CN1871351A

CN1871351A - 一种新的真菌蛋白及其编码核酸

Info

Publication number: CN1871351A
Application number: CNA2004800314200A
Authority: CN
Inventors: 米歇尔·莫诺; 雷托·斯托克林; 埃里克·格罗茨曼
Original assignee: FunZyme BioTechnologies SA
Current assignee: Amira Biotech Corp
Priority date: 2003-08-25
Filing date: 2004-08-25
Publication date: 2006-11-29
Anticipated expiration: 2024-08-25
Also published as: US20050158298A1; EP1673457A2; US7468267B2; JP2007531504A; ES2366830T3; IL173937A; CA2536635C; EP1673457B1; US20070009988A1; US20090130737A1; JP4839215B2; CA2536635A1; WO2005019251A2; US7943340B2; US7354734B2; CN1871351B; DK1673457T3; ATE510011T1; WO2005019251A3; HK1096427A1

Abstract

本发明涉及一种编码新的多肽酶的真菌核酸序列。同时也提供该核酸序列编码的多肽及其衍生物、变异体或上述多肽的片段、多聚核苷或抗体。新的亮氨酸氨肽酶(LAP)和其他氨肽酶或羧肽酶多肽是指本发明所述的EXOX核酸和蛋白，在医学、研究和商业应用上有着广泛的用途。

Description

一种新的真菌蛋白及其编码核酸

技术领域

本发明涉及一种新的具有独特催化性质的多肽酶及其编码核酸。具体的是，本发明涉及一种编码新的亮氨酸氨肽酶和其他氨基或羧基多肽酶的核酸，本发明中特指为EXOX，还包括载体、宿主细胞、抗体，以及制造所述核酸和多肽酶的重组方法。所述基因可以从以下两种真菌中得到：红色毛癣菌(Trichophyton rubrum)、烟曲霉菌(Aspergillusfumigatus)。

背景技术

细菌、酵母和丝状菌，还有些特殊的植物细胞，无脊椎动物和脊椎动物都会表达一种有利用吸收氨基酸、二肽或三肽的膜蛋白(Lubkowitz，等，Microbiology 143：387-396(1997)；Hauser等，Mol.Membr.Biol.18(1)：105-112(2001)；Stacey等，Trends PlantSci.7(6)：257-263(2002)；Rubio-Aliaga & Daniel，Trends Pharmacol.Sci.23(9)：434-440(2002)。转运蛋白，如在酵母、丝状菌和植物细胞的，也能吸收大的寡肽(4-5个氨基酸)。在食品发酵工业中，早已证明微生物参与了蛋白被消化成氨基酸的过程。细菌属的乳酸菌(Lactobacillus)(O’Cuinn等，Biochem.Soc.Trans.27(4)：730-734(1999))和真菌属的曲霉菌(Aspergillus)(Doumas等，Appl.Enviorn.Microbiol.64：4809-4815(1998))分泌内部和外部蛋白酶，对蛋白消化很有用。

氨基多肽酶的活性，也能在真菌被感染时发挥作用，早已证实通过(De Bersaques &Dockx，Arch.Belg.Dermatol.Syphiligr.29：135-140(1973)；Danew & Friedrich，Mykosen 23：502-511(1980))菌丝体和培养基，然而，还没有氨基多肽酶或羧基多肽酶从皮肤真菌中分离并表征过。

发明内容

本发明是基于一种分离的多肽的发明，所述多肽为含有选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的成熟多肽。本发明同时提供一种分离的含有选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的多肽，以及含有与上述序列具有90％同源性序列的分离多肽，所述多肽具有氨肽酶或羧肽酶活性。其中，所述多肽是亮氨酸氨肽酶中，如ruLAP2。

本发明另一方面提供含有一个或多个替换的保守氨基酸的分离多肽，所述多肽也具有氨肽酶活性。

本发明同时包括自然发生的等位突变的选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的多肽。所述等位突变包括转录氨基酸序列的核酸序列有一个或多个核苷酸不同于选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示序列。在可选序列中任意的氨基酸变化的突变多肽是由保守替换提供的。

本发明同时提供一种从多肽去除特定氨基酸的方法，例如从重组蛋白去除标签，其中具有去除氨基酸活性的多肽含有至少与选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列90％同源性序列的多肽，或具有类似功能的多肽。

本发明所述的任一多肽均可天然产生。进一步，所述多肽可以包含在含有试剂的组合物中，所述组合物可用在含一个或多个试剂的试剂盒里。

本发明同时提供一种含有所述多肽的皮肤真菌。例如，适合的真菌包括：絮状表皮癣菌(Epidermophyton floccosum)、奥杜盎小孢子菌(Microsporum audouinii)、铁锈色小孢子菌(Microsporum ferrugineum)、同心性毛癣菌(Trichophyton concentricum)、卡那毛癣菌(Trichophyton kanei)、麦格尼氏发癣菌(Trichophyton megninii)、须癣毛癣菌(Trichophyton mentagrophytes)、罗比特斯克毛癣菌(Trichophytonraubitschekii)、红色毛癣菌(Trichophyton rubrum)、许兰氏毛癣菌(Trichophytonschoenleinii)、苏丹毛癣菌(Trichophyton soudanense)、断发毛癣菌(Trichophytontonsurans)、紫色毛癣菌(Trichophyton violaceum)、杨德氏发癣菌(Trichophytonyaoundei)、犬小孢子菌(Microsporum canis)、马类小孢子菌(Microsporum equinum)、猪小孢子菌(Microsporum nanum)、桃色小孢子菌(Microsporum persicolor)、马发癣菌(Trichophyton equinum)、猴类毛癣菌(Trichophyton simii)、疣状毛癣菌(Trichophyton verrucosum)、石膏样小孢子菌(Microsporum gypseum)、阿耶罗毛癣菌(Trichophyton ajelloi)和土生毛癣菌(Trichophyton terrestre)。

本发明同时提供一种含有本发明所述多肽的微生物培养上清夜。

本发明同时提供一种制备治疗相关病理的人类疾病药物中的应用，所述的治疗包括本发明所述的多肽以及选择与本发明所述多肽相关的病理特征的疾病。

本发明同时提供一种降解多肽底物的方法。所述方法包括将多肽底物与分离的一种或多种本发明多肽接触。其中，多肽底物可以是一个全长的蛋白。进一步的说，其中一种或多种分离的多肽可以有序的分解多肽底物。所述的多肽底物可以是：变性的酪蛋白、麸朊、谷朊、小牛血清蛋白或功能类似物。其中，分离的多肽优选为亮氨酸氨肽酶中的ruLAP2。

本发明进一步提供一种验证具有潜在治疗真菌感染的治疗物质的方法，其中所述真菌感染与本发明所述的多肽表达异常或与其异常的生理作用相关。所述方法包括提供一种能表达所述多肽且具有所述多肽特性或功能的细胞，然后将包含候选物质的组合物与上述细胞接触，再检测候选物质是否引起所述多肽功能特性的改变。其中，当在有候选物质存在时观察到改变，而在含有候选物质组合物的细胞接触时同样的改变没有出现，那么该物质被证明具有潜在的治疗用途。其中，所述功能性特征是多肽具有氨肽酶或羧肽酶活性的特征。

本发明进一步提供一种治疗哺乳动物疾病的方法，所述方法包括向动物给予一定量的多肽，使其病证减轻。特别的是，其中所述多肽为含有的氨基酸序列为选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示至少有90％同源的序列的多肽，或其具有活性片段的多肽。所述的治疗病证包括真菌感染、腹部疾病、消化道吸收不良、口炎性腹泻、过敏反应和酶不足。优选的，其中所述的过敏反应是对麸质过敏。

本发明另外提供一种治疗哺乳动物疾病的方法，所述方法包括向动物给予一定量的蛋白酶抑制剂，使其病证减轻。其中所述蛋白酶抑制剂为含有的氨基酸序列为选自SEQ IDNOs：3、6、9、12、15、18、21、24、27、30、33和35所示至少有90％同源的序列的多肽，或其具有活性片段的多肽。例如，其中所述的疾病可以是真菌感染。

本发明进一步提供一种分离的含有选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的多肽。所述多肽被一种细胞在诱导表达所述多肽的环境下产生。在一些具体实施方案中，所述细胞含有已重组了选自SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32和34所示核酸序列的核苷酸分子的载体。进一步的，所述细胞可以是真菌细胞、细菌细胞、昆虫细胞、植物细胞或哺乳动物细胞。

本发明同时提供一种分离的含有选自SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32和34所示序列核酸序列的核苷酸分子。其中，所述核苷酸分子可以是自然存在的。

本发明同时关于一种不同于一段核苷而是含有选自SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32和34所示序列，且编码成熟的具有选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的多肽的核酸序列。进一步，所述核苷酸分子可以是在在严格的条件下与选自下组的核酸序列杂交，所述的组由选自SEQ IDNOs：2、5、8、11、14、17、20、23、26、29、32、34或其互补序列物组成。在一些具体实施例中，所述核酸分子可以包含在载体内，进一步的可以包括一个与所述核酸分子功能相关的启动子。同时也提供含有所述载体的细胞。

本发明同时提供制备本发明所述的多肽的方法。所述方法包括在诱导表达所述多肽的环境下培养一种细胞，其中所述细胞中含有已重组了选自SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32和34所示序列的核酸分子的载体。举某些例子，所述细胞可以是真菌细胞、细菌细胞、昆虫细胞、植物细胞或哺乳动物细胞。

本发明同时提供一种制备蛋白的方法，包括在能足够表达所述蛋白的环境下培养皮肤真菌，且从所述皮肤真菌中分离出来。其中，所述的蛋白是分泌型蛋白。同样的，所述的蛋白可以是氨肽酶或羧肽酶。特别地，所述氨肽酶是亮氨酸氨肽酶，如ruLAP2。另外，所述的表皮真菌选自如下：絮状表皮癣菌(Epidermophyton floccosum)、奥杜盎小孢子菌(Microsporum audouinii)、铁锈色小孢子菌(Microsporum ferrugineum)、同心性毛癣菌(Trichophyton concentricum)、卡那毛癣菌(Trichophyton kanei)、麦格尼氏发癣菌(Trichophyton megninii)、须癣毛癣菌(Trichophyton mentagrophytes)、罗比特斯克毛癣菌(Trichophyton raubitschekii)、红色毛癣菌(Trichophyton rubrum)、许兰氏毛癣菌(Trichophyton schoenleinii)、苏丹毛癣菌(Trichophyton soudanense)、断发毛癣菌(Trichophyton tonsurans)、紫色毛癣菌(Trichophyton violaceum)、杨德氏发癣菌(Trichophyton yaoundei)、犬小孢子菌(Microsporum canis)、马类小孢子菌(Microsporum equinum)、猪小孢子菌(Microsporum nanum)、桃色小孢子菌(Microsporumpersicolor)、马发癣菌(Trichophyton equinum)、猴类毛癣菌(Trichophyton simii)、疣状毛癣菌(Trichophyton verrucosum)、石膏样小孢子菌(Microsporum gypseum)、阿耶罗毛癣菌(Trichophyton ajelloi)和土生毛癣菌(Trichophyton terrestre)。

所述产物蛋白可以作用于多肽底物。例如，产物蛋白可以降解多肽或可以有序的分解一个全长的多肽底物。优选的，多肽底物可以是含有2-200个氨基酸的多肽。

在一些实例中，所述产物蛋白添加一个或多个氨基酸到多肽底物上。另一些实例中，产物蛋白从多肽底物去除一个或多个氨基酸，使其成为一种被修饰多肽，然后所述的产物蛋白有序的将一个或多个氨基酸添加到被修饰多肽，这样形成一种含特殊氨基酸序列多肽产物，与原多肽底物相比。

本发明另外提供一种治疗真菌感染引起的疾病的方法，所述方法包括给予有效剂量的具有EXOX蛋白活性的一种抑制剂，其中抑制剂序列为选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示序列。例如，其中所述的EXOX蛋白含有SEQ ID NO：2所示序列。

本发明进一步提供一种降解多肽底物的方法。所述方法包括将一个或多个本发明所述的分离的多肽与多肽底物接触。优选的，其中所述的多肽底物为全长的蛋白，其中所述的一个或多个分离的多肽有序的酶解多肽底物。所述的多肽底物选自如下组：变性的酪蛋白、麸朊、谷朊、小牛血清蛋白或功能类似物。进一步的在一些实例中，其中所述的分离的多肽是一种氨肽酶。所述的氨肽酶可以是亮氨酸氨肽酶，如ruLAP2。

另外，所述方法还可以用一个或多个蛋白酶与多肽底物接触。在一些实例中，所述的蛋白酶选自如下组：胰蛋白酶、链霉蛋白酶、胰凝乳蛋白酶和蛋白酶K。

本发明进一步提供一种去除蛋白氨基末端氨基酸的方法。所述方法包括将蛋白与本发明所述的分离的多肽接触。在一些实例中，所述的蛋白氨基末端带有组氨酸标签。在另一些实例中，所述的蛋白氨基末端带有Xaa-Pro标签。优选的，所述Xaa是一种含有至少两个相近亲核部位的氨基酸，如丝氨酸、苏氨酸或半胱氨酸。

本发明进一步提供一种具有反蛋白水解活性的多肽。

本发明进一步提供一种添加一个或多个氨基酸到底物多肽上的方法。方法包括将多肽底物与一种或多种本发明所述的分离的多肽接触。

除非另有说明，本发明所述的所有技术和科学用语都和本发明所属一般技术人员理解的一样。尽管有类似或等同的方法和原料可以用来实现本发明，更适合的方法和原料将在以下描述。本发明引用所有的出版物、专利申请、专利及其他参考文献均参照其整体。在冲突的情况下，现在的说明书，包括定义将受到限制。另外，所述的原料、方法和实施例仅限于说明本发明而不是限制本发明。

附图说明

图1是红色毛癣菌培养上清夜用抗-A.oryzue Alp(胶板A，左边)和Mep antisera(胶板C，右边)Western杂交结果图。胶板B显示用考马斯亮蓝染色的10％SDS-PAGE胶。泳道1(lane 1)里，0.25ml的红色毛癣菌培养上清夜中的蛋白在加样到SDS-PAGE胶前预先用TCA处理。0.2g纯化的A.oryzue重组蛋白ALP和MEP分别加样在泳道2和3里。标准的蛋白分子量对照在图左面。

图2是显示P.pastoris产生的重组ruLAP2(1，2)、fuLAP2(3，4)、ruLAP1(5，6)、fruLAP1(7，8)的SDS-PAGE蛋白特征图。每个纯化的重组LAP 1g加到10％SDS-PAGE胶。泳道2、4、6和8表示用N-糖苷酶F处理后的去糖基蛋白。胶用考马斯亮蓝R-250染色。

图3是红色毛癣菌培养上清夜和重组LAPs作为对照探针，和抗-ruLAP2(泳道1-4)、抗-ruLAP1 antisera(泳道5-8)Western杂交结果图。泳道1、2、5和6表示0.25ml的红色毛癣菌培养上清夜中的蛋白在加样到SDS-PAGE胶前预先用TCA处理。0.1g纯化的重组ruLAP2(泳道3、4)和ruLAP1(泳道7、8)作为对照加样。N-糖苷酶F用来去蛋白的糖基。标准的蛋白分子量对照在图左面。

图4是红色毛癣菌AMPP(氨肽酶P)在不同pH值下的酶活性图表。该图显示AMPP在很大的一个pH值范围内具有活性，范围为pH6～11。

图5是红色毛癣菌AMPP(氨肽酶P)在不同温度下的酶活性图表。该酶在温度25～60℃间具有活性，优选的温度为50℃。

图6是显示在37℃，4h，ruLAP1以E/S比率(w∶w)以1/50分解gliadin 14mer的结果图。

图7是显示DPPIV单独酶解和DPPIV/ruLAP2的酶混和物分解gliadin 14mer的结果图。

图8是显示在37℃，4h，ruDPPIV1以E/S比率(w∶w)以1/50分解gliadin 33mer的结果图。

图9是显示DPPIV/ruLAP2的酶混和物分解gliadin 33mer的结果图。

图10A和10B表示ruLAP2分解Gly-Ser-proNPY(A)前和(B)后的质谱图。

图11A和11B表示ruLAP2分解Ala-proNPY(A)前和(B)后的质谱图。

图12A和12B表示ruLAP2分解TG47(A)前和(B)后的质谱图。

图13A和13B表示DPPIV分解desMet-G-CSF(A)前和(B)后的质谱图。

图14是M28E亚家族氨肽酶的推断的氨基酸序列比对图。

图15是M28E亚家族氨肽酶的推断的氨基酸序列比对图。

本发明的详细描述

本发明所述的蛋白酶与肽酶、蛋白水解酶和多肽水解酶同意。所述蛋白酶包括所有能够将CO-NH键断裂，将蛋白降解为多肽或氨基酸的酶。多肽外切酶作用于多肽链的氨基(N)或羧基(C)端邻近的基团。那些作用于N端释放一个氨基酸残基的酶命名为氨肽酶。许多不同的高级蛋白酶参与了大量的生物生理反应。因此，现在选择新药的目标都放在控制相关多肽或酶的降解上。

皮肤真菌是人类和动物的致病真菌，导致皮肤感染(Vanbreuseghem等，GUIDEPRATIQUE BE MYCOLOGUE MEDICALEET VETERINAIRE.(1978)；Kwong-Chong & Bennet，NEDICAL MYCOLOGY(1992)；Weitzman & Summerbell，Clin.Microbiol.Rev.8：240-259(1995))。皮肤真菌包括但不限于：T.ajelloi，A.uncinatum，K ajelloi，T.asteroides，T.mentagrophytes，T.concentricum，T.cruris.E.floccosum，T.dankalienese，G.dankaliensis，T.equinum，T.equinum var.autotrophicum，T.equinum var.equinum，T.erinacei，T.fischeri，T flavescens，T.floccosum，T.gloriae，T.gourvilii，T.granulare，T.granulosum，T.gypseum，T.inguinale，T.interdigitale，T.intertriginis，T.kanei，T.krajdenii，T.longfusum，T.megninii，A.quinckanum，A.benhamiae，A.vanbreuseghemii，T.pedis，T.proliferans，T.quickaneum，T.radiolatum，T.mentrophytes var.erinacei，T.mentagrophytes var.interdigitale，T.mentagrophytes var.mentagrophytes，T.mentagrophytes var.nodulare，T.mentagrophytes var.quinnckeanum，T.niveum，T.nodulare，T.persicolor，M.persicolor，T.phaseolforme，T.proliferans，T.purpureum，T.quinckeanum，T.radiolatum，T.raubitschekii，T rubrum，S.ruber，T schoenleinii，T simii，A.simii，T soudanense，T sulphureum，T tonsurans，A.insingulare，A.lenticularum，A.quadrifidum，T tonsurans，T sulphureum，T terrestre，T.tonsuransvar.sulphureum，T.tonsurans var tonsurans subvar.perforans ，T.vanbreuseghemii，T.verrucosum，T.violaceum，T.yaoundei，E.floccosum，M.audouinii，M.ferrugineum，T.megninii，T.mentragrophytes，T.raubitschekii，T.schoenleinii，T.soudanese，T.violaceum，M.canis，M.equinum，M.nanum，M.persicolor，T.verrucosum，和M.gypseum。在欧洲上述致病菌中，从医院和个人实例中分离得到的真菌，常见的有红色毛癣菌、须癣毛癣菌(T.mentagrophytes)、犬小孢子菌(Microsporumcanis)(Monod等，Dermatology，205：201-203，2002)。实际上，皮肤真菌专门寄生在角质层、指甲或头发中，消化角质化细胞膜。至今，所有研究显示皮肤真菌产生具有体外活性的蛋白水解酶，许多研究者从个别菌种中发现一个或多个分泌型胞外蛋白酶。相关综述参见Monod等，Int.J.Med.Microbiol.293：405-419，2002。特别地，犬小孢子菌拥有两个编码S8(枯草杆菌蛋白酶)和M36(fungalysin)家族的基因家族，参见MEROPS蛋白酶数据库(http://merops.sanger.ac.uk/)(Brouta等，Infect.Immun.70：5676-5683，2002；Descamps等，J Invest.Dermatol.70：830-835，2002)。分离的犬小孢子菌基因家族中其中之一编码从培养上清夜中得到两个前述特征的胞内酶之一。(Mignon等，Med Mycol.36：395-404，1998；Brouta等，Med Mycol 39：269-275，2001)。两个酶都在感染的猫中发现，并表现出角质分解能力(Mignon等，Med Mycol.36：395-404，1998)。所述蛋白水解酶的活性能使皮肤真菌专门在角质层、指甲或头发中生长，利用消化的角质化细胞膜，如单个氨基酸或小肽，作为细胞生长的营养来源。

以下描述来自皮肤真菌红色毛癣菌的两个新的亮氨酸氨肽酶：ruLAP1和ruLAP2。红色毛癣菌是发癣菌素属的一种，还包括T.ajelloi，T.asteroides，T.mentagrophytes，T.concentricum，T.cruris，T.dankalienese，T.equinum，T.equinum var.autotrophicum，T.equinum var.equinum，T.erinacei，T.f scheri，T.flavescens，T.floccosum，T.gloriae，T.gourvilii，T.granulare，T.granulosum，T gypseum，T inguinale，T interdigitale，T.intertriginis，T.kanei，T krajdenii，T longfusum，Tmegninii，T.pedis，T.proliferans，T.quickaneum，T radiolatum，T mentrophytesvar.erinacei，T.mentagrophytes var.interdigitale，T.mentagrophytes var.mentagrophytes，T.mentagrophytes var.nodulare，T.mentagrophytes var.quinnckeanum，T.niveum，T.nodulare，T.persicolor，T.phaseolforme，T.proliferans，T.purpureum，T.quinckeanum，T.radiolatum，T.raubitschekii，T.orthologues。上述两个LAPs的特性与那些由机会型真菌烟曲霉菌的fuLAP1和fuLAP2直系同源性基因编码的分泌型酶、商业上可获得的从猪肾提取的微粒体LAP(MEROPS＞M1family)相近。所有上述的酶具有亮氨酸氨肽酶活性。同时，烟曲霉菌的氨肽酶fuLAP1和fuLAP2表现出70％的氨基酸同源性和米曲霉菌的直系同源性基因，参考本发明引用的美国专利US 6,127,161和5,994,113。进一步，ruLAP2表现出独特的性质：(i)ruLAP1和ruLAP2表现出50％的同源性与烟曲霉菌直系同源性基因编码的fuLAP1和fuLAP2、美国专利US 6,127,161和5,994,113中报道的米曲霉菌的[xu1]直系同源性基因；(ii)ruLAP2和来源于毕氏酵母表达***的类胰蛋白酶胞内酶的酶组合物能顺序酶解一个全长的多肽链，如变性的酪蛋白；(iii)ruLAP2和ruDPPIV(红色毛癣菌的另一个胞外酶)的酶混合物降解一段麦醇溶蛋白，已知其能抵抗蛋白酶水解，这样就提供了ruLAP2单独或与ruDPPIV组合用于治疗腹乳糜泻疾病或其他消化道疾病的证据，如吸收不良；(iv)ruLAP2和其他蛋白酶组合(酶组合物)可应用于食品工业中，如降解苦味底物、降解theves、处理肉类、香皂工业、分解朊病毒、分解病毒、降解有毒或副产物蛋白；(v)和，既然ruLAP2和/或其他真菌分泌的蛋白酶是皮肤真菌在指甲角质化底物中生长必须的，那么ruLAP2和/或其他真菌分泌的蛋白酶的抑制剂将是治疗霉菌病的一种新方法。

本发明提供一种新的真菌核酸和蛋白，所述蛋白具有亮氨酸氨肽酶活性。LAPs在很多功能中都起到作用，包括但不限于血液凝固、控制细胞死亡、组织分化、肿瘤侵袭、一些致病微生物感染过程中等，所述作用使LAPs在新药领域中成为一种有价值的目标和有力的工具。除了在生理上的功能，氨肽酶还有商业应用价值，主要在清洁剂和食品领域。由于微生物有着丰富的生物多样性和对基因操作来说易于感染，微生物是蛋白酶的极佳来源，例如真菌。微生物降解蛋白并利用降解的产物作为生长的营养来源。因此，本发明所述的新的LAPs具有广泛的工业用途，包括但不限于用于：食品工业中水解蛋白；降解副反应产物(如羽毛)；降解朊蛋白；蛋白质体学的降解蛋白；氨基酸分析时的多肽水解反应；伤口清洗(如攻击死组织)；假肢清洗和/或准备；织物柔软剂；香皂；对污染的水箱或其他含有要除掉蛋白或消毒的容器(如保鲜桶、瓶子等)进行清洗或消毒；外科器械的清洗。

本发明提供一种新的酶及其组合物，如相比与单个酶水解，多种酶的组合物容易分解不溶蛋白的结构，例如将角质细胞膜分解成小肽或游离氨基酸。事实上，除了S8和M36家族的胞外酶外，红色毛癣菌分泌的两个LAPs都各有不同的底物活性。ruLAP1和ruLAP2都属于一样的LAPs家族(MEROPS＞M28)。两个LAPs的特性与那些由机会型真菌烟曲霉菌的fuLAP1和fuLAP2直系同源性基因编码的分泌型酶、商业上可获得的从猪肾提取的微粒体LAP(MEROPS＞M1 family)相近。上述酶均具有亮氨酸氨肽酶活性。进一步的是，ruLAP2具有独特的初级结构，同时具有一个特性：和ruDPPIV的酶混合物能有序的降解一段多肽链，如麦醇溶蛋白，已知其能抵抗其他蛋白酶的水解。更特别的是，纯化的ruLAP2和来源于毕氏酵母表达***的类胰蛋白酶胞内酶的酶混合物物能顺序酶解一个全长的多肽链，如变性的酪蛋白。

本发明部分是基于编码新的多肽的一段新的核酸序列。所述新的核酸序列和其编码的多肽指的是ruLAP1、ruLAP2、fuLAP1和fuLAP2。所述核酸及其编码的多肽，本发明中统一简称为“EXOX”。

本发明所述新的EXOX核酸包括表1A、1B、2A、2B、3A、3B、4A、4B、5A、5B、6A、6B、7A、7B、8A、8B、9A、9B、10A、10B、11A、11B和12A所示的序列或片段、衍生物、类似物或同源物。本发明所述新的EXOX蛋白包括表1C、2C、3C、4C、5C、6C、7C、8C、9C、10C、11C和12B所示的蛋白片段序列。下面将具体描述所述EXOX核酸和蛋白。

同时，在本发明范围内还包括一种方法，所述方法是用蛋白酶抑制剂治疗或预防真菌感染或被真菌、酵母细胞和/或细菌感染的机会。

利用反转录基因技术，红色毛癣菌分泌的两个亮氨酸氨肽酶的特性通过和真菌烟曲霉菌直系同源性基因编码的酶、从猪肾提取的微粒体氨酸氨肽酶pkLAP比较，得到了确定。所述四个真菌酶(ruLAP1、ruLAP2、fuLAP1和fuLAP2)被证实和pkLAP同样对底物Leu-AMC结构优先选择，同样具有亮氨酸氨肽功能。另外，亮氨酸氨肽酶pkLAP对Leu-AMC结构具有极高的选择性，因此也被称为丙胺酸氨肽酶(MEROPS＞M1.001)。

本发明所述的编码EXOX蛋白的EXOX核酸，包括本发明提供的核酸序列及其片段。本[xu2]发明同时也包括相应的突变体或基于所示序列变换的仍可以编码具有EXOX类似活性或功能的蛋白的核酸，或核酸序列的片段。本发明进一步包括相应的与本发明所示序列互补的核酸，也包括核酸片段与本发明任意描述的序列互补。本发明同时包括核酸、核酸片段或其互补片段的化学修饰。所述修饰包括，但不限于如下所述，基团和核酸的糖磷酸骨架的修饰或衍生。运用上述修饰至少是为了提高被修饰核酸的化学稳定性，例如，修饰的核酸可以应用于相关治疗领域中的反义结合核酸技术。

本发明所述的EXOX蛋白包括含有本发明所示序列的EXO蛋白。本发明同时还包括所示蛋白序列的突变体或相应残基的不同蛋白，其仍具有EXO类似活性或功能的蛋白，或蛋白的片段。本发明进一步还包括抗体或抗体片段，如F_ab或(F_ab2)，所述抗体免疫特性的与本发明所述的蛋白结合。

EXOX核酸和蛋白具有潜在的治疗应用，如治疗真菌感染。所述EXOX核酸、蛋白和抑制剂同时具有包括但不限于如下功能：(i)改进蛋白产物的生物技术工具，如去除标签、含稀有氨基酸的产物；(ii)某些领域疾病诊断的药物研发，如过敏反应(麸质过敏)；(iii)皮肤病药物研发，如抗真菌药物、疣的治疗、伤口愈合等；(iv)美容术，如去皮、脱毛、磨皮和dermaplaning；(v)食品工业，如作为营养添加剂、糖精、通过预分解产生低变应原性的食品；(vi)消毒工具，如净化蛋白污染物如朊蛋白或病毒；(vii)清洁或回收废弃物，如羽毛、骨头、头发和毛皮；(viii)清洗用品，如香波或液体清洁剂。

EXO蛋白的抑制剂，特别是ruLAP2的抑制剂，可以作为抗真菌感染药物来治疗真菌感染病。LAPs蛋白酶本身也可以作为治疗消化道疾病应用，如吸收不良或对麸朊引起过敏反应。麸[xu3]朊是小麦中发现的，谷蛋白和醇溶朊(醇溶谷蛋白)的蛋白混合物的专业名词。由于其内在的物理特性，如粘性和弹性，麸朊经常被用作食品添加剂。在食品质量控制和选择上检测麸朊的含量很重要，尤其是对那些麸朊过敏的个体，如麸朊过敏肠病、乳糜泻病、口炎性腹泻和相关的过敏反应，因此来自于小麦、裸麦，以及一些燕麦的食品中去除麸朊是很有必要的。

胞外蛋白酶核酸及多肽

本发明描述的红色毛癣菌亮氨酸氨肽酶活性及前人所研究的犬小孢子菌分泌的枯草杆菌蛋白酶和金属蛋白酶显示皮肤真菌分泌一系列蛋白酶，类似与那些在仅有碳和氮源的蛋白基质上的曲霉菌属。而且，ruDPPIV和ruDPPV：EMBL AF082514的编码二肽-氨肽酶的ruDPPV，与来自烟曲霉菌和米曲霉菌DPPIV和DPPV高度类似(Beauvais等，J Biol.Chem.272：6238-6244，1997；Beauvais等，Immun.65：3042-304，1997；Doumas等，Appl.Environ.Microbiol.64：4809-4815，1998；Doumas等，J.Food Mycol.2：271-279，1999)，从基因组和红色毛癣菌的cDNA文库中分离得到。红色毛癣菌编码上述蛋白酶的基因中的内含子-外显子结构与从烟曲霉菌和米曲霉菌分离的同源基因类似。由于曲霉菌属与皮肤真菌属在分类上相近，出现上述结果就不奇怪了，同时它们属于同一个分类学上能产生闭囊壳原子囊(Eurotiomycete分类)的子囊菌群。与编码枯草杆菌蛋白酶和fungalysins的基因相比，ruLAP1和ruLAP2不是红色毛癣菌基因组中大基因家族的成员。

ruLAP1显示50％的氨基酸同源性与fuLAP1和/或LAP1(参见表19A和20)，上述3个酶的结构都属于M28E亚家族，气单胞菌属和弧菌属的亮氨酰氨肽酶(MEROPS＞M28.002)。另外，ruLAP2显示50％的氨基酸同源性与fuLAP2和/或LAP2(参见表19B和21)，上述3个酶的结构都属于M28A亚家族，有液泡的S.cerevisiae的蛋白酶Y(MEROPS＞M28.001)，灰色链霉菌分泌的氨肽酶(MEROPS＞M28.00X)。另外，M28A和M28E亚家族的成员表现出很低的相似性。然而，上述氨肽酶中的2个Zn⁺⁺结合位点的氨基酸很保守，且在真菌LAPs被证明，具体特征本发明详述(表20、21)。在灰色链霉菌和Aeromonas proteolytica分泌的氨肽酶中His和Asp残基结合一个Zn⁺⁺离子，另两个His和Glu残基结合第二个Zn⁺⁺离子，同时第二个Asp残基与两个Zn⁺⁺离子桥联(Greenblat等，J.Mol.Biol.265：620-636(1997)；Hasselgren等，J.Biol.Inorg.Chem.6：120-127(2001))。在灰色链霉菌氨肽酶中用不同的二价离子替换Zn⁺⁺受到Ca⁺⁺的影响，且具有不同效果(Ben-Meir等，Eur.J.Biochem 212：107-112(1993)；Lin等，J.Biol.Inorg.Chem.2：744-749(1997)；Hasselgren等，J.Biol.Inorg.Chem.6：120-127(2001))。本发明所述的氨肽酶发现对不同的离子敏感性不同。与灰色链霉菌的氨肽酶一样，ruLAP2与fuLAP1被Co⁺⁺高度激活。

尽管有着很高的序列同一性，ruLAP2与fuLAP1具有基本上不同的蛋白水解活性。特别的，ruLAP2能够有效的水解Asp-和Glu-7-胺-4-甲基香豆素(AMC)，同时ruLAP2到目前为止被证明是单一的LAP，能在ruDPPIV存在下水解能抵抗胃和胰腺的蛋白酶水解的麸朊，或第二方面，以来自P.pastoris表达***的部分纯化的含有类胰酶胞外酶的形式消化一段全长多肽链，如变性的酪蛋白。LAP降解一段长的多肽的能力不能单独的从其分解氨酰-AMC残基基础上预测得到。皮肤真菌酶的部分特性已经在犬小孢子菌分泌的胞外酶上观察得到。与烟曲霉菌和米曲霉菌分泌的同源蛋白酶相比，31.5kDa犬小孢子菌枯草杆菌蛋白酶和43.5kDa犬小孢子菌金属蛋白酶都能够水解角朊。由于皮肤真菌从它们的在土壤中的习性进化后，它们已发展出一套用特殊的蛋白酶分解角质组织进行感染的策略。ruLAP2独特的特征能够表现在其高度特别的寄生的角质层和指甲的组织。

除了上述LAPs，一系列新的从致病的真菌红色毛癣菌分离得到的蛋白酶将在下面详述。与LAPs一样，上述蛋白酶都是胞外蛋白酶。它们包括：两个羧肽酶、一个脯氨酰氨肽酶、一个氨肽酶P、一个脯氨酰氨基酸酶和一个二肽基肽酶IV。另外两个新的蛋白酶已经得到确认：一个来自犬小孢子菌的亮氨酸氨肽酶(caLAP1)、一个来自须癣毛癣菌的亮氨酸氨肽酶(meLAP1)。

ruLAP2

ruLAP2是红色毛癣菌的亮氨酸氨肽酶。1757核苷酸(SEQ ID NO：1)的ruLAP2核酸如表1A所示。

表1A、ruLAP2基因组核苷酸序列(SEQ ID NO：1)

ATGAAGTCGCAACTGTTGAGCCTGGCTGTGGCCGTCACAACCATCTCCCAGGGCGTTGTTGGTCAAGAGCCCTTCGGATGGCCTTTCAAGCCTATGGTCACTCAGGTGAGTTGCTCTCAACAGATCGATCGATCGATCTACCTTTGTCCCTGTCACATCAAACTCCAGCAGAGCCAAAGAAACAGACACAATGTTCCTGGGGAATTCTTATGGGCTAATGTAAATGTATAGGATGACCTGCAAAACAAGATAAAGCTCAAGGATATCATGGCAGGCGTCGAGAAGCTGCAAAGCTTTTCTGATGCTCATCCTGAAAAGAACCGAGTGTTTGGTGGTAATGGCCACAAGGACACTGTAGAGTGGATCTACAATGAGATCAAGGCCACTGGCTACTACGATGTGAAGAAGCAGGAGCAAGTACACCTGTGGTCTCATGCCGAGGCTGCTCTCAATGCCAATGGCAAGGACCTCAAGGCCAGCGCCATGTCCTACAGCCCTCCTGCCAGCAAGATCATGGCTGAGCTTGTTGTTGCCAAGAACAATGGCTGCAATGCTGTATGTGCCATACACTTTCTATACGTCACATTCTCTCTAGAATGAAGAGCACGGGAGAACTAACTTTATGTATACAGACTGATTACCCAGCGAACACTCAGGGCAAGATCGTCCTCGTTGAGCGTGGTGTCTGCAGCTTCGGCGAGAAGTCTGCTCAGGCTGGTGATGCAAAGGCTGCTGGTGCCATTGTCTACAACAACGTCCCCGGATCCCTTGCTGGCACTCTTGGTGGCCTTGACAAGCGCCATGTCCCAACCGCTGGTCTTTCCCAGGAGGATGGAAAGAACCTTGCTACCCTCGTTGCTTCTGGTAAGATTGATGTCACCATGAACGTTATCAGTCTGTTTGAGAACCGAACCACGTAAGTAGCTCAACGGCTGATCCAGCATCAATTGTCTCGAGTATATACTAAATCGATACCTCATAGCTGGAACGTCATTGCTGAGACCAAGGGAGGAGACCACAACAACGTTATCATGCTCGGTGCTCACTCCGACTCCGTCGATGCCGGCCCTGGTATTAACGACAACGGCTCGGGCTCCATTGGTATCATGACCGTTGCCAAAGCCCTCACCAACTTCAAGCTCAACAACGCCGTCCGCTTTGCCTGGTGGACCGCTGAGGAATTCGGTCTCCTTGGAAGCACCTTCTACGTCAACAGCCTCGATGACCGTGAGCTGCACAAGGTCAA

GTTGTACCTCAACTTCGACATGATCGGCTCTCCCAACTTCGCCAACCAGATCTACGACGGTGACGGTTCGGCCTACAACATGACCGGCCCCGCTGGCTCTGCTGAAATCGAGTACCTGTTCGAGAAGTTCTTTGACGACCAGGGTATCCCACACCAGCCCACTGCCTTCACTGGCCGATCCGACTACTCTGCTTTCATCAAGCGCAACGTGCCCGCTGGCGGCCTCTTCACTGGAGCCGAGGTTGTCAAGACCCCCGAGCAAGTCAAGTTGTTCGGTGGTGAGGCTGGCGTTGCCTATGACAAGAACTACCATCGCAAGGGCGACACCGTTGCCAACATCAACAAGGGAGCTATCTTCCTTAACACTCGAGCCATCGCCTACGCTATCGCCGAGTATGCCCGATCCCTCAAGGGATTCCCAACCCGCCCAAAGACCGGCAAGCGTGACGTCAACCCCCAGTATTCTAAGATGCCTGGTGGTGGCTGCGGACACCACACTGTCTTCATGTAA

1488个核苷酸的ruLAP2开放阅读框(ORF)，其中起始子ATG在第一个位置上(表1B中下划线)。

表1B、ruLAP2核苷酸序列(SEQ ID NO：2)

ATGAAGTCGCAACTGTTGAGCCTGGCTGTGGCCGTCACAACCATCTCCCAGGGCGTTGTTGGTCAAGAGCCCTTCGGATGGCCTTTCAAGCCTATGGTCACTCAGGATGACCTGCAAAACAAGATAAAGCTCAAGGATATCATGGCAGGCGTCGAGAAGCTGCAAAGCTTTTCTGATGCTCATCCTGAAAAGAACCGAGTGTTTGGTGGTAATGGCCACAAGGACACTGTAGAGTGGATCTACAATGAGATCAAGGCCACTGGCTACTACGATGTGAAGAAGCAGGAGCAAGTACACCTGTGGTCTCATGCCGAGGCTGCTCTCAATGCCAATGGCAAGGACCTCAAGGCCAGCGCCATGTCCTACAGCCCTCCTGCCAGCAAGATCATGGCTGAGCTTGTTGTTGCCAAGAACAATGGCTGCAATGCTACTGATTACCCAGCGAACACTCAGGGCAAGATCGTCCTCGTTGAGCGTGGTGTCTGCAGCTTCGGCGAGAAGTCTGCTCAGGCTGGTGATGCAAAGGCTGCTGGTGCCATTGTCTACAACAACGTCCCCGGATCCCTTGCTGGCACTCTTGGTGGCCTTGACAAGCGCCATGTCCCAACCGCTGGTCTTTCCCAGGAGGATGGAAAGAACCTTGCTACCCTCGTTGCTTCTGGTAAGATTGATGTCACCATGAACGTTATCAGTCTGTTTGAGAACCGAACCACCTGGAACGTCATTGCTGAGACCAAGGGAGGAGACCACAACAACGTTATCATGCTCGGTGCTCACTCCGACTCCGTCGATGCCGGCCCTGGTATTAACGACAACGGCTCGGGCTCCATTGGTATCATGACCGTTGCCAAAGCCCTCACCAACTTCAAGCTCAACAACGCCGTCCGCTTTGCCTGGTGGACCGCTGAGGAATTCGGTCTCCTTGGAAGCACCTTCTACGTCAACAGCCTCGATGACCGTGAGCTGCACAAGGTCAAGTTGTACCTCAACTTCGACATGATCGGCTCTCCCAACTTCGCCAACCAGATCTACGACGGTGACGGTTCGGCCTACAACATGACCGGCCCCGCTGGCTCTGCTGAAATCGAGTACCTGTTCGAGAAGTTCTTTGACGACCAGGGTATCCCACACCAGCCCACTGCCTTCACTGGCCGATCCGACTACTCTGCTTTCATCAAGCGCAACGTGCCCGCTGGCGGCCTCTTCACTGGAGCCGAGGTTGTCAAGACCCCCGAGCAAGTCAAGTTGTTCGGTGGTGAGGCTGGCGTTGCCTATGACAAGAACTACCATCGCAAGGGCGACACCGTTGCCAACATCAACAAGGGAGCTATCTTCCTTAACACTCGAGCCATCGCCTACGCTATCGCCGAGTATGCCCGATCCCTCAAGGGATTCCCAACCCGCCCAAAGACCGGCAAGCGTGACGTCAACCCCCAGTATTCTAAGATGCCTGGTGGTGGCTGCGGACACCACACTGTCTTCATGTAA

上述ruLAP2核苷酸序列(SEQ ID NO：2)编码有495个氨基酸残基(SEQ ID NO：3)的蛋白，在表1C中以一个字母的氨基酸代码表示。

表1C、ruLAP2编码的蛋白序列(SEQ ID NO：3)

MKSQLLSLAVAVTTISQGVVGQEPFGWPFKPMVTQDDLQNKIKLKDIMAGVEKLQSFSDAHPEKNRVFGGNGHKDTVEWIYNEIKATGYYDVKKQEQVHLWSHAEAALNANGKDLKASAMSYSPPASKIMAELVVAKNNGCNATDYPANTQGKIVLVERGVCSFGEKSAQAGDAKAAGAIVYNNVPGSLAGTLGGLDKRHVPTAGLSQEDGKNLATLVASGKIDVTMNVISLFENRTTWNVIAETKGGDHNNVIMLGAHSDSVDAGPGINDNGSGSIGIMTVAKALTNFKLNNAVRFAWWTAEEFGLLGSTFYVNSLDDRELHKVKLYLNFDMIGSPNFANQIYDGDGSAYNMTGPAGSAEIEYLFEKFFDDQGIPHQPTAFTGRSDYSAFIKRNVPAGGLFTGAEVVKTPEQVKLFGGEAGVAYDKNYHRKGDTVANINKGAIFLNTRAIAYAIAEYARSLKGFPTRPKTGKRDVNPQYSKMPGGGCGHHTVFM

上述ruLAP2具有与表1D、1E和1F中的BLAST氨基酸序列同源性。

软件操作应用如下：

tblastn-将蛋白“序列1”和核酸“序列2”比较，其中核苷酸序列所有6阅读框转录。

blastx-将核酸“序列1”和蛋白“序列2”比较。

blastp-蛋白与蛋白比较。

这里所述的BLAST比对结果中，“E值”或“期待”值是一种可能性的数据显示，表示比对序列可能在查询的数据库中与BLAST查询序列具有偶然的类似性。期待值(E)是一个描述找到可能“期待”看有机会与查询的数据库中的特殊位点吻合的参数。它被分值(S)减少其指数，S是两个序列间配对情况。必要的，E值描述了序列间配对存在的随机背景误差。

表1D.ruLAP2 TBLASTN结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi469363	Saccharomycescerevisiae氨肽酶Y基因	32421	170/477(35％)	239/437(55％)	8e-65
gi15839805	MycobacteriumtuberculosisCDC15551，整个280个基因组中的33片段	18857	152/424(35％)	225/424(53％)	5e-57	gi469363	Saccharomycescerevisiae氨肽酶Y基因	32421	170/477(35％)	239/437(55％)	8e-65
gi15839805	MycobacteriumtuberculosisCDC15551，整个280个基因组中的33片段	18857	152/424(35％)	225/424(53％)	5e-57	gi9949032	Pseudomonasaruginosa PA01，，整个529个基因组中的281片段氨肽酶Y基因	12547	129/317(40％)	180/317(56％)	1e-56

表1E.ruLAP2 BLASTX结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi28918599	未知蛋白/Neurospora crassa	508	219/467(46％)	287/467(61％)	e-112
gi584764	APE3 YEAST；氨肽酶前体/Saccharomycescerevisiae	537	170/477(35％)	239/437(53％)	1e-65	gi28918599	未知蛋白/Neurospora crassa	508	219/467(46％)	287/467(61％)	e-112
gi584764	APE3 YEAST；氨肽酶前体/Saccharomycescerevisiae	537	170/477(35％)	239/437(53％)	1e-65	gi9949032	未知蛋白/Thermobifida fusca	514	151/460(32％)	237/460(51％)	5e-61
gi15839805	水解酶/MycobacteriumtuberculosisCDC15551	493	152/424(35％)	225/424(53％)	6e-58	gi9949032	未知蛋白/Thermobifida fusca	514	151/460(32％)	237/460(51％)	5e-61

表1F.ruLAP2 BLASTP结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi28918599	未知蛋白/Neurospora crassa	508	219/467(46％)	287/467(61％)	e-105
gi584764	APE3 YEAST；氨肽酶前体/Saccharomycescerevisiae	537	169/477(35％)	237/477(49％)	2e-64	gi28918599	未知蛋白/Neurospora crassa	508	219/467(46％)	287/467(61％)	e-105
gi584764	APE3 YEAST；氨肽酶前体/Saccharomycescerevisiae	537	169/477(35％)	237/477(49％)	2e-64	gi15839805	水解酶/MycobacteriumtuberculosisCDC15551	493	152/424(35％)	225/424(53％)	5e-57
gi123017467	未知蛋白/Thermobifida fusca	514	150/460(32％)	237/460(51％)	1e-56	gi15839805	水解酶/MycobacteriumtuberculosisCDC15551	493	152/424(35％)	225/424(53％)	5e-57

ruLAP1

ruLAP1是红色毛癣菌的亮氨酸氨肽酶。1256个核苷酸(SEQ ID NO：4)的ruLAP1核酸如表2A所示。

表2A、ruLAP1基因组核苷酸序列(SEQ ID NO：4)

ATGAAGCTCCTCTCTGTTCTTGCGCTGAGCGCTACCGCTACCTCCGTCCTCGGAGCTAGCATTCCTGTTGATGCCCGGGCCGAGAAGTTCCTCATCGAACTTGCCCCTGGTGAGACTCGCTGGGTTACCGAGGAGGAGAAGTGGGAGCTTAAGCGGGTATGTACCACTATCCTACGCAAAAGTTGTATTTTCACTAGATAATATTGGTTATTAACACCCATTCTAGAAGGGTCAAGACTTCTTTGACATCACTGACGAGGAGGTTGGATTCACTGCTGCTGTTGCACAGCCAGCCATTGCCTACCCAACCTCCATCCGCCATGCTAATGCTGTTAACGCCATGATTGCTACCCTCTCCAAGGAGAACATGCAGCGCGATCTGACCAAGCTCAGCTCGTTCCAAACCGCTTACTATAAGGTTGACTTTGGCAAGCAGTCTGCCACCTGGCTCCAGGAGCAAGTCCAGGCTGCCATCAATACCGCTGGTGCCAATCGCTACGGAGCCAAGGTCGCCAGCTTCCGACACAACTTCGCTCAGCACAGCATCATTGCCACTATTCCCGGCCGCTCCCCTGAAGTCGTTGTCGTCGGTGCTCACCAAGACAGCATCAACCAACGCAGCCCCATGACCGGCCGCGCTCCAGGTGCCGATGACAACGGCAGTGGCTCCGTCACCATCCTTGAGGCCCTCCGTGGTGTTCTCCGGGACCAGACCATCCTCCAGGGCAAGGCTGCCAACACCATTGAGTTCCACTGGTACGCCGGTGAGGAAGCTGGTCTTCTGGGCTCCCAGGCCATCTTCGCCAACTACAAACAGACCGGCAAGAAGGTCAAGGGCATGCTCAACCAGGACATGACCGGTTACATCAAGGGAATGGTCGACAAGGGTCTCAAGGTGTCCTTCGGTATCATCACCGACAACGTCAACGCTAACTTGACCAAGTTCGTCCGCATGGTCATCACCAAGGTAAGCTTCAACTCTTGATAAATATATTTTTCATCGATGAAATGATGTCCTAATAATGCTTAAGTACTGCTCAATCCCAACCATCGACACCCGCTGCGGCTATGCTTGCTCTGACCACGCCTCTGCCAACCGCAATGGCTACCCATCTGCCATGGTTGCCGAGTCTCCCATCGATCTCCTCGACCCTCACCTCCACACTGACTCTGACAACATTAGCTACCTCGACTTCGACCACATGATCGAGCACGCTAAGCTCATTGTCGGCTTCGTCACTGAGCTCGCTAAGTAA

1122个核苷酸的ruLAP1开放阅读框(ORF)，其中起始子ATG在第一个位置上(表2B中下划线)。

表2B、ruLAP1核苷酸序列(SEQ ID NO：5)

ATGAAGCTCCTCTCTGTTCTTGCGCTGAGCGCTACCGCTACCTCCGTCCTCGGAGCTAGCATTCCTGTTGATGCCCGGGCCGAGAAGTTCCTCATCGAACTTGCCCCTGGTGAGACTCGCTGGGTTACCGAGGAGGAGAAGTGGGAGCTTAAGCGGAAGGGTCAAGACTTCTTTGACATCACTGACGAGGAGGTTGGATTCACTGCTGCTGTTGCACAGCCAGCCATTGCCTACCCAACCTCCATCCGCCATGCTAATGCTGTTAACGCCATGATTGCTACCCTCTCCAAGGAGAACATGCAGCGCGATCTGACCAAGCTCAGCTCGTTCCAAACCGCTTACTATAAGGTTGACTTTGGCAAGCAGTCTGCCACCTGGCTCCAGGAGCAAGTCCAGGCTGCCATCAATACCGCTGGTGCCAATCGCTACGGAGCCAAGGTCGCCAGCTTCCGACACAACTTCGCTCAGCACAGCATCATTGCCACTATTCCCGGCCGCTCCCCTGAAGTCGTTGTCGTCGGTGCTCACCAAGACAGCATCAACCAACGCAGCCCCATGACCGGCCGCGCTCCAGGTGCCGATGACAACGGCAGTGGCTCCGTCACCATCCTTGAGGCCCTCCGTGGTGTTCTCCGGGACCAGACCATCCTCCAGGGCAAGGCTGCCAACACCATTGAGTTCCACTGGTACGCCGGTGAGGAAGCTGGTCTTCTGGGCTCCCAGGCCATCTTCGCCAACTACAAACAGACCGGCAAGAAGGTCAAGGGCATGCTCAACCAGGACATGACCGGTTACATCAAGGGAATGGTCGACAAGGGTCTCAAGGTGTCCTTCGGTATCATCACCGACAACGTCAACGCTAACTTGACCAAGTTCGTCCGCATGGTCATCACCAAGTACTGCTCAATCCCAACCATCGACACCCGCTGCGGCTATGCTTGCTCTGACCACGCCTCTGCCAACCGCAATGGCTACCCATCTGCCATGGTTGCCGAGTCTCCCATCGATCTCCTCGACCCTCACCTCCACACTGACTCTGACAACATTAGCTACCTCGACTTCGACCACATGATCGAGCACGCTAAGCTCATTGTCGGCTTCGTCACTGAGCTCGCTAAGTAA

上述ruLAP1核苷酸序列(SEQ ID NO：5)编码有377个氨基酸残基(SEQ ID NO：6)的蛋白，在表2C中以一个字母的氨基酸代码表示。

表2C、ruLAP1编码的蛋白序列(SEQ ID NO：6)
表2C、ruLAP1编码的蛋白序列(SEQ ID NO：6)	MKLLSVLALSATATSVLGASIPVDARAEKFLIELAPGETRWVTEEEKWELKRKGQDFFDITDEEVGFTAAVAQPAIAYPTSIRHANAVNAMIATLSKENMQRDLTKLSSFQTAYYKVDFGKQSATWLQEQVQAAINTAGANRYGAKVASFRHNFAQHSIIATIPGRSPEVVVVGAHQDSINQRSPMTGRAPGADDNGSGSVTILEALRGVLRDQTILQGKAANTIEFHWYAGEEAGLLGSQAIFANYKQTGKKVKGMLNQDMTGYIKGMVDKGLKVSFGIITDNVNANLTKFVRMVITKYCSIPTIDTRCGYACSDHASANRNGYPSAMVAESPIDLLDPHLHTDSDNISYLDFDHMIEHAKLIVGFVTELAK

上述ruLAP1具有与表2D、2E和2F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。

表2D.ruLAP1 TBLASTN结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	>gi1762234	Polyketidesynthase PKSL2/	9894	131/247(53％)	171/247(69％)	1e-95

	Aspergillusparasiticus		40/76(52％)20/24(83％)	57/76(75％)22/24(91％)
	Aspergillusparasiticus		40/76(52％)20/24(83％)	57/76(75％)22/24(91％)		>gi23393798	亮氨酸氨肽酶(Lap1)/Aspergillussojae	2547	77/159(48％)63/148(42％)14/30(46％)	97/159(61％)89/148(60％)23/30(76％)	4e-64
>gi927685	Saccharomycescerevisiae染色IV lambda 3641和cosmid 9831，和9410	78500	137/350(39％)	201/346(57％)	3e-62	>gi23393798	亮氨酸氨肽酶(Lap1)/Aspergillussojae	2547	77/159(48％)63/148(42％)14/30(46％)	97/159(61％)89/148(60％)23/30(76％)	4e-64
>gi927685	Saccharomycescerevisiae染色IV lambda 3641和cosmid 9831，和9410	78500	137/350(39％)	201/346(57％)	3e-62	>gi7413486	Agricus氨肽酶的部分mRNA	1089	130/346(37％)	189/346(54％)	2e-55

表2E.ruLAP1 BLASTX结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	>gi23393799	亮氨酸氨肽酶/Aspergillussojae	377	126/248(50％)37/78(47％)13/24(83％)	162/248(65％)55/78(70％)20/24(83％)	5e-87
>gi28918132	未知蛋白/Neurospora crassa	402	115/247(46％)43/77(55％)18/24(75％)	153/247(61％)58/77(75％)23/24(95％)	8e-86	>gi23393799	亮氨酸氨肽酶/Aspergillussojae	377	126/248(50％)37/78(47％)13/24(83％)	162/248(65％)55/78(70％)20/24(83％)	5e-87
>gi28918132	未知蛋白/Neurospora crassa	402	115/247(46％)43/77(55％)18/24(75％)	153/247(61％)58/77(75％)23/24(95％)	8e-86	>gi6320623	未知ORF；ydr415cp/Saccharomycescerevisiae	374	96/254(37％)37/77(46％)	143/254(56％)49/77(63％)	7e-55
>gi28916832	未知蛋白/Neurospora crassa	409	96/226(42％)31/66(46％)	135/226(59％)41/66(62％)	4e-54	>gi6320623	未知ORF；ydr415cp/Saccharomycescerevisiae	374	96/254(37％)37/77(46％)	143/254(56％)49/77(63％)	7e-55

表2F.ruLAP1 BLASTP结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	>gi23393799	亮氨酸氨肽酶/Aspergillussojae	377	175/348(50％)	234/348(67％)	4e-99
>gi28918132	未知蛋白/Neurospora crassa	402	175/345(50％)	230/345(66％)	2e-97	>gi23393799	亮氨酸氨肽酶/Aspergillussojae	377	175/348(50％)	234/348(67％)	4e-99
>gi28918132	未知蛋白/Neurospora crassa	402	175/345(50％)	230/345(66％)	2e-97	>gi6320623	未知ORF；ydr415cp/Saccharomycescerevisiae	374	140/351(39％)	201/351(57％)	7e-65
>gi28916832	未知蛋白/Neurospora crassa	409	129/296(43％)	178/296(60％)	3e-58	>gi6320623	未知ORF；ydr415cp/Saccharomycescerevisiae	374	140/351(39％)	201/351(57％)	7e-65

fuLAP2

fuLAP2是烟曲霉菌的亮氨酸氨肽酶。1557个核苷酸(SEQ ID NO：7)的fuLAP2核酸如表3A所示。

表3A、fuLAP2基因组核苷酸序列(SEQ ID NO：7)

ATGAAGCTGCTCTACCTCACATCGTTTGCCTCTCTGGCCGTGGCCAATGGCCCAGGATGGGACTGGAAGCCCCGAGTTCATCCGGTTAGTGTTCCTCTCGCCGGGTTTGTCTGCTGTATGCTAACAGCATCCTGTCTATTACAGAAAGTCCTGCCCCAAATGATCCATTTGTGGGATCTTCTGCAGGGCGCTCAACAGCTGGAAGACTTCGCCTATGCCTACCCCGAGCGCAACCGCGTCTTTGGTGGACGGGCCCACGAGGACACCGTCAACTACCTCTACCGTGAGTTGAAGAAAACCGGCTACTACGACGTTTACAAGCAGCCCCAGGTTCACCAGTGGACCCGAGCCGACCAGGCTCTCACCGTCGACGGCCAGTCCTATGACGCCACAACCATGACTTACAGCCCCAGCGTAAACGCCACGGCGCCGCTGGCAGTGGTGAACAACCTGGGCTGCGTCGAGGCTGACTATCCCGCCGATCTGACGGGCAAGATTGCTCTGATCTCGCGGGGCGAGTGCACCTTTGCGACCAAATCCGTCTTGAGCGCCAAGGCCGGGGCGGCGGCGGCACTCGTGTACAACAATATCGAGGGTTCGATGGCGGGAACTCTGGGCGGCGCGACCAGCGAGCTGGGTGCCTACGCTCCCATCGCCGGCATCAGCCTCGCGGACGGACAGGCGCTGATCCAGATGATCCAGGCGGGCACGGTGACAGCCAACCTGTGGATCGACAGCCAGGTCGAGAACCGTACCACCTACAACGTGATCGCGCAGACCAAGGGCGGCGACCCCAACAACGTCGTCGCGCTGGGTGGCCACACGGACTCGGTCGAGGCCGGGCCCGGCATCAACGACGACGGCTCCGGCATCATCAGCAACCTCGTCGTCGCCAAGGCGCTGACCCGCTTCTCGGTCAAGAACGCGGTGCGCTTCTGCTTCTGGACGGCGGAGGAGTTCGGCCTGCTGGGCAGCAACTACTACGTCAACAGCCTCAATGCCACCGAGCAGGCCAAGATCCGCCTGTATCTCAACTTCGACATGATCGCCTCCCCCAACTACGCCCTGATGATCTATGACGGCGACGGCTCGGCCTTCAACCTGACGGGGCCGGCCGGCTCGGCGCAGATCGAGCGGCTCTTCGAGGACTACTACACGTCGATCCGCAAGCCGTTCGTGCCGACCGAGTTCAACGGCCGCTCCGACTACCAGGCCTTTATTCTCAACGGCATCCCCGCGGGAGGCCTCTTCACCGGCGCGGAGGCGATCAAGACCGAGGAACAGGCCCAATTGTTTGGCGGCCAGGCCGGCGTGGCTCTGGACGCCAACTACCACGCCAAGGGTGACAACATGACTAATCTCAACCGCGAGGCTTTCCTGATCAATTCCAGGGCGACGGCCTTTGCCGTGGCGACGTACGCCAACAGCCTTGACTCGATCCCCCCACGCAACATGACCACCGTGGTCAAGCGGTCGCAGCTGGAGCAAGCCATGAAGAGGACCCCGCACACGCACACCGGCGGAACAGGATGCTACAAGGACCGGGTTGAGCAGTAG

1497个核苷酸的fuLAP2开放阅读框(ORF)，其中起始子ATG在第一个位置上(表3B中下划线)。

表3B、fuLAP2核苷酸序列(SEQ ID NO：8)

ATGAAGCTGCTCTACCTCACATCGTTTGCCTCTCTGGCCGTGGCCAATGGCCCAGGATGGGACTGGAAGCCCCGAGTTCATCCGAAAGTCCTGCCCCAAATGATCCATTTGTGGGATCTTCTGCAGGGCGCTCAACAGCTGGAAGACTTCGCCTATGCCTACCCCGAGCGCAACCGCGTCTTTGGTGGACGGGCCCACGAGGACACCGTCAACTACCTCTACCGTGAGTTGAAGAAAACCGGCTACTACGACGTTTACAAGCAGCCCCAGGTTCACCAGTGGACCCGAGCCGACCAGGCTCTCACCGTCGACGGCCAGTCCTATGACGCCACAACCATGACTTACAGCCCCAGCGTAAACGCCACGGCGCCGCTGGCAGTGGTGAACAACCTGGGCTGCGTCGAGGCTGACTATCCCGCCGATCTGACGGGCAAGATTGCTCTGATCTCGCGGGGCGAGTGCACCTTTGCGACCAAATCCGTCTTGAGCGCCAAGGCCGGGGCGGCGGCGGCACTCGTGTACAACAATATCGAGGGTTCGATGGCGGGAACTCTGGGCGGCGCGACCAGCGAGCTGGGTGCCTACGCTCCCATCGCCGGCATCAGCCTCGCGGACGGACAGGCGCTGATCCAGATGATCCAGGCGGGCACGGTGACAGCCAACCTGTGGATCGACAGCCAGGTCGAGAACCGTACCACCTACAACGTGATCGCGCAGACCAAGGGCGGCGACCCCAACAACGTCGTCGCGCTGGGTGGCCACACGGACTCGGTCGAGGCCGGGCCCGGCATCAACGACGACGGCTCCGGCATCATCAGCAACCTCGTCGTCGCCAAGGCGCTGACCCGCTTCTCGGTCAAGAACGCGGTGCGCTTCTGCTTCTGGACGGCGGAGGAGTTCGGCCTGCTGGGCAGCAACTACTACGTCAACAGCCTCAATGCCACCGAGCAGGCCAAGATCCGCCTGTATCTCAACTTCGACATGATCGCCTCCCCCAACTACGCCCTGATGATCTATGACGGCGACGGCTCGGCCTTCAACCTGACGGGGCCGGCCGGCTCGGCGCAGATCGAGCGGCTCTTCGAGGACTACTACACGTCGATCCGCAAGCCGTTCGTGCCGACCGAGTTCAACGGCCGCTCCGACTACCAGGCCTTTATTCTCAACGGCATCCCCGCGGGAGGCCTCTTCACCGGCGCGGAGGCGATCAAGACCGAGGAACAGGCCCAATTGTTTGGCGGCCAGGCCGGCGTGGCTCTGGACGCCAACTACCACGCCAAGGGTGACAACATGACTAATCTCAACCGCGAGGCTTTCCTGATCAATTCCAGGGCGACGGCCTTTGCCGTGGCGACGTACGCCAACAGCCTTGACTCGATCCCCCCACGCAACATGACCACCGTGGTCAAGCGGTCGCAGCTGGAGCAAGCCATGAAGAGGACCCCGCACACGCACACCGGCGGAACAGGATGCTACAAGGACCGGGTTGAGCAGTAG

上述fuLAP2核苷酸序列(SEQ ID NO：8)编码有498个氨基酸残基(SEQ ID NO：9)的蛋白，在表3C中以一个字母的氨基酸代码表示。

表3C、fuLAP2编码的蛋白序列(SEQ ID NO：9)

MKLLYLTSFASLAVANGPGWDWKPRVHPKVLPQMIHLWDLLQGAQQLEDFAYAYPERNRVFGGRAHEDTVNYLYRELKKTGYYDVYKQPQVHQWTRADQALTVDGQSYDATTMTYSPSVNATAPLAVVNNLGCVEADYPADLTGKIALISRGECTFATKSVLSAKAGAAAALVYNNIEGSMAGTLGGATSELGAYAPIAGISLADGQALIQMIQAGTVTANLWIDSQVENRTTYNVIAQTKGGDPNNVVALGGHTDSVEAGPGINDDGSGIISNLVVAKALTRFSVKNAVRFCFWTAEEFGLLGSNYYVNSLNATEQAKIRLYLNFDMIASPNYALMIYDGDGSAFNLTGPAGSAQIERLFEDYYTSIRKPFVPTEFNGRSDYQAFILNGIPAGGLFTGAEAIKTEEQAQLFGGQAGVALDANYHAKGDNMTNLNREAFLINSRATAFAVATYANSLDSIPPRNMTTVVKRSQLEQAMKRTPHTHTGGTGCYKDRVEQ

上述fuLAP2具有与表3D、3E和3F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。

表3D.fuLAP2 TBLASTN结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	>gi469463	SaccharomycesCerevisiae/氨肽酶Y基因	2272	184/464(39％)	243/464(52％)	7e-69
>gi9949032	PseudomonasAruginosa PA01，，整个529个基因组中的281片段氨肽酶Y基因	12547	165/445(37％)	231/445(51％)	9e-67	>gi469463	SaccharomycesCerevisiae/氨肽酶Y基因	2272	184/464(39％)	243/464(52％)	7e-69
>gi9949032	PseudomonasAruginosa PA01，，整个529个基因组中的281片段氨肽酶Y基因	12547	165/445(37％)	231/445(51％)	9e-67	>gi23017467	MycobacteriumTuberculosisCDC15551，整个280个基因组中的33片段	18857	166/426(38％)	218/426(51％)	2e-62

表3E.fuLAP2 BLASTX结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	>gi28918599	未知蛋白/Neurospora crassa	508	250/479(52％)	314/479(65％)	e-131
>gi23017467	未知蛋白/Thermobifida fusca	514	173/465(37％)	251/465(53％)	4e-74	>gi28918599	未知蛋白/Neurospora crassa	508	250/479(52％)	314/479(65％)	e-131
>gi23017467	未知蛋白/Thermobifida fusca	514	173/465(37％)	251/465(53％)	4e-74	>gi584764	APE3 YEAST；氨肽酶前体/Saccharomycescerevisiae	537	184/464(39％)	243/464(52％)	8e-70
>gi9949032	可能的氨肽酶/PseudomonasAeruginosa PA01	536	165/445(37％)	231/445(51％)	1e-67	>gi584764	APE3 YEAST；氨肽酶前体/Saccharomycescerevisiae	537	184/464(39％)	243/464(52％)	8e-70
>gi9949032	可能的氨肽酶/PseudomonasAeruginosa PA01	536	165/445(37％)	231/445(51％)	1e-67	>gi15839805	水解酶/MycobacteriumTuberculosisCDC15551	493	166/426(38％)	218/426(51％)	3e-63

表3F.fuLAP2 BLASTP结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	>gi28918599	未知蛋白/Neurospora crassa	508	250/469(52％)	314/479(65％)	e-128
>gi123017467	未知蛋白/Thermobifida fusca	514	173/465(37％)	251/465(53％)	3e-71	>gi28918599	未知蛋白/Neurospora crassa	508	250/469(52％)	314/479(65％)	e-128
>gi123017467	未知蛋白/Thermobifida fusca	514	173/465(37％)	251/465(53％)	3e-71	>gi584764	APE3 YEAST；氨肽酶前体/Saccharomycescerevisiae	537	183/464(39％)	243/464(52％)	6e-70
>gi15598135	可能的氨肽酶/	536	164/445	230/445	3e-65	>gi584764	APE3 YEAST；氨肽酶前体/Saccharomycescerevisiae	537	183/464(39％)	243/464(52％)	6e-70

PseudomonasAeruginosa PA01

(36％)

(51％)

fuLAP1

fuLAP1是烟曲霉菌的亮氨酸氨肽酶。1298个核苷酸(SEQ ID NO：10)的ruLAP1核酸如表4A所示。

表4A、fuLAP1基因组核苷酸序列(SEQ ID NO：10)

ATGAAAGTTCTTACAGCTATTGCGCTGAGCGCAATAGCTTTCACAGGGGCTGTAGCTGCAGTGATTACTCAGGAAGCATTCTTAAACAACCCCCGCATCCATCATGACCAGGAGAAGTACTTGATCGAACTGGCCCCTTATCGAACACGATGGGTGACTGAAGAGGAGAAATGGGCATTGAAATTGGTACCATACTTCCCCAAAATTTGGGTCTCCAAGTCCACGGGCGACTAACTGCACGATTGCTTGAAGGACGGCGTGAATTTTATCGATATCACAGAAGAGCACAACACCGGATTTTACCCGACTCTCCACAGCGCCAGCTATGTGAAATATCCACCGAAGATGCAGTATGCAGAAGAAGTGGCTGCTCTTAACAAGAATTTATCGAAAGAAAACATGAAGGCCAACCTGGAACGATTCACATCATTTCATACTCGCTATTACAAATCTCAGACGGGAATCCGATCGGCAACGTGGCTGTTCGACCAAGTTCAGAGAGTTGTCTCTGAGTCTGGAGCCGCTGAGTATGGTGCAACTGTTGAGCGATTCTCTCATCCATGGGGTCAGTTCAGCATTATTGCCCGAATACCCGGCCGAACGAACAAGACTGTGGTGCTGGGCGCCCATCAGGACAGCATCAATTTGTTTCTCCCGTCAATCTTGGCTGCTCCCGGTGCTGATGACGATGGAAGTGGAACTGTCACCATTCTTGAAGCGTTGCGCGGTCTGCTGCAGTCAGACGCCATTGCCAAGGGTAATGCATCCAATACTGTCGAGTTCCACTGGTACTCTGCAGAAGAAGGCGGAATGCTGGGCTCCCAGGCAATATTTTCCAATTACAAGCGGAATAGGCGGGAAATCAAAGCCATGCTCCAGCAAGACATGACTGGCTACGTCCAGGGAGCTTTGAACGCCGGTGTTGAGGAAGCCATAGGAATTATGGTCGATTATGTCGACCAGGGCCTCACACAGTTTCTCAAGGACGTTGTTACAGCGGTAAGCCTCAGTTGTCCCCCACGAAAAGCTGTTTAGTCGACAAATGAAATTGACGGCTGCATTAGTACTGCTCTGTGGGTTACCTGGAGACGAAGTGCGGATATGCCTGCTCCGACCACACCTCGGCCAGTAAATATGGTTATCCCGCGGCTATGGCGACAGAAGCAGAGATGGAAAATACCAATAAGAAGATACATACTACCGACGACAAGATCAAGTATTTGAGCTTCGATCATATGTTGGAGCATGCCAAGTTGAGTCTTGGCTTCGCTTTCGAATTGGCATTTGCGCCGTTTTAA

1167个核苷酸的fuLAP1开放阅读框(ORF)，其中起始子ATG在第一个位置上(表4B中下划线)。

表4B、fuLAP1核苷酸序列(SEQ ID NO：11)

ATGAAAGTTCTTACAGCTATTGCGCTGAGCGCAATAGCTTTCACAGGGGCTGTAGCTGCAGTGATTACTCAGGAAGCATTCTTAAACAACCCCCGCATCCATCATGACCAGGAGAAGTACTTGATCGAACTGGCCCCTTATCGAACACGATGGGTGACTGAAGAGGAGAAATGGGCATTGAAATTGGACGGCGTGAATTTTATCGATATCACAGAAGAGCACAACACCGGATTTTACCCGACTCTCCACAGCGCCAGCTATGTGAAATATCCACCGAAGATGCAGTATGCAGAAGAAGTGGCTGCTCTTAACAAGAATTTATCGAAAGAAAACATGAAGGCCAACCTGGAACGATTCACATCATTTCATACTCGCTATTACAAATCTCAGACGGGAATCCGATCGGCAACGTGGCTGTTCGACCAAGTTCAGAGAGTTGTCTCTGAGTCTGGAGCCGCTGAGTATGGTGCAACTGTTGAGCGATTCTCTCATCCATGGGGTCAGTTCAGCATTATTGCCCGAATACCCGGCCGAACGAACAAGACTGTGGTGCTGGGCGCCCATCAGGACAGCATCAATTTGTTTCTCCCGTCAATCTTGGCTGCTCCCGGTGCTGATGACGATGGAAGTGGAACTGTCACCATTCTTGAAGCGTTGCGCGGTCTGCTGCAGTCAGACGCCATTGCCAAGGGTAATGCATCCAATACTGTCGAGTTCCACTGGTACTCTGCAGAAGAAGGCGGAATGCTGGGCTCCCAGGCAATATTTTCCAATTACAAGCGGAATAGGCGGGAAATCAAAGCCATGCTCCAGCAAGACATGACTGGCTACGTCCAGGGAGCTTTGAACGCCGGTGTTGAGGAAGCCATAGGAATTATGGTCGATTATGTCGACCAGGGCCTCACACAGTTTCTCAAGGACGTTGTTACAGCGTACTGCTCTGTGGGTTACCTGGAGACGAAGTGCGGATATGCCTGCTCCGACCACACCTCGGCCAGTAAATATGGTTATCCCGCGGCTATGGCGACAGAAGCAGAGATGGAAAATACCAATAAGAAGATACATACTACCGACGACAAGATCAAGTATTTGAGCTTCGATCATATGTTGGAGCATGCCAAGTTGAGTCTTGGCTTCGCTTTCGAATTGGCATTTGCGCCGTTTTAA

上述fuLAP1核苷酸序列(SEQ ID NO：11)编码有388个氨基酸残基(SEQ ID NO：12)的蛋白，在表4C中以一个字母的氨基酸代码表示。

表4C、fuLAP1编码的蛋白序列(SEQ ID NO：12)
表4C、fuLAP1编码的蛋白序列(SEQ ID NO：12)	MKVLTAIALSAIAFTGAVAAVITQEAFLNNPRIHHDQEKYLIELAPYRTRWVTEEEKWALKLDGVNFIDITEEHNTGFYPTLHSASYVKYPPKMQYAEEVAALNKNLSKENMKANLERFTSFHTRYYKSQTGIRSATWLFDQVQRVVSESGAAEYGATVERFSHPWGQFSIIARIPGRTNKTVVLGAHQDSINLFLPSILAAPGADDDGSGTVTILEALRGLLQSDAIAKGNASNTVEFHWYSAEEGGMLGSQAIFSNYKRNRREIKAMLQQDMTGYVQGALNAGVEEAIGIMVDYVDQGLTQFLKDVVTAYCSVGYLETKCGYACSDHTSASKYGYPAAMATEAEMENTNKKIHTTDDKIKYLSFDHMLEHAKLSLGFAFELAFAPF

上述fuLAP1具有与表4D、4E和4F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。

表4D.fuLAP1 TBLASTN结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	>gi1762234	Polyketidesynthase PKSL2/Aspergillusparasiticus	9894	208/249(80％)61/84(72％)46/62(74％)	226/249(90％)67/84(79％)55/62(88％)	e-169
>gi23393798	亮氨酸氨肽酶(Lap1)/Aspergillussojae	2547	66/110(60％)68/152(44％)37/75(49％)15/30(50％)	82/110(74％)92/152(60％)52/75(69％)21/30(70％)	7e-82	>gi1762234	Polyketidesynthase PKSL2/Aspergillusparasiticus	9894	208/249(80％)61/84(72％)46/62(74％)	226/249(90％)67/84(79％)55/62(88％)	e-169
>gi23393798	亮氨酸氨肽酶(Lap1)/Aspergillussojae	2547	66/110(60％)68/152(44％)37/75(49％)15/30(50％)	82/110(74％)92/152(60％)52/75(69％)21/30(70％)	7e-82	>gi927685	SaccharomycesCerevisiae染色IV lambda 3641和cosmid 9831，和9410	78500	152/341(44％)	207/341(60％)	1e-71
>gi5832144	在无氮源情况下培养出的Botrytis cinerea菌株T4 cDNA文库	780	89/134(66％)27/53(50％)	106/134(79％)33/53(62％)	7e-58	>gi927685	SaccharomycesCerevisiae染色IV lambda 3641和cosmid 9831，和9410	78500	152/341(44％)	207/341(60％)	1e-71

表4E.fuLAP1 BLASTX结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	>gi28918132	未知蛋白/Neurospora crassa	402	208/352(59％)	255/352(72％)	e-116
>gi23393799	亮氨酸氨肽酶/Aspergillussojae	377	183/355(51％)	241/355(67％)	3e-97	>gi28918132	未知蛋白/Neurospora crassa	402	208/352(59％)	255/352(72％)	e-116
>gi23393799	亮氨酸氨肽酶/Aspergillussojae	377	183/355(51％)	241/355(67％)	3e-97	>gi6320623	未知ORF Ydr414cp/Saccharomycescerevisiae	374	152/341(44％)	207/341(60％)	2e-72
>gi18250467	氨肽酶/Agaricusbisporus	384	139/352(39％)	186/352(52％)	1e-58	>gi6320623	未知ORF Ydr414cp/Saccharomycescerevisiae	374	152/341(44％)	207/341(60％)	2e-72

表4F.fuLAP1 BLASTP结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	>gi28918132	未知蛋白/Neurospora crassa	402	208/352(59％)	255/352(72％)	e-116
>gi23393799	亮氨酸氨肽酶(LAP1)/Aspergillussojae	377	183/355(51％)	241/355(67％)	6e-98	>gi28918132	未知蛋白/Neurospora crassa	402	208/352(59％)	255/352(72％)	e-116
>gi23393799	亮氨酸氨肽酶(LAP1)/Aspergillussojae	377	183/355(51％)	241/355(67％)	6e-98	>gi6320623	未知ORF Ydr414cp/Saccharomycescerevisiae	374	152/341(44％)	207/341(60％)	3e-73

>gi18250467

氨肽酶/Agaricus bisporus

384

140/352(39％)

190/352(53％)

7e-59

ruCBPS1

ruCBPS1是红色毛癣菌的羧肽酶。2106个核苷酸(SEQ ID NO：13)的ruCBPS1核酸如表5A所示。

表5A、ruCBPS1基因组核苷酸序列(SEQ ID NO：13)

ATGGTGTCATTCTGCGGAGTGGCAGCCTGCCTGCTGACAGTTGCTGGCCATCTTGCGCAGGCTCAGTTCCCACCAAAACCGGAGGGAGTCACTGTCCTGGAGTCGAAATTCGGCAGCGGTGCTCGCATCACTTATAAGGAGGTCCGTTAGCTGCATAGAAAGTCCACGTGAAGACGCTGTAGCTAACAATCCACTAGCCTGGCCTCTGTGAGACGACAGAGGGCGTCAAGTCGTACGCCGGATATGTCCATCTGCCTCCAGGCACGCTCAGGGACTTCGGTGTCGAGCAGGACTACCCTATCAACACCTTTTTTTGGTTCTTTGAGGCAAGAAAGGACCCTGAAAATGCCCCTCTCGGCATCTGGATGAACGGTGGCCCGGGTAGCTCGTCGATGTTTGGAATGATGACTGAGAACGGGCCTTGCTTCGTCAATGCAGACTCCAATTCTACTCGCCTGAACCCTCATTCTTGGAACAATGAAGGTATGCCATCAGCTTCTGATGGAAAACTAAATATTGCTAACATTGTACTTTCTGTGACTAGTCAATATGCTGTATATAGACCAGCCAGTGCAGGTCGGTCTGTCCTACGACACTTTGGCCAACTTCACCAGGAATCTAGTCACGGATGAGATCACGAAACTGAAACCCGGAGAACCTATTCCGGAACAGAATGCCACTTTCCTGGTAGGTACATATGCAAGCCGCAATATGAACACCACTGCACACGGAACTAGGCATGCTGCCATGGCTCTCTGGCACTTCGCCCAAGTCTGGTTCCAAGAGTTCCCAGGATATCACCCTAGGAACAACAAGATCAGCATTGCTACCGAATCCTACGGCGGCCGTTATGGCCCGGCCTTTACTGCCTTCTTTGAAGAGCAGAACCAGAAGATCAAGAACGGCACATGGAAGGGACACGAGGGAACTATGCACGTGCTGCATCTCGACACCCTCATGATCGTCAACGGATGCATCGACCGTCTTGTCCAATGGCCGGCATATCCGCAAATGGCGTACAACAACACATATAGCATCGAGGCAGTCAACGCCAGCATTCATGCAGGAATGCTGGATGCCCTCTACCGCGACGGTGGCTGTCGAGACAAGATTAACCACTGCCGCTCCCTCTCTTCTGTGTTCGATCCTGAGAATCTCGGCATCAACTCAACCGTCAATGATGTCTGCAAGGATGCCGAGACATTCTGCTCCAATGATGTTCGCGATCCCTACCTCAAGTTCTCTGGCCGCAACTACTATGACATCGGACAGCTTGACCCCAGCCCATTCCCAGCACCATTTTACATGGCCTGGCTAAATCAGCCGCATGTGCAGGCAGCACTGGGTGTGCCACTTAACTGGACACAGTCAAACGATGTTGTGTCTACCGCATTCCGTGCAATTGGTGACTACCCTCGGCCAGGGTGGCTGGAGAACCTGGCTTATTTGCTGGAGAATGGCATCAAGGTTTCGCTTGTTTACGGTGATCGGGACTACGCATGCAACTGGTTCGGTGGTGAGCTCTCAAGTCTGGGAATCAACTACACTGACACCCACGAATTCCATAATGCCGGCTATGCAGGTATCCAGATCAATAGCAGCTACATCGGTGGACAGGTGAGGCAGTACGGCAACCTCTCCTTCGCCCGCGTCTACGAGGCCGGCCATGAGGTGCCATCGTACCAACCCGAGACTGCACTGCAGATATTCCACCGTTCCCTGTTCAACAAGGATATCGCTACTGGAACCAAGGACACGTCATCGCGCATGGACGGAGGCAAGTTTTACGGCACCTCGGGCCCTGCGGACTCGTTTGGTTTCAAGAACAAACCTCCACCGCAGCACGTCCACTTCTGTCATATCTTAGACACCAGCACCTGCACCAAGGAGCAGATCCAGTCAGTTGAGAACGGCACTGCCGCCGTACGCAGCTGGATCATTGTCGACTCCAACTCGACCTCTCTGTTCCCCGAGGTAGTTGGCTCAGGGGAACCCACGCCAACCCCTATGCCTGGAGGGGCTACTACACTATCTGCTCACGGGTTCTTGTATGGCGTGACATTATGGGCTGTTATTGTTGTAGCTGTTATAGAGCTGGCAATGTAA

1989个核苷酸(SEQ ID NO：14)的ruCBPS1开放阅读框(ORF)见表5B，其中ruCBPS1开放阅读框(ORF)起始子ATG在第一个位置上(表5B中下划线)。

表5B、ruCBPS1核苷酸序列(SEQ ID NO：14)

ATGGTGTCATTCTGCGGAGTGGCAGCCTGCCTGCTGACAGTTGCTGGCCATCTTGCGCAGGCTCAGTTCCCACCAAAACCGGAGGGAGTCACTGTCCTGGAGTCGAAATTCGGCAGCGGTGCTCGCATCACTTATAAGGAGCCTGGCCTCTGTGAGACGACAGAGGGCGTCAAGTCGTACGCCGGATATGTCCATCTGCCTCCAGGCACGCTCAGGGACTTCGGTGTCGAGCAGGACTACCCTATCAACACCTTTTTTTGGTTCTTTGAGGCAAGAAAGGACCCTGAAAATGCCCCTCTCGGCATCTGGATGAACGGTGGCCCGGGTAGCTCGTCGATGTTTGGAATGATGACTGAGAACGGGCCTTGCTTCGTCAATGCAGACTCCAATTCTACTCGCCTGAACCCTCATTCTTGGAACAATGAAGTCAATATGCTGTATATAGACCAGCCAGTGCAGGTCGGTCTGTCCTACGACACTTTGGCCAACTTCACCAGGAATCTAGTCACGGATGAGATCACGAAACTGAAACCCGGAGAACCTATTCCGGAACAGAATGCCACTTTCCTGGTAGGTACATATGCAAGCCGCAATATGAACACCACTGCACACGGAACTAGGCATGCTGCCATGGCTCTCTGGCACTTCGCCCAAGTCTGGTTCCAAGAGTTCCCAGGATATCACCCTAGGAACAACAAGATCAGCATTGCTACCGAATCCTACGGCGGCCGTTATGGCCCGGCCTTTACTGCCTTCTTTGAAGAGCAGAACCAGAAGATCAAGAACGGCACATGGAAGGGACACGAGGGAACTATGCACGTGCTGCATCTCGACACCCTCATGATCGTCAACGGATGCATCGACCGTCTTGTCCAATGGCCGGCATATCCGCAAATGGCGTACAACAACACATATAGCATCGAGGCAGTCAACGCCAGCATTCATGCAGGAATGCTGGATGCCCTCTACCGCGACGGTGGCTGTCGAGACAAGATTAACCACTGCCGCTCCCTCTCTTCTGTGTTCGATCCTGAGAATCTCGGCATCAACTCAACCGTCAATGATGTCTGCAAGGATGCCGAGACATTCTGCTCCAATGATGTTCGCGATCCCTACCTCAAGTTCTCTGGCCGCAACTACTATGACATCGGACAGCTTGACCCCAGCCCATTCCCAGCACCATTTTACATGGCCTGGCTAAATCAGCCGCATGTGCAGGCAGCACTGGGTGTGCCACTTAACTGGACACAGTCAAACGATGTTGTGTCTACCGCATTCCGTGCAATTGGTGACTACCCTCGGCCAGGGTGGCTGGAGAACCTGGCTTATTTGCTGGAGAATGGCATCAAGGTTTCGCTTGTTTACGGTGATCGGGACTACGCATGCAACTGG

TTCGGTGGTGAGCTCTCAAGTCTGGGAATCAACTACACTGACACCCACGAATTCCATAATGCCGGCTATGCAGGTATCCAGATCAATAGCAGCTACATCGGTGGACAGGTGAGGCAGTACGGCAACCTCTCCTTCGCCCGCGTCTACGAGGCCGGCCATGAGGTGCCATCGTACCAACCCGAGACTGCACTGCAGATATTCCACCGTTCCCTGTTCAACAAGGATATCGCTACTGGAACCAAGGACACGTCATCGCGCATGGACGGAGGCAAGTTTTACGGCACCTCGGGCCCTGCGGACTCGTTTGGTTTCAAGAACAAACCTCCACCGCAGCACGTCCACTTCTGTCATATCTTAGACACCAGCACCTGCACCAAGGAGCAGATCCAGTCAGTTGAGAACGGCACTGCCGCCGTACGCAGCTGGATCATTGTCGACTCCAACTCGACCTCTCTGTTCCCCGAGGTAGTTGGCTCAGGGGAACCCACGCCAACCCCTATGCCTGGAGGGGCTACTACACTATCTGCTCACGGGTTCTTGTATGGCGTGACATTATGGGCTGTTATTGTTGTAGCTGTTATAGAGCTGGCAATGTAA

上述ruCBPS1核苷酸序列(SEQ ID NO：14)编码含662个氨基酸残基(SEQ ID NO：15)的蛋白，在表5C中以一个字母的氨基酸代码表示。

表5C、ruCBPS1编码的蛋白序列(SEQ ID NO：15)

MVSFCGVAACLLTVAGHLAQAQFPPKPEGVTVLESKFGSGARITYKEPGLCETTEGVKSYAGYVHLPPGTLRDFGVEQDYPINTFFWFFEARKDPENAPLGIWMNGGPGSSSMFGMMTENGPCFVNADSNSTRLNPHSWNNEVNMLYIDQPVQVGLSYDTLANFTRNLVTDEITKLKPGEPIPEQNATFLVGTYASRNMNTTAHGTRHAAMALWHFAQVWFQEFPGYHPRNNKISIATESYGGRYGPAFTAFFEEQNQKIKNGTWKGHEGTMHVLHLDTLMIVNGCIDRLVQWPAYPQMAYNNTYSIEAVNASIHAGMLDALYRDGGCRDKINHCRSLSSVFDPENLGINSTVNDVCKDAETFCSNDVRDPYLKFSGRNYYDIGQLDPSPFPAPFYMAWLNQPHVQAALGVPLNWTQSNDVVSTAFRAIGDYPRPGWLENLAYLLENGIKVSLVYGDRDYACNWFGGELSSLGINYTDTHEFHNAGYAGIQINSSYIGGQVRQYGNLSFARVYEAGHEVPSYQPETALQIFHRSLFNKDIATGTKDTSSRMDGGKFYGTSGPADSFGFKNKPPPQHVHFCHILDTSTCTKEQIQSVENGTAAVRSWIIVDSNSTSLFPEVVGSGEPTPTPMPGGATTLSAHGFLYGVTLWAVIVVAVIELAM

上述ruCBPS1具有与表5D、5E和5F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。

表5D.ruCBPS1 TBLASTN结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|32410708	Neurospora crassa菌株OR74A	1947	222/632(35％)	321/632(50％)	1e-90
gi\|3046860	schizoaccharomycesprombe cpy1羧肽酶Y基因	4308	137/481(28％)	204/481(42％)	6e-41	gi\|32410708	Neurospora crassa菌株OR74A	1947	222/632(35％)	321/632(50％)	1e-90
gi\|3046860	schizoaccharomycesprombe cpy1羧肽酶Y基因	4308	137/481(28％)	204/481(42％)	6e-41	gi\|18152938	Pichia angusta羧肽酶Y(CPY)基因	2214	141/520(27％)	228/520(43％)	4e-40
gi\|4028157	Pichia angusta羧肽酶Y前体(CPY)基因	2509	140/520(26％)	226/520(43％)	7e-40	gi\|18152938	Pichia angusta羧肽酶Y(CPY)基因	2214	141/520(27％)	228/520(43％)	4e-40
gi\|4028157	Pichia angusta羧肽酶Y前体(CPY)基因	2509	140/520(26％)	226/520(43％)	7e-40	gi\|170828	Candida albicans羧肽酶Y前体(CPY1)基因	1985	131/482(27％)	205/482(43％)	3e-36

表5E.ruCBPS1 BLASTX结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|15004616	羧肽酶S1/Aspergillus oryzae	555	209/535(39％)	294/535(54％)	1e-98
gi\|435818	羧肽酶S1 CPD-S1/Penicilliumjanthinellum	423	159/498(31％)	234/498(46％)	6e-64	gi\|15004616	羧肽酶S1/Aspergillus oryzae	555	209/535(39％)	294/535(54％)	1e-98
gi\|435818	羧肽酶S1 CPD-S1/Penicilliumjanthinellum	423	159/498(31％)	234/498(46％)	6e-64	gi\|995456	前-羧肽酶Z/Absidia zychae	460	147/506(29％)	219/506(43％)	8e-48
gi\|3046861	羧肽酶Y/schizoaccharomyces prombe	1002	137/481(28％)	204/481(42％)	7e-42	gi\|995456	前-羧肽酶Z/Absidia zychae	460	147/506(29％)	219/506(43％)	8e-48

gi\|18152939	羧肽酶Y/Pichia angusta	537	141/520(27％)	228/520(43％)	4e-41
gi\|18152939	羧肽酶Y/Pichia angusta	537	141/520(27％)	228/520(43％)	4e-41	gi\|4028158	羧肽酶Y前体；vacuolar羧肽酶/Pichia angusta	541	140/520(26％)	226/520(43％)	7e-41
gi\|7597001	羧肽酶Y前体/Candida albicans	542	131/482(27％)	206/482(42％)	2e-37	gi\|4028158	羧肽酶Y前体；vacuolar羧肽酶/Pichia angusta	541	140/520(26％)	226/520(43％)	7e-41

表5F.ruCBPS1 BLASTP结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|15004616	羧肽酶S1/Aspergillusoryzae	555	210/537(39％)	296/535(55％)	2e-95
gi\|435818	羧肽酶S1CPD-S1/Penicilliumjantbinellum	423	159/498(31％)	234/498(46％)	2e-60	gi\|15004616	羧肽酶S1/Aspergillusoryzae	555	210/537(39％)	296/535(55％)	2e-95
gi\|435818	羧肽酶S1CPD-S1/Penicilliumjantbinellum	423	159/498(31％)	234/498(46％)	2e-60	gi\|995456	前-羧肽酶Z/Absidia zychae	460	146/500(29％)	217/500(43％)	6e-47
gi\|19115337	羧肽酶Y/schizoaccharomyces prombe	1002	136/481(28％)	204/481(42％)	7e-41	gi\|995456	前-羧肽酶Z/Absidia zychae	460	146/500(29％)	217/500(43％)	6e-47

ruCBPS1’

ruCBPS1’是红色毛癣菌的羧肽酶。2030个核苷酸(SEQ ID NO：16)的ruCBPS1’基因组DNA序列如表6A所示。

表6A、ruCBPS1’基因组核苷酸序列(SEQ ID NO：16)

ATGCGCTTTGCTGCTAGCATTGCCGTGGCCCTGCCAGTCATTCACGCGGCGAGTGCTCAAGGCTTCCCTCCACCCGTTAAGGGCGTCACCGTGGTCAAATCCAAGTTCGACGAAAACGTAAAGATCACATACAAGGAGGTATGTGTTTACATCATTTTCACATCCAGATCTTATATCCTTACAATAAATCTGGCTAACTCACTGGATAGAATGACATATGTGAAACCACTCAAGGAGTTAGATCATTCACCGGTCATGTCCACCTTCCTCCAGACAACGATGACTTTGGTGTCTACCGGAACTACTCCATCAACACATTCTTCTGGTTCTTTGAAGCTCGTGAAGACCCTAAGAATGCTCCTCTCTCCATCTGGCTGAACGGTGGTCCGGGATCGTCATCCATGATTGGACTCTTCCAGGAAAACGGTCCATGCTGGGTCAATGAAGACTCTAAATCTACCACCAACAATTCATTTTCATGGAACAATAAAGTAAATATGCTCTACATTGATCAGCCAAACCAAGTCGGTTTCAGTTATGACGTACCTACCAACATCACTTACTCTACCATCAATGATACAATATCTGTTGCGGACTTCTCTAACGGTGTCCCTGCGCAAAATCTTTCTACGTTGGTTGGAACCGGCAGCAGCCAGAACCCTTGGGCAACTGCCAATAACACTGTGAACGCTGCTCGTTCTATCTGGCACTTTGCACAAGTGTGGTTCCAGGAATTCCCTGAACACAAGCCTAACAATAACAAGATCAGTATTTGGACAGAGTCCTATGGAGGAAGATATGGTCCCTCATTCGCCTCTTACTTCCAGGAACAGAACGAAAAGATCAAAAACCATACCATTACTGAAGAAGGAGAGATGCATATTCTGAACCTCGACACCCTCGGTATCATCAACGGCTGCATCGATCTTATGTTCCAAGCAGAAAGTTATGCTGAATTCCCATACAACAACACCTATGGCATCAAAGCTTATACCAAGGAGAAGCGTGACGCTATATTACACGACATCCACCGTCCTGACGGCTGCTTCGACAAGGTTACCAAGTGCCGTGAGGCCGCGAAAGAAGGAGACCCTCACTTCTACAGCAACAATGCAACCGTCAACACAATCTGTGCGGATGCTAACTCTGCCTGCGACAAATATCTAATGGATCCTTTCCAAGAGACCAATCTTGGTTACTATGATATTGCTCATCCTCTTCAGGATCCCTTCCCCCCACCATTCTATAAGGGCTTCCTCAGCCAATCCAGCGTTCTATCTGACATGGGATCGCCAGTCAACTTCTCCCAATACGCCCAAGCTGTGGGAAAATCATTCCATGGAGTTGGCGACTACGCTCGCCCTGATGTGCGCGGCTTCACCGGTGACATTGCTTATCTTCTCGAGAGCGGAGTCAAGGTTGCTCTCGTCTATGGTGACAGAGACTACATCTGCAATTGGTTCGGTGGTGAGCAGGTCAGTCTTGGCTTGAACTACACTGGCACCCAAGACTTCCACAGGGCAAAATATGCCGATGTCAAGGTCAACTCTTCATACGTCGGAGGCGTAGTGCGTCAACATGGAAACTTCTCTTTCACCAGAGTTTTCGAGGCCGGTCATGAAGTCCCTGGTTACCAACCCGAGACTGCCCTCAAGATCTTTGAGCGCATCATGTTCAACAAGGATATTTCTACCGGTGAGATCGACATTGCTCAGAAACCAGACTACGGTACCACTGGAACTGAGTCTACGTTCCATATCAAAAACGATATCCCTCCTTCGCCTGAGCCGACCTGCTACCTCCTCAGTGCTGACGGAACCTGTACCCCGGAGCAGCTTAATGCTATTAAGGATGGAACTGCAGTTGTTGAGAACTACATTATTAAGAGCCCTGCTGCGTCGAAGGGGAACCCTCCACCAACCACGACCTCATCTCCCACAGCAGCCCCTACCGCTGGAAGTGCCATGCTAAAGGCTCCTGTGGCAATGCTAGCAATATCAGCTCTCACTGTCCTTGCTTTCTTCTTGTAG

1959个核苷酸(SEQ ID NO：17)的ruCBPS1’见表6B，其中ruCBPS1’开放阅读框(“ORF”)起始子ATG在第一个位置上(表6B中下划线)。

表6B、ruCBPS1’核苷酸序列(SEQ ID NO：17)

ATGCGCTTTGCTGCTAGCATTGCCGTGGCCCTGCCAGTCATTCACGCGGCGAGTGCTCAAGGCTTCCCTCCACCCGTTAAGGGCGTCACCGTGGTCAAATCCAAGTTCGACGAAAACGTAAAGATCACATACAAGGAGAATGACATATGTGAAACCACTCAAGGAGTTAGATCATTCACCGGTCATGTCCACCTTCCTCCAGACAACGATGACTTTGGTGTCTACCGGAACTACTCCATCAACACATTCTTCTGGTTCTTTGAAGCTCGTGAAGACCCTAAGAATGCTCCTCTCTCCATCTGGCTGAACGGTGGTCCGGGATCGTCATCCATGATTGGACTCTTCCAGGAAAACGGTCCATGCTGGGTCAATGAAGACTCTAAATCTACCACCAACAATTCATTTTCATGGAACAATAAAGTAAATATGCTCTACATTGATCAGCCAAACCAAGTCGGTTTCAGTTATGACGTACCTACCAACATCACTTACTCTACCATCAATGATACAATATCTGTTGCGGACTTCTCTAACGGTGTCCCTGCGCAAAATCTTTCTACGTTGGTTGGAACCGGCAGCAGCCAGAACCCTTGGGCAACTGCCAATAACACTGTGAACGCTGCTCGTTCTATCTGGCACTTTGCACAAGTGTGGTTCCAGGAATTCCCTGAACACAAGCCTAACAATAACAAGATCAGTATTTGGACAGAGTCCTATGGAGGAAGATATGGTCCCTCATTCGCCTCTTACTTCCAGGAACAGAACGAAAAGATCAAAAACCATACCATTACTGAAGAAGGAGAGATGCATATTCTGAACCTCGACACCCTCGGTATCATCAACGGCTGCATCGATCTTATGTTCCAAGCAGAAAGTTATGCTGAATTCCCATACAACAACACCTATGGCATCAAAGCTTATACCAAGGAGAAGCGTGACGCTATATTACACGACATCCACCGTCCTGACGGCTGCTTCGACAAGGTTACCAAGTGCCGTGAGGCCGCGAAAGAAGGAGACCCTCACTTCTACAGCAACAATGCAACCGTCAACACAATCTGTGCGGATGCTAACTCTGCCTGCGACAAATATCTAATGGATCCTTTCCAAGAGACCAATCTTGGTTACTATGATATTGCTCATCCTCTTCAGGATCCCTTCCCCCCACCATTCTATAAGGGCTTCCTCAGCCAATCCAGCGTTCTATCTGACATGGGATCGCCAGTCAACTTCTCCCAATACGCCCAAGCTGTGGGAAAATCATTCCATGGAGTTGGCGACTACGCTCGCCCTGATGTGCGCGGCTTCACCGGTGACATTGCTTATCTTCTCGAGAGCGGAGTCAAGGTTGCTCTCGTCTATGGTGACAGAGACTACATCTGCAATTGGTTCGGTGGTGAGCAGGTCAGTCTTGGCTTGAACTACACTGGCACCCAAGACTTCCACAGGGCAAAATATGCCGATGTCAAGGTCAACTCTTCATACGTCGGAGGCGTAGTGCGTCAACATGGAAACTTCTCTTTCACCAGAGTTTTCGAGGCCGGTCATGAAGTCCCTGGTTACCAACCCGAGACTGCCCTCAAGATCTTTGAGCGCATCATGTTCAACAAGGATATTTCTACCGGTGAGATCGACATTGCTCAGAAACCAGACTACGGTACCACTGGAACTGAGTCTACGTTCCATATCAAAAACGATATCCCTCCTTCGCCTGAGCCGACCTGCTACCTCCTCAGTGCTGACGGAACCTGTACCCCGGAGCAGCTTAATGCTATTAAGGATGGAACTGCAGTTGTTGAGAACTACATTATTAAGAGCCCTGCTGCGTCGAAGGGGAACCCTCCACCAACCACGACCTCATCTCCCACAGCAGCCCCTACCGCTGGAAGTGCCATGCTAAAGGCTCCTGTGGCAATGCTAGCAATATCAGCTCTCACTGTCCTTGCTTTCTTCTTGTAG

上述ruCBPS1’核苷酸序列(SEQ ID NO：17)编码含652个氨基酸残基(SEQ ID NO：18)的蛋白，在表6C中以一个字母的氨基酸代码表示。

表6C、ruCBPS1’编码的蛋白序列(SEQ ID NO：18)

MRFAASIAVALPVIHAASAQGFPPPVKGVTVVKSKFDENVKITYKENDICETTQGVRSFTGHVHLPPDNDDFGVYRNYSINTFFWFFEAREDPKNAPLSIWLNGGPGSSSMIGLFQENGPCWVNEDSKSTTNNSFSWNNKVNMLYIDQPNQVGFSYDVPTNITYSTINDTISVADFSNGVPAQNLSTLVGTGSSQNPWATANNTVNAARSIWHFAQVWFQEFPEHKPNNNKISIWTESYGGRYGPSFASYFQEQNEKIKNHTITEEGEMHILNLDTLGIINGCIDLMFQAESYAEFPYNNTYGIKAYTKEKRDAILHDIHRPDGCFDKVTKCREAAKEGDPHFYSNNATVNTICADANSACDKYLMDPFQETNLGYYDIAHPLQDPFPPPFYKGFLSQSSVLSDMGSPVNFSQYAQAVGKSFHGVGDYARPDVRGFTGDIAYLLESGVKVALVYGDRDYICNWFGGEQVSLGLNYTGTQDFHRAKYADVKVNSSYVGGVVRQHGNFSFTRVFEAGHEVPGYQPETALKIFERIMFNKDISTGEIDIAQKPDYGTTGTESTFHIKNDIPPSPEPTCYLLSADGTCTPEQLNAIKDGTAVVENYIIKSPAASKGNPPPTTTSSPTAAPTAGSAMLKAPVAMLAISALTVLAFFL

上述ruCBPS1’具有与表6D、6E和6F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。

表6D.ruCBPS1’TBLASTN结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|32410708	Neurospora crassa菌株OR74A	1947	246/632(38％)	337/632(53％)	e-104
gi\|3046860	Schizoaccharomycesprombe cpy1羧肽酶Y基因	4308	137/480(28％)	215/480(44％)	1e-45	gi\|32410708	Neurospora crassa菌株OR74A	1947	246/632(38％)	337/632(53％)	e-104
gi\|3046860	Schizoaccharomycesprombe cpy1羧肽酶Y基因	4308	137/480(28％)	215/480(44％)	1e-45	gi\|18152938	Pichia angusta羧肽酶Y(CPY)基因	2214	139/508(27％)	227/508(44％)	2e-42

表6E.ruCBPS1’BLASTX结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|15004616	羧肽酶S1/Aspergillus oryzae	555	221/567(38％)	310/567(54％)	e-102
gi\|435818	羧肽酶S1CPD-S1/Penicilliumjanthinellum	423	174/499(34％)	258/499(51％)	4e-77	gi\|15004616	羧肽酶S1/Aspergillus oryzae	555	221/567(38％)	310/567(54％)	e-102
gi\|435818	羧肽酶S1CPD-S1/Penicilliumjanthinellum	423	174/499(34％)	258/499(51％)	4e-77	gi\|995456	前-羧肽酶Z/Absidiazychae	460	155/491(31％)	243/491(49％)	2e-58
gi\|19115337	羧肽酶Y/Schizoaccharomycesprombe	1002	137/480(28％)	215/480(44％)	1e-46	gi\|995456	前-羧肽酶Z/Absidiazychae	460	155/491(31％)	243/491(49％)	2e-58
gi\|19115337	羧肽酶Y/Schizoaccharomycesprombe	1002	137/480(28％)	215/480(44％)	1e-46	gi\|4028158	羧肽酶Y前体；Vacuolar羧肽酶/Pichia angusta	541	139/508(27％)	226/508(44％)	2e-43

表6F.ruCBPS1’BLASTP结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|15004616	羧肽酶S1/Aspergillusoryzae	555	222/567(39％)	310/567(54％)	7e-98
gi\|435818	羧肽酶S1CPD-S1/Penicilliumjanthinellum	423	174/499(34％)	259/499(51％)	1e-71	gi\|15004616	羧肽酶S1/Aspergillusoryzae	555	222/567(39％)	310/567(54％)	7e-98
gi\|435818	羧肽酶S1CPD-S1/Penicilliumjanthinellum	423	174/499(34％)	259/499(51％)	1e-71	gi\|995456	前-羧肽酶Z/Absidia zychae	460	156/491(31％)	244/491(49％)	2e-57
gi\|19115337	羧肽酶Y/Schizoaccharomyces prombe	1002	137/480(28％)	215/480(44％)	4e-44	gi\|995456	前-羧肽酶Z/Absidia zychae	460	156/491(31％)	244/491(49％)	2e-57

ruPAP

ruPAP是红色毛癣菌的脯氨酰氨肽酶。1795个核苷酸(SEQ ID NO：19)的ruPAP基因组DNA序列如表7A所示。

表7A、ruPAP基因组核苷酸序列(SEQ ID NO：19)

ATGCGCTTTGCTGCTAGCATTGCCGTGGCCCTGCCAGTCATTCACGCGGCGAGTGCTCAAGGCTTCCCTCCACCCGTTAAGGGCGTCACCGTGGTCAAATCCAAGTTCGACGAAAACGTAAAGATCACATACAAGGAGGTATGTGTTTACATCATTTTCACATCCAGATCTTATATCCTTACAATAAATCTGGCTAACTCACTGGATAGAATGACATATGTGAAACCACTCAAGGAGTTAGATCATTCACCGGTCATGTCCACCTTCCTCCAGACAACGATGACTTTGGTGTCTACCGGAACTACTCCATCAACACATTCTTCTGGTTCTTTGAAGCTCGTGAAGACCCTAAGAATGCTCCTCTCTCCATCTGGCTGAACGGTGGTCCGGGATCGTCATCCATGATTGGACTCTTCCAGGAAAACGGTCCATGCTGGGTCAATGAAGACTCTAAATCTACCACCAACAATTCATTTTCATGGAACAATAAAGTAAATATGCTCTACATTGATCAGCCAAACCAAGTCGGTTTCAGTTATGACGTACCTACCAACATCACTTACTCTACCATCAATGATACAATATCTGTTGCGGACTTCTCTAACGGTGTCCCTGCGCAAAATCTTTCTACGTTGGTTGGAACCGGCAGCAGCCAGAACCCTTGGGCAACTGCCAATAACACTGTGAACGCTGCTCGTTCTATCTGGCACTTTGCACAAGTGTGGTTCCAGGAATTCCCTGAACACAAGCCTAACAATAACAAGATCAGTATTTGGACAGAGTCCTATGGAGGAAGATATGGTCCCTCATTCGCCTCTTACTTCCAGGAACAGAACGAAAAGATCAAAAACCATACCATTACTGAAGAAGGAGAGATGCATATTCTGAACCTCGACACCCTCGGTATCATCAACGGCTGCATCGATCTTATGTTCCAAGCAGAAAGTTATGCTGAAT

TCCCATACAACAACACCTATGGCATCAAAGCTTATACCAAGGAGAAGCGTGACGCTATATTACACGACATCCACCGTCCTGACGGCTGCTTCGACAAGGTTACCAAGTGCCGTGAGGCCGCGAAAGAAGGAGACCCTCACTTCTACAGCAACAATGCAACCGTCAACACAATCTGTGCGGATGCTAACTCTGCCTGCGACAAATATCTAATGGATCCTTTCCAAGAGACCAATCTTGGTTACTATGATATTGCTCATCCTCTTCAGGATCCCTTCCCCCCACCATTCTATAAGGGCTTCCTCAGCCAATCCAGCGTTCTATCTGACATGGGATCGCCAGTCAACTTCTCCCAATACGCCCAAGCTGTGGGAAAATCATTCCATGGAGTTGGCGACTACGCTCGCCCTGATGTGCGCGGCTTCACCGGTGACATTGCTTATCTTCTCGAGAGCGGAGTCAAGGTTGCTCTCGTCTATGGTGACAGAGACTACATCTGCAATTGGTTCGGTGGTGAGCAGGTCAGTCTTGGCTTGAACTACACTGGCACCCAAGACTTCCACAGGGCAAAATATGCCGATGTCAAGGTCAACTCTTCATACGTCGGAGGCGTAGTGCGTCAACATGGAAACTTCTCTTTCACCAGAGTTTTCGAGGCCGGTCATGAAGTCCCTGGTTACCAACCCGAGACTGCCCTCAAGATCTTTGAGCGCATCATGTTCAACAAGGATATTTCTACCGGTGAGATCGACATTGCTCAGAAACCAGACTACGGTACCACTGGAACTGAGTCTACGTTCCATATCAAAAACGATATCCCTCCTTCGCCTGAGCCGACCTGCTACCTCCTCAGTGCTGACGGAACCTGTACCCCGGAGCAGCTTAATGCTATTAAGGATGGAACTGCAGTTGTTGAGAACTACATTATTAAGAGCCCTGCTGCGTCGAAGGGGAACCCTCCACCAACCACGACCTCATCTCCCACAGCAGCCCCTACCGCTGGAAGTGCCATGCTAAAGGCTCCTGTGGCAATGCTAGCAATATCAGCTCTCACTGTCCTTGCTTTCTTCTTGTAG

1326个核苷酸(SEQ ID NO：20)的ruPAP见表7B，其中ruPAP开放阅读框(“ORF”)起始子ATG在第一个位置上(表7B中下划线)。

表7B、ruPAP核苷酸序列(SEQ ID NO：20)

ATGCAAGCAGCAAAATTGTTGAGCCGGTACTGGCAAAATGTACCTGGAAGACTGAGGGTATCTGAGCTCCTTTTCGATGTCCCTTTAGACTACTCAAACCCGTCTTCCACTTCGCTCCGGTTGTTCGCCAGGAGTGTGCAGCGGCGAATTCCAGGGTCCTCTCTCGATGATAAAGACAGACAGCTACCCTGGATTGTTTTCCTGCAGGGTGGACCAGGAGGAGCTTGCCCACAACCTCAGGAGGTAGGCTGGGTTGGGCCATTGCTGGATCGAGGATTCCAGATCCTTCTCCTTGACCAGCGAGGAACAGGGCTTTCAACCCCTATAACCGCTGCGACGCTTGCTCTTCAGGGAAACGCAGTAAAGCAAGCCGAATATCTTAGGCTATTCCGTGCCGATAATATCGTGCGAGACTGTGAAGCAGTGCGTAAACTATTGACTGCTTATTACCCTCCAGATAAGCAGAAATGGAGCGTCCTTGGCCAGAGTTTTGGAGGATTCTGTGCCGTCACGTATGTTTCTAATCCTGAGGGACTTAAAGAAGTCTTCACAACTGGTGGATTACCCCCTCTTGTGTCAAAGCCTGATCCTGTGTACGAGAGGACCTACGACAAGGTCCAGTCCCGGAATAAAGTGTACTATTCCACTTTCCCCGAAGACGAAGATCGAGTGCGGATTATACTCAAGCATCTCCAAACCCACGATGTTAAGCTCCCCGATGGCTCACCGTTAACTCCGGAACGCTTTCTCCAGCTAGGAATTCATTTTGGAATGAAAGGCATAATTTTGAAGTGCATTAATGAACTGGAATACTTTGGCTTCCTCACACGACCTACTTTATCTCTGATTGAGAACGACACGAGTGCAGACAACGGCATTCTATATGCCATAATGCATGAATCTATCTACTGCCAAGGGGAGGCCTCAAACTGGGCTGCCGAAAGACTACTACCAAAGTTCTCTGGCTTCCGAGGCGCTCATAATCCTGATGGCATCTACTTCACTGGGGAGATGGTATACAAACACTGGTTTGAGTCGTCCACAGAACTCGGCCAGCTCAAAGAGGTAGCCGATATTCTTGCTTCCTACAATGACTGGCCGCAGTTGTATGATAAGGAACAGCTCGCGCGCAACGAGGTGCCAGTGTATTCCGCTACATATGTCGAGGATATGTACGTGCACTTCAGCTACGCCAACGAAACAGCTGCCACTATTCACAATTGCAAACAGTTCATCACCAACACGATGTACCACAACGGACTGCGTTCAGATTCCGCTGAACTTATTGCGCAGCTGTTTGCTCTTCGTGATGATACGATTGACTAG

上述ruPAP核苷酸序列(SEQ ID NO：20)编码含441个氨基酸残基(SEQ ID NO：21)的蛋白，在表7C中以一个字母的氨基酸代码表示。

表7C、ruPAP编码的蛋白序列(SEQ ID NO：21)

MQAAKLLSRYWQNVPGRLRVSELLFDVPLDYSNPSSTSLRLFARSVQRRIPGSSLDDKDRQLPWIVFLQGGPGGACPQPQEVGWVGPLLDRGFQILLLDQRGTGLSTPITAATLALQGNAVKQAEYLRLFRADNIVRDCEAVRKLLTAYYPPDKQKWSVLGQSFGGFCAVTYVSNPEGLKEVFTTGGLPPLVSKPDPVYERTYDKVQSRNKVYYSTFPEDEDRVRIILKHLQTHDVKLPDGSPLTPERFLQLGIHFGMKGIILKCINELEYFGFLTRPTLSLIENDTSADNGILYAIMHESIYCQGEASNWAAERLLPKFSGFRGAHNPDGIYFTGEMVYKHWFESSTELGQLKEVADILASYNDWPQLYDKEQLARNEVPVYSATYVEDMYVHFSYANETAATIHNCKQFITNTMYHNGLRSDSAELIAQLFALRDDTID

上述ruPAP具有与表7D、7E和7F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。

表7D.ruPAP TBLASTN结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|14329656	Aspergillus	3752	151/307	190/307	e-118

	neger papA的前氨肽酶A基因		(49％)	61％)
	neger papA的前氨肽酶A基因		(49％)	61％)		gi\|32414442	Neurospora crassa菌株OR74A	1449	212/477(44％)	285/477(59％)	e-100
gi\|604877	Aeromonas sobria的前氨肽酶基因	1740	175/420(41％)	239/420(56％)	4e-77	gi\|32414442	Neurospora crassa菌株OR74A	1449	212/477(44％)	285/477(59％)	e-100

表7E.ruPAP BLASTX结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|18307408	脯氨酰氨肽酶A/Aspergillusneger	442	266/442(60％)	334/442(75％)	e-152
gi\|4456054	推定的脯氨酰氨肽酶A/Aspergillusnidulans	365	211/366(57％)	263/366(71％)	e-144	gi\|18307408	脯氨酰氨肽酶A/Aspergillusneger	442	266/442(60％)	334/442(75％)	e-152
gi\|4456054	推定的脯氨酰氨肽酶A/Aspergillusnidulans	365	211/366(57％)	263/366(71％)	e-144	gi\|22507295	脯氨酰氨肽酶/Talaromyces emersonii	300	181/301(60％)	226/301(75％)	4e-99
gi\|236731	脯氨酰氨肽酶A/Aeromonas sobria	425	175/420(41％)	239/420(56％)	4e-76	gi\|22507295	脯氨酰氨肽酶/Talaromyces emersonii	300	181/301(60％)	226/301(75％)	4e-99

表7F.ruPAP BLASTP结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|18307408	脯氨酰氨肽酶A/Aspergillusneger	442	267/443(60％)	336/442(75％)	e-157
gi\|4456054	推定的脯氨酰氨肽酶/Aspergillusnidulans	365	211/366(57％)	263/366(71％)	e-116	gi\|18307408	脯氨酰氨肽酶A/Aspergillusneger	442	267/443(60％)	336/442(75％)	e-157
gi\|4456054	推定的脯氨酰氨肽酶/Aspergillusnidulans	365	211/366(57％)	263/366(71％)	e-116	gi\|22507295	脯氨酰氨肽酶/Talaromyces emersonii	300	181/301(60％)	226/301(75％)	e-102
gi\|236731	脯氨酰氨肽酶/Aeromonas sobria	425	175/420(41％)	239/420(56％)	2e-78	gi\|22507295	脯氨酰氨肽酶/Talaromyces emersonii	300	181/301(60％)	226/301(75％)	e-102

ruAMPP

ruAMPP是红色毛癣菌的氨肽酶P。2418个核苷酸(SEQ ID NO：22)的ruAMPP基因组DNA序列如表8A所示。

表8A、ruAMPP基因组核苷酸序列(SEQ ID NO：22)

ATGCCGCCACCACCGGTTGACACGACCCAGCGTCTCGCAAAGCTGCGAGAGCTGATGGCTCAGAACAAGGTCGATGTATATAGTATGCAATTCAGATACACCATTAAAGCTCCCTTGATAATAACAGTCGTATACTCATTCTTCTTTCTTCTACTCCTCGCCTTAAAGTTGTGCCTTCGGAAGACAGCCATCAGTCGGAGTACATTGCTCCATGTGATGGGCGTCGAGGTTAGACCTGTCCCTCCATAAAAGAATACCTACCCGTAATACCAGCCGGCAGACGCTCATACGTATCACTGCAGCTTTCATATCCAGCTTCACTGGCTCGGCAGGATGTGCCATCGTCTCTATGAGTAAAGCTGCTCTGTCTACAGACGGCAGATACTTCAGCCAAGCTGCAAAACAGCTCGATGCCAACTGGATCCTGTTGAAGCGAGGTGTCGAGGGTGTCCCAACCTGGGAAGAATGGTATATCTGCCCCTGGTATCGACTTTTCCGGTATAATGGTTGACAGGCTGGATATAGGACCGCTGAGCAGGCCGAGACACGGCAAGGTTGTGGGTGTTGACCCGTCACTTATTACGGCAGGTGAGAATCTACAGTATGCGTCTCTTACAAGTGTCATCGTGACTAACTGTATGTTATAGCGGATGCACGAAAGCTTTCTCAGACGTTGAAGACCACCGGAGGCTCCTTGGTTGGAATTGATCAGAACCTGATTGATGCCGTCTGGGGAGATGAACGTCCTGCACGGCCTGCCAACCAAATTACGGTACAGCCTGTTGAGCGCGCGGGAAAGTCATTCGAGGAGAAAGTGGAAGACCTGCGAAAGGAATTGACTGCGAAGAAGAGGTCTGCTATGGTTATTTGTATGACGCTAGATCTATTTTTGATCAAACATATACTAACAAACGCAATATAGCCACCTTGGATGAGATTGCATGGCTCTTCAACCTC

CGTGGAAGCGAGTAAGTTTCTATATAAATGGTATCTTTCACTTTATACAAAAAGCCATGCTGACTGGTGTAGTATTCCATATAACCCCGTCTTTTTCTCGTACGCAATTGTGACGCCCTCAGTTGCGGAACTCTATGTCGATGAGAGCAAGCTGTCTCCAGAAGCCAGAAAACATCTCGAAGGCAAGGTCGTTCTCAAGCCATACGAGTCCATCTTCCAAGCTTCCAAAGTCCTCGCCGAATCAAAGGCATCGGCTAGCAGCGGTTCCTCTGGGAAGTTCTTGTTGTCTAACAAGGCTTCGTGGTCTTTGAGCCTCGCCCTCGGTGGGGAACAGAACGTCGTTGAGGTTCGAAGTCCCATCACTGACGCCAAAGCCATCAAGAACGAAGTTGAACTGGAAGGATTCAGAAAATGCCATATCCGAGACGGTGCAGCTCTGATCGAGTACTTCGCCTGGCTTGAAAATGCATTGATCAAAGAAGGTGCCAAGCTAGACGAAGTAGATGGAGCCGACAAACTCTTCGAGATCCGCAAGAAATATGACCTCTTCGTCGGCAACTCCTTCGACACCATCTCTTCTACCGGTGCTAACGGTGCTACCATTCATTACAAACCCGAGAAGTCAACTTGCGCTATCATTGACCCGAAGGCTATGTACCTGTGTGACTCTGGTGGCCAATACCTTGATGGTACTACTGATACTACCCGAACTCTCCACTTTGGAGAGCCCACGGAGTTCCAGAAGAAGGCTTATGCACTTGTTCTAAAGGGACATATCAGCATTGACAATGCCATTTTCCCCAAAGGAACCACCGGATACGCCATTGACTCGTTTGCTCGACAGCATTTGTGGAAGGAGGGTCTGGATTACCTCCACGGCACCGGTCATGGTGTTGGCTCATTTTTGGTACGGGGTTTCCTTTTTCTTTTTTTTTTCTTTTTTTATTTTTATTATTACTTCTCTTAGGCTAACACATTCTCTCTAAGAACGTCCATGAGGGACCTATGGGCATAGGAAGCCGTGCTCAGTACGCTGAAGTTCCTCTCTCTGCCAGCAATGTTCTTTCCAACGGTAGGATTTCTGCATCTCATCTTTCTTGAATCCTACTAATTGCAAAATAGAGCCTGGATATTATGAAGACGGCAACTTCGGCATTCGTCTCGAGAGTAAGTTCAATGACTGCGTATTCTAGTTTTTTCATACTGACGGCCTCTTTAGACCTCGTAATCTGCAAGGAGGTCCAGACTGCACACAAATTCGGCGACAAGCCCTTCCTCGGATTTGAGTCCATCACCCTGGTACCTTTCTGCCAAAAACTCCTTGATGCTTCTCTCTTGACCGAAGCTGAGAGAAAGTGGGTGAATGATTACCATGCGAAAGTCTGGGAGAAGACCAGTCCCTTCTTTGAGAAGGACGAGTTAACAACCGCCTGGCTAAAGCGCGAGACACAACCTATTTAA

1878个核苷酸(SEQ ID NO：23)的ruAMPP见表8B，其中ruAMPP开放阅读框(“ORF”)起始子ATG在第一个位置上(表8B中下划线)。

表8B、ruAMPP核苷酸序列(SEQ ID NO：23)

ATGCCGCCACCACCGGTTGACACGACCCAGCGTCTCGCAAAGCTGCGAGAGCTGATGGCTCAGAACAAGGTCGATGTATATATTGTGCCTTCGGAAGACAGCCATCAGTCGGAGTACATTGCTCCATGTGATGGGCGTCGAGCTTTCATATCCAGCTTCACTGGCTCGGCAGGATGTGCCATCGTCTCTATGAGTAAAGCTGCTCTGTCTACAGACGGCAGATACTTCAGCCAAGCTGCAAAACAGCTCGATGCCAACTGGATCCTGTTGAAGCGAGGTGTCGAGGGTGTCCCAACCTGGGAAGAATGGACCGCTGAGCAGGCCGAGACACGGCAAGGTTGTGGGTCGGATGCACGAAAGCTTTCTCAGACGTTGAAGACCACCGGAGGCTCCTTGGTTGGAATTGATCAGAACCTGATTGATGCCGTCTGGGGAGATGAACGTCCTGCACGGCCTGCCAACCAAATTACGGTACAGCCTGTTGAGCGCGCGGGAAAGTCATTCGAGGAGAAAGTGGAAGACCTGCGAAAGGAATTGACTGCGAAGAAGAGGTCTGCTATGGTTATTTCGAGTAAGTTTCTATATAAATGGTATCTTTCACTTTATACAAAAAGCCATGCTGACTGGTGTAGTATTCCATATAACCCCGTCTTTTTCTCGTACGCAATTGTGACGCCCTCAGTTGCGGAACTCTATGTCGATGAGAGCAAGCTGTCTCCAGAAGCCAGAAAACATCTCGAAGGCAAGGTCGTTCTCAAGCCATACGAGTCCATCTTCCAAGCTTCCAAAGTCCTCGCCGAATCAAAGGCATCGGCTAGCAGCGGTTCCTCTGGGAAGTTCTTGTTGTCTAACAAGGCTTCGTGGTCTTTGAGCCTCGCCCTCGGTGGGGAACAGAACGTCGTTGAGGTTCGAAGTCCCATCACTGACGCCAAAGCCATCAAGAACGAAGTTGAACTGGAAGGATTCAGAAAATGCCATATCCGAGACGGTGCAGCTCTGATCGAGTACTTCGCCTGGCTTGAAAATGCATTGATCAAAGAAGGTGCCAAGCTAGACGAAGTAGATGGAGCCGACAAACTCTTCGAGATCCGCAAGAAATATGACCTCTTCGTCGGCAACTCCTTCGACACCATCTCTTCTACCGGTGCTAACGGTGCTACCATTCATTACAAACCCGAGAAGTCAACTTGCGCTATCATTGACCCGAAGGCTATGTACCTGTGTGACTCTGGTGGCCAATACCTTGATGGTACTACTGATACTACCCGAACTCTCCACTTTGGAGAGCCCACGGAGTTCCAGAAGAAGGCTTATGCACTTGTTCTAAAGGGACATATCAGCATTGACAATGCCATTTTCCCCAAAGGAACCACCGGATACGCCATTGACTCGTTTGCTCGACAGCATTTGTGGAAGGAGGGTCTGGATTACCTCCACGGCACCGGTCATGGTGTTGGCTCATTTTTGAACGTCCATGAGGGACCTATGGGCATAGGAAGCCGTGCTCAGTACGCTGAAGTTCCTCTCTCTGCCAGCAATAGCCTGGATATTATGAAGACGGCAACTTCGGCATTCGTCTCGAGAGTAAGTTCAATGACTGCGTATTCTAGTTTTTTCATACTGACGGCCTCTTTAGACCTCGTAATCTGCAAGGAGGTCCAGACTGCACACAAATTCGGCGACAAGCCCTTCCTCGGATTTGAGTCCATCACCCTGGTACCTTTCTGCCAAAAACTCCTTGATGCTTCTCTCTTGACCGAAGCTGAGAGAAAGTGGGTGAATGATTACCATGCGAAAGTCTGGGAGAAGACCAGTCCCTTCTTTGAGAAGGACGAGTTAACAACCGCCTGGCTAAAGCGCGAGACACAACCTATTTAA

上述ruAMPP核苷酸序列(SEQ ID NO：23)编码含625个氨基酸残基(SEQ ID NO：24)的蛋白，在表8C中以一个字母的氨基酸代码表示。

表8C、ruAMPP编码的蛋白序列(SEQ ID NO：24)
表8C、ruAMPP编码的蛋白序列(SEQ ID NO：24)	MPPPPVDTTQRLAKLRELMAQNKVDVYIVPSEDSHQSEYIAPCDGRRAFISSFTGSAGCAIVSMSKAALSTDGRYFSQAAKQLDANWILLKRGVEGVPTWEEWTAEQAETRQGCGSDARKLSQTLKTTGGSLVGIDQNLIDAVWGDERPARPANQITVQPVERAGKSFEEKVEDLRKELTAKKRSAMVISSKFLYKWYLSLYTKSHADWCSIPYNPVFFSYAIVTPSVAELYVDESKLSPEARKHLEGKVVLKPYESIFQASKVLAESKASASSGSSGKFLLSNKASWSLSLALGGEQNVVEVRSPITDAKAIKNEVELEGFRKCHIRDGAALIEYFAWLENALIKEG

AKLDEVDGADKLFEIRKKYDLFVGNSFDTISSTGAN6ATIHYKPEKSTCAIIDPKAMYLCDSGGQYLDGTTDTTRTLHFGEPTEFQKKAYALVLKGHISIDNAIFPKGTTGYAIDSFARQHLWKEGLDYLHGTGHGVGSFLNVHEGPMGIGSRAQYAEVPLSASNSLDIMKTATSAFVSRVSSMTAYSSFFILTASLDLVICKEVQTAHKFGDKPFLGFESITLVPFCQKLLDASLLTEAERKWVNDYHAKVWEKTSPFFEKDELTTAWLKRETQPI

上述ruAMPP具有与表8D、8E和8F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。

表8D.ruAMPP TBLASTN结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|32403169	Neurospora Crassa菌株OR74A	1845	339/630(53％)	433/630(68％)	0.0
gi\|20453016	Drosophila melanogaster的氨肽酶P基因	12647	268/638(42％)	369/638(57％)	e-127	gi\|32403169	Neurospora Crassa菌株OR74A	1845	339/630(53％)	433/630(68％)	0.0
gi\|20453016	Drosophila melanogaster的氨肽酶P基因	12647	268/638(42％)	369/638(57％)	e-127	gi\|17571207	Drosophila melanogaster(ApepP)的染色体2	12001	268/638(42％)	369/638(57％)	e-127
gi\|4583560	Drosophila melanogasterDaminopep-P基因	2358	268/638(42％)	369/638(57％)	e-127	gi\|17571207	Drosophila melanogaster(ApepP)的染色体2	12001	268/638(42％)	369/638(57％)	e-127

表8E.ruAMPP BLASTX结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|25529603	X-Pro氨肽酶细胞质形式/Drosophilamelanogaster	613	268/638(42％)	369/638(57％)	e-127
gi\|4107172	氨肽酶P/Drosophilamelanogaster	613	258/638(40％)	369/638(57％)	e-124	gi\|25529603	X-Pro氨肽酶细胞质形式/Drosophilamelanogaster	613	268/638(42％)	369/638(57％)	e-127
gi\|4107172	氨肽酶P/Drosophilamelanogaster	613	258/638(40％)	369/638(57％)	e-124	gi\|15384991	Xaa-Pro氨肽酶2/Lycopersicm esculentum	654	268/674(39％)	365/674(54％)	e-120
gi\|8489879	胞液的氨肽酶P/人	623	254/646(39％)	358/646(55％)	e-119	gi\|15384991	Xaa-Pro氨肽酶2/Lycopersicm esculentum	654	268/674(39％)	365/674(54％)	e-120
gi\|8489879	胞液的氨肽酶P/人	623	254/646(39％)	358/646(55％)	e-119	gi\|2584787	氨肽酶P-like/人	623	254/646(39％)	357/646(55％)	e-119

表8F.ruAMPP BLASTP结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|30923284	可能的多肽酶C22G7.01C	598	291/629(46％)	384/629(61％)	e-156
gi\|25529603	X-Pro氨肽酶细胞质形式/Drosophila melanogaster	613	268/638(42％)	369/638(57％)	e-124	gi\|30923284	可能的多肽酶C22G7.01C	598	291/629(46％)	384/629(61％)	e-156
gi\|25529603	X-Pro氨肽酶细胞质形式/Drosophila melanogaster	613	268/638(42％)	369/638(57％)	e-124	gi\|15384991	Xaa-Pro氨肽酶2/Lycopersicm esculentum	654	268/674(39％)	365/674(54％)	e-123
gi\|8489879	胞液的氨肽酶P/人	623	254/646(39％)	358/646(55％)	e-122	gi\|15384991	Xaa-Pro氨肽酶2/Lycopersicm esculentum	654	268/674(39％)	365/674(54％)	e-123
gi\|8489879	胞液的氨肽酶P/人	623	254/646(39％)	358/646(55％)	e-122	gi\|2584787	氨肽酶P-like/人	623	254/646(39％)	357/646(55％)	e-122
gi\|4107172	氨肽酶P/Drosophilamelanogaster	613	258/638(40％)	369/638(57％)	e-121	gi\|2584787	氨肽酶P-like/人	623	254/646(39％)	357/646(55％)	e-122
gi\|4107172	氨肽酶P/Drosophilamelanogaster	613	258/638(40％)	369/638(57％)	e-121	gi\|18777778	细胞质的氨肽酶P/	623	253/645	353/645	e-120

	Rattus norvegicus		(39％)	(54％)
	Rattus norvegicus		(39％)	(54％)		gi\|18875372	胞液的氨肽酶P/Mus musculus	623	250/645(38％)	354/645(54％)	e-118
gi\|15384989	Xaa-Pro氨肽酶1/Lycopersicon	655	264/674(39％)	361/674(53％)	e-117	gi\|18875372	胞液的氨肽酶P/Mus musculus	623	250/645(38％)	354/645(54％)	e-118

ruPLD

ruPLD是红色毛癣菌的脯氨酰氨基酸酶。2344个核苷酸(SEQ ID NO：25)的ruPLD基因组DNA序列如表9A所示。

表9A、ruPLD基因组核苷酸序列(SEQ ID NO：25)

ATCAACCTCACCTCTTCACCGTCTCACGCCCTTCGTCCCGTCCAAGTCTTCATTTCGCCCTCTCTATGATAACCAACAAACATCCGCTGTTATGTAATCGAACCCGCCGTTAGCCATCCCTAGCCCCGCGTTTTCTCCCAGCATCAATACGACCGAAATGAAGACAGACGGGGAAGACGAGGCAAAACAATAACACATCAACAATTTAACCCGTTGCCGTCTTCTACCCATCTTGTCTACGCATCGTCCAACCTTTTCTTGCCCTATATCAGCCGAACTCGGCCATCATGGATATCCACGTCGACAAATACCCGGCTAAGAGTCACGCCAGGCGCGTCGCCGAGAAGCTCAAGGCCGCGGGGCACGGCTCTACCGGCATCATCTTCGTCGAAGGCCAAAAGGAGCATATTATCGATGATAGCGACGAGCCGTTTCACTTCCGGTGAGCCGTGGGAATACACTCGACTGGGCGGAATAAGCTAACAAAAGGGTGTGATAGTCAACGCCGAAACTTCCTCTATCTGTCCGGCTGTCTTGAGGCCGAGTGCTCCGTTGCATACAACATCGAGAAAGATGAGCTTACATTGTTCATTCCACCAGTCGACCCAGCCTCGGTTATGTGGTCCGGCCTCCCTCTTGAGCCCGCCGAAGCCTTGAAGCAGTTCGATGTTGATGCCGTGCTCCTCACAACTGAGATAAACAACTATCTCGCGAAGTGTGGGGGCGAGAAGGTCTTCACCATTGCAGACAGAGTTTGCCCGGAGGTCTCCTTCTCATCCTTCAAGCACAACGACACCGATGCCCTGAAGCTTGCCATCGAGTCCTGCCGTATAGTGAAAGACGAGTATGAAATTGGTCTTCTCCGACGTGCTAATGAGGTCTCCAGCCAAGCTCATATTGAAGTGATGAAAGCCGCAACCAAGTCAAAGAACGAGAGAGAGCTCTATGCTACTCTCAACTATGTCTGCATGTCTAATGGCTGCTCCGACCAGTCTTACCATCCAATTCTTGCATGTGGCCCCAATGCTGCCACTCTCCACTACACCAAGAACAACGGTGACCTAACTAACCCGGCTACCGGGATTAAGGACCAGCTCGTACTTATCGACGCTGGATGCCAGTACAAGGCGTACTGTGCAGATATCACTCGTGCATTCCCCTTGTCCGGCAAATTCACCACGGAGGGCCGCCAGATCTATGATATTGCCTTGGAGATGCAGAAAGTCGCGTTTGGCATGATCAAACCTAATGTTTTGTTCGACGACATGCATGCTGCGGTCCACCGGGTTGCGATCAAGGGGCTGCTCAAGATTGGCATTCTCACTGGCTCTGAGGATGAGATTTTCGATAAGGGAATCAGCACTGCCTTTTTCCCACATGGTCTAGGCCACCATCTCGGCATGGACACTCACGATGTTGGAGGAAACCCTAACCCGGCTGACCCGAATCGCATGTTTAAATACTTGCGTCTGCGAGGCACTGTTCCAGAGGGATCCGTCATTACAATTGAGCCCGGTGTAAGTGTTGAATCGAGTAGTTGCTCCGCCGAATGTTTCACATACATTTACTAACCCTTGCTCTAGGTCTACTTCTGCCGTTACATCATTGAGCCATTCCTTACTAACCCCGAGACCAGCAAGTACATCAACTCCGAAGTTCTAGACAAGTACTGGGCTGTTGGAGGTGTACGTATCGAGGACAACGTCGTCGTCCGCGCCAATGGCTTTGAGAACCTGACCACGGTGCCAAAGGAGCCCGAGGAGGTCGAACGCATTGTCCAGGAGGGTGCTAAATAATTATGTTTTTATTCAGTACACCGAGTGGTCGGACACACGCAGGAGCATGTACATATTTATGATCTACCCAGTTGATTTGCTACCAAAAAAGAACCGACCACAGCCCTATTTATTGATATTACATAGTAGGAATAAAGGCCACTTTGCCCACCGCGAATAATAACAATAAGAAAAGCAACTACTCGTACAACCAGCCTAGAAAGCTCTAGACCTCTTTCTCGCTGGGCCCTTGAATGCCGGGCTACTGGTGTTATCACGCTCCCTGGCCCTCTTCTCCTTCATGTCCAACACCCGATTAAGCAAATCGAAACTGAACTGGGGATGCTCAAGACACAATGCCTTGAACTGCTCTTCAGCATCATGACGCAGCACATCACTCATCTTAGCCCAGAAGCGAGCAACCGGTCCTCTGATAGCAGTGTCTTCCGGCGTGGTATGGCTGTACACGTATCTCGCATACTCGATCTCACCCGTAGCACTACTCTCGATGCTACCAATCTTGTTCTGAGCAAGCAGTTTGAGTTTTTCGTTTCCGAGCTTTTCGGCCA

1401个核苷酸(SEQ ID NO：26)的ruPLD见表9B，其中获得的ruPLD部分开放阅读框(“ORF”)序列缺失在第一个位置上的起始子ATG。

表9B、ruPLD核苷酸序列(SEQ ID NO：26)

CCGAACTCGGCCATCATGGATATCCACGTCGACAAATACCCGGCTAAGAGTCACGCCAGGCGCGTCGCCGAGAAGCTCAAGGCCGCGGGGCACGGCTCTACCGGCATCATCTTCGTCGAAGGCCAAAAGGAGCATATTATCGATGATAGCGACGAGCCGTTTCACTTCCGTCAACGCCGAAACTTCCTCTATCTGTCCGGCTGTCTTGAGGCCGAGTGCTCCGTTGCATACAACATCGAGAAAGATGAGCTTACATTGTTCATTCCACCAGTCGACCCAGCCTCGGTTATGTGGTCCGGCCTCCCTCTTGAGCCCGCCGAAGCCTTGAAGCAGTTCGATGTTGATGCCGTGCTCCTCACAACTGAGATAAACAACTATCTCGCGAAGTGTGGGGGCGAGAAGGTCTTCACCATTGCAGACAGAGTTTGCCCGGAGGTCTCCTTCTCATCCTTCAAGCACAACGACACGGATGCCCTGAAGCTTGCCATCGAGTCCTGCCGTATAGTGAAAGACGAGTATGAAATTGGTCTTCTCCGACGTGCTAATGAGGTCTCCAGCCAAGCTCATATTGAAGTGATGAAAGCCGCAACCAAGTCAAAGAACGAGAGAGAGCTCTATGCTACTCTCAACTATGTCTGCATGTCTAATGGCTGCTCCGACCAGTCTTACCATCCAATTCTTGCATGTGGCCCCAATGCTGCCACTCTCCACTACACCAAGAACAACGGTGACCTAACTAACCCGGCTACCGGGATTAAGGACCAGCTCGTACTTATCGACGCT

GGATGCCAGTACAAGGCGTACTGTGCAGATATCACTCGTGCATTCCCCTTGTCCGGCAAATTCACCACGGAGGGCCGCCAGATCTATGATATTGCCTTGGAGATGCAGAAAGTCGCGTTTGGCATGATCAAACCTAATGTTTTGTTCGACGACATGCATGCTGCGGTCCACCGGGTTGCGATCAAGGGGCTGCTCAAGATTGGCATTCTCACTGGCTCTGAGGATGAGATTTTCGATAAGGGAATCAGCACTGCCTTTTTCCCACATGGTCTAGGCCACCATCTCGGCATGGACACTCACGATGTTGGAGGAAACCCTAACCCGGCTGACCCGAATCGCATGTTTAAATACTTGCGTCTGCGAGGCACTGTTCCAGAGGGATCCGTCATTACAATTGAGCCCGGTGTCTACTTCTGCCGTTACATCATTGAGCCATTCCTTACTAACCCCGAGACCAGCAAGTACATCAACTCCGAAGTTCTAGACAAGTACTGGGCTGTTGGAGGTGTACGTATCGAGGACAACGTCGTCGTCCGCGCCAATGGCTTTGAGAACCTGACCACGGTGCCAAAGGAGCCCGAGGAGGTCGAACGCATTGTCCAGGAGGGTGCTAAATAA

上述部分ruPLD核苷酸序列(SEQ ID NO：26)编码含466个氨基酸残基(SEQ ID NO：27)部分的蛋白，在表9C中以一个字母的氨基酸代码表示。

表9C、ruPLD编码的蛋白序列(SEQ ID NO：27)

PNSAIMDIHVDKYPAKSHARRVAEKLKAAGHGSTGIIFVEGQKEHIIDDSDEPFHFRQRRNFLYLSGCLEAECSVAYNIEKDELTLFIPPVDPASVMWSGLPLEPAEALKQFDVDAVLLTTEINNYLAKCGGEKVFTIADRVCPEVSFSSFKHNDTDALKLAIESCRIVKDEYEIGLLRRANEVSSQAHIEVMKAATKSKNERELYATLNYVCMSNGCSDQSYHPILACGPNAATLHYTKNNGDLTNPATGIKDQLVLIDAGCQYKAYCADITRAFPLSGKFTTEGRQIYDIALEMQKVAFGMIKPNVLFDDMHAAVHRVAIKGLLKIGILTGSEDEIFDKGISTAFFPHGLGHHLGMDTHDVGGNPNPADPNRMFKYLRLRGTVPEGSVITIEPGVYFCRYIIEPFLTNPETSKYINSEVLDKYWAVGGVRIEDNVVVRANGFENLTTVPKEPEEVERIVQEGAK

上述ruPLD具有与表9D、9E和9F中的BLAST氨基酸序列同源性。由parawise blast程序分析的数据。

表9D.ruPLD TBLASTN结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|14272360	脯氨酰氨基酸酶的Aspergillus nidulans pepP基因	2632	199/348(57％)	249/348(71％)	e-143
gi\|32420910	Neurospora crassa菌株OR74A	2562	235/457(51％)	324/457(70％)	e-136	gi\|14272360	脯氨酰氨基酸酶的Aspergillus nidulans pepP基因	2632	199/348(57％)	249/348(71％)	e-143
gi\|32420910	Neurospora crassa菌株OR74A	2562	235/457(51％)	324/457(70％)	e-136	gi\|3114965	脯氨酰氨基酸酶的Suberitesdomunculla mRNA，形式1	1688	157/464(33％)	235/464(50％)	4e-66
gi\|22531161	Arabidopsis tbaliana X-Pro类二肽酶蛋白	1672	160/477(33％)	242/477(50％)	2e-64	gi\|3114965	脯氨酰氨基酸酶的Suberitesdomunculla mRNA，形式1	1688	157/464(33％)	235/464(50％)	4e-66

表9E.ruPLD BLASTX结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|14272361	脯氨酰氨基酸酶/Emericella nidulans	496	267/463(57％)	336/463(72％)	e-153
gi\|3114966	脯氨酰氨基酸酶/Suberites domuncula	501	157/464(33％)	235/464(50％)	1e-66	gi\|14272361	脯氨酰氨基酸酶/Emericella nidulans	496	267/463(57％)	336/463(72％)	e-153
gi\|3114966	脯氨酰氨基酸酶/Suberites domuncula	501	157/464(33％)	235/464(50％)	1e-66	gi\|22531162	X-Pro类二肽酶蛋白/Arabidopsis thaliana	486	160/477(33％)	242/477(50％)	6e-65
gi\|30582223	多肽酶D/人	493	152/452(33％)	231/452(51％)	2e-63	gi\|22531162	X-Pro类二肽酶蛋白/Arabidopsis thaliana	486	160/477(33％)	242/477(50％)	6e-65
gi\|30582223	多肽酶D/人	493	152/452(33％)	231/452(51％)	2e-63	gi\|20271451	多肽酶D/人	493	152/452(33％)	230/452(50％)	3e-63

表9F.ruPLD BLASTP结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|14272361	脯氨酰氨基酸酶/Emericellanidulans	496	267/463(57％)	336/463(72％)	e-158
gi\|3114966	脯氨酰氨基酸酶/Suberitesdomuncula	501	158/466(33％)	235/466(50％)	6e-67	gi\|14272361	脯氨酰氨基酸酶/Emericellanidulans	496	267/463(57％)	336/463(72％)	e-158
gi\|3114966	脯氨酰氨基酸酶/Suberitesdomuncula	501	158/466(33％)	235/466(50％)	6e-67	gi\|22531162	X-Pro类二肽酶蛋白/Arabidopsis thaliana	486	159/477(33％)	241/477(50％)	6e-64
gi\|30584879	人多肽酶D	494	152/452(33％)	231/452(51％)	2e-63	gi\|22531162	X-Pro类二肽酶蛋白/Arabidopsis thaliana	486	159/477(33％)	241/477(50％)	6e-64
gi\|30584879	人多肽酶D	494	152/452(33％)	231/452(51％)	2e-63	gi\|15929143	多肽酶D/人	493	152/452(33％)	231/452(51％)	2e-63
gi\|20271451	多肽酶D/人	493	152/452(33％)	230/452(50％)	4e-63	gi\|15929143	多肽酶D/人	493	152/452(33％)	231/452(51％)	2e-63

caLAP2

caLAP2是犬小孢子菌的亮氨酸氨肽酶。1730个核苷酸(SEQ ID NO：28)的caLAP2基因组DNA序列如表10A所示。

表10A、caLAP2基因组核苷酸序列(SEQ ID NO：28)

ATGAAGACACAGTTGTTGAGTCTGGGAGTTGCCCTCACGGCCATCTCTCAGGGCGTTATTGCTGAGGATGCCTTGAACTGGCCATTCAAGCCGTTGGTTAATGCTGTGAGTATATACACAAGATCGATCGATCGTCCTCTTGTCCCTGTCACTTATCGCTCTACAGTAAGCAAAAATACTGGAGAATCATGTGCTGATGTAAATGTATAGGATGACCTGCAAAACAAGATTAAGCTCAAGGATCTTATGGCTGGCGTACAGAAACTCCAAGACTTCGCCTACGCTCACCCTGAGAAGAATCGAGTATTCGGTGGTGCTGGCCACAAGGATACCGTCGACTGGATCTACAATGAGCTCAAGGCTACCGGCTACTACGATGTGAAGATGCAGCCACAAGTCCACCTGTGGTCTCATGCTGAGGCAGCTGTCAATGCCAATGGCAAGGATCTCACTGCCAGTGCCATGTCCTACAGCCCTCCAGCCGACAAGATCACTGCCGAGCTTGTCCTGGCCAAGAACATGGGATGCAATGCTGTATGTGCGCCCCTTTTCCATTCTATATATCGACTGGTCGCTTGGAAATTCAGAAGAGCTGACAATTGCAAACAGACTGATTACCCAGAGGGTACCAAGGGCAAGATTGTCCTCATCGAGCGTGGTGTCTGCAGCTTTGGCGAGAAGTCCGCTCAGGCTGGCGATGCAAAGGCTATTGGTGCCATCGTCTACAACAACGTCCCTGGAAGCTTGGCCGGCACCCTGGGTGGCCTTGACAACCGCCATGCTCCAACTGCTGGAATCTCTCAGGCTGATGGAAAGAACCTCGCTAGCCTTGTCGCCTCTGGCAAGGTTACCGTCACCATGAACGTTATCAGCAAGTTTGAGAACAGGACTACGTGAGTATTGTTCCATACTTTGGTCAACAATGATATATACACGTACTAACACTGCTCTATAGCTGGAACGTCATTGCCGAGACCAAGGGAGGAGACCACAACAACGTCATCATGCTCGGTTCTCACTCTGACTCTGTCGACGCCGGCCCTGGTATCAACGACAACGGCTCCGGTACCATTGGTATCATGACCGTTGCCAAAGCCCTCACCAACTTCAAGGTCAACAACGCCGTCCGCTTCGGCTGGTGGACCGCCGAGGAGTTCGGCCTTCTCGGCAGCACTTTCTACGTCGACAGCCTTGACGACCGTGAACTGCACAAGGTCAAGCTGTACCTCAACTTCGACATGATTGGCTCCCCCAACTTCGCCAACCAGATCTACGACGGAGACGGCTCCGCCTACAACATGACTGGCCCCGCCGGATCTGCTGAAATCGAGTACCTGTTCGAGAAGTTCTTCGATGACCAGGGAATCCCACACCAGCCCACCGCCTTCACCGGCCGCTCCGACTACTCTGCCTTCATCAAGCGCAACGTCCCTGCCGGAGGTCTGTTTACTGGTGCTGAGGTCGTCAAGACCGCCGAGCAGGCTAAGCTATTTGGCGGCGAGGCTGGCGTTGCTTATGACAAGAACTACCACGGCAAGGGCGACACTGTAGACAACATCAACAAGGGTGCTATCTACCTCAACACTCGAGGAATCGCGTATGCCACTGCTCAGTATGCTAGTTCGCTGCGCGGATTCCCAACCCGCCCAAAGACGGGTAAGCGTGACGTGAGCCCCCGTGGCCAGTCTATGCCTGGTGGTGGATGCGGACACCACAGCGTCTTCATGTAA

1488个核苷酸的caLAP2见表10B，其中起始子ATG在第一个位置上(表10B中下划线)。

表10B、caLAP2核苷酸序列(SEQ ID NO：29)

ATGAAGACACAGTTGTTGAGTCTGGGAGTTGCCCTCACGGCCATCTCTCAGGGCGTTATTGCTGAGGATGCCTTGAACTGGCCATTCAAGCCGTTGGTTAATGCTGATGACCTGCAAAACAAGATTAAGCTCAAGGATCTTATGGCTGGCGTACAGAAACTCCAAGACTTCGCCTACGCTCACCCTGAGAAGAATCGAGTATTCGGTGGTGCTGGCCACAAGGATACCGTCGACTGGATCTACAATGAGCTCAAGGCTACCGGCTACTACGATGTGAAGATGCAGCCACAAGTCCACCTGTGGTCTCATGCTGAGGCAGCTGTCAATGCCAATGGCAAGGATCTCACTGCCAGTGCCATGTCCTACAGCCCTCCAGCCGACAAGATCACTGCCGAGCTTGTCCTGGCCAAGAACATGGGATGCAATGCTACTGATTACCCAGAGGGTACCAAGGGCAAGATTGTCCTCATCGAGCGTGGTGTCTGCAGCTTTGGCGAGAAGTCCGCTCAG

GCTGGCGATGCAAAGGCTATTGGTGCCATCGTCTACAACAACGTCCCTGGAAGCTTGGCCGGCACCCTGGGTGGCCTTGACAACCGCCATGCTCCAACTGCTGGAATCTCTCAGGCTGATGGAAAGAACCTCGCTAGCCTTGTCGCCTCTGGCAAGGTTACCGTCACCATGAACGTTATCAGCAAGTTTGAGAACAGGACTACCTGGAACGTCATTGCCGAGACCAAGGGAGGAGACCACAACAACGTCATCATGCTCGGTTCTCACTCTGACTCTGTCGACGCCGGCCCTGGTATCAACGACAACGGCTCCGGTACCATTGGTATCATGACCGTTGCCAAAGCCCTCACCAACTTCAAGGTCAACAACGCCGTCCGCTTCGGCTGGTGGACCGCCGAGGAGTTCGGCCTTCTCGGCAGCACTTTCTACGTCGACAGCCTTGACGACCGTGAACTGCACAAGGTCAAGCTGTACCTCAACTTCGACATGATTGGCTCCCCCAACTTCGCCAACCAGATCTACGACGGAGACGGCTCCGCCTACAACATGACTGGCCCCGCCGGATCTGCTGAAATCGAGTACCTGTTCGAGAAGTTCTTCGATGACCAGGGAATCCCACACCAGCCCACCGCCTTCACCGGCCGCTCCGACTACTCTGCCTTCATCAAGCGCAACGTCCCTGCCGGAGGTCTGTTTACTGGTGCTGAGGTCGTCAAGACCGCCGAGCAGGCTAAGCTATTTGGCGGCGAGGCTGGCGTTGCTTATGACAAGAACTACCACGGCAAGGGCGACACTGTAGACAACATCAACAAGGGTGCTATCTACCTCAACACTCGAGGAATCGCGTATGCCACTGCTCAGTATGCTAGTTCGCTGCGCGGATTCCCAACCCGCCCAAAGACGGGTAAGCGTGACGTGAGCCCCCGTGGCCAGTCTATGCCTGGTGGTGGATGCGGACACCACAGCGTCTTCATGTAA

上述caLAP2核苷酸序列(SEQ ID NO：29)编码含495个氨基酸残基(SEQ ID NO：30)的蛋白，在表10C中以一个字母的氨基酸代码表示。

表10C、caLAP2编码的蛋白序列(SEQ ID NO：30)

MKTQLLSLGVALTAISQGVIAEDALNWPFKPLVNADDLQNKIKLKDLMAGVQKLQDFAYAHPEKNRVFGGAGHKDTVDWIYNELKATGYYDVKMQPQVHLWSHAEAAVNANGKDLTASAMSYSPPADKITAELVLAKNMGCNATDYPEGTKGKIVLIERGVCSFGEKSAQAGDAKAIGAIVYNNVPGSLAGTLGGLDNRHAPTAGISQADGKNLASLVASGKVTVTMNVISKFENRTTWNVIAETKGGDHNNVIMLGSHSDSVDAGPGINDNGSGTIGIMTVAKALTNFKVNNAVRFGWWTAEEFGLLGSTFYVDSLDDRELHKVKLYLNFDMIGSPNFANQIYDGDGSAYNMTGPAGSAEIEYLFEKFFDDQGIPHQPTAFTGRSDYSAFIKRNVPAGGLFTGAEVVKTAEQAKLFGGEAGVAYDKNYHGKGDTVDNINKGAIYLNTRGIAYATAQYASSLRGFPTRPKTGKRDVSPRGQSMPGGGCGHHSVFM

上述caLAP2具有与表10D、10E和10F中的BLAST氨基酸序列同源性。由parawise blast程序分析的数据。

表10D.caLAP2 TBLASTN结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|600025	Saccharomyces cerevisiae(s288c)RIF1，DPB3，YmL27和SNF5基因	32421	182/477(38％)	254/477(53％)	8e-77
gi\|469463	Saccharomyces cerevisiae氨肽酶Y基因	2272	182/477(38％)	254/477(53％)	8e-77	gi\|600025	Saccharomyces cerevisiae(s288c)RIF1，DPB3，YmL27和SNF5基因	32421	182/477(38％)	254/477(53％)	8e-77
gi\|469463	Saccharomyces cerevisiae氨肽酶Y基因	2272	182/477(38％)	254/477(53％)	8e-77	gi\|16033407	Bacillus licheniformis亮氨酸氨肽酶前体，基因	2054	132/474(27％)	215/474(45％)	3e-27

表10E.caLAP2 BLASTX结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|6319763	氨肽酶yscIII；Ape3p/Saccharomyces cerevisiae	537	182/477(38％)	254/477(53％)	9e-78
gi\|1077010	氨肽酶Y前体，有液泡的/Saccharomyces cerevisiae	537	182/477(38％)	254/477(53％)	9e-78	gi\|6319763	氨肽酶yscIII；Ape3p/Saccharomyces cerevisiae	537	182/477(38％)	254/477(53％)	9e-78
gi\|1077010	氨肽酶Y前体，有液泡的/Saccharomyces cerevisiae	537	182/477(38％)	254/477(53％)	9e-78	gi\|31791596	可能的脂蛋白氨肽酶LPQL/Mycobacterium bovis	500	188/485(38％)	269/485(55％)	3e-77
gi\|15839805	水解酶/Mycobacterium tuberculosis	493	187/481(38％)	268/481(55％)	6e-77	gi\|31791596	可能的脂蛋白氨肽酶LPQL/Mycobacterium bovis	500	188/485(38％)	269/485(55％)	3e-77

表10F.caLAP2B LASTP结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|6319763	氨肽酶yscIII；Ape3p/Saccharomyces cerevisiae	563	182/477(38％)	254/477(53％)	5e-78
gi\|1077010	氨肽酶Y前体，有液泡的/Saccharomyces cerevisiae	537	182/477(38％)	254/477(53％)	8e-78	gi\|6319763	氨肽酶yscIII；Ape3p/Saccharomyces cerevisiae	563	182/477(38％)	254/477(53％)	5e-78
gi\|1077010	氨肽酶Y前体，有液泡的/Saccharomyces cerevisiae	537	182/477(38％)	254/477(53％)	8e-78	gi\|15839805	水解酶/Mycobacteriumtuberculosis	493	187/481(38％)	268/481(55％)	1e-71
gi\|31617182	可能的脂蛋白氨肽酶LPQL/Mycobacterium bovis	500	188/485(38％)	269/485(55％)	2e-71	gi\|15839805	水解酶/Mycobacteriumtuberculosis	493	187/481(38％)	268/481(55％)	1e-71
gi\|31617182	可能的脂蛋白氨肽酶LPQL/Mycobacterium bovis	500	188/485(38％)	269/485(55％)	2e-71	gi\|15598135	可能的氨肽酶/Pseudomonas aeruginosa	536	166/445(37％)	242/445(54％)	2e-65

meLAP2

meLAP2是须癣毛癣菌的亮氨酸氨肽酶。1775个核苷酸(SEQ ID NO：31)的meLAP2核酸如表11A所示。

表11A、meLAP2基因组核苷酸序列(SEQ ID NO：31)

ATGAAGTCGCAACTGTTGAGCCTAGCCGTGGCCGTCACCACCATTTCCCAGGGCGTTGTTGGTCAAGAGCCCTTTGGATGGCCCTTCAAGCCTATGGTCACTCAGGTGAGTTGCTGTCAACAGATCGATCGATCGATCTACCTTCGTCCCTGTCACCTATAACTCCACAGCAGGACCAAGAAAACACAAGTTTTCCGGGGAATTCTTATGTGCTGATGTAAATGTATAGGATGACCTGCAAAACAAGATTAAGCTCAAGGATATCATGGCAGGTGTCGAGAAGCTGCAAAGCTTTTCTGATGCTCATCCTGAAAAGAACCGAGTGTTCGGTGGTAATGGCCACAAGGACACTGTCGAGTGGATCTACAATGAGCTCAAGGCCACCGGCTACTACAATGTGAAGAAGCAGGAGCAGGTACACCTGTGGTCTCACGCTGAGGCCGCTCTCAGTGCCAATGGCAAGGACCTCAAGGCCAGCGCCATGTCGTACAGCCCTCCTGCCAACAAGATCATGGCCGAGCTTGTCGTTGCCAAGAACAATGGCTGCAATGCTGTAAGTGCCATACACTTCCTATACATCACATTCACTTTAGAATGAAGAGCGCGGGAGAACTGATTTTTTTTTTTTTTTTTTTTTTTTTGTAACAGACCGATTACCCAGAGAACACTCAGGGAAAGATAGTCCTCATTCAGCGTGGTGTCTGCAGCTTCGGCGAGAAGTCTTCTCAGGCTGGTGATGCGAAGGCTATTGGTGCCGTTGTCTACAACAACGTCCCCGGATCCCTTGCTGGCACTCTTGGTGGCCTTGACAAGCGCCATGTCCCAACCGCTGGTCTTTCCCAGGAGGATGGAAAGAATCTTGCTAGCCTCGTTGCTTCTGGCAAGGTTGATGTCACCATGAACGTTGTCAGTCTGTTTGAGAACCGAACCACGTAAGTAACTCAACGTCATATCCAGCATTAATCTTCAGGAGTATATATACTAATTCGGTATCTCACAGCTGGAACGTCATTGCTGAGACCAAGGGAGGAGACCACAACAATGTTGTCATGCTTGGTGCTCACTCCGACTCCGTCGATGCCGGCCCCGGTATCAACGACAACGGCTCCGGCTCCATTGGTATCATGACCGTTGCCAAAGCCCTTACTAACTTCAAGCTCAACAACGCCGTTCGCTTTGCCTGGTGGACCGCTGAGGAATTCGGTCTCCTTGGAAGCACCTTCTACGTCGACAGCCTTGATGACCGTGAGCTGCACAAGGTCAAGCTGTACCTCAACTTCGACATGATCGGCTCTCCCAACTTCGCCAACCAGATCTACGACGGTGACGGTTCGGCCTACAACATGACTGGTCCCGCTGGCTCTGCTGAAATCGAGTACCTGTTCGAGAAGTTCTTTGACGACCAGGGTCTCCCACACCAGCCCACTGCCTTCACCGGCCGATCCGACTACTCTGCATTCATCAAGCGCAACGTCCCCGCTGGAGGTCTTTTCACTGGTGCCGAGGTTGTCAAGACCCCCGAGCAAGTTAAGCTGTTCGGTGGTGAGGCTGGCGTTGCCTATGACAAGAACTACCATGGCAAGGGTGACACCGTTGCCAACATCAACAAGGGAGCTATCTTCCTTAACACTCGAGCAATCGCCTACTCTGTGGCCGAGTATGCTCGATCCCTCAAGGGCTTCCCAACCCGCCCAAAGACCGGCAAGCGTGCCGTCAACCCTCAGTATGCTAAGATGCCTGGTGGTGGTTGCGGACACCACACTGTCTTCATGTAA

1488个核苷酸的meLAP2开放阅读框(“ORF”)，其中起始子ATG在第一个位置上(表11B中下划线)。

表11B、meLAP2核苷酸序列(SEQ ID NO：32)

ATGAAGTCGCAACTGTTGAGCCTAGCCGTGGCCGTCACCACCATTTCCCAGGGCGTTGTTGGTCAAGAGCCCTTTGGATGGCCCTTCAAGCCTATGGTCACTCAGGATGACCTGCAAAACAAGATTAAGCTCAAGGATATCATGGCAGGTGTCGAGAAGCTGCAAAGCTTTTCTGATGCTCATCCTGAAAAGAACCGAGTGTTCGGTGGTAATGGCCACAAGGACACTGTCGAGTGGATCTACAATGAGCTCAAGGCCACCGGCTACTACAATGTGAAGAAGCAGGAGCAGGTACACCTGTGGTCTCACGCTGAGGCCGCTCTCAGTGCCAATGGCAAGGACCTCAAGGCCAGCGCCATGTCGTACAGCCCTCCTGCCAACAAGATCATGGCCGAGCTTGTCGTTGCCAAGAACAATGGCTGCAATGCTACCGATTACCCAGAGAACACTCAGGGAAAGATAGTCCTCATTCAGCGTGGTGTCTGCAGCTTCGGCGAGAAGTCTTCTCAG

GCTGGTGATGCGAAGGCTATTGGTGCCGTTGTCTACAACAACGTCCCCGGATCCCTTGCTGGCACTCTTGGTGGCCTTGACAAGCGCCATGTCCCAACCGCTGGTCTTTCCCAGGAGGATGGAAAGAATCTTGCTAGCCTCGTTGCTTCTGGCAAGGTTGATGTCACCATGAACGTTGTCAGTCTGTTTGAGAACCGAACCACCTGGAACGTCATTGCTGAGACCAAGGGAGGAGACCACAACAATGTTGTCATGCTTGGTGCTCACTCCGACTCCGTCGATGCCGGCCCCGGTATCAACGACAACGGCTCCGGCTCCATTGGTATCATGACCGTTGCCAAAGCCCTTACTAACTTCAAGCTCAACAACGCCGTTCGCTTTGCCTGGTGGACCGCTGAGGAATTCGGTCTCCTTGGAAGCACCTTCTACGTCGACAGCCTTGATGACCGTGAGCTGCACAAGGTCAAGCTGTACCTCAACTTCGACATGATCGGCTCTCCCAACTTCGCCAACCAGATCTACGACGGTGACGGTTCGGCCTACAACATGACTGGTCCCGCTGGCTCTGCTGAAATCGAGTACCTGTTCGAGAAGTTCTTTGACGACCAGGGTCTCCCACACCAGCCCACTGCCTTCACCGGCCGATCCGACTACTCTGCATTCATCAAGCGCAACGTCCCCGCTGGAGGTCTTTTCACTGGTGCCGAGGTTGTCAAGACCCCCGAGCAAGTTAAGCTGTTCGGTGGTGAGGCTGGCGTTGCCTATGACAAGAACTACCATGGCAAGGGTGACACCGTTGCCAACATCAACAAGGGAGCTATCTTCCTTAACACTCGAGCAATCGCCTACTCTGTGGCCGAGTATGCTCGATCCCTCAAGGGCTTCCCAACCCGCCCAAAGACCGGCAAGCGTGCCGTCAACCCTCAGTATGCTAAGATGCCTGGTGGTGGTTGCGGACACCACACTGTCTTCATGTAA

上述meLAP2核苷酸序列(SEQ ID NO：32)编码有495个氨基酸残基(SEQ ID NO：33)的蛋白，在表11C中以一个字母的氨基酸代码表示。

表11C、fuLAP2编码的蛋白序列(SEQ ID NO：33)

MKSQLLSLAVAVTTISQGVVGQEPFGWPFKPMVTQDDLQNKIKLKDIMAGVEKLQSFSDAHPEKNRVFGGNGHKDTVEWIYNELKATGYYNVKKQEQVHLWSHAEAALSANGKDLKASAMSYSPPANKIMAELVVAKNNGCNATDYPENTQGKIVLIQRGVCSFGEKSSQAGDAKAIGAVVYNNVPGSLAGTLGGLDKRHVPTAGLSQEDGKNLASLVASGKVDVTMNVVSLFENRTTWNVIAETKGGDHNNVVMLGAHSDSVDAGPGINDNGSGSIGIMTVAKALTNFKLNNAVRFAWWTAEEFGLLGSTFYVDSLDDRELHKVKLYLNFDMIGSPNFANQIYDGDGSAYNMTGPAGSAEIEYLFEKFFDDQGLPHQPTAFTGRSDYSAFIKRNVPAGGLFTGAEVVKTPEQVKLFGGEAGVAYDKNYHGKGDTVANINKGAIFLNTRAIAYSVAEYARSLKGFPTRPKTGKRAVNPQYAKMPGGGCGHHTVFM

上述meLAP2具有与表11D、11E和11F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。

表11D.meLAP2 TBLASTN结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|600025	Saccharomycescerevisiae(s288c)RIF1，DPB3，YmL27和SNF5基因	32421	180/479(37％)	251/479(52％)	2e-70
gi\|469463	Saccharomycescerevisiae氨肽酶Y基因	2272	180/479(37％)	251/479(52％)	2e-70	gi\|600025	Saccharomycescerevisiae(s288c)RIF1，DPB3，YmL27和SNF5基因	32421	180/479(37％)	251/479(52％)	2e-70

表11E.meLAP2 BLASTX结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|1077010	氨肽酶Y前体，有液泡的/Saccharomycescerevisiae	537	180/479(37％)	251/479(52％)	8e-71
gi\|6319763	氨肽酶yscIII；Ape3p/Saccharomyces cerevisiae	563	180/479(37％)	251/479(52％)	8e-71	gi\|1077010	氨肽酶Y前体，有液泡的/Saccharomycescerevisiae	537	180/479(37％)	251/479(52％)	8e-71
gi\|6319763	氨肽酶yscIII；Ape3p/Saccharomyces cerevisiae	563	180/479(37％)	251/479(52％)	8e-71	gi\|15839805	水解酶/MycobacteriumTuberculosis	493	159/440(36％)	236/440(53％)	1e-63
gi\|31791596	可能的脂蛋白氨肽酶LPQL/Mycobacterium bovis	500	159/440(36％)	236/440(53％)	1e-63	gi\|15839805	水解酶/MycobacteriumTuberculosis	493	159/440(36％)	236/440(53％)	1e-63
gi\|31791596	可能的脂蛋白氨肽酶LPQL/Mycobacterium bovis	500	159/440(36％)	236/440(53％)	1e-63	gi\|15598135	可能的氨肽酶/	536	158/445(35％)	237/445(53％)	1e-62

	PseudomonasAeruginosa
	PseudomonasAeruginosa					gi\|1045225	N-乙酰化嘌呤霉素N-乙酰化水解酶/Streptomyces anulatus	485	154/477(32％)	218/477(45％)	4e-48
gi\|29831415	可能的氨肽酶/Streptomycesa vermitilis	315	95/244(38％)	131/244(53％)	2e-37	gi\|1045225	N-乙酰化嘌呤霉素N-乙酰化水解酶/Streptomyces anulatus	485	154/477(32％)	218/477(45％)	4e-48

表11F.meLAP2 BLASTP结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|6319763	氨肽酶yscIII；Ape3p/Saccharomycescerevisiae	563	179/479(37％)	248/479(51％)	9e-71
gi\|1077010	氨肽酶Y前体，有液泡的/Saccharomycescerevisiae	537	179/479(37％)	248/479(51％)	9e-71	gi\|6319763	氨肽酶yscIII；Ape3p/Saccharomycescerevisiae	563	179/479(37％)	248/479(51％)	9e-71
gi\|1077010	氨肽酶Y前体，有液泡的/Saccharomycescerevisiae	537	179/479(37％)	248/479(51％)	9e-71	gi\|31617182	可能的脂蛋白氨肽酶LPQL/Mycobacteriumbovis	500	159/440(36％)	236/440(53％)	2e-62
gi\|15839805	水解酶/MycobacteriumTuberculosis	493	159/440(36％)	236/440(53％)	2e-62	gi\|31617182	可能的脂蛋白氨肽酶LPQL/Mycobacteriumbovis	500	159/440(36％)	236/440(53％)	2e-62

ruDPPIV

ruDPPIV是红色毛癣菌的二肽基多肽酶IV。2326个核苷酸序列(SEQ ID NO：34)的ruDPPIV核酸如表12A所示。所述的ruDPPIV开放阅读框(“ORF”)起始子ATG在第一个位置上(表12A中下划线)。

表12A、ruDPPIV核苷酸序列(SEQ ID NO：34)

ATGAAGCTCCTCTCGCTACTTATGCTGGCGGGCATCGCCCAAGCCATCGTTCCTCCTCGTGAGCCCCGTTCACCAACTGGTGGCGGCAACAAGCTGTTGACCTACAAGGAGTGTGTCCCTAGAGCTACTATCTCTCCAAGGTCGACGTCCCTTGCCTGGATTAACAGTGAAGAAGATGGCCGGTACATCTCCCAGTCCGACGATGGAGCATTGATCCTCCAGAACATCGTCACGAACACCAACAAGACTCTCGTGGCCGCAGACAAGGTACCCAAGGGTTACTATGACTACTGGTTCAAGCCAGACCTTTCTGCTGTCTTATGGGCAACCAATTACACCAAGCAGTACCGTCACTCTTACTTTGCCAACTACTTCATTCTAGACATCAAAAAGGGATCGTTGACCCCTCTAGCCCAGGACCAGGCTGGTGACATCCAGTATGCTCAATGGAGCCCCATGAACAACTCTATCGCCTATGTCCGTGRAAACGACCTGTATATCTGGAACAATGGCAAGACCAAGCGTATTACCGAAAATGGCGGCCCGGATATCTTCAATGGTGTCCCTGACTGGGTATACGAGGAAGAAATCTTCGGGGACCGGTTCGCTCTTTGGTTCTCACCTGACGGTGAATACCTTGCGTACCTCCGCTTTAACGAGACTGGAGTCCCGACCTACACTATTCCGTACTACAAGAACAAGCAAAAGATTGCCCCTGCCTACCCAAGGGAGCTGGAGATCCGTTACCCTAAAGTCTCTGCGAAGAACCCAACCGTGCAGTTCCACCTGTTAAACATTGCTTCATCCCAGGAGACAACTATCCCAGTTACTGCGTTCCCGGAAAACGATCTTGTGATCGGTGAGGTTGCTTGGCTCAGCAGTGGCCATGATAGTGTAGCATATCGTGCTTTCAACCGTGTCCAGGATAGAGAAAAGATTGTCAGCGTCAAGGTTGAGTCCAAGGAATCCAAGGTTATTCGCGAAAGAGATGGCACCGACGGCTGGATCGACAACCTTCTCTCATGTCATATATCGGAAACGTTAACGGCAAGGAGTACTACGTCGATATATCTGATGCTTCTGGCTGGGCACATATCTACCTCTACCCGGTTGATGGAGGAAAGGAGATTGCACTAACAAAGGGAGAATGGGAAGTCGTTGCCATTCTCAAGGTTGACACGAAGAAGAAGCTGATCTACTTCACCTCTACCAAATATCACAGCACCACTCGACACGTCTACTCTGTCTCGTATGACACAAAGGTCATGACCCCTCTCGTCAACGATAAGGAGGCTGCGTACTACACTGCATCCTTCTCGGCCAAGGGTGGTTACTATATCTTGTCCTACCAAGGTCCAAATGTTCCATACCAAGAACTTTACTCCACCAAGGACAGTAAGAAGCCTCTCAAGACAATCACTAGCAATGATGCATTGCTCGAGAAGCTGAAGGAGTACAAGCTCCCCAAGGTTAGCTTCTTTGAGATCAAGCTTCCATCTGGTGAAACCCTTAATGTTAAGCAACGCCTACCACCTAACTTCAACCCACACAAGAAGTACCCCGTCCTCTTCACTCCGTATGGTGGCCCTGGTGCCCAAGAGGTAAGCCAGGCATGGAATTCATTGGACTTCAAGTCCTACATTACATCTGACCCTGAGCTTGAATACGTTACCTGGACTGTTGACAACCGTGGAACCGGCTACAAGGGCCGCAAGTTCCGCA

GCGCCGTAGCTAAGCGTCTCGGTTTCCTCGAAGCCCAGGACCAGGTCTTTGCTGCTAAGGAGGTGCTGAAAAACCGTTGGGCTGATAAGGACCATATTGGAATCTGGGGCTGNAGCTATGGCGGCTTCCTGACCGCTAAGACCCTCGAGACCGACAGTGGTGTATTCACTTTTGGTATCAGTACTGCTCCTGTCTCTGATTTCAGACTCTACGACAGCATGTACACTGAGCGTTACATGAAGACCGTTGAACTAAACGCTGACGGCTACAGTGAGACCGCCGTGCACAAGGTTGATGGCTTTAAGAACCTCAAAGGTCATTACTCATCCAGCATGGAACCGGTGACGACAACGTCCACTTCCAAAACGCCGCTGTCCTTTCCAACACCCTGATGAACGGCGGTGTAACTGCAGACAAGTTGACTACTCAGTGGTTTACTGACTCGGACCACGGCATCAGATACGATATGGACTCCACTTACCAGTACAAGCAGCTTTCTAAGATGGTCTACGACCAGAAGCAACGAAGGCCAGAAAGCCCACCAATGCACCAATGGAGCAAGAGAGTTTTGGCTGCCCTGTTTGGTGAGAGGGCAGAGGAATGA

上述ruDPPIV核苷酸序列(SEQ ID NO：34)编码含775个氨基酸残基(SEQ ID NO：35)的蛋白，在表12B中以一个字母的氨基酸代码表示。

表12B、ruDPPIV编码的蛋白序列(SEQ ID NO：35)

MKLLSLLMLAGIAQAIVPPREPRSPTGGGNKLLTYKECVPRATISPRSTSLAWINSEEDGRYISQSDDGALILQNIVTNTNKTLVAADKVPKGYYDYWFKPDLSAVLWATNYTKQYRHSYFANYFILDIKKGSLTPLAQDQAGDIQYAQWSPMNNSIAYVRXNDLYIWNNGKTKRITENGGPDIFNGVPDWVYEEEIFGDRFALWFSPDGEYLAYLRFNETGVPTYTIPYYKNKQKIAPAYPRELEIRYPKVSAKNPTVQFHLLNIASSQETTIPVTAFPENDLVIGEVAWLSSGHDSVAYRAFNRVQDREKIVSVKVESKESKVIRERDGTDGWIDNLLSMSYIGNVNGKEYYVDISDASGWAHIYLYPVDGGKEIALTKGEWEVVAILKVDTKKKLIYFTSTKYHSTTRHVYSVSYDTKVMTPLVNDKEAAYYTASFSAKGGYYILSYQGPNVPYQELYSTKDSKKPLKTITSNDALLEKLKEYKLPKVSFFEIKLPSGETLNVKQRLPPNFNPHKKYPVLFTPYGGPGAQEVSQAWNSLDFKSYITSDPELEYVTWTVDNRGTGYKGRKFRSAVAKRLGFLEAQDQVFAAKEVLKNRWADKDHIGIWGXSYGGFLTAKTLETDSGVFTFGISTAPVSDFRLYDSMYTERYMKTVELNADGYSETAVHKVDGFKNLKGHYLIQHGTGDDNVHFQNAAVLSNTLMNGGVTADKLTTQWFTDSDHGIRYDMDSTYQYKQLSKMVYDQKQRRPESPPMHQWSKRVLAALFGERAEE

上述ruDPPIV具有与表10C、10D和10E中的BLAST氨基酸序列同源性。用parawiseblast程序分析上述数据。

表12C.ruDPPIV TBLASTN结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|2351699	Aspergillusfumigatus二肽基多肽酶IV(Dpp4)基因	2352	469/761(61％)	585/761(76％)	0.0
gi\|2924304	Aspergillusoryzae Dpp4基因	4771	448/769(58％)	568/769(73％)	0.0	gi\|2351699	Aspergillusfumigatus二肽基多肽酶IV(Dpp4)基因	2352	469/761(61％)	585/761(76％)	0.0
gi\|2924304	Aspergillusoryzae Dpp4基因	4771	448/769(58％)	568/769(73％)	0.0	gi\|32422540	Neurospora crassa菌株OR74A	2688	256/720(35％)	374/420(51％)	e-114
gi\|14330262	二肽基氨肽酶IV型的AspergillusnigerdapB基因，外显子1-3	3989	224/637(35％)	333/637(52％)	e-111	gi\|32422540	Neurospora crassa菌株OR74A	2688	256/720(35％)	374/420(51％)	e-114
gi\|14330262	二肽基氨肽酶IV型的AspergillusnigerdapB基因，外显子1-3	3989	224/637(35％)	333/637(52％)	e-111	gi\|1621278	二肽基多肽酶的Xenopuslaevis mRNA	3337	244/752(32％)	375/752(49％)	e-100
gi\|6978772	Rattus norvegicus二肽基多肽酶4(Dpp4)	4835	246/742(33％)	373/742(50％)	8e-98	gi\|1621278	二肽基多肽酶的Xenopuslaevis mRNA	3337	244/752(32％)	375/752(49％)	e-100

表12D.ruDPPIV BLASTX结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|2351700	二肽基多肽酶IV/Aspergillusfumigatus	765	218/341(63％)	270/341(79％)	0.0

gi\|2924305	脯氨酰二肽基多肽酶/Aspergillusoryzae	771	213/344(61％)	270/340(78％)	0.0
gi\|2924305	脯氨酰二肽基多肽酶/Aspergillusoryzae	771	213/344(61％)	270/340(78％)	0.0	gi\|1621279	二肽基多肽酶IV/Xenopus laevis mRNA	748	118/349(33％)	186/349(53％)	8e-93
gi\|535588	二肽基多肽酶IV/人	766	125/375(33％)	191/375(50％)	3e-90	gi\|1621279	二肽基多肽酶IV/Xenopus laevis mRNA	748	118/349(33％)	186/349(53％)	8e-93

表12E.ruDPPIV BLASTP结果

基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值
基因目录/索引	蛋白/组织	长度(aa)	一致性(％)	得分值(％)	E值	gi\|2351700	二肽基多肽酶IV/Aspergillusfumigatus	765	468/761(61％)	585/761(76％)	0.0
gi\|2924305	脯氨酰二肽基多肽酶/Aspergillusoryzae	771	448/769(58％)	568/769(73％)	0.0	gi\|2351700	二肽基多肽酶IV/Aspergillusfumigatus	765	468/761(61％)	585/761(76％)	0.0
gi\|2924305	脯氨酰二肽基多肽酶/Aspergillusoryzae	771	448/769(58％)	568/769(73％)	0.0	gi\|14330263	二肽基氨肽酶IV型/Aspergillusniger	901	261/733(35％)	387/733(52％)	e-114
gi\|19114882	二肽基氨肽酶/Schizoaccharomyces prombe	793	258/742(34％)	396/742(53％)	e-106	gi\|14330263	二肽基氨肽酶IV型/Aspergillusniger	901	261/733(35％)	387/733(52％)	e-114
gi\|19114882	二肽基氨肽酶/Schizoaccharomyces prombe	793	258/742(34％)	396/742(53％)	e-106	gi\|3660	二肽基氨肽酶/Saccharomyces cerevisiae	841	254/750(33％)	370/750(49％)	2e-95

本发明另一方面是关于分离的编码EXOX多肽或具有其生物活性部分的核酸分子。同时本发明也包括能充分应用的作为杂交探针证明EXOX编码核酸(如EXOX mRNAs)的核酸片段，作为扩增或突变EXOX核酸分子的PCR引物的核酸片段。所述应用，所述术语“核酸分子”指的是包括DNA分子(如cDNA或基因组DNA)，RNA分子(如mRNA)，利用核酸同源性产生的上述DNA或RNA的类似物、衍生物、片段或功能类似物等。所述核酸分子可以是单链或双链。

一个EXOX核酸能编码一个成熟的EXOX多肽。本发明所指，“成熟”形式的多肽或蛋白表示自然产生的多肽、前体形式或蛋白前体。所述自然产生的多肽、前体形式或蛋白前体包括但不限于，全长的编码相关蛋白的基因产物。同样的，上述自然产生的多肽、前体形式或蛋白前体也可以被定义为由一段本发明所述的ORF编码。所述的产物的“成熟”形式产生于，包括但不限于，一个或多个自然发生的基因表达过程，如发生在细胞、宿主细胞里出现基因表达。上述产生步骤导致“成熟”形式的多肽或蛋白的例子包括去除由ORF开始密码子编码的N末端甲硫氨酸残基，或水解去除一段信号肽或引导序列。上述从具有残基1到N的多肽或蛋白前体产生的成熟形式，所述残基1是指N末端甲硫氨酸，去除N末端甲硫氨酸后具有残基2到N的残基。另外的，上述从具有残基1到N的多肽或蛋白前体产生的成熟形式，其中N末端从残基1到残基M的信号序列被除去，保留残基M+1到残基N的残基。这里进一步引述，多肽或蛋白的“成熟”形式可以从后转录修饰中产生，而不用蛋白水解去除现象。上述另外的过程包括，但不限于如，糖基化(N-，O-和W型)、十四酰化、磷酸化、硫化、N末端环化或C末端酰胺化。一般的，成熟的多肽或蛋白可以通过上述一种方法产生，或上述方法的任意组合产生。

所述的术语“探针”，在本发明中指的是具有不同长度的核酸序列，可能至少是10个核苷酸(nt)，或到100个，又或到最大的6000个nt，这取决于其相关作用。探针被用于证明核酸序列的一致性、相关性或互补性。较长的探针一般来自于天然或重组的，具有高度特异性，同时比起短的探针具有更长的杂交时间。探针可以是单链或双链，可以设计用于PCR反应，膜杂交技术，或象ELISA技术[xu4]。

所述术语“分离的”核酸分子，在本发明中指的是从自然存在的核酸中分离得到的一种核酸分子。优选的，“分离的”核酸不含有该核酸来源生物的基因组DNA中天然位于该核酸侧翼的序列(如位于该核酸的5’和3’端序列)。例如，在不同的实施方案中，分离的EXOX核酸分子可以含有至少约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列，该核苷酸序列天然位于上述核酸分子来源的细胞/组织/物种基因组DNA中的核酸分子的侧翼。此外，“分离的”核酸分子，例如cDNA分子，在用重组技术产生时，可以基本上不含其他细胞物质或培养基；或在用化学法合成时，基本上不含化学前体或其他化学物质。特别的，其中核酸分子或蛋白的纯度至少约50％，进一步优选为至少约85％，最优选为至少约99％。

本发明所述的术语“重组体”指的是参考一种细胞，显示该细胞复制异源核酸或表达由异源核酸编码的多肽或蛋白。重组体细胞可以含有不是天然的(非重组体)细胞的基因。重组体细胞也可以含有天然的细胞里经过修饰过的和通过人工手段引入到细胞里的基因。所述术语还包括含有内生的被修饰过，但没有去除核酸的细胞里的核酸；所述修饰包括可以获得的基因替换、定点突变和其他相关技术。本领域技术人员熟知的是所述细胞可以被用作单细胞或多细胞转基因组织，例如产生EXOX的转基因真菌。

本发明提供的一种核酸分子，如含有SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示核酸序列的核酸分子或其互补系列，可以用标准的分子生物学技术分离得到，所述序列信息如本发明所示。用全部或部分SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示核酸序列作为杂交探针，EXOX分子用标准的杂交和克隆技术被分离得到(如以下文献描述：Sambrook等，(eds)，分子克隆试验操作手册第二版，冷泉港实验室出版，冷泉港，NY，1989；Ausubel等，(eds.)，CURRENT PROTOCOLS IN MOLECULARBIOLOGY，John Wiley & Sons，New York，NY，1993)。

本发明所述的核酸可以通过以cDNA、mRNA或等位基因组DNA作为模板，以合适的寡核苷酸片段为引物，进行一定的PCR反应得到。所述的核酸扩增后可以克隆到合适的载体中，并通过序列分析得到确认。进一步的，EXOX核苷酸序列对应的寡核苷酸可以通过标准的合成技术制备，如DNA自动合成仪。

本发明所述的术语“寡核苷酸”指的是一系列连接在一起的核苷酸残基，所述寡核苷酸具有足够多的碱基来保证应用于PCR反应。一段短的寡核苷酸序列可以基于或来自于一个基因组DNA或cDNA，然后被应用于扩增、确认或揭示在特定细胞或组织中存在的一种同样的、类似的或互补的DNA或RNA。寡核苷酸含有部分核酸序列，长度可为10nt、50nt或100nt，优选为15nt～30nt。在本发明一个具体实施方案中，一段长度小于100nt的寡核苷酸进一步的包括了SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34或其互补序列中至少6个邻近核苷酸。寡核苷酸可以通过化学合成，作为探针应用。

在另一个实施方案中，本发明所述的分离的核酸分子包括了一种含有与选自SEQ IDNOs：2、5、8、11、14、17、20、23、26、29、32或34所示序列互补的核酸分子(例如，一段作为探针或引物的核酸片段、一段编码具有EXOX多肽活性部分的核酸片段)。上述与选自SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示序列互补的核酸分子具有与选自SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示序列很少或没有错配的氢键连接，从而形成稳定的双螺旋结构。

在这里，术语“互补体”指的是核酸分子的核苷酸间为Watson-Crick或Hoogsteen碱基配对。术语“连接”指的是两个多肽、化合物、多肽相关物质、组合物或其功能类似物之间的物理或化学相互作用力。连接包括离子键、非离子键、范德华引力、氢键引力等。物理作用力可以是直接的，也可以是间接的。间接的作用力可以是通过或由另一个多肽或化合物的影响。直接的连接指的是没有空间的阻隔，或者是由于另一个多肽或化合物作用，但不是指其他具体的化学反应作用。

本发明提供的片段定义为具有至少6个(相邻的)核酸或4个(相邻的)氨基酸，其长度足够允许严格的核酸杂交或与特殊的抗体结合，相对的，部分片段的反应小于全长反应。片段可以从所选择的核酸或氨基酸序列中相邻的部分得到。由核酸序列或氨基酸序列形成的衍生物可以是直接从自然获得的化合物的或被修饰过的或部分替换的。同功物指的是具有类似核酸或氨基酸序列结构，但不限于的是，具有不同的组分或侧链。同源或异源是指核酸序列或氨基酸序列从不同物种分离得到的一类特定基因。

如果衍生物或同功物含有被修饰过的本发明所述核酸或蛋白，所述衍生物和同功物可以是全长或超过全长。本发明所述的核酸或蛋白的衍生物或同功物包括但不限于：在不同的重组体中含有与本发明所述的核酸或蛋白具有至少约70％、80％或95％同源性的分子(优选为具有80-95％同源性的分子)；或是按照本领域技术人员熟知的经过计算机同源程序配对过的线性序列；或是能够在严格的、温和的、低度严格的条件下与编码上述的蛋白的互补序列杂交的编码的核酸。参见如Ausubel等，CURRENT PROTOCOLS TN MOLECULARBIOLOGY，John Wiley & Sons，New York，NY，1993和以下所述。

本发明中，一种“同源核酸序列”或“同源氨基酸序列”或是其它不同名称指的是在核苷酸或氨基酸水平上具有同源性特征的序列。同源核酸序列包括那些编码EXOX多肽的重组异构体的序列。重组异构体能够在同样的组织中表达，如选择性剪切的RNA。另一方面，重组异构体可以被不同的基因编码。在本发明中，同源核酸序列可以是编码除真菌外的其他物种的EXOX多肽的核酸序列。同源核酸序列也包括但不限于自然发生的本发明提供的核酸等位替换或突变。同源核酸序列还包括那些编码如SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示序列的保守氨基酸亚单位(参见下面)，一种多肽具有EXOX生物活性。EXOX蛋白的不同生物活性将在下面详述。

EXOX多肽由EXQX核酸的开放阅读框(ORF)编码。ORF被终止子结束其延伸。一段开放阅读框代表了一种全长蛋白的编码序列，由ATG“起始子”开始，到TAA、TAG或TGA三个终止子之一终止。为了本发明目的，所述ORF可以是编码序列的任何部分，含有或不含起始子和终止子之一或两个。作为一个好的编码真正的细胞质蛋白的ORF，其最小的长度经常是编码50个氨基酸或更多氨基酸蛋白的DNA结构。

经来自真菌EXOX基因克隆确认的核苷酸序列可以作为探针和引物应用，所述探针和引物设计用来证明和/或克隆在其他物种的EXOX同源基因，也包括来自其他物种的EXOX同源基因。所述引物/探针一般包括一段基本上纯化的寡核苷酸。所述寡核苷酸一般包括核苷酸序列的一个区，所述核苷酸序列在严格条件下与至少约12、25、50、100、150、200、250、300、350或400连续的核苷酸序列的核酸杂交，其中杂交的核酸序列为SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34的正义核苷酸序列；或SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34的反义核苷酸序列；或SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34的天然存在的突变体序列。

“具有EXOX多肽部分活性的多肽”指的是多肽具有活性类似，但不限于，本发明所述多肽活性，包括成熟形式，经过特殊的生物检测，有或没有剂量依赖。一种编码“EXOX生物活性部分”的核酸片段可以从SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示的编码具有EXOX生物活性的多肽(EXOX蛋白生物活性在下面详述)的部分序列分离得到，表达EXOX蛋白被编码部分(如体内表达的重组子)，评价EXOX蛋白被编码部分活性。

EXOX核酸和多肽的变异体

本发明进一步包括不同于SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示序列的核酸分子，其导致基因编码的兼并，这样同样的编码如SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示序列编码的EXOX蛋白。在另一实例中，一种本发明所述分离的核酸分子具有编码含有SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列多肽的核酸序列。除了SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示的真菌EXOX核酸序列外，核酸序列EXOX多肽的氨基酸序列存在于不同的种群中。上述EXOX基因的多样性可以存在于不同的由自然等位变异导致的真菌种类中。本发明中，术语“基因”和“重组基因”指的是含有编码EXOX蛋白开放阅读框(ORF)的核酸分子，优选的是一种真菌EXOX蛋白。上述自然等位变异可以是典型的在EXOX基因的核酸序列中发生1～5％的变异。所述任一和所有EXOX多肽的核酸变异和引起的氨基酸多样性都属于本发明范围，所述变异和多样性是自然等位变异的结果，不会改变EXOX多肽的功能、活性。

更进一步的是，其他种类中编码EXOX多肽的核酸分子，但具有与来自于真菌的SEQ IDNOs：2、5、8、11、14、17、20、23、26、29、32或34所示序列不同的核酸序列，也属于本发明范围。与本发明EXOX cDNAs同源和相对应的自然等位变异的核酸分子可以通过其与本发明所述真菌EXOX核酸序列同源，用真菌cDNAs或类似部分作为杂交探针通过标准的杂交技术在严格的杂交条件下分离得到。

同样的，在另一个实施方案中，一种本发明所述的分离核酸分子具有至少6个核苷酸，能够在严格条件与含有SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示序列的核酸分子杂交。

在另一个实施方案中，上述核酸至少具有10、25、50、100、250、500、750、1000、1500或2000核苷酸。在另一个实施方案中，本发明所述的分离核酸分子与编码区杂交。在本发明中，术语“在严格条件下杂交”描述的是在核酸序列彼此间至少有60％同源情况下进行杂交和清洗，核酸之间仍保持杂交状态。

同源或其他相关序列(如直系同源、侧系同源)可以通过用所有或部分所述真菌的特殊序列作为探针，用本领域常用的核酸杂交和克隆方法，在低的、温和或高的严格杂交条件下获得。

本发明所述术语“严格杂交条件”指的是探针、引物或寡核苷酸只与目标序列杂交，而不是其他序列。严格条件是序列依赖型，根据不同反应而不同。特别的，长序列的杂交温度比短序列杂交温度高。一般的，对于特别序列，其严格条件选择比热熔点(T_m)低5℃，在一定的离子强度和pH下。所述T_m是指(在一定的离子强度、pH和核酸浓度下)探针50％的与目标序列互补的序列和目标序列达到平衡的杂交状态时的温度。既然目标序列一般存在过度的，在T_m时，探针的50％序列在平衡状态时都被反应了。一般的，严格条件中的盐浓度小于约1.0M钠离子，一般为约0.01到1.0M钠离子(或其他盐)，pH7.0~8.3，对于短的探针、引物或寡核苷酸(如10nt到50nt)温度至少约30℃，对于长的探针、引物或寡核苷酸温度至少约60℃。严格条件中还可以添加破坏DNA稳定的试剂，例如甲酰胺。

严格条件是本领域的技术人员熟知的，而且能在Ausubel等，Current Protocols inMolecular Biology，John Wiley & Sons，N.Y.(1989)，6.3.1-6.3.6查到。优选的，在所述条件下，核酸序列相互之间至少约65％、70％、75％、85％、90％、98％或99％同源性的序列仍能相互杂交。非限定的严格杂交条件例子是在高的盐缓冲液，包括：6×SSC，50mMTris-HCl(pH7.5)，lmM EDTA，0.02％PVP，0.02％Ficoll，0.02％BSA，和500mg/ml的变性鲑鱼精DNA，在65℃下杂交，随后在50℃下用0.2×SSC洗一次或多次。本发明所述的一种分离的核酸分子可以在严格条件下与SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示序列对应的自然-存在的核酸分子杂交。在本发明中，“自然-存在”核酸分子指的是自然存在的一种RNA或DNA分子(如编码一种天然的蛋白)。

在第二个实施方案中，本发明还提高一种在中度严格条件下与含有SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示序列的核酸分子或其片段、同功物或衍生物杂交的核酸分子。非限定的中度严格杂交条件例子是在6×SSC，5×denhardt’溶液，0.5％SDS和100mg/ml的变性鲑鱼精DNA，在55℃下杂交，随后在37℃下用1×SSC、0.1％SDS洗一次或多次。其他的中度严格杂交条件是本领域技术人员熟知的，如Ausubel等，1993，Current Protocols in Molecular Biology，John Wiley & Sons，N.Y.；Kriegler，1990，Gene transfer and Expression，A Laboratory Manual，Stockton出版，NY。

在第三个实施方案中，本发明还提高一种在低度严格条件下与含有SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示序列的核酸分子或其片段、同功物或衍生物杂交的核酸分子。非限定的中度严格杂交条件例子是在35％甲酰胺、5×SSC、50mMTris-HCl(pH7.5)、5mM EDTA、0.02％PVP、0.02％Ficoll、0.02％BSA、100mg/ml的变性鲑鱼精DNA和10％(w/v)葡聚糖硫酸盐，在40℃下杂交，随后在50℃下用2×SSC、25mMTris-HCl(pH7.4)、5mM EDTA和0.1％SDS洗一次或多次。其他的低度严格杂交条件是本领域技术人员熟知的(如种间杂交应用)，参见如Ausubel等，1993，Current Protocolsin Molecular Biology，John Wiley & Sons，N.Y.；Kriegler，1990，Gene transfer andExpression，A Laboratory Manual，Stockton出版，NY；Shilo & Weinberg，Proc Natl AcadSci USA 78：6789-6792(1981)。

保守的突变

除了自然存在的EXOX序列的等位突变可以存在上述生物体中，本领域技术人员可以得出如下的改变，所述改变由SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示序列的核酸突变而来，从而导致编码的EXOX蛋白的氨基酸序列发生变化，但上述变化不会改变所述EXOX蛋白的功能活性。例如，导致在“非必需”氨基酸残基上替换氨基酸的核苷酸替换可以发生在SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示序列中。所述“非必需”氨基酸残基是指一种在EXOX蛋白序列中野生型序列中的不改变EXOX蛋白生物活性的氨基酸残基改变，而“必需“的氨基酸是指生物活性需要的基团。

本发明中，术语“生物活性”或“功能活性”指的是自然或一般的EXO蛋白具有的功能，例如，降解其他蛋白的能力。本发明所述的EXOX蛋白中的氨基酸残基可以通过特殊的non-amenable改变来预测。保守性的氨基酸替换是本领域技术人员熟知的。其中一项本领域技术人员熟知的技术是通过标准的技术，每一个核酸编码子(除了AUG，一般只对应甲硫氨酸)可以被修饰成功能一致的分子。进一步的，在一段编码序列中改变、增加或删除一个氨基酸或一小部分氨基酸(通常小于5％，更特别的是小于1％)的单独的替换、删除或增加的改变是“保守突变”，所述改变是化学性类似的氨基酸替换的结果。

本发明另一方面还涉及编码含有对于活性不是必需的氨基酸残基改变的EXOX蛋白的核酸分子。所述EXOX蛋白的氨基酸序列不同于SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示序列，但其仍有生物活性。在一个实施方案中，所述分离的核酸分子包括一种编码蛋白的核苷酸序列，所述蛋白的氨基酸序列至少与SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示序列有45％的同源性。优选的，所述核酸分子编码的蛋白的氨基酸序列至少与SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示序列有60％的同源性；更优选的是至少与SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示序列有70％的同源性；更进一步优选的是至少与SEQ IDNOs：3、6、9、12、15、18、21、24、27、30、33和35所示序列有80％的同源性；再优选的是至少与SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示序列有90％的同源性；最[xu5]优选的是至少与SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示序列有95％的同源性。

编码与含有SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示序列的蛋白同源的EXOX蛋白的分离的核酸分子可以在SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32或34所示核苷酸序列中通过一个或多个核苷酸替换、增加或删除得到，这样一个或多个的氨基酸替换、增加或删除被引入到所述的被编码的蛋白。

通过标准的技术可以在SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示序列引入突变，如点突变、PCR介导的突变和DNA移位。优选的，保守的氨基酸替换发生在一个或多个可预测的、非必需的氨基酸残基上。在人类DNA中单个碱基的替换是参见的。如果替换是发生在编码区，那么替换可能是保守或非保守替换。所述“保守的氨基酸替换”是具有类似特性的、与被替换的氨基酸具有类似的侧链结构新的氨基酸。非必需替换指的是具有不同特性的新的氨基酸。现有技术对具有类似侧链的氨基酸家族已有定义。氨基酸家族包括碱性侧链的(如赖氨酸、精氨酸、组氨酸)、酸性侧链的(如天冬氨酸、谷氨酸)、不带电的极性侧链的(如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链的(如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、蛋氨酸、色氨酸)、β-分支侧链的(如苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链的(如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此，对于保守替换，在EXOX蛋白中预测为非必需的氨基酸残基可以被同一个侧链家族的另一个氨基酸替换。可选择的是，在另一个实施方案中，突变也可以被随机的引入到所有或部分EXOX编码序列中，如饱和突变，然后对产生的突变体筛选其EXOX生物活性，以鉴定出保持活性的突变体。SEQ IDNOs：3、6、9、12、15、18、21、24、27、30、33和35所示序列发生突变后，可对其编码蛋白进行重组表达和蛋白活性的测定。

氨基酸[xu6]家族的相关性也可以被侧链相互作用的基础决定。替换的氨基酸可以是保守“强”的残基或完全保守“弱”的残基。所述保守氨基酸残基的“强”的组包括以下组：STA、NEQK、NHQK、NDEQ、QHRK、MILV、MILF、HY、FYW，其中单个字母的氨基酸代号代表那些可以互相替换的氨基酸。另外，保守氨基酸残基的“强”的组包括以下组：CSA、ATV、SAG、STNK、STPA、SGND、SNDEQK、NDEQHK、NEQHRK、HFY，其中每组中的字母代表单个字母的氨基酸代号。

在一个实施方案中，突变的EXOX蛋白可以按以下方法检验：(i)形成蛋白的能力：和其他EXOX蛋白、其他细胞表面蛋白或生物活性类似物部分的相互作用；(ii)突变的EXOX蛋白与EXOX配体形成联合体形式；或(iii)突变的EXOX蛋白与细胞内的目标蛋白或生物活性类似物结合的能力(如抗生物素蛋白)。

在另一个实施方案中，突变的EXOX蛋白可以通过调控特殊的生物功能(如分解蛋白的能力)被检验。

EXOX多肽

本发明对应的多肽包括含有EXOX多肽具有的如SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的多肽。本发明还包括从SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示序列对应的残基发生变化的突变或变异的蛋白，所述蛋白的还具有EXOX蛋白的活性或生理功能，或其功能类似物片段。

一般地，保存了EXOX类似功能的EXOX变异体，包括序列中特殊位置的残基被其他氨基酸替换的任意的变异体，进一步还包括在原蛋白的两个基团中***一个或多个额外的氨基酸残基或在原蛋白中删除一个或多个氨基酸残基的可能性。任何的氨基酸替换、***或删除都属于本发明范围。在有利的条件下，所述替换如本文上面定义。

本发明另一发明还涉及分离的EXOX蛋白、其类似生物活性部分或衍生物、片段、异源体或类似同源体。生物活性[xu7]部分指的是EXOX蛋白中对于一般功能必需的部分，如氨肽酶活性。同时也提供多肽片段适合于用于培养抗EXOX抗体的免疫原。在一个实施方案中，天然的EXOX蛋白可以从细胞、组织或培养基用适当的蛋白提纯方法分离得到。在另一个实施方案中，EXOX蛋白可以通过重组DNA技术得到。EXOX蛋白或多肽还可以通过标准的肽合成技术，由化学法合成，而代替重组表达。

所述“分离的”或“纯化的”多肽、蛋白或其类似生物活性部分基本上不含来自EXOX蛋白来源的细胞或组织的细胞物质或其他杂质蛋白，或者用化学法合成时，基本上不含化学前体或其他化学物质。术语“基本上不含细胞物质”包括EXOX蛋白与细胞组分分开的EXOX蛋白的前体，其中细胞是用来分离或重组产生改蛋白的细胞。在一个实施方案中，术语“基本上不含细胞物质”包括含有少于约30％(按干重量)的非EXOX蛋白(这里也称为“杂质蛋白”)的EXOX蛋白前体，优选少于约20％的非EXOX蛋白的EXOX蛋白前体，更优选为少于约10％的非EXOX蛋白的EXOX蛋白前体，最优选为少于约5％的非EXOX蛋白的EXOX蛋白前体。当该EXOX蛋白或其类似生物活性部分是由重组方法产生时，还优选基本上不含培养基，即培养基的含量少于约20％，优选为少于约10％，更优选为少于约5％的EXOX蛋白前体。

术语“基本上不含化学前体或其他化学物质”是指蛋白与化学前体或其他化学物质分离的EXOX蛋白前体，其中的化学前体或其他化学物质参与了蛋白的合成。在一个实施方案中，术语“基本上不含化学前体或其他化学物质”包括含有少于约30％(按干重量)的化学前体或非EXOX化学物质的EXOX蛋白前体，优选少于约20％的学前体或非EXOX化学物质的EXOX蛋白前体，更优选为少于约10％的学前体或非EXOX化学物质的EXOX蛋白前体，最优选为少于约5％的学前体或非EXOX化学物质的EXOX蛋白前体。进一步的，“基本上不含化学前体或其他化学物质”还包括氧化副产物。本[xu8]领域技术人员都知道如何防止氧化反应，如将化学物质置于一个无氧的环境中。

EXOX蛋白的生物活性部分所包含的肽含有的氨基酸序列与EXOX蛋白的氨基酸序列有足够的同源性，或来源于EXOX蛋白的氨基酸序列(如SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示的氨基酸序列)，它包含的氨基酸序列比全长的EXOX蛋白的少，并表现出EXOX蛋白的至少一种活性。通常，生物活性部分包含至少一种EXOX蛋白的活性结构域或片段。EXOX蛋白的生物活性部分可以是多肽，例如，它的长度为10、25、50、100或更多个氨基酸。

此外，其他蛋白区域缺失的其他生物活性部分可以通过重组技术得到，并用来评价EXOX蛋白的一种或多种功能活性。

在一个实施方案中，EXOX蛋白含有SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示的氨基酸序列。在其他实施方案中，EXOX蛋白基本上与SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35同源，并保留了SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35蛋白的变异功能活性，但其氨基酸序列有差别，其原因如下所详述的，是由于天然的等位基因变异或突变造成的。因此，在另一个实施方案中，EXOX蛋白是如以下所述的蛋白：含有与SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示的氨基酸序列至少约90％同源的氨基酸序列，并保留了SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35的EXOX蛋白的功能活性。本发明中，术语“生物活性”或“功能活性”指的是自然或一般的EXO蛋白具有的功能，例如，降解其他蛋白的能力。

两个或多个序列同源性的测定

为了测定两种氨基酸序列或两种核酸序列的同源性百分数，可将序列进行比对，用于最优比较目的(例如，在第一和第二氨基酸或核苷酸序列中之一，或两者中引入空位，用于最优比对，非相同的序列可考虑进行比较)。氨基酸残基、对应氨基酸位置的核苷酸或核苷酸位置可以比较。当第一序列的某个位置与第二序列相应相同位置具有相同氨基酸残基或核苷酸时，则此两个分子在该位置上具有同源性(这里所用的氨基酸或核酸“同源性”与氨基酸或核酸的“同一性”的意义是相同的)。

核酸序列的同源性可用两个序列间的同源程度衡量。本领域技术人员可以用计算机程序计算同源性，如GCG软件包的GAP程序，参见Needleman & Wunsch，J.Mol.Biol.48：443-453，1970。通过以下操作，利用GCG GAP程序来对比核酸序列：空位罚分5.0和空位拓展罚分0.3，对比的核酸序列的编码区按照上述参数，表现一定的至少70％，75％，80％，85％，90％，95％，98％，or 99％同源可能性，与SEQ ID NOs：2，5，8，11，14，17，20，23，26，29，32，和34所示的序列的CDS(编码)部分相比。

术语“序列同源”是指两个多聚核苷酸或多肽在对比的特定区内具有的残基对残基相同性的程度。术语“序列同源性的百分比”是通过以下方法计算得出：在整个对比区比较两个最佳配比的序列，在两个序列中具有的同样的核酸碱基(如A、T、C、G、U或I，核酸中的碱基)数目产生匹配位置的数目，除以匹配位置整个对比区的数目(如整个屏幕)，然后将上述结果乘以100产生序列同源的百分比。这里所述术语“基本同源”表示多聚核苷酸序列的一种特征，其中多聚核苷酸包括与参考序列的对比区相比至少有80％序列同源，优选至少85％同源，更优选90～95％同源，最优选为有至少99％序列同源。嵌合和融合蛋白

本发明还提供EXOX嵌合或融合蛋白。这里所用的EXOX“嵌合蛋白”或“融合蛋白”包括与非EXOX多肽选择性连接的EXOX多肽。“EXOX多肽”是指含有相当于EXOX蛋白(SEQID NOs：3、6、9、12、15、18、21、24、27、30、33或35)氨基酸序列的多肽，而“非EXOX多肽”是指该多肽含有的氨基酸序列相当于与EXOX蛋白基本上不同源的多肽，例如与EXOX蛋白不同的蛋白，和来源于相同或不同组织的蛋白。在EXOX融合蛋白中，EXOX多肽可以相当于全部或部分的[xu9]EXOX蛋白。在一个实施方案中，EXOX融合蛋白含有EXOX蛋白的至少一个生物活性部分。在另一个实施方案中，EXOX融合蛋白含有EXOX蛋白的至少二个生物活性部分。在另一个实施方案中，EXOX融合蛋白含有EXOX蛋白的至少三个生物活性部分。在融合蛋白中，术语“选择性连接”是要表明EXOX蛋白和非EXOX蛋白彼此融合在同一开放读码序列中。非EXOX多肽可以融合到EXOX多肽的N端或C端。

在一个实施方案中，该融合蛋白是GST-EXOX融合蛋白，其中EXOX序列融合到GST序列的C端。这种融合蛋白可促进重组EXOX蛋白的纯化。

在另一个实施方案中，该融合蛋白是在N端含有异源信号序列的EXOX蛋白。在某些宿主细胞中(例如哺乳动物宿主细胞)，通过使用异源信号序列可以提高EXOX的表达和/或分泌水平。

在另一个实施方案中，融合蛋白是一种EXOX-免疫球蛋白融合蛋白，其中EXOX基因与来自免疫球蛋白家族的一个基因融合。本发明所述的EXOX-免疫球蛋白融合蛋白可以作为药物组合物治疗抑制EXOX配体和EXOX蛋白在细胞表面上的结合的药物中的应用，这样抑制生物体内EXOX-介导的信号传导。EXOX-免疫球蛋白融合蛋白还可以用于影响EXOX相关的配体的生物利用度。对EXOX配体/EXOX相互作用的抑制在医疗上有用，可以针对治疗增殖和分化的紊乱，调节(如促进或抑制)细胞生长。进一步，本发明所述的EXOX-免疫球蛋白融合蛋白可以作为免疫原，在生物体内产生抗-EXOX抗体，用来纯化EXOX配体，和扫描分析验证抑制EXOX和EXOX配体相互作用的分子。

本发明所述的EXOX嵌合体或融合蛋白可以通过标准的重组DNA技术获得。例如，编码不同多肽序列的DNA片段通过常规的技术连接在一起，如为连接提供平头末端或粘性末端，用限制酶切提供合适的末端，添加合适的粘性末端，用碱磷酸化处理防止错配，最后酶连接。在另一个实施方案中，融合蛋白可以通过常规的技术合成获得，包括DNA自动合成。可供选择的，基因片段的PCR扩增运用锚引物，可以在两个连续的基因片段上产生互补的突出序列，这样可以顺序的将两个片段融合和扩增，产生一个嵌合体基因序列(参见Ausubel等(eds.)CURRENT PROTOCOLS IN MOLECULAR BIOLOGY，John Wiley & Sons，1992)。进一步的，许多商业上可获得的表达***已编码了融合的一部分(如，GST多肽)。EXOX-编码的核酸可以克隆到上述表达载体中，这样EXOX蛋白与融合的一部分连接在一起。EXOX激动剂和拮抗剂

本发明还包括EXOX蛋白的变体，它可以起EXOX激动剂(模拟物)的功能，或起EXOX拮抗剂的功能。EXOX蛋白的变体可通过诱变产生(例如，EXOX蛋白的不连续点突变或截短)。EXOX蛋白的激动剂可使其基本上保留与天然存在形式的EXOX蛋白相同、或一部分的生物学活性。EXOX的拮抗剂可抑制天然存在的EXOX蛋白形式的一种或多种活性，例如，通过竞争性抑制细胞信号通道的上游或下游，其中包括EXOX蛋白酶。因此，用限定功能的变体治疗，可引起特定的生物学效应。在一个实施方案中，与用天然存在形式的EXOX蛋白治疗相比，用具有天然存在形式的EXOX蛋白的生物活性中的一部分的变体治疗，对受试者的副作用较少。

作为EXOX蛋白激动剂(模拟物)，或EXOX蛋白拮抗剂的EXOX蛋白的变异体，可用下述方法鉴定：对EXOX蛋白的突变体(例如截短突变体的)组合文库，筛选其EXOX蛋白激动剂或拮抗剂活性。在一个实施方案中，多样化的EXOX突变体文库可通过在核酸水平上的组合诱变来产生，并由多样化的基因文库所编码。多样化的EXOX变体文库可以通过下述的方法产生，例如，将合成的寡核苷酸混合物用酶法连接成各种基因序列，从而使一组简并的潜在EXOX序列可以按单个多肽的形式表达，或者以包含一组EXOX序列的一组大融合蛋白(如噬菌体表达)的形式表达。由简并的寡核苷酸序列生产潜在EXOX变体的方法有很多种。可以在自动DNA合成仪中进行简并基因序列的化学合成，然后将合成的基因连接到适合的表达载体中。使用一组简并的基因，可以在一种混合物中提供全部编码所需要的一组潜在EXOX序列。合成简并的寡核苷酸的方法在本领域是已知的，参见例如，Narang，Tetrahedron(1983)；Itakura等，Annu.Rev.Biochem.53：323(1984)；Itakura等，Science 198：1056(1984)；Ike等，Nucleic Acid Res.11：477(1983)。

多肽文库

此外，EXOX蛋白编码序列片段的文库可以用来产生多样化的一组EXOX片段，用于筛选和随后选择EXOX蛋白的变体。在一个实施方案中，产生编码序列片段的文库的方法如下：用核酸酶处理EXOX编码序列的双链PCR片段，处理的条件是使每个分子仅发生约一次切口，然后使双链DNA变性，再使DNA复性形成双链DNA，该DNA可以包括不同切口的产物的正义/反义对，用S1核酸酶处理重新形成的双链体，以除去单链部分，再将得到的片段文库连接到表达载体中。用这种方法可获得编码各种大小的EXOX蛋白的N端、C端和内部片段的表达文库。

已知在本领域有几种用于筛选通过点突变或截短制备的组合文库的基因产物，以及用于对cDNA文库筛选具有选择特性的基因产物的技术。这些技术适用于对EXOX蛋白组合诱变所产生的基因文库进行快速筛选。能进行高通量分析、使用最广的用于筛选大基因文库的技术通常包括：将基因文库克隆到可复制的表达载体中，用产生的载体文库转化适合的细胞，以及在某种条件下使组合的基因表达，在该表达条件下，通过对所需活性的检测，促进了分离出编码该被测产物基因的载体。Recrusive ensemble诱变(REM)，是一种新的技术，它可提高文库中功能突变体的频度，可以结合筛选测定用于鉴别EXOX变体，参见例如，Arkin & Yourvan Proc.Natl.Acad.Sci.USA 89：7811-7815(1992)；Delgrave等，蛋白Engineering 6：327-331(1993)。

文库也可以通过DNA重排产生。DNA重排采用来自不同种属或基因的相关基因，其在功能、片段上相关，通过重组使其重新组合。可以确认其中含有有用或潜在令人感兴趣的产物的重组基因。所有重组的基因相当于片段来说具有用途，可以重新组合形成新的重组基因。来自不同种属或基因的不同片段经过复性和延伸，在文库中形成多样性。筛选出一个令人感兴趣的蛋白的过程是合适的。利用DNA重排产生重组基因的重要因素包括复性时的温度、基因的相似性和DNA片段的大小。

Stemmer等(Nature 370：389-391(1994))、Stemmer(Proc.Natl.Acad.USA 91：10747-10751(1994))、美国专利No.5,603,793、No.5,830,721和No.5,811,238，在这里作为具体的参考文献，描述了如生物体外的蛋白重排方法，如诱变的重复循环、重排和选择，如同一系列的产生displayed多肽和抗体的方法，如同一系列通过DNA片段进行的DNA重新组配技术，以及它们生物体内外的诱变复制。进一步的，DNA重排技术的不同应用是本领域技术人员熟知的。除了上述引用的公开文献，美国专利No.5,837,458也提供了在递归的重排技术里新的代谢途径和生物产率的提高的进化，和Crameri等(Nature Medicine 2(1)：100-103(1996))描述了抗体重排应用于抗体噬菌体文库。同时也可参考WO95/22625，WO97/20078，WO96/33207，WO97/33957，WO98/27230，WO97/35966，WO98/31837，WO98/13487，WO98/13485和WO989/42832。

表达载体

本发明的另一个方面是关于载体，优选表达载体，它含有编码EXOX蛋白、或衍生物、片段、同一物或其同源物的核酸。这里所用的术语“载体”是指一种核酸分子，它能转运与其连接的另一核酸。载体的一种类型是“质粒”，它是指可将另外的DNA片段连接在其中的环状双链DNA。另一种类型的载体是病毒载体，在该载体中，另外的DNA片段可与病毒的基因组连接。一些载体能够在其导入的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和游离型的哺乳动物的载体)。其他的载体(例如，非游离型的哺乳动物载体)是通过导入宿主细胞而整合到宿主细胞的基因组中，从而与宿主的基因组一起复制。此外，某些载体能指导与其选择性连接的基因的表达，这种载体在此称为“表达载体”。一般，重组DNA技术中使用的表达载体常常为质粒的形式。本说明书中，“质粒”和“载体”可以互换使用，因为质粒是最常用的一种载体形式。但是，本发明还包括其他形式的有同等功能的表达裁体，例如，病毒载体(例如复制缺陷逆转录病毒、腺病毒和腺伴随病毒)。

功能蛋白的产生与组织产生蛋白的细胞机器紧密相关。在选择表达***时，大肠杆菌是经典的“工厂”，因为它的基因组全部测得；组织容易处理；生长快；只需便宜容易制备的基质；分泌蛋白到基质中，从而有利于收集蛋白。但是，大肠杆菌是原核细胞，缺少细胞器，如真核具有的内质网和高尔基体，它们能够修饰产生的蛋白。许多真核蛋白可以在大肠杆菌中表达得到，但许多是没有功能的、无用的形式，因为糖基化或后转录修饰没有发生。

这样，研究者最近转向了真核酵母、哺乳动物核植物蛋白表达***。例如，在过去几年里嗜甲醇酵母P.pastoris成为了不同蛋白表达***中的有力的宿主，同时建立了一种选择性表达人类蛋白的高产量的真核宿主技术。

另一个例子，植物也被大量的蛋白表达***用作表达宿主，其提供了潜在的比经典的表达***更具有经济价值、可控和安全的优势[xu10]。最近，有系列的植物不同表达***出现，包括短期表达、植物细胞悬浮液培养、重组植物病毒和叶绿体转基因***。当在植物里表达的蛋白与哺乳动物有一些差异时，目前没有证据表明这些差异导致在病人身上产生不良反应。

另一个适合不同表达***利用了昆虫细胞，经常与杆状病毒表达载体结合。杆状病毒载体适用于在培养的昆虫细胞表达蛋白，例如，SF9细胞，包括pAc系列(Smith等，Mol.Cell.Biol.3：2156-2165(1983))和pVL系列(Lucklow和Summers，Virology170：31-39(1989))。

本发明的宿主细胞也可以用于生产除人以外的转基因动物，所述动物的基因组中已经转入了外源的序列。转基因动物是除人以外的动物，优选哺乳动物，更优选啮齿动物，如大鼠或小鼠，其中该动物的一个或多个细胞包含转移基因。其他转基因动物的例子包括除人以外的灵长类动物、绵羊、狗、牛、山羊、鸡、两栖类等。通过胚胎的操作和显微注射而产生转基因动物的方法，特别是对小鼠之类的动物，在本领域中已成为常规的方法，并在以下文献中有描述，例如：美国专利NOs.4,736,886、4,870,009和4,873,191；Hogan，1986.In：Manipulating the Mouse Embryo，Cold Spring Harbor Laboratory Press，Cold Spring Harbor，N.Y.)。类似的方法也用来生产其他的转基因动物。

Pichia pastoris表达***

真核酵母之一是嗜甲醇Pichia pastoris。P.pastoris已经被开发成一个产生外源蛋白合理的宿主，因它的乙醇氧化启动子被分离和克隆了。Pichiapastoris转录在1985年就已经有报道了。Pichia pastoris异源蛋白表达***由Phillips Petroleum发展，参见美国专利NOs.4,855,231，4,857,4674,879,231和4,929,555，本发明中全面引述上述专利。该***最近被体外标记。与其他真核表达***相比，Pichia具有很多优势，因为它没有细菌相关的内毒素问题，也没有动物细胞培养产生的蛋白中含有滤过性毒菌的问题。进一步的，P.pastoris可以在缺乏葡萄糖的情况下利用甲醇作为碳源。P.pastois表达***利用甲醇介导的乙醇氧化酶(AOX1)启动子，该启动子控制乙醇氧化酶的表达基因，该酶在甲醇代谢过程中第一个启动。上述启动子已研究清楚并整合到了一系列P.pastoris表达***中。由于P.pastoris产生的蛋白具有正常的结构并能分泌到胞外，基因工程P.pastoris发酵提供了一种很好的代替大肠杆菌表达***的选择。进一步的，P.pastoris还有超过大肠杆菌的优势：自发的对产生的蛋白糖基化。该表达***已制得了很多的蛋白，包括破伤风菌疫苗片段、Brodatella pertussis pertactin、人血清蛋白和溶菌酶。

EXOX蛋白标签去除

已经开发了不少***用来快速有效的纯化在细菌中表达的重组蛋白。其中大部分依赖与谷胱甘肽转移酶(GST)区域、钙结合多肽(CBP)组氨酸标签融合的蛋白表达。例如，结合谷胱甘肽转移酶(GST)的片段的多肽表达可以从细菌粗提取物中在不变性的条件下用谷胱甘肽凝胶亲和层析色谱法纯化。

进一步的，上述载体表达***一般引入特殊的蛋白酶水解位点，方便蛋白酶对细菌融合蛋白进行水解，载体引入的水解位点有凝血酶、肠激酶、或Xa蛋白因子。凝血酶专门对包含Leu-Val-Pro-Arg↓Gly-Ser(SEQ ID NO：44)序列的目标蛋白进行酶解。肠激酶的酶切位点是Asp-Asp-Asp-Asp-Lys↓(SEQ ID NO：45)。象肠激酶，Xa蛋白因子酶解位点在其结合序列Ile-Glu-Gly-Arg↓(SEQ ID NO：46)的C末端，这样就可以用来从适当设计结构中去除所有载体编码的序列。上述所有蛋白水解酶现在都可以在商业上获得高纯度的，以避免其包含的其他酶的二次降解。每个试剂盒都提供了所有的适合酶保存、利用在酶解基质中去除该酶的生物试剂等工具。最近Qiagen公司开发了一种TAGZyme***，能有效的去除从蛋白N末端的组氨酸标签，该蛋白包括能有序的从N末端到“停止点”氨基酸结构域分解双肽的外肽酶，包括↓Lys-Xaa、↓Arg-Xaa、↓Xaa-Xaa-Pro-Xaa-、↓Xaa-Pro-Xaa-Xaa-或↓Gln-Xaa。

尽管没有太大的必要去除一个纯化后的重组蛋白中短的组氨酸相似标签(不管组氨酸残基为多少)，但在一些应用中需要去除组氨酸，如X射线晶体结构分析或NMR。同样的对于凝血酶酶切位点Gly-Ser残基或其他多余的N末端氨基酸残基也需要上述处理，其存在和所用表达***相关。

最近利用在羰基基团和具有两个相邻亲核基团的分子之间浓缩反应方法来纯化。例如具有两个相邻亲核基团的氨基酸包括丝氨酸、苏氨酸和半胱氨酸。纯化蛋白或多肽包括由如N末端半胱氨酸、苏氨酸或丝氨酸残基和树脂间形成可逆的共价的键，参见Villian等，Chem.& Biol.8：673-679(2001)。在重组蛋白的N末端增加一对残基，如Thr-Pro、Cys-Pro或Ser-Pro，或化学合成的蛋白或多肽，通过以下两个步骤纯化：(1)通过共价连接纯化；(2)去除二肽标签。该方法有效的回收重组蛋白的成熟形式，而没有二肽标签序列。

EXOX蛋白的逆蛋白水解活性

本发明的另一个方面是关于将一个或多个氨基酸接到另一个氨基酸、多肽、寡多肽、多聚肽或任意的可连接的二级胺化合物的方法，该方法是利用EXOX蛋白的逆蛋白水解活性。本发明中，术语“逆蛋白水解活性”是指能促进将一个或多个氨基酸接到另一个氨基酸、多肽、寡多肽、多聚肽或任意的可连接的二级胺化合物的酶活性。本技术领域一个公知的技术是在合适的热力学的条件下，蛋白水解酶具有逆蛋白水解活性。

其中一个蛋白水解酶具有逆蛋白水解活性的酶是胰蛋白酶，该酶是胰腺的丝氨酸酶，其专门针对带正电的赖氨酸和精氨酸侧链的底物。胰蛋白酶被广泛的应用于从猪胰岛素制备人胰岛素，其中猪胰岛素除了在B链最后一个氨基酸丙胺酸代替了人胰岛素的苏氨酸，其余类似。在胰蛋白酶存在下，将猪胰岛素与苏氨酸酯反应，通过去除其末端的丙氨酸后加上苏氨酸酯，形成人胰岛素苏氨酸酯。随后将人胰岛素苏氨酸酯用三氟醋酸水解该酯，从而形成人胰岛素。

在一些实施方案中，EXOX蛋白被用来促进逆蛋白水解活性。举些例子，将EXOX蛋白和一个多肽或一个或多个氨基酸在增加一个或多个氨基酸到多肽的环境里培育。

有很多利用本发明EXOX蛋白的逆蛋白水解活性的途径。例如，利用EXOX蛋白的逆蛋白水解活性合成多肽链。EXOX蛋白也可以作为一种连接工具，将一个或多个氨基酸接到另一个氨基酸、多肽或任意的可连接的二级胺化合物。

药物组合物

本发明的EXOX核酸分子、EXOX蛋白、抗EXOX抗体(这里亦称为活性化合物)和衍生物、片段、同一物和其同源物可以掺入适合于给药的药物组合物中。这种组合物通常含有核酸分子、蛋白、抗体，或调节化合物和可药用载体。这里所用的术语“可药用载体”是指包括一些和全部的与药物的给药相容的溶剂、分散介质、包衣、抗细菌和抗真菌剂、等渗剂和吸收延迟剂等适合于给药的载体。适合的载体在最新版的Remington’sPharmaceutical Sciences一书中有描述，该书是本领域标准的参考，也是本发明全面引述的。优选的载体或稀释剂包括但不限于水、盐溶液、Ringer’s溶液、葡萄糖溶液和5％人血清清蛋白。脂质体和无水赋形剂，如不挥发的油，也可以使用。这种介质和试剂用于药物活性物质中在本领域来说是众所周知的。迄今为止除了任何常规使用的介质或试剂与活性化合物不相容以外，上述介质和试剂在组合物中的使用是经过仔细考虑的。补充的活性化合物也可掺入组合物中。

封装技术已广泛应用于许多工业领域中。例子包括控释药剂、食品和饮料中的色料、食品中抗氧化剂、农业中控释外激素。胶囊、微胶囊和微球是小球体微粒，活性成分包含在微粒混合物中或附着在微粒表面。例如，封装在生物可降解的藻酸盐微粒里。生物封装技术趋向于封装细胞、酶和生物活性材料。

本发明的药物组合物配制成与其给药途径相容的形式。给药途径的例子包括非肠道的给药，例如静脉内、真皮内、皮下的、口服的(例如吸入)、经皮的(局部的)、经粘膜的，和直肠的给药。用于非肠、真皮内、或皮下应用的溶液或悬浮液可以包括以下组分：无菌的稀释剂，例如注射用水、盐溶液、不挥发油类、聚乙二醇、甘油、丙二醇或其他合成的溶剂；抗细菌剂，例如苯甲醇或对羟基苯甲酸甲酯；抗氧化剂，例如抗坏血酸或二亚硫酸钠；螯合剂，如乙二胺四乙酸(EDTA)；缓冲液，例如乙酸盐、柠檬酸盐或磷酸盐缓冲液和调节渗透压的试剂，例如氯化钠或葡萄糖。pH可用酸或碱调节，例如盐酸或氢氧化钠。非肠道制剂可以密封入安瓿、一次性注射器或由玻璃或塑料制成的多剂量的小瓶中。

适用于可注射用的药物组合物包括无菌的含水溶液(水可溶的情况)或分散液，或者，对临时配制的无菌可注射溶液或分散液的制剂来说，包括无菌的粉末。对于静脉内给药，合适的载体包括生理盐水、抑菌水、Cremophor ELTM(BASF，Parsippany，N.J.)或磷酸盐缓冲液(PBS)。在所有场合，该组合物必须是无菌的，并应是流动的，其流动性应达到易于注射的程度。在生产和储存的条件下，该组合物必须是稳定的，并且必须能抗微生物，如细菌和真菌的污染作用而能保存。该载体可以是溶剂或含有，举例来说，水、乙醇、多元醇(例如，甘油、丙二醇和液体聚乙烯醇等)，及其它合适的混合物的分散介质。适当的流动性可通过以下方法保持：例如，使用包衣，如卵磷酯；在分散体的场合，保持所要求的颗粒大小；以及使用表面活性剂。微生物作用的预防可通过各种抗细菌剂和抗真菌剂而达到，例如对羟基苯甲酸酯、氯丁醇、酚、抗坏血酸、工汞硫代水杨酸钠等。在很多场合，组合物中最好包括等渗剂，例如蔗糖、多元醇，如甘露醇、山梨醇、氮化钠。在组合物中包括延迟吸收的试剂，例如单硬脂酸酯铝和明胶，可达到使注射组合物延长吸收的目的。

无菌的注射溶液的制备方法如下：将活性化合物(例如，EXOX蛋白或抗mGluR5M抗体)按所要求的量掺入适当溶剂中，该溶剂含有以上列举的组分中的一种或其组合，然后，按照要求通过无菌过滤。一般，分散剂的制备方法是，将活性化合物掺入无菌载体中，该载体含有基本的分散介质和选自以上列举组分中的其他必须组分。对于用于制备无菌注射溶液的无菌粉末，优选的制备方法是真空干燥和冷冻干燥，该方法由预先经过无菌过滤的溶液生成含活性组分和其它所需组分的粉末。

从红色毛癣菌或产生EXOX或从红色毛癣菌分离的EXOX的转基因真菌的培养基质中分离得到的粗提物可以用于口服给药，因为蛋白酶是胞外的。口服组合物一般包括惰性稀释剂或可食的载体.口服组合物可以封装在明胶胶囊内，或压成片。用于口服治疗给药时，活性化合物中可掺入赋形剂，并以片剂、锭剂或胶囊的形式使用。口服组合物也可以用流体载体来制备，以便用作嗽口剂，其中在流体载体中的化合物，被经口施用并涮洗和吐出，或吞下。药物相容的粘结剂，和/或佐剂物质也可作为组合物的一部分包括在内。片剂、丸剂、胶囊、锭剂等可以含有下列的任一种组分，或类似性质的化合物：粘结剂，例如微晶纤维素、黄蓍胶或明胶；赋形剂，例如淀粉或乳糖；崩解剂，例如藻朊酸、Primogel或玉米淀粉；润滑剂，例如硬脂酸镁或Sterotes；滑动剂，例如胶体的二氧化硅；甜味剂，例如蔗糖或糖精；或调味剂，例如薄荷、水杨酸甲酯或橙味调料。

用于吸入给药时，组合物可以用气溶胶喷雾的形式由压力容器或分配器，或者喷雾器来递送，压力容器或分配器含有合适的推进剂，例如，二氧化碳气体。

全身的给药也可通过经粘膜或经皮给药的方法。对于经粘膜或经皮给药，在该制剂使用适合于需要透过屏障的渗透剂。这种渗透剂在本领域中通常是熟知的，例如，对于经粘膜给药，包括清洁剂、胆盐，和梭链孢酸衍生物。经粘膜给药也可以通过使用鼻的喷雾剂或栓剂来完成。对于经皮给药，如本领域通常所知，可将活性化合物配制在软膏、油膏、凝胶或霜剂中。

该化合物也可以制成栓剂(例如，用常规的栓剂基，如可可酯和其他甘油酯)或保留灌肠的形式，用于直肠递送。

在一个实施方案中，活性化合物采用能防止该化合物从人体迅速消除的载体来制备，例如控释制剂，包括植入物和微胶囊化传递***.生物可降解的、生物相容的聚合物也可以使用，例如乙酸乙烯酯、聚酐、聚乙醇酸、胶原、聚原酸酯和聚乳酸.制备这种制剂的方法对本领的技术人员来说是显而易见的。上述的材料也可从市场上由Alza公司和Nova制药公司获得。脂质体悬浮液(包括用病毒抗原单克隆抗体导向受感染细胞的脂质体)也可以用作可药用载体。这些载体可以按照本领域技术人员熟知的方法制备，举例来说，如美国专利NO.4,522,811中所述。

尤其有利的是，按剂量单位形式来配制口服或非肠道给药的组合物，以便于给药和有利于剂量的统一。这里所用的剂量单位形式是指以单元剂量适用于治疗受试者的、物理形式上分开的单位；每单位含有预定量的活性化合物，该量计算为能与所需药用载体结合产生所需疗效的量。本发明的剂量单位形式的规格根据以下方面而定，或直接依赖于以下方面：活性化合物的特性和要达到的疗效，以及在合成这种用于治疗个体的活性化合物的技术本身存在的限制。

本发明的核酸分子也可以***载体中并用作基因治疗载体。基因治疗载体可以递送给治疗受试者，例如，通过静脉内注射、局部给药(参见美国专利5,328,470)或通过立体定位注射(参见，例如chen等(1994)PNAS 91：3054-3057)。基因治疗载体的药物制剂可包括可接受的稀释剂中的基因治疗裁体，或可包括包埋了基因递送载体的缓释基质。或者，在完整的基因递送载体可以由重组细胞，例如逆转录病毒载体完整地产生的场合，该药物制剂可以包括一种或多种产生基因递送***的细胞。

上述药物组合物可以连同给药说明一起包含在容器、小盒或喷雾器内。

具体实施方式

实施例1：材料与方法

菌株和质粒

本研究使用的是红色毛癣菌的一个临床分离株CHUV 862-00。用大肠杆菌(E.coli)LE392来繁殖噬菌体λEMBL3(Promega，Wallisellen，Switzerland)。所有的质粒-亚克隆实验使用质粒pMTL2I在大肠杆菌DH5α中进行(Chambers等，Gene 68：139-149(1988))。使用P.pastoris GSI15和表达载体pKJ 113(Borg-Von Zepelin et al，Mol.Microbiol28：543-554(1998))来表达重组肽酶。众所周知，在本领域P.pastoris可以被用来表达大量的重组蛋白。

红色毛癣菌生长培养基

红色毛癣菌在Sabouraud琼脂糖或液体培养基(Bio-Rad，Munchen，Germany)上生长，或为了提高产物的蛋白水解活性，在含有0.2％大豆蛋白(Supro 1711，Protein TechnologyInternational，St.Lauise.MO)作为唯一氮源和碳源的液体培养基中培养。这种培养基中不添加盐。那些本领域的技术人员熟知的盐也可以添加到生长培养基。100ml的液体培养基和少量新鲜生长菌丝一起在800ml组织培养瓶中孵育。培养物在30℃下无须震荡培养10天。

基因组和cDNA文库

从新鲜的生长旺盛的菌丝中分离DNA用于构建红色毛癣菌的基因组DNA文库(Yeltonet al.PNAS 81：1470-1474(1984))。用Sau3A部分消化DNA，从低溶点琼脂糖凝胶中回收12～20kb的DNA片段。使用一个合适的克隆体系(Promega)，将这些DNA片段***到噬菌体XEMBL3中。

使用一种微量mRNA***和500ug总RNA，一个红色毛癣菌的cDNA文库被制备，cDNA被***进pSPORT6质粒中(Invitrogen Life Technologies；Rockville，Maryland，USA)。从大豆蛋白液体培养基的10天培养物(10×100毫升)中制备RNA。用研钵在液氮中将菌丝研磨成细的粉末，用专供植物和真菌的RNeasy总RNA纯化试剂盒(Qiagen，Basel，Switzerland)分离总RNA。

以前已经用CHUVI 92-88菌株构建了一个烟曲霉菌的cDNA文库，该烟曲霉菌菌株在含0.2％胶原蛋白作为唯一氮源和碳源的液体培养基中，在30℃的条件下生长40小时(Monod等，1991)。总RNA依照Applegate和Monod描述的方法提取，依据标准程序(Sambrook等，1989)用oligo(dT)纤维素膜(Sigma，Buchs，Switzerland)纯化获得mRNA。按照制造商提供的程序，用λ噬菌体gtl1(Promega)和这些mRNA制备一个文库。

表13.编码氨肽酶的红色毛癣菌和烟曲霉菌的基因

基因	基因组DNA(bp.从ATG到终止密码子)	cDNA：ORF长度(bp.)自ATG密码子开始	自ATG密码子开始编码的氨基酸残基(aa)	内含子(bp.自ATG密码子开始的基因组DNA)
基因	基因组DNA(bp.从ATG到终止密码子)	cDNA：ORF长度(bp.)自ATG密码子开始	自ATG密码子开始编码的氨基酸残基(aa)	内含子(bp.自ATG密码子开始的基因组DNA)	ruLAP2	1757	1488	495	3个内含子(bp 106-231；556-632；917-982)4个内含子，编码35，108，95，257aa
fuLAP2	1557	1497	498	1个内含子(bp 85-144)2个内含子编码28，470aa	ruLAP2	1757	1488	495	3个内含子(bp 106-231；556-632；917-982)4个内含子，编码35，108，95，257aa
fuLAP2	1557	1497	498	1个内含子(bp 85-144)2个内含子编码28，470aa	ruLAP1	1256	1122	373	2个内含子(bp157-226；968-1031)3个内含子编码52，247，74aa
fuLAP1	1298	1167	388	2个内含子(bp 187-252；1000-1064)3个内含子编码62，249，77aa	ruLAP1	1256	1122	373	2个内含子(bp157-226；968-1031)3个内含子编码52，247，74aa

LAP基因的克隆

基因组文库的重组噬菌斑(10⁴)被转移到GeneScreen尼龙膜上(NEN Life ScienceProducts，Boston，MA)。在低严格条件条件下，用³²P标记的探针对这些膜进行杂交(Monod等，Mol.Microbiol.13：357-368(1994))。采用Grossberger描述的方法，所有的阳性噬菌斑被纯化并提取相应的噬菌体DNA(Grossberger，Nucleic Acid Res.15：6737(1987))。按照标准程序，源自EMBL3噬菌体的杂交筛选到的片段被亚克隆进pMTL 2I中。用Microsynth(Balgach，Switzerland)进行核酸测序。

用标准PCR方法分离cDNA

制备cDNA文库中106个克隆的DNA，用PCR方法获得红色毛癣菌和烟曲霉菌的cDNA。根据源自不同肽酶基因(表13)的DNA序列设计的同源引物，在标准条件下进行PCR。200ngDNA、10ul正义和反义寡核苷酸引物(浓度为42mM)、8ul的脱氧核苷酸混合物(每种dNTP为10mM)，溶于100ul PCR缓冲液中(10mM Tris-HCl pH8.3；50mm KCl；1.5Mm MgCL2)。每个反应体系加入2.5单位AmpliTAQ DNA聚合酶(PE.，Zurich，Switzerland)。PCR反应程序为：反应混合物先在94℃温育5分钟，接着25个循环(94℃0.5分钟，55℃0.5分钟，72℃0.5分钟)，最后72℃保温10分钟。

重组LAPs的制备

通过将克隆cDNA的PCR产物连进E.coli-P.pastoris穿梭载体pKJ 113的多克隆位点，构建表达质粒。用PCR纯化试剂盒(ROCHE Diagnostics)纯化PCR产物，用先前设计的5’-引物(表14)上的限制性内切酶来消化。用10pg经EcoR I或Sma I线性化的质粒DNA电激转化P.pastoris GSI 15(Invitrogen)在组氨酸缺陷型培养基(1M山梨糖，1％(W/V)葡萄糖，1.34％(W/V)不含氨基酸酵母YNB，4×10^-5％(W/V)生物素，5×10^-3％氨基酸(W/V)(例如L-谷氨酸，L-甲硫氨酸，L-亮氨酸，L-异亮氨酸各5×10^-3％)，2％(W/V)琼脂糖)选择转化株，用最小的甲醇平板(1.34％(W/V)不含氨基酸的YNB、4×10^-5％(W/V)生物素、0.5％(V/V)甲醇、2％(W/V)琼脂糖)筛选***到AOX1位点的结构中。转化株不能在含有甲醇作为唯一氮源的培养基上生长，经过在AOX1位点取代AOX1编码区域的整合事件，保证了在正确的酵母基因组位置包含上述结构。这些转化株在10ml甘油酵母培养基(0.1M磷酸钾缓冲液，pH6.0，包括1％(W/V)酵母提取物、2％(W/V)蛋白胨、1.34％(W/V)不含氨基酸的YNB，1％(V/V)甘油和4×1％(W/V)生物素)中，在30℃下，生长至接近饱和(600nm下OD 20)。收集细胞、将其重新悬浮于2ml培养基中，(除了用0.5％(V/V)甲醇取代甘油外，其他都相同)孵育2天。两天后，收集上清液，用SDS-PAGE胶检测蛋白产物。从400ml细胞培养物的上清液中获得大量重组肽酶。

表14.描述了在P.pastoris中表达不同LAP所用的材料

基因	寡核苷酸	方向	编码的氨基酸序列*	PCR产物(含克隆位点)^￥	载体
基因	寡核苷酸	方向	编码的氨基酸序列*	PCR产物(含克隆位点)^￥	载体	ruLAP2	GT TG/T CGA CTT GTT GGT CAA GAG CCC TTC GGA TGG(SEQID NO：47)CT TGC/GGC CGC TTA CAT GAA GAC AGT GTG GTG TCC(SEQID NO：48)	正向反向	(R)(L)VGQEPFGW(SEQ ID NO：63)GHHTVFMStop(SEQ ID NO：64)	ruLAP2(58-1485)SalI---NotI	pKJ113XhoI---NotI
fuLAP2^￥	GT TC/T CGA GGC CCA GGA TGG GAC TGG AAG(SEQ ID NO：49)CGC AAA GG/T GCA CTC GCC CCG CGA(SEQ ID NO：50)TCG CGG GGC GAG/TGC ACC TTT GCG(SEQ ID NO：51)CTT A/GA TCT CTA CTG CTC AAC CCG GTC CTT(SEQ ID NO：52)	正向反向正向反向	(R)GPGWDWK(SEQ ID NO：65)SRGECTFA(SEQ ID NO：66)SRGECTFA(SEQ ID NO：67)KDRVEQStop(SEQ ID NO：68)	fuLAP2a(49-460)XhoI---ApaLlfuLAP2b(461-1494)ApaLl---BglII	pKJ113XhoI---BamHI	ruLAP2		正向反向	(R)(L)VGQEPFGW(SEQ ID NO：63)GHHTVFMStop(SEQ ID NO：64)	ruLAP2(58-1485)SalI---NotI	pKJ113XhoI---NotI
fuLAP2^￥		正向反向正向反向		fuLAP2a(49-460)XhoI---ApaLlfuLAP2b(461-1494)ApaLl---BglII	pKJ113XhoI---BamHI	ruLAP1	GT TC/T CGA GGC ATT CCT GTT GAT GCC CGG GCC G(SEQID NO：53)CTT A/GA TCT TTA CTT AGC AAG CTC AGT GAC GAA GCCGAC(SEQ ID NO：54)	正向反向	(R)(G)IPVDARA(SEQ ID NO：69)VGFVTELAKsToP(SEQ ID NO：70)	ruLAPI(61-1119)XTtoI---BglII	pKJ113XhoI---BamHI
fuLAP1	GT TC/T CGA GGG GCT GTA GCT GCA GTG ATT(SEQ ID NO：55)CTT A/GA TCT TTA AAA CGG CGC AAA TGC CAA(SEQ ID NO：56)	正向反向	(R)GAVAAVI(SEQ ID NO：71)LAFAPFsToP(SEQ ID NO：72)	fuLAPI(46-1164)XhoI---BglII	pKJ113XhoI---BamHI	ruLAP1		正向反向	(R)(G)IPVDARA(SEQ ID NO：69)VGFVTELAKsToP(SEQ ID NO：70)	ruLAPI(61-1119)XTtoI---BglII	pKJ113XhoI---BamHI
fuLAP1		正向反向	(R)GAVAAVI(SEQ ID NO：71)LAFAPFsToP(SEQ ID NO：72)	fuLAPI(46-1164)XhoI---BglII	pKJ113XhoI---BamHI	RuDPPIV^§	CT TC/T CGA GTC GTT CCT CCT CGT GAG CCC CG(SEQ IDNO：57)G TTC CAT GGT/CAT GAC CTT TGT GTC ATA CGA GAC AG(SEQ ID NO：58)GT TCC ATG GT/C ATG ACC CCT CTC GTC AAC GAT AAG G(SEQ ID NO：59)CTT G/GA TCC TCA TTC CTC TGC CCT CTC ACC(SEQ IDNO：60)	正向反向正向反向	(R)(V)VPPREPR(SEQ ID NO：73)VSYDTKVM(SEQ ID NO：74)VMTPLVNDK(SEQ ID NO：75)GERAEEstop(SEQ ID NO：76)	ruDPPIVa(49-1266)XhoI---RcaIruDPPIZb(1267-2325)RcaI---BamHI	PKJ111XhoI---BamHI
ruDPPV	CCG G/AA TTC TTT ACC CCA GAG GAC TTC(SEQ ID NO：61)GAG T/CT AGA CTA GTA GTC GAA GTA AGA GTG(SEQ ID NO：62)	正向反向	(E)(F)FTPEDF(SEQ ID NO：77)HSYFDYStop(SEQ ID NO：78)	ruDPPV(58-2178)EcoRI---XbaI	pPICZaAEcoRI---XbaI	RuDPPIV^§		正向反向正向反向		ruDPPIVa(49-1266)XhoI---RcaIruDPPIZb(1267-2325)RcaI---BamHI	PKJ111XhoI---BamHI

****语表示限制位点序列编码的氨基酸，并被重组酶加上了N末端点。

^￥***语的数字表示在LAP和DPPcDNAs中存在的核苷酸位置。

^§fuLAP2和ruDPPIV PCR片段与E.coli-P.pastoris穿梭载体首尾相连。

重组LAP的纯化

使用Amicon cell和Ultracel Amicon YM30膜(30kDa为分离点)(Millipore，Volketswil，Switzerland)用超滤的方法浓缩400ml P.pastoris培养物上清液中的分泌蛋白。先用50mM pH7.5的Tris-HCl洗浓缩物，用相同的缓冲液平衡Mono Q-Sepharose柱(Amersham Pharmacia，Switzerland)。用50mM pH7.5的Tris-HCl洗脱后，用0-0.5M线性梯度的NaCl以1ml/min的流速洗脱。从Mono Q-Sepharose柱洗下的不同组分被用于酶活性筛选。用亮氨酸-7-氨基-4-甲基香豆素(Leu-AMC)作为底物。含有LAP的组分被汇聚在一起。用含有Ultracel Amincon YM30膜的超滤Amicon cell浓缩后，用20ml pH6.0的Tris-HCl洗脱，LAP提取物上样到排阻的superose 6 FPLP(Amersham Pharmacia)，用20ml Tris-HCl pH6.0的作为洗脱液以0.2ml/min的流速淋洗。收集洗脱下来的活性组分。在做进一步的功能确认之前，在4℃条件下，用30kDa的分离点(Millipore)的Centricon浓缩器浓缩LAP酶至终体积0.4-1.0ml。

在一个替代的纯化方案中，每一步纯化都在4℃下操作。将400ml P.pastoris培养物上清液中的分泌蛋白用Amicon cell和Ultracel Amicon YM30膜(30kDa的分离点)(Millipore，Volketswil，Switzerland)超滤的方法浓缩。用100ml 20mM pH6.0的醋酸钾洗浓缩物，用相同的缓冲液平衡Mono Q-Sepharose柱(Amersham Pharmacia，Switzerland)。用20mM pH6.0的Tris-HCl缓冲液洗脱柱子后，用0-0.2M线性梯度的NaCl以1ml/min流速，以超过142分钟时间洗脱酶。从Mono Q-Sepharose柱上洗脱下的不同组分用Leu-AMC作为底物来筛选酶活性，含有LAP的组分被汇集在了一起。在带有ultracelAmicon YM30膜的Amicon cell超滤浓缩后，用PBS缓冲液洗脱。LAP提取物被上样到一个排除大小的superdex 200 FPLC柱(Amersham Pharmacia)。用20mM pH6.0的醋酸钠缓冲液以0.2ml/min的流速洗脱。洗脱得到的有活性的片段被收集到一起。在4℃下在30kDa分离点的Centricon浓缩器中将LAP浓缩至0.4-1.0ml以供进一步的特征分析。

在Mono Q中含有ruLAP2活性的组分洗脱在30-40分钟(大约50mM NaCl)，在Superdox200中是在65-70分钟(峰3)。然而，在用1M NaCl洗脱时，大量LAP2活性没有保留下来。因此，这个组分在用20mM醋酸钠脱盐后样品被加到相同的MonoQ柱，用更宽的浓度范围(0-1M)的NaCl以0.5/min的速度洗脱超过142分钟。第一个活性峰出现在洗脱7-15分钟时和70-140nM NaCl对应，第二个峰出现在150-250mM NaCl洗脱时(具有更强的酶活性)。在Superdex上，洗脱78-80分钟70-140mM NcCl的组分和它上面提到的峰一起被收集。在Superdex上，150-250mM NaCl的组分提供了两个有活性的洗脱组分，分别在44-49分钟(峰1)和50-63分钟(峰2)。

蛋白质提取分析

使用12％聚丙烯酰胺分离胶，采用SDS-PAGE方法分析蛋白质提取物。用考马斯亮蓝R-250(Bio-Rad)对胶进行染色。N-糖苷酶F的消化按先前描述的方法进行(Doumas et al.，Appl.Environ.Microbiol.64：4809-4815(1998)

Western杂交

膜先用红-丽春红染色，用针标记出主要蛋白带的位置。用兔抗血清和碱性磷酸酶耦联的山羊抗-兔IgG(Bio-Rad)或结合有过氧化物酶的山羊抗-兔IgG(Amersham Pharmacia，Switzerland)作为二次标记抗体。针对ruLAP1、ruLAP2、fungalysin家族的A.Oryzae分泌的碱性磷酸酶(ALP)和A.oryzae分泌的中性蛋白酶(NPI)的兔抗血清由Eurogentec(Liege，Belgium)用纯化的重组酶制造。

氨肽酶活性检测

用不同多肽的aminoacl-4-methylcoumaryl-7-amide荧光衍生物来确定氨肽酶活性，在内部淬灭Lys(Abz)-pro-pro-Pna荧光底物特异性确定氨肽酶P的活性(Stockel et al，Adv Exp.Med.Biol.421：31-35(1997)。所有的底物都购自Bachem(Bubendorf，Switzerland)。根据制造商的建议，底物被制备为0.1M贮存液，在-20℃保存。反应混合物包括：在25ul 50mH缓冲液中包含浓度为5mM的底物和酶制备物(根据每种酶对底物的水解活性，每次检测的用量在56-2662ng)，调节pH值到每种LAP的最适值。37℃温育60分钟后，加入5ul冰醋酸中止反应，用3.5ml稀释反应混合物。用荧光光度计(Spectrofluorophotometer)(PE，LS-5 fluorometer)检测释放的AMC，激发光波长370nm，发射波长460nm。根据用合成的AMC作的标准曲线被用来估计释放的AMC的量。在310nm激发光和410nm发射光下，测定释放的diprolyl-p-nitrinanilide。LA活性以释放的AMC的nmol数或pNA/分钟/ug蛋白来表示。

表15

底物	ruLAP2	fuLAP2	ruLAP1	fuLAP1	pkLAP
底物	ruLAP2	fuLAP2	ruLAP1	fuLAP1	pkLAP	Leu-AMC	100.0	100.0	100.0	100.0	100.0
IlE-AMC	6.4	1.8	7.4	13.2	6.3	Leu-AMC	100.0	100.0	100.0	100.0	100.0
IlE-AMC	6.4	1.8	7.4	13.2	6.3	Val-AMC	4.8	0.8	4.9	27.6	4.0
Ala-AMC	33.3	11.7	5.2	4.7	584.7	Val-AMC	4.8	0.8	4.9	27.6	4.0
Ala-AMC	33.3	11.7	5.2	4.7	584.7	Gly-AMC	3.3	2.2	5.1	0.8	74.8
Ser-AMC	26.1	10.3	5.9	10.3	24.6	Gly-AMC	3.3	2.2	5.1	0.8	74.8
Ser-AMC	26.1	10.3	5.9	10.3	24.6	Thr-AMC	0.9	0.1	1.7	5.1	4.4
Cys-AMC	14.9	2.1	18.5	5.0	35.5	Thr-AMC	0.9	0.1	1.7	5.1	4.4
Cys-AMC	14.9	2.1	18.5	5.0	35.5	Met-AMC	119.7	89.5	41.3	116.9	46.1
Asn-AMC	114.6	73.5	6.8	29.4	33.9	Met-AMC	119.7	89.5	41.3	116.9	46.1
Asn-AMC	114.6	73.5	6.8	29.4	33.9	Gln-AMC	49.9	37.0	2.3	44.9	50.7
Asp-AMC	3.8	0.3	0.0	0.8	0.9	Gln-AMC	49.9	37.0	2.3	44.9	50.7
Asp-AMC	3.8	0.3	0.0	0.8	0.9	Glu-AMC	3.7	1.1	0.0	0.0	4.7
Lys-AMC	4.6	2.3	9.1	7.7	70.1	Glu-AMC	3.7	1.1	0.0	0.0	4.7
Lys-AMC	4.6	2.3	9.1	7.7	70.1	Arg-AMC	1.9	2.3	12.3	53.9	174.8
His-AMC	0.6	1.9	0.1	0.8	17.6	Arg-AMC	1.9	2.3	12.3	53.9	174.8
His-AMC	0.6	1.9	0.1	0.8	17.6	Phe-AMC	17.1	8.9	4.6	163.7	184.4
Pro-AMC	21.4	7.4	1.4	12.0	7.9	Phe-AMC	17.1	8.9	4.6	163.7	184.4
Pro-AMC	21.4	7.4	1.4	12.0	7.9	Hyp-AMC	14.2	13.3	0.3	3.9	1.7
Gly-Pro-AMC	7.2	74.1	0.0	5.4	16.7	Hyp-AMC	14.2	13.3	0.3	3.9	1.7
Gly-Pro-AMC	7.2	74.1	0.0	5.4	16.7	Pyr-AMC	0.0	0.0	0.0	0.0	0.0
Lys(Abz)Pro-PropNA	0.0	0.0	0.0	0.0	0.0	Pyr-AMC	0.0	0.0	0.0	0.0	0.0

各种化学试剂对LAP的影响

抑制剂和金属阳离子在37℃下和酶提前温育15分钟，然后，加入终浓度为5mM的Leu-AMC。再温育60分钟后，依前面描述的方法测定酶活性。试验纯化的LAP的抑制剂和它们的浓度分别是：500ul amastatin(Bachem)、40um苯甲脒(Sigma)、500ul bestatin(Bachem)、100um E-64(L-trans-epoxysuccinyl-leu-4-guanidinobutylamide)(Bachem)、100um leupeptin(Sigma)、40um PMSF(Sigma)、20um TLCK(RocheDiagnostics)和20um TPCK(Roche Diagnostics)。0.5mM和1mM的CaCl₂、MgCl₂、CoCl₂、ZnCl₂、NiCl₂和CuCl₂被用于试验。

表16详细的描述了不同蛋白酶抑制剂存在下不同的EXOXs水解活性，以Leu-MCA作为LAP的底物。活性以其与没有抑制剂时的活性百分比来表示。

表16

抑制剂	ruLAP2	fuLAP2	ruLAP1	fuLAP1	pkLAP
抑制剂	ruLAP2	fuLAP2	ruLAP1	fuLAP1	pkLAP	乙二胺四乙酸5mM	5	50	0	16	99
乙二胺四乙酸1mM	7	77	7	19	68	乙二胺四乙酸5mM	5	50	0	16	99
乙二胺四乙酸1mM	7	77	7	19	68	邻二氮杂菲5mM	0	0	0	0	0
邻二氮杂菲1mM	0	0	0	0	0	邻二氮杂菲5mM	0	0	0	0	0
邻二氮杂菲1mM	0	0	0	0	0	抑氨肽酶B500Pu	55	88	0	11	24
抑氨肽酶肽500M	0	0	0	17	0	抑氨肽酶B500Pu	55	88	0	11	24
抑氨肽酶肽500M	0	0	0	17	0	对氯汞苯甲酸500M	21	96	32	90	59
E64 100uM	34	71	103	190	93	对氯汞苯甲酸500M	21	96	32	90	59
E64 100uM	34	71	103	190	93	亮抑酶肽100M	113	61	233	149	86
胃酶抑素100M	45	73	160	14	64	亮抑酶肽100M	113	61	233	149	86
胃酶抑素100M	45	73	160	14	64	苯甲基磺酰40uM	79	84	78	156	58
苯甲脒40M	89	91	85	77	75	苯甲基磺酰40uM	79	84	78	156	58
苯甲脒40M	89	91	85	77	75	甲苯磺酰-左旋赖氨酸-氯甲基酮盐酸盐20M	96	120	68	80	113
甲苯磺酰苯丙氨酰氯甲酮20M	79	87	68	95	108	甲苯磺酰-左旋赖氨酸-氯甲基酮盐酸盐20M	96	120	68	80	113

表17详细的描述了不同阳离子存在下不同的EXOXs水解活性，以Leu-MCA作为LAP的底物。活性以其与没有抑制剂时的活性百分比来表示。

表17

	ruLAP2	fuLAP2	ruLAP1	fuLAP1	pkLAP
	ruLAP2	fuLAP2	ruLAP1	fuLAP1	pkLAP	CaCl₂ 0.5mM	126.6	110.0	151.7	54.9	177.4
CaCl₂ 1mM	141.9	165.4	175.6	43.3	161.8	CaCl₂ 0.5mM	126.6	110.0	151.7	54.9	177.4
CaCl₂ 1mM	141.9	165.4	175.6	43.3	161.8	MgCl₂ 0.5mM	121.2	97.6	129.9	68.5	130.1
MgCl₂ 1mM	110.2	108.0	132.6	72.6	146.1	MgCl₂ 0.5mM	121.2	97.6	129.9	68.5	130.1
MgCl₂ 1mM	110.2	108.0	132.6	72.6	146.1	MnCl₂ 0.5mM	77.5	84.3	120.7	25.9	157.6
MnCl₂ 1mM	86.8	140.2	105.2	28.4	165.8	MnCl₂ 0.5mM	77.5	84.3	120.7	25.9	157.6
MnCl₂ 1mM	86.8	140.2	105.2	28.4	165.8	CoCl₂ 0.5mM	591.2	378.0	210.2	104.3	876.1
CoCl₂ 1mM	789.7	662.7	202.1	96.5	899.8	CoCl₂ 0.5mM	591.2	378.0	210.2	104.3	876.1
CoCl₂ 1mM	789.7	662.7	202.1	96.5	899.8	ZnCl₂ 0.5mM	77.9	51.4	43.0	60.7	437.6
ZnCl₂ 1mM	88.9	119.5	68.9	53.2	297.9	ZnCl₂ 0.5mM	77.9	51.4	43.0	60.7	437.6
ZnCl₂ 1mM	88.9	119.5	68.9	53.2	297.9	NiCl₂ 0.5mM	130.5	98.4	74.8	51.7	1187.7
NiCl₂ 1mM	147.9	149.3	58.1	37.2	1158.7	NiCl₂ 0.5mM	130.5	98.4	74.8	51.7	1187.7
NiCl₂ 1mM	147.9	149.3	58.1	37.2	1158.7	CuCl₂ 0.5mM	50.9	68.9	40.1	25.8	1422.0
CuCl₂ 1mM	34.7	73.6	13.7	17.0	1092.4	CuCl₂ 0.5mM	50.9	68.9	40.1	25.8	1422.0

EXOX活性的最适pH值

采用Ellis和Morrison缓冲***来确定酶活性的最适pH值(Ellis & Morrison，Methods Enzymol.87：405-426(1982))。缓冲液中含有具有不同pKa值的三种成分，在试验的整个pH值范围内，缓冲液的离子强度保持恒定。缓冲液的pH值可以用1M HCl或1M NaOH以半个pH值单位在6到11的范围内进行调节。基于Leu-AMC底物的活性检测条件，除了Tris/HCl缓冲液被一定pH值的Ellis和Morrison缓冲液取代以外，其他条件和前面描述的一样。

表18.祥述了内源和重组的红色毛癣菌和烟曲霉菌氨肽酶的特征

表18

基因	基因长度(nt)	内含子数	蛋白前体(aa)	信号(aa)	成熟结构域(aa)	成熟酶多肽链的分子量(kDa)	内源/重组酶的分子量(kDa)	去糖基化后重组酶的分子量(kDa)	可能的糖基化位点的数目	经计算的pI值	重组蛋白的产率(ug/ml)^*	GenBank序列号
基因	基因长度(nt)	内含子数	蛋白前体(aa)	信号(aa)	成熟结构域(aa)	成熟酶多肽链的分子量(kDa)	内源/重组酶的分子量(kDa)	去糖基化后重组酶的分子量(kDa)	可能的糖基化位点的数目	经计算的pI值	重组蛋白的产率(ug/ml)^*	GenBank序列号	ruLAP1fuLAPlruLAP2fuLAP2ruDPPIV	12561298175715572326	22310	373388495498775	1917181515	354371477383760	38,80441,46551,48752,27086,610	31-33/38-40§NI/4058/58-65§NI/75-10090/90	38-4040525284	33464	6.39(6.23)5.67(5.67)7.32(6.94)5.57(5.46)(8.05)	40804010010	AY496930AY436356AY496929AY436357AY497021

§NI：表示未决定

^*括号中数字对应不含前序列的全长多肽

EXOX活性的最适温度

每份LAP和Leu-AMC(5mM)在20、30、40、50、60、70和80℃的条件下分别孵育10、30和60分钟，通过测试酶活性和它们最适的pH来确定最适的温度条件。

蛋白水解检验

使用resorufin标记的酪蛋白在磷酸缓冲液(20mM，pH7.4)中测定蛋白水解活性。反应混合物总体积约0.5ml，其中包含0.002％的底物。37℃温育后，加入三氯乙酸(终浓度为4％)沉淀未被消化的底物，通过离心分离上清液。加入500ul Tris缓冲液(500mM，pH9.4)碱化后，测定上清夜在574nm下的吸光度。为了实用方便，一个蛋白水解活性单位(U)被定义为每分钟产生0.001吸光度值的酶量。

实施例2：红色毛癣菌分泌蛋白的水解酶活性

在含有0.2％大豆蛋白作为唯一氮源和碳源的培养基上在30℃的条件下培养红色毛癣菌。生长14天后，记录到培养基伴随有澄清现象，用resorufin标记的酪蛋白作为底物检测真实的蛋白水解酶活性(400U/ml)。其蛋白水解活性分别被PMSF和邻-二氮杂菲抑制15％和85％，证明红色毛癣菌分泌丝氨酸和金属蛋白酶。对培养物上清夜的Western杂交分析揭示红色毛癣菌和犬小孢子菌相像，分泌枯草杆菌蛋白酶(subtilisin)家族(MEROPS＞S8)和fungalysin家族(MEROPS＞M36)的内源蛋白酶，类似于A.oryzae分泌的碱性磷酸酶ALP和中性的金属蛋白酶NPI(参见图1)。另外，在红色毛癣菌培养物的上清夜中检测到对象Leu-AMC和Leu-pNA这样底物的高活性。

实施例3：红色毛癣菌分泌物的氨肽酶活性

犬小孢子菌内蛋白酶基因的核苷酸序列和同源基因的相似性为50-70％。这些基因编码A.oryzae和A.fumigtus分泌的枯草杆菌蛋白酶和fungalysin。另外，犬小孢子菌和Aspergillis的基因具有内含子-外显子结构的线性对应关系。因此，来自A.oryzae和酵母编码氨肽酶，基因的DNA序列被用来设计探针，用于筛选红色毛癣菌的基因组DNA文库。使用重组蛋白，通过与机会致病菌烟曲霉菌分泌的蛋白进行比较。确定红色毛癣菌分泌的氨肽酶的特性。

实施例4：克隆编码红色毛癣菌和烟曲霉菌氨肽酶的基因

表19A和19B详述了各种LAP的两两比较结果

表19A

M28E酶	％相似性或一致性^a
	％相似性或一致性^a				ruLAP1	fuLAP1	或LAP1	Vibrio LAP
	ruLAP1		72	72	ruLAP1	fuLAP1	或LAP1	Vibrio LAP	41
fuLAP1	ruLAP1		72	72	50		70	39	41
fuLAP1	或LAP1	48	49		50		70	39	42
Vibrio LAP	或LAP1	48	49		22	21	23		42

表19B

M28E酶	％相似性或一致性^a
	％相似性或一致性^a			ruLAP2	fuLAP2	或LAP2	S.cer.aaY
	ruLAP2	69	71	ruLAP2	fuLAP2	或LAP2	S.cer.aaY	53
fuLAP2	ruLAP2	69	71	51		85	52	53

或LAP2	49	72		53
或LAP2	49	72		53	S.cer.aaY	32	33	34

^a相似性百分比(上边右手处)和一致性百分比(下边左手处)的比值可以通过Gapimplemented in the GCG package of the Genetics Computer Group，University ofWisconsin，Madison程序获得。

图14是M28E亚家族氨肽酶推导氨基酸序列的对比结果。用下划线表示推定的信号序列加工位点。实心三角形显示为ruLAP1推定的KR加工位点。Open箭头显示的是S.griseus的氨肽酶以及在其他LAP中的保守的两个Zn⁺⁺结合位点。使用威斯康星大学GCG软件包中的经Boxshade 3.2改良的对比。AbispLAP1是指Agaricus bisporus的LAP。

图15是M28A亚家族氧基肽酶推导氨基酸序列的对比结果。下划线表示推定的信号序列加工位点。用空心三角表示。两个氨基酸残基，His和Asp，在真菌的LAP中保守，在S.griseus氨肽酶中结合第一个Zn⁺⁺。实心菱形表示结合第二个Zn⁺⁺离子的另外两个残基--His和Glu，空心箭头表示连接两个Zn⁺⁺离子的ASP残基。*代表仅在ruLAP中发现的甲硫氨酸残基。

氨基酸序列GPGINDDGSG(SEQ ID NO：36)和DM(Q/M)ASPN(SEQ ID NO：37)被发现存在于A.oryzae分泌的52kDa氨肽酶(美国专利：6127161)和酵母氨肽酶中。(Nishizawa，et.al.1994)来自这些数据，两段大致上一致的寡核苷酸(GGXATXAAYGAYGAYGGXTCXGG，SEQ ID NO：38)和(TTXGGXGAXGCXATCATRTC，SEQ ID NO：39)被分别用来作为正义和反义引物来扩增红色毛癣菌的DNA。获得一段220bp的PCR片断被用来作为探针筛选λ噬菌体EMBL 3基因组DNA文库，找到一条编码可能的氨肽酶(ruLAP2)的核苷酸序列。从烟曲霉菌基因组序列中找到一条编码相似分泌型氨肽酶(fuLAP2)的核苷酸序列(参见网站www.TIGR.com)。

使用寡核苷酸GCATTCCTGUGATGCCCGGGCCG(正义)(SEQ ID NO：40)和TTACTTAGCAAGCTCAGTGACGAAGCCGAC(反义)(SEQ ID NO：41)，通过PCR扩增A.oryzae基因组DNA，得到一段1200bp的片段，该片段包含编码A.oryzae 31kDa氨肽酶(美国专利5994113)基因的核苷酸序列。这个片段被用作探针二次筛选红色毛癣菌基因组DNA文库。在红色毛癣菌基因组文库的λ噬菌体EMBL3DNA中，发现了一段核苷酸序列(EMBL)，它和那些编码A.oryzae30kDa氨肽酶和来自烟曲霉菌基因组序列的其他分泌型氨肽酶(网站：www.TIGR.com)相似。这些红色毛癣菌和烟曲霉菌推定的氨肽酶被分别称为ruLAP1和fuLAP1。

鉴定的ruLAP1、ruLAP2、fuLAP1和fuLAP2每个都包含一个17～20氨基酸的信号序列。用5’-正向和3’-反向引物PCR扩增基因组DNA(参见表14)和包含10⁸个克隆的红色毛癣菌或烟曲霉菌cDNA文库的总DNA，对PCR产物进行测序，确定红色毛癣菌和烟曲霉菌基因的内含子-外显子结构。RuLAP2的3个内含子的第一个在位置上和fuLAP2唯一的内含子在位置上相似(参见表13)。基因ruLAP1和fuLAP1具有两个内含子和三个外显子，有相似的共线性结构。

实施例5：重组红色毛癣菌和烟曲霉菌氨肽酶的产生

由RT-PCR获得的红色毛癣菌和烟曲霉菌的cDNA被克隆进pKJ 113，在P.pastoris中表达。取决于肽酶的产量，在Leu-AMC上得到大约10-80ug/ml有活性的酶(参见表18)。在相同的培养条件下，野生型的P.pastoris不向培养基中分泌任何有亮氨酸氨肽酶活性的物质。SDS-PAGE分析P.pastoris转化株分泌的重组ruLAP2、fuLAP1和fuLAP2呈现弥散的带(图2)。N-糖苷酶处理后，在胶上只有快迁移率的主带出现，说明和ruLAP1相反，这三个LAP是糖蛋白(图2)去糖基化的重组LAP的表现分子量和根据编码蛋白酶基因的核苷酸序列推导出的多肽链计算出的分子量接近。表18提供了每个重组酶推导出的初级结构(氨基酸序列)。

实施例6：检测红色毛癣菌培养物上清液中的ruLAP1和ruLAP2

使用抗ruLAP1的抗血清，在红色毛癣菌培养物上清液中检测到LAP1产物的电泳迁移率高于重组ruLAP1的。

使用抗ruLAP2抗血清，对红色毛癣菌培养物上清液的Western杂交分析结果显示红色毛癣菌分泌的糖基化的LAP2和来自P.pastoris(的重组酶有相同的电泳迁移率。

实施例7：重组LAP的特性

氨肽酶ruLAP1、ruLAP2、fuLAP1以及猪肾微粒体氨肽酶(pkLAP)都能有效地水解Leu-AMC。这种底物被用来确定活性最适的温度和pH值，通过测定(i)各种已知的肽酶抑制剂(参见表16)和(ii)不同的二价离子(参见表17)对酶活性的影响来进一步了解它们的特性。每种LAP在20℃时都有水解Leu-AMC的能力，最适的温度范围从40℃～50℃。最适的pH在7.0到8.5之间(参见表18)。80℃预处理10分钟可使酶不可逆地完全失活。

供试的氨肽酶能被浓度500uM的amastatin(参见表16)强烈或完全抑制。RuLAP1、fuLAP1和pkLAP也被bestatin抑制，但这种抑制剂仅对ruLAP2和fuLAP2有部分抑制效应。在螯合剂试验中，邻二氮杂菲在浓度为1mM和5mM时完全抑制这5种酶。fuLAP1、ruLAP2和ruLAP1比其他LAP对EDTA更敏感。E64和Chloromercuribenzoate(半胱氨酸蛋白酶抑制剂)使ruLAP2的活性减弱。暗示在这种酶的氨基酸序列上存在对于活性关键的巯基残基。对于供试的所有LAP，Leupeptin(丝氨酸/半胱氨酸蛋白酶抑制剂)、PMSF(丝氨酸蛋白酶抑制剂)、苯甲脒、TLCK和TPCK没有明显的抑制效果。令人吃惊的是，fuLAP1和ruLAP1对0.1mM pepstatin(天冬氨酸蛋白酶抑制剂)表现有一些灵敏性。

除了fuLAP1表现对二价离子的一般性敏感，当浓度达到1mM时，Co⁺⁺可以使LAP活性增加200％到900％，四种真菌的LAP对二价阳离子表现不同的灵敏性。例如fuLAP2被Mn⁺⁺和Ca⁺⁺激活，而fuLAP1被相同的离子抑制。不同M28家族的4种真菌LAP1，微粒体的pkLAP被Zn、Ni和Cu⁺⁺高度活化。

用Leu-AMC作为参照，对这些酶对于不同的aminoacyl-AMC的水解活性进行了比较(参见表15)。根据供试的氨肽酶，检测不同氨酰残基的不同参数选择。例如，氨肽酶pkLAP和四种真菌的LAP不同之处在于它对Ala-AMC和Arg-AMC有特别高的效率。RuLAP1明显对Leu-AMC有最强的选择性。然而，观察到和ruLAP2、fuLAP1和fuLAP2有关的其他一些优先的水解活性。例如，ser-和pro-AMC被ruLAP2更有效水解，而fuLAP1喜爱Asp-和Glu-AMC。因为它们不能切开Lys(Abz)-pro-pro-pNA，这些酶都不表现氨肽酶P的活性。

实施例8：ruLAP2和ruDPPIV在消化醇溶蛋白多肽中的应用

Celiac病(CD)是一种消化疾病，它能破坏小肠，干扰从食物中吸收营养。患有celiac病的人无法忍受一种叫做麸质(gluten)的蛋白质，这种蛋白质存在于小麦、黑麦和大麦中。当患CD的病人摄入含有麸质的食物时，他们的免疫***产生反应，对小肠造成破坏。在大部分世界人群中，这种疾病的发病率大约是1/200，治疗CD的唯一方法是终生都绝不食用含有麸质的膳食。对于大部分患者而言，遵循这样的饮食将会使症状消失，已有的肠破坏得到恢复，并且防止进一步恶化。

小麦麸质的主要毒性成分是一种叫做醇溶蛋白(gliadin)的富含脯氨酸和Gln的蛋白家族，它们在消化道中不被降解并且饱含许多T-细胞刺激抗原决定部位。因为不同的体外***已被用来进行这些研究，关于有效诱导HLA-DQ2阳性gut-来源和外周T细胞和免疫活性的抗原决定部位仍然存在一些争议(Vader et al.，Gastroenterology122：1729-1737(2002))。在一种CD器官培养模板中，醇溶蛋白产生毒性的能力和刺激T-细胞并不一致，反之亦然。(McAdam & Sollid，Gut 47：743-745(2000))。而且，许多麸质抗原决定部位同HLA-DQ2和HLA-DQ8结合，但这并不是所有的被脱酰胺作用增强。通过小肠组织转谷氨酰酶的作用，某些谷氨酰残基转化为谷氨酸。因为它们有可能的刺激T-细胞的能力。Molberg et al.，Nat.Med.4：713-717(1998)。但是，对于T-细胞激活，脱酰胺作用并不是绝对必要的。(Arentz-Hansen et al.，Gastroenterology123：803-809(2002))。

其他治疗或预防CD的措施，最好的方式找到一种替代的“不含麸质”食品，在过去几年里已提出建议，包括用化合物抑制T-细胞激活来阻止多肽和HLA-DQ2的结合，抑制组织转谷氨酰酶来阻止麸质脱酰胺(Sollid，Nat.Rev.Immunol.2：647-655(2002))和口腔肽酶的补充。后面的方法被认为对于免疫抑制多肽消化有根本性的作用，具体是含有细菌脯氨酰胞内肽酶，该酶对于含有脯氨酸的多肽有很宽范围的耐受性(Shan等，Science297：2275-2279(2002)；Hausch et al.，Am.J.Physiol.Gastrointest Liver Physiol.283：G996-G1003(2002))。相对大片段的醇溶蛋白能抵抗消化酶的降解，而且，这种肽是来自被麸质刺激的CD病人肠组织不同的HLA-DQ2-限制性T-细胞克隆的潜在的刺激物。每个这样的T-细胞克隆识别不同的33mer抗原决定部位。脯氨酰胞内肽酶，偏爱Pro-Xaa-Pro结构域，能够切开33mer的醇溶蛋白肽，和刷状缘的氨肽酶的协调效应，迅速减少这些肽的T-细胞刺激潜力。

尽管在大麦和黑麦有稳定的同源物，这些已经描述的抵抗消化道降解的gluten肽结构域在我们的案例中作为不同LAP的模式底物，单独或同ruDPPIV联合一起消化：对应于α/β醇溶蛋白AIV(P04724)82-95片段PQPQLPYPQPQLPY(SEQ ID NO：42)(14mer)或对应于醇溶蛋白MM1(P18573)57-89片段的LQLQPFPQPQLPYPQPQLPYPQPQLPYPQPQPF(SEQ IDNO：43)(33mer)。

33mer的N-端乙酰化的形式(Ac-33mer)也被合成作为酶切试验的对照。通过一种杂质酶用外肽酶去干扰内肽酶的酶切。

被用于评估的酶有：ruLAP1(Trichophyton rubrum的氨肽酶I)、ruLAP2(Trichophytonrubrum的氨肽酶II)、或LAP2(Aspergillus orizae的氨肽酶II)、fuLAP2(Aspergillusfumigatus的氨肽酶II)、MicpkLAP(来自猪肾的微粒体亮氨酸氨肽酶，Sigma)、CytpkLAP(来自猪肾的胞质亮氨酸氨肽酶，Sigma)和ruDPPIV。

多肽的合成：

采用固相合成的方法。在Applied Biosystems的custom-modified 430A型态合成仪上进行，用原位neutralization/2-(1H-benzotriazol-1-yl)-1，1，1，3，3tetramethyluronium hexa fluoro-phosphate(HBTU)activation试剂盒，在standard-O-CHz-phenylacetamidomethyl resin逐步的进行Boc化学链延长(Schnlzer等，Int.J.Peptide Protein Res.40：180-193(1992))。

在合成结束时，用无水HF在0℃处理1小时，用5％对-甲酚作为净化剂，肽被去保护并被从树脂上切下。切下后，用冰冻的***沉淀合成的肽，溶解在乙腈水溶液中，冻干。用RP-HPLC的方法纯化肽，使用来自Waters的C18柱，线性梯度的缓冲B(99％乙腈/10％H₂O/0.1％三氟乙酸)，在缓冲液A(H₂O/0.1％三氟乙酸)，214nm下紫外检测。使用PlatformII设备(Micromass，Manchester，England)用electrospray质谱对样品进行分析。

降解反应的条件：

温育在37℃，PH7.2的50mM Tris-HCl中进行，1mM CoCl₂，底物浓度1mg/ml，E/S比例为1∶20。用乙酸酸化中止反应，在C8z柱上用RP-HPLC进行中点分析，在0.1％TFA中用2％/分钟乙腈梯度。所有的峰由ESI-MS确认。

14mer的消化：

如图6所示，在4小时内14mer没有被ruLAP2消化。和对照相比，HPLC谱没有变化。实际上，消化仅仅切除了N-末端的脯氨酸。另一方面，补充ruDPPIV导致完全降解成氨基酸和二肽，ruDPPIV自身不能水解肽。(图7)

33mer的消化：

单独用ruLAP2消化33mer导致在4小时内肽的部分降解(少于50％)。这个肽不是ruDPPIV的底物(图8)。然而，当两种酶被混合在一起，33mer被完全消化(图9)成氨基酸和二肽，其中的一些能够被ESI-MS鉴定(Y、L、F、P、PY和PF)。

当ruDPPIV和ruLAP2或fuLAP2混合时，得到相同的HPLC波形。然而，和ruLAP1混和时，一些高分子量的成分仍然存在，少于10％是初始的底物。

另一方面，和猪肾微粒体氨肽酶一起温育导致仅仅部分N-末端Leu和C-末端phe被部分除去(由于Carboxypeptidasic污染)，添加DPPIV并不改变HPLC图谱。胞质的猪肾氨肽酶对33mer完全没有活性。

在LAP或DPPIV单独的或混合在一起的消化实验中，Ac-醇溶蛋白33mer的稳定性进一步证实自由的氨基基团是醇溶蛋白33mer被这些外肽酶完全降解所必须的。

用其他酶消化：

用链霉蛋白酶(E/S＝1/25)消化超过20小时仅部分(少于40％)水解，加入ruLAP2(两种酶都以E/S＝1/50的比率)没有提高水解性。另一方面，在相同条件下加入DPPIV导致肽的完全降解，因为氨肽酶和二肽肽酶的协同作用。Chtmotrypsin单独或和ruLAP或DPPIV混和不能降解肽。

实施例9：ruLAP2在表达融合其他蛋白的重组蛋白的过程中或添加N-末端标签中的应用

LAP2被鉴定酶切proNPY N末端的Gly-Ser以及同一个肽的N-末端另外一个Ala。为了增加LAP2单独或/和其他外肽酶结合时在加工较大重组蛋白过程中应用，一个有N-末端Met-Thr-Pro序列的G-CSF重组蛋白(Cys¹⁷→Ser，Lys^{16，23，34，40}→Arg)被依次和ruLAP2和ruDPPIV温育，从有175个残基的蛋白上依次除去met和Thr-Pro二肽。

ruLAP2消化Gly-Ser-ProNPY：

1mg/ml肽加入50mM Tris-HCl，1mM CoCl₂缓冲液中和ruLAP2以E/S比率以1∶20和1∶100(W∶W)混合，37℃温育过夜。用RP-HPLC分离酶切材料，用ESI-MS鉴定。如图10所示，和ruLAP2温育结果是切去N-端的两个残基，理论上损失144.1amu(发现的144.2)E/S比率为1∶100得到相同的结果。当酶到达Xaa-Pro结构域时酶切停止，在proNPY的结构域是Tyr-Pro。

ruLAP2消化Ala-ProNPY：

消化条件和Gly-Ser-ProNPY的相同。图11B显示N-末端的丙氨酸差不多被全部从ProNPY中除去(分子量损失71amu)。

从C-CSF的N-末端依次切去甲硫氨酸和Thr-Pro：

被用于这些试验的是名为TG47的一种G-CSF的突变类似物，它是methinoyl-[C17S，K16，23，34，40R]G-CSF，其重新折叠的蛋白质理论上的质量是18894.90。

用ruLAP2消化：

将G-CSF的贮备液(在含0.1％Sarcosyl PBS中浓度为1.9mg/ml)稀释4倍至pH7.2的50mM Tris-HCl中，含1mM CoCl₂。和ruLAP2(E/S＝1∶20和1∶100，W∶W)在37℃温育15小时。用30％(V∶V)乙腈稀释溶液，乙酸酸化，RP-HPLC分离蛋白质，进行MS分析。如图12A和B所示，过夜温育导致N-末端甲硫氨酸完全切除。理论上质量损失131.2amu。在E/S比率为1∶100时，过夜温育后，仍有痕量未被切开的物质存在。

为了从半-制备的RP-HPLC柱上分离截短的物质，该实验在2mg尺度上被重复。以E/S比率1∶25(W∶W)在37℃条件下消化15小时以上。分离到的物质(0.8mg)通过ESI-MS鉴定(图12B，desMet-G-CSF，计算分子量为18763.7amu，实测分子质量为18762.5)。

DPPIV消化desMet-G-CSF：

冻干的材料重新溶于pH7.5的含0.1％Sarcosyl的50mM Tris-HCl中，浓度为1mg/ml。和DPPIV以E/S比率1/20(W∶W)在37℃温育过夜。像以前一样用RP-HPLC分离蛋白质，用ESI-MS鉴定(图13A和13B)。DPPIV消化(图13B)结果是切除N-末端二肽Thr-Pro(计算的分子量为18,564.8amu，实测分子质量为18,563)。在反应介质中，痕量的未消化物质仍然存在。

于是，依次应用LAP2和DPPIV的结果是有效地移去重组蛋白N-末端序列。当酶到达一个“停止点结构域”，如Xaa-Pro-Xaa，或Xaa-Pro结构域，它们可能是LAP2特异的停止点，RuLAP2的消化被终止，但可被DPPIV依次切去。

然而，对N-末端残基切除的起始高度依赖于序列，因为在与LAP和DPPIV一起温育时，Met(His)₆标记没有从Met(His)₆-proPNY中除去。

其他实施方案

尽管以上实施例详细的描述了本发明，但仅用来说明本发明目的，而不是用来限制本发明的权利要求范围。特别的是，可预测到不偏离本发明精神和范围的的不同的替换、改变和修饰均属于本发明权利要求范围。本领域普通技术人员知晓的有关重组的核酸起始原料、涉及的克隆或文库类型等方面的选择均认为是常规选择。其他的方面，如优势和修饰也被认为属于以下权利要求范围内。

序列表

<110>富诺齐梅生物技术股份有限公司

<120>一种新的真菌蛋白及其编码核酸

<130>PFD1060017F-CF

<150>US 60/498,398

<151>2003-08-25

<160>35

<170>PatentIn version 3.1

<210>1

<211>1757

<212>DNA

<213>红色毛癣菌(T.rubrum)

<400>1

atgaagtcgc aactgttgag cctggctgtg gccgtcacaa ccatctccca gggcgttgtt 60

ggtcaagagc ccttcggatg gcctttcaag cctatggtca ctcaggtgag ttgctctcaa 120

cagatcgatc gatcgatcta cctttgtccc tgtcacatca aactccagca gagccaaaga 180

aacagacaca atgttcctgg ggaattctta tgggctaatg taaatgtata ggatgacctg 240

caaaacaaga taaagctcaa ggatatcatg gcaggcgtcg agaagctgca aagcttttct 300

gatgctcatc ctgaaaagaa ccgagtgttt ggtggtaatg gccacaagga cactgtagag 360

tggatctaca atgagatcaa ggccactggc tactacgatg tgaagaagca ggagcaagta 420

cacctgtggt ctcatgccga ggctgctctc aatgccaatg gcaaggacct caaggccagc 480

gccatgtcct acagccctcc tgccagcaag atcatggctg agcttgttgt tgccaagaac 540

aatggctgca atgctgtatg tgccatacac tttctatacg tcacattctc tctagaatga 600

agagcacggg agaactaact ttatgtatac agactgatta cccagcgaac actcagggca 660

agatcgtcct cgttgagcgt ggtgtctgca gcttcggcga gaagtctgct caggctggtg 720

atgcaaaggc tgctggtgcc attgtctaca acaacgtccc cggatccctt gctggcactc 780

ttggtggcct tgacaagcgc catgtcccaa ccgctggtct ttcccaggag gatggaaaga 840

accttgctac cctcgttgct tctggtaaga ttgatgtcac catgaacgtt atcagtctgt 900

ttgagaaccg aaccacgtaa gtagctcaac ggctgatcca gcatcaattg tctcgagtat 960

atactaaatc gatacctcat agctggaacg tcattgctga gaccaaggga ggagaccaca 1020

acaacgttat catgctcggt gctcactccg actccgtcga tgccggccct ggtattaacg 1080

acaacggctc gggctccatt ggtatcatga ccgttgccaa agccctcacc aacttcaagc 1140

tcaacaacgc cgtccgcttt gcctggtgga ccgctgagga attcggtctc cttggaagca 1200

ccttctacgt caacagcctc gatgaccgtg agctgcacaa ggtcaagttg tacctcaact 1260

tcgacatgat cggctctccc aacttcgcca accagatcta cgacggtgac ggttcggcct 1320

acaacatgac cggccccgct ggctctgctg aaatcgagta cctgttcgag aagttctttg 1380

acgaccaggg tatcccacac cagcccactg ccttcactgg ccgatccgac tactctgctt 1440

tcatcaagcg caacgtgccc gctggcggcc tcttcactgg agccgaggtt gtcaagaccc 1500

ccgagcaagt caagttgttc ggtggtgagg ctggcgttgc ctatgacaag aactaccatc 1560

gcaagggcga caccgttgcc aacatcaaca agggagctat cttccttaac actcgagcca 1620

tcgcctacgc tatcgccgag tatgcccgat ccctcaaggg attcccaacc cgcccaaaga 1680

ccggcaagcg tgacgtcaac ccccagtatt ctaagatgcc tggtggtggc tgcggacacc 1740

acactgtctt catgtaa 1757

<210>2

<211>1488

<212>DNA

<213>红色毛癣菌(T.rubrum)

<400>2

atgaagtcgc aactgttgag cctggctgtg gccgtcacaa ccatctccca gggcgttgtt 60

ggtcaagagc ccttcggatg gcctttcaag cctatggtca ctcaggatga cctgcaaaac 120

aagataaagc tcaaggatat catggcaggc gtcgagaagc tgcaaagctt ttctgatgct 180

catcctgaaa agaaccgagt gtttggtggt aatggccaca aggacactgt agagtggatc 240

tacaatgaga tcaaggccac tggctactac gatgtgaaga agcaggagca agtacacctg 300

tggtctcatg ccgaggctgc tctcaatgcc aatggcaagg acctcaaggc cagcgccatg 360

tcctacagcc ctcctgccag caagatcatg gctgagcttg ttgttgccaa gaacaatggc 420

tgcaatgcta ctgattaccc agcgaacact cagggcaaga tcgtcctcgt tgagcgtggt 480

gtctgcagct tcggcgagaa gtctgctcag gctggtgatg caaaggctgc tggtgccatt 540

gtctacaaca acgtccccgg atcccttgct ggcactcttg gtggccttga caagcgccat 600

gtcccaaccg ctggtctttc ccaggaggat ggaaagaacc ttgctaccct cgttgcttct 660

ggtaagattg atgtcaccat gaacgttatc agtctgtttg agaaccgaac cacctggaac 720

gtcattgctg agaccaaggg aggagaccac aacaacgtta tcatgctcgg tgctcactcc 780

gactccgtcg atgccggccc tggtattaac gacaacggct cgggctccat tggtatcatg 840

accgttgcca aagccctcac caacttcaag ctcaacaacg ccgtccgctt tgcctggtgg 900

accgctgagg aattcggtct ccttggaagc accttctacg tcaacagcct cgatgaccgt 960

gagctgcaca aggtcaagtt gtacctcaac ttcgacatga tcggctctcc caacttcgcc 1020

aaccagatct acgacggtga cggttcggcc tacaacatga ccggccccgc tggctctgct 1080

gaaatcgagt acctgttcga gaagttcttt gacgaccagg gtatcccaca ccagcccact 1140

gccttcactg gccgatccga ctactctgct ttcatcaagc gcaacgtgcc cgctggcggc 1200

ctcttcactg gagccgaggt tgtcaagacc cccgagcaag tcaagttgtt cggtggtgag 1260

gctggcgttg cctatgacaa gaactaccat cgcaagggcg acaccgttgc caacatcaac 1320

aagggagcta tcttccttaa cactcgagcc atcgcctacg ctatcgccga gtatgcccga 1380

tccctcaagg gattcccaac ccgcccaaag accggcaagc gtgacgtcaa cccccagtat 1440

tctaagatgc ctggtggtgg ctgcggacac cacactgtct tcatgtaa 1488

<210>3

<211>495

<212>PRT

<213>红色毛癣菌(T.rubrum)

<400>3

Met Lys Ser Gln Leu Leu Ser Leu Ala Val Ala Val Thr Thr Ile Ser

1 5 10 15

Gln Gly Val Val Gly Gln Glu Pro Phe Gly Trp Pro Phe Lys Pro Met

20 25 30

Val Thr Gln Asp Asp Leu Gln Asn Lys Ile Lys Leu Lys Asp Ile Met

35 40 45

Ala Gly Val Glu Lys Leu Gln Ser Phe Ser Asp Ala His Pro Glu Lys

50 55 60

Asn Arg Val Phe Gly Gly Asn Gly His Lys Asp Thr Val Glu Trp Ile

65 70 75 80

Tyr Asn Glu Ile Lys Ala Thr Gly Tyr Tyr Asp Val Lys Lys Gln Glu

85 90 95

Gln Val His Leu Trp Ser His Ala Glu Ala Ala Leu Asn Ala Asn Gly

100 105 110

Lys Asp Leu Lys Ala Ser Ala Met Ser Tyr Ser Pro Pro Ala Ser Lys

115 120 125

Ile Met Ala Glu Leu Val Val Ala Lys Asn Asn Gly Cys Asn Ala Thr

130 135 140

Asp Tyr Pro Ala Asn Thr Gln Gly Lys Ile Val Leu Val Glu Arg Gly

145 150 155 160

Val Cys Ser Phe Gly Glu Lys Ser Ala Gln Ala Gly Asp Ala Lys Ala

165 170 175

Ala Gly Ala Ile Val Tyr Asn Asn Val Pro Gly Ser Leu Ala Gly Thr

180 185 190

Leu Gly Gly Leu Asp Lys Arg His Val Pro Thr Ala Gly Leu Ser Gln

195 200 205

Glu Asp Gly Lys Asn Leu Ala Thr Leu Val Ala Ser Gly Lys Ile Asp

210 215 220

Val Thr Met Asn Val Ile Ser Leu Phe Glu Asn Arg Thr Thr Trp Asn

225 230 235 240

Val Ile Ala Glu Thr Lys Gly Gly Asp His Asn Asn Val Ile Met Leu

245 250 255

Gly Ala His Ser Asp Ser Val Asp Ala Gly Pro Gly Ile Asn Asp Asn

260 265 270

Gly Ser Gly Ser Ile Gly Ile Met Thr Val Ala Lys Ala Leu Thr Asn

275 280 285

Phe Lys Leu Asn Asn Ala Val Arg Phe Ala Trp Trp Thr Ala Glu Glu

290 295 300

Phe Gly Leu Leu Gly Ser Thr Phe Tyr Val Asn Ser Leu Asp Asp Arg

305 310 315 320

Glu Leu His Lys Val Lys Leu Tyr Leu Asn Phe Asp Met Ile Gly Ser

325 330 335

Pro Asn Phe Ala Asn Gln Ile Tyr Asp Gly Asp Gly Ser Ala Tyr Asn

340 345 350

Met Thr Gly Pro Ala Gly Ser Ala Glu Ile Glu Tyr Leu Phe Glu Lys

355 360 365

Phe Phe Asp Asp Gln Gly Ile Pro His Gln Pro Thr Ala Phe Thr Gly

370 375 380

Arg Ser Asp Tyr Ser Ala Phe Ile Lys Arg Asn Val Pro Ala Gly Gly

385 390 395 400

Leu Phe Thr Gly Ala Glu Val Val Lys Thr Pro Glu Gln Val Lys Leu

405 410 415

Phe Gly Gly Glu Ala Gly Val Ala Tyr Asp Lys Asn Tyr His Arg Lys

420 425 430

Gly Asp Thr Val Ala Asn Ile Asn Lys Gly Ala Ile Phe Leu Asn Thr

435 440 445

Arg Ala Ile Ala Tyr Ala Ile Ala Glu Tyr Ala Arg Ser Leu Lys Gly

450 455 460

Phe Pro Thr Arg Pro Lys Thr Gly Lys Arg Asp Val Asn Pro Gln Tyr

465 470 475 480

Ser Lys Met Pro Gly Gly Gly Cys Gly His His Thr Val Phe Met

485 490 495

<210>4

<211>1256

<212>DNA

<213>红色毛癣菌(T.rubrum)

<400>4

atgaagctcc tctctgttct tgcgctgagc gctaccgcta cctccgtcct cggagctagc 60

attcctgttg atgcccgggc cgagaagttc ctcatcgaac ttgcccctgg tgagactcgc 120

tgggttaccg aggaggagaa gtgggagctt aagcgggtat gtaccactat cctacgcaaa 180

agttgtattt tcactagata atattggtta ttaacaccca ttctagaagg gtcaagactt 240

ctttgacatc actgacgagg aggttggatt cactgctgct gttgcacagc cagccattgc 300

ctacccaacc tccatccgcc atgctaatgc tgttaacgcc atgattgcta ccctctccaa 360

ggagaacatg cagcgcgatc tgaccaagct cagctcgttc caaaccgctt actataaggt 420

tgactttggc aagcagtctg ccacctggct ccaggagcaa gtccaggctg ccatcaatac 480

cgctggtgcc aatcgctacg gagccaaggt cgccagcttc cgacacaact tcgctcagca 540

cagcatcatt gccactattc ccggccgctc ccctgaagtc gttgtcgtcg gtgctcacca 600

agacagcatc aaccaacgca gccccatgac cggccgcgct ccaggtgccg atgacaacgg 660

cagtggctcc gtcaccatcc ttgaggccct ccgtggtgtt ctccgggacc agaccatcct 720

ccagggcaag gctgccaaca ccattgagtt ccactggtac gccggtgagg aagctggtct 780

tctgggctcc caggccatct tcgccaacta caaacagacc ggcaagaagg tcaagggcat 840

gctcaaccag gacatgaccg gttacatcaa gggaatggtc gacaagggtc tcaaggtgtc 900

cttcggtatc atcaccgaca acgtcaacgc taacttgacc aagttcgtcc gcatggtcat 960

caccaaggta agcttcaact cttgataaat atatttttca tcgatgaaat gatgtcctaa 1020

taatgcttaa gtactgctca atcccaacca tcgacacccg ctgcggctat gcttgctctg 1080

accacgcctc tgccaaccgc aatggctacc catctgccat ggttgccgag tctcccatcg 1140

atctcctcga ccctcacctc cacactgact ctgacaacat tagctacctc gacttcgacc 1200

acatgatcga gcacgctaag ctcattgtcg gcttcgtcac tgagctcgct aagtaa 1256

<210>5

<211>1122

<212>DNA

<213>红色毛癣菌(T.rubrum)

<400>5

atgaagctcc tctctgttct tgcgctgagc gctaccgcta cctccgtcct cggagctagc 60

attcctgttg atgcccgggc cgagaagttc ctcatcgaac ttgcccctgg tgagactcgc 120

tgggttaccg aggaggagaa gtgggagctt aagcggaagg gtcaagactt ctttgacatc 180

actgacgagg aggttggatt cactgctgct gttgcacagc cagccattgc ctacccaacc 240

tccatccgcc atgctaatgc tgttaacgcc atgattgcta ccctctccaa ggagaacatg 300

cagcgcgatc tgaccaagct cagctcgttc caaaccgctt actataaggt tgactttggc 360

aagcagtctg ccacctggct ccaggagcaa gtccaggctg ccatcaatac cgctggtgcc 420

aatcgctacg gagccaaggt cgccagcttc cgacacaact tcgctcagca cagcatcatt 480

gccactattc ccggccgctc ccctgaagtc gttgtcgtcg gtgctcacca agacagcatc 540

aaccaacgca gccccatgac cggccgcgct ccaggtgccg atgacaacgg cagtggctcc 600

gtcaccatcc ttgaggccct ccgtggtgtt ctccgggacc agaccatcct ccagggcaag 660

gctgccaaca ccattgagtt ccactggtac gccggtgagg aagctggtct tctgggctcc 720

caggccatct tcgccaacta caaacagacc ggcaagaagg tcaagggcat gctcaaccag 780

gacatgaccg gttacatcaa gggaatggtc gacaagggtc tcaaggtgtc cttcggtatc 840

atcaccgaca acgtcaacgc taacttgacc aagttcgtcc gcatggtcat caccaagtac 900

tgctcaatcc caaccatcga cacccgctgc ggctatgctt gctctgacca cgcctctgcc 960

aaccgcaatg gctacccatc tgccatggtt gccgagtctc ccatcgatct cctcgaccct 1020

cacctccaca ctgactctga caacattagc tacctcgact tcgaccacat gatcgagcac 1080

gctaagctca ttgtcggctt cgtcactgag ctcgctaagt aa 1122

<210>6

<211>373

<212>PRT

<213>红色毛癣菌(T.rubrum)

<400>6

Met Lys Leu Leu Ser Val Leu Ala Leu Ser Ala Thr Ala Thr Ser Val

1 5 10 15

Leu Gly Ala Ser Ile Pro Val Asp Ala Arg Ala Glu Lys Phe Leu Ile

20 25 30

Glu Leu Ala Pro Gly Glu Thr Arg Trp Val Thr Glu Glu Glu Lys Trp

35 40 45

Glu Leu Lys Arg Lys Gly Gln Asp Phe Phe Asp Ile Thr Asp Glu Glu

50 55 60

Val Gly Phe Thr Ala Ala Val Ala Gln Pro Ala Ile Ala Tyr Pro Thr

65 70 75 80

Ser Ile Arg His Ala Asn Ala Val Asn Ala Met Ile Ala Thr Leu Ser

85 90 95

Lys Glu Asn Met Gln Arg Asp Leu Thr Lys Leu Ser Ser Phe Gln Thr

100 105 110

Ala Tyr Tyr Lys Val Asp Phe Gly Lys Gln Ser Ala Thr Trp Leu Gln

115 120 125

Glu Gln Val Gln Ala Ala Ile Asn Thr Ala Gly Ala Asn Arg Tyr Gly

130 135 140

Ala Lys Val Ala Ser Phe Arg His Asn Phe Ala Gln His Ser Ile lle

145 150 155 160

Ala Thr Ile Pro Gly Arg Ser Pro Glu Val Val Val Val Gly Ala His

165 170 175

Gln Asp Ser Ile Asn Gln Arg Ser Pro Met Thr Gly Arg Ala Pro Gly

180 185 190

Ala Asp Asp Asn Gly Ser Gly Ser Val Thr Ile Leu Glu Ala Leu Arg

195 200 205

Gly Val Leu Arg Asp Gln Thr Ile Leu Gln Gly Lys Ala Ala Asn Thr

210 215 220

Ile Glu Phe His Trp Tyr Ala Gly Glu Glu Ala Gly Leu Leu Gly Ser

225 230 235 240

Gln Ala Ile Phe Ala Asn Tyr Lys Gln Thr Gly Lys Lys Val Lys Gly

245 250 255

Met Leu Asn Gln Asp Met Thr Gly Tyr Ile Lys Gly Met Val Asp Lys

260 265 270

Gly Leu Lys Val Ser Phe Gly Ile Ile Thr Asp Asn Val Asn Ala Asn

275 280 285

Leu Thr Lys Phe Val Arg Met Val Ile Thr Lys Tyr Cys Ser Ile Pro

290 295 300

Thr Ile Asp Thr Arg Cys Gly Tyr Ala Cys Ser Asp His Ala Ser Ala

305 310 315 320

Asn Arg Asn Gly Tyr Pro Ser Ala Met Val Ala Glu Ser Pro Ile Asp

325 330 335

Leu Leu Asp Pro His Leu His Thr Asp Ser Asp Asn Ile Ser Tyr Leu

340 345 350

Asp Phe Asp His Met Ile Glu His Ala Lys Leu Ile Val Gly Phe Val

355 360 365

Thr Glu Leu Ala Lys

370

<210>7

<211>1557

<212>DNA

<213>烟曲霉菌(A.fumigatus)

<400>7

atgaagctgc tctacctcac atcgtttgcc tctctggccg tggccaatgg cccaggatgg 60

gactggaagc cccgagttca tccggttagt gttcctctcg ccgggtttgt ctgctgtatg 120

ctaacagcat cctgtctatt acagaaagtc ctgccccaaa tgatccattt gtgggatctt 180

ctgcagggcg ctcaacagct ggaagacttc gcctatgcct accccgagcg caaccgcgtc 240

tttggtggac gggcccacga ggacaccgtc aactacctct accgtgagtt gaagaaaacc 300

ggctactacg acgtttacaa gcagccccag gttcaccagt ggacccgagc cgaccaggct 360

ctcaccgtcg acggccagtc ctatgacgcc acaaccatga cttacagccc cagcgtaaac 420

gccacggcgc cgctggcagt ggtgaacaac ctgggctgcg tcgaggctga ctatcccgcc 480

gatctgacgg gcaagattgc tctgatctcg cggggcgagt gcacctttgc gaccaaatcc 540

gtcttgagcg ccaaggccgg ggcggcggcg gcactcgtgt acaacaatat cgagggttcg 600

atggcgggaa ctctgggcgg cgcgaccagc gagctgggtg cctacgctcc catcgccggc 660

atcagcctcg cggacggaca ggcgctgatc cagatgatcc aggcgggcac ggtgacagcc 720

aacctgtgga tcgacagcca ggtcgagaac cgtaccacct acaacgtgat cgcgcagacc 780

aagggcggcg accccaacaa cgtcgtcgcg ctgggtggcc acacggactc ggtcgaggcc 840

gggcccggca tcaacgacga cggctccggc atcatcagca acctcgtcgt cgccaaggcg 900

ctgacccgct tctcggtcaa gaacgcggtg cgcttctgct tctggacggc ggaggagttc 960

ggcctgctgg gcagcaacta ctacgtcaac agcctcaatg ccaccgagca ggccaagatc 1020

cgcctgtatc tcaacttcga catgatcgcc tcccccaact acgccctgat gatctatgac 1080

ggcgacggct cggccttcaa cctgacgggg ccggccggct cggcgcagat cgagcggctc 1140

ttcgaggact actacacgtc gatccgcaag ccgttcgtgc cgaccgagtt caacggccgc 1200

tccgactacc aggcctttat tctcaacggc atccccgcgg gaggcctctt caccggcgcg 1260

gaggcgatca agaccgagga acaggcccaa ttgtttggcg gccaggccgg cgtggctctg 1320

gacgccaact accacgccaa gggtgacaac atgactaatc tcaaccgcga ggctttcctg 1380

atcaattcca gggcgacggc ctttgccgtg gcgacgtacg ccaacagcct tgactcgatc 1440

cccccacgca acatgaccac cgtggtcaag cggtcgcagc tggagcaagc catgaagagg 1500

accccgcaca cgcacaccgg cggaacagga tgctacaagg accgggttga gcagtag 1557

<210>8

<211>1497

<212>DNA

<213>烟曲霉菌(A.fumigatus)

<400>8

atgaagctgc tctacctcac atcgtttgcc tctctggccg tggccaatgg cccaggatgg 60

gactggaagc cccgagttca tccgaaagtc ctgccccaaa tgatccattt gtgggatctt 120

ctgcagggcg ctcaacagct ggaagacttc gcctatgcct accccgagcg caaccgcgtc 180

tttggtggac gggcccacga ggacaccgtc aactacctct accgtgagtt gaagaaaacc 240

ggctactacg acgtttacaa gcagccccag gttcaccagt ggacccgagc cgaccaggct 300

ctcaccgtcg acggccagtc ctatgacgcc acaaccatga cttacagccc cagcgtaaac 360

gccacggcgc cgctggcagt ggtgaacaac ctgggctgcg tcgaggctga ctatcccgcc 420

gatctgacgg gcaagattgc tctgatctcg cggggcgagt gcacctttgc gaccaaatcc 480

gtcttgagcg ccaaggccgg ggcggcggcg gcactcgtgt acaacaatat cgagggttcg 540

atggcgggaa ctctgggcgg cgcgaccagc gagctgggtg cctacgctcc catcgccggc 600

atcagcctcg cggacggaca ggcgctgatc cagatgatcc aggcgggcac ggtgacagcc 660

aacctgtgga tcgacagcca ggtcgagaac cgtaccacct acaacgtgat cgcgcagacc 720

aagggcggcg accccaacaa cgtcgtcgcg ctgggtggcc acacggactc ggtcgaggcc 780

gggcccggca tcaacgacga cggctccggc atcatcagca acctcgtcgt cgccaaggcg 840

ctgacccgct tctcggtcaa gaacgcggtg cgcttctgct tctggacggc ggaggagttc 900

ggcctgctgg gcagcaacta ctacgtcaac agcctcaatg ccaccgagca ggccaagatc 960

cgcctgtatc tcaacttcga catgatcgcc tcccccaact acgccctgat gatctatgac 1020

ggcgacggct cggccttcaa cctgacgggg ccggccggct cggcgcagat cgagcggctc 1080

ttcgaggact actacacgtc gatccgcaag ccgttcgtgc cgaccgagtt caacggccgc 1140

tccgactacc aggcctttat tctcaacggc atccccgcgg gaggcctctt caccggcgcg 1200

gaggcgatca agaccgagga acaggcccaa ttgtttggcg gccaggccgg cgtggctctg 1260

gacgccaact accacgccaa gggtgacaac atgactaatc tcaaccgcga ggctttcctg 1320

atcaattcca gggcgacggc ctttgccgtg gcgacgtacg ccaacagcct tgactcgatc 1380

cccccacgca acatgaccac cgtggtcaag cggtcgcagc tggagcaagc catgaagagg 1440

accccgcaca cgcacaccgg cggaacagga tgctacaagg accgggttga gcagtag 1497

<210>9

<211>498

<212>PRT

<213>烟曲霉菌(A.fumigatus)

<400>9

Met Lys Leu Leu Tyr Leu Thr Ser Phe Ala Ser Leu Ala Val Ala Asn

1 5 10 15

Gly Pro Gly Trp Asp Trp Lys Pro Arg Val His Pro Lys Val Leu Pro

20 25 30

Gln Met Ile His Leu Trp Asp Leu Leu Gln Gly Ala Gln Gln Leu Glu

35 40 45

Asp Phe Ala Tyr Ala Tyr Pro Glu Arg Asn Arg Val Phe Gly Gly Arg

50 55 60

Ala His Glu Asp Thr Val Asn Tyr Leu Tyr Arg Glu Leu Lys Lys Thr

65 70 75 80

Gly Tyr Tyr Asp Val Tyr Lys Gln Pro Gln Val His Gln Trp Thr Arg

85 90 95

Ala Asp Gln Ala Leu Thr Val Asp Gly Gln Ser Tyr Asp Ala Thr Thr

100 105 110

Met Thr Tyr Ser Pro Ser Val Asn Ala Thr Ala Pro Leu Ala Val Val

115 120 125

Asn Asn Leu Gly Cys Val Glu Ala Asp Tyr Pro Ala Asp Leu Thr Gly

130 135 140

Lys Ile Ala Leu Ile Ser Arg Gly Glu Cys Thr Phe Ala Thr Lys Ser

145 150 155 160

Val Leu Ser Ala Lys Ala Gly Ala Ala Ala Ala Leu Val Tyr Asn Asn

165 170 175

Ile Glu Gly Ser Met Ala Gly Thr Leu Gly Gly Ala Thr Ser Glu Leu

180 185 190

Gly Ala Tyr Ala Pro Ile Ala Gly Ile Ser Leu Ala Asp Gly Gln Ala

195 200 205

Leu Ile Gln Met Ile Gln Ala Gly Thr Val Thr Ala Asn Leu Trp Ile

210 215 220

Asp Ser Gln Val Glu Asn Arg Thr Thr Tyr Asn Val Ile Ala Gln Thr

225 230 235 240

Lys Gly Gly Asp Pro Asn Asn Val Val Ala Leu Gly Gly His Thr Asp

245 250 255

Ser Val Glu Ala Gly Pro Gly Ile Asn Asp Asp Gly Ser Gly Ile Ile

260 265 270

Ser Asn Leu Val Val Ala Lys Ala Leu Thr Arg Phe Ser Val Lys Asn

275 280 285

Ala Val Arg Phe Cys Phe Trp Thr Ala Glu Glu Phe Gly Leu Leu Gly

290 295 300

Ser Asn Tyr Tyr Val Asn Ser Leu Asn Ala Thr Glu Gln Ala Lys Ile

305 310 315 320

Arg Leu Tyr Leu Asn Phe Asp Met Ile Ala Ser Pro Asn Tyr Ala Leu

325 330 335

Met Ile Tyr Asp Gly Asp Gly Ser Ala Phe Asn Leu Thr Gly Pro Ala

340 345 350

Gly Ser Ala Gln Ile Glu Arg Leu Phe Glu Asp Tyr Tyr Thr Ser Ile

355 360 365

Arg Lys Pro Phe Val Pro Thr Glu Phe Asn Gly Arg Ser Asp Tyr Gln

370 375 380

Ala Phe Ile Leu Asn Gly Ile Pro Ala Gly Gly Leu Phe Thr Gly Ala

385 390 395 400

Glu Ala Ile Lys Thr Glu Glu Gln Ala Gln Leu Phe Gly Gly Gln Ala

405 410 415

Gly Val Ala Leu Asp Ala Asn Tyr His Ala Lys Gly Asp Asn Met Thr

420 425 430

Asn Leu Asn Arg Glu Ala Phe Leu Ile Asn Ser Arg Ala Thr Ala Phe

435 440 445

Ala Val Ala Thr Tyr Ala Asn Ser Leu Asp Ser Ile Pro Pro Arg Asn

450 455 460

Met Thr Thr Val Val Lys Arg Ser Gln Leu Glu Gln Ala Met Lys Arg

465 470 475 480

Thr Pro His Thr His Thr Gly Gly Thr Gly Cys Tyr Lys Asp Arg Val

485 490 495

Glu Gln

<210>10

<211>1298

<212>DNA

<213>烟曲霉菌(A.fumigatus)

<400>10

atgaaagttc ttacagctat tgcgctgagc gcaatagctt tcacaggggc tgtagctgca 60

gtgattactc aggaagcatt cttaaacaac ccccgcatcc atcatgacca ggagaagtac 120

ttgatcgaac tggcccctta tcgaacacga tgggtgactg aagaggagaa atgggcattg 180

aaattggtac catacttccc caaaatttgg gtctccaagt ccacgggcga ctaactgcac 240

gattgcttga aggacggcgt gaattttatc gatatcacag aagagcacaa caccggattt 300

tacccgactc tccacagcgc cagctatgtg aaatatccac cgaagatgca gtatgcagaa 360

gaagtggctg ctcttaacaa gaatttatcg aaagaaaaca tgaaggccaa cctggaacga 420

ttcacatcat ttcatactcg ctattacaaa tctcagacgg gaatccgatc ggcaacgtgg 480

ctgttcgacc aagttcagag agttgtctct gagtctggag ccgctgagta tggtgcaact 540

gttgagcgat tctctcatcc atggggtcag ttcagcatta ttgcccgaat acccggccga 600

acgaacaaga ctgtggtgct gggcgcccat caggacagca tcaatttgtt tctcccgtca 660

atcttggctg ctcccggtgc tgatgacgat ggaagtggaa ctgtcaccat tcttgaagcg 720

ttgcgcggtc tgctgcagtc agacgccatt gccaagggta atgcatccaa tactgtcgag 780

ttccactggt actctgcaga agaaggcgga atgctgggct cccaggcaat attttccaat 840

tacaagcgga ataggcggga aatcaaagcc atgctccagc aagacatgac tggctacgtc 900

cagggagctt tgaacgccgg tgttgaggaa gccataggaa ttatggtcga ttatgtcgac 960

cagggcctca cacagtttct caaggacgtt gttacagcgg taagcctcag ttgtccccca 1020

cgaaaagctg tttagtcgac aaatgaaatt gacggctgca ttagtactgc tctgtgggtt 1080

acctggagac gaagtgcgga tatgcctgct ccgaccacac ctcggccagt aaatatggtt 1140

atcccgcggc tatggcgaca gaagcagaga tggaaaatac caataagaag atacatacta 1200

ccgacgacaa gatcaagtat ttgagcttcg atcatatgtt ggagcatgcc aagttgagtc 1260

ttggcttcgc tttcgaattg gcatttgcgc cgttttaa 1298

<210>11

<211>1167

<212>DNA

<213>烟曲霉菌(A.fumigatus)

<400>11

atgaaagttc ttacagctat tgcgctgagc gcaatagctt tcacaggggc tgtagctgca 60

gtgattactc aggaagcatt cttaaacaac ccccgcatcc atcatgacca ggagaagtac 120

ttgatcgaac tggcccctta tcgaacacga tgggtgactg aagaggagaa atgggcattg 180

aaattggacg gcgtgaattt tatcgatatc acagaagagc acaacaccgg attttacccg 240

actctccaca gcgccagcta tgtgaaatat ccaccgaaga tgcagtatgc agaagaagtg 300

gctgctctta acaagaattt atcgaaagaa aacatgaagg ccaacctgga acgattcaca 360

tcatttcata ctcgctatta caaatctcag acgggaatcc gatcggcaac gtggctgttc 420

gaccaagttc agagagttgt ctctgagtct ggagccgctg agtatggtgc aactgttgag 480

cgattctctc atccatgggg tcagttcagc attattgccc gaatacccgg ccgaacgaac 540

aagactgtgg tgctgggcgc ccatcaggac agcatcaatt tgtttctccc gtcaatcttg 600

gctgctcccg gtgctgatga cgatggaagt ggaactgtca ccattcttga agcgttgcgc 660

ggtctgctgc agtcagacgc cattgccaag ggtaatgcat ccaatactgt cgagttccac 720

tggtactctg cagaagaagg cggaatgctg ggctcccagg caatattttc caattacaag 780

cggaataggc gggaaatcaa agccatgctc cagcaagaca tgactggcta cgtccaggga 840

gctttgaacg ccggtgttga ggaagccata ggaattatgg tcgattatgt cgaccagggc 900

ctcacacagt ttctcaagga cgttgttaca gcgtactgct ctgtgggtta cctggagacg 960

aagtgcggat atgcctgctc cgaccacacc tcggccagta aatatggtta tcccgcggct 1020

atggcgacag aagcagagat ggaaaatacc aataagaaga tacatactac cgacgacaag 1080

atcaagtatt tgagcttcga tcatatgttg gagcatgcca agttgagtct tggcttcgct 1140

ttcgaattgg catttgcgcc gttttaa 1167

<210>12

<211>388

<212>PRT

<213>烟曲霉菌(A.fumigatus)

<400>12

Met Lys Val Leu Thr Ala Ile Ala Leu Ser Ala Ile Ala Phe Thr Gly

1 5 10 15

Ala Val Ala Ala Val Ile Thr Gln Glu Ala Phe Leu Asn Asn Pro Arg

20 25 30

Ile His His Asp Gln Glu Lys Tyr Leu Ile Glu Leu Ala Pro Tyr Arg

35 40 45

Thr Arg Trp Val Thr Glu Glu Glu Lys Trp Ala Leu Lys Leu Asp Gly

50 55 60

Val Asn Phe Ile Asp Ile Thr Glu Glu His Asn Thr Gly Phe Tyr Pro

65 70 75 80

Thr Leu His Ser Ala Ser Tyr Val Lys Tyr Pro Pro Lys Met Gln Tyr

85 90 95

Ala Glu Glu Val Ala Ala Leu Asn Lys Asn Leu Ser Lys Glu Asn Met

100 105 110

Lys Ala Asn Leu Glu Arg Phe Thr Ser Phe His Thr Arg Tyr Tyr Lys

115 120 125

Ser Gln Thr Gly Ile Arg Ser Ala Thr Trp Leu Phe Asp Gln Val Gln

130 135 140

Arg Val Val Ser Glu Ser Gly Ala Ala Glu Tyr Gly Ala Thr Val Glu

145 150 155 160

Arg Phe Ser His Pro Trp Gly Gln Phe Ser Ile Ile Ala Arg Ile Pro

165 170 175

Gly Arg Thr Asn Lys Thr Val Val Leu Gly Ala His Gln Asp Ser Ile

180 185 190

Asn Leu Phe Leu Pro Ser Ile Leu Ala Ala Pro Gly Ala Asp Asp Asp

195 200 205

Gly Ser Gly Thr Val Thr Ile Leu Glu Ala Leu Arg Gly Leu Leu Gln

210 215 220

Ser Asp Ala Ile Ala Lys Gly Asn Ala Ser Asn Thr Val Glu Phe His

225 230 235 240

Trp Tyr Ser Ala Glu Glu Gly Gly Met Leu Gly Ser Gln Ala Ile Phe

245 250 255

Ser Asn Tyr Lys Arg Asn Arg Arg Glu Ile Lys Ala Met Leu Gln Gln

260 265 270

Asp Met Thr Gly Tyr Val Gln Gly Ala Leu Asn Ala Gly Val Glu Glu

275 280 285

Ala Ile Gly Ile Met Val Asp Tyr Val Asp Gln Gly Leu Thr Gln Phe

290 295 300

Leu Lys Asp Val Val Thr Ala Tyr Cys Ser Val Gly Tyr Leu Glu Thr

305 310 315 320

Lys Cys Gly Tyr Ala Cys Ser Asp His Thr Ser Ala Ser Lys Tyr Gly

325 330 335

Tyr Pro Ala Ala Met Ala Thr Glu Ala Glu Met Glu Asn Thr Asn Lys

340 345 350

Lys Ile His Thr Thr Asp Asp Lys Ile Lys Tyr Leu Ser Phe Asp His

355 360 365

Met Leu Glu His Ala Lys Leu Ser Leu Gly Phe Ala Phe Glu Leu Ala

370 375 380

Phe Ala Pro Phe

385

<210>13

<211>2106

<212>DNA

<213>红色毛癣菌(T.rubrum)

<400>13

atggtgtcat tctgcggagt ggcagcctgc ctgctgacag ttgctggcca tcttgcgcag 60

gctcagttcc caccaaaacc ggagggagtc actgtcctgg agtcgaaatt cggcagcggt 120

gctcgcatca cttataagga ggtccgttag ctgcatagaa agtccacgtg aagacgctgt 180

agctaacaat ccactagcct ggcctctgtg agacgacaga gggcgtcaag tcgtacgccg 240

gatatgtcca tctgcctcca ggcacgctca gggacttcgg tgtcgagcag gactacccta 300

tcaacacctt tttttggttc tttgaggcaa gaaaggaccc tgaaaatgcc cctctcggca 360

tctggatgaa cggtggcccg ggtagctcgt cgatgtttgg aatgatgact gagaacgggc 420

cttgcttcgt caatgcagac tccaattcta ctcgcctgaa ccctcattct tggaacaatg 480

aaggtatgcc atcagcttct gatggaaaac taaatattgc taacattgta ctttctgtga 540

ctagtcaata tgctgtatat agaccagcca gtgcaggtcg gtctgtccta cgacactttg 600

gccaacttca ccaggaatct agtcacggat gagatcacga aactgaaacc cggagaacct 660

attccggaac agaatgccac tttcctggta ggtacatatg caagccgcaa tatgaacacc 720

actgcacacg gaactaggca tgctgccatg gctctctggc acttcgccca agtctggttc 780

caagagttcc caggatatca ccctaggaac aacaagatca gcattgctac cgaatcctac 840

ggcggccgtt atggcccggc ctttactgcc ttctttgaag agcagaacca gaagatcaag 900

aacggcacat ggaagggaca cgagggaact atgcacgtgc tgcatctcga caccctcatg 960

atcgtcaacg gatgcatcga ccgtcttgtc caatggccgg catatccgca aatggcgtac 1020

aacaacacat atagcatcga ggcagtcaac gccagcattc atgcaggaat gctggatgcc 1080

ctctaccgcg acggtggctg tcgagacaag attaaccact gccgctccct ctcttctgtg 1140

ttcgatcctg agaatctcgg catcaactca accgtcaatg atgtctgcaa ggatgccgag 1200

acattctgct ccaatgatgt tcgcgatccc tacctcaagt tctctggccg caactactat 1260

gacatcggac agcttgaccc cagcccattc ccagcaccat tttacatggc ctggctaaat 1320

cagccgcatg tgcaggcagc actgggtgtg ccacttaact ggacacagtc aaacgatgtt 1380

gtgtctaccg cattccgtgc aattggtgac taccctcggc cagggtggct ggagaacctg 1440

gcttatttgc tggagaatgg catcaaggtt tcgcttgttt acggtgatcg ggactacgca 1500

tgcaactggt tcggtggtga gctctcaagt ctgggaatca actacactga cacccacgaa 1560

ttccataatg ccggctatgc aggtatccag atcaatagca gctacatcgg tggacaggtg 1620

aggcagtacg gcaacctctc cttcgcccgc gtctacgagg ccggccatga ggtgccatcg 1680

taccaacccg agactgcact gcagatattc caccgttccc tgttcaacaa ggatatcgct 1740

actggaacca aggacacgtc atcgcgcatg gacggaggca agttttacgg cacctcgggc 1800

cctgcggact cgtttggttt caagaacaaa cctccaccgc agcacgtcca cttctgtcat 1860

atcttagaca ccagcacctg caccaaggag cagatccagt cagttgagaa cggcactgcc 1920

gccgtacgca gctggatcat tgtcgactcc aactcgacct ctctgttccc cgaggtagtt 1980

ggctcagggg aacccacgcc aacccctatg cctggagggg ctactacact atctgctcac 2040

gggttcttgt atggcgtgac attatgggct gttattgttg tagctgttat agagctggca 2100

atgtaa 2106

<210>14

<211>1989

<212>DNA

<213>红色毛癣菌(T.rubrum)

<400>14

atggtgtcat tctgcggagt ggcagcctgc ctgctgacag ttgctggcca tcttgcgcag 60

gctcagttcc caccaaaacc ggagggagtc actgtcctgg agtcgaaatt cggcagcggt 120

gctcgcatca cttataagga gcctggcctc tgtgagacga cagagggcgt caagtcgtac 180

gccggatatg tccatctgcc tccaggcacg ctcagggact tcggtgtcga gcaggactac 240

cctatcaaca cctttttttg gttctttgag gcaagaaagg accctgaaaa tgcccctctc 300

ggcatctgga tgaacggtgg cccgggtagc tcgtcgatgt ttggaatgat gactgagaac 360

gggccttgct tcgtcaatgc agactccaat tctactcgcc tgaaccctca ttcttggaac 420

aatgaagtca atatgctgta tatagaccag ccagtgcagg tcggtctgtc ctacgacact 480

ttggccaact tcaccaggaa tctagtcacg gatgagatca cgaaactgaa acccggagaa 540

cctattccgg aacagaatgc cactttcctg gtaggtacat atgcaagccg caatatgaac 600

accactgcac acggaactag gcatgctgcc atggctctct ggcacttcgc ccaagtctgg 660

ttccaagagt tcccaggata tcaccctagg aacaacaaga tcagcattgc taccgaatcc 720

tacggcggcc gttatggccc ggcctttact gccttctttg aagagcagaa ccagaagatc 780

aagaacggca catggaaggg acacgaggga actatgcacg tgctgcatct cgacaccctc 840

atgatcgtca acggatgcat cgaccgtctt gtccaatggc cggcatatcc gcaaatggcg 900

tacaacaaca catatagcat cgaggcagtc aacgccagca ttcatgcagg aatgctggat 960

gccctctacc gcgacggtgg ctgtcgagac aagattaacc actgccgctc cctctcttct 1020

gtgttcgatc ctgagaatct cggcatcaac tcaaccgtca atgatgtctg caaggatgcc 1080

gagacattct gctccaatga tgttcgcgat ccctacctca agttctctgg ccgcaactac 1140

tatgacatcg gacagcttga ccccagccca ttcccagcac cattttacat ggcctggcta 1200

aatcagccgc atgtgcaggc agcactgggt gtgccactta actggacaca gtcaaacgat 1260

gttgtgtcta ccgcattccg tgcaattggt gactaccctc ggccagggtg gctggagaac 1320

ctggcttatt tgctggagaa tggcatcaag gtttcgcttg tttacggtga tcgggactac 1380

gcatgcaact ggttcggtgg tgagctctca agtctgggaa tcaactacac tgacacccac 1440

gaattccata atgccggcta tgcaggtatc cagatcaata gcagctacat cggtggacag 1500

gtgaggcagt acggcaacct ctccttcgcc cgcgtctacg aggccggcca tgaggtgcca 1560

tcgtaccaac ccgagactgc actgcagata ttccaccgtt ccctgttcaa caaggatatc 1620

gctactggaa ccaaggacac gtcatcgcgc atggacggag gcaagtttta cggcacctcg 1680

ggccctgcgg actcgtttgg tttcaagaac aaacctccac cgcagcacgt ccacttctgt 1740

catatcttag acaccagcac ctgcaccaag gagcagatcc agtcagttga gaacggcact 1800

gccgccgtac gcagctggat cattgtcgac tccaactcga cctctctgtt ccccgaggta 1860

gttggctcag gggaacccac gccaacccct atgcctggag gggctactac actatctgct 1920

cacgggttct tgtatggcgt gacattatgg gctgttattg ttgtagctgt tatagagctg 1980

gcaatgtaa 1989

<210>15

<211>662

<212>PRT

<213>红色毛癣菌(T.rubrum)

<400>15

Met Val Ser Phe Cys Gly Val Ala Ala Cys Leu Leu Thr Val Ala Gly

1 5 10 15

His Leu Ala Gln Ala Gln Phe Pro Pro Lys Pro Glu Gly Val Thr Val

20 25 30

Leu Glu Ser Lys Phe Gly Ser Gly Ala Arg Ile Thr Tyr Lys Glu Pro

35 40 45

Gly Leu Cys Glu Thr Thr Glu Gly Val Lys Ser Tyr Ala Gly Tyr Val

50 55 60

His Leu Pro Pro Gly Thr Leu Arg Asp Phe Gly Val Glu Gln Asp Tyr

65 70 75 80

Pro Ile Asn Thr Phe Phe Trp Phe Phe Glu Ala Arg Lys Asp Pro Glu

85 90 95

Asn Ala Pro Leu Gly Ile Trp Met Asn Gly Gly Pro Gly Ser Ser Ser

100 105 110

Met Phe Gly Met Met Thr Glu Asn Gly Pro Cys Phe Val Asn Ala Asp

115 120 125

Ser Asn Ser Thr Arg Leu Asn Pro His Ser Trp Asn Asn Glu Val Asn

130 135 140

Met Leu Tyr Ile Asp Gln Pro Val Gln Val Gly Leu Ser Tyr Asp Thr

145 150 155 160

Leu Ala Asn Phe Thr Arg Asn Leu Val Thr Asp Glu Ile Thr Lys Leu

165 170 175

Lys Pro Gly Glu Pro Ile Pro Glu Gln Asn Ala Thr Phe Leu Val Gly

180 185 190

Thr Tyr Ala Ser Arg Asn Met Asn Thr Thr Ala His Gly Thr Arg His

195 200 205

Ala Ala Met Ala Leu Trp His Phe Ala Gln Val Trp Phe Gln Glu Phe

210 215 220

Pro Gly Tyr His Pro Arg Asn Asn Lys Ile Ser Ile Ala Thr Glu Ser

225 230 235 240

Tyr Gly Gly Arg Tyr Gly Pro Ala Phe Thr Ala Phe Phe Glu Glu Gln

245 250 255

Asn Gln Lys Ile Lys Asn Gly Thr Trp Lys Gly His Glu Gly Thr Met

260 265 270

His Val Leu His Leu Asp Thr Leu Met Ile Val Asn Gly Cys Ile Asp

275 280 285

Arg Leu Val Gln Trp Pro Ala Tyr Pro Gln Met Ala Tyr Asn Asn Thr

290 295 300

Tyr Ser Ile Glu Ala Val Asn Ala Ser Ile His Ala Gly Met Leu Asp

305 310 315 320

Ala Leu Tyr Arg Asp Gly Gly Cys Arg Asp Lys Ile Asn His Cys Arg

325 330 335

Ser Leu Ser Ser Val Phe Asp Pro Glu Asn Leu Gly Ile Asn Ser Thr

340 345 350

Val Asn Asp Val Cys Lys Asp Ala Glu Thr Phe Cys Ser Asn Asp Val

355 360 365

Arg Asp Pro Tyr Leu Lys Phe Ser Gly Arg Asn Tyr Tyr Asp Ile Gly

370 375 380

Gln Leu Asp Pro Ser Pro Phe Pro Ala Pro Phe Tyr Met Ala Trp Leu

385 390 395 400

Asn Gln Pro His Val Gln Ala Ala Leu Gly Val Pro Leu Asn Trp Thr

405 410 415

Gln Ser Asn Asp Val Val Ser Thr Ala Phe Arg Ala Ile Gly Asp Tyr

420 425 430

Pro Arg Pro Gly Trp Leu Glu Asn Leu Ala Tyr Leu Leu Glu Asn Gly

435 440 445

Ile Lys Val Ser Leu Val Tyr Gly Asp Arg Asp Tyr Ala Cys Asn Trp

450 455 460

Phe Gly Gly Glu Leu Ser Ser Leu Gly Ile Asn Tyr Thr Asp Thr His

465 470 475 480

Glu Phe His Asn Ala Gly Tyr Ala Gly Ile Gln Ile Asn Ser Ser Tyr

485 490 495

Ile Gly Gly Gln Val Arg Gln Tyr Gly Asn Leu Ser Phe Ala Arg Val

500 505 510

Tyr Glu Ala Gly His Glu Val Pro Ser Tyr Gln Pro Glu Thr Ala Leu

515 520 525

Gln Ile Phe His Arg Ser Leu Phe Asn Lys Asp Ile Ala Thr Gly Thr

530 535 540

Lys Asp Thr Ser Ser Arg Met Asp Gly Gly Lys Phe Tyr Gly Thr Ser

545 550 555 560

Gly Pro Ala Asp Ser Phe Gly Phe Lys Asn Lys Pro Pro Pro Gln His

565 570 575

Val His Phe Cys His Ile Leu Asp Thr Ser Thr Cys Thr Lys Glu Gln

580 585 590

Ile Gln Ser Val Glu Asn Gly Thr Ala Ala Val Arg Ser Trp Ile Ile

595 600 605

Val Asp Ser Asn Ser Thr Ser Leu Phe Pro Glu Val Val Gly Ser Gly

610 615 620

Glu Pro Thr Pro Thr Pro Met Pro Gly Gly Ala Thr Thr Leu Ser Ala

625 630 635 640

His Gly Phe Leu Tyr Gly Val Thr Leu Trp Ala Val Ile Val Val Ala

645 650 655

Val Ile Glu Leu Ala Met

660

<210>16

<211>2030

<212>DNA

<213>红色毛癣菌(T.rubrum)

<400>16

atgcgctttg ctgctagcat tgccgtggcc ctgccagtca ttcacgcggc gagtgctcaa 60

ggcttccctc cacccgttaa gggcgtcacc gtggtcaaat ccaagttcga cgaaaacgta 120

aagatcacat acaaggaggt atgtgtttac atcattttca catccagatc ttatatcctt 180

acaataaatc tggctaactc actggataga atgacatatg tgaaaccact caaggagtta 240

gatcattcac cggtcatgtc caccttcctc cagacaacga tgactttggt gtctaccgga 300

actactccat caacacattc ttctggttct ttgaagctcg tgaagaccct aagaatgctc 360

ctctctccat ctggctgaac ggtggtccgg gatcgtcatc catgattgga ctcttccagg 420

aaaacggtcc atgctgggtc aatgaagact ctaaatctac caccaacaat tcattttcat 480

ggaacaataa agtaaatatg ctctacattg atcagccaaa ccaagtcggt ttcagttatg 540

acgtacctac caacatcact tactctacca tcaatgatac aatatctgtt gcggacttct 600

ctaacggtgt ccctgcgcaa aatctttcta cgttggttgg aaccggcagc agccagaacc 660

cttgggcaac tgccaataac actgtgaacg ctgctcgttc tatctggcac tttgcacaag 720

tgtggttcca ggaattccct gaacacaagc ctaacaataa caagatcagt atttggacag 780

agtcctatgg aggaagatat ggtccctcat tcgcctctta cttccaggaa cagaacgaaa 840

agatcaaaaa ccataccatt actgaagaag gagagatgca tattctgaac ctcgacaccc 900

tcggtatcat caacggctgc atcgatctta tgttccaagc agaaagttat gctgaattcc 960

catacaacaa cacctatggc atcaaagctt ataccaagga gaagcgtgac gctatattac 1020

acgacatcca ccgtcctgac ggctgcttcg acaaggttac caagtgccgt gaggccgcga 1080

aagaaggaga ccctcacttc tacagcaaca atgcaaccgt caacacaatc tgtgcggatg 1140

ctaactctgc ctgcgacaaa tatctaatgg atcctttcca agagaccaat cttggttact 1200

atgatattgc tcatcctctt caggatccct tccccccacc attctataag ggcttcctca 1260

gccaatccag cgttctatct gacatgggat cgccagtcaa cttctcccaa tacgcccaag 1320

ctgtgggaaa atcattccat ggagttggcg actacgctcg ccctgatgtg cgcggcttca 1380

ccggtgacat tgcttatctt ctcgagagcg gagtcaaggt tgctctcgtc tatggtgaca 1440

gagactacat ctgcaattgg ttcggtggtg agcaggtcag tcttggcttg aactacactg 1500

gcacccaaga cttccacagg gcaaaatatg ccgatgtcaa ggtcaactct tcatacgtcg 1560

gaggcgtagt gcgtcaacat ggaaacttct ctttcaccag agttttcgag gccggtcatg 1620

aagtccctgg ttaccaaccc gagactgccc tcaagatctt tgagcgcatc atgttcaaca 1680

aggatatttc taccggtgag atcgacattg ctcagaaacc agactacggt accactggaa 1740

ctgagtctac gttccatatc aaaaacgata tccctccttc gcctgagccg acctgctacc 1800

tcctcagtgc tgacggaacc tgtaccccgg agcagcttaa tgctattaag gatggaactg 1860

cagttgttga gaactacatt attaagagcc ctgctgcgtc gaaggggaac cctccaccaa 1920

ccacgacctc atctcccaca gcagccccta ccgctggaag tgccatgcta aaggctcctg 1980

tggcaatgct agcaatatca gctctcactg tccttgcttt cttcttgtag 2030

<210>17

<211>1959

<212>DNA

<213>红色毛癣菌(T.rubrum)

<400>17

atgcgctttg ctgctagcat tgccgtggcc ctgccagtca ttcacgcggc gagtgctcaa 60

ggcttccctc cacccgttaa gggcgtcacc gtggtcaaat ccaagttcga cgaaaacgta 120

aagatcacat acaaggagaa tgacatatgt gaaaccactc aaggagttag atcattcacc 180

ggtcatgtcc accttcctcc agacaacgat gactttggtg tctaccggaa ctactccatc 240

aacacattct tctggttctt tgaagctcgt gaagacccta agaatgctcc tctctccatc 300

tggctgaacg gtggtccggg atcgtcatcc atgattggac tcttccagga aaacggtcca 360

tgctgggtca atgaagactc taaatctacc accaacaatt cattttcatg gaacaataaa 420

gtaaatatgc tctacattga tcagccaaac caagtcggtt tcagttatga cgtacctacc 480

aacatcactt actctaccat caatgataca atatctgttg cggacttctc taacggtgtc 540

cctgcgcaaa atctttctac gttggttgga accggcagca gccagaaccc ttgggcaact 600

gccaataaca ctgtgaacgc tgctcgttct atctggcact ttgcacaagt gtggttccag 660

gaattccctg aacacaagcc taacaataac aagatcagta tttggacaga gtcctatgga 720

ggaagatatg gtccctcatt cgcctcttac ttccaggaac agaacgaaaa gatcaaaaac 780

cataccatta ctgaagaagg agagatgcat attctgaacc tcgacaccct cggtatcatc 840

aacggctgca tcgatcttat gttccaagca gaaagttatg ctgaattccc atacaacaac 900

acctatggca tcaaagctta taccaaggag aagcgtgacg ctatattaca cgacatccac 960

cgtcctgacg gctgcttcga caaggttacc aagtgccgtg aggccgcgaa agaaggagac 1020

cctcacttct acagcaacaa tgcaaccgtc aacacaatct gtgcggatgc taactctgcc 1080

tgcgacaaat atctaatgga tcctttccaa gagaccaatc ttggttacta tgatattgct 1140

catcctcttc aggatccctt ccccccacca ttctataagg gcttcctcag ccaatccagc 1200

gttctatctg acatgggatc gccagtcaac ttctcccaat acgcccaagc tgtgggaaaa 1260

tcattccatg gagttggcga ctacgctcgc cctgatgtgc gcggcttcac cggtgacatt 1320

gcttatcttc tcgagagcgg agtcaaggtt gctctcgtct atggtgacag agactacatc 1380

tgcaattggt tcggtggtga gcaggtcagt cttggcttga actacactgg cacccaagac 1440

ttccacaggg caaaatatgc cgatgtcaag gtcaactctt catacgtcgg aggcgtagtg 1500

cgtcaacatg gaaacttctc tttcaccaga gttttcgagg ccggtcatga agtccctggt 1560

taccaacccg agactgccct caagatcttt gagcgcatca tgttcaacaa ggatatttct 1620

accggtgaga tcgacattgc tcagaaacca gactacggta ccactggaac tgagtctacg 1680

ttccatatca aaaacgatat ccctccttcg cctgagccga cctgctacct cctcagtgct 1740

gacggaacct gtaccccgga gcagcttaat gctattaagg atggaactgc agttgttgag 1800

aactacatta ttaagagccc tgctgcgtcg aaggggaacc ctccaccaac cacgacctca 1860

tctcccacag cagcccctac cgctggaagt gccatgctaa aggctcctgt ggcaatgcta 1920

gcaatatcag ctctcactgt ccttgctttc ttcttgtag 1959

<210>18

<211>652

<212>PRT

<213>红色毛癣菌(T.rubrum)

<400>18

Met Arg Phe Ala Ala Ser Ile Ala Val Ala Leu Pro Val Ile His Ala

1 5 10 15

Ala Ser Ala Gln Gly Phe Pro Pro Pro Val Lys Gly Val Thr Val Val

20 25 30

Lys Ser Lys Phe Asp Glu Asn Val Lys Ile Thr Tyr Lys Glu Asn Asp

35 40 45

Ile Cys Glu Thr Thr Gln Gly Val Arg Ser Phe Thr Gly His Val His

50 55 60

Leu Pro Pro Asp Asn Asp Asp Phe Gly Val Tyr Arg Asn Tyr Ser Ile

65 70 75 80

Asn Thr Phe Phe Trp Phe Phe Glu Ala Arg Glu Asp Pro Lys Asn Ala

85 90 95

Pro Leu Ser Ile Trp Leu Asn Gly Gly Pro Gly Ser Ser Ser Met Ile

100 105 110

Gly Leu Phe Gln Glu Asn Gly Pro Cys Trp Val Asn Glu Asp Ser Lys

115 120 125

Ser Thr Thr Asn Asn Ser Phe Ser Trp Asn Asn Lys Val Asn Met Leu

130 135 140

Tyr Ile Asp Gln Pro Asn Gln Val Gly Phe Ser Tyr Asp Val Pro Thr

145 150 155 160

Asn Ile Thr Tyr Ser Thr Ile Asn Asp Thr Ile Ser Val Ala Asp Phe

165 170 175

Ser Asn Gly Val Pro Ala Gln Asn Leu Ser Thr Leu Val Gly Thr Gly

180 185 190

Ser Ser Gln Asn Pro Trp Ala Thr Ala Asn Asn Thr Val Asn Ala Ala

195 200 205

Arg Ser Ile Trp His Phe Ala Gln Val Trp Phe Gln Glu Phe Pro Glu

210 215 220

His Lys Pro Asn Asn Asn Lys Ile Ser Ile Trp Thr Glu Ser Tyr Gly

225 230 235 240

Gly Arg Tyr Gly Pro Ser Phe Ala Ser Tyr Phe Gln Glu Gln Asn Glu

245 250 255

Lys Ile Lys Asn His Thr Ile Thr Glu Glu Gly Glu Met His Ile Leu

260 265 270

Asn Leu Asp Thr Leu Gly Ile Ile Asn Gly Cys Ile Asp Leu Met Phe

275 280 285

Gln Ala Glu Ser Tyr Ala Glu Phe Pro Tyr Asn Asn Thr Tyr Gly Ile

290 295 300

Lys Ala Tyr Thr Lys Glu Lys Arg Asp Ala Ile Leu His Asp Ile His

305 310 315 320

Arg Pro Asp Gly Cys Phe Asp Lys Val Thr Lys Cys Arg Glu Ala Ala

325 330 335

Lys Glu Gly Asp Pro His Phe Tyr Ser Asn Asn Ala Thr Val Asn Thr

340 345 350

Ile Cys Ala Asp Ala Asn Ser Ala Cys Asp Lys Tyr Leu Met Asp Pro

355 360 365

Phe Gln Glu Thr Ash Leu Gly Tyr Tyr Asp Ile Ala His Pro Leu Gln

370 375 380

Asp Pro Phe Pro Pro Pro Phe Tyr Lys Gly Phe Leu Ser Gln Ser Ser

385 390 395 400

Val Leu Ser Asp Met Gly Ser Pro Val Asn Phe Ser Gln Tyr Ala Gln

405 410 415

Ala Val Gly Lys Ser Phe His Gly Val Gly Asp Tyr Ala Arg Pro Asp

420 425 430

Val Arg Gly Phe Thr Gly Asp Ile Ala Tyr Leu Leu Glu Ser Gly Val

435 440 445

Lys Val Ala Leu Val Tyr Gly Asp Arg Asp Tyr Ile Cys Asn Trp Phe

450 455 460

Gly Gly Glu Gln Val Ser Leu Gly Leu Asn Tyr Thr Gly Thr Gln Asp

465 470 475 480

Phe His Arg Ala Lys Tyr Ala Asp Val Lys Val Asn Ser Ser Tyr Val

485 490 495

Gly Gly Val Val Arg Gln His Gly Asn Phe Ser Phe Thr Arg Val Phe

500 505 510

Glu Ala Gly His Glu Val Pro Gly Tyr Gln Pro Glu Thr Ala Leu Lys

515 520 525

Ile Phe Glu Arg Ile Met Phe Asn Lys Asp Ile Ser Thr Gly Glu Ile

530 535 540

Asp Ile Ala Gln Lys Pro Asp Tyr Gly Thr Thr Gly Thr Glu Ser Thr

545 550 555 560

Phe His Ile Lys Asn Asp Ile Pro Pro Ser Pro Glu Pro Thr Cys Tyr

565 570 575

Leu Leu Ser Ala Asp Gly Thr Cys Thr Pro Glu Gln Leu Asn Ala Ile

580 585 590

Lys Asp Gly Thr Ala Val Val Glu Asn Tyr Ile Ile Lys Ser Pro Ala

595 600 605

Ala Ser Lys Gly Asn Pro Pro Pro Thr Thr Thr Ser Ser Pro Thr Ala

610 615 620

Ala Pro Thr Ala Gly Ser Ala Met Leu Lys Ala Pro Val Ala Met Leu

625 630 635 640

Ala Ile Ser Ala Leu Thr Val Leu Ala Phe Phe Leu

645 650

<210>19

<211>1795

<212>DNA

<213>红色毛癣菌(T.rubrum)

<220>

<221>misc_feature

<222>(283)..(283)

<223>n

<400>19

atgcaagcag caaaattgtt gagccggtac tggcaaaatg tacctggtta gtgcagctaa 60

tcttgagtca catcatgcat agttaaccga gtatcacaac acaatctact attgcgtttt 120

tgctaatggc taccatagga agactgaggg tatctgagct ccttttcgat gtccctttag 180

actactcaaa cccgtcttcc acttcgctcc ggttgttcgc caggagtgtg cagcggcgaa 240

ttccagggtc ctctctcgat gataaagaca gacagctacc ctnggattgt tttcctgcag 300

ggtggaccag gaggagcttg cccacaacct caggaggtag gctgggttgg gccattgctg 360

gatcgaggat tccaggtgag tctccagaat cgggatgagt aactgtagaa caccttgttg 420

aatttcttga ttagatcctt ctccttgacc agcgaggaac agggctttca acccctataa 480

ccgctgcgac gcttgctctt cagggaaacg cagtaaagca agccgaatat cttaggctat 540

tccgtgccga taatatcgtg cgagactgtg aagcagtgcg taaactattg actgcttatt 600

accctccaga taagcagaaa tggagcgtcc ttggccagag ttttggagga ttctgtgccg 660

tcacgtatgt ttctaagtag tgagtaacta ctccttcaaa tccacctgct atagattgtc 720

gtgcaaatct aaccttcatc atctagtcct gagggactta aagaagtctt cacaactggt 780

ggattacccc ctcttgtgtc aaagcctgat cctgtgtacg agaggaccta cggtaagttg 840

ggatagattg ggctattttt agtttaatat acagctgaca tctacagaca aggtccagtc 900

ccggaataaa gtgtactatt ccactttccc cgaagacgaa gatcgagtgc ggattatact 960

caagcatctc caaacccacg atgttaagct ccccgatggc tcaccgttaa ctccggaacg 1020

ctttctccag ctaggaattc attttggaat gaaaggtacg ccataettcg caggtgactt 1080

ctcgtaacca atgactaaca tatgcatata gggggcatcg gcttagttca tagtatgata 1140

ccatcaataa cttacattat acttattcac tgactaacaa tgtcgaaata tcaggcataa 1200

ttttgaagtg cattaatgaa ctggaatact ttggcttcct cacacgacct actttatctc 1260

tgattgagaa cgacacgagt gcagacaacg gcattctata tgccataatg catgaatcta 1320

tctactgcca agggtaaaac gtctctcctg atcgagtcaa tatcagaatc taacgtgata 1380

ccgtagggag gcctcaaact gggctgccga aagactacta ccaaagttct ctggcttccg 1440

aggcgctcat aatcctgatg gcatctactt cactggggag atggtataca aacactggtt 1500

tgagtcgtcc acagaactcg gccagctcaa agaggtagcc gatattcttg cttcctacaa 1560

tgactggccg cagttgtatg ataaggaaca gctcgcgcgc aacgaggtgc cagtgtattc 1620

cgctacatat gtcgaggata tgtacgtgca cttcagctac gccaacgaaa cagctgccac 1680

tattcacaat tgcaaacagt tcatcaccaa cacgatgtac cacaacggac tgcgttcaga 1740

ttccgctgaa cttattgcgc agctgtttgc tcttcgtgat gatacgattg actag 1795

<210>20

<211>1326

<212>DNA

<213>红色毛癣菌(T.rubrum)

<400>20

atgcaagcag caaaattgtt gagccggtac tggcaaaatg tacctggaag actgagggta 60

tctgagctcc ttttcgatgt ccctttagac tactcaaacc cgtcttccac ttcgctccgg 120

ttgttcgcca ggagtgtgca gcggcgaatt ccagggtcct ctctcgatga taaagacaga 180

cagctaccct ggattgtttt cctgcagggt ggaccaggag gagcttgccc acaacctcag 240

gaggtaggct gggttgggcc attgctggat cgaggattcc agatccttct ccttgaccag 300

cgaggaacag ggctttcaac ccctataacc gctgcgacgc ttgctcttca gggaaacgca 360

gtaaagcaag ccgaatatct taggctattc cgtgccgata atatcgtgcg agactgtgaa 420

gcagtgcgta aactattgac tgcttattac cctccagata agcagaaatg gagcgtcctt 480

ggccagagtt ttggaggatt ctgtgccgtc acgtatgttt ctaatcctga gggacttaaa 540

gaagtcttca caactggtgg attaccccct cttgtgtcaa agcctgatcc tgtgtacgag 600

aggacctacg acaaggtcca gtcccggaat aaagtgtact attccacttt ccccgaagac 660

gaagatcgag tgcggattat actcaagcat ctccaaaccc acgatgttaa gctccccgat 720

ggctcaccgt taactccgga acgctttctc cagctaggaa ttcattttgg aatgaaaggc 780

ataattttga agtgcattaa tgaactggaa tactttggct tcctcacacg acctacttta 840

tctctgattg agaacgacac gagtgcagac aacggcattc tatatgccat aatgcatgaa 900

tctatctact gccaagggga ggcctcaaac tgggctgccg aaagactact accaaagttc 960

tctggcttcc gaggcgctca taatcctgat ggcatctact tcactgggga gatggtatac 1020

aaacactggt ttgagtcgtc cacagaactc ggccagctca aagaggtagc cgatattctt 1080

gcttcctaca atgactggcc gcagttgtat gataaggaac agctcgcgcg caacgaggtg 1140

ccagtgtatt ccgctacata tgtcgaggat atgtacgtgc acttcagcta cgccaacgaa 1200

acagctgcca ctattcacaa ttgcaaacag ttcatcacca acacgatgta ccacaacgga 1260

ctgcgttcag attccgctga acttattgcg cagctgtttg ctcttcgtga tgatacgatt 1320

gactag 1326

<210>21

<211>441

<212>PRT

<213>红色毛癣菌(T.rubrum)

<220>

<221>UNSURE

<222>(283)..(283)

<223>I

<400>21

Met Gln Ala Ala Lys Leu Leu Ser Arg Tyr Trp Gln Asn Val Pro Gly

1 5 10 15

Arg Leu Arg Val Ser Glu Leu Leu Phe Asp Val Pro Leu Asp Tyr Ser

20 25 30

Asn Pro Ser Ser Thr Ser Leu Arg Leu Phe Ala Arg Ser Val Gln Arg

35 40 45

Arg Ile Pro Gly Ser Ser Leu Asp Asp Lys Asp Arg Gln Leu Pro Trp

50 55 60

Ile Val Phe Leu Gln Gly Gly Pro Gly Gly Ala Cys Pro Gln Pro Gln

65 70 75 80

Glu Val Gly Trp Val Gly Pro Leu Leu Asp Arg Gly Phe Gln Ile Leu

85 90 95

Leu Leu Asp Gln Arg Gly Thr Gly Leu Ser Thr Pro Ile Thr Ala Ala

100 105 110

Thr Leu Ala Leu Gln Gly Asn Ala Val Lys Gln Ala Glu Tyr Leu Arg

115 120 125

Leu Phe Arg Ala Asp Asn Ile Val Arg Asp Cys Glu Ala Val Arg Lys

130 135 140

Leu Leu Thr Ala Tyr Tyr Pro Pro Asp Lys Gln Lys Trp Ser Val Leu

145 150 155 160

Gly Gln Ser Phe Gly Gly Phe Cys Ala Val Thr Tyr Val Ser Asn Pro

165 170 175

Glu Gly Leu Lys Glu Val Phe Thr Thr Gly Gly Leu Pro Pro Leu Val

180 185 190

Ser Lys Pro Asp Pro Val Tyr Glu Arg Thr Tyr Asp Lys Val Gln Ser

195 200 205

Arg Asn Lys Val Tyr Tyr Ser Thr Phe Pro Glu Asp Glu Asp Arg Val

210 215 220

Arg Ile Ile Leu Lys His Leu Gln Thr His Asp Val Lys Leu Pro Asp

225 230 235 240

Gly Ser Pro Leu Thr Pro Glu Arg Phe Leu Gln Leu Gly Ile His Phe

245 250 255

Gly Met Lys Gly Ile Ile Leu Lys Cys Ile Asn Glu Leu Glu Tyr Phe

260 265 270

Gly Phe Leu Thr Arg Pro Thr Leu Ser Leu Ile Glu Asn Asp Thr Ser

275 280 285

Ala Asp Asn Gly Ile Leu Tyr Ala Ile Met His Glu Ser Ile Tyr Cys

290 295 300

Gln Gly Glu Ala Ser Asn Trp Ala Ala Glu Arg Leu Leu Pro Lys Phe

305 310 315 320

Ser Gly Phe Arg Gly Ala His Asn Pro Asp Gly Ile Tyr Phe Thr Gly

325 330 335

Glu Met Val Tyr Lys His Trp Phe Glu Ser Ser Thr Glu Leu Gly Gln

340 345 350

Leu Lys Glu Val Ala Asp Ile Leu Ala Ser Tyr Asn Asp Trp Pro Gln

355 360 365

Leu Tyr Asp Lys Glu Gln Leu Ala Arg Asn Glu Val Pro Val Tyr Ser

370 375 380

Ala Thr Tyr Val Glu Asp Met Tyr Val His Phe Ser Tyr Ala Asn Glu

385 390 395 400

Thr Ala Ala Thr Ile His Asn Cys Lys Gln Phe Ile Thr Asn Thr Met

405 410 415

Tyr His Asn Gly Leu Arg Ser Asp Ser Ala Glu Leu Ile Ala Gln Leu

420 425 430

Phe Ala Leu Arg Asp Asp Thr Ile Asp

435 440

<210>22

<211>2418

<212>DNA

<213>红色毛癣菌(T.rubrum)

<400>22

atgccgccac caccggttga cacgacccag cgtctcgcaa agctgcgaga gctgatggct 60

cagaacaagg tcgatgtata tagtatgcaa ttcagataca ccattaaagc tcccttgata 120

ataacagtcg tatactcatt cttctttctt ctactcctcg ccttaaagtt gtgccttcgg 180

aagacagcca tcagtcggag tacattgctc catgtgatgg gcgtcgaggt tagacctgtc 240

cctccataaa agaataccta cccgtaatac cagccggcag acgctcatac gtatcactgc 300

agctttcata tccagcttca ctggctcggc aggatgtgcc atcgtctcta tgagtaaagc 360

tgctctgtct acagacggca gatacttcag ccaagctgca aaacagctcg atgccaactg 420

gatcctgttg aagcgaggtg tcgagggtgt cccaacctgg gaagaatggt atatctgccc 480

ctggtatcga cttttccggt ataatggttg acaggctgga tataggaccg ctgagcaggc 540

cgagacacgg caaggttgtg ggtgttgacc cgtcacttat tacggcaggt gagaatctac 600

agtatgcgtc tcttacaagt gtcatcgtga ctaactgtat gttatagcgg atgcacgaaa 660

gctttctcag acgttgaaga ccaccggagg ctccttggtt ggaattgatc agaacctgat 720

tgatgccgtc tggggagatg aacgtcctgc acggcctgcc aaccaaatta cggtacagcc 780

tgttgagcgc gcgggaaagt cattcgagga gaaagtggaa gacctgcgaa aggaattgac 840

tgcgaagaag aggtctgcta tggttatttg tatgacgcta gatctatttt tgatcaaaca 900

tatactaaca aacgcaatat agccaccttg gatgagattg catggctctt caacctccgt 960

ggaagcgagt aagtttctat ataaatggta tctttcactt tatacaaaaa gccatgctga 1020

ctggtgtagt attccatata accccgtctt tttctcgtac gcaattgtga cgccctcagt 1080

tgcggaactc tatgtcgatg agagcaagct gtctccagaa gccagaaaac atctcgaagg 1140

caaggtcgtt ctcaagccat acgagtccat cttccaagct tccaaagtcc tcgccgaatc 1200

aaaggcatcg gctagcagcg gttcctctgg gaagttcttg ttgtctaaca aggcttcgtg 1260

gtctttgagc ctcgccctcg gtggggaaca gaacgtcgtt gaggttcgaa gtcccatcac 1320

tgacgccaaa gccatcaaga acgaagttga actggaagga ttcagaaaat gccatatccg 1380

agacggtgca gctctgatcg agtacttcgc ctggcttgaa aatgcattga tcaaagaagg 1440

tgccaagcta gacgaagtag atggagccga caaactcttc gagatccgca agaaatatga 1500

cctcttcgtc ggcaactcct tcgacaccat ctcttctacc ggtgctaacg gtgctaccat 1560

tcattacaaa cccgagaagt caacttgcgc tatcattgac ccgaaggcta tgtacctgtg 1620

tgactctggt ggccaatacc ttgatggtac tactgatact acccgaactc tccactttgg 1680

agagcccacg gagttccaga agaaggctta tgcacttgtt ctaaagggac atatcagcat 1740

tgacaatgcc attttcccca aaggaaccac cggatacgcc attgactcgt ttgctcgaca 1800

gcatttgtgg aaggagggtc tggattacct ccacggcacc ggtcatggtg ttggctcatt 1860

tttggtacgg ggtttccttt ttcttttttt tttctttttt tatttttatt attacttctc 1920

ttaggctaac acattctctc taagaacgtc catgagggac ctatgggcat aggaagccgt 1980

gctcagtacg ctgaagttcc tctctctgcc agcaatgttc tttccaacgg taggatttct 2040

gcatctcatc tttcttgaat cctactaatt gcaaaataga gcctggatat tatgaagacg 2100

gcaacttcgg cattcgtctc gagagtaagt tcaatgactg cgtattctag ttttttcata 2160

ctgacggcct ctttagacct cgtaatctgc aaggaggtcc agactgcaca caaattcggc 2220

gacaagccct tcctcggatt tgagtccatc accctggtac ctttctgcca aaaactcctt 2280

gatgcttctc tcttgaccga agctgagaga aagtgggtga atgattacca tgcgaaagtc 2340

tgggagaaga ccagtccctt ctttgagaag gacgagttaa caaccgcctg gctaaagcgc 2400

gagacacaac ctatttaa 2418

<210>23

<211>1878

<212>DNA

<213>红色毛癣菌(T.rubrum)

<400>23

atgccgccac caccggttga cacgacccag cgtctcgcaa agctgcgaga gctgatggct 60

cagaacaagg tcgatgtata tattgtgcct tcggaagaca gccatcagtc ggagtacatt 120

gctccatgtg atgggcgtcg agctttcata tccagcttca ctggctcggc aggatgtgcc 180

atcgtctcta tgagtaaagc tgctctgtct acagacggca gatacttcag ccaagctgca 240

aaacagctcg atgccaactg gatcctgttg aagcgaggtg tcgagggtgt cccaacctgg 300

gaagaatgga ccgctgagca ggccgagaca cggcaaggtt gtgggtcgga tgcacgaaag 360

ctttctcaga cgttgaagac caccggaggc tccttggttg gaattgatca gaacctgatt 420

gatgccgtct ggggagatga acgtcctgca cggcctgcca accaaattac ggtacagcct 480

gttgagcgcg cgggaaagtc attcgaggag aaagtggaag acctgcgaaa ggaattgact 540

gcgaagaaga ggtctgctat ggttatttcg agtaagtttc tatataaatg gtatctttca 600

ctttatacaa aaagccatgc tgactggtgt agtattccat ataaccccgt ctttttctcg 660

tacgcaattg tgacgccctc agttgcggaa ctctatgtcg atgagagcaa gctgtctcca 720

gaagccagaa aacatctcga aggcaaggtc gttctcaagc catacgagtc catcttccaa 780

gcttccaaag tcctcgccga atcaaaggca tcggctagca gcggttcctc tgggaagttc 840

ttgttgtcta acaaggcttc gtggtctttg agcctcgccc tcggtgggga acagaacgtc 900

gttgaggttc gaagtcccat cactgacgcc aaagccatca agaacgaagt tgaactggaa 960

ggattcagaa aatgccatat ccgagacggt gcagctctga tcgagtactt cgcctggctt 1020

gaaaatgcat tgatcaaaga aggtgccaag ctagacgaag tagatggagc cgacaaactc 1080

ttcgagatcc gcaagaaata tgacctcttc gtcggcaact ccttcgacac catctcttct 1140

accggtgcta acggtgctac cattcattac aaacccgaga agtcaacttg cgctatcatt 1200

gacccgaagg ctatgtacct gtgtgactct ggtggccaat accttgatgg tactactgat 1260

actacccgaa ctctccactt tggagagccc acggagttcc agaagaaggc ttatgcactt 1320

gttctaaagg gacatatcag cattgacaat gccattttcc ccaaaggaac caccggatac 1380

gccattgact cgtttgctcg acagcatttg tggaaggagg gtctggatta cctccacggc 1440

accggtcatg gtgttggctc atttttgaac gtccatgagg gacctatggg cataggaagc 1500

cgtgctcagt acgctgaagt tcctctctct gccagcaata gcctggatat tatgaagacg 1560

gcaacttcgg cattcgtctc gagagtaagt tcaatgactg cgtattctag ttttttcata 1620

ctgacggcct ctttagacct cgtaatctgc aaggaggtcc agactgcaca caaattcggc 1680

gacaagccct tcctcggatt tgagtccatc accctggtac ctttctgcca aaaactcctt 1740

gatgcttctc tcttgaccga agctgagaga aagtgggtga atgattacca tgcgaaagtc 1800

tgggagaaga ccagtccctt ctttgagaag gacgagttaa caaccgcctg gctaaagcgc 1860

gagacacaac ctatttaa 1878

<210>24

<211>625

<212>PRT

<213>红色毛癣菌(T.rubrum)

<400>24

Met Pro Pro Pro Pro Val Asp Thr Thr Gln Arg Leu Ala Lys Leu Arg

1 5 10 15

Glu Leu Met Ala Gln Asn Lys Val Asp Val Tyr Ile Val Pro Ser Glu

20 25 30

Asp Ser His Gln Ser Glu Tyr Ile Ala Pro Cys Asp Gly Arg Arg Ala

35 40 45

Phe Ile Ser Ser Phe Thr Gly Ser Ala Gly Cys Ala Ile Val Ser Met

50 55 60

Ser Lys Ala Ala Leu Ser Thr Asp Gly Arg Tyr Phe Ser Gln Ala Ala

65 70 75 80

Lys Gln Leu Asp Ala Asn Trp Ile Leu Leu Lys Arg Gly Val Glu Gly

85 90 95

Val Pro Thr Trp Glu Glu Trp Thr Ala Glu Gln Ala Glu Thr Arg Gln

100 105 110

Gly Cys Gly Ser Asp Ala Arg Lys Leu Ser Gln Thr Leu Lys Thr Thr

115 120 125

Gly Gly Ser Leu Val Gly Ile Asp Gln Asn Leu Ile Asp Ala Val Trp

130 135 140

Gly Asp Glu Arg Pro Ala Arg Pro Ala Asn Gln Ile Thr Val Gln Pro

145 150 155 160

Val Glu Arg Ala Gly Lys Ser Phe Glu Glu Lys Val Glu Asp Leu Arg

165 170 175

Lys Glu Leu Thr Ala Lys Lys Arg Ser Ala Met Val Ile Ser Ser Lys

180 185 190

Phe Leu Tyr Lys Trp Tyr Leu Ser Leu Tyr Thr Lys Ser His Ala Asp

195 200 205

Trp Cys Ser Ile Pro Tyr Asn Pro Val Phe Phe Ser Tyr Ala Ile Val

210 215 220

Thr Pro Ser Val Ala Glu Leu Tyr Val Asp Glu Ser Lys Leu Ser Pro

225 230 235 240

Glu Ala Arg Lys His Leu Glu Gly Lys Val Val Leu Lys Pro Tyr Glu

245 250 255

Ser Ile Phe Gln Ala Ser Lys Val Leu Ala Glu Ser Lys Ala Ser Ala

260 265 270

Ser Ser Gly Ser Ser Gly Lys Phe Leu Leu Ser Asn Lys Ala Ser Trp

275 280 285

Ser Leu Ser Leu Ala Leu Gly Gly Glu Gln Asn Val Val Glu Val Arg

290 295 300

Ser Pro Ile Thr Asp Ala Lys Ala Ile Lys Asn Glu Val Glu Leu Glu

305 310 315 320

Gly Phe Arg Lys Cys His Ile Arg Asp Gly Ala Ala Leu Ile Glu Tyr

325 330 335

Phe Ala Trp Leu Glu Asn Ala Leu Ile Lys Glu Gly Ala Lys Leu Asp

340 345 350

Glu Val Asp Gly Ala Asp Lys Leu Phe Glu Ile Arg Lys Lys Tyr Asp

355 360 365

Leu Phe Val Gly Asn Ser Phe Asp Thr Ile Ser Ser Thr Gly Ala Asn

370 375 380

Gly Ala Thr Ile His Tyr Lys Pro Glu Lys Ser Thr Cys Ala Ile Ile

385 390 395 400

Asp Pro Lys Ala Met Tyr Leu Cys Asp Ser Gly Gly Gln Tyr Leu Asp

405 410 415

Gly Thr Thr Asp Thr Thr Arg Thr Leu His Phe Gly Glu Pro Thr Glu

420 425 430

Phe Gln Lys Lys Ala Tyr Ala Leu Val Leu Lys Gly His Ile Ser Ile

435 440 445

Asp Asn Ala Ile Phe Pro Lys Gly Thr Thr Gly Tyr Ala Ile Asp Ser

450 455 460

Phe Ala Arg Gln His Leu Trp Lys Glu Gly Leu Asp Tyr Leu His Gly

465 470 475 480

Thr Gly His Gly Val Gly Ser Phe Leu Asn Val His Glu Gly Pro Met

485 490 495

Gly Ile Gly Ser Arg Ala Gln Tyr Ala Glu Val Pro Leu Ser Ala Ser

500 505 510

Asn Ser Leu Asp Ile Met Lys Thr Ala Thr Ser Ala Phe Val Ser Arg

515 520 525

Val Ser Ser Met Thr Ala Tyr Ser Ser Phe Phe Ile Leu Thr Ala Ser

530 535 540

Leu Asp Leu Val Ile Cys Lys Glu Val Gln Thr Ala His Lys Phe Gly

545 550 555 560

Asp Lys Pro Phe Leu Gly Phe Glu Ser Ile Thr Leu Val Pro Phe Cys

565 570 575

Gln Lys Leu Leu Asp Ala Ser Leu Leu Thr Glu Ala Glu Arg Lys Trp

580 585 590

Val Asn Asp Tyr His Ala Lys Val Trp Glu Lys Thr Ser Pro Phe Phe

595 600 605

Glu Lys Asp Glu Leu Thr Thr Ala Trp Leu Lys Arg Glu Thr Gln Pro

610 615 620

Ile

625

<210>25

<211>2344

<212>DNA

<213>红色毛癣菌(T.rubrum)

<400>25

atcaacctca cctcttcacc gtctcacgcc cttcgtcccg tccaactctt catttcgccc 60

tctctatgat aaccaacaaa catccgctgt tatgtaatcg aacccgccgt tagccatccc 120

tagccccgcg ttttctccca gcatcaatac gaccgaaatg aagacagacg gggaagacga 180

ggcaaaacaa taacacatca acaatttaac ccgttgccgt cttctaccca tcttgtctac 240

gcatcgtcca accttttctt gccctatatc agccgaactc ggccatcatg gatatccacg 300

tcgacaaata cccggctaag agtcacgcca ggcgcgtcgc cgagaagctc aaggccgcgg 360

ggcacggctc taccggcatc atcttcgtcg aaggccaaaa ggagcatatt atcgatgata 420

gcgacgagcc gtttcacttc cggtgagccg tgggaataca ctcgactggg cggaataagc 480

taacaaaagg gtgtgatagt caacgccgaa acttcctcta tctgtccggc tgtcttgagg 540

ccgagtgctc cgttgcatac aacatcgaga aagatgagct tacattgttc attccaccag 600

tcgacccagc ctcggttatg tggtccggcc tccctcttga gcccgccgaa gccttgaagc 660

agttcgatgt tgatgccgtg ctcctcacaa ctgagataaa caactatctc gcgaagtgtg 720

ggggcgagaa ggtcttcacc attgcagaca gagtttgccc ggaggtctcc ttctcatcct 780

tcaagcacaa cgacaccgat gccctgaagc ttgccatcga gtcctgccgt atagtgaaag 840

acgagtatga aattggtctt ctccgacgtg ctaatgaggt ctccagccaa gctcatattg 900

aagtgatgaa agccgcaacc aagtcaaaga acgagagaga gctctatgct actctcaact 960

atgtctgcat gtctaatggc tgctccgacc agtcttacca tccaattctt gcatgtggcc 1020

ccaatgctgc cactctccac tacaccaaga acaacggtga cctaactaac ccggctaccg 1080

ggattaagga ccagctcgta cttatcgacg ctggatgcca gtacaaggcg tactgtgcag 1140

atatcactcg tgcattcccc ttgtccggca aattcaccac ggagggccgc cagatctatg 1200

atattgcctt ggagatgcag aaagtcgcgt ttggcatgat caaacctaat gttttgttcg 1260

acgacatgca tgctgcggtc caccgggttg cgatcaaggg gctgctcaag attggcattc 1320

tcactggctc tgaggatgag attttcgata agggaatcag cactgccttt ttcccacatg 1380

gtctaggcca ccatctcggc atggacactc acgatgttgg aggaaaccct aacccggctg 1440

acccgaatcg catgtttaaa tacttgcgtc tgcgaggcac tgttccagag ggatccgtca 1500

ttacaattga gcccggtgta agtgttgaat cgagtagttg ctccgccgaa tgtttcacat 1560

acatttacta acccttgctc taggtctact tctgccgtta catcattgag ccattcctta 1620

ctaaccccga gaccagcaag tacatcaact ccgaagttct agacaagtac tgggctgttg 1680

gaggtgtacg tatcgaggac aacgtcgtcg tccgcgccaa tggctttgag aacctgacca 1740

cggtgccaaa ggagcccgag gaggtcgaac gcattgtcca ggagggtgct aaataattat 1800

gtttttattc agtacaccga gtggtcggac acacgcagga gcatgtacat atttatgatc 1860

tacccagttg atttgctacc aaaaaagaac cgaccacagc cctatttatt gatattacat 1920

agtaggaata aaggccactt tgcccaccgc gaataataac aataagaaaa gcaactactc 1980

gtacaaccag cctagaaagc tctagacctc tttctcgctg ggcccttgaa tgccgggcta 2040

ctggtgttat cacgctccct ggccctcttc tccttcatgt ccaacacccg attaagcaaa 2100

tcgaaactga actggggatg ctcaagacac aatgccttga actgctcttc agcatcatga 2160

cgcagcacat cactcatctt agcccagaag cgagcaaccg gtcctctgat agcagtgtct 2220

tccggcgtgg tatggctgta cacgtatctc gcatactcga tctcacccgt agcactactc 2280

tcgatgctac caatcttgtt ctgagcaagc agtttgagtt tttcgtttcc gagcttttcg 2340

gcca 2344

<210>26

<211>1401

<212>DNA

<213>红色毛癣菌(T.rubrum)

<400>26

ccgaactcgg ccatcatgga tatccacgtc gacaaatacc cggctaagag tcacgccagg 60

cgcgtcgccg agaagctcaa ggccgcgggg cacggctcta ccggcatcat cttcgtcgaa 120

ggccaaaagg agcatattat cgatgatagc gacgagccgt ttcacttccg tcaacgccga 180

aacttcctct atctgtccgg ctgtcttgag gccgagtgct ccgttgcata caacatcgag 240

aaagatgagc ttacattgtt cattccacca gtcgacccag cctcggttat gtggtccggc 300

ctccctcttg agcccgccga agccttgaag cagttcgatg ttgatgccgt gctcctcaca 360

actgagataa acaactatct cgcgaagtgt gggggcgaga aggtcttcac cattgcagac 420

agagtttgcc cggaggtctc cttctcatcc ttcaagcaca acgacaccga tgccctgaag 480

cttgccatcg agtcctgccg tatagtgaaa gacgagtatg aaattggtct tctccgacgt 540

gctaatgagg tctccagcca agctcatatt gaagtgatga aagccgcaac caagtcaaag 600

aacgagagag agctctatgc tactctcaac tatgtctgca tgtctaatgg ctgctccgac 660

cagtcttacc atccaattct tgcatgtggc cccaatgctg ccactctcca ctacaccaag 720

aacaacggtg acctaactaa cccggctacc gggattaagg accagctcgt acttatcgac 780

gctggatgcc agtacaaggc gtactgtgca gatatcactc gtgcattccc cttgtccggc 840

aaattcacca cggagggccg ccagatctat gatattgcct tggagatgca gaaagtcgcg 900

tttggcatga tcaaacctaa tgttttgttc gacgacatgc atgctgcggt ccaccgggtt 960

gcgatcaagg ggctgctcaa gattggcatt ctcactggct ctgaggatga gattttcgat 1020

aagggaatca gcactgcctt tttcccacat ggtctaggcc accatctcgg catggacact 1080

cacgatgttg gaggaaaccc taacccggct gacccgaatc gcatgtttaa atacttgcgt 1140

ctgcgaggca ctgttccaga gggatccgtc attacaattg agcccggtgt ctacttctgc 1200

cgttacatca ttgagccatt ccttactaac cccgagacca gcaagtacat caactccgaa 1260

gttctagaca agtactgggc tgttggaggt gtacgtatcg aggacaacgt cgtcgtccgc 1320

gccaatggct ttgagaacct gaccacggtg ccaaaggagc ccgaggaggt cgaacgcatt 1380

gtccaggagg gtgctaaata a 1401

<210>27

<211>466

<212>PRT

<213>红色毛癣菌(T.rubrum)

<400>27

Pro Asn Ser Ala Ile Met Asp Ile His Val Asp Lys Tyr Pro Ala Lys

1 5 10 15

Ser His Ala Arg Arg Val Ala Glu Lys Leu Lys Ala Ala Gly His Gly

20 25 30

Ser Thr Gly Ile Ile Phe Val Glu Gly Gln Lys Glu His Ile Ile Asp

35 40 45

Asp Ser Asp Glu Pro Phe His Phe Arg Gln Arg Arg Asn Phe Leu Tyr

50 55 60

Leu Ser Gly Cys Leu Glu Ala Glu Cys Ser Val Ala Tyr Asn Ile Glu

65 70 75 80

Lys Asp Glu Leu Thr Leu Phe Ile Pro Pro Val Asp Pro Ala Ser Val

85 90 95

Met Trp Ser Gly Leu Pro Leu Glu Pro Ala Glu Ala Leu Lys Gln Phe

100 105 110

Asp Val Asp Ala Val Leu Leu Thr Thr Glu Ile Asn Asn Tyr Leu Ala

115 120 125

Lys Cys Gly Gly Glu Lys Val Phe Thr Ile Ala Asp Arg Val Cys Pro

130 135 140

Glu Val Ser Phe Ser Ser Phe Lys His Asn Asp Thr Asp Ala Leu Lys

145 150 155 160

Leu Ala Ile Glu Ser Cys Arg Ile Val Lys Asp Glu Tyr Glu Ile Gly

165 170 175

Leu Leu Arg Arg Ala Asn Glu Val Ser Ser Gln Ala His Ile Glu Val

180 185 190

Met Lys Ala Ala Thr Lys Ser Lys Asn Glu Arg Glu Leu Tyr Ala Thr

195 200 205

Leu Asn Tyr Val Cys Met Ser Asn Gly Cys Ser Asp Gln Ser Tyr His

210 215 220

Pro Ile Leu Ala Cys Gly Pro Asn Ala Ala Thr Leu His Tyr Thr Lys

225 230 235 240

Asn Asn Gly Asp Leu Thr Asn Pro Ala Thr Gly Ile Lys Asp Gln Leu

245 250 255

Val Leu Ile Asp Ala Gly Cys Gln Tyr Lys Ala Tyr Cys Ala Asp Ile

260 265 270

Thr Arg Ala Phe Pro Leu Ser Gly Lys Phe Thr Thr Glu Gly Arg Gln

275 280 285

Ile Tyr Asp Ile Ala Leu Glu Met Gln Lys Val Ala Phe Gly Met Ile

290 295 300

Lys Pro Asn Val Leu Phe Asp Asp Met His Ala Ala Val His Arg Val

305 310 315 320

Ala Ile Lys Gly Leu Leu Lys Ile Gly Ile Leu Thr Gly Ser Glu Asp

325 330 335

Glu Ile Phe Asp Lys Gly Ile Ser Thr Ala Phe Phe Pro His Gly Leu

340 345 350

Gly His His Leu Gly Met Asp Thr His Asp Val Gly Gly Asn Pro Asn

355 360 365

Pro Ala Asp Pro Asn Arg Met Phe Lys Tyr Leu Arg Leu Arg Gly Thr

370 375 380

Val Pro Glu Gly Ser Val Ile Thr Ile Glu Pro Gly Val Tyr Phe Cys

385 390 395 400

Arg Tyr Ile Ile Glu Pro Phe Leu Thr Asn Pro Glu Thr Ser Lys Tyr

405 410 415

Ile Asn Ser Glu Val Leu Asp Lys Tyr Trp Ala Val Gly Gly Val Arg

420 425 430

Ile Glu Asp Asn Val Val Val Arg Ala Asn Gly Phe Glu Asn Leu Thr

435 440 445

Thr Val Pro Lys Glu Pro Glu Glu Val Glu Arg Ile Val Gln Glu Gly

450 455 460

Ala Lys

465

<210>28

<211>1730

<212>DNA

<213>犬小孢子菌(Microsporum canis)

<400>28

atgaagacac agttgttgag tctgggagtt gccctcacgg ccatctctca gggcgttatt 60

gctgaggatg ccttgaactg gccattcaag ccgttggtta atgctgtgag tatatacaca 120

agatcgatcg atcgtcctct tgtccctgtc acttatcgct ctacagtaag caaaaatact 180

ggagaatcat gtgctgatgt aaatgtatag gatgacctgc aaaacaagat taagctcaag 240

gatcttatgg ctggcgtaca gaaactccaa gacttcgcct acgctcaccc tgagaagaat 300

cgagtattcg gtggtgctgg ccacaaggat accgtcgact ggatctacaa tgagctcaag 360

gctaccggct actacgatgt gaagatgcag ccacaagtcc acctgtggtc tcatgctgag 420

gcagctgtca atgccaatgg caaggatctc actgccagtg ccatgtccta cagccctcca 480

gccgacaaga tcactgccga gcttgtcctg gccaagaaca tgggatgcaa tgctgtatgt 540

gcgccccttt tccattctat atatcgactg gtcgcttgga aattcagaag agctgacaat 600

tgcaaacaga ctgattaccc agagggtacc aagggcaaga ttgtcctcat cgagcgtggt 660

gtctgcagct ttggcgagaa gtccgctcag gctggcgatg caaaggctat tggtgccatc 720

gtctacaaca acgtccctgg aagcttggcc ggcaccctgg gtggccttga caaccgccat 780

gctccaactg ctggaatctc tcaggctgat ggaaagaacc tcgctagcct tgtcgcctct 840

ggcaaggtta ccgtcaccat gaacgttatc agcaagtttg agaacaggac tacgtgagta 900

ttgttccata ctttggtcaa caatgatata tacacgtact aacactgctc tatagctgga 960

acgtcattgc cgagaccaag ggaggagacc acaacaacgt catcatgctc ggttctcact 1020

ctgactctgt cgacgccggc cctggtatca acgacaacgg ctccggtacc attggtatca 1080

tgaccgttgc caaagccctc accaacttca aggtcaacaa cgccgtccgc ttcggctggt 1140

ggaccgccga ggagttcggc cttctcggca gcactttcta cgtcgacagc cttgacgacc 1200

gtgaactgca caaggtcaag ctgtacctca acttcgacat gattggctcc cccaacttcg 1260

ccaaccagat ctacgacgga gacggctccg cctacaacat gactggcccc gccggatctg 1320

ctgaaatcga gtacctgttc gagaagttct tcgatgacca gggaatccca caccagccca 1380

ccgccttcac cggccgctcc gactactctg ccttcatcaa gcgcaacgtc cctgccggag 1440

gtctgtttac tggtgctgag gtcgtcaaga ccgccgagca ggctaagcta tttggcggcg 1500

aggctggcgt tgcttatgac aagaactacc acggcaaggg cgacactgta gacaacatca 1560

acaagggtgc tatctacctc aacactcgag gaatcgcgta tgccactgct cagtatgcta 1620

gttcgctgcg cggattccca acccgcccaa agacgggtaa gcgtgacgtg agcccccgtg 1680

gccagtctat gcctggtggt ggatgcggac accacagcgt cttcatgtaa 1730

<210>29

<211>1488

<212>DNA

<213>犬小孢子菌(Microsporum canis)

<400>29

atgaagacac agttgttgag tctgggagtt gccctcacgg ccatctctca gggcgttatt 60

gctgaggatg ccttgaactg gccattcaag ccgttggtta atgctgatga cctgcaaaac 120

aagattaagc tcaaggatct tatggctggc gtacagaaac tccaagactt cgcctacgct 180

caccctgaga agaatcgagt attcggtggt gctggccaca aggataccgt cgactggatc 240

tacaatgagc tcaaggctac cggctactac gatgtgaaga tgcagccaca agtccacctg 300

tggtctcatg ctgaggcagc tgtcaatgcc aatggcaagg atctcactgc cagtgccatg 360

tcctacagcc ctccagccga caagatcact gccgagcttg tcctggccaa gaacatggga 420

tgcaatgcta ctgattaccc agagggtacc aagggcaaga ttgtcctcat cgagcgtggt 480

gtctgcagct ttggcgagaa gtccgctcag gctggcgatg caaaggctat tggtgccatc 540

gtctacaaca acgtccctgg aagcttggcc ggcaccctgg gtggccttga caaccgccat 600

gctccaactg ctggaatctc tcaggctgat ggaaagaacc tcgctagcct tgtcgcctct 660

ggcaaggtta ccgtcaccat gaacgttatc agcaagtttg agaacaggac tacctggaac 720

gtcattgccg agaccaaggg aggagaccac aacaacgtca tcatgctcgg ttctcactct 780

gactctgtcg acgccggccc tggtatcaac gacaacggct ccggtaccat tggtatcatg 840

accgttgcca aagccctcac caacttcaag gtcaacaacg ccgtccgctt cggctggtgg 900

accgccgagg agttcggcct tctcggcagc actttctacg tcgacagcct tgacgaccgt 960

gaactgcaca aggtcaagct gtacctcaac ttcgacatga ttggctcccc caacttcgcc 1020

aaccagatct acgacggaga cggctccgcc tacaacatga ctggccccgc cggatctgct 1080

gaaatcgagt acctgttcga gaagttcttc gatgaccagg gaatcccaca ccagcccacc 1140

gccttcaccg gccgctccga ctactctgcc ttcatcaagc gcaacgtccc tgccggaggt 1200

ctgtttactg gtgctgaggt cgtcaagacc gccgagcagg ctaagctatt tggcggcgag 1260

gctggcgttg cttatgacaa gaactaccac ggcaagggcg acactgtaga caacatcaac 1320

aagggtgcta tctacctcaa cactcgagga atcgcgtatg ccactgctca gtatgctagt 1380

tcgctgcgcg gattcccaac ccgcccaaag acgggtaagc gtgacgtgag cccccgtggc 1440

cagtctatgc ctggtggtgg atgcggacac cacagcgtct tcatgtaa 1488

<210>30

<211>495

<212>PRT

<213>犬小孢子菌(Microsporum canis)

<400>30

Met Lys Thr Gln Leu Leu Ser Leu Gly Val Ala Leu Thr Ala Ile Ser

1 5 10 15

Gln Gly Val Ile Ala Glu Asp Ala Leu Asn Trp Pro Phe Lys Pro Leu

20 25 30

Val Asn Ala Asp Asp Leu Gln Asn Lys Ile Lys Leu Lys Asp Leu Met

35 40 45

Ala Gly Val Gln Lys Leu Gln Asp Phe Ala Tyr Ala His Pro Glu Lys

50 55 60

Asn Arg Val Phe Gly Gly Ala Gly His Lys Asp Thr Val Asp Trp Ile

65 70 75 80

Tyr Asn Glu Leu Lys Ala Thr Gly Tyr Tyr Asp Val Lys Met Gln Pro

85 90 95

Gln Val His Leu Trp Ser His Ala Glu Ala Ala Val Asn Ala Asn Gly

100 105 110

Lys Asp Leu Thr Ala Ser Ala Met Ser Tyr Ser Pro Pro Ala Asp Lys

115 120 125

Ile Thr Ala Glu Leu Val Leu Ala Lys Asn Met Gly Cys Asn Ala Thr

130 135 140

Asp Tyr Pro Glu Gly Thr Lys Gly Lys Ile Val Leu Ile Glu Arg Gly

145 150 155 160

Val Cys Ser Phe Gly Glu Lys Ser Ala Gln Ala Gly Asp Ala Lys Ala

165 170 175

Ile Gly Ala Ile Val Tyr Asn Asn Val Pro Gly Ser Leu Ala Gly Thr

180 185 190

Leu Gly Gly Leu Asp Asn Arg His Ala Pro Thr Ala Gly Ile Ser Gln

195 200 205

Ala Asp Gly Lys Asn Leu Ala Ser Leu Val Ala Ser Gly Lys Val Thr

210 215 220

Val Thr Met Asn Val Ile Ser Lys Phe Glu Asn Arg Thr Thr Trp Asn

225 230 235 240

Val Ile Ala Glu Thr Lys Gly Gly Asp His Asn Asn Val Ile Met Leu

245 250 255

Gly Ser His Ser Asp Ser Val Asp Ala Gly Pro Gly Ile Asn Asp Asn

260 265 270

Gly Ser Gly Thr Ile Gly Ile Met Thr Val Ala Lys Ala Leu Thr Asn

275 280 285

Phe Lys Val Asn Asn Ala Val Arg Phe Gly Trp Trp Thr Ala Glu Glu

290 295 300

Phe Gly Leu Leu Gly Ser Thr Phe Tyr Val Asp Ser Leu Asp Asp Arg

305 310 315 320

Glu Leu His Lys Val Lys Leu Tyr Leu Asn Phe Asp Met Ile Gly Ser

325 330 335

Pro Asn Phe Ala Asn Gln Ile Tyr Asp Gly Asp Gly Ser Ala Tyr Asn

340 345 350

Met Thr Gly Pro Ala Gly Ser Ala Glu Ile Glu Tyr Leu Phe Glu Lys

355 360 365

Phe Phe Asp Asp Gln Gly Ile Pro His Gln Pro Thr Ala Phe Thr Gly

370 375 380

Arg Ser Asp Tyr Ser Ala Phe Ile Lys Arg Asn Val Pro Ala Gly Gly

385 390 395 400

Leu Phe Thr Gly Ala Glu Val Val Lys Thr Ala Glu Gln Ala Lys Leu

405 410 415

Phe Gly Gly Glu Ala Gly Val Ala Tyr Asp Lys Asn Tyr His Gly Lys

420 425 430

Gly Asp Thr Val Asp Asn Ile Asn Lys Gly Ala Ile Tyr Leu Asn Thr

435 440 445

Arg Gly Ile Ala Tyr Ala Thr Ala Gln Tyr Ala Ser Ser Leu Arg Gly

450 455 460

Phe Pro Thr Arg Pro Lys Thr Gly Lys Arg Asp Val Ser Pro Arg Gly

465 470 475 480

Gln Ser Met Pro Gly Gly Gly Cys Gly His His Ser Val Phe Met

485 490 495

<210>31

<211>1775

<212>DNA

<213>须癣毛癣菌(T.mentagrophytes)

<400>31

atgaagtcgc aactgttgag cctagccgtg gccgtcacca ccatttccca gggcgttgtt 60

ggtcaagagc cctttggatg gcccttcaag cctatggtca ctcaggtgag ttgctgtcaa 120

cagatcgatc gatcgatcta ccttcgtccc tgtcacctat aactccacag caggaccaag 180

aaaacacaag ttttccgggg aattcttatg tgctgatgta aatgtatagg atgacctgca 240

aaacaagatt aagctcaagg atatcatggc aggtgtcgag aagctgcaaa gcttttctga 300

tgctcatcct gaaaagaacc gagtgttcgg tggtaatggc cacaaggaca ctgtcgagtg 360

gatctacaat gagctcaagg ccaccggcta ctacaatgtg aagaagcagg agcaggtaca 420

cctgtggtct cacgctgagg ccgctctcag tgccaatggc aaggacctca aggccagcgc 480

catgtcgtac agccctcctg ccaacaagat catggccgag cttgtcgttg ccaagaacaa 540

tggctgcaat gctgtaagtg ccatacactt cctatacatc acattcactt tagaatgaag 600

agcgcgggag aactgatttt tttttttttt tttttttttt tgtaacagac cgattaccca 660

gagaacactc agggaaagat agtcctcatt cagcgtggtg tctgcagctt cggcgagaag 720

tcttctcagg ctggtgatgc gaaggctatt ggtgccgttg tctacaacaa cgtccccgga 780

tcccttgctg gcactcttgg tggccttgac aagcgccatg tcccaaccgc tggtctttcc 840

caggaggatg gaaagaatct tgctagcctc gttgcttctg gcaaggttga tgtcaccatg 900

aacgttgtca gtctgtttga gaaccgaacc acgtaagtaa ctcaacgtca tatccagcat 960

taatcttcag gagtatatat actaattcgg tatctcacag ctggaacgtc attgctgaga 1020

ccaagggagg agaccacaac aatgttgtca tgcttggtgc tcactccgac tccgtcgatg 1080

ccggccccgg tatcaacgac aacggctccg gctccattgg tatcatgacc gttgccaaag 1140

cccttactaa cttcaagctc aacaacgccg ttcgctttgc ctggtggacc gctgaggaat 1200

tcggtctcct tggaagcacc ttctacgtcg acagccttga tgaccgtgag ctgcacaagg 1260

tcaagctgta cctcaacttc gacatgatcg gctctcccaa cttcgccaac cagatctacg 1320

acggtgacgg ttcggcctac aacatgactg gtcccgctgg ctctgctgaa atcgagtacc 1380

tgttcgagaa gttctttgac gaccagggtc tcccacacca gcccactgcc ttcaccggcc 1440

gatccgacta ctctgcattc atcaagcgca acgtccccgc tggaggtctt ttcactggtg 1500

ccgaggttgt caagaccccc gagcaagtta agctgttcgg tggtgaggct ggcgttgcct 1560

atgacaagaa ctaccatggc aagggtgaca ccgttgccaa catcaacaag ggagctatct 1620

tccttaacac tcgagcaatc gcctactctg tggccgagta tgctcgatcc ctcaagggct 1680

tcccaacccg cccaaagacc ggcaagcgtg ccgtcaaccc tcagtatgct aagatgcctg 1740

gtggtggttg cggacaccac actgtcttca tgtaa 1775

<210>32

<211>1488

<212>DNA

<213>须癣毛癣菌(T.mentagrophytes)

<400>32

atgaagtcgc aactgttgag cctagccgtg gccgtcacca ccatttccca gggcgttgtt 60

ggtcaagagc cctttggatg gcccttcaag cctatggtca ctcaggatga cctgcaaaac 120

aagattaagc tcaaggatat catggcaggt gtcgagaagc tgcaaagctt ttctgatgct 180

catcctgaaa agaaccgagt gttcggtggt aatggccaca aggacactgt cgagtggatc 240

tacaatgagc tcaaggccac cggctactac aatgtgaaga agcaggagca ggtacacctg 300

tggtctcacg ctgaggccgc tctcagtgcc aatggcaagg acctcaaggc cagcgccatg 360

tcgtacagcc ctcctgccaa caagatcatg gccgagcttg tcgttgccaa gaacaatggc 420

tgcaatgcta ccgattaccc agagaacact cagggaaaga tagtcctcat tcagcgtggt 480

gtctgcagct tcggcgagaa gtcttctcag gctggtgatg cgaaggctat tggtgccgtt 540

gtctacaaca acgtccccgg atcccttgct ggcactcttg gtggccttga caagcgccat 600

gtcccaaccg ctggtctttc ccaggaggat ggaaagaatc ttgctagcct cgttgcttct 660

ggcaaggttg atgtcaccat gaacgttgtc agtctgtttg agaaccgaac cacctggaac 720

gtcattgctg agaccaaggg aggagaccac aacaatgttg tcatgcttgg tgctcactcc 780

gactccgtcg atgccggccc cggtatcaac gacaacggct ccggctccat tggtatcatg 840

accgttgcca aagcccttac taacttcaag ctcaacaacg ccgttcgctt tgcctggtgg 900

accgctgagg aattcggtct ccttggaagc accttctacg tcgacagcct tgatgaccgt 960

gagctgcaca aggtcaagct gtacctcaac ttcgacatga tcggctctcc caacttcgcc 1020

aaccagatct acgacggtga cggttcggcc tacaacatga ctggtcccgc tggctctgct 1080

gaaatcgagt acctgttcga gaagttcttt gacgaccagg gtctcccaca ccagcccact 1140

gccttcaccg gccgatccga ctactctgca ttcatcaagc gcaacgtccc cgctggaggt 1200

cttttcactg gtgccgaggt tgtcaagacc cccgagcaag ttaagctgtt cggtggtgag 1260

gctggcgttg cctatgacaa gaactaccat ggcaagggtg acaccgttgc caacatcaac 1320

aagggagcta tcttccttaa cactcgagca atcgcctact ctgtggccga gtatgctcga 1380

tccctcaagg gcttcccaac ccgcccaaag accggcaagc gtgccgtcaa ccctcagtat 1440

gctaagatgc ctggtggtgg ttgcggacac cacactgtct tcatgtaa 1488

<210>33

<211>495

<212>PRT

<213>须癣毛癣菌(T.mentagrophytes)

<400>33

Met Lys Ser Gln Leu Leu Ser Leu Ala Val Ala Val Thr Thr Ile Ser

1 5 10 15

Gln Gly Val Val Gly Gln Glu Pro Phe Gly Trp Pro Phe Lys Pro Met

20 25 30

Val Thr Gln Asp Asp Leu Gln Asn Lys Ile Lys Leu Lys Asp Ile Met

35 40 45

Ala Gly Val Glu Lys Leu Gln Ser Phe Ser Asp Ala His Pro Glu Lys

50 55 60

Asn Arg Val Phe Gly Gly Asn Gly His Lys Asp Thr Val Glu Trp Ile

65 70 75 80

Tyr Asn Glu Leu Lys Ala Thr Gly Tyr Tyr Asn Val Lys Lys Gln Glu

85 90 95

Gln Val His Leu Trp Ser His Ala Glu Ala Ala Leu Ser Ala Asn Gly

100 105 110

Lys Asp Leu Lys Ala Ser Ala Met Ser Tyr Ser Pro Pro Ala Asn Lys

115 120 125

Ile Met Ala Glu Leu Val Val Ala Lys Asn Asn Gly Cys Asn Ala Thr

130 135 140

Asp Tyr Pro Glu Asn Thr Gln Gly Lys Ile Val Leu Ile Gln Arg Gly

145 150 155 160

Val Cys Ser Phe Gly Glu Lys Ser Ser Gln Ala Gly Asp Ala Lys Ala

165 170 175

Ile Gly Ala Val Val Tyr Asn Asn Val Pro Gly Ser Leu Ala Gly Thr

180 185 190

Leu Gly Gly Leu Asp Lys Arg His Val Pro Thr Ala Gly Leu Ser Gln

195 200 205

Glu Asp Gly Lys Asn Leu Ala Ser Leu Val Ala Ser Gly Lys Val Asp

210 215 220

Val Thr Met Asn Val Val Ser Leu Phe Glu Asn Arg Thr Thr Trp Asn

225 230 235 240

Val Ile Ala Glu Thr Lys Gly Gly Asp His Asn Asn Val Val Met Leu

245 250 255

Gly Ala His Ser Asp Ser Val Asp Ala Gly Pro Gly Ile Asn Asp Asn

260 265 270

Gly Ser Gly Ser Ile Gly Ile Met Thr Val Ala Lys Ala Leu Thr Asn

275 280 285

Phe Lys Leu Asn Asn Ala Val Arg Phe Ala Trp Trp Thr Ala Glu Glu

290 295 300

Phe Gly Leu Leu Gly Ser Thr Phe Tyr Val Asp Ser Leu Asp Asp Arg

305 310 315 320

Glu Leu His Lys Val Lys Leu Tyr Leu Asn Phe Asp Met Ile Gly Ser

325 330 335

Pro Asn Phe Ala Asn Gln Ile Tyr Asp Gly Asp Gly Ser Ala Tyr Asn

340 345 350

Met Thr Gly Pro Ala Gly Ser Ala Glu Ile Glu Tyr Leu Phe Glu Lys

355 360 365

Phe Phe Asp Asp Gln Gly Leu Pro His Gln Pro Thr Ala Phe Thr Gly

370 375 380

Arg Ser Asp Tyr Ser Ala Phe Ile Lys Arg Asn Val Pro Ala Gly Gly

385 390 395 400

Leu Phe Thr Gly Ala Glu Val Val Lys Thr Pro Glu Gln Val Lys Leu

405 410 415

Phe Gly Gly Glu Ala Gly Val Ala Tyr Asp Lys Asn Tyr His Gly Lys

420 425 430

Gly Asp Thr Val Ala Asn Ile Asn Lys Gly Ala Ile Phe Leu Asn Thr

435 440 445

Arg Ala Ile Ala Tyr Ser Val Ala Glu Tyr Ala Arg Ser Leu Lys Gly

450 455 460

Phe Pro Thr Arg Pro Lys Thr Gly Lys Arg Ala Val Asn Pro Gln Tyr

465 470 475 480

Ala Lys Met Pro Gly Gly Gly Cys Gly His His Thr Val Phe Met

485 490 495

<210>34

<211>2328

<212>DNA

<213>红色毛癣菌(T.rubrum)

<400>34

atgaagctcc tctcgctact tatgctggcg ggcatcgccc aagccatcgt tcctcctcgt 60

gagccccgtt caccaactgg tggcggcaac aagctgttga cctacaagga gtgtgtccct 120

agagctacta tctctccaag gtcgacgtcc cttgcctgga ttaacagtga agaagatggc 180

cggtacatct cccagtccga cgatggagca ttgatcctcc agaacatcgt cacgaacacc 240

aacaagactc tcgtggccgc agacaaggta cccaagggtt actatgacta ctggttcaag 300

ccagaccttt ctgctgtctt atgggcaacc aattacacca agcagtaccg tcactcttac 360

tttgccaact acttcattct agacatcaaa aagggatcgt tgacccctct agcccaggac 420

caggctggtg acatccagta tgctcaatgg agccccatga acaactctat cgcctatgtc 480

cgtggaaacg acctgtatat ctggaacaat ggcaagacca agcgtattac cgaaaatggc 540

ggcccggata tcttcaatgg tgtccctgac tgggtatacg aggaagaaat cttcggggac 600

cggttcgctc tttggttctc acctgacggt gaataccttg cgtacctccg ctttaacgag 660

actggagtcc cgacctacac tattccgtac tacaagaaca agcaaaagat tgcccctgcc 720

tacccaaggg agctggagat ccgttaccct aaagtctctg cgaagaaccc aaccgtgcag 780

ttccacctgt taaacattgc ttcatcccag gagacaacta tcccagttac tgcgttcccg 840

gaaaacgatc ttgtgatcgg tgaggttgct tggctcagca gtggccatga tagtgtagca 900

tatcgtgctt tcaaccgtgt ccaggataga gaaaagattg tcagcgtcaa ggttgagtcc 960

aaggaatcca aggttattcg cgaaagagat ggcaccgacg gctggatcga caaccttctc 1020

tccatgtcat atatcggaaa cgttaacggc aaggagtact acgtcgatat atctgatgct 1080

tctggctggg cacatatcta cctctacccg gttgatggag gaaaggagat tgcactaaca 1140

aagggagaat gggaagtcgt tgccattctc aaggttgaca cgaagaagaa gctgatctac 1200

ttcacctcta ccaaatatca cagcaccact cgacacgtct actctgtctc gtatgacaca 1260

aaggtcatga cccctctcgt caacgataag gaggctgcgt actacactgc atccttctcg 1320

gccaagggtg gttactatat cttgtcctac caaggtccaa atgttccata ccaagaactt 1380

tactccacca aggacagtaa gaagcctctc aagacaatca ctagcaatga tgcattgctc 1440

gagaagctga aggagtacaa gctccccaag gttagcttct ttgagatcaa gcttccatct 1500

ggtgaaaccc ttaatgttaa gcaacgccta ccacctaact tcaacccaca caagaagtac 1560

cccgtcctct tcactccgta tggtggccct ggtgcccaag aggtaagcca ggcatggaat 1620

tcattggact tcaagtccta cattacatct gaccctgagc ttgaatacgt tacctggact 1680

gttgacaacc gtggaaccgg ctacaagggc cgcaagttcc gcagcgccgt agctaagcgt 1740

ctcggtttcc tcgaagccca ggaccaggtc tttgctgcta aggaggtgct gaaaaaccgt 1800

tgggctgata aggaccatat tggaatctgg ggctggagct atggcggctt cctgaccgct 1860

aagaccctcg agaccgacag tggtgtattc acttttggta tcagtactgc tcctgtctct 1920

gatttcagac tctacgacag catgtacact gagcgttaca tgaagaccgt tgaactaaac 1980

gctgacggct acagtgagac cgccgtgcac aaggttgatg gctttaagaa cctcaaaggt 2040

cattacttca tccagcatgg aaccggtgac gacaacgtcc acttccaaaa cgccgctgtc 2100

ctttccaaca ccctgatgaa cggcggtgta actgcagaca agttgactac tcagtggttt 2160

actgactcgg accacggcat cagatacgat atggactcca cttaccagta caagcagctt 2220

tctaagatgg tctacgacca gaagcaacga aggccagaaa gcccaccaat gcaccaatgg 2280

agcaagagag ttttggctgc cctgtttggt gagagggcag aggaatga 2328

<210>35

<211>775

<212>PRT

<213>红色毛癣菌(T.rubrum)

<220>

<221>MISC_FEATURE

<222>(162)..(612)

<223>X

<400>35

Met Lys Leu Leu Ser Leu Leu Met Leu Ala Gly Ile Ala Gln Ala Ile

1 5 10 15

Val Pro Pro Arg Glu Pro Arg Ser Pro Thr Gly Gly Gly Asn Lys Leu

20 25 30

Leu Thr Tyr Lys Glu Cys Val Pro Arg Ala Thr Ile Ser Pro Arg Ser

35 40 45

Thr Ser Leu Ala Trp Ile Asn Ser Glu Glu Asp Gly Arg Tyr Ile Ser

50 55 60

Gln Ser Asp Asp Gly Ala Leu Ile Leu Gln Asn Ile Val Thr Asn Thr

65 70 75 80

Asn Lys Thr Leu Val Ala Ala Asp Lys Val Pro Lys Gly Tyr Tyr Asp

85 90 95

Tyr Trp Phe Lys Pro Asp Leu Ser Ala Val Leu Trp Ala Thr Asn Tyr

100 105 110

Thr Lys Gln Tyr Arg His Ser Tyr Phe Ala Asn Tyr Phe Ile Leu Asp

115 120 125

Ile Lys Lys Gly Ser Leu Thr Pro Leu Ala Gln Asp Gln Ala Gly Asp

130 135 140

Ile Gln Tyr Ala Gln Trp Ser Pro Met Asn Asn Ser Ile Ala Tyr Val

145 150 155 160

Arg Xaa Asn Asp Leu Tyr Ile Trp Asn Asn Gly Lys Thr Lys Arg Ile

165 170 175

Thr Glu Asn Gly Gly Pro Asp Ile Phe Asn Gly Val Pro Asp Trp Val

180 185 190

Tyr Glu Glu Glu Ile Phe Gly Asp Arg Phe Ala Leu Trp Phe Ser Pro

195 200 205

Asp Gly Glu Tyr Leu Ala Tyr Leu Arg Phe Asn Glu Thr Gly Val Pro

210 215 220

Thr Tyr Thr Ile Pro Tyr Tyr Lys Asn Lys Gln Lys Ile Ala Pro Ala

225 230 235 240

Tyr Pro Arg Glu Leu Glu Ile Arg Tyr Pro Lys Val Ser Ala Lys Asn

245 250 255

Pro Thr Val Gln Phe His Leu Leu Asn Ile Ala Ser Ser Gln Glu Thr

260 265 270

Thr Ile Pro Val Thr Ala Phe Pro Glu Asn Asp Leu Val Ile Gly Glu

275 280 285

Val Ala Trp Leu Ser Ser Gly His Asp Ser Val Ala Tyr Arg Ala Phe

290 295 300

Asn Arg Val Gln Asp Arg Glu Lys Ile Val Ser Val Lys Val Glu Ser

305 310 315 320

Lys Glu Ser Lys Val Ile Arg Glu Arg Asp Gly Thr Asp Gly Trp Ile

325 330 335

Asp Asn Leu Leu Ser Met Ser Tyr Ile Gly Asn Val Asn Gly Lys Glu

340 345 350

Tyr Tyr Val Asp Ile Ser Asp Ala Ser Gly Trp Ala His Ile Tyr Leu

355 360 365

Tyr Pro Val Asp Gly Gly Lys Glu Ile Ala Leu Thr Lys Gly Glu Trp

370 375 380

Glu Val Val Ala Ile Leu Lys Val Asp Thr Lys Lys Lys Leu Ile Tyr

385 390 395 400

Phe Thr Ser Thr Lys Tyr His Ser Thr Thr Arg His Val Tyr Ser Val

405 410 415

Ser Tyr Asp Thr Lys Val Met Thr Pro Leu Val Asn Asp Lys Glu Ala

420 425 430

Ala Tyr Tyr Thr Ala Ser Phe Ser Ala Lys Gly Gly Tyr Tyr Ile Leu

435 440 445

Ser Tyr Gln Gly Pro Asn Val Pro Tyr Gln Glu Leu Tyr Ser Thr Lys

450 455 460

Asp Ser Lys Lys Pro Leu Lys Thr Ile Thr Ser Asn Asp Ala Leu Leu

465 470 475 480

Glu Lys Leu Lys Glu Tyr Lys Leu Pro Lys Val Ser Phe Phe Glu Ile

485 490 495

Lys Leu Pro Ser Gly Glu Thr Leu Asn Val Lys Gln Arg Leu Pro Pro

500 505 510

Asn Phe Asn Pro His Lys Lys Tyr Pro Val Leu Phe Thr Pro Tyr Gly

515 520 525

Gly Pro Gly Ala Gln Glu Val Ser Gln Ala Trp Asn Ser Leu Asp Phe

530 535 540

Lys Ser Tyr Ile Thr Ser Asp Pro Glu Leu Glu Tyr Val Thr Trp Thr

545 550 555 560

Val Asp Asn Arg Gly Thr Gly Tyr Lys Gly Arg Lys Phe Arg Ser Ala

565 570 575

Val Ala Lys Arg Leu Gly Phe Leu Glu Ala Gln Asp Gln Val Phe Ala

580 585 590

Ala Lys Glu Val Leu Lys Asn Arg Trp Ala Asp Lys Asp His Ile Gly

595 600 605

Ile Trp Gly Xaa Ser Tyr Gly Gly Phe Leu Thr Ala Lys Thr Leu Glu

610 615 620

Thr Asp Ser Gly Val Phe Thr Phe Gly Ile Ser Thr Ala Pro Val Ser

625 630 635 640

Asp Phe Arg Leu Tyr Asp Ser Met Tyr Thr Glu Arg Tyr Met Lys Thr

645 650 655

Val Glu Leu Asn Ala Asp Gly Tyr Ser Glu Thr Ala Val His Lys Val

660 665 670

Asp Gly Phe Lys Asn Leu Lys Gly His Tyr Leu Ile Gln His Gly Thr

675 680 685

Gly Asp Asp Asn Val His Phe Gln Asn Ala Ala Val Leu Ser Asn Thr

690 695 700

Leu Met Asn Gly Gly Val Thr Ala Asp Lys Leu Thr Thr Gln Trp Phe

705 710 715 720

Thr Asp Ser Asp His Gly Ile Arg Tyr Asp Met Asp Ser Thr Tyr Gln

725 730 735

Tyr Lys Gln Leu Ser Lys Met Val Tyr Asp Gln Lys Gln Arg Arg Pro

740 745 750

Glu Ser Pro Pro Met His Gln Trp Ser Lys Arg Val Leu Ala Ala Leu

755 760 765

Phe Gly Glu Arg Ala Glu Glu

770 775

Claims

1、一种分离的多肽，含有选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的成熟形式。

2、一种分离的多肽，含有选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示的氨基酸序列。

3、一段分离的多肽，含有与选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列至少有90％同源的序列。

4、如权利要求3所述的多肽，其中所述分离的多肽还包括与选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列天然发生等位变异的序列。

5、如权利要求3所述的多肽，其中所述分离的多肽具有氨肽酶或羧肽酶活性。

6、如权利要求5所述的多肽，其中所述的多肽是亮氨酸氨肽酶。

7、如权利要求6所述的多肽，其中所述的多肽是ruLAP2。

8、一种分离的多肽，其含有一个或多个选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的保守替换。

9、如权利要求8所述的多肽，其中所述的多肽具有氨肽酶活性。

10、如权利要求1所述的多肽，其中所述的多肽是天然产生的。

11、一种含有权利要求1所述的多肽和试剂的组合物。

12、一种试剂盒，其中一个或多个试剂内含有权利要求11所述的组合物。

13、一种含有权利要求1所述的皮肤真菌。

14、如权利要求13所述的表皮寄生菌，其中所述皮肤真菌选自如下菌种：絮状表皮癣菌，奥杜盎小孢子菌、铁锈色小孢子菌、同心性毛癣菌、卡那毛癣菌、麦格尼氏发癣菌、须癣发癣菌、罗比特斯克毛癣菌、红色毛癣菌、许兰氏毛癣菌、苏丹毛癣菌、断发毛癣菌、紫色毛癣菌、杨德氏发癣菌、犬小芽胞菌、马类小孢子菌、猪小孢子菌、桃色小孢子菌、马发癣菌、猴类毛癣菌、疣状毛癣菌、石膏样小孢子菌、阿耶罗毛癣菌和土生毛癣菌。

15、一种含有权利要求1所述多肽的微生物培养上清夜。

16、权利要求1所述的多肽在制备治疗与其相关病理的人类疾病药物中的应用。

17、一种验证具有潜在治疗真菌感染的治疗物质的方法，其中所述真菌感染与权利要求1所述的多肽表达异常或与其异常的生理相关作用相联系，所述方法包括：

(a)提供一种能表达权利要求1所述多肽且具有所述多肽特性或功能的细胞；

(b)将包含候选物质的组合物与上述细胞接触；

(c)检测候选物质是否引起所述多肽功能特性的改变；

其中，当在有候选物质存在时观察到改变，而在不含候选物质组合物与细胞接触时同样的改变没有出现，那么该物质被证明具有潜在的治疗用途。

18、如权利要求17所述的方法，其中所述功能特性是具有氨肽酶或羧肽酶活性。

19、一种治疗哺乳动物疾病的方法，所述方法包括向动物给予一定量的多肽，使其病证减轻，其中所述多肽为含有与选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列至少有90％同源的多肽，或其具有活性的片段。

20、如权利要求19所述的方法，其中所述的疾病包括：真菌感染、腹部疾病、消化道吸收不良、口炎性腹泻、过敏反应和酶不足。

21、如权利要求20所述的方法，其中所述的过敏反应是对麸质过敏。

22、一种治疗哺乳动物疾病的方法，所述方法包括向动物给予一定量的蛋白酶抑制剂，使其病证减轻，其中所述蛋白酶抑制剂为含有的氨基酸序列为SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示至少有90％同源序列的多肽，或其具有活性的片段。

23、如权利要求22所述的方法，其中所述的疾病为真菌感染。

24、一种分离的核酸分子，含有选自SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32和34所示的核酸序列。

25、如权利要求24所述的核酸分子，其中所述的核酸分子是天然存在的。

26、一种核酸分子，其中所述核酸分子不是单独的核苷，而是一种含有选自SEQ IDNOs：2、5、8、11、14、17、20、23、26、29、32和34所示的核酸序列。

27、一种分离的核酸分子，其编码一种含有选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的成熟多肽。

28、如权利要求24所述的核酸分子，其中所述的核酸分子可在严格条件下与选自下组的核酸序列杂交，所述的组由选自SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32、34或其互补序列物组成。

29、一种含有权利要求24所述核酸分子的载体。

30、如权利要求29所述的载体，还可以包含操控所述核酸分子的启动子。

31、一种含有权利要求29所述载体的细胞。

32、一种制备权利要求1所述多肽的方法，所述方法包括在诱导表达所述多肽的环境下培养一种细胞，其中所述细胞中含有已重组了选自SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32和34所示序列的核酸分子的载体。

33、如权利要求32所述的方法，其中所述的细胞选自：真菌细胞、细菌细胞、昆虫细胞、植物细胞或哺乳动物细胞。

34、一种制备权利要求2所述多肽的方法，所述方法包括在能够表达所述多肽的环境下培养一种细胞，其中所述细胞中含有已重组了SEQ ID NOs：2、5、8、11、14、17、20、23、26、29、32和34所示序列的核酸分子的载体。

35、如权利要求34所述的方法，其中所述的细胞选自：真菌细胞、细菌细胞、昆虫细胞、植物细胞或哺乳动物细胞。

36、一种制备蛋白的方法，包括：

(a)在能足够表达所述蛋白的环境下培养权利要求13所述的表皮肤真菌，

(b)且从所述皮肤真菌中分离出来。

37、如权利要求36所述的方法，其中所述的蛋白是分泌型蛋白。

38、如权利要求36所述的方法，其中所述的蛋白是氨肽酶或羧肽酶。

39、如权利要求38所述的方法，其中所述的蛋白是亮氨酸氨肽酶。

40、如权利要求39所述的方法，其中所述的LAP是ruLAP2。

41、如权利要求36所述的方法，其中所述的表皮寄生菌选自絮状表皮癣菌，奥杜盎小孢子菌、铁锈色小孢子菌、同心性毛癣菌、卡那毛癣菌、麦格尼氏发癣菌、须癣发癣菌、罗比特斯克毛癣菌、红色毛癣菌、许兰氏毛癣菌、苏丹毛癣菌、断发毛癣菌、紫色毛癣菌、杨德氏发癣菌、犬小芽胞菌、马类小孢子菌、猪小孢子菌、桃色小孢子菌、马发癣菌、猴类毛癣菌、疣状毛癣菌、石膏样小孢子菌、阿耶罗毛癣菌和土生毛癣菌。

42、如权利要求36所述的方法，还可以包括向产物蛋白提供多肽底物。

43、如权利要求42所述的方法，其中所述的产物蛋白降解多肽底物。

44、如权利要求42所述的方法，其中所述的多肽底物的长度为2～200个氨基酸。

45、如权利要求42所述的方法，其中所述的产物蛋白有序的消化一段全长的多肽底物。

46、一种治疗真菌感染引起的疾病的方法，所述方法包括给予有效剂量的具有EXOX蛋白活性的一种抑制剂，其中EXOX蛋白选自SEQ ID NOs：3、6、9、12、15、18、21、24、27、30、33和35。

47、如权利要求46所述的方法，其中所述的EXOX蛋白含有SEQ ID NO：2。

48、一种降解多肽底物的方法，所述方法包括将一个或多个权利要求1所述的分离的多肽与多肽底物接触。

49、如权利要求48所述的方法，其中所述的多肽底物为全长的蛋白。

50、如权利要求48所述的方法，其中所述的一个或多个分离的多肽有序的酶解多肽底物。

51、如权利要求48所述的方法，其中所述的多肽底物选自如下组：变性的酪蛋白、麸朊、谷朊、小牛血清蛋白或类似功能物。

52、如权利要求48所述的方法，其中所述的分离的多肽是一种氨肽酶。

53、如权利要求52所述的方法，其中所述的氨肽酶是亮氨酸氨肽酶。

54、如权利要求53所述的方法，其中所述的亮氨酸氨肽酶是ruLAP2。

55、如权利要求48所述的方法，还可以用一个或多个蛋白酶与多肽底物接触。

56、如权利要求55所述的方法，其中所述的一个或多个蛋白酶选自如下组：胰蛋白酶、链霉蛋白酶、胰凝乳蛋白酶和蛋白酶K。

57、一种去除蛋白氨基末端氨基酸的方法，包括将蛋白与权利要求3所述的分离的多肽接触。

58、如权利要求57所述的方法，其中所述的蛋白氨基末端带有组氨酸标签。

59、如权利要求57所述的方法，其中所述的蛋白氨基末端带有Xaa-Pro标签。

60、如权利要求57所述的方法，其中所述Xaa是一种含有至少两个相近亲核部位的氨基酸。

61、如权利要求60所述的方法，其中所述的氨基酸是丝氨酸、苏氨酸或半胱氨酸。

62、如权利要求3所述的分离的多肽，其中所述的多肽具有反蛋白水解活性。

63、如权利要求42所述的方法，其中所述的产物蛋白添加一个或多个氨基酸到底物多肽上。

64、如权利要求42所述的方法，其中所述的产物蛋白去除多肽底物一个或多个氨基酸，使其成为一种被修饰多肽，然后所述的产物蛋白有序的将一个或多个氨基酸添加到被修饰多肽，这样形成一种含特殊氨基酸序列多肽产物，与多肽底物相比。

65、一种在多肽底物添加一个或多个氨基酸的方法，所述方法包括将多肽底物与一种或多种权利要求3所述的分离的多肽接触。

66、如权利要求48所述的方法，进一步包括在充分的有序添加一个或多个氨基酸序列条件下，培育多肽底物与一个或多个分离的多肽一段时间。