CN1871351A - 一种新的真菌蛋白及其编码核酸 - Google Patents

一种新的真菌蛋白及其编码核酸 Download PDF

Info

Publication number
CN1871351A
CN1871351A CNA2004800314200A CN200480031420A CN1871351A CN 1871351 A CN1871351 A CN 1871351A CN A2004800314200 A CNA2004800314200 A CN A2004800314200A CN 200480031420 A CN200480031420 A CN 200480031420A CN 1871351 A CN1871351 A CN 1871351A
Authority
CN
China
Prior art keywords
polypeptide
trichophyton
seq
albumen
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004800314200A
Other languages
English (en)
Other versions
CN1871351B (zh
Inventor
米歇尔·莫诺
雷托·斯托克林
埃里克·格罗茨曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Amira Biotech Corp
Original Assignee
FunZyme BioTechnologies SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FunZyme BioTechnologies SA filed Critical FunZyme BioTechnologies SA
Publication of CN1871351A publication Critical patent/CN1871351A/zh
Application granted granted Critical
Publication of CN1871351B publication Critical patent/CN1871351B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/06Preparation of peptides or proteins produced by the hydrolysis of a peptide bond, e.g. hydrolysate products
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/14Prodigestives, e.g. acids, enzymes, appetite stimulants, antidyspeptics, tonics, antiflatulents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/10Antimycotics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/08Antiallergic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • C12Q1/18Testing for antimicrobial activity of a material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/34Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase
    • C12Q1/37Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase involving peptidase or proteinase
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/37Assays involving biological materials from specific organisms or of a specific nature from fungi

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Mycology (AREA)
  • Biomedical Technology (AREA)
  • Pulmonology (AREA)
  • Nutrition Science (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本发明涉及一种编码新的多肽酶的真菌核酸序列。同时也提供该核酸序列编码的多肽及其衍生物、变异体或上述多肽的片段、多聚核苷或抗体。新的亮氨酸氨肽酶(LAP)和其他氨肽酶或羧肽酶多肽是指本发明所述的EXOX核酸和蛋白,在医学、研究和商业应用上有着广泛的用途。

Description

一种新的真菌蛋白及其编码核酸
技术领域
本发明涉及一种新的具有独特催化性质的多肽酶及其编码核酸。具体的是,本发明涉及一种编码新的亮氨酸氨肽酶和其他氨基或羧基多肽酶的核酸,本发明中特指为EXOX,还包括载体、宿主细胞、抗体,以及制造所述核酸和多肽酶的重组方法。所述基因可以从以下两种真菌中得到:红色毛癣菌(Trichophyton rubrum)、烟曲霉菌(Aspergillusfumigatus)。
背景技术
细菌、酵母和丝状菌,还有些特殊的植物细胞,无脊椎动物和脊椎动物都会表达一种有利用吸收氨基酸、二肽或三肽的膜蛋白(Lubkowitz,等,Microbiology 143:387-396(1997);Hauser等,Mol.Membr.Biol.18(1):105-112(2001);Stacey等,Trends PlantSci.7(6):257-263(2002);Rubio-Aliaga & Daniel,Trends Pharmacol.Sci.23(9):434-440(2002)。转运蛋白,如在酵母、丝状菌和植物细胞的,也能吸收大的寡肽(4-5个氨基酸)。在食品发酵工业中,早已证明微生物参与了蛋白被消化成氨基酸的过程。细菌属的乳酸菌(Lactobacillus)(O’Cuinn等,Biochem.Soc.Trans.27(4):730-734(1999))和真菌属的曲霉菌(Aspergillus)(Doumas等,Appl.Enviorn.Microbiol.64:4809-4815(1998))分泌内部和外部蛋白酶,对蛋白消化很有用。
氨基多肽酶的活性,也能在真菌被感染时发挥作用,早已证实通过(De Bersaques &Dockx,Arch.Belg.Dermatol.Syphiligr.29:135-140(1973);Danew & Friedrich,Mykosen 23:502-511(1980))菌丝体和培养基,然而,还没有氨基多肽酶或羧基多肽酶从皮肤真菌中分离并表征过。
发明内容
本发明是基于一种分离的多肽的发明,所述多肽为含有选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的成熟多肽。本发明同时提供一种分离的含有选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的多肽,以及含有与上述序列具有90%同源性序列的分离多肽,所述多肽具有氨肽酶或羧肽酶活性。其中,所述多肽是亮氨酸氨肽酶中,如ruLAP2。
本发明另一方面提供含有一个或多个替换的保守氨基酸的分离多肽,所述多肽也具有氨肽酶活性。
本发明同时包括自然发生的等位突变的选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的多肽。所述等位突变包括转录氨基酸序列的核酸序列有一个或多个核苷酸不同于选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示序列。在可选序列中任意的氨基酸变化的突变多肽是由保守替换提供的。
本发明同时提供一种从多肽去除特定氨基酸的方法,例如从重组蛋白去除标签,其中具有去除氨基酸活性的多肽含有至少与选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列90%同源性序列的多肽,或具有类似功能的多肽。
本发明所述的任一多肽均可天然产生。进一步,所述多肽可以包含在含有试剂的组合物中,所述组合物可用在含一个或多个试剂的试剂盒里。
本发明同时提供一种含有所述多肽的皮肤真菌。例如,适合的真菌包括:絮状表皮癣菌(Epidermophyton floccosum)、奥杜盎小孢子菌(Microsporum audouinii)、铁锈色小孢子菌(Microsporum ferrugineum)、同心性毛癣菌(Trichophyton concentricum)、卡那毛癣菌(Trichophyton kanei)、麦格尼氏发癣菌(Trichophyton megninii)、须癣毛癣菌(Trichophyton mentagrophytes)、罗比特斯克毛癣菌(Trichophytonraubitschekii)、红色毛癣菌(Trichophyton rubrum)、许兰氏毛癣菌(Trichophytonschoenleinii)、苏丹毛癣菌(Trichophyton soudanense)、断发毛癣菌(Trichophytontonsurans)、紫色毛癣菌(Trichophyton violaceum)、杨德氏发癣菌(Trichophytonyaoundei)、犬小孢子菌(Microsporum canis)、马类小孢子菌(Microsporum equinum)、猪小孢子菌(Microsporum nanum)、桃色小孢子菌(Microsporum persicolor)、马发癣菌(Trichophyton equinum)、猴类毛癣菌(Trichophyton simii)、疣状毛癣菌(Trichophyton verrucosum)、石膏样小孢子菌(Microsporum gypseum)、阿耶罗毛癣菌(Trichophyton ajelloi)和土生毛癣菌(Trichophyton terrestre)。
本发明同时提供一种含有本发明所述多肽的微生物培养上清夜。
本发明同时提供一种制备治疗相关病理的人类疾病药物中的应用,所述的治疗包括本发明所述的多肽以及选择与本发明所述多肽相关的病理特征的疾病。
本发明同时提供一种降解多肽底物的方法。所述方法包括将多肽底物与分离的一种或多种本发明多肽接触。其中,多肽底物可以是一个全长的蛋白。进一步的说,其中一种或多种分离的多肽可以有序的分解多肽底物。所述的多肽底物可以是:变性的酪蛋白、麸朊、谷朊、小牛血清蛋白或功能类似物。其中,分离的多肽优选为亮氨酸氨肽酶中的ruLAP2。
本发明进一步提供一种验证具有潜在治疗真菌感染的治疗物质的方法,其中所述真菌感染与本发明所述的多肽表达异常或与其异常的生理作用相关。所述方法包括提供一种能表达所述多肽且具有所述多肽特性或功能的细胞,然后将包含候选物质的组合物与上述细胞接触,再检测候选物质是否引起所述多肽功能特性的改变。其中,当在有候选物质存在时观察到改变,而在含有候选物质组合物的细胞接触时同样的改变没有出现,那么该物质被证明具有潜在的治疗用途。其中,所述功能性特征是多肽具有氨肽酶或羧肽酶活性的特征。
本发明进一步提供一种治疗哺乳动物疾病的方法,所述方法包括向动物给予一定量的多肽,使其病证减轻。特别的是,其中所述多肽为含有的氨基酸序列为选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示至少有90%同源的序列的多肽,或其具有活性片段的多肽。所述的治疗病证包括真菌感染、腹部疾病、消化道吸收不良、口炎性腹泻、过敏反应和酶不足。优选的,其中所述的过敏反应是对麸质过敏。
本发明另外提供一种治疗哺乳动物疾病的方法,所述方法包括向动物给予一定量的蛋白酶抑制剂,使其病证减轻。其中所述蛋白酶抑制剂为含有的氨基酸序列为选自SEQ IDNOs:3、6、9、12、15、18、21、24、27、30、33和35所示至少有90%同源的序列的多肽,或其具有活性片段的多肽。例如,其中所述的疾病可以是真菌感染。
本发明进一步提供一种分离的含有选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的多肽。所述多肽被一种细胞在诱导表达所述多肽的环境下产生。在一些具体实施方案中,所述细胞含有已重组了选自SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32和34所示核酸序列的核苷酸分子的载体。进一步的,所述细胞可以是真菌细胞、细菌细胞、昆虫细胞、植物细胞或哺乳动物细胞。
本发明同时提供一种分离的含有选自SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32和34所示序列核酸序列的核苷酸分子。其中,所述核苷酸分子可以是自然存在的。
本发明同时关于一种不同于一段核苷而是含有选自SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32和34所示序列,且编码成熟的具有选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的多肽的核酸序列。进一步,所述核苷酸分子可以是在在严格的条件下与选自下组的核酸序列杂交,所述的组由选自SEQ IDNOs:2、5、8、11、14、17、20、23、26、29、32、34或其互补序列物组成。在一些具体实施例中,所述核酸分子可以包含在载体内,进一步的可以包括一个与所述核酸分子功能相关的启动子。同时也提供含有所述载体的细胞。
本发明同时提供制备本发明所述的多肽的方法。所述方法包括在诱导表达所述多肽的环境下培养一种细胞,其中所述细胞中含有已重组了选自SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32和34所示序列的核酸分子的载体。举某些例子,所述细胞可以是真菌细胞、细菌细胞、昆虫细胞、植物细胞或哺乳动物细胞。
本发明同时提供一种制备蛋白的方法,包括在能足够表达所述蛋白的环境下培养皮肤真菌,且从所述皮肤真菌中分离出来。其中,所述的蛋白是分泌型蛋白。同样的,所述的蛋白可以是氨肽酶或羧肽酶。特别地,所述氨肽酶是亮氨酸氨肽酶,如ruLAP2。另外,所述的表皮真菌选自如下:絮状表皮癣菌(Epidermophyton floccosum)、奥杜盎小孢子菌(Microsporum audouinii)、铁锈色小孢子菌(Microsporum ferrugineum)、同心性毛癣菌(Trichophyton concentricum)、卡那毛癣菌(Trichophyton kanei)、麦格尼氏发癣菌(Trichophyton megninii)、须癣毛癣菌(Trichophyton mentagrophytes)、罗比特斯克毛癣菌(Trichophyton raubitschekii)、红色毛癣菌(Trichophyton rubrum)、许兰氏毛癣菌(Trichophyton schoenleinii)、苏丹毛癣菌(Trichophyton soudanense)、断发毛癣菌(Trichophyton tonsurans)、紫色毛癣菌(Trichophyton violaceum)、杨德氏发癣菌(Trichophyton yaoundei)、犬小孢子菌(Microsporum canis)、马类小孢子菌(Microsporum equinum)、猪小孢子菌(Microsporum nanum)、桃色小孢子菌(Microsporumpersicolor)、马发癣菌(Trichophyton equinum)、猴类毛癣菌(Trichophyton simii)、疣状毛癣菌(Trichophyton verrucosum)、石膏样小孢子菌(Microsporum gypseum)、阿耶罗毛癣菌(Trichophyton ajelloi)和土生毛癣菌(Trichophyton terrestre)。
所述产物蛋白可以作用于多肽底物。例如,产物蛋白可以降解多肽或可以有序的分解一个全长的多肽底物。优选的,多肽底物可以是含有2-200个氨基酸的多肽。
在一些实例中,所述产物蛋白添加一个或多个氨基酸到多肽底物上。另一些实例中,产物蛋白从多肽底物去除一个或多个氨基酸,使其成为一种被修饰多肽,然后所述的产物蛋白有序的将一个或多个氨基酸添加到被修饰多肽,这样形成一种含特殊氨基酸序列多肽产物,与原多肽底物相比。
本发明另外提供一种治疗真菌感染引起的疾病的方法,所述方法包括给予有效剂量的具有EXOX蛋白活性的一种抑制剂,其中抑制剂序列为选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示序列。例如,其中所述的EXOX蛋白含有SEQ ID NO:2所示序列。
本发明进一步提供一种降解多肽底物的方法。所述方法包括将一个或多个本发明所述的分离的多肽与多肽底物接触。优选的,其中所述的多肽底物为全长的蛋白,其中所述的一个或多个分离的多肽有序的酶解多肽底物。所述的多肽底物选自如下组:变性的酪蛋白、麸朊、谷朊、小牛血清蛋白或功能类似物。进一步的在一些实例中,其中所述的分离的多肽是一种氨肽酶。所述的氨肽酶可以是亮氨酸氨肽酶,如ruLAP2。
另外,所述方法还可以用一个或多个蛋白酶与多肽底物接触。在一些实例中,所述的蛋白酶选自如下组:胰蛋白酶、链霉蛋白酶、胰凝乳蛋白酶和蛋白酶K。
本发明进一步提供一种去除蛋白氨基末端氨基酸的方法。所述方法包括将蛋白与本发明所述的分离的多肽接触。在一些实例中,所述的蛋白氨基末端带有组氨酸标签。在另一些实例中,所述的蛋白氨基末端带有Xaa-Pro标签。优选的,所述Xaa是一种含有至少两个相近亲核部位的氨基酸,如丝氨酸、苏氨酸或半胱氨酸。
本发明进一步提供一种具有反蛋白水解活性的多肽。
本发明进一步提供一种添加一个或多个氨基酸到底物多肽上的方法。方法包括将多肽底物与一种或多种本发明所述的分离的多肽接触。
除非另有说明,本发明所述的所有技术和科学用语都和本发明所属一般技术人员理解的一样。尽管有类似或等同的方法和原料可以用来实现本发明,更适合的方法和原料将在以下描述。本发明引用所有的出版物、专利申请、专利及其他参考文献均参照其整体。在冲突的情况下,现在的说明书,包括定义将受到限制。另外,所述的原料、方法和实施例仅限于说明本发明而不是限制本发明。
附图说明
图1是红色毛癣菌培养上清夜用抗-A.oryzue Alp(胶板A,左边)和Mep antisera(胶板C,右边)Western杂交结果图。胶板B显示用考马斯亮蓝染色的10%SDS-PAGE胶。泳道1(lane 1)里,0.25ml的红色毛癣菌培养上清夜中的蛋白在加样到SDS-PAGE胶前预先用TCA处理。0.2g纯化的A.oryzue重组蛋白ALP和MEP分别加样在泳道2和3里。标准的蛋白分子量对照在图左面。
图2是显示P.pastoris产生的重组ruLAP2(1,2)、fuLAP2(3,4)、ruLAP1(5,6)、fruLAP1(7,8)的SDS-PAGE蛋白特征图。每个纯化的重组LAP 1g加到10%SDS-PAGE胶。泳道2、4、6和8表示用N-糖苷酶F处理后的去糖基蛋白。胶用考马斯亮蓝R-250染色。
图3是红色毛癣菌培养上清夜和重组LAPs作为对照探针,和抗-ruLAP2(泳道1-4)、抗-ruLAP1 antisera(泳道5-8)Western杂交结果图。泳道1、2、5和6表示0.25ml的红色毛癣菌培养上清夜中的蛋白在加样到SDS-PAGE胶前预先用TCA处理。0.1g纯化的重组ruLAP2(泳道3、4)和ruLAP1(泳道7、8)作为对照加样。N-糖苷酶F用来去蛋白的糖基。标准的蛋白分子量对照在图左面。
图4是红色毛癣菌AMPP(氨肽酶P)在不同pH值下的酶活性图表。该图显示AMPP在很大的一个pH值范围内具有活性,范围为pH6~11。
图5是红色毛癣菌AMPP(氨肽酶P)在不同温度下的酶活性图表。该酶在温度25~60℃间具有活性,优选的温度为50℃。
图6是显示在37℃,4h,ruLAP1以E/S比率(w∶w)以1/50分解gliadin 14mer的结果图。
图7是显示DPPIV单独酶解和DPPIV/ruLAP2的酶混和物分解gliadin 14mer的结果图。
图8是显示在37℃,4h,ruDPPIV1以E/S比率(w∶w)以1/50分解gliadin 33mer的结果图。
图9是显示DPPIV/ruLAP2的酶混和物分解gliadin 33mer的结果图。
图10A和10B表示ruLAP2分解Gly-Ser-proNPY(A)前和(B)后的质谱图。
图11A和11B表示ruLAP2分解Ala-proNPY(A)前和(B)后的质谱图。
图12A和12B表示ruLAP2分解TG47(A)前和(B)后的质谱图。
图13A和13B表示DPPIV分解desMet-G-CSF(A)前和(B)后的质谱图。
图14是M28E亚家族氨肽酶的推断的氨基酸序列比对图。
图15是M28E亚家族氨肽酶的推断的氨基酸序列比对图。
本发明的详细描述
本发明所述的蛋白酶与肽酶、蛋白水解酶和多肽水解酶同意。所述蛋白酶包括所有能够将CO-NH键断裂,将蛋白降解为多肽或氨基酸的酶。多肽外切酶作用于多肽链的氨基(N)或羧基(C)端邻近的基团。那些作用于N端释放一个氨基酸残基的酶命名为氨肽酶。许多不同的高级蛋白酶参与了大量的生物生理反应。因此,现在选择新药的目标都放在控制相关多肽或酶的降解上。
皮肤真菌是人类和动物的致病真菌,导致皮肤感染(Vanbreuseghem等,GUIDEPRATIQUE BE MYCOLOGUE MEDICALEET VETERINAIRE.(1978);Kwong-Chong & Bennet,NEDICAL MYCOLOGY(1992);Weitzman & Summerbell,Clin.Microbiol.Rev.8:240-259(1995))。皮肤真菌包括但不限于:T.ajelloi,A.uncinatum,K ajelloi,T.asteroides,T.mentagrophytes,T.concentricum,T.cruris.E.floccosum,T.dankalienese,G.dankaliensis,T.equinum,T.equinum var.autotrophicum,T.equinum var.equinum,T.erinacei,T.fischeri,T flavescens,T.floccosum,T.gloriae,T.gourvilii,T.granulare,T.granulosum,T.gypseum,T.inguinale,T.interdigitale,T.intertriginis,T.kanei,T.krajdenii,T.longfusum,T.megninii,A.quinckanum,A.benhamiae,A.vanbreuseghemii,T.pedis,T.proliferans,T.quickaneum,T.radiolatum,T.mentrophytes var.erinacei,T.mentagrophytes var.interdigitale,T.mentagrophytes var.mentagrophytes,T.mentagrophytes var.nodulare,T.mentagrophytes var.quinnckeanum,T.niveum,T.nodulare,T.persicolor,M.persicolor,T.phaseolforme,T.proliferans,T.purpureum,T.quinckeanum,T.radiolatum,T.raubitschekii,T rubrum,S.ruber,T schoenleinii,T simii,A.simii,T soudanense,T sulphureum,T tonsurans,A.insingulare,A.lenticularum,A.quadrifidum,T tonsurans,T sulphureum,T terrestre,T.tonsuransvar.sulphureum,T.tonsurans var tonsurans subvar.perforans ,T.vanbreuseghemii,T.verrucosum,T.violaceum,T.yaoundei,E.floccosum,M.audouinii,M.ferrugineum,T.megninii,T.mentragrophytes,T.raubitschekii,T.schoenleinii,T.soudanese,T.violaceum,M.canis,M.equinum,M.nanum,M.persicolor,T.verrucosum,和M.gypseum。在欧洲上述致病菌中,从医院和个人实例中分离得到的真菌,常见的有红色毛癣菌、须癣毛癣菌(T.mentagrophytes)、犬小孢子菌(Microsporumcanis)(Monod等,Dermatology,205:201-203,2002)。实际上,皮肤真菌专门寄生在角质层、指甲或头发中,消化角质化细胞膜。至今,所有研究显示皮肤真菌产生具有体外活性的蛋白水解酶,许多研究者从个别菌种中发现一个或多个分泌型胞外蛋白酶。相关综述参见Monod等,Int.J.Med.Microbiol.293:405-419,2002。特别地,犬小孢子菌拥有两个编码S8(枯草杆菌蛋白酶)和M36(fungalysin)家族的基因家族,参见MEROPS蛋白酶数据库(http://merops.sanger.ac.uk/)(Brouta等,Infect.Immun.70:5676-5683,2002;Descamps等,J Invest.Dermatol.70:830-835,2002)。分离的犬小孢子菌基因家族中其中之一编码从培养上清夜中得到两个前述特征的胞内酶之一。(Mignon等,Med Mycol.36:395-404,1998;Brouta等,Med Mycol 39:269-275,2001)。两个酶都在感染的猫中发现,并表现出角质分解能力(Mignon等,Med Mycol.36:395-404,1998)。所述蛋白水解酶的活性能使皮肤真菌专门在角质层、指甲或头发中生长,利用消化的角质化细胞膜,如单个氨基酸或小肽,作为细胞生长的营养来源。
以下描述来自皮肤真菌红色毛癣菌的两个新的亮氨酸氨肽酶:ruLAP1和ruLAP2。红色毛癣菌是发癣菌素属的一种,还包括T.ajelloi,T.asteroides,T.mentagrophytes,T.concentricum,T.cruris,T.dankalienese,T.equinum,T.equinum var.autotrophicum,T.equinum var.equinum,T.erinacei,T.f scheri,T.flavescens,T.floccosum,T.gloriae,T.gourvilii,T.granulare,T.granulosum,T gypseum,T inguinale,T interdigitale,T.intertriginis,T.kanei,T krajdenii,T longfusum,Tmegninii,T.pedis,T.proliferans,T.quickaneum,T radiolatum,T mentrophytesvar.erinacei,T.mentagrophytes var.interdigitale,T.mentagrophytes var.mentagrophytes,T.mentagrophytes var.nodulare,T.mentagrophytes var.quinnckeanum,T.niveum,T.nodulare,T.persicolor,T.phaseolforme,T.proliferans,T.purpureum,T.quinckeanum,T.radiolatum,T.raubitschekii,T.orthologues。上述两个LAPs的特性与那些由机会型真菌烟曲霉菌的fuLAP1和fuLAP2直系同源性基因编码的分泌型酶、商业上可获得的从猪肾提取的微粒体LAP(MEROPS>M1family)相近。所有上述的酶具有亮氨酸氨肽酶活性。同时,烟曲霉菌的氨肽酶fuLAP1和fuLAP2表现出70%的氨基酸同源性和米曲霉菌的直系同源性基因,参考本发明引用的美国专利US 6,127,161和5,994,113。进一步,ruLAP2表现出独特的性质:(i)ruLAP1和ruLAP2表现出50%的同源性与烟曲霉菌直系同源性基因编码的fuLAP1和fuLAP2、美国专利US 6,127,161和5,994,113中报道的米曲霉菌的[xu1]直系同源性基因;(ii)ruLAP2和来源于毕氏酵母表达***的类胰蛋白酶胞内酶的酶组合物能顺序酶解一个全长的多肽链,如变性的酪蛋白;(iii)ruLAP2和ruDPPIV(红色毛癣菌的另一个胞外酶)的酶混合物降解一段麦醇溶蛋白,已知其能抵抗蛋白酶水解,这样就提供了ruLAP2单独或与ruDPPIV组合用于治疗腹乳糜泻疾病或其他消化道疾病的证据,如吸收不良;(iv)ruLAP2和其他蛋白酶组合(酶组合物)可应用于食品工业中,如降解苦味底物、降解theves、处理肉类、香皂工业、分解朊病毒、分解病毒、降解有毒或副产物蛋白;(v)和,既然ruLAP2和/或其他真菌分泌的蛋白酶是皮肤真菌在指甲角质化底物中生长必须的,那么ruLAP2和/或其他真菌分泌的蛋白酶的抑制剂将是治疗霉菌病的一种新方法。
本发明提供一种新的真菌核酸和蛋白,所述蛋白具有亮氨酸氨肽酶活性。LAPs在很多功能中都起到作用,包括但不限于血液凝固、控制细胞死亡、组织分化、肿瘤侵袭、一些致病微生物感染过程中等,所述作用使LAPs在新药领域中成为一种有价值的目标和有力的工具。除了在生理上的功能,氨肽酶还有商业应用价值,主要在清洁剂和食品领域。由于微生物有着丰富的生物多样性和对基因操作来说易于感染,微生物是蛋白酶的极佳来源,例如真菌。微生物降解蛋白并利用降解的产物作为生长的营养来源。因此,本发明所述的新的LAPs具有广泛的工业用途,包括但不限于用于:食品工业中水解蛋白;降解副反应产物(如羽毛);降解朊蛋白;蛋白质体学的降解蛋白;氨基酸分析时的多肽水解反应;伤口清洗(如攻击死组织);假肢清洗和/或准备;织物柔软剂;香皂;对污染的水箱或其他含有要除掉蛋白或消毒的容器(如保鲜桶、瓶子等)进行清洗或消毒;外科器械的清洗。
本发明提供一种新的酶及其组合物,如相比与单个酶水解,多种酶的组合物容易分解不溶蛋白的结构,例如将角质细胞膜分解成小肽或游离氨基酸。事实上,除了S8和M36家族的胞外酶外,红色毛癣菌分泌的两个LAPs都各有不同的底物活性。ruLAP1和ruLAP2都属于一样的LAPs家族(MEROPS>M28)。两个LAPs的特性与那些由机会型真菌烟曲霉菌的fuLAP1和fuLAP2直系同源性基因编码的分泌型酶、商业上可获得的从猪肾提取的微粒体LAP(MEROPS>M1 family)相近。上述酶均具有亮氨酸氨肽酶活性。进一步的是,ruLAP2具有独特的初级结构,同时具有一个特性:和ruDPPIV的酶混合物能有序的降解一段多肽链,如麦醇溶蛋白,已知其能抵抗其他蛋白酶的水解。更特别的是,纯化的ruLAP2和来源于毕氏酵母表达***的类胰蛋白酶胞内酶的酶混合物物能顺序酶解一个全长的多肽链,如变性的酪蛋白。
本发明部分是基于编码新的多肽的一段新的核酸序列。所述新的核酸序列和其编码的多肽指的是ruLAP1、ruLAP2、fuLAP1和fuLAP2。所述核酸及其编码的多肽,本发明中统一简称为“EXOX”。
本发明所述新的EXOX核酸包括表1A、1B、2A、2B、3A、3B、4A、4B、5A、5B、6A、6B、7A、7B、8A、8B、9A、9B、10A、10B、11A、11B和12A所示的序列或片段、衍生物、类似物或同源物。本发明所述新的EXOX蛋白包括表1C、2C、3C、4C、5C、6C、7C、8C、9C、10C、11C和12B所示的蛋白片段序列。下面将具体描述所述EXOX核酸和蛋白。
同时,在本发明范围内还包括一种方法,所述方法是用蛋白酶抑制剂治疗或预防真菌感染或被真菌、酵母细胞和/或细菌感染的机会。
利用反转录基因技术,红色毛癣菌分泌的两个亮氨酸氨肽酶的特性通过和真菌烟曲霉菌直系同源性基因编码的酶、从猪肾提取的微粒体氨酸氨肽酶pkLAP比较,得到了确定。所述四个真菌酶(ruLAP1、ruLAP2、fuLAP1和fuLAP2)被证实和pkLAP同样对底物Leu-AMC结构优先选择,同样具有亮氨酸氨肽功能。另外,亮氨酸氨肽酶pkLAP对Leu-AMC结构具有极高的选择性,因此也被称为丙胺酸氨肽酶(MEROPS>M1.001)。
本发明所述的编码EXOX蛋白的EXOX核酸,包括本发明提供的核酸序列及其片段。本[xu2]发明同时也包括相应的突变体或基于所示序列变换的仍可以编码具有EXOX类似活性或功能的蛋白的核酸,或核酸序列的片段。本发明进一步包括相应的与本发明所示序列互补的核酸,也包括核酸片段与本发明任意描述的序列互补。本发明同时包括核酸、核酸片段或其互补片段的化学修饰。所述修饰包括,但不限于如下所述,基团和核酸的糖磷酸骨架的修饰或衍生。运用上述修饰至少是为了提高被修饰核酸的化学稳定性,例如,修饰的核酸可以应用于相关治疗领域中的反义结合核酸技术。
本发明所述的EXOX蛋白包括含有本发明所示序列的EXO蛋白。本发明同时还包括所示蛋白序列的突变体或相应残基的不同蛋白,其仍具有EXO类似活性或功能的蛋白,或蛋白的片段。本发明进一步还包括抗体或抗体片段,如Fab或(Fab2),所述抗体免疫特性的与本发明所述的蛋白结合。
EXOX核酸和蛋白具有潜在的治疗应用,如治疗真菌感染。所述EXOX核酸、蛋白和抑制剂同时具有包括但不限于如下功能:(i)改进蛋白产物的生物技术工具,如去除标签、含稀有氨基酸的产物;(ii)某些领域疾病诊断的药物研发,如过敏反应(麸质过敏);(iii)皮肤病药物研发,如抗真菌药物、疣的治疗、伤口愈合等;(iv)美容术,如去皮、脱毛、磨皮和dermaplaning;(v)食品工业,如作为营养添加剂、糖精、通过预分解产生低变应原性的食品;(vi)消毒工具,如净化蛋白污染物如朊蛋白或病毒;(vii)清洁或回收废弃物,如羽毛、骨头、头发和毛皮;(viii)清洗用品,如香波或液体清洁剂。
EXO蛋白的抑制剂,特别是ruLAP2的抑制剂,可以作为抗真菌感染药物来治疗真菌感染病。LAPs蛋白酶本身也可以作为治疗消化道疾病应用,如吸收不良或对麸朊引起过敏反应。麸[xu3]朊是小麦中发现的,谷蛋白和醇溶朊(醇溶谷蛋白)的蛋白混合物的专业名词。由于其内在的物理特性,如粘性和弹性,麸朊经常被用作食品添加剂。在食品质量控制和选择上检测麸朊的含量很重要,尤其是对那些麸朊过敏的个体,如麸朊过敏肠病、乳糜泻病、口炎性腹泻和相关的过敏反应,因此来自于小麦、裸麦,以及一些燕麦的食品中去除麸朊是很有必要的。
胞外蛋白酶核酸及多肽
本发明描述的红色毛癣菌亮氨酸氨肽酶活性及前人所研究的犬小孢子菌分泌的枯草杆菌蛋白酶和金属蛋白酶显示皮肤真菌分泌一系列蛋白酶,类似与那些在仅有碳和氮源的蛋白基质上的曲霉菌属。而且,ruDPPIV和ruDPPV:EMBL AF082514的编码二肽-氨肽酶的ruDPPV,与来自烟曲霉菌和米曲霉菌DPPIV和DPPV高度类似(Beauvais等,J Biol.Chem.272:6238-6244,1997;Beauvais等,Immun.65:3042-304,1997;Doumas等,Appl.Environ.Microbiol.64:4809-4815,1998;Doumas等,J.Food Mycol.2:271-279,1999),从基因组和红色毛癣菌的cDNA文库中分离得到。红色毛癣菌编码上述蛋白酶的基因中的内含子-外显子结构与从烟曲霉菌和米曲霉菌分离的同源基因类似。由于曲霉菌属与皮肤真菌属在分类上相近,出现上述结果就不奇怪了,同时它们属于同一个分类学上能产生闭囊壳原子囊(Eurotiomycete分类)的子囊菌群。与编码枯草杆菌蛋白酶和fungalysins的基因相比,ruLAP1和ruLAP2不是红色毛癣菌基因组中大基因家族的成员。
ruLAP1显示50%的氨基酸同源性与fuLAP1和/或LAP1(参见表19A和20),上述3个酶的结构都属于M28E亚家族,气单胞菌属和弧菌属的亮氨酰氨肽酶(MEROPS>M28.002)。另外,ruLAP2显示50%的氨基酸同源性与fuLAP2和/或LAP2(参见表19B和21),上述3个酶的结构都属于M28A亚家族,有液泡的S.cerevisiae的蛋白酶Y(MEROPS>M28.001),灰色链霉菌分泌的氨肽酶(MEROPS>M28.00X)。另外,M28A和M28E亚家族的成员表现出很低的相似性。然而,上述氨肽酶中的2个Zn++结合位点的氨基酸很保守,且在真菌LAPs被证明,具体特征本发明详述(表20、21)。在灰色链霉菌和Aeromonas proteolytica分泌的氨肽酶中His和Asp残基结合一个Zn++离子,另两个His和Glu残基结合第二个Zn++离子,同时第二个Asp残基与两个Zn++离子桥联(Greenblat等,J.Mol.Biol.265:620-636(1997);Hasselgren等,J.Biol.Inorg.Chem.6:120-127(2001))。在灰色链霉菌氨肽酶中用不同的二价离子替换Zn++受到Ca++的影响,且具有不同效果(Ben-Meir等,Eur.J.Biochem 212:107-112(1993);Lin等,J.Biol.Inorg.Chem.2:744-749(1997);Hasselgren等,J.Biol.Inorg.Chem.6:120-127(2001))。本发明所述的氨肽酶发现对不同的离子敏感性不同。与灰色链霉菌的氨肽酶一样,ruLAP2与fuLAP1被Co++高度激活。
尽管有着很高的序列同一性,ruLAP2与fuLAP1具有基本上不同的蛋白水解活性。特别的,ruLAP2能够有效的水解Asp-和Glu-7-胺-4-甲基香豆素(AMC),同时ruLAP2到目前为止被证明是单一的LAP,能在ruDPPIV存在下水解能抵抗胃和胰腺的蛋白酶水解的麸朊,或第二方面,以来自P.pastoris表达***的部分纯化的含有类胰酶胞外酶的形式消化一段全长多肽链,如变性的酪蛋白。LAP降解一段长的多肽的能力不能单独的从其分解氨酰-AMC残基基础上预测得到。皮肤真菌酶的部分特性已经在犬小孢子菌分泌的胞外酶上观察得到。与烟曲霉菌和米曲霉菌分泌的同源蛋白酶相比,31.5kDa犬小孢子菌枯草杆菌蛋白酶和43.5kDa犬小孢子菌金属蛋白酶都能够水解角朊。由于皮肤真菌从它们的在土壤中的习性进化后,它们已发展出一套用特殊的蛋白酶分解角质组织进行感染的策略。ruLAP2独特的特征能够表现在其高度特别的寄生的角质层和指甲的组织。
除了上述LAPs,一系列新的从致病的真菌红色毛癣菌分离得到的蛋白酶将在下面详述。与LAPs一样,上述蛋白酶都是胞外蛋白酶。它们包括:两个羧肽酶、一个脯氨酰氨肽酶、一个氨肽酶P、一个脯氨酰氨基酸酶和一个二肽基肽酶IV。另外两个新的蛋白酶已经得到确认:一个来自犬小孢子菌的亮氨酸氨肽酶(caLAP1)、一个来自须癣毛癣菌的亮氨酸氨肽酶(meLAP1)。
ruLAP2
ruLAP2是红色毛癣菌的亮氨酸氨肽酶。1757核苷酸(SEQ ID NO:1)的ruLAP2核酸如表1A所示。
  表1A、ruLAP2基因组核苷酸序列(SEQ ID NO:1)
  ATGAAGTCGCAACTGTTGAGCCTGGCTGTGGCCGTCACAACCATCTCCCAGGGCGTTGTTGGTCAAGAGCCCTTCGGATGGCCTTTCAAGCCTATGGTCACTCAGGTGAGTTGCTCTCAACAGATCGATCGATCGATCTACCTTTGTCCCTGTCACATCAAACTCCAGCAGAGCCAAAGAAACAGACACAATGTTCCTGGGGAATTCTTATGGGCTAATGTAAATGTATAGGATGACCTGCAAAACAAGATAAAGCTCAAGGATATCATGGCAGGCGTCGAGAAGCTGCAAAGCTTTTCTGATGCTCATCCTGAAAAGAACCGAGTGTTTGGTGGTAATGGCCACAAGGACACTGTAGAGTGGATCTACAATGAGATCAAGGCCACTGGCTACTACGATGTGAAGAAGCAGGAGCAAGTACACCTGTGGTCTCATGCCGAGGCTGCTCTCAATGCCAATGGCAAGGACCTCAAGGCCAGCGCCATGTCCTACAGCCCTCCTGCCAGCAAGATCATGGCTGAGCTTGTTGTTGCCAAGAACAATGGCTGCAATGCTGTATGTGCCATACACTTTCTATACGTCACATTCTCTCTAGAATGAAGAGCACGGGAGAACTAACTTTATGTATACAGACTGATTACCCAGCGAACACTCAGGGCAAGATCGTCCTCGTTGAGCGTGGTGTCTGCAGCTTCGGCGAGAAGTCTGCTCAGGCTGGTGATGCAAAGGCTGCTGGTGCCATTGTCTACAACAACGTCCCCGGATCCCTTGCTGGCACTCTTGGTGGCCTTGACAAGCGCCATGTCCCAACCGCTGGTCTTTCCCAGGAGGATGGAAAGAACCTTGCTACCCTCGTTGCTTCTGGTAAGATTGATGTCACCATGAACGTTATCAGTCTGTTTGAGAACCGAACCACGTAAGTAGCTCAACGGCTGATCCAGCATCAATTGTCTCGAGTATATACTAAATCGATACCTCATAGCTGGAACGTCATTGCTGAGACCAAGGGAGGAGACCACAACAACGTTATCATGCTCGGTGCTCACTCCGACTCCGTCGATGCCGGCCCTGGTATTAACGACAACGGCTCGGGCTCCATTGGTATCATGACCGTTGCCAAAGCCCTCACCAACTTCAAGCTCAACAACGCCGTCCGCTTTGCCTGGTGGACCGCTGAGGAATTCGGTCTCCTTGGAAGCACCTTCTACGTCAACAGCCTCGATGACCGTGAGCTGCACAAGGTCAA
  GTTGTACCTCAACTTCGACATGATCGGCTCTCCCAACTTCGCCAACCAGATCTACGACGGTGACGGTTCGGCCTACAACATGACCGGCCCCGCTGGCTCTGCTGAAATCGAGTACCTGTTCGAGAAGTTCTTTGACGACCAGGGTATCCCACACCAGCCCACTGCCTTCACTGGCCGATCCGACTACTCTGCTTTCATCAAGCGCAACGTGCCCGCTGGCGGCCTCTTCACTGGAGCCGAGGTTGTCAAGACCCCCGAGCAAGTCAAGTTGTTCGGTGGTGAGGCTGGCGTTGCCTATGACAAGAACTACCATCGCAAGGGCGACACCGTTGCCAACATCAACAAGGGAGCTATCTTCCTTAACACTCGAGCCATCGCCTACGCTATCGCCGAGTATGCCCGATCCCTCAAGGGATTCCCAACCCGCCCAAAGACCGGCAAGCGTGACGTCAACCCCCAGTATTCTAAGATGCCTGGTGGTGGCTGCGGACACCACACTGTCTTCATGTAA
1488个核苷酸的ruLAP2开放阅读框(ORF),其中起始子ATG在第一个位置上(表1B中下划线)。
  表1B、ruLAP2核苷酸序列(SEQ ID NO:2)
  ATGAAGTCGCAACTGTTGAGCCTGGCTGTGGCCGTCACAACCATCTCCCAGGGCGTTGTTGGTCAAGAGCCCTTCGGATGGCCTTTCAAGCCTATGGTCACTCAGGATGACCTGCAAAACAAGATAAAGCTCAAGGATATCATGGCAGGCGTCGAGAAGCTGCAAAGCTTTTCTGATGCTCATCCTGAAAAGAACCGAGTGTTTGGTGGTAATGGCCACAAGGACACTGTAGAGTGGATCTACAATGAGATCAAGGCCACTGGCTACTACGATGTGAAGAAGCAGGAGCAAGTACACCTGTGGTCTCATGCCGAGGCTGCTCTCAATGCCAATGGCAAGGACCTCAAGGCCAGCGCCATGTCCTACAGCCCTCCTGCCAGCAAGATCATGGCTGAGCTTGTTGTTGCCAAGAACAATGGCTGCAATGCTACTGATTACCCAGCGAACACTCAGGGCAAGATCGTCCTCGTTGAGCGTGGTGTCTGCAGCTTCGGCGAGAAGTCTGCTCAGGCTGGTGATGCAAAGGCTGCTGGTGCCATTGTCTACAACAACGTCCCCGGATCCCTTGCTGGCACTCTTGGTGGCCTTGACAAGCGCCATGTCCCAACCGCTGGTCTTTCCCAGGAGGATGGAAAGAACCTTGCTACCCTCGTTGCTTCTGGTAAGATTGATGTCACCATGAACGTTATCAGTCTGTTTGAGAACCGAACCACCTGGAACGTCATTGCTGAGACCAAGGGAGGAGACCACAACAACGTTATCATGCTCGGTGCTCACTCCGACTCCGTCGATGCCGGCCCTGGTATTAACGACAACGGCTCGGGCTCCATTGGTATCATGACCGTTGCCAAAGCCCTCACCAACTTCAAGCTCAACAACGCCGTCCGCTTTGCCTGGTGGACCGCTGAGGAATTCGGTCTCCTTGGAAGCACCTTCTACGTCAACAGCCTCGATGACCGTGAGCTGCACAAGGTCAAGTTGTACCTCAACTTCGACATGATCGGCTCTCCCAACTTCGCCAACCAGATCTACGACGGTGACGGTTCGGCCTACAACATGACCGGCCCCGCTGGCTCTGCTGAAATCGAGTACCTGTTCGAGAAGTTCTTTGACGACCAGGGTATCCCACACCAGCCCACTGCCTTCACTGGCCGATCCGACTACTCTGCTTTCATCAAGCGCAACGTGCCCGCTGGCGGCCTCTTCACTGGAGCCGAGGTTGTCAAGACCCCCGAGCAAGTCAAGTTGTTCGGTGGTGAGGCTGGCGTTGCCTATGACAAGAACTACCATCGCAAGGGCGACACCGTTGCCAACATCAACAAGGGAGCTATCTTCCTTAACACTCGAGCCATCGCCTACGCTATCGCCGAGTATGCCCGATCCCTCAAGGGATTCCCAACCCGCCCAAAGACCGGCAAGCGTGACGTCAACCCCCAGTATTCTAAGATGCCTGGTGGTGGCTGCGGACACCACACTGTCTTCATGTAA
上述ruLAP2核苷酸序列(SEQ ID NO:2)编码有495个氨基酸残基(SEQ ID NO:3)的蛋白,在表1C中以一个字母的氨基酸代码表示。
  表1C、ruLAP2编码的蛋白序列(SEQ ID NO:3)
  MKSQLLSLAVAVTTISQGVVGQEPFGWPFKPMVTQDDLQNKIKLKDIMAGVEKLQSFSDAHPEKNRVFGGNGHKDTVEWIYNEIKATGYYDVKKQEQVHLWSHAEAALNANGKDLKASAMSYSPPASKIMAELVVAKNNGCNATDYPANTQGKIVLVERGVCSFGEKSAQAGDAKAAGAIVYNNVPGSLAGTLGGLDKRHVPTAGLSQEDGKNLATLVASGKIDVTMNVISLFENRTTWNVIAETKGGDHNNVIMLGAHSDSVDAGPGINDNGSGSIGIMTVAKALTNFKLNNAVRFAWWTAEEFGLLGSTFYVNSLDDRELHKVKLYLNFDMIGSPNFANQIYDGDGSAYNMTGPAGSAEIEYLFEKFFDDQGIPHQPTAFTGRSDYSAFIKRNVPAGGLFTGAEVVKTPEQVKLFGGEAGVAYDKNYHRKGDTVANINKGAIFLNTRAIAYAIAEYARSLKGFPTRPKTGKRDVNPQYSKMPGGGCGHHTVFM
上述ruLAP2具有与表1D、1E和1F中的BLAST氨基酸序列同源性。
软件操作应用如下:
tblastn-将蛋白“序列1”和核酸“序列2”比较,其中核苷酸序列所有6阅读框转录。
blastx-将核酸“序列1”和蛋白“序列2”比较。
blastp-蛋白与蛋白比较。
这里所述的BLAST比对结果中,“E值”或“期待”值是一种可能性的数据显示,表示比对序列可能在查询的数据库中与BLAST查询序列具有偶然的类似性。期待值(E)是一个描述找到可能“期待”看有机会与查询的数据库中的特殊位点吻合的参数。它被分值(S)减少其指数,S是两个序列间配对情况。必要的,E值描述了序列间配对存在的随机背景误差。
                                        表1D.ruLAP2 TBLASTN结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi469363   Saccharomycescerevisiae氨肽酶Y基因   32421   170/477(35%)   239/437(55%)   8e-65
  gi15839805   MycobacteriumtuberculosisCDC15551,整个280个基因组中的33片段   18857   152/424(35%)   225/424(53%)   5e-57
  gi9949032   Pseudomonasaruginosa PA01,,整个529个基因组中的281片段氨肽酶Y基因   12547   129/317(40%)   180/317(56%)   1e-56
                                         表1E.ruLAP2 BLASTX结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi28918599   未知蛋白/Neurospora crassa   508   219/467(46%)   287/467(61%)   e-112
  gi584764   APE3 YEAST;氨肽酶前体/Saccharomycescerevisiae   537   170/477(35%)   239/437(53%)   1e-65
  gi9949032   未知蛋白/Thermobifida fusca   514   151/460(32%)   237/460(51%)   5e-61
  gi15839805   水解酶/MycobacteriumtuberculosisCDC15551   493   152/424(35%)   225/424(53%)   6e-58
                                                     表1F.ruLAP2 BLASTP结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi28918599   未知蛋白/Neurospora crassa   508   219/467(46%)   287/467(61%)   e-105
  gi584764   APE3 YEAST;氨肽酶前体/Saccharomycescerevisiae   537   169/477(35%)   237/477(49%)   2e-64
  gi15839805   水解酶/MycobacteriumtuberculosisCDC15551   493   152/424(35%)   225/424(53%)   5e-57
  gi123017467   未知蛋白/Thermobifida fusca   514   150/460(32%)   237/460(51%)   1e-56
ruLAP1
ruLAP1是红色毛癣菌的亮氨酸氨肽酶。1256个核苷酸(SEQ ID NO:4)的ruLAP1核酸如表2A所示。
  表2A、ruLAP1基因组核苷酸序列(SEQ ID NO:4)
  ATGAAGCTCCTCTCTGTTCTTGCGCTGAGCGCTACCGCTACCTCCGTCCTCGGAGCTAGCATTCCTGTTGATGCCCGGGCCGAGAAGTTCCTCATCGAACTTGCCCCTGGTGAGACTCGCTGGGTTACCGAGGAGGAGAAGTGGGAGCTTAAGCGGGTATGTACCACTATCCTACGCAAAAGTTGTATTTTCACTAGATAATATTGGTTATTAACACCCATTCTAGAAGGGTCAAGACTTCTTTGACATCACTGACGAGGAGGTTGGATTCACTGCTGCTGTTGCACAGCCAGCCATTGCCTACCCAACCTCCATCCGCCATGCTAATGCTGTTAACGCCATGATTGCTACCCTCTCCAAGGAGAACATGCAGCGCGATCTGACCAAGCTCAGCTCGTTCCAAACCGCTTACTATAAGGTTGACTTTGGCAAGCAGTCTGCCACCTGGCTCCAGGAGCAAGTCCAGGCTGCCATCAATACCGCTGGTGCCAATCGCTACGGAGCCAAGGTCGCCAGCTTCCGACACAACTTCGCTCAGCACAGCATCATTGCCACTATTCCCGGCCGCTCCCCTGAAGTCGTTGTCGTCGGTGCTCACCAAGACAGCATCAACCAACGCAGCCCCATGACCGGCCGCGCTCCAGGTGCCGATGACAACGGCAGTGGCTCCGTCACCATCCTTGAGGCCCTCCGTGGTGTTCTCCGGGACCAGACCATCCTCCAGGGCAAGGCTGCCAACACCATTGAGTTCCACTGGTACGCCGGTGAGGAAGCTGGTCTTCTGGGCTCCCAGGCCATCTTCGCCAACTACAAACAGACCGGCAAGAAGGTCAAGGGCATGCTCAACCAGGACATGACCGGTTACATCAAGGGAATGGTCGACAAGGGTCTCAAGGTGTCCTTCGGTATCATCACCGACAACGTCAACGCTAACTTGACCAAGTTCGTCCGCATGGTCATCACCAAGGTAAGCTTCAACTCTTGATAAATATATTTTTCATCGATGAAATGATGTCCTAATAATGCTTAAGTACTGCTCAATCCCAACCATCGACACCCGCTGCGGCTATGCTTGCTCTGACCACGCCTCTGCCAACCGCAATGGCTACCCATCTGCCATGGTTGCCGAGTCTCCCATCGATCTCCTCGACCCTCACCTCCACACTGACTCTGACAACATTAGCTACCTCGACTTCGACCACATGATCGAGCACGCTAAGCTCATTGTCGGCTTCGTCACTGAGCTCGCTAAGTAA
1122个核苷酸的ruLAP1开放阅读框(ORF),其中起始子ATG在第一个位置上(表2B中下划线)。
  表2B、ruLAP1核苷酸序列(SEQ ID NO:5)
  ATGAAGCTCCTCTCTGTTCTTGCGCTGAGCGCTACCGCTACCTCCGTCCTCGGAGCTAGCATTCCTGTTGATGCCCGGGCCGAGAAGTTCCTCATCGAACTTGCCCCTGGTGAGACTCGCTGGGTTACCGAGGAGGAGAAGTGGGAGCTTAAGCGGAAGGGTCAAGACTTCTTTGACATCACTGACGAGGAGGTTGGATTCACTGCTGCTGTTGCACAGCCAGCCATTGCCTACCCAACCTCCATCCGCCATGCTAATGCTGTTAACGCCATGATTGCTACCCTCTCCAAGGAGAACATGCAGCGCGATCTGACCAAGCTCAGCTCGTTCCAAACCGCTTACTATAAGGTTGACTTTGGCAAGCAGTCTGCCACCTGGCTCCAGGAGCAAGTCCAGGCTGCCATCAATACCGCTGGTGCCAATCGCTACGGAGCCAAGGTCGCCAGCTTCCGACACAACTTCGCTCAGCACAGCATCATTGCCACTATTCCCGGCCGCTCCCCTGAAGTCGTTGTCGTCGGTGCTCACCAAGACAGCATCAACCAACGCAGCCCCATGACCGGCCGCGCTCCAGGTGCCGATGACAACGGCAGTGGCTCCGTCACCATCCTTGAGGCCCTCCGTGGTGTTCTCCGGGACCAGACCATCCTCCAGGGCAAGGCTGCCAACACCATTGAGTTCCACTGGTACGCCGGTGAGGAAGCTGGTCTTCTGGGCTCCCAGGCCATCTTCGCCAACTACAAACAGACCGGCAAGAAGGTCAAGGGCATGCTCAACCAGGACATGACCGGTTACATCAAGGGAATGGTCGACAAGGGTCTCAAGGTGTCCTTCGGTATCATCACCGACAACGTCAACGCTAACTTGACCAAGTTCGTCCGCATGGTCATCACCAAGTACTGCTCAATCCCAACCATCGACACCCGCTGCGGCTATGCTTGCTCTGACCACGCCTCTGCCAACCGCAATGGCTACCCATCTGCCATGGTTGCCGAGTCTCCCATCGATCTCCTCGACCCTCACCTCCACACTGACTCTGACAACATTAGCTACCTCGACTTCGACCACATGATCGAGCACGCTAAGCTCATTGTCGGCTTCGTCACTGAGCTCGCTAAGTAA
上述ruLAP1核苷酸序列(SEQ ID NO:5)编码有377个氨基酸残基(SEQ ID NO:6)的蛋白,在表2C中以一个字母的氨基酸代码表示。
  表2C、ruLAP1编码的蛋白序列(SEQ ID NO:6)
  MKLLSVLALSATATSVLGASIPVDARAEKFLIELAPGETRWVTEEEKWELKRKGQDFFDITDEEVGFTAAVAQPAIAYPTSIRHANAVNAMIATLSKENMQRDLTKLSSFQTAYYKVDFGKQSATWLQEQVQAAINTAGANRYGAKVASFRHNFAQHSIIATIPGRSPEVVVVGAHQDSINQRSPMTGRAPGADDNGSGSVTILEALRGVLRDQTILQGKAANTIEFHWYAGEEAGLLGSQAIFANYKQTGKKVKGMLNQDMTGYIKGMVDKGLKVSFGIITDNVNANLTKFVRMVITKYCSIPTIDTRCGYACSDHASANRNGYPSAMVAESPIDLLDPHLHTDSDNISYLDFDHMIEHAKLIVGFVTELAK
上述ruLAP1具有与表2D、2E和2F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。
                            表2D.ruLAP1 TBLASTN结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  >gi1762234   Polyketidesynthase PKSL2/   9894   131/247(53%)   171/247(69%)   1e-95
  Aspergillusparasiticus   40/76(52%)20/24(83%)   57/76(75%)22/24(91%)
 >gi23393798   亮氨酸氨肽酶(Lap1)/Aspergillussojae   2547   77/159(48%)63/148(42%)14/30(46%)   97/159(61%)89/148(60%)23/30(76%)   4e-64
 >gi927685   Saccharomycescerevisiae染色IV lambda 3641和cosmid 9831,和9410   78500   137/350(39%)   201/346(57%)   3e-62
 >gi7413486   Agricus氨肽酶的部分mRNA   1089   130/346(37%)   189/346(54%)   2e-55
                            表2E.ruLAP1 BLASTX结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
 >gi23393799   亮氨酸氨肽酶/Aspergillussojae   377   126/248(50%)37/78(47%)13/24(83%)   162/248(65%)55/78(70%)20/24(83%)   5e-87
 >gi28918132   未知蛋白/Neurospora crassa   402   115/247(46%)43/77(55%)18/24(75%)   153/247(61%)58/77(75%)23/24(95%)   8e-86
 >gi6320623   未知ORF;ydr415cp/Saccharomycescerevisiae   374   96/254(37%)37/77(46%)   143/254(56%)49/77(63%)   7e-55
 >gi28916832   未知蛋白/Neurospora crassa   409   96/226(42%)31/66(46%)   135/226(59%)41/66(62%)   4e-54
                                       表2F.ruLAP1 BLASTP结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  >gi23393799   亮氨酸氨肽酶/Aspergillussojae   377   175/348(50%)   234/348(67%)   4e-99
  >gi28918132   未知蛋白/Neurospora crassa   402   175/345(50%)   230/345(66%)   2e-97
  >gi6320623   未知ORF;ydr415cp/Saccharomycescerevisiae   374   140/351(39%)   201/351(57%)   7e-65
  >gi28916832   未知蛋白/Neurospora crassa   409   129/296(43%)   178/296(60%)   3e-58
fuLAP2
fuLAP2是烟曲霉菌的亮氨酸氨肽酶。1557个核苷酸(SEQ ID NO:7)的fuLAP2核酸如表3A所示。
  表3A、fuLAP2基因组核苷酸序列(SEQ ID NO:7)
  ATGAAGCTGCTCTACCTCACATCGTTTGCCTCTCTGGCCGTGGCCAATGGCCCAGGATGGGACTGGAAGCCCCGAGTTCATCCGGTTAGTGTTCCTCTCGCCGGGTTTGTCTGCTGTATGCTAACAGCATCCTGTCTATTACAGAAAGTCCTGCCCCAAATGATCCATTTGTGGGATCTTCTGCAGGGCGCTCAACAGCTGGAAGACTTCGCCTATGCCTACCCCGAGCGCAACCGCGTCTTTGGTGGACGGGCCCACGAGGACACCGTCAACTACCTCTACCGTGAGTTGAAGAAAACCGGCTACTACGACGTTTACAAGCAGCCCCAGGTTCACCAGTGGACCCGAGCCGACCAGGCTCTCACCGTCGACGGCCAGTCCTATGACGCCACAACCATGACTTACAGCCCCAGCGTAAACGCCACGGCGCCGCTGGCAGTGGTGAACAACCTGGGCTGCGTCGAGGCTGACTATCCCGCCGATCTGACGGGCAAGATTGCTCTGATCTCGCGGGGCGAGTGCACCTTTGCGACCAAATCCGTCTTGAGCGCCAAGGCCGGGGCGGCGGCGGCACTCGTGTACAACAATATCGAGGGTTCGATGGCGGGAACTCTGGGCGGCGCGACCAGCGAGCTGGGTGCCTACGCTCCCATCGCCGGCATCAGCCTCGCGGACGGACAGGCGCTGATCCAGATGATCCAGGCGGGCACGGTGACAGCCAACCTGTGGATCGACAGCCAGGTCGAGAACCGTACCACCTACAACGTGATCGCGCAGACCAAGGGCGGCGACCCCAACAACGTCGTCGCGCTGGGTGGCCACACGGACTCGGTCGAGGCCGGGCCCGGCATCAACGACGACGGCTCCGGCATCATCAGCAACCTCGTCGTCGCCAAGGCGCTGACCCGCTTCTCGGTCAAGAACGCGGTGCGCTTCTGCTTCTGGACGGCGGAGGAGTTCGGCCTGCTGGGCAGCAACTACTACGTCAACAGCCTCAATGCCACCGAGCAGGCCAAGATCCGCCTGTATCTCAACTTCGACATGATCGCCTCCCCCAACTACGCCCTGATGATCTATGACGGCGACGGCTCGGCCTTCAACCTGACGGGGCCGGCCGGCTCGGCGCAGATCGAGCGGCTCTTCGAGGACTACTACACGTCGATCCGCAAGCCGTTCGTGCCGACCGAGTTCAACGGCCGCTCCGACTACCAGGCCTTTATTCTCAACGGCATCCCCGCGGGAGGCCTCTTCACCGGCGCGGAGGCGATCAAGACCGAGGAACAGGCCCAATTGTTTGGCGGCCAGGCCGGCGTGGCTCTGGACGCCAACTACCACGCCAAGGGTGACAACATGACTAATCTCAACCGCGAGGCTTTCCTGATCAATTCCAGGGCGACGGCCTTTGCCGTGGCGACGTACGCCAACAGCCTTGACTCGATCCCCCCACGCAACATGACCACCGTGGTCAAGCGGTCGCAGCTGGAGCAAGCCATGAAGAGGACCCCGCACACGCACACCGGCGGAACAGGATGCTACAAGGACCGGGTTGAGCAGTAG
1497个核苷酸的fuLAP2开放阅读框(ORF),其中起始子ATG在第一个位置上(表3B中下划线)。
  表3B、fuLAP2核苷酸序列(SEQ ID NO:8)
  ATGAAGCTGCTCTACCTCACATCGTTTGCCTCTCTGGCCGTGGCCAATGGCCCAGGATGGGACTGGAAGCCCCGAGTTCATCCGAAAGTCCTGCCCCAAATGATCCATTTGTGGGATCTTCTGCAGGGCGCTCAACAGCTGGAAGACTTCGCCTATGCCTACCCCGAGCGCAACCGCGTCTTTGGTGGACGGGCCCACGAGGACACCGTCAACTACCTCTACCGTGAGTTGAAGAAAACCGGCTACTACGACGTTTACAAGCAGCCCCAGGTTCACCAGTGGACCCGAGCCGACCAGGCTCTCACCGTCGACGGCCAGTCCTATGACGCCACAACCATGACTTACAGCCCCAGCGTAAACGCCACGGCGCCGCTGGCAGTGGTGAACAACCTGGGCTGCGTCGAGGCTGACTATCCCGCCGATCTGACGGGCAAGATTGCTCTGATCTCGCGGGGCGAGTGCACCTTTGCGACCAAATCCGTCTTGAGCGCCAAGGCCGGGGCGGCGGCGGCACTCGTGTACAACAATATCGAGGGTTCGATGGCGGGAACTCTGGGCGGCGCGACCAGCGAGCTGGGTGCCTACGCTCCCATCGCCGGCATCAGCCTCGCGGACGGACAGGCGCTGATCCAGATGATCCAGGCGGGCACGGTGACAGCCAACCTGTGGATCGACAGCCAGGTCGAGAACCGTACCACCTACAACGTGATCGCGCAGACCAAGGGCGGCGACCCCAACAACGTCGTCGCGCTGGGTGGCCACACGGACTCGGTCGAGGCCGGGCCCGGCATCAACGACGACGGCTCCGGCATCATCAGCAACCTCGTCGTCGCCAAGGCGCTGACCCGCTTCTCGGTCAAGAACGCGGTGCGCTTCTGCTTCTGGACGGCGGAGGAGTTCGGCCTGCTGGGCAGCAACTACTACGTCAACAGCCTCAATGCCACCGAGCAGGCCAAGATCCGCCTGTATCTCAACTTCGACATGATCGCCTCCCCCAACTACGCCCTGATGATCTATGACGGCGACGGCTCGGCCTTCAACCTGACGGGGCCGGCCGGCTCGGCGCAGATCGAGCGGCTCTTCGAGGACTACTACACGTCGATCCGCAAGCCGTTCGTGCCGACCGAGTTCAACGGCCGCTCCGACTACCAGGCCTTTATTCTCAACGGCATCCCCGCGGGAGGCCTCTTCACCGGCGCGGAGGCGATCAAGACCGAGGAACAGGCCCAATTGTTTGGCGGCCAGGCCGGCGTGGCTCTGGACGCCAACTACCACGCCAAGGGTGACAACATGACTAATCTCAACCGCGAGGCTTTCCTGATCAATTCCAGGGCGACGGCCTTTGCCGTGGCGACGTACGCCAACAGCCTTGACTCGATCCCCCCACGCAACATGACCACCGTGGTCAAGCGGTCGCAGCTGGAGCAAGCCATGAAGAGGACCCCGCACACGCACACCGGCGGAACAGGATGCTACAAGGACCGGGTTGAGCAGTAG
上述fuLAP2核苷酸序列(SEQ ID NO:8)编码有498个氨基酸残基(SEQ ID NO:9)的蛋白,在表3C中以一个字母的氨基酸代码表示。
  表3C、fuLAP2编码的蛋白序列(SEQ ID NO:9)
  MKLLYLTSFASLAVANGPGWDWKPRVHPKVLPQMIHLWDLLQGAQQLEDFAYAYPERNRVFGGRAHEDTVNYLYRELKKTGYYDVYKQPQVHQWTRADQALTVDGQSYDATTMTYSPSVNATAPLAVVNNLGCVEADYPADLTGKIALISRGECTFATKSVLSAKAGAAAALVYNNIEGSMAGTLGGATSELGAYAPIAGISLADGQALIQMIQAGTVTANLWIDSQVENRTTYNVIAQTKGGDPNNVVALGGHTDSVEAGPGINDDGSGIISNLVVAKALTRFSVKNAVRFCFWTAEEFGLLGSNYYVNSLNATEQAKIRLYLNFDMIASPNYALMIYDGDGSAFNLTGPAGSAQIERLFEDYYTSIRKPFVPTEFNGRSDYQAFILNGIPAGGLFTGAEAIKTEEQAQLFGGQAGVALDANYHAKGDNMTNLNREAFLINSRATAFAVATYANSLDSIPPRNMTTVVKRSQLEQAMKRTPHTHTGGTGCYKDRVEQ
上述fuLAP2具有与表3D、3E和3F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。
                                   表3D.fuLAP2 TBLASTN结果
 基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
 >gi469463   SaccharomycesCerevisiae/氨肽酶Y基因   2272   184/464(39%)   243/464(52%)   7e-69
 >gi9949032   PseudomonasAruginosa PA01,,整个529个基因组中的281片段氨肽酶Y基因   12547   165/445(37%)   231/445(51%)   9e-67
 >gi23017467   MycobacteriumTuberculosisCDC15551,整个280个基因组中的33片段   18857   166/426(38%)   218/426(51%)   2e-62
                                      表3E.fuLAP2 BLASTX结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  >gi28918599   未知蛋白/Neurospora crassa   508   250/479(52%)   314/479(65%)   e-131
  >gi23017467   未知蛋白/Thermobifida fusca   514   173/465(37%)   251/465(53%)   4e-74
  >gi584764   APE3 YEAST;氨肽酶前体/Saccharomycescerevisiae   537   184/464(39%)   243/464(52%)   8e-70
  >gi9949032   可能的氨肽酶/PseudomonasAeruginosa PA01   536   165/445(37%)   231/445(51%)   1e-67
  >gi15839805   水解酶/MycobacteriumTuberculosisCDC15551   493   166/426(38%)   218/426(51%)   3e-63
                                             表3F.fuLAP2 BLASTP结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  >gi28918599   未知蛋白/Neurospora crassa   508   250/469(52%)   314/479(65%)   e-128
  >gi123017467   未知蛋白/Thermobifida fusca   514   173/465(37%)   251/465(53%)   3e-71
  >gi584764   APE3 YEAST;氨肽酶前体/Saccharomycescerevisiae   537   183/464(39%)   243/464(52%)   6e-70
  >gi15598135   可能的氨肽酶/   536   164/445   230/445   3e-65
  PseudomonasAeruginosa PA01   (36%)   (51%)
fuLAP1
fuLAP1是烟曲霉菌的亮氨酸氨肽酶。1298个核苷酸(SEQ ID NO:10)的ruLAP1核酸如表4A所示。
  表4A、fuLAP1基因组核苷酸序列(SEQ ID NO:10)
  ATGAAAGTTCTTACAGCTATTGCGCTGAGCGCAATAGCTTTCACAGGGGCTGTAGCTGCAGTGATTACTCAGGAAGCATTCTTAAACAACCCCCGCATCCATCATGACCAGGAGAAGTACTTGATCGAACTGGCCCCTTATCGAACACGATGGGTGACTGAAGAGGAGAAATGGGCATTGAAATTGGTACCATACTTCCCCAAAATTTGGGTCTCCAAGTCCACGGGCGACTAACTGCACGATTGCTTGAAGGACGGCGTGAATTTTATCGATATCACAGAAGAGCACAACACCGGATTTTACCCGACTCTCCACAGCGCCAGCTATGTGAAATATCCACCGAAGATGCAGTATGCAGAAGAAGTGGCTGCTCTTAACAAGAATTTATCGAAAGAAAACATGAAGGCCAACCTGGAACGATTCACATCATTTCATACTCGCTATTACAAATCTCAGACGGGAATCCGATCGGCAACGTGGCTGTTCGACCAAGTTCAGAGAGTTGTCTCTGAGTCTGGAGCCGCTGAGTATGGTGCAACTGTTGAGCGATTCTCTCATCCATGGGGTCAGTTCAGCATTATTGCCCGAATACCCGGCCGAACGAACAAGACTGTGGTGCTGGGCGCCCATCAGGACAGCATCAATTTGTTTCTCCCGTCAATCTTGGCTGCTCCCGGTGCTGATGACGATGGAAGTGGAACTGTCACCATTCTTGAAGCGTTGCGCGGTCTGCTGCAGTCAGACGCCATTGCCAAGGGTAATGCATCCAATACTGTCGAGTTCCACTGGTACTCTGCAGAAGAAGGCGGAATGCTGGGCTCCCAGGCAATATTTTCCAATTACAAGCGGAATAGGCGGGAAATCAAAGCCATGCTCCAGCAAGACATGACTGGCTACGTCCAGGGAGCTTTGAACGCCGGTGTTGAGGAAGCCATAGGAATTATGGTCGATTATGTCGACCAGGGCCTCACACAGTTTCTCAAGGACGTTGTTACAGCGGTAAGCCTCAGTTGTCCCCCACGAAAAGCTGTTTAGTCGACAAATGAAATTGACGGCTGCATTAGTACTGCTCTGTGGGTTACCTGGAGACGAAGTGCGGATATGCCTGCTCCGACCACACCTCGGCCAGTAAATATGGTTATCCCGCGGCTATGGCGACAGAAGCAGAGATGGAAAATACCAATAAGAAGATACATACTACCGACGACAAGATCAAGTATTTGAGCTTCGATCATATGTTGGAGCATGCCAAGTTGAGTCTTGGCTTCGCTTTCGAATTGGCATTTGCGCCGTTTTAA
1167个核苷酸的fuLAP1开放阅读框(ORF),其中起始子ATG在第一个位置上(表4B中下划线)。
  表4B、fuLAP1核苷酸序列(SEQ ID NO:11)
  ATGAAAGTTCTTACAGCTATTGCGCTGAGCGCAATAGCTTTCACAGGGGCTGTAGCTGCAGTGATTACTCAGGAAGCATTCTTAAACAACCCCCGCATCCATCATGACCAGGAGAAGTACTTGATCGAACTGGCCCCTTATCGAACACGATGGGTGACTGAAGAGGAGAAATGGGCATTGAAATTGGACGGCGTGAATTTTATCGATATCACAGAAGAGCACAACACCGGATTTTACCCGACTCTCCACAGCGCCAGCTATGTGAAATATCCACCGAAGATGCAGTATGCAGAAGAAGTGGCTGCTCTTAACAAGAATTTATCGAAAGAAAACATGAAGGCCAACCTGGAACGATTCACATCATTTCATACTCGCTATTACAAATCTCAGACGGGAATCCGATCGGCAACGTGGCTGTTCGACCAAGTTCAGAGAGTTGTCTCTGAGTCTGGAGCCGCTGAGTATGGTGCAACTGTTGAGCGATTCTCTCATCCATGGGGTCAGTTCAGCATTATTGCCCGAATACCCGGCCGAACGAACAAGACTGTGGTGCTGGGCGCCCATCAGGACAGCATCAATTTGTTTCTCCCGTCAATCTTGGCTGCTCCCGGTGCTGATGACGATGGAAGTGGAACTGTCACCATTCTTGAAGCGTTGCGCGGTCTGCTGCAGTCAGACGCCATTGCCAAGGGTAATGCATCCAATACTGTCGAGTTCCACTGGTACTCTGCAGAAGAAGGCGGAATGCTGGGCTCCCAGGCAATATTTTCCAATTACAAGCGGAATAGGCGGGAAATCAAAGCCATGCTCCAGCAAGACATGACTGGCTACGTCCAGGGAGCTTTGAACGCCGGTGTTGAGGAAGCCATAGGAATTATGGTCGATTATGTCGACCAGGGCCTCACACAGTTTCTCAAGGACGTTGTTACAGCGTACTGCTCTGTGGGTTACCTGGAGACGAAGTGCGGATATGCCTGCTCCGACCACACCTCGGCCAGTAAATATGGTTATCCCGCGGCTATGGCGACAGAAGCAGAGATGGAAAATACCAATAAGAAGATACATACTACCGACGACAAGATCAAGTATTTGAGCTTCGATCATATGTTGGAGCATGCCAAGTTGAGTCTTGGCTTCGCTTTCGAATTGGCATTTGCGCCGTTTTAA
上述fuLAP1核苷酸序列(SEQ ID NO:11)编码有388个氨基酸残基(SEQ ID NO:12)的蛋白,在表4C中以一个字母的氨基酸代码表示。
  表4C、fuLAP1编码的蛋白序列(SEQ ID NO:12)
  MKVLTAIALSAIAFTGAVAAVITQEAFLNNPRIHHDQEKYLIELAPYRTRWVTEEEKWALKLDGVNFIDITEEHNTGFYPTLHSASYVKYPPKMQYAEEVAALNKNLSKENMKANLERFTSFHTRYYKSQTGIRSATWLFDQVQRVVSESGAAEYGATVERFSHPWGQFSIIARIPGRTNKTVVLGAHQDSINLFLPSILAAPGADDDGSGTVTILEALRGLLQSDAIAKGNASNTVEFHWYSAEEGGMLGSQAIFSNYKRNRREIKAMLQQDMTGYVQGALNAGVEEAIGIMVDYVDQGLTQFLKDVVTAYCSVGYLETKCGYACSDHTSASKYGYPAAMATEAEMENTNKKIHTTDDKIKYLSFDHMLEHAKLSLGFAFELAFAPF
上述fuLAP1具有与表4D、4E和4F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。
                                         表4D.fuLAP1 TBLASTN结果
 基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
 >gi1762234   Polyketidesynthase PKSL2/Aspergillusparasiticus   9894   208/249(80%)61/84(72%)46/62(74%)   226/249(90%)67/84(79%)55/62(88%)   e-169
 >gi23393798   亮氨酸氨肽酶(Lap1)/Aspergillussojae   2547   66/110(60%)68/152(44%)37/75(49%)15/30(50%)   82/110(74%)92/152(60%)52/75(69%)21/30(70%)   7e-82
 >gi927685   SaccharomycesCerevisiae染色IV lambda 3641和cosmid 9831,和9410   78500   152/341(44%)   207/341(60%)   1e-71
 >gi5832144   在无氮源情况下培养出的Botrytis cinerea菌株T4 cDNA文库   780   89/134(66%)27/53(50%)   106/134(79%)33/53(62%)   7e-58
                                          表4E.fuLAP1 BLASTX结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  >gi28918132   未知蛋白/Neurospora crassa   402   208/352(59%)   255/352(72%)   e-116
  >gi23393799   亮氨酸氨肽酶/Aspergillussojae   377   183/355(51%)   241/355(67%)   3e-97
  >gi6320623   未知ORF Ydr414cp/Saccharomycescerevisiae   374   152/341(44%)   207/341(60%)   2e-72
  >gi18250467   氨肽酶/Agaricusbisporus   384   139/352(39%)   186/352(52%)   1e-58
                                   表4F.fuLAP1 BLASTP结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
 >gi28918132   未知蛋白/Neurospora crassa   402   208/352(59%)   255/352(72%)   e-116
 >gi23393799   亮氨酸氨肽酶(LAP1)/Aspergillussojae   377   183/355(51%)   241/355(67%)   6e-98
 >gi6320623   未知ORF Ydr414cp/Saccharomycescerevisiae   374   152/341(44%)   207/341(60%)   3e-73
  >gi18250467   氨肽酶/Agaricus bisporus   384   140/352(39%)   190/352(53%)   7e-59
ruCBPS1
ruCBPS1是红色毛癣菌的羧肽酶。2106个核苷酸(SEQ ID NO:13)的ruCBPS1核酸如表5A所示。
  表5A、ruCBPS1基因组核苷酸序列(SEQ ID NO:13)
  ATGGTGTCATTCTGCGGAGTGGCAGCCTGCCTGCTGACAGTTGCTGGCCATCTTGCGCAGGCTCAGTTCCCACCAAAACCGGAGGGAGTCACTGTCCTGGAGTCGAAATTCGGCAGCGGTGCTCGCATCACTTATAAGGAGGTCCGTTAGCTGCATAGAAAGTCCACGTGAAGACGCTGTAGCTAACAATCCACTAGCCTGGCCTCTGTGAGACGACAGAGGGCGTCAAGTCGTACGCCGGATATGTCCATCTGCCTCCAGGCACGCTCAGGGACTTCGGTGTCGAGCAGGACTACCCTATCAACACCTTTTTTTGGTTCTTTGAGGCAAGAAAGGACCCTGAAAATGCCCCTCTCGGCATCTGGATGAACGGTGGCCCGGGTAGCTCGTCGATGTTTGGAATGATGACTGAGAACGGGCCTTGCTTCGTCAATGCAGACTCCAATTCTACTCGCCTGAACCCTCATTCTTGGAACAATGAAGGTATGCCATCAGCTTCTGATGGAAAACTAAATATTGCTAACATTGTACTTTCTGTGACTAGTCAATATGCTGTATATAGACCAGCCAGTGCAGGTCGGTCTGTCCTACGACACTTTGGCCAACTTCACCAGGAATCTAGTCACGGATGAGATCACGAAACTGAAACCCGGAGAACCTATTCCGGAACAGAATGCCACTTTCCTGGTAGGTACATATGCAAGCCGCAATATGAACACCACTGCACACGGAACTAGGCATGCTGCCATGGCTCTCTGGCACTTCGCCCAAGTCTGGTTCCAAGAGTTCCCAGGATATCACCCTAGGAACAACAAGATCAGCATTGCTACCGAATCCTACGGCGGCCGTTATGGCCCGGCCTTTACTGCCTTCTTTGAAGAGCAGAACCAGAAGATCAAGAACGGCACATGGAAGGGACACGAGGGAACTATGCACGTGCTGCATCTCGACACCCTCATGATCGTCAACGGATGCATCGACCGTCTTGTCCAATGGCCGGCATATCCGCAAATGGCGTACAACAACACATATAGCATCGAGGCAGTCAACGCCAGCATTCATGCAGGAATGCTGGATGCCCTCTACCGCGACGGTGGCTGTCGAGACAAGATTAACCACTGCCGCTCCCTCTCTTCTGTGTTCGATCCTGAGAATCTCGGCATCAACTCAACCGTCAATGATGTCTGCAAGGATGCCGAGACATTCTGCTCCAATGATGTTCGCGATCCCTACCTCAAGTTCTCTGGCCGCAACTACTATGACATCGGACAGCTTGACCCCAGCCCATTCCCAGCACCATTTTACATGGCCTGGCTAAATCAGCCGCATGTGCAGGCAGCACTGGGTGTGCCACTTAACTGGACACAGTCAAACGATGTTGTGTCTACCGCATTCCGTGCAATTGGTGACTACCCTCGGCCAGGGTGGCTGGAGAACCTGGCTTATTTGCTGGAGAATGGCATCAAGGTTTCGCTTGTTTACGGTGATCGGGACTACGCATGCAACTGGTTCGGTGGTGAGCTCTCAAGTCTGGGAATCAACTACACTGACACCCACGAATTCCATAATGCCGGCTATGCAGGTATCCAGATCAATAGCAGCTACATCGGTGGACAGGTGAGGCAGTACGGCAACCTCTCCTTCGCCCGCGTCTACGAGGCCGGCCATGAGGTGCCATCGTACCAACCCGAGACTGCACTGCAGATATTCCACCGTTCCCTGTTCAACAAGGATATCGCTACTGGAACCAAGGACACGTCATCGCGCATGGACGGAGGCAAGTTTTACGGCACCTCGGGCCCTGCGGACTCGTTTGGTTTCAAGAACAAACCTCCACCGCAGCACGTCCACTTCTGTCATATCTTAGACACCAGCACCTGCACCAAGGAGCAGATCCAGTCAGTTGAGAACGGCACTGCCGCCGTACGCAGCTGGATCATTGTCGACTCCAACTCGACCTCTCTGTTCCCCGAGGTAGTTGGCTCAGGGGAACCCACGCCAACCCCTATGCCTGGAGGGGCTACTACACTATCTGCTCACGGGTTCTTGTATGGCGTGACATTATGGGCTGTTATTGTTGTAGCTGTTATAGAGCTGGCAATGTAA
1989个核苷酸(SEQ ID NO:14)的ruCBPS1开放阅读框(ORF)见表5B,其中ruCBPS1开放阅读框(ORF)起始子ATG在第一个位置上(表5B中下划线)。
                表5B、ruCBPS1核苷酸序列(SEQ ID NO:14)
  ATGGTGTCATTCTGCGGAGTGGCAGCCTGCCTGCTGACAGTTGCTGGCCATCTTGCGCAGGCTCAGTTCCCACCAAAACCGGAGGGAGTCACTGTCCTGGAGTCGAAATTCGGCAGCGGTGCTCGCATCACTTATAAGGAGCCTGGCCTCTGTGAGACGACAGAGGGCGTCAAGTCGTACGCCGGATATGTCCATCTGCCTCCAGGCACGCTCAGGGACTTCGGTGTCGAGCAGGACTACCCTATCAACACCTTTTTTTGGTTCTTTGAGGCAAGAAAGGACCCTGAAAATGCCCCTCTCGGCATCTGGATGAACGGTGGCCCGGGTAGCTCGTCGATGTTTGGAATGATGACTGAGAACGGGCCTTGCTTCGTCAATGCAGACTCCAATTCTACTCGCCTGAACCCTCATTCTTGGAACAATGAAGTCAATATGCTGTATATAGACCAGCCAGTGCAGGTCGGTCTGTCCTACGACACTTTGGCCAACTTCACCAGGAATCTAGTCACGGATGAGATCACGAAACTGAAACCCGGAGAACCTATTCCGGAACAGAATGCCACTTTCCTGGTAGGTACATATGCAAGCCGCAATATGAACACCACTGCACACGGAACTAGGCATGCTGCCATGGCTCTCTGGCACTTCGCCCAAGTCTGGTTCCAAGAGTTCCCAGGATATCACCCTAGGAACAACAAGATCAGCATTGCTACCGAATCCTACGGCGGCCGTTATGGCCCGGCCTTTACTGCCTTCTTTGAAGAGCAGAACCAGAAGATCAAGAACGGCACATGGAAGGGACACGAGGGAACTATGCACGTGCTGCATCTCGACACCCTCATGATCGTCAACGGATGCATCGACCGTCTTGTCCAATGGCCGGCATATCCGCAAATGGCGTACAACAACACATATAGCATCGAGGCAGTCAACGCCAGCATTCATGCAGGAATGCTGGATGCCCTCTACCGCGACGGTGGCTGTCGAGACAAGATTAACCACTGCCGCTCCCTCTCTTCTGTGTTCGATCCTGAGAATCTCGGCATCAACTCAACCGTCAATGATGTCTGCAAGGATGCCGAGACATTCTGCTCCAATGATGTTCGCGATCCCTACCTCAAGTTCTCTGGCCGCAACTACTATGACATCGGACAGCTTGACCCCAGCCCATTCCCAGCACCATTTTACATGGCCTGGCTAAATCAGCCGCATGTGCAGGCAGCACTGGGTGTGCCACTTAACTGGACACAGTCAAACGATGTTGTGTCTACCGCATTCCGTGCAATTGGTGACTACCCTCGGCCAGGGTGGCTGGAGAACCTGGCTTATTTGCTGGAGAATGGCATCAAGGTTTCGCTTGTTTACGGTGATCGGGACTACGCATGCAACTGG
  TTCGGTGGTGAGCTCTCAAGTCTGGGAATCAACTACACTGACACCCACGAATTCCATAATGCCGGCTATGCAGGTATCCAGATCAATAGCAGCTACATCGGTGGACAGGTGAGGCAGTACGGCAACCTCTCCTTCGCCCGCGTCTACGAGGCCGGCCATGAGGTGCCATCGTACCAACCCGAGACTGCACTGCAGATATTCCACCGTTCCCTGTTCAACAAGGATATCGCTACTGGAACCAAGGACACGTCATCGCGCATGGACGGAGGCAAGTTTTACGGCACCTCGGGCCCTGCGGACTCGTTTGGTTTCAAGAACAAACCTCCACCGCAGCACGTCCACTTCTGTCATATCTTAGACACCAGCACCTGCACCAAGGAGCAGATCCAGTCAGTTGAGAACGGCACTGCCGCCGTACGCAGCTGGATCATTGTCGACTCCAACTCGACCTCTCTGTTCCCCGAGGTAGTTGGCTCAGGGGAACCCACGCCAACCCCTATGCCTGGAGGGGCTACTACACTATCTGCTCACGGGTTCTTGTATGGCGTGACATTATGGGCTGTTATTGTTGTAGCTGTTATAGAGCTGGCAATGTAA
上述ruCBPS1核苷酸序列(SEQ ID NO:14)编码含662个氨基酸残基(SEQ ID NO:15)的蛋白,在表5C中以一个字母的氨基酸代码表示。
  表5C、ruCBPS1编码的蛋白序列(SEQ ID NO:15)
  MVSFCGVAACLLTVAGHLAQAQFPPKPEGVTVLESKFGSGARITYKEPGLCETTEGVKSYAGYVHLPPGTLRDFGVEQDYPINTFFWFFEARKDPENAPLGIWMNGGPGSSSMFGMMTENGPCFVNADSNSTRLNPHSWNNEVNMLYIDQPVQVGLSYDTLANFTRNLVTDEITKLKPGEPIPEQNATFLVGTYASRNMNTTAHGTRHAAMALWHFAQVWFQEFPGYHPRNNKISIATESYGGRYGPAFTAFFEEQNQKIKNGTWKGHEGTMHVLHLDTLMIVNGCIDRLVQWPAYPQMAYNNTYSIEAVNASIHAGMLDALYRDGGCRDKINHCRSLSSVFDPENLGINSTVNDVCKDAETFCSNDVRDPYLKFSGRNYYDIGQLDPSPFPAPFYMAWLNQPHVQAALGVPLNWTQSNDVVSTAFRAIGDYPRPGWLENLAYLLENGIKVSLVYGDRDYACNWFGGELSSLGINYTDTHEFHNAGYAGIQINSSYIGGQVRQYGNLSFARVYEAGHEVPSYQPETALQIFHRSLFNKDIATGTKDTSSRMDGGKFYGTSGPADSFGFKNKPPPQHVHFCHILDTSTCTKEQIQSVENGTAAVRSWIIVDSNSTSLFPEVVGSGEPTPTPMPGGATTLSAHGFLYGVTLWAVIVVAVIELAM
上述ruCBPS1具有与表5D、5E和5F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。
                             表5D.ruCBPS1 TBLASTN结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|32410708   Neurospora crassa菌株OR74A   1947   222/632(35%)   321/632(50%)   1e-90
  gi|3046860   schizoaccharomycesprombe cpy1羧肽酶Y基因   4308   137/481(28%)   204/481(42%)   6e-41
  gi|18152938   Pichia angusta羧肽酶Y(CPY)基因   2214   141/520(27%)   228/520(43%)   4e-40
  gi|4028157   Pichia angusta羧肽酶Y前体(CPY)基因   2509   140/520(26%)   226/520(43%)   7e-40
  gi|170828   Candida albicans羧肽酶Y前体(CPY1)基因   1985   131/482(27%)   205/482(43%)   3e-36
                                表5E.ruCBPS1  BLASTX结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|15004616   羧肽酶S1/Aspergillus oryzae   555   209/535(39%)   294/535(54%)   1e-98
  gi|435818   羧肽酶S1 CPD-S1/Penicilliumjanthinellum   423   159/498(31%)   234/498(46%)   6e-64
  gi|995456   前-羧肽酶Z/Absidia zychae   460   147/506(29%)   219/506(43%)   8e-48
  gi|3046861   羧肽酶Y/schizoaccharomyces prombe   1002   137/481(28%)   204/481(42%)   7e-42
  gi|18152939   羧肽酶Y/Pichia angusta   537   141/520(27%)   228/520(43%)   4e-41
  gi|4028158   羧肽酶Y前体;vacuolar羧肽酶/Pichia angusta   541   140/520(26%)   226/520(43%)   7e-41
  gi|7597001   羧肽酶Y前体/Candida albicans   542   131/482(27%)   206/482(42%)   2e-37
                                表5F.ruCBPS1 BLASTP结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|15004616   羧肽酶S1/Aspergillusoryzae   555   210/537(39%)   296/535(55%)   2e-95
  gi|435818   羧肽酶S1CPD-S1/Penicilliumjantbinellum   423   159/498(31%)   234/498(46%)   2e-60
  gi|995456   前-羧肽酶Z/Absidia zychae   460   146/500(29%)   217/500(43%)   6e-47
  gi|19115337   羧肽酶Y/schizoaccharomyces prombe   1002   136/481(28%)   204/481(42%)   7e-41
ruCBPS1’
ruCBPS1’是红色毛癣菌的羧肽酶。2030个核苷酸(SEQ ID NO:16)的ruCBPS1’基因组DNA序列如表6A所示。
                 表6A、ruCBPS1’基因组核苷酸序列(SEQ ID NO:16)
  ATGCGCTTTGCTGCTAGCATTGCCGTGGCCCTGCCAGTCATTCACGCGGCGAGTGCTCAAGGCTTCCCTCCACCCGTTAAGGGCGTCACCGTGGTCAAATCCAAGTTCGACGAAAACGTAAAGATCACATACAAGGAGGTATGTGTTTACATCATTTTCACATCCAGATCTTATATCCTTACAATAAATCTGGCTAACTCACTGGATAGAATGACATATGTGAAACCACTCAAGGAGTTAGATCATTCACCGGTCATGTCCACCTTCCTCCAGACAACGATGACTTTGGTGTCTACCGGAACTACTCCATCAACACATTCTTCTGGTTCTTTGAAGCTCGTGAAGACCCTAAGAATGCTCCTCTCTCCATCTGGCTGAACGGTGGTCCGGGATCGTCATCCATGATTGGACTCTTCCAGGAAAACGGTCCATGCTGGGTCAATGAAGACTCTAAATCTACCACCAACAATTCATTTTCATGGAACAATAAAGTAAATATGCTCTACATTGATCAGCCAAACCAAGTCGGTTTCAGTTATGACGTACCTACCAACATCACTTACTCTACCATCAATGATACAATATCTGTTGCGGACTTCTCTAACGGTGTCCCTGCGCAAAATCTTTCTACGTTGGTTGGAACCGGCAGCAGCCAGAACCCTTGGGCAACTGCCAATAACACTGTGAACGCTGCTCGTTCTATCTGGCACTTTGCACAAGTGTGGTTCCAGGAATTCCCTGAACACAAGCCTAACAATAACAAGATCAGTATTTGGACAGAGTCCTATGGAGGAAGATATGGTCCCTCATTCGCCTCTTACTTCCAGGAACAGAACGAAAAGATCAAAAACCATACCATTACTGAAGAAGGAGAGATGCATATTCTGAACCTCGACACCCTCGGTATCATCAACGGCTGCATCGATCTTATGTTCCAAGCAGAAAGTTATGCTGAATTCCCATACAACAACACCTATGGCATCAAAGCTTATACCAAGGAGAAGCGTGACGCTATATTACACGACATCCACCGTCCTGACGGCTGCTTCGACAAGGTTACCAAGTGCCGTGAGGCCGCGAAAGAAGGAGACCCTCACTTCTACAGCAACAATGCAACCGTCAACACAATCTGTGCGGATGCTAACTCTGCCTGCGACAAATATCTAATGGATCCTTTCCAAGAGACCAATCTTGGTTACTATGATATTGCTCATCCTCTTCAGGATCCCTTCCCCCCACCATTCTATAAGGGCTTCCTCAGCCAATCCAGCGTTCTATCTGACATGGGATCGCCAGTCAACTTCTCCCAATACGCCCAAGCTGTGGGAAAATCATTCCATGGAGTTGGCGACTACGCTCGCCCTGATGTGCGCGGCTTCACCGGTGACATTGCTTATCTTCTCGAGAGCGGAGTCAAGGTTGCTCTCGTCTATGGTGACAGAGACTACATCTGCAATTGGTTCGGTGGTGAGCAGGTCAGTCTTGGCTTGAACTACACTGGCACCCAAGACTTCCACAGGGCAAAATATGCCGATGTCAAGGTCAACTCTTCATACGTCGGAGGCGTAGTGCGTCAACATGGAAACTTCTCTTTCACCAGAGTTTTCGAGGCCGGTCATGAAGTCCCTGGTTACCAACCCGAGACTGCCCTCAAGATCTTTGAGCGCATCATGTTCAACAAGGATATTTCTACCGGTGAGATCGACATTGCTCAGAAACCAGACTACGGTACCACTGGAACTGAGTCTACGTTCCATATCAAAAACGATATCCCTCCTTCGCCTGAGCCGACCTGCTACCTCCTCAGTGCTGACGGAACCTGTACCCCGGAGCAGCTTAATGCTATTAAGGATGGAACTGCAGTTGTTGAGAACTACATTATTAAGAGCCCTGCTGCGTCGAAGGGGAACCCTCCACCAACCACGACCTCATCTCCCACAGCAGCCCCTACCGCTGGAAGTGCCATGCTAAAGGCTCCTGTGGCAATGCTAGCAATATCAGCTCTCACTGTCCTTGCTTTCTTCTTGTAG
1959个核苷酸(SEQ ID NO:17)的ruCBPS1’见表6B,其中ruCBPS1’开放阅读框(“ORF”)起始子ATG在第一个位置上(表6B中下划线)。
  表6B、ruCBPS1’核苷酸序列(SEQ ID NO:17)
  ATGCGCTTTGCTGCTAGCATTGCCGTGGCCCTGCCAGTCATTCACGCGGCGAGTGCTCAAGGCTTCCCTCCACCCGTTAAGGGCGTCACCGTGGTCAAATCCAAGTTCGACGAAAACGTAAAGATCACATACAAGGAGAATGACATATGTGAAACCACTCAAGGAGTTAGATCATTCACCGGTCATGTCCACCTTCCTCCAGACAACGATGACTTTGGTGTCTACCGGAACTACTCCATCAACACATTCTTCTGGTTCTTTGAAGCTCGTGAAGACCCTAAGAATGCTCCTCTCTCCATCTGGCTGAACGGTGGTCCGGGATCGTCATCCATGATTGGACTCTTCCAGGAAAACGGTCCATGCTGGGTCAATGAAGACTCTAAATCTACCACCAACAATTCATTTTCATGGAACAATAAAGTAAATATGCTCTACATTGATCAGCCAAACCAAGTCGGTTTCAGTTATGACGTACCTACCAACATCACTTACTCTACCATCAATGATACAATATCTGTTGCGGACTTCTCTAACGGTGTCCCTGCGCAAAATCTTTCTACGTTGGTTGGAACCGGCAGCAGCCAGAACCCTTGGGCAACTGCCAATAACACTGTGAACGCTGCTCGTTCTATCTGGCACTTTGCACAAGTGTGGTTCCAGGAATTCCCTGAACACAAGCCTAACAATAACAAGATCAGTATTTGGACAGAGTCCTATGGAGGAAGATATGGTCCCTCATTCGCCTCTTACTTCCAGGAACAGAACGAAAAGATCAAAAACCATACCATTACTGAAGAAGGAGAGATGCATATTCTGAACCTCGACACCCTCGGTATCATCAACGGCTGCATCGATCTTATGTTCCAAGCAGAAAGTTATGCTGAATTCCCATACAACAACACCTATGGCATCAAAGCTTATACCAAGGAGAAGCGTGACGCTATATTACACGACATCCACCGTCCTGACGGCTGCTTCGACAAGGTTACCAAGTGCCGTGAGGCCGCGAAAGAAGGAGACCCTCACTTCTACAGCAACAATGCAACCGTCAACACAATCTGTGCGGATGCTAACTCTGCCTGCGACAAATATCTAATGGATCCTTTCCAAGAGACCAATCTTGGTTACTATGATATTGCTCATCCTCTTCAGGATCCCTTCCCCCCACCATTCTATAAGGGCTTCCTCAGCCAATCCAGCGTTCTATCTGACATGGGATCGCCAGTCAACTTCTCCCAATACGCCCAAGCTGTGGGAAAATCATTCCATGGAGTTGGCGACTACGCTCGCCCTGATGTGCGCGGCTTCACCGGTGACATTGCTTATCTTCTCGAGAGCGGAGTCAAGGTTGCTCTCGTCTATGGTGACAGAGACTACATCTGCAATTGGTTCGGTGGTGAGCAGGTCAGTCTTGGCTTGAACTACACTGGCACCCAAGACTTCCACAGGGCAAAATATGCCGATGTCAAGGTCAACTCTTCATACGTCGGAGGCGTAGTGCGTCAACATGGAAACTTCTCTTTCACCAGAGTTTTCGAGGCCGGTCATGAAGTCCCTGGTTACCAACCCGAGACTGCCCTCAAGATCTTTGAGCGCATCATGTTCAACAAGGATATTTCTACCGGTGAGATCGACATTGCTCAGAAACCAGACTACGGTACCACTGGAACTGAGTCTACGTTCCATATCAAAAACGATATCCCTCCTTCGCCTGAGCCGACCTGCTACCTCCTCAGTGCTGACGGAACCTGTACCCCGGAGCAGCTTAATGCTATTAAGGATGGAACTGCAGTTGTTGAGAACTACATTATTAAGAGCCCTGCTGCGTCGAAGGGGAACCCTCCACCAACCACGACCTCATCTCCCACAGCAGCCCCTACCGCTGGAAGTGCCATGCTAAAGGCTCCTGTGGCAATGCTAGCAATATCAGCTCTCACTGTCCTTGCTTTCTTCTTGTAG
上述ruCBPS1’核苷酸序列(SEQ ID NO:17)编码含652个氨基酸残基(SEQ ID NO:18)的蛋白,在表6C中以一个字母的氨基酸代码表示。
  表6C、ruCBPS1’编码的蛋白序列(SEQ ID NO:18)
  MRFAASIAVALPVIHAASAQGFPPPVKGVTVVKSKFDENVKITYKENDICETTQGVRSFTGHVHLPPDNDDFGVYRNYSINTFFWFFEAREDPKNAPLSIWLNGGPGSSSMIGLFQENGPCWVNEDSKSTTNNSFSWNNKVNMLYIDQPNQVGFSYDVPTNITYSTINDTISVADFSNGVPAQNLSTLVGTGSSQNPWATANNTVNAARSIWHFAQVWFQEFPEHKPNNNKISIWTESYGGRYGPSFASYFQEQNEKIKNHTITEEGEMHILNLDTLGIINGCIDLMFQAESYAEFPYNNTYGIKAYTKEKRDAILHDIHRPDGCFDKVTKCREAAKEGDPHFYSNNATVNTICADANSACDKYLMDPFQETNLGYYDIAHPLQDPFPPPFYKGFLSQSSVLSDMGSPVNFSQYAQAVGKSFHGVGDYARPDVRGFTGDIAYLLESGVKVALVYGDRDYICNWFGGEQVSLGLNYTGTQDFHRAKYADVKVNSSYVGGVVRQHGNFSFTRVFEAGHEVPGYQPETALKIFERIMFNKDISTGEIDIAQKPDYGTTGTESTFHIKNDIPPSPEPTCYLLSADGTCTPEQLNAIKDGTAVVENYIIKSPAASKGNPPPTTTSSPTAAPTAGSAMLKAPVAMLAISALTVLAFFL
上述ruCBPS1’具有与表6D、6E和6F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。
                          表6D.ruCBPS1’TBLASTN结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|32410708   Neurospora crassa菌株OR74A   1947   246/632(38%)   337/632(53%)   e-104
  gi|3046860   Schizoaccharomycesprombe cpy1羧肽酶Y基因   4308   137/480(28%)   215/480(44%)   1e-45
  gi|18152938   Pichia angusta羧肽酶Y(CPY)基因   2214   139/508(27%)   227/508(44%)   2e-42
                                表6E.ruCBPS1’BLASTX结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|15004616   羧肽酶S1/Aspergillus oryzae   555   221/567(38%)   310/567(54%)   e-102
  gi|435818   羧肽酶S1CPD-S1/Penicilliumjanthinellum   423   174/499(34%)   258/499(51%)   4e-77
  gi|995456   前-羧肽酶Z/Absidiazychae   460   155/491(31%)   243/491(49%)   2e-58
  gi|19115337   羧肽酶Y/Schizoaccharomycesprombe   1002   137/480(28%)   215/480(44%)   1e-46
  gi|4028158   羧肽酶Y前体;Vacuolar羧肽酶/Pichia angusta   541   139/508(27%)   226/508(44%)   2e-43
                             表6F.ruCBPS1’BLASTP结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|15004616   羧肽酶S1/Aspergillusoryzae   555   222/567(39%)   310/567(54%)   7e-98
  gi|435818   羧肽酶S1CPD-S1/Penicilliumjanthinellum   423   174/499(34%)   259/499(51%)   1e-71
  gi|995456   前-羧肽酶Z/Absidia zychae   460   156/491(31%)   244/491(49%)   2e-57
  gi|19115337   羧肽酶Y/Schizoaccharomyces prombe   1002   137/480(28%)   215/480(44%)   4e-44
ruPAP
ruPAP是红色毛癣菌的脯氨酰氨肽酶。1795个核苷酸(SEQ ID NO:19)的ruPAP基因组DNA序列如表7A所示。
  表7A、ruPAP基因组核苷酸序列(SEQ ID NO:19)
  ATGCGCTTTGCTGCTAGCATTGCCGTGGCCCTGCCAGTCATTCACGCGGCGAGTGCTCAAGGCTTCCCTCCACCCGTTAAGGGCGTCACCGTGGTCAAATCCAAGTTCGACGAAAACGTAAAGATCACATACAAGGAGGTATGTGTTTACATCATTTTCACATCCAGATCTTATATCCTTACAATAAATCTGGCTAACTCACTGGATAGAATGACATATGTGAAACCACTCAAGGAGTTAGATCATTCACCGGTCATGTCCACCTTCCTCCAGACAACGATGACTTTGGTGTCTACCGGAACTACTCCATCAACACATTCTTCTGGTTCTTTGAAGCTCGTGAAGACCCTAAGAATGCTCCTCTCTCCATCTGGCTGAACGGTGGTCCGGGATCGTCATCCATGATTGGACTCTTCCAGGAAAACGGTCCATGCTGGGTCAATGAAGACTCTAAATCTACCACCAACAATTCATTTTCATGGAACAATAAAGTAAATATGCTCTACATTGATCAGCCAAACCAAGTCGGTTTCAGTTATGACGTACCTACCAACATCACTTACTCTACCATCAATGATACAATATCTGTTGCGGACTTCTCTAACGGTGTCCCTGCGCAAAATCTTTCTACGTTGGTTGGAACCGGCAGCAGCCAGAACCCTTGGGCAACTGCCAATAACACTGTGAACGCTGCTCGTTCTATCTGGCACTTTGCACAAGTGTGGTTCCAGGAATTCCCTGAACACAAGCCTAACAATAACAAGATCAGTATTTGGACAGAGTCCTATGGAGGAAGATATGGTCCCTCATTCGCCTCTTACTTCCAGGAACAGAACGAAAAGATCAAAAACCATACCATTACTGAAGAAGGAGAGATGCATATTCTGAACCTCGACACCCTCGGTATCATCAACGGCTGCATCGATCTTATGTTCCAAGCAGAAAGTTATGCTGAAT
  TCCCATACAACAACACCTATGGCATCAAAGCTTATACCAAGGAGAAGCGTGACGCTATATTACACGACATCCACCGTCCTGACGGCTGCTTCGACAAGGTTACCAAGTGCCGTGAGGCCGCGAAAGAAGGAGACCCTCACTTCTACAGCAACAATGCAACCGTCAACACAATCTGTGCGGATGCTAACTCTGCCTGCGACAAATATCTAATGGATCCTTTCCAAGAGACCAATCTTGGTTACTATGATATTGCTCATCCTCTTCAGGATCCCTTCCCCCCACCATTCTATAAGGGCTTCCTCAGCCAATCCAGCGTTCTATCTGACATGGGATCGCCAGTCAACTTCTCCCAATACGCCCAAGCTGTGGGAAAATCATTCCATGGAGTTGGCGACTACGCTCGCCCTGATGTGCGCGGCTTCACCGGTGACATTGCTTATCTTCTCGAGAGCGGAGTCAAGGTTGCTCTCGTCTATGGTGACAGAGACTACATCTGCAATTGGTTCGGTGGTGAGCAGGTCAGTCTTGGCTTGAACTACACTGGCACCCAAGACTTCCACAGGGCAAAATATGCCGATGTCAAGGTCAACTCTTCATACGTCGGAGGCGTAGTGCGTCAACATGGAAACTTCTCTTTCACCAGAGTTTTCGAGGCCGGTCATGAAGTCCCTGGTTACCAACCCGAGACTGCCCTCAAGATCTTTGAGCGCATCATGTTCAACAAGGATATTTCTACCGGTGAGATCGACATTGCTCAGAAACCAGACTACGGTACCACTGGAACTGAGTCTACGTTCCATATCAAAAACGATATCCCTCCTTCGCCTGAGCCGACCTGCTACCTCCTCAGTGCTGACGGAACCTGTACCCCGGAGCAGCTTAATGCTATTAAGGATGGAACTGCAGTTGTTGAGAACTACATTATTAAGAGCCCTGCTGCGTCGAAGGGGAACCCTCCACCAACCACGACCTCATCTCCCACAGCAGCCCCTACCGCTGGAAGTGCCATGCTAAAGGCTCCTGTGGCAATGCTAGCAATATCAGCTCTCACTGTCCTTGCTTTCTTCTTGTAG
1326个核苷酸(SEQ ID NO:20)的ruPAP见表7B,其中ruPAP开放阅读框(“ORF”)起始子ATG在第一个位置上(表7B中下划线)。
  表7B、ruPAP核苷酸序列(SEQ ID NO:20)
  ATGCAAGCAGCAAAATTGTTGAGCCGGTACTGGCAAAATGTACCTGGAAGACTGAGGGTATCTGAGCTCCTTTTCGATGTCCCTTTAGACTACTCAAACCCGTCTTCCACTTCGCTCCGGTTGTTCGCCAGGAGTGTGCAGCGGCGAATTCCAGGGTCCTCTCTCGATGATAAAGACAGACAGCTACCCTGGATTGTTTTCCTGCAGGGTGGACCAGGAGGAGCTTGCCCACAACCTCAGGAGGTAGGCTGGGTTGGGCCATTGCTGGATCGAGGATTCCAGATCCTTCTCCTTGACCAGCGAGGAACAGGGCTTTCAACCCCTATAACCGCTGCGACGCTTGCTCTTCAGGGAAACGCAGTAAAGCAAGCCGAATATCTTAGGCTATTCCGTGCCGATAATATCGTGCGAGACTGTGAAGCAGTGCGTAAACTATTGACTGCTTATTACCCTCCAGATAAGCAGAAATGGAGCGTCCTTGGCCAGAGTTTTGGAGGATTCTGTGCCGTCACGTATGTTTCTAATCCTGAGGGACTTAAAGAAGTCTTCACAACTGGTGGATTACCCCCTCTTGTGTCAAAGCCTGATCCTGTGTACGAGAGGACCTACGACAAGGTCCAGTCCCGGAATAAAGTGTACTATTCCACTTTCCCCGAAGACGAAGATCGAGTGCGGATTATACTCAAGCATCTCCAAACCCACGATGTTAAGCTCCCCGATGGCTCACCGTTAACTCCGGAACGCTTTCTCCAGCTAGGAATTCATTTTGGAATGAAAGGCATAATTTTGAAGTGCATTAATGAACTGGAATACTTTGGCTTCCTCACACGACCTACTTTATCTCTGATTGAGAACGACACGAGTGCAGACAACGGCATTCTATATGCCATAATGCATGAATCTATCTACTGCCAAGGGGAGGCCTCAAACTGGGCTGCCGAAAGACTACTACCAAAGTTCTCTGGCTTCCGAGGCGCTCATAATCCTGATGGCATCTACTTCACTGGGGAGATGGTATACAAACACTGGTTTGAGTCGTCCACAGAACTCGGCCAGCTCAAAGAGGTAGCCGATATTCTTGCTTCCTACAATGACTGGCCGCAGTTGTATGATAAGGAACAGCTCGCGCGCAACGAGGTGCCAGTGTATTCCGCTACATATGTCGAGGATATGTACGTGCACTTCAGCTACGCCAACGAAACAGCTGCCACTATTCACAATTGCAAACAGTTCATCACCAACACGATGTACCACAACGGACTGCGTTCAGATTCCGCTGAACTTATTGCGCAGCTGTTTGCTCTTCGTGATGATACGATTGACTAG
上述ruPAP核苷酸序列(SEQ ID NO:20)编码含441个氨基酸残基(SEQ ID NO:21)的蛋白,在表7C中以一个字母的氨基酸代码表示。
  表7C、ruPAP编码的蛋白序列(SEQ ID NO:21)
  MQAAKLLSRYWQNVPGRLRVSELLFDVPLDYSNPSSTSLRLFARSVQRRIPGSSLDDKDRQLPWIVFLQGGPGGACPQPQEVGWVGPLLDRGFQILLLDQRGTGLSTPITAATLALQGNAVKQAEYLRLFRADNIVRDCEAVRKLLTAYYPPDKQKWSVLGQSFGGFCAVTYVSNPEGLKEVFTTGGLPPLVSKPDPVYERTYDKVQSRNKVYYSTFPEDEDRVRIILKHLQTHDVKLPDGSPLTPERFLQLGIHFGMKGIILKCINELEYFGFLTRPTLSLIENDTSADNGILYAIMHESIYCQGEASNWAAERLLPKFSGFRGAHNPDGIYFTGEMVYKHWFESSTELGQLKEVADILASYNDWPQLYDKEQLARNEVPVYSATYVEDMYVHFSYANETAATIHNCKQFITNTMYHNGLRSDSAELIAQLFALRDDTID
上述ruPAP具有与表7D、7E和7F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。
                             表7D.ruPAP TBLASTN结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|14329656   Aspergillus   3752   151/307   190/307   e-118
  neger papA的前氨肽酶A基因   (49%)   61%)
  gi|32414442   Neurospora crassa菌株OR74A   1449   212/477(44%)   285/477(59%)   e-100
  gi|604877   Aeromonas sobria的前氨肽酶基因   1740   175/420(41%)   239/420(56%)   4e-77
                                     表7E.ruPAP BLASTX结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|18307408   脯氨酰氨肽酶A/Aspergillusneger   442   266/442(60%)   334/442(75%)   e-152
  gi|4456054   推定的脯氨酰氨肽酶A/Aspergillusnidulans   365   211/366(57%)   263/366(71%)   e-144
  gi|22507295   脯氨酰氨肽酶/Talaromyces emersonii   300   181/301(60%)   226/301(75%)   4e-99
  gi|236731   脯氨酰氨肽酶A/Aeromonas sobria   425   175/420(41%)   239/420(56%)   4e-76
                            表7F.ruPAP BLASTP结果
  基因目录/索引  蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|18307408  脯氨酰氨肽酶A/Aspergillusneger   442   267/443(60%)   336/442(75%)   e-157
  gi|4456054  推定的脯氨酰氨肽酶/Aspergillusnidulans   365   211/366(57%)   263/366(71%)   e-116
  gi|22507295  脯氨酰氨肽酶/Talaromyces emersonii   300   181/301(60%)   226/301(75%)   e-102
  gi|236731  脯氨酰氨肽酶/Aeromonas sobria   425   175/420(41%)   239/420(56%)   2e-78
ruAMPP
ruAMPP是红色毛癣菌的氨肽酶P。2418个核苷酸(SEQ ID NO:22)的ruAMPP基因组DNA序列如表8A所示。
  表8A、ruAMPP基因组核苷酸序列(SEQ ID NO:22)
  ATGCCGCCACCACCGGTTGACACGACCCAGCGTCTCGCAAAGCTGCGAGAGCTGATGGCTCAGAACAAGGTCGATGTATATAGTATGCAATTCAGATACACCATTAAAGCTCCCTTGATAATAACAGTCGTATACTCATTCTTCTTTCTTCTACTCCTCGCCTTAAAGTTGTGCCTTCGGAAGACAGCCATCAGTCGGAGTACATTGCTCCATGTGATGGGCGTCGAGGTTAGACCTGTCCCTCCATAAAAGAATACCTACCCGTAATACCAGCCGGCAGACGCTCATACGTATCACTGCAGCTTTCATATCCAGCTTCACTGGCTCGGCAGGATGTGCCATCGTCTCTATGAGTAAAGCTGCTCTGTCTACAGACGGCAGATACTTCAGCCAAGCTGCAAAACAGCTCGATGCCAACTGGATCCTGTTGAAGCGAGGTGTCGAGGGTGTCCCAACCTGGGAAGAATGGTATATCTGCCCCTGGTATCGACTTTTCCGGTATAATGGTTGACAGGCTGGATATAGGACCGCTGAGCAGGCCGAGACACGGCAAGGTTGTGGGTGTTGACCCGTCACTTATTACGGCAGGTGAGAATCTACAGTATGCGTCTCTTACAAGTGTCATCGTGACTAACTGTATGTTATAGCGGATGCACGAAAGCTTTCTCAGACGTTGAAGACCACCGGAGGCTCCTTGGTTGGAATTGATCAGAACCTGATTGATGCCGTCTGGGGAGATGAACGTCCTGCACGGCCTGCCAACCAAATTACGGTACAGCCTGTTGAGCGCGCGGGAAAGTCATTCGAGGAGAAAGTGGAAGACCTGCGAAAGGAATTGACTGCGAAGAAGAGGTCTGCTATGGTTATTTGTATGACGCTAGATCTATTTTTGATCAAACATATACTAACAAACGCAATATAGCCACCTTGGATGAGATTGCATGGCTCTTCAACCTC
  CGTGGAAGCGAGTAAGTTTCTATATAAATGGTATCTTTCACTTTATACAAAAAGCCATGCTGACTGGTGTAGTATTCCATATAACCCCGTCTTTTTCTCGTACGCAATTGTGACGCCCTCAGTTGCGGAACTCTATGTCGATGAGAGCAAGCTGTCTCCAGAAGCCAGAAAACATCTCGAAGGCAAGGTCGTTCTCAAGCCATACGAGTCCATCTTCCAAGCTTCCAAAGTCCTCGCCGAATCAAAGGCATCGGCTAGCAGCGGTTCCTCTGGGAAGTTCTTGTTGTCTAACAAGGCTTCGTGGTCTTTGAGCCTCGCCCTCGGTGGGGAACAGAACGTCGTTGAGGTTCGAAGTCCCATCACTGACGCCAAAGCCATCAAGAACGAAGTTGAACTGGAAGGATTCAGAAAATGCCATATCCGAGACGGTGCAGCTCTGATCGAGTACTTCGCCTGGCTTGAAAATGCATTGATCAAAGAAGGTGCCAAGCTAGACGAAGTAGATGGAGCCGACAAACTCTTCGAGATCCGCAAGAAATATGACCTCTTCGTCGGCAACTCCTTCGACACCATCTCTTCTACCGGTGCTAACGGTGCTACCATTCATTACAAACCCGAGAAGTCAACTTGCGCTATCATTGACCCGAAGGCTATGTACCTGTGTGACTCTGGTGGCCAATACCTTGATGGTACTACTGATACTACCCGAACTCTCCACTTTGGAGAGCCCACGGAGTTCCAGAAGAAGGCTTATGCACTTGTTCTAAAGGGACATATCAGCATTGACAATGCCATTTTCCCCAAAGGAACCACCGGATACGCCATTGACTCGTTTGCTCGACAGCATTTGTGGAAGGAGGGTCTGGATTACCTCCACGGCACCGGTCATGGTGTTGGCTCATTTTTGGTACGGGGTTTCCTTTTTCTTTTTTTTTTCTTTTTTTATTTTTATTATTACTTCTCTTAGGCTAACACATTCTCTCTAAGAACGTCCATGAGGGACCTATGGGCATAGGAAGCCGTGCTCAGTACGCTGAAGTTCCTCTCTCTGCCAGCAATGTTCTTTCCAACGGTAGGATTTCTGCATCTCATCTTTCTTGAATCCTACTAATTGCAAAATAGAGCCTGGATATTATGAAGACGGCAACTTCGGCATTCGTCTCGAGAGTAAGTTCAATGACTGCGTATTCTAGTTTTTTCATACTGACGGCCTCTTTAGACCTCGTAATCTGCAAGGAGGTCCAGACTGCACACAAATTCGGCGACAAGCCCTTCCTCGGATTTGAGTCCATCACCCTGGTACCTTTCTGCCAAAAACTCCTTGATGCTTCTCTCTTGACCGAAGCTGAGAGAAAGTGGGTGAATGATTACCATGCGAAAGTCTGGGAGAAGACCAGTCCCTTCTTTGAGAAGGACGAGTTAACAACCGCCTGGCTAAAGCGCGAGACACAACCTATTTAA
1878个核苷酸(SEQ ID NO:23)的ruAMPP见表8B,其中ruAMPP开放阅读框(“ORF”)起始子ATG在第一个位置上(表8B中下划线)。
  表8B、ruAMPP核苷酸序列(SEQ ID NO:23)
  ATGCCGCCACCACCGGTTGACACGACCCAGCGTCTCGCAAAGCTGCGAGAGCTGATGGCTCAGAACAAGGTCGATGTATATATTGTGCCTTCGGAAGACAGCCATCAGTCGGAGTACATTGCTCCATGTGATGGGCGTCGAGCTTTCATATCCAGCTTCACTGGCTCGGCAGGATGTGCCATCGTCTCTATGAGTAAAGCTGCTCTGTCTACAGACGGCAGATACTTCAGCCAAGCTGCAAAACAGCTCGATGCCAACTGGATCCTGTTGAAGCGAGGTGTCGAGGGTGTCCCAACCTGGGAAGAATGGACCGCTGAGCAGGCCGAGACACGGCAAGGTTGTGGGTCGGATGCACGAAAGCTTTCTCAGACGTTGAAGACCACCGGAGGCTCCTTGGTTGGAATTGATCAGAACCTGATTGATGCCGTCTGGGGAGATGAACGTCCTGCACGGCCTGCCAACCAAATTACGGTACAGCCTGTTGAGCGCGCGGGAAAGTCATTCGAGGAGAAAGTGGAAGACCTGCGAAAGGAATTGACTGCGAAGAAGAGGTCTGCTATGGTTATTTCGAGTAAGTTTCTATATAAATGGTATCTTTCACTTTATACAAAAAGCCATGCTGACTGGTGTAGTATTCCATATAACCCCGTCTTTTTCTCGTACGCAATTGTGACGCCCTCAGTTGCGGAACTCTATGTCGATGAGAGCAAGCTGTCTCCAGAAGCCAGAAAACATCTCGAAGGCAAGGTCGTTCTCAAGCCATACGAGTCCATCTTCCAAGCTTCCAAAGTCCTCGCCGAATCAAAGGCATCGGCTAGCAGCGGTTCCTCTGGGAAGTTCTTGTTGTCTAACAAGGCTTCGTGGTCTTTGAGCCTCGCCCTCGGTGGGGAACAGAACGTCGTTGAGGTTCGAAGTCCCATCACTGACGCCAAAGCCATCAAGAACGAAGTTGAACTGGAAGGATTCAGAAAATGCCATATCCGAGACGGTGCAGCTCTGATCGAGTACTTCGCCTGGCTTGAAAATGCATTGATCAAAGAAGGTGCCAAGCTAGACGAAGTAGATGGAGCCGACAAACTCTTCGAGATCCGCAAGAAATATGACCTCTTCGTCGGCAACTCCTTCGACACCATCTCTTCTACCGGTGCTAACGGTGCTACCATTCATTACAAACCCGAGAAGTCAACTTGCGCTATCATTGACCCGAAGGCTATGTACCTGTGTGACTCTGGTGGCCAATACCTTGATGGTACTACTGATACTACCCGAACTCTCCACTTTGGAGAGCCCACGGAGTTCCAGAAGAAGGCTTATGCACTTGTTCTAAAGGGACATATCAGCATTGACAATGCCATTTTCCCCAAAGGAACCACCGGATACGCCATTGACTCGTTTGCTCGACAGCATTTGTGGAAGGAGGGTCTGGATTACCTCCACGGCACCGGTCATGGTGTTGGCTCATTTTTGAACGTCCATGAGGGACCTATGGGCATAGGAAGCCGTGCTCAGTACGCTGAAGTTCCTCTCTCTGCCAGCAATAGCCTGGATATTATGAAGACGGCAACTTCGGCATTCGTCTCGAGAGTAAGTTCAATGACTGCGTATTCTAGTTTTTTCATACTGACGGCCTCTTTAGACCTCGTAATCTGCAAGGAGGTCCAGACTGCACACAAATTCGGCGACAAGCCCTTCCTCGGATTTGAGTCCATCACCCTGGTACCTTTCTGCCAAAAACTCCTTGATGCTTCTCTCTTGACCGAAGCTGAGAGAAAGTGGGTGAATGATTACCATGCGAAAGTCTGGGAGAAGACCAGTCCCTTCTTTGAGAAGGACGAGTTAACAACCGCCTGGCTAAAGCGCGAGACACAACCTATTTAA
上述ruAMPP核苷酸序列(SEQ ID NO:23)编码含625个氨基酸残基(SEQ ID NO:24)的蛋白,在表8C中以一个字母的氨基酸代码表示。
  表8C、ruAMPP编码的蛋白序列(SEQ ID NO:24)
  MPPPPVDTTQRLAKLRELMAQNKVDVYIVPSEDSHQSEYIAPCDGRRAFISSFTGSAGCAIVSMSKAALSTDGRYFSQAAKQLDANWILLKRGVEGVPTWEEWTAEQAETRQGCGSDARKLSQTLKTTGGSLVGIDQNLIDAVWGDERPARPANQITVQPVERAGKSFEEKVEDLRKELTAKKRSAMVISSKFLYKWYLSLYTKSHADWCSIPYNPVFFSYAIVTPSVAELYVDESKLSPEARKHLEGKVVLKPYESIFQASKVLAESKASASSGSSGKFLLSNKASWSLSLALGGEQNVVEVRSPITDAKAIKNEVELEGFRKCHIRDGAALIEYFAWLENALIKEG
  AKLDEVDGADKLFEIRKKYDLFVGNSFDTISSTGAN6ATIHYKPEKSTCAIIDPKAMYLCDSGGQYLDGTTDTTRTLHFGEPTEFQKKAYALVLKGHISIDNAIFPKGTTGYAIDSFARQHLWKEGLDYLHGTGHGVGSFLNVHEGPMGIGSRAQYAEVPLSASNSLDIMKTATSAFVSRVSSMTAYSSFFILTASLDLVICKEVQTAHKFGDKPFLGFESITLVPFCQKLLDASLLTEAERKWVNDYHAKVWEKTSPFFEKDELTTAWLKRETQPI
上述ruAMPP具有与表8D、8E和8F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。
                               表8D.ruAMPP TBLASTN结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|32403169   Neurospora Crassa菌株OR74A   1845   339/630(53%)   433/630(68%)   0.0
  gi|20453016   Drosophila melanogaster的氨肽酶P基因   12647   268/638(42%)   369/638(57%)   e-127
  gi|17571207   Drosophila melanogaster(ApepP)的染色体2   12001   268/638(42%)   369/638(57%)   e-127
  gi|4583560   Drosophila melanogasterDaminopep-P基因   2358   268/638(42%)   369/638(57%)   e-127
                               表8E.ruAMPP BLASTX结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|25529603   X-Pro氨肽酶细胞质形式/Drosophilamelanogaster   613   268/638(42%)   369/638(57%)   e-127
  gi|4107172   氨肽酶P/Drosophilamelanogaster   613   258/638(40%)   369/638(57%)   e-124
  gi|15384991   Xaa-Pro氨肽酶2/Lycopersicm esculentum   654   268/674(39%)   365/674(54%)   e-120
  gi|8489879   胞液的氨肽酶P/人   623   254/646(39%)   358/646(55%)   e-119
  gi|2584787   氨肽酶P-like/人   623   254/646(39%)   357/646(55%)   e-119
                                     表8F.ruAMPP BLASTP结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|30923284   可能的多肽酶C22G7.01C   598   291/629(46%)   384/629(61%)   e-156
  gi|25529603   X-Pro氨肽酶细胞质形式/Drosophila melanogaster   613   268/638(42%)   369/638(57%)   e-124
  gi|15384991   Xaa-Pro氨肽酶2/Lycopersicm esculentum   654   268/674(39%)   365/674(54%)   e-123
  gi|8489879   胞液的氨肽酶P/人   623   254/646(39%)   358/646(55%)   e-122
  gi|2584787   氨肽酶P-like/人   623   254/646(39%)   357/646(55%)   e-122
  gi|4107172   氨肽酶P/Drosophilamelanogaster   613   258/638(40%)   369/638(57%)   e-121
  gi|18777778   细胞质的氨肽酶P/   623   253/645   353/645   e-120
  Rattus norvegicus   (39%)   (54%)
  gi|18875372   胞液的氨肽酶P/Mus musculus   623   250/645(38%)   354/645(54%)   e-118
  gi|15384989   Xaa-Pro氨肽酶1/Lycopersicon   655   264/674(39%)   361/674(53%)   e-117
ruPLD
ruPLD是红色毛癣菌的脯氨酰氨基酸酶。2344个核苷酸(SEQ ID NO:25)的ruPLD基因组DNA序列如表9A所示。
  表9A、ruPLD基因组核苷酸序列(SEQ ID NO:25)
  ATCAACCTCACCTCTTCACCGTCTCACGCCCTTCGTCCCGTCCAAGTCTTCATTTCGCCCTCTCTATGATAACCAACAAACATCCGCTGTTATGTAATCGAACCCGCCGTTAGCCATCCCTAGCCCCGCGTTTTCTCCCAGCATCAATACGACCGAAATGAAGACAGACGGGGAAGACGAGGCAAAACAATAACACATCAACAATTTAACCCGTTGCCGTCTTCTACCCATCTTGTCTACGCATCGTCCAACCTTTTCTTGCCCTATATCAGCCGAACTCGGCCATCATGGATATCCACGTCGACAAATACCCGGCTAAGAGTCACGCCAGGCGCGTCGCCGAGAAGCTCAAGGCCGCGGGGCACGGCTCTACCGGCATCATCTTCGTCGAAGGCCAAAAGGAGCATATTATCGATGATAGCGACGAGCCGTTTCACTTCCGGTGAGCCGTGGGAATACACTCGACTGGGCGGAATAAGCTAACAAAAGGGTGTGATAGTCAACGCCGAAACTTCCTCTATCTGTCCGGCTGTCTTGAGGCCGAGTGCTCCGTTGCATACAACATCGAGAAAGATGAGCTTACATTGTTCATTCCACCAGTCGACCCAGCCTCGGTTATGTGGTCCGGCCTCCCTCTTGAGCCCGCCGAAGCCTTGAAGCAGTTCGATGTTGATGCCGTGCTCCTCACAACTGAGATAAACAACTATCTCGCGAAGTGTGGGGGCGAGAAGGTCTTCACCATTGCAGACAGAGTTTGCCCGGAGGTCTCCTTCTCATCCTTCAAGCACAACGACACCGATGCCCTGAAGCTTGCCATCGAGTCCTGCCGTATAGTGAAAGACGAGTATGAAATTGGTCTTCTCCGACGTGCTAATGAGGTCTCCAGCCAAGCTCATATTGAAGTGATGAAAGCCGCAACCAAGTCAAAGAACGAGAGAGAGCTCTATGCTACTCTCAACTATGTCTGCATGTCTAATGGCTGCTCCGACCAGTCTTACCATCCAATTCTTGCATGTGGCCCCAATGCTGCCACTCTCCACTACACCAAGAACAACGGTGACCTAACTAACCCGGCTACCGGGATTAAGGACCAGCTCGTACTTATCGACGCTGGATGCCAGTACAAGGCGTACTGTGCAGATATCACTCGTGCATTCCCCTTGTCCGGCAAATTCACCACGGAGGGCCGCCAGATCTATGATATTGCCTTGGAGATGCAGAAAGTCGCGTTTGGCATGATCAAACCTAATGTTTTGTTCGACGACATGCATGCTGCGGTCCACCGGGTTGCGATCAAGGGGCTGCTCAAGATTGGCATTCTCACTGGCTCTGAGGATGAGATTTTCGATAAGGGAATCAGCACTGCCTTTTTCCCACATGGTCTAGGCCACCATCTCGGCATGGACACTCACGATGTTGGAGGAAACCCTAACCCGGCTGACCCGAATCGCATGTTTAAATACTTGCGTCTGCGAGGCACTGTTCCAGAGGGATCCGTCATTACAATTGAGCCCGGTGTAAGTGTTGAATCGAGTAGTTGCTCCGCCGAATGTTTCACATACATTTACTAACCCTTGCTCTAGGTCTACTTCTGCCGTTACATCATTGAGCCATTCCTTACTAACCCCGAGACCAGCAAGTACATCAACTCCGAAGTTCTAGACAAGTACTGGGCTGTTGGAGGTGTACGTATCGAGGACAACGTCGTCGTCCGCGCCAATGGCTTTGAGAACCTGACCACGGTGCCAAAGGAGCCCGAGGAGGTCGAACGCATTGTCCAGGAGGGTGCTAAATAATTATGTTTTTATTCAGTACACCGAGTGGTCGGACACACGCAGGAGCATGTACATATTTATGATCTACCCAGTTGATTTGCTACCAAAAAAGAACCGACCACAGCCCTATTTATTGATATTACATAGTAGGAATAAAGGCCACTTTGCCCACCGCGAATAATAACAATAAGAAAAGCAACTACTCGTACAACCAGCCTAGAAAGCTCTAGACCTCTTTCTCGCTGGGCCCTTGAATGCCGGGCTACTGGTGTTATCACGCTCCCTGGCCCTCTTCTCCTTCATGTCCAACACCCGATTAAGCAAATCGAAACTGAACTGGGGATGCTCAAGACACAATGCCTTGAACTGCTCTTCAGCATCATGACGCAGCACATCACTCATCTTAGCCCAGAAGCGAGCAACCGGTCCTCTGATAGCAGTGTCTTCCGGCGTGGTATGGCTGTACACGTATCTCGCATACTCGATCTCACCCGTAGCACTACTCTCGATGCTACCAATCTTGTTCTGAGCAAGCAGTTTGAGTTTTTCGTTTCCGAGCTTTTCGGCCA
1401个核苷酸(SEQ ID NO:26)的ruPLD见表9B,其中获得的ruPLD部分开放阅读框(“ORF”)序列缺失在第一个位置上的起始子ATG。
  表9B、ruPLD核苷酸序列(SEQ ID NO:26)
  CCGAACTCGGCCATCATGGATATCCACGTCGACAAATACCCGGCTAAGAGTCACGCCAGGCGCGTCGCCGAGAAGCTCAAGGCCGCGGGGCACGGCTCTACCGGCATCATCTTCGTCGAAGGCCAAAAGGAGCATATTATCGATGATAGCGACGAGCCGTTTCACTTCCGTCAACGCCGAAACTTCCTCTATCTGTCCGGCTGTCTTGAGGCCGAGTGCTCCGTTGCATACAACATCGAGAAAGATGAGCTTACATTGTTCATTCCACCAGTCGACCCAGCCTCGGTTATGTGGTCCGGCCTCCCTCTTGAGCCCGCCGAAGCCTTGAAGCAGTTCGATGTTGATGCCGTGCTCCTCACAACTGAGATAAACAACTATCTCGCGAAGTGTGGGGGCGAGAAGGTCTTCACCATTGCAGACAGAGTTTGCCCGGAGGTCTCCTTCTCATCCTTCAAGCACAACGACACGGATGCCCTGAAGCTTGCCATCGAGTCCTGCCGTATAGTGAAAGACGAGTATGAAATTGGTCTTCTCCGACGTGCTAATGAGGTCTCCAGCCAAGCTCATATTGAAGTGATGAAAGCCGCAACCAAGTCAAAGAACGAGAGAGAGCTCTATGCTACTCTCAACTATGTCTGCATGTCTAATGGCTGCTCCGACCAGTCTTACCATCCAATTCTTGCATGTGGCCCCAATGCTGCCACTCTCCACTACACCAAGAACAACGGTGACCTAACTAACCCGGCTACCGGGATTAAGGACCAGCTCGTACTTATCGACGCT
  GGATGCCAGTACAAGGCGTACTGTGCAGATATCACTCGTGCATTCCCCTTGTCCGGCAAATTCACCACGGAGGGCCGCCAGATCTATGATATTGCCTTGGAGATGCAGAAAGTCGCGTTTGGCATGATCAAACCTAATGTTTTGTTCGACGACATGCATGCTGCGGTCCACCGGGTTGCGATCAAGGGGCTGCTCAAGATTGGCATTCTCACTGGCTCTGAGGATGAGATTTTCGATAAGGGAATCAGCACTGCCTTTTTCCCACATGGTCTAGGCCACCATCTCGGCATGGACACTCACGATGTTGGAGGAAACCCTAACCCGGCTGACCCGAATCGCATGTTTAAATACTTGCGTCTGCGAGGCACTGTTCCAGAGGGATCCGTCATTACAATTGAGCCCGGTGTCTACTTCTGCCGTTACATCATTGAGCCATTCCTTACTAACCCCGAGACCAGCAAGTACATCAACTCCGAAGTTCTAGACAAGTACTGGGCTGTTGGAGGTGTACGTATCGAGGACAACGTCGTCGTCCGCGCCAATGGCTTTGAGAACCTGACCACGGTGCCAAAGGAGCCCGAGGAGGTCGAACGCATTGTCCAGGAGGGTGCTAAATAA
上述部分ruPLD核苷酸序列(SEQ ID NO:26)编码含466个氨基酸残基(SEQ ID NO:27)部分的蛋白,在表9C中以一个字母的氨基酸代码表示。
  表9C、ruPLD编码的蛋白序列(SEQ ID NO:27)
  PNSAIMDIHVDKYPAKSHARRVAEKLKAAGHGSTGIIFVEGQKEHIIDDSDEPFHFRQRRNFLYLSGCLEAECSVAYNIEKDELTLFIPPVDPASVMWSGLPLEPAEALKQFDVDAVLLTTEINNYLAKCGGEKVFTIADRVCPEVSFSSFKHNDTDALKLAIESCRIVKDEYEIGLLRRANEVSSQAHIEVMKAATKSKNERELYATLNYVCMSNGCSDQSYHPILACGPNAATLHYTKNNGDLTNPATGIKDQLVLIDAGCQYKAYCADITRAFPLSGKFTTEGRQIYDIALEMQKVAFGMIKPNVLFDDMHAAVHRVAIKGLLKIGILTGSEDEIFDKGISTAFFPHGLGHHLGMDTHDVGGNPNPADPNRMFKYLRLRGTVPEGSVITIEPGVYFCRYIIEPFLTNPETSKYINSEVLDKYWAVGGVRIEDNVVVRANGFENLTTVPKEPEEVERIVQEGAK
上述ruPLD具有与表9D、9E和9F中的BLAST氨基酸序列同源性。由parawise blast程序分析的数据。
                           表9D.ruPLD TBLASTN结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|14272360   脯氨酰氨基酸酶的Aspergillus nidulans pepP基因   2632   199/348(57%)   249/348(71%)   e-143
  gi|32420910   Neurospora crassa菌株OR74A   2562   235/457(51%)   324/457(70%)   e-136
  gi|3114965   脯氨酰氨基酸酶的Suberitesdomunculla mRNA,形式1   1688   157/464(33%)   235/464(50%)   4e-66
  gi|22531161   Arabidopsis tbaliana X-Pro类二肽酶蛋白   1672   160/477(33%)   242/477(50%)   2e-64
                             表9E.ruPLD BLASTX结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|14272361   脯氨酰氨基酸酶/Emericella nidulans   496   267/463(57%)   336/463(72%)   e-153
  gi|3114966   脯氨酰氨基酸酶/Suberites domuncula   501   157/464(33%)   235/464(50%)   1e-66
  gi|22531162   X-Pro类二肽酶蛋白/Arabidopsis thaliana   486   160/477(33%)   242/477(50%)   6e-65
  gi|30582223   多肽酶D/人   493   152/452(33%)   231/452(51%)   2e-63
  gi|20271451   多肽酶D/人   493   152/452(33%)   230/452(50%)   3e-63
                                表9F.ruPLD BLASTP结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|14272361   脯氨酰氨基酸酶/Emericellanidulans   496   267/463(57%)   336/463(72%)   e-158
  gi|3114966   脯氨酰氨基酸酶/Suberitesdomuncula   501   158/466(33%)   235/466(50%)   6e-67
  gi|22531162   X-Pro类二肽酶蛋白/Arabidopsis thaliana   486   159/477(33%)   241/477(50%)   6e-64
  gi|30584879   人多肽酶D   494   152/452(33%)   231/452(51%)   2e-63
  gi|15929143   多肽酶D/人   493   152/452(33%)   231/452(51%)   2e-63
  gi|20271451   多肽酶D/人   493   152/452(33%)   230/452(50%)   4e-63
caLAP2
caLAP2是犬小孢子菌的亮氨酸氨肽酶。1730个核苷酸(SEQ ID NO:28)的caLAP2基因组DNA序列如表10A所示。
  表10A、caLAP2基因组核苷酸序列(SEQ ID NO:28)
  ATGAAGACACAGTTGTTGAGTCTGGGAGTTGCCCTCACGGCCATCTCTCAGGGCGTTATTGCTGAGGATGCCTTGAACTGGCCATTCAAGCCGTTGGTTAATGCTGTGAGTATATACACAAGATCGATCGATCGTCCTCTTGTCCCTGTCACTTATCGCTCTACAGTAAGCAAAAATACTGGAGAATCATGTGCTGATGTAAATGTATAGGATGACCTGCAAAACAAGATTAAGCTCAAGGATCTTATGGCTGGCGTACAGAAACTCCAAGACTTCGCCTACGCTCACCCTGAGAAGAATCGAGTATTCGGTGGTGCTGGCCACAAGGATACCGTCGACTGGATCTACAATGAGCTCAAGGCTACCGGCTACTACGATGTGAAGATGCAGCCACAAGTCCACCTGTGGTCTCATGCTGAGGCAGCTGTCAATGCCAATGGCAAGGATCTCACTGCCAGTGCCATGTCCTACAGCCCTCCAGCCGACAAGATCACTGCCGAGCTTGTCCTGGCCAAGAACATGGGATGCAATGCTGTATGTGCGCCCCTTTTCCATTCTATATATCGACTGGTCGCTTGGAAATTCAGAAGAGCTGACAATTGCAAACAGACTGATTACCCAGAGGGTACCAAGGGCAAGATTGTCCTCATCGAGCGTGGTGTCTGCAGCTTTGGCGAGAAGTCCGCTCAGGCTGGCGATGCAAAGGCTATTGGTGCCATCGTCTACAACAACGTCCCTGGAAGCTTGGCCGGCACCCTGGGTGGCCTTGACAACCGCCATGCTCCAACTGCTGGAATCTCTCAGGCTGATGGAAAGAACCTCGCTAGCCTTGTCGCCTCTGGCAAGGTTACCGTCACCATGAACGTTATCAGCAAGTTTGAGAACAGGACTACGTGAGTATTGTTCCATACTTTGGTCAACAATGATATATACACGTACTAACACTGCTCTATAGCTGGAACGTCATTGCCGAGACCAAGGGAGGAGACCACAACAACGTCATCATGCTCGGTTCTCACTCTGACTCTGTCGACGCCGGCCCTGGTATCAACGACAACGGCTCCGGTACCATTGGTATCATGACCGTTGCCAAAGCCCTCACCAACTTCAAGGTCAACAACGCCGTCCGCTTCGGCTGGTGGACCGCCGAGGAGTTCGGCCTTCTCGGCAGCACTTTCTACGTCGACAGCCTTGACGACCGTGAACTGCACAAGGTCAAGCTGTACCTCAACTTCGACATGATTGGCTCCCCCAACTTCGCCAACCAGATCTACGACGGAGACGGCTCCGCCTACAACATGACTGGCCCCGCCGGATCTGCTGAAATCGAGTACCTGTTCGAGAAGTTCTTCGATGACCAGGGAATCCCACACCAGCCCACCGCCTTCACCGGCCGCTCCGACTACTCTGCCTTCATCAAGCGCAACGTCCCTGCCGGAGGTCTGTTTACTGGTGCTGAGGTCGTCAAGACCGCCGAGCAGGCTAAGCTATTTGGCGGCGAGGCTGGCGTTGCTTATGACAAGAACTACCACGGCAAGGGCGACACTGTAGACAACATCAACAAGGGTGCTATCTACCTCAACACTCGAGGAATCGCGTATGCCACTGCTCAGTATGCTAGTTCGCTGCGCGGATTCCCAACCCGCCCAAAGACGGGTAAGCGTGACGTGAGCCCCCGTGGCCAGTCTATGCCTGGTGGTGGATGCGGACACCACAGCGTCTTCATGTAA
1488个核苷酸的caLAP2见表10B,其中起始子ATG在第一个位置上(表10B中下划线)。
  表10B、caLAP2核苷酸序列(SEQ ID NO:29)
  ATGAAGACACAGTTGTTGAGTCTGGGAGTTGCCCTCACGGCCATCTCTCAGGGCGTTATTGCTGAGGATGCCTTGAACTGGCCATTCAAGCCGTTGGTTAATGCTGATGACCTGCAAAACAAGATTAAGCTCAAGGATCTTATGGCTGGCGTACAGAAACTCCAAGACTTCGCCTACGCTCACCCTGAGAAGAATCGAGTATTCGGTGGTGCTGGCCACAAGGATACCGTCGACTGGATCTACAATGAGCTCAAGGCTACCGGCTACTACGATGTGAAGATGCAGCCACAAGTCCACCTGTGGTCTCATGCTGAGGCAGCTGTCAATGCCAATGGCAAGGATCTCACTGCCAGTGCCATGTCCTACAGCCCTCCAGCCGACAAGATCACTGCCGAGCTTGTCCTGGCCAAGAACATGGGATGCAATGCTACTGATTACCCAGAGGGTACCAAGGGCAAGATTGTCCTCATCGAGCGTGGTGTCTGCAGCTTTGGCGAGAAGTCCGCTCAG
  GCTGGCGATGCAAAGGCTATTGGTGCCATCGTCTACAACAACGTCCCTGGAAGCTTGGCCGGCACCCTGGGTGGCCTTGACAACCGCCATGCTCCAACTGCTGGAATCTCTCAGGCTGATGGAAAGAACCTCGCTAGCCTTGTCGCCTCTGGCAAGGTTACCGTCACCATGAACGTTATCAGCAAGTTTGAGAACAGGACTACCTGGAACGTCATTGCCGAGACCAAGGGAGGAGACCACAACAACGTCATCATGCTCGGTTCTCACTCTGACTCTGTCGACGCCGGCCCTGGTATCAACGACAACGGCTCCGGTACCATTGGTATCATGACCGTTGCCAAAGCCCTCACCAACTTCAAGGTCAACAACGCCGTCCGCTTCGGCTGGTGGACCGCCGAGGAGTTCGGCCTTCTCGGCAGCACTTTCTACGTCGACAGCCTTGACGACCGTGAACTGCACAAGGTCAAGCTGTACCTCAACTTCGACATGATTGGCTCCCCCAACTTCGCCAACCAGATCTACGACGGAGACGGCTCCGCCTACAACATGACTGGCCCCGCCGGATCTGCTGAAATCGAGTACCTGTTCGAGAAGTTCTTCGATGACCAGGGAATCCCACACCAGCCCACCGCCTTCACCGGCCGCTCCGACTACTCTGCCTTCATCAAGCGCAACGTCCCTGCCGGAGGTCTGTTTACTGGTGCTGAGGTCGTCAAGACCGCCGAGCAGGCTAAGCTATTTGGCGGCGAGGCTGGCGTTGCTTATGACAAGAACTACCACGGCAAGGGCGACACTGTAGACAACATCAACAAGGGTGCTATCTACCTCAACACTCGAGGAATCGCGTATGCCACTGCTCAGTATGCTAGTTCGCTGCGCGGATTCCCAACCCGCCCAAAGACGGGTAAGCGTGACGTGAGCCCCCGTGGCCAGTCTATGCCTGGTGGTGGATGCGGACACCACAGCGTCTTCATGTAA
上述caLAP2核苷酸序列(SEQ ID NO:29)编码含495个氨基酸残基(SEQ ID NO:30)的蛋白,在表10C中以一个字母的氨基酸代码表示。
  表10C、caLAP2编码的蛋白序列(SEQ ID NO:30)
  MKTQLLSLGVALTAISQGVIAEDALNWPFKPLVNADDLQNKIKLKDLMAGVQKLQDFAYAHPEKNRVFGGAGHKDTVDWIYNELKATGYYDVKMQPQVHLWSHAEAAVNANGKDLTASAMSYSPPADKITAELVLAKNMGCNATDYPEGTKGKIVLIERGVCSFGEKSAQAGDAKAIGAIVYNNVPGSLAGTLGGLDNRHAPTAGISQADGKNLASLVASGKVTVTMNVISKFENRTTWNVIAETKGGDHNNVIMLGSHSDSVDAGPGINDNGSGTIGIMTVAKALTNFKVNNAVRFGWWTAEEFGLLGSTFYVDSLDDRELHKVKLYLNFDMIGSPNFANQIYDGDGSAYNMTGPAGSAEIEYLFEKFFDDQGIPHQPTAFTGRSDYSAFIKRNVPAGGLFTGAEVVKTAEQAKLFGGEAGVAYDKNYHGKGDTVDNINKGAIYLNTRGIAYATAQYASSLRGFPTRPKTGKRDVSPRGQSMPGGGCGHHSVFM
上述caLAP2具有与表10D、10E和10F中的BLAST氨基酸序列同源性。由parawise blast程序分析的数据。
                             表10D.caLAP2 TBLASTN结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|600025   Saccharomyces cerevisiae(s288c)RIF1,DPB3,YmL27和SNF5基因   32421   182/477(38%)   254/477(53%)   8e-77
  gi|469463   Saccharomyces cerevisiae氨肽酶Y基因   2272   182/477(38%)   254/477(53%)   8e-77
  gi|16033407   Bacillus licheniformis亮氨酸氨肽酶前体,基因   2054   132/474(27%)   215/474(45%)   3e-27
                                      表10E.caLAP2 BLASTX结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|6319763   氨肽酶yscIII;Ape3p/Saccharomyces cerevisiae   537   182/477(38%)   254/477(53%)   9e-78
  gi|1077010   氨肽酶Y前体,有液泡的/Saccharomyces cerevisiae   537   182/477(38%)   254/477(53%)   9e-78
  gi|31791596   可能的脂蛋白氨肽酶LPQL/Mycobacterium bovis   500   188/485(38%)   269/485(55%)   3e-77
  gi|15839805   水解酶/Mycobacterium tuberculosis   493   187/481(38%)   268/481(55%)   6e-77
                                  表10F.caLAP2B LASTP结果
  基因目录/索引  蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|6319763  氨肽酶yscIII;Ape3p/Saccharomyces cerevisiae   563   182/477(38%)   254/477(53%)   5e-78
  gi|1077010  氨肽酶Y前体,有液泡的/Saccharomyces cerevisiae   537   182/477(38%)   254/477(53%)   8e-78
  gi|15839805  水解酶/Mycobacteriumtuberculosis   493   187/481(38%)   268/481(55%)   1e-71
  gi|31617182  可能的脂蛋白氨肽酶LPQL/Mycobacterium bovis   500   188/485(38%)   269/485(55%)   2e-71
  gi|15598135  可能的氨肽酶/Pseudomonas aeruginosa   536   166/445(37%)   242/445(54%)   2e-65
meLAP2
meLAP2是须癣毛癣菌的亮氨酸氨肽酶。1775个核苷酸(SEQ ID NO:31)的meLAP2核酸如表11A所示。
  表11A、meLAP2基因组核苷酸序列(SEQ ID NO:31)
  ATGAAGTCGCAACTGTTGAGCCTAGCCGTGGCCGTCACCACCATTTCCCAGGGCGTTGTTGGTCAAGAGCCCTTTGGATGGCCCTTCAAGCCTATGGTCACTCAGGTGAGTTGCTGTCAACAGATCGATCGATCGATCTACCTTCGTCCCTGTCACCTATAACTCCACAGCAGGACCAAGAAAACACAAGTTTTCCGGGGAATTCTTATGTGCTGATGTAAATGTATAGGATGACCTGCAAAACAAGATTAAGCTCAAGGATATCATGGCAGGTGTCGAGAAGCTGCAAAGCTTTTCTGATGCTCATCCTGAAAAGAACCGAGTGTTCGGTGGTAATGGCCACAAGGACACTGTCGAGTGGATCTACAATGAGCTCAAGGCCACCGGCTACTACAATGTGAAGAAGCAGGAGCAGGTACACCTGTGGTCTCACGCTGAGGCCGCTCTCAGTGCCAATGGCAAGGACCTCAAGGCCAGCGCCATGTCGTACAGCCCTCCTGCCAACAAGATCATGGCCGAGCTTGTCGTTGCCAAGAACAATGGCTGCAATGCTGTAAGTGCCATACACTTCCTATACATCACATTCACTTTAGAATGAAGAGCGCGGGAGAACTGATTTTTTTTTTTTTTTTTTTTTTTTTGTAACAGACCGATTACCCAGAGAACACTCAGGGAAAGATAGTCCTCATTCAGCGTGGTGTCTGCAGCTTCGGCGAGAAGTCTTCTCAGGCTGGTGATGCGAAGGCTATTGGTGCCGTTGTCTACAACAACGTCCCCGGATCCCTTGCTGGCACTCTTGGTGGCCTTGACAAGCGCCATGTCCCAACCGCTGGTCTTTCCCAGGAGGATGGAAAGAATCTTGCTAGCCTCGTTGCTTCTGGCAAGGTTGATGTCACCATGAACGTTGTCAGTCTGTTTGAGAACCGAACCACGTAAGTAACTCAACGTCATATCCAGCATTAATCTTCAGGAGTATATATACTAATTCGGTATCTCACAGCTGGAACGTCATTGCTGAGACCAAGGGAGGAGACCACAACAATGTTGTCATGCTTGGTGCTCACTCCGACTCCGTCGATGCCGGCCCCGGTATCAACGACAACGGCTCCGGCTCCATTGGTATCATGACCGTTGCCAAAGCCCTTACTAACTTCAAGCTCAACAACGCCGTTCGCTTTGCCTGGTGGACCGCTGAGGAATTCGGTCTCCTTGGAAGCACCTTCTACGTCGACAGCCTTGATGACCGTGAGCTGCACAAGGTCAAGCTGTACCTCAACTTCGACATGATCGGCTCTCCCAACTTCGCCAACCAGATCTACGACGGTGACGGTTCGGCCTACAACATGACTGGTCCCGCTGGCTCTGCTGAAATCGAGTACCTGTTCGAGAAGTTCTTTGACGACCAGGGTCTCCCACACCAGCCCACTGCCTTCACCGGCCGATCCGACTACTCTGCATTCATCAAGCGCAACGTCCCCGCTGGAGGTCTTTTCACTGGTGCCGAGGTTGTCAAGACCCCCGAGCAAGTTAAGCTGTTCGGTGGTGAGGCTGGCGTTGCCTATGACAAGAACTACCATGGCAAGGGTGACACCGTTGCCAACATCAACAAGGGAGCTATCTTCCTTAACACTCGAGCAATCGCCTACTCTGTGGCCGAGTATGCTCGATCCCTCAAGGGCTTCCCAACCCGCCCAAAGACCGGCAAGCGTGCCGTCAACCCTCAGTATGCTAAGATGCCTGGTGGTGGTTGCGGACACCACACTGTCTTCATGTAA
1488个核苷酸的meLAP2开放阅读框(“ORF”),其中起始子ATG在第一个位置上(表11B中下划线)。
  表11B、meLAP2核苷酸序列(SEQ ID NO:32)
  ATGAAGTCGCAACTGTTGAGCCTAGCCGTGGCCGTCACCACCATTTCCCAGGGCGTTGTTGGTCAAGAGCCCTTTGGATGGCCCTTCAAGCCTATGGTCACTCAGGATGACCTGCAAAACAAGATTAAGCTCAAGGATATCATGGCAGGTGTCGAGAAGCTGCAAAGCTTTTCTGATGCTCATCCTGAAAAGAACCGAGTGTTCGGTGGTAATGGCCACAAGGACACTGTCGAGTGGATCTACAATGAGCTCAAGGCCACCGGCTACTACAATGTGAAGAAGCAGGAGCAGGTACACCTGTGGTCTCACGCTGAGGCCGCTCTCAGTGCCAATGGCAAGGACCTCAAGGCCAGCGCCATGTCGTACAGCCCTCCTGCCAACAAGATCATGGCCGAGCTTGTCGTTGCCAAGAACAATGGCTGCAATGCTACCGATTACCCAGAGAACACTCAGGGAAAGATAGTCCTCATTCAGCGTGGTGTCTGCAGCTTCGGCGAGAAGTCTTCTCAG
  GCTGGTGATGCGAAGGCTATTGGTGCCGTTGTCTACAACAACGTCCCCGGATCCCTTGCTGGCACTCTTGGTGGCCTTGACAAGCGCCATGTCCCAACCGCTGGTCTTTCCCAGGAGGATGGAAAGAATCTTGCTAGCCTCGTTGCTTCTGGCAAGGTTGATGTCACCATGAACGTTGTCAGTCTGTTTGAGAACCGAACCACCTGGAACGTCATTGCTGAGACCAAGGGAGGAGACCACAACAATGTTGTCATGCTTGGTGCTCACTCCGACTCCGTCGATGCCGGCCCCGGTATCAACGACAACGGCTCCGGCTCCATTGGTATCATGACCGTTGCCAAAGCCCTTACTAACTTCAAGCTCAACAACGCCGTTCGCTTTGCCTGGTGGACCGCTGAGGAATTCGGTCTCCTTGGAAGCACCTTCTACGTCGACAGCCTTGATGACCGTGAGCTGCACAAGGTCAAGCTGTACCTCAACTTCGACATGATCGGCTCTCCCAACTTCGCCAACCAGATCTACGACGGTGACGGTTCGGCCTACAACATGACTGGTCCCGCTGGCTCTGCTGAAATCGAGTACCTGTTCGAGAAGTTCTTTGACGACCAGGGTCTCCCACACCAGCCCACTGCCTTCACCGGCCGATCCGACTACTCTGCATTCATCAAGCGCAACGTCCCCGCTGGAGGTCTTTTCACTGGTGCCGAGGTTGTCAAGACCCCCGAGCAAGTTAAGCTGTTCGGTGGTGAGGCTGGCGTTGCCTATGACAAGAACTACCATGGCAAGGGTGACACCGTTGCCAACATCAACAAGGGAGCTATCTTCCTTAACACTCGAGCAATCGCCTACTCTGTGGCCGAGTATGCTCGATCCCTCAAGGGCTTCCCAACCCGCCCAAAGACCGGCAAGCGTGCCGTCAACCCTCAGTATGCTAAGATGCCTGGTGGTGGTTGCGGACACCACACTGTCTTCATGTAA
上述meLAP2核苷酸序列(SEQ ID NO:32)编码有495个氨基酸残基(SEQ ID NO:33)的蛋白,在表11C中以一个字母的氨基酸代码表示。
  表11C、fuLAP2编码的蛋白序列(SEQ ID NO:33)
  MKSQLLSLAVAVTTISQGVVGQEPFGWPFKPMVTQDDLQNKIKLKDIMAGVEKLQSFSDAHPEKNRVFGGNGHKDTVEWIYNELKATGYYNVKKQEQVHLWSHAEAALSANGKDLKASAMSYSPPANKIMAELVVAKNNGCNATDYPENTQGKIVLIQRGVCSFGEKSSQAGDAKAIGAVVYNNVPGSLAGTLGGLDKRHVPTAGLSQEDGKNLASLVASGKVDVTMNVVSLFENRTTWNVIAETKGGDHNNVVMLGAHSDSVDAGPGINDNGSGSIGIMTVAKALTNFKLNNAVRFAWWTAEEFGLLGSTFYVDSLDDRELHKVKLYLNFDMIGSPNFANQIYDGDGSAYNMTGPAGSAEIEYLFEKFFDDQGLPHQPTAFTGRSDYSAFIKRNVPAGGLFTGAEVVKTPEQVKLFGGEAGVAYDKNYHGKGDTVANINKGAIFLNTRAIAYSVAEYARSLKGFPTRPKTGKRAVNPQYAKMPGGGCGHHTVFM
上述meLAP2具有与表11D、11E和11F中的BLAST氨基酸序列同源性。用parawise blast程序分析上述数据。
                            表11D.meLAP2 TBLASTN结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|600025   Saccharomycescerevisiae(s288c)RIF1,DPB3,YmL27和SNF5基因   32421   180/479(37%)   251/479(52%)   2e-70
  gi|469463   Saccharomycescerevisiae氨肽酶Y基因   2272   180/479(37%)   251/479(52%)   2e-70
                               表11E.meLAP2 BLASTX结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|1077010   氨肽酶Y前体,有液泡的/Saccharomycescerevisiae   537   180/479(37%)   251/479(52%)   8e-71
  gi|6319763   氨肽酶yscIII;Ape3p/Saccharomyces cerevisiae   563   180/479(37%)   251/479(52%)   8e-71
  gi|15839805   水解酶/MycobacteriumTuberculosis   493   159/440(36%)   236/440(53%)   1e-63
  gi|31791596   可能的脂蛋白氨肽酶LPQL/Mycobacterium bovis   500   159/440(36%)   236/440(53%)   1e-63
  gi|15598135   可能的氨肽酶/   536   158/445(35%)   237/445(53%)   1e-62
  PseudomonasAeruginosa
  gi|1045225   N-乙酰化嘌呤霉素N-乙酰化水解酶/Streptomyces anulatus   485   154/477(32%)   218/477(45%)   4e-48
  gi|29831415   可能的氨肽酶/Streptomycesa vermitilis   315   95/244(38%)   131/244(53%)   2e-37
                                      表11F.meLAP2 BLASTP结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|6319763   氨肽酶yscIII;Ape3p/Saccharomycescerevisiae   563   179/479(37%)   248/479(51%)   9e-71
  gi|1077010   氨肽酶Y前体,有液泡的/Saccharomycescerevisiae   537   179/479(37%)   248/479(51%)   9e-71
  gi|31617182   可能的脂蛋白氨肽酶LPQL/Mycobacteriumbovis   500   159/440(36%)   236/440(53%)   2e-62
  gi|15839805   水解酶/MycobacteriumTuberculosis   493   159/440(36%)   236/440(53%)   2e-62
ruDPPIV
ruDPPIV是红色毛癣菌的二肽基多肽酶IV。2326个核苷酸序列(SEQ ID NO:34)的ruDPPIV核酸如表12A所示。所述的ruDPPIV开放阅读框(“ORF”)起始子ATG在第一个位置上(表12A中下划线)。
  表12A、ruDPPIV核苷酸序列(SEQ ID NO:34)
  ATGAAGCTCCTCTCGCTACTTATGCTGGCGGGCATCGCCCAAGCCATCGTTCCTCCTCGTGAGCCCCGTTCACCAACTGGTGGCGGCAACAAGCTGTTGACCTACAAGGAGTGTGTCCCTAGAGCTACTATCTCTCCAAGGTCGACGTCCCTTGCCTGGATTAACAGTGAAGAAGATGGCCGGTACATCTCCCAGTCCGACGATGGAGCATTGATCCTCCAGAACATCGTCACGAACACCAACAAGACTCTCGTGGCCGCAGACAAGGTACCCAAGGGTTACTATGACTACTGGTTCAAGCCAGACCTTTCTGCTGTCTTATGGGCAACCAATTACACCAAGCAGTACCGTCACTCTTACTTTGCCAACTACTTCATTCTAGACATCAAAAAGGGATCGTTGACCCCTCTAGCCCAGGACCAGGCTGGTGACATCCAGTATGCTCAATGGAGCCCCATGAACAACTCTATCGCCTATGTCCGTGRAAACGACCTGTATATCTGGAACAATGGCAAGACCAAGCGTATTACCGAAAATGGCGGCCCGGATATCTTCAATGGTGTCCCTGACTGGGTATACGAGGAAGAAATCTTCGGGGACCGGTTCGCTCTTTGGTTCTCACCTGACGGTGAATACCTTGCGTACCTCCGCTTTAACGAGACTGGAGTCCCGACCTACACTATTCCGTACTACAAGAACAAGCAAAAGATTGCCCCTGCCTACCCAAGGGAGCTGGAGATCCGTTACCCTAAAGTCTCTGCGAAGAACCCAACCGTGCAGTTCCACCTGTTAAACATTGCTTCATCCCAGGAGACAACTATCCCAGTTACTGCGTTCCCGGAAAACGATCTTGTGATCGGTGAGGTTGCTTGGCTCAGCAGTGGCCATGATAGTGTAGCATATCGTGCTTTCAACCGTGTCCAGGATAGAGAAAAGATTGTCAGCGTCAAGGTTGAGTCCAAGGAATCCAAGGTTATTCGCGAAAGAGATGGCACCGACGGCTGGATCGACAACCTTCTCTCATGTCATATATCGGAAACGTTAACGGCAAGGAGTACTACGTCGATATATCTGATGCTTCTGGCTGGGCACATATCTACCTCTACCCGGTTGATGGAGGAAAGGAGATTGCACTAACAAAGGGAGAATGGGAAGTCGTTGCCATTCTCAAGGTTGACACGAAGAAGAAGCTGATCTACTTCACCTCTACCAAATATCACAGCACCACTCGACACGTCTACTCTGTCTCGTATGACACAAAGGTCATGACCCCTCTCGTCAACGATAAGGAGGCTGCGTACTACACTGCATCCTTCTCGGCCAAGGGTGGTTACTATATCTTGTCCTACCAAGGTCCAAATGTTCCATACCAAGAACTTTACTCCACCAAGGACAGTAAGAAGCCTCTCAAGACAATCACTAGCAATGATGCATTGCTCGAGAAGCTGAAGGAGTACAAGCTCCCCAAGGTTAGCTTCTTTGAGATCAAGCTTCCATCTGGTGAAACCCTTAATGTTAAGCAACGCCTACCACCTAACTTCAACCCACACAAGAAGTACCCCGTCCTCTTCACTCCGTATGGTGGCCCTGGTGCCCAAGAGGTAAGCCAGGCATGGAATTCATTGGACTTCAAGTCCTACATTACATCTGACCCTGAGCTTGAATACGTTACCTGGACTGTTGACAACCGTGGAACCGGCTACAAGGGCCGCAAGTTCCGCA
  GCGCCGTAGCTAAGCGTCTCGGTTTCCTCGAAGCCCAGGACCAGGTCTTTGCTGCTAAGGAGGTGCTGAAAAACCGTTGGGCTGATAAGGACCATATTGGAATCTGGGGCTGNAGCTATGGCGGCTTCCTGACCGCTAAGACCCTCGAGACCGACAGTGGTGTATTCACTTTTGGTATCAGTACTGCTCCTGTCTCTGATTTCAGACTCTACGACAGCATGTACACTGAGCGTTACATGAAGACCGTTGAACTAAACGCTGACGGCTACAGTGAGACCGCCGTGCACAAGGTTGATGGCTTTAAGAACCTCAAAGGTCATTACTCATCCAGCATGGAACCGGTGACGACAACGTCCACTTCCAAAACGCCGCTGTCCTTTCCAACACCCTGATGAACGGCGGTGTAACTGCAGACAAGTTGACTACTCAGTGGTTTACTGACTCGGACCACGGCATCAGATACGATATGGACTCCACTTACCAGTACAAGCAGCTTTCTAAGATGGTCTACGACCAGAAGCAACGAAGGCCAGAAAGCCCACCAATGCACCAATGGAGCAAGAGAGTTTTGGCTGCCCTGTTTGGTGAGAGGGCAGAGGAATGA
上述ruDPPIV核苷酸序列(SEQ ID NO:34)编码含775个氨基酸残基(SEQ ID NO:35)的蛋白,在表12B中以一个字母的氨基酸代码表示。
  表12B、ruDPPIV编码的蛋白序列(SEQ ID NO:35)
  MKLLSLLMLAGIAQAIVPPREPRSPTGGGNKLLTYKECVPRATISPRSTSLAWINSEEDGRYISQSDDGALILQNIVTNTNKTLVAADKVPKGYYDYWFKPDLSAVLWATNYTKQYRHSYFANYFILDIKKGSLTPLAQDQAGDIQYAQWSPMNNSIAYVRXNDLYIWNNGKTKRITENGGPDIFNGVPDWVYEEEIFGDRFALWFSPDGEYLAYLRFNETGVPTYTIPYYKNKQKIAPAYPRELEIRYPKVSAKNPTVQFHLLNIASSQETTIPVTAFPENDLVIGEVAWLSSGHDSVAYRAFNRVQDREKIVSVKVESKESKVIRERDGTDGWIDNLLSMSYIGNVNGKEYYVDISDASGWAHIYLYPVDGGKEIALTKGEWEVVAILKVDTKKKLIYFTSTKYHSTTRHVYSVSYDTKVMTPLVNDKEAAYYTASFSAKGGYYILSYQGPNVPYQELYSTKDSKKPLKTITSNDALLEKLKEYKLPKVSFFEIKLPSGETLNVKQRLPPNFNPHKKYPVLFTPYGGPGAQEVSQAWNSLDFKSYITSDPELEYVTWTVDNRGTGYKGRKFRSAVAKRLGFLEAQDQVFAAKEVLKNRWADKDHIGIWGXSYGGFLTAKTLETDSGVFTFGISTAPVSDFRLYDSMYTERYMKTVELNADGYSETAVHKVDGFKNLKGHYLIQHGTGDDNVHFQNAAVLSNTLMNGGVTADKLTTQWFTDSDHGIRYDMDSTYQYKQLSKMVYDQKQRRPESPPMHQWSKRVLAALFGERAEE
上述ruDPPIV具有与表10C、10D和10E中的BLAST氨基酸序列同源性。用parawiseblast程序分析上述数据。
                            表12C.ruDPPIV TBLASTN结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|2351699   Aspergillusfumigatus二肽基多肽酶IV(Dpp4)基因   2352   469/761(61%)   585/761(76%)   0.0
  gi|2924304   Aspergillusoryzae Dpp4基因   4771   448/769(58%)   568/769(73%)   0.0
  gi|32422540   Neurospora crassa菌株OR74A   2688   256/720(35%)   374/420(51%)   e-114
  gi|14330262   二肽基氨肽酶IV型的AspergillusnigerdapB基因,外显子1-3   3989   224/637(35%)   333/637(52%)   e-111
  gi|1621278   二肽基多肽酶的Xenopuslaevis mRNA   3337   244/752(32%)   375/752(49%)   e-100
  gi|6978772   Rattus norvegicus二肽基多肽酶4(Dpp4)   4835   246/742(33%)   373/742(50%)   8e-98
                         表12D.ruDPPIV BLASTX结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|2351700   二肽基多肽酶IV/Aspergillusfumigatus   765   218/341(63%)   270/341(79%)   0.0
  gi|2924305   脯氨酰二肽基多肽酶/Aspergillusoryzae   771   213/344(61%)   270/340(78%)   0.0
  gi|1621279   二肽基多肽酶IV/Xenopus laevis mRNA   748   118/349(33%)   186/349(53%)   8e-93
  gi|535588   二肽基多肽酶IV/人   766   125/375(33%)   191/375(50%)   3e-90
                            表12E.ruDPPIV BLASTP结果
  基因目录/索引   蛋白/组织   长度(aa)   一致性(%)   得分值(%)   E值
  gi|2351700   二肽基多肽酶IV/Aspergillusfumigatus   765   468/761(61%)   585/761(76%)   0.0
  gi|2924305   脯氨酰二肽基多肽酶/Aspergillusoryzae   771   448/769(58%)   568/769(73%)   0.0
  gi|14330263   二肽基氨肽酶IV型/Aspergillusniger   901   261/733(35%)   387/733(52%)   e-114
  gi|19114882   二肽基氨肽酶/Schizoaccharomyces prombe   793   258/742(34%)   396/742(53%)   e-106
  gi|3660   二肽基氨肽酶/Saccharomyces cerevisiae   841   254/750(33%)   370/750(49%)   2e-95
本发明另一方面是关于分离的编码EXOX多肽或具有其生物活性部分的核酸分子。同时本发明也包括能充分应用的作为杂交探针证明EXOX编码核酸(如EXOX mRNAs)的核酸片段,作为扩增或突变EXOX核酸分子的PCR引物的核酸片段。所述应用,所述术语“核酸分子”指的是包括DNA分子(如cDNA或基因组DNA),RNA分子(如mRNA),利用核酸同源性产生的上述DNA或RNA的类似物、衍生物、片段或功能类似物等。所述核酸分子可以是单链或双链。
一个EXOX核酸能编码一个成熟的EXOX多肽。本发明所指,“成熟”形式的多肽或蛋白表示自然产生的多肽、前体形式或蛋白前体。所述自然产生的多肽、前体形式或蛋白前体包括但不限于,全长的编码相关蛋白的基因产物。同样的,上述自然产生的多肽、前体形式或蛋白前体也可以被定义为由一段本发明所述的ORF编码。所述的产物的“成熟”形式产生于,包括但不限于,一个或多个自然发生的基因表达过程,如发生在细胞、宿主细胞里出现基因表达。上述产生步骤导致“成熟”形式的多肽或蛋白的例子包括去除由ORF开始密码子编码的N末端甲硫氨酸残基,或水解去除一段信号肽或引导序列。上述从具有残基1到N的多肽或蛋白前体产生的成熟形式,所述残基1是指N末端甲硫氨酸,去除N末端甲硫氨酸后具有残基2到N的残基。另外的,上述从具有残基1到N的多肽或蛋白前体产生的成熟形式,其中N末端从残基1到残基M的信号序列被除去,保留残基M+1到残基N的残基。这里进一步引述,多肽或蛋白的“成熟”形式可以从后转录修饰中产生,而不用蛋白水解去除现象。上述另外的过程包括,但不限于如,糖基化(N-,O-和W型)、十四酰化、磷酸化、硫化、N末端环化或C末端酰胺化。一般的,成熟的多肽或蛋白可以通过上述一种方法产生,或上述方法的任意组合产生。
所述的术语“探针”,在本发明中指的是具有不同长度的核酸序列,可能至少是10个核苷酸(nt),或到100个,又或到最大的6000个nt,这取决于其相关作用。探针被用于证明核酸序列的一致性、相关性或互补性。较长的探针一般来自于天然或重组的,具有高度特异性,同时比起短的探针具有更长的杂交时间。探针可以是单链或双链,可以设计用于PCR反应,膜杂交技术,或象ELISA技术[xu4]。
所述术语“分离的”核酸分子,在本发明中指的是从自然存在的核酸中分离得到的一种核酸分子。优选的,“分离的”核酸不含有该核酸来源生物的基因组DNA中天然位于该核酸侧翼的序列(如位于该核酸的5’和3’端序列)。例如,在不同的实施方案中,分离的EXOX核酸分子可以含有至少约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列,该核苷酸序列天然位于上述核酸分子来源的细胞/组织/物种基因组DNA中的核酸分子的侧翼。此外,“分离的”核酸分子,例如cDNA分子,在用重组技术产生时,可以基本上不含其他细胞物质或培养基;或在用化学法合成时,基本上不含化学前体或其他化学物质。特别的,其中核酸分子或蛋白的纯度至少约50%,进一步优选为至少约85%,最优选为至少约99%。
本发明所述的术语“重组体”指的是参考一种细胞,显示该细胞复制异源核酸或表达由异源核酸编码的多肽或蛋白。重组体细胞可以含有不是天然的(非重组体)细胞的基因。重组体细胞也可以含有天然的细胞里经过修饰过的和通过人工手段引入到细胞里的基因。所述术语还包括含有内生的被修饰过,但没有去除核酸的细胞里的核酸;所述修饰包括可以获得的基因替换、定点突变和其他相关技术。本领域技术人员熟知的是所述细胞可以被用作单细胞或多细胞转基因组织,例如产生EXOX的转基因真菌。
本发明提供的一种核酸分子,如含有SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示核酸序列的核酸分子或其互补系列,可以用标准的分子生物学技术分离得到,所述序列信息如本发明所示。用全部或部分SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示核酸序列作为杂交探针,EXOX分子用标准的杂交和克隆技术被分离得到(如以下文献描述:Sambrook等,(eds),分子克隆试验操作手册第二版,冷泉港实验室出版,冷泉港,NY,1989;Ausubel等,(eds.),CURRENT PROTOCOLS IN MOLECULARBIOLOGY,John Wiley & Sons,New York,NY,1993)。
本发明所述的核酸可以通过以cDNA、mRNA或等位基因组DNA作为模板,以合适的寡核苷酸片段为引物,进行一定的PCR反应得到。所述的核酸扩增后可以克隆到合适的载体中,并通过序列分析得到确认。进一步的,EXOX核苷酸序列对应的寡核苷酸可以通过标准的合成技术制备,如DNA自动合成仪。
本发明所述的术语“寡核苷酸”指的是一系列连接在一起的核苷酸残基,所述寡核苷酸具有足够多的碱基来保证应用于PCR反应。一段短的寡核苷酸序列可以基于或来自于一个基因组DNA或cDNA,然后被应用于扩增、确认或揭示在特定细胞或组织中存在的一种同样的、类似的或互补的DNA或RNA。寡核苷酸含有部分核酸序列,长度可为10nt、50nt或100nt,优选为15nt~30nt。在本发明一个具体实施方案中,一段长度小于100nt的寡核苷酸进一步的包括了SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34或其互补序列中至少6个邻近核苷酸。寡核苷酸可以通过化学合成,作为探针应用。
在另一个实施方案中,本发明所述的分离的核酸分子包括了一种含有与选自SEQ IDNOs:2、5、8、11、14、17、20、23、26、29、32或34所示序列互补的核酸分子(例如,一段作为探针或引物的核酸片段、一段编码具有EXOX多肽活性部分的核酸片段)。上述与选自SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示序列互补的核酸分子具有与选自SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示序列很少或没有错配的氢键连接,从而形成稳定的双螺旋结构。
在这里,术语“互补体”指的是核酸分子的核苷酸间为Watson-Crick或Hoogsteen碱基配对。术语“连接”指的是两个多肽、化合物、多肽相关物质、组合物或其功能类似物之间的物理或化学相互作用力。连接包括离子键、非离子键、范德华引力、氢键引力等。物理作用力可以是直接的,也可以是间接的。间接的作用力可以是通过或由另一个多肽或化合物的影响。直接的连接指的是没有空间的阻隔,或者是由于另一个多肽或化合物作用,但不是指其他具体的化学反应作用。
本发明提供的片段定义为具有至少6个(相邻的)核酸或4个(相邻的)氨基酸,其长度足够允许严格的核酸杂交或与特殊的抗体结合,相对的,部分片段的反应小于全长反应。片段可以从所选择的核酸或氨基酸序列中相邻的部分得到。由核酸序列或氨基酸序列形成的衍生物可以是直接从自然获得的化合物的或被修饰过的或部分替换的。同功物指的是具有类似核酸或氨基酸序列结构,但不限于的是,具有不同的组分或侧链。同源或异源是指核酸序列或氨基酸序列从不同物种分离得到的一类特定基因。
如果衍生物或同功物含有被修饰过的本发明所述核酸或蛋白,所述衍生物和同功物可以是全长或超过全长。本发明所述的核酸或蛋白的衍生物或同功物包括但不限于:在不同的重组体中含有与本发明所述的核酸或蛋白具有至少约70%、80%或95%同源性的分子(优选为具有80-95%同源性的分子);或是按照本领域技术人员熟知的经过计算机同源程序配对过的线性序列;或是能够在严格的、温和的、低度严格的条件下与编码上述的蛋白的互补序列杂交的编码的核酸。参见如Ausubel等,CURRENT PROTOCOLS TN MOLECULARBIOLOGY,John Wiley & Sons,New York,NY,1993和以下所述。
本发明中,一种“同源核酸序列”或“同源氨基酸序列”或是其它不同名称指的是在核苷酸或氨基酸水平上具有同源性特征的序列。同源核酸序列包括那些编码EXOX多肽的重组异构体的序列。重组异构体能够在同样的组织中表达,如选择性剪切的RNA。另一方面,重组异构体可以被不同的基因编码。在本发明中,同源核酸序列可以是编码除真菌外的其他物种的EXOX多肽的核酸序列。同源核酸序列也包括但不限于自然发生的本发明提供的核酸等位替换或突变。同源核酸序列还包括那些编码如SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示序列的保守氨基酸亚单位(参见下面),一种多肽具有EXOX生物活性。EXOX蛋白的不同生物活性将在下面详述。
EXOX多肽由EXQX核酸的开放阅读框(ORF)编码。ORF被终止子结束其延伸。一段开放阅读框代表了一种全长蛋白的编码序列,由ATG“起始子”开始,到TAA、TAG或TGA三个终止子之一终止。为了本发明目的,所述ORF可以是编码序列的任何部分,含有或不含起始子和终止子之一或两个。作为一个好的编码真正的细胞质蛋白的ORF,其最小的长度经常是编码50个氨基酸或更多氨基酸蛋白的DNA结构。
经来自真菌EXOX基因克隆确认的核苷酸序列可以作为探针和引物应用,所述探针和引物设计用来证明和/或克隆在其他物种的EXOX同源基因,也包括来自其他物种的EXOX同源基因。所述引物/探针一般包括一段基本上纯化的寡核苷酸。所述寡核苷酸一般包括核苷酸序列的一个区,所述核苷酸序列在严格条件下与至少约12、25、50、100、150、200、250、300、350或400连续的核苷酸序列的核酸杂交,其中杂交的核酸序列为SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34的正义核苷酸序列;或SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34的反义核苷酸序列;或SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34的天然存在的突变体序列。
“具有EXOX多肽部分活性的多肽”指的是多肽具有活性类似,但不限于,本发明所述多肽活性,包括成熟形式,经过特殊的生物检测,有或没有剂量依赖。一种编码“EXOX生物活性部分”的核酸片段可以从SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示的编码具有EXOX生物活性的多肽(EXOX蛋白生物活性在下面详述)的部分序列分离得到,表达EXOX蛋白被编码部分(如体内表达的重组子),评价EXOX蛋白被编码部分活性。
EXOX核酸和多肽的变异体
本发明进一步包括不同于SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示序列的核酸分子,其导致基因编码的兼并,这样同样的编码如SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示序列编码的EXOX蛋白。在另一实例中,一种本发明所述分离的核酸分子具有编码含有SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列多肽的核酸序列。除了SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示的真菌EXOX核酸序列外,核酸序列EXOX多肽的氨基酸序列存在于不同的种群中。上述EXOX基因的多样性可以存在于不同的由自然等位变异导致的真菌种类中。本发明中,术语“基因”和“重组基因”指的是含有编码EXOX蛋白开放阅读框(ORF)的核酸分子,优选的是一种真菌EXOX蛋白。上述自然等位变异可以是典型的在EXOX基因的核酸序列中发生1~5%的变异。所述任一和所有EXOX多肽的核酸变异和引起的氨基酸多样性都属于本发明范围,所述变异和多样性是自然等位变异的结果,不会改变EXOX多肽的功能、活性。
更进一步的是,其他种类中编码EXOX多肽的核酸分子,但具有与来自于真菌的SEQ IDNOs:2、5、8、11、14、17、20、23、26、29、32或34所示序列不同的核酸序列,也属于本发明范围。与本发明EXOX cDNAs同源和相对应的自然等位变异的核酸分子可以通过其与本发明所述真菌EXOX核酸序列同源,用真菌cDNAs或类似部分作为杂交探针通过标准的杂交技术在严格的杂交条件下分离得到。
同样的,在另一个实施方案中,一种本发明所述的分离核酸分子具有至少6个核苷酸,能够在严格条件与含有SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示序列的核酸分子杂交。
在另一个实施方案中,上述核酸至少具有10、25、50、100、250、500、750、1000、1500或2000核苷酸。在另一个实施方案中,本发明所述的分离核酸分子与编码区杂交。在本发明中,术语“在严格条件下杂交”描述的是在核酸序列彼此间至少有60%同源情况下进行杂交和清洗,核酸之间仍保持杂交状态。
同源或其他相关序列(如直系同源、侧系同源)可以通过用所有或部分所述真菌的特殊序列作为探针,用本领域常用的核酸杂交和克隆方法,在低的、温和或高的严格杂交条件下获得。
本发明所述术语“严格杂交条件”指的是探针、引物或寡核苷酸只与目标序列杂交,而不是其他序列。严格条件是序列依赖型,根据不同反应而不同。特别的,长序列的杂交温度比短序列杂交温度高。一般的,对于特别序列,其严格条件选择比热熔点(Tm)低5℃,在一定的离子强度和pH下。所述Tm是指(在一定的离子强度、pH和核酸浓度下)探针50%的与目标序列互补的序列和目标序列达到平衡的杂交状态时的温度。既然目标序列一般存在过度的,在Tm时,探针的50%序列在平衡状态时都被反应了。一般的,严格条件中的盐浓度小于约1.0M钠离子,一般为约0.01到1.0M钠离子(或其他盐),pH7.0~8.3,对于短的探针、引物或寡核苷酸(如10nt到50nt)温度至少约30℃,对于长的探针、引物或寡核苷酸温度至少约60℃。严格条件中还可以添加破坏DNA稳定的试剂,例如甲酰胺。
严格条件是本领域的技术人员熟知的,而且能在Ausubel等,Current Protocols inMolecular Biology,John Wiley & Sons,N.Y.(1989),6.3.1-6.3.6查到。优选的,在所述条件下,核酸序列相互之间至少约65%、70%、75%、85%、90%、98%或99%同源性的序列仍能相互杂交。非限定的严格杂交条件例子是在高的盐缓冲液,包括:6×SSC,50mMTris-HCl(pH7.5),lmM EDTA,0.02%PVP,0.02%Ficoll,0.02%BSA,和500mg/ml的变性鲑鱼精DNA,在65℃下杂交,随后在50℃下用0.2×SSC洗一次或多次。本发明所述的一种分离的核酸分子可以在严格条件下与SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示序列对应的自然-存在的核酸分子杂交。在本发明中,“自然-存在”核酸分子指的是自然存在的一种RNA或DNA分子(如编码一种天然的蛋白)。
在第二个实施方案中,本发明还提高一种在中度严格条件下与含有SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示序列的核酸分子或其片段、同功物或衍生物杂交的核酸分子。非限定的中度严格杂交条件例子是在6×SSC,5×denhardt’溶液,0.5%SDS和100mg/ml的变性鲑鱼精DNA,在55℃下杂交,随后在37℃下用1×SSC、0.1%SDS洗一次或多次。其他的中度严格杂交条件是本领域技术人员熟知的,如Ausubel等,1993,Current Protocols in Molecular Biology,John Wiley & Sons,N.Y.;Kriegler,1990,Gene transfer and Expression,A Laboratory Manual,Stockton出版,NY。
在第三个实施方案中,本发明还提高一种在低度严格条件下与含有SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示序列的核酸分子或其片段、同功物或衍生物杂交的核酸分子。非限定的中度严格杂交条件例子是在35%甲酰胺、5×SSC、50mMTris-HCl(pH7.5)、5mM EDTA、0.02%PVP、0.02%Ficoll、0.02%BSA、100mg/ml的变性鲑鱼精DNA和10%(w/v)葡聚糖硫酸盐,在40℃下杂交,随后在50℃下用2×SSC、25mMTris-HCl(pH7.4)、5mM EDTA和0.1%SDS洗一次或多次。其他的低度严格杂交条件是本领域技术人员熟知的(如种间杂交应用),参见如Ausubel等,1993,Current Protocolsin Molecular Biology,John Wiley & Sons,N.Y.;Kriegler,1990,Gene transfer andExpression,A Laboratory Manual,Stockton出版,NY;Shilo & Weinberg,Proc Natl AcadSci USA 78:6789-6792(1981)。
保守的突变
除了自然存在的EXOX序列的等位突变可以存在上述生物体中,本领域技术人员可以得出如下的改变,所述改变由SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示序列的核酸突变而来,从而导致编码的EXOX蛋白的氨基酸序列发生变化,但上述变化不会改变所述EXOX蛋白的功能活性。例如,导致在“非必需”氨基酸残基上替换氨基酸的核苷酸替换可以发生在SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示序列中。所述“非必需”氨基酸残基是指一种在EXOX蛋白序列中野生型序列中的不改变EXOX蛋白生物活性的氨基酸残基改变,而“必需“的氨基酸是指生物活性需要的基团。
本发明中,术语“生物活性”或“功能活性”指的是自然或一般的EXO蛋白具有的功能,例如,降解其他蛋白的能力。本发明所述的EXOX蛋白中的氨基酸残基可以通过特殊的non-amenable改变来预测。保守性的氨基酸替换是本领域技术人员熟知的。其中一项本领域技术人员熟知的技术是通过标准的技术,每一个核酸编码子(除了AUG,一般只对应甲硫氨酸)可以被修饰成功能一致的分子。进一步的,在一段编码序列中改变、增加或删除一个氨基酸或一小部分氨基酸(通常小于5%,更特别的是小于1%)的单独的替换、删除或增加的改变是“保守突变”,所述改变是化学性类似的氨基酸替换的结果。
本发明另一方面还涉及编码含有对于活性不是必需的氨基酸残基改变的EXOX蛋白的核酸分子。所述EXOX蛋白的氨基酸序列不同于SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示序列,但其仍有生物活性。在一个实施方案中,所述分离的核酸分子包括一种编码蛋白的核苷酸序列,所述蛋白的氨基酸序列至少与SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示序列有45%的同源性。优选的,所述核酸分子编码的蛋白的氨基酸序列至少与SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示序列有60%的同源性;更优选的是至少与SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示序列有70%的同源性;更进一步优选的是至少与SEQ IDNOs:3、6、9、12、15、18、21、24、27、30、33和35所示序列有80%的同源性;再优选的是至少与SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示序列有90%的同源性;最[xu5]优选的是至少与SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示序列有95%的同源性。
编码与含有SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示序列的蛋白同源的EXOX蛋白的分离的核酸分子可以在SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32或34所示核苷酸序列中通过一个或多个核苷酸替换、增加或删除得到,这样一个或多个的氨基酸替换、增加或删除被引入到所述的被编码的蛋白。
通过标准的技术可以在SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示序列引入突变,如点突变、PCR介导的突变和DNA移位。优选的,保守的氨基酸替换发生在一个或多个可预测的、非必需的氨基酸残基上。在人类DNA中单个碱基的替换是参见的。如果替换是发生在编码区,那么替换可能是保守或非保守替换。所述“保守的氨基酸替换”是具有类似特性的、与被替换的氨基酸具有类似的侧链结构新的氨基酸。非必需替换指的是具有不同特性的新的氨基酸。现有技术对具有类似侧链的氨基酸家族已有定义。氨基酸家族包括碱性侧链的(如赖氨酸、精氨酸、组氨酸)、酸性侧链的(如天冬氨酸、谷氨酸)、不带电的极性侧链的(如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链的(如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、蛋氨酸、色氨酸)、β-分支侧链的(如苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链的(如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,对于保守替换,在EXOX蛋白中预测为非必需的氨基酸残基可以被同一个侧链家族的另一个氨基酸替换。可选择的是,在另一个实施方案中,突变也可以被随机的引入到所有或部分EXOX编码序列中,如饱和突变,然后对产生的突变体筛选其EXOX生物活性,以鉴定出保持活性的突变体。SEQ IDNOs:3、6、9、12、15、18、21、24、27、30、33和35所示序列发生突变后,可对其编码蛋白进行重组表达和蛋白活性的测定。
氨基酸[xu6]家族的相关性也可以被侧链相互作用的基础决定。替换的氨基酸可以是保守“强”的残基或完全保守“弱”的残基。所述保守氨基酸残基的“强”的组包括以下组:STA、NEQK、NHQK、NDEQ、QHRK、MILV、MILF、HY、FYW,其中单个字母的氨基酸代号代表那些可以互相替换的氨基酸。另外,保守氨基酸残基的“强”的组包括以下组:CSA、ATV、SAG、STNK、STPA、SGND、SNDEQK、NDEQHK、NEQHRK、HFY,其中每组中的字母代表单个字母的氨基酸代号。
在一个实施方案中,突变的EXOX蛋白可以按以下方法检验:(i)形成蛋白的能力:和其他EXOX蛋白、其他细胞表面蛋白或生物活性类似物部分的相互作用;(ii)突变的EXOX蛋白与EXOX配体形成联合体形式;或(iii)突变的EXOX蛋白与细胞内的目标蛋白或生物活性类似物结合的能力(如抗生物素蛋白)。
在另一个实施方案中,突变的EXOX蛋白可以通过调控特殊的生物功能(如分解蛋白的能力)被检验。
EXOX多肽
本发明对应的多肽包括含有EXOX多肽具有的如SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的多肽。本发明还包括从SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示序列对应的残基发生变化的突变或变异的蛋白,所述蛋白的还具有EXOX蛋白的活性或生理功能,或其功能类似物片段。
一般地,保存了EXOX类似功能的EXOX变异体,包括序列中特殊位置的残基被其他氨基酸替换的任意的变异体,进一步还包括在原蛋白的两个基团中***一个或多个额外的氨基酸残基或在原蛋白中删除一个或多个氨基酸残基的可能性。任何的氨基酸替换、***或删除都属于本发明范围。在有利的条件下,所述替换如本文上面定义。
本发明另一发明还涉及分离的EXOX蛋白、其类似生物活性部分或衍生物、片段、异源体或类似同源体。生物活性[xu7]部分指的是EXOX蛋白中对于一般功能必需的部分,如氨肽酶活性。同时也提供多肽片段适合于用于培养抗EXOX抗体的免疫原。在一个实施方案中,天然的EXOX蛋白可以从细胞、组织或培养基用适当的蛋白提纯方法分离得到。在另一个实施方案中,EXOX蛋白可以通过重组DNA技术得到。EXOX蛋白或多肽还可以通过标准的肽合成技术,由化学法合成,而代替重组表达。
所述“分离的”或“纯化的”多肽、蛋白或其类似生物活性部分基本上不含来自EXOX蛋白来源的细胞或组织的细胞物质或其他杂质蛋白,或者用化学法合成时,基本上不含化学前体或其他化学物质。术语“基本上不含细胞物质”包括EXOX蛋白与细胞组分分开的EXOX蛋白的前体,其中细胞是用来分离或重组产生改蛋白的细胞。在一个实施方案中,术语“基本上不含细胞物质”包括含有少于约30%(按干重量)的非EXOX蛋白(这里也称为“杂质蛋白”)的EXOX蛋白前体,优选少于约20%的非EXOX蛋白的EXOX蛋白前体,更优选为少于约10%的非EXOX蛋白的EXOX蛋白前体,最优选为少于约5%的非EXOX蛋白的EXOX蛋白前体。当该EXOX蛋白或其类似生物活性部分是由重组方法产生时,还优选基本上不含培养基,即培养基的含量少于约20%,优选为少于约10%,更优选为少于约5%的EXOX蛋白前体。
术语“基本上不含化学前体或其他化学物质”是指蛋白与化学前体或其他化学物质分离的EXOX蛋白前体,其中的化学前体或其他化学物质参与了蛋白的合成。在一个实施方案中,术语“基本上不含化学前体或其他化学物质”包括含有少于约30%(按干重量)的化学前体或非EXOX化学物质的EXOX蛋白前体,优选少于约20%的学前体或非EXOX化学物质的EXOX蛋白前体,更优选为少于约10%的学前体或非EXOX化学物质的EXOX蛋白前体,最优选为少于约5%的学前体或非EXOX化学物质的EXOX蛋白前体。进一步的,“基本上不含化学前体或其他化学物质”还包括氧化副产物。本[xu8]领域技术人员都知道如何防止氧化反应,如将化学物质置于一个无氧的环境中。
EXOX蛋白的生物活性部分所包含的肽含有的氨基酸序列与EXOX蛋白的氨基酸序列有足够的同源性,或来源于EXOX蛋白的氨基酸序列(如SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示的氨基酸序列),它包含的氨基酸序列比全长的EXOX蛋白的少,并表现出EXOX蛋白的至少一种活性。通常,生物活性部分包含至少一种EXOX蛋白的活性结构域或片段。EXOX蛋白的生物活性部分可以是多肽,例如,它的长度为10、25、50、100或更多个氨基酸。
此外,其他蛋白区域缺失的其他生物活性部分可以通过重组技术得到,并用来评价EXOX蛋白的一种或多种功能活性。
在一个实施方案中,EXOX蛋白含有SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示的氨基酸序列。在其他实施方案中,EXOX蛋白基本上与SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35同源,并保留了SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35蛋白的变异功能活性,但其氨基酸序列有差别,其原因如下所详述的,是由于天然的等位基因变异或突变造成的。因此,在另一个实施方案中,EXOX蛋白是如以下所述的蛋白:含有与SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示的氨基酸序列至少约90%同源的氨基酸序列,并保留了SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35的EXOX蛋白的功能活性。本发明中,术语“生物活性”或“功能活性”指的是自然或一般的EXO蛋白具有的功能,例如,降解其他蛋白的能力。
两个或多个序列同源性的测定
为了测定两种氨基酸序列或两种核酸序列的同源性百分数,可将序列进行比对,用于最优比较目的(例如,在第一和第二氨基酸或核苷酸序列中之一,或两者中引入空位,用于最优比对,非相同的序列可考虑进行比较)。氨基酸残基、对应氨基酸位置的核苷酸或核苷酸位置可以比较。当第一序列的某个位置与第二序列相应相同位置具有相同氨基酸残基或核苷酸时,则此两个分子在该位置上具有同源性(这里所用的氨基酸或核酸“同源性”与氨基酸或核酸的“同一性”的意义是相同的)。
核酸序列的同源性可用两个序列间的同源程度衡量。本领域技术人员可以用计算机程序计算同源性,如GCG软件包的GAP程序,参见Needleman & Wunsch,J.Mol.Biol.48:443-453,1970。通过以下操作,利用GCG GAP程序来对比核酸序列:空位罚分5.0和空位拓展罚分0.3,对比的核酸序列的编码区按照上述参数,表现一定的至少70%,75%,80%,85%,90%,95%,98%,or 99%同源可能性,与SEQ ID NOs:2,5,8,11,14,17,20,23,26,29,32,和34所示的序列的CDS(编码)部分相比。
术语“序列同源”是指两个多聚核苷酸或多肽在对比的特定区内具有的残基对残基相同性的程度。术语“序列同源性的百分比”是通过以下方法计算得出:在整个对比区比较两个最佳配比的序列,在两个序列中具有的同样的核酸碱基(如A、T、C、G、U或I,核酸中的碱基)数目产生匹配位置的数目,除以匹配位置整个对比区的数目(如整个屏幕),然后将上述结果乘以100产生序列同源的百分比。这里所述术语“基本同源”表示多聚核苷酸序列的一种特征,其中多聚核苷酸包括与参考序列的对比区相比至少有80%序列同源,优选至少85%同源,更优选90~95%同源,最优选为有至少99%序列同源。嵌合和融合蛋白
本发明还提供EXOX嵌合或融合蛋白。这里所用的EXOX“嵌合蛋白”或“融合蛋白”包括与非EXOX多肽选择性连接的EXOX多肽。“EXOX多肽”是指含有相当于EXOX蛋白(SEQID NOs:3、6、9、12、15、18、21、24、27、30、33或35)氨基酸序列的多肽,而“非EXOX多肽”是指该多肽含有的氨基酸序列相当于与EXOX蛋白基本上不同源的多肽,例如与EXOX蛋白不同的蛋白,和来源于相同或不同组织的蛋白。在EXOX融合蛋白中,EXOX多肽可以相当于全部或部分的[xu9]EXOX蛋白。在一个实施方案中,EXOX融合蛋白含有EXOX蛋白的至少一个生物活性部分。在另一个实施方案中,EXOX融合蛋白含有EXOX蛋白的至少二个生物活性部分。在另一个实施方案中,EXOX融合蛋白含有EXOX蛋白的至少三个生物活性部分。在融合蛋白中,术语“选择性连接”是要表明EXOX蛋白和非EXOX蛋白彼此融合在同一开放读码序列中。非EXOX多肽可以融合到EXOX多肽的N端或C端。
在一个实施方案中,该融合蛋白是GST-EXOX融合蛋白,其中EXOX序列融合到GST序列的C端。这种融合蛋白可促进重组EXOX蛋白的纯化。
在另一个实施方案中,该融合蛋白是在N端含有异源信号序列的EXOX蛋白。在某些宿主细胞中(例如哺乳动物宿主细胞),通过使用异源信号序列可以提高EXOX的表达和/或分泌水平。
在另一个实施方案中,融合蛋白是一种EXOX-免疫球蛋白融合蛋白,其中EXOX基因与来自免疫球蛋白家族的一个基因融合。本发明所述的EXOX-免疫球蛋白融合蛋白可以作为药物组合物治疗抑制EXOX配体和EXOX蛋白在细胞表面上的结合的药物中的应用,这样抑制生物体内EXOX-介导的信号传导。EXOX-免疫球蛋白融合蛋白还可以用于影响EXOX相关的配体的生物利用度。对EXOX配体/EXOX相互作用的抑制在医疗上有用,可以针对治疗增殖和分化的紊乱,调节(如促进或抑制)细胞生长。进一步,本发明所述的EXOX-免疫球蛋白融合蛋白可以作为免疫原,在生物体内产生抗-EXOX抗体,用来纯化EXOX配体,和扫描分析验证抑制EXOX和EXOX配体相互作用的分子。
本发明所述的EXOX嵌合体或融合蛋白可以通过标准的重组DNA技术获得。例如,编码不同多肽序列的DNA片段通过常规的技术连接在一起,如为连接提供平头末端或粘性末端,用限制酶切提供合适的末端,添加合适的粘性末端,用碱磷酸化处理防止错配,最后酶连接。在另一个实施方案中,融合蛋白可以通过常规的技术合成获得,包括DNA自动合成。可供选择的,基因片段的PCR扩增运用锚引物,可以在两个连续的基因片段上产生互补的突出序列,这样可以顺序的将两个片段融合和扩增,产生一个嵌合体基因序列(参见Ausubel等(eds.)CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,John Wiley & Sons,1992)。进一步的,许多商业上可获得的表达***已编码了融合的一部分(如,GST多肽)。EXOX-编码的核酸可以克隆到上述表达载体中,这样EXOX蛋白与融合的一部分连接在一起。EXOX激动剂和拮抗剂
本发明还包括EXOX蛋白的变体,它可以起EXOX激动剂(模拟物)的功能,或起EXOX拮抗剂的功能。EXOX蛋白的变体可通过诱变产生(例如,EXOX蛋白的不连续点突变或截短)。EXOX蛋白的激动剂可使其基本上保留与天然存在形式的EXOX蛋白相同、或一部分的生物学活性。EXOX的拮抗剂可抑制天然存在的EXOX蛋白形式的一种或多种活性,例如,通过竞争性抑制细胞信号通道的上游或下游,其中包括EXOX蛋白酶。因此,用限定功能的变体治疗,可引起特定的生物学效应。在一个实施方案中,与用天然存在形式的EXOX蛋白治疗相比,用具有天然存在形式的EXOX蛋白的生物活性中的一部分的变体治疗,对受试者的副作用较少。
作为EXOX蛋白激动剂(模拟物),或EXOX蛋白拮抗剂的EXOX蛋白的变异体,可用下述方法鉴定:对EXOX蛋白的突变体(例如截短突变体的)组合文库,筛选其EXOX蛋白激动剂或拮抗剂活性。在一个实施方案中,多样化的EXOX突变体文库可通过在核酸水平上的组合诱变来产生,并由多样化的基因文库所编码。多样化的EXOX变体文库可以通过下述的方法产生,例如,将合成的寡核苷酸混合物用酶法连接成各种基因序列,从而使一组简并的潜在EXOX序列可以按单个多肽的形式表达,或者以包含一组EXOX序列的一组大融合蛋白(如噬菌体表达)的形式表达。由简并的寡核苷酸序列生产潜在EXOX变体的方法有很多种。可以在自动DNA合成仪中进行简并基因序列的化学合成,然后将合成的基因连接到适合的表达载体中。使用一组简并的基因,可以在一种混合物中提供全部编码所需要的一组潜在EXOX序列。合成简并的寡核苷酸的方法在本领域是已知的,参见例如,Narang,Tetrahedron(1983);Itakura等,Annu.Rev.Biochem.53:323(1984);Itakura等,Science 198:1056(1984);Ike等,Nucleic Acid Res.11:477(1983)。
多肽文库
此外,EXOX蛋白编码序列片段的文库可以用来产生多样化的一组EXOX片段,用于筛选和随后选择EXOX蛋白的变体。在一个实施方案中,产生编码序列片段的文库的方法如下:用核酸酶处理EXOX编码序列的双链PCR片段,处理的条件是使每个分子仅发生约一次切口,然后使双链DNA变性,再使DNA复性形成双链DNA,该DNA可以包括不同切口的产物的正义/反义对,用S1核酸酶处理重新形成的双链体,以除去单链部分,再将得到的片段文库连接到表达载体中。用这种方法可获得编码各种大小的EXOX蛋白的N端、C端和内部片段的表达文库。
已知在本领域有几种用于筛选通过点突变或截短制备的组合文库的基因产物,以及用于对cDNA文库筛选具有选择特性的基因产物的技术。这些技术适用于对EXOX蛋白组合诱变所产生的基因文库进行快速筛选。能进行高通量分析、使用最广的用于筛选大基因文库的技术通常包括:将基因文库克隆到可复制的表达载体中,用产生的载体文库转化适合的细胞,以及在某种条件下使组合的基因表达,在该表达条件下,通过对所需活性的检测,促进了分离出编码该被测产物基因的载体。Recrusive ensemble诱变(REM),是一种新的技术,它可提高文库中功能突变体的频度,可以结合筛选测定用于鉴别EXOX变体,参见例如,Arkin & Yourvan Proc.Natl.Acad.Sci.USA 89:7811-7815(1992);Delgrave等,蛋白Engineering 6:327-331(1993)。
文库也可以通过DNA重排产生。DNA重排采用来自不同种属或基因的相关基因,其在功能、片段上相关,通过重组使其重新组合。可以确认其中含有有用或潜在令人感兴趣的产物的重组基因。所有重组的基因相当于片段来说具有用途,可以重新组合形成新的重组基因。来自不同种属或基因的不同片段经过复性和延伸,在文库中形成多样性。筛选出一个令人感兴趣的蛋白的过程是合适的。利用DNA重排产生重组基因的重要因素包括复性时的温度、基因的相似性和DNA片段的大小。
Stemmer等(Nature 370:389-391(1994))、Stemmer(Proc.Natl.Acad.USA 91:10747-10751(1994))、美国专利No.5,603,793、No.5,830,721和No.5,811,238,在这里作为具体的参考文献,描述了如生物体外的蛋白重排方法,如诱变的重复循环、重排和选择,如同一系列的产生displayed多肽和抗体的方法,如同一系列通过DNA片段进行的DNA重新组配技术,以及它们生物体内外的诱变复制。进一步的,DNA重排技术的不同应用是本领域技术人员熟知的。除了上述引用的公开文献,美国专利No.5,837,458也提供了在递归的重排技术里新的代谢途径和生物产率的提高的进化,和Crameri等(Nature Medicine 2(1):100-103(1996))描述了抗体重排应用于抗体噬菌体文库。同时也可参考WO95/22625,WO97/20078,WO96/33207,WO97/33957,WO98/27230,WO97/35966,WO98/31837,WO98/13487,WO98/13485和WO989/42832。
表达载体
本发明的另一个方面是关于载体,优选表达载体,它含有编码EXOX蛋白、或衍生物、片段、同一物或其同源物的核酸。这里所用的术语“载体”是指一种核酸分子,它能转运与其连接的另一核酸。载体的一种类型是“质粒”,它是指可将另外的DNA片段连接在其中的环状双链DNA。另一种类型的载体是病毒载体,在该载体中,另外的DNA片段可与病毒的基因组连接。一些载体能够在其导入的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和游离型的哺乳动物的载体)。其他的载体(例如,非游离型的哺乳动物载体)是通过导入宿主细胞而整合到宿主细胞的基因组中,从而与宿主的基因组一起复制。此外,某些载体能指导与其选择性连接的基因的表达,这种载体在此称为“表达载体”。一般,重组DNA技术中使用的表达载体常常为质粒的形式。本说明书中,“质粒”和“载体”可以互换使用,因为质粒是最常用的一种载体形式。但是,本发明还包括其他形式的有同等功能的表达裁体,例如,病毒载体(例如复制缺陷逆转录病毒、腺病毒和腺伴随病毒)。
功能蛋白的产生与组织产生蛋白的细胞机器紧密相关。在选择表达***时,大肠杆菌是经典的“工厂”,因为它的基因组全部测得;组织容易处理;生长快;只需便宜容易制备的基质;分泌蛋白到基质中,从而有利于收集蛋白。但是,大肠杆菌是原核细胞,缺少细胞器,如真核具有的内质网和高尔基体,它们能够修饰产生的蛋白。许多真核蛋白可以在大肠杆菌中表达得到,但许多是没有功能的、无用的形式,因为糖基化或后转录修饰没有发生。
这样,研究者最近转向了真核酵母、哺乳动物核植物蛋白表达***。例如,在过去几年里嗜甲醇酵母P.pastoris成为了不同蛋白表达***中的有力的宿主,同时建立了一种选择性表达人类蛋白的高产量的真核宿主技术。
另一个例子,植物也被大量的蛋白表达***用作表达宿主,其提供了潜在的比经典的表达***更具有经济价值、可控和安全的优势[xu10]。最近,有系列的植物不同表达***出现,包括短期表达、植物细胞悬浮液培养、重组植物病毒和叶绿体转基因***。当在植物里表达的蛋白与哺乳动物有一些差异时,目前没有证据表明这些差异导致在病人身上产生不良反应。
另一个适合不同表达***利用了昆虫细胞,经常与杆状病毒表达载体结合。杆状病毒载体适用于在培养的昆虫细胞表达蛋白,例如,SF9细胞,包括pAc系列(Smith等,Mol.Cell.Biol.3:2156-2165(1983))和pVL系列(Lucklow和Summers,Virology170:31-39(1989))。
本发明的宿主细胞也可以用于生产除人以外的转基因动物,所述动物的基因组中已经转入了外源的序列。转基因动物是除人以外的动物,优选哺乳动物,更优选啮齿动物,如大鼠或小鼠,其中该动物的一个或多个细胞包含转移基因。其他转基因动物的例子包括除人以外的灵长类动物、绵羊、狗、牛、山羊、鸡、两栖类等。通过胚胎的操作和显微注射而产生转基因动物的方法,特别是对小鼠之类的动物,在本领域中已成为常规的方法,并在以下文献中有描述,例如:美国专利NOs.4,736,886、4,870,009和4,873,191;Hogan,1986.In:Manipulating the Mouse Embryo,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.)。类似的方法也用来生产其他的转基因动物。
Pichia pastoris表达***
真核酵母之一是嗜甲醇Pichia pastoris。P.pastoris已经被开发成一个产生外源蛋白合理的宿主,因它的乙醇氧化启动子被分离和克隆了。Pichiapastoris转录在1985年就已经有报道了。Pichia pastoris异源蛋白表达***由Phillips Petroleum发展,参见美国专利NOs.4,855,231,4,857,4674,879,231和4,929,555,本发明中全面引述上述专利。该***最近被体外标记。与其他真核表达***相比,Pichia具有很多优势,因为它没有细菌相关的内毒素问题,也没有动物细胞培养产生的蛋白中含有滤过性毒菌的问题。进一步的,P.pastoris可以在缺乏葡萄糖的情况下利用甲醇作为碳源。P.pastois表达***利用甲醇介导的乙醇氧化酶(AOX1)启动子,该启动子控制乙醇氧化酶的表达基因,该酶在甲醇代谢过程中第一个启动。上述启动子已研究清楚并整合到了一系列P.pastoris表达***中。由于P.pastoris产生的蛋白具有正常的结构并能分泌到胞外,基因工程P.pastoris发酵提供了一种很好的代替大肠杆菌表达***的选择。进一步的,P.pastoris还有超过大肠杆菌的优势:自发的对产生的蛋白糖基化。该表达***已制得了很多的蛋白,包括破伤风菌疫苗片段、Brodatella pertussis pertactin、人血清蛋白和溶菌酶。
EXOX蛋白标签去除
已经开发了不少***用来快速有效的纯化在细菌中表达的重组蛋白。其中大部分依赖与谷胱甘肽转移酶(GST)区域、钙结合多肽(CBP)组氨酸标签融合的蛋白表达。例如,结合谷胱甘肽转移酶(GST)的片段的多肽表达可以从细菌粗提取物中在不变性的条件下用谷胱甘肽凝胶亲和层析色谱法纯化。
进一步的,上述载体表达***一般引入特殊的蛋白酶水解位点,方便蛋白酶对细菌融合蛋白进行水解,载体引入的水解位点有凝血酶、肠激酶、或Xa蛋白因子。凝血酶专门对包含Leu-Val-Pro-Arg↓Gly-Ser(SEQ ID NO:44)序列的目标蛋白进行酶解。肠激酶的酶切位点是Asp-Asp-Asp-Asp-Lys↓(SEQ ID NO:45)。象肠激酶,Xa蛋白因子酶解位点在其结合序列Ile-Glu-Gly-Arg↓(SEQ ID NO:46)的C末端,这样就可以用来从适当设计结构中去除所有载体编码的序列。上述所有蛋白水解酶现在都可以在商业上获得高纯度的,以避免其包含的其他酶的二次降解。每个试剂盒都提供了所有的适合酶保存、利用在酶解基质中去除该酶的生物试剂等工具。最近Qiagen公司开发了一种TAGZyme***,能有效的去除从蛋白N末端的组氨酸标签,该蛋白包括能有序的从N末端到“停止点”氨基酸结构域分解双肽的外肽酶,包括↓Lys-Xaa、↓Arg-Xaa、↓Xaa-Xaa-Pro-Xaa-、↓Xaa-Pro-Xaa-Xaa-或↓Gln-Xaa。
尽管没有太大的必要去除一个纯化后的重组蛋白中短的组氨酸相似标签(不管组氨酸残基为多少),但在一些应用中需要去除组氨酸,如X射线晶体结构分析或NMR。同样的对于凝血酶酶切位点Gly-Ser残基或其他多余的N末端氨基酸残基也需要上述处理,其存在和所用表达***相关。
最近利用在羰基基团和具有两个相邻亲核基团的分子之间浓缩反应方法来纯化。例如具有两个相邻亲核基团的氨基酸包括丝氨酸、苏氨酸和半胱氨酸。纯化蛋白或多肽包括由如N末端半胱氨酸、苏氨酸或丝氨酸残基和树脂间形成可逆的共价的键,参见Villian等,Chem.& Biol.8:673-679(2001)。在重组蛋白的N末端增加一对残基,如Thr-Pro、Cys-Pro或Ser-Pro,或化学合成的蛋白或多肽,通过以下两个步骤纯化:(1)通过共价连接纯化;(2)去除二肽标签。该方法有效的回收重组蛋白的成熟形式,而没有二肽标签序列。
EXOX蛋白的逆蛋白水解活性
本发明的另一个方面是关于将一个或多个氨基酸接到另一个氨基酸、多肽、寡多肽、多聚肽或任意的可连接的二级胺化合物的方法,该方法是利用EXOX蛋白的逆蛋白水解活性。本发明中,术语“逆蛋白水解活性”是指能促进将一个或多个氨基酸接到另一个氨基酸、多肽、寡多肽、多聚肽或任意的可连接的二级胺化合物的酶活性。本技术领域一个公知的技术是在合适的热力学的条件下,蛋白水解酶具有逆蛋白水解活性。
其中一个蛋白水解酶具有逆蛋白水解活性的酶是胰蛋白酶,该酶是胰腺的丝氨酸酶,其专门针对带正电的赖氨酸和精氨酸侧链的底物。胰蛋白酶被广泛的应用于从猪胰岛素制备人胰岛素,其中猪胰岛素除了在B链最后一个氨基酸丙胺酸代替了人胰岛素的苏氨酸,其余类似。在胰蛋白酶存在下,将猪胰岛素与苏氨酸酯反应,通过去除其末端的丙氨酸后加上苏氨酸酯,形成人胰岛素苏氨酸酯。随后将人胰岛素苏氨酸酯用三氟醋酸水解该酯,从而形成人胰岛素。
在一些实施方案中,EXOX蛋白被用来促进逆蛋白水解活性。举些例子,将EXOX蛋白和一个多肽或一个或多个氨基酸在增加一个或多个氨基酸到多肽的环境里培育。
有很多利用本发明EXOX蛋白的逆蛋白水解活性的途径。例如,利用EXOX蛋白的逆蛋白水解活性合成多肽链。EXOX蛋白也可以作为一种连接工具,将一个或多个氨基酸接到另一个氨基酸、多肽或任意的可连接的二级胺化合物。
药物组合物
本发明的EXOX核酸分子、EXOX蛋白、抗EXOX抗体(这里亦称为活性化合物)和衍生物、片段、同一物和其同源物可以掺入适合于给药的药物组合物中。这种组合物通常含有核酸分子、蛋白、抗体,或调节化合物和可药用载体。这里所用的术语“可药用载体”是指包括一些和全部的与药物的给药相容的溶剂、分散介质、包衣、抗细菌和抗真菌剂、等渗剂和吸收延迟剂等适合于给药的载体。适合的载体在最新版的Remington’sPharmaceutical Sciences一书中有描述,该书是本领域标准的参考,也是本发明全面引述的。优选的载体或稀释剂包括但不限于水、盐溶液、Ringer’s溶液、葡萄糖溶液和5%人血清清蛋白。脂质体和无水赋形剂,如不挥发的油,也可以使用。这种介质和试剂用于药物活性物质中在本领域来说是众所周知的。迄今为止除了任何常规使用的介质或试剂与活性化合物不相容以外,上述介质和试剂在组合物中的使用是经过仔细考虑的。补充的活性化合物也可掺入组合物中。
封装技术已广泛应用于许多工业领域中。例子包括控释药剂、食品和饮料中的色料、食品中抗氧化剂、农业中控释外激素。胶囊、微胶囊和微球是小球体微粒,活性成分包含在微粒混合物中或附着在微粒表面。例如,封装在生物可降解的藻酸盐微粒里。生物封装技术趋向于封装细胞、酶和生物活性材料。
本发明的药物组合物配制成与其给药途径相容的形式。给药途径的例子包括非肠道的给药,例如静脉内、真皮内、皮下的、口服的(例如吸入)、经皮的(局部的)、经粘膜的,和直肠的给药。用于非肠、真皮内、或皮下应用的溶液或悬浮液可以包括以下组分:无菌的稀释剂,例如注射用水、盐溶液、不挥发油类、聚乙二醇、甘油、丙二醇或其他合成的溶剂;抗细菌剂,例如苯甲醇或对羟基苯甲酸甲酯;抗氧化剂,例如抗坏血酸或二亚硫酸钠;螯合剂,如乙二胺四乙酸(EDTA);缓冲液,例如乙酸盐、柠檬酸盐或磷酸盐缓冲液和调节渗透压的试剂,例如氯化钠或葡萄糖。pH可用酸或碱调节,例如盐酸或氢氧化钠。非肠道制剂可以密封入安瓿、一次性注射器或由玻璃或塑料制成的多剂量的小瓶中。
适用于可注射用的药物组合物包括无菌的含水溶液(水可溶的情况)或分散液,或者,对临时配制的无菌可注射溶液或分散液的制剂来说,包括无菌的粉末。对于静脉内给药,合适的载体包括生理盐水、抑菌水、Cremophor ELTM(BASF,Parsippany,N.J.)或磷酸盐缓冲液(PBS)。在所有场合,该组合物必须是无菌的,并应是流动的,其流动性应达到易于注射的程度。在生产和储存的条件下,该组合物必须是稳定的,并且必须能抗微生物,如细菌和真菌的污染作用而能保存。该载体可以是溶剂或含有,举例来说,水、乙醇、多元醇(例如,甘油、丙二醇和液体聚乙烯醇等),及其它合适的混合物的分散介质。适当的流动性可通过以下方法保持:例如,使用包衣,如卵磷酯;在分散体的场合,保持所要求的颗粒大小;以及使用表面活性剂。微生物作用的预防可通过各种抗细菌剂和抗真菌剂而达到,例如对羟基苯甲酸酯、氯丁醇、酚、抗坏血酸、工汞硫代水杨酸钠等。在很多场合,组合物中最好包括等渗剂,例如蔗糖、多元醇,如甘露醇、山梨醇、氮化钠。在组合物中包括延迟吸收的试剂,例如单硬脂酸酯铝和明胶,可达到使注射组合物延长吸收的目的。
无菌的注射溶液的制备方法如下:将活性化合物(例如,EXOX蛋白或抗mGluR5M抗体)按所要求的量掺入适当溶剂中,该溶剂含有以上列举的组分中的一种或其组合,然后,按照要求通过无菌过滤。一般,分散剂的制备方法是,将活性化合物掺入无菌载体中,该载体含有基本的分散介质和选自以上列举组分中的其他必须组分。对于用于制备无菌注射溶液的无菌粉末,优选的制备方法是真空干燥和冷冻干燥,该方法由预先经过无菌过滤的溶液生成含活性组分和其它所需组分的粉末。
从红色毛癣菌或产生EXOX或从红色毛癣菌分离的EXOX的转基因真菌的培养基质中分离得到的粗提物可以用于口服给药,因为蛋白酶是胞外的。口服组合物一般包括惰性稀释剂或可食的载体.口服组合物可以封装在明胶胶囊内,或压成片。用于口服治疗给药时,活性化合物中可掺入赋形剂,并以片剂、锭剂或胶囊的形式使用。口服组合物也可以用流体载体来制备,以便用作嗽口剂,其中在流体载体中的化合物,被经口施用并涮洗和吐出,或吞下。药物相容的粘结剂,和/或佐剂物质也可作为组合物的一部分包括在内。片剂、丸剂、胶囊、锭剂等可以含有下列的任一种组分,或类似性质的化合物:粘结剂,例如微晶纤维素、黄蓍胶或明胶;赋形剂,例如淀粉或乳糖;崩解剂,例如藻朊酸、Primogel或玉米淀粉;润滑剂,例如硬脂酸镁或Sterotes;滑动剂,例如胶体的二氧化硅;甜味剂,例如蔗糖或糖精;或调味剂,例如薄荷、水杨酸甲酯或橙味调料。
用于吸入给药时,组合物可以用气溶胶喷雾的形式由压力容器或分配器,或者喷雾器来递送,压力容器或分配器含有合适的推进剂,例如,二氧化碳气体。
全身的给药也可通过经粘膜或经皮给药的方法。对于经粘膜或经皮给药,在该制剂使用适合于需要透过屏障的渗透剂。这种渗透剂在本领域中通常是熟知的,例如,对于经粘膜给药,包括清洁剂、胆盐,和梭链孢酸衍生物。经粘膜给药也可以通过使用鼻的喷雾剂或栓剂来完成。对于经皮给药,如本领域通常所知,可将活性化合物配制在软膏、油膏、凝胶或霜剂中。
该化合物也可以制成栓剂(例如,用常规的栓剂基,如可可酯和其他甘油酯)或保留灌肠的形式,用于直肠递送。
在一个实施方案中,活性化合物采用能防止该化合物从人体迅速消除的载体来制备,例如控释制剂,包括植入物和微胶囊化传递***.生物可降解的、生物相容的聚合物也可以使用,例如乙酸乙烯酯、聚酐、聚乙醇酸、胶原、聚原酸酯和聚乳酸.制备这种制剂的方法对本领的技术人员来说是显而易见的。上述的材料也可从市场上由Alza公司和Nova制药公司获得。脂质体悬浮液(包括用病毒抗原单克隆抗体导向受感染细胞的脂质体)也可以用作可药用载体。这些载体可以按照本领域技术人员熟知的方法制备,举例来说,如美国专利NO.4,522,811中所述。
尤其有利的是,按剂量单位形式来配制口服或非肠道给药的组合物,以便于给药和有利于剂量的统一。这里所用的剂量单位形式是指以单元剂量适用于治疗受试者的、物理形式上分开的单位;每单位含有预定量的活性化合物,该量计算为能与所需药用载体结合产生所需疗效的量。本发明的剂量单位形式的规格根据以下方面而定,或直接依赖于以下方面:活性化合物的特性和要达到的疗效,以及在合成这种用于治疗个体的活性化合物的技术本身存在的限制。
本发明的核酸分子也可以***载体中并用作基因治疗载体。基因治疗载体可以递送给治疗受试者,例如,通过静脉内注射、局部给药(参见美国专利5,328,470)或通过立体定位注射(参见,例如chen等(1994)PNAS 91:3054-3057)。基因治疗载体的药物制剂可包括可接受的稀释剂中的基因治疗裁体,或可包括包埋了基因递送载体的缓释基质。或者,在完整的基因递送载体可以由重组细胞,例如逆转录病毒载体完整地产生的场合,该药物制剂可以包括一种或多种产生基因递送***的细胞。
上述药物组合物可以连同给药说明一起包含在容器、小盒或喷雾器内。
具体实施方式
实施例1:材料与方法
菌株和质粒
本研究使用的是红色毛癣菌的一个临床分离株CHUV 862-00。用大肠杆菌(E.coli)LE392来繁殖噬菌体λEMBL3(Promega,Wallisellen,Switzerland)。所有的质粒-亚克隆实验使用质粒pMTL2I在大肠杆菌DH5α中进行(Chambers等,Gene 68:139-149(1988))。使用P.pastoris GSI15和表达载体pKJ 113(Borg-Von Zepelin et al,Mol.Microbiol28:543-554(1998))来表达重组肽酶。众所周知,在本领域P.pastoris可以被用来表达大量的重组蛋白。
红色毛癣菌生长培养基
红色毛癣菌在Sabouraud琼脂糖或液体培养基(Bio-Rad,Munchen,Germany)上生长,或为了提高产物的蛋白水解活性,在含有0.2%大豆蛋白(Supro 1711,Protein TechnologyInternational,St.Lauise.MO)作为唯一氮源和碳源的液体培养基中培养。这种培养基中不添加盐。那些本领域的技术人员熟知的盐也可以添加到生长培养基。100ml的液体培养基和少量新鲜生长菌丝一起在800ml组织培养瓶中孵育。培养物在30℃下无须震荡培养10天。
基因组和cDNA文库
从新鲜的生长旺盛的菌丝中分离DNA用于构建红色毛癣菌的基因组DNA文库(Yeltonet al.PNAS 81:1470-1474(1984))。用Sau3A部分消化DNA,从低溶点琼脂糖凝胶中回收12~20kb的DNA片段。使用一个合适的克隆体系(Promega),将这些DNA片段***到噬菌体XEMBL3中。
使用一种微量mRNA***和500ug总RNA,一个红色毛癣菌的cDNA文库被制备,cDNA被***进pSPORT6质粒中(Invitrogen Life Technologies;Rockville,Maryland,USA)。从大豆蛋白液体培养基的10天培养物(10×100毫升)中制备RNA。用研钵在液氮中将菌丝研磨成细的粉末,用专供植物和真菌的RNeasy总RNA纯化试剂盒(Qiagen,Basel,Switzerland)分离总RNA。
以前已经用CHUVI 92-88菌株构建了一个烟曲霉菌的cDNA文库,该烟曲霉菌菌株在含0.2%胶原蛋白作为唯一氮源和碳源的液体培养基中,在30℃的条件下生长40小时(Monod等,1991)。总RNA依照Applegate和Monod描述的方法提取,依据标准程序(Sambrook等,1989)用oligo(dT)纤维素膜(Sigma,Buchs,Switzerland)纯化获得mRNA。按照制造商提供的程序,用λ噬菌体gtl1(Promega)和这些mRNA制备一个文库。
表13.编码氨肽酶的红色毛癣菌和烟曲霉菌的基因
  基因   基因组DNA(bp.从ATG到终止密码子)   cDNA:ORF长度(bp.)自ATG密码子开始  自ATG密码子开始编码的氨基酸残基(aa)   内含子(bp.自ATG密码子开始的基因组DNA)
  ruLAP2   1757   1488   495   3个内含子(bp 106-231;556-632;917-982)4个内含子,编码35,108,95,257aa
  fuLAP2   1557   1497   498   1个内含子(bp 85-144)2个内含子编码28,470aa
  ruLAP1   1256   1122   373   2个内含子(bp157-226;968-1031)3个内含子编码52,247,74aa
  fuLAP1   1298   1167   388   2个内含子(bp 187-252;1000-1064)3个内含子编码62,249,77aa
LAP基因的克隆
基因组文库的重组噬菌斑(104)被转移到GeneScreen尼龙膜上(NEN Life ScienceProducts,Boston,MA)。在低严格条件条件下,用32P标记的探针对这些膜进行杂交(Monod等,Mol.Microbiol.13:357-368(1994))。采用Grossberger描述的方法,所有的阳性噬菌斑被纯化并提取相应的噬菌体DNA(Grossberger,Nucleic Acid Res.15:6737(1987))。按照标准程序,源自EMBL3噬菌体的杂交筛选到的片段被亚克隆进pMTL 2I中。用Microsynth(Balgach,Switzerland)进行核酸测序。
用标准PCR方法分离cDNA
制备cDNA文库中106个克隆的DNA,用PCR方法获得红色毛癣菌和烟曲霉菌的cDNA。根据源自不同肽酶基因(表13)的DNA序列设计的同源引物,在标准条件下进行PCR。200ngDNA、10ul正义和反义寡核苷酸引物(浓度为42mM)、8ul的脱氧核苷酸混合物(每种dNTP为10mM),溶于100ul PCR缓冲液中(10mM Tris-HCl pH8.3;50mm KCl;1.5Mm MgCL2)。每个反应体系加入2.5单位AmpliTAQ DNA聚合酶(PE.,Zurich,Switzerland)。PCR反应程序为:反应混合物先在94℃温育5分钟,接着25个循环(94℃0.5分钟,55℃0.5分钟,72℃0.5分钟),最后72℃保温10分钟。
重组LAPs的制备
通过将克隆cDNA的PCR产物连进E.coli-P.pastoris穿梭载体pKJ 113的多克隆位点,构建表达质粒。用PCR纯化试剂盒(ROCHE Diagnostics)纯化PCR产物,用先前设计的5’-引物(表14)上的限制性内切酶来消化。用10pg经EcoR I或Sma I线性化的质粒DNA电激转化P.pastoris GSI 15(Invitrogen)在组氨酸缺陷型培养基(1M山梨糖,1%(W/V)葡萄糖,1.34%(W/V)不含氨基酸酵母YNB,4×10-5%(W/V)生物素,5×10-3%氨基酸(W/V)(例如L-谷氨酸,L-甲硫氨酸,L-亮氨酸,L-异亮氨酸各5×10-3%),2%(W/V)琼脂糖)选择转化株,用最小的甲醇平板(1.34%(W/V)不含氨基酸的YNB、4×10-5%(W/V)生物素、0.5%(V/V)甲醇、2%(W/V)琼脂糖)筛选***到AOX1位点的结构中。转化株不能在含有甲醇作为唯一氮源的培养基上生长,经过在AOX1位点取代AOX1编码区域的整合事件,保证了在正确的酵母基因组位置包含上述结构。这些转化株在10ml甘油酵母培养基(0.1M磷酸钾缓冲液,pH6.0,包括1%(W/V)酵母提取物、2%(W/V)蛋白胨、1.34%(W/V)不含氨基酸的YNB,1%(V/V)甘油和4×1%(W/V)生物素)中,在30℃下,生长至接近饱和(600nm下OD 20)。收集细胞、将其重新悬浮于2ml培养基中,(除了用0.5%(V/V)甲醇取代甘油外,其他都相同)孵育2天。两天后,收集上清液,用SDS-PAGE胶检测蛋白产物。从400ml细胞培养物的上清液中获得大量重组肽酶。
                        表14.描述了在P.pastoris中表达不同LAP所用的材料
 基因   寡核苷酸   方向   编码的氨基酸序列*   PCR产物(含克隆位点)   载体
 ruLAP2   GT TG/T CGA CTT GTT GGT CAA GAG CCC TTC GGA TGG(SEQID NO:47)CT TGC/GGC CGC TTA CAT GAA GAC AGT GTG GTG TCC(SEQID NO:48)   正向反向  (R)(L)VGQEPFGW(SEQ ID NO:63)GHHTVFMStop(SEQ ID NO:64)   ruLAP2(58-1485)SalI---NotI   pKJ113XhoI---NotI
 fuLAP2   GT TC/T CGA GGC CCA GGA TGG GAC TGG AAG(SEQ ID NO:49)CGC AAA GG/T GCA CTC GCC CCG CGA(SEQ ID NO:50)TCG CGG GGC GAG/TGC ACC TTT GCG(SEQ ID NO:51)CTT A/GA TCT CTA CTG CTC AAC CCG GTC CTT(SEQ ID NO:52)   正向反向正向反向  (R)GPGWDWK(SEQ ID NO:65)SRGECTFA(SEQ ID NO:66)SRGECTFA(SEQ ID NO:67)KDRVEQStop(SEQ ID NO:68)   fuLAP2a(49-460)XhoI---ApaLlfuLAP2b(461-1494)ApaLl---BglII   pKJ113XhoI---BamHI
 ruLAP1   GT TC/T CGA GGC ATT CCT GTT GAT GCC CGG GCC G(SEQID NO:53)CTT A/GA TCT TTA CTT AGC AAG CTC AGT GAC GAA GCCGAC(SEQ ID NO:54)   正向反向  (R)(G)IPVDARA(SEQ ID NO:69)VGFVTELAKsToP(SEQ ID NO:70)   ruLAPI(61-1119)XTtoI---BglII   pKJ113XhoI---BamHI
 fuLAP1   GT TC/T CGA GGG GCT GTA GCT GCA GTG ATT(SEQ ID NO:55)CTT A/GA TCT TTA AAA CGG CGC AAA TGC CAA(SEQ ID NO:56)   正向反向  (R)GAVAAVI(SEQ ID NO:71)LAFAPFsToP(SEQ ID NO:72)   fuLAPI(46-1164)XhoI---BglII   pKJ113XhoI---BamHI
 RuDPPIV§   CT TC/T CGA GTC GTT CCT CCT CGT GAG CCC CG(SEQ IDNO:57)G TTC CAT GGT/CAT GAC CTT TGT GTC ATA CGA GAC AG(SEQ ID NO:58)GT TCC ATG GT/C ATG ACC CCT CTC GTC AAC GAT AAG G(SEQ ID NO:59)CTT G/GA TCC TCA TTC CTC TGC CCT CTC ACC(SEQ IDNO:60)   正向反向正向反向  (R)(V)VPPREPR(SEQ ID NO:73)VSYDTKVM(SEQ ID NO:74)VMTPLVNDK(SEQ ID NO:75)GERAEEstop(SEQ ID NO:76)   ruDPPIVa(49-1266)XhoI---RcaIruDPPIZb(1267-2325)RcaI---BamHI   PKJ111XhoI---BamHI
 ruDPPV   CCG G/AA TTC TTT ACC CCA GAG GAC TTC(SEQ ID NO:61)GAG T/CT AGA CTA GTA GTC GAA GTA AGA GTG(SEQ ID NO:62)   正向反向  (E)(F)FTPEDF(SEQ ID NO:77)HSYFDYStop(SEQ ID NO:78)   ruDPPV(58-2178)EcoRI---XbaI   pPICZaAEcoRI---XbaI
****语表示限制位点序列编码的氨基酸,并被重组酶加上了N末端点。
***语的数字表示在LAP和DPPcDNAs中存在的核苷酸位置。
§fuLAP2和ruDPPIV PCR片段与E.coli-P.pastoris穿梭载体首尾相连。
重组LAP的纯化
使用Amicon cell和Ultracel Amicon YM30膜(30kDa为分离点)(Millipore,Volketswil,Switzerland)用超滤的方法浓缩400ml P.pastoris培养物上清液中的分泌蛋白。先用50mM pH7.5的Tris-HCl洗浓缩物,用相同的缓冲液平衡Mono Q-Sepharose柱(Amersham Pharmacia,Switzerland)。用50mM pH7.5的Tris-HCl洗脱后,用0-0.5M线性梯度的NaCl以1ml/min的流速洗脱。从Mono Q-Sepharose柱洗下的不同组分被用于酶活性筛选。用亮氨酸-7-氨基-4-甲基香豆素(Leu-AMC)作为底物。含有LAP的组分被汇聚在一起。用含有Ultracel Amincon YM30膜的超滤Amicon cell浓缩后,用20ml pH6.0的Tris-HCl洗脱,LAP提取物上样到排阻的superose 6 FPLP(Amersham Pharmacia),用20ml Tris-HCl pH6.0的作为洗脱液以0.2ml/min的流速淋洗。收集洗脱下来的活性组分。在做进一步的功能确认之前,在4℃条件下,用30kDa的分离点(Millipore)的Centricon浓缩器浓缩LAP酶至终体积0.4-1.0ml。
在一个替代的纯化方案中,每一步纯化都在4℃下操作。将400ml P.pastoris培养物上清液中的分泌蛋白用Amicon cell和Ultracel Amicon YM30膜(30kDa的分离点)(Millipore,Volketswil,Switzerland)超滤的方法浓缩。用100ml 20mM pH6.0的醋酸钾洗浓缩物,用相同的缓冲液平衡Mono Q-Sepharose柱(Amersham Pharmacia,Switzerland)。用20mM pH6.0的Tris-HCl缓冲液洗脱柱子后,用0-0.2M线性梯度的NaCl以1ml/min流速,以超过142分钟时间洗脱酶。从Mono Q-Sepharose柱上洗脱下的不同组分用Leu-AMC作为底物来筛选酶活性,含有LAP的组分被汇集在了一起。在带有ultracelAmicon YM30膜的Amicon cell超滤浓缩后,用PBS缓冲液洗脱。LAP提取物被上样到一个排除大小的superdex 200 FPLC柱(Amersham Pharmacia)。用20mM pH6.0的醋酸钠缓冲液以0.2ml/min的流速洗脱。洗脱得到的有活性的片段被收集到一起。在4℃下在30kDa分离点的Centricon浓缩器中将LAP浓缩至0.4-1.0ml以供进一步的特征分析。
在Mono Q中含有ruLAP2活性的组分洗脱在30-40分钟(大约50mM NaCl),在Superdox200中是在65-70分钟(峰3)。然而,在用1M NaCl洗脱时,大量LAP2活性没有保留下来。因此,这个组分在用20mM醋酸钠脱盐后样品被加到相同的MonoQ柱,用更宽的浓度范围(0-1M)的NaCl以0.5/min的速度洗脱超过142分钟。第一个活性峰出现在洗脱7-15分钟时和70-140nM NaCl对应,第二个峰出现在150-250mM NaCl洗脱时(具有更强的酶活性)。在Superdex上,洗脱78-80分钟70-140mM NcCl的组分和它上面提到的峰一起被收集。在Superdex上,150-250mM NaCl的组分提供了两个有活性的洗脱组分,分别在44-49分钟(峰1)和50-63分钟(峰2)。
蛋白质提取分析
使用12%聚丙烯酰胺分离胶,采用SDS-PAGE方法分析蛋白质提取物。用考马斯亮蓝R-250(Bio-Rad)对胶进行染色。N-糖苷酶F的消化按先前描述的方法进行(Doumas et al.,Appl.Environ.Microbiol.64:4809-4815(1998)
Western杂交
膜先用红-丽春红染色,用针标记出主要蛋白带的位置。用兔抗血清和碱性磷酸酶耦联的山羊抗-兔IgG(Bio-Rad)或结合有过氧化物酶的山羊抗-兔IgG(Amersham Pharmacia,Switzerland)作为二次标记抗体。针对ruLAP1、ruLAP2、fungalysin家族的A.Oryzae分泌的碱性磷酸酶(ALP)和A.oryzae分泌的中性蛋白酶(NPI)的兔抗血清由Eurogentec(Liege,Belgium)用纯化的重组酶制造。
氨肽酶活性检测
用不同多肽的aminoacl-4-methylcoumaryl-7-amide荧光衍生物来确定氨肽酶活性,在内部淬灭Lys(Abz)-pro-pro-Pna荧光底物特异性确定氨肽酶P的活性(Stockel et al,Adv Exp.Med.Biol.421:31-35(1997)。所有的底物都购自Bachem(Bubendorf,Switzerland)。根据制造商的建议,底物被制备为0.1M贮存液,在-20℃保存。反应混合物包括:在25ul 50mH缓冲液中包含浓度为5mM的底物和酶制备物(根据每种酶对底物的水解活性,每次检测的用量在56-2662ng),调节pH值到每种LAP的最适值。37℃温育60分钟后,加入5ul冰醋酸中止反应,用3.5ml稀释反应混合物。用荧光光度计(Spectrofluorophotometer)(PE,LS-5 fluorometer)检测释放的AMC,激发光波长370nm,发射波长460nm。根据用合成的AMC作的标准曲线被用来估计释放的AMC的量。在310nm激发光和410nm发射光下,测定释放的diprolyl-p-nitrinanilide。LA活性以释放的AMC的nmol数或pNA/分钟/ug蛋白来表示。
                                       表15
  底物   ruLAP2   fuLAP2   ruLAP1   fuLAP1   pkLAP
  Leu-AMC   100.0   100.0   100.0   100.0   100.0
  IlE-AMC   6.4   1.8   7.4   13.2   6.3
  Val-AMC   4.8   0.8   4.9   27.6   4.0
  Ala-AMC   33.3   11.7   5.2   4.7   584.7
  Gly-AMC   3.3   2.2   5.1   0.8   74.8
  Ser-AMC   26.1   10.3   5.9   10.3   24.6
  Thr-AMC   0.9   0.1   1.7   5.1   4.4
  Cys-AMC   14.9   2.1   18.5   5.0   35.5
  Met-AMC   119.7   89.5   41.3   116.9   46.1
  Asn-AMC   114.6   73.5   6.8   29.4   33.9
  Gln-AMC   49.9   37.0   2.3   44.9   50.7
  Asp-AMC   3.8   0.3   0.0   0.8   0.9
  Glu-AMC   3.7   1.1   0.0   0.0   4.7
  Lys-AMC   4.6   2.3   9.1   7.7   70.1
  Arg-AMC   1.9   2.3   12.3   53.9   174.8
  His-AMC   0.6   1.9   0.1   0.8   17.6
  Phe-AMC   17.1   8.9   4.6   163.7   184.4
  Pro-AMC   21.4   7.4   1.4   12.0   7.9
  Hyp-AMC   14.2   13.3   0.3   3.9   1.7
  Gly-Pro-AMC   7.2   74.1   0.0   5.4   16.7
  Pyr-AMC   0.0   0.0   0.0   0.0   0.0
  Lys(Abz)Pro-PropNA   0.0   0.0   0.0   0.0   0.0
各种化学试剂对LAP的影响
抑制剂和金属阳离子在37℃下和酶提前温育15分钟,然后,加入终浓度为5mM的Leu-AMC。再温育60分钟后,依前面描述的方法测定酶活性。试验纯化的LAP的抑制剂和它们的浓度分别是:500ul amastatin(Bachem)、40um苯甲脒(Sigma)、500ul bestatin(Bachem)、100um E-64(L-trans-epoxysuccinyl-leu-4-guanidinobutylamide)(Bachem)、100um leupeptin(Sigma)、40um PMSF(Sigma)、20um TLCK(RocheDiagnostics)和20um TPCK(Roche Diagnostics)。0.5mM和1mM的CaCl2、MgCl2、CoCl2、ZnCl2、NiCl2和CuCl2被用于试验。
表16详细的描述了不同蛋白酶抑制剂存在下不同的EXOXs水解活性,以Leu-MCA作为LAP的底物。活性以其与没有抑制剂时的活性百分比来表示。
                                       表16
  抑制剂   ruLAP2   fuLAP2   ruLAP1   fuLAP1   pkLAP
  乙二胺四乙酸5mM   5   50   0   16   99
  乙二胺四乙酸1mM   7   77   7   19   68
  邻二氮杂菲5mM   0   0   0   0   0
  邻二氮杂菲1mM   0   0   0   0   0
  抑氨肽酶B500Pu   55   88   0   11   24
  抑氨肽酶肽500M   0   0   0   17   0
  对氯汞苯甲酸500M   21   96   32   90   59
  E64 100uM   34   71   103   190   93
  亮抑酶肽100M   113   61   233   149   86
  胃酶抑素100M   45   73   160   14   64
  苯甲基磺酰40uM   79   84   78   156   58
  苯甲脒40M   89   91   85   77   75
  甲苯磺酰-左旋赖氨酸-氯甲基酮盐酸盐20M   96   120   68   80   113
  甲苯磺酰苯丙氨酰氯甲酮20M   79   87   68   95   108
表17详细的描述了不同阳离子存在下不同的EXOXs水解活性,以Leu-MCA作为LAP的底物。活性以其与没有抑制剂时的活性百分比来表示。
                                    表17
  ruLAP2   fuLAP2   ruLAP1   fuLAP1   pkLAP
  CaCl2  0.5mM   126.6   110.0   151.7   54.9   177.4
  CaCl2  1mM   141.9   165.4   175.6   43.3   161.8
  MgCl2  0.5mM   121.2   97.6   129.9   68.5   130.1
  MgCl2  1mM   110.2   108.0   132.6   72.6   146.1
  MnCl2  0.5mM   77.5   84.3   120.7   25.9   157.6
  MnCl2  1mM   86.8   140.2   105.2   28.4   165.8
  CoCl2  0.5mM   591.2   378.0   210.2   104.3   876.1
  CoCl2  1mM   789.7   662.7   202.1   96.5   899.8
  ZnCl2  0.5mM   77.9   51.4   43.0   60.7   437.6
  ZnCl2  1mM   88.9   119.5   68.9   53.2   297.9
  NiCl2  0.5mM   130.5   98.4   74.8   51.7   1187.7
  NiCl2  1mM   147.9   149.3   58.1   37.2   1158.7
  CuCl2  0.5mM   50.9   68.9   40.1   25.8   1422.0
  CuCl2  1mM   34.7   73.6   13.7   17.0   1092.4
EXOX活性的最适pH值
采用Ellis和Morrison缓冲***来确定酶活性的最适pH值(Ellis & Morrison,Methods Enzymol.87:405-426(1982))。缓冲液中含有具有不同pKa值的三种成分,在试验的整个pH值范围内,缓冲液的离子强度保持恒定。缓冲液的pH值可以用1M HCl或1M NaOH以半个pH值单位在6到11的范围内进行调节。基于Leu-AMC底物的活性检测条件,除了Tris/HCl缓冲液被一定pH值的Ellis和Morrison缓冲液取代以外,其他条件和前面描述的一样。
表18.祥述了内源和重组的红色毛癣菌和烟曲霉菌氨肽酶的特征
表18
  基因   基因长度(nt)   内含子数   蛋白前体(aa)   信号(aa)   成熟结构域(aa)   成熟酶多肽链的分子量(kDa)   内源/重组酶的分子量(kDa)   去糖基化后重组酶的分子量(kDa)   可能的糖基化位点的数目   经计算的pI值   重组蛋白的产率(ug/ml)*   GenBank序列号
  ruLAP1fuLAPlruLAP2fuLAP2ruDPPIV   12561298175715572326   22310   373388495498775   1917181515   354371477383760   38,80441,46551,48752,27086,610   31-33/38-40§NI/4058/58-65§NI/75-10090/90   38-4040525284   33464   6.39(6.23)5.67(5.67)7.32(6.94)5.57(5.46)(8.05)   40804010010   AY496930AY436356AY496929AY436357AY497021
§NI:表示未决定
*括号中数字对应不含前序列的全长多肽
EXOX活性的最适温度
每份LAP和Leu-AMC(5mM)在20、30、40、50、60、70和80℃的条件下分别孵育10、30和60分钟,通过测试酶活性和它们最适的pH来确定最适的温度条件。
蛋白水解检验
使用resorufin标记的酪蛋白在磷酸缓冲液(20mM,pH7.4)中测定蛋白水解活性。反应混合物总体积约0.5ml,其中包含0.002%的底物。37℃温育后,加入三氯乙酸(终浓度为4%)沉淀未被消化的底物,通过离心分离上清液。加入500ul Tris缓冲液(500mM,pH9.4)碱化后,测定上清夜在574nm下的吸光度。为了实用方便,一个蛋白水解活性单位(U)被定义为每分钟产生0.001吸光度值的酶量。
实施例2:红色毛癣菌分泌蛋白的水解酶活性
在含有0.2%大豆蛋白作为唯一氮源和碳源的培养基上在30℃的条件下培养红色毛癣菌。生长14天后,记录到培养基伴随有澄清现象,用resorufin标记的酪蛋白作为底物检测真实的蛋白水解酶活性(400U/ml)。其蛋白水解活性分别被PMSF和邻-二氮杂菲抑制15%和85%,证明红色毛癣菌分泌丝氨酸和金属蛋白酶。对培养物上清夜的Western杂交分析揭示红色毛癣菌和犬小孢子菌相像,分泌枯草杆菌蛋白酶(subtilisin)家族(MEROPS>S8)和fungalysin家族(MEROPS>M36)的内源蛋白酶,类似于A.oryzae分泌的碱性磷酸酶ALP和中性的金属蛋白酶NPI(参见图1)。另外,在红色毛癣菌培养物的上清夜中检测到对象Leu-AMC和Leu-pNA这样底物的高活性。
实施例3:红色毛癣菌分泌物的氨肽酶活性
犬小孢子菌内蛋白酶基因的核苷酸序列和同源基因的相似性为50-70%。这些基因编码A.oryzae和A.fumigtus分泌的枯草杆菌蛋白酶和fungalysin。另外,犬小孢子菌和Aspergillis的基因具有内含子-外显子结构的线性对应关系。因此,来自A.oryzae和酵母编码氨肽酶,基因的DNA序列被用来设计探针,用于筛选红色毛癣菌的基因组DNA文库。使用重组蛋白,通过与机会致病菌烟曲霉菌分泌的蛋白进行比较。确定红色毛癣菌分泌的氨肽酶的特性。
实施例4:克隆编码红色毛癣菌和烟曲霉菌氨肽酶的基因
表19A和19B详述了各种LAP的两两比较结果
                                       表19A
  M28E酶              %相似性或一致性a
  ruLAP1   fuLAP1   或LAP1   Vibrio LAP
  ruLAP1   72   72   41
  fuLAP1   50   70   39
  或LAP1   48   49   42
  Vibrio LAP   22   21   23
                                      表19B
  M28E酶              %相似性或一致性a
  ruLAP2   fuLAP2   或LAP2   S.cer.aaY
  ruLAP2   69   71   53
  fuLAP2   51   85   52
  或LAP2   49   72   53
  S.cer.aaY   32   33   34
a相似性百分比(上边右手处)和一致性百分比(下边左手处)的比值可以通过Gapimplemented in the GCG package of the Genetics Computer Group,University ofWisconsin,Madison程序获得。
图14是M28E亚家族氨肽酶推导氨基酸序列的对比结果。用下划线表示推定的信号序列加工位点。实心三角形显示为ruLAP1推定的KR加工位点。Open箭头显示的是S.griseus的氨肽酶以及在其他LAP中的保守的两个Zn++结合位点。使用威斯康星大学GCG软件包中的经Boxshade 3.2改良的对比。AbispLAP1是指Agaricus bisporus的LAP。
图15是M28A亚家族氧基肽酶推导氨基酸序列的对比结果。下划线表示推定的信号序列加工位点。用空心三角表示。两个氨基酸残基,His和Asp,在真菌的LAP中保守,在S.griseus氨肽酶中结合第一个Zn++。实心菱形表示结合第二个Zn++离子的另外两个残基--His和Glu,空心箭头表示连接两个Zn++离子的ASP残基。*代表仅在ruLAP中发现的甲硫氨酸残基。
氨基酸序列GPGINDDGSG(SEQ ID NO:36)和DM(Q/M)ASPN(SEQ ID NO:37)被发现存在于A.oryzae分泌的52kDa氨肽酶(美国专利:6127161)和酵母氨肽酶中。(Nishizawa,et.al.1994)来自这些数据,两段大致上一致的寡核苷酸(GGXATXAAYGAYGAYGGXTCXGG,SEQ ID NO:38)和(TTXGGXGAXGCXATCATRTC,SEQ ID NO:39)被分别用来作为正义和反义引物来扩增红色毛癣菌的DNA。获得一段220bp的PCR片断被用来作为探针筛选λ噬菌体EMBL 3基因组DNA文库,找到一条编码可能的氨肽酶(ruLAP2)的核苷酸序列。从烟曲霉菌基因组序列中找到一条编码相似分泌型氨肽酶(fuLAP2)的核苷酸序列(参见网站www.TIGR.com)。
使用寡核苷酸GCATTCCTGUGATGCCCGGGCCG(正义)(SEQ ID NO:40)和TTACTTAGCAAGCTCAGTGACGAAGCCGAC(反义)(SEQ ID NO:41),通过PCR扩增A.oryzae基因组DNA,得到一段1200bp的片段,该片段包含编码A.oryzae 31kDa氨肽酶(美国专利5994113)基因的核苷酸序列。这个片段被用作探针二次筛选红色毛癣菌基因组DNA文库。在红色毛癣菌基因组文库的λ噬菌体EMBL3DNA中,发现了一段核苷酸序列(EMBL),它和那些编码A.oryzae30kDa氨肽酶和来自烟曲霉菌基因组序列的其他分泌型氨肽酶(网站:www.TIGR.com)相似。这些红色毛癣菌和烟曲霉菌推定的氨肽酶被分别称为ruLAP1和fuLAP1。
鉴定的ruLAP1、ruLAP2、fuLAP1和fuLAP2每个都包含一个17~20氨基酸的信号序列。用5’-正向和3’-反向引物PCR扩增基因组DNA(参见表14)和包含108个克隆的红色毛癣菌或烟曲霉菌cDNA文库的总DNA,对PCR产物进行测序,确定红色毛癣菌和烟曲霉菌基因的内含子-外显子结构。RuLAP2的3个内含子的第一个在位置上和fuLAP2唯一的内含子在位置上相似(参见表13)。基因ruLAP1和fuLAP1具有两个内含子和三个外显子,有相似的共线性结构。
实施例5:重组红色毛癣菌和烟曲霉菌氨肽酶的产生
由RT-PCR获得的红色毛癣菌和烟曲霉菌的cDNA被克隆进pKJ 113,在P.pastoris中表达。取决于肽酶的产量,在Leu-AMC上得到大约10-80ug/ml有活性的酶(参见表18)。在相同的培养条件下,野生型的P.pastoris不向培养基中分泌任何有亮氨酸氨肽酶活性的物质。SDS-PAGE分析P.pastoris转化株分泌的重组ruLAP2、fuLAP1和fuLAP2呈现弥散的带(图2)。N-糖苷酶处理后,在胶上只有快迁移率的主带出现,说明和ruLAP1相反,这三个LAP是糖蛋白(图2)去糖基化的重组LAP的表现分子量和根据编码蛋白酶基因的核苷酸序列推导出的多肽链计算出的分子量接近。表18提供了每个重组酶推导出的初级结构(氨基酸序列)。
实施例6:检测红色毛癣菌培养物上清液中的ruLAP1和ruLAP2
使用抗ruLAP1的抗血清,在红色毛癣菌培养物上清液中检测到LAP1产物的电泳迁移率高于重组ruLAP1的。
使用抗ruLAP2抗血清,对红色毛癣菌培养物上清液的Western杂交分析结果显示红色毛癣菌分泌的糖基化的LAP2和来自P.pastoris(的重组酶有相同的电泳迁移率。
实施例7:重组LAP的特性
氨肽酶ruLAP1、ruLAP2、fuLAP1以及猪肾微粒体氨肽酶(pkLAP)都能有效地水解Leu-AMC。这种底物被用来确定活性最适的温度和pH值,通过测定(i)各种已知的肽酶抑制剂(参见表16)和(ii)不同的二价离子(参见表17)对酶活性的影响来进一步了解它们的特性。每种LAP在20℃时都有水解Leu-AMC的能力,最适的温度范围从40℃~50℃。最适的pH在7.0到8.5之间(参见表18)。80℃预处理10分钟可使酶不可逆地完全失活。
供试的氨肽酶能被浓度500uM的amastatin(参见表16)强烈或完全抑制。RuLAP1、fuLAP1和pkLAP也被bestatin抑制,但这种抑制剂仅对ruLAP2和fuLAP2有部分抑制效应。在螯合剂试验中,邻二氮杂菲在浓度为1mM和5mM时完全抑制这5种酶。fuLAP1、ruLAP2和ruLAP1比其他LAP对EDTA更敏感。E64和Chloromercuribenzoate(半胱氨酸蛋白酶抑制剂)使ruLAP2的活性减弱。暗示在这种酶的氨基酸序列上存在对于活性关键的巯基残基。对于供试的所有LAP,Leupeptin(丝氨酸/半胱氨酸蛋白酶抑制剂)、PMSF(丝氨酸蛋白酶抑制剂)、苯甲脒、TLCK和TPCK没有明显的抑制效果。令人吃惊的是,fuLAP1和ruLAP1对0.1mM pepstatin(天冬氨酸蛋白酶抑制剂)表现有一些灵敏性。
除了fuLAP1表现对二价离子的一般性敏感,当浓度达到1mM时,Co++可以使LAP活性增加200%到900%,四种真菌的LAP对二价阳离子表现不同的灵敏性。例如fuLAP2被Mn++和Ca++激活,而fuLAP1被相同的离子抑制。不同M28家族的4种真菌LAP1,微粒体的pkLAP被Zn、Ni和Cu++高度活化。
用Leu-AMC作为参照,对这些酶对于不同的aminoacyl-AMC的水解活性进行了比较(参见表15)。根据供试的氨肽酶,检测不同氨酰残基的不同参数选择。例如,氨肽酶pkLAP和四种真菌的LAP不同之处在于它对Ala-AMC和Arg-AMC有特别高的效率。RuLAP1明显对Leu-AMC有最强的选择性。然而,观察到和ruLAP2、fuLAP1和fuLAP2有关的其他一些优先的水解活性。例如,ser-和pro-AMC被ruLAP2更有效水解,而fuLAP1喜爱Asp-和Glu-AMC。因为它们不能切开Lys(Abz)-pro-pro-pNA,这些酶都不表现氨肽酶P的活性。
实施例8:ruLAP2和ruDPPIV在消化醇溶蛋白多肽中的应用
Celiac病(CD)是一种消化疾病,它能破坏小肠,干扰从食物中吸收营养。患有celiac病的人无法忍受一种叫做麸质(gluten)的蛋白质,这种蛋白质存在于小麦、黑麦和大麦中。当患CD的病人摄入含有麸质的食物时,他们的免疫***产生反应,对小肠造成破坏。在大部分世界人群中,这种疾病的发病率大约是1/200,治疗CD的唯一方法是终生都绝不食用含有麸质的膳食。对于大部分患者而言,遵循这样的饮食将会使症状消失,已有的肠破坏得到恢复,并且防止进一步恶化。
小麦麸质的主要毒性成分是一种叫做醇溶蛋白(gliadin)的富含脯氨酸和Gln的蛋白家族,它们在消化道中不被降解并且饱含许多T-细胞刺激抗原决定部位。因为不同的体外***已被用来进行这些研究,关于有效诱导HLA-DQ2阳性gut-来源和外周T细胞和免疫活性的抗原决定部位仍然存在一些争议(Vader et al.,Gastroenterology122:1729-1737(2002))。在一种CD器官培养模板中,醇溶蛋白产生毒性的能力和刺激T-细胞并不一致,反之亦然。(McAdam & Sollid,Gut 47:743-745(2000))。而且,许多麸质抗原决定部位同HLA-DQ2和HLA-DQ8结合,但这并不是所有的被脱酰胺作用增强。通过小肠组织转谷氨酰酶的作用,某些谷氨酰残基转化为谷氨酸。因为它们有可能的刺激T-细胞的能力。Molberg et al.,Nat.Med.4:713-717(1998)。但是,对于T-细胞激活,脱酰胺作用并不是绝对必要的。(Arentz-Hansen et al.,Gastroenterology123:803-809(2002))。
其他治疗或预防CD的措施,最好的方式找到一种替代的“不含麸质”食品,在过去几年里已提出建议,包括用化合物抑制T-细胞激活来阻止多肽和HLA-DQ2的结合,抑制组织转谷氨酰酶来阻止麸质脱酰胺(Sollid,Nat.Rev.Immunol.2:647-655(2002))和口腔肽酶的补充。后面的方法被认为对于免疫抑制多肽消化有根本性的作用,具体是含有细菌脯氨酰胞内肽酶,该酶对于含有脯氨酸的多肽有很宽范围的耐受性(Shan等,Science297:2275-2279(2002);Hausch et al.,Am.J.Physiol.Gastrointest Liver Physiol.283:G996-G1003(2002))。相对大片段的醇溶蛋白能抵抗消化酶的降解,而且,这种肽是来自被麸质刺激的CD病人肠组织不同的HLA-DQ2-限制性T-细胞克隆的潜在的刺激物。每个这样的T-细胞克隆识别不同的33mer抗原决定部位。脯氨酰胞内肽酶,偏爱Pro-Xaa-Pro结构域,能够切开33mer的醇溶蛋白肽,和刷状缘的氨肽酶的协调效应,迅速减少这些肽的T-细胞刺激潜力。
尽管在大麦和黑麦有稳定的同源物,这些已经描述的抵抗消化道降解的gluten肽结构域在我们的案例中作为不同LAP的模式底物,单独或同ruDPPIV联合一起消化:对应于α/β醇溶蛋白AIV(P04724)82-95片段PQPQLPYPQPQLPY(SEQ ID NO:42)(14mer)或对应于醇溶蛋白MM1(P18573)57-89片段的LQLQPFPQPQLPYPQPQLPYPQPQLPYPQPQPF(SEQ IDNO:43)(33mer)。
33mer的N-端乙酰化的形式(Ac-33mer)也被合成作为酶切试验的对照。通过一种杂质酶用外肽酶去干扰内肽酶的酶切。
被用于评估的酶有:ruLAP1(Trichophyton rubrum的氨肽酶I)、ruLAP2(Trichophytonrubrum的氨肽酶II)、或LAP2(Aspergillus orizae的氨肽酶II)、fuLAP2(Aspergillusfumigatus的氨肽酶II)、MicpkLAP(来自猪肾的微粒体亮氨酸氨肽酶,Sigma)、CytpkLAP(来自猪肾的胞质亮氨酸氨肽酶,Sigma)和ruDPPIV。
多肽的合成:
采用固相合成的方法。在Applied Biosystems的custom-modified 430A型态合成仪上进行,用原位neutralization/2-(1H-benzotriazol-1-yl)-1,1,1,3,3tetramethyluronium hexa fluoro-phosphate(HBTU)activation试剂盒,在standard-O-CHz-phenylacetamidomethyl resin逐步的进行Boc化学链延长(Schnlzer等,Int.J.Peptide Protein Res.40:180-193(1992))。
在合成结束时,用无水HF在0℃处理1小时,用5%对-甲酚作为净化剂,肽被去保护并被从树脂上切下。切下后,用冰冻的***沉淀合成的肽,溶解在乙腈水溶液中,冻干。用RP-HPLC的方法纯化肽,使用来自Waters的C18柱,线性梯度的缓冲B(99%乙腈/10%H2O/0.1%三氟乙酸),在缓冲液A(H2O/0.1%三氟乙酸),214nm下紫外检测。使用PlatformII设备(Micromass,Manchester,England)用electrospray质谱对样品进行分析。
降解反应的条件:
温育在37℃,PH7.2的50mM Tris-HCl中进行,1mM CoCl2,底物浓度1mg/ml,E/S比例为1∶20。用乙酸酸化中止反应,在C8z柱上用RP-HPLC进行中点分析,在0.1%TFA中用2%/分钟乙腈梯度。所有的峰由ESI-MS确认。
14mer的消化:
如图6所示,在4小时内14mer没有被ruLAP2消化。和对照相比,HPLC谱没有变化。实际上,消化仅仅切除了N-末端的脯氨酸。另一方面,补充ruDPPIV导致完全降解成氨基酸和二肽,ruDPPIV自身不能水解肽。(图7)
33mer的消化:
单独用ruLAP2消化33mer导致在4小时内肽的部分降解(少于50%)。这个肽不是ruDPPIV的底物(图8)。然而,当两种酶被混合在一起,33mer被完全消化(图9)成氨基酸和二肽,其中的一些能够被ESI-MS鉴定(Y、L、F、P、PY和PF)。
当ruDPPIV和ruLAP2或fuLAP2混合时,得到相同的HPLC波形。然而,和ruLAP1混和时,一些高分子量的成分仍然存在,少于10%是初始的底物。
另一方面,和猪肾微粒体氨肽酶一起温育导致仅仅部分N-末端Leu和C-末端phe被部分除去(由于Carboxypeptidasic污染),添加DPPIV并不改变HPLC图谱。胞质的猪肾氨肽酶对33mer完全没有活性。
在LAP或DPPIV单独的或混合在一起的消化实验中,Ac-醇溶蛋白33mer的稳定性进一步证实自由的氨基基团是醇溶蛋白33mer被这些外肽酶完全降解所必须的。
用其他酶消化:
用链霉蛋白酶(E/S=1/25)消化超过20小时仅部分(少于40%)水解,加入ruLAP2(两种酶都以E/S=1/50的比率)没有提高水解性。另一方面,在相同条件下加入DPPIV导致肽的完全降解,因为氨肽酶和二肽肽酶的协同作用。Chtmotrypsin单独或和ruLAP或DPPIV混和不能降解肽。
实施例9:ruLAP2在表达融合其他蛋白的重组蛋白的过程中或添加N-末端标签中的应用
LAP2被鉴定酶切proNPY N末端的Gly-Ser以及同一个肽的N-末端另外一个Ala。为了增加LAP2单独或/和其他外肽酶结合时在加工较大重组蛋白过程中应用,一个有N-末端Met-Thr-Pro序列的G-CSF重组蛋白(Cys17→Ser,Lys16,23,34,40→Arg)被依次和ruLAP2和ruDPPIV温育,从有175个残基的蛋白上依次除去met和Thr-Pro二肽。
ruLAP2消化Gly-Ser-ProNPY:
1mg/ml肽加入50mM Tris-HCl,1mM CoCl2缓冲液中和ruLAP2以E/S比率以1∶20和1∶100(W∶W)混合,37℃温育过夜。用RP-HPLC分离酶切材料,用ESI-MS鉴定。如图10所示,和ruLAP2温育结果是切去N-端的两个残基,理论上损失144.1amu(发现的144.2)E/S比率为1∶100得到相同的结果。当酶到达Xaa-Pro结构域时酶切停止,在proNPY的结构域是Tyr-Pro。
ruLAP2消化Ala-ProNPY:
消化条件和Gly-Ser-ProNPY的相同。图11B显示N-末端的丙氨酸差不多被全部从ProNPY中除去(分子量损失71amu)。
从C-CSF的N-末端依次切去甲硫氨酸和Thr-Pro:
被用于这些试验的是名为TG47的一种G-CSF的突变类似物,它是methinoyl-[C17S,K16,23,34,40R]G-CSF,其重新折叠的蛋白质理论上的质量是18894.90。
用ruLAP2消化:
将G-CSF的贮备液(在含0.1%Sarcosyl PBS中浓度为1.9mg/ml)稀释4倍至pH7.2的50mM Tris-HCl中,含1mM CoCl2。和ruLAP2(E/S=1∶20和1∶100,W∶W)在37℃温育15小时。用30%(V∶V)乙腈稀释溶液,乙酸酸化,RP-HPLC分离蛋白质,进行MS分析。如图12A和B所示,过夜温育导致N-末端甲硫氨酸完全切除。理论上质量损失131.2amu。在E/S比率为1∶100时,过夜温育后,仍有痕量未被切开的物质存在。
为了从半-制备的RP-HPLC柱上分离截短的物质,该实验在2mg尺度上被重复。以E/S比率1∶25(W∶W)在37℃条件下消化15小时以上。分离到的物质(0.8mg)通过ESI-MS鉴定(图12B,desMet-G-CSF,计算分子量为18763.7amu,实测分子质量为18762.5)。
DPPIV消化desMet-G-CSF:
冻干的材料重新溶于pH7.5的含0.1%Sarcosyl的50mM Tris-HCl中,浓度为1mg/ml。和DPPIV以E/S比率1/20(W∶W)在37℃温育过夜。像以前一样用RP-HPLC分离蛋白质,用ESI-MS鉴定(图13A和13B)。DPPIV消化(图13B)结果是切除N-末端二肽Thr-Pro(计算的分子量为18,564.8amu,实测分子质量为18,563)。在反应介质中,痕量的未消化物质仍然存在。
于是,依次应用LAP2和DPPIV的结果是有效地移去重组蛋白N-末端序列。当酶到达一个“停止点结构域”,如Xaa-Pro-Xaa,或Xaa-Pro结构域,它们可能是LAP2特异的停止点,RuLAP2的消化被终止,但可被DPPIV依次切去。
然而,对N-末端残基切除的起始高度依赖于序列,因为在与LAP和DPPIV一起温育时,Met(His)6标记没有从Met(His)6-proPNY中除去。
                            其他实施方案
尽管以上实施例详细的描述了本发明,但仅用来说明本发明目的,而不是用来限制本发明的权利要求范围。特别的是,可预测到不偏离本发明精神和范围的的不同的替换、改变和修饰均属于本发明权利要求范围。本领域普通技术人员知晓的有关重组的核酸起始原料、涉及的克隆或文库类型等方面的选择均认为是常规选择。其他的方面,如优势和修饰也被认为属于以下权利要求范围内。
                                      序列表
<110>富诺齐梅生物技术股份有限公司
<120>一种新的真菌蛋白及其编码核酸
<130>PFD1060017F-CF
<150>US 60/498,398
<151>2003-08-25
<160>35
<170>PatentIn version 3.1
<210>1
<211>1757
<212>DNA
<213>红色毛癣菌(T.rubrum)
<400>1
atgaagtcgc aactgttgag cctggctgtg gccgtcacaa ccatctccca gggcgttgtt      60
ggtcaagagc ccttcggatg gcctttcaag cctatggtca ctcaggtgag ttgctctcaa     120
cagatcgatc gatcgatcta cctttgtccc tgtcacatca aactccagca gagccaaaga     180
aacagacaca atgttcctgg ggaattctta tgggctaatg taaatgtata ggatgacctg     240
caaaacaaga taaagctcaa ggatatcatg gcaggcgtcg agaagctgca aagcttttct     300
gatgctcatc ctgaaaagaa ccgagtgttt ggtggtaatg gccacaagga cactgtagag     360
tggatctaca atgagatcaa ggccactggc tactacgatg tgaagaagca ggagcaagta     420
cacctgtggt ctcatgccga ggctgctctc aatgccaatg gcaaggacct caaggccagc     480
gccatgtcct acagccctcc tgccagcaag atcatggctg agcttgttgt tgccaagaac     540
aatggctgca atgctgtatg tgccatacac tttctatacg tcacattctc tctagaatga     600
agagcacggg agaactaact ttatgtatac agactgatta cccagcgaac actcagggca     660
agatcgtcct cgttgagcgt ggtgtctgca gcttcggcga gaagtctgct caggctggtg     720
atgcaaaggc tgctggtgcc attgtctaca acaacgtccc cggatccctt gctggcactc     780
ttggtggcct tgacaagcgc catgtcccaa ccgctggtct ttcccaggag gatggaaaga     840
accttgctac cctcgttgct tctggtaaga ttgatgtcac catgaacgtt atcagtctgt     900
ttgagaaccg aaccacgtaa gtagctcaac ggctgatcca gcatcaattg tctcgagtat     960
atactaaatc gatacctcat agctggaacg tcattgctga gaccaaggga ggagaccaca    1020
acaacgttat catgctcggt gctcactccg actccgtcga tgccggccct ggtattaacg    1080
acaacggctc gggctccatt ggtatcatga ccgttgccaa agccctcacc aacttcaagc    1140
tcaacaacgc cgtccgcttt gcctggtgga ccgctgagga attcggtctc cttggaagca    1200
ccttctacgt caacagcctc gatgaccgtg agctgcacaa ggtcaagttg tacctcaact    1260
tcgacatgat cggctctccc aacttcgcca accagatcta cgacggtgac ggttcggcct    1320
acaacatgac cggccccgct ggctctgctg aaatcgagta cctgttcgag aagttctttg    1380
acgaccaggg tatcccacac cagcccactg ccttcactgg ccgatccgac tactctgctt    1440
tcatcaagcg caacgtgccc gctggcggcc tcttcactgg agccgaggtt gtcaagaccc    1500
ccgagcaagt caagttgttc ggtggtgagg ctggcgttgc ctatgacaag aactaccatc    1560
gcaagggcga caccgttgcc aacatcaaca agggagctat cttccttaac actcgagcca    1620
tcgcctacgc tatcgccgag tatgcccgat ccctcaaggg attcccaacc cgcccaaaga    1680
ccggcaagcg tgacgtcaac ccccagtatt ctaagatgcc tggtggtggc tgcggacacc    1740
acactgtctt catgtaa                                                   1757
<210>2
<211>1488
<212>DNA
<213>红色毛癣菌(T.rubrum)
<400>2
atgaagtcgc aactgttgag cctggctgtg gccgtcacaa ccatctccca gggcgttgtt      60
ggtcaagagc ccttcggatg gcctttcaag cctatggtca ctcaggatga cctgcaaaac     120
aagataaagc tcaaggatat catggcaggc gtcgagaagc tgcaaagctt ttctgatgct     180
catcctgaaa agaaccgagt gtttggtggt aatggccaca aggacactgt agagtggatc     240
tacaatgaga tcaaggccac tggctactac gatgtgaaga agcaggagca agtacacctg     300
tggtctcatg ccgaggctgc tctcaatgcc aatggcaagg acctcaaggc cagcgccatg     360
tcctacagcc ctcctgccag caagatcatg gctgagcttg ttgttgccaa gaacaatggc     420
tgcaatgcta ctgattaccc agcgaacact cagggcaaga tcgtcctcgt tgagcgtggt     480
gtctgcagct tcggcgagaa gtctgctcag gctggtgatg caaaggctgc tggtgccatt     540
gtctacaaca acgtccccgg atcccttgct ggcactcttg gtggccttga caagcgccat     600
gtcccaaccg ctggtctttc ccaggaggat ggaaagaacc ttgctaccct cgttgcttct     660
ggtaagattg atgtcaccat gaacgttatc agtctgtttg agaaccgaac cacctggaac     720
gtcattgctg agaccaaggg aggagaccac aacaacgtta tcatgctcgg tgctcactcc     780
gactccgtcg atgccggccc tggtattaac gacaacggct cgggctccat tggtatcatg     840
accgttgcca aagccctcac caacttcaag ctcaacaacg ccgtccgctt tgcctggtgg     900
accgctgagg aattcggtct ccttggaagc accttctacg tcaacagcct cgatgaccgt     960
gagctgcaca aggtcaagtt gtacctcaac ttcgacatga tcggctctcc caacttcgcc    1020
aaccagatct acgacggtga cggttcggcc tacaacatga ccggccccgc tggctctgct    1080
gaaatcgagt acctgttcga gaagttcttt gacgaccagg gtatcccaca ccagcccact    1140
gccttcactg gccgatccga ctactctgct ttcatcaagc gcaacgtgcc cgctggcggc    1200
ctcttcactg gagccgaggt tgtcaagacc cccgagcaag tcaagttgtt cggtggtgag    1260
gctggcgttg cctatgacaa gaactaccat cgcaagggcg acaccgttgc caacatcaac    1320
aagggagcta tcttccttaa cactcgagcc atcgcctacg ctatcgccga gtatgcccga    1380
tccctcaagg gattcccaac ccgcccaaag accggcaagc gtgacgtcaa cccccagtat    1440
tctaagatgc ctggtggtgg ctgcggacac cacactgtct tcatgtaa                 1488
<210>3
<211>495
<212>PRT
<213>红色毛癣菌(T.rubrum)
<400>3
Met Lys Ser Gln Leu Leu Ser Leu Ala Val Ala Val Thr Thr Ile Ser
1               5                   10                  15
Gln Gly Val Val Gly Gln Glu Pro Phe Gly Trp Pro Phe Lys Pro Met
            20                  25                  30
Val Thr Gln Asp Asp Leu Gln Asn Lys Ile Lys Leu Lys Asp Ile Met
        35                  40                  45
Ala Gly Val Glu Lys Leu Gln Ser Phe Ser Asp Ala His Pro Glu Lys
    50                  55                  60
Asn Arg Val Phe Gly Gly Asn Gly His Lys Asp Thr Val Glu Trp Ile
65                  70                  75                  80
Tyr Asn Glu Ile Lys Ala Thr Gly Tyr Tyr Asp Val Lys Lys Gln Glu
                85                  90                  95
Gln Val His Leu Trp Ser His Ala Glu Ala Ala Leu Asn Ala Asn Gly
            100                 105                 110
Lys Asp Leu Lys Ala Ser Ala Met Ser Tyr Ser Pro Pro Ala Ser Lys
        115                 120                 125
Ile Met Ala Glu Leu Val Val Ala Lys Asn Asn Gly Cys Asn Ala Thr
    130                 135                 140
Asp Tyr Pro Ala Asn Thr Gln Gly Lys Ile Val Leu Val Glu Arg Gly
145                 150                 155                 160
Val Cys Ser Phe Gly Glu Lys Ser Ala Gln Ala Gly Asp Ala Lys Ala
                165                 170                 175
Ala Gly Ala Ile Val Tyr Asn Asn Val Pro Gly Ser Leu Ala Gly Thr
            180                 185                 190
Leu Gly Gly Leu Asp Lys Arg His Val Pro Thr Ala Gly Leu Ser Gln
        195                 200                 205
Glu Asp Gly Lys Asn Leu Ala Thr Leu Val Ala Ser Gly Lys Ile Asp
    210                 215                 220
Val Thr Met Asn Val Ile Ser Leu Phe Glu Asn Arg Thr Thr Trp Asn
225                 230                 235                 240
Val Ile Ala Glu Thr Lys Gly Gly Asp His Asn Asn Val Ile Met Leu
                245                 250                 255
Gly Ala His Ser Asp Ser Val Asp Ala Gly Pro Gly Ile Asn Asp Asn
            260                 265                 270
Gly Ser Gly Ser Ile Gly Ile Met Thr Val Ala Lys Ala Leu Thr Asn
        275                 280                 285
Phe Lys Leu Asn Asn Ala Val Arg Phe Ala Trp Trp Thr Ala Glu Glu
    290                 295                 300
Phe Gly Leu Leu Gly Ser Thr Phe Tyr Val Asn Ser Leu Asp Asp Arg
305                 310                 315                 320
Glu Leu His Lys Val Lys Leu Tyr Leu Asn Phe Asp Met Ile Gly Ser
                325                 330                 335
Pro Asn Phe Ala Asn Gln Ile Tyr Asp Gly Asp Gly Ser Ala Tyr Asn
            340                 345                 350
Met Thr Gly Pro Ala Gly Ser Ala Glu Ile Glu Tyr Leu Phe Glu Lys
        355                 360                 365
Phe Phe Asp Asp Gln Gly Ile Pro His Gln Pro Thr Ala Phe Thr Gly
    370                 375                 380
Arg Ser Asp Tyr Ser Ala Phe Ile Lys Arg Asn Val Pro Ala Gly Gly
385                 390                 395                 400
Leu Phe Thr Gly Ala Glu Val Val Lys Thr Pro Glu Gln Val Lys Leu
                405                 410                 415
Phe Gly Gly Glu Ala Gly Val Ala Tyr Asp Lys Asn Tyr His Arg Lys
            420                 425                 430
Gly Asp Thr Val Ala Asn Ile Asn Lys Gly Ala Ile Phe Leu Asn Thr
        435                 440                 445
Arg Ala Ile Ala Tyr Ala Ile Ala Glu Tyr Ala Arg Ser Leu Lys Gly
    450                 455                 460
Phe Pro Thr Arg Pro Lys Thr Gly Lys Arg Asp Val Asn Pro Gln Tyr
465                 470                 475                 480
Ser Lys Met Pro Gly Gly Gly Cys Gly His His Thr Val Phe Met
                485                 490                 495
<210>4
<211>1256
<212>DNA
<213>红色毛癣菌(T.rubrum)
<400>4
atgaagctcc tctctgttct tgcgctgagc gctaccgcta cctccgtcct cggagctagc      60
attcctgttg atgcccgggc cgagaagttc ctcatcgaac ttgcccctgg tgagactcgc     120
tgggttaccg aggaggagaa gtgggagctt aagcgggtat gtaccactat cctacgcaaa     180
agttgtattt tcactagata atattggtta ttaacaccca ttctagaagg gtcaagactt     240
ctttgacatc actgacgagg aggttggatt cactgctgct gttgcacagc cagccattgc     300
ctacccaacc tccatccgcc atgctaatgc tgttaacgcc atgattgcta ccctctccaa     360
ggagaacatg cagcgcgatc tgaccaagct cagctcgttc caaaccgctt actataaggt     420
tgactttggc aagcagtctg ccacctggct ccaggagcaa gtccaggctg ccatcaatac     480
cgctggtgcc aatcgctacg gagccaaggt cgccagcttc cgacacaact tcgctcagca     540
cagcatcatt gccactattc ccggccgctc ccctgaagtc gttgtcgtcg gtgctcacca     600
agacagcatc aaccaacgca gccccatgac cggccgcgct ccaggtgccg atgacaacgg     660
cagtggctcc gtcaccatcc ttgaggccct ccgtggtgtt ctccgggacc agaccatcct     720
ccagggcaag gctgccaaca ccattgagtt ccactggtac gccggtgagg aagctggtct     780
tctgggctcc caggccatct tcgccaacta caaacagacc ggcaagaagg tcaagggcat     840
gctcaaccag gacatgaccg gttacatcaa gggaatggtc gacaagggtc tcaaggtgtc     900
cttcggtatc atcaccgaca acgtcaacgc taacttgacc aagttcgtcc gcatggtcat     960
caccaaggta agcttcaact cttgataaat atatttttca tcgatgaaat gatgtcctaa    1020
taatgcttaa gtactgctca atcccaacca tcgacacccg ctgcggctat gcttgctctg    1080
accacgcctc tgccaaccgc aatggctacc catctgccat ggttgccgag tctcccatcg    1140
atctcctcga ccctcacctc cacactgact ctgacaacat tagctacctc gacttcgacc    1200
acatgatcga gcacgctaag ctcattgtcg gcttcgtcac tgagctcgct aagtaa        1256
<210>5
<211>1122
<212>DNA
<213>红色毛癣菌(T.rubrum)
<400>5
atgaagctcc tctctgttct tgcgctgagc gctaccgcta cctccgtcct cggagctagc      60
attcctgttg atgcccgggc cgagaagttc ctcatcgaac ttgcccctgg tgagactcgc     120
tgggttaccg aggaggagaa gtgggagctt aagcggaagg gtcaagactt ctttgacatc     180
actgacgagg aggttggatt cactgctgct gttgcacagc cagccattgc ctacccaacc     240
tccatccgcc atgctaatgc tgttaacgcc atgattgcta ccctctccaa ggagaacatg     300
cagcgcgatc tgaccaagct cagctcgttc caaaccgctt actataaggt tgactttggc     360
aagcagtctg ccacctggct ccaggagcaa gtccaggctg ccatcaatac cgctggtgcc     420
aatcgctacg gagccaaggt cgccagcttc cgacacaact tcgctcagca cagcatcatt     480
gccactattc ccggccgctc ccctgaagtc gttgtcgtcg gtgctcacca agacagcatc     540
aaccaacgca gccccatgac cggccgcgct ccaggtgccg atgacaacgg cagtggctcc     600
gtcaccatcc ttgaggccct ccgtggtgtt ctccgggacc agaccatcct ccagggcaag     660
gctgccaaca ccattgagtt ccactggtac gccggtgagg aagctggtct tctgggctcc     720
caggccatct tcgccaacta caaacagacc ggcaagaagg tcaagggcat gctcaaccag     780
gacatgaccg gttacatcaa gggaatggtc gacaagggtc tcaaggtgtc cttcggtatc     840
atcaccgaca acgtcaacgc taacttgacc aagttcgtcc gcatggtcat caccaagtac     900
tgctcaatcc caaccatcga cacccgctgc ggctatgctt gctctgacca cgcctctgcc     960
aaccgcaatg gctacccatc tgccatggtt gccgagtctc ccatcgatct cctcgaccct    1020
cacctccaca ctgactctga caacattagc tacctcgact tcgaccacat gatcgagcac    1080
gctaagctca ttgtcggctt cgtcactgag ctcgctaagt aa                       1122
<210>6
<211>373
<212>PRT
<213>红色毛癣菌(T.rubrum)
<400>6
Met Lys Leu Leu Ser Val Leu Ala Leu Ser Ala Thr Ala Thr Ser Val
1               5               10                  15
Leu Gly Ala Ser Ile Pro Val Asp Ala Arg Ala Glu Lys Phe Leu Ile
            20                  25                  30
Glu Leu Ala Pro Gly Glu Thr Arg Trp Val Thr Glu Glu Glu Lys Trp
        35                  40                  45
Glu Leu Lys Arg Lys Gly Gln Asp Phe Phe Asp Ile Thr Asp Glu Glu
    50                  55                  60
Val Gly Phe Thr Ala Ala Val Ala Gln Pro Ala Ile Ala Tyr Pro Thr
65                  70                  75                  80
Ser Ile Arg His Ala Asn Ala Val Asn Ala Met Ile Ala Thr Leu Ser
                85                  90                  95
Lys Glu Asn Met Gln Arg Asp Leu Thr Lys Leu Ser Ser Phe Gln Thr
            100                 105                 110
Ala Tyr Tyr Lys Val Asp Phe Gly Lys Gln Ser Ala Thr Trp Leu Gln
        115                 120                 125
Glu Gln Val Gln Ala Ala Ile Asn Thr Ala Gly Ala Asn Arg Tyr Gly
    130                 135                 140
Ala Lys Val Ala Ser Phe Arg His Asn Phe Ala Gln His Ser Ile lle
145                 150                 155                 160
Ala Thr Ile Pro Gly Arg Ser Pro Glu Val Val Val Val Gly Ala His
                165                 170                 175
Gln Asp Ser Ile Asn Gln Arg Ser Pro Met Thr Gly Arg Ala Pro Gly
            180                 185                 190
Ala Asp Asp Asn Gly Ser Gly Ser Val Thr Ile Leu Glu Ala Leu Arg
        195                 200                 205
Gly Val Leu Arg Asp Gln Thr Ile Leu Gln Gly Lys Ala Ala Asn Thr
    210                 215                 220
Ile Glu Phe His Trp Tyr Ala Gly Glu Glu Ala Gly Leu Leu Gly Ser
225                 230                 235                 240
Gln Ala Ile Phe Ala Asn Tyr Lys Gln Thr Gly Lys Lys Val Lys Gly
                245                 250                 255
Met Leu Asn Gln Asp Met Thr Gly Tyr Ile Lys Gly Met Val Asp Lys
            260                 265                 270
Gly Leu Lys Val Ser Phe Gly Ile Ile Thr Asp Asn Val Asn Ala Asn
        275                 280                 285
Leu Thr Lys Phe Val Arg Met Val Ile Thr Lys Tyr Cys Ser Ile Pro
    290                 295                 300
Thr Ile Asp Thr Arg Cys Gly Tyr Ala Cys Ser Asp His Ala Ser Ala
305                 310                 315                 320
Asn Arg Asn Gly Tyr Pro Ser Ala Met Val Ala Glu Ser Pro Ile Asp
                325                 330                 335
Leu Leu Asp Pro His Leu His Thr Asp Ser Asp Asn Ile Ser Tyr Leu
            340                 345                 350
Asp Phe Asp His Met Ile Glu His Ala Lys Leu Ile Val Gly Phe Val
        355                 360                 365
Thr Glu Leu Ala Lys
    370
<210>7
<211>1557
<212>DNA
<213>烟曲霉菌(A.fumigatus)
<400>7
atgaagctgc tctacctcac atcgtttgcc tctctggccg tggccaatgg cccaggatgg      60
gactggaagc cccgagttca tccggttagt gttcctctcg ccgggtttgt ctgctgtatg     120
ctaacagcat cctgtctatt acagaaagtc ctgccccaaa tgatccattt gtgggatctt     180
ctgcagggcg ctcaacagct ggaagacttc gcctatgcct accccgagcg caaccgcgtc     240
tttggtggac gggcccacga ggacaccgtc aactacctct accgtgagtt gaagaaaacc     300
ggctactacg acgtttacaa gcagccccag gttcaccagt ggacccgagc cgaccaggct     360
ctcaccgtcg acggccagtc ctatgacgcc acaaccatga cttacagccc cagcgtaaac     420
gccacggcgc cgctggcagt ggtgaacaac ctgggctgcg tcgaggctga ctatcccgcc     480
gatctgacgg gcaagattgc tctgatctcg cggggcgagt gcacctttgc gaccaaatcc     540
gtcttgagcg ccaaggccgg ggcggcggcg gcactcgtgt acaacaatat cgagggttcg     600
atggcgggaa ctctgggcgg cgcgaccagc gagctgggtg cctacgctcc catcgccggc     660
atcagcctcg cggacggaca ggcgctgatc cagatgatcc aggcgggcac ggtgacagcc     720
aacctgtgga tcgacagcca ggtcgagaac cgtaccacct acaacgtgat cgcgcagacc     780
aagggcggcg accccaacaa cgtcgtcgcg ctgggtggcc acacggactc ggtcgaggcc     840
gggcccggca tcaacgacga cggctccggc atcatcagca acctcgtcgt cgccaaggcg     900
ctgacccgct tctcggtcaa gaacgcggtg cgcttctgct tctggacggc ggaggagttc     960
ggcctgctgg gcagcaacta ctacgtcaac agcctcaatg ccaccgagca ggccaagatc    1020
cgcctgtatc tcaacttcga catgatcgcc tcccccaact acgccctgat gatctatgac    1080
ggcgacggct cggccttcaa cctgacgggg ccggccggct cggcgcagat cgagcggctc    1140
ttcgaggact actacacgtc gatccgcaag ccgttcgtgc cgaccgagtt caacggccgc    1200
tccgactacc aggcctttat tctcaacggc atccccgcgg gaggcctctt caccggcgcg    1260
gaggcgatca agaccgagga acaggcccaa ttgtttggcg gccaggccgg cgtggctctg    1320
gacgccaact accacgccaa gggtgacaac atgactaatc tcaaccgcga ggctttcctg    1380
atcaattcca gggcgacggc ctttgccgtg gcgacgtacg ccaacagcct tgactcgatc    1440
cccccacgca acatgaccac cgtggtcaag cggtcgcagc tggagcaagc catgaagagg    1500
accccgcaca cgcacaccgg cggaacagga tgctacaagg accgggttga gcagtag       1557
<210>8
<211>1497
<212>DNA
<213>烟曲霉菌(A.fumigatus)
<400>8
atgaagctgc tctacctcac atcgtttgcc tctctggccg tggccaatgg cccaggatgg       60
gactggaagc cccgagttca tccgaaagtc ctgccccaaa tgatccattt gtgggatctt      120
ctgcagggcg ctcaacagct ggaagacttc gcctatgcct accccgagcg caaccgcgtc      180
tttggtggac gggcccacga ggacaccgtc aactacctct accgtgagtt gaagaaaacc      240
ggctactacg acgtttacaa gcagccccag gttcaccagt ggacccgagc cgaccaggct      300
ctcaccgtcg acggccagtc ctatgacgcc acaaccatga cttacagccc cagcgtaaac      360
gccacggcgc cgctggcagt ggtgaacaac ctgggctgcg tcgaggctga ctatcccgcc      420
gatctgacgg gcaagattgc tctgatctcg cggggcgagt gcacctttgc gaccaaatcc      480
gtcttgagcg ccaaggccgg ggcggcggcg gcactcgtgt acaacaatat cgagggttcg      540
atggcgggaa ctctgggcgg cgcgaccagc gagctgggtg cctacgctcc catcgccggc      600
atcagcctcg cggacggaca ggcgctgatc cagatgatcc aggcgggcac ggtgacagcc      660
aacctgtgga tcgacagcca ggtcgagaac cgtaccacct acaacgtgat cgcgcagacc      720
aagggcggcg accccaacaa cgtcgtcgcg ctgggtggcc acacggactc ggtcgaggcc      780
gggcccggca tcaacgacga cggctccggc atcatcagca acctcgtcgt cgccaaggcg      840
ctgacccgct tctcggtcaa gaacgcggtg cgcttctgct tctggacggc ggaggagttc      900
ggcctgctgg gcagcaacta ctacgtcaac agcctcaatg ccaccgagca ggccaagatc      960
cgcctgtatc tcaacttcga catgatcgcc tcccccaact acgccctgat gatctatgac     1020
ggcgacggct cggccttcaa cctgacgggg ccggccggct cggcgcagat cgagcggctc     1080
ttcgaggact actacacgtc gatccgcaag ccgttcgtgc cgaccgagtt caacggccgc     1140
tccgactacc aggcctttat tctcaacggc atccccgcgg gaggcctctt caccggcgcg     1200
gaggcgatca agaccgagga acaggcccaa ttgtttggcg gccaggccgg cgtggctctg     1260
gacgccaact accacgccaa gggtgacaac atgactaatc tcaaccgcga ggctttcctg     1320
atcaattcca gggcgacggc ctttgccgtg gcgacgtacg ccaacagcct tgactcgatc     1380
cccccacgca acatgaccac cgtggtcaag cggtcgcagc tggagcaagc catgaagagg     1440
accccgcaca cgcacaccgg cggaacagga tgctacaagg accgggttga gcagtag        1497
<210>9
<211>498
<212>PRT
<213>烟曲霉菌(A.fumigatus)
<400>9
Met Lys Leu Leu Tyr Leu Thr Ser Phe Ala Ser Leu Ala Val Ala Asn
1               5               10                  15
Gly Pro Gly Trp Asp Trp Lys Pro Arg Val His Pro Lys Val Leu Pro
            20                  25                  30
Gln Met Ile His Leu Trp Asp Leu Leu Gln Gly Ala Gln Gln Leu Glu
        35                  40                  45
Asp Phe Ala Tyr Ala Tyr Pro Glu Arg Asn Arg Val Phe Gly Gly Arg
    50                  55                  60
Ala His Glu Asp Thr Val Asn Tyr Leu Tyr Arg Glu Leu Lys Lys Thr
65                  70                  75                  80
Gly Tyr Tyr Asp Val Tyr Lys Gln Pro Gln Val His Gln Trp Thr Arg
                85                  90                  95
Ala Asp Gln Ala Leu Thr Val Asp Gly Gln Ser Tyr Asp Ala Thr Thr
            100                 105                 110
Met Thr Tyr Ser Pro Ser Val Asn Ala Thr Ala Pro Leu Ala Val Val
        115                 120                 125
Asn Asn Leu Gly Cys Val Glu Ala Asp Tyr Pro Ala Asp Leu Thr Gly
    130                 135                 140
Lys Ile Ala Leu Ile Ser Arg Gly Glu Cys Thr Phe Ala Thr Lys Ser
145                 150                 155                 160
Val Leu Ser Ala Lys Ala Gly Ala Ala Ala Ala Leu Val Tyr Asn Asn
                165                 170                 175
Ile Glu Gly Ser Met Ala Gly Thr Leu Gly Gly Ala Thr Ser Glu Leu
            180                 185                 190
Gly Ala Tyr Ala Pro Ile Ala Gly Ile Ser Leu Ala Asp Gly Gln Ala
        195                 200                 205
Leu Ile Gln Met Ile Gln Ala Gly Thr Val Thr Ala Asn Leu Trp Ile
    210                 215                 220
Asp Ser Gln Val Glu Asn Arg Thr Thr Tyr Asn Val Ile Ala Gln Thr
225                 230                 235                 240
Lys Gly Gly Asp Pro Asn Asn Val Val Ala Leu Gly Gly His Thr Asp
                245                 250                 255
Ser Val Glu Ala Gly Pro Gly Ile Asn Asp Asp Gly Ser Gly Ile Ile
            260                 265                 270
Ser Asn Leu Val Val Ala Lys Ala Leu Thr Arg Phe Ser Val Lys Asn
        275                 280                 285
Ala Val Arg Phe Cys Phe Trp Thr Ala Glu Glu Phe Gly Leu Leu Gly
    290                 295                 300
Ser Asn Tyr Tyr Val Asn Ser Leu Asn Ala Thr Glu Gln Ala Lys Ile
305                 310                 315                 320
Arg Leu Tyr Leu Asn Phe Asp Met Ile Ala Ser Pro Asn Tyr Ala Leu
                325                 330                 335
Met Ile Tyr Asp Gly Asp Gly Ser Ala Phe Asn Leu Thr Gly Pro Ala
            340                 345                 350
Gly Ser Ala Gln Ile Glu Arg Leu Phe Glu Asp Tyr Tyr Thr Ser Ile
        355                 360                 365
Arg Lys Pro Phe Val Pro Thr Glu Phe Asn Gly Arg Ser Asp Tyr Gln
    370                 375                 380
Ala Phe Ile Leu Asn Gly Ile Pro Ala Gly Gly Leu Phe Thr Gly Ala
385                 390                 395                 400
Glu Ala Ile Lys Thr Glu Glu Gln Ala Gln Leu Phe Gly Gly Gln Ala
                405                 410                 415
Gly Val Ala Leu Asp Ala Asn Tyr His Ala Lys Gly Asp Asn Met Thr
            420                 425                 430
Asn Leu Asn Arg Glu Ala Phe Leu Ile Asn Ser Arg Ala Thr Ala Phe
        435                 440                 445
Ala Val Ala Thr Tyr Ala Asn Ser Leu Asp Ser Ile Pro Pro Arg Asn
    450                 455                 460
Met Thr Thr Val Val Lys Arg Ser Gln Leu Glu Gln Ala Met Lys Arg
465                 470                 475                 480
Thr Pro His Thr His Thr Gly Gly Thr Gly Cys Tyr Lys Asp Arg Val
                485                 490                 495
Glu Gln
<210>10
<211>1298
<212>DNA
<213>烟曲霉菌(A.fumigatus)
<400>10
atgaaagttc ttacagctat tgcgctgagc gcaatagctt tcacaggggc tgtagctgca      60
gtgattactc aggaagcatt cttaaacaac ccccgcatcc atcatgacca ggagaagtac     120
ttgatcgaac tggcccctta tcgaacacga tgggtgactg aagaggagaa atgggcattg     180
aaattggtac catacttccc caaaatttgg gtctccaagt ccacgggcga ctaactgcac     240
gattgcttga aggacggcgt gaattttatc gatatcacag aagagcacaa caccggattt     300
tacccgactc tccacagcgc cagctatgtg aaatatccac cgaagatgca gtatgcagaa     360
gaagtggctg ctcttaacaa gaatttatcg aaagaaaaca tgaaggccaa cctggaacga     420
ttcacatcat ttcatactcg ctattacaaa tctcagacgg gaatccgatc ggcaacgtgg     480
ctgttcgacc aagttcagag agttgtctct gagtctggag ccgctgagta tggtgcaact     540
gttgagcgat tctctcatcc atggggtcag ttcagcatta ttgcccgaat acccggccga     600
acgaacaaga ctgtggtgct gggcgcccat caggacagca tcaatttgtt tctcccgtca     660
atcttggctg ctcccggtgc tgatgacgat ggaagtggaa ctgtcaccat tcttgaagcg     720
ttgcgcggtc tgctgcagtc agacgccatt gccaagggta atgcatccaa tactgtcgag     780
ttccactggt actctgcaga agaaggcgga atgctgggct cccaggcaat attttccaat     840
tacaagcgga ataggcggga aatcaaagcc atgctccagc aagacatgac tggctacgtc     900
cagggagctt tgaacgccgg tgttgaggaa gccataggaa ttatggtcga ttatgtcgac     960
cagggcctca cacagtttct caaggacgtt gttacagcgg taagcctcag ttgtccccca    1020
cgaaaagctg tttagtcgac aaatgaaatt gacggctgca ttagtactgc tctgtgggtt    1080
acctggagac gaagtgcgga tatgcctgct ccgaccacac ctcggccagt aaatatggtt    1140
atcccgcggc tatggcgaca gaagcagaga tggaaaatac caataagaag atacatacta    1200
ccgacgacaa gatcaagtat ttgagcttcg atcatatgtt ggagcatgcc aagttgagtc    1260
ttggcttcgc tttcgaattg gcatttgcgc cgttttaa                            1298
<210>11
<211>1167
<212>DNA
<213>烟曲霉菌(A.fumigatus)
<400>11
atgaaagttc ttacagctat tgcgctgagc gcaatagctt tcacaggggc tgtagctgca      60
gtgattactc aggaagcatt cttaaacaac ccccgcatcc atcatgacca ggagaagtac     120
ttgatcgaac tggcccctta tcgaacacga tgggtgactg aagaggagaa atgggcattg     180
aaattggacg gcgtgaattt tatcgatatc acagaagagc acaacaccgg attttacccg     240
actctccaca gcgccagcta tgtgaaatat ccaccgaaga tgcagtatgc agaagaagtg     300
gctgctctta acaagaattt atcgaaagaa aacatgaagg ccaacctgga acgattcaca     360
tcatttcata ctcgctatta caaatctcag acgggaatcc gatcggcaac gtggctgttc     420
gaccaagttc agagagttgt ctctgagtct ggagccgctg agtatggtgc aactgttgag     480
cgattctctc atccatgggg tcagttcagc attattgccc gaatacccgg ccgaacgaac     540
aagactgtgg tgctgggcgc ccatcaggac agcatcaatt tgtttctccc gtcaatcttg     600
gctgctcccg gtgctgatga cgatggaagt ggaactgtca ccattcttga agcgttgcgc     660
ggtctgctgc agtcagacgc cattgccaag ggtaatgcat ccaatactgt cgagttccac     720
tggtactctg cagaagaagg cggaatgctg ggctcccagg caatattttc caattacaag     780
cggaataggc gggaaatcaa agccatgctc cagcaagaca tgactggcta cgtccaggga     840
gctttgaacg ccggtgttga ggaagccata ggaattatgg tcgattatgt cgaccagggc     900
ctcacacagt ttctcaagga cgttgttaca gcgtactgct ctgtgggtta cctggagacg     960
aagtgcggat atgcctgctc cgaccacacc tcggccagta aatatggtta tcccgcggct    1020
atggcgacag aagcagagat ggaaaatacc aataagaaga tacatactac cgacgacaag    1080
atcaagtatt tgagcttcga tcatatgttg gagcatgcca agttgagtct tggcttcgct    1140
ttcgaattgg catttgcgcc gttttaa                                        1167
<210>12
<211>388
<212>PRT
<213>烟曲霉菌(A.fumigatus)
<400>12
Met Lys Val Leu Thr Ala Ile Ala Leu Ser Ala Ile Ala Phe Thr Gly
1               5                   10                  15
Ala Val Ala Ala Val Ile Thr Gln Glu Ala Phe Leu Asn Asn Pro Arg
            20                  25                  30
Ile His His Asp Gln Glu Lys Tyr Leu Ile Glu Leu Ala Pro Tyr Arg
        35                  40                  45
Thr Arg Trp Val Thr Glu Glu Glu Lys Trp Ala Leu Lys Leu Asp Gly
    50                  55                  60
Val Asn Phe Ile Asp Ile Thr Glu Glu His Asn Thr Gly Phe Tyr Pro
65                  70                  75                  80
Thr Leu His Ser Ala Ser Tyr Val Lys Tyr Pro Pro Lys Met Gln Tyr
                85                  90                  95
Ala Glu Glu Val Ala Ala Leu Asn Lys Asn Leu Ser Lys Glu Asn Met
            100                 105                 110
Lys Ala Asn Leu Glu Arg Phe Thr Ser Phe His Thr Arg Tyr Tyr Lys
        115                 120                 125
Ser Gln Thr Gly Ile Arg Ser Ala Thr Trp Leu Phe Asp Gln Val Gln
    130                 135                 140
Arg Val Val Ser Glu Ser Gly Ala Ala Glu Tyr Gly Ala Thr Val Glu
145                 150                 155                 160
Arg Phe Ser His Pro Trp Gly Gln Phe Ser Ile Ile Ala Arg Ile Pro
                165                 170                 175
Gly Arg Thr Asn Lys Thr Val Val Leu Gly Ala His Gln Asp Ser Ile
            180                 185                 190
Asn Leu Phe Leu Pro Ser Ile Leu Ala Ala Pro Gly Ala Asp Asp Asp
        195                 200                 205
Gly Ser Gly Thr Val Thr Ile Leu Glu Ala Leu Arg Gly Leu Leu Gln
    210                 215                 220
Ser Asp Ala Ile Ala Lys Gly Asn Ala Ser Asn Thr Val Glu Phe His
225                 230                 235                 240
Trp Tyr Ser Ala Glu Glu Gly Gly Met Leu Gly Ser Gln Ala Ile Phe
                245                 250                 255
Ser Asn Tyr Lys Arg Asn Arg Arg Glu Ile Lys Ala Met Leu Gln Gln
            260                 265                 270
Asp Met Thr Gly Tyr Val Gln Gly Ala Leu Asn Ala Gly Val Glu Glu
        275                 280                 285
Ala Ile Gly Ile Met Val Asp Tyr Val Asp Gln Gly Leu Thr Gln Phe
    290                 295                 300
Leu Lys Asp Val Val Thr Ala Tyr Cys Ser Val Gly Tyr Leu Glu Thr
305                 310                 315                 320
Lys Cys Gly Tyr Ala Cys Ser Asp His Thr Ser Ala Ser Lys Tyr Gly
                325                 330                 335
Tyr Pro Ala Ala Met Ala Thr Glu Ala Glu Met Glu Asn Thr Asn Lys
            340                 345                 350
Lys Ile His Thr Thr Asp Asp Lys Ile Lys Tyr Leu Ser Phe Asp His
        355                 360                 365
Met Leu Glu His Ala Lys Leu Ser Leu Gly Phe Ala Phe Glu Leu Ala
    370                 375                 380
Phe Ala Pro Phe
385
<210>13
<211>2106
<212>DNA
<213>红色毛癣菌(T.rubrum)
<400>13
atggtgtcat tctgcggagt ggcagcctgc ctgctgacag ttgctggcca tcttgcgcag      60
gctcagttcc caccaaaacc ggagggagtc actgtcctgg agtcgaaatt cggcagcggt     120
gctcgcatca cttataagga ggtccgttag ctgcatagaa agtccacgtg aagacgctgt     180
agctaacaat ccactagcct ggcctctgtg agacgacaga gggcgtcaag tcgtacgccg     240
gatatgtcca tctgcctcca ggcacgctca gggacttcgg tgtcgagcag gactacccta     300
tcaacacctt tttttggttc tttgaggcaa gaaaggaccc tgaaaatgcc cctctcggca     360
tctggatgaa cggtggcccg ggtagctcgt cgatgtttgg aatgatgact gagaacgggc     420
cttgcttcgt caatgcagac tccaattcta ctcgcctgaa ccctcattct tggaacaatg     480
aaggtatgcc atcagcttct gatggaaaac taaatattgc taacattgta ctttctgtga     540
ctagtcaata tgctgtatat agaccagcca gtgcaggtcg gtctgtccta cgacactttg     600
gccaacttca ccaggaatct agtcacggat gagatcacga aactgaaacc cggagaacct     660
attccggaac agaatgccac tttcctggta ggtacatatg caagccgcaa tatgaacacc     720
actgcacacg gaactaggca tgctgccatg gctctctggc acttcgccca agtctggttc     780
caagagttcc caggatatca ccctaggaac aacaagatca gcattgctac cgaatcctac     840
ggcggccgtt atggcccggc ctttactgcc ttctttgaag agcagaacca gaagatcaag     900
aacggcacat ggaagggaca cgagggaact atgcacgtgc tgcatctcga caccctcatg     960
atcgtcaacg gatgcatcga ccgtcttgtc caatggccgg catatccgca aatggcgtac    1020
aacaacacat atagcatcga ggcagtcaac gccagcattc atgcaggaat gctggatgcc    1080
ctctaccgcg acggtggctg tcgagacaag attaaccact gccgctccct ctcttctgtg    1140
ttcgatcctg agaatctcgg catcaactca accgtcaatg atgtctgcaa ggatgccgag    1200
acattctgct ccaatgatgt tcgcgatccc tacctcaagt tctctggccg caactactat    1260
gacatcggac agcttgaccc cagcccattc ccagcaccat tttacatggc ctggctaaat    1320
cagccgcatg tgcaggcagc actgggtgtg ccacttaact ggacacagtc aaacgatgtt    1380
gtgtctaccg cattccgtgc aattggtgac taccctcggc cagggtggct ggagaacctg    1440
gcttatttgc tggagaatgg catcaaggtt tcgcttgttt acggtgatcg ggactacgca    1500
tgcaactggt tcggtggtga gctctcaagt ctgggaatca actacactga cacccacgaa    1560
ttccataatg ccggctatgc aggtatccag atcaatagca gctacatcgg tggacaggtg    1620
aggcagtacg gcaacctctc cttcgcccgc gtctacgagg ccggccatga ggtgccatcg    1680
taccaacccg agactgcact gcagatattc caccgttccc tgttcaacaa ggatatcgct    1740
actggaacca aggacacgtc atcgcgcatg gacggaggca agttttacgg cacctcgggc    1800
cctgcggact cgtttggttt caagaacaaa cctccaccgc agcacgtcca cttctgtcat    1860
atcttagaca ccagcacctg caccaaggag cagatccagt cagttgagaa cggcactgcc    1920
gccgtacgca gctggatcat tgtcgactcc aactcgacct ctctgttccc cgaggtagtt    1980
ggctcagggg aacccacgcc aacccctatg cctggagggg ctactacact atctgctcac    2040
gggttcttgt atggcgtgac attatgggct gttattgttg tagctgttat agagctggca    2100
atgtaa                                                               2106
<210>14
<211>1989
<212>DNA
<213>红色毛癣菌(T.rubrum)
<400>14
atggtgtcat tctgcggagt ggcagcctgc ctgctgacag ttgctggcca tcttgcgcag      60
gctcagttcc caccaaaacc ggagggagtc actgtcctgg agtcgaaatt cggcagcggt     120
gctcgcatca cttataagga gcctggcctc tgtgagacga cagagggcgt caagtcgtac     180
gccggatatg tccatctgcc tccaggcacg ctcagggact tcggtgtcga gcaggactac     240
cctatcaaca cctttttttg gttctttgag gcaagaaagg accctgaaaa tgcccctctc     300
ggcatctgga tgaacggtgg cccgggtagc tcgtcgatgt ttggaatgat gactgagaac     360
gggccttgct tcgtcaatgc agactccaat tctactcgcc tgaaccctca ttcttggaac     420
aatgaagtca atatgctgta tatagaccag ccagtgcagg tcggtctgtc ctacgacact     480
ttggccaact tcaccaggaa tctagtcacg gatgagatca cgaaactgaa acccggagaa     540
cctattccgg aacagaatgc cactttcctg gtaggtacat atgcaagccg caatatgaac     600
accactgcac acggaactag gcatgctgcc atggctctct ggcacttcgc ccaagtctgg     660
ttccaagagt tcccaggata tcaccctagg aacaacaaga tcagcattgc taccgaatcc     720
tacggcggcc gttatggccc ggcctttact gccttctttg aagagcagaa ccagaagatc     780
aagaacggca catggaaggg acacgaggga actatgcacg tgctgcatct cgacaccctc     840
atgatcgtca acggatgcat cgaccgtctt gtccaatggc cggcatatcc gcaaatggcg     900
tacaacaaca catatagcat cgaggcagtc aacgccagca ttcatgcagg aatgctggat     960
gccctctacc gcgacggtgg ctgtcgagac aagattaacc actgccgctc cctctcttct    1020
gtgttcgatc ctgagaatct cggcatcaac tcaaccgtca atgatgtctg caaggatgcc    1080
gagacattct gctccaatga tgttcgcgat ccctacctca agttctctgg ccgcaactac    1140
tatgacatcg gacagcttga ccccagccca ttcccagcac cattttacat ggcctggcta    1200
aatcagccgc atgtgcaggc agcactgggt gtgccactta actggacaca gtcaaacgat    1260
gttgtgtcta ccgcattccg tgcaattggt gactaccctc ggccagggtg gctggagaac    1320
ctggcttatt tgctggagaa tggcatcaag gtttcgcttg tttacggtga tcgggactac    1380
gcatgcaact ggttcggtgg tgagctctca agtctgggaa tcaactacac tgacacccac    1440
gaattccata atgccggcta tgcaggtatc cagatcaata gcagctacat cggtggacag    1500
gtgaggcagt acggcaacct ctccttcgcc cgcgtctacg aggccggcca tgaggtgcca    1560
tcgtaccaac ccgagactgc actgcagata ttccaccgtt ccctgttcaa caaggatatc    1620
gctactggaa ccaaggacac gtcatcgcgc atggacggag gcaagtttta cggcacctcg    1680
ggccctgcgg actcgtttgg tttcaagaac aaacctccac cgcagcacgt ccacttctgt    1740
catatcttag acaccagcac ctgcaccaag gagcagatcc agtcagttga gaacggcact    1800
gccgccgtac gcagctggat cattgtcgac tccaactcga cctctctgtt ccccgaggta    1860
gttggctcag gggaacccac gccaacccct atgcctggag gggctactac actatctgct    1920
cacgggttct tgtatggcgt gacattatgg gctgttattg ttgtagctgt tatagagctg    1980
gcaatgtaa                                                            1989
<210>15
<211>662
<212>PRT
<213>红色毛癣菌(T.rubrum)
<400>15
Met Val Ser Phe Cys Gly Val Ala Ala Cys Leu Leu Thr Val Ala Gly
1               5                   10                  15
His Leu Ala Gln Ala Gln Phe Pro Pro Lys Pro Glu Gly Val Thr Val
            20                  25                  30
Leu Glu Ser Lys Phe Gly Ser Gly Ala Arg Ile Thr Tyr Lys Glu Pro
        35                  40                  45
Gly Leu Cys Glu Thr Thr Glu Gly Val Lys Ser Tyr Ala Gly Tyr Val
    50                  55                  60
His Leu Pro Pro Gly Thr Leu Arg Asp Phe Gly Val Glu Gln Asp Tyr
65                  70                  75                  80
Pro Ile Asn Thr Phe Phe Trp Phe Phe Glu Ala Arg Lys Asp Pro Glu
                85                  90                  95
Asn Ala Pro Leu Gly Ile Trp Met Asn Gly Gly Pro Gly Ser Ser Ser
            100                 105                 110
Met Phe Gly Met Met Thr Glu Asn Gly Pro Cys Phe Val Asn Ala Asp
        115                 120                 125
Ser Asn Ser Thr Arg Leu Asn Pro His Ser Trp Asn Asn Glu Val Asn
    130                 135                 140
Met Leu Tyr Ile Asp Gln Pro Val Gln Val Gly Leu Ser Tyr Asp Thr
145                 150                 155                 160
Leu Ala Asn Phe Thr Arg Asn Leu Val Thr Asp Glu Ile Thr Lys Leu
                165                 170                 175
Lys Pro Gly Glu Pro Ile Pro Glu Gln Asn Ala Thr Phe Leu Val Gly
            180                 185                 190
Thr Tyr Ala Ser Arg Asn Met Asn Thr Thr Ala His Gly Thr Arg His
        195                 200                 205
Ala Ala Met Ala Leu Trp His Phe Ala Gln Val Trp Phe Gln Glu Phe
    210                 215                 220
Pro Gly Tyr His Pro Arg Asn Asn Lys Ile Ser Ile Ala Thr Glu Ser
225                 230                 235                 240
Tyr Gly Gly Arg Tyr Gly Pro Ala Phe Thr Ala Phe Phe Glu Glu Gln
                245                 250                 255
Asn Gln Lys Ile Lys Asn Gly Thr Trp Lys Gly His Glu Gly Thr Met
            260                 265                 270
His Val Leu His Leu Asp Thr Leu Met Ile Val Asn Gly Cys Ile Asp
        275                 280                 285
Arg Leu Val Gln Trp Pro Ala Tyr Pro Gln Met Ala Tyr Asn Asn Thr
    290                 295                 300
Tyr Ser Ile Glu Ala Val Asn Ala Ser Ile His Ala Gly Met Leu Asp
305                 310                 315                 320
Ala Leu Tyr Arg Asp Gly Gly Cys Arg Asp Lys Ile Asn His Cys Arg
                325                 330                 335
Ser Leu Ser Ser Val Phe Asp Pro Glu Asn Leu Gly Ile Asn Ser Thr
            340                 345                 350
Val Asn Asp Val Cys Lys Asp Ala Glu Thr Phe Cys Ser Asn Asp Val
        355                 360                 365
Arg Asp Pro Tyr Leu Lys Phe Ser Gly Arg Asn Tyr Tyr Asp Ile Gly
    370                 375                 380
Gln Leu Asp Pro Ser Pro Phe Pro Ala Pro Phe Tyr Met Ala Trp Leu
385                 390                 395                 400
Asn Gln Pro His Val Gln Ala Ala Leu Gly Val Pro Leu Asn Trp Thr
                405                 410                 415
Gln Ser Asn Asp Val Val Ser Thr Ala Phe Arg Ala Ile Gly Asp Tyr
            420                 425                 430
Pro Arg Pro Gly Trp Leu Glu Asn Leu Ala Tyr Leu Leu Glu Asn Gly
        435                 440                 445
Ile Lys Val Ser Leu Val Tyr Gly Asp Arg Asp Tyr Ala Cys Asn Trp
    450                 455                 460
Phe Gly Gly Glu Leu Ser Ser Leu Gly Ile Asn Tyr Thr Asp Thr His
465                 470                 475                 480
Glu Phe His Asn Ala Gly Tyr Ala Gly Ile Gln Ile Asn Ser Ser Tyr
                485                 490                 495
Ile Gly Gly Gln Val Arg Gln Tyr Gly Asn Leu Ser Phe Ala Arg Val
            500                 505                 510
Tyr Glu Ala Gly His Glu Val Pro Ser Tyr Gln Pro Glu Thr Ala Leu
        515                 520                 525
Gln Ile Phe His Arg Ser Leu Phe Asn Lys Asp Ile Ala Thr Gly Thr
    530                 535                 540
Lys Asp Thr Ser Ser Arg Met Asp Gly Gly Lys Phe Tyr Gly Thr Ser
545                 550                 555                 560
Gly Pro Ala Asp Ser Phe Gly Phe Lys Asn Lys Pro Pro Pro Gln His
                565                 570                 575
Val His Phe Cys His Ile Leu Asp Thr Ser Thr Cys Thr Lys Glu Gln
            580                 585                 590
Ile Gln Ser Val Glu Asn Gly Thr Ala Ala Val Arg Ser Trp Ile Ile
        595                 600                 605
Val Asp Ser Asn Ser Thr Ser Leu Phe Pro Glu Val Val Gly Ser Gly
    610                 615                 620
Glu Pro Thr Pro Thr Pro Met Pro Gly Gly Ala Thr Thr Leu Ser Ala
625                 630                 635                 640
His Gly Phe Leu Tyr Gly Val Thr Leu Trp Ala Val Ile Val Val Ala
                645                 650                 655
Val Ile Glu Leu Ala Met
            660
<210>16
<211>2030
<212>DNA
<213>红色毛癣菌(T.rubrum)
<400>16
atgcgctttg ctgctagcat tgccgtggcc ctgccagtca ttcacgcggc gagtgctcaa      60
ggcttccctc cacccgttaa gggcgtcacc gtggtcaaat ccaagttcga cgaaaacgta     120
aagatcacat acaaggaggt atgtgtttac atcattttca catccagatc ttatatcctt     180
acaataaatc tggctaactc actggataga atgacatatg tgaaaccact caaggagtta     240
gatcattcac cggtcatgtc caccttcctc cagacaacga tgactttggt gtctaccgga     300
actactccat caacacattc ttctggttct ttgaagctcg tgaagaccct aagaatgctc     360
ctctctccat ctggctgaac ggtggtccgg gatcgtcatc catgattgga ctcttccagg     420
aaaacggtcc atgctgggtc aatgaagact ctaaatctac caccaacaat tcattttcat     480
ggaacaataa agtaaatatg ctctacattg atcagccaaa ccaagtcggt ttcagttatg     540
acgtacctac caacatcact tactctacca tcaatgatac aatatctgtt gcggacttct     600
ctaacggtgt ccctgcgcaa aatctttcta cgttggttgg aaccggcagc agccagaacc     660
cttgggcaac tgccaataac actgtgaacg ctgctcgttc tatctggcac tttgcacaag     720
tgtggttcca ggaattccct gaacacaagc ctaacaataa caagatcagt atttggacag     780
agtcctatgg aggaagatat ggtccctcat tcgcctctta cttccaggaa cagaacgaaa     840
agatcaaaaa ccataccatt actgaagaag gagagatgca tattctgaac ctcgacaccc     900
tcggtatcat caacggctgc atcgatctta tgttccaagc agaaagttat gctgaattcc     960
catacaacaa cacctatggc atcaaagctt ataccaagga gaagcgtgac gctatattac    1020
acgacatcca ccgtcctgac ggctgcttcg acaaggttac caagtgccgt gaggccgcga    1080
aagaaggaga ccctcacttc tacagcaaca atgcaaccgt caacacaatc tgtgcggatg    1140
ctaactctgc ctgcgacaaa tatctaatgg atcctttcca agagaccaat cttggttact    1200
atgatattgc tcatcctctt caggatccct tccccccacc attctataag ggcttcctca    1260
gccaatccag cgttctatct gacatgggat cgccagtcaa cttctcccaa tacgcccaag    1320
ctgtgggaaa atcattccat ggagttggcg actacgctcg ccctgatgtg cgcggcttca    1380
ccggtgacat tgcttatctt ctcgagagcg gagtcaaggt tgctctcgtc tatggtgaca    1440
gagactacat ctgcaattgg ttcggtggtg agcaggtcag tcttggcttg aactacactg    1500
gcacccaaga cttccacagg gcaaaatatg ccgatgtcaa ggtcaactct tcatacgtcg    1560
gaggcgtagt gcgtcaacat ggaaacttct ctttcaccag agttttcgag gccggtcatg    1620
aagtccctgg ttaccaaccc gagactgccc tcaagatctt tgagcgcatc atgttcaaca    1680
aggatatttc taccggtgag atcgacattg ctcagaaacc agactacggt accactggaa    1740
ctgagtctac gttccatatc aaaaacgata tccctccttc gcctgagccg acctgctacc    1800
tcctcagtgc tgacggaacc tgtaccccgg agcagcttaa tgctattaag gatggaactg    1860
cagttgttga gaactacatt attaagagcc ctgctgcgtc gaaggggaac cctccaccaa    1920
ccacgacctc atctcccaca gcagccccta ccgctggaag tgccatgcta aaggctcctg    1980
tggcaatgct agcaatatca gctctcactg tccttgcttt cttcttgtag               2030
<210>17
<211>1959
<212>DNA
<213>红色毛癣菌(T.rubrum)
<400>17
atgcgctttg ctgctagcat tgccgtggcc ctgccagtca ttcacgcggc gagtgctcaa      60
ggcttccctc cacccgttaa gggcgtcacc gtggtcaaat ccaagttcga cgaaaacgta     120
aagatcacat acaaggagaa tgacatatgt gaaaccactc aaggagttag atcattcacc     180
ggtcatgtcc accttcctcc agacaacgat gactttggtg tctaccggaa ctactccatc     240
aacacattct tctggttctt tgaagctcgt gaagacccta agaatgctcc tctctccatc     300
tggctgaacg gtggtccggg atcgtcatcc atgattggac tcttccagga aaacggtcca     360
tgctgggtca atgaagactc taaatctacc accaacaatt cattttcatg gaacaataaa     420
gtaaatatgc tctacattga tcagccaaac caagtcggtt tcagttatga cgtacctacc     480
aacatcactt actctaccat caatgataca atatctgttg cggacttctc taacggtgtc     540
cctgcgcaaa atctttctac gttggttgga accggcagca gccagaaccc ttgggcaact     600
gccaataaca ctgtgaacgc tgctcgttct atctggcact ttgcacaagt gtggttccag     660
gaattccctg aacacaagcc taacaataac aagatcagta tttggacaga gtcctatgga     720
ggaagatatg gtccctcatt cgcctcttac ttccaggaac agaacgaaaa gatcaaaaac     780
cataccatta ctgaagaagg agagatgcat attctgaacc tcgacaccct cggtatcatc     840
aacggctgca tcgatcttat gttccaagca gaaagttatg ctgaattccc atacaacaac     900
acctatggca tcaaagctta taccaaggag aagcgtgacg ctatattaca cgacatccac     960
cgtcctgacg gctgcttcga caaggttacc aagtgccgtg aggccgcgaa agaaggagac    1020
cctcacttct acagcaacaa tgcaaccgtc aacacaatct gtgcggatgc taactctgcc    1080
tgcgacaaat atctaatgga tcctttccaa gagaccaatc ttggttacta tgatattgct    1140
catcctcttc aggatccctt ccccccacca ttctataagg gcttcctcag ccaatccagc    1200
gttctatctg acatgggatc gccagtcaac ttctcccaat acgcccaagc tgtgggaaaa    1260
tcattccatg gagttggcga ctacgctcgc cctgatgtgc gcggcttcac cggtgacatt    1320
gcttatcttc tcgagagcgg agtcaaggtt gctctcgtct atggtgacag agactacatc    1380
tgcaattggt tcggtggtga gcaggtcagt cttggcttga actacactgg cacccaagac    1440
ttccacaggg caaaatatgc cgatgtcaag gtcaactctt catacgtcgg aggcgtagtg    1500
cgtcaacatg gaaacttctc tttcaccaga gttttcgagg ccggtcatga agtccctggt    1560
taccaacccg agactgccct caagatcttt gagcgcatca tgttcaacaa ggatatttct    1620
accggtgaga tcgacattgc tcagaaacca gactacggta ccactggaac tgagtctacg    1680
ttccatatca aaaacgatat ccctccttcg cctgagccga cctgctacct cctcagtgct    1740
gacggaacct gtaccccgga gcagcttaat gctattaagg atggaactgc agttgttgag    1800
aactacatta ttaagagccc tgctgcgtcg aaggggaacc ctccaccaac cacgacctca    1860
tctcccacag cagcccctac cgctggaagt gccatgctaa aggctcctgt ggcaatgcta    1920
gcaatatcag ctctcactgt ccttgctttc ttcttgtag                           1959
<210>18
<211>652
<212>PRT
<213>红色毛癣菌(T.rubrum)
<400>18
Met Arg Phe Ala Ala Ser Ile Ala Val Ala Leu Pro Val Ile His Ala
1               5                   10                  15
Ala Ser Ala Gln Gly Phe Pro Pro Pro Val Lys Gly Val Thr Val Val
            20                  25                  30
Lys Ser Lys Phe Asp Glu Asn Val Lys Ile Thr Tyr Lys Glu Asn Asp
        35                  40                  45
Ile Cys Glu Thr Thr Gln Gly Val Arg Ser Phe Thr Gly His Val His
    50                  55                  60
Leu Pro Pro Asp Asn Asp Asp Phe Gly Val Tyr Arg Asn Tyr Ser Ile
65                  70                  75                  80
Asn Thr Phe Phe Trp Phe Phe Glu Ala Arg Glu Asp Pro Lys Asn Ala
                85                  90                  95
Pro Leu Ser Ile Trp Leu Asn Gly Gly Pro Gly Ser Ser Ser Met Ile
            100                 105                 110
Gly Leu Phe Gln Glu Asn Gly Pro Cys Trp Val Asn Glu Asp Ser Lys
        115                 120                 125
Ser Thr Thr Asn Asn Ser Phe Ser Trp Asn Asn Lys Val Asn Met Leu
    130                 135                 140
Tyr Ile Asp Gln Pro Asn Gln Val Gly Phe Ser Tyr Asp Val Pro Thr
145                 150                 155                 160
Asn Ile Thr Tyr Ser Thr Ile Asn Asp Thr Ile Ser Val Ala Asp Phe
                165                 170                 175
Ser Asn Gly Val Pro Ala Gln Asn Leu Ser Thr Leu Val Gly Thr Gly
            180                 185                 190
Ser Ser Gln Asn Pro Trp Ala Thr Ala Asn Asn Thr Val Asn Ala Ala
        195                 200                 205
Arg Ser Ile Trp His Phe Ala Gln Val Trp Phe Gln Glu Phe Pro Glu
    210                 215                 220
His Lys Pro Asn Asn Asn Lys Ile Ser Ile Trp Thr Glu Ser Tyr Gly
225                 230                 235                 240
Gly Arg Tyr Gly Pro Ser Phe Ala Ser Tyr Phe Gln Glu Gln Asn Glu
                245                 250                 255
Lys Ile Lys Asn His Thr Ile Thr Glu Glu Gly Glu Met His Ile Leu
            260                 265                 270
Asn Leu Asp Thr Leu Gly Ile Ile Asn Gly Cys Ile Asp Leu Met Phe
        275                 280                 285
Gln Ala Glu Ser Tyr Ala Glu Phe Pro Tyr Asn Asn Thr Tyr Gly Ile
    290                 295                 300
Lys Ala Tyr Thr Lys Glu Lys Arg Asp Ala Ile Leu His Asp Ile His
305                 310                 315                 320
Arg Pro Asp Gly Cys Phe Asp Lys Val Thr Lys Cys Arg Glu Ala Ala
                325                 330                 335
Lys Glu Gly Asp Pro His Phe Tyr Ser Asn Asn Ala Thr Val Asn Thr
            340                 345                 350
Ile Cys Ala Asp Ala Asn Ser Ala Cys Asp Lys Tyr Leu Met Asp Pro
        355                 360                 365
Phe Gln Glu Thr Ash Leu Gly Tyr Tyr Asp Ile Ala His Pro Leu Gln
    370                 375                 380
Asp Pro Phe Pro Pro Pro Phe Tyr Lys Gly Phe Leu Ser Gln Ser Ser
385                 390                 395                 400
Val Leu Ser Asp Met Gly Ser Pro Val Asn Phe Ser Gln Tyr Ala Gln
                405                 410                 415
Ala Val Gly Lys Ser Phe His Gly Val Gly Asp Tyr Ala Arg Pro Asp
            420                 425                 430
Val Arg Gly Phe Thr Gly Asp Ile Ala Tyr Leu Leu Glu Ser Gly Val
        435                 440                 445
Lys Val Ala Leu Val Tyr Gly Asp Arg Asp Tyr Ile Cys Asn Trp Phe
    450                 455                 460
Gly Gly Glu Gln Val Ser Leu Gly Leu Asn Tyr Thr Gly Thr Gln Asp
465                 470                 475                 480
Phe His Arg Ala Lys Tyr Ala Asp Val Lys Val Asn Ser Ser Tyr Val
                485                 490                 495
Gly Gly Val Val Arg Gln His Gly Asn Phe Ser Phe Thr Arg Val Phe
            500                 505                 510
Glu Ala Gly His Glu Val Pro Gly Tyr Gln Pro Glu Thr Ala Leu Lys
        515                 520                 525
Ile Phe Glu Arg Ile Met Phe Asn Lys Asp Ile Ser Thr Gly Glu Ile
    530                 535                 540
Asp Ile Ala Gln Lys Pro Asp Tyr Gly Thr Thr Gly Thr Glu Ser Thr
545                 550                 555                 560
Phe His Ile Lys Asn Asp Ile Pro Pro Ser Pro Glu Pro Thr Cys Tyr
                565                 570                 575
Leu Leu Ser Ala Asp Gly Thr Cys Thr Pro Glu Gln Leu Asn Ala Ile
            580                 585                 590
Lys Asp Gly Thr Ala Val Val Glu Asn Tyr Ile Ile Lys Ser Pro Ala
        595                 600                 605
Ala Ser Lys Gly Asn Pro Pro Pro Thr Thr Thr Ser Ser Pro Thr Ala
    610                 615                 620
Ala Pro Thr Ala Gly Ser Ala Met Leu Lys Ala Pro Val Ala Met Leu
625                 630                 635                 640
Ala Ile Ser Ala Leu Thr Val Leu Ala Phe Phe Leu
                645                 650
<210>19
<211>1795
<212>DNA
<213>红色毛癣菌(T.rubrum)
<220>
<221>misc_feature
<222>(283)..(283)
<223>n
<400>19
atgcaagcag caaaattgtt gagccggtac tggcaaaatg tacctggtta gtgcagctaa      60
tcttgagtca catcatgcat agttaaccga gtatcacaac acaatctact attgcgtttt      120
tgctaatggc taccatagga agactgaggg tatctgagct ccttttcgat gtccctttag     180
actactcaaa cccgtcttcc acttcgctcc ggttgttcgc caggagtgtg cagcggcgaa     240
ttccagggtc ctctctcgat gataaagaca gacagctacc ctnggattgt tttcctgcag     300
ggtggaccag gaggagcttg cccacaacct caggaggtag gctgggttgg gccattgctg     360
gatcgaggat tccaggtgag tctccagaat cgggatgagt aactgtagaa caccttgttg     420
aatttcttga ttagatcctt ctccttgacc agcgaggaac agggctttca acccctataa     480
ccgctgcgac gcttgctctt cagggaaacg cagtaaagca agccgaatat cttaggctat     540
tccgtgccga taatatcgtg cgagactgtg aagcagtgcg taaactattg actgcttatt     600
accctccaga taagcagaaa tggagcgtcc ttggccagag ttttggagga ttctgtgccg     660
tcacgtatgt ttctaagtag tgagtaacta ctccttcaaa tccacctgct atagattgtc     720
gtgcaaatct aaccttcatc atctagtcct gagggactta aagaagtctt cacaactggt     780
ggattacccc ctcttgtgtc aaagcctgat cctgtgtacg agaggaccta cggtaagttg     840
ggatagattg ggctattttt agtttaatat acagctgaca tctacagaca aggtccagtc     900
ccggaataaa gtgtactatt ccactttccc cgaagacgaa gatcgagtgc ggattatact     960
caagcatctc caaacccacg atgttaagct ccccgatggc tcaccgttaa ctccggaacg    1020
ctttctccag ctaggaattc attttggaat gaaaggtacg ccataettcg caggtgactt    1080
ctcgtaacca atgactaaca tatgcatata gggggcatcg gcttagttca tagtatgata    1140
ccatcaataa cttacattat acttattcac tgactaacaa tgtcgaaata tcaggcataa    1200
ttttgaagtg cattaatgaa ctggaatact ttggcttcct cacacgacct actttatctc    1260
tgattgagaa cgacacgagt gcagacaacg gcattctata tgccataatg catgaatcta    1320
tctactgcca agggtaaaac gtctctcctg atcgagtcaa tatcagaatc taacgtgata    1380
ccgtagggag gcctcaaact gggctgccga aagactacta ccaaagttct ctggcttccg    1440
aggcgctcat aatcctgatg gcatctactt cactggggag atggtataca aacactggtt    1500
tgagtcgtcc acagaactcg gccagctcaa agaggtagcc gatattcttg cttcctacaa    1560
tgactggccg cagttgtatg ataaggaaca gctcgcgcgc aacgaggtgc cagtgtattc    1620
cgctacatat gtcgaggata tgtacgtgca cttcagctac gccaacgaaa cagctgccac    1680
tattcacaat tgcaaacagt tcatcaccaa cacgatgtac cacaacggac tgcgttcaga    1740
ttccgctgaa cttattgcgc agctgtttgc tcttcgtgat gatacgattg actag         1795
<210>20
<211>1326
<212>DNA
<213>红色毛癣菌(T.rubrum)
<400>20
atgcaagcag caaaattgtt gagccggtac tggcaaaatg tacctggaag actgagggta      60
tctgagctcc ttttcgatgt ccctttagac tactcaaacc cgtcttccac ttcgctccgg     120
ttgttcgcca ggagtgtgca gcggcgaatt ccagggtcct ctctcgatga taaagacaga     180
cagctaccct ggattgtttt cctgcagggt ggaccaggag gagcttgccc acaacctcag     240
gaggtaggct gggttgggcc attgctggat cgaggattcc agatccttct ccttgaccag     300
cgaggaacag ggctttcaac ccctataacc gctgcgacgc ttgctcttca gggaaacgca     360
gtaaagcaag ccgaatatct taggctattc cgtgccgata atatcgtgcg agactgtgaa     420
gcagtgcgta aactattgac tgcttattac cctccagata agcagaaatg gagcgtcctt     480
ggccagagtt ttggaggatt ctgtgccgtc acgtatgttt ctaatcctga gggacttaaa     540
gaagtcttca caactggtgg attaccccct cttgtgtcaa agcctgatcc tgtgtacgag     600
aggacctacg acaaggtcca gtcccggaat aaagtgtact attccacttt ccccgaagac     660
gaagatcgag tgcggattat actcaagcat ctccaaaccc acgatgttaa gctccccgat     720
ggctcaccgt taactccgga acgctttctc cagctaggaa ttcattttgg aatgaaaggc     780
ataattttga agtgcattaa tgaactggaa tactttggct tcctcacacg acctacttta     840
tctctgattg agaacgacac gagtgcagac aacggcattc tatatgccat aatgcatgaa     900
tctatctact gccaagggga ggcctcaaac tgggctgccg aaagactact accaaagttc     960
tctggcttcc gaggcgctca taatcctgat ggcatctact tcactgggga gatggtatac    1020
aaacactggt ttgagtcgtc cacagaactc ggccagctca aagaggtagc cgatattctt    1080
gcttcctaca atgactggcc gcagttgtat gataaggaac agctcgcgcg caacgaggtg    1140
ccagtgtatt ccgctacata tgtcgaggat atgtacgtgc acttcagcta cgccaacgaa    1200
acagctgcca ctattcacaa ttgcaaacag ttcatcacca acacgatgta ccacaacgga    1260
ctgcgttcag attccgctga acttattgcg cagctgtttg ctcttcgtga tgatacgatt    1320
gactag                                                               1326
<210>21
<211>441
<212>PRT
<213>红色毛癣菌(T.rubrum)
<220>
<221>UNSURE
<222>(283)..(283)
<223>I
<400>21
Met Gln Ala Ala Lys Leu Leu Ser Arg Tyr Trp Gln Asn Val Pro Gly
1               5               10                  15
Arg Leu Arg Val Ser Glu Leu Leu Phe Asp Val Pro Leu Asp Tyr Ser
            20                  25                  30
Asn Pro Ser Ser Thr Ser Leu Arg Leu Phe Ala Arg Ser Val Gln Arg
        35                  40                  45
Arg Ile Pro Gly Ser Ser Leu Asp Asp Lys Asp Arg Gln Leu Pro Trp
    50                  55                  60
Ile Val Phe Leu Gln Gly Gly Pro Gly Gly Ala Cys Pro Gln Pro Gln
65                  70                  75                  80
Glu Val Gly Trp Val Gly Pro Leu Leu Asp Arg Gly Phe Gln Ile Leu
                85                  90                  95
Leu Leu Asp Gln Arg Gly Thr Gly Leu Ser Thr Pro Ile Thr Ala Ala
            100                 105                 110
Thr Leu Ala Leu Gln Gly Asn Ala Val Lys Gln Ala Glu Tyr Leu Arg
        115                 120                 125
Leu Phe Arg Ala Asp Asn Ile Val Arg Asp Cys Glu Ala Val Arg Lys
    130                 135                 140
Leu Leu Thr Ala Tyr Tyr Pro Pro Asp Lys Gln Lys Trp Ser Val Leu
145                 150                 155                 160
Gly Gln Ser Phe Gly Gly Phe Cys Ala Val Thr Tyr Val Ser Asn Pro
                165                 170                 175
Glu Gly Leu Lys Glu Val Phe Thr Thr Gly Gly Leu Pro Pro Leu Val
            180                 185                 190
Ser Lys Pro Asp Pro Val Tyr Glu Arg Thr Tyr Asp Lys Val Gln Ser
        195                 200                 205
Arg Asn Lys Val Tyr Tyr Ser Thr Phe Pro Glu Asp Glu Asp Arg Val
    210                 215                 220
Arg Ile Ile Leu Lys His Leu Gln Thr His Asp Val Lys Leu Pro Asp
225                 230                 235                 240
Gly Ser Pro Leu Thr Pro Glu Arg Phe Leu Gln Leu Gly Ile His Phe
                245                 250                 255
Gly Met Lys Gly Ile Ile Leu Lys Cys Ile Asn Glu Leu Glu Tyr Phe
            260                 265                 270
Gly Phe Leu Thr Arg Pro Thr Leu Ser Leu Ile Glu Asn Asp Thr Ser
        275                 280                 285
Ala Asp Asn Gly Ile Leu Tyr Ala Ile Met His Glu Ser Ile Tyr Cys
    290                 295                 300
Gln Gly Glu Ala Ser Asn Trp Ala Ala Glu Arg Leu Leu Pro Lys Phe
305                 310                 315                 320
Ser Gly Phe Arg Gly Ala His Asn Pro Asp Gly Ile Tyr Phe Thr Gly
                325                 330                 335
Glu Met Val Tyr Lys His Trp Phe Glu Ser Ser Thr Glu Leu Gly Gln
            340                 345                 350
Leu Lys Glu Val Ala Asp Ile Leu Ala Ser Tyr Asn Asp Trp Pro Gln
        355                 360                 365
Leu Tyr Asp Lys Glu Gln Leu Ala Arg Asn Glu Val Pro Val Tyr Ser
    370                 375                 380
Ala Thr Tyr Val Glu Asp Met Tyr Val His Phe Ser Tyr Ala Asn Glu
385                 390                 395                 400
Thr Ala Ala Thr Ile His Asn Cys Lys Gln Phe Ile Thr Asn Thr Met
                405                 410                 415
Tyr His Asn Gly Leu Arg Ser Asp Ser Ala Glu Leu Ile Ala Gln Leu
            420                 425                 430
Phe Ala Leu Arg Asp Asp Thr Ile Asp
        435                 440
<210>22
<211>2418
<212>DNA
<213>红色毛癣菌(T.rubrum)
<400>22
atgccgccac caccggttga cacgacccag cgtctcgcaa agctgcgaga gctgatggct      60
cagaacaagg tcgatgtata tagtatgcaa ttcagataca ccattaaagc tcccttgata     120
ataacagtcg tatactcatt cttctttctt ctactcctcg ccttaaagtt gtgccttcgg     180
aagacagcca tcagtcggag tacattgctc catgtgatgg gcgtcgaggt tagacctgtc     240
cctccataaa agaataccta cccgtaatac cagccggcag acgctcatac gtatcactgc     300
agctttcata tccagcttca ctggctcggc aggatgtgcc atcgtctcta tgagtaaagc     360
tgctctgtct acagacggca gatacttcag ccaagctgca aaacagctcg atgccaactg     420
gatcctgttg aagcgaggtg tcgagggtgt cccaacctgg gaagaatggt atatctgccc     480
ctggtatcga cttttccggt ataatggttg acaggctgga tataggaccg ctgagcaggc     540
cgagacacgg caaggttgtg ggtgttgacc cgtcacttat tacggcaggt gagaatctac     600
agtatgcgtc tcttacaagt gtcatcgtga ctaactgtat gttatagcgg atgcacgaaa     660
gctttctcag acgttgaaga ccaccggagg ctccttggtt ggaattgatc agaacctgat     720
tgatgccgtc tggggagatg aacgtcctgc acggcctgcc aaccaaatta cggtacagcc     780
tgttgagcgc gcgggaaagt cattcgagga gaaagtggaa gacctgcgaa aggaattgac     840
tgcgaagaag aggtctgcta tggttatttg tatgacgcta gatctatttt tgatcaaaca     900
tatactaaca aacgcaatat agccaccttg gatgagattg catggctctt caacctccgt     960
ggaagcgagt aagtttctat ataaatggta tctttcactt tatacaaaaa gccatgctga    1020
ctggtgtagt attccatata accccgtctt tttctcgtac gcaattgtga cgccctcagt    1080
tgcggaactc tatgtcgatg agagcaagct gtctccagaa gccagaaaac atctcgaagg    1140
caaggtcgtt ctcaagccat acgagtccat cttccaagct tccaaagtcc tcgccgaatc    1200
aaaggcatcg gctagcagcg gttcctctgg gaagttcttg ttgtctaaca aggcttcgtg    1260
gtctttgagc ctcgccctcg gtggggaaca gaacgtcgtt gaggttcgaa gtcccatcac    1320
tgacgccaaa gccatcaaga acgaagttga actggaagga ttcagaaaat gccatatccg    1380
agacggtgca gctctgatcg agtacttcgc ctggcttgaa aatgcattga tcaaagaagg    1440
tgccaagcta gacgaagtag atggagccga caaactcttc gagatccgca agaaatatga    1500
cctcttcgtc ggcaactcct tcgacaccat ctcttctacc ggtgctaacg gtgctaccat    1560
tcattacaaa cccgagaagt caacttgcgc tatcattgac ccgaaggcta tgtacctgtg    1620
tgactctggt ggccaatacc ttgatggtac tactgatact acccgaactc tccactttgg    1680
agagcccacg gagttccaga agaaggctta tgcacttgtt ctaaagggac atatcagcat    1740
tgacaatgcc attttcccca aaggaaccac cggatacgcc attgactcgt ttgctcgaca    1800
gcatttgtgg aaggagggtc tggattacct ccacggcacc ggtcatggtg ttggctcatt    1860
tttggtacgg ggtttccttt ttcttttttt tttctttttt tatttttatt attacttctc    1920
ttaggctaac acattctctc taagaacgtc catgagggac ctatgggcat aggaagccgt    1980
gctcagtacg ctgaagttcc tctctctgcc agcaatgttc tttccaacgg taggatttct    2040
gcatctcatc tttcttgaat cctactaatt gcaaaataga gcctggatat tatgaagacg    2100
gcaacttcgg cattcgtctc gagagtaagt tcaatgactg cgtattctag ttttttcata    2160
ctgacggcct ctttagacct cgtaatctgc aaggaggtcc agactgcaca caaattcggc    2220
gacaagccct tcctcggatt tgagtccatc accctggtac ctttctgcca aaaactcctt    2280
gatgcttctc tcttgaccga agctgagaga aagtgggtga atgattacca tgcgaaagtc    2340
tgggagaaga ccagtccctt ctttgagaag gacgagttaa caaccgcctg gctaaagcgc    2400
gagacacaac ctatttaa                                                  2418
<210>23
<211>1878
<212>DNA
<213>红色毛癣菌(T.rubrum)
<400>23
atgccgccac caccggttga cacgacccag cgtctcgcaa agctgcgaga gctgatggct      60
cagaacaagg tcgatgtata tattgtgcct tcggaagaca gccatcagtc ggagtacatt     120
gctccatgtg atgggcgtcg agctttcata tccagcttca ctggctcggc aggatgtgcc     180
atcgtctcta tgagtaaagc tgctctgtct acagacggca gatacttcag ccaagctgca     240
aaacagctcg atgccaactg gatcctgttg aagcgaggtg tcgagggtgt cccaacctgg     300
gaagaatgga ccgctgagca ggccgagaca cggcaaggtt gtgggtcgga tgcacgaaag     360
ctttctcaga cgttgaagac caccggaggc tccttggttg gaattgatca gaacctgatt     420
gatgccgtct ggggagatga acgtcctgca cggcctgcca accaaattac ggtacagcct     480
gttgagcgcg cgggaaagtc attcgaggag aaagtggaag acctgcgaaa ggaattgact     540
gcgaagaaga ggtctgctat ggttatttcg agtaagtttc tatataaatg gtatctttca     600
ctttatacaa aaagccatgc tgactggtgt agtattccat ataaccccgt ctttttctcg     660
tacgcaattg tgacgccctc agttgcggaa ctctatgtcg atgagagcaa gctgtctcca     720
gaagccagaa aacatctcga aggcaaggtc gttctcaagc catacgagtc catcttccaa     780
gcttccaaag tcctcgccga atcaaaggca tcggctagca gcggttcctc tgggaagttc     840
ttgttgtcta acaaggcttc gtggtctttg agcctcgccc tcggtgggga acagaacgtc     900
gttgaggttc gaagtcccat cactgacgcc aaagccatca agaacgaagt tgaactggaa     960
ggattcagaa aatgccatat ccgagacggt gcagctctga tcgagtactt cgcctggctt    1020
gaaaatgcat tgatcaaaga aggtgccaag ctagacgaag tagatggagc cgacaaactc    1080
ttcgagatcc gcaagaaata tgacctcttc gtcggcaact ccttcgacac catctcttct    1140
accggtgcta acggtgctac cattcattac aaacccgaga agtcaacttg cgctatcatt    1200
gacccgaagg ctatgtacct gtgtgactct ggtggccaat accttgatgg tactactgat    1260
actacccgaa ctctccactt tggagagccc acggagttcc agaagaaggc ttatgcactt    1320
gttctaaagg gacatatcag cattgacaat gccattttcc ccaaaggaac caccggatac    1380
gccattgact cgtttgctcg acagcatttg tggaaggagg gtctggatta cctccacggc    1440
accggtcatg gtgttggctc atttttgaac gtccatgagg gacctatggg cataggaagc    1500
cgtgctcagt acgctgaagt tcctctctct gccagcaata gcctggatat tatgaagacg    1560
gcaacttcgg cattcgtctc gagagtaagt tcaatgactg cgtattctag ttttttcata    1620
ctgacggcct ctttagacct cgtaatctgc aaggaggtcc agactgcaca caaattcggc    1680
gacaagccct tcctcggatt tgagtccatc accctggtac ctttctgcca aaaactcctt    1740
gatgcttctc tcttgaccga agctgagaga aagtgggtga atgattacca tgcgaaagtc    1800
tgggagaaga ccagtccctt ctttgagaag gacgagttaa caaccgcctg gctaaagcgc    1860
gagacacaac ctatttaa                                                  1878
<210>24
<211>625
<212>PRT
<213>红色毛癣菌(T.rubrum)
<400>24
Met Pro Pro Pro Pro Val Asp Thr Thr Gln Arg Leu Ala Lys Leu Arg
1               5                   10                  15
Glu Leu Met Ala Gln Asn Lys Val Asp Val Tyr Ile Val Pro Ser Glu
            20                  25                  30
Asp Ser His Gln Ser Glu Tyr Ile Ala Pro Cys Asp Gly Arg Arg Ala
        35                  40                  45
Phe Ile Ser Ser Phe Thr Gly Ser Ala Gly Cys Ala Ile Val Ser Met
    50                  55                  60
Ser Lys Ala Ala Leu Ser Thr Asp Gly Arg Tyr Phe Ser Gln Ala Ala
65                  70                  75                  80
Lys Gln Leu Asp Ala Asn Trp Ile Leu Leu Lys Arg Gly Val Glu Gly
                85                  90                  95
Val Pro Thr Trp Glu Glu Trp Thr Ala Glu Gln Ala Glu Thr Arg Gln
            100                 105                 110
Gly Cys Gly Ser Asp Ala Arg Lys Leu Ser Gln Thr Leu Lys Thr Thr
        115                 120                 125
Gly Gly Ser Leu Val Gly Ile Asp Gln Asn Leu Ile Asp Ala Val Trp
    130                 135                 140
Gly Asp Glu Arg Pro Ala Arg Pro Ala Asn Gln Ile Thr Val Gln Pro
145                 150                 155                 160
Val Glu Arg Ala Gly Lys Ser Phe Glu Glu Lys Val Glu Asp Leu Arg
                165                 170                 175
Lys Glu Leu Thr Ala Lys Lys Arg Ser Ala Met Val Ile Ser Ser Lys
            180                 185                 190
Phe Leu Tyr Lys Trp Tyr Leu Ser Leu Tyr Thr Lys Ser His Ala Asp
        195                 200                 205
Trp Cys Ser Ile Pro Tyr Asn Pro Val Phe Phe Ser Tyr Ala Ile Val
    210                 215                 220
Thr Pro Ser Val Ala Glu Leu Tyr Val Asp Glu Ser Lys Leu Ser Pro
225                 230                 235                 240
Glu Ala Arg Lys His Leu Glu Gly Lys Val Val Leu Lys Pro Tyr Glu
                245                 250                 255
Ser Ile Phe Gln Ala Ser Lys Val Leu Ala Glu Ser Lys Ala Ser Ala
            260                 265                 270
Ser Ser Gly Ser Ser Gly Lys Phe Leu Leu Ser Asn Lys Ala Ser Trp
        275                 280                 285
Ser Leu Ser Leu Ala Leu Gly Gly Glu Gln Asn Val Val Glu Val Arg
    290                 295                 300
Ser Pro Ile Thr Asp Ala Lys Ala Ile Lys Asn Glu Val Glu Leu Glu
305                 310                 315                 320
Gly Phe Arg Lys Cys His Ile Arg Asp Gly Ala Ala Leu Ile Glu Tyr
                325                 330                 335
Phe Ala Trp Leu Glu Asn Ala Leu Ile Lys Glu Gly Ala Lys Leu Asp
            340                 345                 350
Glu Val Asp Gly Ala Asp Lys Leu Phe Glu Ile Arg Lys Lys Tyr Asp
        355                 360                 365
Leu Phe Val Gly Asn Ser Phe Asp Thr Ile Ser Ser Thr Gly Ala Asn
    370                 375                 380
Gly Ala Thr Ile His Tyr Lys Pro Glu Lys Ser Thr Cys Ala Ile Ile
385                 390                 395                 400
Asp Pro Lys Ala Met Tyr Leu Cys Asp Ser Gly Gly Gln Tyr Leu Asp
                405                 410                 415
Gly Thr Thr Asp Thr Thr Arg Thr Leu His Phe Gly Glu Pro Thr Glu
            420                 425                 430
Phe Gln Lys Lys Ala Tyr Ala Leu Val Leu Lys Gly His Ile Ser Ile
        435                 440                 445
Asp Asn Ala Ile Phe Pro Lys Gly Thr Thr Gly Tyr Ala Ile Asp Ser
    450                 455                 460
Phe Ala Arg Gln His Leu Trp Lys Glu Gly Leu Asp Tyr Leu His Gly
465                 470                 475                 480
Thr Gly His Gly Val Gly Ser Phe Leu Asn Val His Glu Gly Pro Met
                485                 490                 495
Gly Ile Gly Ser Arg Ala Gln Tyr Ala Glu Val Pro Leu Ser Ala Ser
            500                 505                 510
Asn Ser Leu Asp Ile Met Lys Thr Ala Thr Ser Ala Phe Val Ser Arg
        515                 520                 525
Val Ser Ser Met Thr Ala Tyr Ser Ser Phe Phe Ile Leu Thr Ala Ser
    530                 535                 540
Leu Asp Leu Val Ile Cys Lys Glu Val Gln Thr Ala His Lys Phe Gly
545                 550                 555                 560
Asp Lys Pro Phe Leu Gly Phe Glu Ser Ile Thr Leu Val Pro Phe Cys
                565                 570                 575
Gln Lys Leu Leu Asp Ala Ser Leu Leu Thr Glu Ala Glu Arg Lys Trp
            580                 585                 590
Val Asn Asp Tyr His Ala Lys Val Trp Glu Lys Thr Ser Pro Phe Phe
        595                 600                 605
Glu Lys Asp Glu Leu Thr Thr Ala Trp Leu Lys Arg Glu Thr Gln Pro
    610                 615                 620
Ile
625
<210>25
<211>2344
<212>DNA
<213>红色毛癣菌(T.rubrum)
<400>25
atcaacctca cctcttcacc gtctcacgcc cttcgtcccg tccaactctt catttcgccc      60
tctctatgat aaccaacaaa catccgctgt tatgtaatcg aacccgccgt tagccatccc     120
tagccccgcg ttttctccca gcatcaatac gaccgaaatg aagacagacg gggaagacga     180
ggcaaaacaa taacacatca acaatttaac ccgttgccgt cttctaccca tcttgtctac     240
gcatcgtcca accttttctt gccctatatc agccgaactc ggccatcatg gatatccacg     300
tcgacaaata cccggctaag agtcacgcca ggcgcgtcgc cgagaagctc aaggccgcgg     360
ggcacggctc taccggcatc atcttcgtcg aaggccaaaa ggagcatatt atcgatgata     420
gcgacgagcc gtttcacttc cggtgagccg tgggaataca ctcgactggg cggaataagc     480
taacaaaagg gtgtgatagt caacgccgaa acttcctcta tctgtccggc tgtcttgagg     540
ccgagtgctc cgttgcatac aacatcgaga aagatgagct tacattgttc attccaccag     600
tcgacccagc ctcggttatg tggtccggcc tccctcttga gcccgccgaa gccttgaagc     660
agttcgatgt tgatgccgtg ctcctcacaa ctgagataaa caactatctc gcgaagtgtg     720
ggggcgagaa ggtcttcacc attgcagaca gagtttgccc ggaggtctcc ttctcatcct     780
tcaagcacaa cgacaccgat gccctgaagc ttgccatcga gtcctgccgt atagtgaaag     840
acgagtatga aattggtctt ctccgacgtg ctaatgaggt ctccagccaa gctcatattg     900
aagtgatgaa agccgcaacc aagtcaaaga acgagagaga gctctatgct actctcaact     960
atgtctgcat gtctaatggc tgctccgacc agtcttacca tccaattctt gcatgtggcc    1020
ccaatgctgc cactctccac tacaccaaga acaacggtga cctaactaac ccggctaccg    1080
ggattaagga ccagctcgta cttatcgacg ctggatgcca gtacaaggcg tactgtgcag    1140
atatcactcg tgcattcccc ttgtccggca aattcaccac ggagggccgc cagatctatg    1200
atattgcctt ggagatgcag aaagtcgcgt ttggcatgat caaacctaat gttttgttcg    1260
acgacatgca tgctgcggtc caccgggttg cgatcaaggg gctgctcaag attggcattc    1320
tcactggctc tgaggatgag attttcgata agggaatcag cactgccttt ttcccacatg    1380
gtctaggcca ccatctcggc atggacactc acgatgttgg aggaaaccct aacccggctg    1440
acccgaatcg catgtttaaa tacttgcgtc tgcgaggcac tgttccagag ggatccgtca    1500
ttacaattga gcccggtgta agtgttgaat cgagtagttg ctccgccgaa tgtttcacat    1560
acatttacta acccttgctc taggtctact tctgccgtta catcattgag ccattcctta    1620
ctaaccccga gaccagcaag tacatcaact ccgaagttct agacaagtac tgggctgttg    1680
gaggtgtacg tatcgaggac aacgtcgtcg tccgcgccaa tggctttgag aacctgacca    1740
cggtgccaaa ggagcccgag gaggtcgaac gcattgtcca ggagggtgct aaataattat    1800
gtttttattc agtacaccga gtggtcggac acacgcagga gcatgtacat atttatgatc    1860
tacccagttg atttgctacc aaaaaagaac cgaccacagc cctatttatt gatattacat    1920
agtaggaata aaggccactt tgcccaccgc gaataataac aataagaaaa gcaactactc    1980
gtacaaccag cctagaaagc tctagacctc tttctcgctg ggcccttgaa tgccgggcta    2040
ctggtgttat cacgctccct ggccctcttc tccttcatgt ccaacacccg attaagcaaa    2100
tcgaaactga actggggatg ctcaagacac aatgccttga actgctcttc agcatcatga    2160
cgcagcacat cactcatctt agcccagaag cgagcaaccg gtcctctgat agcagtgtct    2220
tccggcgtgg tatggctgta cacgtatctc gcatactcga tctcacccgt agcactactc    2280
tcgatgctac caatcttgtt ctgagcaagc agtttgagtt tttcgtttcc gagcttttcg    2340
gcca                                                                 2344
<210>26
<211>1401
<212>DNA
<213>红色毛癣菌(T.rubrum)
<400>26
ccgaactcgg ccatcatgga tatccacgtc gacaaatacc cggctaagag tcacgccagg      60
cgcgtcgccg agaagctcaa ggccgcgggg cacggctcta ccggcatcat cttcgtcgaa     120
ggccaaaagg agcatattat cgatgatagc gacgagccgt ttcacttccg tcaacgccga     180
aacttcctct atctgtccgg ctgtcttgag gccgagtgct ccgttgcata caacatcgag     240
aaagatgagc ttacattgtt cattccacca gtcgacccag cctcggttat gtggtccggc     300
ctccctcttg agcccgccga agccttgaag cagttcgatg ttgatgccgt gctcctcaca     360
actgagataa acaactatct cgcgaagtgt gggggcgaga aggtcttcac cattgcagac     420
agagtttgcc cggaggtctc cttctcatcc ttcaagcaca acgacaccga tgccctgaag     480
cttgccatcg agtcctgccg tatagtgaaa gacgagtatg aaattggtct tctccgacgt     540
gctaatgagg tctccagcca agctcatatt gaagtgatga aagccgcaac caagtcaaag     600
aacgagagag agctctatgc tactctcaac tatgtctgca tgtctaatgg ctgctccgac     660
cagtcttacc atccaattct tgcatgtggc cccaatgctg ccactctcca ctacaccaag     720
aacaacggtg acctaactaa cccggctacc gggattaagg accagctcgt acttatcgac     780
gctggatgcc agtacaaggc gtactgtgca gatatcactc gtgcattccc cttgtccggc     840
aaattcacca cggagggccg ccagatctat gatattgcct tggagatgca gaaagtcgcg     900
tttggcatga tcaaacctaa tgttttgttc gacgacatgc atgctgcggt ccaccgggtt     960
gcgatcaagg ggctgctcaa gattggcatt ctcactggct ctgaggatga gattttcgat    1020
aagggaatca gcactgcctt tttcccacat ggtctaggcc accatctcgg catggacact    1080
cacgatgttg gaggaaaccc taacccggct gacccgaatc gcatgtttaa atacttgcgt    1140
ctgcgaggca ctgttccaga gggatccgtc attacaattg agcccggtgt ctacttctgc    1200
cgttacatca ttgagccatt ccttactaac cccgagacca gcaagtacat caactccgaa    1260
gttctagaca agtactgggc tgttggaggt gtacgtatcg aggacaacgt cgtcgtccgc    1320
gccaatggct ttgagaacct gaccacggtg ccaaaggagc ccgaggaggt cgaacgcatt    1380
gtccaggagg gtgctaaata a                                              1401
<210>27
<211>466
<212>PRT
<213>红色毛癣菌(T.rubrum)
<400>27
Pro Asn Ser Ala Ile Met Asp Ile His Val Asp Lys Tyr Pro Ala Lys
1               5                   10                  15
Ser His Ala Arg Arg Val Ala Glu Lys Leu Lys Ala Ala Gly His Gly
            20                  25                  30
Ser Thr Gly Ile Ile Phe Val Glu Gly Gln Lys Glu His Ile Ile Asp
        35                  40                  45
Asp Ser Asp Glu Pro Phe His Phe Arg Gln Arg Arg Asn Phe Leu Tyr
    50                  55                  60
Leu Ser Gly Cys Leu Glu Ala Glu Cys Ser Val Ala Tyr Asn Ile Glu
65                  70                  75                  80
Lys Asp Glu Leu Thr Leu Phe Ile Pro Pro Val Asp Pro Ala Ser Val
                85                  90                  95
Met Trp Ser Gly Leu Pro Leu Glu Pro Ala Glu Ala Leu Lys Gln Phe
            100                 105                 110
Asp Val Asp Ala Val Leu Leu Thr Thr Glu Ile Asn Asn Tyr Leu Ala
        115                 120                 125
Lys Cys Gly Gly Glu Lys Val Phe Thr Ile Ala Asp Arg Val Cys Pro
    130                 135                 140
Glu Val Ser Phe Ser Ser Phe Lys His Asn Asp Thr Asp Ala Leu Lys
145                 150                 155                 160
Leu Ala Ile Glu Ser Cys Arg Ile Val Lys Asp Glu Tyr Glu Ile Gly
                165                 170                 175
Leu Leu Arg Arg Ala Asn Glu Val Ser Ser Gln Ala His Ile Glu Val
            180                 185                 190
Met Lys Ala Ala Thr Lys Ser Lys Asn Glu Arg Glu Leu Tyr Ala Thr
        195                 200                 205
Leu Asn Tyr Val Cys Met Ser Asn Gly Cys Ser Asp Gln Ser Tyr His
    210                 215                 220
Pro Ile Leu Ala Cys Gly Pro Asn Ala Ala Thr Leu His Tyr Thr Lys
225                 230                 235                 240
Asn Asn Gly Asp Leu Thr Asn Pro Ala Thr Gly Ile Lys Asp Gln Leu
                245                 250                 255
Val Leu Ile Asp Ala Gly Cys Gln Tyr Lys Ala Tyr Cys Ala Asp Ile
            260                 265                 270
Thr Arg Ala Phe Pro Leu Ser Gly Lys Phe Thr Thr Glu Gly Arg Gln
        275                 280                 285
Ile Tyr Asp Ile Ala Leu Glu Met Gln Lys Val Ala Phe Gly Met Ile
    290                 295                 300
Lys Pro Asn Val Leu Phe Asp Asp Met His Ala Ala Val His Arg Val
305                 310                 315                 320
Ala Ile Lys Gly Leu Leu Lys Ile Gly Ile Leu Thr Gly Ser Glu Asp
                325                 330                 335
Glu Ile Phe Asp Lys Gly Ile Ser Thr Ala Phe Phe Pro His Gly Leu
            340                 345                 350
Gly His His Leu Gly Met Asp Thr His Asp Val Gly Gly Asn Pro Asn
        355                 360                 365
Pro Ala Asp Pro Asn Arg Met Phe Lys Tyr Leu Arg Leu Arg Gly Thr
    370                 375                 380
Val Pro Glu Gly Ser Val Ile Thr Ile Glu Pro Gly Val Tyr Phe Cys
385                 390                 395                 400
Arg Tyr Ile Ile Glu Pro Phe Leu Thr Asn Pro Glu Thr Ser Lys Tyr
                405                 410                 415
Ile Asn Ser Glu Val Leu Asp Lys Tyr Trp Ala Val Gly Gly Val Arg
            420                 425                 430
Ile Glu Asp Asn Val Val Val Arg Ala Asn Gly Phe Glu Asn Leu Thr
        435                 440                 445
Thr Val Pro Lys Glu Pro Glu Glu Val Glu Arg Ile Val Gln Glu Gly
    450                 455                 460
Ala Lys
465
<210>28
<211>1730
<212>DNA
<213>犬小孢子菌(Microsporum canis)
<400>28
atgaagacac agttgttgag tctgggagtt gccctcacgg ccatctctca gggcgttatt      60
gctgaggatg ccttgaactg gccattcaag ccgttggtta atgctgtgag tatatacaca     120
agatcgatcg atcgtcctct tgtccctgtc acttatcgct ctacagtaag caaaaatact     180
ggagaatcat gtgctgatgt aaatgtatag gatgacctgc aaaacaagat taagctcaag     240
gatcttatgg ctggcgtaca gaaactccaa gacttcgcct acgctcaccc tgagaagaat     300
cgagtattcg gtggtgctgg ccacaaggat accgtcgact ggatctacaa tgagctcaag     360
gctaccggct actacgatgt gaagatgcag ccacaagtcc acctgtggtc tcatgctgag     420
gcagctgtca atgccaatgg caaggatctc actgccagtg ccatgtccta cagccctcca     480
gccgacaaga tcactgccga gcttgtcctg gccaagaaca tgggatgcaa tgctgtatgt     540
gcgccccttt tccattctat atatcgactg gtcgcttgga aattcagaag agctgacaat     600
tgcaaacaga ctgattaccc agagggtacc aagggcaaga ttgtcctcat cgagcgtggt     660
gtctgcagct ttggcgagaa gtccgctcag gctggcgatg caaaggctat tggtgccatc     720
gtctacaaca acgtccctgg aagcttggcc ggcaccctgg gtggccttga caaccgccat     780
gctccaactg ctggaatctc tcaggctgat ggaaagaacc tcgctagcct tgtcgcctct     840
ggcaaggtta ccgtcaccat gaacgttatc agcaagtttg agaacaggac tacgtgagta     900
ttgttccata ctttggtcaa caatgatata tacacgtact aacactgctc tatagctgga     960
acgtcattgc cgagaccaag ggaggagacc acaacaacgt catcatgctc ggttctcact    1020
ctgactctgt cgacgccggc cctggtatca acgacaacgg ctccggtacc attggtatca    1080
tgaccgttgc caaagccctc accaacttca aggtcaacaa cgccgtccgc ttcggctggt    1140
ggaccgccga ggagttcggc cttctcggca gcactttcta cgtcgacagc cttgacgacc    1200
gtgaactgca caaggtcaag ctgtacctca acttcgacat gattggctcc cccaacttcg     1260
ccaaccagat ctacgacgga gacggctccg cctacaacat gactggcccc gccggatctg     1320
ctgaaatcga gtacctgttc gagaagttct tcgatgacca gggaatccca caccagccca     1380
ccgccttcac cggccgctcc gactactctg ccttcatcaa gcgcaacgtc cctgccggag     1440
gtctgtttac tggtgctgag gtcgtcaaga ccgccgagca ggctaagcta tttggcggcg     1500
aggctggcgt tgcttatgac aagaactacc acggcaaggg cgacactgta gacaacatca     1560
acaagggtgc tatctacctc aacactcgag gaatcgcgta tgccactgct cagtatgcta     1620
gttcgctgcg cggattccca acccgcccaa agacgggtaa gcgtgacgtg agcccccgtg     1680
gccagtctat gcctggtggt ggatgcggac accacagcgt cttcatgtaa                1730
<210>29
<211>1488
<212>DNA
<213>犬小孢子菌(Microsporum canis)
<400>29
atgaagacac agttgttgag tctgggagtt gccctcacgg ccatctctca gggcgttatt      60
gctgaggatg ccttgaactg gccattcaag ccgttggtta atgctgatga cctgcaaaac     120
aagattaagc tcaaggatct tatggctggc gtacagaaac tccaagactt cgcctacgct     180
caccctgaga agaatcgagt attcggtggt gctggccaca aggataccgt cgactggatc     240
tacaatgagc tcaaggctac cggctactac gatgtgaaga tgcagccaca agtccacctg     300
tggtctcatg ctgaggcagc tgtcaatgcc aatggcaagg atctcactgc cagtgccatg     360
tcctacagcc ctccagccga caagatcact gccgagcttg tcctggccaa gaacatggga     420
tgcaatgcta ctgattaccc agagggtacc aagggcaaga ttgtcctcat cgagcgtggt     480
gtctgcagct ttggcgagaa gtccgctcag gctggcgatg caaaggctat tggtgccatc     540
gtctacaaca acgtccctgg aagcttggcc ggcaccctgg gtggccttga caaccgccat     600
gctccaactg ctggaatctc tcaggctgat ggaaagaacc tcgctagcct tgtcgcctct     660
ggcaaggtta ccgtcaccat gaacgttatc agcaagtttg agaacaggac tacctggaac     720
gtcattgccg agaccaaggg aggagaccac aacaacgtca tcatgctcgg ttctcactct     780
gactctgtcg acgccggccc tggtatcaac gacaacggct ccggtaccat tggtatcatg     840
accgttgcca aagccctcac caacttcaag gtcaacaacg ccgtccgctt cggctggtgg     900
accgccgagg agttcggcct tctcggcagc actttctacg tcgacagcct tgacgaccgt     960
gaactgcaca aggtcaagct gtacctcaac ttcgacatga ttggctcccc caacttcgcc    1020
aaccagatct acgacggaga cggctccgcc tacaacatga ctggccccgc cggatctgct    1080
gaaatcgagt acctgttcga gaagttcttc gatgaccagg gaatcccaca ccagcccacc    1140
gccttcaccg gccgctccga ctactctgcc ttcatcaagc gcaacgtccc tgccggaggt    1200
ctgtttactg gtgctgaggt cgtcaagacc gccgagcagg ctaagctatt tggcggcgag    1260
gctggcgttg cttatgacaa gaactaccac ggcaagggcg acactgtaga caacatcaac    1320
aagggtgcta tctacctcaa cactcgagga atcgcgtatg ccactgctca gtatgctagt    1380
tcgctgcgcg gattcccaac ccgcccaaag acgggtaagc gtgacgtgag cccccgtggc    1440
cagtctatgc ctggtggtgg atgcggacac cacagcgtct tcatgtaa                 1488
<210>30
<211>495
<212>PRT
<213>犬小孢子菌(Microsporum canis)
<400>30
Met Lys Thr Gln Leu Leu Ser Leu Gly Val Ala Leu Thr Ala Ile Ser
1               5                   10                  15
Gln Gly Val Ile Ala Glu Asp Ala Leu Asn Trp Pro Phe Lys Pro Leu
            20                  25                  30
Val Asn Ala Asp Asp Leu Gln Asn Lys Ile Lys Leu Lys Asp Leu Met
        35                  40                  45
Ala Gly Val Gln Lys Leu Gln Asp Phe Ala Tyr Ala His Pro Glu Lys
    50                  55                  60
Asn Arg Val Phe Gly Gly Ala Gly His Lys Asp Thr Val Asp Trp Ile
65                  70                  75                  80
Tyr Asn Glu Leu Lys Ala Thr Gly Tyr Tyr Asp Val Lys Met Gln Pro
                85                  90                  95
Gln Val His Leu Trp Ser His Ala Glu Ala Ala Val Asn Ala Asn Gly
            100                 105                 110
Lys Asp Leu Thr Ala Ser Ala Met Ser Tyr Ser Pro Pro Ala Asp Lys
        115                 120                 125
Ile Thr Ala Glu Leu Val Leu Ala Lys Asn Met Gly Cys Asn Ala Thr
    130                 135                 140
Asp Tyr Pro Glu Gly Thr Lys Gly Lys Ile Val Leu Ile Glu Arg Gly
145                 150                 155                 160
Val Cys Ser Phe Gly Glu Lys Ser Ala Gln Ala Gly Asp Ala Lys Ala
                165                 170                 175
Ile Gly Ala Ile Val Tyr Asn Asn Val Pro Gly Ser Leu Ala Gly Thr
            180                 185                 190
Leu Gly Gly Leu Asp Asn Arg His Ala Pro Thr Ala Gly Ile Ser Gln
        195                 200                 205
Ala Asp Gly Lys Asn Leu Ala Ser Leu Val Ala Ser Gly Lys Val Thr
    210                 215                 220
Val Thr Met Asn Val Ile Ser Lys Phe Glu Asn Arg Thr Thr Trp Asn
225                 230                 235                 240
Val Ile Ala Glu Thr Lys Gly Gly Asp His Asn Asn Val Ile Met Leu
                245                 250                 255
Gly Ser His Ser Asp Ser Val Asp Ala Gly Pro Gly Ile Asn Asp Asn
            260                 265                 270
Gly Ser Gly Thr Ile Gly Ile Met Thr Val Ala Lys Ala Leu Thr Asn
        275                 280                 285
Phe Lys Val Asn Asn Ala Val Arg Phe Gly Trp Trp Thr Ala Glu Glu
    290                 295                 300
Phe Gly Leu Leu Gly Ser Thr Phe Tyr Val Asp Ser Leu Asp Asp Arg
305                 310                 315                 320
Glu Leu His Lys Val Lys Leu Tyr Leu Asn Phe Asp Met Ile Gly Ser
                325                 330                 335
Pro Asn Phe Ala Asn Gln Ile Tyr Asp Gly Asp Gly Ser Ala Tyr Asn
            340                 345                 350
Met Thr Gly Pro Ala Gly Ser Ala Glu Ile Glu Tyr Leu Phe Glu Lys
        355                 360                 365
Phe Phe Asp Asp Gln Gly Ile Pro His Gln Pro Thr Ala Phe Thr Gly
    370                 375                 380
Arg Ser Asp Tyr Ser Ala Phe Ile Lys Arg Asn Val Pro Ala Gly Gly
385                 390                 395                 400
Leu Phe Thr Gly Ala Glu Val Val Lys Thr Ala Glu Gln Ala Lys Leu
                405                 410                 415
Phe Gly Gly Glu Ala Gly Val Ala Tyr Asp Lys Asn Tyr His Gly Lys
            420                 425                 430
Gly Asp Thr Val Asp Asn Ile Asn Lys Gly Ala Ile Tyr Leu Asn Thr
        435                 440                 445
Arg Gly Ile Ala Tyr Ala Thr Ala Gln Tyr Ala Ser Ser Leu Arg Gly
    450                 455                 460
Phe Pro Thr Arg Pro Lys Thr Gly Lys Arg Asp Val Ser Pro Arg Gly
465                 470                 475                 480
Gln Ser Met Pro Gly Gly Gly Cys Gly His His Ser Val Phe Met
                485                 490                 495
<210>31
<211>1775
<212>DNA
<213>须癣毛癣菌(T.mentagrophytes)
<400>31
atgaagtcgc aactgttgag cctagccgtg gccgtcacca ccatttccca gggcgttgtt      60
ggtcaagagc cctttggatg gcccttcaag cctatggtca ctcaggtgag ttgctgtcaa     120
cagatcgatc gatcgatcta ccttcgtccc tgtcacctat aactccacag caggaccaag     180
aaaacacaag ttttccgggg aattcttatg tgctgatgta aatgtatagg atgacctgca     240
aaacaagatt aagctcaagg atatcatggc aggtgtcgag aagctgcaaa gcttttctga     300
tgctcatcct gaaaagaacc gagtgttcgg tggtaatggc cacaaggaca ctgtcgagtg     360
gatctacaat gagctcaagg ccaccggcta ctacaatgtg aagaagcagg agcaggtaca     420
cctgtggtct cacgctgagg ccgctctcag tgccaatggc aaggacctca aggccagcgc     480
catgtcgtac agccctcctg ccaacaagat catggccgag cttgtcgttg ccaagaacaa     540
tggctgcaat gctgtaagtg ccatacactt cctatacatc acattcactt tagaatgaag     600
agcgcgggag aactgatttt tttttttttt tttttttttt tgtaacagac cgattaccca     660
gagaacactc agggaaagat agtcctcatt cagcgtggtg tctgcagctt cggcgagaag     720
tcttctcagg ctggtgatgc gaaggctatt ggtgccgttg tctacaacaa cgtccccgga     780
tcccttgctg gcactcttgg tggccttgac aagcgccatg tcccaaccgc tggtctttcc     840
caggaggatg gaaagaatct tgctagcctc gttgcttctg gcaaggttga tgtcaccatg     900
aacgttgtca gtctgtttga gaaccgaacc acgtaagtaa ctcaacgtca tatccagcat     960
taatcttcag gagtatatat actaattcgg tatctcacag ctggaacgtc attgctgaga    1020
ccaagggagg agaccacaac aatgttgtca tgcttggtgc tcactccgac tccgtcgatg    1080
ccggccccgg tatcaacgac aacggctccg gctccattgg tatcatgacc gttgccaaag    1140
cccttactaa cttcaagctc aacaacgccg ttcgctttgc ctggtggacc gctgaggaat    1200
tcggtctcct tggaagcacc ttctacgtcg acagccttga tgaccgtgag ctgcacaagg    1260
tcaagctgta cctcaacttc gacatgatcg gctctcccaa cttcgccaac cagatctacg    1320
acggtgacgg ttcggcctac aacatgactg gtcccgctgg ctctgctgaa atcgagtacc    1380
tgttcgagaa gttctttgac gaccagggtc tcccacacca gcccactgcc ttcaccggcc    1440
gatccgacta ctctgcattc atcaagcgca acgtccccgc tggaggtctt ttcactggtg    1500
ccgaggttgt caagaccccc gagcaagtta agctgttcgg tggtgaggct ggcgttgcct    1560
atgacaagaa ctaccatggc aagggtgaca ccgttgccaa catcaacaag ggagctatct    1620
tccttaacac tcgagcaatc gcctactctg tggccgagta tgctcgatcc ctcaagggct    1680
tcccaacccg cccaaagacc ggcaagcgtg ccgtcaaccc tcagtatgct aagatgcctg    1740
gtggtggttg cggacaccac actgtcttca tgtaa                               1775
<210>32
<211>1488
<212>DNA
<213>须癣毛癣菌(T.mentagrophytes)
<400>32
atgaagtcgc aactgttgag cctagccgtg gccgtcacca ccatttccca gggcgttgtt      60
ggtcaagagc cctttggatg gcccttcaag cctatggtca ctcaggatga cctgcaaaac     120
aagattaagc tcaaggatat catggcaggt gtcgagaagc tgcaaagctt ttctgatgct     180
catcctgaaa agaaccgagt gttcggtggt aatggccaca aggacactgt cgagtggatc     240
tacaatgagc tcaaggccac cggctactac aatgtgaaga agcaggagca ggtacacctg     300
tggtctcacg ctgaggccgc tctcagtgcc aatggcaagg acctcaaggc cagcgccatg     360
tcgtacagcc ctcctgccaa caagatcatg gccgagcttg tcgttgccaa gaacaatggc     420
tgcaatgcta ccgattaccc agagaacact cagggaaaga tagtcctcat tcagcgtggt     480
gtctgcagct tcggcgagaa gtcttctcag gctggtgatg cgaaggctat tggtgccgtt     540
gtctacaaca acgtccccgg atcccttgct ggcactcttg gtggccttga caagcgccat     600
gtcccaaccg ctggtctttc ccaggaggat ggaaagaatc ttgctagcct cgttgcttct     660
ggcaaggttg atgtcaccat gaacgttgtc agtctgtttg agaaccgaac cacctggaac     720
gtcattgctg agaccaaggg aggagaccac aacaatgttg tcatgcttgg tgctcactcc     780
gactccgtcg atgccggccc cggtatcaac gacaacggct ccggctccat tggtatcatg     840
accgttgcca aagcccttac taacttcaag ctcaacaacg ccgttcgctt tgcctggtgg     900
accgctgagg aattcggtct ccttggaagc accttctacg tcgacagcct tgatgaccgt     960
gagctgcaca aggtcaagct gtacctcaac ttcgacatga tcggctctcc caacttcgcc    1020
aaccagatct acgacggtga cggttcggcc tacaacatga ctggtcccgc tggctctgct    1080
gaaatcgagt acctgttcga gaagttcttt gacgaccagg gtctcccaca ccagcccact    1140
gccttcaccg gccgatccga ctactctgca ttcatcaagc gcaacgtccc cgctggaggt    1200
cttttcactg gtgccgaggt tgtcaagacc cccgagcaag ttaagctgtt cggtggtgag    1260
gctggcgttg cctatgacaa gaactaccat ggcaagggtg acaccgttgc caacatcaac    1320
aagggagcta tcttccttaa cactcgagca atcgcctact ctgtggccga gtatgctcga    1380
tccctcaagg gcttcccaac ccgcccaaag accggcaagc gtgccgtcaa ccctcagtat    1440
gctaagatgc ctggtggtgg ttgcggacac cacactgtct tcatgtaa                 1488
<210>33
<211>495
<212>PRT
<213>须癣毛癣菌(T.mentagrophytes)
<400>33
Met Lys Ser Gln Leu Leu Ser Leu Ala Val Ala Val Thr Thr Ile Ser
1               5                   10                  15
Gln Gly Val Val Gly Gln Glu Pro Phe Gly Trp Pro Phe Lys Pro Met
            20                  25                  30
Val Thr Gln Asp Asp Leu Gln Asn Lys Ile Lys Leu Lys Asp Ile Met
        35                  40                  45
Ala Gly Val Glu Lys Leu Gln Ser Phe Ser Asp Ala His Pro Glu Lys
    50                  55                  60
Asn Arg Val Phe Gly Gly Asn Gly His Lys Asp Thr Val Glu Trp Ile
65                  70                  75                  80
Tyr Asn Glu Leu Lys Ala Thr Gly Tyr Tyr Asn Val Lys Lys Gln Glu
                85                  90                  95
Gln Val His Leu Trp Ser His Ala Glu Ala Ala Leu Ser Ala Asn Gly
            100                 105                 110
Lys Asp Leu Lys Ala Ser Ala Met Ser Tyr Ser Pro Pro Ala Asn Lys
        115                 120                 125
Ile Met Ala Glu Leu Val Val Ala Lys Asn Asn Gly Cys Asn Ala Thr
    130                 135                 140
Asp Tyr Pro Glu Asn Thr Gln Gly Lys Ile Val Leu Ile Gln Arg Gly
145                 150                 155                 160
Val Cys Ser Phe Gly Glu Lys Ser Ser Gln Ala Gly Asp Ala Lys Ala
                165                 170                 175
Ile Gly Ala Val Val Tyr Asn Asn Val Pro Gly Ser Leu Ala Gly Thr
            180                 185                 190
Leu Gly Gly Leu Asp Lys Arg His Val Pro Thr Ala Gly Leu Ser Gln
        195                 200                 205
Glu Asp Gly Lys Asn Leu Ala Ser Leu Val Ala Ser Gly Lys Val Asp
    210                 215                 220
Val Thr Met Asn Val Val Ser Leu Phe Glu Asn Arg Thr Thr Trp Asn
225                 230                 235                 240
Val Ile Ala Glu Thr Lys Gly Gly Asp His Asn Asn Val Val Met Leu
                245                 250                 255
Gly Ala His Ser Asp Ser Val Asp Ala Gly Pro Gly Ile Asn Asp Asn
            260                 265                 270
Gly Ser Gly Ser Ile Gly Ile Met Thr Val Ala Lys Ala Leu Thr Asn
        275                 280                 285
Phe Lys Leu Asn Asn Ala Val Arg Phe Ala Trp Trp Thr Ala Glu Glu
    290                 295                 300
Phe Gly Leu Leu Gly Ser Thr Phe Tyr Val Asp Ser Leu Asp Asp Arg
305                 310                 315                 320
Glu Leu His Lys Val Lys Leu Tyr Leu Asn Phe Asp Met Ile Gly Ser
                325                 330                 335
Pro Asn Phe Ala Asn Gln Ile Tyr Asp Gly Asp Gly Ser Ala Tyr Asn
            340                 345                 350
Met Thr Gly Pro Ala Gly Ser Ala Glu Ile Glu Tyr Leu Phe Glu Lys
        355                 360                 365
Phe Phe Asp Asp Gln Gly Leu Pro His Gln Pro Thr Ala Phe Thr Gly
    370                 375                 380
Arg Ser Asp Tyr Ser Ala Phe Ile Lys Arg Asn Val Pro Ala Gly Gly
385                 390                 395                 400
Leu Phe Thr Gly Ala Glu Val Val Lys Thr Pro Glu Gln Val Lys Leu
                405                 410                 415
Phe Gly Gly Glu Ala Gly Val Ala Tyr Asp Lys Asn Tyr His Gly Lys
            420                 425                 430
Gly Asp Thr Val Ala Asn Ile Asn Lys Gly Ala Ile Phe Leu Asn Thr
        435                 440                 445
Arg Ala Ile Ala Tyr Ser Val Ala Glu Tyr Ala Arg Ser Leu Lys Gly
    450                 455                 460
Phe Pro Thr Arg Pro Lys Thr Gly Lys Arg Ala Val Asn Pro Gln Tyr
465                 470                 475                 480
Ala Lys Met Pro Gly Gly Gly Cys Gly His His Thr Val Phe Met
                485                 490                 495
<210>34
<211>2328
<212>DNA
<213>红色毛癣菌(T.rubrum)
<400>34
atgaagctcc tctcgctact tatgctggcg ggcatcgccc aagccatcgt tcctcctcgt      60
gagccccgtt caccaactgg tggcggcaac aagctgttga cctacaagga gtgtgtccct     120
agagctacta tctctccaag gtcgacgtcc cttgcctgga ttaacagtga agaagatggc     180
cggtacatct cccagtccga cgatggagca ttgatcctcc agaacatcgt cacgaacacc     240
aacaagactc tcgtggccgc agacaaggta cccaagggtt actatgacta ctggttcaag     300
ccagaccttt ctgctgtctt atgggcaacc aattacacca agcagtaccg tcactcttac     360
tttgccaact acttcattct agacatcaaa aagggatcgt tgacccctct agcccaggac     420
caggctggtg acatccagta tgctcaatgg agccccatga acaactctat cgcctatgtc     480
cgtggaaacg acctgtatat ctggaacaat ggcaagacca agcgtattac cgaaaatggc     540
ggcccggata tcttcaatgg tgtccctgac tgggtatacg aggaagaaat cttcggggac     600
cggttcgctc tttggttctc acctgacggt gaataccttg cgtacctccg ctttaacgag     660
actggagtcc cgacctacac tattccgtac tacaagaaca agcaaaagat tgcccctgcc     720
tacccaaggg agctggagat ccgttaccct aaagtctctg cgaagaaccc aaccgtgcag     780
ttccacctgt taaacattgc ttcatcccag gagacaacta tcccagttac tgcgttcccg     840
gaaaacgatc ttgtgatcgg tgaggttgct tggctcagca gtggccatga tagtgtagca     900
tatcgtgctt tcaaccgtgt ccaggataga gaaaagattg tcagcgtcaa ggttgagtcc     960
aaggaatcca aggttattcg cgaaagagat ggcaccgacg gctggatcga caaccttctc    1020
tccatgtcat atatcggaaa cgttaacggc aaggagtact acgtcgatat atctgatgct    1080
tctggctggg cacatatcta cctctacccg gttgatggag gaaaggagat tgcactaaca    1140
aagggagaat gggaagtcgt tgccattctc aaggttgaca cgaagaagaa gctgatctac    1200
ttcacctcta ccaaatatca cagcaccact cgacacgtct actctgtctc gtatgacaca    1260
aaggtcatga cccctctcgt caacgataag gaggctgcgt actacactgc atccttctcg    1320
gccaagggtg gttactatat cttgtcctac caaggtccaa atgttccata ccaagaactt    1380
tactccacca aggacagtaa gaagcctctc aagacaatca ctagcaatga tgcattgctc    1440
gagaagctga aggagtacaa gctccccaag gttagcttct ttgagatcaa gcttccatct    1500
ggtgaaaccc ttaatgttaa gcaacgccta ccacctaact tcaacccaca caagaagtac    1560
cccgtcctct tcactccgta tggtggccct ggtgcccaag aggtaagcca ggcatggaat    1620
tcattggact tcaagtccta cattacatct gaccctgagc ttgaatacgt tacctggact    1680
gttgacaacc gtggaaccgg ctacaagggc cgcaagttcc gcagcgccgt agctaagcgt    1740
ctcggtttcc tcgaagccca ggaccaggtc tttgctgcta aggaggtgct gaaaaaccgt    1800
tgggctgata aggaccatat tggaatctgg ggctggagct atggcggctt cctgaccgct    1860
aagaccctcg agaccgacag tggtgtattc acttttggta tcagtactgc tcctgtctct    1920
gatttcagac tctacgacag catgtacact gagcgttaca tgaagaccgt tgaactaaac    1980
gctgacggct acagtgagac cgccgtgcac aaggttgatg gctttaagaa cctcaaaggt    2040
cattacttca tccagcatgg aaccggtgac gacaacgtcc acttccaaaa cgccgctgtc    2100
ctttccaaca ccctgatgaa cggcggtgta actgcagaca agttgactac tcagtggttt    2160
actgactcgg accacggcat cagatacgat atggactcca cttaccagta caagcagctt    2220
tctaagatgg tctacgacca gaagcaacga aggccagaaa gcccaccaat gcaccaatgg    2280
agcaagagag ttttggctgc cctgtttggt gagagggcag aggaatga                 2328
<210>35
<211>775
<212>PRT
<213>红色毛癣菌(T.rubrum)
<220>
<221>MISC_FEATURE
<222>(162)..(612)
<223>X
<400>35
Met Lys Leu Leu Ser Leu Leu Met Leu Ala Gly Ile Ala Gln Ala Ile
1               5                   10                  15
Val Pro Pro Arg Glu Pro Arg Ser Pro Thr Gly Gly Gly Asn Lys Leu
            20                  25                  30
Leu Thr Tyr Lys Glu Cys Val Pro Arg Ala Thr Ile Ser Pro Arg Ser
        35                  40                  45
Thr Ser Leu Ala Trp Ile Asn Ser Glu Glu Asp Gly Arg Tyr Ile Ser
    50                  55                  60
Gln Ser Asp Asp Gly Ala Leu Ile Leu Gln Asn Ile Val Thr Asn Thr
65                  70                  75                  80
Asn Lys Thr Leu Val Ala Ala Asp Lys Val Pro Lys Gly Tyr Tyr Asp
                85                  90                  95
Tyr Trp Phe Lys Pro Asp Leu Ser Ala Val Leu Trp Ala Thr Asn Tyr
            100                 105                 110
Thr Lys Gln Tyr Arg His Ser Tyr Phe Ala Asn Tyr Phe Ile Leu Asp
        115                 120                 125
Ile Lys Lys Gly Ser Leu Thr Pro Leu Ala Gln Asp Gln Ala Gly Asp
    130                 135                 140
Ile Gln Tyr Ala Gln Trp Ser Pro Met Asn Asn Ser Ile Ala Tyr Val
145                 150                 155                 160
Arg Xaa Asn Asp Leu Tyr Ile Trp Asn Asn Gly Lys Thr Lys Arg Ile
                165                 170                 175
Thr Glu Asn Gly Gly Pro Asp Ile Phe Asn Gly Val Pro Asp Trp Val
            180                 185                 190
Tyr Glu Glu Glu Ile Phe Gly Asp Arg Phe Ala Leu Trp Phe Ser Pro
        195                 200                 205
Asp Gly Glu Tyr Leu Ala Tyr Leu Arg Phe Asn Glu Thr Gly Val Pro
    210                 215                 220
Thr Tyr Thr Ile Pro Tyr Tyr Lys Asn Lys Gln Lys Ile Ala Pro Ala
225                 230                 235                 240
Tyr Pro Arg Glu Leu Glu Ile Arg Tyr Pro Lys Val Ser Ala Lys Asn
                245                 250                 255
Pro Thr Val Gln Phe His Leu Leu Asn Ile Ala Ser Ser Gln Glu Thr
            260                 265                 270
Thr Ile Pro Val Thr Ala Phe Pro Glu Asn Asp Leu Val Ile Gly Glu
        275                 280                 285
Val Ala Trp Leu Ser Ser Gly His Asp Ser Val Ala Tyr Arg Ala Phe
    290                 295                 300
Asn Arg Val Gln Asp Arg Glu Lys Ile Val Ser Val Lys Val Glu Ser
305                 310                 315                 320
Lys Glu Ser Lys Val Ile Arg Glu Arg Asp Gly Thr Asp Gly Trp Ile
                325                 330                 335
Asp Asn Leu Leu Ser Met Ser Tyr Ile Gly Asn Val Asn Gly Lys Glu
            340                 345                 350
Tyr Tyr Val Asp Ile Ser Asp Ala Ser Gly Trp Ala His Ile Tyr Leu
        355                 360                 365
Tyr Pro Val Asp Gly Gly Lys Glu Ile Ala Leu Thr Lys Gly Glu Trp
    370                 375                 380
Glu Val Val Ala Ile Leu Lys Val Asp Thr Lys Lys Lys Leu Ile Tyr
385                 390                 395                 400
Phe Thr Ser Thr Lys Tyr His Ser Thr Thr Arg His Val Tyr Ser Val
                405                 410                 415
Ser Tyr Asp Thr Lys Val Met Thr Pro Leu Val Asn Asp Lys Glu Ala
            420                 425                 430
Ala Tyr Tyr Thr Ala Ser Phe Ser Ala Lys Gly Gly Tyr Tyr Ile Leu
        435                 440                 445
Ser Tyr Gln Gly Pro Asn Val Pro Tyr Gln Glu Leu Tyr Ser Thr Lys
    450                 455                 460
Asp Ser Lys Lys Pro Leu Lys Thr Ile Thr Ser Asn Asp Ala Leu Leu
465                 470                 475                 480
Glu Lys Leu Lys Glu Tyr Lys Leu Pro Lys Val Ser Phe Phe Glu Ile
                485                 490                 495
Lys Leu Pro Ser Gly Glu Thr Leu Asn Val Lys Gln Arg Leu Pro Pro
            500                 505                 510
Asn Phe Asn Pro His Lys Lys Tyr Pro Val Leu Phe Thr Pro Tyr Gly
        515                 520                 525
Gly Pro Gly Ala Gln Glu Val Ser Gln Ala Trp Asn Ser Leu Asp Phe
    530                 535                 540
Lys Ser Tyr Ile Thr Ser Asp Pro Glu Leu Glu Tyr Val Thr Trp Thr
545                 550                 555                 560
Val Asp Asn Arg Gly Thr Gly Tyr Lys Gly Arg Lys Phe Arg Ser Ala
                565                 570                 575
Val Ala Lys Arg Leu Gly Phe Leu Glu Ala Gln Asp Gln Val Phe Ala
            580                 585                 590
Ala Lys Glu Val Leu Lys Asn Arg Trp Ala Asp Lys Asp His Ile Gly
        595                 600                 605
Ile Trp Gly Xaa Ser Tyr Gly Gly Phe Leu Thr Ala Lys Thr Leu Glu
    610                 615                 620
Thr Asp Ser Gly Val Phe Thr Phe Gly Ile Ser Thr Ala Pro Val Ser
625                 630                 635                 640
Asp Phe Arg Leu Tyr Asp Ser Met Tyr Thr Glu Arg Tyr Met Lys Thr
                645                 650                 655
Val Glu Leu Asn Ala Asp Gly Tyr Ser Glu Thr Ala Val His Lys Val
            660                 665                 670
Asp Gly Phe Lys Asn Leu Lys Gly His Tyr Leu Ile Gln His Gly Thr
        675                 680                 685
Gly Asp Asp Asn Val His Phe Gln Asn Ala Ala Val Leu Ser Asn Thr
    690                 695                 700
Leu Met Asn Gly Gly Val Thr Ala Asp Lys Leu Thr Thr Gln Trp Phe
705                 710                 715                 720
Thr Asp Ser Asp His Gly Ile Arg Tyr Asp Met Asp Ser Thr Tyr Gln
                725                 730                 735
Tyr Lys Gln Leu Ser Lys Met Val Tyr Asp Gln Lys Gln Arg Arg Pro
            740                 745                 750
Glu Ser Pro Pro Met His Gln Trp Ser Lys Arg Val Leu Ala Ala Leu
        755                 760                 765
Phe Gly Glu Arg Ala Glu Glu
    770                 775

Claims (66)

1、一种分离的多肽,含有选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的成熟形式。
2、一种分离的多肽,含有选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示的氨基酸序列。
3、一段分离的多肽,含有与选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列至少有90%同源的序列。
4、如权利要求3所述的多肽,其中所述分离的多肽还包括与选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列天然发生等位变异的序列。
5、如权利要求3所述的多肽,其中所述分离的多肽具有氨肽酶或羧肽酶活性。
6、如权利要求5所述的多肽,其中所述的多肽是亮氨酸氨肽酶。
7、如权利要求6所述的多肽,其中所述的多肽是ruLAP2。
8、一种分离的多肽,其含有一个或多个选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的保守替换。
9、如权利要求8所述的多肽,其中所述的多肽具有氨肽酶活性。
10、如权利要求1所述的多肽,其中所述的多肽是天然产生的。
11、一种含有权利要求1所述的多肽和试剂的组合物。
12、一种试剂盒,其中一个或多个试剂内含有权利要求11所述的组合物。
13、一种含有权利要求1所述的皮肤真菌。
14、如权利要求13所述的表皮寄生菌,其中所述皮肤真菌选自如下菌种:絮状表皮癣菌,奥杜盎小孢子菌、铁锈色小孢子菌、同心性毛癣菌、卡那毛癣菌、麦格尼氏发癣菌、须癣发癣菌、罗比特斯克毛癣菌、红色毛癣菌、许兰氏毛癣菌、苏丹毛癣菌、断发毛癣菌、紫色毛癣菌、杨德氏发癣菌、犬小芽胞菌、马类小孢子菌、猪小孢子菌、桃色小孢子菌、马发癣菌、猴类毛癣菌、疣状毛癣菌、石膏样小孢子菌、阿耶罗毛癣菌和土生毛癣菌。
15、一种含有权利要求1所述多肽的微生物培养上清夜。
16、权利要求1所述的多肽在制备治疗与其相关病理的人类疾病药物中的应用。
17、一种验证具有潜在治疗真菌感染的治疗物质的方法,其中所述真菌感染与权利要求1所述的多肽表达异常或与其异常的生理相关作用相联系,所述方法包括:
(a)提供一种能表达权利要求1所述多肽且具有所述多肽特性或功能的细胞;
(b)将包含候选物质的组合物与上述细胞接触;
(c)检测候选物质是否引起所述多肽功能特性的改变;
其中,当在有候选物质存在时观察到改变,而在不含候选物质组合物与细胞接触时同样的改变没有出现,那么该物质被证明具有潜在的治疗用途。
18、如权利要求17所述的方法,其中所述功能特性是具有氨肽酶或羧肽酶活性。
19、一种治疗哺乳动物疾病的方法,所述方法包括向动物给予一定量的多肽,使其病证减轻,其中所述多肽为含有与选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列至少有90%同源的多肽,或其具有活性的片段。
20、如权利要求19所述的方法,其中所述的疾病包括:真菌感染、腹部疾病、消化道吸收不良、口炎性腹泻、过敏反应和酶不足。
21、如权利要求20所述的方法,其中所述的过敏反应是对麸质过敏。
22、一种治疗哺乳动物疾病的方法,所述方法包括向动物给予一定量的蛋白酶抑制剂,使其病证减轻,其中所述蛋白酶抑制剂为含有的氨基酸序列为SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示至少有90%同源序列的多肽,或其具有活性的片段。
23、如权利要求22所述的方法,其中所述的疾病为真菌感染。
24、一种分离的核酸分子,含有选自SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32和34所示的核酸序列。
25、如权利要求24所述的核酸分子,其中所述的核酸分子是天然存在的。
26、一种核酸分子,其中所述核酸分子不是单独的核苷,而是一种含有选自SEQ IDNOs:2、5、8、11、14、17、20、23、26、29、32和34所示的核酸序列。
27、一种分离的核酸分子,其编码一种含有选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35所示氨基酸序列的成熟多肽。
28、如权利要求24所述的核酸分子,其中所述的核酸分子可在严格条件下与选自下组的核酸序列杂交,所述的组由选自SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32、34或其互补序列物组成。
29、一种含有权利要求24所述核酸分子的载体。
30、如权利要求29所述的载体,还可以包含操控所述核酸分子的启动子。
31、一种含有权利要求29所述载体的细胞。
32、一种制备权利要求1所述多肽的方法,所述方法包括在诱导表达所述多肽的环境下培养一种细胞,其中所述细胞中含有已重组了选自SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32和34所示序列的核酸分子的载体。
33、如权利要求32所述的方法,其中所述的细胞选自:真菌细胞、细菌细胞、昆虫细胞、植物细胞或哺乳动物细胞。
34、一种制备权利要求2所述多肽的方法,所述方法包括在能够表达所述多肽的环境下培养一种细胞,其中所述细胞中含有已重组了SEQ ID NOs:2、5、8、11、14、17、20、23、26、29、32和34所示序列的核酸分子的载体。
35、如权利要求34所述的方法,其中所述的细胞选自:真菌细胞、细菌细胞、昆虫细胞、植物细胞或哺乳动物细胞。
36、一种制备蛋白的方法,包括:
(a)在能足够表达所述蛋白的环境下培养权利要求13所述的表皮肤真菌,
(b)且从所述皮肤真菌中分离出来。
37、如权利要求36所述的方法,其中所述的蛋白是分泌型蛋白。
38、如权利要求36所述的方法,其中所述的蛋白是氨肽酶或羧肽酶。
39、如权利要求38所述的方法,其中所述的蛋白是亮氨酸氨肽酶。
40、如权利要求39所述的方法,其中所述的LAP是ruLAP2。
41、如权利要求36所述的方法,其中所述的表皮寄生菌选自絮状表皮癣菌,奥杜盎小孢子菌、铁锈色小孢子菌、同心性毛癣菌、卡那毛癣菌、麦格尼氏发癣菌、须癣发癣菌、罗比特斯克毛癣菌、红色毛癣菌、许兰氏毛癣菌、苏丹毛癣菌、断发毛癣菌、紫色毛癣菌、杨德氏发癣菌、犬小芽胞菌、马类小孢子菌、猪小孢子菌、桃色小孢子菌、马发癣菌、猴类毛癣菌、疣状毛癣菌、石膏样小孢子菌、阿耶罗毛癣菌和土生毛癣菌。
42、如权利要求36所述的方法,还可以包括向产物蛋白提供多肽底物。
43、如权利要求42所述的方法,其中所述的产物蛋白降解多肽底物。
44、如权利要求42所述的方法,其中所述的多肽底物的长度为2~200个氨基酸。
45、如权利要求42所述的方法,其中所述的产物蛋白有序的消化一段全长的多肽底物。
46、一种治疗真菌感染引起的疾病的方法,所述方法包括给予有效剂量的具有EXOX蛋白活性的一种抑制剂,其中EXOX蛋白选自SEQ ID NOs:3、6、9、12、15、18、21、24、27、30、33和35。
47、如权利要求46所述的方法,其中所述的EXOX蛋白含有SEQ ID NO:2。
48、一种降解多肽底物的方法,所述方法包括将一个或多个权利要求1所述的分离的多肽与多肽底物接触。
49、如权利要求48所述的方法,其中所述的多肽底物为全长的蛋白。
50、如权利要求48所述的方法,其中所述的一个或多个分离的多肽有序的酶解多肽底物。
51、如权利要求48所述的方法,其中所述的多肽底物选自如下组:变性的酪蛋白、麸朊、谷朊、小牛血清蛋白或类似功能物。
52、如权利要求48所述的方法,其中所述的分离的多肽是一种氨肽酶。
53、如权利要求52所述的方法,其中所述的氨肽酶是亮氨酸氨肽酶。
54、如权利要求53所述的方法,其中所述的亮氨酸氨肽酶是ruLAP2。
55、如权利要求48所述的方法,还可以用一个或多个蛋白酶与多肽底物接触。
56、如权利要求55所述的方法,其中所述的一个或多个蛋白酶选自如下组:胰蛋白酶、链霉蛋白酶、胰凝乳蛋白酶和蛋白酶K。
57、一种去除蛋白氨基末端氨基酸的方法,包括将蛋白与权利要求3所述的分离的多肽接触。
58、如权利要求57所述的方法,其中所述的蛋白氨基末端带有组氨酸标签。
59、如权利要求57所述的方法,其中所述的蛋白氨基末端带有Xaa-Pro标签。
60、如权利要求57所述的方法,其中所述Xaa是一种含有至少两个相近亲核部位的氨基酸。
61、如权利要求60所述的方法,其中所述的氨基酸是丝氨酸、苏氨酸或半胱氨酸。
62、如权利要求3所述的分离的多肽,其中所述的多肽具有反蛋白水解活性。
63、如权利要求42所述的方法,其中所述的产物蛋白添加一个或多个氨基酸到底物多肽上。
64、如权利要求42所述的方法,其中所述的产物蛋白去除多肽底物一个或多个氨基酸,使其成为一种被修饰多肽,然后所述的产物蛋白有序的将一个或多个氨基酸添加到被修饰多肽,这样形成一种含特殊氨基酸序列多肽产物,与多肽底物相比。
65、一种在多肽底物添加一个或多个氨基酸的方法,所述方法包括将多肽底物与一种或多种权利要求3所述的分离的多肽接触。
66、如权利要求48所述的方法,进一步包括在充分的有序添加一个或多个氨基酸序列条件下,培育多肽底物与一个或多个分离的多肽一段时间。
CN2004800314200A 2003-08-25 2004-08-25 一种新的真菌蛋白及其编码核酸 Active CN1871351B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US49831803P 2003-08-25 2003-08-25
US60/498,318 2003-08-25
PCT/IB2004/002963 WO2005019251A2 (en) 2003-08-25 2004-08-25 Novel fungal proteins and nucleic acids encoding same

Publications (2)

Publication Number Publication Date
CN1871351A true CN1871351A (zh) 2006-11-29
CN1871351B CN1871351B (zh) 2010-06-23

Family

ID=34216166

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004800314200A Active CN1871351B (zh) 2003-08-25 2004-08-25 一种新的真菌蛋白及其编码核酸

Country Status (13)

Country Link
US (3) US7468267B2 (zh)
EP (1) EP1673457B1 (zh)
JP (1) JP4839215B2 (zh)
CN (1) CN1871351B (zh)
AT (1) ATE510011T1 (zh)
AU (1) AU2004266199B2 (zh)
CA (1) CA2536635C (zh)
DK (1) DK1673457T3 (zh)
ES (1) ES2366830T3 (zh)
HK (1) HK1096427A1 (zh)
IL (1) IL173937A (zh)
PL (1) PL1673457T3 (zh)
WO (1) WO2005019251A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108690881A (zh) * 2017-03-30 2018-10-23 欧蒙医学诊断技术有限公司 用于诊断皮肤癣菌病的测定法
CN111320678A (zh) * 2020-03-09 2020-06-23 安亭生物有限责任公司 抗菌肽突变体及其应用
CN111836554A (zh) * 2017-12-12 2020-10-27 国家科学研究中心 从极端微生物中获得的tet外切蛋白酶的组合物水解多肽的用途
CN113151329A (zh) * 2021-03-30 2021-07-23 云南师范大学 中性蛋白酶突变体及其构造方法和应用

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7468267B2 (en) * 2003-08-25 2008-12-23 Funzyme Biotechnologies Sa Fungal proteins and nucleic acids encoding same
US8802422B2 (en) 2007-06-01 2014-08-12 Solazyme, Inc. Renewable diesel and jet fuel from microbial sources
AU2009234176B2 (en) 2008-04-09 2014-08-07 Corbion Biotech, Inc. Direct chemical modification of microbial biomass and microbial oils
CA2732508C (en) 2008-08-11 2016-03-15 Nektar Therapeutics Multi-arm polymeric alkanoate conjugates
US20100297292A1 (en) * 2008-10-14 2010-11-25 Solazyme, Inc. Reduced Pigmentation Microalgae Strains and Products Therefrom
CN104770424A (zh) * 2008-10-14 2015-07-15 索拉兹米公司 微藻生物质的食品组合物
US20100303957A1 (en) * 2008-10-14 2010-12-02 Solazyme, Inc. Edible Oil and Processes for Its Production from Microalgae
US20100297331A1 (en) * 2008-10-14 2010-11-25 Solazyme, Inc. Reduced Fat Foods Containing High-Lipid Microalgae with Improved Sensory Properties
US20100297325A1 (en) * 2008-10-14 2010-11-25 Solazyme, Inc. Egg Products Containing Microalgae
US20100297323A1 (en) * 2008-10-14 2010-11-25 Solazyme, Inc. Gluten-free Foods Containing Microalgae
US20100297296A1 (en) * 2008-10-14 2010-11-25 Solazyme, Inc. Healthier Baked Goods Containing Microalgae
US20100303990A1 (en) * 2008-10-14 2010-12-02 Solazyme, Inc. High Protein and High Fiber Algal Food Materials
US20100303989A1 (en) * 2008-10-14 2010-12-02 Solazyme, Inc. Microalgal Flour
US20100303961A1 (en) * 2008-10-14 2010-12-02 Solazyme, Inc. Methods of Inducing Satiety
US20100297295A1 (en) * 2008-10-14 2010-11-25 Solazyme, Inc. Microalgae-Based Beverages
JP5859311B2 (ja) 2008-11-28 2016-02-10 ソラザイム, インコーポレイテッドSolazyme Inc 組み換え従属栄養微生物における、用途に応じた油の生産
CA2784944A1 (en) 2009-12-21 2011-06-30 Centre Hospitalier Universitaire Vaudois Synergic action of a prolyl protease and tripeptidyl proteases
US9011842B2 (en) 2010-02-02 2015-04-21 Amano Enzyme Inc. Use of proteases for gluten intolerance
CA3039432A1 (en) 2010-05-28 2011-12-01 Corbion Biotech, Inc. Tailored oils produced from recombinant heterotrophic microorganisms
CA3024641A1 (en) 2010-11-03 2012-05-10 Corbion Biotech, Inc. Microbial oils with lowered pour points, dielectric fluids produced therefrom, and related methods
WO2012088422A1 (en) 2010-12-22 2012-06-28 Nektar Therapeutics Multi-arm polymeric prodrug conjugates of taxane-based compounds
WO2012088445A1 (en) 2010-12-22 2012-06-28 Nektar Therapeutics Multi-arm polymeric prodrug conjugates of cabazitaxel-based compounds
CA2825691C (en) 2011-02-02 2020-08-25 Solazyme, Inc. Tailored oils produced from recombinant oleaginous microorganisms
WO2012154626A1 (en) 2011-05-06 2012-11-15 Solazyme, Inc. Genetically engineered microorganisms that metabolize xylose
EP2788018B1 (en) 2011-12-06 2016-06-29 Fondazione Istituto Insubrico di Ricerca per la Vita New proteases able to hydrolyze gluten peptides and proteins at acidic ph, from the actinomycete actinoallomurus
US9719114B2 (en) 2012-04-18 2017-08-01 Terravia Holdings, Inc. Tailored oils
ES2744868T3 (es) 2012-04-18 2020-02-26 Corbion Biotech Inc Aceites hechos a medida
FR3000216B1 (fr) * 2012-12-21 2015-02-06 Galderma Res & Dev Utilisation de proteases particulieres pour la detection de trichophytons et de pathologies associees
US10098371B2 (en) 2013-01-28 2018-10-16 Solazyme Roquette Nutritionals, LLC Microalgal flour
FR3009619B1 (fr) 2013-08-07 2017-12-29 Roquette Freres Compositions de biomasse de microalgues riches en proteines de qualite sensorielle optimisee
EP3052636A2 (en) 2013-10-04 2016-08-10 Solazyme, Inc. Tailored oils
WO2016007862A2 (en) 2014-07-10 2016-01-14 Solazyme, Inc. Novel ketoacyl acp synthase genes and uses thereof
WO2016120764A1 (en) 2015-01-26 2016-08-04 Centre Hospitalier Universitaire Vaudois (Chuv) Aspergillus oryzae prolyl endopeptidases and use thereof in degradation of polypeptides
JP6697226B2 (ja) * 2015-06-11 2020-05-20 天野エンザイム株式会社 新規ペプチダーゼ
US11473073B2 (en) * 2015-06-26 2022-10-18 Dupont Nutrition Biosciences Aps Aminopeptidases for protein hydrolyzates
US11124785B2 (en) 2016-02-11 2021-09-21 Trustees Of Boston University Rothia subtilisins, S8A family proteases, as therapeutic enzymes for application in gluten intolerance disorders
WO2022089727A1 (en) * 2020-10-27 2022-05-05 Amyra Biotech Ag Dipeptidylpeptidase and leucine aminopeptidase polypeptide variants
KR102611109B1 (ko) * 2021-06-23 2023-12-07 연세대학교 산학협력단 조직 또는 기관으로부터 세포 분리용 조성물
CN116004588A (zh) * 2022-01-10 2023-04-25 西北农林科技大学 含有fyve结构域的agc蛋白激酶及其编码基因与应用

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4873191A (en) 1981-06-12 1989-10-10 Ohio University Genetic transformation of zygotes
US4522811A (en) 1982-07-08 1985-06-11 Syntex (U.S.A.) Inc. Serial injection of muramyldipeptides and liposomes enhances the anti-infective activity of muramyldipeptides
US4870009A (en) 1982-11-22 1989-09-26 The Salk Institute For Biological Studies Method of obtaining gene product through the generation of transgenic animals
US4736866B1 (en) 1984-06-22 1988-04-12 Transgenic non-human mammals
US4855231A (en) 1984-10-30 1989-08-08 Phillips Petroleum Company Regulatory region for heterologous gene expression in yeast
US4879231A (en) 1984-10-30 1989-11-07 Phillips Petroleum Company Transformation of yeasts of the genus pichia
US4857467A (en) 1986-07-23 1989-08-15 Phillips Petroleum Company Carbon and energy source markers for transformation of strains of the genes Pichia
US4929555A (en) 1987-10-19 1990-05-29 Phillips Petroleum Company Pichia transformation
US5328470A (en) 1989-03-31 1994-07-12 The Regents Of The University Of Michigan Treatment of diseases by site-specific instillation of cells or site-specific transformation of cells and kits therefor
JP3082549B2 (ja) 1993-12-27 2000-08-28 株式会社村田製作所 支持フィルム付きセラミックグリーンシートの製造方法
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
EP0815210B1 (en) 1995-03-16 2004-06-02 Novozymes A/S An enzyme with aminopeptidase activity
WO1997033957A1 (en) 1996-03-15 1997-09-18 Amway Corporation Powder detergent composition having improved solubility
AU4597197A (en) 1996-09-27 1998-04-17 Introgene B.V. Methods for optimization of gene therapy by recursive sequence shuffling and selection
CA2266423A1 (en) 1996-09-27 1998-04-02 Maxygen, Inc. Methods for optimization of gene therapy by recursive sequence shuffling and selection
DE69835360T2 (de) 1997-01-17 2007-08-16 Maxygen, Inc., Redwood City EVOLUTION Prokaryotischer GANZER ZELLEN DURCH REKURSIVE SEQUENZREKOMBINATION
US6153410A (en) 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
EP0897012A1 (en) * 1997-07-05 1999-02-17 Societe Des Produits Nestle S.A. Cloning of the prolyl-dipeptidyl-peptidase from aspergillus oryzae
JP3727780B2 (ja) 1998-06-12 2005-12-14 キッコーマン株式会社 ロイシンアミノペプチダーゼ遺伝子、組み換え体dna及びロイシンアミノペプチダーゼの製造法
US7468267B2 (en) * 2003-08-25 2008-12-23 Funzyme Biotechnologies Sa Fungal proteins and nucleic acids encoding same

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108690881A (zh) * 2017-03-30 2018-10-23 欧蒙医学诊断技术有限公司 用于诊断皮肤癣菌病的测定法
CN111836554A (zh) * 2017-12-12 2020-10-27 国家科学研究中心 从极端微生物中获得的tet外切蛋白酶的组合物水解多肽的用途
CN111320678A (zh) * 2020-03-09 2020-06-23 安亭生物有限责任公司 抗菌肽突变体及其应用
CN111320678B (zh) * 2020-03-09 2023-06-09 安亭生物有限责任公司 抗菌肽突变体及其应用
CN113151329A (zh) * 2021-03-30 2021-07-23 云南师范大学 中性蛋白酶突变体及其构造方法和应用
CN113151329B (zh) * 2021-03-30 2023-09-08 云南师范大学 中性蛋白酶突变体及其构造方法和应用

Also Published As

Publication number Publication date
US20050158298A1 (en) 2005-07-21
EP1673457A2 (en) 2006-06-28
US7468267B2 (en) 2008-12-23
JP2007531504A (ja) 2007-11-08
ES2366830T3 (es) 2011-10-25
IL173937A (en) 2012-07-31
CA2536635C (en) 2015-05-12
EP1673457B1 (en) 2011-05-18
US20070009988A1 (en) 2007-01-11
US20090130737A1 (en) 2009-05-21
JP4839215B2 (ja) 2011-12-21
CA2536635A1 (en) 2005-03-03
WO2005019251A2 (en) 2005-03-03
US7943340B2 (en) 2011-05-17
US7354734B2 (en) 2008-04-08
CN1871351B (zh) 2010-06-23
DK1673457T3 (da) 2011-09-05
ATE510011T1 (de) 2011-06-15
WO2005019251A3 (en) 2006-03-23
HK1096427A1 (en) 2007-06-01
PL1673457T3 (pl) 2011-12-30
AU2004266199B2 (en) 2010-09-16
AU2004266199A1 (en) 2005-03-03
IL173937A0 (en) 2006-07-05
WO2005019251A8 (en) 2005-12-01
AU2004266199A2 (en) 2005-03-03

Similar Documents

Publication Publication Date Title
CN1871351A (zh) 一种新的真菌蛋白及其编码核酸
CN1561394A (zh) 人嗜中性粒细胞明胶酶相关脂卡林及有关蛋白的突变蛋白
CN1768138A (zh) 在微生物中生产重组蛋白质的方法
CN1993377A (zh) 丙氨酸2,3氨基变位酶
CN1813062A (zh) 噬菌体溶菌素
CN1298848C (zh) 具有减弱的蛋白酶活性的嗜血杆菌Hin47类似物
CN1611601A (zh) 三肽基氨肽酶
CN1880460A (zh) 大肠杆菌自裂解方法及其专用载体与应用
CN101066447A (zh) 基因和蛋白质,及它们的用途
CN1685058A (zh) 制备具有抗高血压特性的肽的方法
CN1198918C (zh) 减毒的活胸膜肺炎放线杆菌
CN1798838A (zh) 一种蛋白酶的抑制剂蛋白及其用途
CN1802093A (zh) 具有心率降低特性的混合物
CN1526017A (zh) 与利什曼原虫属寄生虫毒性相关的基因
CN1181199C (zh) 地衣形芽孢杆菌l-25角蛋白酶及编码该角蛋白酶的dna
CN1112127A (zh) 新的蛋白质p140多肽及编码该多肽的DNA
CN1155702C (zh) 一种新的谷氨酰胺酶及其基因和生产方法
CN1496370A (zh) 分离的苛养木杆菌gum操纵子,分离的其核酸分子及它们的用途
CN1084565A (zh) 具有腈水合酶活性的新型蛋白和编码该蛋白的基因
CN1213403A (zh) 具有齿斑葡聚糖酶活性的多肽及编码该多肽的核酸
CN101037680A (zh) 皂草苷分解酶及其基因以及大豆皂草精醇b的大量生产***
CN1904041A (zh) 人重组磷脂酶d2及其制备方法和在药物制备中的应用
CN101062942A (zh) 来源于烟曲霉的与活性氧杀伤相关蛋白及其编码基因
CN1547610A (zh) 用于生长激素高表达的dna及其应用
CN101041690A (zh) 重组犬钩虫抗凝肽5突变体、其编码基因、其制备和应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1096427

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1096427

Country of ref document: HK

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20151008

Address after: Swiss Chu Gezhou

Patentee after: Amira Biotech Corp

Address before: geneva

Patentee before: Funzyme Biotechnologies SA