CN1495257A - 衍生自厌氧真菌的新的重组木聚糖酶及相关序列、表达载体和宿主 - Google Patents

衍生自厌氧真菌的新的重组木聚糖酶及相关序列、表达载体和宿主 Download PDF

Info

Publication number
CN1495257A
CN1495257A CNA031585043A CN03158504A CN1495257A CN 1495257 A CN1495257 A CN 1495257A CN A031585043 A CNA031585043 A CN A031585043A CN 03158504 A CN03158504 A CN 03158504A CN 1495257 A CN1495257 A CN 1495257A
Authority
CN
China
Prior art keywords
gly
thr
ser
ala
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA031585043A
Other languages
English (en)
Inventor
许瑞祥
黄雅惠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biological Biological Polytron Technologies Inc
Qianwei Biological Science & Technology Development Co Ltd
Original Assignee
Biological Biological Polytron Technologies Inc
Qianwei Biological Science & Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biological Biological Polytron Technologies Inc, Qianwei Biological Science & Technology Development Co Ltd filed Critical Biological Biological Polytron Technologies Inc
Publication of CN1495257A publication Critical patent/CN1495257A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/248Xylanases
    • C12N9/2482Endo-1,4-beta-xylanase (3.2.1.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01008Endo-1,4-beta-xylanase (3.2.1.8)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Detergent Compositions (AREA)

Abstract

本发明提供了重组木聚糖酶,它们衍生自厌氧真菌,特别是衍生自Neocallimastix frontalis和N.patriciarum。所述酶耐热及耐碱性pH,而且对木聚糖呈高度特异性并具有高活性。

Description

衍生自厌氧真菌的新的重组木聚糖酶 及相关序列、表达载体和宿主
技术领域
本发明涉及衍生自厌氧真菌如Neocallimastix frontalis和N.patriciarum的新的重组木聚糖酶。本发明的木聚糖酶耐热及耐碱性pH,而且对木聚糖呈高度特异性并具有高活性。本发明还涉及编码所述木聚糖酶的相关DNA序列,以及携带所述DNA序列的宿主。
背景技术
木聚糖酶降解木聚糖,木聚糖是一种多糖,且是植物中半纤维素的主要组成部分。木聚糖是世界上继纤维素之后最丰富的可再生资源,其是一种具有β-1,4-D-吡喃木糖连接的主链和多种取代侧链的杂多糖。由于其复杂的结构,需要酶降解***才能完全分解木聚糖。这些酶包括主链降解酶:内切β-1,4-木聚糖酶(EC 3.2.1.8)和β-木糖苷酶(EC 3.2.1.37);侧链降解酶:α-L-***呋喃糖苷酶(EC 3.2.1.55),α-葡糖醛酸糖苷酶(EC 3.2.1.139)和乙酰木聚糖酯酶(EC 3.1.1.72)(Q.K.Beg,M.Kapoor,L. Mahajan和G.S.Hoondal.微生物木聚糖酶及其工业应用综述,应用微生物学生物技术(2001)56:326-338)。在这些酶当中,内切β-1,4-木聚糖酶对木聚糖降解起主要作用。
内切木聚糖酶是随机裂解组成木聚糖主链的木糖残基之间β(1-4)键的酶,是主要在植物初生和次生细胞壁中发现的一种半纤维素的优势形式。许多现有技术如US 5,948,667(于1999年9月7日公布),US6,300,114(于2001年10月9日取得专利权),US 5,824,533(于1998年10月20日取得专利权)及WO 93/25693(于1993年12月23日公布)等,已经揭示了多种木聚糖酶及其应用。木聚糖酶的已知应用也非常多,例如已经揭示了用木聚糖酶(连同纤维素酶一起)处理草料以提高产酸率,从而保证更好品质的青贮饲料及随之改良反刍动物对植物细胞壁的消化率。木聚糖酶可以用于处理黑麦及具有高***木聚糖含量的其它谷类,以改良家禽和猪对谷类的消化能力。木聚糖酶可以用于生物转化中,将木聚糖水解为可以作为微生物的生长底物的木寡糖和木糖,这一过程可涉及同时糖化和发酵。木聚糖酶可以用于生物制浆中处理纤维素浆,以除去木聚糖杂质或生产具有不同特性的纸浆。在一些情况中,木聚糖酶可用于减少漂白纸浆所需氯的量及减少精制纸浆所需能量。另外,木聚糖酶在浸解亚麻纤维,澄清果汁,制备用作食物增稠剂的葡聚糖及从植物原料中生产液汁方面也是有用的。
可商购的木聚糖酶及其活性和用途见于“Q.K.Beg,M.Kapoor,L.Mahajan和G.S.Hoondal,微生物木聚糖酶及其工业应用综述,应用微生物学生物技术(2001)56:326-338”。
特别地,据报道用木聚糖酶预处理未漂白的牛皮纸浆可以减少用于漂白程序的化学品的消耗量。现有技术领域还揭示了木聚糖酶预处理可用于与由Cl2,ClO2,H2O2和O3组成的漂白顺序组合。经这种木聚糖酶处理后的纸浆的可漂白性更好所导致的直接结果是漂白所用化学品的消耗量降低,当使用含氯的化学品时,这种消耗量降低可以减少对环境有害的有机氯化合物的形成。经这种木聚糖酶处理后纸浆的可漂白性更好的另一个直接结果是可以生产具有良好亮度的产品,这种亮度以别的方式(如使用过氧化物全无氯(TCF)漂白)难以达到。因为木聚糖酶的底物特异性,所以纤维素纤维不受伤害,且产物的强度性质在可接受限度内。
然而,这不是简单地仅仅加入木聚糖酶处理步骤即可。设计用于纸浆漂白的大多数商购木聚糖酶不是非常耐热,当使用中性或碱性pH条件时尤其如此。实际上,木聚糖酶在温度高于60℃时通常失效或失活。因此,WO 9325693中特别揭示的重组木聚糖酶不能满足纸浆和造纸业的需求,该酶衍生自Neocallimastix patriciarum,被称为XYLA,具有5980U/mg的比活性。
在碱性pH下有活性的木聚糖酶可以减少在木聚糖酶处理之前酸化纸浆的需求。另外,许多现代牛皮纸蒸煮和漂白程序的温度相对较高,在50℃以上,这对许多商购的漂白酶均不适合。因此,需要在碱性pH稳定的耐热木聚糖酶制品,以用于木浆漂白程序中。为获得耐热木聚糖酶,US 6,300,114生产了源自丝状真菌中放射菌如曲霉属或木霉属的蛋白质。
反刍动物由于其消化纤维性植物原料的能力而得到赞扬。反刍动物自身不产生纤维降解酶,但它们携带可以消化纤维以支持宿主生存的细菌、真菌和原生动物(Russell,J.B.和J.L.Rychlik.2001,改变瘤胃微生物生态学的因素,科学292:1119-22)。瘤胃生态学***包括根据反刍动物环境的剧烈选择压力而确定的不同种群的厌氧细菌、真菌和原生动物。瘤胃微生物通常成为高活性纤维降解作用的资源。迄今为止,有许多纤维降解基因分离自瘤胃(Selinger,B.L.,C.W.Forsberg和K.J.Cheng,瘤胃:增强家畜生产力的酶的唯一来源,厌氧性生物2:263-284(1996))。
然而迄今为止,分离自瘤胃的木聚糖酶相关基因均是通过首先构建cDNA基因数据库然后筛选包含于其中的具有木聚糖相关碱基的基因而获得(Durand,R.,C.Rascle和M.Fevre,瘤胃厌氧真菌Neocallimastix frontalis的内切木聚糖酶多基因家族的一个成员xyn3的分子鉴定,Curr Genet,第30卷第6期(1996)pp 531-540)。通过这种已知方法,分离自反刍动物真菌的木聚糖酶基因序列没有内含子。总之,这种已知方法非常耗时且效率低下。本发明不用构建所述cDNA基因数据库,而是直接使用来自反刍动物真菌的DNA作为模板,采用合适的特异性引物进行PCR。在这种方式中,可以快速获得木聚糖酶基因序列。另外,由用这种方式获得的基因序列表达的一些新木聚糖酶在高温和碱性反应条件下活性非常强,而且具有高比活。这些新重组木聚糖酶可以由原核或真核表达***产生。
本文所引用的所有参考文献在此均并入作为参考文献。
发明内容
本发明涉及重组木聚糖酶,其通过使用合适的引物进行聚合酶链反应(PCR)而衍生自瘤胃微生物优选厌氧真菌如Neocallimastixfrontalis和N.patriciarum。与现有技术揭示的那些木聚糖酶相比,本发明的木聚糖酶耐热及耐碱性pH,并具有显著的高比活(specificactivity)。尤其SEQ ID NO.26所示Xynsk1-9E在70℃、pH6条件下,在1%燕麦斯卑尔脱小麦(oat spelt)木聚糖底物中反应3分钟后呈现最高的比活,10371.04U/mg蛋白。
本发明的木聚糖酶与许多已知的木聚糖酶相反,对羧甲基纤维素和大麦β-葡聚糖没有明显的残余活性。前一性质在纸浆和造纸业中特别有用,因为所述酶可以从植物纤维中除去木聚糖及分离出木质素而不破坏纤维素纤维。
本发明的再一目的是提供包含编码本发明木聚糖酶的DNA序列的重组载体。优选地,所述木聚糖酶衍生自Neocallimastix frontalis或N.patriciarum。相应基因优选置于由所述载体提供的一些控制序列如启动子序列(其与相应基因整合)控制下(即可操纵地连接)。如果需要,这种控制序列可以作为***基因座的结果而由宿主染色体提供。
表达载体上的表达控制序列根据载体设计为在原核或真核宿主中表达某一基因而变化(例如穿梭载体可以提供一种在细菌宿主内进行选择的基因),而且可以额外含有转录元件如增强子元件,终止序列和/或转录起始和终止位点。
本发明的另一目的是提供来自用所述重组表达载体转化的宿主培养物的培养基。优选地,所述宿主是原核表达宿主,如大肠杆菌;或真核表达宿主,如Pichia methanolica。更优选地,所述宿主是Pichiamethanolica。
本发明的另一目的是提供用于木聚糖酶基因扩增的引物和探针,其特征在于具有序列aactgttgctaaggcccaatggggt或accccatttaccatcgtcatcagtg。
附图说明
图1示出pGEXxynsk1-9E的构建。
图2示出pMETxynsk1-9E的构建。
图3(a)和3(b)分别示出DNA序列对比结果和氨基酸序列对比结果。得自N.patriciarum的木聚糖酶的氨基酸序列AAE25847从US5,948,667获知。分离自Orpinomyces sp.PC-2的木聚糖酶的DNA序列U57819和氨基酸序列AAE12389从US 5,824,533中获知。
图4(a)和4(b)分别示出DNA序列对比结果和氨基酸序列对比结果。分离自N.patriciarum的乙酰木聚糖酯酶(ETS)的DNA序列(U66253)和氨基酸序列(AAB69092)在GenBank中公布。
图5示出在大肠杆菌中表达的Xynsk1-9E的SDS-PAGE结果,其中泳道1和5表示蛋白质标记,泳道2表示细胞裂解物,泳道3表示样品流,泳道4表示Xynsk1-9E,泳道6表示GST。
图6示出在P.methanolica中表达的Xynsk1-9P的SDS-PAGE结果,其中泳道1表示超滤后的培养物上清,泳道2表示培养物上清,泳道3表示蛋白质标记。
图7(a)示出分别在大肠杆菌(●)和P.methanolica(○)中表达的Xynsk1-9E和Xynsk1-9P的最佳温度。
图7(b)示出分别在大肠杆菌(●)和P.methanolica(○)中表达的Xynsk1-9E和Xynsk1-9P的最佳pH。
图8图示了与克隆的木聚糖酶基因sk1-9的位置相关的缺失和活性分析。
保藏物
携带xynsk1-9基因(SEQ ID NO:12)的Pichia methanolicaPXYNsk1-9,于2002年8月20日保藏在美国典型培养物保藏中心(ATCC,位于美国弗吉尼亚州马纳萨斯市大学道10801,邮编20110-2209),保藏号为ATCC PTA-4605。
具体实施方案
本发明涉及衍生自瘤胃微生物优选厌氧真菌的重组木聚糖酶,其通过使用合适的引物进行聚合酶链反应(PCR)而获得。可以是消化道(特别是瘤胃)真菌的厌氧真菌的例子包括:Neocallimastix.,如N.patnciarum,N.frontalis,N.hurleyensis和N.stanthorpensis;Sphaeromonas spp.,如S.communis;Caecomyces spp.,如C.equi;Piromyces spp.,如P.communis,P.equi,P.dwnbonica,P.lethargicus和P.mat;Ruminomyces spp.,如P.elegans;Anaeromyces spp.,如A.mucronatus,及Orpinomyces spp.,如O.bovis和O.joyonii。优选Neocallimastix spp.,特别优选Neocallimastix frontalis和N.patriciarum。
优选的本发明衍生自Neocallimastix frontalis或N.patriciarum的重组木聚糖酶包括SEQ ID No.16-27和32-33所示那些木聚糖酶。特别优选的是重组木聚糖酶Xynsk1-9E(SEQ ID NO.26)。
本发明的木聚糖酶耐热及耐碱性pH,而且具有高比活,其可以明显高于现有技术揭示的那些木聚糖酶的比活。特别是SEQ ID NO.26所示Xynsk1-9E在70℃在pH6条件下,在1%燕麦斯卑尔脱小麦木聚糖底物中反应3分钟后,呈现最高的比活10371.04U/mg蛋白质。
本发明的木聚糖酶最初通过使用特异性引物,及使用厌氧真菌的DNA作为PCR的DNA模板而获得,所述特异性引物基于GenBank中公布的木聚糖酶基因或氨基酸序列而设计,所述厌氧真菌DNA分离自的水牛(Bubalus befullus)和台湾梅花鹿(Cervus Nippon taiwanus)的瘤胃。所设计的引物不需要扩增整个木聚糖酶基因序列,因为从现有技术得知得自瘤胃的木聚糖酶基因残余物(即不完全的木聚糖酶基因序列)仍能呈现酶活性(Durand,R.,C.Rascle和M.Fevre.1996,瘤胃厌氧真菌Neocallimastix的内切木聚糖酶多基因家族的一个成员xyn3的分子学鉴定;Fanutti,C.,T.Ponyi,G.W.Black,G.P.Hazlewood和H.J.Gilbert.1995,得自厌氧真菌的纤维素酶和半纤维素酶中保守的非催化性40个残基的序列起蛋白质停靠结构域作用,生物化学杂志270:29314-22)。如下文中所述,本发明证实不完全基因序列也可以呈现酶活性(见图8)。本发明中所用引物优选特征在于具有序列aactgttgctaaggcccaatggggt或accccatttaccatcgtcatcagtg,或相似序列。获得瘤胃微生物的DNA序列的方法和PCR可以根据以下实施例中的方法及本领域已知的方法进行,本领域技术人员在不偏离本发明精神的范围内可以对所用方法加以调整。
至于重组蛋白的大规模表达,由于本发明的木聚糖酶的氨基酸序列和相关DNA序列已经由本申请鉴别,因此本发明的木聚糖酶可以通过任何合适的方式制备。虽然可以采取大量发酵转化的宿主,可以尝试通过有机化学的方法合成多肽,但选择的制备方法通常涉及重组DNA技术。本发明的木聚糖酶因此优选是异源木聚糖酶编码序列在真核表达宿主或原核表达宿主中的表达产物。优选真核表达宿主,因为本发明的木聚糖酶基因来自真核细胞。在适于常规使用的宿主的已知条件下培养转化的宿主,所需酶包含于所述宿主中或从宿主中分泌至培养基中,通过本领域已知方法从所述培养基中回收所述酶制品。
所述酶制品是含或不含转化的宿主细胞的培养基,或者通过本领域熟知的方法回收自所述培养基中。例如,当使用真核表达宿主如Pichia methanolica时,因为木聚糖酶分泌入培养基中,因此本发明的一个优点是本发明的酶制品可以从培养基中直接加以利用而不用进一步纯化。如果需要,这种制品可以冻干,或者以其它方式浓缩和/或稳定所述酶活性以便贮存。如果使用真核表达宿主,可以非常经济地提供和使用本发明的酶制品,因为(1)所述酶可以以粗制形式使用;无需从培养液中分离特异的酶,(2)因为所述酶分泌入培养基中,只有培养基需要回收以获得所需酶制品;不需要从宿主中提取酶。然而,如果使用原核表达宿主如大肠杆菌,需要从宿主中提取酶。
如果需要,表达的蛋白质可以根据常规条件进一步纯化,如提取,沉淀,层析,亲和层析,电泳等。
也已知通常非全长蛋白质具有完整蛋白质的功能,例如缺失N-末端,内部部分或C-末端的截短的蛋白质通常具有完整天然蛋白质的生物学和/或酶活性。本领域技术人员已知产生截短的蛋白质及具有内部缺失的蛋白质的方法。在本发明中,截短的木聚糖酶蛋白或内部缺失的木聚糖酶蛋白的功能可以使用下文揭示的及本领域通常已知的木聚糖酶分析测试。
基本保留本文特异揭示的木聚糖酶相同活性的取代和截短的木聚糖酶衍生物被认为是举例示出的木聚糖酶的等价物,而且属于本发明范围内,特别是当取代或截短的木聚糖酶衍生物的比活是举例示出的木聚糖酶的至少大10%时。本领域技术人员使用本文教导的分析方法及参考本领域已知的方法可以容易地测定截短或取代的木聚糖酶的活性。
根据本发明的第二方面,提供了编码本发明木聚糖酶的分离或重组的DNA分子。所述DNA序列优选包括木聚糖酶编码区(CDS,蛋白质编码序列)。遗传变体包括杂合DNA序列,其含有与源自同源或异源来源的调节区域如启动子、前导肽和终止子信号融合的木聚糖酶CDS。遗传变体还包括编码突变木聚糖酶蛋白的DNA序列和简并DNA序列,其中保留了所述酶的木聚糖降解活性。本发明提供了构建“第二代”木聚糖酶的起始材料,所述“第二代”木聚糖酶是具有与本文分离的那些酶不同性质的突变木聚糖酶,或者其DNA序列(编码木聚糖酶CDS)改变为反映遗传密码的简并性或杂交物种变化的突变木聚糖酶。基因可以通过本领域已知方法突变(例如化学方法,定点诱变,随机聚合酶反应诱变),从而产生具有改变的性质(例如温度和pH最佳值,比活或底物特异性)的基因产物。本发明的木聚糖酶基因也可以用于异源杂交和聚合酶链反应实验,以从其它天然来源中分离木聚糖酶编码基因。
尽管天然mRNA的全长拷贝在本发明这一方面的DNA中不存在,但应理解本发明不限于截短的cDNA。应理解的是可以存在天然存在于相应野生型基因中的一些或全部内含子(如果有的话)。然而,全长cDNA中存在的至少一些序列在本发明的DNA中不存在。还应理解本发明的这方面涵盖了编码本发明全长木聚糖酶的DNA;DNA中不存在的部分也许位于(在一些实施方案中优选是位于)3’和/或5’非翻译区。基本全长的或截短的木聚糖酶因此可以从本发明这一方面的DNA中产生,其(a)基本没有3’非翻译区,或(b)基本没有5’非翻译区,或(c)基本没有3’和5’非翻译区。
本发明优选的重组DNA包括SEQ ID No.2-13和29-30所示那些DNA。特别优选SEQ ID NO.12所示重组DNA,Xynsk1-9。
本发明的重组DNA可以呈载体形式。所述载体例如是质粒,粘粒或噬菌体。载体通常包括一或多个选择标记,从而可以选择用载体转染(或转化;在本说明书中这两个术语可交替使用)的细胞,优选可以选择携带掺入异源DNA的载体的细胞。通常存在适当的起始和终止信号。另外,如果所述载体要进行表达,要存在足够的调节序列以驱动表达。不包含调节序列的载体用作克隆载体;当然,表达载体也可以用作克隆载体。
克隆载体可以导入大肠杆菌,Pichia methanolica或便于其操纵的另外的合适宿主中。生产本发明木聚糖酶的有用宿主包括如下微生物的工业菌株如黑曲霉,无花果曲霉(Aspergillus ficcum),泡盛曲霉(Aspergillus awamori),米曲霉(Aspergillus oryzae),里氏木霉(Trichoderma reesei),米赫毛霉(Mucor miehei),乳克鲁维氏酵母(Kluyvermoyces lactis),巴斯德毕赤氏酵母(Pichia pastoris),Pichiamethanolica,酿酒酵母(Saccharomyces cerevisiae),大肠杆菌,枯草芽孢杆菌(Bacillus subtilis)或地衣形芽孢杆菌(Bacillus licheniformis)等,或植物宿主如canola,大豆,玉米,马铃薯等。所有***均使用一相似方案进行基因表达。一种表达构建体装配为包含相应蛋白质编码序列和控制序列如启动子,增强子和终止子。还可以包含其它序列如信号肽序列和选择标记。为实现木聚糖酶的胞外表达,本发明的表达构建体利用分泌信号肽序列。如果需要胞质表达,则表达构建体中不包含信号肽序列。为保证有效转录包含转录终止子。表达构建体中也可以包含增强表达或蛋白质纯化的辅助序列。启动子、增强子、信号肽和终止子元件在宿主细胞中起作用,使木聚糖酶有效表达和分泌。
根据本发明的另一方面,提供了一种用上述DNA转染或转化的宿主细胞。优选宿主是大肠杆菌或Pichia methanolica。特别优选Pichiamethanolica。
本发明的木聚糖酶在食品、饲料、纸浆和造纸业有许多应用。本发明所述的木聚糖酶在这些工业中的应用包括在本发明范围内。据信本发明的木聚糖酶特别适用于造纸和纸浆业。
定义
本文中出现的重组DNA技术中使用的许多术语定义如下:
木聚糖酶:木聚糖酶是一种半纤维素酶,其在木聚糖的木糖链内切割β-1,4键(木聚糖是通过β-1,4键连接的D-木糖残基的聚合物)。木聚糖酶活性与木聚糖裂解(xylanolytic)活性同义。
木聚糖酶活性单位是指在37℃在1分钟内释放1μmol产物(以木糖当量测得)的酶的数量。
一种氨基酸序列是一个特异氨基酸序列的“等价物”是指这样的氨基酸序列,其与该特异的氨基酸序列不同,其含有至少一些氨基酸变化(缺失,取代,转换,***等),当用于所需目的时,这些变化基本不影响该蛋白质的与所述特异氨基酸序列的类似活性相比的生物活性。优选地,“等价的”氨基酸序列含有在氨基酸水平与所述特异氨基酸序列有至少85%-99%同源性,更优选有至少90%同源性,在一特别高度优选的实施方案中,有至少95%同源性。
酶制品:“酶制品”是指一种组合物,其含有已经从一种微生物中提取(部分或完全纯化)的酶或用于培养这种微生物的培养基。“从中提取”是指从细胞中分离所述酶的任何方法,包括破坏细胞,也包括简单地从失效的细胞中除去培养基。因此,术语“酶制品”包括这样的组合物,其包含先前用于培养所需微生物的培养基和在培养期间微生物已经分泌入这种培养基中的任何酶。
同源:与本发明宿主“同源的”酶是指与宿主物种相同物种的未转化菌株天然产生一些数量的该天然蛋白质;与本发明宿主同源的“基因”是指在与宿主物种相同物种的未转化菌株的基因组中发现的基因。与本发明宿主“异源”的酶是指与宿主物种相同物种的未转化菌株不天然产生一些数量的该天然蛋白质;与本发明宿主“异源”的基因是指在与宿主物种相同物种的未转化菌株中未发现的基因。
克隆载体:指质粒或噬菌体DNA或其它DNA序列(如线性DNA),其提供一个合适的核酸环境以将相应基因转运宿主细胞中。本发明的克隆载体可以设计为在原核宿主及真核宿主中自主复制。在真菌宿主如毕赤氏酵母(Pichia)中,克隆载体一般不自主复制,相反仅作为一种运载工具将相应基因转运至毕赤氏酵母宿主中并随后***毕赤氏酵母基因组中。所述克隆载体进一步的特征在于一个或少量的内切核酸酶识别位点,在这些位点这种DNA序列可以以可确定方式切割而不丧失载体的基本生物学功能,而且DNA可以在其中剪接以使该DNA进行复制与克隆。所述克隆载体可进一步含有一个适用于鉴别用克隆载体转化的细胞的一个标记。标记例如是抗生素抗性。或者,这种标记可以存在一个克隆载体上,该克隆载体独立于提供相应基因的克隆载体。术语“载体”有时与“克隆载体”通用。
表达载体:这种载体与克隆载体相似,但其在转化进所需宿主后能表达相应基因。
当使用真菌宿主时,相应基因优选作为整合进真菌染色体中的克隆或表达载体的一部分提供给真菌宿主。衍生自克隆载体或表达载体的序列在整合过程期间也可以与相应基因整合。
相应基因优选置于一些控制序列的控制下(即可操纵地连接),所述控制序列如由载体提供的启动子序列(其与相应基因整合)。如果需要,这种控制序列可以作为***基因座的结果而由宿主染色体提供。
表达载体上的表达控制序列根据载体设计为在原核宿主或真核宿主中表达某一基因而加以变化(例如穿梭载体可以提供一种用于在细菌宿主内进行选择的基因),而且另外含有转录元件如增强子元件,终止序列和/或转录起始和终止位点。
本发明在以下实施例中得以更详细描述。这些实施例只示出了本发明的几个具体应用。显而易见,本领域技术人员可以进行一些相似的应用。因此不应认为实施例缩小了本发明的范围,它们只是阐明了本发明的应用。
                         实施例
                         实施例1
从厌氧真菌Neocallimastix frontalis(sk1)和N.patriciarum(w1)中
                      获得DNA序列
厌氧真菌Neocallimastix frontalis(sk1)和N.patriciarum(w1)分离自水牛(Bubalus befullus)和台湾梅花鹿(Cervus Nippon taiwanus)的瘤胃,如Orpin,C.G.等[Orpin,C.G.和Munri,E.A.,Trans.Br.Mycol.Soc.86:178181(1986)]所述。将Neocallimastix frontalis(sk1)和N.patriciarum(w1)于39℃在厌氧条件下,在1%微晶纤维素存在下于含有瘤胃液的培养基中(Kemp等,普通微生物学杂志130:27-37(1984))培养48小时。
提取菌株Neocallimastix frontalis(sk1)和N.patriciarum(w1)的总DNA,如Moncalvo等所述(Moncalvo,J.M.,H.H.Wang和R.S.Hseu,1995,从内部转录间隔序列和25S核糖体DNA序列推断的Ganoderma中的***发生亲缘关系,真菌学87:223-238)。将冻干的菌丝体在研钵中用研杵磨碎。将该材料悬浮于500μl裂解缓冲液(0.2 M Tris,0.25M NaCl,0.025 M EDTA,0.5%SDS(pH8.5))中。在加入500μl苯酚/氯仿/异戊醇(25∶24∶1)后,将该混合物充分混合并离心15分钟。将上清移至清洁试管中,加入0.1体积3M乙酸钠和0.6体积异丙醇。混合后,将该溶液静置5分钟。将样品离心15分钟并沥干。沉淀用70%乙醇漂洗,在真空下短暂干燥,然后溶解于100μl的TE(10mM Tris,1 mM EDTA(pH8.0))中。适当稀释后(500×),将此DNA溶液用作PCR模板。使用合适的引物进行PCR。所述引物及其核苷酸序列以及其目的示于表1。所述PCR中使用的反应试剂示于表2。PCR的反应条件如下:94℃、2分钟,然后依次重复以下4种条件35次:(1)94℃、45秒(变性DNA),(2)50℃、45秒,(3)72℃、45秒,(4)72℃、10分钟。
               表1:PCR中使用的引物
引物    序列(5’→3’)a                   目的
EX4F    aactgttgctaaggcccaatggggt      扩增木聚糖酶基因
EX3R    accccatttaccatcgtcatcagtg      扩增木聚糖酶基因
EX4F-E
        ggatccactgttgctaaggcccaatggggt 构建大肠杆菌载体
(BamHI)
EX3R-E
        gaattctcaaccccatttaccatcgtcat  构建大肠杆菌载体
(EcoRI)
EX4F-P
        gaattcgcgactgttgctaaggccc      构建P.methanolica载体
(EcoRI)
EX3R-P
        cgcggatccaccccatttaccatcgtcatc 构建P.methanolica载体
(BamHI)
a斜体字:限制酶切割位点
          表2:PCR试剂(25μl)
成分                   体积      终浓度
10×PCR缓冲液         2.5μl     1×
MgCl2 15mM           2.5μl     1.5mM
dNTP 2.5mM(每种)      2μl       0.2mM
引物10μM(每种)       各1μl     各0.4μM
Taq DNA聚合酶(5U/μl) 0.07μl    0.014U/μl
dH2O                 5.93μl
DNA模板               10μl
纯化的PCR产物用10单位的限制酶EcoRI和BamHI消化,并连接于预先用相同限制酶消化的50ng的pGEX4T-1或pMETαA中。利用“分子克隆通用方案”(Ausubel等,1994)中所述的CaCl2方法,用所得载体构建体转化大肠杆菌。将成功转化的菌株在含有0.3%燕麦斯卑尔脱小麦木聚糖的Luria Broth培养基中培养,并通过刚果红染色方法(Teather,R.M.和P.J.Wood,刚果红—多糖相互作用在计数和定性来自牛瘤胃中的分解纤维素的细菌中的应用,应用环境微生物学1982.43(4):p.777-80)。P.methanolica的转化和筛选根据“在Pichiamethanolica中重组蛋白表达方法手册,Invitrogen”进行。采用的菌株和载体的详细情况示于表3。载体构建过程示于图1和图2。以此方式获得的木聚糖酶基因的详细DNA序列示于图3(a)和图4(a)。以这些方式获得的木聚糖酶的推导的氨基酸序列示于3(b)和图4(b)。
                                        表3
菌株              目的      基因型                                       来源
                            FФ80dlacZ△M15△(lacZYA-argF)
                                                                        Life technologies,
大肠杆菌          载体构建  U169,deoR,recA1,endA1,hsdR17
                                                                        GIBCOBRL
(DH5α)           和贮存    (rk-,mk+),gal-phoA,supE44λ,-thi-1,
                                        gyrA96,relAl
大肠杆菌(BL21)    表达      大肠杆菌BF-ompT,hsdS(rB-,mB-),        Amersham pharmacia
                                       gal,dcm                                 biotech
pGEX4T-1          表达      Tac启动子,gst,Ampr,lacIq,pBR322       Amersham pharmacia
                                            ori                                 biotech
Pichia methanolica
                  表达                    Ade2-11                       Invitrogen
(PMAD11)
pMETαA           表达      AUG1启动子,AUG1转录终止信号,              Invitrogen
                              ADE2,pMBlori,Ampr
            实施例2:大规模表达重组蛋白
2.1 将成功转化的大肠杆菌菌株的每个菌落在含有150μg/ml氨苄青霉素的150ml LB培养基上单独培养。通过UV吸光度监测生长情况,直至OD600=0.6-0.9。用不可水解的乳糖类似物异丙基-β-D-1-硫代吡喃半乳糖苷(IPTG)诱导表达16小时。通过离心沉淀细胞,然后将沉淀的细胞悬浮于磷酸盐缓冲盐水(PBS,140mM NaCl,2.7mMKCl,10mM Na2HPO4,1.8mM KH2PO4,pH7.4)中。可以收获并直接使用细胞,或者在通过超声、机械作用、酶、化学品或高压处理破裂细胞后使用。所得裂解物可以直接用于展示木聚糖酶活性,或者可以进行进一步加工如离心。如果进行离心,上清中含有的重组蛋白可以通过谷胱甘肽S-转移酶(GST)亲和层析柱纯化。详细操作方法示于“GST亲和层析柱操作手册”(Amersham Pharmacia Biotech)。
2.2 将成功转化的P.methanolica菌株的每个菌落在200ml的YAPD(酵母提取物/琼脂/胨/葡萄糖)培养基中单独培养16小时。离心沉淀细胞并悬浮于BMMY培养基中。随后,在所述培养基中加入大约1ml甲醇/24小时,直至达到甲醇浓度为0.5%。在每个特定间隔取上清以进行蛋白质和酶分析。
为在Pichia methanolica中按比例扩大木聚糖酶的表达,使用配有5L工作容积的水夹套玻璃容器的BiostatB发酵罐(B.Braun biotechinternational)进行分批和补料分批发酵。P.methanolica的发酵包括两个阶段:首先是在葡萄糖上的生长阶段,随后在甲醇上的诱导阶段。所有发酵均在30℃用2.0L缓冲液葡萄糖复合培养基(BMDY,1%酵母提取物,2%胨,100mM磷酸钾,pH6.0,1.34%YNB,4×10-5%生物素和2%葡萄糖)中的生长阶段混合物起始。在接种之前,用浓氢氧化铵(28%(v/v))和2N硫酸将pH调节为6.0。将接种物生长于含有50mlBMDY培养基的250ml带挡板的烧瓶中,并在30℃以250rpm温育16-18小时。将过夜培养物加入发酵罐中至600nm光密度为大约0.1。使用由气泵(HIBLOW SPP-25GA)控制的恒流空气(2.5vvm)供氧,搅拌设为800rpm。培养基的pH用氢氧化铵和硫酸自动保持在6.0。
在葡萄糖耗尽后,通过在室温以1,500×g离心5分钟收集细胞。弃去上清,并将细胞再悬浮于2L缓冲的甲醇复合培养基中(BMMY 1%酵母提取物,2%胨,100mM磷酸钾,pH6.0,1.34%YNB,4×10-5%生物素和0.5%甲醇),并注入发酵罐中。每4小时加入一次0.5%甲醇。每24小时取样品进行光密度测定,活细胞测定,木聚糖酶活性分析,总可溶蛋白质测定及凝胶电泳分析。
实施例3:测定从培养物上清中获得的内切-β-1,4-木聚糖酶活性的最
                    佳pH和温度
将纯化后获得的重组蛋白质稀释为10-3-10-4mg/ml,以检测内切-β-1,4-木聚糖酶活性。活性检测使用二硝基水杨酸试剂进行(Miller,G.L.,二硝基水杨酸试剂在测定还原糖中的应用,分析化学31:426-428,1959),以确定碳水化合物的数量,使用木糖作标准。用以下经修改的方法测定实施例中示出的木聚糖酶活性(Georis等,由Streptomyces sp.S38的xyl1基因编码的内切β-1,4-木聚糖酶家族11的序列,过量生产和纯化,基因1999.237(1):p.123-33):分别在40,50,60,70,80和90℃将0.36ml底物溶液预保温5分钟(水浴),加入0.04ml稀释的酶溶液,涡旋混合几秒钟,并分别在40,50,60,70,80和90℃温育3分钟。随后,加入0.5ml DNS试剂终止反应,将反应混合物在100℃温育10分钟以生色。还原糖通过测定在540nm的吸光度而确定。最大活性定为100%。测试结果示于图7(a)。
为确定所获得的重组蛋白的最佳pH,使用的缓冲液为25mM柠檬酸盐缓冲液(pH3-6),磷酸盐缓冲液(pH6-8),Tris缓冲液(pH8-9)和甘氨酸缓冲液(pH9-10)。将取自摇瓶培养的样品(培养物上清)在每种缓冲液中稀释,然后温育3分钟。在工作缓冲液的pH或温度范围内针对底物背景还原糖基团校正所有单位。在70℃、每种pH下测定木聚糖酶活性。最大活性定为100%。测试结果示于图7(b)。
        实施例4:核苷酸测序和氨基酸测序分析
使用Neocallimastix frontailis(sk1)和N.patriciarum(w1)DNA作为模板进行PCR,成功获得大约1000bp的扩增产物。在DNA测序后,发现在这些扩增产物中,来自w1有5个不同序列,来自sk1有9个不同序列。基于序列对比,发现来自w1的4个序列(即w1-A1(SEQID No.8),w1-A2(SEQ ID No.9),w1-4(SEQ ID No.14)和w1-11(SEQID No.10))及来自sk1的8个序列(即sk1-2(SEQ ID No.4),sk1-9(SEQID No.12),sk1-11(SEQ ID No.3),sk1-12(SEQ ID No.5),sk1-14(SEQID No.2),sk1-15(SEQ ID No.11),sk1-18(SEQ ID No.6),和sk1-20(SEQ ID No.7))属于瘤胃真菌的内切-β-1,4-木聚糖酶基因(见图3(a))。另外,与现有技术相比较,得自N.patriciarum并从US 5,948,667中已知的序列AAE25847(SEQ ID No.14)及得自Orpinomyces sp.PC-2并从US 5,824,533中已知的序列AAE12389(SEQ ID No.15)与本发明的氨基酸序列最相近。DNA序列和氨基酸序列的相同性矩阵分别示于表4(a)和4(b)。
                           表4(a) DNA序列的相同性矩阵
        U66253  sk1-14  sk1-11  sk1-2  sk1-12  sk1-18  sk1-20  w1-A1  w1-A2  w1-11  sk1-15  sk1-9  w1-4
U66253  1.000   0.844   0.847   0.846  0.848   0.845   0.847   0.847  0.848  0.847  0.852   0.852  0.853
sk1-14   -      1.000   0.951   0.951  0.953   0.950   0.951   0.950  0.952  0.951  0.901   0.900  0.901
sk1-11   -      -       1.000   0.995  0.998   0.994   0.996   0.994  0.997  1.000  0.943   0.942  0.943
Sk1-2    -      -       -       1.000  0.997   0.993   0.995   0.993  0.996  0.995  0.942   0.941  0.942
sk1-12   -      -       -       -      1.000   0.996   0.998   0.996  0.999  0.998  0.945   0.944  0.945
sk1-18   -      -       -       -      -       1.000   0.994   0.992  0.995  0.994  0.941   0.940  0.941
sk1-20   -      -       -       -      -       -       1.000   0.996  0.997  0.996  0.943   0.942  0.943
w1-A1    -      -       -       -      -       -       -       1.000  0.995  0.994  0.942   0.941  0.942
w1-A2    -      -       -       -      -       -       -       -      1.000  0.997  0.944   0.943  0.944
w1-11    -      -       -       -      -       -       -       -      -      1.000  0.943   0.942  0.943
sk1-15   -      -       -       -      -       -       -       -      -      -      1.000   0.997  0.998
Sk1-9    -      -       -       -      -       -       -       -      -      -      -       1.000  0.999
W1-4     -      -       -       -      -       -       -       -      -      -      -       -      1.000
                         表4(b) 氨基酸序列的相同性矩阵
          AAE25847  AAD04194  SK1-14  SK1-11  SK1-2  SK1-12  SK1-18  SK1-20  W1-A1  W1-A2  W1-11  SK1-15  SK1-9  W1-4
AAE25847  1.000     0.201     0.198   0.200   0.203  0.203   0.203   0.203   0.203  0.203  0.200  0.200   0.200  0.200
AAD04194  -         1.000     0.837   0.863   0.863  0.869   0.863   0.863   0.866  0.866  0.863  0.879   0.879  0.882
SK1-14    -         -         1.000   0.957   0.957  0.963   0.957   0.957   0.957  0.960  0.957  0.887   0.887  0.890
SK1-11    -         -         -       1.000   0.988  0.994   0.988   0.988   0.988  0.991  1.000  0.915   0.915  0.918
SK1-2     -         -         -       -       1.000  0.994   0.988   0.988   0.988  0.991  0.988  0.915   0.915  0.918
SK1-12    -         -         -       -       -      1.000   0.994   0.994   0.994  0.997  0.994  0.921   0.921  0.923
SK1-18    -         -         -       -       -      -       1.000   0.988   0.988  0.991  0.988  0.915   0.915  0.918
SK1-20    -         -         -       -       -      -       -       1.000   0.994  0.991  0.988  0.915   0.915  0.918
W1-A1     -         -         -       -       -      -       -       -       1.000  0.991  0.988  0.918   0.918  0.921
W1-A2     -         -         -       -       -      -       -       -       -      1.000  0.991  0.918   0.918  0.921
W1-11     -         -         -       -       -      -       -       -       -      -      1.000  0.915   0.915  0.918
SK1-15    -         -         -       -       -      -       -       -       -      -      -      1.000   0.994  0.997
SK1-9     -         -         -       -       -      -       -       -       -      -      -      -       1.000  0.997
W1-4      -         -         -       -       -      -       -       -       -      -      -      -       -      1.000
另外,序列对比示出蛋白质SK1-6(SEQ ID No.32)和W1-6(SEQID No.33)属于瘤胃真菌的乙酰木聚糖酯酶,它们的氨基酸序列与衍生自N.patriciarum的AAB69092(SEQ ID No.31)序列最相近。在这一方面的DNA序列和氨基酸序列的相同性矩阵分别示于图4(a)和4(b)。序列相同性示于表5(a)和5(b)。
   表5(a) DNA序列的相同性矩阵
序列    U66253    sk1-6    w1-6
U66253  1.000     0.667    0.668
sk1-6   -         1.000    0.998
w1-6    -         -        1.000
   表5(b) 氨基酸序列的相同性矩阵
序列      AAB69092  SK1-6    W1-6
AAB69092  1.000     0.560    0.560
SK1-6     -         1.000    0.996
W1-6      -         -        1.000
令人惊奇地发现序列为aactgttgctaaggcccaatggggt或accccatttaccatcgtcatcagtg的引物不仅成功地扩增了内切木聚糖酶,而且还扩增出木聚糖酯酶基因。这也许是为什么所述引物可以成功扩增编码木聚糖降解酶的基因的原因。
       实施例5:内切β-1,4-木聚糖酶的活性检测
由大肠杆菌表达的重组蛋白质在经GST亲和层析柱纯化后,进行SDS-PAGE分析(见图5)。最后,分离出分子量为大约29kDa的蛋白质(称为Xynsk1-9E,泳道4)。活性检测证明其具有内切β-1,4-木聚糖酶活性。
收集P.methanolica培养物上清并浓缩为原体积的1/10。如上所述进行上清的SDS-PAGE分析,其浓缩物示出一条从33-118kDa的条带,相关蛋白质称为Xynsk1-9P(泳道1-2)(见图6)。
最佳温度和pH以及底物特异性的测定表明Xynsk1-9E和Xynsk1-9P在这些方面具有相同倾向。另外,在70℃,pH6及当底物是1%燕麦斯卑尔脱小麦木聚糖时,观测到最高活性(见图7(a)和7(b))。换而言之,Xynsk1-9E在底物为1%燕麦斯卑尔脱小麦木聚糖中在70℃和pH6下反应3分钟后,呈现最高的比活10371.04U/mg蛋白质(见表6)。
      表6:在大肠杆菌和P.methanolica中表达的
         Xynsk1-9E和Xynsk1-9P的底物特异性
                               大肠杆菌           P.methanolicaa
底物
                              U/ml     U/mg 蛋白质     U/ml
1%燕麦斯卑尔脱小麦木聚糖
                            20742.07   10371.04       71686.7
(OSX)
1%桦木木聚糖(BWX)          19043.32   9521.66        61685.65
0.5%黑麦***木聚糖(RAX)  6665.42    3332.71        24908.56
0.5%小麦***木聚糖(WAX)  5485.17    2742.59        20804.75
0.5%羧甲基纤维素(CMC)      N.D.       N.D.           N.D.
0.2%微晶纤维素             N.D.       N.D.           N.D.
N.D.:未检测到,a超滤后的培养物上清
                           序列表
<110>前卫生物科技开发股份有限公司
     育德生物科技股份有限公司
<120>衍生自厌氧真菌的新的重组木聚糖酶及相关序列、表达载体和宿主
<130>P22617
<160>33
<170>PatentIn version 3.1
<210>1
<211>1014
<212>DNA
<213>Orpinomyces sp.PC-2
<400>1
accgttgcta aggcccaatg gggtggaaac ggtggtgcct ctgctggtca aagattaagc     60
gttggtggtg gtcaaaacca acataaaggt gtttttgatg gcttcagtta tgaaatctgg    120
ttagataaca ccggtggtag tggttccatg acccttggta aaggtgcaac cttcaaggct    180
gaatggagtg cagctgttaa ccgtggtaac ttccttgccc gtcgtggtct tgatttcggt    240
tctaccaaaa aggcaaccgc ttacgaatac atcggattgg attatgaagc aagttacaga    300
caaactgcca gcgcaagtgg taactcccgt ctttgtgtat acggctggtt ccaaaaccgt    360
ggagttcaag gcgtaccttt ggtagaatac tacatcattg aagattgggt tgactgggta    420
ccagatgcac aaggaaaaat ggtaaccatc gatggtgcac aatataagat tttccaaatg    480
gatcacactg gtccaactat caatggtggt aatgaaacct ttaagcaata cttcagtgtc    540
cgtcaacaaa agagaacttc tggtcatatt actgtatcag atcactttaa ggcatggtcc    600
aatcaaggtt ggggtattgg aaacctctat gaagttgcat tgaacgcaga aggttggcaa    660
agtagtggtg tcgctgacgt ccccaagttg gatgtctaca ccaccaaaca aggttctgct    720
cctcgtacta ccaccaccac tacccgtact actacccgta ctactacaaa aacacttcca    780
accactaata aaaaatgttc tgccaagatt actgcccaag gttacaagtg ttgtagtgat    840
ccaaattgtg ttgtttacta cactgatgaa gatggtacct ggggtgttga aaacaatcaa    900
tggtgtggat gtggtgttga agcatgttct ggcaagatta ctgcccaagg ttacaagtgt    960
tgtagtgatc caaagtgtgt tgtttactac actgatgacg atggtaaatg gggt          1014
<210>2
<211>1027
<212>DNA
<213>Neocallimastix frontalis
<400>2
actgttgcta aggcccaatg gggtggaggt gcttccgctg gtcaaaaatt atccgtcggt    60
ggtggtcaaa accaacataa gggtgtctcc gatggtttca gttatgaaat ctggttagat     120
aacaccggtg gtagcggttc tatgactctc ggtagtggtg caaccttcaa ggctgaatgg     180
aatgcagctg ttaaccgtgg taacttcctt gcccgtcgtg gccttgactt cggttctcaa     240
aagaaggcaa ccgactacag ctacatcgga ttggattata ctgcaactta cagacaaact     300
gccagtgcaa gtggtaactc ccgtctctgt gtatacggat ggttccaaaa ccgtggagtt     360
caaggtgttc ctttagtaga atactacatc attgaagatt gggttgactg ggttccagat     420
gcacaaggaa aaatggtaac catcgatgga gctcaatata agattttcca aatggatcac     480
actggtccaa ctatcaatgg tggtagtgaa acctttaagc aatacttcag tgtccgtcaa     540
caaaagagaa cttctggtca tattactgtc tcagatcact ttaaggaatg ggctaaacaa     600
ggttggggta ttggtaacct ttatgaagtt gctttgaacg ccgaaggttg gcaaagtagt     660
ggtatagctg atgtcaccaa gttagatgtt tacacaaccc aaaaaggttc taatcctacc     720
accgccgctc gtactactcg tactactgcc cgtactactg cccgtactac tacccgtact     780
aagactcttc caaccaacaa taagtgttct tccaaaatta ctgctcaagg ttacaagtgt     840
tgtagtaatc caaattgtga aattgtctac actgatgacg atggtacctg gggtgttgaa     900
aacaatgaat ggtgtggttg tggtcttgaa aaatgttctt caaagattac tgctcaaggt     960
tacaagtgtt gtagcgatcc aaattgcgtt gtttactaca ctgatgacga taaactgttg    1020
ctaaggc                                                              1027
<210>3
<211>1023
<212>DNA
<213>Neocallimastix frontalis
<400>3
actgttgcta aggcccaatg gggtggaggt gcttccgctg gtcaaaaatt atccgtcggt      60
ggtggtcaaa accaacataa gggtgtctcc gatggtttca gttatgaaat ctggttagat     120
aacaccggtg gtagcggttc tatgattctc ggtagtggtg caaccttcaa ggctgaatgg     180
aatgcagctg ttaaccgtgg taacttcctt gcccgtcgtg gtcttgactt cggttctcaa     240
aagaaggcaa ccgattacag ctacatcgga ttggattata ctgcaactta cagacaaact     300
gccagtgcaa gtggtaactc ccgtctctgt gtatacggat ggttccaaaa ccgtggagtt     360
caaggcgttc ctttagtaga atactacatc attgaagatt gggttgactg ggttccagat     420
gcacaaggaa aaatggtaac catcgatgga gctcaatata agattttcca aatggatcac     480
actggtccaa ctatcaatgg tggtagtgaa acctttaagc aatacttcag tgtccgtcaa     540
caaaagagaa cttctggtca tattactgtc tcagatcact ttaaggaatg ggctaaacat     600
ggttggggta ttggtaacct ttatgaagtt gctttgaacg ccgaaggttg gcaaagtagt     660
ggtatagctg atgtcaccaa gttagatgtt tacacaaccc aaaaaggttc taatcctacc     720
accgccgctc gtactactcg tactactgcc cgtactactg cccgtactac tacccgtact     780
aagactcttc caaccaacaa taagtgttct tccaaaatta ctgctcaagg ttacaagtgt     840
tgtagtaatc caaattgtga aattgtctac actgatgacg atggtacctg gggtgttgaa     900
aacaatgaat ggtgtggttg tggtcttgaa aaatgttctt caaagattac tgctcaaggt     960
tacaagtgtt gtagcgatcc aaattgcgtt gtttactaca ctgatgacga tggtaaatgg    1020
ggt                                                                  1023
<210>4
<211>1023
<212>DNA
<213>Neocallimastix frontalis
<400>4
actgttgcta aggcccaatg gggtggaggt gcttccgctg gtcaaaaatt atccgtcggt      60
ggtggtcaaa accaatataa gggtgtctcc gatggtttca gttatgaaat ctggttagat     120
aacaccggtg gtagcggttc tatgactctc ggtagtggtg caaccttcaa ggctgaatgg     180
aatgcagctg ttaaccgtgg taacttcctt gcccgtcgtg gtcttgactt cggttctcaa     240
aagaaggcaa ccgattacag ctacatcgga ttggattata ctgcaactta cagacaaact     300
gccagtgcaa gtggtaactc ccgtctctgt gtatacggat ggttccaaaa ccgtggagtt     360
caaggcgttc ctttagtaga atactacatc attgaagatt gggttgactg ggttccagat     420
gcacaaggaa aaatggtaac catcgacgga gctcaatata agattatcca aatggatcac     480
actggtccaa ctatcaatgg tggtagtgaa acctttaagc aatacttcag tgtccgtcaa     540
caaaagagaa cttctggtca tattactgtc tcagatcact ttaaggaatg ggctaaacaa     600
ggttggggta ttggtaacct ttatgaagtt gctttgaacg ccgaaggttg gcaaagtagt     660
ggtatagctg atgtcaccaa gttagatgtt tacacaaccc aaaaaggttc taatcctacc     720
accgccgctc gtactactcg tactactgcc cgtactactg cccgtactac tacccgtact     780
aagactcttc caaccaacaa taagtgttct tccaaaatta ctgctcaagg ttacaagtgt     840
tgtagtaatc caaattgtga aattgtctac actgatgacg atggtacctg gggtgttgaa     900
aacaatgaat ggtgtggttg tggtcttgaa aaatgttctt caaagattac tgctcaaggt     960
tacaagtgtt gtagcgatcc aaattgcgtt gtttactaca ctgatgacga tggtaaatgg    1020
ggt                                                                  1023
<210>5
<211>1023
<212>DNA
<213>Neocallimastix frontalis
<400>5
actgttgcta aggcccaatg gggtggaggt gcttccgctg gtcaaaaatt atccgtcggt      60
ggtggtcaaa accaacataa gggtgtctcc gatggtttca gttatgaaat ctggttagat     120
aacaccggtg gtagcggttc tatgactctc ggtagtggtg caaccttcaa ggctgaatgg     180
aatgcagctg ttaaccgtgg taacttcctt gcccgtcgtg gtcttgactt cggttctcaa     240
aagaaggcaa ccgattacag ctacatcgga ttggattata ctgcaactta cagacaaact     300
gccagtgcaa gtggtaactc ccgtctctgt gtatacggat ggttccaaaa ccgtggagtt     360
caaggcgttc ctttagtaga atactacatc attgaagatt gggttgactg ggttccagat     420
gcacaaggaa aaatggtaac catcgatgga gctcaatata agattttcca aatggatcac     480
actggtccaa ctatcaatgg tggtagtgaa acctttaagc aatacttcag tgtccgtcaa     540
caaaagagaa cttctggtca tattactgtc tcagatcact ttaaggaatg ggctaaacaa     600
ggttggggta ttggtaacct ttatgaagtt gctttgaacg ccgaaggttg gcaaagtagt     660
ggtatagctg atgtcaccaa gttagatgtt tacacaaccc aaaaaggttc taatcctacc     720
accgccgctc gtactactcg tactactgcc cgtactactg cccgtactac tacccgtact     780
aagactcttc caaccaacaa taagtgttct tccaaaatta ctgctcaagg ttacaagtgt     840
tgtagtaatc caaattgtga aattgtctac actgatgacg atggtacctg gggtgttgaa     900
aacaatgaat ggtgtggttg tggtcttgaa aaatgttctt caaagattac tgctcaaggt     960
tacaagtgtt gtagcgatcc aaattgcgtt gtttactaca ctgatgacga tggtaaatgg    1020
ggt                                                                  1023
<210>6
<211>1023
<212>DNA
<213>Neocallimastix frontalis
<400>6
actgttgcta aggcccaatg gggtggaggt gcttccgctg gtcaaaaatt atccgtcggt      60
ggtggtcaaa accaacataa gggtgtctcc gatggtttca gttatgaaat ctggttagat     120
aacaccggtg gtagcggttc tatgactctc ggtagtggtg caaccttcaa ggctgaatgg     180
aatgcagctg ttaaccgtgg taacttcctt gcccgtcgtg gtctcgactt cggttctcaa     240
aagaaggcaa ccgattacag ctacatcgga ttggattata ctgtaactta cagacaaact     300
gccagtgcaa gtggtaactc ccgtctctgt gtatacggat ggttccaaaa ccgtggagtt     360
caaggcgttc ctctagtaga atactacatc attgaagatt gggttgactg ggttccagat     420
gcacaaggaa aaatggtaac catcgatgga gctcaatata agattttcca aatggatcac     480
actggtccaa ctatcaatgg tggtagtgaa acctttaagc aatacttcag tgtccgtcaa     540
caaaagagaa cttctggtca tattactgtc tcagatcact ttaaggaatg ggctaaacaa     600
ggttggggta ttggtaacct ttatgaagtt gctttgaacg ccgaaggttg gcaaagtagt     660
ggtatagctg atgtcaccaa gttagatgtt tacacaaccc aaaaaggttc taatcctacc     720
accgccgctc gtactactcg tactactgcc cgtactactg cccgtactac tacccgtact     780
aagactcttc caaccaacaa taagtgttct tccaaaatta ctgctcaagg ttacaagtgt     840
tgtagtaatc caaattgtga aattgtctac tctgatgacg atggtacctg gggtgttgaa     900
aacaatgaat ggtgtggttg tggtcttgaa aaatgttctt caaagattac tgctcaaggt     960
tacaagtgtt gtagcgatcc aaattgcgtt gtttactaca ctgatgacga tggtaaatgg    1020
ggt                                                                  1023
<210>7
<211>1023
<212>DNA
<213>Neocallimastix frontalis
<400>7
actgttgcta aggcccaatg gggtggaggt gcttccgctg gtcaaaaatt atccgtcggt      60
ggtggtcaaa accaacataa gggtgtctcc gatggtttca gttatgaaat ctggttagat     120
aacaccggtg gtagcggttc tatgactctc ggtagtggtg caaccttcaa ggctgaatgg     180
aatgcagctg ttaaccgtgg taacttcctt gcccgtcgtg gtcttgactt cggttctcaa     240
aagaaggcaa ccgattacag ctacatcgga ttggattata ctgcaactta cagacaaact     300
gccagtgcaa gtggtaactc ccgtctctgt gtatacggat ggttccaaaa ccgtggagtt     360
caaggcgttc ctttagtaga atactacatc attgaagatt gggttgactg ggttccagat     420
gcacaaggaa aaatggtaac catcgatgga gctcaatata agattttcca aatggatcac     480
actggtccaa ctatcaatgg tggtagtgaa acctttaagc aatacttcag tgtccgtcaa     540
caaaagagaa cttctggtca tattactgtc tcagatcact ttaaggaatg ggctaaacaa     600
ggttggggta ttggtaacct ttatgaagtt gctttgaacg ccgaaggttg gcaaagtagt     660
ggtatagctg atgtcaccaa gttagatgtt tacacaaccc aaaaaggttc taatcctacc     720
accgccgctc gtactactcg tactactgcc cgtactactg cccgtactac tacccgtact     780
aagactcttc caaccaacaa taagtgttct tccaaaatta ctgctcaagg ttacaagtgt     840
agtagtaatc caaattgtga aattgtctac actgatgacg atggtacctg gggtgttgaa     900
aacaatgaat ggtgtggttg tggtcttgaa aaatgttctt caaagattac tgctcaaggt     960
tacaagtgtc gtagcgatcc aaattgcgtt gtttactaca ctgatgacga tggtaaatgg    1020
ggt                                                                  1023
<210>8
<211>1023
<212>DNA
<213>Neocallimastix patriciarum
<400>8
actgttgcta aggcccaatg gggtggaggt gcttccgctg gtcaaaaatt atccgtcggt      60
ggtggtcaaa accaacataa gggtgtctcc gatggtttca gttatgaaat ctggttagat     120
aacaccggtg gtagcggttc tatgactctc ggtagtggtg caaccttcaa ggctgaatgg     180
aatgcagctg ttaaccgtgg taacttcctt gcccgtcgtg gtcttgactt cggttctcaa     240
aagaaggcaa ccgattacag ctacatcgga ttggattata ctgcaactta cagacaaact     300
gccagtgcaa gtggtaactc ccgcctctgt gtatacggat ggttccaaaa ccgtggagtt     360
caaggcgttc ctttagtaga atactacatc attgaagatt gggttgactg ggttccagat     420
gcacaaggaa aaatggtaac catcgatgga gctcaatata agattttcca aatggatcac     480
actggtccaa ctatcaatgg tggtagtgaa acctttaagc aatacttcag tgtccgtcaa     540
caaaagagaa cttctggtca tattactgtc tcagatcact ttaaggaatg ggctaaacaa     600
ggttggggta ttggtaacct ttatgaagtt gctttgaacg ccgaaggttg gcaaagtagt     660
ggtatagctg atgtcaccaa gttagatgtt tacacaaccc aaaaaggttc taatcctacc     720
accgccgctc gtactactcg tactactgcc cgtactactg cccgtactac tacccgtact     780
aagactcttc caaccaacaa taagtgttct tccaaaatta ctgctcaagg ttacaagtgt     840
tgtagtaatc caaattgtga aattgtttac actgatgacg atggtacctg gggtgttgaa     900
aacaatgaat ggtgtggttg tggtcttgaa gaatgttctt caaagattac tgctcaaggt     960
tacaagtgtc gtagcgatcc aaattgcgtt gtttactaca ctgatgacga tggtaaatgg    1020
ggt                                                                  1023
<210>9
<211>1023
<212>DNA
<213>Neocallimastix patriciarum
<400>9
actgttgcta aggcccaatg gggtggaggt gcttccgctg gtcaaaaatt atccgtcggt      60
ggtggtcaaa accaacataa gggtgtctcc gatggtttca gttatgaaat ctggtcagat     120
aacaccggtg gtagcggttc tatgactctc ggtagtggtg caaccttcaa ggctgaatgg     180
aatgcagctg ttaaccgtgg taacttcctt gcccgtcgtg gtcttgactt cggttctcaa     240
aagaaggcaa ccgattacag ctacatcgga ttggattata ctgcaactta cagacaaact     300
gccagtgcaa gtggtaactc ccgtctctgt gtatacggat ggttccaaaa ccgtggagtt     360
caaggcgttc ctttagtaga atactacatc attgaagatt gggttgactg ggttccagat     420
gcacaaggaa aaatggtaac catcgatgga gctcaatata agattttcca aatggatcac     480
actggtccaa ctatcaatgg tggtagtgaa acctttaagc aatacttcag tgtccgtcaa     540
caaaagagaa cttctggtca tattactgtc tcagatcact ttaaggaatg ggctaaacaa     600
ggttggggta ttggtaacct ttatgaagtt gctttgaacg ccgaaggttg gcaaagtagt     660
ggtatagctg atgtcaccaa gttagatgtt tacacaaccc aaaaaggttc taatcctacc     720
accgccgctc gtactactcg tactactgcc cgtactactg cccgtactac tacccgtact     780
aagactcttc caaccaacaa taagtgttct tccaaaatta ctgctcaagg ttacaagtgt     840
tgtagtaatc caaattgtga aattgtctac actgatgacg atggtacctg gggtgttgaa     900
aacaatgaat ggtgtggttg tggtcttgaa aaatgttctt caaagattac tgctcaaggt     960
tacaagtgtt gtagcgatcc aaattgcgtt gtttactaca ctgatgacga tggtaaatgg    1020
ggt                                                                  1023
<210>10
<211>1023
<212>DNA
<213>Neocallimastix patriciarum
<400>10
actgttgcta aggcccaatg gggtggaggt gcttccgctg gtcaaaaatt atccgtcggt      60
ggtggtcaaa accaacataa gggtgtctcc gatggtttca gttatgaaat ctggttagat     120
aacaccggtg gtagcggttc tatgattctc ggtagtggtg caaccttcaa ggctgaatgg     180
aatgcagctg ttaaccgtgg taacttcctt gcccgtcgtg gtcttgactt cggttctcaa     240
aagaaggcaa ccgattacag ctacatcgga ttggattata ctgcaactta cagacaaact     300
gccagtgcaa gtggtaactc ccgtctctgt gtatacggat ggttccaaaa ccgtggagtt     360
caaggcgttc ctttagtaga atactacatc attgaagatt gggttgactg ggttccagat     420
gcacaaggaa aaatggtaac catcgatgga gctcaatata agattttcca aatggatcac     480
actggtccaa ctatcaatgg tggtagtgaa acctttaagc aatacttcag tgtccgtcaa     540
caaaagagaa cttctggtca tattactgtc tcagatcact ttaaggaatg ggctaaacat     600
ggttggggta ttggtaacct ttatgaagtt gctttgaacg ccgaaggttg gcaaagtagt     660
ggtatagctg atgtcaccaa gttagatgtt tacacaaccc aaaaaggttc taatcctacc     720
accgccgctc gtactactcg tactactgcc cgtactactg cccgtactac tacccgtact     780
aagactcttc caaccaacaa taagtgttct tccaaaatta ctgctcaagg ttacaagtgt     840
tgtagtaatc caaattgtga aattgtctac actgatgacg atggtacctg gggtgttgaa     900
aacaatgaat ggtgtggttg tggtcttgaa aaatgttctt caaagattac tgctcaaggt     960
tacaagtgtt gtagcgatcc aaattgcgtt gtttactaca ctgatgacga tggtaaatgg    1020
ggt                                                                  1023
<210>11
<211>1011
<212>DNA
<213>Neocallimastix frontalis
<400>11
actgttgcta aggcccaatg gggtggaggt gcttccgctg gtcaaaaatt atccgtcggt      60
ggtggtcaaa accaacataa gggtgtctcc gatggtttca gttatgaaat ctggttagat     120
aacaccggtg gtagcggttc tatgactctc ggtagtggtg caaccttcaa ggctgaatgg     180
aatgcagctg ttaaccgtgg taacttcctt gcccgtcgtg gtcttgactt cggttctcaa     240
aagaaggcag ccgattacag ctacatcgga ttggattata ctgcaactta cagacaaact     300
gccagtgcaa gtggtaactc ccgtctctgt gtatacggat ggttccaaaa ccgtggagtt     360
caaggcgttc ctttagtaga atactacatc attgaagatt gggttgactg ggttccagat     420
gcacaaggaa aaatggtaac catcgatgga gctcaatata agattttcca aatggatcac     480
actggtccaa ctatcaatgg tggtagtgaa acctttaagc aatacttcag tgtccgtcaa     540
caaaagagaa cttctggtca tattactgtc tcagatcact ttaaggaatg ggctaaacaa     600
ggttggggta ttggtaacct ttatgaagtt gctttgaacg ccgaaggttg gcaaagtagt     660
ggtgttgctg atgtcacctt attagatgtt tacacaactc caaagggttc tagtccagcc     720
acctctgccg ctcctcgtac tactacccgt actactactc gtaccaagtc tcttccaacc     780
aattacaata agtgttctgc tagaattact gctcaaggtt acaagtgttg tagcgatcca     840
aattgtgttg tttactacac tgatgacgat ggtacctggg gtgttgaaaa caatgaatgg     900
tgtggttgtg gtgttgaaca atgttcttcc aagatcactt ctcaaggtta caagtgttgt     960
agcgatccaa attgcgttgt tttctacact gatgacgatg gtaaatgggg t             1011
<210>12
<211>1011
<212>DNA
<213>Neocallimastix frontalis
<400>12
actgttgcta aggcccaatg gggtggaggt gcttccgctg gtcaaaaatt atccgtcggt      60
ggtggtcaaa accaacataa gggtgtctcc gatggtttca gttatgaaat ctggttagat     120
aacaccggtg gtagcggttc tatgactctc ggtagtggtg caaccttcaa ggctgaatgg     180
aatgcagctg ttaaccgtgg taacttcctt gcccgtcgtg gtcttgactt cggttctcaa     240
aagaaggcaa ccgattacag ctacatcgga ttggattata ctgcaactta cagacaaact     300
gccagtgcaa gtggtaactc ccgtctctgt gtatacggat ggttccaaaa ccgtggagtt     360
caaggcgttc ctttagtaga atactacatc attgaagatt gggttgactg ggttccagat     420
gcacaaggaa aaatggtaac catcgatgga gctcaatata agattttcca aatggatcac     480
actggtccaa ctatcaatgg tggtagtgaa acctttaagc aatacttcag tgtccgtcaa     540
caaaagagaa cttctggtca tattactgtc tcagatcact ttaaggaatg ggctaagcaa     600
ggttggggta ttggtaacct ttatgaagtt gctttgaacg ccgaaggttg gcaaagtagt     660
ggtgttgctg atgtcacctt attagatgtt tacacaactc caaagggttc tagtccagcc     720
acctctgccg ctcctcgtac tactacccgt actactactc gtaccaagtc tcttccaacc     780
aattacaata agtgttctgc tagaattact gctcaaggtt acaagtgttg tagcgatcca     840
aattgtgttg tttactacac tgatgacgat ggtacctggg gtgttgaaaa caatgaatgg     900
cgtggttgtg gtgttgaaca atgttcttcc aagatcactt ctcaaggtta caagtgttgt     960
agcgatccaa attgcgttgt tttctacact gatgacgatg gtaaatgggg t             1011
<210>13
<211>1011
<212>DNA
<213>Neocallimastix patriciarum
<400>13
actgttgcta aggcccaatg gggtggaggt gcttccgctg gtcaaaaatt atccgtcggt      60
ggtggtcaaa accaacataa gggtgtctcc gatggtttca gttatgaaat ctggttagat     120
aacaccggtg gtagcggttc tatgactctc ggtagtggtg caaccttcaa ggctgaatgg     180
aatgcagctg ttaaccgtgg taacttcctt gcccgtcgtg gtcttgactt cggttctcaa     240
aagaaggcaa ccgattacag ctacatcgga ttggattata ctgcaactta cagacaaact     300
gccagtgcaa gtggtaactc ccgtctctgt gtatacggat ggttccaaaa ccgtggagtt     360
caaggcgttc ctttagtaga atactacatc attgaagatt gggttgactg ggttccagat     420
gcacaaggaa aaatggtaac catcgatgga gctcaatata agattttcca aatggatcac     480
actggtccaa ctatcaatgg tggtagtgaa acctttaagc aatacttcag tgtccgtcaa     540
caaaagagaa cttctggtca tattactgtc tcagatcact ttaaggaatg ggctaagcaa     600
ggttggggta ttggtaacct ttatgaagtt gctttgaacg ccgaaggttg gcaaagtagt     660
ggtgttgctg atgtcacctt attagatgtt tacacaactc caaagggttc tagtccagcc     720
acctctgccg ctcctcgtac tactacccgt actactactc gtaccaagtc tcttccaacc     780
aattacaata agtgttctgc tagaattact gctcaaggtt acaagtgttg tagcgatcca     840
aattgtgttg tttactacac tgatgacgat ggtacctggg gtgttgaaaa caatgaatgg     900
tgtggttgtg gtgttgaaca atgttcttcc aagatcactt ctcaaggtta caagtgttgt     960
agcgatccaa attgcgttgt tttctacact gatgacgatg gtaaatgggg t             1011
<210>14
<211>448
<212>PRT
<213>Neocallimastix patriciarum
<400>14
Thr Leu Ala Gln Ser Phe Cys Ser Ser Ala Ser His Ser Gly Gln Ser
1               5                   10                  15
Val Lys Glu Thr Gly Asn Lys Val Gly Thr Ile Gly Gly Val Gly Tyr
            20                  25                  30
Glu Leu Trp Ala Asp Ser Gly Asn Asn Ser Ala Thr Phe Tyr Ser Asp
        35                  40                  45
Gly Ser Phe Ser Cys Thr Phe Gln Asn Ala Gly Asp Tyr Leu Cys Arg
    50                  55                  60
Ser Gly Leu Ser Phe Asp Ser Thr Lys Thr Pro Ser Gln Ile Gly Arg
65                  70                  75                  80
Met Lys Ala Asp Phe Lys Leu Val Lys Thr Lys Tyr Phe Gln Cys Trp
                85                  90                  95
Leu Phe Leu Cys Trp Cys Leu Arg Trp Thr Arg Ser Pro Leu Val Gly
            100                 105                 110
Ile Leu His Val Asp Asn Trp Leu Ser Pro Ser Pro Pro Gly Asp Trp
        115                 120                 125
Val Gly Asn Lys Lys His Gly Ser Phe Thr Ile Asp Gly Ala Gln Tyr
    130                 135                 140
Thr Val Tyr Glu Asn Thr Arg Thr Gly Pro Ser Ile Asp Gly Asn Thr
145                 150                 155                 160
Thr Phe Lys Gln Tyr Phe Ser Ile Arg Gln Gln Ala Arg Asp Cys Gly
                165                 170                 175
Thr Ile Asp Ile Ser Ala His Phe Asp Gln Trp Glu Lys Leu Gly Met
            180                 185                 190
Thr Met Gly Lys Leu His Glu Ala Lys Val Leu Gly Glu Ala Gly Asn
        195                 200                 205
Gly Asn Gly Gly Val Ser Gly Thr Ala Asp Phe Pro Tyr Ala Lys Val
    210                 215                 220
Tyr Ile Gly Asp Gly Asn Gly Gly Gly Ala Ser Pro Ala Pro Ala Gly
225                 230                 235                 240
Gly Ala Pro Ala Gly Gly Ala Pro Ala Gly Asn Asp Gln Pro Gln Gly
                245                 250                 255
Pro Gln Gly Gln Gln Pro Pro Gln Gly Gln Gln Pro Pro Gln Gly Gln
            260                 265                 270
Gln Pro Pro Gln Gly Gln Gln Pro Pro Gln Gly Gln Gln Pro Pro Gln
        275                 280                 285
Gly Asn Asp Gln Gln Gly Gln Gln Pro Pro Gln Gly Gln Gln Pro Pro
    290                 295                 300
Gln Gly Asn Asp Gln Gln Gln Gly Gln Gln Pro Pro Gln Pro Gln Gly
305                 310                 315                 320
Pro Gln Gly Gly Asn Pro Gly Gly Ser Asp Phe Asn Asn Trp Asn Gln
                325                 330                 335
Gly Gly Ser Pro Trp Gly Gly Asn Gln Gly Gly Ser Pro Trp Gly Gly
            340                 345                 350
Asn Gln Gly Gly Asn Pro Trp Gly Gly Asn Gln Gly Gly Ser Pro Trp
        355                 360                 365
Gly Gly Asn Gln Gly Gly Ser Pro Trp Gly Gln Gly Asn Gln Gly Gly
    370                 375                 380
Asn Pro Trp Gly Gly Asn Gln Gly Gly Ser Pro Trp Gly Gly Asn Gln
385                 390                 395                 400
Gly Gly Asn Pro Trp Gly Gly Asn Gln Trp Gly Ala Pro Gln Asn Ala
                405                 410                 415
Ala Ala Pro Gln Ser Ala Ala Ala Pro Gln Asn Ala Ser Asp Gly Gly
            420                 425                 430
Asn Cys Ala Ser Leu Trp Gly Gln Cys Gly Gly Gln Gly Tyr Asn Gly
        435                 440                 445
<210>15
<211>338
<212>PRT
<213>Orpinomyces sp.PC-2
<400>15
Thr Val Ala Lys Ala Gln Trp Gly Gly Asn Gly Gly Ala Ser Ala Gly
1               5                   10                  15
Gln Arg Leu Ser Val Gly Gly Gly Gln Asn Gln His Lys Gly Val Phe
            20                  25                  30
Asp Gly Phe Ser Tyr Glu Ile Trp Leu Asp Asn Thr Gly Gly Ser Gly
        35                  40                  45
Ser Met Thr Leu Gly Lys Gly Ala Thr Phe Lys Ala Glu Trp Ser Ala
    50                  55                  60
Ala Val Asn Arg Gly Asn Phe Leu Ala Arg Arg Gly Leu Asp Phe Gly
65                  70                  75                  80
Ser Thr Lys Lys Ala Thr Ala Tyr Glu Tyr Ile Gly Leu Asp Tyr Glu
                85                  90                  95
Ala Ser Tyr Arg Gln Thr Ala Ser Ala Ser Gly Asn Ser Arg Leu Cys
            100                 105                 110
Val Tyr Gly Trp Phe Gln Asn Arg Gly Val Gln Gly Val Pro Leu Val
        115                 120                 125
Glu Tyr Tyr Ile Ile Glu Asp Trp Val Asp Trp Val Pro Asp Ala Gln
    130                 135                 140
Gly Lys Met Val Thr Ile Asp Gly Ala Gln Tyr Lys Ile Phe Gln Met
145                 150                 155                 160
Asp His Thr Gly Pro Thr Ile Asn Gly Gly Asn Glu Thr Phe Lys Gln
                165                 170                 175
Tyr Phe Ser Val Arg Gln Gln Lys Arg Thr Ser Gly His Ile Thr Val
            180                 185                 190
Ser Asp His Phe Lys Ala Trp Ser Asn Gln Gly Trp Gly Ile Gly Asn
        195                 200                 205
Leu Tyr Glu Val Ala Leu Asn Ala Glu Gly Trp Gln Ser Ser Gly Val
    210                 215                 220
Ala Asp Val Pro Lys Leu Asp Val Tyr Thr Thr Lys Gln Gly Ser Ala
225                 230                 235                 240
Pro Arg Thr Thr Thr Thr Thr Thr Arg Thr Thr Thr Arg Thr Thr Thr
                245                 250                 255
Lys Thr Leu Pro Thr Thr Asn Lys Lys Cys Ser Ala Lys Ile Thr Ala
            260                 265                 270
Gln Gly Tyr Lys Cys Cys Ser Asp Pro Asn Cys Val Val Tyr Tyr Thr
        275                 280                 285
Asp Glu Asp Gly Thr Trp Gly Val Glu Asn Asn Gln Trp Cys Gly Cys
    290                 295                 300
Gly Val Glu Ala Cys Ser Gly Lys Ile Thr Ala Gln Gly Tyr Lys Cys
305                 310                 315                 320
Cys Ser Asp Pro Lys Cys Val Val Tyr Tyr Thr Asp Asp Asp Gly Lys
                325                 330                 335
Trp Gly
<210>16
<211>354
<212>PRT
<213>Neocallimastix frontalis
<400>16
Thr Val Ala Lys Ala Gln Trp Gly Gly Gly Ala Ser Ala Gly Gln Lys
1               5                   10                  15
Leu Ser Val Gly Gly Gly Gln Asn Gln His Lys Gly Val Ser Asp Gly
            20                  25                  30
Phe Ser Tyr Glu Ile Trp Leu Asp Asn Thr Gly Gly Ser Gly Ser Met
        35                  40                  45
Thr Leu Gly Ser Gly Ala Thr Phe Lys Ala Glu Trp Asn Ala Ala Val
    50                  55                  60
Asn Arg Gly Asn Phe Leu Ala Arg Arg Gly Leu Asp Phe Gly Ser Gln
65                  70                  75                  80
Lys Lys Ala Thr Asp Tyr Ser Tyr Ile Gly Leu Asp Tyr Thr Ala Thr
                85                  90                  95
Tyr Arg Gln Thr Ala Ser Ala Ser Gly Asn Ser Arg Leu Cys Val Tyr
            100                 105                 110
Gly Trp Phe Gln Asn Arg Gly Val Gln Gly Val Pro Leu Val Glu Tyr
        115                 120                 125
Tyr Ile Ile Glu Asp Trp Val Asp Trp Val Pro Asp Ala Gln Gly Lys
    130                 135                 140
Met Val Thr Ile Asp Gly Ala Gln Tyr Lys Ile Phe Gln Met Asp His
145                 150                 155                 160
Thr Gly Pro Thr Ile Asn Gly Gly Ser Glu Thr Phe Lys Gln Tyr Phe
                165                 170                 175
Ser Val Arg Gln Gln Lys Arg Thr Ser Gly His Ile Thr Val Ser Asp
            180                 185                 190
His Phe Lys Glu Trp Ala Lys Gln Gly Trp Gly Ile Gly Asn Leu Tyr
        195                 200                 205
Glu Val Ala Leu Asn Ala Glu Gly Trp Gln Ser Ser Gly Ile Ala Asp
    210                 215                 220
Val Thr Lys Leu Asp Val Tyr Thr Thr Gln Lys Gly Ser Asn Pro Thr
225                 230                 235                 240
Thr Ala Ala Arg Thr Thr Arg Thr Thr Ala Arg Thr Thr Ala Arg Thr
                245                 250                 255
Thr Thr Arg Thr Lys Thr Leu Pro Thr Asn Asn Lys Cys Ser Ser Lys
            260                 265                 270
Ile Thr Ala Gln Gly Tyr Lys Cys Cys Ser Asn Pro Asn Cys Glu Ile
        275                 280                 285
Val Tyr Thr Asp Asp Asp Gly Thr Trp Gly Val Glu Asn Asn Glu Trp
    290                 295                 300
Cys Gly Cys Gly Leu Glu Lys Cys Ser Ser Lys Ile Thr Ala Gln Gly
305                 310                 315                 320
Tyr Lys Cys Cys Ser Asp Pro Asn Cys Val Val Tyr Tyr Thr Asp Asp
                325                 330                 335
Asp Lys Leu Leu Leu Arg Pro Asn Gly Val Thr Asp Asp Asp Gly Lys
            340                 345                 350
Trp Gly
<210>17
<211>341
<212>PRT
<213>Neocallimastix frontalis
<400>17
Thr Val Ala Lys Ala Gln Trp Gly Gly Gly Ala Ser Ala Gly Gln Lys
1               5                   10                  15
Leu Ser Val Gly Gly Gly Gln Asn Gln His Lys Gly Val Ser Asp Gly
            20                  25                  30
Phe Ser Tyr Glu Ile Trp Leu Asp Asn Thr Gly Gly Ser Gly Ser Met
        35                  40                  45
Ile Leu Gly Ser Gly Ala Thr Phe Lys Ala Glu Trp Asn Ala Ala Val
    50                  55                  60
Asn Arg Gly Asn Phe Leu Ala Arg Arg Gly Leu Asp Phe Gly Ser Gln
65                  70                  75                  80
Lys Lys Ala Thr Asp Tyr Ser Tyr Ile Gly Leu Asp Tyr Thr Ala Thr
                85                  90                  95
Tyr Arg Gln Thr Ala Ser Ala Ser Gly Asn Ser Arg Leu Cys Val Tyr
            100                 105                 110
Gly Trp Phe Gln Asn Arg Gly Val Gln Gly Val Pro Leu Val Glu Tyr
        115                 120                 125
Tyr Ile Ile Glu Asp Trp Val Asp Trp Val Pro Asp Ala Gln Gly Lys
    130                 135                 140
Met Val Thr Ile Asp Gly Ala Gln Tyr Lys Ile Phe Gln Met Asp His
145                 150                 155                 160
Thr Gly Pro Thr Ile Asn Gly Gly Ser Glu Thr Phe Lys Gln Tyr Phe
                165                 170                 175
Ser Val Arg Gln Gln Lys Arg Thr Ser Gly His Ile Thr Val Ser Asp
            180                 185                 190
His Phe Lys Glu Trp Ala Lys His Gly Trp Gly Ile Gly Asn Leu Tyr
        195                 200                 205
Glu Val Ala Leu Asn Ala Glu Gly Trp Gln Ser Ser Gly Ile Ala Asp
    210                 215                 220
Val Thr Lys Leu Asp Val Tyr Thr Thr Gln Lys Gly Ser Asn Pro Thr
225                 230                 235                 240
Thr Ala Ala Arg Thr Thr Arg Thr Thr Ala Arg Thr Thr Ala Arg Thr
                245                 250                 255
Thr Thr Arg Thr Lys Thr Leu Pro Thr Asn Asn Lys Cys Ser Ser Lys
            260                 265                 270
Ile Thr Ala Gln Gly Tyr Lys Cys Cys Ser Asn Pro Asn Cys Glu Ile
        275                 280                 285
Val Tyr Thr Asp Asp Asp Gly Thr Trp Gly Val Glu Asn Asn Glu Trp
    290                 295                 300
Cys Gly Cys Gly Leu Glu Lys Cys Ser Ser Lys Ile Thr Ala Gln Gly
305                 310                 315                 320
Tyr Lys Cys Cys Ser Asp Pro Asn Cys Val Val Tyr Tyr Thr Asp Asp
                325                 330                 335
Asp Gly Lys Trp Gly
            340
<210>18
<211>341
<212>PRT
<213>Neocallimastix frontalis
<400>18
Thr Val Ala Lys Ala Gln Trp Gly Gly Gly Ala Ser Ala Gly Gln Lys
1               5                   10                  15
Leu Ser Val Gly Gly Gly Gln Asn Gln Tyr Lys Gly Val Ser Asp Gly
            20                  25                  30
Phe Ser Tyr Glu Ile Trp Leu Asp Asn Thr Gly Gly Ser Gly Ser Met
        35                  40                  45
Thr Leu Gly Ser Gly Ala Thr Phe Lys Ala Glu Trp Asn Ala Ala Val
    50                  55                  60
Asn Arg Gly Asn Phe Leu Ala Arg Arg Gly Leu Asp Phe Gly Ser Gln
65                  70                  75                  80
Lys Lys Ala Thr Asp Tyr Ser Tyr Ile Gly Leu Asp Tyr Thr Ala Thr
                85                  90                  95
Tyr Arg Gln Thr Ala Ser Ala Ser Gly Asn Ser Arg Leu Cys Val Tyr
            100                 105                 110
Gly Trp Phe Gln Asn Arg Gly Val Gln Gly Val Pro Leu Val Glu Tyr
        115                 120                 125
Tyr Ile Ile Glu Asp Trp Val Asp Trp Val Pro Asp Ala Gln Gly Lys
    130                 135                 140
Met Val Thr Ile Asp Gly Ala Gln Tyr Lys Ile Ile Gln Met Asp His
145                 150                 155                 160
Thr Gly Pro Thr Ile Asn Gly Gly Ser Glu Thr Phe Lys Gln Tyr Phe
                165                 170                 175
Ser Val Arg Gln Gln Lys Arg Thr Ser Gly His Ile Thr Val Ser Asp
            180                 185                 190
His Phe Lys Glu Trp Ala Lys Gln Gly Trp Gly Ile Gly Asn Leu Tyr
        195                 200                 205
Glu Val Ala Leu Asn Ala Glu Gly Trp Gln Ser Ser Gly Ile Ala Asp
    210                 215                 220
Val Thr Lys Leu Asp Val Tyr Thr Thr Gln Lys Gly Ser Asn Pro Thr
225                 230                 235                 240
Thr Ala Ala Arg Thr Thr Arg Thr Thr Ala Arg Thr Thr Ala Arg Thr
                245                 250                 255
Thr Thr Arg Thr Lys Thr Leu Pro Thr Asn Asn Lys Cys Ser Ser Lys
            260                 265                 270
Ile Thr Ala Gln Gly Tyr Lys Cys Cys Ser Asn Pro Asn Cys Glu Ile
        275                 280                 285
Val Tyr Thr Asp Asp Asp Gly Thr Trp Gly Val Glu Asn Asn Glu Trp
    290                 295                 300
Cys Gly Cys Gly Leu Glu Lys Cys Ser Ser Lys Ile Thr Ala Gln Gly
305                 310                 315                 320
Tyr Lys Cys Cys Ser Asp Pro Asn Cys Val Val Tyr Tyr Thr Asp Asp
                325                 330                 335
Asp Gly Lys Trp Gly
            340
<210>19
<211>341
<212>PRT
<213>Neocallimastix frontalis
<400>19
Thr Val Ala Lys Ala Gln Trp Gly Gly Gly Ala Ser Ala Gly Gln Lys
1               5                   10                  15
Leu Ser Val Gly Gly Gly Gln Asn Gln His Lys Gly Val Ser Asp Gly
            20                  25                  30
Phe Ser Tyr Glu Ile Trp Leu Asp Asn Thr Gly Gly Ser Gly Ser Met
        35                  40                  45
Thr Leu Gly Ser Gly Ala Thr Phe Lys Ala Glu Trp Asn Ala Ala Val
    50                  55                  60
Asn Arg Gly Asn Phe Leu Ala Arg Arg Gly Leu Asp Phe Gly Ser Gln
65                  70                  75                  80
Lys Lys Ala Thr Asp Tyr Ser Tyr Ile Gly Leu Asp Tyr Thr Ala Thr
                85                  90                  95
Tyr Arg Gln Thr Ala Ser Ala Ser Gly Asn Ser Arg Leu Cys Val Tyr
            100                 105                 110
Gly Trp Phe Gln Asn Arg Gly Val Gln Gly Val Pro Leu Val Glu Tyr
        115                 120                 125
Tyr Ile Ile Glu Asp Trp Val Asp Trp Val Pro Asp Ala Gln Gly Lys
    130                 135                 140
Met Val Thr Ile Asp Gly Ala Gln Tyr Lys Ile Phe Gln Met Asp His
145                 150                 155                 160
Thr Gly Pro Thr Ile Asn Gly Gly Ser Glu Thr Phe Lys Gln Tyr Phe
                165                 170                 175
Ser Val Arg Gln Gln Lys Arg Thr Ser Gly His Ile Thr Val Ser Asp
            180                 185                 190
His Phe Lys Glu Trp Ala Lys Gln Gly Trp Gly Ile Gly Asn Leu Tyr
        195                 200                 205
Glu Val Ala Leu Asn Ala Glu Gly Trp Gln Ser Ser Gly Ile Ala Asp
    210                 215                 220
Val Thr Lys Leu Asp Val Tyr Thr Thr Gln Lys Gly Ser Asn Pro Thr
225                 230                 235                 240
Thr Ala Ala Arg Thr Thr Arg Thr Thr Ala Arg Thr Thr Ala Arg Thr
                245                 250                 255
Thr Thr Arg Thr Lys Thr Leu Pro Thr Asn Asn Lys Cys Ser Ser Lys
            260                 265                 270
Ile Thr Ala Gln Gly Tyr Lys Cys Cys Ser Asn Pro Asn Cys Glu Ile
        275                 280                 285
Val Tyr Thr Asp Asp Asp Gly Thr Trp Gly Val Glu Asn Asn Glu Trp
    290                 295                 300
Cys Gly Cys Gly Leu Glu Lys Cys Ser Ser Lys Ile Thr Ala Gln Gly
305                 310                 315                 320
Tyr Lys Cys Cys Ser Asp Pro Asn Cys Val Val Tyr Tyr Thr Asp Asp
                325                 330                 335
Asp Gly Lys Trp Gly
               340
<210>20
<211>341
<212>PRT
<213>Neocallimastix frontalis
<400>20
Thr Val Ala Lys Ala Gln Trp Gly Gly Gly Ala Ser Ala Gly Gln Lys
1               5                   10                  15
Leu Ser Val Gly Gly Gly Gln Asn Gln His Lys Gly Val Ser Asp Gly
            20                  25                  30
Phe Ser Tyr Glu Ile Trp Leu Asp Asn Thr Gly Gly Ser Gly Ser Met
        35                  40                  45
Thr Leu Gly Ser Gly Ala Thr Phe Lys Ala Glu Trp Asn Ala Ala Val
    50                  55                  60
Asn Arg Gly Asn Phe Leu Ala Arg Arg Gly Leu Asp Phe Gly Ser Gln
65                  70                  75                  80
Lys Lys Ala Thr Asp Tyr Ser Tyr Ile Gly Leu Asp Tyr Thr Val Thr
                85                  90                  95
Tyr Arg Gln Thr Ala Ser Ala Ser Gly Asn Ser Arg Leu Cys Val Tyr
            100                 105                 110
Gly Trp Phe Gln Asn Arg Gly Val Gln Gly Val Pro Leu Val Glu Tyr
        115                 120                 125
Tyr Ile Ile Glu Asp Trp Val Asp Trp Val Pro Asp Ala Gln Gly Lys
    130                 135                 140
Met Val Thr Ile Asp Gly Ala Gln Tyr Lys Ile Phe Gln Met Asp His
145                 150                 155                 160
Thr Gly Pro Thr Ile Asn Gly Gly Ser Glu Thr Phe Lys Gln Tyr Phe
                165                 170                 175
Ser Val Arg Gln Gln Lys Arg Thr Ser Gly His Ile Thr Val Ser Asp
            180                 185                 190
His Phe Lys Glu Trp Ala Lys Gln Gly Trp Gly Ile Gly Asn Leu Tyr
        195                 200                 205
Glu Val Ala Leu Asn Ala Glu Gly Trp Gln Ser Ser Gly Ile Ala Asp
    210                 215                 220
Val Thr Lys Leu Asp Val Tyr Thr Thr Gln Lys Gly Ser Asn Pro Thr
225                 230                 235                 240
Thr Ala Ala Arg Thr Thr Arg Thr Thr Ala Arg Thr Thr Ala Arg Thr
                245                 250                 255
Thr Thr Arg Thr Lys Thr Leu Pro Thr Asn Asn Lys Cys Ser Ser Lys
            260                 265                 270
Ile Thr Ala Gln Gly Tyr Lys Cys Cys Ser Asn Pro Asn Cys Glu Ile
        275                 280                 285
Val Tyr Ser Asp Asp Asp Gly Thr Trp Gly Val Glu Asn Asn Glu Trp
    290                 295                 300
Cys Gly Cys Gly Leu Glu Lys Cys Ser Ser Lys Ile Thr Ala Gln Gly
305                 310                 315                 320
Tyr Lys Cys Cys Ser Asp Pro Asn Cys Val Val Tyr Tyr Thr Asp Asp
                325                 330                 335
Asp Gly Lys Trp Gly
            340
<210>21
<211>341
<212>PRT
<213>Neocallimastix frontalis
<400>21
Thr Val Ala Lys Ala Gln Trp Gly Gly Gly Ala Ser Ala Gly Gln Lys
1               5                   10                  15
Leu Ser Val Gly Gly Gly Gln Asn Gln His Lys Gly Val Ser Asp Gly
            20                  25                  30
Phe Ser Tyr Glu Ile Trp Leu Asp Asn Thr Gly Gly Ser Gly Ser Met
        35                  40                  45
Thr Leu Gly Ser Gly Ala Thr Phe Lys Ala Glu Trp Asn Ala Ala Val
    50                  55                  60
Asn Arg Gly Asn Phe Leu Ala Arg Arg Gly Leu Asp Phe Gly Ser Gln
65                  70                  75                  80
Lys Lys Ala Thr Asp Tyr Ser Tyr Ile Gly Leu Asp Tyr Thr Ala Thr
                85                  90                  95
Tyr Arg Gln Thr Ala Ser Ala Ser Gly Asn Ser Arg Leu Cys Val Tyr
            100                 105                 110
Gly Trp Phe Gln Asn Arg Gly Val Gln Gly Val Pro Leu Val Glu Tyr
        115                 120                 125
Tyr Ile Ile Glu Asp Trp Val Asp Trp Val Pro Asp Ala Gln Gly Lys
    130                 135                 140
Met Val Thr Ile Asp Gly Ala Gln Tyr Lys Ile Phe Gln Met Asp His
145                 150                 155                 160
Thr Gly Pro Thr Ile Asn Gly Gly Ser Glu Thr Phe Lys Gln Tyr Phe
                165                 170                 175
Ser Val Arg Gln Gln Lys Arg Thr Ser Gly His Ile Thr Val Ser Asp
            180                 185                 190
His Phe Lys Glu Trp Ala Lys Gln Gly Trp Gly Ile Gly Asn Leu Tyr
        195                 200                 205
Glu Val Ala Leu Asn Ala Glu Gly Trp Gln Ser Ser Gly Ile Ala Asp
    210                 215                 220
Val Thr Lys Leu Asp Val Tyr Thr Thr Gln Lys Gly Ser Asn Pro Thr
225                 230                 235                 240
Thr Ala Ala Arg Thr Thr Arg Thr Thr Ala Arg Thr Thr Ala Arg Thr
                245                 250                 255
Thr Thr Arg Thr Lys Thr Leu Pro Thr Asn Asn Lys Cys Ser Ser Lys
            260                 265                 270
Ile Thr Ala Gln Gly Tyr Lys Cys Ser Ser Asn Pro Asn Cys Glu Ile
        275                 280                 285
Val Tyr Thr Asp Asp Asp Gly Thr Trp Gly Val Glu Asn Asn Glu Trp
    290                 295                 300
Cys Gly Cys Gly Leu Glu Lys Cys Ser Ser Lys Ile Thr Ala Gln Gly
305                 310                 315                 320
Tyr Lys Cys Arg Ser Asp Pro Asn Cys Val Val Tyr Tyr Thr Asp Asp
                325                 330                 335
Asp Gly Lys Trp Gly
            340
<210>22
<211>341
<212>PRT
<213>Neocallimastix patriciarum
<400>22
Thr Val Ala Lys Ala Gln Trp Gly Gly Gly Ala Ser Ala Gly Gln Lys
1               5                   10                  15
Leu Ser Val Gly Gly Gly Gln Asn Gln His Lys Gly Val Ser Asp Gly
            20                  25                  30
Phe Ser Tyr Glu Ile Trp Leu Asp Asn Thr Gly Gly Ser Gly Ser Met
        35                  40                  45
Thr Leu Gly Ser Gly Ala Thr Phe Lys Ala Glu Trp Asn Ala Ala Val
    50                  55                  60
Asn Arg Gly Asn Phe Leu Ala Arg Arg Gly Leu Asp Phe Gly Ser Gln
65                  70                  75                  80
Lys Lys Ala Thr Asp Tyr Ser Tyr Ile Gly Leu Asp Tyr Thr Ala Thr
                85                  90                  95
Tyr Arg Gln Thr Ala Ser Ala Ser Gly Asn Ser Arg Leu Cys Val Tyr
            100                 105                 110
Gly Trp Phe Gln Asn Arg Gly Val Gln Gly Val Pro Leu Val Glu Tyr
        115                 120                 125
Tyr Ile Ile Glu Asp Trp Val Asp Trp Val Pro Asp Ala Gln Gly Lys
    130                 135                 140
Met Val Thr Ile Asp Gly Ala Gln Tyr Lys Ile Phe Gln Met Asp His
145                 150                 155                 160
Thr Gly Pro Thr Ile Asn Gly Gly Ser Glu Thr Phe Lys Gln Tyr Phe
                165                 170                 175
Ser Val Arg Gln Gln Lys Arg Thr Ser Gly His Ile Thr Val Ser Asp
            180                 185                 190
His Phe Lys Glu Trp Ala Lys Gln Gly Trp Gly Ile Gly Asn Leu Tyr
        195                 200                 205
Glu Val Ala Leu Asn Ala Glu Gly Trp Gln Ser Ser Gly Ile Ala Asp
    210                 215                 220
Val Thr Lys Leu Asp Val Tyr Thr Thr Gln Lys Gly Ser Asn Pro Thr
225                 230                 235                 240
Thr Ala Ala Arg Thr Thr Arg Thr Thr Ala Arg Thr Thr Ala Arg Thr
                245                 250                 255
Thr Thr Arg Thr Lys Thr Leu Pro Thr Asn Asn Lys Cys Ser Ser Lys
            260                 265                 270
Ile Thr Ala Gln Gly Tyr Lys Cys Cys Ser Asn Pro Asn Cys Glu Ile
        275                 280                 285
Val Tyr Thr Asp Asp Asp Gly Thr Trp Gly Val Glu Asn Asn Glu Trp
    290                 295                 300
Cys Gly Cys Gly Leu Glu Glu Cys Ser Ser Lys Ile Thr Ala Gln Gly
305                 310                 315                 320
Tyr Lys Cys Arg Ser Asp Pro Asn Cys Val Val Tyr Tyr Thr Asp Asp
                325                 330                 335
Asp Gly Lys Trp Gly
            340
<210>23
<211>341
<212>PRT
<213>Neocallimastix patriciarum
<400>23
Thr Val Ala Lys Ala Gln Trp Gly Gly Gly Ala Ser Ala Gly Gln Lys
1               5                   10                  15
Leu Ser Val Gly Gly Gly Gln Asn Gln His Lys Gly Val Ser Asp Gly
            20                  25                  30
Phe Ser Tyr Glu Ile Trp Ser Asp Asn Thr Gly Gly Ser Gly Ser Met
        35                  40                  45
Thr Leu Gly Ser Gly Ala Thr Phe Lys Ala Glu Trp Asn Ala Ala Val
    50                  55                  60
Asn Arg Gly Asn Phe Leu Ala Arg Arg Gly Leu Asp Phe Gly Ser Gln
65                  70                  75                  80
Lys Lys Ala Thr Asp Tyr Ser Tyr Ile Gly Leu Asp Tyr Thr Ala Thr
                85                  90                  95
Tyr Arg Gln Thr Ala Ser Ala Ser Gly Asn Ser Arg Leu Cys Val Tyr
            100                 105                 110
Gly Trp Phe Gln Asn Arg Gly Val Gln Gly Val Pro Leu Val Glu Tyr
        115                 120                 125
Tyr Ile Ile Glu Asp Trp Val Asp Trp Val Pro Asp Ala Gln Gly Lys
    130                 135                 140
Met Val Thr Ile Asp Gly Ala Gln Tyr Lys Ile Phe Gln Met Asp His
145                 150                 155                 160
Thr Gly Pro Thr Ile Asn Gly Gly Ser Glu Thr Phe Lys Gln Tyr Phe
                165                 170                 175
Ser Val Arg Gln Gln Lys Arg Thr Ser Gly His Ile Thr Val Ser Asp
            180                 185                 190
His Phe Lys Glu Trp Ala Lys Gln Gly Trp Gly Ile Gly Asn Leu Tyr
        195                 200                 205
Glu Val Ala Leu Asn Ala Glu Gly Trp Gln Ser Ser Gly Ile Ala Asp
    210                 215                 220
Val Thr Lys Leu Asp Val Tyr Thr Thr Gln Lys Gly Ser Asn Pro Thr
225                 230                 235                 240
Thr Ala Ala Arg Thr Thr Arg Thr Thr Ala Arg Thr Thr Ala Arg Thr
                245                 250                 255
Thr Thr Arg Thr Lys Thr Leu Pro Thr Asn Asn Lys Cys Ser Ser Lys
            260                 265                 270
Ile Thr Ala Gln Gly Tyr Lys Cys Cys Ser Asn Pro Asn Cys Glu Ile
        275                 280                 285
Val Tyr Thr Asp Asp Asp Gly Thr Trp Gly Val Glu Asn Asn Glu Trp
    290                 295                 300
Cys Gly Cys Gly Leu Glu Lys Cys Ser Ser Lys Ile Thr Ala Gln Gly
305                 310                 315                 320
Tyr Lys Cys Cys Ser Asp Pro Asn Cys Val Val Tyr Tyr Thr Asp Asp
                325                 330                 335
Asp Gly Lys Trp Gly
            340
<210>24
<211>341
<212>PRT
<213>Neocallimastix patriciarum
<400>24
Thr Val Ala Lys Ala Gln Trp Gly Gly Gly Ala Ser Ala Gly Gln Lys
1               5                   10                  15
Leu Ser Val Gly Gly Gly Gln Asn Gln His Lys Gly Val Ser Asp Gly
            20                  25                  30
Phe Ser Tyr Glu Ile Trp Leu Asp Asn Thr Gly Gly Ser Gly Ser Met
        35                  40                  45
Ile Leu Gly Ser Gly Ala Thr Phe Lys Ala Glu Trp Asn Ala Ala Val
    50                  55                  60
Asn Arg Gly Asn Phe Leu Ala Arg Arg Gly Leu Asp Phe Gly Ser Gln
65                  70                  75                  80
Lys Lys Ala Thr Asp Tyr Ser Tyr Ile Gly Leu Asp Tyr Thr Ala Thr
                85                  90                  95
Tyr Arg Gln Thr Ala Ser Ala Ser Gly Asn Ser Arg Leu Cys Val Tyr
            100                 105                 110
Gly Trp Phe Gln Asn Arg Gly Val Gln Gly Val Pro Leu Val Glu Tyr
        115                 120                 125
Tyr Ile Ile Glu Asp Trp Val Asp Trp Val Pro Asp Ala Gln Gly Lys
    130                 135                 140
Met Val Thr Ile Asp Gly Ala Gln Tyr Lys Ile Phe Gln Met Asp His
145                 150                 155                 160
Thr Gly Pro Thr Ile Asn Gly Gly Ser Glu Thr Phe Lys Gln Tyr Phe
                165                 170                 175
Ser Val Arg Gln Gln Lys Arg Thr Ser Gly His Ile Thr Val Ser Asp
            180                 185                 190
His Phe Lys Glu Trp Ala Lys His Gly Trp Gly Ile Gly Asn Leu Tyr
        195                 200                 205
Glu Val Ala Leu Asn Ala Glu Gly Trp Gln Ser Ser Gly Ile Ala Asp
    210                 215                 220
Val Thr Lys Leu Asp Val Tyr Thr Thr Gln Lys Gly Ser Asn Pro Thr
225                 230                 235                 240
Thr Ala Ala Arg Thr Thr Arg Thr Thr Ala Arg Thr Thr Ala Arg Thr
                245                 250                 255
Thr Thr Arg Thr Lys Thr Leu Pro Thr Asn Asn Lys Cys Ser Ser Lys
            260                 265                 270
Ile Thr Ala Gln Gly Tyr Lys Cys Cys Ser Asn Pro Asn Cys Glu Ile
        275                 280                 285
Val Tyr Thr Asp Asp Asp Gly Thr Trp Gly Val Glu Asn Asn Glu Trp
    290                 295                 300
Cys Gly Cys Gly Leu Glu Lys Cys Ser Ser Lys Ile Thr Ala Gln Gly
305                 310                 315                 320
Tyr Lys Cys Cys Ser Asp Pro Asn Cys Val Val Tyr Tyr Thr Asp Asp
                325                 330                 335
Asp Gly Lys Trp Gly
            340
<210>25
<211>337
<212>PRT
<213>Neocallimastix frontalis
<400>25
Thr Val Ala Lys Ala Gln Trp Gly Gly Gly Ala Ser Ala Gly Gln Lys
1               5                   10                  15
Leu Ser Val Gly Gly Gly Gln Asn Gln His Lys Gly Val Ser Asp Gly
            20                  25                  30
Phe Ser Tyr Glu Ile Trp Leu Asp Asn Thr Gly Gly Ser Gly Ser Met
        35                  40                  45
Thr Leu Gly Ser Gly Ala Thr Phe Lys Ala Glu Trp Asn Ala Ala Val
    50                  55                  60
Asn Arg Gly Asn Phe Leu Ala Arg Arg Gly Leu Asp Phe Gly Ser Gln
65                  70                  75                  80
Lys Lys Ala Ala Asp Tyr Ser Tyr Ile Gly Leu Asp Tyr Thr Ala Thr
                85                  90                  95
Tyr Arg Gln Thr Ala Ser Ala Ser Gly Asn Ser Arg Leu Cys Val Tyr
            100                 105                 110
Gly Trp Phe Gln Asn Arg Gly Val Gln Gly Val Pro Leu Val Glu Tyr
        115                 120                 125
Tyr Ile Ile Glu Asp Trp Val Asp Trp Val Pro Asp Ala Gln Gly Lys
    130                 135                 140
Met Val Thr Ile Asp Gly Ala Gln Tyr Lys Ile Phe Gln Met Asp His
145                 150                 155                 160
Thr Gly Pro Thr Ile Asn Gly Gly Ser Glu Thr Phe Lys Gln Tyr Phe
                165                 170                 175
Ser Val Arg Gln Gln Lys Arg Thr Ser Gly His Ile Thr Val Ser Asp
            180                 185                 190
His Phe Lys Glu Trp Ala Lys Gln Gly Trp Gly Ile Gly Asn Leu Tyr
        195                 200                 205
Glu Val Ala Leu Asn Ala Glu Gly Trp Gln Ser Ser Gly Val Ala Asp
    210                 215                 220
Val Thr Leu Leu Asp Val Tyr Thr Thr Pro Lys Gly Ser Ser Pro Ala
225                 230                 235                 240
Thr Ser Ala Ala Pro Arg Thr Thr Thr Arg Thr Thr Thr Arg Thr Lys
                245                 250                 255
Ser Leu Pro Thr Asn Tyr Asn Lys Cys Ser Ala Arg Ile Thr Ala Gln
            260                 265                 270
Gly Tyr Lys Cys Cys Ser Asp Pro Asn Cys Val Val Tyr Tyr Thr Asp
        275                 280                 285
Asp Asp Gly Thr Trp Gly Val Glu Asn Asn Glu Trp Cys Gly Cys Gly
    290                 295                 300
Val Glu Gln Cys Ser Ser Lys Ile Thr Ser Gln Gly Tyr Lys Cys Cys
305                 310                 315                 320
Ser Asp Pro Asn Cys Val Val Phe Tyr Thr Asp Asp Asp Gly Lys Trp
                325                 330                 335
Gly
<210>26
<211>337
<212>PRT
<213>Neocallimastix frontalis
<400>26
Thr Val Ala Lys Ala Gln Trp Gly Gly Gly Ala Ser Ala Gly Gln Lys
1               5                   10                  15
Leu Ser Val Gly Gly Gly Gln Asn Gln His Lys Gly Val Ser Asp Gly
            20                  25                  30
Phe Ser Tyr Glu Ile Trp Leu Asp Asn Thr Gly Gly Ser Gly Ser Met
        35                  40                  45
Thr Leu Gly Ser Gly Ala Thr Phe Lys Ala Glu Trp Asn Ala Ala Val
    50                  55                  60
Asn Arg Gly Asn Phe Leu Ala Arg Arg Gly Leu Asp Phe Gly Ser Gln
65                  70                  75                  80
Lys Lys Ala Thr Asp Tyr Ser Tyr Ile Gly Leu Asp Tyr Thr Ala Thr
                85                  90                  95
Tyr Arg Gln Thr Ala Ser Ala Ser Gly Asn Ser Arg Leu Cys Val Tyr
            100                 105                 110
Gly Trp Phe Gln Asn Arg Gly Val Gln Gly Val Pro Leu Val Glu Tyr
        115                 120                 125
Tyr Ile Ile Glu Asp Trp Val Asp Trp Val Pro Asp Ala Gln Gly Lys
    130                 135                 140
Met Val Thr Ile Asp Gly Ala Gln Tyr Lys Ile Phe Gln Met Asp His
145                 150                 155                 160
Thr Gly Pro Thr Ile Asn Gly Gly Ser Glu Thr Phe Lys Gln Tyr Phe
                165                 170                 175
Ser Val Arg Gln Gln Lys Arg Thr Ser Gly His Ile Thr Val Ser Asp
            180                 185                 190
His Phe Lys Glu Trp Ala Lys Gln Gly Trp Gly Ile Gly Asn Leu Tyr
        195                 200                 205
Glu Val Ala Leu Asn Ala Glu Gly Trp Gln Ser Ser Gly Val Ala Asp
    210                 215                 220
Val Thr Leu Leu Asp Val Tyr Thr Thr Pro Lys Gly Ser Ser Pro Ala
225                 230                 235                 240
Thr Ser Ala Ala Pro Arg Thr Thr Thr Arg Thr Thr Thr Arg Thr Lys
                245                 250                 255
Ser Leu Pro Thr Asn Tyr Asn Lys Cys Ser Ala Arg Ile Thr Ala Gln
            260                 265                 270
Gly Tyr Lys Cys Cys Ser Asp Pro Asn Cys Val Val Tyr Tyr Thr Asp
        275                 280                 285
Asp Asp Gly Thr Trp Gly Val Glu Asn Asn Glu Trp Arg Gly Cys Gly
    290                 295                 300
Val Glu Gln Cys Ser Ser Lys Ile Thr Ser Gln Gly Tyr Lys Cys Cys
305                 310                 315                 320
Ser Asp Pro Asn Cys Val Val Phe Tyr Thr Asp Asp Asp Gly Lys Trp
                325                 330                 335
Gly
<210>27
<211>337
<212>PRT
<213>Neocallimastix patriciarum
<400>27
Thr Val Ala Lys Ala Gln Trp Gly Gly Gly Ala Ser Ala Gly Gln Lys
1               5                   10                  15
Leu Ser Val Gly Gly Gly Gln Asn Gln His Lys Gly Val Ser Asp Gly
            20                  25                  30
Phe Ser Tyr Glu Ile Trp Leu Asp Asn Thr Gly Gly Ser Gly Ser Met
        35                  40                  45
Thr Leu Gly Ser Gly Ala Thr Phe Lys Ala Glu Trp Asn Ala Ala Val
    50                  55                  60
Asn Arg Gly Asn Phe Leu Ala Arg Arg Gly Leu Asp Phe Gly Ser Gln
65                  70                  75                  80
Lys Lys Ala Thr Asp Tyr Ser Tyr Ile Gly Leu Asp Tyr Thr Ala Thr
                85                  90                  95
Tyr Arg Gln Thr Ala Ser Ala Ser Gly Asn Ser Arg Leu Cys Val Tyr
            100                 105                 110
Gly Trp Phe Gln Asn Arg Gly Val Gln Gly Val Pro Leu Val Glu Tyr
        115                 120                 125
Tyr Ile Ile Glu Asp Trp Val Asp Trp Val Pro Asp Ala Gln Gly Lys
    130                 135                 140
Met Val Thr Ile Asp Gly Ala Gln Tyr Lys Ile Phe Gln Met Asp His
145                 150                 155                 160
Thr Gly Pro Thr Ile Asn Gly Gly Ser Glu Thr Phe Lys Gln Tyr Phe
                165                 170                 175
Ser Val Arg Gln Gln Lys Arg Thr Ser Gly His Ile Thr Val Ser Asp
            180                 185                 190
His Phe Lys Glu Trp Ala Lys Gln Gly Trp Gly Ile Gly Asn Leu Tyr
        195                 200                 205
Glu Val Ala Leu Asn Ala Glu Gly Trp Gln Ser Ser Gly Val Ala Asp
    210                 215                 220
Val Thr Leu Leu Asp Val Tyr Thr Thr Pro Lys Gly Ser Ser Pro Ala
225                 230                 235                 240
Thr Ser Ala Ala Pro Arg Thr Thr Thr Arg Thr Thr Thr Arg Thr Lys
                245                 250                 255
Ser Leu Pro Thr Asn Tyr Asn Lys Cys Ser Ala Arg Ile Thr Ala Gln
            260                 265                 270
Gly Tyr Lys Cys Cys Ser Asp Pro Asn Cys Val Val Tyr Tyr Thr Asp
        275                 280                 285
Asp Asp Gly Thr Trp Gly Val Glu Asn Asn Glu Trp Cys Gly Cys Gly
    290                 295                 300
Val Glu Gln Cys Ser Ser Lys Ile Thr Ser Gln Gly Tyr Lys Cys Cys
305                 310                 315                 320
Ser Asp Pro Asn Cys Val Val Phe Tyr Thr Asp Asp Asp Gly Lys Trp
                325                 330                 335
Gly
<210>28
<211>969
<212>DNA
<213>Neocallimastix patriciarum
<400>28
gctccagctc ttgcccaatg gggcggcgga tgggacttcg gcggtttcgg aggaggcttc      60
ggaggaggct tcggtggtaa taacaacggt ggagctgtta ctggtaatac taatggtggt     120
attgatgatc aatctggaga atctatccgt attatgccaa tgggtgattc tatcacattt     180
ggtattggtg aaactggtgg ttacagaaag tacctttaca gcgatttaac caaacaaggt     240
tacaaaattg atatggttgg tccagaagga tcaagtcgtg ctaccgaaaa tggtattaca     300
tttgatgaca atcacgctgg ttacagtgga tacaccatca aaaacggtct cgaattcttc     360
agaggtcttg aaggaaatgg aagtttatat gatgtcctta aattgaaaca ttctgttaaa     420
ttagctaaac cagatatcat tcttcttatc attggtacca atgatatgtc cggaaatcac     480
tctacccaat cttgtactaa tgatcttcat gatcttttag attatgttat tggtgaaatg     540
ccatctcatt gtactatctt cctttcttct attccagatt tacaaactaa caacgcccaa     600
aatgttcttt cttacaacga agcagttaag aaggttgtta gcgaatacca aggaaagggt     660
aagaatgtta gatttgctga tattcacggt tgtatgaacg gtatggctga tatgagttct     720
gataaggttc atccaagtgg atctggttac aagaagatgg gtgactactt tgctacagtt     780
gttgacagct ttattaagga aaatccagac ttcagaggta ccagttcctc taacaaggcc     840
actaccacca aggccactac cccaaccacc ggtaatacca cttgttccgc taagattact     900
agccaaggct acaagtgttg ttctgctagc tgtgttgttg tctacactga caacgacgga     960
gattggggg                                                             969
<210>29
<211>957
<212>DNA
<213>Neocallimastix frontalis
<400>29
actgttgcta aggcccaatg gggtggtttt ggtgacttcg gaggcttcgg aggctttggt      60
ggcttcggtg ataacggtaa taatggcaat aataataaca atggtggtaa tgttgctgta     120
tcaggtgata ctgttaaaat tatgcctgtt ggtgattcta tcacttttgg tgaaggtgaa     180
agaggtggat acagaaagta tctttacagt gccttaactc aaaaaggtta taaaattgat     240
atggtaggtc cagagggatc caacagtgct tcagctaatg gtattcaata tgatgataat     300
aatgctggtt acagtggatt ccaaattaaa gaaattccag gttggggtca acaacaaggt     360
ggtgaaggca gtttatacaa taaacttaag agtaagaatg ctgttaagca atctcaacca     420
gatatcattc ttcttatcat tggtactaat gatatgaccg ccaatcgttc aatggatgct     480
tgtgccaatg atcttcgtgc tcttttagat tatatgcttg gagatatgcc agccaatagt     540
attatcttta tgggttctat tccagaattt actgcctacg gtggtaattc tcaaagaatt     600
gctaattaca atggtacagt taagaaggtt gctgatgaat acgctaataa gggtaagaat     660
gttagatttg ctgatgttca tggttgtctt aacggtatgg ctgatattgg tggtgaccaa     720
cttcacccaa gtggaaatgg ttataaaaaa attggtaact tctgggctgg agttgtcgat     780
gaataccttc aatctatcaa atctaataac ggtggtaagg aagatgaaac cggtagtggt     840
agtggcaatg gtgaagtaga acttagtaat tgttcaagta aaattactag acaaggttac     900
aaatgttgtt ctaagaattg tgtagtcatc tacactgatg ccgatggtaa atggggt        957
<210>30
<211>957
<212>DNA
<213>Neocallimastix patriciarum
<400>30
actgttgcta aggcccaatg gggtggtttt ggtgacttcg gaggcttcgg aggctttggt      60
ggcttcggtg ataacggtaa taatggcaat aataataaca atggtggtaa tgttgctgta     120
tcaggtgata ctgttaaaat tatgcctgtt ggtgattcta tcacttttgg tgaaggtgaa     180
agaggtggat acagaaagta tctttacagt gccttaactc aaaaaggtta taaaattgat     240
atggtaggtc cagagggatc caacagtgct tcagctaatg gtattcaata tgatgataat     300
aatgctggtt acagtggatt ccaaattaaa gaaattccag gttggggtca acaacaaggt     360
ggtgaaggca gtttatacaa taaacttaag agtaagaatg ctgttaagca atctcaacca     420
gatatcattc ttcttatcat tggtactaat gatatgaccg ccaatcgttc aatggatgct     480
tgtgccaatg atcttcgtgc tcttttagat tatatgcttg gagatatgcc agccaatagt     540
attatcttta tgggttctat tccagaattt actgcctacg gtggtaattc tcaaagaatt     600
gctaattaca atggtacagt taagaaggtt gctgatgaat acgctaataa gggtaagaat     660
gttagatttg ctgatgttca tggttgtctt aacggtatgg ctgatattgg tggtgaccaa     720
cttcacccaa gtggaaatgg ttataaaaaa attggtaact tctgggctgg agttgtcgat     780
gaataccttc aatctatcaa atctaataac ggtggtaagg aagatgaaac cggtagtggt     840
agtggcaatg gtgaagtaga acttagtaat tgttcaagta aaattactag acaaggttac     900
aaatgttgtt ctaagaattg tgtagtcatc tacactgatg acgatggtaa atggggt        957
<210>31
<211>323
<212>PRT
<213>Neocallimastix patriciarum
<400>31
Ala Pro Ala Leu Ala Gln Trp Gly Gly Gly Trp Asp Phe Gly Gly Phe
1               5                   10                  15
Gly Gly Gly Phe Gly Gly Gly Phe Gly Gly Asn Asn Asn Gly Gly Ala
            20                  25                  30
Val Thr Gly Asn Thr Asn Gly Gly Ile Asp Asp Gln Ser Gly Glu Ser
        35                  40                  45
Ile Arg Ile Met Pro Met Gly Asp Ser Ile Thr Phe Gly Ile Gly Glu
    50                  55                  60
Thr Gly Gly Tyr Arg Lys Tyr Leu Tyr Ser Asp Leu Thr Lys Gln Gly
65                  70                  75                  80
Tyr Lys Ile Asp Met Val Gly Pro Glu Gly Ser Ser Arg Ala Thr Glu
                85                  90                  95
Asn Gly Ile Thr Phe Asp Asp Asn His Ala Gly Tyr Ser Gly Tyr Thr
            100                 105                 110
Ile Lys Asn Gly Leu Glu Phe Phe Arg Gly Leu Glu Gly Asn Gly Ser
        115                 120                 125
Leu Tyr Asp Val Leu Lys Leu Lys His Ser Val Lys Leu Ala Lys Pro
    130                 135                 140
Asp Ile Ile Leu Leu Ile Ile Gly Thr Asn Asp Met Ser Gly Asn His
145                 150                 155                 160
Ser Thr Gln Ser Cys Thr Asn Asp Leu His Asp Leu Leu Asp Tyr Val
                165                 170                 175
Ile Gly Glu Met Pro Ser His Cys Thr Ile Phe Leu Ser Ser Ile Pro
            180                 185                 190
Asp Leu Gln Thr Asn Asn Ala Gln Asn Val Leu Ser Tyr Asn Glu Ala
        195                 200                 205
Val Lys Lys Val Val Ser Glu Tyr Gln Gly Lys Gly Lys Asn Val Arg
    210                 215                 220
Phe Ala Asp Ile His Gly Cys Met Asn Gly Met Ala Asp Met Ser Ser
225                 230                 235                 240
Asp Lys Val His Pro Ser Gly Ser Gly Tyr Lys Lys Met Gly Asp Tyr
                245                 250                 255
Phe Ala Thr Val Val Asp Ser Phe Ile Lys Glu Asn Pro Asp Phe Arg
            260                 265                 270
Gly Thr Ser Ser Ser Asn Lys Ala Thr Thr Thr Lys Ala Thr Thr Pro
        275                 280                 285
Thr Thr Gly Asn Thr Thr Cys Ser Ala Lys Ile Thr Ser Gln Gly Tyr
    290                 295                 300
Lys Cys Cys Ser Ala Ser Cys Val Val Val Tyr Thr Asp Asn Asp Gly
305                 310                 315                 320
Asp Trp Gly
<210>32
<211>319
<212>PRT
<213>Neocallimastix frontalis
<400>32
Thr Val Ala Lys Ala Gln Trp Gly Gly Phe Gly Asp Phe Gly Gly Phe
1               5                   10                  15
Gly Gly Phe Gly Gly Phe Gly Asp Asn Gly Asn Asn Gly Asn Asn Asn
            20                  25                  30
Asn Asn Gly Gly Asn Val Ala Val Ser Gly Asp Thr Val Lys Ile Met
        35                  40                  45
Pro Val Gly Asp Ser Ile Thr Phe Gly Glu Gly Glu Arg Gly Gly Tyr
    50                  55                  60
Arg Lys Tyr Leu Tyr Ser Ala Leu Thr Gln Lys Gly Tyr Lys Ile Asp
65                  70                  75                  80
Met Val Gly Pro Glu Gly Ser Asn Ser Ala Ser Ala Asn Gly Ile Gln
                85                  90                  95
Tyr Asp Asp Asn Asn Ala Gly Tyr Ser Gly Phe Gln Ile Lys Glu Ile
            100                 105                 110
Pro Gly Trp Gly Gln Gln Gln Gly Gly Glu Gly Ser Leu Tyr Asn Lys
        115                 120                 125
Leu Lys Ser Lys Asn Ala Val Lys Gln Ser Gln Pro Asp Ile Ile Leu
    130                 135                 140
Leu Ile Ile Gly Thr Asn Asp Met Thr Ala Asn Arg Ser Met Asp Ala
145                 150                 155                 160
Cys Ala Asn Asp Leu Arg Ala Leu Leu Asp Tyr Met Leu Gly Asp Met
                165                 170                 175
Pro Ala Asn Ser Ile Ile Phe Met Gly Ser Ile Pro Glu Phe Thr Ala
            180                 185                 190
Tyr Gly Gly Asn Ser Gln Arg Ile Ala Asn Tyr Asn Gly Thr Val Lys
        195                 200                 205
Lys Val Ala Asp Glu Tyr Ala Asn Lys Gly Lys Asn Val Arg Phe Ala
    210                 215                 220
Asp Val His Gly Cys Leu Asn Gly Met Ala Asp Ile Gly Gly Asp Gln
225                 230                 235                 240
Leu His Pro Ser Gly Asn Gly Tyr Lys Lys Ile Gly Asn Phe Trp Ala
                245                 250                 255
Gly Val Val Asp Glu Tyr Leu Gln Ser Ile Lys Ser Asn Asn Gly Gly
            260                 265                 270
Lys Glu Asp Glu Thr Gly Ser Gly Ser Gly Asn Gly Glu Val Glu Leu
        275                 280                 285
Ser Asn Cys Ser Ser Lys Ile Thr Arg Gln Gly Tyr Lys Cys Cys Ser
    290                 295                 300
Lys Asn Cys Val Val Ile Tyr Thr Asp Ala Asp Gly Lys Trp Gly
305                 310                 315
<210>33
<211>319
<212>PRT
<213>Neocallimastix patriciarum
<400>33
Thr Val Ala Lys Ala Gln Trp Gly Gly Phe Gly Asp Phe Gly Gly Phe
1               5                   10                  15
Gly Gly Phe Gly Gly Phe Gly Asp Asn Gly Asn Asn Gly Asn Asn Asn
            20                  25                  30
Asn Asn Gly Gly Asn Val Ala Val Ser Gly Asp Thr Val Lys Ile Met
        35                  40                  45
Pro Val Gly Asp Ser Ile Thr Phe Gly Glu Gly Glu Arg Gly Gly Tyr
    50                  55                  60
Arg Lys Tyr Leu Tyr Ser Ala Leu Thr Gln Lys Gly Tyr Lys Ile Asp
65                  70                  75                  80
Met Val Gly Pro Glu Gly Ser Asn Ser Ala Ser Ala Asn Gly Ile Gln
                85                  90                  95
Tyr Asp Asp Asn Asn Ala Gly Tyr Ser Gly Phe Gln Ile Lys Glu Ile
            100                 105                 110
Pro Gly Trp Gly Gln Gln Gln Gly Gly Glu Gly Ser Leu Tyr Asn Lys
        115                 120                 125
Leu Lys Ser Lys Asn Ala Val Lys Gln Ser Gln Pro Asp Ile Ile Leu
    130                 135                 140
Leu Ile Ile Gly Thr Asn Asp Met Thr Ala Asn Arg Ser Met Asp Ala
145                 150                 155                 160
Cys Ala Asn Asp Leu Arg Ala Leu Leu Asp Tyr Met Leu Gly Asp Met
                165                 170                 175
Pro Ala Asn Ser Ile Ile Phe Met Gly Ser Ile Pro Glu Phe Thr Ala
            180                 185                 190
Tyr Gly Gly Asn Ser Gln Arg Ile Ala Asn Tyr Asn Gly Thr Val Lys
        195                 200                 205
Lys Val Ala Asp Glu Tyr Ala Asn Lys Gly Lys Asn Val Arg Phe Ala
    210                 215                 220
Asp Val His Gly Cys Leu Asn Gly Met Ala Asp Ile Gly Gly Asp Gln
225                 230                 235                 240
Leu His Pro Ser Gly Asn Gly Tyr Lys Lys Ile Gly Asn Phe Trp Ala
                245                 250                 255
Gly Val Val Asp Glu Tyr Leu Gln Ser Ile Lys Ser Asn Asn Gly Gly
            260                 265                 270
Lys Glu Asp Glu Thr Gly Ser Gly Ser Gly Asn Gly Glu Val Glu Leu
        275                 280                 285
Ser Asn Cys Ser Ser Lys Ile Thr Arg Gln Gly Tyr Lys Cys Cys Ser
    290                 295                 300
Lys Asn Cys Val Val Ile Tyr Thr Asp Ala Asp Gly Lys Trp Gly
305                 310                 315

Claims (20)

1.一种木聚糖酶,其具有选自SEQ ID NO:16-27和32-33的一种氨基酸序列,或其具有木聚糖酶活性的片段。
2.权利要求1的木聚糖酶,其具有SEQ ID NO:26的氨基酸序列,或其具有木聚糖酶活性的片段
3.一种分离的DNA序列,其编码包含选自SEQ ID NO:16-27和32-33的一种氨基酸序列或其具有木聚糖酶活性的片段的氨基酸序列。
4.权利要求3的分离的DNA序列,其中所述DNA包含SEQ IDNO:2-13和29-30的核酸序列。
5.权利要求3的分离的DNA序列,其编码包含SEQ ID NO:26的氨基酸序列或其具有木聚糖酶活性的片段的氨基酸序列。
6.权利要求3的分离的DNA序列,其中所述DNA序列包含SEQ ID NO:12的核酸序列。
7.一种重组表达载体,其包含权利要求3的DNA。
8.权利要求7的重组表达载体,其包含权利要求4的DNA。
9.权利要求7的重组表达载体,其包含权利要求5的DNA。
10.权利要求7的重组表达载体,其包含权利要求6的DNA。
11.一种用权利要求3的DNA分子转染或转化的宿主细胞。
12.权利要求11的宿主细胞,其是用权利要求4的DNA分子转染或转化的。
13.权利要求12的宿主细胞,其是用权利要求5的DNA分子转染或转化的。
14.权利要求13的宿主细胞,其是用权利要求6的DNA分子转染或转化的。
15.权利要求11的宿主细胞,其选自大肠杆菌和Pichiamethanolica。
16.权利要求12的宿主细胞,其选自大肠杆菌和Pichiamethanolica。
17.权利要求13的宿主细胞,其选自大肠杆菌和Pichiamethanolica。
18.权利要求14的宿主细胞,其选自大肠杆菌和Pichiamethanolica。
19.木聚糖酶基因扩增中使用的引物,其特征在于具有序列aactgttgctaaggcccaatggggt或accccatttaccatcgtcatcagtg。
20.木聚糖酶基因扩增中使用的探针,其特征在于具有序列aactgttgctaaggcccaatggggt或accccatttaccatcgtcatcagtg。
CNA031585043A 2002-09-17 2003-09-17 衍生自厌氧真菌的新的重组木聚糖酶及相关序列、表达载体和宿主 Pending CN1495257A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/244,596 US7226772B2 (en) 2002-09-17 2002-09-17 Recombinant xylanases derived from anaerobic fungi, and the relevant sequences, expression vectors and hosts
US10/244,596 2002-09-17

Publications (1)

Publication Number Publication Date
CN1495257A true CN1495257A (zh) 2004-05-12

Family

ID=31991925

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA031585043A Pending CN1495257A (zh) 2002-09-17 2003-09-17 衍生自厌氧真菌的新的重组木聚糖酶及相关序列、表达载体和宿主

Country Status (6)

Country Link
US (1) US7226772B2 (zh)
EP (1) EP1433844A3 (zh)
JP (1) JP2004261173A (zh)
CN (1) CN1495257A (zh)
AU (1) AU2003248004A1 (zh)
CA (1) CA2441462A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011097792A1 (zh) * 2010-02-10 2011-08-18 永丰馀造纸股份有限公司 经修饰的木聚糖酶的核苷酸分子及其应用
CN102712913A (zh) * 2009-11-24 2012-10-03 永丰馀造纸股份有限公司 木聚糖酶组合物及其制造方法
CN102994480A (zh) * 2012-12-03 2013-03-27 青岛蔚蓝生物集团有限公司 一种木聚糖酶及重组表达木聚糖酶的毕赤酵母工程菌
WO2014107953A1 (zh) * 2013-01-09 2014-07-17 中国农业科学院饲料研究所 来源于瘤胃木聚糖酶XynA的C端结构域及提高木聚糖酶催化率的方法
CN104130951A (zh) * 2014-08-07 2014-11-05 新疆农业大学 一种重组毕赤酵母工程菌和代谢的重组木聚糖酶及其制备
CN105219664A (zh) * 2015-09-24 2016-01-06 新疆农业大学 一种重组基因工程菌构建及高活性β-D-1,4-内切木聚糖酶的制备与应用
CN105462948A (zh) * 2016-01-11 2016-04-06 中国农业大学 一种小麦日粮特异性木聚糖降解复合酶制剂及其制备方法和应用

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2746929A1 (en) * 2008-12-22 2010-07-01 The Regents Of The University Of California Acidothermus celluloyticus xylanase
US9012186B2 (en) 2009-04-27 2015-04-21 The Board Of Trustees Of The University Of Illinois Hemicellulose-degrading enzymes
US9850512B2 (en) 2013-03-15 2017-12-26 The Research Foundation For The State University Of New York Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield
US9951363B2 (en) 2014-03-14 2018-04-24 The Research Foundation for the State University of New York College of Environmental Science and Forestry Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects
CN113913410B (zh) * 2021-10-29 2022-09-23 甘肃省科学院生物研究所 一种牦牛瘤胃厌氧真菌木聚糖酶基因工程菌的构建及其应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993025693A1 (en) 1992-06-17 1993-12-23 The Agricultural And Food Research Council Recombinant xylanases
WO1994000578A1 (en) * 1992-06-24 1994-01-06 Commonwealth Scientific And Industrial Research Organisation Recombinant cellulases
US6300114B1 (en) * 1994-07-29 2001-10-09 Rohm Enzyme Finland Oy Sequences of xylanase and xylanase expression vectors
US5824533A (en) * 1995-05-19 1998-10-20 University Of Georgia Research Foundation, Inc. Orpinomyces xylanase proteins and coding sequences
US5948667A (en) * 1996-11-13 1999-09-07 Her Majesty The Queen In Right Of Canada, As Represented By The Department Of Agriculture And Agri-Food Xylanase obtained from an anaerobic fungus

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102712913A (zh) * 2009-11-24 2012-10-03 永丰馀造纸股份有限公司 木聚糖酶组合物及其制造方法
WO2011097792A1 (zh) * 2010-02-10 2011-08-18 永丰馀造纸股份有限公司 经修饰的木聚糖酶的核苷酸分子及其应用
CN102994480A (zh) * 2012-12-03 2013-03-27 青岛蔚蓝生物集团有限公司 一种木聚糖酶及重组表达木聚糖酶的毕赤酵母工程菌
WO2014107953A1 (zh) * 2013-01-09 2014-07-17 中国农业科学院饲料研究所 来源于瘤胃木聚糖酶XynA的C端结构域及提高木聚糖酶催化率的方法
CN104130951A (zh) * 2014-08-07 2014-11-05 新疆农业大学 一种重组毕赤酵母工程菌和代谢的重组木聚糖酶及其制备
CN105219664A (zh) * 2015-09-24 2016-01-06 新疆农业大学 一种重组基因工程菌构建及高活性β-D-1,4-内切木聚糖酶的制备与应用
CN105219664B (zh) * 2015-09-24 2019-07-05 新疆农业大学 一种重组基因工程菌构建及高活性β-D-1,4-内切木聚糖酶的制备与应用
CN105462948A (zh) * 2016-01-11 2016-04-06 中国农业大学 一种小麦日粮特异性木聚糖降解复合酶制剂及其制备方法和应用

Also Published As

Publication number Publication date
US20040053238A1 (en) 2004-03-18
AU2003248004A1 (en) 2004-04-01
CA2441462A1 (en) 2004-03-17
EP1433844A2 (en) 2004-06-30
US7226772B2 (en) 2007-06-05
JP2004261173A (ja) 2004-09-24
EP1433844A3 (en) 2005-02-09

Similar Documents

Publication Publication Date Title
CN1240833C (zh) 新型腈水合酶
CN1230546C (zh) 丝状真菌宿主领域的转化***
CN1155700C (zh) 提高木聚糖酶嗜热性、嗜碱性和热稳定性的修饰
CN1263859C (zh) 具有蛋白酶活性的多肽的编码核酸
CN1509330A (zh) 具有纤维二糖酶活性的多肽和编码其的多核苷酸
CN1890367A (zh) 耐表面活性剂的纤维素酶及其修饰方法
CN1944639A (zh) 酶混合物
CN1161461C (zh) 碱性磷酸酶在酵母中的表达
CN1190495C (zh) 在单端孢菌毒素缺陷的丝状真菌突变细胞中生产异源多肽的方法
CN1156570C (zh) 微生物木糖葡聚糖内切转糖基酶、其生产方法及用途
CN1617927A (zh) 焦谷氨酰肽酶及其基因
CN101074435A (zh) α-半乳糖苷酶基因、其编码蛋白及其制备方法和应用
CN1531595A (zh) 琼脂糖酶及其基因
CN1495257A (zh) 衍生自厌氧真菌的新的重组木聚糖酶及相关序列、表达载体和宿主
CN1195058C (zh) 草酰乙酸水解酶缺陷型真菌宿主细胞
CN1175104C (zh) 内切-β-N-乙酰葡糖胺糖苷酶基因
CN101031643A (zh) 具有α-葡糖苷酶活性的多肽及编码其的多核苷酸
CN1301307A (zh) 在丝状真菌突变细胞中生产多肽的方法
CN1878859A (zh) 新型桥石短小芽孢杆菌和使用该微生物作为宿主生产蛋白的方法
CN1268746C (zh) 用于在真菌细胞中生产多肽的方法
CN1697877A (zh) 具有增强的嗜热性和嗜碱性的木聚糖酶
CN1183248C (zh) 环状缩肽合成酶及其基因、以及环状缩肽的大规模生产***
CN1930289A (zh) 变异芽孢杆菌属细菌
CN1891820A (zh) 在表面活性剂存在下稳定的胆固醇氧化酶
CN1150323C (zh) 具有碱性支链淀粉酶和碱性α-淀粉酶两种活性的酶的基因

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication