MX2013010509A - Composiciones de celulasa y sus metodos de uso para mejorar la conversions de biomasa lignocelulosica en azucares. - Google Patents

Composiciones de celulasa y sus metodos de uso para mejorar la conversions de biomasa lignocelulosica en azucares.

Info

Publication number
MX2013010509A
MX2013010509A MX2013010509A MX2013010509A MX2013010509A MX 2013010509 A MX2013010509 A MX 2013010509A MX 2013010509 A MX2013010509 A MX 2013010509A MX 2013010509 A MX2013010509 A MX 2013010509A MX 2013010509 A MX2013010509 A MX 2013010509A
Authority
MX
Mexico
Prior art keywords
sequence
sec
ident
polypeptide
amino acid
Prior art date
Application number
MX2013010509A
Other languages
English (en)
Inventor
Thijs Kaper
Igor Nikolaev
Suzanne Lantz
Meredith K Fujdala
Megan Y Hsi
Original Assignee
Danisco Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Danisco Inc filed Critical Danisco Inc
Publication of MX2013010509A publication Critical patent/MX2013010509A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2445Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01021Beta-glucosidase (3.2.1.21)
    • DTEXTILES; PAPER
    • D06TREATMENT OF TEXTILES OR THE LIKE; LAUNDERING; FLEXIBLE MATERIALS NOT OTHERWISE PROVIDED FOR
    • D06MTREATMENT, NOT PROVIDED FOR ELSEWHERE IN CLASS D06, OF FIBRES, THREADS, YARNS, FABRICS, FEATHERS OR FIBROUS GOODS MADE FROM SUCH MATERIALS
    • D06M16/00Biochemical treatment of fibres, threads, yarns, fabrics, or fibrous goods made from such materials, e.g. enzymatic
    • D06M16/003Biochemical treatment of fibres, threads, yarns, fabrics, or fibrous goods made from such materials, e.g. enzymatic with enzymes or microorganisms
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Textile Engineering (AREA)
  • Mycology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

La presente invención se relaciona con composiciones que se pueden usar para hidrolizar biomasa, tales como composiciones que comprenden un polipéptido que tiene actividad de ß-glucosidasas, métodos para hidrolizar material de biomasa y métodos para mejorar la estabilidad y eficacia de sacarificación de una composición que comprende tales.

Description

COMPOSICIONES DE CELULASA Y SUS METODOS DE USO PARA MEJORAR LA CONVERSION DE BIOMASA LIGNOCELULOSICA EN AZUCARES FERMÉNTABLES Campo de la Invención La presente descripción se relaciona, generalmente, con ciertas enzimas ß-glucosidasas , y las composiciones modificadas de enzimas ß-glucosidasas, composiciones de caldo de fermentación de ß-glucosidasas , y otras composiciones que comprenden tales ß-glucosidasas , y con los métodos para elaborarlas o usarlas en un escenario de investigación, industrial o comercial, por ejemplo, para la sacarificación o conversión de materiales de biomasa que comprenden hemicelulosas y, opcionalmente , celulosa, en azúcares fermentables .
Antecedentes de la Invención La bioconversión de biomasa lignocelulósica renovable en un azúcar fermentable que, posteriormente, se fermenta para producir alcohol (por ejemplo, etanol) como alternativa para los combustibles líquidos ha atraído en gran medida la atención de los investigadores desde la década de los setenta, cuando se produjo la crisis del petróleo (Bungay, H. R. , "Energy: the biomass options". NY: Wiley; 1981; Olsson L, Hahn-Hagerdal B. Enzyme Microb Technol 1996, 18:312-31; Zaldivar, J et al., Appl icrobiol Biotechnol 2001, 56: 17-34; Galbe, M et al., Appl Microbiol Biotechnol 2002, 59:618-28). En las últimas décadas, Ref. 242723 el etanol se ha usado como una mezcla con gasolina al 10 % en los Estados Unidos o como un combustible puro para vehículos en Brasil. La importancia del bioetanol como combustible incrementa paralelamente con el incremento en los precios del petróleo y la reducción gradual de sus fuentes. Adicionalmente, los azúcares fermentables se usan cada vez más para producir plásticos, polímeros y otros productos bio-derivados . Por lo tanto, la demanda por azúcares fermentables de costo bajo abundantes, que pueden usarse en lugar de materia prima de combustible a base de petróleo, crece rápidamente.
Principalmente, entre los materiales renovables de biomasa útiles se encuentran la celulosa y la hemicélulosa (xilanos) , que pueden convertirse en azúcares fermentables. La conversión enzimática de estos polisacáridos en azúcares solubles, por ejemplo, glucosa, xilosa, arabinosa, galactosa, mañosa y/o otras hexosas y pentosas, se produce debido a las acciones combinadas de diversas enzimas. Por ejemplo, las endo-1 , 4 - ß-glucanasas (EG) y las exo-celobiohidrolasas (CBH) catalizan la hidrólisis de celulosa insoluble en celooligosacáridos (por ejemplo, en donde la celobiosa es un producto principal) , mientras que las ß-glucosidasas (BGL) convierten los oligosacáridos en glucosa. Las xilanasas, junto con otras proteínas complementarias (hemicelulasas ; cuyos ejemplos no limitantes incluyen L- -arabinofuranosidasas , feruloil y acetilxilano esterasas, glucuronidasas y ß-xilosidasas) , catalizan la hidrólisis de hemicelulosas .
Las paredes celulares de las plantas están compuestas por una mezcla heterogénea de polisacáridos complejos que interactúan a través de medios covalentes y no covalentes . Los polisacáridos complejos de las paredes celulares de plantas superiores incluyen, por ejemplo, celulosa (ß-1,4 glucano) que constituye, generalmente, 35-50 % del carbono encontrado en los componentes de las paredes celulares. Los polímeros de celulosa se asocian por sí mismos a través de enlaces de hidrógeno, interacciones de Van der Waals e interacciones hidrofóbicas para formar microfibrillas de celulosa semicristalina . Estas microfibrillas incluyen, además, regiones no cristalinas, conocidas, generalmente, como celulosa amorfa. Las microfibrillas de celulosa están integradas en una matriz formada de hemicelulosas (que incluyen, por ejemplo, xilanos, arábanos y mananos) , pectinas (por ejemplo, galacturonanos y galactanos) y muchos otros ß-1,3 y ß-1,4 glucanos . Estos polímeros de la matriz se sustituyen, frecuentemente, con, por ejemplo, residuos de arabinosa, galactosa y/o xilosa para producir arabinoxilanos , arabinogalactanos , galactomananos y xiloglucanos altamente complejos. La matriz de hemicelulosa está rodeada, a su vez, por lignina polifenólica .
Para obtener azúcares fermentables útiles a partir de materiales de biomasa, la lignina, típicamente, se permeabiliza y la hemicelulosa se interrumpe para permitir el acceso por las enzimas que hidrolizan celulosa. Un consorcio de actividades enzimáticas podría ser necesario para descomponer la matriz compleja de un material de biomasa antes de producir los azúcares fermentables .
Independientemente del tipo de materia prima celulósica, el costo y la eficiencia hidrolítica de las enzimas son factores principales que restringen la comercialización de los procesos de bioconversión de biomasa. Los costos de producción de enzimas producidas por microorganismos se conectan fuertemente con la productividad de la cepa productora de enzimas y el rendimiento de actividad final en el caldo de fermentación. La eficiencia hidrolítica de un complejo de múltiples enzimas puede depender de muchos factores, por ejemplo, las propiedades de las enzimas individuales, las sinergias entre estas y su relación en la combinación de múltiples enzimas.
Existe una necesidad en la técnica para identificar las enzimas y/o composiciones enzimáticas que tienen la capacidad de convertir material vegetal y/u otro material celulósico o hemicelulósico en azúcares fermentables con una eficacia suficiente o mejorada, producciones mejoradas de azúcares fermentables y/o capacidad mejorada para actuar en una variedad mayor de materiales celulósicos o hemicelulósicos .
Los métodos mejorados y las composiciones que se describen en la presente descripción proporcionan tales composiciones enzimáticas que tienen la capacidad de producir azúcares fermentables a bajo costo y a partir de fuentes renovables .
Las patentes, solicitudes de patentes, documentos, números de registro de las bases de datos de secuencias de nucleótidos/proteínas y artículos que se mencionan en la presente descripción se incorporan en la presente descripción como referencia en su totalidad.
Breve Descripción de la Invención La presente descripción proporciona varios polipéptidos de ß-glucosidasa, que incluyen variantes, mutantes, enzimas híbridas/quiméricas/de fusión, ácidos nucleicos que codifican estos polipéptidos, composiciones que comprenden tales polipéptidos y métodos para usar estas composiciones. Las composiciones en la presente descripción son, en algunos aspectos, composiciones de celulasa que no son de origen natural. Las composiciones pueden comprender, además, una o más hemicelulasas , y como tales son composiciones de hemicelulosa . En algunos aspectos, las composiciones pueden usarse en un proceso de sacarificación, al convertir diversos materiales de biomasa en azúcares fermentables . En algunos aspectos, las composiciones en la presente descripción proporcionan una eficacia o eficiencia de sacarificación mejorada y otras ventajas. La presente invención proporciona, además, células, por ejemplo, células huésped modificadas de manera recombinante , caldos de fermentación derivados de estas células y métodos o procesos para usar estas células o caldos de fermentación. La presente invención describe y contempla, además, métodos empresariales para usar tales polipéptidos, ácidos nucleicos que codifican estos polipéptidos y composiciones que comprenden tales polipéptidos.
En ciertos aspectos, la presente descripción permite una composición de celulasa que no es de origen natural que comprende un polipéptido de ß-glucosidasas , que es una quimera (o híbrido, o fusión, cuyos términos se usan indistintamente en la presente descripción para referirse al mismo concepto) de por lo menos dos secuencias de ß-glucosidasa . En algunos aspectos, la composición de celulasa que no es de origen natural comprende actividad de ß-glucosidasas . La composición puede comprender, además, uno o más de actividad de xilanasas, ß-xilosidasas y/o L-a-arabinofuranosidasas . Por lo tanto, la composición puede ser una composición de hemicelulasa . La composición de celulasa/hemicelulasa que no es de , origen natural comprende componentes derivados de por lo menos dos fuentes diferentes. En algunos aspectos, la composición de celulasa/hemicelulasa que no es de origen natural comprende una o más hemicelulasas de origen natural. Los polipéptidos de ß-glucosidasa en la composición pueden comprender, además, uno o más sitios de glicosilación . En algunos aspectos, el polipéptido de ß-glucosidasa comprende una secuencia N-terminal y una secuencia C-terminal, en donde cada secuencia N-terminal o secuencia C-terminal comprende una o más subsecuencias derivadas de distintas ß-glucosidasas . En ciertos aspectos, las secuencias N-terminal y C-terminal se derivan de distintas fuentes. En algunas modalidades, por lo menos dos de las subsecuencias de las secuencias N-terminal y C-terminal se derivan de distintas fuentes. En algunos aspectos, ya se la secuencia N-terminal o la secuencia C-terminal comprende, además, una secuencia en la región de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud. En ciertas modalidades, la secuencia N-terminal y la secuencia C-terminal se encuentran inmediatamente adyacente o directamente conectadas . En otras modalidades, las secuencias N-terminal y C-terminal no se encuentran inmediatamente adyacentes, más bien, están conectadas funcionalmente por medio de un dominio conector. En ciertas modalidades, el dominio conector se ubica en la posición central (por ejemplo, no se encuentra ni en el extremo N-terminal ni C-terminal) del polipéptido quimérico. En ciertas modalidades, ni la secuencia N-terminal ni la secuencia C-terminal del polipéptido híbrido comprende una secuencia de bucle. En su lugar, el dominio conector comprende la secuencia de bucle. En algunos aspectos, la secuencia N-terminal comprende una primera secuencia de aminoácidos de una ß-glucosidasa o una variante de esta de por lo menos aproximadamente 200 (por ejemplo, aproximadamente 200, 250, 300, 350, 400, 450, 500, 550 o 600) residuos de longitud. En algunos aspectos, la secuencia N-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representados por las sec. con núms . de ident .: 136-148. En algunos aspectos, la secuencia C-terminal comprende una segunda secuencia de aminoácidos de una ß-glucosidasa o una variante de esta de por lo menos aproximadamente 50 (por ejemplo, aproximadamente 50, 75, 100, 125, 150, 175 o 200) residuos de aminoácidos de longitud. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representados por las sec. con núms. de ident .: 149-156. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) de los motivos de las secuencias de aminoácidos de las sec. con núms. de ident. : 164-169, y la segunda de las dos o más secuencias de ß-glucosidasa tiene por lo menos 50 residuos de aminoácidos de longitud y comprende la sec. con núm. de ident. :170. En algunos aspectos, ya sea la secuencia C-terminal o la secuencia N-terminal comprende una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident. :171) o de FD (R/ ) YNIT (sec. con núm. de ident.:172) . En algunos aspectos, ni la secuencia C-terminal ni la secuencia N-terminal comprende una secuencia de bucle. En algunas modalidades, la secuencia C-terminal y la secuencia N-terminal están conectadas por medio de un dominio conector que comprende una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos, con una secuencia de FD RSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En ciertas modalidades, el polipéptido de ß-glucosidasa comprende una secuencia que tiene por lo menos aproximadamente 65 %, (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con la sec. con núm. de ident.:135. En algunas modalidades, el polipéptido que tiene actividad de ß-glucosidasas (por ejemplo, el polipéptido de ß-glucosidasa) está codificado por un nucleótido que tiene por lo menos aproximadamente 65 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 %) de identidad con la sec. con núm. de ident . -.83, o por un polinucleótido con la capacidad de hibridizarse en condiciones de rigurosidad alta con la sec. con núm. de ident. N:83 o un complemento de esta. En algunos aspectos, el polipéptido o polipéptidos de ß-glucosidasa en la composición de celulasa o hemicelulasa que no es de origen natural tienen una estabilidad mejorada en cualquiera de las enzimas naturales de donde se deriva cada secuencia C-terminal y/o N-terminal del polipéptido quimérico. En algunos aspectos, la estabilidad mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución en el índice o alcance de una pérdida de actividad enzimática asociada durante el almacenamiento o las condiciones de producción, en donde la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 30 % o menor que aproximadamente 20 %, con mayor preferencia, menor que 15 %, o menor que 10 %.
Los polipéptidos de la presente descripción se pueden obtener y/o usar, adecuadamente, en forma "sustancialmente pura". Por ejemplo, un polipéptido de la presente descripción constituye por lo menos aproximadamente 80 % en peso (por ejemplo, por lo menos aproximadamente 85 % en peso, 90 % en peso, 91 % en peso, 92 % en peso, 93 % en peso, 94 % en peso, 95 % en peso, 96 % en peso, 97 % en peso, 98 % en peso o 99 % en peso) del total de proteína en una composición específica, que incluye, además, otros ingredientes tales como un regulador o una solución.
En algunos aspectos, la presente descripción proporciona ácido nucleico que codifica el polipéptido de ß-glUcósidasa, que incluye las variantes, mutantes y polipéptidos híbridos/de fusión/quiméricos. Por ejemplo, la presente descripción proporciona un ácido nucleico aislado que codifica el polipéptido de ß-glucosidasa, en donde el ácido nucleico tiene por lo menos aproximadamente 65 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 ·% o 100 %) de identidad con la sec . con núm. de ident.:83, o tiene la capacidad de hibridizarse en condiciones de rigurosidad alta en la sec. con núm. de ident . :83 o un complemento de esta. La presente descripción proporciona, además, células huésped que comprenden tales moléculas de ácido nucleico. En algunas modalidades, la presente descripción proporciona, además, promotores y vectores adecuados para usar con las moléculas de ácido nucleico y las células huésped. En ciertos aspectos, la descripción proporciona composiciones preparadas al fermentar las células huésped, que incluyen composiciones de celulasa o composiciones de hemicelulosa . Como tales, la descripción proporciona composiciones de caldo de fermentación.
En algunos aspectos, la descripción proporciona métodos para usar las composiciones, polipéptidos, células o ácidos nucleicos que codifican los polipéptidos en la presente descripción para lograr la sacarificación de sustratos/materiales de biomasa. En ciertas modalidades, los sustratos/materiales de biomasa se tratan previa y, adecuadamente, o se someten a métodos adecuados de tratamiento previo. En algunas modalidades, la descripción proporciona, además, ciertos métodos comerciales o empresariales asociados con las composiciones, polipéptidos , células o ácidos nucleicos que se describen en la presente descripción.
Breve Descripción de las Figuras Las siguientes figuras y tablas pretenden ser ilustrativas sin limitar el alcance y contenido de la descripción instantánea o las reivindicaciones en la presente descripción.
Las Figuras 1A-1D proporcionan un resumen de los identificadores de secuencias usados en la presente descripción de diversas enzimas y nucleótidos que codifican algunas de estas enzimas.
La Figura 2 proporciona residuos conservados entre ciertos homólogos de ß-glucosidasa (por ejemplo, Fv3C) , previstos en base a la estructura cristalina de Bgl3B de T. neapolitana unido a glucosa en el subsitio -1 (la estructura cristalina en el registro del Protein Data Bank (Banco de Datos de Proteínas) : pdb:2X41) .
La Figura 3 proporciona la composición enzimática de un caldo de fermentación producido por la cepa H3A integrada de T. reesei.
Figuras 4A-4E: la Figura 4A enumera las enzimas (purificadas o no purificadas) que se agregaron individualmente a cada una de las muestras en el Ejemplo 2, y las concentraciones de proteína de materia prima de estas enzimas. La Figura 4B representa la cantidad de liberación de glucosa después de la sacarificación de mazorca de maíz tratada previamente con amoníaco diluido al agregar composiciones enzimáticas que comprenden diversas enzimas purificadas o no purificadas de la Figura 4A, que se agregan a la cepa H3A de T. reesei integrada, de conformidad con el Ejemplo 2. La Figura 4C representa la cantidad de liberación de celobiosa después de la sacarificación de mazorca de maíz tratada previamente con amoníaco diluido al agregar composiciones enzimáticas que comprenden diversas enzimas purificadas o no purificadas de la Figura 4A, que se agregaron a la cepa H3A de T. reesei integrada, de conformidad con el Ejemplo 2. La Figura 4D representa la cantidad de liberación de xilobiosa después de la sacarificación de mazorca de maíz tratada previamente con amoníaco diluido al agregar composiciones enzimáticas que comprenden diversas enzimas purificadas o no purificadas de la Figura 4A, que se agregaron a la cepa H3A de T. reesei integrada, de conformidad con el Ejemplo 2. La Figura 4E representa la cantidad de liberación de xilosa después de la sacarificación de mazorca de maíz tratada previamente con amoníaco diluido al agregar composiciones enzimáticas que comprenden diversas enzimas purificadas o no purificadas de la Figura 4A, que se agregaron a la cepa H3A de T. reesei integrada, de conformidad con el Ejemplo 2.
Figuras 5A-5B: la Figura 5A enumera la actividad de ß -glucosidasas de varios homólogos de ß-glucosidasa, que incluyen Bgll de T. reesei (Tr3A) , Bglu de A. niger (An3A) , Fv3C, Fv3D y Pa3C. La actividad en celobiosa y los sustratos de CNPG se determinaron de conformidad con el Ejemplo 4; la Figura 5B compara la actividad de otro grupo de homólogos de ß-glucosidasa, con relación a Bgll de T. reesei, en celobiosa y sustratos de CNPG, de conformidad con el Ejemplo 5A.
Figura 6: enumera los pesos relativos de las enzimas en una mezcla/composición de enzimas analizada en el Ejemplo 5B-D.
Figura 7 : proporciona una comparación de los efectos de las composiciones de enzimas en mazorca de maíz tratada previamente con amoníaco diluido.
Figuras 8A-8B: la Figura 8A representa la secuencia de nucleótidos Fv3A (sec. con núm. de ident. :1) . La Figura 8B representa la secuencia de aminoácidos Fv3A (sec. con núm. de ident. : 2 ) . La secuencia señal prevista aparece subrayada. El dominio conservado previsto aparece en negrita.
Figuras 9A-9B: la Figura 9A representa la secuencia de nucleótidos Pf43A (sec. con núm. de ident. :3) . La Figura 9B representa la secuencia de aminoácidos Pf43A (sec. con núm. de ident. :4) . La secuencia señal prevista aparece subrayada, el dominio conservado previsto aparece en negrita, el módulo de unión a carbohidratos ("CBM", por sus siglas en inglés) previsto aparece en mayúsculas, y el conector previsto que separa el CD y el CBM aparece en cursiva.
Figuras 10A-10B: la Figura 10A representa la secuencia de nucleótidos Fv43E (sec. con núm. de ident. :5) . La Figura 10B representa la secuencia de aminoácidos Fv43E (sec. con núm. de ident. :6) . La secuencia señal prevista aparece subrayada. El dominio conservado previsto aparece en negrita.
Figuras 11A-11B: la Figura 11A representa la secuencia de nucleótidos Fv39A (sec. con núm. de ident. :7) . La Figura 11B representa la secuencia de aminoácidos Fv39A (sec. con núm. de ident. : 8) . La secuencia señal prevista aparece subrayada. El dominio conservado previsto se presenta en negrita.
Figuras 12A-12B: la Figura 12A representa la secuencia de nucleótidos Fv43A (sec. con núm. de ident. : 9) . La Figura 12B representa la secuencia de aminoácidos Fv43A (sec. con núm. de ident. :10) . La secuencia señal prevista aparece subrayada. El dominio conservado previsto aparece en negrita, el CBM previsto aparece en mayúsculas y el conector previsto que separa el dominio conservado y el CBM aparece en cursiva.
Figuras 13A-13B: la Figura 13A representa la secuencia de nucleótidos Fv43B (sec. con núm. de ident. :11) . La Figura 13B representa la secuencia de aminoácidos Fv43B (sec. con núm. de ident. : 12) . La secuencia señal prevista aparece subrayada. El dominio conservado previsto se presenta en negrita.
Figuras 14A-14B: la Figura 14A representa la secuencia de nucleótidos Pa51A (sec. con núm. de ident. :13) . La Figura 14B representa la secuencia de aminoácidos Pa51A (sec. con núm. de ident.:14). La secuencia señal prevista aparece subrayada. El dominio conservado de L- -arabinofuranosidasa previsto aparece en negrita. Para la expresión en T. reesei, el ADN genómico se optimizó por codones (ver la Figura 27C) .
Figuras 15A-15B: la Figura 15A representa la secuencia de nucleótidos Gz43A (sec. con núm. de ident. :15) . La Figura 15B representa la secuencia de aminoácidos Gz43A (sec. con núm. de ident.: 16). La secuencia señal prevista aparece subrayada y el dominio conservado previsto aparece en negrita. Para la expresión en T. reesei, la secuencia señal prevista se reemplazó por la secuencia señal CBH1 de T. reesei (MYRKLAVISAFLATARA (sec. con núm. de ident.: 159)) en T. reesei.
Figuras 16A-16B: la Figura 16A representa la secuencia de nucleótidos Fo43A (sec. con núm. de ident. :17). La Figura 16B representa la secuencia de aminoácidos Fo43A (sec. con núm. de ident. :18) . La secuencia señal prevista aparece subrayada. El dominio conservado previsto aparece en negrita. Para la expresión en T. reesei, la secuencia señal prevista se reemplazó por la secuencia señal CBH1 de T. reesei (MYRKLAVISAFLATARA (sec. con núm. de ident .: 159 )) .
Figuras 17A-17B: la Figura 17A representa la secuencia de nucleótidos Af43A (sec. con núm. de ident. :19). La Figura 17B representa la secuencia de aminoácidos Af43A (sec. con núm. de ident.:20). El dominio conservado previsto aparece en negrita.
Figuras 18A-18B: la Figura 18A representa la secuencia de nucleótidos Pf51A (sec. con núm. de ident.:21). La Figura 18B representa la secuencia de aminoácidos Pf51A (sec. con núm. de ident. :22) . La secuencia señal prevista aparece subrayada. El dominio conservado de L-a-arabinofuranosidasa previsto aparece en negrita. Para la expresión en T. .reesei, la secuencia señal Pf51A prevista se reemplazó por la secuencia señal CBH1 de T. reesei (MYRKLAVISAFLATARA (sec. con núm. de ident.: 159)) y la secuencia de nucleótidos Pf51A se optimizó por codones para la expresión en T. reesei Figuras 19A-19B: la Figura 19A representa la secuencia de nucleótidos AfuXyn2 (sec. con núm. de ident. :23) . La Figura 19B representa secuencia de aminoácidos AfuXyn2 (sec. con núm. de ident.: 24) . La secuencia señal prevista aparece subrayada. El dominio conservado GHll previsto aparece en negrita.
Figuras 20A-20B: la Figura 20A representa la secuencia de nucleótidos AfuXyn5 (sec. con núm. de ident. :25) . La Figura 20B representa la secuencia de aminoácidos AfuXyn5 (sec. con núm. de ident. :26). La secuencia señal prevista aparece subrayada. El dominio conservado GHll previsto aparece en negrita.
Figuras 21A-21B: la Figura 21A representa secuencia de nucleótidos Fv43D (sec. con núm. de ident. :27) . La Figura 21B representa la secuencia de aminoácidos Fv43D (sec. con núm. de ident. :28). La secuencia señal prevista aparece subrayada.
El dominio conservado previsto aparece en negrita.
Figuras 22A-22B: la Figura 22A representa la secuencia de nucleótidos Pf43B (sec. con núm. de ident. :29) . La Figura 22B representa la secuencia de aminoácidos Pf43B (sec. con núm. de ident. :30). La secuencia señal prevista aparece subrayada. El dominio conservado previsto aparece en negrita.
Figuras 23A-23B: la Figura 23A representa la secuencia de nucleótidos (sec. con núm. de ident. :31) . La Figura 23B representa la secuencia de aminoácidos Fv51A (sec. con núm. de ident.: 32). La secuencia señal prevista aparece subrayada. El dominio conservado de L-a-arabinofuranosidasa previsto aparece en negrita.
Figuras 24A-24B: la Figura 24A representa la secuencia de nucleótidos Xyn3 de T. reesei (sec. con núm. de ident. :41) . La Figura 24B representa la secuencia de aminoácidos Xyn3 de T. reesei (sec. con núm. de ident. :42) .
La secuencia señal prevista aparece subrayada. El dominio conservado previsto aparece en negrita.
Figuras 25A-25B: la Figura 25A representa la secuencia de aminoácidos Xyn2 de T. reesei (sec. con núm. de ident. :43) . La secuencia señal aparece subrayada. El dominio conservado previsto aparece en negrita. La Figura 25B representa la secuencia de nucleótidos Xyn2 de T. reesei (sec. con núm. de ident. :162). La secuencia codificante puede encontrarse en Tórrónen et al. Biotechnology, 1992, 10:1461-65.
Figuras 26A-26B: la Figura 26A representa la secuencia de aminoácidos Bxll de T. reesei (sec. con núm. de ident.:44). La secuencia señal aparece subrayada. El dominio conservado previsto aparece en negrita. La Figura 26B representa la secuencia de nucleótidos Bxll de T. reesei (sec. con núm. de ident.:163). La secuencia codificante puede encontrarse en Margolles-Clark et al. Ap l : Environ. Microbiol. 1996, 62 (10) : 3840-46.
Figuras 27A-27F: la Figura 27A representa la secuencia de aminoácidos Bgll de G. reesei (sec. con núm. de ident.:45). La secuencia señal aparece subrayada. La secuencia codificante puede encontrarse en Barnett et al. Bio-Technology, 1991, 9 ( 6 ) : 562 -567. La Figura 27B representa el ADNc derivado para Pa51A (sec. con núm. de ident . :46) . La Figura 27C representa ADNc optimizado por codones para Pa51A (sec. con núm. de ident. :47) . Figura 27D: secuencia codificante para un constructo que comprende una secuencia señal CBH1 (subrayada) dirección 5' del ADN genómico que codifica Gz43A maduro (sec. con núm. de ident. :48) .:. Figura 27E: secuencia codificante para un constructo que comprende una secuencia señal CBH1 (subrayada) dirección 5' del ADN genómico que codifica Fo43A maduro (sec. con núm. de ident. :49). Figura 27F: secuencia codificante para un constructo que comprende una secuencia señal CBH1 (subrayada) dirección 5' del ADN optimizado por codones que codifica Pf51A (sec. con núm. de ident.:50).
Figuras 28A-28B: la Figura 28A representa la secuencia de nucleótidos Eg4 de G. reesei (sec. con núm. de ident.:51). La Figura 28B representa la secuencia de aminoácidos Eg4 de T. reesei (sec. con núm. de ident.:52) . La secuencia señal prevista aparece subrayada. Los dominios conservados previstos aparecen en negrita. El conector previsto aparece en cursiva.
Figuras 29A-29B: la Figura 29A representa la secuencia de nucleótidos de Pa3D (sec. con núm. de ident.:53). La Figura 29B representa la secuencia de aminoácidos de Pa3D (sec. con núm. de ident.:54). La secuencia señal prevista aparece subrayada. Los dominios conservados previstos aparecen en negrita.
Figuras 30A-30B: la Figura 30A representa la secuencia de nucleótidos de Fv3G (sec. con núm. de ident.:55). La Figura 30B representa la secuencia de aminoácidos de Fv3G (sec. con núm. de ident.:56). La secuencia señal prevista aparece subrayada. Los dominios conservados previstos aparecen en negrita.
Figuras 31A-31B: la Figura 31A representa la secuencia de nucleótidos de Fv3D (sec. con núm. de ident.:57) . La Figura 31B representa la secuencia de aminoácidos de Fv3D (sec. qon núm. de ident.:58). La secuencia señal prevista aparece subrayada. Los dominios conservados previstos aparecen en negrita'. ' Figuras 32A-32B: la Figura 32A representa la secuencia de nucleótidos de Fv3C (sec. con núm. de ident.:59). La Figura 32B representa la secuencia de aminoácidos de Fv3C (sec. con núm. de ident.:60). La secuencia señal prevista aparece subrayada. Los dominios conservados previstos aparecen en negrita.
Figuras 33A-33B: la Figura 33A representa la secuencia de nucleótidos de Tr3A (sec. con núm. de ident.:61) . La Figura 33B representa la secuencia de aminoácidos de Tr3A (sec. con núm. de ident.:62). La secuencia señal prevista aparece subrayada. Los dominios conservados previstos aparecen en negrita.
Figuras 34A-34B: la Figura 34A representa la secuencia de nucleótidos de Tr3B (sec. con núm. de ident.:63) . La Figura 34B representa la secuencia de aminoácidos de Tr3B (sec. con núm. de ident.:64). La secuencia señal prevista aparece subrayada. Los dominios conservados previstos aparecen en negrita.
Figuras 35A-35B: la Figura 35A representa la secuencia de nucleótidos optimizada por codones de Te3A (sec. con núm. de ident.:65) . La Figura 35B representa la secuencia de aminoácidos de Te3A (sec. con núm. de ident.:66) . La secuencia señal prevista aparece subrayada. Los dominios conservados previstos aparecen en negrita.
Figuras 36A-36B: la Figura 36A representa la secuencia de nucleótidos de An3A (sec. con núm. de ident.:67) . La Figura 36B representa la secuencia de aminoácidos de An3A (sec. con núm. de ident.:68) . La secuencia señal prevista aparece subrayada. Los dominios conservados previstos aparecen en negrita.
Figuras 37A-37B: la Figura 37A representa la secuencia de nucleótidos de Fo3A (sec. con núm. de ident.:69) . La Figura 37B representa la secuencia de aminoácidos de Fo3A (sec. con núm. de ident.:70). La secuencia señal prevista aparece subrayada. Los dominios conservados previstos aparecen en negrita.
Figuras 38A-38B: la Figura 38A representa la secuencia de nucleótidos de Gz3A (sec. con núm. de ident.:71). La Figura 38B representa la secuencia de aminoácidos de Gz3A (sec. con núm. de ident . :72) . La secuencia señal prevista aparece subrayada. Los dominios conservados previstos aparecen en negrita.
Figuras 39A-39B: la Figura 39A representa la secuencia de nucleótidos de Nh3A (sec. con núm. de ident. :73) . La Figura 39B representa la secuencia de aminoácidos de Nh3A (sec. con núm. de ident.: 74). La secuencia señal prevista aparece subrayada. Los dominios conservados previstos aparecen en negrita.
Figuras 40A-40B: la Figura 40A representa la secuencia de nucleótidos de Vd3A (sec. con núm. de ident. :75) . La Figura 40B representa la secuencia de aminoácidos de Vd3A (sec. con núm. de ident.: 76). La secuencia señal prevista aparece subrayada. Los dominios conservados previstos aparecen en negrita.
Figuras 41A-41B: la Figura 41A representa la secuencia de nucleótidos de Pa3G (sec. con núm. de ident. :77). La Figura 41B representa la secuencia de aminoácidos de Pa3G (sec. con núm. de ident. :78) . La secuencia señal prevista aparece subrayada. Los dominios conservados previstos aparecen en negrita.
La Figura 42: representa la secuencia de aminoácidos de Tn3B (sec. con núm. de ident. :79) . El programa de predicción de señales Signal P estándar no proporcionó ninguna secuencia señal prevista.
Figuras 43A-1 a 43B-3: las Figuras 43A-1 a 43A-7 representan un alineamiento de la secuencia de aminoácidos de ciertos homólogos de ß-glucosidasas . Las Figuras 43B-1 a 43B-3 representa un alineamiento de homólogos de ß-glucosidasas , de los cuales se sabe que algunos son susceptibles al procesamiento proteolítico pero otros no. La primera región subrayada contiene residuos que se encuentran aproximadamente dentro de una secuencia de bucle ubicada en una región central de esta clase de enzimas. La' segunda región subrayada dirección 3' desde la primera región subrayada contiene residuos que son, frecuentemente, susceptibles a la digestión o procesamiento proteolítico inicial.
La Figura 44 representa un vector pENTR/D-TOPO con el marco de lectura abierta Fv3C.
Figuras 45A-45B: la Figura 45A representa el vector pTrex6g. La Figura 45B representa un constructo de pExpression pTrex6g/Fv3C .
Figuras 46A-46C: la Figura 46A representa la región codificante prevista de la secuencia de ADN genómico Fv3C. La Figura 46B representa la secuencia de aminoácidos -terminal de Fv3C. Las flechas muestran los sitios de clivaje de péptidos señal putativos. El inicio de la proteína madura aparece subrayado. La Figura 46C representa un gel de SDS-PAGE de transformantes de G. reesei que expresan Fv3C a partir de los codones de inicio comentados (1) y alternos (2) .
La Figura 47 compara el rendimiento de varias mezclas de celulasa entera y ß-glucosidasas en la sacarificación de celulosa dilatada en ácido fosfórico a 50 °C. En este experimento, se mezcló celulasa entera a 10 mg de proteína/g de celulosa con 5 mg/g de ß-glucosidasa y se usó las mezclas de enzimas para hidrolizar celulosa dilatada en ácido fosfórico a celulosa al 0.7 %, pH 5.0. La muestra marcada como base en la figura fue la conversión obtenida de 10 mg/g de celulasa entera sola sin ß-glucosidasa agregada. Las reacciones se llevaron a cabo en placas de microtitulación a 50 °C durante 2 h. Las muestras se evaluaron por triplicado. Esto de conformidad con el Ejemplo 5A.
La Figura 48 compara el rendimiento de varias mezclas de celulasa entera y ß-glucosidasas en la sacarificación de rastrojo de maíz tratado previamente con ácido (PCS, por sus siglas en inglés) a 50 °C. En este experimento, se mezcló celulasa entera a 10 mg de proteína/g de celulosa con 5 mg/g de ß-glucosidasa y se usó las mezclas de enzimas para hidrolizar el PCS a sólidos al 13 %, pH 5.0. La muestra marcada como base en la figura fue la conversión obtenida de 10 mg/g de celulasa entera sola sin ß-glucosidasa agregada. Las reacciones se llevaron a cabo en placas de microtitulación a 50 °C durante 48 h. Las muestras se evaluaron por triplicado. Los detalles experimentales se describen en el Ejemplo 5B.
La Figura 49 compara el rendimiento de varias mezclas de celulasa entera y ß-glucosidasas en la sacarificación de mazorca de maíz tratada previamente con amoníaco diluido a 50 °C. En este experimento, se mezcló celulasa entera a 10 mg de proteína/g de celulosa con 8 mg/g de hemicelulasas y 5 mg/g de ß-glucosidasa y se usó las mezclas de enzimas para hidrolizar la mazorca de maíz tratada previamente con amoníaco diluido a sólidos al 20 %, pH 5.0. La muestra marcada como base en la figura fue la conversión obtenida de la mezcla de 10 mg/g de celulasa entera + 8 mg/g de hemicelulosa sola sin ß-glucosidasa agregada. Las reacciones se llevaron a cabo en placas de microtitulación a 50 °C durante 48 h. Las muestras se evaluaron por triplicado. Los detalles experimentales se describen en el Ejemplo 5C.
La Figura 50 compara el rendimiento de las mezclas de celulasa entera y ß-glucosidasas en la sacarificación de mazorca de maíz tratada previamente con hidróxido dé sodio (NaOH) a 50 °C. En este experimento, se mezcló celulasa entera a 10 mg de proteína/g de celulosa con 5 mg/g de ß-glucosidasas y se usó las mezclas de enzimas para hidrolizar la mazorca de maíz tratada previamente con NaOH a sólidos al 17 %, pH 5.0. La muestra marcada como base en la figura fue la conversión obtenida de la mezcla de 10 mg/g de celulasa entera sola sin ß-glucosidasa agregada. Las reacciones se llevaron a cabo en placas de microtitulación a 50 °C durante 48 h. Cada muestra se analizó con 4 réplicas. Esto de conformidad con el Ejemplo 5D.
La Figura 51 compara el rendimiento de las mezclas de celulasa entera y ß-glucosidasas en la sacarificación de pasto varilla tratado previamente con amoníaco diluido a 50 °C. En este experimento, se mezcló celulasa entera a 10 mg de proteína/g de celulosa con 5 mg/g ß-glucosidasas y se usó las mezclas de enzimas para hidrolizar pasto varilla a sólidos al 17 %, pH 5.0. La muestra marcada como base en la figura fue la conversión obtenida de la mezcla de 10 mg/g de celulasa entera sola sin ß-glucosidasa agregada. Las reacciones se llevaron a cabo en placas de microtitulación a 50 °C durante 48 h. Cada muestra se analizó con 4 réplicas. Los detalles experimentales se describen en el Ejemplo 5E.
La Figura 52 compara el rendimiento de las mezclas de celulasa entera y ß -glucosidasas en la sacarificación de rastrojo de maíz AFEX a 50 °C. En este experimento, se mezcló celulasa entera a 10 mg de proteína/g de celulosa con 5 mg/g de ß-glucosidasas y se usó las mezclas de enzimas para hidrolizar rastrojo de maíz AFEX a sólidos al 14 %, pH 5.0. La muestra marcada como base en la figura fue la conversión obtenida de la mezcla de 10 mg/g de celulasa entera sola sin beta-glucosidasa agregada. Las reacciones se llevaron a cabo en placas de microtitulación a 50 °C :durante 48 h. Cada muestra se analizó con 4 réplicas. Los detalles experimentales se describen en el Ejemplo 5F.
Las Figuras 53A-53C representan el porcentaje de conversión de glucano a partir de mazorca de maíz tratada previamente con amoníaco diluido a sólidos al 20 % a distintas relaciones de ß -glucosidasa y celulasa entera, en una cantidad entre 0 y 50 %. La dosis de enzimas se mantuvo constante para cada uno de los experimentos. La Figura 53A representa el experimento realizado con Bgll de T. reesei . La Figura 53B representa el experimento realizado con Fv3C. La Figura 53C representa el experimento realizado con Bglu (An3A) de A. niger.
La Figura 54 representa el porcentaje de conversión de glucano a partir de mazorca de maíz tratada previamente con amoníaco diluido a sólidos al 20 % por medio de tres composiciones enzimáticas diferentes dosificadas a concentraciones de 2.5-40 mg/g de glucano, de conformidad con el Ejemplo 7. ? indica la conversión de glucano que se observó con Accellerase 1500 + xilanasa Multifect, 0 indica la conversión de glucano que se observó con una celulasa entera a partir de la cepa H3A de T. reesei integrada, ? indica la conversión de glucano que se observó con una composición enzimática que comprende 75 % en peso de celulasa entera a partir de la cepa H3A de T. reesei integrada más 25 % en peso de Fv3C.
Figuras 55A-55I: la Figura 55A representa un mapa del plásmido de expresión pRAX2-Fv3C usado para la expresión en A. niger. La Figura 55B representa el plásmido pENTR-TOPO-Bgll-943/942. La Figura 55C representa el vector de expresión pTrex3g 943/942. La Figura 55D representa el plásmido Xyn3 de pENTR/ T. reesei. La Figura 55E representa el vector de expresión Xyn3 de pTrex3g/T. reesei. La Figura 55F representa el plásmido pENTR- Fv3A . La Figura 55G representa el vector de expresión pTrex6g/Fv3A. La Figura 55H representa el plásmido TOPO Blunt/Pegll-Fv43D . La Figura 551 representa el plásmido TOPO Blunt/Pegll-Fv51A.
La Figura 56 representa un alineamiento de aminoácidos entre ß-xilosidasa Bxll de T. reesei y Fv3A.
Las Figuras 57A-57B representan un alineamiento de secuencias de aminoácidos de ciertas hidrolasas de la familia GH43. Los residuos de aminoácidos conservados entre los miembros de la familia aparecen en mayúsculas y en negrita.
La Figura 58 representa un alineamiento de secuencias de aminoácidos de ciertas enzimas de la familia 51. Los residuos de aminoácidos conservados entre los miembros de la familia aparecen en mayúsculas y en negrita.
Las Figuras 59A-59B representan los alineamientos de secuencias de aminoácidos de varias endoxilanasas de las familias GH10 y GH11. Figura 59A: Alineamiento de xilanasas de la familia GH10. Los residuos subrayados en negrita son los residuos de nucleófilos catalíticos (indicados con "N" sobre el alineamiento). Figura 59B: Alineamiento de xilanasas de la familia GH11. Los residuos subrayados y en negrita son los residuos de nucleófilos catalíticos y residuos generales de ácido base (indicados con "N" y "A", respectivamente, sobre el alineamiento) .
Figuras 60A-60C: la Figura 60A representa una representación esquemática del gen que codifica el polipéptido quimérico/de fusión Bgl3 ("FB") de Fv3C/T. reesei. Las Figuras 60B-1 a 60B-2 representan la secuencia de nucleótidos que codifica el polipéptido de fusión/quimérico Bgl3 ("FB") de Fv3C/T. reesei (sec. con núm. de ident.:82). La Figura 60C representa la secuencia de aminoácidos que codifica el polipéptido de fusión/quimérico Bgl3 de Fv3C/T. reesei. (sec. con núm. de ident.:159) . La secuencia en negrita es de Bgl3 de T. reesei.
La Figura 61 representa un mapa del plásmido de fusión pTTT-pyrG13 -Fv3C/Bgl3.
La Figura 62 compara Bgll de G. reesei (diamantes cerrados) y Fv3C producido en A. niger (diamantes abiertos) en la sacarificación de mazorca de maíz tratada previamente con amoníaco diluido. En este experimento, se colocó Bgll de T. reesei y Fv3C de 0-10 mg de proteína/g de celulosa con una concentración constante de 10 mg/g H3A-5 y estas mezclas se usaron para hidrolizar mazorca de maíz tratada previamente con amoníaco diluido a celulosa al 5 %, pH 5.0. Las reacciones se llevaron a cabo en placa de microtitulación a 50 °C durante 2 días. Cada muestra se analizó con 5 réplicas de ensayo. Los detalles experimentales se muestran en el Ejemplo 13.
Figura 63: perfiles de DSC de ß -glucosidasas Bglul (Tr3A) de G. reesei, Fv3C, y polipéptido quimérico de Fv3C/Te3A/Bgl3 ("FAB") recolectados con una frecuencia de exploración de 90 °C/r (25 °C-110 °C) en amortiguador de acetato sódico 50 mM, pH 5.
Figuras 64A-64D: Figura 64A: rendimiento de celulasa entera: mezclas de Bgll de T. reesei en la sacarificación de celulosa dilatada en ácido fosfórico a 50 °C. Figura 64B: mezclas de Bgl3 de T. reesei en la sacarificación de celulosa dilatada en ácido fosfórico a 37 °C. Figura 64C: mezclas de Bgl3 de T. reesei en la sacarificación de rastrojos de maíz tratados previamente con ácido a 50 °C. Figura 64D: mezclas de Bgl3 de G. reesei en la sacarificación de rastrojos de maíz tratados previamente con ácido a 37 °C.
Figuras 65A-65B. Figura 65A: Comparación de Bgll de T. reesei (diamantes cerrados) y Bgl3 de G. reesei (diamantes abiertos) en sacarificación de celulosa dilatada en ácido fosfórico. Figura 65B: Comparación de celobiosa (franjas negras) y glucosa (franjas blancas) producidas por Bgll de G. reesei (grupo de la izquierda) y Bgl3 de T. reesei (grupo de la derecha) en la sacarificación de celulosa dilatada en ácido fosfórico.
Las Figuras 66A-66B representan las secuencias de nucleótidos de varios cebadores.
Figuras 67A-67B: la Figura 67A representa la secuencia de aminoácidos de longitud total de Bgl3 ("FAB") de Fv3C/Te3A/T. reesei (sec. con núm. de ident.:135) (Te3A aparece en cursiva, en negrita y en mayúsculas, Bgl3 de T. reesei aparece subrayado y en mayúsculas) . La Figura 67B representa la secuencia de ácido nucleico que codifica la quimera Bgl3 ("FAB") de Fv3C/Te3A/T. reesei (sec. con núm. de ident.:83).
Figuras 68A-68C: la Figura 68A es una tabla que enumera los motivos estructurales presentes en los dominios en el extremo N- y C-terminal de ciertos polipéptidos quiméricos de ß-glucosidasa . La Figura 68B es una tabla que enumera ciertos motivos de secuencias de aminoácidos usados para diseñar un polipéptido híbrido/quimérico de ß-glucosidasa adecuado de la presente invención. La Figura 68C es una lista de motivos de secuencias de aminoácidos de GH6l/endoglucanasas .
Las Figuras 69A-69B representan secuencias de nucleótidos y secuencias de proteínas de Pa3C (sec. con núms . de ident.:80 y 81, respectivamente) .
Las Figuras 70A-70J: la Figura 70A representa estructuras en 3-D superpuestas de Fv3C y Te3A, y Bgll de T. reesei, observadas desde un primer ángulo, que hace visible la estructura de "inserción 1". La Figura 70B representa las mismas estructuras superpuestas observadas desde un segundo ángulo, que hace visible la estructura de "inserción 2". La Figura 70C representa las mismas estructuras superpuestas observadas desde un tercer ángulo, que hace visible la estructura de "inserción 3". La Figura 70D representa las mismas estructuras superpuestas observadas desde un cuarto ángulo, que hace visible la estructura de "inserción 4". Las Figuras 70E-1 a 70E-2 son un alineamiento de secuencias de Bgll de T. reesei (Q12715_TRI) , Te3A (ABG2_T_eme) y Fv3C (FV3C) , que se indica con las inserciones 1-4, que son estructuras tipo bucle. La Figura 70F representa partes superpuestas de las estructuras de Fv3C (gris claro) , Te3A (gris oscuro) y Bgll de T. reesei (negro) , que indican las interacciones conservadas entre los residuos W59/ 33 y W355/W325 (Fv3C/Te3A) . La Figura 70G representa partes superpuestas de las estructuras de Fv3C (gris claro) , Te3A (gris oscuro) y Bgll de T. reesei (negro) , que indican las interacciones conservadas entre el primer par de residuos: S57/31 y N291/261 (Fv3C/Te3A) , y entre los segundos grupos de residuos: Y55/29, P775/729 y A778/732 (Fv3C/Te3A) . La Figura 70H representa partes superpuestas de las estructuras Fv3C (gris oscuro) y Bgll de T. reesei (negro), que indican las interacciones de enlaces de hidrógeno de Fv3C en K162 con el átomo de oxígeno de la cadena principal de V409 en la "inserción 2", una interacción conservada en Te3A, pero que no se encuentra en Bgll de T. reesei. Las Figuras 701(a)- 701(b) representan los sitios de glicosilación conservados entre la sec . con núm. de ident. :168f compartidos entre Fv3C, Te3A y una ß-glucosidasa quimérica/híbrida de la sec. con núm. de ident. :135, (a) representa la misma región superpuesta con Te3A (gris oscuro) y Bgll de T. reesei (negro) ; (b) representa la misma región superpuesta con la ß-glucosidasa quimérica/híbrida de la sec. con núm. de ident.:135 (gris claro) , Te3A (gris oscuro) y Bgll de T. reesei (negro) . La flecha negra indica la estructura en bucle de la "inserción 3" en Té3A (presente, además, en la ß-glucosidasa híbrida de la sec. con núm. de ident. :135), que aparentemente ocultaba los glicanos de glicosilación. La Figura 70J representa las partes superpuestas de las estructuras de Fv3C (gris claro) , Te3A (gris oscuro) y Bgll de T. reesei (negro), que indican las interacciones conservadas entre los residuos W386/355 que reaccionan con 95/68 (Fv3C/Te3A) de la "inserción 2" de Fv3C y Te3A. Falta la interacción de Bgll de T. reesei.
Figuras 71A-71C: la Figura 71A representa la cantidad de proteínas no unidas determinadas en la fracción soluble (sobrenadante) después de una incubación a 50 °C durante 44 horas de conformidad con el Ejemplo 13. La Figura 7 IB representa el total de proteína (unida y no unida) en la lechada después de una incubación a 50 °C durante 44 horas de conformidad con el Ejemplo 13. La Figura 71C representa la proteína no unida en la lechada después de 30 min de incubación adicional en regulador de conformidad con el Ejemplo 13.
Descripción Detallada de la Invención Las enzimas se han clasificado tradicionalmente según la especificidad del sustrato y los productos de reacción. En la era pregenómica, la función se consideró como la base más adaptable (y quizás la más útil) para comparar enzimas y ensayos, puesto que diversas actividades enzimáticas se han desarrollado durante muchos años, lo que produjo el esquema de clasificación EC familiar. Las celulasas y otras glicosil hidrolasas, que actúan con enlaces glicosídicos entre dos porciones de carbohidratos (o una porción de carbohidratos y no carbohidratos, como ocurre en los derivados de nitrofenol-glicósidos) , se denominan, según este esquema de clasificación, EC 3.2.1.-, en donde el número final indica el tipo exacto de enlace dividido. Por ejemplo, de conformidad con este esquema una endocelulasa (1, 4^-endoglucanasa) se denomina EC 3.2.1.4.
Con la llegada de los proyectos difundidos de secuenciación del genoma, los datos de secuenciación han facilitado el análisis y comparación de proteínas y genes relacionados. Adicionalmente , un número cada vez mayor de enzimas con la capacidad de actuar sobre porciones de carbohidratos (por ejemplo, carbohidrasas) se han cristalizado y sus estructuras en 3-D se han resuelto. Tales análisis han identificado distintas familias de enzimas con secuencia relacionada, que contienen pliegues tridimensionales conservados que pueden predecirse en base a su secuencia de aminoácidos. Además, se ha demostrado que las enzimas con los mismos pliegues tridimensionales o similares muestran una estereoespecificidad igual o similar de hidrólisis, incluso cuando catalizan diferentes reacciones (Henrissat et al., FEBS Lett 1998, 425(2) : 352-4; Coutinho and Henrissat, Genetics, biochemistry and ecology of cellulose degradation, 1999, T. Kimura. Tokio, Uni Publishers Co : 15-23.) .
Estos hallazgos fundamentan una clasificación en base a las secuencias de los módulos de carbohidrasa, que está disponible en forma de una base de datos en la internet, el servidor Carbohydrate -Active enZYme (CAZy) , en www.cazy.org (ver Cantarel et al., 2009, The Carbohydrate -Active EnZymes datábase (CAZy) : an expert resource for Glycogenomics . Nucleic Acids Res. 37 (publicado en Datábase :D233-38) .
La base de datos CAZy define cuatro clases principales de carbohidrasas distinguibles por el tipo de reacción catalizada: glicosil hidrolasas (GH) , glicosiltransferas'as (GT) , polisacárido liasas (PL) y carbohidrato esterasas (CE) . Las enzimas de la presente descripción son glicosil hidrolasas. Las GH son un grupo de enzimas que hidrolizan el enlace glicosídico entre dos o más carbohidratos, o entre una porción de carbohidratos y una porción de no carbohidratos. Un sistema de clasificación para las glicosil hidrolasas, agrupadas por similitud de secuencias, ha resultado en la definición de más de 120 familias diferentes. Esta clasificación se encuentra disponible en el sitio web de CAZy. Las enzimas de la presente invención pertenecen a la familia de glicosil hidrolasas 3 (GH3) .
Las enzimas GH3 incluyen, por ejemplo, ß-glucosidasa (EC.3.2.1.21) ; ß-xilosidasa (EC : 3.2.1.37) ; N-acetil ß-glucosaminidasa (EC : 3.2.1.52) ; glucano ß- 1 , 3 -glucosidasa (EC:3.2.1.58) ; celodextrinasa (EC : 3.2.1.74 ) ; exo-1, 3-1,4 -glucanasa (EC:3.2.1) y ß-galactosidasa (EC 3.2.1.23). Por ejemplo, las enzimas GH3 pueden ser aquellas que tienen actividad de ß-glucosidasas, ß-xilosidasas , N-acetil ß-glucosaminidasas , glucano ß-l, 3-glucosidasas, celodextrinasas , exo- 1 , 3 -1 , 4 -glucanasas y/o ß-galactosidasas . Generalmente, las enzimas GH3 son proteínas globulares y pueden consistir en dos o más subdominios . Un residuo catalítico se ha identificado como un residuo de aspartato que, en las ß-glucosidasas , se encuentra en el tercio N-terminal del péptido y dentro del fragmento de aminoácidos SDW (Li et al. 2001, Biochem. J. 355:835-840). La secuencia correspondiente en Bgll de T. reesei es T266D267W268 (al contar desde la metionina en la posición de inicio) , en donde el residuo catalítico aspartato es el D267. La secuencia de hidroxilo/aspartato se conserva, además, en las GH3 ß-xilosidasas analizadas. Por ejemplo, la secuencia correspondiente en Bxll de T. reesei es S310D311 y la secuencia correspondiente en Fv3A es S290D291.
Polipéptidos de la invención Celulasas Las composiciones de la presente descripción pueden comprender una o más celulasas. Las celulasas son enzimas que hidrolizan celulosa ^-l,4-glucano o enlaces ß D-glucosídicos) resultantes en la formación de glucosa, celobiosa, celooligosacáridos y similares. Las celulasas se han dividido tradicionalmente en tres clases principales: endoglucanasas (EC 3.2.1.4) ("EG") , exoglucanasas o celobiohidrolasas (EC 3.2.1.91) ("CBH") y ß-glucosidasas (ß -D-glucósido glucohidrolasa; EC 3.2.1.21) ("BG") (Knowles et al., 1987, Trends in Biotechnology 5 (9) : 255-261 ; Shulein, 1988, Methods in Enzymology, 160:234-242) .
Las celulasas para usar de conformidad con los métodos y composiciones de la presente descripción se pueden obtener de, o producir de manera recombinante de, sin limitarse a, uno o más de los siguientes organismos: Chrysosporium lucknowen.se, Crinipellis scapella, Macrophomina phaseolina, Myceliophthora t ermophila, Sordaria fimicola, Volutella colletotrichoides, Thielavia terrestris, Acremonium sp. , Exidia glandulosa, Fomes fomentarius, Spongipellis sp., Rhizophlyctis rosea, Rhizomucor pusillus, Phycomyces niteus, Chaetostylum fresenii , Diplodia gossypina, Ulospora bilgramii , Saccobolus dilutellus, Penicillium verruculosum, Penicillium chrysogenum, Ther omyces verrucosus, Diaporthe syngenesia, Colletotrichum lagenarium, Nigrospora sp. , Xylaria hypoxylon, Nectria pinea, Sordaria macrospora, Thielavia thermophila , Chaeto ium mororum, Chaetomium virscens, Chaetomium brasiliensis, Chaetomium cunicolorum, Syspastospora boninensis, Cladorrhinum foecundissimum, Scytalidium thermophila, Gliocladium catenulatum, Fusarium oxysporum ssp. lycopersici, Fusarium oxysporum ssp. passiflora , Fusarium solani , Fusarium anguioides, Fusarium poae, Humicola nigrescens, Humicola grísea, Panaeolus retirugis, Tra etes sanguínea, Schizophyllum commune, Trichothecium roseum, Microsphaeropsis sp., Acsobolus stictoideus spej . , Poronia punctata, Nodulisporum sp., Trichoderma sp. (por ejemplo, T. reesei) y Cylindrocarpon sp. Además, las celulasas se pueden obtener de, o producir de manera recombinante a partir de una bacteria, o se pueden producir de manera recombinante a partir de una levadura.
Por ejemplo, una celulasa para usar en un método y/o composición de la presente descripción es una celulasa entera y/o tiene la capacidad de alcanzar un producto de fracciones de por lo menos 0.1 (por ejemplo de 0.1 a 0.4) según el ensayo de calcoflúor. ß-glucosidasas La ß-glucosidasa o ß-glucosidasas (o el "polipéptido o polipéptidos de ß-glucosidasas" intercambiables en la presente descripción) catalizan la hidrólisis de residuos terminales no reductores en ß-D-glucósidos con liberación de glucosa. Los ejemplos de polipéptidos de ß-glucosidasas incluyen polipéptidos, fragmentos de polipéptidos, péptidos y polipéptidos de fusión que tienen por lo menos una actividad de un polipéptido de ß-glucosidasas . Los ejemplos de polipéptidos de ß-glucosidasas y ácidos nucleicos incluyen polipéptidos de origen natural (que incluyen, por ejemplo, variantes) y ácidos nucleicos a partir de cualquiera de los organismos de recurso descritos en la presente descripción, y polipéptidos mutantes y ácidos nucleicos derivados de cualquiera de los organismos de recurso descritos en la presente descripción que tienen por lo menos una actividad de un polipéptido de ß-glucosidasas .
Las composiciones de la presente descripción pueden comprender uno o más polipéptidos de ß-glucosidasas . El término "ß-glucosidasa", como se usa en la presente descripción, se refiere a una ß-D-glucósido glucohidrolasa clasificada como EC 3.2.1.21, y/o miembros de la familia de GH 3 que catalizan la hidrólisis de celobiosa para liberar ß-D-glucosa. Las GH3 ß-glucosidasas de la presente invención incluyen, sin limitarse a, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A (también denominada "Bgll de T. reesei" o "Bglul de T. reesei") , Tr3B (también denominada "Bgl3 de T. reesei") , Te3A, An3A (también denominada "Bglu de A. niger ") , Fo3A, Gz3A, Nh3A, Vd3A, Pa3G o polipéptido Tn3B. En algunas modalidades, el polipéptido de GH3 ß -glucosidasas en la presente descripción tiene por lo menos una actividad de un polipéptido de ß-glucosidasas .
Los polipéptidos de ß-glucosidasas adecuados se pueden obtener a partir de varios microorganismos, por medios recombinantes , o se pueden adquirir de fuentes comerciales. Los ejemplos de ß -glucosidasas a partir de microorganismos incluyen, pero no se limitan a, unas a partir de bacterias y hongos. Por ejemplo, una ß-glucosidasa de la presente descripción se puede obtener, adecuadamente, a partir de un hongo filamentoso.
Los polipéptidos de ß-glucosidasas se pueden obtener, o producir de manera recombinante , a partir de, entre otros, A. aculeatus (Ka aguchi et al. Gene 1996, 173: 287-288), A. kawachi (Iwashita et al. Appl . Environ. Microbiol . 1999, 65: 5546-5553) , A. oryzae (patente núm. WO 2002/095014) , C. biazotea ( ong et al. Gene, 1998, 207:79-86)·, P. funic losum (patente núm. WO 2004/078919), S. fibuligera (Machida et al. Appl. Environ. Microbiol. 1988, 54: 3147-3155), S. pombe (Wood et al. Nature 2002, 415: 871-880), T. reesei (por ejemplo, ß-glucosidasa 1 (patente de los Estados Unidos núm. 6,022,725), ß-glucosidasa 3 (patente de los Estados Unidos núm. 6,982,159), ß- glucosidasa 4 (patente de los Estados Unidos núm. 7,045,332), ß-glucosidasa 5 (patente de los Estados Unidos núm. 7,005,289), ß-glucosidasa 6 (publicación de los Estados Unidos núm. 20060258554) , ß-glucosidasa 7 (publicación de los Estados Unidos núm. 20060258554) ) , P. anserina (por ejemplo, Pa3D) , F. verticillioides (por ejemplo, Fv3G, Fv3D o Fv3C) , T. reesei (por ejemplo, Tr3A o Tr3B) , T. emersonii (por ejemplo, Te3A) , A. niger (por ejemplo, An3A) , F. oxysporum (por ejemplo, Fo3A) , G. zeae (por ejemplo, Gz3A) , N. haematococca (por ejemplo, Nh3A) , V. dahliae (por ejemplo, Vd3A) , P. anserine (por ejemplo, Pa3G) o T. neapolitana (por ejemplo, Tn3B) .
El polipéptido de ß-glucosidasas se puede producir al expresar un gen endógeno/exógeno que codifica una ß-glucosidasa, una variante, un híbrido/quimérico/de fusión, o un mutante . Por ejemplo, los polipéptidos de ß-glucosidasas se pueden secretar en el espacio extracelular , por ejemplo, por organismos gram positivo, tales como Bacillus o Actinomycetes , o por huéspedes eucariotas, tales como hongos, (por ejemplo, Trichoderma, Chrysosporium, Aspergillus , Saccharomyces , Pichia) . Los polipéptidos de ß-glucosidasas se pueden expresar en una levadura, tal como Saccharomyces cerevisiae . El polipéptido de ß-glucosidasas se puede sobreexpresar o subexpresar.
El polipéptido de ß-glucosidasas se puede obtener, además, a partir de fuentes comerciales. Los ejemplos de preparación adecuada de ß-glucosidasas comerciales para usar en la presente descripció incluyen, por ejemplo, ß-glucosidasa de T. reesei en BG Accellerase® (Danisco US Inc., Genencor) ; NOVOZYM™ 188 (una ß-glucosidasa de A. niger) ; ß-glucosidasa de Agrobacterium r sp. ? ß-glucosidasa de T. marítima a partir de Megazyme (Megazyrae International Ireland Ltd., Irlanda.).
Además, el polipéptido de ß -glucosidasas puede ser un componente de una composición de celulasa, una composición de celulasas de células enteras, un caldo de fermentación de celulasas o una composición de celulasas enteras de formulación de caldo.
La actividad de las ß-glucosidasas se puede determinar mediante varios medios adecuados conocidos en la técnica, que incluyen, en un ejemplo no limitante, el ensayo descrito por Chen et al., en Biochimica et Biophysica Acta 1992, 121:54-60, en donde 1 pNPG indica 1 µp? de nitrofenol liberado de 4-nitrofenil- ß-D-glucopiranosido en 10 min a 50 0 C y un pH de 4.8.
Los polipéptidos de ß-glucosidasas constituyen, adecuadamente, de aproximadamente 0 % en peso a aproximadamente 75 % en peso del peso total de enzimas en una composición de celulasa de la presente invención. La relación de cualquier par de enzimas con relación unas con otras se puede calcular fácilmente en base a la presente descripción. Se contempla las composiciones de celulasa que comprenden enzimas en cualquier relación de peso derivable de los porcentajes en peso descritos en la presente descripción. El contenido de ß-glucosidasas puede estar en el intervalo en donde el límite inferior es de aproximadamente 0 % en peso, 1 % en peso, 2 % en peso, 3 % en peso, 4 % en peso, 5 % en peso, 6 % en peso 7 % en peso, 8 % en peso, 9 % en peso, 10 % en peso, 12 % en peso, 15 % en peso, 17 %, 20 % en peso, 25 % en peso, 30 % en peso, 40 % en peso, 45 % en peso o 50 % en peso del peso total de enzimas en la composición de celulasa, y el límite superior es de aproximadamente 10 % en peso, 12 % en peso, 15 % en peso, 17 % en peso, 20 % en peso, 25 % en peso, 30 % en peso, 35 % en peso, 40 % en peso, 50 % en peso, 55 % en peso, 60 % en peso, 65 % en peso o 70 % en peso del peso total de enzimas en la composición de celulasa. Por ejemplo, la ß -glucosidasa o ß-glucosidasas representan, adecuadamente, de aproximadamente 0.1 % en peso a aproximadamente 40 % en peso, de aproximadamente 1 % en peso a aproximadamente 35 % en peso, de aproximadamente 2 % en peso a aproximadamente 30 % en peso; de aproximadamente 5 % en peso a aproximadamente 25 % en peso, de aproximadamente 7 % en peso a aproximadamente 20 % en peso, de aproximadamente 9 % en peso a aproximadamente 17 % en peso, de aproximadamente 10 % en peso a aproximadamente 20 % en peso o de aproximadamente 5 % en peso a aproximadamente 10 % en peso del peso total de enzimas en la composición de celulasa.
Polipéptidos de ß-glucosidasas mutantes: la presente descripción permite polipéptidos de ß-glucosidasas mutantes. Los polipéptidos de ß-glucosidasas mutantes incluyen aquellos en donde uno o más residuos de aminoácidos han experimentado una sustitución de aminoácidos mientras retienen la actividad de ß-glucosidasas (por ejemplo, la capacidad de catalizar la hidrólisis de residuos terminales no reductores en ß-D-glucósidos con liberación de glucosa) . Como tales, los polipéptidos de ß-glucosidasas mutantes constituyen un tipo particular de "polipéptidos de ß-glucosidasas", tal como se define el término en la presente descripción. Los polipéptidos de ß-glucosidasas mutantes se pueden producir al sustituir uno o más aminoácidos en la secuencia de aminoácidos natural o silvestre del polipéptido. En algunos aspectos, la presente invención incluye polipéptidos que comprenden secuencias de aminoácidos alteradas en comparación con una secuencia de aminoácidos de enzimas precursoras, en donde la enzima mutante retiene la naturaleza celulótica característica de la enzima precursora pero puede tener propiedades alteradas en algunos aspectos específicos, por ejemplo, un grado óptimo de pH aumentado o reducido, una estabilidad oxidativa aumentada o reducida; una estabilidad térmica aumentada o reducida y un nivel aumentado o reducido de actividad específica hacia uno o más sustratos, en comparación con la enzima precursora. Las instrucciones para determinar cuáles residuos de aminoácidos se pueden sustituir, insertar o eliminar sin afectar la actividad biológica se pueden encontrar con el uso de programas informáticos conocidos en la técnica, por ejemplo, el programa LASERGENE (DNASTAR) . Las sustituciones de aminoácidos pueden ser conservadoras o no conservadoras y tales residuos de aminoácidos sustituidos pueden o no estar codificados por el código genético. Las sustituciones de aminoácidos pueden estar ubicadas en los módulos de unión a carbohidratos (CBM, por sus siglas en inglés) del polipéptido, en los dominios catalíticos (CD, por sus siglas en inglés) del polipéptido y/o tanto en CBM como en CD. El "alfabeto" de veinte aminoácidos estándar se ha dividido en familias químicas según la similitud de sus cadenas laterales. Esas familias incluyen aminoácidos con cadenas laterales básicas (por ejemplo, lisina, arginina, histidina) , cadenas laterales acídicas (por ejemplo, ácido aspártico, ácido glutámico) , cadenas laterales polares sin carga (por ejemplo, glicina, asparagina, glutamina, serina, treonina, tirosina, cisteína) , cadenas laterales no polares (por ejemplo, alanina, valina, leucina, isoleucina, prolina, fenilalanina, metionina, triptófano) , cadenas laterales beta-ramificadas (por ejemplo, treonina, valina, isoleucina) y cadenas laterales aromáticas (por ejemplo, tirosina, fenilalanina, triptófano, histidina) . Una "sustitución conservadora de' aminoácidos" es cuando el residuo de aminoácidos se reemplaza con un residuo de aminoácidos que tiene una cadena lateral químicamente similar (por ejemplo, al reemplazar un aminoácido que tiene una cadena lateral básica con otro aminoácido que tiene una cadena lateral básica) . Una "sustitución no conservadora de aminoácidos" es cuando el residuo de aminoácidos se reemplaza con un residuo de aminoácidos que tiene una cadena lateral químicamente diferente (por ejemplo, al reemplazar un aminoácido que tiene una cadena lateral básica con otro aminoácido que tiene una cadena lateral aromática) .
Polipéptidos quiméricos : La presente descripción proporciona, además, proteínas híbridas/de fusión/quiméricas que incluyen un dominio de una proteína de la presente descripción unido a uno o más segmentos de fusión, que son, típicamente, heterólogos a la proteína (por ejemplo, que se deriva de una fuente diferente a la proteína de la presente descripción) . Tales enzimas híbridas/de fusión/quiméricas pueden considerarse, además, como un tipo de ß-glucosidasa mutante porque varían en secuencia en comparación con la ß-glucosidasa silvestre de referencia, pero retienen la actividad de ß -glucosidasas, aunque tienen otras propiedades distintas a la ß-glucosidasa natural o silvestre de referencia. Los segmentos quiméricos adecuados incluyen, pero no se limitan a, segmentos que pueden mejorar la estabilidad de una proteína, proporcionar otra actividad biológica deseada o niveles mejorados de actividad biológica deseable y/o facilitar la purificación de la proteína (por ejemplo, por cromatografía de afinidad) . Un segmento quimérico adecuado puede ser un dominio de cualquier tamaño que tiene la función deseada (por ejemplo, confiere mayor estabilidad, solubilidad, acción o actividad biológica; y/o simplifica la purificación de una proteína) . Una proteína quimérica de la presente invención se puede construir a partir de dos o más segmentos quiméricos, de los cuales cada uno o por lo menos dos se derivan de una fuente o microorganismo diferente. Los segmentos quiméricos se pueden unir a un término amino y/o carboxilo del dominio o dominios de una proteína de la presente descripción. Los segmentos quiméricos pueden ser susceptibles al clivaje. Puede ser favorable que haya susceptibilidad, por ejemplo, puede facilitar la recuperación directa de la proteína de interés. Las proteínas quiméricas se producen, preferentemente, al cultivar una célula recombinante transfectada con un ácido nucleico quimérico que codifica una proteína, que incluye un segmento quimérico unido al extremo terminal carboxilo o amino, o segmentos quiméricos unidos tanto al extremo terminal carboxilo como al amino, de una proteína, o un dominio de esta.
Consecuentemente, los polipéptidos de ß-glucosidasas de la presente descripción incluyen, además, productos de expresión de fusiones de genes (por ejemplo, una forma sobreexpresada , soluble y activa de una proteína recombinante) , de genes mutagenizados {por ejemplo, genes que tienen modificaciones de codones para mejorar la transcripción y traducción de genes) y de genes truncados [por ejemplo, genes que tienen secuencias señal eliminadas o sustituidas con una secuencia señal heteróloga) .
Las glicosil hidrolasas que usan sustratos insolubles son, frecuentemente, enzimas modulares. Usualmente, comprenden módulos catalíticos unidos a uno o más módulos de unión a carbohidratos (CBM, por sus siglas en inglés) no catalíticos. En la naturaleza, se cree que los CBM promueven la interacción de las glicosil hidrolasas con su polisacárido de sustrato objetivo. Por lo tanto, la presente descripción proporciona enzimas quiméricas que tienen una especificidad del sustrato alterada, que incluye, por ejemplo, enzimas quiméricas que tienen múltiples sustratos como resultado de CBM heterólogos "empalmados". Los CBM heterólogos de las enzimas quiméricas de la presente descripción se pueden diseñar, además, para ser modulares, de manera que se unan a un módulo catalítico o dominio catalítico (un "CD", por ejemplo, en un sitio activo), que, además, puede ser heterólogo u homólogo para la glicosil hidrolasa.
Por lo tanto, la presente descripción proporciona péptidos y polipéptidos que consisten en, o que comprenden, módulos CBM/CD, que se pueden parear o unir de manera homologa para formar pares quiméricos (heterólogos) de CBM/CD. Por lo tanto, estos polipéptidos/péptidos quiméricos se pueden usar para mejorar o alterar el rendimiento de una enzima de interés. Consecuentemente, en algunos aspectos, la presente descripción proporciona enzimas quiméricas que comprenden, por ejemplo, por lo menos un CBM de una enzima, si está disponible, de la sec. con núm. de ident . :2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 43, 44, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 o 79. Un polipéptido de la presente descripción, por ejemplo, incluye una secuencia de aminoácidos que comprende el CD y/o el CBM de la secuencia de polipéptidos de la sec . con núm. de ident. :2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 43, 44, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 o 79. Por lo tanto, el polipéptido de la presente descripción puede ser, adecuadamente, una proteína de fusión que comprende dominios funcionales de dos o más proteínas diferentes (por ejemplo, un CBM de una proteína unida a un CD de otra proteína) .
La presente descripción proporciona, además, una composición de celulasa que no es de origen natural que comprende un polipéptido de ß-glucosidasa, que es una quimera de por lo menos dos secuencias de ß -glucosidasas . En algunos aspectos, la composición de celulasa que no es de origen natural comprende actividad de ß-glucosidasas . La composición puede comprender, además, uno o más de actividad de xilanasas, ß-xdlosidasas y/o L- -arabinofuranosidasas Por lo tanto, la composición es una composición de hemicelulasas . En algunos aspectos, la composición de celulasa/hemicelulasa que no es de origen natural comprende componentes enzimáticos o polipéptidos que se derivan de por lo menos dos fuentes diferentes. En algunos aspectos, la composición de celulasa/hemicelulasa que no es de origen natural comprende una o más hemicelulasas de origen natural .
En algunos aspectos, los polipéptidos de ß-glucosidasa en la composición comprenden, además, uno o más sitios de glicosilación . En algunos aspectos, el polipéptido de ß-glucosidasa comprende una secuencia N-terminal y una secuencia C-terminal, en donde la secuencia N-terminal o la secuencia C-terminal puede comprender. una o más subsecuencias derivadas de diferentes ß-glucosidasas . En ciertos aspectos, las secuencias N-terminal y C-terminal se derivan de distintas fuentes. En algunas modalidades, por lo menos dos de las subsecuencias de las secuencias N-terminal y C-terminal se derivan de distintas f entes. En algunos aspectos, ya se la secuencia N-terminal o la secuencia C-terminal comprende, además, una secuencia en la región de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud. En ciertas modalidades, la secuencia N-terminal y la secuencia C-terminal se encuentran inmediatamente adyacente o directamente conectadas. En otras modalidades, las secuencias N-terminal y C-terminal no se encuentran inmediatamente adyacentes, más bien, están conectadas funcionalmente por medio de un dominio conector. El dominio conector puede estar ubicado en la posición central (por ejemplo, ni en el extremo N-terminal ni en el C-terminal) del polipéptido quimérico. En ciertas modalidades, ni la secuencia N-terminal ni la secuencia C-terminal del polipéptido híbrido comprende una secuencia de bucle. En su lugar, el dominio conector comprende la secuencia de bucle. En algunos aspectos, la secuencia N-terminal comprende una primera secuencia de aminoácidos de una ß-glucosidasa o una variante de esta de por lo menos aproximadamente 200 (por ejemplo, aproximadamente 200, 250, 300, 350, 400, 450, 500, 550 o 600) residuos de longitud. En algunos aspectos, la secuencia N-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representados por las sec. con núms . de ident .: 136-148. En algunos aspectos, la secuencia C-terminal comprende una segunda secuencia de aminoácidos de una ß -glucosidasa o una variante de esta de por lo menos aproximadamente 50 (por ejemplo, aproximadamente 50, 75, 100, 125, 150, 175 o 200) residuos de aminoácidos de longitud. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representados por las sec. con núms. de ident .: 149 - 156. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) de los motivos de las secuencias de aminoácidos de las sec. con núms. de ident. : 164-169, y la segunda de las dos o más secuencias de ß-glucosidasa tiene por lo menos 50 residuos de aminoácidos de longitud y comprende la sec . con núm. de ident.:170. En algunos aspectos, ya sea la secuencia C-terminal o la secuencia N-terminal comprende una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos, y una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident . :172) . En algunos aspectos, ni la secuencia C-terminal ni la secuencia N-terminal comprende una secuencia de bucle. En algunas modalidades, la secuencia C-terminal y la secuencia N-terminal se conectan por medio de un dominio conector que comprende una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos, y una secuencia de FDRRSPG (sec. con núm. de ident.: 171) o de FD (R/K) YNIT (sec. con núm. de ident.: 172). En algunos aspectos, el polipéptido o polipéptidos de ß-glucosidasa en la composición de celulasa o hemicelulasa que no es de origen natural tienen una estabilidad mejorada en cualquiera de las enzimas naturales de donde se deriva cada secuencia C-terminal y/o N-terminal del polipéptido quimérico. En algunos aspectos, la estabilidad mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución asociada en el índice o alcance de la pérdida de actividad enzimática durante el almacenamiento o condiciones de producción, en donde la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 30 % o menor que aproximadamente 20 %, con mayor preferencia, menor que 15 %, o menor que 10 %.
Los polipéptidos de la presente descripción se pueden obtener y/o usar, adecuadamente, en forma "sustancialmente pura". Por ejemplo, un polipéptido de la presente descripción constituye por lo menos aproximadamente 80 % en peso (por ejemplo, por lo menos aproximadamente 85 % en peso, 90 % en peso, 91 % en peso , 92 % en peso, 93 % en peso, 94 % en peso, 95 % en peso, 96 % en peso, 97 % en peso, 98 % en peso o 99 % en peso) del total de proteína en una composición específica, que incluye , además, otros ingredientes tales como un regulador o una solución.
Caldos de fermentación. Adicionalmente , los polipéptidos de la presente descripción se pueden obtener y/o usar, adecuadamente, en caldos de fermentación (por ejemplo, un caldo de cultivo fúngico filamentoso) . Los caldos de fermentación pueden ser una composición enzimática modificada, por ejemplo, el caldo de fermentación puede estar producido por una célula huésped recombinante modificada para expresar un polipéptido heterólogo de interés, o por una célula huésped recombinante modificada para expresar un polipéptido endógeno de la presente descripción en cantidades mayores o menores que los niveles de expresión endógena (por ejemplo, en una cantidad de aproximadamente 1-, 2-, 3-, 4-, 5- veces o más -mayor o menor que los niveles de expresión endógena) . Los caldos de fermentación de la presente invención pueden estar producidos, además, por ciertas cepas de células huésped "integradas" modificadas para expresar una pluralidad de los polipéptidos de la presente descripción en las proporciones deseadas. Uno o más o todos los genes que codifican los polipéptidos de interés se pueden integrar en los materiales genéticos de la cepa de células huésped, por ejemplo.
Fv3C La secuencia de aminoácidos de Fv3C (sec. con núm. de ident.:60) se muestra en las Figuras 32B y 43A-1 a 43B-3. La sec. con núm. de ident . 60 es la secuencia del inmaduro Fv3C. Fv3C tiene una secuencia señal prevista correspondiente a las posiciones 1 a la 19 de la sec. con núm. de ident. :60 (subrayada) ; se predice el clivaje de la secuencia señal para producir una proteína madura que tiene una secuencia correspondiente a las posiciones 20 a la 899 de la sec. con núm. de ident. :60. Las predicciones de las secuencias señal se llevaron a cabo con el algoritmo de SignalP- . El dominio conservado previsto se presenta en negrita en la Figura 32B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI . Se prevé que los residuos de Fv3C, E536 y D307 funcionan como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas GH3 de, por ejemplo, P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473) , F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. mencionadas anteriormente (ver la Figura 43). Como se usa en la presente descripción, "un polipéptido Fv3C" se refiere, en algunos aspectos, a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750 u 800 residuos de aminoácidos contiguos entre los residuos 20 al 899 de la sec . con núm. de ident.:60. Un polipéptido Fv3C se encuentra, preferentemente, inalterado, en comparación con un Fv3C natural, en los residuos E536 y D307. Un polipéptido Fv3C se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descritas en la presente descripción, tal como se muestra en el alineamiento de las Figuras 43A-1 a 43B-3. Un polipéptido Fv3C comprende, adecuadamente, los dominios completos conservados previstos del Fv3C natural que se muestra en la Figura 32B. Un polipéptido Fv3C ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Fv3C maduro que se muestra en la Figura 32B. El polipéptido Fv3C de la presente invención tiene, preferentemente, actividad de ß-glucosidasas .
Consecuentemente, un polipéptido Fv3C de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident. :60, o con los residuos (i) 20-327, (ii) 22-600, (iii) 20-899, (iv) 428-899, o (v) 428-660 de la sec. con núm. de ident. :60. El polipéptido tiene, adecuadamente, actividad de ß-glucosidasa .
En algunos aspectos, un "polipéptido Fv3C" de la presente invención puede referirse a un polipéptido Fv3C mutante . Las sustituciones de aminoácidos se pueden introducir en el polipéptido Fv3C para mejorar la actividad de ß-glucosidasas y/o la estabilidad de la molécula. Por ejemplo, las sustituciones de aminoácidos que aumentan la afinidad de unión del polipéptido Fv3C para su sustrato o que mejoran capacidad de Fv3C para catalizar la hidrólisis de residuos terminales no reductores en ß-D-glucósidos se pueden introducir en el polipéptido. En algunos aspectos, los polipéptidos Fv3C mutantes comprenden una o más sustituciones conservadoras de aminoácidos. En algunos aspectos, los polipéptidos Fv3C mutantes comprenden una o más sustituciones no conservadoras de aminoácidos. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CD del polipéptido Fv3C. O la sustitución o sustituciones de aminoácidos se encuentran en el CB del polipéptido Fv3C. La sustitución o sustituciones de aminoácidos pueden encontrarse tanto en el CD como en el CBM. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Fv3C se pueden llevar a cabo en los aminoácidos E536 y/o D307. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Fv3C se pueden llevar a cabo en uno o más o todos los aminoácidos D119, R125, L168, R183, K216, H217, R227, M272, Y275, D307, 308, S477 y/o E536. El polipéptido o polipéptidos Fv3C mutantes tienen, adecuadamente, actividad de ß-glucosidasas .
En algunos aspectos, el polipéptido Fv3C comprende una quimera/fusión/híbrido o un constructo quimérico de dos secuencias de ß-glucosidasas , en donde la primera secuencia se deriva de una primera ß-glucosidasa , tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud, y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad con una secuencia de la misma longitud de Fv3C (sec. con núm. de ident . : 60) , y en donde la segunda secuencia se deriva de una segunda ß-glucosidasa, tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud, y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident. : 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende el motivo de la secuencia de aminoácidos de la sec. con núm. de ident. : 170. En algunos aspectos, la primera secuencia de ß-glucosidasas comprende una secuencia N- terminal de por lo menos aproximadamente 200 residuos de aminoácidos contiguos de la sec. con núm. de ident. :60, y la segunda secuencia de ß-glucosidasas comprende una secuencia C-terminal de por lo menos aproximadamente 50 residuos de aminoácidos contiguos de cualquiera de las sec. con núms. de ident. :54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende el motivo de la secuencia de aminoácidos de la sec. con núm. de ident.: 170.
En ciertos aspectos, el polipéptido Fv3C puede ser una quimera/híbrido/fusión o un constructo quimérico de dos secuencias de ß-glucosidasas , en donde la primera secuencia se deriva de una primera ß-glucosidasa, tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud, y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad con una secuencia de la misma longitud de cualquiera de las sec. con núms. de ident.:54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de aminoácidos de las sec. con núms. de ident.: 164-169, en donde la segunda secuencia se deriva de una segunda ß-glucosidasa, tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud, y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad con una secuencia de la misma longitud de Fv3C (sec. con núm. de ident.: 60) . En algunos aspectos, la primera secuencia de ß-glucosidasas comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos contiguos de las sec. con núms. de ident. :54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 o 79, o comprende uno o más o todos los motivos de las secuencias de aminoácidos de las sec. con núms. de ident. : 164-169 y la segunda secuencia de ß-glucosidasas comprende una secuencia C-terminal de por lo menos aproximadamente 50 residuos de aminoácidos contiguos de la sec. con núm. de ident.: 60.
En algunos aspectos, la primera secuencia de ß-glucosidasa se localiza en el extremo N-terminal del polipéptido quimérico de ß-glucosidasa, mientras que la segunda secuencia de ß-glucosidasa se encuentra en el extremo C-terminal del polipéptido quimérico de ß-glucosidasa . En algunas modalidades, la primera, la segunda o ambas secuencias de ß-glucosidasas comprenden, además, uno o más sitios de glicosilación. En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasa se encuentran inmediatamente adyacentes entre sí o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasas no se encuentran inmediatamente adyacentes pero se conectan por medio de un dominio conector. En algunos aspectos, la primera o la segunda secuencia de ß-glucosidasas comprende una región en bucle o una secuencia que representa una estructura tipo bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En algunos aspectos, ni la primera ni la segunda secuencia de ß-glucosidasa comprende una secuencia de bucle. En algunas modalidades, el dominio conector comprende una región en bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172) . En algunas modalidades, el dominio conector que conecta la primera secuencia de ß-glucosidasa y la segunda secuencia de ß-glucosidasa se localiza en la región central (es decir, no se encuentra en el extremo N-terminal ni C-terminal del polipéptido quimérico) . En algunos aspectos, la secuencia N-terminal de la ß-glucosidasa quimérica comprende una secuencia de por lo menos 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de longitud derivados de un polipéptido Fv3C o una variante de este. En algunos aspectos, la secuencia N-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representados por las sec . con núms . de ident. : 136-148. En algunos aspectos, la secuencia C-terminal comprende una secuencia de por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos de longitud derivados de un polipéptido de ß-glucosidasa o una variante de este. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representados por las sec. con núms. de ident .: 149-156. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) de los motivos de las secuencias de aminoácidos de las sec. con núms. de ident. : 164-169, y la segunda de las dos o más secuencias de ß-glucosidasa tiene por lo menos 50 residuos de aminoácidos de longitud y comprende la sec. con núm. de ident.: 170. En ciertas modalidades, el polipéptido de ß-glucosidasa, la variante de este, o el híbrido/quimera de este comprende, además, uno o más sitios de glicosilación . El sitio o sitios de glicosilación pueden estar dentro de la secuencia C-terminal , dentro de la secuencia N-terminal o dentro de ambas.
En algunos aspectos, la composición de celulasa o hemicelulasa que no es de origen natural de la presente invención comprende, además, una o más hemicelulasas de origen natural. En algunos aspectos, la composición de celulasa que no es de origen natural tiene una estabilidad mejorada en comparación con las enzimas naturales, que incluyen Fv3C, de donde se deriva la secuencia C-terminal o N-terminal de la ß-glucosidasa quimérica. En algunos aspectos, la estabilidad mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución asociada en el índice o alcance de la pérdida de actividad enzimática durante el almacenamiento o condiciones de producción, en donde el índice o alcance de la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 20 %, con mayor preferencia, menor que aproximadamente 15 % o, aún con mayor preferencia, menor que aproximadamente 10 %. En algunos aspectos, el polipéptido de ß -glucosidasa es una enzima quimérica o de fusión que comprende una secuencia de un polipéptido Fv3C unido operativamente a una secuencia de un Bgl3 de T. reesei. En ciertas modalidades, el polipéptido de ß-glucosidasa comprende una secuencia N-terminal que se deriva de un polipéptido Fv3C y una secuencia C-terminal que se deriva de un polipéptido Bgl3 de T. reesei. En algunos aspectos, la secuencia N-terminal o la secuencia C-terminal puede comprender una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident . :172) . Las secuencias en el extremo N-terminal y C-terminal pueden estar inmediatamente adyacentes o directamente conectadas entre sí. En otros aspectos, la secuencia N-terminal y la secuencia C-terminal pueden estar conectadas por medio de un dominio conector. En ciertas modalidades, el dominio conector comprende una secuencia de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident. :171) o de FD (R/K) YNIT (sec. con núm. de ident. :172) . En algunos aspectos, la composición de celulasa que no es de origen natural comprende actividad de ß -glucosidasas . La composición de celulasa que no es de origen natural puede comprender, además, una o más de las actividades de xilanasas, ß-xilosidasas y/o L-a-arabinofuranosidasas .
Pa3D La secuencia de aminoácidos de Pa3D (sec. con núm. de ident. :54) se muestra en las Figuras. 29B y 43A-1 a 43B-3. La sec. con núm. de ident. 54 es la secuencia del inmaduro Pa3D.
Pa3D tiene una secuencia señal prevista correspondiente a los residuos 1 al 17 de la sec . con núm. de ident. :2 (subrayada); se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a los residuos 18 al 733 de la sec. con núm. de ident.:54. Las predicciones de secuencias señal para este y otros polipéptidos de la presente descripción se llevaron a cabo con el algoritmo SignalP-NN (www. cbs.dtu.dk) . El dominio conservado previsto aparece en negrita en la Figura 29B. Las predicciones de dominios para este y otros polipéptidos de la presente descripción se llevaron a cabo en base a la base de datos Pfam, SMART o NCBI. Se prevé que los residuos de Pa3D E463 y D262 funcionan como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de varias ß-glucosidasas de la familia GH3 de, por ejemplo, P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473) , F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. (ver las Figuras 43A-1 a 43B-3) . Como se usa en la presente descripción, "un polipéptido Pa3D" se refiere, en algunos aspectos, a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650 o 700 residuos de aminoácidos contiguos entre los residuos 18 al 733 de la sec . con núm. de ident.:54. Un polipéptido Pa3D se encuentra, preferentemente, inalterado, en comparación con un Pa3D natural, en los residuos E463 y D262. Un polipéptido Pa3D se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descritas en la presente descripción tal como se muestra en el alineamiento de las Figuras 43A-1 a 43B-3. Un polipéptido Pa3D comprende, adecuadamente, los dominios completos conservados previstos del Pa3D natural que se muestra en la Figura 29B. Un polipéptido Pa3D ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Pa3D maduro que se muestra en la Figura 29B. El polipéptido Pa3D de la presente invención tiene, preferentemente, actividad de ß-glucosidasas .
Consecuentemente, un polipéptido Pa3D de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident.:54, o con los residuos (i) 18-282, (ii) 18-601, (iii) 18-733, (iv) 356-601, o (v) 356-733 de la sec. con núm. de ident . : 54. El polipéptido tiene, adecuadamente, actividad de ß-glucosidasa .
Un "polipéptido Pa3D" de la presente invención se puede referir, además, a un polipéptido . Pa3D mutante. Las sustituciones de aminoácidos se pueden introducir en el polipéptido Pa3D para mejorar la actividad de ß-glucosidasas y/o otras propiedades. Por ejemplo, las sustituciones de aminoácidos que aumentan la afinidad de unión del polipéptido Pa3D para su sustrato o que mejoran la capacidad de Pa3D para catalizar la hidrólisis de residuos terminales no reductores en ß-D-glucósidos pueden introducirse. En algunos aspectos, los polipéptidos Pa3D mutantes comprenden una o más sustituciones conservadoras de aminoácidos. O los polipéptidos Pa3D mutantes pueden comprender una o más sustituciones no conservadoras de aminoácidos. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CD del polipéptido Pa3D. 0 la sustitución o sustituciones de aminoácidos se encuentran en el CBM del polipéptido Pa3D. La sustitución o sustituciones de aminoácidos pueden encontrarse tanto en el CD como en el CBM. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Pa3D se pueden llevar a cabo en los aminoácidos E463 y/o D262. Las sustituciones de aminoácidos del polipéptido Pa3D se pueden llevar a cabo en uno o más o todos los aminoácidos D87, R93, L136, R151, K184, H185, R195, M227, Y230, D262, 263, S406 y/o E463. El polipéptido o polipéptidos Pa3D mutantes tienen, adecuadamente, actividad de ß-glucosidasas .
En algunos aspectos, el polipéptido Pa3D puede ser una quimera/híbrido/fusión de dos secuencias de ß-glucosidasas, en donde la primera secuencia se deriva de una primera ß-glucosidasa, tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud, y comprende aproximadamente 60 % (por ejemplo, aproximadamente 60 %, 65 %, 70 %, 75 ¾ u 80 I) o más de identidad con una secuencia de la misma longitud de Pa3D (sec. con núm. de ident . : 54) y en donde la segunda secuencia se deriva de una segunda ß-glucosidasa, tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y tiene aproximadamente 60 %, 70 %, 75 %, 80 % o más de identidad con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident.: 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende un motivo de la secuencia de aminoácidos de la sec. con núm. de ident.: 170. En algunos aspectos, la primera secuencia de ß-glucosidasas comprende una secuencia N-terminal de por lo menos aproximadamente 200 residuos de aminoácidos contiguos de la sec. con núm. de ident. : 54 y la segunda secuencia de ß-glucosidasas comprende una secuencia C-terminal de por lo menos aproximadamente 50 residuos de aminoácidos contiguos de cualquiera de las sec. con núms. de ident . : 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende un motivo de la secuencia de aminoácidos de la sec. con núm. de ident. :170.
En algunos aspectos, el polipéptido Pa3D de la presente invención comprende una quimera/híbrido/fusión o un constructo quimérico de secuencias de ß-glucosidasas , en donde la primera secuencia es de una primera ß-glucosidasa, tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y tiene aproximadamente 60 % (por ejemplo, 60 %, 65 %, 70 %, 75 % u 80 %) o más de identidad con una secuencia de la misma longitud de cualquiera de las sec. con núms. de ident.: 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de aminoácidos de las sec. con núms. de ident.: 164-169 y la segunda secuencia es de una segunda ß-glucosidasa, tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y tiene aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad con una secuencia de la misma longitud de Pa3D (sec. con núm. de ident. :54). Por ejemplo, la primera secuencia de ß-glucosidasas comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos contiguos de las sec. con núms. de ident.: 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 o 79, o comprende uno o más o todos los motivos de las secuencias de aminoácidos de las sec. con núms . de ident . : 164-169 y la segunda secuencia de ß-glucosidasas comprende una secuencia C-terminal de por lo menos 50 residuos de aminoácidos contiguos de la sec. con núm. de ident .: 54.
En algunos aspectos, la primera secuencia de ß-glucosidasa se localiza en el extremo N-terminal del polipéptido quimérico de ß-glucosidasa, mientras que la segunda secuencia de ß-glucosidasa se encuentra en el extremo C-terminal del polipéptido quimérico de ß-glucosidasa . En ciertas modalidades, la primera, la segunda o ambas secuencias de ß-glucosidasa comprenden, además, uno o más sitios de glicosilación . En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasa se encuentran inmediatamente adyacentes entre sí o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasa no se encuentran inmediatamente adyacentes pero se conectan por medio de un dominio conector. En algunos aspectos, la primera o la segunda secuencia de ß-glucosidasa comprende una región en bucle o una secuencia que representa una estructura tipo bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident. :171) o de FD (R/K) YNIT (sec. con núm. de ident. :172) . En algunos aspectos, ni la primera ni la segunda secuencia de ß-glucosidasa comprende una secuencia de bucle.
En algunas modalidades, el dominio conector comprende una región en bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) Y IT (sec. con núm. de ident.:172). En algunas modalidades, el dominio conector que conecta la primera secuencia de ß-glucosidasa y la segunda secuencia de ß-glucosidasa se localiza en la región central (es decir, no se encuentra en el extremo N-terminal ni C-terminal del polipéptido quimérico) . En algunos aspectos, la secuencia N-terminal de la ß-glucosidasa quimérica comprende una secuencia de por lo menos 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de longitud derivados de un polipéptido Pa3D o una variante de este. En algunos aspectos, la secuencia N-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos que representan las sec. con núms . de ident. : 136-148 o, preferentemente, uno o más o todos los motivos secuenciales de las sec. con núms. de ident.: 164-169. En algunos aspectos, la secuencia C-terminal comprende una secuencia de por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos de longitud derivados de un polipéptido de ß-glucosidasa o una variante de este. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos que representan las sec. con núms. de ident .: 149-156 o, preferentemente, un motivo de la secuencia de polipéptidos de la sec . con núm. de ident.:170. En ciertas modalidades, el polipéptido de ß-glucosidasa, la variante de este, o el híbrido o quimérico de este, comprende, además, uno o más sitios de glicosilación . El sitio o sitios de glicosilación pueden encontrarse dentro de la secuencia C-terminal o dentro de la secuencia N-terminal, o dentro de ambas.
En algunos aspectos, la composición de celulasa o hemicelulasa que no es de origen natural de la presente invención comprende, además, una o más hemicelulasas de origen natural. En algunos aspectos, la composición de celulasa que no es de origen natural tiene una estabilidad mejorada en comparación con las enzimas naturales, que incluyen Pa3D, de donde se deriva la secuencia C-terminal o N-terminal de la ß-glucosidasa quimérica. En algunos aspectos, la estabilidad mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución asociada en el índice o alcance de pérdida de actividad enzimática durante el almacenamiento o las condiciones de producción, en donde la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 20 %, con mayor preferencia, menor que aproximadamente 15 % o, aún con mayor preferencia, menor que aproximadamente 10 %. En algunos aspectos, la secuencia N-terminal o la secuencia C-terminal puede comprender una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). Las secuencias en el extremo N-terminal y C-terminal pueden estar inmediatamente adyacentes o directamente conectadas entre sí. En otros aspectos, la secuencia N-terminal y la secuencia C-terminal pueden estar conectadas por medio de un dominio conector. En ciertas modalidades, el dominio conector comprende una secuencia de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En algunos aspectos, la composición de celulasa que no es de origen natural comprende actividad de ß-glucosidasas . En algunos aspectos, la composición de celulasa que no es de origen natural comprende, además, una o más de las actividades de xilanasa, ß-xilosidasa y/o L-a-arabinofuranosidasa .
Fv3G La secuencia de aminoácidos de Fv3G (sec. con núm. de ident.:56) se muestra en las Figuras 30B y 43A-1 a 43B-1. La sec. con núm. de ident . 56 es la secuencia del inmaduro Fv3G. Fv3G tiene una secuencia señal prevista correspondiente a las posiciones 1 a la 21 de la sec . con núm. de ident. :56 (subrayada) ; se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a las posiciones 22 a la 780 de la sec. con núm. de ident.: 56. Las predicciones de secuencias señal se llevaron a cabo, como se describió anteriormente, con el algoritmo SignalP- N (http://www.cbs.dtu.dk), como se hizo para los otros polipéptidos de la presente descripción. El dominio conservado previsto se presenta en negrita en la Figura 30B. Las predicciones de dominio se realizaron como se hizo con los otros polipéptidos de la presente invención, según la base de datos Pfam, SMART o NCBI . Se predice que los residuos de FV3G E509 y D272 funcionan como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas GH3 de, por ejemplo, P. anserina (núm. de registro XP_001912683) , V. dahliae, N. haematococca (núm. de registro XP_003045443) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473), F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. mencionadas anteriormente (ver las Figuras 43A-1 a 43B-3) . Como se usa en la presente descripción, "un polipéptido Fv3G" se refiere, en algunos aspectos, a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 o 750 residuos de aminoácidos contiguos entre los residuos 20 al 780 de la sec . con núm. de ident. :56. Un polipéptido Fv3G se encuentra, preferentemente, inalterado, en comparación con un Fv3G natural, en los residuos E509 y D272. Un polipéptido Fv3G se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descritas en la presente descripción, tal como se muestra en el alineamiento de las 43A-1 a 43B-3. Un polipéptido Fv3G comprende, adecuadamente, los dominios completos conservados previstos del Fv3G natural que se muestra en la Figura 30B. Un polipéptido Fv3G ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia del Fv3G maduro que se muestra en la Figura 30B. El polipéptido Fv3G de la presente invención tiene, preferentemente, actividad de ß-glucosidasas .
Consecuentemente, un polipéptido Fv3G de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident.:56, o con los residuos (i) 22-292, (Ü) 22-629, (iii) 22-780, (iv) 373-629, o (v) 373-780 de la sec. con núm. de ident. :56. El polipéptido tiene, adecuadamente, actividad de ß -glucosidasa .
En algunos aspectos, un "polipéptido Fv3G" de la presente invención se puede referir, además, a un polipéptido Fv3G mutante. Las sustituciones de aminoácidos se pueden introducir en el polipéptido Fv3G para mejorar la actividad de ß-glucosidasas de la molécula. Por ejemplo, las sustituciones de aminoácidos que aumentan la afinidad de unión del polipéptido Fv3G para su sustrato o que mejoran la capacidad de Fv3G para catalizar la hidrólisis de residuos terminales no reductores en ß-D-glucósidos se pueden introducir en el polipéptido Fv3G. En algunos aspectos, los polipéptidos Fv3G mutantes comprenden una o más sustituciones conservadoras de aminoácidos. En algunos aspectos, los polipéptidos Fv3G mutantes comprenden una o más sustituciones no conservadoras de aminoácidos. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CD del polipéptido Fv3G. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CBM del polipéptido Fv3G. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran tanto en el CD como en el CBM. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Fv3G se pueden llevar a cabo en los aminoácidos E509 y/o D272. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Fv3G se pueden llevar a cabo en uno o más aminoácidos D101, R107, L150, R165, K198, H199, R209, M237, Y240, D272, 273, S455 y/o E509. El polipéptido o polipéptidos Fv3G mutantes tienen, adecuadamente, actividad de ß-glucosidasas .
En algunos aspectos, el polipéptido Fv3G comprende una quimera de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud, y comprende aproximadamente 60 %, 65 %, 70 %, 75 % u 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Fv3G (sec. con núm. de ident.:56) y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident.:54, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79 o comprende un motivo de la secuencia de aminoácidos de la sec. con núm. de ident. :170. En algunos aspectos, la primera secuencia de ß-glucosidasas que comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de la sec. con núm. de ident. :56 y la segunda secuencia de ß-glucosidasas que comprende una secuencia C-terminal de por lo menos aproximadamente 50 residuos de aminoácidos contiguos de cualquiera de las sec . con núms. de ident.:54, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende el motivo de la sec. con núm. de ident . :170.
En ciertos aspectos, el polipéptido Fv3G de la presente invención comprende una quimera o un constructo quimérico de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud, y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms. de ident.: 54, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las sec. con núms. de ident .: 164-169 , mientras que la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud, comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Fv3G (sec. con núm. de ident. :56) . En algunos aspectos, la primera secuencia de ß-glucosidasas comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de cualquiera de las sec. con núms. de ident.: 54, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias sec. con núms. de ident.: 164-169 y la segunda secuencia de ß-glucosidasas comprende una secuencia C-terminal de por lo menos 50 residuos de aminoácidos contiguos de la sec . con núm. de ident.:56.
En algunos aspectos, la primera secuencia de ß-glucosidasa se localiza en el extremo N-terminal del polipéptido quimérico de ß-glucosidasa, mientras que la segunda secuencia de ß-glucosidasa se encuentra en el extremo C-terminal del polipéptido quimérico de ß-glucosidasa . En ciertas modalidades, la primera, la segunda o ambas secuencias de ß-glucosidasa comprenden, además, uno o más sitios de glicosilación . En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasa se encuentran inmediatamente adyacentes entre sí o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasas no se encuentran inmediatamente adyacentes pero se conectan por medio de un dominio conector. En algunos aspectos, la primera o la segunda secuencia de ß-glucosidasa comprende una región en bucle o una secuencia que representa una estructura tipo bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD(R/K)YNIT (sec. con núm. de ident.:172) . En algunos aspectos, ni la primera ni la segunda secuencia de ß-glucosidasa comprende una secuencia de bucle. En algunas modalidades, el dominio conector comprende una región en bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident . : 172 ) . En algunas modalidades, el dominio conector que conecta la primera secuencia de ß-glucosidasa y la segunda secuencia de ß-glucosidasa se localiza en la región central (es decir, no se encuentra en el extremo N-terminal ni C-terminal del polipéptido quimérico) . En algunos aspectos, la secuencia N-terminal de la ß-glucosidasa quimérica comprende una secuencia de por lo menos 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de longitud derivados de un polipéptido Fv3G o una variante de este. En algunos aspectos, la secuencia N-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos que representan las sec. con núms . de ident.: 136-148 o, preferentemente, una o más o todas las sec. con núms. de ident .: 164-169. En algunos aspectos, la secuencia C-terminal comprende una secuencia de por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos de longitud derivados de un polipéptido de ß-glucosidasa o una variante de este. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos que representan las sec. con núms. de ident .: 149-156 o, preferentemente, la sec. con núm. de ident. :170. El polipéptido de ß-glucosidasa, la variante de este, o el híbrido o quimera de este puede comprender, además, uno o más sitios de glicosilación. El sitio o sitios de glicosilación pueden encontrarse dentro de la secuencia C-terminal o dentro de la secuencia N-terminal, o dentro de ambas .
En algunos aspectos, la composición de celulasa o hemicelulasa que no es de origen natural de la presente invención comprende, además, una o más hemicelulasas de origen natural. En algunos aspectos, la composición de celulasa que no es de origen natural tiene una estabilidad mejorada en comparación con las enzimas naturales, que incluyen Fv3G, de donde se deriva la secuencia C-terminal o N-terminal de la ß-glucosidasa quimérica. En algunos aspectos, la estabilidad mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución asociada en el índice o el alcance de pérdida de actividad enzimática durante el almacenamiento o las condiciones de producción, en donde la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 20 %, con mayor preferencia, menor que aproximadamente 15 % o, aún con mayor preferencia, menor que aproximadamente 10 %. En algunos aspectos, la secuencia N-terminal o la secuencia C-terminal puede comprender una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). Las secuencias en el extremo N-terminal y C-terminal pueden estar inmediatamente adyacentes o directamente conectadas entre sí. En otros aspectos, la secuencia N-terminal y la secuencia C-terminal pueden estar conectadas por medio de un dominio conector. En ciertas modalidades, el dominio conector comprende una secuencia de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident. :171) o de FD (R/K) YNIT (sec. con núm. de ident.: 172 >. En algunos aspectos, la composición de celulasa que no es de origen natural comprende actividad de ß-glucosidasas . En algunos aspectos, la composición de celulasa que no es de origen natural comprende, además, una o más de las actividades de xilanasa, ß-xilosidasa y/o L-a-arabinofuranosidasa .
Fv3D La secuencia de aminoácidos de Fv3D (sec. con núm. de ident.:58) se muestra en las Figuras 31B y 43A-1 a 43B-3. La sec. con núm. de ident . 58 es la secuencia del inmaduro Fv3D. Fv3D tiene una secuencia señal prevista correspondiente a las posiciones 1 a la 19 de la sec. con núm. de ident. :58 (subrayada) ; se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a las posiciones 20 a la 811 de la sec. con núm. de ident.:58. Las predicciones de las secuencias señal se llevaron a cabo con el algoritmo de SignalP-N . El dominio conservado previsto se presenta en negrita en la Figura 3 IB. Las predicciones del dominio se llevaron a cabo según la base de datos Pfam, SMART o NCBI . Se prevé que los residuos de Fv3D E534 y D301 funcionan como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas GH3 de, por ejemplo, P. (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473) , F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. mencionadas anteriormente (ver las Figuras 43A-1 a 43B-3) . Como se usa en la presente descripción, "un polipéptido Fv3D" se refiere, en algunos aspectos, a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 ¾, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 o 750 residuos de aminoácidos contiguos entre los residuos 20 al 811 de la sec. con núm. de ident.:58. Un polipéptido Fv3D se encuentra, preferentemente, inalterado, en comparación con un Fv3D natural, en los residuos E534 y D301. Un polipéptido Fv3D se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descritas en la presente descripción, tal como se muestra en el alineamiento de las Figuras 43A-1 a 43B-3. Un polipéptido Fv3D comprende, adecuadamente, los dominios completos conservados previstos del Fv3D natural que se muestra en la Figura 31B. Un polipéptido Fv3D ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia del Fv3D maduro que se muestra en la Figura 31B. El polipéptido Fv3D de la presente invención tiene, preferentemente, actividad de ß-glucosidasas .
Consecuentemente, un polipéptido Fv3D de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident . :58, o con los residuos (i) 20-321, (ii) 20-651, (iii) 20-811, (iv) 423-651, o (v) 423-811 de la sec. con núm. de ident. :58. El polipéptido tiene, adecuadamente, actividad de ß -glucosidasa .
En algunos aspectos, un "polipéptido Fv3D" de la presente invención puede referirse, además, a un polipéptido Fv3D mutante. Las sustituciones de aminoácidos se pueden introducir en el polipéptido Fv3D para mejorar la actividad de ß-glucosidasas de la molécula. Por ejemplo, las sustituciones de aminoácidos que aumentan la afinidad de unión del polipéptido Fv3D para su sustrato o que mejoran la capacidad de Fv3D para catalizar la hidrólisis de residuos terminales no reductores en ß-D-glucósidos se pueden introducir en el polipéptido Fv3D. En algunos aspectos, los polipéptidos Fv3D mutantes comprenden una o más sustituciones conservadoras de aminoácidos. En algunos aspectos, los polipéptidos Fv3D mutantes comprenden una o más sustituciones no conservadoras de aminoácidos. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CD del polipéptido Fv3G. En algunos aspectos, la sustitución o sustituciones de aminoácidos; se encuentran en el CBM del polipéptido Fv3D. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran tanto en el CD como en el CBM. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Fv3D se pueden llevar a cabo en los aminoácidos E534 y/o D301. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Fv3D se pueden llevar a cabo en uno o más de los aminoácidos Dlll, R117, L160, R175, K208, H209, R219, M266, Y269, D301, W302, S472 y/o E534. El polipéptido o polipéptidos Fv3D mutantes tienen, adecuadamente, actividad de ß-glucosidasas .
En algunos aspectos, el polipéptido Fv3D comprende una quimera de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 % u 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Fv3D (sec. con núm. de ident . : 58) y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident. : 5 , 56, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79. En algunos aspectos, la primera secuencia de ß-glucosidasas que comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de la sec. con núm. de ident.: 58 y la segunda secuencia de ß-glucosidasas que comprende una secuencia C-terminal de por lo menos aproximadamente 50 residuos de aminoácidos contiguos de cualquiera de las sec. con núms. de ident. :54, 56, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79.
En ciertos aspectos, el polipéptido Fv3D de la presente invención comprende un híbrido/fusión/quimera o un constructo quimérico de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident . : 54, 56, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident.: 164-169, mientras que la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Fv3D (sec. con núm. de ident. :58). En algunos aspectos, la primera secuencia de ß-glucosidasas comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de cualquiera de las sec. con núms. de ident.: 54, 56, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident.: 164-169 y la segunda secuencia de ß-glucosidasas comprende una secuencia C-terminal de por lo menos 50 residuos de aminoácidos contiguos de la sec. con núm. de ident. :58.
En algunos aspectos, la primera secuencia de ß-glucosidasa se localiza en el extremo N-terminal del polipéptido quimérico de ß-glucosidasa, mientras que la segunda secuencia de ß -glucosidasa se encuentra en el extremo C-terminal del polipéptido quimérico de ß-glucosidasa. En ciertas modalidades, la primera, la segunda o ambas secuencias de ß-glucosidasa comprenden, además, uno o más sitios de glicosilación . En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasa se encuentran inmediatamente adyacentes entre sí o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencias de ß-glucosidasas no se encuentran inmediatamente adyacentes pero se conectan por medio de un dominio conector. En algunos aspectos, la primera o la segunda secuencia de ß-glucosidasa comprende una región en bucle o una secuencia que representa una estructura tipo bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident . :172) . En algunos aspectos, ni la primera ni la segunda secuencia de ß-glucosidasa comprende una secuencia de bucle. En algunas modalidades, el dominio conector comprende una región en bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident. :171) o de FD (R/K) YNIT (sec. con núm. de ident. :172) . En algunas modalidades, el dominio conector que conecta la primera secuencia de ß-glucosidasa y la segunda secuencia de ß-glucosidasa se localiza en la región central (es decir, no se encuentra en el extremo N-terminal ni C-terminal del polipéptido quimérico) . En algunos aspectos, la secuencia N-terminal de la ß-glucosidasa quimérica comprende una secuencia de por lo menos 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de longitud derivados de un polipéptido Fv3D o una variante de este. En algunos aspectos, la secuencia N-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos que representan las sec . con núms . de ident .: 136-148 o, preferentemente, los motivos secuenciales de las sec. con núms. de ident .: 164-169. En algunos aspectos, la secuencia C-terminal comprende una secuencia de por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos de longitud derivados de un polipéptido de ß -glucosidasa o una variante de este. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms. de ident .: 149-156 o, preferentemente, el motivo de la sec. con núm. de ident. :170. En ciertas modalidades, el polipéptido de ß-glucosidasa, la variante de este, o el híbrido o quimérico de este, comprende, además, uno o más sitios de glicosilación . El sitio o sitios de glicosilación pueden encontrarse dentro de la secuencia C-terminal o dentro de la secuencia N-terminal, o dentro de ambas.
En algunos aspectos, la composición de celulasa o hemicelulasa que no es de origen natural de la presente invención comprende, además, una o más hemicelulasas de origen natural. En algunos aspectos, la composición de celulasa que no es de origen natural tiene una estabilidad mejorada en comparación con las enzimas naturales, que incluyen Fv3D, de donde se deriva la secuencia C-terminal o N-terminal de la ß-glucosidasa quimérica. En algunos aspectos, la estabilidad mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución asociada en el índice o alcance de pérdida de actividad enzimática durante el almacenamiento o las condiciones de producción, en donde la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 20 %, con mayor preferencia, menor que aproximadamente 15 % o, aún con mayor preferencia, menor que aproximadamente 10 %. En algunos aspectos, la secuencia N-terminal o la secuencia C-terminal puede comprender una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). Las secuencias en el extremo N-terminal y C-terminal pueden estar inmediatamente adyacentes o directamente conectadas entre sí. En otros aspectos, la secuencia N-terminal y la secuencia C-terminal pueden estar conectadas por medio de un dominio conector. En ciertas modalidades, el dominio conector comprende una secuencia de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En algunos aspectos, la composición de celulasa que no es de origen natural comprende actividad de ß-glucosidasas . En algunos aspectos, la composición de celulasa que no es de origen natural comprende, además, una o más de las actividades de xilanasa, ß-xilosidasa y/o L-a-arabinofuranosidasa .
Tr3A La secuencia de aminoácidos de Tr3A (sec. con núm. de ident.:62) se muestra en las Figuras 33B y 43A-1 a 43B-3. Tr3A se conoce, además, como Bgll de T. reesei . La sec. con núm. de ident . 62 es la secuencia del inmaduro Tr3A. Tr3A tiene una secuencia señal prevista correspondiente a las posiciones 1 a la 19 de la sec. con núm. de ident. :62 (subrayada); se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente, a las posiciones 20 a la 744 de la sec. con núm. de ident.: 62. Las predicciones de las secuencias señal se llevaron a cabo con el algoritmo de SignalP-NN. El dominio conservado previsto se presenta en negrita en la Figura 33B. Las predicciones del dominio se llevaron a cabo según la base de datos Pfam, SMART o NCBI . Se prevé que los residuos de Tr3A E472 y D267 funcionan como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas GH3 de, por ejemplo, P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 j , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473) , F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. mencionadas anteriormente (ver las Figuras 43A-1 a 43B-3) . Como se usa en la presente descripción, "un polipéptido Tr3A" se refiere, en algunos aspectos, a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 ¾, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650 o 700 residuos de aminoácidos contiguos entre los residuos 20 al 744 de la sec . con núm. de ident.:62. Un polipéptido Tr3A se encuentra, preferentemente, inalterado, en comparación con un Tr3A natural, en los residuos E472 y D267. Un polipéptido Tr3A se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descritas en la presente descripción, tal como se muestra en el alineamiento de las Figuras 43A-1 a 43B-3. Un polipéptido Tr3A comprende, adecuadamente, los dominios completos conservados previstos del Tr3A natural que se muestra en la Figura 33B. Un polipéptido Tr3A ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Tr3A maduro que se muestra en la Figura 33B. El polipéptido Tr3A de la presente invención tiene, preferentemente, actividad de ß -glucosidasas .
Consecuentemente, un polipéptido Tr3A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident. :62, o con los residuos (i) 20-287, (ii) 22-611, (iii) 20-744, (iv) 362-611, o (v) 362-744 de la sec. con núm. de ident. :62. El polipéptido tiene, adecuadamente, actividad de ß-glucosidasa .
En algunos aspectos, un "polipéptido Tr3A" de la presente invención puede referirse, además, a un polipéptido Tr3A mutante. Las sustituciones de aminoácidos se pueden introducir en el polipéptido Tr3A para mejorar la actividad de ß-glucosidasas de la molécula. Por ejemplo, las sustituciones de aminoácidos que aumentan la afinidad de unión del polipéptido Tr3A para su sustrato o que mejoran la capacidad de Tr3A para catalizar la hidrólisis de residuos terminales no reductores en ß-D-glucósidos se pueden introducir en el polipéptido Tr3A. En algunos aspectos, los polipéptidos Tr3A mutantes comprenden una o más sustituciones conservadoras de aminoácidos. En algunos aspectos, los polipéptidos Tr3A mutantes comprenden una o más sustituciones no conservadoras de aminoácidos. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CD del polipéptido Tr3A. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CBM del polipéptido Tr3A. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran tanto en el CD como en el CBM. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Tr3A se pueden llevar a cabo en los aminoácidos E472 y/o D267. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Tr3A se pueden llevar a cabo en los aminoácidos D92 , R98, L141, R156, K189, H190, R200, M232, Y235, D267, W268, S415 y/o E472. El polipéptido o polipéptidos Tr3A mutantes tienen, adecuadamente, actividad de ß-glucosidasas .
En algunos aspectos, el polipéptido Tr3A comprende una quimera/fusión/híbrido de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 % u 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Tr3A (sec. con núm. de ident.:62) y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident.:54, 56, 58, 60, 64, 68, 70, 72, 74, 76, 78 y 79, o comprende un motivo de la secuencia de aminoácidos de la sec. con núm. de ident.:170. En algunos aspectos, la primera secuencia de ß-glucosidasas comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de la sec. con núm. de ident . :62 y la segunda secuencia de ß-glucosidasas que comprende una secuencia C-terminal de por lo menos aproximadamente 50 residuos de aminoácidos contiguos de cualquiera de las sec. con núms. de ident. :54, 56, 58, 60, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende un motivo de la secuencia de aminoácidos de la sec. con núm. de ident.: 170.
En ciertos aspectos, el polipéptido Tr3A de la presente invención comprende una quimera o un constructo quimérico de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident . : 54, 56, 58, 60, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident.: 164-169, mientras que la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Tr3A (sec. con núm. de ident. :62) . En algunos aspectos, la primera secuencia de ß-glucosidasas comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de cualquiera de las sec. con núms. de ident.: 54, 56, 58, 60, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident.: 164-169 y la segunda secuencia de ß-glucosidasas comprende una secuencia C-terminal de por lo menos 50 residuos de aminoácidos contiguos de la sec. con núm. de ident.: 62.
En algunos aspectos, la primera secuencia de ß-glucosidasa se localiza en el extremo N-terminal del polipéptido quimérico de ß-glucosidasa, mientras que la segunda secuencia de ß-glucosidasa se encuentra en el extremo C-terminal del polipéptido quimérico de ß-glucosidasa . En ciertas modalidades, la primera, la segunda o ambas secuencias de ß -glucosidasa comprenden, además, uno o más sitios de glicosilación. En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasa se encuentran inmediatamente adyacentes entre sí o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasas no se encuentran inmediatamente adyacentes pero se conectan por medio de un dominio conector. En algunos aspectos, la primera o la segunda secuencia de ß-glucosidasa comprende una región en bucle o una secuencia que representa una estructura tipo bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FD SPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident. :172) . En algunos aspectos, ni la primera ni la segunda secuencia de ß-glucosidasa comprende una secuencia de bucle. En algunas modalidades, el dominio conector comprende una región en bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.: 171) o de FD (R/K) YNIT (sec. con núm. de ident.: 172). En algunas modalidades, el dominio conector que conecta la primera secuencia de ß-glucosidasa y la segunda secuencia de ß-glucosidasa se localiza en la región central (es decir, no se encuentra en el extremo N-terminal ni C-terminal del polipéptido quimérico) . En algunos aspectos, la secuencia N-terminal de la ß-glucosidasa quimérica comprende una secuencia de por lo menos 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de longitud derivados de un polipéptido Tr3A o una variante de este. En algunos aspectos, la secuencia N-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos que representan las sec . con núms . de ident .: 136-148 o, preferentemente, los motivos de las secuencias de las sec. con núms. de ident .: 164 - 169. En algunos aspectos, la secuencia C-terminal comprende una secuencia de por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos de longitud derivados de un polipéptido de ß-glucosidasa o una variante de este. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos que representan las sec. con núms. de ident .: 149-156 o, preferentemente, el motivo de la secuencia de la sec. con núm. de ident.: 170. En ciertas modalidades, el polipéptido de ß-glucosidasa, la variante de este, o el híbrido o quimérico de este, comprende, además, uno o más sitios de glicosilación . El sitio o sitios de glicosilación pueden encontrarse dentro de la secuencia C-terminal o dentro de la secuencia N-terminal, o dentro de ambas.
En algunos aspectos, la composición de celulasa o hemicelulasa que no es de origen natural de la presente invención comprende, además, una o más hemicelulasas de origen natural. En algunos aspectos, la composición de celulasa que no es de origen natural tiene una estabilidad mejorada en comparación con las enzimas naturales, que incluyen Tr3A, de donde se deriva la secuencia C-terminal o N-terminal de la ß-glucosidasa quimérica. En algunos aspectos, la estabilidad mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución asociada en el índice o alcance de pérdida de actividad enzimática durante el almacenamiento o las condiciones de producción, en donde la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 20 %, con mayor preferencia, menor que aproximadamente 15 % o, aún con mayor preferencia, menor que aproximadamente 10 %. En algunos aspectos, la secuencia N-terminal o la secuencia C-terminal puede comprender una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD(R/K)YNIT (sec. con núm. de ident.:172). Las secuencias en el extremo N-terminal y C-terminal pueden estar inmediatamente adyacentes o directamente conectadas entre sí. En otros aspectos, la secuencia N-terminal y la secuencia C-terminal pueden estar conectadas por medio de un dominio conector. En ciertas modalidades, el dominio conector comprende una secuencia de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD(R/K)YNIT (sec. con núm. de ident . :172) . La composición de celulasa que no es de origen natural comprende actividad de ß-glucosidasas . La composición de celulasa que no es de origen natural puede comprender, además, una o más de las actividades de xilanasas, ß -xilosidasas y/o L-a-arabinofuranosidasas .
Tr3B La secuencia de aminoácidos de Tr3B (sec. con núm. de ident. :64) se muestra en las Figuras 34B y 43A-1 a 43B-3.
Tr3B se conoce también como "Bgl3 de T. reesei" o "Cel3B de G. reesei". La sec. con núm. de ident.: 64 es la secuencia del Tr3B inmaduro. Tr3B tiene una secuencia señal prevista correspondiente a las posiciones 1 a la 18 de la sec. con núm. de ident. :64 (subrayada); se predice el clivaje de la secuencia señal para obtener una proteína madura que tiene una secuencia correspondiente a las posiciones 19 a la 874 de la sec. con núm. de ident.:64. Las predicciones de las secuencias señal se llevaron a cabo con el algoritmo de SignalP- N. El dominio conservado previsto se presenta en negrita en la Figura 34B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI . Se prevé que los residuos de Tr3B E516 y D287 funcionan como ácido-base y nucleófilo catalíticos, respectivamente, en base al alineamiento de secuencias de las glucosidasas GH3 a partir de, por ejemplo, P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , ?. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro 7AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473) , F. verticillioides y G. neapolitana (núm. de registro Q0GC07) , etc. mencionadas anteriormente (ver la Figura 43) . Como se usa en la presente descripción, "un polipéptido Tr3B" se refiere, en algunos aspectos, a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 o 850 residuos de aminoácidos contiguos entre los residuos 19 al 874 de la sec. con núm. de ident.:64. Un polipéptido Tr3B se encuentra, preferentemente, inalterado, en comparación con un Tr3B natural, en los residuos E516 y D287. Un polipéptido Tr3B se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados en la familia GH3 de ß-glucosidasas descrita en la presente descripción, tal como se muestra en el alineamiento de las Figuras 43A-1 a 43B-3. Un polipéptido Tr3B comprende, adecuadamente, los dominios completos conservados previstos del Tr3B natural que se muestra en la Figura 34B. Un polipéptido Tr3A ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Tr3B maduro que se muestra en la Figura 34B. El polipéptido Tr3B de la presente invención tiene, preferentemente, actividad de ß-glucosidasas .
Consecuentemente, un polipéptido Tr3B de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident.:64, o con los residuos (i) 19-307, (ii) 19-640, (iii) 19-874, (iv) 407-640, o (v) 407-874 de la sec. con núm. de ident . : 64. El polipéptido tiene, adecuadamente, actividad de ß-glucosidasas .
En algunos aspectos, un "polipéptido Tr3B" de la presente invención puede referirse, además, a un polipéptido Tr3B mutante. Las sustituciones de aminoácidos se pueden introducir en el polipéptido Tr3B para mejorar la actividad de ß-glucosidasas de la molécula. Por ejemplo, las sustituciones de aminoácidos que incrementan la afinidad de unión del polipéptido Tr3B para su sustrato o para mejorar la capacidad de Tr3B para catalizar la hidrólisis de residuos terminales no reductores en ß-D-glucósidos se pueden introducir en el polipéptido Tr3B. En algunos aspectos, los polipéptidos Tr3B mutantes comprenden una o más sustituciones conservadoras de aminoácidos. En algunos aspectos, los polipéptidos Tr3B mutantes comprenden una o más sustituciones no conservadoras de aminoácidos. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CD del polipéptido Tr3B . En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el polipéptido Tr3B CBM. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran tanto en el CD como en el CBM. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Tr3B se pueden llevar a cabo en los aminoácidos E516 y/o D287. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Tr3B se pueden llevar a cabo en uno o más de los aminoácidos D99, R105, L148, R163, K196, H197, R207, M252, Y255, D287, W288, S457 y/o E516. El polipéptido o polipéptidos Tr3B mutantes tienen, adecuadamente, actividad de ß-glucosidasas .
En algunos aspectos, el polipéptido Tr3B comprende una quimera/híbrido/ fusión de dos secuencias de ß-glucosidasas, en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 % u 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Tr3B (sec. con núm. de ident. :64) , y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más identidad de secuencias con una secuencia de la misma longitud con cualquiera de las sec. con núms . de ident. :54, 56, 58, 60, 62, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende el motivo de la secuencia de polipéptidos de la sec. con núm. de ident. :170. En algunos aspectos, la primera secuencia de ß-glucosidasas que comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de la sec. con núm. de ident. :64, y la segunda secuencia de ß-glucosidasas que comprende una secuencia C-terminal de por lo menos aproximadamente 50 residuos de aminoácidos contiguos de cualquiera de las sec. con núms. de ident. :54, 56, 58, 60, 62, 68, 70, 72, 74, 76, 78 y 79, o comprende el motivo de la secuencia de polipéptidos de la sec. con núm. de ident.:170.
En ciertos aspectos, el polipéptido Tr3B de la presente invención comprende una quimera o un constructo quimérico de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident.: 54, 56, 58, 60, 62, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende uno o más motivos de las secuencias de polipéptidos de las sec. con núms. de ident.: 164-169, mientras que la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más identidad de secuencias con una secuencia de la misma longitud de Tr3B (sec. con núm. de ident.: 64). En algunos aspectos, la primera secuencia de ß-glucosidasas comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de cualquiera de las sec. con núms. de ident. :54, 56, 58, 60, 62, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident .: 164-169 , y la segunda secuencia de ß-glucosidasas comprende una secuencia C-terminal de por lo menos 50 residuos de aminoácidos contiguos de la sec. con núm. de ident .: 64.
En algunos aspectos, la primera secuencia de ß-glucosidasas se localiza en el extremo N-terminal del polipéptido quimérico de ß -glucosidasa , mientras que la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido quimérico de ß-glucosidasa. En ciertas modalidades, la primera, la segunda o ambas secuencias de ß-glucosidasas comprenden, además, uno o más sitios de glicosilación . En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasas se encuentran inmediatamente adyacentes entre sí o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß -glucosidasas no se encuentran inmediatamente adyacentes pero se conectan por medio de un dominio conector. En algunos aspectos, la primera o la segunda secuencia de ß -glucosidasas comprende una región en bucle o una secuencia que representa una estructura tipo bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident . :172) . En algunos aspectos, ni la primera ni la segunda secuencia de ß-glucosidasas comprende una secuencia de bucle. En algunas modalidades, el dominio conector comprende una región en bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident . : 172 ) . En algunas modalidades, el dominio conector que conecta la primera secuencia de ß -glucosidasas y la segunda secuencia de ß -glucosidasas se localiza en la región central (es decir, no se encuentra en el extremo N-terminal ni C-terminal del polipéptido quimérico) . En algunos aspectos, la secuencia N-terminal de la ß-glucosidasa quimérica comprende una secuencia de por lo menos 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de longitud derivados de un polipéptido Tr3B o una variante de este. En algunos aspectos, la secuencia N-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms . de ident .: 136 - 148 o, preferentemente, los motivos de las sec. con núms. de ident. : 164-169. En algunos aspectos, la secuencia C-terminal comprende una secuencia de por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos de longitud derivados de un polipéptido de ß -glucosidasa o una variante de este. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos que representan las sec. con núms. de ident .: 149-156 o, preferentemente, el motivo de la secuencia de la sec. con núm. de ident. :170. En ciertas modalidades, el polipéptido de ß-glucosidasa, la variante de este, o el híbrido o quimérico de este, comprende, además, uno o más sitios de glicosilación. El sitio o sitios de glicosilación pueden encontrarse dentro de la secuencia C-terminal o dentro de la secuencia N-terminal , o dentro de ambas.
En algunos aspectos, la composición de celulasa o hemicelulasa que no es de origen natural de la presente invención comprende, además, una o más hemicelulasas de origen natural. En algunos aspectos, la composición de celulasa que no es de origen natural tiene una estabilidad mejorada en comparación con las enzimas naturales, que incluyen Tr3B, de donde se derivan las secuencias en C-terminal o en N-terminal de la ß-glucosidasa quimérica. En algunos aspectos, la estabilidad mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución asociada en el índice o alcance de la pérdida de actividad enzimática durante el almacenamiento o las condiciones de producción, en donde la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 20 %, con mayor preferencia, menor que aproximadamente 15 % o, aún con mayor preferencia, menor que aproximadamente 10 %. En algunos aspectos, la secuencia N-terminal o la secuencia C-terminal puede comprender una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident . : 172 ) . Las secuencias en el extremo N-terminal y C-terminal pueden estar inmediatamente adyacentes o directamente conectadas entre sí. En otros aspectos, la secuencia N-terminal y la secuencia C-terminal pueden estar conectadas por medio de un dominio conector. En ciertas modalidades, el dominio conector comprende una secuencia de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident. :171) o de FD (R/K) YNIT (sec. con núm. de ident.: 172). En algunos aspectos, la composición de celulasa que no es de origen natural comprende actividad de ß-glucosidasas . En algunos aspectos, la composición de celulasa que no es de origen natural comprende, además, una o más de las actividades de xilanasa, ß-xilosidasa y/o L-a-arabinofuranosidasa .
Te3A La secuencia de aminoácidos de Te3A (sec. con núm. de ident. :66) se muestra en las Figuras 35B y 43A-1 a 43B-3. Te3A también se denomina "Abg2." La sec. con núm. de ident. :66 es la secuencia del Te3A inmaduro. Te3A tiene una secuencia señal prevista correspondiente a las posiciones 1 a 19 de la sec. con núm. de ident. :66 (subrayada) ; se prevé que el el ivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a las posiciones 20 a 857 de la sec . con núm. de ident.:66. Las predicciones de las secuencias señal se llevaron a cabo con el algoritmo de SignalP-N . El dominio conservado previsto aparece en negrita en la Figura 35B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI . Se prevé que los residuos de Te3A E505 y D277 funcionan como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 de, por ejemplo, P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473), F. verticillioides y T. neapolitana (núm. de registro Q0GC07) etc. mencionadas anteriormente (ver la Figura 43) . Como se usa en la presente descripción, "un polipéptido Te3A" se refiere, en algunos aspectos, a un polipéptido y/o una variante ' de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750 u 800 residuos de aminoácidos contiguos entre los residuos 20 al 857 de la sec. con núm. de ident. :66. Un polipéptido Te3A se encuentra, preferentemente, inalterado, en comparación con un Te3A natural en los residuos E505 y D277. Un polipéptido Te3A se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descritas en la presente descripción tal como se muestran en el alineamiento de las Figuras 43A-1 a 43B-3. Un polipéptido Te3A comprende, adecuadamente, los dominios completos conservados previstos del Te3A natural que se muestra en la Figura 35B. Un polipéptido Te3A ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Te3A maduro que se muestra en la Figura 35B. El polipéptido Te3A de la presente invención tiene, preferentemente, actividad de ß-glucosidasas .
Consecuentemente, un polipéptido Te3A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident . :66, o con los residuos (i) 20-297, (ii) 20-629, (iii) 20-857, (iv) 396-629, o (v) 396-857 de la sec. con núm. de ident. : 66. El polipéptido tiene, adecuadamente, actividad de ß -glucosidasa .
En algunos aspectos, un "polipéptido Te3A" de la presente invención se puede referir, además, a un polipéptido Te3A mutante. Las sustituciones de aminoácidos se pueden introducir en el polipéptido Te3A para mejorar la actividad de ß-glucosidasas de la molécula. Por ejemplo, las sustituciones de aminoácidos que incrementan la afinidad de unión del polipéptido Te3A para su sustrato o que mejoran la capacidad de Te3A de catalizar la hidrólisis de residuos terminales no reductores en ß-D-glucósidos se pueden introducir en el polipéptido Te3A. En algunos aspectos, los polipéptidos Te3A mutantes comprenden una o más sustituciones conservadoras de aminoácidos. En algunos aspectos, los polipéptidos Te3A mutantes comprenden una o más sustituciones no conservadoras de aminoácidos. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CD del polipéptido Te3A. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CBM del polipéptido Te3A. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran tanto en el CD como en el CBM. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Te3A'se pueden llevar a cabo en cualquiera de los aminoácidos E505 y/o D277. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Te3A se pueden llevar a cabo en uno o más de los aminoácidos D92, R98, L141, R156, K189, H190, R200, M242, Y245, D277, 278, S447 y/o E505. El polipéptido o polipéptidos Te3A mutantes tienen, adecuadamente, actividad de ß-glucosidasas .
En algunos aspectos, el polipéptido Te3A comprende una quimera/fusión/híbrido de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 % u 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Te3A (sec. con núm. de ident.:66), y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident.:54, 56, 58, 60, 62, 64, 68, 70, 72, 74, 76, 78 y 79, o comprende el motivo de la secuencia de polipéptidos de la sec. con núm. de ident . :170. En algunos aspectos, la primera secuencia de ß-glucosidasas que comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de la sec. con núm. de ident. :66, y la segunda secuencia de ß-glucosidasas que comprende una secuencia C-terminal de por lo menos aproximadamente 50 residuos de aminoácidos contiguos de cualquiera de las sec. con núms. de ident..-54, 56, 58, 60, 62, 64, 68, 70, 72, 74, 76, 78 y 79, o comprende el motivo de la secuencia de polipéptidos de la sec. con núm. de ident.: 170.
En ciertos aspectos, el polipéptido Te3A de la presente invención comprende una quimera/híbrido/fusión o un constructo quimérico de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec . con núms . de ident . : 54, 56, 58, 60, 62, 64, 68, 70, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident .: 164-169 , mientras que la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más identidad de secuencias con la secuencia de la misma longitud de Te3A (sec. con núm. de ident. :66) . En algunos aspectos, la primera secuencia de ß-glucosidasas comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de cualquiera de las sec. con núms. de ident.: 54, 56, 58, 60, 62, 64, 68, 70, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident .: 164-169 , y la segunda secuencia de ß-glucosidasas comprende una secuencia C-terminal de por lo menos 50 residuos de aminoácidos contiguos de la sec. con núm. de ident.: 66.
En algunos aspectos, la primera secuencia de ß-glucosidasas se localiza en el extremo N-terminal del polipéptido quimérico de ß-glucosidasa, mientras que la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido quimérico de ß-glucosidasa. En ciertas modalidades, la primera, la segunda o ambas secuencias de ß-glucosidasas comprenden, además, uno o más sitios de glicosilación. En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasas se encuentran inmediatamente adyacentes entre sí o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasas no se encuentran inmediatamente adyacentes pero se conectan por medio de un dominio conector. En algunos aspectos, la primera o la segunda secuencia de ß-glucosidasas comprende una región en bucle o una secuencia que representa una estructura tipo bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDR SPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En algunos aspectos, ni la primera ni la segunda secuencia de ß-glucosidasas comprende una secuencia de bucle. En algunas modalidades, el dominio conector comprende una región en bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En algunas modalidades, el dominio conector que conecta la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas se localiza en la región central (es decir, no se encuentra en el extremo N-terminal ni C-terminal del polipéptido quimérico) . En algunos aspectos, la secuencia N-terminal de la ß-glucosidasa quimérica comprende una secuencia de por lo menos 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de longitud derivados de un polipéptido Te3A o una variante de este. En algunos aspectos, la secuencia N-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms . de ident .: 136-148 o, preferentemente, los motivos de las sec. con núms. de ident .: 164 - 169. En algunos aspectos, la secuencia C-terminal comprende una secuencia de por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos de longitud derivados de un polipéptido de ß-glucosidasa o una variante de este. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms. de ident .: 149-156 o, preferentemente, el motivo de la sec. con núm. de ident.: 170. En ciertas modalidades, el polipéptido de ß-glucosidasa, la variante de este, o el híbrido o quimérico de este, comprende, además, uno o más sitios de glicosilación . El sitio o sitios de glicosilación pueden encontrarse dentro de la secuencia C-terminal o dentro de la secuencia N-terminal, o dentro de ambas.
En algunos aspectos, la composición de celulasa o hemicelulasa que no es de origen natural de la presente invención comprende, además, una o más hemicelulasas de origen natural. En algunos aspectos, la composición de celulasa que no es de origen natural tiene una estabilidad mejorada en comparación con las enzimas naturales, que incluyen Te3A, de donde se derivan las secuencias en C-terminal o N-terminal de la ß-glucosidasa quimérica. En algunos aspectos, la estabilidad ' mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución asociada en el índice o alcance de la actividad enzimática durante el almacenamiento o las condiciones de producción, en donde la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 20 %, con mayor preferencia, menor que aproximadamente 15 % o, aún con mayor preferencia, menor que aproximadamente 10 %. En algunos aspectos, la secuencia N-terminal o la secuencia C-terminal puede comprender una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172).
Las secuencias en el extremo N-terminal y C-terminal pueden estar inmediatamente adyacentes o directamente conectadas entre sí. En otros aspectos, la secuencia N-terminal y la secuencia C-terminal pueden estar conectadas por medio de un dominio conector. En ciertas modalidades, el dominio conector comprende una secuencia de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) Y IT (sec. con núm. de ident.:172). En algunos aspectos, la composición de celulasa que no es de origen natural comprende actividad de ß-glucosidasas . En algunos aspectos, la composición de celulasa que no es de origen natural comprende, además, una o más de las actividades de xilanasa, ß-xilosidasa y/o L-a-arabinofuranosidasa .
An3A La secuencia de aminoácidos de An3A (sec. con núm. de ident . :68) se muestra en las Figuras 36B y 43A-1 a 43B-3. An3A también se denomina Bglu de "A. niger" . La sec. con núm. de ident.: 68 es la secuencia del An3A inmaduro. An3A tiene una secuencia señal prevista correspondiente a las posiciones 1 a 19 de la sec. con núm. de ident. :68 (subrayada); se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a las posiciones 20 a 860 de la sec. con núm. de ident. :68. Las predicciones de las secuencias señal se llevaron a cabo con el algoritmo de SignalP-NN. El dominio conservado previsto aparece en negrita en la Figura 36B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI. Se prevé que los residuos de An3A E509 y D277 funcionan como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 de, por ejemplo, P. anserina (núm . de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473) , F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. mencionadas anteriormente (ver la Figura 43) . Como se usa en la presente descripción, "un polipéptido An3A" se refiere, en algunos aspectos, a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750 u 800 residuos de aminoácidos contiguos entre los residuos 20 al 860 de la sec . con núm. de ident.:68. Un polipéptido An'3A se encuentra, preferentemente, inalterado, en comparación con un An3A natural en los residuos E509 y D277. Un polipéptido An3A se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descritas en la presente descripción tal como se muestran en el alineamiento de las Figuras 43A-1 a 43B-3. Un polipéptido An3A comprende, adecuadamente, los dominios completos conservados previstos de An3A natural que se muestra en la Figura 36B. Un polipéptido An3A ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de An3A maduro que se muestra en la Figura 36B. El polipéptido An3A de la presente invención tiene, preferentemente, actividad de ß-glucosidasas .
Consecuentemente, un polipéptido An3A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident.:68 o con los residuos (i) 20-300, (ii) 20-634, (iii) 20-860, (iv) 400-634, o (v) 400-860 de la sec. con núm. de ident.:68. El polipéptido tiene, adecuadamente, actividad de ß -glucosidasa .
En algunos aspectos, un "polipéptido An3A" de la presente invención se puede referir, además, a un polipéptido An3A mutante . Las sustituciones de aminoácidos se pueden introducir en el polipéptido An3A para mejorar la actividad de ß-glucosidasas de la molécula. Por ejemplo, las sustituciones de aminoácidos que incrementan la afinidad de unión del polipéptido An3A para su sustrato o que mejoran la capacidad de An3A para catalizar la hidrólisis de residuos terminales no reductores en ß-D-glucósidos se pueden introducir en el polipéptido An3A. En algunos aspectos, los polipéptidos An3A mutantes comprenden una o más sustituciones conservadoras de aminoácidos. En algunos aspectos, los polipéptidos An3A mutantes comprenden una o más sustituciones no conservadoras de aminoácidos. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CD del polipéptido An3A. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CBM del polipéptido An3A. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran tanto en el CD como en el CBM. En algunos aspectos, las sustituciones de aminoácidos del polipéptido An3A se pueden llevar a cabo en los aminoácidos E509 y/o D277. En algunos aspectos, las sustituciones de aminoácidos del polipéptido An3A se pueden llevar a cabo en uno o más de los aminoácidos D92, R98, L141, R156, K189, H190, R200, M245, Y248, D277, W278, S451 y/o E509. El polipéptido o polipéptidos An3A mutantes tienen, adecuadamente, actividad de ß-glucosidasas .
En algunos aspectos, el polipéptido An3A comprende una quimera/híbrido/fusión de dos secuencias de ß-glucosidasas, en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 % u 80 % o más de identidad de secuencias con una secuencia de la misma longitud de An3A (sec. con núm. de ident.:68) y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident.:54, 56, 58, 60, 62, 64, 66, 70, 72, 74, 76, 78 y 79, o comprende un motivo de la secuencia de polipéptidos de la sec. con núm. de ident.:170. En algunos aspectos, la primera secuencia de ß-glucosidasas que comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de la sec. con núm. de ident.:68, y la segunda secuencia de ß-glucosidasas comprende una secuencia C-terminal de por lo menos aproximadamente 50 residuos de aminoácidos contiguos de cualquiera de las sec. con núms. de ident.:54, 56, 58, 60, 62, 64, 66, 70, 72, 74, 76, 78 y 79, o comprende un motivo de la secuencia de polipéptidos de la sec. con núm. de ident.:170.
En ciertos aspectos, el polipéptido An3A de la presente invención comprende una quimera o un constructo quimérico de dos secuencias de ß-glucosidasas, en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núras. de ident . : 54, 56, 58, 60, 62, 64, 66, 70, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms . de ident .: 164-169 , mientras que la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de An3A (sec. con núm. de ident. :68) . En algunos aspectos, la primera secuencia de ß-glucosidasas comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de cualquiera de las sec. con núms. de ident. :54, 56, 58, 60, 62, 64, 66, 70, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident .: 164 -169 , y la segunda secuencia de ß-glucosidasas comprende una secuencia C-terminal de por lo menos 50 residuos de aminoácidos contiguos de la sec. con núm. de ident. :68.
En algunos aspectos, la primera secuencia de ß-glucosidasas se localiza en el extremo N-terminal del polipéptido quimérico de ß-glucosidasa, mientras que la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido quimérico de ß-glucosidasa. En ciertas modalidades, la primera, la segunda o ambas secuencias de ß -glucosidasas comprenden, además, uno o más sitios de glicosilación. En ciertas modalidades, la primera y la segunda secuencia de ß -glucosidasas se encuentran inmediatamente adyacentes entre sí o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasas no se encuentran inmediatamente adyacentes pero se conectan por medio de un dominio conector. En algunos aspectos, la primera o la segunda secuencia de ß -glucosidasas comprende una región en bucle o una secuencia que representa una estructura tipo bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm . de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En algunos aspectos, ni la primera ni la segunda secuencia de ß-glucosidasas comprende una secuencia de bucle. En algunas modalidades, el dominio conector comprende una región en bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172) . En algunas modalidades, el dominio conector que conecta la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas se localiza en la región central (es decir, no se encuentra en el extremo N-terminal ni C-terminal del polipéptido quimérico) . En algunos aspectos, la secuencia N-terminal de la ß -glucosidasa quimérica comprende una secuencia de por lo menos 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de longitud derivados de un polipéptido An3A o una variante de este. En algunos aspectos, la secuencia N-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms . de ident . : 136 - 148 , preferentemente, los motivos de las sec. con núms. de ident .: 164-169. En algunos aspectos, la secuencia C-terminal comprende una secuencia de por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos de longitud derivados de un polipéptido de ß -glucosidasa o una variante de este. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms. de ident .: 149-156 , preferentemente, el motivo de la sec. con núm. de ident..-170. En ciertas modalidades, el polipéptido de ß-glucosidasa, la variante de este, o el híbrido o quimérico de este, comprende, además, uno o más sitios de glicosilación . El sitio o sitios de glicosilación pueden encontrarse dentro de la secuencia C-terminal o dentro de la secuencia N-terminal, o dentro de arabas.
En algunos aspectos, la composición de celulasa o hemicelulasa que no es de origen natural de la presente invención comprende, además, una o más hemicelulasas de origen natural. En algunos aspectos, la composición de celulasa que no es de origen natural tiene una estabilidad mejorada en comparación con las enzimas naturales, que incluyen An3A, de donde se derivan las secuencias en C- terminal o N-terminal de la ß-glucosidasa quimérica. En algunos aspectos, la estabilidad mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución asociada en el índice o alcance de pérdida de actividad enzimática durante el almacenamiento o las condiciones de producción, en donde la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 20 %, con mayor preferencia, menor que aproximadamente 15 % o, aún con mayor preferencia, menor que aproximadamente 10 %. E algunos aspectos, la secuencia N-terminal o la secuencia C- terminal puede comprender una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident. :171) o de FD (R/K) YNIT (sec. con núm. de ident.:172) .
Las secuencias en el extremo N-terminal y C-terminal pueden estar inmediatamente adyacentes o directamente conectadas entre sí. En otros aspectos, la secuencia N-terminal y la secuencia C-terminal pueden estar conectadas por medio de un dominio conector. En ciertas modalidades, el dominio conector comprende una secuencia de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En algunos aspectos, la composición de celulasa que no es de origen natural comprende actividad de ß-glucosidasas . En algunos aspectos, la composición de celulasa que no es de origen natural comprende, además, una o más de las actividades de xilanasa, ß-xilosidasa y/o L-a-arabinofuranosidasa .
Fo3A La secuencia de aminoácidos de Fo3A (sec. con núm. de ident.:70) se muestra en las Figuras 37B y 43A-1 a 43B-3. La sec. con núm. de ident . 70 es la secuencia del inmaduro Fo3A. Fo3A tiene una secuencia señal prevista correspondiente a las posiciones l a 19 de la sec. con núm. de ident. : 70 (subrayada) ; se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a las posiciones 20 a 899 de la sec. con núm. de ident.: 70. Las predicciones de las secuencias señal se llevaron a cabo con el algoritmo de SignalP- . El dominio conservado previsto aparece en negrita en la Figura 37B. Las predicciones del dominio se realizaron según la base de datos Pfam, SMART o NCBI . Se prevé que los residuos Fo3A E536 y D307 funcionan como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 de, por ejemplo, P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. hae atococca (núm. de registro XP_003045443) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG 02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473) , F. verticillioídes y T. neapolitana (núm. de registro Q0GC07) etc. mencionadas anteriormente (ver las Figuras 43A-1 a 43B-3) . Como se usa en la presente descripción, "un polipéptido Fo3A" se refiere, en cierto aspecto, a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 ¾, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 u 850 residuos de aminoácidos contiguos entre los residuos 20 al 899 de la sec. con núm. de ident.:70. Un polipéptido Fo3A se encuentra, preferentemente, inalterado, en comparación con un Fo3A natural, en los residuos E536 y D307. Un polipéptido Fo3A se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descritas en la presente descripción tal como se muestran en el alineamiento de las Figuras 43A-1 a 43B-3. Un polipéptido Fo3A comprende, adecuadamente, los dominios completos conservados previstos del Fo3A natural que se muestra en la Figura 37B. Un polipéptido Fo3A ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Fo3A maduro que se muestra en la Figura 37B. El polipéptido Fo3A de la presente invención tiene, preferentemente, actividad de ß-glucosidasas .
Consecuentemente, un polipéptido Fo3A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident.:70, o con los residuos (i) 20-327, (ii) 20-660, (iii) 20-899, (iv) 428-660, o (v) 428-899 de la sec. con núm. de ident.:70. El polipéptido tiene, adecuadamente, actividad de ß-glucosidasa .
En algunos aspectos, un "polipéptido Fo3A" de la presente invención se puede referir, además, a un polipéptido Fo3A mutante. Las sustituciones de aminoácidos se pueden introducir en el polipéptido Fo3A para mejorar la actividad de ß-glucosidasas de la molécula. Por ejemplo, las sustituciones de aminoácidos que incrementan la afinidad de unión del polipéptido Fo3A para su sustrato o que mejoran la capacidad de Fo3A de catalizar la hidrólisis de residuos terminales no reductores en los ß-D-glucósidos se pueden introducir en el polipéptido Fo3A. En algunos aspectos, los polipéptidos Fo3A mutantes comprenden una o más sustituciones conservadoras de aminoácidos. En algunos aspectos, los polipéptidos Fo3A mutantes comprenden una o más sustituciones no conservadoras de aminoácidos. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CD del polipéptido Fo3A. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CBM del polipéptido Fo3A. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran tanto en el CD como en el CBM. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Fo3A se pueden llevar a cabo en los aminoácidos E536 y/o D307. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Fo3A se pueden llevar a cabo en uno o más de los aminoácidos D119, R125, L168, R183, K216, H217, R227, M272, Y275, D307, 308, S477 y/o E536. El polipéptido o polipéptidos Fo3A mutantes tienen, adecuadamente, actividad de ß-glucosidasas .
En algunos aspectos, el polipéptido Fo3A comprende una quimera/híbrido/fusión de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 % u 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Fo3A (sec. con núm. de ident.:70), y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident.:54, 56, 58, 60, 62, 64, 66, 68, 72, 74, 76, 78 y 79, o comprende un motivo de la secuencia de polipéptidos de la sec. con núm. de ident.:170. En algunos aspectos, la primera secuencia de ß-glucosidasas que comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de la sec. con núm. de ident . : 70 y la segunda secuencia de ß-glucosidasas que comprende una secuencia e-terminal de por lo menos aproximadamente 50 residuos de aminoácidos contiguos de cualquiera de las sec. con núms. de ident. :54, 56, 58, 60, 62, 64, 66, 68, 72, 74, 76, 78 y 79, o comprende un motivo de la secuencia de polipéptidos de la sec. con núm. de ident. :170.
En ciertos aspectos, el polipéptido Fo3A de la presente invención comprende una quimera o un constructo quimérico de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec . con núms . de ident . : 54, 56, 58, 60, 62, 64, 66, 68, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident .: 164-169, mientras que la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Fo3A (sec. con núm. de ident.: 70). En algunos aspectos, la primera secuencia de ß-glucosidasas comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de cualquiera de las sec. con núms. de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident .: 164-169 , y la segunda secuencia de ß-glucosidasas comprende una secuencia C-terminal de por lo menos 50 residuos de aminoácidos contiguos de la sec. con núm. de ident. :70.
En algunos aspectos, la primera secuencia de ß-glucosidasas se localiza en el extremo N-terminal del polipéptido quimérico de ß-glucosidasa, mientras que la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido quimérico de ß-glucosidasa. En ciertas modalidades, la primera, la segunda o ambas secuencias de ß-glucosidasas comprenden, además, uno o más sitios de glicosilación. En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasas se encuentran inmediatamente adyacentes entre sí o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasas no se encuentran inmediatamente adyacentes pero se conectan por medio de un dominio conector. En algunos aspectos, la primera o la segunda secuencia de ß-glucosidasas comprende una región en bucle o una secuencia que representa una estructura tipo bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident . :172) . En algunos aspectos, ni la primera ni la segunda secuencia de ß-glucosidasas comprende una secuencia de bucle. En algunas modalidades, el dominio conector comprende una región en bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident. :171) o de FD (R/K) YNIT (sec. con núm. de ident. :172). En algunas modalidades, el dominio conector que conecta la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas se localiza en la región central (es decir, no se encuentra en el extremo N-terminal ni C-terminal del polipéptido quimérico) . En algunos aspectos, la secuencia N-terminal de la ß-glucosidasa quimérica comprende una secuencia de por lo menos 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de longitud derivados de un polipéptido Fo3A o una variante de este. En algunos aspectos, la secuencia N-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms . de ident . : 136 - 148 , preferentemente, los motivos de las sec. con núms. de ident .: 164-169. En algunos aspectos, la secuencia C-terminal comprende una secuencia de por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos de longitud derivados de un polipéptido de ß-glucosidasa o una variante de este. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms. de ident .: 149-156 , preferentemente, el motivo de la sec. con núm. de ident. :170. En ciertas modalidades, el polipéptido de ß-glucosidasa, la variante de este, o el híbrido o quimérico de este, comprende, además, uno o más sitios de glicosilación. El sitio o sitios de glicosilación pueden encontrarse dentro de la secuencia C-terminal o dentro de la secuencia N-terminal, o dentro de ambas.
En algunos aspectos, la composición de celulasa o hemicelulasa que no es de origen natural de la presente invención comprende, además, una o más hemicelulasas de origen natural. En algunos aspectos, la composición de celulasa que no es de origen natural tiene una estabilidad mejorada en comparación con las enzimas naturales, que incluyen Fo3A, de donde se derivan las secuencias en C-terminal o N-terminal de la ß-glucosidasa quimérica. En algunos aspectos, la estabilidad mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución asociada en el índice o alcance de pérdida de actividad enzimática durante el almacenamiento o las condiciones de producción, en donde la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 20 %, con mayor preferencia, menor que aproximadamente 15 % o, aún con mayor preferencia, menor que aproximadamente 10 %. En algunos aspectos, la secuencia N-terminal o la secuencia C-terminal puede comprender una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). Las secuencias en el extremo N-terminal y C-terminal pueden estar inmediatamente adyacentes o directamente conectadas entre sí. En otros aspectos, la secuencia N-terminal y la secuencia C-terminal pueden estar conectadas por medio de un dominio conector. En ciertas modalidades, el dominio conector comprende una secuencia de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En algunos aspectos, la composición de celulasa que no es de origen natural comprende actividad de ß-glucosidasas . En algunos aspectos, la composición de celulasa que no es de origen natural comprende, además, una o más de las actividades de xilanasa, ß-xilosidasa y/o L-a-arabinofuranosidasa .
Gz3A La secuencia de aminoácidos de Gz3A (sec. con núm. de ident.:72) se muestra en las Figuras 38B y 43A-1 a 43B-3. La sec. con núm. de ident. 72 es la secuencia del inmaduro Gz3A. Gz3A tiene una secuencia señal prevista correspondiente a las posiciones 1 a 18 de la sec. con núm. de ident. : 72 (subrayada) ; se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a las posiciones 19 a 886 de la sec. con núm. de ident.: 72. Las predicciones de las secuencias señal se llevaron a cabo con el algoritmo de SignalP-NN. El dominio conservado previsto aparece en negrita en la Figura 38B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI . Se prevé que los residuos de Gz3A E523 y D294 funcionan como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 de, por ejemplo, P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473), F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. mencionadas anteriormente (ver la Figura 43). Como se usa en la presente descripción, "un polipéptido Gz3A" se refiere, en algunos aspectos, a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 u 850 residuos de aminoácidos contiguos entre los residuos 19 al 886 de la sec. con núm. de ident.:72. Un polipéptido Gz3A se encuentra, preferentemente, inalterado, en comparación con un Gz3A natural, en los residuos E536 y D307. Un polipéptido Gz3A se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descritas en la presente descripción tal como se muestran en el alineamiento de las Figuras 43A-1 a 43B-3. Un polipéptido Gz3A comprende, adecuadamente, los dominios completos conservados previstos del Gz3A natural que se muestra en la Figura 38B. Un polipéptido Gz3A ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Gz3A maduro que se muestra en la Figura 38B. El polipéptido Gz3A de la presente invención tiene, preferentemente, actividad de ß-glucosidasas .
Consecuentemente, un polipéptido Gz3A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident . :72, o con los residuos (i) 19-314, (ii) 19-647, (iii) 19-886, (iv) 415-647, o (v) 415-886 de la sec. con núm. de ident. : 72. El polipéptido tiene, adecuadamente, actividad de ß-glucosidasa .
En algunos aspectos, un "polipéptido Gz3A" de la presente invención se puede referir, además, a un polipéptido Gz3A mutante . Las sustituciones de aminoácidos se pueden introducir en el polipéptido Gz3A para mejorar la actividad de ß-glucosidasas de la molécula. Por ejemplo, las sustituciones de aminoácidos que incrementan la afinidad de unión del polipéptido Gz3A para su sustrato o que mejoran la capacidad de Gz3A para catalizar la hidrólisis de residuos terminales no reductores en ß-D-glucósidos se pueden introducir en el polipéptido Gz3A. En algunos aspectos, los polipéptidos Gz3A mutantes comprenden una o más sustituciones conservadoras de aminoácidos. En algunos aspectos, los polipéptidos Gz3A mutantes comprenden una o más sustituciones no conservadoras de aminoácidos. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CD del polipéptido Gz3A. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CBM del polipéptido Gz3A. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran tanto en el CD como en el CBM. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Gz3A se pueden llevar a cabo en los aminoácidos E536 y/o D307. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Gz3A se pueden llevar a cabo en uno o más de los aminoácidos D106, R112, L155, R170, K203, H204, R214, M259, Y262, D294, 295, S464 y/o E523. El polipéptido o polipéptidos Gz3A mutantes tienen, adecuadamente, actividad de ß-glucosidasas .
En algunos aspectos, el polipéptido Gz3A comprende una quimera/fusión/híbrido de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 % u 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Gz3A (sec. con núm. de ident.:72), y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia igual de cualquiera de las sec. con núms . de ident.:54, 56, 58, 60, 62, 64, 66, 68, 70, 74, 76, 78 y 79, o comprende un motivo de la secuencia de polipéptidos de la sec. con núm. de ident.:170. En algunos aspectos, la primera secuencia de ß-glucosidasas que comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de la sec. con núm. de ident.:72, y la segunda secuencia de ß-glucosidasas que comprende una secuencia C-terminal de por lo menos aproximadamente 50 residuos de aminoácidos contiguos de cualquiera de las sec. con núms. de ident.:54, 56, 58, 60, 62, 64, 66, 68, 70, 74, 76, 78 y 79, o comprende un motivo de la secuencia de polipéptidos de la sec. con núm. de ident.:170.
En ciertos aspectos, el polipéptido Gz3A de la presente invención comprende una quimera o un constructo quimérico de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident.: 164-169, mientras que la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Gz3A (sec. con núm. de ident. :72) . En algunos aspectos, la primera secuencia de ß-glucosidasas comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de cualquiera de las sec. con núms. de ident. :54, 56, 58, 60, 62, 64, 66, 68, 70, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident.: 164-169, y la segunda secuencia de -glucosidasas comprende una secuencia C-terminal de por lo menos 50 residuos de aminoácidos contiguos de la sec. con núm. de ident.: 72.
En algunos aspectos, la primera secuencia de ß-glucosidasas se localiza en el extremo N-terminal del polipéptido quimérico de ß-glucosidasa, mientras que la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido quimérico de ß-glucosidasa . En ciertas modalidades, la primera, la segunda o ambas secuencias de ß-glucosidasas comprenden, además, uno o más sitios de glicosilación . En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasas se encuentran inmediatamente adyacentes entre sí o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasas no se encuentran inmediatamente adyacentes pero se conectan por medio de un dominio conector. En algunos aspectos, la primera o la segunda secuencia de ß-glucosidasas comprende una región en bucle o una secuencia que representa una estructura tipo bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En algunos aspectos, ni la primera ni la segunda secuencia de ß-glucosidasas comprende una secuencia de bucle. En algunas modalidades, el dominio conector comprende una región en bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident . :172) . En algunas modalidades, el dominio conector que conecta la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas se localiza en la región central (es decir, no se encuentra en el extremo N-terminal ni C-terminal del polipéptido quimérico) . En algunos aspectos, la secuencia N-terminal de la ß-glucosidasa quimérica comprende una secuencia de por lo menos 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de longitud derivados de un polipéptido Gz3A o una variante de este. En algunos aspectos, la secuencia N-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms . de ident .: 136-148, preferentemente, los motivos de las secuencias de las sec. con núms. de ident .: 16 -169. En algunos aspectos, la secuencia C-terminal comprende una secuencia de por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos de longitud derivados de un polipéptido de ß-glucosidasa o una variante de este. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms. de ident .: 149-156 o, preferentemente, el motivo de la secuencia de la sec. con núm. de ident. :170. En ciertas modalidades, el polipéptido de ß-glucosidasa, la variante de este, o el híbrido o quimérico de este, comprende, además, uno o más sitios de glicosilación . El sitio o sitios de glicosilación pueden encontrarse dentro de la secuencia C-terminal o dentro de la secuencia N-terminal, o dentro de ambas.
En algunos aspectos, la composición de celulasa o hemicelulasa que no es de origen natural de la presente invención comprende, además, una o más hemicelulasas de origen natural. En algunos aspectos, la composición de celulasa que no . es de origen natural tiene una estabilidad mejorada en comparación con las enzimas naturales, que incluyen Gz3A, de donde se derivan las secuencias en C-terminal o N-terminal de la ß-glucosidasa quimérica. En algunos aspectos, la estabilidad mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución asociada en el índice o alcance de la actividad enzimática durante el almacenamiento o las condiciones de producción, en donde la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 20 %, con mayor preferencia, menor que aproximadamente 15 % o, aún con mayor preferencia, menor que aproximadamente 10 %. En algunos aspectos, la secuencia N-terminal o la secuencia C-terminal puede comprender una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). Las secuencias en el extremo N-terminal y C-terminal pueden estar inmediatamente adyacentes o directamente conectadas entre sí. En otros aspectos, la secuencia N-terminal y la secuencia C-terminal pueden estar conectadas por medio de un dominio conector. En ciertas modalidades, el dominio conector comprende una secuencia de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En algunos aspectos, la composición de celulasa que no es de origen natural comprende actividad de ß-glucosidasas . En algunos aspectos, la composición de celulasa que no es de origen natural comprende, además, una o más de las actividades de xilanasa, ß-xilosidasa y/o L-a-arabinofuranosidasa .
Nh3A La secuencia de aminoácidos de Nh3A (sec. con núm. de ident.:74) se muestra en las Figuras 39B y 43A-1 a 43B-3. La sec. con núm. de ident. 74 es la secuencia del inmaduro Nh3A. Nh3A tiene una secuencia señal prevista correspondiente a las posiciones 1 a 19 de la sec. con núm. de ident .: 74 (subrayada) ; se prevé que el elivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a las posiciones 20 a 880 de la sec. con núm. de ident.: 74. Las predicciones de las secuencias señal se llevaron a cabo con el algoritmo de SignalP-NN. El dominio conservado previsto aparece en negrita en la Figura 39B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI . Se prevé que los residuos de Nh3A E523 y D294 funcionan como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 de, por ejemplo, P. anserina (núm. de registro XP_001912683) , V. dahliae, N. haematococca (núm. de registro XP_003045443) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , ' A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473) , F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. mencionadas anteriormente (ver la Figura 43) . Como se usa en la presente descripción, "un polipéptido Nh3A" se refiere, en algunos aspectos, a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 u 850 residuos de aminoácidos contiguos entre los residuos 20 al 880 de la sec. con núm. de ident . : 74. Un polipéptido Nh3A se encuentra, preferentemente, inalterado, en comparación con un Nh3A natural, en los residuos E523 y D294. un polipéptido Nh3A se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descritas en la presente descripción tal como se muestran en el alineamiento de las Figuras 43A-1 a 43B-3. Un polipéptido Nh3A comprende, adecuadamente, los dominios completos conservados previstos de Nh3A natural que se muestra en la Figura 39B. Un polipéptido Nh3A ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Nh3A maduro que se muestra en la Figura 39B. El polipéptido Nh3A de la presente invención tiene, preferentemente, actividad de ß-glucosidasas .
Consecuentemente, un polipéptido Nh3A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident.:74, o con los residuos (i) 20-295, (ii) 20-647, (iii) 20-880, (iv) 414-647, o (v) 414-880 de la sec. con núm. de ident . : 74. El polipéptido tiene, adecuadamente, actividad de ß -glucosidasa .
En algunos aspectos, un "polipéptido Nh3A" de la presente invención se puede referir, además, a un polipéptido Nh3A mutante. Las sustituciones de aminoácidos se pueden introducir en el polipéptido Nh3A para mejorar la actividad de ß-glucosidasas de la molécula. Por ejemplo, las sustituciones de aminoácidos que incrementan la afinidad de unión del polipéptido Nh3A para su sustrato o que mejoran la capacidad de Nh3A para catalizar la hidrólisis de residuos terminales no reductores en ß-D-glucósidos se pueden introducir en el polipéptido Nh3A. En algunos aspectos, los polipéptidos Nh3A mutantes comprenden una o más sustituciones conservadoras de aminoácidos. En algunos aspectos, los polipéptidos Nh3A mutantes comprenden una o más sustituciones no conservadoras de aminoácidos. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CD del polipéptido Nh3A. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CBM del polipéptido Nh3A. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran tanto en el CD como en el CBM. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Nh3A se pueden llevar a cabo en los aminoácidos E523 y/o D294. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Nh3A se pueden llevar a cabo en uno o más de los aminoácidos D106, R112, L155, R170, K203, H204, R214, M259, Y262, D294, W295, S464 y/o E523. El polipéptido o polipéptidos Nh3A mutantes tienen, adecuadamente, actividad de ß-glucosidasas .
En algunos aspectos, el polipéptido Nh3A comprende una quimera/fusión/híbrido de dos secuencias de ß-glucosidasas, en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 % u 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Nh3A (sec. con núm. de ident.:74) y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident.:54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 76, 78 y 79, o comprende un motivo de la secuencia de polipéptidos de la sec. con núm. de ident.:170. En algunos aspectos, la primera secuencia de ß-glucosidasas que comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de la sec. con núm. de ident.:74, y la segunda secuencia de ß-glucosidasas que comprende una secuencia C-terminal de por lo menos aproximadamente 50 residuos de aminoácidos contiguos de cualquiera de las sec. con núms. de ident.:54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 76, 78 y 79, o comprende un motivo de la secuencia de polipéptidos de la sec. con núm. de ident.:170.
En ciertos aspectos, el polipéptido Nh3A de la presente invención comprende una quimera o un constructo quimérico de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms. de ident . : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec . con núms . de ident . : 164-169, mientras que la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Nh3A (sec. con núm. de ident. :74). En algunos aspectos, la primera secuencia de ß-glucosidasas comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de cualquiera de las sec. con núms. de ident. :54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident.: 164-169, y la segunda secuencia de ß-glucosidasas comprende una secuencia C-terminal de por lo menos 50 residuos de aminoácidos contiguos de la sec. con núm. de ident .: 74.
En algunos aspectos, la primera secuencia de ß-glucosidasas se localiza en el extremo N-terminal del polipéptido quimérico de ß-glucosidasa, mientras que la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido quimérico de ß-glucosidasa. En ciertas modalidades, la primera, la segunda o ambas secuencias de ß-glucosidasas comprenden, además, uno o más sitios de glicosilación . En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasas se encuentran inmediatamente adyacentes entre sí o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasas no se encuentran inmediatamente adyacentes pero se conectan por medio de un dominio conector. En algunos aspectos, la primera o la segunda secuencia de ß-glucosidasas comprende una región en bucle o una secuencia que representa una estructura tipo bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En algunos aspectos, ni la primera ni la segunda secuencia de ß-glucosidasas comprende una secuencia de bucle. En algunas modalidades, el dominio conector comprende una región en bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172) . En algunas modalidades, el dominio conector que conecta la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas se localiza en la región central (es decir, no se encuentra en el extremo N-terminal ni C-terminal del polipéptido quimérico) . En algunos aspectos, la secuencia N-terminal de la ß-glucosidasa quimérica comprende una secuencia de por lo menos 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de longitud derivados de un polipéptido Nh3A o una variante de este. En algunos aspectos, la secuencia N- erminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms . de ident .: 136-148 , preferentemente, los motivos de las secuencias de las sec. con núms. de ident .: 164- 169. En algunos aspectos, la secuencia C-terminal comprende una secuencia de por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos de longitud derivados de un polipéptido de ß-glucosidasa o una variante de este. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos que representan las sec. con núms. de ident .: 149-156 o, preferentemente, el motivo de la secuencia de la sec. con núm. de ident. :170. En ciertas modalidades, el polipéptido de ß-glucosidasa, la variante de este, o el híbrido o quimérico de este, comprende, además, uno o más sitios de glicosilación . El sitio o sitios de glicosilación pueden encontrarse dentro de la secuencia C-terminal o dentro de la secuencia N-terminal, o dentro de ambas.
En algunos aspectos, la composición de celulasa o hemicelulasa que no es de origen natural de la presente invención comprende, además, una o más hemicelulasas de origen natural. En algunos aspectos, la composición de celulasa que no es de origen natural tiene una estabilidad mejorada en comparación con las enzimas naturales, que incluyen Nh3A, de donde se derivan las secuencias en C-terminal o N-terminal de la ß-glucosidasa quimérica. En algunos aspectos, la estabilidad mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución asociada en el alcance o índice de la pérdida de actividad enzimática durante el almacenamiento o condiciones de producción, en donde la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 20 %, con mayor preferencia, menor que aproximadamente 15 % o, aún con mayor preferencia, menor que aproximadamente 10 %. En algunos aspectos, la secuencia N-terminal o la secuencia C-terminal puede comprender una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). Las secuencias en el extremo N-terminal y C-terminal pueden estar inmediatamente adyacentes o directamente conectadas entre sí. En otros aspectos, la secuencia N-terminal y la secuencia C-terminal pueden estar conectadas por medio de un dominio conector. En ciertas modalidades, el dominio conector comprende una secuencia de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD(R/K)YNIT (sec. con núm. de ident.:172). En algunos aspectos, la composición de celulasa que no es de origen natural comprende actividad de ß-glucosidasas . En algunos aspectos, la composición de celulasa que no es de origen natural comprende, además, una o más de las actividades de xilanasa, ß-xilosidasa y/o L-a-arabinofuranosidasa .
Vd3A La secuencia de aminoácidos de Vd3A (sec. con núm. de ident.:76) se muestra en las Figuras 40B y 43A-1 a 43B-3. La sec. con núm. de ident.:76 es la secuencia del Vd3A inmaduro. Vd3A tiene una secuencia señal prevista correspondiente a las posiciones 1 a 18 de la sec. con núm. de ident.:76 (subrayada) ; se prevé que el el ivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a las posiciones 19 a 890 de la sec. con núm. de ident.:76. Las predicciones de las secuencias señal se llevaron a cabo con el algoritmo de SignalP-NN. El dominio conservado previsto aparece en negrita en la Figura 40B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI. Se demostró que Vd3A tiene actividad de ß-glucosidasa en, por ejemplo, un ensayo enzimático con el uso de cNPG y celobiosa y en hidrólisis de mazorca de maíz tratada previamente con amoníaco diluido como sustratos. Se prevé que los residuos de Vd3A E524 y D295 funcionan como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 de, por ejemplo, P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , ?. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473) , F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. mencionadas anteriormente (ver las Figuras 43A-1 a 43B-3) . Como se usa en la presente descripción, "un polipéptido Vd3A" se refiere, en algunos aspectos, a un polipéptido y/o una variante de este qUe comprende una secuencia que tiene por lo menos 85 ¾, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 u 850 residuos de aminoácidos contiguos entre los residuos 19 al 890 de la sec . con núm. de ident.:76. Un polipéptido Vd3A se encuentra, preferentemente, inalterado, en comparación con un Vd3A natural, en los residuos E524 y D295. Un polipéptido Vd3A se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descritas en la presente descripción tal como se muestran en el alineamiento de las Figuras 43A-1 a 43B-3. Un polipéptido Vd3A comprende, adecuadamente, los dominios completos conservados previstos del Vd3A natural que se muestra en la Figura 40B. Un polipéptido Nh3A ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Vd3A maduro que se muestra en la Figura 40B. El polipéptido Vd3A de la presente invención tiene, preferentemente, actividad de ß-glucosidasas .
Consecuentemente, un polipéptido Vd3A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 80 %, 85 ¾, 90 ¾, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident.:76, o con los residuos (i) 19-296, (ii) 19-649, (Üi) 19-890, (iv) 415-649, o (v) 415-890 de la sec. con núm. de ident . :76. El polipéptido tiene, adecuadamente, actividad de ß-glucosidasa .
En algunos aspectos, un "polipéptido Vd3A" de la presente invención se puede referir, además, a un polipéptido Vd3A mutante . Las sustituciones de aminoácidos se pueden introducir en el polipéptido Vd3A para mejorar la actividad de ß-glucosidasas de la molécula. Por ejemplo, las sustituciones de aminoácidos que incrementan la afinidad de unión del polipéptido Vd3A para su sustrato o que mejoran la capacidad de Vd3A para catalizar la hidrólisis de residuos terminales no reductores en las ß-D-glucósidos se pueden introducir en el polipéptido Vd3A. En algunos aspectos, los polipéptidos Vd3A mutantes comprenden una o más sustituciones conservadoras de aminoácidos. En algunos aspectos, los polipéptidos Vd3A mutantes comprenden una o más sustituciones no conservadoras de aminoácidos. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CD del polipéptido Vd3A. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CBM del polipéptido Vd3A. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran tanto en el CD como en el CBM. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Vd3A se pueden llevar a cabo en los aminoácidos E524 y/o D295. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Vd3A se pueden llevar a cabo en uno o más de los aminoácidos D107, R113, L156, R171, K204, H205, R215, M260, Y263, D295, W296, S465 y/o E524. El polipéptido o polipéptidos Vd3A mutantes tienen, adecuadamente, actividad de ß-glucosidasas .
En algunos aspectos, el polipéptido Vd3A comprende una quimera/híbrido/fusión de dos secuencias de ß-glucosidasas, en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 % u 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Vd3A (sec. con núm. de ident.:76) y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de · longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident.:54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 78 y 79, o comprende un motivo de la secuencia de polipéptidos de la sec. con núm. de ident.: 170. En algunos aspectos, la primera secuencia de ß-glucosidasas que comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de la sec. con núm. de ident. :76, y la segunda secuencia de ß-glucosidasas que comprende una secuencia C- erminal de por lo menos aproximadamente 50 residuos de aminoácidos contiguos de cualquiera de las sec. con núms. de ident. :54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 78 y 79, o comprende un motivo de la secuencia de polipéptidos de la sec. con núm. de ident.: 170.
En ciertos aspectos, el polipéptido Vd3A de la presente invención comprende una quimera o un constructo quimérico de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident.:54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident . : 164-169, mientras que la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Vd3A (sec. con núm. de ident. :76) . En algunos aspectos, la primera secuencia de ß-glucosidasas comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de cualquiera de las sec. con núms. de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident.: 164-169, y la segunda secuencia de ß -glucosidasas comprende una secuencia C-terminal de por lo menos 50 residuos de aminoácidos contiguos de la sec. con núm. de ident. :76.
En algunos aspectos, la primera secuencia de ß-glucosidasas se localiza en el extremo N-terminal del polipéptido quimérico de -glucosidasa , mientras que la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido quimérico de ß-glucosidasa. En ciertas modalidades, la primera, la segunda o ambas secuencias de ß -glucosidasas comprenden, además, uno o más sitios de glicosilación. En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasas se encuentran inmediatamente adyacentes entre sí o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasas no se encuentran inmediatamente adyacentes pero se conectan por medio de un dominio conector. En algunos aspectos, la primera o la segunda secuencia de ß -glucosidasas comprende una región en bucle o una secuencia que representa una estructura tipo bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident . :172) . En algunos aspectos, ni la primera ni la segunda secuencia de ß-glucosidasas comprende una secuencia de bucle. En algunas modalidades, el dominio conector comprende una región en bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident. :171) o de FD (R/K) YNIT (sec. con núm. de ident. :172) . En algunas modalidades, el dominio conector que conecta la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas se localiza en la región central (es decir, no se encuentra en el extremo N-terminal ni C-terminal del polipéptido quimérico) . En algunos aspectos, la secuencia N-terminal de la ß -glucosidasa quimérica comprende una secuencia de por lo menos 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de longitud derivados de un polipéptido Vd3A o una variante de este. En algunos aspectos, la secuencia N-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec . con núms . de ident . : 136 - 148 o, preferentemente, los motivos de las sec. con núms. de ident .: 164-169. En algunos aspectos, la secuencia C-terminal comprende una secuencia de por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos de longitud derivados de un polipéptido de ß -glucosidasa o una variante de este. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos que representan las sec. con núms. de ident. : 149-156 o, preferentemente, el motivo de la secuencia de la sec. con núm. de ident. :170. En ciertas modalidades, el polipéptido de ß-glucosidasa , la variante de este, o el híbrido o quimérico de este, comprende, además, uno o más sitios de glicosilación . El sitio o sitios de glicosilación pueden encontrarse dentro de la secuencia C-terminal o dentro de la secuencia N-terminal, o dentro de ambas.
En algunos aspectos, la composición de celulasa o hemicelulasa que no es de origen natural de la presente invención comprende, además, una o más hemicelulasas de origen natural. En algunos aspectos, la composición de celulasa que no es de origen natural tiene una estabilidad mejorada en comparación con las enzimas naturales, que incluyen Vd3A, de donde se derivan las secuencias en C-terminal o N-terminal de la ß-glucosidasa quimérica. En algunos aspectos, la estabilidad mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución asociada en el índice o alcance de pérdida de actividad enzimática durante el almacenamiento o las condiciones de producción, en donde la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 20 %, con mayor preferencia, menor que aproximadamente 15 % o, aún con mayor preferencia, menor que aproximadamente 10 %. En algunos aspectos, la secuencia N-terminal o la secuencia C-terminal puede comprender una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident . : 172 ) . Las secuencias en el extremo N-terminal y C-terminal pueden estar inmediatamente adyacentes o directamente conectadas entre sí. En otros aspectos, la secuencia N-terminal y la secuencia C-terminal pueden estar conectadas por medio de un dominio conector. En ciertas modalidades, el dominio conector comprende una secuencia de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En algunos aspectos, la composición de celulasa que no es de origen natural comprende actividad de ß-glucosidasas . En algunos aspectos, la composición de celulasa que no es de origen natural comprende, además, una o más de las actividades de xilanasa, ß-xilosidasa y/o L-a-arabinofuranosidasa .
Pa3G La secuencia de aminoácidos de Pa3G (sec. con núm. de ident . :78) se muestra en las Figuras 41B y 43A-1 a 43B-3. La sec. con núm. de ident. 78 es la secuencia del inmaduro Pa3G. Pa3G tiene una secuencia señal prevista correspondiente a las posiciones 1 a 19 de la sec. con núm. de ident. :78 (subrayada) ; se prevé que el elivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a las posiciones 20 a 805 de la sec. con núm. de ident. :78. Las predicciones de las secuencias señal se llevaron a cabo con el algoritmo de SignalP-NN. El dominio conservado previsto aparece en negrita en la Figura 41B. Las predicciones de dominio se realizaron en función de las bases de datos Pfam, SMART o NCBI . Se prevé que los residuos de Pa3G E517 y D289 funcionan como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 de, por ejemplo, P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755), T. reesei (núm. de registro AAA18473), F. verticillioides y T. neapolitana (núm. de registro Q0GC07) , etc. mencionadas anteriormente (ver las Figuras 43A-1 a 43B- 3) . Como se usa en la presente descripción, "un polipéptido Pa3G" se refiere, en algunos aspectos, a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 o 750 residuos de aminoácidos contiguos entre los residuos 20 al 805 de la sec . con núm. de ident. :78. Un polipéptido Pa3G se encuentra, preferentemente, inalterado, en comparación con un Pa3G natural, en los residuos E517 y D289. Un polipéptido Pa3G se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 ¾, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descritas en la presente descripción tal como se muestran en el alineamiento de las Figuras 43A-1 a 43B-3. Un polipéptido Pa3G comprende, adecuadamente, los dominios completos conservados previstos del Pa3G natural que se muestra en la Figura 41B. Un polipéptido Pa3G ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con las secuencia de Pa3G maduro que se muestra en la Figura 41B. El polipéptido Pa3G de la presente invención tiene, preferentemente, actividad de ß-glucosidasas .
Consecuentemente, un polipéptido Pa3G de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident.:78, o con los residuos (i) 20-354, (ii) 20-660, (iii) 20-805, (iv) 449-660, o (v) 449-805 de la sec. con núm. de ident . :78. El polipéptido tiene, adecuadamente, actividad de ß -glucosidasa .
En algunos aspectos, un "polipéptido Pa3G" de la presente invención se puede referir, además, a un polipéptido Vd3A mutante . Las sustituciones de aminoácidos se pueden introducir en el polipéptido Pa3G para mejorar la actividad de ß-glucosidasas de la molécula. Por ejemplo, las sustituciones de aminoácidos que incrementan la afinidad de unión del polipéptido Pa3G para su sustrato o que mejoran su capacidad para catalizar la hidrólisis de residuos terminales no reductores en ß-D-glucósidos se pueden introducir en el polipéptido Pa3G. En algunos aspectos, los polipéptidos Pa3G mutantes comprenden una o más sustituciones conservadoras de aminoácidos. En algunos aspectos, los polipéptidos Pa3G mutantes comprenden una o más sustituciones no conservadoras de aminoácidos. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CD del polipéptido Pa3G. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CBM del polipéptido Pa3G. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran tanto en el CD como en el CBM. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Pa3G se pueden llevar a cabo en los aminoácidos E517 y/o D289. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Pa3G se pueden llevar a cabo en uno o más de los aminoácidos D101, R107, L150, R165, K199, H209, R215, M254, Y257, D289, W290, S458 y/o E517. El polipéptido o polipéptidos Pa3G mutantes tienen, adecuadamente, actividad de ß-glucosidasas .
En algunos aspectos, el polipéptido Pa3G comprende una quimera/fusión/híbrido de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 % u 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Pa3G (sec. con núm. de ident.:78) y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident.:54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 y 79, o comprende un motivo de la secuencia de polipéptidos de la sec. con núm. de ident.:170. En algunos aspectos, la primera secuencia de ß-glucosidasas que comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de la sec. con núm. de ident.:78, y la segunda secuencia de ß-glucosidasas que comprende una secuencia C-terminal de por lo menos aproximadamente 50 residuos de aminoácidos contiguos de cualquiera de las sec. con núms. de ident.:54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 y 79, o comprende un motivo de la secuencia de polipéptidos de la sec. con núm. de ident.:170.
En ciertos aspectos, el polipéptido Pa3G de la presente invención comprende una quimera o un constructo quimérico de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec . con núms . de ident . : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de iden .: 164-169 , mientras que la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Pa3G (sec. con núm. de ident. -.78). En algunos aspectos, la primera secuencia de ß-glucosidasas comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de cualquiera de las sec. con núms. de ident. :54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident .: 164-169, y la segunda secuencia de ß-glucosidasas comprende una secuencia C-terminal de por lo menos 50 residuos de aminoácidos contiguos de la sec. con núm. de ident. :78.
En algunos aspectos, la primera secuencia de ß-glucosidasas se localiza en el extremo N-terminal del polipéptido quimérico de ß-glucosidasa, mientras que la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido quimérico de ß-glucosidasa . En ciertas modalidades, la primera, la segunda o ambas secuencias de ß-glucosidasas comprenden, además, uno o más sitios de glicosilación . En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasas se encuentran inmediatamente adyacentes entre sí o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasas no se encuentran inmediatamente adyacentes pero se conectan por medio de un dominio conector. En algunos aspectos, la primera o la segunda secuencia de ß-glucosidasas comprende una región en bucle o una secuencia que representa una estructura tipo bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En algunos aspectos, ni la primera ni la segunda secuencia de ß-glucosidasas comprende una secuencia de bucle. En algunas modalidades, el dominio conector comprende una región en bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos, una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En algunas modalidades, el dominio conector que conecta la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas se localiza en la región central (es decir, no se encuentra en el extremo N-terminal ni C-terminal del polipéptido quimérico). En algunos aspectos, la secuencia N-terminal de la ß-glucosidasa quimérica comprende una secuencia de por lo menos 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de longitud derivados de un polipéptido Pa3G o una variante de este. En algunos aspectos, la secuencia N-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec . con núms . de ident .: 136-148 o, preferentemente, los motivos de las sec. con núms. de ident .: 164-169. En algunos aspectos, la secuencia C-terminal comprende una secuencia de por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos de longitud derivados de un polipéptido de ß-glucosidasa o una variante de este. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms. de ident .: 149-156 o, preferentemente, el motivo de la sec. con núm. de ident. :170. En ciertas modalidades, el polipéptido de ß-glucosidasa, la variante de este, o el híbrido o quimérico de este, comprende, además, uno o más sitios de glicosilación. El sitio o sitios de glicosilación pueden encontrarse dentro de la secuencia C-terminal o dentro de la secuencia N-terminal, o dentro de ambas.
En algunos aspectos, la composición de celulasa o hemicelulasa que no es de origen natural de la presente invención comprende, además, una o más hemicelulasas de origen natural. En algunos aspectos, la composición de celulasa que no es de origen natural tiene una estabilidad mejorada en comparación con las enzimas naturales, que incluyen Pa3G, de donde se derivan las secuencias en C-terminal o N-terminal de la ß-glucosidasa quimérica. En algunos aspectos, la estabilidad mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución asociada en el índice o alcance de pérdida de actividad enzimática durante el almacenamiento o las condiciones de producción, en donde la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 20 %, con mayor preferencia, menor que aproximadamente 15 % o, aún con mayor preferencia, menor que aproximadamente 10 %. En algunos aspectos, la secuencia N-terminal o la secuencia C-terminal puede comprender una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). Las secuencias en el extremo N-terminal y C-terminal pueden estar inmediatamente adyacentes o directamente conectadas entre sí. En otros aspectos, la secuencia N-terminal y la secuencia C-terminal pueden estar conectadas por medio de un dominio conector . En ciertas modalidades, el dominio conector comprende una secuencia de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident. :171) o de FD (R/K) YNIT (sec. con núm. de ident.:172) . En algunos aspectos, la composición de celulasa que no es de origen natural comprende actividad de ß-glucosidasas . En algunos aspectos, la composición de celulasa que no es de origen natural comprende, además, una o más de las actividades de xilanasa, ß-xilosidasa y/o L-a-arabinofuranosidasa .
Tn3B La secuencia de aminoácidos de Tn3B (sec. con núm. de ident . :79) se muestra en las Figuras 42 y 43A-1 a 43B-3. La sec. con núm. de ident. 79 es la secuencia del inmaduro Tn3B. El algoritmo SignalP-NN (http://www.cbs.dtu.dk) no proporcionar una secuencia señal prevista. Se prevé que los residuos de Tn3B E458 y D242 funcionan como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las glucosidasas de GH3 , por ejemplo, P. anserina (núm. de registro XP_001912683 ) , V. dahliae, N. haematococca (núm. de registro XP_003045443 ) , G. zeae (núm. de registro XP_386781) , F. oxysporum (núm. de registro BGL FOXG_02349) , A. niger (núm. de registro CAK48740) , T. emersonii (núm. de registro AAL69548) , T. reesei (núm. de registro AAP57755) , T. reesei (núm. de registro AAA18473) , F. verticillioídes y T. neapolitana (núm. de registro Q0GC07) , etc. mencionadas anteriormente (ver las Figuras 43A-1 a 43B-3) . Como se usa en la presente descripción, "un polipéptido Tn3B" se refiere, en algunos aspectos, a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 o 750 residuos de aminoácidos contiguos de la sec. con núm. de ident.:79. Un polipéptido Tn3B se encuentra, preferentemente, inalterado, en comparación con un Tn3B natural, en los residuos E458 y D242. Un polipéptido Tn3B se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre las ß-glucosidasas de la familia GH3 descritas en la presente descripción tal como se muestra en el alineamiento de las Figuras 43A-1 a 43B-3. Un polipéptido Tn3B comprende, adecuadamente, los dominios completos conservados previstos del Tn3B natural que se muestra en las Figuras 43A-1 a 43B-3. Un polipéptido Tn3B ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % O 100 % de identidad con la secuencia de Tn3B maduro que se muestra en la Figura 42. El polipéptido Tn3B de la presente invención tiene, preferentemente, actividad de ß-glucosidasas .
Consecuentemente, un polipéptido Tn3B de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident.:79. El polipéptido tiene, adecuadamente, actividad de ß-glucosidasa .
En algunos aspectos, un "polipéptido Tn3B" de la presente invención se puede referir, además, a un polipéptido Tn3B mutante . Las sustituciones de aminoácidos se pueden introducir en el polipéptido Tn3B para mejorar la actividad de ¦ ß-glucosidasas de la molécula. Por ejemplo, las sustituciones de aminoácidos que incrementan la afinidad de unión del polipéptido Tn3B para su sustrato o que mejoran la capacidad de Tn3B para catalizar la hidrólisis de residuos terminales no reductores en ß-D-glucósidos se pueden introducir en el polipéptido Tn3B. En algunos aspectos, los polipéptidos Tn3B mutantes comprenden una o más sustituciones conservadoras de aminoácidos. En algunos aspectos, los polipéptidos Tn3B mutantes comprenden una o más sustituciones no conservadoras de aminoácidos. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CD del polipéptido Tn3B. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran en el CBM del polipéptido Tn3B. En algunos aspectos, la sustitución o sustituciones de aminoácidos se encuentran tanto en el CD como en el CBM. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Tn3B se pueden llevar a cabo en los aminoácidos E458 y/o D242. En algunos aspectos, las sustituciones de aminoácidos del polipéptido Tn3B se pueden llevar a cabo en uno o más de los aminoácidos D58, R64, L116, R130, K163, H164, R174, M207, Y210, D242, W243, S370 y/o E458. El polipéptido o polipéptidos Tn3B mutantes tienen, adecuadamente, actividad de ß-glucosidasas .
En algunos aspectos, el polipéptido Tn3B comprende una quimera/fusión/híbrido de dos secuencias de ß-glucosidasas, en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 % u 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Tn3B (sec. con núm. de ident.:79) y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms . de ident.:54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 y 78, o comprende un motivo de la secuencia de polipéptidos de la sec. con núm. de ident.:170. En algunos aspectos, la primera secuencia de ß-glucosidasas que comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de la sec. con núm. de ident.:79 y la segunda secuencia de ß-glucosidasas que comprende una secuencia C-terminal de por lo menos aproximadamente 50 residuos de aminoácidos contiguos de cualquiera de las sec. con núms . de ident. :54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 y 78, o comprende un motivo de la secuencia de polipéptidos de la sec. con nüm. de ident. :170.
En ciertos aspectos, el polipéptido Tn3B de la presente invención comprende una quimera o un constructo quimérico de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß -glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las sec. con núms. de ident. : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 y 78, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident. : 164-169, mientras que la segunda secuencia de ß -glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, 65 %, 70 %, 75 %, 80 % o más de identidad de secuencias con una secuencia de la misma longitud de Tn3B (sec. con núm. de ident. :79) . En algunos aspectos, la primera secuencia de ß -glucosidasas comprende una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de cualquiera de las sec. con núms . de ident.:54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76 y 78, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident . : 164-169, y la segunda secuencia de ß-glucosidasas comprende una secuencia C-terminal de por lo menos 50 residuos de aminoácidos contiguos de la sec. con núm. de ident. :79.
En algunos aspectos, la primera secuencia de ß-glucosidasas se localiza en el extremo N-terminal del polipéptido quimérico de ß-glucosidasa, mientras que la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido quimérico de ß-glucosidasa. En ciertas modalidades, la primera, la segunda o ambas secuencias de ß-glucosidasas comprenden, además, uno o más sitios de glicosilación . En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasas se encuentran inmediatamente adyacentes entre sí o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasas no se encuentran inmediatamente adyacentes pero se conectan por medio de un dominio conector. En algunos aspectos, la primera o la segunda secuencia de ß-glucosidasas comprende una región en bucle o una secuencia que representa una estructura tipo bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) Y IT (sec. con núm. de ident.:172) . En algunos aspectos, ni la primera ??· la segunda secuencia de ß-glucosidasas comprende una secuencia de bucle. En algunas modalidades, el dominio conector comprende una región en bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos. En algunas modalidades, el dominio conector que conecta la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas se localiza en la región central (es decir, no se encuentra en el extremo N-terminal ni C-terminal del polipéptido quimérico) . En algunos aspectos, la secuencia N-terminal de la ß-glucosidasa quimérica comprende una secuencia de por lo menos 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de longitud derivados de un polipéptido Tn3B o una variante de este. En algunos aspectos, la secuencia N-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms . de ident .: 136-148 o, preferentemente, los motivos de las sec. con núms. de ident .: 164-169. En algunos aspectos, la secuencia C-terminal comprende una secuencia de por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos de longitud derivados de un polipéptido de ß-glucosidasa o una variante de este. En algunos aspectos, la secuencia C-terminal comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms . de ident .: 149-156 o, preferentemente, el motivo de la sec. con núm. de ident. :170. En ciertas modalidades, el polipéptido de ß-glucosidasa, la variante de este, o el híbrido o quimérico de este, comprende, además, uno o más sitios de glicosilación. El sitio o sitios de glicosilación pueden encontrarse dentro de la secuencia C-terminal o dentro de la secuencia N-terminal, o dentro de ambas.
En algunos aspectos, la composición de celulasa o hemicelulasa que no es de origen natural de la presente invención comprende, además, una o más hemicelulasas de origen natural. En algunos aspectos, la composición de celulasa que no es de origen natural tiene una estabilidad mejorada en comparación con las enzimas naturales, que incluyen Tn3B, de donde se derivan las secuencias en C-terminal o N-terminal de la ß-glucosidasa quimérica. En algunos aspectos, la estabilidad mejorada comprende una mejoría en la estabilidad proteolítica durante el almacenamiento, la expresión o los procesos de producción. En algunos aspectos, la estabilidad mejorada comprende una disminución asociada en el índice o alcance de pérdida de actividad enzimática durante el almacenamiento o las condiciones de producción, en donde la pérdida de actividad enzimática es, preferentemente, menor que aproximadamente 50 %, menor que aproximadamente 40 %, menor que aproximadamente 20 %, con mayor preferencia, menor que aproximadamente 15 % o, aún con mayor preferencia, menor que aproximadamente 10 % . En algunos aspectos, la secuencia N-terminal o la secuencia C-terminal puede comprender una secuencia de bucle que comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). Las secuencias en el extremo N-terminal y C-terminal pueden estar inmediatamente adyacentes o directamente conectadas entre sí. En otros aspectos, la secuencia N-terminal y la secuencia C-terminal pueden estar conectadas por medio de un dominio conector. En ciertas modalidades, el dominio conector comprende una secuencia de bucle de aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En algunos aspectos, la composición de celulasa que no es de origen natural comprende actividad de ß-glucosidasas . En algunos aspectos, la composición de celulasa que no es de origen natural comprende, además, una o más de las actividades de xilanasa, ß-xilosidasa y/o L-a-arabinofuranosidasa . Ácidos nucleicos Los ácidos nucleicos de ß-glucosidasa ilustrativos incluyen ácidos nucleicos que codifican un polipéptido, fragmento de un polipéptido, péptido o polipéptido de fusión que tiene por lo menos una actividad de un polipéptido de ß-glucosidasa. Los polipéptidos de ß-glucosidasa y ácidos nucleicos ilustrativos incluyen polipéptidos y ácidos nucleicos de origen natural a partir de cualquiera de los organismos de recurso descritos en la presente descripción, así como polipéptidos y ácidos nucleicos mutantes derivados de cualquiera de los organismos de recurso descritos en la presente descripción. Los ácidos nucleicos de ß-glucosidasa ilustrativos incluyen, por ejemplo, ß-glucosidasa aislada de, sin limitarse a, uno o más de los siguientes organismos: Crinipellis scapella, Macrophomina phaseolina, Myceliophthora thermophila, Sordaria fimicola, Volutella colletotrichoides, Thielavia terrestris, Acremonium sp. , Exidia glandulosa, Fomes fomentarius, Spongipellis sp. , Rhizophlyctis rosea, Rhizomucor pusillus, Phycomyces niteus, Chaetostylum fresenii , Diplodia gossypina, Ulospora bilgramii , Saccobolus dilutellus, Penicillium verruculosum, Penicillium chrysogenum, Thermomyces verrucosus, Diaporthe syngenesia, Colletotrichum lagenarium, Nigrospora sp. , Xylaria hypoxylon, Nectria pinea, Sordaria macrospora, Thielavia thermophila, Chaetomium mororu , Chaetomium virscens, Chaetomium brasiliensis, Chaetomium cunicolorum, Syspastospora boninensis, Cladorrhinum foecundissimum, Scytalidium thermophila, Gliocladium catenulatum, Fusarium oxysporum ssp. lycopersici , Fusarium oxysporum ssp. passiflora, Fusarium solani , Fusarium anguioides, Fusarium poae, Humicola nigrescens, Hu icola grisea, Panaeolus retirugis, Trametes sanguínea, Schizophyllum commune, Trichothecium roseum, Microsphaeropsis sp. , Acsobolus stictoideus spej . , Poronia punctata, Nodulisporum sp. , Trichoder a sp. (por ejemplo, T. reesei) y Cylindrocarpon sp.
La presente descripción proporciona ácidos nucleicos aislados, sintéticos o recombinantes que comprenden una secuencia de ácido nucleico que tiene por lo menos aproximadamente 70 %, por ejemplo, por lo menos aproximadamente 71 %, 72 %, 73 %, 74 %, 75 g, ¾ / 76 g, "S / 77 g, ¾ / 78 %, 79 %, 80 %, 81 %, 82 o. 83 Q, "° / 84 o / 85 %, 86 o o / 87 %, 88 %; 89 %, 90 %, 91 %, 92 o 93 O, ¾ , 94 o %, 95 %, 96 "ó , 97 %, 98 O, o o 99 % o un total (100 %) de identidad de secuencias con un ácido nucleico de la sec. con núm. de ident.:l, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 46, 47, 48, 49, 50, 51, 53, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75 o 77 con una región de por lo menos aproximadamente 10, por ejemplo, por lo menos aproximadamente 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950 o 2000 nucleótidos . La presente descripción proporciona, además, ácidos nucleicos que codifican por lo menos un polipéptido que tiene una actividad hemicelulolítica [por ejemplo, actividad de una xilanasa, ß-xilosidasa y/o L-a- arabinofuranosidasa) . Además, la presente descripción proporciona ácidos nucleicos que codifican polipéptidos que tienen actividades celulolíticas (por ejemplo, actividad de ß-glucosidasas o actividad de endoglucanasas) .
Los ácidos nucleicos de la presente descripción incluyen, además, ácidos nucleicos aislados, sintéticos o recombinantes que codifican una enzima o una porción madura de una enzima que comprende la secuencia de la sec . con núm. de ident . : 2 , 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 43, 44, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 o 79, o para una enzima endoglucanasa GH61 o una porción madura de esa enzima que comprende los motivos de las secuencias de polipéptidos: (1) sec. con núms . de ident .: 84 y 88; (2) sec. con núms. de ident. :85 y 88; (3) sec. con núm. de ident. :86; (4) sec. con núm. de ident. :87; (5) sec. con núms. de ident. :84, 88 y 89; (6) sec. con núms. de ident. :85, 88 y 89; (7) sec. con núms. de ident.: 84, 88 y 90; (8) sec. con núms. de ident.: 85, 88 y 90; (9) sec. con núms. de ident.: 84, 88 y 91; (10) sec . con núms. de ident.: 85, 88 y 91; (11) sec. con núms. de ident.: 84, 88, 89 y 91; (12) sec. con núms. de ident.: 84, 88, 90 y 91; (13) sec. con núms. de ident.: 85, 88, 89 y 91; y (14) sec. con núms. de ident.: 85, 88, 90 y 91 y subsecuencias de estas (por ejemplo, un dominio conservado o dominio de unión a carbohidratos ("CBM") y variantes de estos.
La descripción proporciona, específicamente, un ácido nucleico que codifica Fv3A, Pf43A, Fv43E, Fv39A, Fv43A, Fv43B, Pa51A, Gz43A, Fo43A, Af43A, Pf51A, AfuXyn2 , AfuXyn5, Fv43D, Pf43B, Fv43B, Fv51A, Xyn3 de T. reesei ,¦ Xyn2 de T. reesei, Bxll de T. reesei, Bgll (Tr3A) de T. reesei, Eg4 de T. reesei, Bgl3 (Tr3B) de T. reesei, Pa3D, Fv3G, Fv3D, Fv3C, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G o un polipéptido Tn3B, una variante, un mutante o un polipéptido híbrido o quimérico de estos. En algunos aspectos, la presente descripción proporciona un ácido nucleico que codifica una enzima quimérica o de fusión que comprende, por ejemplo, una primera secuencia de ß-glucosidasas y una segunda secuencia de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas se derivan de diferentes organismos. En cierto aspecto, la primera secuencia de ß-glucosidasas se encuentra en el extremo N-terminal y la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido híbrido o quimérico de ß-glucosidasa . En cierto aspecto, la primera secuencia de ß -glucosidasas , o más específicamente, el extremo C-terminal de la primera secuencia de ß-glucosidasas se encuentra directamente adyacente o conectado a segunda secuencia de ß -glucosidasas , o más específicamente, al extremo N-terminal de la segunda secuencia de ß -glucosidasas . En algunas modalidades, la primera secuencia de ß-glucosidasas y la segunda secuencia de ß -glucosidasas no se encuentran directamente adyacentes o conectadas, más bien, la primera secuencia de ß-glucosidasas se une operativamente o se conecta a segunda secuencia de ß-glucosidasas por medio de una secuencia conectora o dominio conector. En algunos ejemplos, la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms . de ident . : 136-148, mientras que la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende uno o más o todos los motivos de las secuencias de polipéptidos representadas por las sec. con núms. de ident.: 149-156. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) de los motivos de las secuencias de aminoácidos de las sec. con núms. de ident.: 164-169, y la segunda de las dos o más secuencias de ß-glucosidasa tiene por lo menos 50 residuos de aminoácidos de longitud y comprende la sec. con núm. de ident.: 170. En algunos aspectos, la primera secuencia de ß -glucosidasas y la segunda secuencia de ß-glucosidasas están directamente conectadas o inmediatamente adyacentes entre sí. En cierto aspecto, la primera secuencia de ß-glucosidasas no se encuentra directamente conectada o inmediatamente adyacente a segunda secuencia de ß-glucosidasas , más bien, la primera y la segunda secuencia de ß -glucosidasa se conectan por medio de una secuencia conectora. En ciertas modalidades, la secuencia conectora se encuentra en la región central. En cierto ejemplo específico, la primera secuencia de ß -glucosidasas comprende una secuencia, por ejemplo, una secuencia N-terminal de por lo menos 200 residuos de aminoácidos de longitud de un polipéptido Fv3C. En algunas modalidades, la segunda secuencia de ß-glucosidasas comprende una secuencia, por ejemplo, una secuencia C-terminal de por lo menos 50 residuos de aminoácidos de longitud, de un polipéptido Bgl3 de T. reesei. En un ejemplo particular, el polipéptido de ß-glucosidasa es un polipéptido Fv3C híbrido o quimérico, o un polipéptido Bgl3 (Tr3B) de T. reesei y comprende una secuencia de aminoácidos de la sec. con núm. de ident.:159. En otro ejemplo, el polipéptido de ß -glucosidasa es un polipéptido Fv3C híbrido o quimérico, o un polipéptido Bgl3 de T. reesei, qµe comprende, opcionalmente , una secuencia conectora derivada de un tercer polipéptido de la secuencia de ß-glucosidasas , en donde el polipéptido de ß-glucosidasa comprende una secuencia de aminoácidos de la sec. con núm. de ident.:135. Además, en algunos aspectos, la enzima quimérica o de fusión comprende, adecuadamente, una secuencia conectora y, por lo tanto, la descripción proporciona un ácido nucleico que codifica una enzima quimérica que puede considerarse como un polipéptido de ß-glucosidasa de donde se deriva la secuencia N-terminal, la secuencia C-terminal o subsecuencias de estas. Por ejemplo, un polipéptido Fv3C/Bgl3 híbrido puede considerarse como un polipéptido Fv3C, una variante de este, un polipéptido Bgl3 de T. reesei , una variante de este, o un polipéptido Fv3C/Bgl3 quimérico o una variante de este. En otro ejemplo, un polipéptido Fv3C/Te3A/Bgl3 híbrido puede considerarse como un polipéptido Fv3C o una variante de este, un polipéptido Bgl3 de T. reesei o una variante de este, un polipéptido Te3A o una variante de este, o un polipéptido Fv3C/Te3A/Bgl3 quimérico o una variante de este.
El término "variante", cuando se usa en el contexto de una secuencia de polinucleótidos , puede incluir una secuencia de polinucleótidos relacionada con la de un gen o la secuencia codificante de esta. Esta definición puede incluir, además, por ejemplo, variantes "alélicas", "de empalme" "de especies" o "polimórficas" . Una variante de empalme puede tener una identidad significativa con un polinucleótido de referencia, pero tiene, generalmente, una cantidad mayor o menor de residuos debido al empalme alterno de exones durante el procesamiento de ARNm. El polipéptido correspondiente puede tener dominios funcionales adicionales o en ausencia de dominios. Las variantes de especies son secuencias de polinucleótidos que varían de una especie a otra. Los polipéptidos resultantes tienen, generalmente, una identidad significativa de aminoácidos en relación unos con otros, como se detalle adicionalmente . Una variante polimórfica es una variación en la secuencia de polinucleótidos de un gen particular entre individuos de una especie específica.
Por ejemplo, la presente descripción proporciona una molécula de ácido nucleico aislada, en donde la molécula de ácido nucleico codifica: (1) un polipéptido que comprende una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident. :54, o con los residuos (i) 18-282, (ii) 18-601, (iii) 18-733, (iv) 356-601, o (v) 356-733 de la sec. con núm. de ident . : 54 ; o (2) un polipéptido que comprende una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident. :56, o con los residuos (i) 22-292, (ii) 22-629, (iii) 22-780, (iv) 373-629, o (v) 373-780 de la sec. con núm. de ident . : 56 ; o (3) un polipéptido que comprende una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident.:58, o con los residuos (i) 20-321, (ii) 20-651, (iii) 20-811, (iv) 423-651, o (v) 423-811 de la sec. con núm. de ident . : 58 ; o (4) un polipéptido que comprende una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 ¾, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident. :60, o con los residuos (i) 20-327, (ii) 22-600, (iii) 20-899, (iv) 428-899, o (v) 428-660 de la sec. con núm. de ident . : 60 ; o (5) un polipéptido que comprende una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident. :62, o con los residuos (i) 20-287, (ii) 22-611, (iii) 20-744, (iv) 362-611, o (v) 362-744 de la sec. con núm. de ident . : 62 ; o (6) un polipéptido que comprende una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident. :64, o con los residuos (i) 19-307, (ii) 19-640, (iii) 19-874, (iv) 407-640, o (v) 407-874 de la sec . con núm. de ident . : 64 ; o (7) un polipéptido que comprende una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident. :66, o con los residuos (i) 20-297, (ii) 20-629, (iii) 20-857, (iv) 396-629, o (v) 396-857 de la sec. con núm. de ident . : 66 ; o (8) un polipéptido que comprende una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident. :68, o con los residuos (i) 20-300, (ii) 20-634, (iii) 20-860, (iv) 400-634, o (v) 400-860 de la sec. con núm. de ident . : 68 ; o (9) un polipéptido que comprende una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident. :70, o con los residuos (i) 20-327, (ii) 20-660, (iii) 20-899, (iv) 428-660, o (v) 428-899 de la sec. con núm. de ident . : 70 ; o (10) un polipéptido que comprende una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident.:72, o con los residuos (i) 19-314, (ii) 19-647, (iii) 19-886, (iv) 415-647, o (v) 415-886 de la sec. con núm. de ident . : 72 ; o (11) un polipéptido que comprende una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident. :74, o con los residuos (i) 20-295, (ii) 20-647, (iii) 20-880, (iv) 414-647, o (v) 414-880 de la sec. con núm. de ident . : 74 ; o (121) un polipéptido que comprende una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident. :76, o con los residuos (i) 19-296, (ii) 19-649, (iii) 19-890, (iv) 415-649, o (v) 415-890 de la sec. con núm. de ident . : 76 ; o (13) un polipéptido que comprende una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident. :78, o con los residuos (i) 20-354, (ii) 20-660, (iii) 20-805, (iv) 449-660, o (v) 449-805 de la sec. con núm. de ident . : 78 ; o (14) un polipéptido que comprende una secuencia de aminoácidos con por lo menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident. :79.
La descripción instantánea proporciona, además: (1) un ácido nucleico que tiene por lo menos 90 % (por ejemplo, por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencias con la sec. con núm. de ident. :53, o un ácido nucleico que tiene la capacidad de hibridizarse en condiciones de rigurosidad alta en un complemento de la sec. con núm. de ident. :53, o en un fragmento de esta; o (2) un ácido nucleico que tiene por lo menos 90 % (por ejemplo, por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencias con la sec. con núm. de ident. :55, o un ácido nucleico que tiene la capacidad de hibridizarse en condiciones de rigurosidad alta en un complemento de la sec. con núm. de ident. :55, o en un fragmento de esta; o (3) un ácido nucleico que tiene por lo menos 90 % (por ejemplo, por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %,· 98 %, 99 % o más) de identidad de secuencias con la sec. con núm. de ident. :57, o un ácido nucleico que tiene la capacidad de hibridizarse en condiciones de rigurosidad alta en un complemento de la sec . con núm. de ident . :57, o en un fragmento de esta; o (4) un ácido nucleico que tiene por lo menos 90 % (por ejemplo, por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencias con la sec. con núm. de ident. :59, o un ácido nucleico que tiene la capacidad de hibridizarse en condiciones de rigurosidad alta en un complemento de la sec. con núm. de ident. :59, o en un fragmento de esta; o (5) un ácido nucleico que tiene por lo menos 90 % (por ejemplo, por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencias con la sec. con núm. de ident. :61, o un ácido nucleico que tiene la capacidad de hibridizarse en condiciones de rigurosidad alta en un complemento de la sec. con núm. de ident. :61, o con un fragmento de esta; o (6) un ácido nucleico que tiene por lo menos 90 % (por ejemplo, por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 , 99 % o más) de identidad de secuencias con la sec. con núm. de ident.: 63, o un ácido nucleico que tiene la capacidad de hibridizarse en condiciones de rigurosidad alta en un complemento de la sec. con núm. de ident.: 63, o con un fragmento de esta; o (7) un ácido nucleico que tiene por lo menos 90 % (por ejemplo, por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencias con la sec. con núm. de ident.:65, o un ácido nucleico que tiene la capacidad de hibridizarse en condiciones de rigurosidad alta en un complemento de la sec. con núm. de ident.:65, o con un fragmento de esta; o (8) un ácido nucleico que tiene por lo menos 90 % (por ejemplo, por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencias con la sec. con núm. de ident. :67, o un ácido nucleico que tiene la capacidad de hibridizarse en condiciones de rigurosidad alta en un complemento de la sec. con núm. de ident. :67, o con un fragmento de esta; o (9) un ácido nucleico que tiene por lo menos 90 % (por ejemplo, por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencias con la sec. con núm. de ident. :69, o un ácido nucleico que tiene la capacidad de hibridizarse en condiciones de rigurosidad alta en un complemento de la sec. con núm. de ident.: 69, o con un fragmento de esta; o (10) un ácido nucleico que tiene por lo menos 90 % (por ejemplo, por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencias con la sec. con núm. de ident. :71, o un ácido nucleico que tiene la capacidad de hibridizarse en condiciones de rigurosidad alta en un complemento de la sec. con núm. de ident.:71, o con un fragmento de esta; o (11) un ácido nucleico que tiene por lo menos 90 % (por ejemplo, por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencias con la sec. con núm. de ident . :73, o un ácido nucleico que tiene la capacidad de hibridizarse en condiciones de rigurosidad alta en un complemento de la sec. con núm. de ident. :73, o con un fragmento de esta; o (12) un ácido nucleico que tiene por lo menos 90 % (por ejemplo, por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencias con la sec. con núm. de ident. :75, o un ácido nucleico que tiene la capacidad de hibridizarse en condiciones de rigurosidad alta en un complemento de la sec. con núm. de ident. :75, o con un fragmento de esta; o (13) un ácido nucleico que tiene por lo menos 90 % (por ejemplo, por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más) de identidad de secuencias con la sec. con núm. de ident. :77, o un ácido nucleico que tiene la capacidad de hibridizarse en condiciones de rigurosidad alta en un complemento de la sec. con núm. de ident. :77, o con un fragmento de esta.
Como se usa en la presente descripción, el término "hibridizarse en condiciones de rigurosidad baja, rigurosidad media, rigurosidad alta o rigurosidad muy alta" describe las condiciones para la hibridación y lavado. Las instrucciones para llevar a cabo las reacciones de hibridación se pueden encontrar en Current Protocols in Molecular Biology, John iley & Sons, N.Y. (1989), 6.3.1 - 6.3.6. El método acuoso y no acuoso se describen en esa referencia y se puede usar cualquier método. Las condiciones de hibridación específicas mencionadas en la presente descripción son las siguientes: 1) condiciones de hibridación de rigurosidad baja en cloruro sódico/citrato sódico (SSC) 6X a aproximadamente 45 °C, seguido por dos lavados en SSC 0.2X, SDS al 0.1 % a por lo menos 50 °C (la temperatura de los lavados se pueden incrementar hasta 55 °C para condiciones de rigurosidad baja) ; 2) condiciones de hibridación de rigurosidad media en SSC 6X a aproximadamente 45 °C, seguido por uno o más lavados en SSC 0.2X, SDS al 0.1 % a 60 °C; 3) condiciones de hibridación de rigurosidad alta en SSC 6X a aproximadamente 45 °C, seguido por uno o más lavados en SSC 0.2.X, SDS al 0.1 % a 65 °C y, preferentemente, 4) condiciones de hibridación de rigurosidad muy alta en fosfato sódico 0.5 M, SDS al 7 % a 65 °C, seguido por una o más lavados a SSC 0.2X, SDS al 1 % a 65 °C. Se prefiere las condiciones de rigurosidad alta (4) a menos que se especifique de cualquier otra forma.
Ejemplo de métodos para aislar ácidos nucleicos La ß-glucosidasa y otros ácidos nucleicos de la presente descripción se pueden aislar con el uso de métodos convencionales. Los métodos para obtener los ácidos nucleicos deseados a partir de un organismo de recurso de interés (tal como un genoma bacteriano) son comunes y bien conocidos en la técnica de biología molecular. Los métodos convencionales para aislar ácidos nucleicos, que incluyen la amplificación de PCR de secuencias conocidas, síntesis de ácidos nucleicos, evaluación de librerías genómicas, evaluación de librerías de cósmidos, se describen en la publicación internacional núm. WO 2009/076676 A2 y en la solicitud de patente de los Estados Unidos núm. 12/335,071. Ejemplos de células huésped La presente descripción proporciona células huésped modificadas para expresar una o más enzimas de la presente descripción. Las células huésped adecuadas incluyen células de cualquier microorganismo (por ejemplo, células de una bacteria, un organismo del reino protista, un alga, un hongo (por ejemplo, una levadura u hongo filamentoso) u otro microbio) y son, preferentemente, células de una bacteria, una levadura o un hongo filamentoso.
Las células huésped adecuadas de los géneros bacterianos incluyen, pero no se limitan a, células de Escherichia , Bacillus , Lactobacillus, Pseudomonas y Streptomyces . Las células adecuadas de especies bacterianas incluyen, pero no se limitan a, células de Escherichia coli, Bacillus subtilis , Bacillus licheniformis, Lactobacillus brevis, Pseudomonas aeruginosa y Streptomyces lividans .
Las células huésped adecuadas de los géneros de levadura incluyen, pero no se limitan a, células de Saccharomyces , Schizosaccharomyces , Candida, Hansenula, Pichia, Kluyveromyces y Phaffia. Las células adecuadas de especies de levadura incluyen, pero no se limitan a, células de Saccharomyces cerevisiae , Schizosaccharomyces pombe, Candida albicans , Hansenula polymorpha, Pichia pastoras, J?. canadensis , Kluyveromyces marxianus y Phaffia rhodozyma.
Las células huésped adecuadas de hongos filamentosos incluyen todas las formas filamentosas de la subdivisión Eumycotina . Las células adecuadas de géneros fúngicos filamentosos incluyen, pero no se limitan a, células de Acremonium, Aspergillus , Aureobasidium, Bjerkandera, Ceriporiopsis , Chrysoporium, Coprinus , Coriolus , Corynascus , Chaertomium, Cryptococcus , Filobasidium, Fusarium, Gibberella , Humicola, Magnaporthe, Mucor, Myceliophthora , Mucor, Neocallimastix, Neurospora , Paecilomyces , Penicillium, Phanerochaete , Phlebia, Piromyces, Pleurotus , Scytaldium, Schizophyllum, Sporotrichum, Talaromyces , Ther oascus , Thielavia, Tolypocladium, Trametes y Trichoderma.
Las células adecuadas de especies fúngicas filamentosas incluyen, pero no se limitan a, células de Aspergillus awa ori, Aspergillus fumigatus, Aspergillus foetidus, Aspergíllus japonicus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Chrysosporium lucknowense, Fusarium bactridioides, Fusarium cerealis, Fusarium crookwellense, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureu , Fusarium torulosum, Fusarium trichothecioides, Fusarium venenatum, Bjerkandera adusta, Ceriporiopsis aneirina, Ceriporiopsis aneirina, Ceriporiopsis caregiea, Ceriporiopsis gilvescens, Ceriporiopsis pannocinta, Ceriporiopsis rivulosa, Ceriporiopsis subrufa, Ceriporiopsis subvermispora, Coprinus cinereus, Coriolus hirsutus, Humicola insolens, Humicola lanuginosa, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Neurospora intermedia, Penicillium purpurogenum, Penicillium canescens, Penicillium solitum, Penicillium funiculosum Phanerochaete chrysosporium, Phlebia radíate, Pleurotus eryngii, Talaromyces flavus, Thielavia terrestris, Trametes villosa, Trametes versicolor, Trichoderma harzianum, Trichoderma koníngii, Trichoderma longibrachiatum, Trichoderma reesei y Trichoderma viride.
La presente descripción proporciona, además, una célula huésped recombinante diseñada para expresar uno o más, dos o más, tres o más, cuatro o más, o cinco o más de Fv3A, Pf43A, Fv43E, Fv39A, Fv43A, Fv43B, Pa51A, Gz43A, Fo43A, Af43A, Pf51A, AfuXyn2, AfuXyn5 , Fv43D, Pf43B, Fv43B, Fv51A, Xyn3 de T. reesei, Xyn2 de G. reesei, Bxll de T. reesei, Bgll (Tr3A) de T. reesei, una endoglucanasa GH61, Eg4 de T. reesei, Pa3D, Fv3G, Fv3D, Fv3C, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G o un polipéptido Tn3B, o una variante de estos.
En ciertas modalidades, se contempla la célula huésped recombinante que expresa enzimas híbridas o quiméricas derivadas de dos o más secuencias de celulasa y/o secuencias de hemicelulasa . En algunos aspectos, la enzima híbrida o quimérica comprende dos o más secuencias de ß-glucosidasas . En algunos aspectos, la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec . con núms . de ident . : 136 - 148 , y la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende uno o más o todos los motivos de las secuencias de polipéptidos seleccionadas de las sec. con núms. de ident.: 149-156. Particularmente, la primera de las dos o más secuencias de ß -glucosidasa tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) de los motivos de las secuencias de aminoácidos de las sec. con núms. de ident.: 164-169, y la segunda de las dos o más secuencias de ß-glucosidasa tiene por lo menos 50 residuos de aminoácidos de longitud y comprende la sec. con núm. de ident.:170. En ciertas modalidades, la primera secuencia de ß-glucosidasas está en el extremo N-terminal y la segunda secuencia de ß-glucosidasas está en el extremo C-terminal del polipéptido híbrido o quimérico. En ciertas modalidades, la primera y la segunda secuencia de -glucosidasas se encuentran inmediatamente adyacentes o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasas no se encuentran inmediatamente adyacentes o directamente conectadas, más bien se conectan por medio de un dominio conector. En ciertas modalidades, el dominio conector se encuentra en la región central. En ciertos aspectos, ya sea la primera o la segunda secuencia de ß-glucosidasas comprende una secuencia de bucle que tiene aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) Y IT (sec. con núm. de ident.:172), cuya modificación mejora la estabilidad del polipéptido híbrido o quimérico en comparación con el polipéptido homólogo no modificado, o los polipéptidos de donde se derivan las partes quiméricas del polipéptido híbrido o quimérico. En ciertas modalidades, ni la primera ni la segunda secuencia de ß-glucosidasas comprende la secuencia en bucle, más bien el dominio conector comprende la secuencia en bucle. En algunas modalidades, la modificación de la secuencia en bucle, por ejemplo, acortamiento, alargamiento, eliminación, reempbucle, sustitución u otra modificación que modifica la secuencia, reduce el clivaje de los residuos en la secuencia en bucle. En otras modalidades, la modificación de la secuencia en bucle reduce el clivaje de residuos en sitios fuera de la secuencia en bucle.
En ciertas modalidades, se contempla la célula huésped recombinante que expresa enzimas híbridas o quiméricas derivadas de dos o más secuencias de celulasa y/o secuencias de hemicelulasa . En algunos aspectos, la enzima híbrida o quimérica comprende dos o más secuencias de ß -glucosidasa . En algunas modalidades, la célula huésped recombinante que expresa enzimas híbridas o quiméricas que comprenden una primera secuencia tiene por lo menos aproximadamente 200 residuos de aminoácidos contiguos de longitud y tiene por lo menos 60 %, 70 %, 80 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más de identidad de secuencias con una secuencia de la misma longitud de la sec . con núm. de ident . :60; y una segunda secuencia tiene por lo menos aproximadamente 50 residuos de aminoácidos contiguos de longitud y tiene por lo menos aproximadamente 60 %, 70 %, 80 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más de identidad de secuencias con una secuencia de la misma longitud con cualquiera de las sec. con núms . de ident.:54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79. En modalidades alternas, la célula huésped recombinante que expresa enzimas híbridas o quiméricas que comprenden una primera secuencia tiene por lo menos aproximadamente 200 residuos de aminoácidos contiguos de longitud y tiene por lo menos 60 %, 70 %, 80 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más de identidad de secuencias con una secuencia de la misma longitud con cualquiera de las sec. con núms . de ident.:54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79; y una segunda secuencia tiene por lo menos aproximadamente 50 residuos de aminoácidos contiguos de longitud y tiene por lo menos aproximadamente 60 I, 70 %, 80 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más de identidad de secuencias con una secuencia de la sec. con núm. de ident. :60. En ciertas modalidades, la primera secuencia de ß-glucosidasa está en el extremo N-terminal y la segunda secuencia de ß-glucosidasa está en el extremo C-terminal del polipéptido híbrido o quimérico. En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasa se encuentran inmediatamente adyacentes o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß -glucosidasa no se encuentran inmediatamente adyacentes o directamente conectadas, más bien se conectan por medio de un dominio conector. En ciertas modalidades, el dominio conector se encuentra en la región central. En ciertos aspectos, ya sea la primera o la segunda secuencia de ß-glucosidasas comprende una secuencia en bucle que tiene aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172) cuya modificación mejora la estabilidad del polipéptido híbrido o quimérico en comparación con el polipéptido homólogo no modificado o los polipéptidos de donde se derivan las partes quiméricas del polipéptido híbrido o quimérico. En ciertas modalidades, ni la primera ni la segunda secuencia de ß-glucosidasas comprende la secuencia en bucle, más bien el dominio conector comprende la secuencia en bucle. En algunas modalidades, la modificación de la secuencia en bucle, por ejemplo, acortamiento, alargamiento, eliminación, reempbucle, sustitución u otra modificación que modifica la secuencia, reduce el clivaje de los residuos en la secuencia en bucle. En otras modalidades, la modificación de la secuencia en bucle reduce el clivaje de residuos en sitios fuera de la secuencia en bucle.
En algunos aspectos, la célula huésped recombinante expresa una o más enzimas quiméricas, por ejemplo, una enzima de fusión Fv3C, una enzima de fusión Bgl3 de T. reesei, una enzima de fusión Fv3C/Bgl3, una enzima de fusión Te3A o una enzima de fusión Fv3C/Te3A/Bgl3. Para la presente descripción, los términos "enzima de fusión XX", "enzima quimérica XX" y "enzima híbrida XX" se usan indistintamente para referirse a una enzima que tiene por lo menos una parte quimérica derivada de una enzima XX. Por ejemplo, una enzima de fusión o quimérica Fv3C puede referirse a una enzima híbrida Fv3C/Bgl3 (que es, además, una enzima quimérica Bgl3), o a una enzima híbrida Fv3C/Te3A/Bgl3 (que es, además, una enzima quimérica Te3A o Bgl3) .
La célula huésped recombinante es, por ejemplo, una célula huésped de T. reesei recombinante. En un ejemplo particular, la descripción proporciona un hongo recombinante, tal como un T. reesei recombinante diseñado para expresar 1 o más, 2 o más, 3 o más, 4 o más, o 5 o más de Fv3A, Pf43A, FV43E, FV39A, Fv43A, Fv43B, Pa51A, Gz43A, Fo43A, Af43A, Pf51A, AfuXyn2, AfuXyn5 , Fv43D, Pf43B, Fv43B, Fv51A, Xyn3 de T. reesei, Xyn2 de T. reesei, Bxll de . reesei, Bgll (Tr3A) de T. reesei, Bgl3 (Tr3B) de T. reesei, endoglucanasa GH61, Eg4 de T. reesei, Pa3D, Fv3G, Fv3D, Fv3C, enzima de fusión/quimérica Fv3C, Fv3C/Bgl3, enzima de fusión/quimérica Fv3C/Te3A/Bgl3 , Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G o polipéptido Tn3B o una variante o mutante de este, que incluye, por ejemplo, un polipéptido híbrido o quimérico de este.
La presente descripción proporciona una célula huésped, por ejemplo, una célula huésped fúngica recombinante o un hongo filamentoso recombinante , que se ha diseñado para expresar de manera recombinante por lo menos una xilanasa, por lo menos una ß-xilosidasa y una L- -arabinofuranosidasa . La presente descripción proporciona, además, una célula huésped recombinante, por ejemplo, una célula huésped fúngica recombinante o un hongo filamentoso recombinante, tal como un T. reesei recombinante, diseñado para expresar 1, 2, 3, 4, 5 o más de Fv3A, Pf43A, Fv43E, Fv39A, Fv43A, Fv43B, Pa51A, Gz43A, Fo43A, Af43A, Pf51A, AfuXyn2 , AfuXyn5 , Fv43D, Pf43B, Fv43B, Fv51A, Pa3D, Fv3G, Fv3D, Fv3C, enzima de fusión Fv3C, un Bgl3 (Tr3B) de T. reesei, una enzima de fusión Bgl3 de T. reesei, una enzima de fusión Fv3C/Bgl3, Tr3A, Te3A, una enzima de fusión Te3A, una enzima de fusión Fv3C/Te3A/Bgl3 , An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G o polipéptido Tn3B, además de uno o más de un Xyn3 de T. reesei, un Xyn2 de T. reesei, un Bxll de T. reesei, un Bgll de G. reesei, una endoglucanasa GH61, un Eg4 de T. reesei o una variante de estos. La célula huésped recombinante es, por ejemplo, una célula huésped de T. reesei.
La presente descripción proporciona, además, una célula huésped recombinante por ejemplo, una célula huésped fúngica recombinante o un organismo recombinante, por ejemplo, un hongo filamentoso, tal como un T. reesei recombinante, que se ha diseñado para expresar de manera recombinante Xyn3 de T. reesei, Bgll de T. reesei, Bgl3 (Tr3B) de T. reesei, enzima de fusión Bgl3 de T. reesei, polipéptidos Fv3A, Fv43D y Fv51A.
Por ejemplo, la célula huésped recombinante es, adecuadamente, una célula huésped de T. reesei . El hongo recombinante es, adecuadamente, un T. reesei. recombinante La presente descripción proporciona, por ejemplo, una célula huésped de T. reesei diseñada para expresar de manera recombinante Xyn3 de T. reesei, Bgll de T. reesei, una enzima de fusión Bgl3 de T. reesei, polipéptidos Fv3A, Fv43D y Fv51A.
Ejemplos de promotores y vectores La presente descripción proporciona, además, casetes de expresión y/o vectores que comprenden los ácidos nucleicos descritos anteriormente. Adecuadamente, el ácido nucleico que codifica una enzima de la presente descripción se une operativamente a un promotor. Los promotores son muy conocidos en la técnica. Cualquier promotor que funciona en la célula huésped se puede usar para la expresión de una ß-glucosidasa y/o cualquiera de los otros ácidos nucleicos de la presente descripción. Las regiones de control de iniciación o promotores, que son útiles para activar la expresión de los ácidos nucleicos de una ß-glucosidasa y/o cualquiera de los otros ácidos nucleicos de la presente descripción en varias células huésped son numerosos y conocidas para aquellos con experiencia en la técnica {ver, por ejemplo, la patente núm. WO 2004/033646 y las referencias mencionadas en esta). Prácticamente, se puede usar cualquier promotor con la capacidad de activar estos ácidos nucleicos.
Específicamente, cuando se desea una expresión recombinante en un huésped fúngico filamentoso, el promotor puede ser un promotor fúngico filamentoso. Los ácidos nucleicos pueden estar, por ejemplo, bajo control de promotores heterólogos. Los ácidos nucleicos se pueden expresar, además, bajo el control de promotores constitutivos o inducibles . Los ejemplos de promotores que se pueden usar incluyen, pero no se limitan a, un promotor de celulosa, un promotor de xilanasa, el promotor 1818 (identificado anteriormente como una proteína altamente expresada por EST que mapea Trichoderma) . Por ejemplo, el promotor puede ser, adecuadamente, un promotor de celobiohidrolasa, endoglucanasa o ß-glucosidasa . Un promotor particularmente adecuado puede ser, por ejemplo, un promotor de celobiohidrolasa, endoglucanasa o ß-glucosidasa de T. reesei . Por ejemplo, el promotor es un promotor de celobiohidrolasa I (cbhl) . Los ejemplos no limitantes de promotores incluyen un promotor cbhl, cbh2, egll, egl2, egl3, egl4, egl5, pk.il, gpdl, xynl o xyn2. Los ejemplos no limitantes adicionales de promotores incluyen un promotor cbhl, cbh2, egll, egl2, egl3, egl4, egl5, jpk.il, gpdl, xynl o xyn2 de T. reesei.
Como se usa en la presente descripción, el término "unido operativamente" se refiere a que la secuencia de nucleótidos seleccionada (por ejemplo, que codifica un polipéptido descrito en la presente descripción) está cerca de un promotor para que este pueda regular la expresión del ADN seleccionado.
Adicionalmente, el promotor se encuentra dirección 5' de la secuencia de nucleótidos seleccionada en cuanto a la dirección de transcripción y traducción. La frase "unido operativamente" se refiere a que una secuencia de nucleótidos y una secuencia o secuencias reguladoras se conectan de tal manera para permitir la expresión génica cuando las moléculas adecuadas (por ejemplo, proteínas activadoras transcripcxonales) se unen a la secuencia o secuencias reguladoras.
Cualquiera de las ß-glucosidasas y/u otros ácidos nucleicos descritos en la presente descripción se puede incluir en uno o más vectores. Consecuentemente, la presente descripción incluye, además, vectores con uno o más ácidos nucleicos que codifican cualquiera de las ß-glucosidasas y/u otros ácidos nucleicos de la presente descripción. En algunos aspectos, el vector contiene un ácido nucleico bajo el control de una secuencia de control de expresión. En algunos aspectos, la secuencia de control de expresión es una secuencia natural de control de expresión. En algunos aspectos, la secuencia de control de expresión es una secuencia no natural de control de expresión. En algunos aspectos, el vector contiene un marcador selectivo o marcador seleccionable . En algunos aspectos, una o más ß-glucosidasas se integran en un cromosoma de las células sin un marcador seleccionable.
Los vectores adecuados son aquellos compatibles con la célula huésped usada. Los vectores adecuados se pueden derivar, por ejemplo, de una bacteria, un virus (tal como el bacteriófago T7 o un fago derivado de M-13) , un cósmido, una levadura o una planta. Los vectores adecuados se pueden mantener en un número de copias bajo, medio o alto en la célula huésped. Los protocolos para obtener y usar tales vectores son conocidos para los expertos en la técnica (ver, por ejemplo, Sambrook et al., Molecular Cloning: A Laboratory Manual, 2.° ed. , Cold Spring Harbor, 1989).
En algunos aspectos, el vector de expresión incluye, además, una secuencia de terminación. Las regiones de control de terminación se pueden derivar, además, de diversos genes naturales para la célula huésped. En algunos aspectos, la secuencia de terminación y la secuencia promotora se derivan de la misma fuente.
Un ácido nucleico de ß-glucosidasas se puede incorporar en un vector, tal como un vector de expresión, con el uso de técnicas convencionales (Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, 1982) .
En algunos aspectos, se puede preferir sobreexpresar una o más ß-glucosidasas y/o uno o más de los otros ácidos nucleicos descritos en la presente descripción a concentraciones mucho mayores que las encontradas actualmente en células de origen natural . En algunas modalidades, se puede preferir subexpresar (por ejemplo, mutar, inactivar o eliminar) una o más ß -glucosidasa y/o uno o más de los otros ácidos nucleicos descritos en la presente descripción a concentraciones mucho menores que las encontradas actualmente en células de origen natural.
Ejemplos de métodos de transformación Los ácidos nucleicos de ß-glucosidasa o vectores que los contienen se pueden insertar en una célula huésped (por ejemplo, una célula de planta, una célula de hongo, una célula de levadura o una célula bacteriana que se describe en la presente descripción) con el uso de técnicas convencionales para introducir un constructo de ADN o vector en una célula huésped, tales como transformación, electroporación, microinyección nuclear, transducción, transfección (por ejemplo, transfección mediada por electroporación o mediada por DEAE-dextrina con el uso de un virus fago recombinante) , incubación con precipitado de ADN y fosfato cálcico, bombardeo de alta velocidad con microproyectiles recubiertos con ADN y fusión de protoplastos . Las técnicas generales de transformación son conocidas en la técnica (ver, por ejemplo, Current Protocols in Molecular Biology (F. M. Ausubel efc al. (eds) capítulo 9, 1987; Sambrook et al., Molecular Cloning: A Laboratory Manual, 2.° ed. , Cold Spring Harbor, 1989; y Campbell et al., Curr. Genet . 16:53-56, 1989) . Los ácidos nucleicos introducidos se pueden integrar en el ADN cromosómico o se pueden mantener como secuencias de réplica extracromosómica . Los transformantes se pueden seleccionar mediante cualquier método conocido en la técnica.
Ejemplos de medios de cultivo celular Generalmente, el microorganismo se cultiva en un medio de cultivo celular adecuado para producir los polipéptidos descritos en la presente descripción. El cultivo se lleva a cabo en un medio de nutrientes adecuado, que comprende fuentes de carbono y nitrógeno y sales inorgánicas, mediante el uso de los procedimientos y las variaciones conocidos en la técnica. El medio de cultivo adecuado, los intervalos de temperatura y demás condiciones para el crecimiento y la producción de celulasa son conocidos en la técnica. Como un ejemplo no limitante, un intervalo de temperatura típico para producir celulasas por Trichoderma reesei es de 24 °C a 28 °C.
Ejemplos de condiciones para cultivos celulares Los materiales y métodos adecuados para el mantenimiento y crecimiento de cultivos bacterianos son muy conocidos en la técnica. Las técnicas ilustrativas pueden encontrarse en Manual of Methods for General Bacteriology Gerhardt et al . , eds) , American Society for Microbiology, Washington, D.C. (1994) o Brock en Biotechnology. A Textbook of Industrial Microbiology, segunda edición (1989) Sinauer Associates, Inc., Sunderland, A. En algunos aspectos, las células se cultivan en un medio de cultivo en condiciones que permiten la expresión de uno o más polipéptidos de ß-glucosidasas codificados por un ácido nucleico insertado en las células huésped. Se puede usar condiciones de cultivos celulares convencionales para cultivar las células. En algunos aspectos, las células se cultivan y se mantienen a una temperatura, mezcla gaseosa y pH adecuados. En algunos aspectos, las células se cultivan en un medio celular adecuado.
Composiciones de la invención La presente descripción proporciona composiciones enzimáticas diseñadas (por ejemplo, composiciones de celulasas) o caldos de fermentación enriquecidos con uno o más de los polipéptidos descritos anteriormente. En algunos aspectos, la composición es una composición de celulasas. La composición de celulasas puede ser, por ejemplo, una composición de celulasas fúngicas filamentosas, tales como una composición de celulasas de Trichoderma. En algunos aspectos, la composición es una célula que comprende uno o más ácidos nucleicos que codifican uno o más polipéptidos de celulasas. En algunos aspectos, la composición es un caldo de fermentación que comprende actividad de celulasas, en donde el caldo tiene la capacidad de convertir más de aproximadamente 50 % en peso de la celulosa presente en una muestra de biomasa en azúcares. El término "caldo de fermentación", como se usa en la presente descripción, se refiere a una preparación de enzimas producida por la fermentación que no experimenta ninguna o una mínima recuperación y/o purificación después de la fermentación. El caldo de fermentación puede ser un caldo de fermentación de un hongo filamentoso, por ejemplo, un caldo de fermentación de Trichoderma, Humicola, Fusarium, Aspergillus, Neurospora, Penicillium, Cephalosporium, Achlya, Podospora, Endothia, Mucor, Cochliobolus, Pyricularia o Chrysosporium.
Particularmente, el caldo de fermentación puede ser, por ejemplo, uno de Trichoderma spp . tal como uno de T. reesei, o de Penicillium spp. , tal como uno de P. funiculosum. Además, el caldo de fermentación puede ser, adecuadamente, un caldo de fermentación libre de células. En un aspecto, cualquiera de las composiciones de celulasas, células o caldo de fermentación de la presente invención puede comprender, además, una o más hemicelulasas . En un aspecto, el caldo de fermentación comprende celulasa entera. En ciertas modalidades, el caldo de fermentación se puede usar con procesamiento de posproducción limitado, que incluye, por ejemplo, purificación, ultrafiltración, filtración o una etapa para eliminar células y como tal, se dice que el caldo de fermentación se usa en una formulación de caldo completo. En algunos aspectos, la composición de celulasas enteras se expresa en T. reesei. En algunos aspectos, la composición de celulasas enteras se expresa en la cepa H3A de T. reesei integrada. En algunos aspectos, la composición de celulasas enteras se expresa en la cepa H3A de T. reesei integrada, en donde se han eliminado uno o más componentes de los polipéptidos expresados en la cepa H3A de T. reesei integrada. En algunos aspectos, la composición de celulasas enteras se expresa en A. niger o en una cepa modificada de este. En algunos aspectos, la composición de celulasas tiene la capacidad de alcanzar un producto de fracciones de por lo menos 0.1 a 0.4 según el ensayo de calcoflúor. En algunos aspectos, la composición de celulasas comprende de 0.1 a 25 % en peso del peso total de enzimas de la composición. En algunos aspectos, la composición de celulasas comprende, además, una o más hemicelulasas . En algunos aspectos, la composición de celulasas tiene la capacidad de convertir más de aproximadamente 70 %, 75 %, 80 %, 85 %, 90 % del peso de celulosa presente en la biomasa en azúcares. En algunos aspectos, la composición de celulasas comprende un polipéptido, en donde el porcentaje en peso de celulosa en una muestra de biomasa que se convierte en azúcares se incrementa con relación a una composición de celulasas que no comprende el polipéptido.
En algunos aspectos, la composición es una composición de celulasas que comprende un polipéptido que tiene por lo menos aproximadamente 60 %, por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencias con cualquiera de las secuencias de aminoácidos de las sec . con núms . de ident . : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79. En algunos aspectos, la composición de celulasas comprende un polipéptido que tiene por lo menos aproximadamente 60 %, por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 9 7 %, 98 % o 99 ¾ de identidad de secuencias con cualquiera de las secuencias de aminoácidos de las sec . con núms . de ident . : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, en donde la composición de celulasas tiene la capacidad de convertir más de aproximadamente 30 %, por ejemplo, más de aproximadamente 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 % u 80 % en peso de la celulosa presente en un sustrato de biomasa en azúcares. En ciertas modalidades, el sustrato de biomasa es una mezcla, en forma de sólido, de gel, de semilíquido o de líquido, típicamente, como resultado de someter el sustrato de biomasa a ciertos procesos de tratamiento previo adecuados, tales como los descritos en la presente descripción. En algunos aspectos, la composición de celulasas, que comprende un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident. : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79 y que tiene la capacidad de convertir más de aproximadamente 30 %, (por ejemplo, más de aproximadamente 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 % u 80 %) en peso de la celulosa presente en una muestra de biomasa en azúcares, es una composición de células enteras. En algunos aspectos, la composición de celulasas, que comprende un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencias con la secuencia de aminoácidos con cualquiera de las sec . con núms . de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, en donde la composición de celulasas tiene la capacidad de convertir más de aproximadamente 30 %, por ejemplo, más de aproximadamente 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 % u 80 % en peso de la celulosa presente en una muestra de biomasa en azúcares, es un caldo de fermentación. En algunos aspectos, el caldo de fermentación comprende celulasa entera. En algunos aspectos, el caldo de fermentación es un caldo de fermentación libre de células. En algunos aspectos, la composición de celulasas que comprende un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79 se expresa en T. reesei. En algunos aspectos la composición de celulasas que comprende un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 %) de identidad de secuencias con cualquiera de las secuencias de aminoácidos de las sec. con núms . de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79 se expresa en cepa H3A de T. reesei integrada. En algunos aspectos, uno o más componentes de los polipéptidos expresados en la cepa H3A de G. reesei integrada han sido eliminados. En algunos aspectos, la composición de celulasas que comprende un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 % o 90 %) de identidad de secuencias con por lo menos una de las secuencias de aminoácidos de las sec. con núms. de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79 se expresa en A . niger o en una cepa modificada de este. En algunos aspectos, la composición de celulasas que comprende un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 I o 90 I) de identidad de secuencias con cualquiera de las secuencias de aminoácidos de las sec. con núms. de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79 tiene la capacidad de alcanzar un producto de fracciones de por lo menos 0.1 a 0.4 según el ensayo de calcoflúor. En algunos aspectos, la composición de celulasas que comprende un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 % o 90 %) de identidad de secuencias con por lo menos una de las secuencias de aminoácidos de las sec. con núms . de ident . : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79 comprende de 0.1 a 25 % en peso (por ejemplo, de 0.5 a 22 % en peso, de 1 a 20 % en peso, de 5 a 19 % en peso, de 7 a 18 % en peso, de 9 a 17 % en peso, de 10 a 15 % en peso) del peso total de proteínas de la composición. En algunos aspectos, la composición de celulasas que comprende un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 % o 90 %) de identidad de secuencias con por lo menos una de las secuencias de aminoácidos de las sec. con núms. de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79 comprende, además, una o más hemicelulasas . En algunos aspectos, la composición de celulasas que comprende un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 % o 90 %) de identidad de secuencias con por lo menos una de las secuencias de aminoácidos de las sec. con núms. de ident.: 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79 tiene la capacidad de convertir más de aproximadamente 50 % (por ejemplo, más de aproximadamente 55 %, 60 %, 65 %, 70 %, 75 ¾, 80 %, 85 % o 90 %) del peso de la celulosa presente en la biomasa en azúcares. En algunos aspectos, la composición de celulasas comprende un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 ¾, 85 % o 90 %) de identidad de secuencias con por lo menos una de las secuencias de aminoácidos de las sec . con núms . de ident . : 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, en donde el porcentaje en peso de celulosa en una muestra de biomasa que se convierte en azúcares se incrementa con relación a una composición de celulasas que no comprende el polipéptido.
En algunos aspectos, la composición de celulasas es una composición de celulasas que no es de origen natural que comprende una quimera/híbrido/fusion de dos o más secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 % (por ejemplo, aproximadamente 65 %, 70 %, 75 %, 80 %) o más de identidad de secuencias con una secuencia contigua (con la primera secuencia de ß-glucosidasas) de la misma longitud de Fv3C (sec. con núm. de ident. :60) y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %) de identidad de secuencias con una secuencia contigua (con la segunda secuencia de ß-glucosidasas) de la misma longitud con cualquiera de las sec . con núms . de ident.:54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende un motivo de la secuencia de polipéptidos de la sec. con núm. de ident.:170. En algunos aspectos, la primera secuencia de ß-glucosidasas se encuentra en el extremo N-terminal del polipéptido quimérico, mientras que la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido quimérico. En algunos aspectos, la composición de celulasas es una composición de células enteras. En algunos aspectos, la composición de celulasas es un caldo de fermentación. En algunos aspectos, el caldo de fermentación comprende celulasa entera. En algunos aspectos, el caldo de fermentación es un caldo de fermentación libre de células.
En algunos aspectos, la composición de celulasas es una composición de celulasas que no es de origen natural que comprende una quimera o un híbrido de dos o más secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 % (por ejemplo, aproximadamente 65 %, 70 %, 75 %, 80 %) o más de identidad de secuencias con una secuencia contigua de la misma longitud (con la primera secuencia de ß -glucosidasas ) con cualquiera de las sec. con núms. de ident.:54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms . de ident . : 164-169 y en donde la segunda secuencia de ß -glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %) de identidad de secuencias con una secuencia contigua de la misma longitud (con la segunda secuencia de ß-glucosidasas) de Fv3C (sec. con núm. de ident. :60) . En algunos aspectos, la primera secuencia de ß-glucosidasas se encuentra en el extremo N-terminal del polipéptido quimérico, mientras que la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido quimérico. En algunos aspectos, la composición de celulasas es un caldo de fermentación. En algunos aspectos, el caldo de fermentación comprende celulasa entera. En algunos aspectos, el caldo de fermentación es un caldo de fermentación libre de células.
En ciertas modalidades, la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas se encuentran directamente adyacentes o conectadas. En algunas modalidades, la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas no se encuentran directamente adyacentes pero se conectan por medio de un dominio conector. En ciertas modalidades, el dominio conector se encuentra en la región central (es decir, ni en el extremo N-terminal ni en el extremo C-terminal) en el polipéptido de ß-glucosidasas híbrido o quimérico. En ciertas modalidades, ya sea la primera secuencia de ß-glucosidasas o la segunda secuencia de ß-glucosidasas o ambas de estas secuencias comprenden uno o más sitios de glicosilación. En ciertas modalidades, ya sea la primera secuencia de ß-glucosidasas o la segunda secuencia de ß-glucosidasas comprende una secuencia en bucle que tiene, por ejemplo, aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud, que comprende una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) NIT (sec. con núm. de ident.:172). En ciertas modalidades, la secuencia en bucle proporciona la secuencia conectora que une la primera secuencia de ß-glucosidasas con la segunda secuencia de ß-glucosidasas . En algunos aspectos, la composición de celulasas es una composición de células enteras. En algunos aspectos, la composición de celulasas es un caldo de fermentación. En algunos aspectos, el caldo de fermentación comprende celulasa entera. En algunos aspectos, el caldo de fermentación es un caldo de fermentación libre de células.
En algunos aspectos, la composición de celulasas es una composición de celulagas que no es de origen natural que comprende una quimera o un híbrido de dos o más secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 % (por ejemplo, aproximadamente 65 %, 70 %, 75 %, 80 %) o más de identidad de secuencias con una secuencia contigua de la misma longitud (con la primera secuencia de ß-glucosidasas) de Fv3C (sec. con núm. de ident.:60), y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %) de identidad de secuencias con una secuencia contigua de la misma longitud (con la segunda secuencia de ß-glucosidasas) con cualquiera de las sec. con núms . de ident.:54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende un motivo de la secuencia de polipéptidos de la sec. con núm. de ident.:170. En algunos aspectos, la primera secuencia de ß-glucosidasas se encuentra en el extremo N-terminal del polipéptido quimérico, mientras que la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido quimérico. En ciertas modalidades, la primera secuencia de ß -glucosidasas y la segunda secuencia de ß-glucosidasas se encuentran directamente adyacentes o conectadas. En algunas modalidades, la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas no se encuentran directamente adyacentes pero se conectan por medio de un dominio conector. En ciertas modalidades, el dominio conector se encuentra en la región central (es decir, ni en el extremo N-terminal ni en el extremo C-terminal) en el polipéptido de ß-glucosidasas híbrido o quimérico. En ciertas modalidades, ya sea la primera secuencia de ß-glucosidasas o la segunda secuencia de ß-glucosidasas o ambas de estas secuencias comprenden uno o más sitios de glicosilación . En ciertas modalidades, ya sea la primera secuencia de ß-glucosidasas o la segunda secuencia de ß-glucosidasas comprende una secuencia en bucle que tiene, por ejemplo, aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En ciertas modalidades, la secuencia en bucle proporciona la secuencia conectora que une la primera secuencia de ß -glucosidasas con la segunda secuencia de ß-glucosidasas . En algunos aspectos, la composición de celulasas es una composición de células enteras. En algunos aspectos, la composición de celulasas es un caldo de fermentación. En algunos aspectos, el caldo de fermentación comprende celulasa entera.
En algunos aspectos, el caldo de fermentación es un caldo de fermentación libre de células. En algunos aspectos, la composición de celulasas es una composición de celulasas que no es de origen natural que comprende una quimera o un híbrido de dos o más secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 (por ejemplo, por lo menos aproximadamente 250, 300, 350, 400 o 450) residuos de aminoácidos contiguos de longitud que comprenden uno o más o todos los motivos de las secuencias de aminoácidos de las sec. con núms . de ident .: 136-148 ; mientras que la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 (por ejemplo, por lo menos aproximadamente 50, 75, 100, 120, 150, 180, 200, 220 o 250) residuos de aminoácidos contiguos de longitud que comprenden uno o más o todos los motivos de las secuencias de aminoácidos de las sec. con núms. de ident .: 149-156. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) de los motivos de las secuencias de aminoácidos de las sec. con núms. de ident. : 164-169, y la segunda de las dos o más secuencias de ß-glucosidasa tiene por lo menos 50 residuos de aminoácidos de longitud y comprende la sec. con núm. de ident. :170. En algunos aspectos, la primera secuencia de ß-glucosidasas se encuentra en el extremo N-terminal del polipéptido quimérico, mientras que la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido quimérico. En ciertas modalidades, la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas se encuentran directamente adyacentes o conectadas. En algunas modalidades, la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas no se encuentran directamente adyacentes pero se conectan por medio de un dominio conector. En ciertas modalidades, el dominio conector se encuentra en la región central (es decir, ni en el extremo N- terminal ni en el extremo C-terminal) en el polipéptido de ß-glucosidasas híbrido o quimérico. En ciertas modalidades, ya sea la primera secuencia de ß-glucosidasas o la segunda secuencia de ß-glucosidasas o ambas de estas secuencias comprenden uno o más sitios de glicosilación . En ciertas modalidades, ya- sea la primera secuencia de ß-glucosidasas o la segunda secuencia de ß-glucosidasas comprende una secuencia en bucle que tiene, por ejemplo, aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident. :172) . En ciertas modalidades, la secuencia en bucle proporciona la secuencia conectora que une la primera secuencia de ß-glucosidasas con la segunda secuencia de ß-glucosidasas . En algunos aspectos, la composición de celulasas es una composición de células enteras. En algunos aspectos, la composición de celulasas es un caldo de fermentación. En algunos aspectos, el caldo de fermentación comprende celulasa entera. En algunos aspectos, el caldo de fermentación es un caldo de fermentación libre de células. Composiciones de hemicelulasas En algunos aspectos, cualquiera de las composiciones de celulasas de la presente invención comprende, además, una o más hemicelulasas. En tal caso, las composiciones de celulasas son, además, composiciones de hemicelulasas. En algunos aspectos, la composición de hemicelulasas de la presente invención comprende hemicelulasas seleccionadas de xilanasas, ß-xilosidasas , L-a-arabinofuranosidasas y combinaciones de estas. En algunos aspectos, la composición de hemicelulasas de la presente invención comprende por lo menos una xilanasa. En algunos aspectos, la por lo menos única xilanasa se selecciona del grupo que consiste en Xyn2 de T. reesei, Xyn3 de T. reesei, AfuXyn2 y AfuXyn5. En algunos aspectos, la composición de hemicelulasa de la presente invención comprende por lo menos una ß-xilosidasa . En algunos aspectos, la ß-xilosidasa comprende una ß-xilosidasa del grupo 1, seleccionada de ß-xilosidasas, tales como, por ejemplo, Fv3A y Fv43A. En algunos aspectos, la ß-xilosidasa comprende una ß-xilosidasa del grupo 2 seleccionada de ß -xilosidasas tales como, por ejemplo, Pf43A, Fv43D, Fv39A, Fv43E, Fo43E, Fv43B, Pa51A, Gz43A y Bxll de T. reesei. En algunos aspectos, la composición de celulasas de la presente invención comprende una sola ß-xilosidasa seleccionada de una ß-xilosidasa ya sea del grupo 1 o del grupo 2. En algunos aspectos, la composición de celulasas de la presente invención comprende dos ß-xilosidasas , en donde una ß-xilosidasa se selecciona del grupo 1 y la otra se selecciona del grupo 2. En algunos aspectos, la composición de hemicelulasas de la presente invención comprende por lo menos una L-a-arabinofuranosidasas . En algunos aspectos, la por lo menos única L-a-arabinofuranosidasa se selecciona del grupo que consiste en Af43A, Fv43B, Pf51A, Pa51A y Fv51A.
Xilanasas . En algunos aspectos, las composiciones de celulasas son composiciones de hemicelulasas que comprenden por lo menos una xilanasa adecuada. En algunos aspectos, la por lo menos única xilanasa se selecciona del grupo que consiste en Xyn2 de T. reesei, Xyn3 de T. reesei, AfuXyn2 y AfuXyn5.
Cualquier xilanasa (EC 3.2.1.8) se puede usar como la única o más xilanasas. Las xilanasas adecuadas incluyen, por ejemplo, una xilanasa de Caldocellum saccharolyticum (Luthi et al. 1990, Appl. Environ. Microbiol. 56 (9) : 2677-2683 ) , una xilanasa de Thermatoga marítima (Winterhalter & Liebel, 1995, Ap l. Environ. Microbiol. 61 (5) : 1810-1815) , una cepa FJSS-B.l de xilanasa de Thermatoga Sp. (Simpson et al. 1991, Biochem. J. 277, 413-417) , una xilanasa (BcX) de Bacillus circulans (patente de los Estados Unidos núm. 5,405,769), una xilanasa de Aspergillus niger (Kinoshita et al. 1995, Journal of Fermentation and Bioengineering 79 (5) :422-428) , una xilanasa de Streptomyces llvidans (Shareck et al. 1991, Gene 107:75-82; Morosoli et al. 1986 Biochem. J. 239:587-592; Kluepfel et al. 1990, Biochem. J. 287:45-50) , una xilanasa de Bacillus subtilis (Bernier et al . 1983, Gene 26 (1) : 59-65) , una xilanasa de Cellulomonas fimi (Clarke et al., 1996, FEMS Microbiology Letters 139:27-35), una xilanasa de Pseudomonas fluorescens (Gilbert et al. 1988, Journal of General Microbiology 134:3239-3247) , una xilanasa de Clostridium ther ocellum (Domínguez et al., 1995, Nature Structural Biology 2:569-576), una xilanasa de Bacillus pumilus (Nuyens et al. Applied Microbiology and Biotechnology 2001, 56:431-434; Yang et al. 1998, Nucleic Acids Res. 16 ( 14B) : 7187) , una xilanasa P262 de Clostridium acetobutylicum (Zappe et al. 1990, Nucleic Acids Res. 18(8) :2179) o una xilanasa de Trichoder a harzianum (Rose et al. 1987, J. Mol. Biol .194 (4) : 755-756) .
Xyn2. En algunos aspectos, las composiciones de celulasas de la presente invención comprenden, además, Xyn2. La secuencia de aminoácidos de Xyn2 de T. reesei (sec. con núm. de ident. :43) se muestra en las Figuras 25A-25B y 59B. La sec. con núm. de ident . 43 es la secuencia del inmaduroT. reesei Xy 2. Xyn2 de G. reesei tiene una secuencia de prepropéptidos prevista correspondiente a los residuos 1 al 33 de la sec. con núm. de ident. :43 (subrayada en las Figuras 25A-25B) ; se prevé que el clivaje de la secuencia señal prevista entre las posiciones 16 y 17 produce un propéptido que se procesa por medio de una proteasa tipo quexina entre las posiciones 32 y 33 para producir la proteína madura que tiene una secuencia correspondiente a los residuos 33 al 222 de la sec . con núm. de ident . :43. El dominio conservado previsto aparece en negrita en las Figuras 25A-25B. Se demostró que Xyn2 de G. reesei tiene actividad de endoxilanasas indirectamente al observar su capacidad para catalizar una producción aumentada de monómeros de xilosa en presencia de xilobiosidasa cuando las enzimas actúan sobre biomasa tratada previamente o sobre hemicelulosa aislada. Los residuos acídicos conservados incluyen E118, E123 y E209. Como se usa en la presente descripción, "un polipéptido Xyn2 de T. reesei" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150 o 175 residuos de aminoácidos contiguos entre los residuos 33 al 222 de la sec. con núm. de ident. :43. Un polipéptido Xyn2 de G. reesei se encuentra, preferentemente, inaltérado en comparación con un Xyn2 de T. reesei natural, en los residuos E118, E123 y E209. Un polipéptido Xyn2 de T. reesei se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre Xyn2 , AfuXyn2 y AfuXyn5 de T. reesei, tal como se muestra en el alineamiento de la Figura 59B. Un polipéptido Xyn2 de T. · reesei comprende, adecuadamente, el dominio conservado previsto completo del Xyn2 de T. reesei natural que se muestra en las Figuras 25A-25B. Un polipéptido Xyn2 de G. reesei ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Xyn2 de T. reesei maduro que se muestra en la Figura 25. El polipéptido Xyn2 de T. reesei de la presente invención tiene, preferentemente, actividad de xilanasas.
Xyn3 : En algunos aspectos, las composiciones de celulasas de la presente invención comprenden, además, Xyn3. La secuencia de aminoácidos de Xyn3 de T. reesei (sec. con núm. de ident. :42) se muestra en la Figura 24B. La sec. con núm. de ident. 42 es la secuencia del inmaduro T. reesei Xyn3. Xyn3 de T. reesei tiene una secuencia final prevista correspondiente a los residuos 1 al 16 de la sec. con núm. de ident. :42 (subrayada en la Figura 24B) ; se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a los residuos 17 al 347 de la sec. con núm. de ident. :42. El dominio conservado previsto aparece en negrita en la Figura 24B. Se demostró que Xyn3 de T. reesei tiene actividad de endoxilanasas indirectamente al observar su capacidad para catalizar una producción aumentada de monomeros de xilosa en presencia de xilobiosidasa cuando las enzimas actúan sobre la biomasa tratada previamente o sobre la hemicelulosa aislada. Los residuos catalíticos conservados incluyen E91, E176, E180, E195 y E282, según el alineamiento con otra enzima de la familia GH10, el Xysl delta de Streptomyces halstedii (Canals et al., 2003, Act Crystalogr. D Biol . 59:1447-53), que tiene 33 % de identidad de secuencias con Xyn3 de T. reesei . Como se usa en la presente descripción, "un polipéptido Xyn3 de T. reesei" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250 o 300 residuos de aminoácidos contiguos entre los residuos 17 al 347 de la sec . con núm. de ident.:42. Un polipéptido Xyn3 de T. reesei se encuentra, preferentemente, inalterado en comparación con el Xyn3 de T. reesei natural en los residuos E91, E176, E180, E195 y E282. Un polipéptido Xyn3 de G. reesei se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre Xyn3 y Xysl delta de T. reesei. Un polipéptido Xyn3 de T. reesei comprende, adecuadamente, el dominio conservado previsto completo del Xyn3 de T. reesei natural que se muestra en la Figura 24B. Un polipéptido Xyn3 de T. reesei ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Xyn3 de G. reesei maduro que se muestra en la Figura 24B. El polipéptido Xyn3 de T. reesei de la presente invención tiene, preferentemente, actividad de xilanasas.
AfuXyn2: en algunos aspectos, las composiciones de celulasas de la presente invención comprenden, además, AfuXyn2. La secuencia de aminoácidos de AfuXyn2 (sec. con núm. de ident.:24) se muestra en las Figuras 19B y 59B. La sec. con núm. de ident . 24 es la secuencia del inmaduro AfuXyn2. AfuXyn2 tiene una secuencia final prevista correspondiente a los residuos 1 al 18 de la sec. con núm. de ident.: 24 (subrayada en la Figura 19B) ; se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a los residuos 19 al 228 de la sec. con núm. de ident.: 24. El dominio conservado GH11 previsto aparece en negrita en la Figura 19B. Se demostró que AfuXyn2 tiene actividad de endoxilanasas indirectamente al observar su capacidad para catalizar la producción aumentada de monómeros de xilosa en presencia de xilobiosidasa cuando las enzimas actúan sobre la biomasa tratada previamente o sobre hemicelulosa aislada. Los residuos catalíticos conservados incluyen E124, E129 y E215. Como se usa en la presente descripción, "un polipéptido AfuXyn2" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175 o 200 residuos de aminoácidos contiguos entre los residuos 19 al 228 de la sec . con núm. de ident.:24. Un polipéptido AfuXyn2 se encuentra, preferentemente, inalterado en comparación con el AfuXyn2 natural, en los residuos E124, E129 y E215. Un polipéptido AfuXyn2 se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre AfuXyn2 , AfuXyn5 y Xyn2 de T. reesei, tal como se muestra en el alineamiento de la Figura 59B. Un polipéptido AfuXyn2 comprende, adecuadamente, el dominio conservado previsto completo del AfuXyn2 natural que se muestra en la Figura 19B. Un polipéptido AfuXyn2 ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de AfuXyn2 maduro que se muestra en la Figura 19B. El polipéptido AfuXyn2 de la presente invención tiene, preferentemente, actividad de xilanasas.
AfuXyn5. en algunos aspectos, las composiciones de celulasas de la presente invención comprenden, además, AfuXyn5. La secuencia de aminoácidos de AfuXyn5 (sec. con núm. de ident.:26) se muestra en las Figuras 20B y 59B. La sec. con núm. de ident . 26 es la secuencia del inmaduro AfuXyn5. AfuXyn5 tiene una secuencia final prevista correspondiente a los residuos 1 al 19 de la sec . con núm. de ident.:26 (subrayada en la Figura 20B) ; se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a los residuos 20 al 313 de la sec. con núm. de ident.:26. Los dominios conservados de GH11 previstos aparecen en negrita en la Figura 20B. Se demostró que AfuXyn5 tiene actividad de endoxilanasas indirectamente al observar su capacidad para catalizar la producción aumentada de monómeros de xilosa en presencia de xilobiosidasa cuando las enzimas actúan sobre la biomasa tratada previamente o sobre la hemicelulosa aislada. Los residuos catalíticos conservados incluyen E119, E124 y E210. El CBM previsto se encuentra cerca del extremo C-terminal, caracterizado por numerosos residuos hidrófobos y sigue la prolongada serie rica en serina, treonina de aminoácidos. La región se muestra subrayada en la Figura 59B. Como se usa en la presente descripción, "un polipéptido AfuXyn5" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250 o 275 residuos de aminoácidos contiguos entre los residuos 20 al 313 de la sec. con núm. de ident.:26. Un polipéptido AfuXyn5 se encuentra, preferentemente, inalterado en comparación con el AfuXyn5 natural, en los residuos E119, E120 y E210. Un polipéptido AfuXynS se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre AfuXynS, AfuXyn2 y Xyn2 de T. reesei, tal como se muestra en el alineamiento de la Figura 59B. Un polipéptido AfuXyn5 comprende, adecuadamente, el CBM previsto completo del AfuXyn5 natural y/o el dominio conservado previsto completo del AfuXyn5 natural (subrayado) que se muestra en la Figura 20B. Un polipéptido AfuXyn5 ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de AfuXyn5 maduro que se muestra en la Figura 20B. El polipéptido AfuXynS de la presente invención tiene, preferentemente, actividad de xilanasas.
La xilanasa o xilanasas constituyen, adecuadamente, de aproximadamente 0.05 % en peso a aproximadamente 50 % en peso de las composiciones de celulasas de la descripción, en donde el % en peso representa el peso combinado de xilanasa o xilanasas con relación al peso combinado de todas las enzimas en una composición específica. La xilanasa o xilanasas pueden estar presentes en el intervalo en donde el límite inferior es 0.05 % en peso, 1 % en peso, 1.5 % en peso, 2 % en peso, 3 % en peso, 4 % en peso, 5 % en peso, 6 % en peso, 7 % en peso, 8 % en peso, 9 % en peso, 10 % en peso, 12 % en peso, 15 % en peso, 20 % en peso, 25 % en peso, 30 % en peso, 40 % en peso o 45 % en peso y el límite superior es 5 % en peso, 10 % en peso, 15 % en peso, 20 % en peso, 25 % en peso, 30 % en peso, 35 % en peso, 40 % en peso o 50 % en peso. Adecuadamente, el peso combinado de una o más xilanasas en una composición de enzimas de la presente invención puede constituir, por ejemplo, de aproximadamente 0.05 % en peso a aproximadamente 50 % en peso (por ejemplo, 0.05 % en peso, 1 % en peso, 2 % en peso, de 3 % en peso a 50 % en peso, de 3 % en peso a 40 % en peso, de 3 % en peso a 30 % en peso, de 3 % en peso a 20 % en peso, de 5 % en peso a 20 % en peso, de 10 % en peso a 30 % en peso, de 15 % en peso a 35 % en peso, de 20 % en peso a 40 % en peso, de 20 % en peso a 50 % en peso, etc.) del peso total de todas las enzimas en la composición de enzimas.
La xilanasa se puede producir al expresar un gen endógeno o exogeno que codifica una xilanasa. La xilanasa, en algunas circunstancias, se puede sobreexpresar o subexpresar. ß-xilosidasas : en algunos aspectos, la composición de celulasas de la presente invención comprende por lo menos una ß-xilosidasa . En algunos aspectos, la composición de celulasas comprende por lo menos una ß-xilosidasa del grupo 1, seleccionada del grupo que consiste en, por ejemplo, Fv3A y Fv43A. En algunos aspectos, la composición de celulasas comprende por lo menos una ß-xilosidasa del grupo 2, seleccionada del grupo que consiste en, por ejemplo, Pf43A, Fv43D, Fv39A, Fv43E, Fo43E, Fv43B, Pa51A, Gz43A y Bxll de T. reesei. En algunos aspectos, la composición de celulasas comprende una sola ß-xilosidasa y esa ß-xilosidasa se selecciona de ya sea del grupo 1 o del grupo 2. En algunos aspectos, la composición de celulasas comprende dos ß-xilosidasas, en donde una ß-xilosidasa se selecciona del grupo 1 y la otra se selecciona del grupo 2.
Cualquier ß-xilosidasa (EC 3.2.1.37) se puede usar como una ß-xilosidasa adecuada. Las ß-xilosidasas adecuadas incluyen, por ejemplo, una Bxll de G. emersonii (Reen et al. 2003, Biochem Biophys Res Commun. 305(3) :579-85), ß-xilosidasas de G. stearothermophilus (Shallom et al. 2005, Biochemistry 44:387-397), ß-xilosidasas de S. thermophilum (Zanoelo et al. 2004, J. Ind. Microbiol . Biotechnol . 31:170-176), ß-xilosidasas de T. lignorum (Schmidt, 1998, Methods Enzymol. 160:662-671), ß -xilosidasas de A. awamori (Kurakake et al. 2005, Biochim. Biophys. Acta 1726:272-279), ß-xilosidasas de A. versicolor (Andrade et al. 2004, Process Biochem. 39:1931-1938), ß -xilosidasas de Streptomyces sp. (Pinphanichakarn et al. 2004, World J. Microbiol. Biotechnol. 20:727-733), ß-xilosidasas de T. marítima (Xue and Shao, 2004, Biotechnol. Lett . 26:1511-1515), SY ß-xilosidasas de Trichoderma sp. (Kim et al. 2004, J. Microbiol. Biotechnol. 14:643-645), ß-xilosidasas de A. niger (Oguntimein and Reilly, 1980, Biotechnol. Bioeng. 22:1143-1154) o ß-xilosidasas de P. wortmanni (Matsuo et al. 1987, Agrie. Biol . Chem. 51:2367-2379) . Las ß-xilosidasas adecuadas se pueden producir de manera endógena por medio del organismo huésped o se pueden clonar de manera recombinante y/o expresar por medio del organismo huésped. Además, las ß-xilosidasas adecuadas se pueden agregar a una composición de celulasas en una forma purificada o aislada.
Fv3A. en algunos aspectos, la composición de celulasas de la presente invención comprende un polipéptido Fv3A. La secuencia de aminoácidos de Fv3A (sec. con núm. de ident.:2) se muestra en las Figuras 8B y 56. La sec. con núm. de ident . 2 es la secuencia del inmaduro Fv3A. Fv3A tiene una secuencia final prevista correspondiente a los residuos 1 al 23 de la sec. con núm. de ident .: 2 (subrayada); se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a los residuos 24 al 766 de la sec. con núm. de ident . : 2. Los dominios conservados previstos aparecen en negrita en la Figura 8B. Se demostró que Fv3A tiene actividad de ß-xilosidasas, por ejemplo, en un ensayo enzimático con el uso de p-nitofenil^-xilopiranosida, xilobiosa, xilo-oligómeros lineales mixtos, oligómeros de arabinoxilano ramificados de hemicelulosa o mazorca de maíz tratada previamente con amoníaco diluido como sustratos. El residuo catalítico previsto es D291, mientras se prevé que los residuos flanqueadores , S290 y C292, participan en la unión al sustrato. E175 y E213 se conservan a través de otras enzimas GH3 y GH39 y se prevé que tienen funciones catalíticas. Como se usa en la presente descripción, "un polipéptido Fv3A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, por ejemplo, por lo menos 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, por ejemplo, por lo menos 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650 o 700 residuos de aminoácidos contiguos entre los residuos 24 al 766 de la sec . con núm. de ident . : 2. Un polipéptido Fv3A se encuentra, preferentemente, inalterado en comparación con el Fv3A natural en los residuos D291, S290, C292, E175 y E213. Un polipéptido Fv3A se encuentra, preferentemente, inalterado en por lo menos 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre Fv3A y Bxll de Trichoderma reesei, tal como se muestra en el alineamiento de la Figura 56. Un polipéptido Fv3A comprende, adecuadamente, el dominio conservado previsto completo del Fv3A natural tal como se muestra en la Figura 8B. Un polipéptido Fv3A ilustrativo de la presente invención comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 ¾, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Fv3A maduro tal como se muestra en la Figura 8B . El polipéptido Fv3A de la presente invención tiene, preferentemente, actividad de ß-xilosidasas .
Consecuentemente, un polipéptido Fv3A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident . : 2 o con los residuos (i) 24-766, (ii) 73-321, (iii) 73-394, (iv) 395-622, (v) 24-622 o (vi) 73-622 de la sec. con núm. de ident . : 2. El polipéptido tiene, adecuadamente, actividad de ß-xilosidasas .
Fv43A. en algunos aspectos, la composición de celulasas de la presente invención comprende un polipéptido FV43A. La secuencia de aminoácidos de Fv43A (sec. con núm. de ident. :10) se proporciona en las Figuras 12B y 57A-57B. La sec. con núm. de ident. 10 es la secuencia del inmaduro Fv43A. Fv43A tiene una secuencia final prevista correspondiente a los residuos 1 al 22 de la sec. con núm. de ident.: 10 (subrayada en la Figura 12B) ; se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a los residuos 23 al 449 de la sec. con núm. de ident. : 10. En la Figura 12B, el dominio conservado previsto aparece en negrita, el CBM previsto aparece en mayúsculas y el conector previsto que separa el CD y el CBM aparece en cursiva. Se demostró que Fv43A tiene actividad de ß-xilosidasas en, por ejemplo, un ensayo enzimático con el uso de 4 -nitofenil- -D-xilopiranosida, xilobiosa, xilo-oligómeros lineales mixtos, oligómeros de arabinoxilano ramificados de hemicelulosa y/o xilo-oligómeros lineales como sustratos. Los residuos catalíticos previstos incluyen ya sea D34 o D62, D148 y E209. Como se usa en la presente descripción, "un polipéptido Fv43A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350 o 400 residuos de aminoácidos contiguos entre los residuos 23 al 449 de la sec. con núm. de ident. :10. Un polipéptido Fv43A se encuentra, preferentemente, inalterado en comparación con el Fv43A natural, en los residuos D34 o D62, D148 y E209. Un polipéptido Fv43A se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados en una familia de enzimas que incluyen Fv43A y l, 2, 3, 4, 5, 6, 7, 8 o todos las otras 9 secuencias de aminoácidos en el alineamiento de las Figuras 57A-57B. Un polipéptido Fv43A comprende adecuadamente el CBM previsto completo del FV43A natural y/o el dominio conservado previsto completo del Fv43A natural y/o el conector de Fv43A tal como se muestra en la Figura 12B. Un polipéptido Fv43A ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Fv43A maduro tal como se muestra en la Figura 12B. El polipéptido Fv43A de la presente invención tiene, preferentemente, actividad de ß-xilosidasas .
Consecuentemente, un polipéptido Fv43A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident.:10 o con los residuos (i) 23-449, (ii) 23-302, (iii) 23-320, (iv) 23-448, (v) 303-448, (vi) 303-449, (vii) 321-448 o (viii) 321-449 de la sec. con núm. de ident.:10. El polipéptido tiene, adecuadamente, actividad de ß-xilosidasas .
Pf43A. en algunos aspectos, la composición de celulasas de la presente invención comprende un polipéptido Pf43A. La secuencia de aminoácidos de Pf43A (sec. con núm. de ident.:4) se muestra en las Figuras 9B y 57A-57B. La sec. con núm. de ident. 4 es la secuencia del inmaduro Pf43A. Pf43A tiene una secuencia final prevista correspondiente a los residuos 1 al 20 de la sec. con núm. de ident. :4 (subrayada en la Figura 9B) ; se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a los residuos 21 al 445 de la sec. con núm. de ident. :4. El dominio conservado previsto aparece en negrita, el CBM previsto aparece en mayúsculas y el conector previsto que separa el CD y el CBM aparece en cursiva en la Figura 9B . Se demostró que Pf43A tiene actividad de ß-xilosidasas en, por ejemplo, un ensayo enzimático con el uso de p-nitofenil^-xilopiranosida, xilobiosa, xilo-oligómeros lineales mixtos o mazorca de maíz tratada previamente con amoníaco diluido como sustratos. Los residuos catalíticos previstos incluyen ya sea D32 o D60, D145 y E206. La región C-terminal subrayada en las Figuras 57A-57B es el CBM previsto. Como se usa en la presente descripción, "un polipéptido Pf43A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350 o 400 residuos de aminoácidos contiguos entre los residuos 21 al 445 de la sec . con núm. de ident.:4. Un polipéptido Pf43A se encuentra, preferentemente, inalterado en comparación con el Pf43A natural en los residuos D32 o D60, D145 y E206. Un Pf43A se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados a través de una familia de proteínas que incluyen Pf43A y 1, 2, 3, 4, 5, 6, 7 o las 8 de otras secuencias de aminoácidos en el alineamiento de las Figuras 57A-57B. Un polipéptido Pf43A de la presente invención comprende, adecuadamente, dos o más o todos los dominios siguientes: (1) el CBM previsto, (2) el dominio conservado previsto y (3) el conector de Pf43A tal como se muestra en la Figura 9B. Un polipéptido Pf43A ilustrativo de . la presente invención comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Pf43A maduro tal como se muestra en la Figura 9B. El polipéptido Pf43A de la presente invención tiene, preferentemente, actividad de ß-xilosidasas .
Consecuentemente, un polipéptido Pf43A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 ¾, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident.:4 o con los residuos (i) 21-445, (ii) 21-301, (iii) 21-323, (iv) 21-444, (v) 302-444, (vi) 302-445, (vii) 324-444 o (viii) 324-445 de la sec. con núm. de ident . : 4. El polipéptido tiene, adecuadamente, actividad de ß-xilosidasas .
Fv43D. en algunos aspectos, la composición de celulasas de la presente invención comprende, además, un polipéptido Fv43D. La secuencia de aminoácidos de Fv43D (sec. con núm. de ident. :28) se muestra en las Figuras 21B y 57A-57B. La sec. con núm. de ident. 28 es la secuencia del inmaduro Fv43D. Fv43D tiene una secuencia final prevista correspondiente a los residuos 1 al 20 de la sec. con núm. de ident. :28 (subrayada en la Figura 2IB) ; se prevé que el elivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a los residuos 21 al 350 de la sec. con núm. de ident.:28. El dominio conservado previsto aparece en negrita en la Figura 21B. Se demostró que Fv43D tiene actividad de ß-xilosidasas en, por ejemplo, un ensayo enzimático con el uso de p-nitofenil^-xilopiranosida, xilobiosa y/o xilo-oligómeros lineales mixtos como sustratos. Los residuos catalíticos previstos incluyen ya sea D37 o D72, D159 y E251. Como se usa en la presente descripción, "un polipéptido Fv43D" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300 o 320 residuos de aminoácidos contiguos entre los residuos 21 al 350 de la sec. con núm. de ident. :28. Un polipéptido Fv43D se encuentra, preferentemente, inalterado en comparación con el Fv43D natural, en los residuos D37 o D72, D159 y E251. Un polipéptido Fv43D se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados en un grupo de enzimas que incluyen Fv43D y l, 2, 3, 4, 5, 6, 7, 8 o las 9 de otras secuencias de aminoácidos en el alineamiento de las Figuras 57A-57B. Un polipéptido Fv43D comprende adecuadamente el CD previsto completo del Fv43D natural que se muestra en la Figura 21B. Un polipéptido Fv43D ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 ¾, 95 %, 96 %, 97 %, 98 ¾, 99 % o 100 % de identidad con la secuencia de FV43D maduro que se muestra en la Figura 21B. El polipéptido Fv43D de la presente invención tiene, preferentemente, actividad de ß-xilosidasas.
Consecuentemente, un polipéptido Fv43D de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident.:28 o con los residuos (i) 20-341, (ii) 21-350, (iii) 107-341 o (iv) 107-350 de la sec. con núm. de ident.:28. El polipéptido tiene, adecuadamente, actividad de ß -xilosidasas .
Fv39A. en algunos aspectos, la composición de celulasas de la presente invención comprende un polipéptido Fv39A. La secuencia de aminoácidos de Fv39A (sec. con núm. de ident.:8) se muestra en la Figura 11B. La sec. con núm. de ident . 8 es la secuencia del inmaduro Fv39A. Fv39A tiene una secuencia final prevista correspondiente a los residuos 1 al 19 de la sec. con núm. de ident. :8 (subrayada en la Figura 11B) ; se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a los residuos 20 al 439 de la sec. con núm. de ident . : 8. El dominio conservado previsto se muestra en negrita en la Figura 11B. Se demostró que Fv39A tiene actividad de ß-xilosidasas en, por ejemplo, un ensayo enzimático con el uso de p-nitofenil - ß-xilopiranosida, xilobiosa o xilo-oligómeros lineales mixtos como sustratos. Se prevé que los residuos de Fv39A E168 y E272 funcionan como ácido-base y nucleófilo catalíticos, respectivamente, en base a un alineamiento de secuencias de las xilosidasas GH39 de Thermoanaerobacterium saccharolyticum (registro de la Uniprot núm. P36906) y Geobacillus stearothermophilus mencionadas anteriormente (registro de la Uniprot núm. Q9ZFM2) con Fv39A. Como se usa en la presente descripción, "un polipéptido Fv39A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350 o 400 residuos de aminoácidos contiguos entre los residuos 20 al 439 de la sec. con núm. de ident . : 8. Un polipéptido Fv39A se encuentra, preferentemente, inalterado en comparación con el Fv39A natural en los residuos E168 y E272. Un polipéptido Fv39A se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados en una familia de enzimas que incluye Fv39A y xilosidasas de Thermoanaerobacterium saccharolyticum y Geobacillus stearothermophilus (ver arriba) . Un polipéptido Fv39A comprende, adecuadamente, el dominio conservado previsto completo del Fv39A natural tal como se muestra en la Figura 11B. Un polipéptido Fv39A ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Fv39A maduro tal como se muestra en la Figura 11B. El polipéptido Fv39A de la presente invención tiene, preferentemente, actividad de ß-xilosidasas .
Consecuentemente, un polipéptido Fv39A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident.:8 o con los residuos (i) 20-439, (ii) 20-291, (iii) 145-291 o (iv) 145-439 de la sec. con núm. de ident.:8. El polipéptido tiene, adecuadamente, actividad de ß -xilosidasas .
Fv43E. en algunos aspectos, la composición de celulasas de la presente invención comprende un polipéptido Fv43E. La secuencia de aminoácidos de Fv43E (sec. con núm. de ident.:6) se muestra en las Figuras 10B y 57A-57B. La sec. con núm. de ident. 6 es la secuencia del inmaduro Fv43E. Fv43E tiene una secuencia final prevista correspondiente a los residuos 1 al 18 de la sec. con núm. de ident .: 6 (subrayada en la Figura 10B) ; se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a los residuos 19 al 530 de la sec. con núm. de ident . : 6. El dominio conservado previsto se indica en negrita en la Figura 10B. Se demostró que Fv43E tiene actividad de ß-xilosidasas, en, por ejemplo, un ensayo enzimático con el uso de 4-nitofenil-p-D-xilopiranosida, xilobiosa y xilo-oligómeros lineales mixtos o mazorca de maíz tratada previamente con amoníaco diluido como sustratos. Los residuos catalíticos previstos incluyen ya sea D40 o D71, D155 y E241. Como se usa en la presente descripción, "un polipéptido Fv43E" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450 o 500 residuos de aminoácidos contiguos entre los residuos 19 al 530 de la sec. con núm. de ident. -.6. un polipéptido Fv43E se encuentra, preferentemente, inalterado en comparación con el Fv43E natural en los residuos D40 o D71, D155 y E241. Un polipéptido Fv43E se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos que se encuentran conservados en una familia de enzimas que incluye Fv43E y 1, 2, 3, 4, 5, 6, 7 o las otras 8 secuencias de aminoácidos en el alineamiento de las Figuras 57A-57B. Un polipéptido Fv43E comprende, adecuadamente, el dominio conservado previsto completo del Fv43E natural tal como se muestra en la Figura 10B. Un polipéptido Fv43E ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 ¾ de identidad con la secuencia de FV43E maduro tal como se muestra en la Figura 10B. El polipéptido Fv43E de la presente invención tiene, preferentemente, actividad de ß-xilosidasas .
Consecuentemente, un polipéptido Fv43E de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident. :6 o con los residuos (i) 19-530, (ii) 29-530, (iii) 19-300 o (iv) 29-300 de la sec. con núm. de ident. :6. El polipéptido tiene, adecuadamente, actividad de ß-xilosidasas .
Fv43B: En algunos aspectos, la composición de celulasas de la presente invención comprende un polipéptido Fv43B. La secuencia de aminoácidos de Fv43B (sec. con núm. de ident. :12) se muestra en las Figuras 13B y 57A-57B. La sec. con núm. de ident . 12 es la secuencia del inmaduro Fv43B. Fv43B tiene una secuencia final prevista correspondiente a los residuos 1 al 16 de la sec. con núm. de ident. : 12 (subrayada en la Figura 13B) ; se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a los residuos 17 al 574 de la sec. con núm. de ident. : 12. El dominio conservado previsto aparece en negrita en la Figura 13B. Se demostró que Fv43B tiene actividad tanto de ß-xilosidasas como de L-a-arabinofuranosidasas en, por ejemplo, un primer ensayo enzimático con el uso de 4 -nitofenil- ß-D-xilopiranosida y p-nitrofenil-a-L-arabinofuranosida como sustratos. Se demostró, en un segundo ensayo enzimático, que cataliza la liberación de arabinosa a partir de arabino-xilooligómeros ramificados y cataliza la liberación aumentada de xilosa a partir de mezclas de oligómeros en presencia de otras enzimas xilosidasas. Los residuos catalíticos previstos incluyen ya sea D38 o D68, D151 y E236. Como se usa en la presente descripción, "un polipéptido Fv43B" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500 o 550 residuos de aminoácidos contiguos entre los residuos 17 al 574 de la sec. con núm. de ident.:12. Un polipéptido Fv43B se encuentra, preferentemente, inalterado en comparación con el Fv43B natural, en los residuos D38 o D68, D151 y E236. Un polipéptido Fv43B se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados en una familia de enzimas que incluyen Fv43B y 1, 2, 3, 4, 5, 6, 7, 8 o las otras 9 secuencias de aminoácidos en el alineamiento de las Figuras 57A-57B. Un polipéptido Fv43B comprende, adecuadamente, el dominio conservado previsto completo del Fv43B natural tal como se muestra en las Figuras 13B y 57A-57B. Un polipéptido Fv43B ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Fv43B maduro tal como se muestra en la Figura 13B. El polipéptido Fv43B de la presente invención tiene, preferentemente, actividad de ß-xilosidasas , actividad de L-a-arabinofuranosidasas o ambas.
Consecuentemente, un polipéptido Fv43B de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident.:12 o con los residuos (i) 17-574, (ii) 27-574, (iii) 17-303 o (iv) 27-303 de la sec. con núm. de ident.:12. El polipéptido tiene, adecuadamente, actividad de ß-xilosidasas, actividad de L-a-arabinofuranosidasas o ambas.
Pa51A: en algunos aspectos, la composición de celulasas de la presente invención comprende un polipéptido Pa51A. La secuencia de aminoácidos de Pa51A (sec. con núm. de ident.:14) se muestra en las Figuras 14B y 58. La sec. con núm. de ident . 14 es la secuencia del inmaduro Pa51A. Pa51A tiene una secuencia final prevista correspondiente a los residuos 1 al 20 de la sec . con núm. de ident.:14 (subrayada en la Figura 14B) ; se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a los residuos 21 al 676 de la sec. con núm. de ident . : 14. El dominio conservado de L-a-arabinofuranosidasa previsto aparece en negrita en la Figura 14B. Se demostró que Pa51A tiene tanto actividad de ß-xilosidasas como de L-a-arabinofuranosidasas en, por ejemplo, ensayos enzimáticos con el uso de los sustratos artificiales p-nitrofenil- ß-xilopiranosida y p-nitofenil- a-L-arabinofuranosida . Se demostró que cataliza la liberación de arabinosa a partir de arabino-xilooligómeros ramificados y que cataliza la liberación incrementada de xilosa a partir de mezclas de oligómero en presencia de otras enzimas xilosidasas. Los residuos acídicos conservados incluyen E43, D50, E257, E296, E340, E370, E485 y E493. Como se usa en la presente descripción, "un polipéptido Pa51A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600 o 650 residuos de aminoácidos contiguos entre los residuos 21 al 676 de la sec. con núm. de ident .: 1 . Un polipéptido Pa51A se encuentra, preferentemente, inalterado en comparación con el Pa51A natural, en los residuos E43, D50, E257, E296, E340, E370, E485 y E493. Un polipéptido Pa51A se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados en un grupo de enzimas que incluyen Pa51A, Fv51A y Pf51A, tal como se muestra en el alineamiento de la Figura 58. Un polipéptido Pa51A comprende, adecuadamente, el dominio conservado previsto del Pa51A natural tal como se muestra en la Figura 14B . Un polipéptido Pa51A ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 ¾, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Pa51A maduro tal como se muestra en la Figura 14B. El polipéptido Pa51A de la presente invención tiene, preferentemente, actividad de ß-xilosidasas, actividad de L-a-arabinofuranosidase o ambas.
Consecuentemente, un polipéptido Pa51A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec . con núm. de ident . : 14 o con los residuos (i) 21-676, (ii) 21-652, (iii) 469-652 o (iv) 469-676 de la sec. con núm. de ident.: 14. El polipéptido tiene, adecuadamente, actividad de ß-xilosidasas , actividad de L-a-arabinofuranosidasas o ambas.
Gz43A: en algunos aspectos, la composición de celulasas de la presente invención comprende un polipéptido Gz43A. La secuencia de aminoácidos de Gz43A (sec. con núm. de ident.:16) se muestra en las Figuras 15B y 57A-57B. La sec. con núm. de ident. 16 es la secuencia del inmaduro Gz43A. Gz43A tiene una secuencia final prevista correspondiente a los residuos 1 al 18 de la sec. con núm. de ident.: 16 (subrayada en la Figura 15B) ; se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a los residuos 19 al 340 de la sec. con núm. de ident. :16. El dominio conservado previsto aparece en negrita en la Figura 15B. Se demostró que Gz43A tiene actividad de ß-xilosidasas en, por ejemplo, un ensayo enzimático con el uso de p-nitofenil-ß-xilopiranosida, xilobiosa o xilo-oligómeros lineales y/o mixtos como sustratos. Los residuos catalíticos previstos incluyen ya sea D33 o D68, D154 y E243. Como se usa en la presente descripción, "un polipéptido Gz43A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250 o 300 residuos de aminoácidos contiguos entre los residuos 19 al 340 de la sec. con núm. de ident. :16. Un polipéptido Gz43A se encuentra, preferentemente, inalterado en comparación con el Gz43A natural, en los residuos D33 o D68, D154 y E243. Un polipéptido Gz43A se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados en un grupo de enzimas que incluyen Gz43A y 1, 2, 3, 4, 5, 6, 7, 8 o las otras 9 secuencias de aminoácidos en el alineamiento de las Figuras 57A-57B. Un polipéptido Gz43A comprende, adecuadamente, el dominio conservado previsto del Gz43A natural tal como se muestra en la Figura 15B. Un polipéptido Gz43A ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Gz43A maduro tal como se muestra en la Figura 15B. El polipéptido Gz43A de la presente invención tiene, preferentemente, actividad de ß-xilosidasas .
Consecuentemente, un polipéptido Gz43A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident.:16 o con los residuos (i) 19-340, (ii) 53-340, (iii) 19-383 o (iv) 53-383 de la sec. con núm. de ident . : 16. El polipéptido tiene, adecuadamente, actividad de ß-xilosidasas .
La ß-xilosidasa o ß-xilosidasas constituyen, adecuadamente, de aproximadamente 0 % en peso a aproximadamente 75 % en peso (por ejemplo, de aproximadamente 0.1 % en peso a aproximadamente 50 % en peso, de aproximadamente 1 % en peso a aproximadamente 40 % en peso, de aproximadamente 2 % en peso a aproximadamente 35 % en peso, de aproximadamente 5 % en peso a aproximadamente 30 % en peso, de aproximadamente 10 % en peso a aproximadamente 25 % en peso) del peso total de enzimas en una composición de celulasas o de hemicelulasas de la presente invención. La relación de cualquier par de proteínas con relación una de la otra se puede calcular fácilmente en base a la presente descripción. Se contempla composiciones que comprenden enzimas en cualquier relación de peso derivable de los porcentajes en peso descritos en la presente descripción. El contenido de ß-xilosidasas puede estar en el intervalo en donde el límite inferior es aproximadamente 0 % en peso, 0.05 % en peso, 0.5 % en peso, 1 % en peso, 2 % en peso, 3 % en peso, 4 % en peso, 5 % en peso, 6 % en peso 7 % en peso, 8 % en peso, 9 % en peso, 10 % en peso, 12 % en peso, 15 % en peso, 20 % en peso, 25 % en peso, 30 % en peso, 40 % en peso, 45 % en peso o 50 % en peso del peso total de enzimas en la mezcla/composición y el límite superior es aproximadamente 10 % en peso, 15 % en peso, 20 % en peso, 25 % en peso, 30 % en peso, 35 % en peso, 40 % en peso, 50 % en peso, 55 % en peso, 60 % en peso, 65 % en peso o 70 ¾ en peso del peso total de enzimas en la composición. Por ejemplo, la ß-xilosidasa o ß-xilosidasas representan, adecuadamente, de aproximadamente 2 % en peso a aproximadamente 30 % en peso; de aproximadamente 10 % en peso a aproximadamente 20 % en peso; de aproximadamente 3 % en peso a aproximadamente 10 % en peso o de aproximadamente 5 % en peso a aproximadamente 9 % en peso del peso total de enzimas en la composición La ß-xilosidasa se puede producir al expresar un gen endógeno o exógeno que codifica una ß-xilosidasa . La ß-xilosidasa, en ciertas circunstancias, se puede sobreexpresar o subexpresar. Alternativamente, la ß-xilosidasa puede ser heteróloga para el organismo huésped que se expresa de manera recombinante por medio del organismo huésped. Además, la ß-xilosidasa se puede agregar a una composición de celulasas o hemicelulasas de la presente invención en una forma purificada o aislada.
L-oc-arabinofuranosidasas : en algunos aspectos, la composición de celulasas de la presente invención comprende por lo menos una L-a-arabinofuranosidasa . En algunos aspectos, la por lo menos única L-a-arabinofuranosidasa se selecciona del grupo que consiste en Af43A, Fv43B, Pf51A, Pa51A y Fv51A. En algunos aspectos, Pa51A, Fv43A tienen tanto actividad de L-a-arabinofuranosidasas como actividad de ß-xilosidasas .
Las L-a-arabinofuranosidasas (EC 3.2.1.55) de cualquier organismo adecuado se pueden usar como la o las L-a-arabinofuranosidasas . Las L-a-arabinofuranosidasas adecuadas incluyen, por ejemplo, L-a-arabinofuranosidasas de A. oryzae (Numan & Bhosle, J. Ind. icrobiol . Biotechnol . 2006, 33:247-260), A. sojae (Oshima et al. J. Ap l . Glycosci. 2005, 52:261-265), B. brevis (Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), B. stearothermophilus ( im et al., J. Microbiol. Biotechnol. 2004, 14:474-482), B. breve (Shin et al., Ap l. Environ. Microbiol. 2003, 69:7116-7123), B. longum (Margolles et al., Appl. Environ. Microbiol. 2003, 69:5096-5103), C. thermocellum (Taylor et al., Biochem. J. 2006, 395:31-37), F. oxysporum (Panagiotou et al., Can. J. Microbiol. 2003, 49:639-644), F. oxysporum f. sp. dianthi (Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), G. stearothermophilus T-6 (Shallom et al., J. Biol . Chem. 2002, 277:43667-43673), H. vulgare (Lee et al., J. Biol. Chem. 2003, 278:5377-5387), P. chrysogenum (Sakamoto et al., Biophys. Acta 2003, 1621:204-210), Penicillium sp. (Rahman et al., Can. J. Microbiol. 2003, 49:58-64), P. cellulosa (Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), j . pusillus (Rahman et al., Carbohyd . Res. 2003, 338:1469-1476), S. chartreusis, S. thermoviolacus, T. ethanolicus, T/xylanilyticus (Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), G. fusca (Tuncer and Ball, Folia Microbiol. 2003, (Praha) 48:168-172), T. marítima (Miyazaki, Extremophiles 2005, 9:399-406), Trichoderma sp. SY (Jung et al. Agrie. Chem. Biotechnol. 2005, 48:7-10), A. kawachii (Koseki et al., Biochim. Biophys. Acta 2006, 1760:1458-1464), F. oxysporum f. sp. dianthi (Chacon-Martinez et al., Physiol. Mol. Plant Pathol . 2004, 64:201-208), T. xylanilyticus (Debeche et al . , Protein Eng. 2002, 15:21-28), H. insolens, M. giganteus (Sorensen et al . , Biotechnol . Prog. 2007, 23:100-107) o R. sativus (Kotake et al . J. Exp. Bot . 2006, 57:2353-2362). Las L-a-arabinofuranosidasas adecuadas se pueden producir de manera endógena por medio del organismo huésped o se pueden clonar de manera recombinante y/o expresar por medio del organismo huésped. Además, las L-a-arabinofuranosidasas adecuadas se pueden agregar a una composición de celulasas en una forma purificada o aislada.
Af43A: en algunos aspectos, la composición de celulasas de la presente invención comprende un polipéptido Af43A. La secuencia de aminoácidos de Af43A (sec. con núm. de ident.:20) se muestra en las Figuras 17B y 57A-57B. La sec. con núm. de ident. 20 es la secuencia del inmaduro Af43A. El dominio conservado previsto aparece en negrita en la Figura 17B. Se demostró que Af43A tiene actividad de L-a-arabinof ranosidasas en, por ejemplo, un ensayo enzimático con el uso de p-nitofenil- a-L-arabinofuranosida como sustrato. Se demostró que Af43A cataliza la liberación de arabinosa del grupo de oligómeros liberados de hemicelulosa por medio de la acción de endoxilanasas . Los residuos catalíticos previstos incluyen ya sea D26 o D58, D139 y E227. Como se usa en la presente descripción, "un polipéptido Af43A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 ¾, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250 o 300 residuos de aminoácidos contiguos de la sec. con núm. de ident.:20. Un polipéptido Af43A se encuentra, preferentemente, inalterado en comparación con el Af43A natural, en los residuos D26 o D58, D139 y E227. Un polipéptido Af43A se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 ¾ o 99 % de los residuos de aminoácidos conservados en un grupo de enzimas que incluyen Af43A y 1, 2, 3, 4, 5, 6, 7, 8 o todas las otras 9 secuencias de aminoácidos en el alineamiento de la Figura 57. Un polipéptido Af43A comprende, adecuadamente, el dominio conservado previsto del Af43A natural, tal como se muestra en la Figura 17B. Un polipéptido Af43A ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la sec. con núm. de ident.:20. El polipéptido Af43A de la presente invención tiene, preferentemente, actividad de L-a-arabinofuranosidasas .
Consecuentemente, un polipéptido Af43A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident.:20 o con los residuos (i) 15-558 o (ii) 15-295 de la sec . con núm. de ident.:20. El polipéptido tiene, adecuadamente, actividad de L-o¡-arabinofuranosidasas .
Pf51A: en algunos aspectos, la composición de celulasas de la presente invención comprende un polipéptido Pf51A. La secuencia de aminoácidos de Pf51A (sec. con núm. de ident.:22) se muestra en las Figuras 18B y 58. La sec. con núm. de ident . 22 es la secuencia del inmaduro Pf51A. Pf51A tiene una secuencia final prevista correspondiente a los residuos 1 al 20 de la sec. con núm. de ident. :22 (subrayada en la Figura 18B) ; se prevé que el clivaje de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a los residuos 21 al 642 de la sec. con núm. de ident. :22. El dominio conservado de L- -arabinofuranosidasa previsto aparece en negrita en la Figura 18B. Se demostró que Pf51A tiene actividad de L-a-arabinofuranosidasas en, por ejemplo, un ensayo enzimático con el uso de -nitrofenil - OÍ-L-arabinofuranosida como sustrato. Se demostró que Pf51A cataliza la liberación de arabinosa del grupo de oligómeros liberados de hemicelulosa por medio de la acción de la endoxilanasa . Los residuos acídicos conservados previstos incluyen E43, D50, E248, E287, E331, E360, E472 y E480. Como se usa en la presente descripción, "un polipéptido Pf51A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 ¾, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550 o 600 residuos de aminoácidos contiguos entre los residuos 21 al 642 de la sec . con núm. de ident.:22. Un polipéptido Pf51A se encuentra, preferentemente, inalterado en comparación con él Pf51A natural, en los residuos E43, D50, E248, E287, E331, E360, E472 y E480. Un polipéptido Pf51A se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre Pf51A, Pa51A y Fv51A, tal como se muestra en el alineamiento de la Figura 58. Un polipéptido Pf51A comprende, adecuadamente, el dominio conservado previsto del Pf51A natural que se muestra en la Figura 18B. Un polipéptido Pf51A ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 ¾, 94 %, 95 , 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Pf51A maduro que se muestra en la Figura 18B . El polipéptido Pf51A de la presente invención tiene, preferentemente, actividad de L-a-arabinofuranosidasas .
Consecuentemente, un polipéptido Pf51A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident.:22 o con los residuos (i) 21-632, (ii) 461-632, (iii) 21-642 o (iv) 461-642 de la sec . con núm. de ident.:22. El polipéptido tiene actividad de L-a-arabinofuranosidasas .
Fv51A. en algunos aspectos, la composición de celulasas de la presente invención comprende un polipéptido Fv51A. La secuencia de aminoácidos de Fv51A (sec. con núm. de ident.:32) se muestra en las Figuras 23B y 58. La sec. con núm. de ident. 32 es la secuencia del inmaduro Fv51A. Fv51A tiene una secuencia final prevista correspondiente a los residuos 1 al 19 de la sec. con núm. de ident. :32 (subrayada en la Figura 23B) ; se prevé que el cliv je de la secuencia señal produce una proteína madura que tiene una secuencia correspondiente a los residuos 20 al 660 de la sec. con núm. de ident. :32. El dominio conservado de L-a-arabinofuranosidasa previsto aparece en negrita en la Figura 23B. Se demostró que Fv51A tiene actividad de L-a-arabinofuranosidasas en, por ejemplo, un ensayo enzimático con el uso de 4-nitrofenil- OÍ-L-arabinofuranosida como sustrato. Se demostró que Fv51A cataliza la liberación de arabinosa del grupo de oligómeros liberados de hemicelulosa por medio de la acción de la endoxilanasa . Los residuos conservados incluyen E42, D49, E247, E286, E330, E359, E479 y E487. Como se usa en la presente descripción, "un polipéptido Fv51A" se refiere a un polipéptido y/o una variante de este que comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con por lo menos 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600 o 625 residuos de aminoácidos contiguos entre los residuos 20 al 660 de la sec . con núm. de ident . :32. Un polipéptido Fv51A se encuentra, preferentemente, inalterado en comparación con el Fv51A natural, en los residuos E42, D49, E247, E286, E330, E359, E479 y E487. Un polipéptido Fv51A se encuentra, preferentemente, inalterado en por lo menos 70 %, 80 %, 90 %, 95 %, 98 % o 99 % de los residuos de aminoácidos conservados entre Fv51A, Pa51A y Pf51A, tal como se muestra en el alineamiento de la Figura 58. Un polipéptido Fv51A comprende, adecuadamente, el dominio conservado previsto del Fv51A natural que se muestra en la Figura 23B. Un polipéptido Fv51A ilustrativo comprende una secuencia que tiene por lo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad con la secuencia de Fv51A maduro que se muestra en la Figura 23B. El polipéptido Fv51A de la presente invención tiene, preferentemente, actividad de L- -arabinofuranosidasas .
Consecuentemente, un polipéptido Fv51A de la presente invención comprende, adecuadamente, una secuencia de aminoácidos con por lo menos 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencias con la secuencia de aminoácidos de la sec. con núm. de ident.:32 o con los residuos (i) 21-660, (ii) 21-645, (iii) 450-645 o (iv) 450-660 de la sec. con núm. de ident.:32. El polipéptido tiene, adecuadamente, actividad de L-o¡-arabinofuranosidasas .
La L-o¡-arabinofuranosidasa o L- -arabinofuranosidasas constituyen, adecuadamente, de aproximadamente 0.05 % en peso a aproximadamente 30 % en peso (por ejemplo, de aproximadamente 0.1 % en peso a aproximadamente 25 % en peso, de aproximadamente 0.5 % en peso a aproximadamente 20 % en peso, de aproximadamente 1 % en peso a aproximadamente 10 % en peso) de la cantidad total de enzimas en una composición de celulasas o de hemicelulasas de la descripción, en donde el % en peso representa el peso combinado de L-a-arabinofuranosidasa o L-OÍ-arabinofuranosidasas con relación al peso combinado de todas las enzimas en una composición específica. La L-a-arabinofuranosidasa o L-a-arabinofuranosidasas pueden estar presentes en el intervalo en donde el límite inferior es 0.05 % en peso, 0.5 % en peso, 1 % en peso, 2 % en peso, 3 % en peso, 4 % en peso, 5 % en peso, 6 % en peso 7 % en peso, 8 % en peso, 9 % en peso, 10 % en peso, 12 % en peso, 15 % en peso, 20 % en peso, 25 % en peso o 28 % en peso y el límite superior es 5 % en peso, 10 % en peso, 15 % en peso, 20 % en peso, 25 % en peso o 30 % en peso. Por ejemplo, la o las L-a-arabinofuranosidasas pueden constituir, adecuadamente, de aproximadamente 2 % en peso a aproximadamente 30 % en peso (por ejemplo, de aproximadamente 2 % en peso a aproximadamente 30 % en peso, de aproximadamente 5 ¾ en peso a aproximadamente 30 % en peso, de aproximadamente 5 % en peso a aproximadamente 10 % en peso, de aproximadamente 10 % en peso a aproximadamente 30 % en peso, de aproximadamente 20 % en peso a aproximadamente 30 % en peso, de aproximadamente 25 % en peso a aproximadamente 30 % en peso, de aproximadamente 2 % en peso a aproximadamente 10 % en peso, de aproximadamente 5 % en peso a aproximadamente 15 % en peso, de aproximadamente 10 % en peso a aproximadamente 25 % en peso, de aproximadamente 20 % en peso a aproximadamente 30 % en peso, etc.) del peso total de enzimas en una composición de celulasas o de hemicelulasas de la presente invención.
La L-a-arabinofuranosidasa se puede producir al expresar un gen endógeno o exógeno que codifica una L-a-arabinofuranosidasa . La L- -arabinofuranosidasa, en ciertas circunstancias, se puede sobreexpresar o subexpresar. Alternativamente, la L-a-arabinofuranosidasa puede ser heteróloga para el organismo huésped que se expresa de manera recombinante por medio del organismo huésped. Además, la L-a-arabinofuranosidasa se puede agregar a una composición de celulasas o de hemicelulasas de la presente invención en una forma purificada o aislada.
Composiciones de células En algunos aspectos, la presente invención contempla células de un ácido nucleico que codifica un polipéptido que tiene actividad de celulasas. En algunos aspectos, las células son células de G. reesei. En algunos aspectos, las células son células de A. niger. En algunos aspectos, las células incluyen células de cualquier microorganismo (por ejemplo, células de una bacteria, un organismo del reino protista, un alga, un hongo (por ejemplo, una levadura u hongo filamentoso) u otro microbio) y son, preferentemente, células de una bacteria, una levadura o un hongo filamentoso. Las células huésped adecuadas de los géneros bacterianos incluyen, pero no se limitan a, células de Escherichia , Bacillus, Lactobacillus , Pseudomonas y Streptomyces . Las células adecuadas de especies bacterianas incluyen, pero no se limitan a, células de Escherichia coli, Bacillus subtilis, Bacillus licheniformis, Lactobacillus brevis , Pseudomonas aeruginosa y Streptomyces lividans . Las células huésped adecuadas de los géneros de levadura incluyen, pero no se limitan a, células de Saccharomyces, Schizosaccharomyces , Candida, Hansenula , Pichia, Kluyveromyces y Phaffia. Las células adecuadas de especies de levadura incluyen, pero no se limitan a, células de Saccharomyces cerevisiae, Schizosaccharomyces pombe, Candida albicans , Hansenula polymorpha, Pichia pastoris, P. canadensis, Kluyveromyces marxianus y Phaffia rhodozyma. Las células huésped adecuadas de hongos filamentosos incluyen todas las formas filamentosas de la subdivisión Eumycotina . Las células adecuadas de géneros fúngicos filamentosos incluyen, pero no se limitan a, células de Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis , Chrysoporium, Coprinus , Coriolus , Corynascus, Chaertomium, Cryptococcus, Filobasidium, Fusarium, Gibberella , Humicola , Magnaporthe, Mucor, Myceliophthora , Mucor, Neocallimastix, Neurospora, Paecilomyces , Penicillium, Phanerochaete, Phlebia, Piromyces , Pleurotus, Scytaldium, Schizophyllum, SporoLrichum, Talaromyces, Thermoascus, Thielavia, Tolypocladium, Trametes y Trichoderma. Las células adecuadas de especies fúngicas filamentosas incluyen, pero no se limitan a, células de Aspergillus awamori, Aspergillus fumigatus, Aspergillus foetidus , Aspergillus japonicus , Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Chrysosporium lucknowense, Fusarium bactridioides, Fusarium cerealis , Fusarium crookwellense , Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi , Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarcochrou , Fusarium sporotrichioides , Fusarium sulphureum, Fusarium torulosum, Fusarium trichothecioides, Fusarium venenatum, Bjerkandera adusta, Ceriporiopsis aneirina, Ceriporiopsis aneirina , Ceriporiopsis caregiea , Ceriporiopsis gilvescens , Ceriporiopsis pannocinta, Ceriporiopsis rivulosa, Ceriporiopsis subrufa, Ceriporiopsis subvermispora, Coprinus cinereus, Coriolus hirsutus, Humicola insolens, Humicola lanuginosa, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Neurospora intermedia , Penicillium purpurogenum, Penicillium canescens, Penicillium solitum, Penicillium funiculosum Phanerochaete chrysosporium, Phlebia radíate, Pleurotus eryngii, Talaromyces flavus, Thielavia terrestris, Trametes villosa, Trametes versicolor, Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatu , Trichoderma reesei y Trichoderma viride. En algunos aspectos, las' células son células de T. reesei. En algunos aspectos, las células son células de A. niger. En algunos aspectos, las células comprenden, además, uno o más ácidos nucleicos que codifican una o más hemicelulasas . En algunos aspectos, las células comprenden una composición de celulasas que no es de origen natural que comprende una enzima beta-glucosidasa , que es una quimera de por lo menos dos beta-glucosidasas .
En algunos aspectos, la presente invención contempla células que comprenden un ácido nucleico que codifica un polipéptido que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 % en peso, 75 %, 80 % en peso, 85 %, 90 %, 91 % en peso, 92 % en peso, 93 % en peso, 94 % en peso, 95 % en peso, 96 % en peso, 97 % en peso, 98 % en peso, 99 % en peso) de identidad de secuencias con cualquiera de las sec . con núms . de ident.:60, 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79. En algunos aspectos, las células comprenden, además, un ácido nucleico que codifica un polipéptido que tiene por lo menos actividad de una hemicelulasa , tal como, por ejemplo, actividad de ß-xilosidasa, L-D-arabinofuranosidasa o xilanasas. En algunos aspectos, la presente invención contempla, además, células que comprenden una quimera de dos o más secuencias de ß-glucosidasas , en donde la primera secuencia de ß -glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 % (por ejemplo, aproximadamente 65 %, aproximadamente 70 %, aproximadamente 75 % o aproximadamente 80 %) o más de identidad de secuencias con un tramo contiguo de la sec. con núm. de ident . :60 de la misma longitud y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, (por ejemplo, aproximadamente 65 %, aproximadamente 65 %, aproximadamente 70 %, aproximadamente 75 %, aproximadamente 80 %) o más de identidad de secuencias con un tramo contiguo de la misma longitud de una de las secuencias de aminoácidos seleccionadas de las sec. con núms. de ident. :54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79. En ciertos aspectos, la presente invención contempla células que comprenden una quimera o un híbrido de dos o más secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, (por ejemplo, aproximadamente 65 %, aproximadamente 65 %, aproximadamente 70 %, aproximadamente 75 %, aproximadamente 80 %) o más de identidad de secuencias con un tramo contiguo de la misma longitud de una de las secuencias de aminoácidos seleccionadas de las sec . con núms . de ident . : 54 , 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, o comprende uno o más o todos los motivos de las secuencias de polipéptidos de las sec. con núms. de ident .: 164 - 169 y la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende aproximadamente 60 %, (por ejemplo, aproximadamente 65 %, aproximadamente 65 %, aproximadamente 70 %, aproximadamente 75 %, aproximadamente 80 %) o más de identidad de secuencias con un tramo contiguo de la misma longitud de la sec. con núm. de ident. :60. En ciertas modalidades, la primera secuencia de ß-glucosidasas , la segunda secuencia de ß-glucosidasas o ambas secuencias de ß-glucosidasas comprenden uno o más sitios de glicosilación . En ciertas modalidades, la primera secuencia de ß-glucosidasas o la segunda secuencia de ß-glucosidasas comprende una región en bucle o una secuencia que codifica una estructura tipo bucle que tiene aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En ciertas modalidades, la primera secuencia de ß -glucosidasas y la segunda secuencia de ß-glucosidasas se encuentran directamente adyacentes o conectadas. En algunas modalidades, la primera secuencia de ß -glucosidasas y la segunda secuencia de ß-glucosidasas no se encuentran directamente adyacentes, más bien se conectan por medio de un dominio conector. En ciertas modalidades, el dominio conector puede comprender la región en bucle, en donde la región en bucle tiene aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD(R/K)YNIT (sec. con núm. de ident.:172). En ciertas modalidades, el dominio conector se encuentra en la región central (por ejemplo, no está ubicado en ni cerca del extremo N-terminal ni del extremo C-terminal de la molécula quimérica) .
En ciertos aspectos, la presente invención contempla células que comprenden una quimera o híbrido de dos o más secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud (por ejemplo, aproximadamente 250, 300, 350 o 400 residuos de aminoácidos de longitud) y comprende uno o más o todos los motivos de las secuencias de aminoácidos de las sec. con núms. de ident .: 136-148 , mientras que la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud (por ejemplo, aproximadamente 120, 150, 170, 200 o 220 residuos de aminoácidos de longitud) y comprende uno o más o todos los motivos de las secuencias de aminoácidos de las sec. con núms. de ident .: 149-156. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) de los motivos de las secuencias de aminoácidos de las sec. con núms. de ident.: 164-169, y la segunda de las dos o más secuencias de ß-glucosidasa tiene por lo menos 50 residuos de aminoácidos de longitud y comprende la sec. con núm. de ident. :170. En ciertas modalidades, la primera secuencia de ß-glucosidasas , la segunda secuencia de ß-glucosidasas o ambas secuencias de ß-glucosidasas comprenden uno o más sitios de glicosilación . En ciertas modalidades, la primera secuencia de ß-glucosidasas o la segunda secuencia de ß-glucosidasas comprende una región en bucle o una secuencia que codifica una estructura tipo bucle que tiene aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.: 171) o de FD (R/K) YNIT (sec. con núm. de ident. :172). En ciertas modalidades, la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas se encuentran directamente adyacentes o conectadas. En algunas modalidades, la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas no se encuentran directamente adyacentes, más bien se conectan por medio de un dominio conector. En ciertas modalidades, el dominio conector puede comprender la región en bucle, en donde la región en bucle tiene aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident. :171) o de FD (R/K) Y IT (sec. con núm. de ident. :172) . En ciertas modalidades, el dominio conector se encuentra en la región central (por ejemplo, no está ubicado en ni cerca del extremo N-terminal ni del extremo C-terminal de la molécula quimérica) .
Composiciones de caldo de fermentación En algunos aspectos, la presente invención contempla un caldo de fermentación que comprende una o más actividades de celulasas, en donde el caldo tiene la capacidad de convertir más de aproximadamente 50 % en peso de la celulosa presente en una muestra de biomasa en azúcares fermentables . En algunos aspectos, el caldo de fermentación tiene la capacidad de convertir más de aproximadamente 55 % en peso (por ejemplo, más de aproximadamente 60 % en peso, 65 % en peso, 70 % en peso, 75 % en peso, 80 % en peso, 85 % en peso o 90 % en peso) de la celulosa presente en una muestra de biomasa en azúcares fermentables . En algunos aspectos, el caldo de fermentación puede comprender, además, actividad de una o más hemicelulasas . En ciertos aspectos, la presente invención contempla un caldo de fermentación que comprende por lo menos un polipéptido de ß-glucosidasas que tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 % 92 %, 83 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %) de identidad de secuencias con cualquierá de las sec . con núms. de ident.:54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79. En ciertos aspectos, la presente invención contempla un caldo de fermentación que comprende una ß-glucosidasa híbrida o quimérica, que es una quimera de por lo menos dos secuencias de ß-glucosidasas .
En algunos aspectos, la presente invención contempla un caldo de fermentación que comprende por lo menos actividad de una ß-glucosidasa, en donde el caldo de fermentación tiene la capacidad de convertir más de aproximadamente 50 % en peso (por ejemplo, aproximadamente 55 % en peso, 60 % en peso, 65 % en peso, 70 % en peso, 75 % en peso u 80 % en peso) de la celulosa presente en una muestra de biomasa en azúcares fermentables . En ciertas modalidades, el caldo de fermentación comprende una actividad de celulasas Fv3C, actividad de celulasas Pa3D, actividad de Fv3G, actividad de Fv3D, actividad de Tr3A, actividad de Tr3B, actividad de Te3A, actividad de An3A, actividad de Fo3A, actividad de Gz3A, actividad de Nh3A, actividad de Vd3A, actividad de Pa3G y/o actividad de Tn3B, en donde el caldo tiene la capacidad de convertir más de aproximadamente 50 % en peso (por ejemplo, más de aproximadamente 55 % en peso, 60 % en peso, 65 % en peso, 70 % en peso, 75 % en peso o incluso 80 % en peso) de la celulosa presente en una muestra de biomasa en azúcares.
En algunos aspectos, la presente invención contempla un caldo de fermentación que comprende una quimera o híbrido de dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 % (por ejemplo, aproximadamente 65 %, aproximadamente 70 %, aproximadamente 75 % o aproximadamente 80 %) o más de identidad de secuencias con una secuencia de la misma longitud de la sec . con núm. de ident . :60 y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 % (por ejemplo, aproximadamente 65 %, aproximadamente 70 %, aproximadamente 75 % o aproximadamente 80 %) o más de identidad de secuencias con una secuencia de la misma longitud de una de las sec. con núms . de ident. : 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79. En algunos aspectos, la presente invención contempla un caldo de fermentación que comprende una quimera o híbrido de dos secuencias de ß-glucosidasas, en donde la primera secuencia de ß-glucosidasas tiene por lo menos 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 % (por ejemplo, aproximadamente 65 %, aproximadamente 70 %, aproximadamente 75 % o aproximadamente 80 %) o más de identidad de secuencias con una secuencia de la misma longitud de una de las sec . con núms. de ident.: 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 % (por ejemplo, aproximadamente 65 %, aproximadamente 70 %, aproximadamente 75 % o aproximadamente 80 %) o más de identidad de ' secuencias con una secuencia de la misma longitud de la sec. con núm. de ident. :60. En ciertas modalidades, la primera secuencia de ß-glucosidasas , la segunda secuencia de ß-glucosidasas o ambas secuencias de ß -glucosidasas comprenden uno o más sitios de glicosilación . En ciertas modalidades, la primera secuencia de ß-glucosidasas o la segunda secuencia de ß-glucosidasas comprende una región en bucle o una secuencia que codifica una estructura tipo bucle que tiene aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident. -.171) o de FD (R/K) YNIT (sec. con núm. de ident.: 172). En ciertas modalidades, la primera secuencia de ß-glucosidasas y la segunda secuencia de ß -glucosidasas se encuentran directamente adyacentes o conectadas. En algunas modalidades, la primera secuencia de ß-glucosidasas y la segunda secuencia de ß-glucosidasas no se encuentran directamente adyacentes, más bien se conectan por medio de un dominio conector. En ciertas modalidades, el dominio conector puede comprender la región en bucle, en donde la región en bucle tiene aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172) . En ciertas modalidades, el dominio conector se encuentra en la región central (por ejemplo, no se encuentra ubicado en ni cerca del extremo N-terminal ni del extremo C-terminal de la molécula quimérica) .
Métodos de la invención En algunos aspectos, la presente descripción proporciona métodos para crear cadenas principales de enzimas quiméricas (por ejemplo, celulasas, tales como endoglucanasas , celobiohidrolasas y ß-glucosidasas , y hemicelulasas , tales como xilanasas, a-arabinofuranosidasas , ß-xilosidasas) para mejorar la estabilidad. En algunos aspectos, la estabilidad mejorada es una estabilidad proteolítica mejorada en que la enzima resultante es menos susceptible al clivaje proteolítico en ciertas condiciones convencionales bajo las cuales la enzima se usa, adecuadamente, o típicamente. En algunos aspectos, la estabilidad proteolítica es para estabilidad durante el almacenamiento, mientras que en otros aspectos, la estabilidad proteolítica es para estabilidad durante la expresión y producción, lo cual permite una mayor producción de enzimas. Como tal, la estabilidad mejorada es un nivel reducido de clivaje proteolítico en condiciones de almacenamiento convencionales o en condiciones de expresión o producción convencionales, en comparación con una enzima no modificada que es la enzima de recurso para la enzima quimérica (es decir, la enzima cuya secuencia o una secuencia variante de esta constituye una parte de la enzima quimérica) . En algunos aspectos, la estabilidad mejorada se refleja tanto en la estabilidad de almacenamiento mejorada como en la estabilidad proteolítica mejorada durante la expresión y producción. Como tal, la estabilidad mejorada es un nivel reducido de clivaje proteolítico en condiciones convencionales para almacenamiento, así como para la expresión y producción.
En algunos aspectos, la presente descripción proporciona un método para convertir biomasa en azúcares; el método comprende poner la biomasa en contacto con una cantidad efectiva de cualquiera de las composiciones descritas en la presente descripción para convertir biomasa en azúcares fermentables . En algunos aspectos, la presente descripción proporciona un proceso de sacarificación que comprende tratar una biomasa con un polipéptido, en donde el polipéptido tiene actividad de celulasas y en donde el proceso produce por lo menos aproximadamente 50 % en peso (por ejemplo, por lo menos aproximadamente 55 % en peso, por lo menos aproximadamente 60 % en peso, por lo menos aproximadamente 65 % en peso, por lo menos aproximadamente 70 % en peso, por lo menos aproximadamente 75 % en peso o por lo menos aproximadamente 80 % en peso) de la conversión de biomasa en azúcares fermentables . En algunos aspectos, la presente descripción proporciona métodos para comercializar cualquiera de las composiciones descritas en la presente descripción, en donde las composiciones se suministran o se venden a refinerías de etanol u otros fabricantes de de bioquímicos o biomateriales y, opcionalmente , en donde las composiciones se producen en un complejo de fabricación ubicado en o cerca de tales refinerías de etanol u otros fabricantes de bioquímicos o biomateriales. Métodos para crear cadenas principales quiméricas En algunos aspectos, la presente invención permite una estabilidad mejorada de ciertos polipéptidos de ß-glucosidasas . En ciertos aspectos, la estabilidad mejorada es una estabilidad proteolítica mejorada, que se refleja, por ejemplo, en un grado menor de degradación proteolítica o clivaje proteolítico de los polipéptidos de ß-glucosidasas en condiciones convencionales en donde los polipéptidos de ß-glucosidasas se usan típicamente. En algunos aspectos, la estabilidad proteolítica mejorada es una estabilidad mejorada durante el almacenamiento, la expresión y/o la producción.
Como tal, la estabilidad proteolítica mejorada se refleja en un grado menor (por ejemplo, como se refleja en un alcance o grado reducido de pérdida de actividad) de clivaje proteolítico en condiciones convencionales de almacenamiento, expresión y/o producción, en donde los polipéptidos de ß-glucosidasas se usan o se aplican típicamente.
Al igual que otras proteínas expresadas de manera heteróloga, ciertas ß-glucosidasas son propensas al clivaje proteolítico durante la producción y almacenamiento por proteasas exogenasas, por proteasas expresadas por células huésped bacterianas o fúngicas o por otras fuerzas externas durante los procesos de producción y almacenamiento. Convencionalmente, tal degradación proteolítica se puede reducir al identificar las secuencias consenso proteolíticas o sitios de clivaje conocidos en la secuencia de aminoácidos primarios de una proteína y al mutar tales aminoácidos de manera que una proteasa ya no pueda desdoblar la proteína en ese sitio. Este método tiene la desventaja de que el polipéptido puede someterse a clivaje proteolítico por más de una proteasa o que el clivaje puede no ser resultado de la proteólisis enzimática. Este método es insuficiente, además, para abordar situaciones en las que el clivaje proteolítico se produce en múltiples sitios, con distintos niveles de preferencia para los múltiples sitios. Por ejemplo, la proteína original, por ejemplo, un polipéptido de ß-glucosidasas de interés, puede desdoblarse inicialmente en cierto sitio por medio de un mecanismo de clivaje proteolítico . Pero una vez que ese sitio de clivaje inicial se identifica, se modifica o se muta y ya no es susceptible al mismo mecanismo de clivaje proteolítico, la misma enzima se desdobla por medio del mismo mecanismo de clivaje proteolítico u otro mecanismo de cierto modo diferente en un sitio distinto del sitio de clivaje inicial. Por supuesto, el segundo sitio también se puede identificar, modificar o mutar para que ya no sea susceptible al clivaje proteolítico, pero la enzima aún se puede someter a clivaje proteolítico por medio del mismo mecanismo u otro mecanismo diferente como los descritos anteriormente en otro sitio adicional.
Los solicitantes han descubierto que los sitios de clivaje en los polipéptidos expresados de manera heteróloga se pueden identificar en base a las comparaciones entre las estructuras secundarias de enzimas relacionadas en términos evolutivos. La comparación de secuencias de aminoácidos y estructuras secundarias previstas de enzimas relacionadas que no se someten a clivaje durante la expresión heteróloga, producción y/o almacenamiento puede conducir a la identificación de las secuencias en bucle presentes en la estructura secundaria de una proteína. Sin embargo, las secuencias en bucle pueden o no estar donde se produce el clivaje. En algunas modalidades, el clivaje proteolítico actual puede ocurrir dirección 3' o dirección 5' de las secuencias en bucle. En lugar de mutar aminoácidos individuales y/o mutar residuos de aminoácidos individuales o residuos en el área adyacente de los sitios de clivaje, al igual que el método convencional, la presente invención se dirige a la modificación de un dominio en bucle, por ejemplo, al reemplazar tal dominio en bucle o modificar de cualquier otra forma la longitud y/o secuencia del dominio en bucle para producir un polipéptido con una estabilidad superior durante la expresión, producción y/o almacenamiento. En ciertas modalidades, la modificación puede incluir, por ejemplo, eliminar, alargar, acortar o reemplazar un bucle identificado con referencia a las enzimas relacionadas en términos evolutivos que no se someten a clivaje. Además, múltiples polipéptidos expresados de manera heteróloga pueden someterse a este método y, después, unirse en una sola cadena principal quimérica que tiene estabilidad proteolítica total superior en comparación con los polipéptidos quiméricos que no se han alterado para eliminar las estructuras secundarias propensas a clivaje. Se determinó que algunos de los motivos de las secuencias de aminoácidos, por ejemplo, los enumerados en la Figura 68A pueden ser importantes para construir moléculas híbridas/quiméricas/de fusión de ß-glucosidasas completamente activas y de alto rendimiento.
Los solicitantes compararon, además, las estructuras en 3-D conocidas de ciertas ß-glucosidasas de la familia GH3 que son susceptibles al procesamiento y resistentes al procesamiento y con el uso de herramientas de estructuras de enzimas en 3-D convencionales, tales como un método de modelado llamado "Coot", como se describe en, por ejemplo, Acta Cryst. (2010) D66, 486-501. Por ejemplo, se descubrió que tanto Fv3C como Te3A tenían mejor actividad de ß-glucosidasas y rendimiento en varios sustratos celulósicos que Bgll de T. reesei . Se descubrió, además, que Fv3C se somete a clivaje proteolítico en condiciones convencionales de almacenamiento o producción, lo cual lo hace menos efectivo o deseable para incluirlo como componente de una composición enzimática comercial o industrial. Con el uso de técnicas de modelado, tales como Coot, se investigó las características compartidas de Te3A, Fv3C en comparación con Bgll de T. reesei y se descubrió cuatro inserciones, como se indica en la Figura 70E. A partir de esas inserciones, se descubrió, además, que los residuos y motivos de las secuencias de aminoácidos indican interacciones conservadas (por ejemplo, enlaces de hidrógeno, sitios de glicosilación, que están presentes en Fv3C y Te3A, pero no en Bgll de T. reesei, como se indica en las Figuras 70F-J. Por lo tanto, se determinó que ciertos motivos de las secuencias de aminoácidos, que incluyen los enumerados en la Figura 68B, 387 ß-glucosidasa, tiene por lo menos 50 residuos de longitud y comprende la sec . con núm. de ident.:170. 21. El polinucleótido aislado de conformidad con la reivindicación 20, caracterizado porque comprende una secuencia de nucleótidos que tiene por lo menos 90 % de identidad con la sec. con núm. de ident.:83. 22. Un vector caracterizado porque comprende el polinucleótido de conformidad con la reivindicación 20 ó 21. 23. Una célula huésped recombinante modificada, caracterizada porque es para expresar el polinucleótido de conformidad con la reivindicación 20 ó 21. 24. La célula huésped recombinante de conformidad con la reivindicación 23, caracterizada porque es una célula bacteriana o fúngica. 25. La célula huésped recombinante de conformidad con la reivindicación 24, caracterizada porque se selecciona de una célula de Bacillus o de E. coli. 26. La célula huésped recombinante de conformidad con la reivindicación 24, caracterizada porque se selecciona de una célula de Trichoderma , Aspergillus, Chrysosporium o de levadura . 27. Una composición de caldo de fermentación o de mezcla de cultivo, caracterizada porque es preparada al fermentar la célula huésped recombinante de conformidad con cualquiera de las reivindicaciones 23-26. tiene por lo menos 200 residuos de aminoácidos de longitud y tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %) de identidad de secuencias con una secuencia de la misma longitud de la sec. con núm. de ident.:60, en donde la segunda ß-glucosidasa tiene por lo menos 50 residuos de aminoácidos de longitud y tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 ¾, 95 %, 96 %, 97 %, 98 %, 99 %) de identidad de secuencias con una secuencia de la misma longitud con cualquiera de las sec. con núms . de ident.:54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 o 79. En otro ejemplo, la ß-glucosidasa híbrida o quimérica puede comprender dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos 200 residuos de aminoácidos de longitud y tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 , 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %) de identidad de secuencias con una secuencia de la misma longitud con cualquiera de las sec. con núms . de ident . , :54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 o 79, en donde la segunda ß-glucosidasa tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %) de identidad de secuencias con una secuencia de la misma longitud de la sec. con núm. de ident.:60. En algunas modalidades, la primera secuencia de ß-glucosidasas de por lo menos aproximadamente 200 residuos de aminoácidos de longitud se encuentra en el extremo N-terminal de la enzima híbrida, mientras que la segunda secuencia de ß-glucosidasas de por lo menos aproximadamente 50 residuos de aminoácidos de longitud se encuentra en el extremo C-terminal de la enzima híbrida. En ciertas modalidades, ya sea la secuencia de ß-glucosidasas en N-terminal o en C-terminal comprende una secuencia en bucle. En algunas modalidades, la secuencia en bucle tiene aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172) . En ciertas modalidades, las secuencias de ß-glucosidasas en N-terminal y en C-terminal se encuentran inmediatamente adyacentes o directamente conectadas entre sí. En otras modalidades, las secuencias de ß-glucosidasas en N-terminal y en C-terminal no se encuentran inmediatamente adyacentes entre sí, más bien se conectan por medio de un dominio conector. En ciertas modalidades, el dominio conector se encuentra en la región central . En algunas modalidades, el dominio conector comprende la secuencia en bucle. En ciertas modalidades, la modificación de la secuencia en bucle, que incluye, por ejemplo, alargamiento, acortamiento, mutación, eliminación (completa o parcialmente) o reempbucle de la secuencia en bucle, hace que la enzima híbrida o quimérica resultante sea completa o parcialmente menos susceptible al clivaje proteolítico. Como tal, el polipéptido o polipéptido quimérico resultante alcanza, preferentemente, una estabilidad mejorada en comparación con sus homólogos naturales (por ejemplo, en el caso de un polipéptido quimérico, homólogos naturales se refieren a la enzima natural de donde se deriva cada parte quimérica) . La estabilidad mejorada se puede reflejar por una reducción o grado menor de productos de descomposición durante condiciones convencionales de almacenamiento, expresión, producción o uso.
La estabilidad mejorada de los polipéptidos expresados de manera heteróloga y los polipéptidos quiméricos se pueden determinar al evaluar si hay una mejoría en la estabilidad proteolítica durante el almacenamiento, expresión u otros procesos de producción, así como en los procesos donde se usa tales polipéptidos.
En ciertas modalidades, la secuencia en bucle está presente en una enzima híbrida o quimérica, por ejemplo, una ß-glucosidasa híbrida o quimérica, que comprende dos o más secuencias de ß-glucosidasas , en donde cada una se deriva de una ß -glucosidasa diferente. Por ejemplo, la ß-glucosidasa híbrida o quimérica puede comprender dos secuencias de ß-glucosidasas, en donde la primera secuencia de ß-glucosidasas tiene por lo menos 200 residuos de aminoácidos de longitud y comprende una o más o todas las secuencias de aminoácidos de las sec. con núms. de ident .: 136-148 , en donde la segunda ß-glucosidasa tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende uno o más o todos los motivos de las secuencias de aminoácidos de las sec. con núms. de ident .: 149-156. Particularmente, la primera de las dos o más secuencias de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o la totalidad) de los motivos de las secuencias de aminoácidos de las sec. con núms. de ident .: 164-169 y la segunda de las dos o más ß-glucosidasas tiene por lo menos 50 residuos de aminoácidos de longitud y comprende la sec. con núm. de ident.: 170. En algunas modalidades, la primera secuencia de ß-glucosidasas de por lo menos aproximadamente 200 residuos de aminoácidos de longitud se encuentra en el extremo N-terminal de la enzima híbrida, mientras que la segunda secuencia de ß-glucosidasas de por lo menos aproximadamente 50 residuos de aminoácidos de longitud se encuentra en el extremo C-terminal de la enzima híbrida. En ciertas modalidades, ya sea la secuencia de ß-glucosidasas en N-terminal o en C-terminal comprende una secuencia en bucle. En algunas modalidades, la secuencia en bucle tiene aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD(R/K)YNIT (sec. con núm. de ident.:172) . En ciertas modalidades, las secuencias de ß-glucosidasas en N-terminal y en C-terminal se encuentran inmediatamente adyacentes o directamente conectadas entre sí. En otras modalidades, las secuencias de ß-glucosidasas en N-terminal y en C-terminal no se encuentran inmediatamente adyacentes entre sí, más bien se conectan por medio de un dominio conector. En ciertas modalidades, el dominio conector se encuentra en la región central. En algunas modalidades, el dominio conector comprende la secuencia en bucle. En ciertas modalidades, la modificación de la secuencia en bucle, que incluye, por ejemplo, alargamiento, acortamiento, mutación, eliminación (completa o parcialmente) o reempbucle de la secuencia en bucle, hace que la enzima híbrida o quimérica resultante sea completa o parcialmente menos susceptible al clivaje proteolítico . Como tal, el polipéptido o polipéptido quimérico resultante alcanza, preferentemente, una estabilidad mejorada en comparación con sus homólogos naturales (por ejemplo, en el caso de un polipéptido quimérico, homólogos naturales se refieren a la enzima natural de donde se deriva cada parte quimérica) . La estabilidad mejorada se puede reflejar por una reducción o grado menor de productos de descomposición durante condiciones convencionales de almacenamiento, expresión, producción o uso.
En algunos aspectos, la secuencia en bucle está presente en una enzima híbrida o quimérica, por ejemplo, una ß-glucosidasa híbrida o quimérica, que comprende dos o más secuencias de enzimas, en donde por lo menos una es una secuencia de ß-glucosidasas , mientras que la otra no es una secuencia de otra enzima y ninguna es de ß-glucosidasas . Por ejemplo, la secuencia que no es de ß-glucosidasas de donde por lo menos una parte quimérica de una enzima quimérica se puede seleccionar de otras hemicelulasas o celulasas, por ejemplo, xilanasas, endoglucanasas , xilosidasas, arabinofuranosidasas y otras. Los dominios en N-terminal y los dominios en C-terminal de los polipéptidos quiméricos pueden encontrarse directamente adyacentes entre sí. Alternativamente, los dominios en N-terminal y los dominios en C-terminal no se encuentran directamente adyacentes o conectados, más bien se conectan por medio de una secuencia conectora. En ciertas modalidades, ya sea la secuencia de ß-glucosidasas en N-terminal o en C-terminal comprende una secuencia en bucle. En algunas modalidades, la secuencia en bucle tiene aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172). En ciertas modalidades, el dominio conector se encuentra en la región central. En algunas modalidades, el dominio conector comprende la secuencia en bucle. En ciertas modalidades, la modificación de la secuencia en bucle, que incluye, por ejemplo, alargamiento, acortamiento, mutación, eliminación (completa o parcialmente) o reempbucle de la secuencia en bucle, hace que la enzima híbrida o quimérica resultante sea completa o parcialmente menos susceptible al clivaje proteolítico . Como tal, el polipéptido o polipéptido quimérico resultante alcanza, preferentemente, una estabilidad mejorada en comparación con sus homólogos naturales (por ejemplo, en el caso de un polipéptido quimérico, homólogos naturales se refieren a la enzima natural de donde se deriva cada parte quimérica) . La estabilidad mejorada se puede reflejar por una reducción o grado menor de productos de descomposición durante condiciones convencionales de almacenamiento, expresión, producción o uso. En ciertas modalidades, un polipéptido quimérico o híbrido puede tener actividades dobles de celulasas y/o hemicelulasas . Por ejemplo, un polipéptido quimérico o híbrido de la presente invención puede tener tanto una actividad de ß-glucosidasas como una actividad de xilanasas. En algunas modalidades, el polipéptido quimérico o híbrido puede tener una estabilidad mejorada en comparación con los homólogos naturales de sus partes quiméricas. Por ejemplo, un polipéptido de ß-glucosidasas-xilanasas quiméricas que comprende una secuencia en bucle modificada puede tener una estabilidad mejorada, por ejemplo, estabilidad proteolítica mejorada en condiciones convencionales de almacenamiento, expresión, producción o uso en comparación con la ß-glucosidasa y xilanasa de donde el polipéptido quimérico deriva su secuencia de ß-glucosidasas y su secuencia de xilanasas.
En algunos aspectos, la presente invención pertenece a un método para mejorar la estabilidad de una enzima celulasa o hemicelulasa en donde la estabilidad se mejora en, por ejemplo, 5 % o más, 10 % o más, 15 % o más, 20 % o más, 25 % o más o incluso 30 % o más en condiciones convencionales de almacenamiento, expresión, producción o uso. La mejoría de estabilidad se puede determinar al especificar la cantidad de tal enzima que se desdobla después de cierto período de tiempo en ciertas condiciones convencionales de almacenamiento, expresión, producción o uso. Por ejemplo, la mejoría de estabilidad se puede determinar por medio de la cantidad de producto del clivaje después de, por ejemplo, aproximadamente 1 (por ejemplo, aproximadamente 1, 2, 3, 4, 5, 6, 8, 10, 12, 15, 18, 20, 24) horas o más bajo las condiciones convencionales de almacenamiento, por ejemplo, a temperatura ambiente o a una temperatura elevada de aproximadamente 40 °C, 45 °C, 50 °C o a una temperatura incluso mayor. En ciertas modalidades, la mejoría de la estabilidad se puede determinar al detectar y determinar la cantidad de producto intacto restante después de, por ejemplo, aproximadamente 1 (por ejemplo, aproximadamente 1, 2, 3, 4, 5, 6, 8, 10, 12, 15, 18, 20, 24) horas o más en condiciones convencionales de producción, por ejemplo, a una temperatura mayor que 50 °C (por ejemplo, mayor que 50 °C, mayor que 55 °C, mayor que 60 °C o incluso mayor que 65 °C) . Métodos para convertir biomasa en azúcares En algunos aspectos, la presente descripción proporciona un método para convertir biomasa en azúcares; el método comprende poner la biomasa en contacto con una cantidad efectiva de cualquiera de las composiciones descritas en la presente descripción para convertir biomasa en azúcares fermentables . En algunos aspectos, el método comprende, además, tratar previamente la biomasa con ácido y/o base. En algunos aspectos, el ácido comprende ácido fosfórico. En algunos aspectos, la base comprende hidróxido sódico o amoníaco.
Biomasa : la presente descripción proporciona métodos y procesos para sacarificación de biomasa, con el uso de las composiciones de celulasas o de hemicelulasas que no son de origen natural de la descripción. El término "biomasa", como se usa en la presente descripción, se refiere a cualquier composición que comprende celulosa y/o hemicelulosa (opcionalmente, además, lignina en materiales de biomasa lignocelulósica) . Como se usa en la presente descripción, la biomasa incluye, pero no se limita a, semillas, granos, tubérculos, desechos de plantas o subproductos de procesamiento de alimentos o procesamiento industrial (por ejemplo, tallos) , maíz (que incluye, por ejemplo, mazorcas, sobrantes y similares) , hierbas (que incluyen, por ejemplo, hierba india, tal como Sorghastrum nutans; o pasto varilla, por ejemplo, especies de Panicum, tales como Panicum virgatum) , caña perenne (por ejemplo, caña gigante) , madera (que incluye, por ejemplo, astillas de madera, residuos de procesamiento) , papel, pulpa y papel reciclado (que incluye, por ejemplo, periódico, papel para impresora y similares) . Otros materiales de biomasa incluyen, pero no se limitan a, bagazo de papas, soja (por ejemplo, semilla de colza) , cebada, centeno, avena, trigo, remolacha y caña de azúcar.
La presente descripción proporciona métodos de sacarificación; los métodos comprenden poner una composición que comprende un material de biomasa, por ejemplo, un material que comprende xilano, hemicelulosa , celulosa y/o un azúcar fermentable, en contacto con un polipéptido de la descripción o un polipéptido codificado por un ácido nucleico de la descripción o cualquiera de las composiciones de celulasas o de hemicelulasas que no son de origen natural o productos para la fabricación de la descripción.
La biomasa sacarificada (por ejemplo, material lignocelulósico procesado por enzimas de la descripción) se puede convertir en varios productos bio-derivados , por medio de procesos tales como, por ejemplo, fermentación microbiana y/o síntesis química. Como se usa en la presente descripción, "fermentación microbiana" se refiere a un proceso para cultivar y recolectar microorganismos de fermentación en condiciones adecuadas. El microorganismo de fermentación puede ser cualquier microorganismo adecuado para usar en el proceso de fermentación deseado para la producción de productos bio-derivados. Los microorganismos de fermentación adecuados incluyen, pero no se limitan a, hongos filamentosos, levadura y bacterias. La biomasa sacarificada se puede convertir, por ejemplo, en un combustible (por ejemplo, un biocombustible , tal como un bioetanol, biobutanol, biometanol, un biopropanol, un biodiesel, un combustible de reactor o similares) por medio de fermentación y/o síntesis química. La biomasa sacarificada se puede convertir, además, por ejemplo, en una sustancia química de consumo (por ejemplo, ácido ascórbico, isopreno, 1 , 3 -propanodiol) , lípidos, aminoácidos, proteínas y enzimas, por medio de fermentación y/o síntesis química.
Tratamiento previo : antes de la sacarificación, la biomasa (por ejemplo, material lignocelulósico) se somete, preferentemente, a una o más etapas de tratamiento previo para hacer que el material de xilano, hemicelulosa, celulosa y/o lignina sea más accesible o susceptible a las enzimas y, por lo tanto, más sensible a la hidrólisis por parte de una enzima o enzimas y/o las composiciones de celulasas o hemicelulasas que no son de origen natural de la presente descripción.
En una modalidad ilustrativa, el tratamiento previo implica someter el material de biomasa a un catalizador que comprende una solución diluida de un ácido fuerte y una sal de metal en un reactor. El material de biomasa puede ser, por ejemplo, una materia prima o un material seco. El tratamiento previo puede reducir la energía de activación, o la temperatura, de la hidrólisis de celulosa, para finalmente permitir mayores rendimientos de azúcares fermentables . Ver, por ejemplo, las patentes de los Estados Unidos núm. 6,660,506; 6,423,145.
Otro método de tratamiento previo ilustrativo implica hidrolizar la biomasa al someter el material de biomasa a una primera etapa de hidrólisis en un medio acuoso a una temperatura y una presión seleccionadas para realizar principalmente la despolimerización de hemicelulosa sin producir una despolimerización significativa de celulosa en glucosa. Esta etapa produce una suspensión en la que la fase acuosa líquida contiene monosacáridos disueltos resultantes de la despolimerización de hemicelulosa, y una fase sólida contiene celulosa y lignina. Después, la suspensión se somete a una segunda etapa de hidrólisis en condiciones que permiten despolimerizar una porción mayor de la celulosa para producir una fase acuosa líquida que contiene productos de despolimerización disueltos/solubles de celulosa. Ver, por ejemplo, la patente de los Estados Unidos núm. 5,536,325.
Otro método ilustrativo adicional incluye procesar un material de biomasa por medio de una o más etapas de hidrólisis con ácido diluido con el uso de aproximadamente 0.4 % a aproximadamente 2 % de un ácido fuerte; seguido por tratamiento del componente lignocelulósico sólido sin reaccionar del material hidrolizado con ácido con delignificación alcalina. Ver, por ejemplo, la patente de los Estados Unidos núm. 6,409,841.
Otros método ilustrativo de tratamiento previo comprende prehidrolizar la biomasa (por ejemplo, materiales lignocelulósicos) en un reactor de prehidrólisis ; agregar un líquido acídico al material lignocelulósico sólido para producir una mezcla; calentar la mezcla hasta temperatura de reacción; mantener la temperatura de reacción durante un período de tiempo suficiente para fraccionar el material lignocelulósico en una porción solubilizada que contiene por lo menos aproximadamente 20 % de la lignina del material lignocelulósico, y una fracción sólida que contiene celulosa,-separar la porción solubilizada de la fracción sólida, y eliminar la porción solubilizada mientras se encuentra a la o aproximadamente a la temperatura de reacción; y recuperar la porción solubilizada. La celulosa en la fracción sólida se vuelve más sensible a la digestión enzimática. Ver, por ejemplo, la patente de los Estados Unidos núm. 5,705,369.
Otros métodos de tratamiento previo pueden incluir el uso de peróxido de hidrógeno H202. Ver Gould, 1984, Biotech y Bioengr. 26:46-52.
El tratamiento previo puede comprender, además, poner un material de biomasa en contacto con cantidades estequiométricas de hidróxido sódico e hidróxido amónico a una concentración muy baja. Ver Teixeira et al., 1999, Appl . Biochem. and Biotech. 77-79:19-34.
El tratamiento previo puede comprender, además, poner una lignocelulosa en contacto con una sustancia química (por ejemplo, una base, tal como carbonato sódico o hidróxido potásico) a un pH de aproximadamente 9 a aproximadamente 14 a temperatura, presión y pH moderados. Ver la publicación del PCT núm. WO2004/081185.
Por ejemplo, en un método preferido de tratamiento previo se usa amoníaco. Tal método de tratamiento previo comprende someter un material de biomasa a una concentración baja de amoníaco en condiciones de alto contenido de sólidos. Ver, por ejemplo, la publicación de patente de los Estados Unidos núm. 20070031918 y la publicación del PCT núm. WO 06110901.
Proceso de sacarificación En algunos aspectos, la presente descripción proporciona un proceso de sacarificación que comprende tratar la biomasa con un polipéptido, en donde el polipéptido tiene actividad de celulasas y en donde el proceso produce por lo menos aproximadamente 50 % en peso (por ejemplo, por lo menos aproximadamente 55 % en peso, 60 % en peso, 65 % en peso, 70 % en peso, 75 % en peso u 80 % en peso) de conversión de biomasa en azúcares fermentables . En algunos aspectos, la biomasa comprende lignina. En algunos aspectos, la biomasa comprende celulosa. En algunos aspectos, la biomasa comprende hemicelulosa . En algunos aspectos, la biomasa que comprende celulosa comprende, además, uno o más de xilano, galactano o arabinano. En algunos aspectos, la biomasa comprende, pero no se limita a, semillas, granos, tubérculos, residuos de plantas o subproductos de procesamiento de alimentos o procesamiento industrial (por ejemplo, tallos) , maíz (que incluye, por ejemplo, mazorcas, rastrojo y similares), hierbas (que incluyen, por ejemplo, hierba india, tal como Sorghastrum nutans; o pasto varilla, por ejemplo, especies de Panicum, tales como Panicum virgatum) , cañas perennes (por ejemplo, caña gigante) , madera (que incluye, por ejemplo, astillas de madera, residuos de procesamiento), papel, pulpa y papel reciclado (que incluye, por ejemplo, periódico, papel para impresora y similares) , bagazo de papa, soja (por ejemplo, semilla de colza) , cebada, centeno, avena, trigo, remolacha y caña de azúcar. En algunos aspectos, el material que comprende biomasa se trata con un ácido y/o base antes del tratamiento con el polipéptido. En algunos aspectos, el ácido es ácido fosfórico. En algunos aspectos, la base es hidróxido de amonio o de sodio. En algunos aspectos, el proceso de sacarificación comprende, además, tratar la biomasa con una celulasa y/o una hemicelulasa . En algunos aspectos, la biomasa se trata con celulasa entera. En algunos aspectos, el proceso de sacarificación produce por lo menos aproximadamente 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 % o 90 % en peso de la conversión de biomasa en azúcares. En algunos aspectos, la composición de celulasas o la composición de hemicelulasas comprende un polipéptido que es una enzima de ß-glucosidasa híbrida o quimérica, que es una quimera de por lo menos dos secuencias de ß-glucosidasas .
En algunos aspectos, se proporciona un proceso de sacarificación que comprende tratar la biomasa con una composición que comprende un polipéptido, en donde el polipéptido tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 , 96 %, 97 %, 98 %, 99 %) de identidad de secuencias con cualquiera de las sec. con núms . de ident.:60, 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, y en donde el proceso produce por lo menos aproximadamente 50 % (por ejemplo, por lo menos aproximadamente 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 % o 90 %) en peso de conversión de biomasa en azúcares fermentables . En algunos aspectos, el proceso de sacarificación que comprende tratar la biomasa con un polipéptido, en donde el polipéptido tiene por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %) de identidad de secuencias con cualquiera de las sec. con núms . de ident.:60, 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, y produce por lo menos aproximadamente 60 %, 70 ¾, 75 %, 80 %, 85 % o 90 % en peso de la conversión de biomasa en azúcares. En algunos aspectos, el material que comprende la biomasa se trata con un ácido y/o base antes del tratamiento con el polipéptido que tiene por lo menos 80 %, por lo menos 90 %, por lo menos 95 % o por lo menos 97 % de identidad de secuencias con cualquiera de las sec. con núms. de ident.:60, 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79. En algunos aspectos, el ácido es ácido fosfórico.
En algunos aspectos, se proporciona un proceso de sacarificación que comprende tratar la biomasa con una composición de celulasas o de hemicelulasas que no es de origen natural que comprende una ß-glucosidasa, que es una quimera o híbrido de por lo menos dos secuencias de ß-glucosidasas .
En algunos aspectos, el proceso de sacarificación comprende tratar la biomasa con una composición de celulasas o de hemicelulasas que no es de origen natural que comprende una quimera de por lo menos dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 % (por e emplo, aproximadamente 65 %, 70 %, 75 ¾ u 80 %) o más de identidad de secuencias con una secuencia de la misma longitud de una secuencia de aminoácidos de Fv3C (sec. con núm. de ident . : 60) y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 % u 80 %) de identidad de secuencias con una secuencia de la misma longitud de una de las secuencias de aminoácidos seleccionadas de las sec. con núms. de ident. :54, 56, 68, 62, 64, 66, 68, 70, 72, 74, 76, 78 o 79. En algunos aspectos, el proceso de sacarificación comprende tratar la biomasa con una composición de celulasas o de hemicelulasas que no es de origen natural que comprende una quimera de por lo menos dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 % (por ejemplo, aproximadamente 65 %, 70 %, 75 % u 80 %) o más de identidad de secuencias con una secuencia de la misma longitud de una secuencia de aminoácidos de cualquiera de las secuencias de aminoácidos seleccionadas de las sec. con núms. de ident.: 54, 56, 68, 62, 64, 66, 68, 70, 72, 74, 76, 78 o 79 y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 % (por ejemplo, por . lo menos aproximadamente 65 %, 70 %, 75 % u 80 %) de identidad de secuencias con una secuencia de la misma longitud de la sec. con núm. de ident.:60. En algunos aspectos, el proceso de sacarificación comprende tratar la biomasa con una composición de celulasas o de hemicelulasas que no es de origen natural que comprende una quimera de por lo menos dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende uno o más o todos los motivos de las secuencias de aminoácidos de las sec. con núms . de ident. :136-148 y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende uno o más o todos los motivos de las secuencias de aminoácidos de las sec. con núms. de ident. :149-156. Particularmente, la primera de las dos o más secuencias de ß-glucosidasa tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende por lo menos 2 (por ejemplo, por lo menos 2, 3, 4 o todos) de los motivos de las secuencias de aminoácidos de las sec. con núms. de ident . : 164-169, y la segunda de las dos o más secuencias de ß-glucosidasa tiene por lo menos 50 residuos de aminoácidos de longitud y comprende la sec. con núm. de ident. :170. En algunas modalidades, la primera secuencia de ß-glucosidasas se encuentra en el extremo N-terminal del polipéptido híbrido o quimérico y la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido híbrido o quimérico. En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasas se encuentran inmediatamente adyacentes o directamente conectadas entre sí. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasas no se encuentran inmediatamente adyacentes, más bien se conectan por medio de un dominio conector. En ciertos aspectos, ya sea la primera o la segunda secuencia de ß-glucosidasas comprende una secuencia en bucle que tiene aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident. :171) o de FD (R/K) Y IT (sec. con núm. de ident. :172) . En algunas modalidades, la secuencia en bucle se modifica de manera que la enzima híbrida o quimérica es menos susceptible al clivaje proteolítico en un sitio en la secuencia en bucle, o en los residuos fuera de la secuencia en bucle. En ciertas modalidades, ni la primera ni la segunda ß-glucosidasa comprende la secuencia en bucle, más bien el dominio conector comprende la secuencia en bucle. En algunas modalidades, el dominio conector se encuentra en la región central en el polipéptido híbrido o quimérico. En algunos aspectos, el material que comprende la biomasa se trata con un ácido y/o base antes del tratamiento con la composición de celulasas o composición de hemicelulasas que no es de origen natural que comprende una quimera de por lo menos dos ß-glucosidasas . En algunos aspectos, el ácido es ácido fosfórico. En algunos aspectos, la base es hidróxido de amonio o de sodio. En algunos aspectos, el proceso de sacarificación comprende, además, tratar la biomasa con una hemicelulasa . En algunos aspectos, la biomasa se trata con una celulasa entera. En algunos aspectos, el proceso de sacarificación que comprende tratar la biomasa con una composición de celulasas o una composición de hemicelulasas que no es de origen natural que comprende una quimera o híbrido de por lo menos dos secuencias de ß-glucosidasas, en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 % (por ejemplo, aproximadamente 65 %, aproximadamente 70 %, aproximadamente 75 % o aproximadamente 80 %) o más de identidad de secuencias con una secuencia de la misma longitud de la sec. con núm. de ident . : 60 y en donde la segunda secuencia de ß -glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 % u 80 %) de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las secuencias de aminoácidos seleccionadas de las sec. con núms . de ident . : 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79, produce por lo menos aproximadamente 50 %, 60 %, 70 %, 75 %, 80 %, 85 % o 90 % en peso de la conversión de la biomasa en azúcares. En algunos aspectos, el proceso de sacarificación que comprende tratar la biomasa con una composición de celulasas o una composición de hemicelulasas que no es de origen natural que comprende una quimera o híbrido de por lo menos dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß-glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende aproximadamente 60 % (por ejemplo, aproximadamente 65 %, aproximadamente 70 %, aproximadamente 75 % o aproximadamente 80 %) o más de identidad de secuencias con una secuencia de la misma longitud de cualquiera de las secuencias de aminoácidos seleccionadas de las sec. con núms. de ident.: 54, 56, 58, 62, 64, 66, 68, 70, 72, 74, 76, 78 y 79 y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende por lo menos aproximadamente 60 % (por ejemplo, por lo menos aproximadamente 65 %, 70 %, 75 % u 80 %) de identidad de secuencias con una secuencia de la misma longitud de la sec. con núm. de ident. :60, produce por lo menos aproximadamente 50 %, 60 %, 70 %, 75 %, 80 %, 85 % o 90 % en peso de la conversión de la biomasa en azúcares. En algunos aspectos, el proceso de sacarificación que comprende tratar la biomasa con una composición de celulasas o una composición de hemicelulasas que no es de origen natural que comprende una quimera o híbrido de por lo menos dos secuencias de ß-glucosidasas , en donde la primera secuencia de ß -glucosidasas tiene por lo menos aproximadamente 200 residuos de aminoácidos de longitud y comprende uno o más o todos los motivos de las secuencias de aminoácidos de las sec . con núms . de ident. : 136-148 o, preferentemente, los motivos de las sec. con núms. de ident . : 164-169 y en donde la segunda secuencia de ß-glucosidasas tiene por lo menos aproximadamente 50 residuos de aminoácidos de longitud y comprende uno o más o todos los motivos de las secuencias de aminoácidos de las sec. con núms. de ident. : 149-156 o, preferentemente, el motivo secuencial de la sec. con núm. de ident. :170, produce por lo menos aproximadamente 50 %, 60 %, 70 %, 75 %, 80 %, 85 % o 90 % en peso de la conversión de la biomasa en azúcares. En algunos aspectos, la primera secuencia de ß-glucosidasas se encuentra en el extremo N-terminal y la segunda secuencia de ß-glucosidasas se encuentra en el extremo C-terminal del polipéptido de ß-glucosidasas quimérico o híbrido. En ciertas modalidades, la primera y la segunda secuencia de ß-glucosidasas se encuentran inmediatamente adyacentes o directamente conectadas. En otras modalidades, la primera y la segunda secuencia de ß-glucosidasas no se encuentran inmediatamente adyacentes, más bien se conectan por medio de un dominio conector. En algunos aspectos, ya sea la primera o la segunda secuencia de ß-glucosidasas comprende una secuencia en bucle, en donde la secuencia en bucle comprende aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident.:172) y en donde la modificación de la secuencia en bucle produce una estabilidad mejorada, que se puede reflejar por un alcance menor de clivaje o descomposición del polipéptido híbrido o quimérico. En ciertas modalidades, la estabilidad mejorada se refleja por la disminución o eliminación del clivaje en un residuo de la secuencia en bucle. En algunas modalidades, la estabilidad mejorada se refleja por la disminución o eliminación del clivaje en un residuo fuera de la región en bucle. En ciertas modalidades, ni la primera ni la segunda secuencia de ß-glucosidasas comprende la región en bucle, mientras que el dominio conector comprende la secuencia en bucle que tiene aproximadamente 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud que comprenden una secuencia de FDRRSPG (sec. con núm. de ident.:171) o de FD (R/K) YNIT (sec. con núm. de ident . :172) . En algunas modalidades, el proceso de sacarificación produce por lo menos aproximadamente 50 %, 60 %, 70 %, 75 %, 80 %, 85 % o 90 % en peso de la conversión de la biomasa en azúcares.
Métodos empresariales Las composiciones de celulasas y/o hemicelulasas de la presente descripción se pueden usar, además, en un entorno industrial y/o comercial. Por lo tanto, se contempla, además, un método o un método para fabricar, promocionar o comercializar de cualquier otra forma las composiciones instantáneas de celulasas y hemicelulasas que no son de origen natural .
En una modalidad específica, composiciones de celulasas y hemicelulasas que no son de origen natural de la presente invención se pueden suministrar o vender a ciertas refinerías de etanol (bioetanol) u otros fabricantes de bioquímicos o biomateriales . En un primer ejemplo, las composiciones de celulasas y/o hemicelulasas que no son de origen natural se pueden fabricar en un centro de fabricación de enzimas que se especializa en la producción de enzimas a escala industrial. Después, las composiciones de celulasas y/o hemicelulasas que no son de origen natural se pueden envasar o vender a los clientes del fabricante de enzimas. En la presente descripción, esta estrategia operativa se denomina "modelo de suministro de enzimas comerciales".
En otra estrategia operativa, las composiciones de celulasas y/o hemicelulasas que no son de origen natural de la presente invención se pueden producir en un estado del sistema de producción de enzimas de la técnica que el fabricante de enzimas construye en un sitio ubicado en o cerca de las refinerías de bioetanol o de los fabricantes de bioquímicos/biomateriales ("de planta") . En algunas modalidades, el fabricante de enzimas y la refinería de bioetanol o el fabricante de bioquímicos/biomateriales realizan un convenio de suministro de enzimas. El fabricante de enzimas diseña, controla y opera el sistema de producción de enzimas en planta, con el uso de la célula huésped, métodos de expresión y producción como se describen en la presente descripción para producir las composiciones de celulasas y/o hemicelulasas que no son de origen natural. En ciertas modalidades, la biomasa adecuada que se somete, preferentemente, a tratamientos previos adecuados como se describen en la presente descripción, se puede hidrolizar con el uso de los métodos de sacarificación y las enzimas y/o composiciones de enzimas de la presente descripción en o cerca de las refinerías de bioetanol o los centros de fabricación de bioquímicos/biomateriales. Después, los azúcares fermentables resultantes se pueden someter a fermentación en los mismos centros o en centros en el área. En la presente descripción, esta estrategia operativa se denomina "modelo de biorrefinería en planta".
El modelo de biorrefinería en planta proporciona ciertas ventajas en comparación con el modelo de suministro de enzimas comerciales, que incluyen, por ejemplo, el suministro de una operación autosuficiente , lo que permite una dependencia mínima en el suministro de enzimas de los proveedores comerciantes de enzimas. Esto a su vez permite que las refinerías de bioetanol o a los fabricantes de bioquímicos/biomateriales a controlar mejor el suministro de enzimas según la demanda en tiempo real o aproximadamente en tiempo real. En ciertas modalidades, se contempla que un centro de producción de enzimas en planta se puede compartir entre dos o entre dos o más refinerías de bioetanol y/o los fabricantes de bioquímicos/biomateriales que están ubicados cerca unos de otros para reducir el costo de transporte y almacenamiento de enzimas. Además, esto permite mejorar la tecnología de "entrega" inmediata en el centro de producción de enzimas en planta para reducir el retraso entre las mejoras de las composiciones de enzimas para una mayor producción de azúcares fermentables y finalmente, bioetanol o bioquímicos.
El modelo de biorrefinería en planta tiene mayor aplicabilidad general en la producción y comercialización de bioetañóles y bioquímicos en que se puede usar para fabricar, suministrar y producir no únicamente las composiciones de celulasas y hemicelulasas que no son de origen natural de la presente descripción sino, además, las enzimas y composiciones de enzimas que procesan almidón (por ejemplo, maíz) para permitir una conversión directa eficiente y efectiva de almidón en bioetanol o bioquímicos. En ciertas modalidades, las enzimas procesadoras de almidón se pueden producir en la biorrefinería en planta, después, se pueden integrar rápida y fácilmente en la refinería de bioetanol o el centro de fabricación de bioquímicos/biomateriales para producir bioetanol.
Por lo tanto, en ciertos aspectos, la presente invención se relaciona, además, con ciertos métodos empresariales para aplicar las enzimas (por ejemplo, celulasas, hemicelulasas) , células, composiciones y procesos en la presente descripción en la fabricación y comercialización de cierto bioetanol, biocombustible , bioquímicos u otros biomateriales . En algunas modalidades, la presente invención se relaciona con la aplicación de tales enzimas, células, composiciones y procesos en un modelo de biorrefinería en planta. En otras modalidades, la presente invención se refiere a la aplicación de tales enzimas, células, composiciones y procesos en un modelo de suministro de enzimas comerciales.
De manera relacionada, la presente descripción proporciona el uso de las enzimas y/o las composiciones de enzimas de la presente invención en un entorno comercial. Por ejemplo, las enzimas y/o composiciones de enzimas de la presente descripción se pueden vender en un mercado adecuado junto con las instrucciones para los métodos típicos o preferidos para usar las enzimas y/o composiciones. Por lo tanto, las enzimas y/o composiciones de enzimas de la presente descripción se pueden usar o comercializar dentro de un modelo de suministro de enzimas comerciales, en donde las enzimas y/o composiciones de enzimas de la presente descripción se venden al fabricante de bioetanol, a una refinería de combustible o a un fabricante de bioquímicos o biomateriales en el negocio de producción de combustibles o bioproductos . En algunos aspectos, la enzima y/o composiciones de enzimas de la presente descripción se pueden vender o comercializar con el uso de un modelo de biorrefinería en planta, en donde la enzima y/o composiciones de enzimas se producen o se preparan en un centro en o cerca de una refinería de combustible o centro del fabricante de bioquímicos/biomateriales y la enzima y/o composiciones de enzimas de la presente invención se adaptan a las necesidades específicas de la refinería de combustible o del fabricante de bioquímicos/biomateriales en tiempo real. Además, la presente descripción se relaciona con proporcionar a estos fabricantes soporte técnico y/o instrucciones para usar las enzimas y/o composiciones de enzimas de manera que se puede fabricar y comercializar el bioproducto deseado (por ejemplo, biocombustible , bioquímicos, biomateriales, etc.).
La presente invención se puede comprender, adicionalmente , al hacer referencia a los siguientes ejemplos que se proporcionan en forma de ilustración y no pretenden ser limitantes.
EJEMPLOS Ejemplo 1. Ensayos/métodos Los siguientes ensayos/métodos se usaron, generalmente, en los Ejemplos descritos a continuación. Cualquier desviación de los protocolos proporcionados a continuación se indica en los ejemplos específicos.
A. Tratamiento previo de sustratos de biomasa La mazorca de maíz, los rastrojos de maíz y el pasto varilla se sometieron a tratamiento previo antes de la hidrólisis enzimática de conformidad con los métodos e intervalos de procesamiento descritos en la patente núm.
WO06110901A (a menos que se indique de otra manera) . Estas referencias para el tratamiento previo se incluyen, además, en las descripciones de las patentes núms . US-2007-0031918-Al, US-2007-0031919-A1, US-2007-0031953 -Al y/o US-2007- 0037259-A1.
Los rastrojos de maíz tratados con explosión de fibra de amoníaco (AFEX, por sus siglas en inglés) se obtuvieron de Michigan Biotechnology Institute International (MBI) . La composición de los rastrojos de maíz se determinó por MBI (Teymouri, F et al. Applied Biochemistry and Biotechnology, 2004, 113:951-963) con el uso de el procedimiento del National Renewable Energy Laboratory (NREL) , (NREL LAP-002) . Los procedimientos del NREL se encuentran disponibles en: http://www.nrel.gov/ biomass/analytical_procedures . html .
B. Análisis composicional de biomasa El método de hidrólisis ácida de 2 etapas descrito en la sección Determinación de los carbohidratos estructurales y lignina en la biomasa (National Renewable Energy Laboratory, Golden, CO 2008 http://www.nrel.gov/biomass/pdfs/42618.pdf) se usó para determinar la composición de los sustratos de biomasa. Con el uso de este método, los resultados de hidrólisis enzimática se reportaron en la presente descripción en términos de conversión porcentual con respecto al rendimiento teórico del contenido inicial de celulosa y xilano del sustrato.
C. Ensayo del total de proteína El ensayo de proteína BCA es un ensayo colorimétrico que determina la concentración ¦ proteica con un espectrofotómetro . Se usó el kit de ensayo de proteína BCA (Pierce Chemical) de conformidad con la sugerencia del fabricante. Se preparó diluciones de enzima en tubos de ensayo con el uso de regulador de acetato sódico 50 mM, pH 5. Las soluciones de enzimas diluidas (cada una de 0.1 mi) se agregaron individualmente en un tubo de centrífuga de 2 mi Eppendorf que contiene 1 mi de ácido tricoloroacético al 15 % (TCA) . Los tubos se colocaron en un vórtice y en un baño de hielo durante 10 min. Los tubos se centrifugaron a 14,000 rpm durante 6 min. Los sobrenadantes se desecharon, las microesferas se resuspendieron individualmente en 1 mi de NaOH 0.1 N y los tubos se colocaron nuevamente en un vórtice hasta que las microesferas se disolvieron. Las soluciones estándar de BSA se prepararon a partir de una solución base de 2 mg/ml . Se preparó una solución activa de BCA al mezclar 0.5 mi de reactivo B con 25 mi de reactivo A del kit de ensayo de proteína BCA. Las muestras de enzimas resuspendidas se agregaron en 3 tubos de centrífuga Eppendorf a un volumen de 0.1 mi cada uno. Se agregó dos (2) mi de solución activa de BCA Pierce en un tubo de cada muestra y las medidas de BSA. Los tubos se incubaron en un baño de agua a 37 °C durante 30 min. Las muestras se enfriaron hasta temperatura ambiente (15 min) y se determinó la absorbancia a 562 nm de cada muestra.
Se calculó los valores promedio para la absorbancia de proteínas para cada medida. Se representó la medida de proteína promedio, la absorbancia en el eje x y la concentración (mg/ml) en el eje y. Los puntos se ajustaron a una ecuación lineal: y=mx +b. La concentración pura de las muestras de enzimas se calculó al sustituir la absorbancia para el valor x. La concentración total de proteínas se calculó al multiplicar con el factor de dilución.
El total de proteínas de muestras purificadas se determinó por A280 (Pace, CN, et al. Protein Science, 1995, 4:2411-2423) .
El contenido total de proteínas de los productos de fermentación se determinó algunas veces como el nitrógeno total por combustión, captura y medición de nitrógeno liberado, ya sea con el uso del método Kjeldahl (rtech laboratories) o con el uso del método de DUMAS (TruSpec CN) (Sader, A. P.O. et al., Archives of Veterinary Science, 2004, 9(2) :73-79) . Para las muestras complejas, por ejemplo, caldos de fermentación, se usó un contenido promedio de N al 16 % y el factor de conversión de 6.25 para nitrógeno en proteína para el cálculo. En algunos casos, para dar cuenta del nitrógeno no proteico de interferencia, se determinó el total de proteína precipitable. En tales casos, se usó una concentración de TCA al 12.5 % para las mediciones y las microesferas de TCA que contienen proteína se resuspendieron en NaOH 0.1 M.
En algunos casos, se usó Coomassie Plus, también denominado ensayo de Better Bradford (Thermo Scientific, Rockford, IL) de conformidad con la recomendación del fabricante. En otros casos, el total de proteína se determinó con el uso de método de Biuret modificado por Weichselbaum and Gornall con el uso de albúmina sérica bovina como calibrador (Weichselbaum, T. Amer. J. Clin. Path. 1960, 16:40; Gornall, A. et al. J. Biol . Chem. 1949, 177:752) .
D. Determinación de glucosa con el uso de ABTS El ensayo de ABTS (ácido 2, 2 ' -azino-bis (3-etilentiazolin-6 ) -sulfónico) para determinar la glucosa se basó en el principio de que en presencia de 02, la glucosa oxidasa cataliza la oxidación de glucosa mientras produce cantidades estequiométricas de peróxido de hidrógeno (H202) .
Esta reacción es seguida por una oxidación catalizada por peroxidasa de rábano picante (HRP, por sus siglas en inglés) de ABTS, la cual se correlaciona linealmente con la concentración de H202. La emergencia de ABTS oxidizado se indica mediante la evolución de un color verde, que se cuantifica en un OD de 405 nm. Se preparó una mezcla de 2.74 mg/ml de ABTS en polvo (Sigma) , 0.1 U/ml de HRP (Sigma) y 1 U/ml de glucosa oxidasa, (OxyGO® HP L5000, Genencor, Danisco Estados Unidos) en un regulador de acetato sódico 50 mM, pH 5.0 y se mantuvo en la oscuridad. Las medidas de glucosa (a 0, 2, 4, 6, 8, 10 nmol) se prepararon en regulador de acetato sódico 50 mM, pH 5.0. Se agregó individualmente diez (10) µ? de las medidas en una placa de microtitulación, de fondo plano, de 96 pocilios por triplicado. Además, se agregó en la placa diez (10) µ? de muestras diluidas en serie. Se agregó cien (100) µ? de solución de sustrato de ABTS en cada pocilio y la placa se colocó en un lector espectrofotométrico de placas. La oxidación de ABTS se leyó durante 5 min a 405 nm.
Alternadamente, la absorbancia a 405 nm se determinó después de 15-30 min de incubación seguida por inhibición de la reacción con el uso de una mezcla de inhibición que contiene regulador de acetato sódico 50 mM, pH 5.0 y SDS al 2 %.
E. Análisis de azúcar por HPLC Las muestras de hidrólisis de sacarificación de mazorcas se prepararon al eliminar el material insoluble con el uso de centrifugación, filtración por medio de un filtro de tubo de centrífuga Spin-X de nailon de 0.22 m (Corning, Corning, NY) y dilución hasta las concentraciones deseadas de regulador de acetato sódico 50 mM, pH 5.0 con el uso de agua destilada. Los azúcares monoméricos se determinaron en un Shodex Sugar SH-G SH1011, 8 x 300 mm con una columna protectora de 6 x 50 mm SH-1011P (www.shodex.net) . El solvente usado fue H2S04 0.01 N y la prueba de cromatografía se llevó a cabo a un índice de flujo de 0.6 ml/min. La temperatura de la columna se mantuvo a 50 °C y la detección se llevó a cabo por índice de refracción. Alternadamente, las cantidades de azúcar se analizaron con el uso de una columna Biorad Aminex HPX-87H con un detector de índice de refracción Waters 2410. El tiempo de análisis fue de aproximadamente 20 min, el volumen de inyección fue 20 µ?, la fase móvil fue un ácido sulfúrico 0.01 N, que se filtró por medio de un filtro de 0.2 µ?? y se desgasificó, el índice de flujo fue de 0.6 ml/min y la temperatura de la columna se mantuvo a 60 °C. Las medidas externas de glucosa, xilosa y arabinosa se realizaron con cada grupo de muestras.
Se usó la cromatografía de exclusión por tamaño para separar e identificar los azúcares oligoméricos . Se usó una columna Tosoh Biosep G2000P de 7.5 mm x 60 cm. Se usó agua destilada para eluir los azúcares. Se usó un índice de flujo de 0.6 ml/min y la columna se llevó a cabo a temperatura ambiente.
Seis medidas de azúcar de carbono incluyeron estaquiosa, rafinosa, celobiosa y glucosa; cinco medidas de azúcar de carbono incluyeron xilohexosa, xilopentosa, xilotetrosa, xilotriosa, xilobiosa y xilosa. Se adquirió las medidas de xilooligómeros (Megazyrae) . La detección se llevó a cabo por índice de refracción. Se usó ya sea unidades de área pico o área pico relativa en porcentaje para reportar los resultados.
El total de regulador de acetato sódico 50 mM, pH 5.0 se determinó por hidrólisis de las muestras centrifugadas y aclaradas con filtro (anteriormente) . La muestra aclarada se diluyó 1:1 con el uso de H2S0 0.8 N. La solución resultante se colocó en autoclave en un vial con tapón durante 1 h a 121 °C. Los resultados se reportaron sin corrección por pérdida de azúcar de monómeros durante la hidrólisis.
F. Preparación de oligómeros a partir de ensayos de mazorcas y enzimas Los oligómeros a partir de la hidrólisis de Xyn3 de T. reesei de mazorcas de maíz se prepararon al incubar 8 mg de Xyn3 de T. reesei por g de glucano + xilano con 250 g de peso seco de mazorca de maíz tratada previamente con amoníaco diluido en un regulador de acetato sódico 50 mM, pH 5.0. La reacción continuó durante 72 h a 48 °C, con agitación giratoria a 180 rpm. El sobrenadante se centrifugó 9,000 x G, después, se filtró a través de filtros Nalgene de 0.22 µt? para recuperar los azúcares solubles.
G. Ensayo de sacarificación de biomasa Para los ejemplos típicos en la presente descripción, los ensayos de sacarificación de mazorca de maíz se llevaron a cabo en un formato de placas de microtitulación de conformidad con los siguientes procedimientos, a menos que un ejemplo particular indicara variaciones específicas. El sustrato de biomasa, por ejemplo, la mazorca de maíz tratada previamente con amoníaco diluido, se diluyó en agua y se el pH se ajustó con ácido sulfúrico para crear una suspensión de celulosa al 7 %, pH de 5, que se usó sin procesamiento adicional en el ensayo. Las muestras de enzimas se cargaron en base al total en mg de proteína por g de celulosa, o por g de xilano, o por g de celulosa y xilano combinados (según los métodos de análisis composicionales convencionales, supra) en el sustrato de mazorca de maíz. Las enzimas se diluyeron en acetato sódico 50 mM, pH 5.0, para obtener las concentraciones de carga deseadas. Se agregó cuarenta (40) µ? de solución enzimática en 70 mg de mazorca de maíz tratada previamente con amoníaco diluido a celulosa al 7 % por pocilio (equivalente a celulosa al 4.5 % final por pocilio) . Después, las placas de ensayo se recubrieron con sellantes de placas de aluminio, se mezclaron a temperatura ambiente y se incubaron a 50 °C, 200 rpm, durante 3 d. Al terminar el período de incubación, la reacción de sacarificación se templó al agregar en cada pocilio 100 µ? de regulador de glicina 100 mM, pH 10.0 y la placa se centrifugó durante 5 min a 3,000 rpm. Se agregó diez (10) yl del sobrenadante en 200 µ? de agua MilliQ en una placa de HPLC de 96 pocilios y los azúcares solubles se determinaron por HPLC. H. Ensayo de sacarificación en placas de microtitulación Las celulasas purificadas y los productos libres de células de cepas de celulasa entera se introdujeron en el ensayo de sacarificación en una cantidad en base al total de proteína (en mg) por g de celulosa en el sustrato. Las hemicelulasas purificadas se cargaron en base al contenido de xilano del sustrato. Los sustratos de biomasa, que incluyen, por ejemplo, rastrojo de maíz tratado previamente (PCS, por sus siglas en inglés) con ácido diluido, rastrojo de maíz expandido con fibra de amoníaco (AFEX) , mazorca de maíz tratada previamente con amoníaco diluido, mazorca de maíz tratada previamente con hidróxido sódico (NaOH) y pasto varilla tratado con amoníaco diluido, se mezclaron a las concentraciones en % de sólidos indicadas y el pH de las mezclas se ajustó hasta 5.0. Las placas se recubrieron con sellantes de placas de aluminio y se colocaron en una incubadora a 50 °C. La incubación se llevó a cabo con agitación durante 2 d. Las reacciones se terminaron al agregar 100 µ? de glicina 100 mM, pH 10 en pocilios individuales. Después de mezclar totalmente, las placas se centrifugaron y los sobrenadantes se diluyeron 10 veces en una placa de HPLC que contiene 100 µ? de regulador de glicina 10 mM, pH 10. Las concentraciones de los regulador de acetato sódico 50 mM, pH 5.0 producidos se determinaron con el uso de HPLC como se describe para el ensayo de hidrólisis de celobiosa (a continuación) . El porcentaje de conversión de glucano se define como [mg de glucosa + (mg de celobiosa x 1.056 + mg de celotriosa x 1.056)] / [mg de celulosa en el sustrato x 1.111]; el % de conversión de xilano se define como [mg de xilosa + (mg de xilobiosa x 1.06)] / [mg de xilano en el sustrato x 1.136] .
I. Ensayo de hidrólisis de celobiosa La actividad de celobiosas se determinó con el uso del método de Ghose, T.K. Puré and Applied Chemistry, 1987, 59(2), 257-268. Las unidades de celobiosa (derivada como se describe en Ghose) se definen como 0.815 dividido por la cantidad de enzimas requerida para liberar 0.1 mg de glucosa en las condiciones del ensayo.
J. Ensayo de hidrólisis de cloro-nitro-fenil-glucósido (CNPG)Se colocó doscientos (200) µ? de un regulador de acetato sódico 50 mM, pH 5, en los pocilios individuales de una placa de microtitulación. La placa se recubrió y se dejó que se equilibrara a 37 °C durante 15 min en un Eppendorf Thermomixer. Además, cinco (5) µ? de enzima, diluidos en regulador de acetato sódico 50 mM, pH 5, se agregaron en pocilios individuales. La placa se recubrió nuevamente y se dejó que se equilibrara a 37 °C durante 5 min. Se agregó veinte (20) µ? de 2-cloro-4-nitrofenil-beta-D-glucopiranosido 2 mM (CNPG, Rose Scientific Ltd. , Edmonton, CA) preparado en agua Millipore en pocilios individuales y la placa se trasladó rápidamente a un espectrofotómetro (SpectraMax 250, Molecular Devices) . Se realizó una lectura cinética a OD 405 nm durante 15 min y los datos se registraron como la Vmáx. Se usó el coeficiente de extinción para CNP para convertir la de unidades de OD/s a µ? de C P/s. La actividad específica (µ? de CNP/sec/mg de proteína) se determinó al dividir uM de CNP/s por los mg de proteína enzimática que se usó en el ensayo.
K. Ensayo de calcoflúor Todas las sustancias químicas usadas fueron de grado analítico. El Avicel PH-101 se adquirió de FMC BioPolymer (Philadelphia, PA) . La celobiosa y el blanco de calcoflúor se adquirieron de Sigma (St. Louise, MO) . La celulosa dilatada con ácido fosfórico (PASC, por sus siglas en inglés) se preparó de Avicel PH-101 con el uso de un protocolo adaptado de alseth, TAPPI 1971, 35:228 and ood, Biochem. J. 1971, 121:353-362. En pocas palabras, el Avicel se solubilizó en ácido fosfórico concentrado, después, se precipitó con el uso de agua desionizada fría. Después de recolectar la celulosa y lavarla con más agua para neutralizar el pH, se diluyó hasta 1 % de sólidos en acetato sódico 50 mM, pH 5.
Todas las diluciones de enzimas se convirtieron en regulador de acetato sódico 50 mM, pH 5.0. Se diluyó celulasa GC220 (Danisco US Inc., Genencor) hasta 2.5, 5, 10 y 15 mg de proteína/G PASC para producir una curva de calibración lineal. Las muestras a evaluar se diluyeron para estar en el intervalo de la curva de calibración, por ejemplo, para obtener una respuesta de 0.1 a 0.4 de producto de fracción. Se agregó 150 µ? de PASC al 1 ¾ frío en 20 µ? de solución enzimática en placas de microtitulación de 96 pocilios. La placa se recubrió y se incubó durante 2 h a 50 °C, 200 rpm en un incubador/agitador Innova. La reacción se templó con 100 µ? de 50 µg/ml de calcoflúor en 100 mM de glicina, pH 10. La fluorescencia se leyó en un lector de microplacas de fluorescencia (SpectraMax M5 por Molecular Devices) a una longitud de onda de activación Ex = 365 nm y longitud de onda de emisión Em = 435 nm. El resultado se expresa como el producto de fracción de acuerdo con la ecuación: FP = 1 - (Fl de muestra - Fl de regulador con celobiosa) / (Fl cero enzima - Fl de regulador con celobiosa) , en donde FP es producto de fracción y Fl son unidades de fluorescencia .
Ejemplo 2. Construcción de una cepa de expresión integrada de trichoderma reesei Se construyó una cepa de expresión integrada de Trichoderma reesei que coexpresó cinco genes: gen bgll de ß-glucosidasa de T. reesei, gene xyn3 de endoxilanasa de T. reesei, gen fv3A de ß-xilosidasa de F. vert icillioides , gen fv43D de ß-xilosidasa de F. verticillioides y gen fv51A de a-arabinofuranosidasa de F. verticillioides .
La construcción de los casetes de expresión para estos genes diferentes y la transformación de la cepa de T. reesei se describen a continuación.
A. Construcción del vector de expresión de ß-glucosidasa La porción N-terminal del gen bgll de ß-glucosidasa de G. reesei natural se optimizó por codones (DNA 2.0, Menlo Park, CA) . Esta porción sintetizada comprendía las primeras 447 bases de la región codificante de esta enzima. Después, este fragmento se amplificó por PCR con el uso de los cebadores SK943 y SK941 (a continuación) . La región restante del gen bgll natural se amplificó por PCR a partir de una muestra de ADN genómico extraída de la cepa RL-P37 de T. reesei (Sheir-Neiss , G et al. Ap l . Microbiol. Biotechnol. 1984, 20:46-53), con el uso de los cebadores SK940 y SK942 (a continuación) . Estos dos fragmentos de PCR del gen bgll se fusionaron entre sí en una reacción de PCR de fusión con el uso de los cebadores SK943 y SK942: cebador directo SK943 : (5'- CACCATGAGATATAGAACAGCTGCCGCT-3 ' ) (sec. con núm. de ident . :92) cebador inverso SK941: (5'- CGACCGCCCTGCGGAGTCTTGCCCAGTGGTCCCGCGACAG-3 ' ) (sec. con núm. de ident . : 93 ) cebador directo (SK940): (5'-CTGTCGCGGGACCACTGGGCAAGACTCCGCAGGGCGGTCG-3 ' ) (sec. con núm. de ident . : 94) cebador inverso (SK942) : (5'- CCTACGCTACCGACAGAGTG- 3 ' ) (sec. con núm. de ident.: 95) Los fragmentos de PCR de fusión resultantes se clonaron en el vector de entrada Gateway® pENTR™/D-T0P0® y se transformaron en células químicamente competentes de E. coli One Shot® TOP10 (Invitrogen) para formar el vector intermedio, pENTR TOPO-Bgll (943/942) (Figura 55B) . Se determinó la secuencia de nucleótidos del ADN insertado. El vector pENTR-943/942 con la secuencia correcta de bgll se recombinó con pTrex3g con el uso de una reacción LR clonase® (ver los protocolos descritos por Invitrogen) . La mezcla de reacción de clonasa LR se transformó en células químicamente competentes de E. coli One Shot® TOP10 (Invitrogen) , para formar en el vector de expresión pTrex3g 943/942 (mapa ver la Figura 55C) . El vector contenía, además, el gen Aspergillus nidulans amdS que codifica acetamidasa, como un marcador seleccionable para la transformación de T. reesei . El cásete de expresión se amplificó por PCR con los cebadores SK745 y SK771 (a continuación) para generar el producto para transformación. Cebador directo SK771: (5' - GTCTAGACTGGAAACGCAAC -3') (sec. con núm. de ident. :96) Cebador inverso SK745: (5' - GAGTTGTGAAGTCGGTAATCC -3') (sec. con núm. de ident. :97) 1) Construcción del cásete de expresión de endoxilanasa El gen xyn3 de endoxilanasa de T. reesei natural se amplificó por PCR a partir de una muestra de ADN genómico extraída de T. reesei, con el uso de los cebadores xyn3F-2 y xyn3R-2.
Cebador directo xyn3F-2: (5'- CACCATGAAAGCAAACGTCATCTTGTGCCTCCTGG- 3 ' ) (sec. con núm. de ident . : 98) Cebador inverso xyn3R-2: (5'-CTATTGTAAGATGCCAACAATGCTGTTATATGCCG GCTTGGGG-3 ' ) (sec. con núm. de ident.: 99) Los fragmentos de PCR resultantes se clonaron en el vector de entrada Gateway® pENTR™/D-TOPO® y se transformaron en células químicamente competentes de E. coli One Shot® TOP10 para formar un vector como se muestra en la Figura 55D. Se determinó la secuencia de nucleótidos del ADN insertado. El vector pENTR/Xyn3 con la secuencia de xyn3 correcta se recombinó con pTrex3g con el uso del protocolo de reacción LR clonase® (Invitrogen) . Después, la mezcla de reacción de LR clonase® se transformó en células químicamente competentes de E. coli One Shot® TOP10 (Invitrogen) para el vector de expresión final, pTrex3g/Xyn3 (ver la Figura 55E) . El vector contiene, además, el gen Aspergillus nidulans amdS, que codifica acetamidasa, como un marcador seleccionable para la transformación de T. reesei. El cásete de expresión se amplificó por PCR con los cebadores SK745 y SK822 (a continuación) para generar el producto para transformación. Cebador directo SK745: (5' - GAGTTGTGAAGTCGGTAATCC- 3 ' ) (sec. con núm. de ident. :100) Cebador inverso SK822 : (5' - CACGAAGAGCGGCGATTC- 3 ' ) (sec. con núm. de ident. :101) 2) Construcción del vector de expresión Fv3A de ß-xilosidasa El gen fv3A de ß-xilosidasa de F. verticillioides se amplificó a partir de una muestra de ADN genómico de F. verticilloides con el uso de los cebadores MH124 y MH125.
Cebador directo MH12 : (5' - CACCCATGCTGCTCAATCTTCAG -3') (sec. con núm. de ident. :102) Cebador inverso MH125: (5' - TTACGCAGACTTGGGGTCTTGAG -3') (sec. con núm. de ident . :103) Los fragmentos de PCR se clonaron en el vector de entrada Gateway ® pENTR™/D-T0P0® y se transformaron en células químicamente competentes de E. coli One Shot® TOP10 (Invitrogen) para formar el vector intermedio, pENTR-Fv3A (ver la Figura 55F) . Se determinó la secuencia de nucleótidos del ADN insertado. El vector pENTR-Fv3A con la secuencia fv3A correcta se recombinó con pTrex6g con el uso del protocolo de reacción LR clonase® (Invitrogen) . La mezcla de reacción LR clonase® se transformó en células químicamente competentes de E. coli One Shot® TOP10 (Invitrogen) para formar el vector de expresión final, pTrex6g/Fv3A (ver la Figura 55G) . El vector contenía, además, un mutante resistente a clorimurón etilo del gen de acetolactato sintasa (ais) de T. reesei, alsR, que se usó junto con su promotor y terminador naturales como un marcador seleccionable para la transformación de T. reesei de conformidad con el método descrito en la publicación internacional núm. WO2008/039370 Al. El cásete de expresión se amplificó por PCR con el uso de los cebadores SK1334, SK1335 y SK1299 (a continuación) para generar el producto para transformación.
Cebador directo SK1334: (5' - GCTTGAGTGTATCGTGTAAG -3') (sec. con núm. de ident. :104) Cebador directo SK1335: (5' - GCAACGGCAAAGCCCCACTTC -3') (sec. con núm. de ident. :105) Cebador inverso SK1299:(5' - GTAGCGGCCGCCTCATCTCATCTCATCCATCC -3') (sec. con núm. de ident. :106) 3) Construcción del cásete de expresión de ß-xilosidasa Fv43D Para la construcción del cásete de expresión Fv43D de ß-xilosidasa de F. verticill ioides , el producto génico fv43D se amplificó a partir de una muestra de ADN genómico de F. verticillioides con el uso de los cebadores SK1322 y SK1297 (a continuación) . Una región del promotor del gen de endoglucanasa egll se amplificó por PCR a partir de una muestra de ADN genómico de T. reesei extraída de la cepa RL-P37, con el uso de los cebadores SK1236 y SK1321 (a continuación) . Estos fragmentos de ADN amplificados por PCR se fusionaron posteriormente en una reacción de PCR de fusión con el uso de los cebadores SK1236 y SK1297 (a continuación) . El fragmento de PCR de fusión resultante se clonó en el vector pCR-Blunt II -TOPO (Invitrogen) para producir el plásmido TOPO Blunt/Pegll-Fv43D (ver la Figura 55H) . Después, este plásmido se usó para transformar células químicamente competentes de E. coli One Shot® TOP10 (Invitrogen) . El ADN de plásmidos se extrajo de diversos clones de E. coli y sus secuencias se confirmaron por procesos de restricción.
Cebador directo SK1322 : (5 ' -CACCATGCAGCTCAAGTTTCTGTC-3 ' ) (sec. con núm. de ident.:107) Cebador inverso SK1297: ( 5 ' -GGTTACTAGTCAACTGCCCGTTCTGTAGCGAG-3') (sec. con núm. de ident.:108) Cebador directo SK1236: ( 5 ' -CATGCGATCGCGACGTTTTGGTCAGGTCG- 3 ' ) (sec. con núm. de ident.:109) Cebador inverso SK1321: (5'-GACAGAAACTTGAGCTGCATGGTGTGGGACAACAAGAAGG-3 ' ) (sec. con núm. de ident . : 110) El cásete de expresión se amplificó por PCR a partir de TOPO Blunt/Pegll-Fv43D con el uso de los cebadores SK1236 y SK1297 (anteriormente) para generar el producto para transformación. 4) Construcción del cásete de expresión de -arabinofuranosidasa Para la construcción del cásete de expresión del gen fv51A de oí-arabinofuranosidasa de F. verticillioides, el producto génico fv51A se amplificó a partir de una muestra de ADN genómico de F. verticillioides con el uso de los cebadores SK1159 y SK1289 (a continuación) . Una región del promotor del gen de endoglucanasa egll se amplificó por PCR de una muestra de ADN genómico de T. reesei extraída de la cepa RL-P37 (supra) , con el uso de los cebadores SK1236 y SK1262 (a continuación). Después, los fragmentos de ADN amplificados por PCR se fusionaron en una reacción de PCR de fusión con el uso de los cebadores SK1236 y SK1289 (a continuación) . El fragmento de PCR de fusión resultante se clonó en vector pCR-Blunt II-TOPO (Invitrogen) para producir el plásmido TOPO Blunt/Pegll-Fv51A (ver la Figura 551) y las células químicamente competentes de E. coli One Shot® TOP10 (Invitrogen) se transformaron con el uso del plásmido.
Cebador directo SK1159: (5 ' -CACCATGGTTCGCTTCAGTTCAATCCTAG-3 ' ) (sec. con núm. de ident.:lll) Cebador inverso SK1289: ( 5 ' -GTGGCTAGAAGATATCCAACAC- 3 ' ) (sec. con núm. de iden . :112) Cebador directo SK1236: (5 ' -CATGCGATCGCGACGTTTTGGTCAGGTCG-3 ' ) (sec. con núm. de ident. :113) Cebador inverso SK1262: (5'-GAACTGAAGCGAACCATGGTGTGGGACAACAAGAAGGAC- 3 ' ) ( sec . con núm . de ident . : 114) El cásete de expresión se amplificó por PCR con los cebadores SK1298 y SK1289 (anteriormente) para generar el producto para transformación.
Cebador directo SK1298: (5 ' -GTAGTTATGCGCATGCTAGAC- 3 ' ) (sec. con núm. de ident. :115) Cebador inverso SK1289: (5 ' -GTGGCTAGAAGATATCCAACAC-3 ' ) (sec. con núm. de ident. :112) 5) Cotransformación de T. reesei con los casetes de expresión de ß-glucosidasa y endoxilanasa Una cepa mutante de Trichoderma reesei, derivada de RL-P37 (Sheir-Neiss, G et al. Ap l . Microbiol . Biotechnol . 1984, 20:46-53.) y seleccionada por la producción alta de celulasa se contransformó con el cásete de expresión de ß-glucosidasa (gen promotor cbhl de beta-glucosidasa 1 de T. reesei, terminador cbhl y marcador amdS) y el cásete de expresión de endoxilanasa (promotor cbhl, xyn3 de T. reesei y terminador cbhl) con el uso de un método de transformación mediada por PEG (ver Penttila, M et al. Gene 1987, 61 (2) : 155-64) . Varios transformantes se aislaron y se examinaron para evaluar la producción de ß-glucosidasas y endoxilanasas . Un transformante llamado cepa núm. 229 de T. reesei se seleccionó para la transformación con otros casetes de expresión. 6) Cotransformación de la cepa núm. 229 de T. reesei con dos casetes de expresión de ß-xilosidasas y otarabinofuranosidasas La cepa núm. 229 de T. reesei se contransformó con el cásete de expresión de ß-xilosidasa fv3A (promotor cbhl, gen fv3A, terminador cbhl y marcador alsR) , el cásete de expresión de ß-xilosidasa fv43D (promotor egll, gen fv43D, terminador natural fv43D) y el cásete de expresión de -arabinofuranosidasas de fv51A (promotor egll, gen fv51A, terminador de fv51A natural) con el uso de electroporación de conformidad con, por ejemplo, la publicación internacional núm. WO2008153712A2. Los transformantes se seleccionaron en placas de agar Vogels que contienen clorimurón etilo (80 ppm) . 50 x solución base Vogels (receta) 20 mi Agar BBL 20 g Con H20 desionizada para producir 980 mi adición postesterilización : glucosa al 50 % 20 mi 50 x solución base Vogels, por litro: En 750 mi de H20 desionizada, se disuelve sucesivamente : citrato de Na3*2H20 125 g KH2P04 (anhidro) 250 g NH4NO3 (anhidro) 100 g MgS04*7H20 10 g CaCl2*2H20 5 g Solución de oligoelementos Vogels (receta a 5 mi continuación) D-biot na 0.1 g Con H20 desionizada, para producir 1 1 Solución de oligoelementos Vogels; Ácido cítrico 50 g ZnS04.*7H20 50 g Fe (NH4)2S04. *6H20 10 g CuS04.5H20 2.5 g MnS04.4H20 0.5 g H3BO3 0.5 g Na2Mo04.2H20 0.5 g Varios transformantes se aislaron y se examinaron para determinar la producción de ß-xilosidasas y L-a-arabinofuranosidasas . Además, los transformantes se evaluaron para analizar el rendimiento de conversión de biomasa de conformidad con el ensayo de sacarificación de mazorcas como se describió en el Ejemplo 1. Los ejemplos de cepas de expresión de T. reesei integradas descritas en la presente descripción se seleccionan de H3A, 39A, A10A, 11A y G9A, que expresaron los genes de T. reesei que codifican beta-glucosidasa 1, Xyn3 y genes de Fusarium que codifican Fv3A, Fv51A y Fv43D a diferentes relaciones. Una cepa particular de H3A, núm. 5 ("H3A-5") , que expresó una concentración menor de Bgll de T. reesei en comparación con las otras cepas de H3A, se usó en un experimento descrito en la presente descripción a continuación. Otra cepa de H3A que expresa una concentración reducida de Bgll de T. reesei se usó en el experimento descritos en el Ejemplo 5. Entre otras, una cepa de T. reesei carecía de Xyn3 de G. reesei sobreexpresada; otra carecía de Fv51A y dos carecían de Fv3A, según el análisis western blot . 7) Composición de la cepa H3A de G. reesei integrada La fermentación de la cepa H3A de T. reesei integrada y la determinación composicional identificaron la existencia de los siguientes productos génicos : Xyn3 de T. reesei, Bgl 1 de T. reesei, Fv3A, Fv51A y Fv43D, a las relaciones que se muestran en la Figura 3 en la presente descripción. 8) Análisis proteico por ,HPLC Se llevó a cabo la cromatografía líquida (LC, por sus siglas en inglés) y la espectroscopia de masas (MS, por sus siglas en inglés) para separar y cuantificar las enzimas contenidas en los caldos de fermentación. Las muestras de enzimas se trataron, primero, con una endoH glicosidasa expresada de manera recombinante a partir de S. plicatus (por ejemplo, NEB P0702L) . La endoH se usó en una cantidad de 0.01-0.03 µg de endoH por µg del total de proteína en la muestra. Las mezclas se incubaron durante 3 h a 37 °C, pH 4.5-6.0 para eliminar enzimáticamente glicosilación unida en N antes del análisis de HPLC . Después, aproximadamente 50 µg de proteína se sometieron a cromatografía de interacción hidrofóbica (Agilent 1100 HPLC) con el uso de una columna de HIC-fenilo y un gradiente de sal de alto a bajo durante 35 min. El gradiente se logró con el uso de un regulador A alto en sal: sulfato de amonio 4 M que contiene 20 mM de fosfato potásico, pH 6.75; y un regulador bajo en sal B: 20 mM de fosfato potásico, pH 6.75. Los picos se detectaron en UV 222 nm. Las fracciones se recolectaron y se analizaron con el uso de espectroscopia de masas. Las relaciones de proteína se reportan como el porcentaje de cada área pico con relación al área integrada total de la muestra. 9) Efecto de adición de proteínas purificadas en el caldo de fermentación de la cepa H3A de T. reesei integrada sobre la sacarificación de mazorca de maíz tratada previamente con amoníaco diluido Este experimento evaluó los beneficios conferidos por varias enzimas (principalmente purificadas, pero también una enzima no purificada) para la sacarificación de biomasa tratada previamente. Las proteínas purificadas y una proteína no purificada se diluyeron en serie a partir de la solución base y se agregaron a un caldo de fermentación de la cepa H3A de T. reesei integrada. Se colocó mazorca de maíz tratada previamente con amoníaco diluido en los pocilios de una placa de microtitulación de 96 pocilios a sólidos al 20 % (p/p) (~5 mg de celulosa por pocilio) , pH 5. Se agregó un caldo de fermentación de H3A en cada pocilio a una relación de 20 mg de proteína/g de celulosa. Se agregó volúmenes de 10, 5, 2 y 1 µ? de cada una de las proteínas diluidas (Figura 4A) en pocilios individuales y se agregó, además, agua de manera que la adición de líquido en cada pocilio individual diera un total de 10 µ? . Los pocilios de referencia incluyeron adiciones ya sea de 10 µ? de agua o diluciones de H3A adicional. Las placas de microtitulación se sellaron con papel de aluminio y se incubaron a 50 °C, con agitación a razón de 200 rpm en un incubador/agitador Innova durante 3 d. Las muestras se templaron con 100 µ? de glicina 100 mM, pH 10. Después, la placa se cubrió con un sello de plástico y se centrifugó a 3,000 rpm durante 5 min a 4 °C. Una alícuota de 5 µ? de la mezcla de reacción templada se diluyó con el uso de 100 µ? de agua. La concentración de glucosa producida en las reacciones se determinó con el uso de HPLC. La producción de glucosa se determinó en función de la concentración proteica agregada a 20 mg/g de H3A. Los resultados se muestran en las Figuras 4B-4E.
Ejemplo 3. Clonación, Expresión y purificación de FV3C A. Clonación y expresión de Fv3C La secuencia de Fv3C (sec. con núm. de ident.:60) se obtuvo al buscar homólogos de ß-glucosidasas de GH3 en el genoma de Fusarium verticillioides en la base de datos del Broad Institute (http://www.broadinstitute.org/). El marco de lectura abierta de Fv3C se amplificó por PCR con el uso de ADN genómico purificado a partir de Fusarium verticillioides como plantilla. El termociclador de PCR usado fue el amplificador de ADN DNA Engine Tetrad 2 Peltier (Bio-Rad Laboratories) . La ADN polimerasa usada fue PfuUltra II Fusión HS (Stratagene) . Los cebadores usados para amplificar el marco de lectura abierta fueron de la siguiente manera: Cebador directo MH234 ( 5 ' -CACCATGAAGCTGAATTGGGTCGC-3 ' ) (sec. con núm. de ident . : 116) Cebador inverso MH235 (5' -TTACTCCAACTTGGCGCTG-3 ' ) (sec. con núm. de ident. :117) Los cebadores directos incluyeron cuatro nucleótidos adicionales (secuencias - CACC) en el extremo 5' para facilitar la clonación direccional en pENTR/D-TOPO (Invitrogen, Carlsbad, CA) . Las condiciones de la PCR para amplificar los marcos de lectura abierta fueron las siguientes: Etapa 1: 94 °C durante 2 min. Etapa 2: 94 °C durante 30 s. Etapa 3: 57 °C durante 30 s. Etapa 4: 72 °C durante 60 s. Las Etapas 2, 3 y 4 se repitieron durante 29 ciclos adicionales. Etapa 5: 72 °C durante 2 min. El producto de PCR del marco de lectura abierta de Fv3C se purificó con el uso de un kit de purificación por PCR Qiaquick (Qiagen) . El producto de PCR purificado se clonó inicialmente en el vector pENTR/D-TOPO, se transformó en células químicamente competentes TOP10 de E. coli (Invitrogen) y se colocó en placas de LA que contienen 50 ppm de canamicina.
El ADN de plásmidos se obtuvo a partir de los transformantes de E. coli con el uso de un kit de preparación de plásmidos QIAspin (Qiagen) . La confirmación de secuencias para el ADN insertado en el vector pENTR/D-TOPO se obtuvo con el uso de los cebadores directos e inversos M13 y los siguientes cebadores de secuenciacion adicionales: MH255 (5' -AAGCCAAGAGCTTTGTGTCC- 3 ' ) (sec. con núm. de ident . : 118) MH256 (5' -TATGCACGAGCTCTACGCCT- 3 ' ) (sec. con núm. de ident . : 119) MH257 ( 5 ' -ATGGTACCCTGGCTATGGCT-3 ' ) (sec. con núm. de ident.: 120) MH258 (5' -CGGTCACGGTCTATCTTGGT-3 ' ) (sec. con núm. de ident. :121) Un vector pENTR/D-TOPO con la secuencia de ADN correcta del marco de lectura abierta de Fv3C (Figura 44) se recombinó con el vector de destino pTrex6g (Figura 45A) con el uso de la mezcla de reacción LR clonase® (Invitrogen) .
El producto de la reacción de LR clonase® se transformó posteriormente en células químicamente competentes TOP10 de E. coli (Invitrogen) que, después, se colocaron en placas de LA que contienen 50 ppm de carbenicilina . El constructo de pExpression resultante fue pTrex6g/Fv3C (Figura 45B) que contiene el marco de lectura abierta de Fv3C y el marcador de selección de acetolactato sintasa de T. reesei mutado (ais) . El ADN del constructo pExpression que contiene el marco de lectura abierta de Fv3C se aisló con el uso de un kit de minipreparación de Qiagen y se usó para la transformación biolística de esporas de T. reesei .
Se llevó a cabo la transformación biolística de T. reesei con el vector de expresión pTrex6g que contiene el marco de lectura abierta de Fv3C adecuado. Específicamente, una cepa de T. reesei en donde cbhl, cbh2, egl, eg2, eg3 y bgll se han eliminado (por ejemplo, la cepa hexa eliminada, ver la publicación internacional núm. WO 05/001036) se transformó por bombardeo de helio con el uso de un sistema de suministro de partículas Biolistic® PDS-1000/he (Bio-Rad) de conformidad con las instrucciones del fabricante (ver la patente de los Estados Unidos núm. 2006/0003408). Los transformantes se trasladaron a placas de selección de clorimurón etilo fresco. Los transformantes estables se inocularon en placas de microtitulación de filtro (Corning) que contienen 200 µ?/pocillo de un medio mínimo de glicina (que contiene 6.0 g/1 de glicina; 4.7 g/1 (NH4)2S04; 5.0 g/1 de KH2P04; 1.0 g/1 de MgS04»7H20; 33.0 g/1 de PIPPS, pH 5.5) con adición postesterilización de mezcla de glucosa al ~2 %/soforosa como fuente de carbono, 10 ml/1 de 100 g/1 de CaCl2, 2.5 ml/1 de una solución de oligoelementos 400X de T. reesei que contiene: 175 g/1 de ácido cítrico anhidro; 200 g/1 de FeS0*7H20; 16 g/1 de ZnS04«7H20; 3.2 g/1 de CuS04«5H20; 1.4 g/1 de MnS0 »H20; 0.8 g/1 de H3B03. Los transformantes se cultivaron en el cultivo líquido durante cinco días en una cámara rica en 02 alojada en una incubadora a 28 °C. Las muestras de sobrenadante de la placa de microtitulación de filtro se recolectaron en un colector al vacío. Las muestras de sobrenadante se colocaron en geles de NuPAGE al 4-12 % y se pigmentaron con el uso del tinte Simply Blue (Invitrogen) .
B. Purificación de Fv3C El Fv3C, a partir del concentrado del matraz de agitación, se dializó durante la noche contra un regulador de TES 25 mM, pH 6.8. La solución enzimática dializada se colocó en una columna de agarosa y dextrano reticulados de SEC HiLoad Superdex 200 grado prep . (GE Healthcare) a un índice de flujo de 1 ml/min, que se equilibró previamente con TES 25 mM, cloruro sódico 0.1 M a pH 6.8. Se usó SDS-PAGE para identificar y determinar la presencia de Fv3C en las fracciones de la separación de SEC. Las fracciones que contienen Fv3C se agruparon y se concentraron. La purificación por SEC se usó, además, para separar el Fv3C de los contaminantes de baja y alta masa molecular. La pureza de la preparación de enzimas se determinó con el uso de SDS/PAGE con tinción de azul de Coomassie. La SDS/PAGE mostró una sola banda principal en 97 kDa.
C. Traducción alterna de Fv3C Para la expresión del gen Fv3C, se usó la secuencia genómica que contiene el ORF como se menciona en la base de datos de Fusarium. http://www.broadinstitute.org/annotation/ genome/fusarium_group/ ultiHome . html . La región codificante prevista contiene 3 intrones, en donde el primer intrón interrupte la secuencia de péptidos señal (Figura 46A) .
Sin embargo, en su parte 3', el primer intrón contenía un ORF alterno, en marco con la secuencia madura que, además, se predice que codifica un péptido señal (Figura 46B) . En ambas traducciones, el sitio de inicio para la proteína madura (que se subraya en la Figura 46B) , según el análisis de secuencias en N- terminal, inició dirección 3' desde ambos sitios de clivaje de los péptidos señal putativos (que se indican con flechas) . Se demostró que el Fv3C se podría expresar efectivamente con el uso de cualquiera de los ATG como inicios putativos de la traducción (Figura 46C) .
Ejemplo 4: Actividad de ß -Glucosidasas sobre celobiosa y CNPG En este experimento, se analizó las actividades de ß-glucosidasas de Bgll de T. reesei, Bglu (An3A) de A. niger (Megazyme International Ireland Ltd. , Wicklow, Irlanda) , Fv3C (sec. con núm. de ident.:60), Fv3D (sec. con núm. de ident.:58) y Pa3C (sec. con núm. de ident. :80) sobre la celobiosa y CNPG. Bgll de T. reesei, Bglu ("An3A") de A. niger, Fv3C, quimera de Fv3C/Te3A/Bgl3 (FAB) , quimera de Fv3C/Bgl3 (FB) , Bgl3 de G. reesei y Te3A son proteínas purificadas. Fv3D y Pa3C no fueron proteínas purificadas. Se expresaron en una cepa eliminada en hexa de T. reesei (como se definió anteriormente) , pero hubo algunas actividades de proteínas de base presentes. Tal como se muestra en la Figura 5A, se descubrió que Fv3C tiene aproximadamente el doble de actividad de Bgll de T. reesei sobre la celobiosa, mientras que Bglu de A. niger es aproximadamente 12 veces más activo que Bgll de G. reesei.
La actividad de Fv3C sobre el sustrato de CNPG fue aproximadamente igual a la de Bgll de T. reesei, pero la actividad de Bglu de A. niger fue aproximadamente el 14 % de la actividad de Bgll de T. reesei (Figura 5A) . Fv3D, otra beta-glucosidasa de Fusarium verticillioides que se expresó del mismo modo que Fv3C, no tuvo ninguna actividad de celobiosas detectable; sin embargo, su actividad sobre CNPG fue aproximadamente 5 veces la de Bgll de T. reesei. Adicionalmente , un homólogo de beta-glucosidasas de P. anserina que se produjo del mismo modo Pa3C no tuvo ninguna actividad mensurable sobre la celobiosa o el sustrato de CNPG. Estos estudios demostraron que las actividades de Fv3C sobre la celobiosa y CNPG se debieron a la molécula en sí y no a las actividades de las proteínas de base.
Ejemplo 5. Sacarificación de Fv3C en varios sustratos de biomasa A. Rendimiento de sacarificación de Fv3C sobre PASC En este experimento, se evaluó la capacidad de Bgll de T. reesei, Fv3C y varios homólogos de Fv3C para mejorar la sacarificación de PASC. Se agregó veinte (20) µ? de cada beta-glucosidasa en una cantidad de 5 mg de proteína/g de celulosa en una carga de 10 mg de proteína/g de celulosa de celulasa entera a partir de una cepa de T. reesei con reducción de bgll en una placa de HPLC de 96 pocilios. Se agregó ciento cincuenta (150) µ? de una suspensión de sólidos al 0.7 % de PASC en cada pocilio y las placas se recubrieron con sellantes de placas de aluminio y se colocaron en una incubadora ajustada a 50 °C durante 2 h con agitación. La reacción se terminó al agregar 100 µ? de un regulador de glicina 100 mM, pH 10, en pocilios individuales. Después de mezclar totalmente, las placas se centrifugaron y los sobrenadantes se diluyeron 10 veces en otra placa de HPLC que contenía 100 µ? de glicina 10 mM, p'H 10, en pocilios individuales. Las concentraciones de azúcares solubles producidas se determinaron con el uso de HPLC (Figura 47) .
Se observó que la mezcla que contiene Fv3C produjo una proporción mayor de glucosa que la mezcla que contiene Bgll de T. reesei en las mismas condiciones. Esto indicó que Fv3C tiene mayor actividad de celobiosas que el Bgll de T. reesei {ver, además, la Figura 5B) . Fv3G, Pa3D y Pa3G no tuvieron ningún efecto observable sobre la hidrólisis de PASC, lo que indicó la falta de contribución de la base eliminada en hexa (en donde varios homólogos de Fv3C se clonaron y se expresaron) en la hidrólisis de PASC.
B. Rendimiento de sacarificación de Fv3C sobre rastrojo de maíz tratado previamente (PCS) con ácido diluido En este experimento, se evaluó las capacidades de Bgll de T. reesei, Fv3C y diversos homólogos de Fv3C para mejorar la sacarificación de PCS a sólidos al 13 % con el uso del método descrito en el ensayo de sacarificación en placas de microtitulación (supra) . Para cada enzima evaluada, se agregó 5 mg de proteína/g de celulosa de beta-glucosidasa en 10 mg de proteína/g de celulosa de una celulasa entera derivada de una cepa de T. reesei con reducción de Bgll.
Específicamente, se agregó 5 mg de proteína/g de celulosa de cada una de las beta-glucosidasas (Bgll, Fv3C y homólogos) en 10 mg de proteína/g de celulosa de una celulasa entera derivada de una cepa de T. reesei con reducción de Bgll, o en 8 mg de proteína/g de celulosa de una mezcla de hemicelulasas purificadas (cuyos componentes se indican en la Figura 6) . El % de conversión de glucano se determinó después de incubar las mezclas enzimáticas con el sustrato durante 2 d a 50 °C.
Los resultados se muestran en la Figura 48. Se ha observado, además, que Fv3C impartió un claro beneficio en cuanto al % de conversión de glucano en comparación con Bgll de T. reesei. Adicionalmente , Fv3C promovió, además, mayores producciones de glucosa y total de azúcar que Bgll de T. reesei .
Los resultados indicaron una contribución limitada, si hubo, de las proteínas base de las células huésped.
C. Rendimiento de sacarificación de Fv3C en mazorca de maíz tratada previamente con amoníaco diluido En este experimento, se evaluó la capacidad de Bgll de T. reesei, Fv3C y Bglu (An3A) de A. niger para mejorar la sacarificación de mazorca de maíz tratada previamente con amoníaco a sólidos al 20 % de conformidad con el método descrito en el ensayo de sacarificación en placas de microtitulación {supra) . Específicamente, se agregó 5 mg de proteína/g de celulosa de beta-glucosidasas (por ejemplo, T. reesei Bgll, Fv3C y homólogos) en el sustrato de mazorca de maíz tratada previamente con amoníaco diluido y se agregó, además, 10 mg de proteína/g de celulosa de celulasa entera derivada de una cepa de T. reesei con reducción de Bgll. Adicionalmente , se agregó, además, a la mezcla 8 mg de proteína/g de celulosa de una mezcla de hemicelulasas purificadas (Figura 6) que contiene Xyn3 , Fv3A, Fv43D y Fv51A. El % de conversión de glucano se determinó después de incubar las mezclas de enzimas con el sustrato durante 2 d a 50 °C.
Los resultados se muestran en la Figura 49. Se observó, además, que Fv3C parecía tener mejor rendimiento que las otras beta-glucosidasas, que incluyen Bgll de T. reesei (Tr3A) . Se observó, además, que las adiciones de Bglu (An3A) de A. niger en la mezcla de enzimas hasta un nivel mayor que 2.5 mg/g de celulosa impidieron la sacarificación.
D. Rendimiento de sacarificación de Fv3C en mazorca de maíz tratada previamente con hidróxido sódico (NaOH) Para evaluar el efecto de varios métodos de tratamiento previo de sustratos sobre el rendimiento de Fv3C, se determinó la capacidad de Bgll de T. reesei (también llamado Tr3A) , Fv3C y Bglu (An3A) de A. niger para mejorar la sacarificación de mazorca de maíz tratada previamente con NaOH a sólidos al 12 % de conformidad con el método descrito en el ensayo de sacarificación con placas de microtitulación (supra) . El tratamiento previo de mazorca de maíz con hidróxido sódico se llevó a cabo de la siguiente manera: se molió 1,000 g de mazorca de maíz hasta un tamaño de aproximadamente 2 mm y, después, se suspendieron en 4 1 de solución acuosa de hidróxido sódico al 5 % y se calentaron hasta 110 °C durante 16 h. El líquido marrón oscuro se filtró caliente con vacío de laboratorio. El residuo sólido en el filtro se lavó con agua hasta que no eluyó más color. El sólido se secó con vacío de laboratorio durante 24 h. Se resuspendió cien (100) g de la muestra en 700 mi de agua y se agitó. Se determinó que el pH de la solución era 11.2. Se agregó solución acuosa de ácido cítrico (10 %) para reducir el pH hasta 5.0 y la suspensión se agitó durante 30 min. Después, el sólido se filtró, se lavó con agua y se secó al vacío a temperatura ambiente durante 24 h. Después de secar, se obtuvo 86.2 g de biomasa enriquecida de polisacáridos . El contenido de humedad de este material fue de aproximadamente 7.3 % en peso. El contenido de glucano, xilano, lignina y total de carbohidratos se determinó antes y después del tratamiento con hidróxido sódico, según los métodos de NREL para el análisis de carbohidratos. El tratamiento previo produjo la delignificación de la biomasa mientras se mantenía una relación en peso de glucanos/xilanos dentro del 15 % de la de la biomasa sin tratar.
Aproximadamente 5 mg de proteína/g de celulosa de beta-glucosidasas (Fv3C y homólogos) se agregaron al sustrato tratado previamente con NaOH, además de la inclusión de 8.7 mg de proteína/g de celulosa de una celulasa entera derivada de una cepa H3A de T. reesei integrada seleccionada específicamente por su nivel bajo de expresión de Bgll ("la cepa H3A-5") . En este experimento no se agregó ninguna hemicelulasa purificada adicional (por ejemplo, la mezcla de la Figura 6) a la base de celulasa entera. El % de conversión de glucano se determinó después de incubar las mezclas de enzimas con el sustrato durante 2 d a 50 °C.
Los resultados se muestran en la Figura 50. Se observó que Fv3C parecía haber tenido mejor rendimiento que las otras beta-glucosidasas , que incluyen Bgll de T. reesei (Tr3A) , An3A y Te3A. Se observó, además, que las adiciones de Bglu de A. niger (An3A) hasta un nivel mayor que 4 mg/g de celulosa produjo menor conversión.
E. Rendimiento de sacarificación de Fv3C en pasto varilla tratado previamente con amoníaco diluido En este experimento, se evaluó la capacidad de Bgll de T. reesei, Fv3C y Bglu (An3A) de ?. niger para mejorar la sacarificación del pasto varilla tratado previamente con amoníaco diluido a sólidos al 17 % de conformidad con el método descrito en el ensayo de sacarificación en placas de microtitulación {supra) . El pasto varilla tratado previamente con amoníaco diluido se obtuvo de DuPont . La composición se determinó con el uso del procedimiento del National Renewable Energy Laboratory (NREL) , (NREL LAP-002) , disponible en: htt : //www . nrel . gov/biomass/analytical_procedures . html .
La composición en base al peso seco era glucano (36.82 %) , xilano (26.09 %) , arabinano (3.51 %) , lignina insoluble en ácido (24.7 %) y acetilo (2.98 ¾) . Esta materia prima se molió con cuchillo para pasar por un tamiz de 1 mm. El material molido se sometió a tratamiento previo a -160 °C durante 90 min en presencia de de amoníaco al 6 % en peso (de sólidos secos) . La carga inicial de sólidos fue aproximadamente 50 % materia seca. La biomasa tratada se almacenó a 4 °C antes de usar.
En este experimento, se agregó 5 mg de proteína/g de celulosa de beta-glucosidasas (por ejemplo, Bgll de T. reesei, Fv3C y homólogos) en el pasto varilla tratado previamente con amoníaco diluido, en presencia de 10 mg de proteína/g de celulosa de una celulasa entera derivada de una cepa (H3A) de T. reesei integrada seleccionada por su baja expresión de ß-glucosidasa . El % de conversión de glucano se determinó después de incubar las mezclas de enzimas con el sustrato durante 2 d a 50 °C y los resultados se indican en la Figura 51.
Parece que Fv3C tuvo mejor rendimiento que Bgll de T. reesei y Bglu de A. niger con el sustrato de pasto varilla. F. Rendimiento de sacarificación de Fv3C en rastrojo de maíz tratado con AFEX En este experimento, se evaluó la capacidad de Bgll de T. reesei, Fv3C y Bglu de A. niger para mejorar la sacarificación de rastrojo de maíz tratado con AFEX a sólidos al 14 % de conformidad con el método descrito en el ensayo de sacarificación en placas de microtitulación (supra) . El rastrojo de maíz tratado previamente con AFEX se obtuvo de Michigan Biotechnology Institute International (MBI) . La composición de rastrojos de maíz se determinó con el uso del procedimiento del National Renewable Energy Laboratory (NREL) LAP-002, disponible en: http : //www . nrel . gov/biomass/analytical_procedures . html .
La composición en base al peso seco fue glucano (31.7 %) , xilano (19.1 %) , galactano (1.83 %) y arabinano (3.4 %) . Esta materia prima se trató con AFEX en un reactor a presión de 18.9 litros (5 galones) (Parr) a 90 °C, 60 % de contenido de humedad, una carga 1:1 de biomasa y amoníaco y durante 30 min. La biomasa tratada se retiró del reactor y se dejó que una campana de extracción evaporara el amoníaco residual. La biomasa tratada se almacenó a 4 °C antes de usar.
En este experimento, aproximadamente 5 mg de proteína/g de celulosa de beta-glucosidasas (Fv3C y homólogos) se agregaron al sustrato tratado previamente, en presencia de 10 mg de proteína/g de celulosa de celulasa entera derivada de una cepa de T. reesei que expresa poca ß-glucosidasa integrada (ver la Figura 3) . El % de conversión de glucano se determinó después de incubar las mezclas de enzimas con el sustrato durante 2 d a 50 °C y los resultados se indican en la Figura 52.
Se observó que Fv3C tuvo mejor rendimiento que Bgll de T. reesei en la conversión de glucano. Se notó, además, que 10 mg/g de celulosa de Fv3C y 10 mg/g de celulosa de celulasa entera H3A en las condiciones mencionadas anteriormente produjeron una conversión de glucano completa o aparentemente completa. A concentraciones menores que 1 mg/g de celulosa, parece que Bglu (An3A) de A. niger produce mayor glucosa y total de conversiones de glucano que Fv3C y Bgll de T. reesei, pero a concentraciones mayores que 2.5 mg/g de celulosa, se observó que Fv3C y Bgll de T. reesei tienen mayor glucosa y conversión de glucano que Bglu de A. niger.
Ejemplo 6. Optimización de la relación de fv3c y celulasa entera para la sacarificación de mazorca de maíz tratada previamente con amoníaco diluido En este experimento, la relación de Fv3C y celulasa entera se varió para determinar la relación óptima de Fv3C y celulasa entera en una composición de hemicelulasas . Se usó mazorca de maíz tratada previamente con amoníaco diluido como sustrato. La relación de beta-glucosidasas (por ejemplo, Bgll de T. reesei, Fv3C, Bglu de A. niger) y celulasa entera derivada de la cepa H3A de G. reesei integrada se varió de 0 a 50 % en la composición de hemicelulasas. Las mezclas se agregaron para hidrolizar la mazorca de maíz tratada previamente con amoníaco a sólidos al 20 % a 20 mg de proteína/g de celulosa. Los resultados se muestran en las Figuras 53A-53C.
La relación óptima de Bgll de T. reesei y celulasa entera era amplia, centrándose a aproximadamente 10 %, en donde 50 % de la mezcla tuvo un rendimiento similar con la misma carga de celulasa entera sola. En contraste, Bglu de A. niger alcanzó lo óptimo a aproximadamente 5 % y el pico fue más agudo. En el nivel pico/óptimo, Bglu de A. niger produjo mayor conversión que la mezcla óptima que comprende Bglu de T. reesei .
Se determinó que la relación óptima de Fv3C y celulasa entera es de aproximadamente 25 %, en donde la mezcla produce más del 96 % de conversión de glucano a 20 mg de proteína total/g de celulosa. Por lo tanto, 25 % de las enzimas en la celulasa entera se pueden reemplazar con una sola enzima, Fv3C, para lograr un mayor rendimiento de sacarificación.
Ejemplo 7. Sacarificación de mazorca de maíz tratada previamente con amoníaco por medio de diferentes mezclas de enzimas Una mezcla de 25 % de Fv3C/75 % de celulasa entera a partir de la cepa (H3A) de T. reesei integrada se comparó con otras mezclas de celulasas de alto rendimiento en un experimento de respuesta a la dosis. La mezcla de celulasa entera a partir de la cepa (H3A) de T. reesei integrada sola, 25 % de Fv3C/75 % de celulasa entera a partir de la cepa (H3A) de T. reesei integrada y xilanasa Accellerase® 1500 + Multifect® se compararon para determinar su rendimiento de sacarificación en mazorca de maíz tratada previamente con amoníaco diluido a sólidos al 20 %. Las mezclas de enzimas se dosificaron de 2.5 a 40 mg de proteína/g de celulosa en la reacción. Los resultados se muestran en la Figura 54.
La mezcla de 25 % de Fv3C/75 % de celulasa entera a partir de la cepa (H3A) de T. reesei integrada tuvo un rendimiento radicalmente mejor que la mezcla de xilanasa Accellerase® 1500 + Multifect® y mostró una mejoría significativa sobre la celulasa entera de la cepa (H3A) de T. reesei integrada. La dosis requerida para 70, 80 o 90 % de conversión de glucano de cada mezcla de enzimas se enumera en la Figura 7. A una conversión de glucano al 70 %, la mezcla de 25 % de Fv3C/75. % de celulasa entera de la cepa (H3A) de G. reesei integrada produjo una reducción de dosis de 3.2 veces en comparación con la mezcla de xilanasa Accellerase® 1500 + Multifect®. A una conversión de glucano de 70, 80 o 90 %, la mezcla de 25 % de Fv3C/75 % de celulasa entera de la cepa (H3A) de T. reesei integrada requería aproximadamente 1.8 veces menos enzima que la celulasa entera de la cepa (H3A) de T. reesei integrada sola.
Ejemplo 8. Expresión de fv3c en la cepa de aspergillus niger Para expresar Fv3C en A. niger, el plásmido pENTR-Fv3C se recombinó con un vector de destino pRAXdest2, como se describe en la patente de los Estados Unidos núm. 7459299, con el uso de la reacción de recombinación Gateway LR (Invitrogen) . El plásmido de expresión contenía la secuencia genómica Fv3C bajo control del promotor y terminador de glucoamilasa de A. niger, el gen pyrG de A. nidulans como marcador selectivo y la secuencia de amal de A. nidulans para la replicación autónoma en células fúngicas . Los productos de recombinación generados se transformaron en DH5a de E. coli de máxima eficiencia (Invitrogen) y los clones que contienen el constructo de expresión pRAX2-Fv3C (Figura 55A) se seleccionaron en placas de agar 2xYT, se prepararon con 16 9 1 Bacto Tryptone (Difco) , 10 g/1 de extracto de levadura Bacto (Difco), 5 g/1 de NaCl, 16 g/1 de agar Bacto (Difco) y 100 g/ml de ampicilina.
Aproximadamente 50-100 mg del plásmido de expresión se transformaron en una cepa var awamori de A. niger (ver la patente de los Estados Unidos núm. 7459299) . El gen glaA de glucoamilasa endógena se eliminó de esta cepa y se llevó a cabo una mutación en el gen pyrG, lo que permitió la selección de los transformantes para la prototrofía para uridina. Se cultivó transformantes de A. niger en un medio MM (el mismo medio mínimo que se usó para la transformación de T. reesei pero se usó NH4C1 10 mM en lugar de acetamida como fuente de nitrógeno) durante 4-5 d a 37 °C y se usó una población total de esporas (aproximadamente 10s esporas/ml) de diferentes placas de transformación para inocular los matraces de agitación que contienen el medio de producción (por 11) : 12 g de triptona; 8 g de soytona; 15 g de (NH4)2S04; 12.1 g de NaH2PO4xH20; 2.19 g de Na2HP04x2H20; 1 g de MgS04x7H20; 1 mi de Tween 80; 150 g de maltosa; pH 5.8. Después de 3 d de fermentación a 30 °C y agitación a 200 rpm, la expresión de Fv3C en los transformantes se confirmó por SDS-PAGE.
Ejemplo 9. Rendimiento de BGL3 de T. reesei (Tr3B) A. Sacarificación con el uso de mezclas de celulasa entera/Bg!3 de T. reesei en PASC y PCS Se usó un caldo de fermentación claro de celulasa entera de una cepa mutante de Trichoderma reesei, derivada de RL-P37 (Sheir-Neiss, G. et al. Appl. Microbiol . Biotechnol . 1984, 20:46-53) y seleccionada para la producción alta de celulasa en la base de estos experimentos. La celulasa entera y la Bgl3 (Tr3B) de G. reesei purificada se colocaron en el ensayo de sacarificación en base a un total en mg de proteína por g de celulosa en el sustrato. La Bgl3 de T. reesei purificada se mezcló con celulasa entera a una concentración de 0-100 % de Bgl3. Las mezclas se cargaron a 20 mg de proteína/g de celulosa. Cada muestra se analizó por triplicado.
La celulosa dilatada con ácido fosfórico (PASC) se preparó de Avicel PH-101 con el uso de un protocolo adaptado de Walseth, TAPPI 1971, 35:228 and Wood, Biochem. J. 1971, 121:353-362. En pocas palabras, se solubilizó 25 Avicel en ácido fosfórico concentrado seguido por precipitación con el uso de agua desionizada fría. Después de recolectar y lavar la celulosa con más agua para neutralizar el pH, se diluyó hasta 1 % de sólidos en un regulador de acetato sódico 50 mM, pH 5.0. Se agregó veinte (20) µ? de la mezcla de enzimas diluida en los pocilios individuales de la placa de microtitulación de fondo plano. Con el uso de una pipeta de repetición, se agregó 150 µ? de sustrato por pocilio y la placa se cubrió con 2 sellantes de placas de aluminio.
Los rastrojos de maíz tratados previamente con ácido diluido (supra) se diluyeron hasta celulosa al 7 % en un regulador de acetato sódico 50 mM, pH 5 y el pH de la mezcla se ajustó hasta 5.0. Con el uso de una pipeta de repetición, se agregó 150 µ? de sustrato en los pocilios individuales de una placa de microtitulación de fondo plano. Se agregó veinte (20) µ? de la mezcla de enzimas diluidas en pocilios individuales y la placa se cubrió con 2 sellantes de placas de aluminio.
Estas placas se incubaron a 37 °C o 50 °C, con mezclado a 700 rpm. PASC se incubó durante 2 h y las placas de PCS durante 48 h. Las reacciones se terminaron al agregar 100 µ? de un regulador de glicina 100 mM, pH 10, en pocilios individuales. Después de mezclar totalmente, los contenidos de las placas se filtraron y el sobrenadante se diluyó 6 veces en una placa de HPLC que contiene 100 µ? de glicina io mM, pH 10. Después, se determinó las concentraciones de los azúcares solubles producidos con el uso de HPLC (Agilent serie 1100, equipada con una columna de desionización/protección (Biorad núm. 125-0118) ) y una columna de carbohidratos Aminex HPX-87P, que se mantuvieron a 85 °C. La fase móvil era agua que tenía un índice de flujo de 0.6 ml/min. El porcentaje de conversión de glucano se define en la presente descripción como 100 x [mg de glucosa + (mg de celobiosa x 1.056)] / [mg de celulosa en el sustrato x 1.111] . Por lo tanto, los % de conversión se corrigieron para agua de hidrólisis. Los resultados de rendimiento de las mezclas de celulasa entera: Bgl3 de T. reesei en la sacarificación de PASC a 50 °C se muestran en la Figura 64A. Los resultados de rendimiento de las mezclas de celulasa entera: Bgl3 de G. reesei en la sacarificación de PASC a 37 °C se muestran en la Figura 64B. El rendimiento de las mezclas de celulasa entera: Bgl3 de G. reesei en la sacarificación de rastrojo de maíz tratado nuevamente con ácido a 50 °C se muestran en la Figura 64C. El rendimiento de las mezclas de celulasa entera: Bgl3 de T. reesei en la sacarificación de rastrojo de maíz tratado nuevamente con ácido a 37 °C se muestran en la Figura 64D.
B. Respuesta á la dosis de Bgl3 con base de celulasa entera en PASC Un caldo de fermentación claro de celulasa entera de una cepa mutante de T. reesei, derivada de RL-P37 (Sheir-Neiss , G et al. Appl . Microbiol . Biotechnol . 1984, 20:46-53) y seleccionada para la producción alta de celulasa en la base de estos experimentos .
La celulasa entera y Bgl3 de T. reesei purificada se colocaron en el ensayo de sacarificación en base al total en mg de proteína por g de celulosa en el sustrato. La Bgl3 de G. reesei purificada se cargó en cantidades de 0-10 mg de proteína /g de celulosa. Además, se agregó una concentración constante de 10 mg de proteína celulasa entera /g de celulosa en cada muestra. Cada muestra se analizó por triplicado.
El sustrato de celulosa dilatada con ácido fosfórico se diluyó hasta celulosa al 1 % en un regulador de acetato sódico 50 mM, pH 5, y el pH se ajustó hasta 5.0. Se agregó veinte (20) µ? de la mezcla de enzimas diluida en los pocilios individuales de la placa de microtitulación de fondo plano. Con el uso de una pipeta de repetición, se agregó 150 µ? de sustrato en pocilios individuales y la placa se recubrió con 2 sellantes de placas de aluminio. Después, las placas se incubaron a 50 °C con mezclado a 700 rpm durante 1 h.
Las reacciones se terminaron al agregar 100 µ? de un regulador de glicina 100 mM, pH 10, en pocilios individuales. Después de mezclar totalmente, los contenidos de las placas se filtraron y el sobrenadante se diluyó 6 veces en una placa de HPLC que contiene 100 µ? de glicina 10 mM, pH 10. Después, se determinó las concentraciones de los azúcares solubles producidos con el uso de HPLC (Agilent serie 1100, equipada con una columna de desionización/protección (Biorad nüm. 125-0118) ) y una columna de carbohidratos Aminex HPX-87P, que se mantuvieron a 85 °C. La fase móvil era agua que tenía un índice de flujo de 0.6 ml/min.
El porcentaje de conversión de glucano se define en la presente descripción como 100 x [mg de glucosa + (mg de celobiosa x 1.056)] / [mg de celulosa en el sustrato x 1.111] . Por lo tanto, los % de conversión se corrigieron para agua de hidrólisis. La comparación de las respuestas a la dosis de Bgll de T. reesei y Bgl3 de T. reesei en la sacarificación de celulosa dilatada con ácido fosfórico se muestra en la Figura 65A. La comparación de la celobiosa y glucosa producidas por Bgll de T. reesei y Bgl3 de T. reesei en la sacarificación de celulosa dilatada con ácido fosfórico se muestra en la Figura 65B.
Ejemplo 10. ß -Glucosidasa quimérica A. Expresión en T. reesei Las porciones de la secuencia C-terminal de Fv3C silvestre se reemplazaron con la secuencia C-terminal de ß-glucosidasa de T. reesei Bgl3 (Tr3B) . Específicamente, un tramo contiguo que representa los residuos 1-691 de Fv3C se fusionó con un tramo contiguo que representa los residuos 668-874 de Bgl3. Una representación esquemática del gen que codifica el polipéptido quimérico/de fusión Fv3C/Bgl3 se presenta en la Figura 60A. La secuencia de aminoácidos y la secuencia de polinucleótidos que codifican el polipéptido de fusión/quimérico Fv3C/Bgl3 se representan en las Figuras 60B y 60C.
La molécula quimérica/de fusión se construyó con el uso de una PCR de fusión. Los clones de pENTR de las secuencias codificantes genómicas de Fv3C y Bgl3 se usaron como plantillas de PCR. Ambos clones de entrada se construyeron en el vector pdonante221 (Invitrogen) . El producto de fusión se ensambló en dos etapas. Primero, la parte quimérica Fv3C se amplificó en una reacción de PCR con el uso de un clon de pENTR Fv3C como plantilla y los siguientes cebadores de oligonucleótidos : pdonante directo: 5'-GCTAGCATGGATGTTTTCCCAGTCACGACGTTGTAAAACGACGGC- 3' (sec. con núm. de ident.:122) Fv3C/Bgl3' inverso: 5'- GGAGGTTGGAGAACTTGAACGTCGACCAAGATAGACCGTGA CCGAAC TCGTAG 3' (sec. con núm. de ident.:123) La parte quimérica Bgl3 se amplificó a partir de un vector pENTR Bgl3 con el uso de los siguientes cebadores de oligonucleótidos : pdonante inverso: 5'- TGCCAGGAAACAGCTATGACCATGTAATACGACTCACTATAGG-3 ' (sec. con núm. de ident . : 124) Fv3C/Bgl3 directo: 5'- CTACGAGTTCGGTCACGGTCTATCTTGGTCGACGTTCAAGTTC TCCAACCTCC-3 ' (sec. con núm. de ident. :125) En la segunda etapa, se agregó equimolar de los productos de PCR (aproximadamente 1 µ? y 0.2 µ? de las reacciones de PCR inicial, respectivamente) como plantillas para una reacción de PCR de fusión posterior con el uso de un grupo de cebadores anidados de la siguiente manera: Att Ll directo: 5' TAAGCTCGGGCCCCAAATAATGATTTTATTTTGACTGATAGT 3' (sec. con núm. de ident. :126) AttL2 inverso: 5 ' GGGATATCAGCTGGATGGCAAATAATGATTTTATTTTGACTGATA 3' (sec. con núm. de ident.:127) Las reacciones de PCR se llevaron a cabo con el uso de una ADN polimerasa Phusion de alta fidelidad (Finnzymes OY) . El producto de PCR fusionado resultante contenía los sitios de recombinación intactos específicos de Gateway attLl, attL2 en los extremos, lo que permite la clonación directa en un vector de destino final por medio de una reacción de recombinación Gateway LR (Invitrogen) .
Después de la separación de los fragmentos de ADN en un gel de agarosa al 0.8 %, los fragmentos se purificaron con el uso de un kit de limpieza de PCR de extracto Nucleospin® (Macherey-Nagel GmbH & Co. KG) y 100 ng de cada fragmento se recombinó con el uso de un vector de destino pTTT-pyrG13 y la mezcla de enzimas LR clonase™ II (Invitrogen) . Los productos de recombinación resultantes se transformaron en DH5a de E. coli de máxima eficiencia (Invitrogen) y los clones que contienen la fusión del constructo de expresión pTTT-pyrG13-Fv3C/Bgl3 (Figura 61) que contienen la ß-glucosidasa quimérica se seleccionaron en placas de agar 2xYT, se prepararon con el uso de 16 g/1 de Triptona Bacto (Difco) , 10 g/1 extracto de levadura Bacto (Difco), 5 g/1 de NaCl, 16 g/1 de agar Bacto (Difco) y 100 ug/ml de ampicilina. Las bacterias se cultivaron en un medio YT 2x que contiene 100 pg/ml de ampicilina. Después de eso, los plásmidos se aislaron y se sometieron a procesos de restricción ya sea por Bgll o EcoRV. La región Fv3C/Bgl3 resultante se secuenció con el uso de un analizador de secuencias ABI3100 (Applied Biosystems) para confirmación. Un plásmido que tiene el patrón de restricción confirmado y la secuencia correcta se usó como plantilla en una reacción de PCR adicional para generar un fragmento de ADN, con el uso de una ADN polimerasa Phusion de alta fidelidad (Finnzymes OY) y los cebadores de la siguiente manera: Cbhl directo: 5' GAGTTGTGAAGTCGGTAATCCCGCTG 3' (sec. con núm. de ident . : 128 AmdS inverso: 5' CCTGCACGAGGGCATCAAGCTCACTAACCG 3' (sec. con núm. de ident. :129) El fragmento resultante comprendía la región codificante Fv3C/Bgl3 bajo control del promotor y terminador cbhl. Específicamente, 0.5-1 µg de este fragmento se transformó en una cepa eliminada en hexa de T. reeseí (ver arriba) con el uso del método PEG-Protoplast con ligeras modificaciones como se describe a continuación. Para la preparación de protoplastos , las esporas se cultivaron durante 16-24 h a 24 °C en medio mínimo de Trichoderma que contenía 20 g/1 de glucosa, 15 g/1 de KH2P04, pH 4.5, 5 g/1 de (NH4)2S04, 0.6 g/1 de MgS0x7H20, 0.6 g/1 de CaCl2x2H20, 1 mi de solución de oligoelementos de T. reesei 1000 X (que contenía 5 g/1 de FeS04x7H20, 1.4 g/1 de ZnS04x7H20, 1.6 g/1 de MnS04 x H20, 3.7 g/1 de CoCl2 x 6H20) con agitación a 150 rpm. Las esporas de germinación se recolectaron por centrifugación y se trataron con 50 mg/ml de solución Glucanex G200 (Novozymes AG) para lisar las paredes de las células fúngicas . Se realizó más preparación de los protoplastos de conformidad con un método descrito por Penttilá et al. Gene 61(1987)155-164.
Las mezclas de transformación, que contenían aproximadamente 1 ig de ADN y l-5x 107 de protoplastos en un volumen total de 200 µ? , se trataron individualmente con 2 mi de solución de PEG al 25 %, se diluyeron con 2 volúmenes de sorbitol 1.2 M/Tris 10 mM, pH7.5 , CaCl2 i0 mM, se mezclaron con agarosa superior selectiva MM al 3 % que contiene uridina 5 mM y acetamida 20 mM. Las mezclas resultantes se vertieron en una placa de agarosa selectiva al 2 % que contiene uridina y acetamida. Las placas se incubaron aún más durante 7-10 d a 28 °C antes de volver a recolectar los transformantes en placas con MM fresco que contienen uridina y acetamida. Las esporas de los clones independientes se usaron para inocular un medio de fermentación ya sea en placas de microtitulación de 96 pocilios o en matraces de agitación.
Las placas de filtro con 96 pocilios (Corning) que contienen 250 µ? de medio de producción de glicina con 4·7 9 1 de (NH4)2S04, 33 g/1 de 1 , 4 -piperaz inebis (ácido propanosulfónico) , ?? 5.5, 6.0 g/1 de glicina, 5.0 g/1 de KH2P04, 1.0 g/1 de CaCl2x2H20, 1.0 g/1 de MgS04x7H20, 2.5 ml/1 de una solución de oligoelementos de T. reesei 400X, 20 g/1 de glucosa y 6.5 g/1 de soforosa se inocularon con el uso de suspensiones de esporas de transformantes de T. reesei que expresan el híbrido Fv3C/Bgl3 (más de 104 esporas por pocilio) . Las placas se incubaron a 28 °C y en aproximadamente 80 % de humedad durante 6-8 d. Los sobrenadantes de cultivo se recolectaron por filtración al vacío y se usaron para evaluar el rendimiento del híbrido, así como su nivel de expresión." El perfil de proteínas de las muestras de caldo completo se determinó por electroforesis PAGE . Se mezcló veinte (20) µ? de sobrenadantes de cultivo con 8 µ? de una muestra 4X con regulador sin agente reductor. Las muestras se separaron en gel Bis-Tris NuPAGE® Novex al 10 % con el uso de regulador MES SDS Running (Invitrogen) .
Esto produjo una ß-glucosidasa quimérica Fv3C/Bgl3 (FB) menos sensible a la degradación de proteasas cuando se expresa en T. reesei o durante el almacenamiento. Después de 8 días de fermentación en una placa de microtitulación, se observó una descomposición significativamente menor de la ß-glucosidasa expresada con la quimera de Fv3C/Bgl3 (FB) , en comparación con la ß-glucosidasa de Fv3C en condiciones comparables.
B. Expresión de Fv3C y FAB en una célula huésped de Chrysosporium lucknowence.
Construcción del cásete de expresión Los vectores de expresión de Fv3C descritos para T. reesei (pTrex6g/Fv3c, Ejemplo 3, Figura 45B) y para A. niger (pRAX2-Fv3C, Ejemplo 8, Figura 55A) se usan para expresar Fv3C, o FAB en Chrysosporium lucknowense. Se usa la secuencia señal de Fv3C natural. El vector pRAX2-Fv3C contiene la secuencia genética de fv3C bajo control de las secuencias promotoras y terminadoras de glucoamilasa de A. niger, el gen pyrG de A. nidulans como marcador selectivo y la secuencia de A. nidulans amal para la replicación autónoma en células fúngicas. El vector pTrex6g/Fv3c contiene el marco de lectura abierta de Fv3C bajo control de las secuencias promotoras y terminadoras de T. reesei cbhl y el marcador de selección de acetolactato sintasa mutado de T. reesei (ais) con su promotor y terminador naturales. Alternativamente, se puede usar, además, marcadores de selección tales como resistencia a la fleomicina o higromicina, o el marcador de selección nutricional acetamidasa (amdS) .
Transformación de C. lucknowense Las células huésped de C. lucknowense se transforman con pTrex6g/Fv3C por fusión de protoplastos como lo describen Penttilá et al. Gene 61(1987)155-164, con las modificaciones conocidas en la técnica, tales como las descritas en, por ejemplo, la patente de los Estados Unidos núm. 6,573,086. Los transformantes resistentes se pueden seleccionar en placas de clorimurón etilo fresco. Alternativamente, las células huésped de pyrG- (uridina auxotrófica) de C. lucknowense se pueden transformar con pRAX2-Fv3C por fusión de protoplastos y se pueden seleccionar por prot trofía para uridina como se describió en el Ejemplo 8, supra.
Transformantes de Culturing C. lucknowense para la producción de proteínas Fv3C y FAB se producen por cultivo de transformantes de C. lucknowense a 27-40 °C, pH 5-10, con agitación durante aproximadamente 5 d en los medios descritos en, por ejemplo, la patente núm. WO 98/15633, con el uso de celulosa o lactosa para inducir el promotor CBHI , o maltosa, maltrina o almidón para inducir el promotor de glucoamilasa .
Ejemplo 11. beta-glucosidasa quimérica Los análisis de SDS-PAGE y mapeo de péptidos revelaron que la quimera Fv3C/Bgl3 se procesó en dos fragmentos cuando se produjo en T. reesei. La secuenciación N- terminal indicó un sitio de procesamiento entre los residuos 674 y 683 de la longitud total de Fv3C.
Se construyó una segunda ß-glucosidasa quimérica que comprendía una secuencia N-terminal derivada de Fv3C, una región en bucle derivada de la secuencia de una segunda ß-glucosidasa de Te3A de Talaromyces emersonii y una secuencia C-terminal derivada de Bgl3 (o Tr3B) de G. reesei . Esto se logró al reemplazar una región en bucle de la quimera Fv3C/Bgl3 (ver el Ejemplo 10, supra) . Específicamente, los residuos de Fv3C 665 - 683 de la quimera Fv3C/Bgl3 (que tiene una secuencia de RRSPSTDGKSSPNN TAAPL (sec. con núm. de ident. : 157) se reemplazaron con los residuos de Te3A 634 -640 (KYNITPI (sec. con núm. de ident.:158) . Esta molécula híbrida se construyó con el uso de un método de PCR de fusión, como se describe en el Ejemplo 10, supra.
Dos sitios de N-glicosilación, particularmente ?725? y S751N, se introdujeron en la cadena principal de Fv3C/Bgl3. Estas mutaciones de glicosilación se introdujeron en la cadena principal de Fv3C/Bgl3 con el uso de la técnica de amplificación por PCR de fusión, como se describió anteriormente, con el uso del plásmido de fusión pTTT-pyrG13 -Fv3C/Bgl3 (Figura 61) como plantilla para generar los fragmentos iniciales de PCR. Los siguientes pares de cebadores se agregaron en reacciones de PCR separadas: Pr Cbhl directo: 5' CGGAATGAGCTAGTAGGCAAAGTCAGC 3' (sec. con núm. de ident . :130 y 725/751 inverso: 5'- CTCCTTGATGCGGCGAACGTTCTTGGGGAAGCCATAGTCCTTAA GGTTCTTGCTGAAGTTGCCCAGAGAG 3' (sec. con núm. de ident. : 131) 725/751 directo: 5'-GGCTTCCCCAAGAACGTTCGCCGCATCAAGGAGTTTATCTACC CCTACCTGAACACCACTACCTC 3' (sec. con núm. de ident.:132) y Ter Cbhl inverso: 5' GATACACGAAGAGCGGCGATTCTACGG 3' (sec. con núm. de ident . :133) .
Después, los fragmentos de PCR se fusionaron con el uso de los cebadores Pr Cbhl directo y Ter Cbhl. El producto de fusión resultante incluyó los dos sitios de glicosilación deseados, pero contenía, además, los sitios attBl y attB2 intactos, lo que permitió la recombinación con el vector pdonante221 con el uso de la reacción de recombinación Gateway BP (Invitrogen) . Esto produjo un clon pENTR-Fv3C/Bgl3/ S725N S751N que, después, se usó como cadena principal para construir la molécula híbrida triple Fv3C/Te3A/Bgl3.
Para reemplazar el bucle del híbrido Fv3C/Bgl3 en los residuos 665 - 683 con la secuencia en bucle a partir de Te3A, se llevó a cabo reacciones de PCR primarias con el uso de los siguientes grupos de cebadores: Grupo 1 _ pdonante directo: 5'- GCTAGCATGGATGTTTTCCCAGTCACGACGTTGTAAA ACGACGGC 3' (sec. con núm. de ident. : 122) y Te3A inverso: 5 ' -GATAGACCGTGACCGAACTCGTAGATAGGCGTGATGTT GTACTTGTCGAAGTGACGGTAGTCGATGAAGAC 3' (sec. con núm. de ident . : 160) ; Grupo 2: Te3A2 directo: 5'-GTCTTCATCGACTACCGTCACTTCGACAAGTACAACATCAC GCCTATCTACGAGTTCGGTCACGGTCTATC-3 ' (sec. con núm. de ident . : 161) ; y pdonante inverso: 5' TGCCAGGAAACAGCTATGACCATGTAATACGACTCACTATAGG 3' (sec. con núm. de ident . -.124) Después, los fragmentos obtenidos en las reacciones de PCR primarias se fusionaron con el uso de los siguientes cebadores : Att Ll directo: 5' TAAGCTCGGGCCCCAAATAATGATTTTATTTTGACTGATAGT 3' (sec. con núm. de ident. :126) and AttL2 inverso: 5 ' GGGATATCAGCTGGATGGCAAATAATGATTTTATTTTGACTGATA 3' (sec. con núm. de ident. :127) .
El producto de PCR resultante contenía los sitios de recombinación específicos de Gateway attLl, attL2 intactos en los extremos, lo que permitió la clonación directa en un vector de destino final con el uso de una reacción de recombinación Gateway LR (Invitrogen) .
La secuencia de ADN del gen codificante Fv3C/Te3A/Bgl3 se enumera en la sec. con núm. de ident. : 83. La secuencia de aminoácidos del híbrido Fv3C/Te3A/Bgl3 (FAB) se enumera en la sec. con núm. de ident. :135. La secuencia genética que codifica la quimera Fv3C/Te3A/Bgl3 se clonó en el vector pTTT-pyrG13 y se expresó en una cepa receptora de T. reesei como se describió en el Ejemplo 10, supra .
Ejemplo 12. Estabilidad mejorada de beta-glucosidasas quiméricas Este experimento determinó las temperaturas de desnaturalización térmica de varias beta-glucosidasas con el uso de calorimetría de barrido diferencial (DSC) . Específicamente, las temperaturas de transición térmica se determinaron para la quimera de enzimas purificadas Fv3C/Te3A/Bgl3 , Fv3C y Bgll de T. reesei. Las enzimas se diluyeron hasta 500 ppm en un regulador de acetato sódico 50 m , pH 5.0. La placa de microt itulación de DSC de 96 pocilios (MicroCal) se cargó con 500 µ? de muestras de enzimas diluidas individuales. Además, se incluyó el blanco de agua y regulador. Los parámetros de DSC (Auto VP-DSC, MicroCal) se predeterminaron a una frecuencia de exploración de 90 °C/h; a 25 °C de temperatura iniciales y 110 °C de temperatura final. El termograma se muestra en la Figura 63. La Tm para Fv3C y la quimera Fv3C/Te3A/Bgl3 parecía similar y quizás, de cierto modo, menor que la de Bgll de T. reesei.
Ejemplo 13. Actividad de fv3c de A. niger expresada en la sacarificación de mazorca de maíz tratada previamente con amoníaco diluido ' La cepa H3A-5 integrada (una productora de poca ß-glucosidasa) , la Fv3C producida en A. niger (ver el Ejemplo 8) y la Bgll de T. reesei purificada (también llamada "Bglul de T. reesei" o "Tr3A" en la presente descripción) se cargaron en el ensayo de sacarificación en base al total en mg de proteína por g de celulosa en el sustrato. Las beta-glucosidasas se cargaron de 0-10 mg de proteína/g de celulosa. Se agregó una concentración constante de 10 mg/g de H3A-5 en cada muestra. Cada muestra se analizó con 5 réplicas de ensayo.
El sustrato de mazorca de maíz tratada previamente con amoníaco diluido se diluyó hasta celulosa al 7 % en regulador de acetato sódico 50 mM, pH 5, y el pH se ajustó hasta 5.0. El sustrato se colocó en placas de microtitulación de 96 pocilios (65 mg por pocilio) . Se agregó treinta (30) µ? de mezcla de enzimas diluidas adecuadamente por pocilio en la placa de 96 pocilios. Después de agregar la mezcla de enzimas, se calculó que el sustrato contenía celulosa al 5 % . Las placas ser recubrieron con 2 sellantes de placas de aluminio. Después, todas las placas se colocaron en una incubadora a 50 °C y 200 rpm durante 48 h.
La reacción se terminó al agregar 100 µ? de regulador de glicina 100 mM, pH 10, en cada pocilio. Después de mezclar totalmente, los contenidos de las placas se centrifugaron y el sobrenadante se diluyó 11 veces en una placa de HPLC que contiene 100 µ? de glicina 10 mM, pH 10. Después, se determinó las concentraciones de los azúcares solubles producidos por medio de HPLC. La HPLC Agilent serie 1100 estaba equipada con una columna de desionización/protección (Biorad núm. 125-0118) y una columna de carbohidratos Aminex a base de plomo (Aminex HPX-87P) que se mantuvieron a 85 °C. La fase móvil era agua con un índice de flujo de 0.6 ml/min.
El porcentaje de conversión de glucano se define como 100 x [mg de glucosa + (mg de celobiosa x 1.056)] / [mg de celulosa en el sustrato x 1.111] . De esta manera, los % de conversión, que se corrigieron para agua de hidrólisis, se representan en la Figura 62.
Ejemplo 13. Comparación de la unión al sustrato de fv3c, fab y bgll de t. reesei Este experimento compara la unión de Fv3C, la molécula quimérica de ß-glucosidasas FAB y Bgll de T. reesei a ciertos sustratos típicos de biomasa.
La lignina, un biopolímero complejo de fenilpropanoide, es el constituyente principal que no es carbohidrato de la madera que une las fibras de celulosa para endurecer y fortalecer las paredes celulares de las plantas. Dado que se retícula con otros componentes de la pared celular, la lignina minimiza la accesibilidad de la celulosa y la hemicelulosa para enzimas que degradan celulosa. Por lo tanto, la lignina se asocia, generalmente, con la digestabilidad reducida de la biomasa de toda la planta. Particularmente, la unión de celulasas a lignina reduce la degradación de celulosa por parte de las celulasas. La lignina es hidrófoba y tiene, aparentemente, carga negativa. Entre FAB, Bgll y Fv3C, Fv3C tiene el menor pl y tiene la menor carga positiva, mientras que Bglul tiene el mayor pl y la máxima carga positiva y se investigó su unión al sustrato lignocelulósico .
La lignina se recuperó después de la extensa sacarificación de mazorca de maíz (DACC, por sus siglas en inglés) o rastrojos de maíz (DACS, por sus siglas en inglés) tratados previamente con amoníaco diluido o rastrojos de maíz tratados previamente con ácido (PCS o whPCS) con el uso de una mezcla de sacarificación que contiene una Accellerase a 100 mg/g de celulosa y 8 mg de xilanasa Multifect/g de celulosa. Después de la sacarificación, se llevó a cabo la hidrólisis de las celulasas por la adición de serina proteasa no específica. Se agregó HC1 0.1N en la mezcla para inactivar la proteasa, seguido por múltiples lavados con regulador de acetato (acetato sódico 50 mM, pH 5) para que la muestra alcanzara nuevamente un pH de 5.
Cien (100) µ? de DACS (a aproximadamente glucano al 5 %) , DACC (a aproximadamente glucano al 5 %) , whPCS (a aproximadamente glucano al 5 %) , lignina preparada de DACC (como en glucano al 5 %) , lignina preparada de PCS (como en glucano al 5 %) o control de regulador de acetato sódico 50 mM, pH 5 se combinaron con 100 µ? de 150 µ9/p?1 de FAB, Bgll de T. reesei o Fv3C en una placa de microtitulación que, después, se selló y se incubó a 50 °C durante 44 h. La placa de microtitulación se centrifugó a velocidad alta para separar los materiales solubles de los insolubles. Se determinó la actividad enzimática en la fracción soluble. En resumen, el sobrenadante se diluyó 5 veces, después, se agregó 20 ul en 80 ul de 2 -cloro- -nitrofenil ß-D-glucopiranosido (CNPG) 2 mM y se incubó a temperatura ambiente durante 6 min. Se agregó cien (100) ul de Na2C03 500 mM, pH9.5, para templar la reacción. Se leyó OD405. El porcentaje de beta-glucosidasa no unida se calculó con el uso de OD405 de la actividad de beta-glucosidasas en la fracción soluble que se dividió por 0D4O5 de la muestra control que se incubó del mismo modo en ausencia de lignina y sustrato de biomasa.
Se determinó la actividad total de la ß-glucosidasa unida y no unida. La placa de microtitulación se mezcló nuevamente, se agregó alícuotas de 20 ul cada una en 80 ul de regulador de acetato sódico, pH 5, se agregó 20 ul de mezcla diluida en 80 ul de 2 -cloro-4 -nitrofenil ß-D-glucopiranosido (CNPG) 2 mM y se incubó a temperatura ambiente durante 6 min y se agregó 100 ul de Na2C03 500 mM, pH9.5, para templar la reacción. La mezcla de reacción se agitó menos y se trasladó 100 ul de sobrenadante a una placa de microtitulación nueva. Se determinó OD405. La actividad de ß-glucosidasas total relativa en presencia de biomasa o lignina se calculó con el uso de OD405 de la mezcla total dividida por OD405 de la muestra control que se incubó de la misma manera en ausencia de lignina y sustrato de biomasa.
Para verificar que la beta-glucosidasa unida no se separó en el período de tiempo de medición, se tomó una alícuota de 20 ul de la placa de microtitulación mezclada en 80 ul de regulador de acetato sódico, pH 5 , en una placa de microtitulación nueva, la placa se incubó a temperatura ambiente con agitación durante media hora para separar la beta-glucosidasa de la biomasa o lignina. Después, la placa se centrifugó y se determinó la actividad de beta-glucosidasas en el sobrenadante como se describió anteriormente. Nuevamente, se calculó la beta-glucosidasa no unida.
La Fv3C demostró la menor unión al sustrato de biomasa o lignina, mientras que tanto FAB como T. reesei 1 mostraron niveles altos de unión al sustrato de biomasa y lignina (Figura 71A) . Ninguna de estas tres ß-glucosidasas se unió a DACC, pero tanto T. reesei como FAB se unieron a la lignina preparada a partir de la sacarificación completa de DACC. Inesperadamente, la FAB o Bgll de T. reesei unida permaneció aproximadamente 50-80 % activa en comparación con la FAB o Bgll libre (Figura 71B) . Se observó, además, que la FAB unida no se separó de la biomasa o lignina, pero aproximadamente 20 % de Bgll sí se separó de un estado unido a un estado no unido durante un período de incubación de 30 min (Figura 71C) .
Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims (32)

REIVINDICACIONES Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones:
1. Un polipéptido aislado caracterizado porque comprende : a) una secuencia de aminoácidos que tiene por lo menos 70 % de identidad con la sec. con núm. de ident.:135; o b) una secuencia N-terminal y una secuencia C-terminal, en donde la secuencia N-terminal comprende una primera secuencia de aminoácidos derivados de una primera ß-glucosidasa, tiene por lo menos 200 residuos de longitud y comprende una o más o todas las sec. con núms . de ident . : 164-169, y caracterizado porque la secuencia C-terminal comprende una segunda secuencia de aminoácidos derivados de una segunda ß-glucosidasa, tiene por lo menos 50 residuos de longitud, y comprende la sec. con núm. de ident.: 170, en donde el polipéptido tiene actividad de ß-glucosidasas .
2. El polipéptido aislado de conformidad con la reivindicación 1, caracterizado porque comprende una secuencia de aminoácidos que tiene por lo menos 80 % de identidad con la sec. con núm. de ident.: 135.
3. El polipéptido aislado de conformidad con la reivindicación 1 ó 2, caracterizado porque comprende una secuencia de aminoácidos que tiene por lo menos 90 % de identidad con la sec. con núm. de ident.:135.
4. El polipéptido aislado de conformidad con la reivindicación 1, caracterizado porque comprende la secuencia N-terminal derivada de la primera ß-glucosidasa y la secuencia C-terminal derivada de la segunda ß-glucosidasa, caracterizado además porque la primera ß-glucosidasa y la segunda ß-glucosidasa son diferentes una de la otra.
5. El polipéptido aislado de conformidad con la reivindicación 1 ó 4, caracterizado porque la secuencia N-terminal y las secuencias en C-terminal no están conectadas directamente, pero están conectadas funcionalmente por medio de un dominio conector.
6. El polipéptido aislado de conformidad con la reivindicación 5, caracterizado porque la secuencia N-terminal, la secuencia C-terminal o el dominio conector comprende una secuencia de la región en bucle de 3, 4, 5, 6, 7, 8, 9, 10 u 11 residuos de aminoácidos de longitud, que comprenden una secuencia de aminoácidos de la sec. con núm. de ident . : 171 o 172.
7. El polipéptido aislado de conformidad con cualquiera de las reivindicaciones 1-6, caracterizado porque tiene una estabilidad mejorada en comparación con la primera ß-glucosidasa o con la segunda ß-glucosidasa .
8. El polipéptido aislado de conformidad con la reivindicación 7, caracterizado porque . la estabilidad mejorada es una resistencia aumentada al clivaje proteolítico en condiciones de almacenamiento o condiciones de producción.
9. El polipéptido aislado de conformidad con cualquiera de las reivindicaciones 4-8, caracterizado porque la secuencia N-terminal comprende una secuencia de aminoácidos que tiene por lo menos 90 % de identidad de secuencias con una secuencia de la misma longitud de la sec . con núm. de ident.:54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 o 79, caracterizado además porque la secuencia C-terminal comprende un motivo secuencial de la sec. con núm. de ident. :170.
10. El polipéptido aislado de conformidad con cualquiera de las reivindicaciones 4-8, caracterizado porque la secuencia N-terminal comprende uno o más o todos los motivos secuenciales de las sec. con núms . de ident .: 164-169 y la secuencia C-terminal comprende una secuencia de aminoácidos que tiene por lo menos 90 % de identidad de secuencias con una secuencia de la misma longitud de la sec. con núm. de ident. :54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78 o 79.
11. El polipéptido aislado de conformidad con la reivindicación 9 ó 10, caracterizado porque la secuencia N-terminal sigue 3 o más, 4 o más, 5 o más de los motivos secuenciales de las sec. con núms . de ident .: 136-148, y en donde la secuencia C-terminal sigue 2 o más, 3 o más, o 4 o más de los motivos secuenciales de las sec. con núms. de ident. : 149-156.
12. Una composición caracterizada porque comprende el polipéptido aislado de conformidad con cualquiera de las reivindicaciones 1-11.
13. La composición de conformidad con la reivindicación 12, caracterizada porque comprende una o más celulasas .
14. La composición de conformidad con la reivindicación 13, caracterizada porque la o las celulasas se seleccionan de endoglucanasas , GH61/endoglucanasas , celobiohidrolasas y otras beta-glucosidasas .
15. La composición de conformidad con cualquiera de las reivindicaciones 12-14, caracterizada porque comprende además, una o más hemicelulasas .
16. La composición de conformidad con la reivindicación 15, caracterizada porque la o las hemicelulasas se seleccionan de xilanasas, ß-xilosidasas o L-OÍ-arabinofuranosidasas .
17. La composición de conformidad con cualquiera de las reivindicaciones 12-16, caracterizada porque la ß-glucosidasa está presente en una cantidad de 1 % en peso a 75 % en peso, con relación a la cantidad total de proteínas en la composición.
18. La composición de conformidad con cualquiera de las reivindicaciones 12-17, caracterizada porque es una mezcla de cultivo o un caldo de fermentación.
19. La composición de conformidad con la reivindicación 18, caracterizada porque es una formulación de caldo entero.
20. Un polinucleótido aislado caracterizado porque: a) comprende una secuencia de nucleótidos que tiene por lo menos 70 % de identidad de secuencias con la sec . con núm. de ident . : 83 ; o b) comprende una secuencia de nucleótidos que tiene la capacidad de hibridizarse en la sec. con núm. de ident. : 83 o en un complemento de esta en condiciones de rigurosidad alta; o c) codifica un polipéptido aislado que tiene actividad de ß-glucosidasas , que comprende una secuencia de aminoácidos que tiene por lo menos 70 % de identidad con la sec. con núm. de ident. : 135; o un polipéptido aislado que tiene actividad de ß-glucosidasas, que comprende una secuencia N-terminal y una secuencia C-terminal, en donde la secuencia N-terminal comprende una primera secuencia de aminoácidos derivados de una primera ß-glucosidasa, tiene por lo menos 200 residuos de longitud y comprende una o más o todas las sec. con núms . de ident. : 164-169 y en donde la secuencia C-terminal comprende una segunda secuencia de aminoácidos derivados de una segunda ß-glucosidasa, tiene por lo menos 50 residuos de longitud y comprende la sec. con núm. de ident.:170.
21. El polinucleótido aislado de conformidad con la reivindicación 20, caracterizado porque comprende una secuencia de nucleótidos que tiene por lo menos 90 % de identidad con la sec. con núm. de ident.:83.
22. Un vector caracterizado porque comprende el polinucleótido de conformidad con la reivindicación 20 ó 21.
23. Una célula huésped recombinante modificada para expresar el polinucleótido de conformidad con la reivindicación 20 ó 21.
2 . La célula huésped recombinante de conformidad con la reivindicación 23, caracterizada porque es una célula bacteriana o fúngica.
25. La célula huésped recombinante de conformidad con la reivindicación 24, caracterizada porque se selecciona de una célula de Bacillus o de E. coli.
26. La célula huésped recombinante de conformidad con la reivindicación 24, caracterizada porque se selecciona de una célula de Trichoderma, Aspergillus, Chrysosporium o de levadura .
27. Una composición de caldo de fermentación o de mezcla de cultivo preparada al fermentar la célula huésped recombinante de conformidad con cualquiera de las reivindicaciones 23-26.
28. Un método para hidrolizar un material celulósico de biomasa; caracterizado porque comprende poner el material de biomasa en contacto con el polipéptido de conformidad con cualquiera de las reivindicaciones 1-11, o con la composición de conformidad con cualquiera de las reivindicaciones 12-19, o con una composición de caldo de fermentación o mezcla de cultivo de conformidad con la reivindicación 27.
29. El método de conformidad con la reivindicación 28, caracterizado porque el material de biomasa se selecciona de semillas, granos, tubérculos, residuos de plantas o subproductos de procesamiento de alimentos o procesamiento industrial, tallos, mazorcas de maíz, rastrojo, hojas, hierbas, cañas perennes, madera, papel, pulpa y papel reciclado, bagazo de papa, soja, cebada, centeno, avena, trigo, remolacha y caña de azúcar.
30. El método de conformidad con la reivindicación 28 ó 29, caracterizado porque el material de biomasa se somete a tratamiento previo.
31. El método de conformidad con la reivindicación 30, caracterizado porque el tratamiento previo comprende un tratamiento previo acídico o un tratamiento previo básico, o una combinación de ambos.
32. Un método para aplicar el polipéptido de conformidad con cualquiera de las reivindicaciones 1-11, o la composición de conformidad con cualquiera de las reivindicaciones 12-19, o la composición de caldo de fermentación o de mezcla de cultivo de coformidad con la reivindicación 27, o el método para hidrólisis de cualquiera de coformidad con las reivindicaciones 28-31, en un entorno comercial o industrial, caracterizado porque sigue una estrategia modelo de suministro de enzimas comerciales o una estrategia modelo de biorrefinería de planta.
MX2013010509A 2011-03-17 2012-03-16 Composiciones de celulasa y sus metodos de uso para mejorar la conversions de biomasa lignocelulosica en azucares. MX2013010509A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161453918P 2011-03-17 2011-03-17
PCT/US2012/029498 WO2012125951A1 (en) 2011-03-17 2012-03-16 Cellulase compositions and methods of using the same for improved conversion of lignocellulosic biomass into fermentable sugars

Publications (1)

Publication Number Publication Date
MX2013010509A true MX2013010509A (es) 2013-10-17

Family

ID=45888505

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2013010509A MX2013010509A (es) 2011-03-17 2012-03-16 Composiciones de celulasa y sus metodos de uso para mejorar la conversions de biomasa lignocelulosica en azucares.

Country Status (13)

Country Link
US (2) US20140073017A1 (es)
EP (1) EP2686427A1 (es)
JP (1) JP6148183B2 (es)
KR (1) KR20140023313A (es)
CN (2) CN109371002A (es)
AU (1) AU2012228968B2 (es)
BR (1) BR112013023715A2 (es)
CA (1) CA2829918A1 (es)
MX (1) MX2013010509A (es)
RU (1) RU2013146341A (es)
SG (1) SG192097A1 (es)
WO (1) WO2012125951A1 (es)
ZA (1) ZA201305532B (es)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2012003091A (es) 2009-09-23 2012-04-30 Danisco Us Inc Enzimas de glicosil hidrolasa novedosas y usos de las mismas.
CN107287250A (zh) 2009-12-23 2017-10-24 丹尼斯科美国公司 提高同步糖化发酵反应效率的方法
US8980050B2 (en) 2012-08-20 2015-03-17 Celanese International Corporation Methods for removing hemicellulose
SG192098A1 (en) 2011-03-17 2013-08-30 Danisco Us Inc Method for reducing viscosity in saccharification process
EP2914717A1 (en) * 2012-10-31 2015-09-09 Danisco US Inc. Beta-glucosidase from magnaporthe grisea
BR112015012968A2 (pt) 2012-12-07 2017-09-12 Danisco Us Inc composições e métodos de uso
US10059932B2 (en) * 2013-03-15 2018-08-28 Nagaoka University Of Technology Mutant of cellulase-producing microorganism, production method of cellulase and production method of cello-oligosaccharide
WO2015017256A1 (en) 2013-07-29 2015-02-05 Danisco Us Inc. Variant enzymes
FR3014903B1 (fr) * 2013-12-17 2017-12-01 Ifp Energies Now Procede d'hydrolyse enzymatique avec production in situ de glycosides hydrolases par des microorganismes genetiquement modifies (mgm) et non mgm
TW201527756A (zh) * 2014-01-10 2015-07-16 Nat Univ Tsing Hua 提供食品安全地圖之方法、電腦程式產品、和系統
JP6465470B2 (ja) * 2014-01-22 2019-02-06 本田技研工業株式会社 糖化酵素の生産方法、及び草木類バイオマスの糖化処理方法
JP6398116B2 (ja) * 2014-01-22 2018-10-03 本田技研工業株式会社 糖化酵素の生産方法、及び草木類バイオマスの糖化処理方法
JP6398115B2 (ja) * 2014-01-22 2018-10-03 本田技研工業株式会社 糖化酵素の生産方法、及び草木類バイオマスの糖化処理方法
AP2016009640A0 (en) * 2014-08-08 2016-12-31 Xyleco Inc Aglycosylated enzyme and uses thereof
MX2017016625A (es) 2015-07-07 2018-05-15 Danisco Us Inc Induccion de la expresion genica usando una mezcla de azucar de alta concentracion.
EP3419992B1 (en) 2016-02-22 2020-11-18 Danisco US Inc. Fungal high-level protein production system
JP6959259B2 (ja) * 2016-04-29 2021-11-02 ノボザイムス アクティーゼルスカブ 洗剤組成物およびその使用
WO2018053058A1 (en) 2016-09-14 2018-03-22 Danisco Us Inc. Lignocellulosic biomass fermentation-based processes
KR102593668B1 (ko) 2016-10-04 2023-10-24 다니스코 유에스 인크. 유도 기질 부재 하의 사상 진균 세포에서의 단백질 생산
US20190330577A1 (en) 2016-12-21 2019-10-31 Dupont Nutrition Biosciences Aps Methods of using thermostable serine proteases
DK3375884T3 (da) * 2017-03-15 2020-07-27 Clariant Int Ltd Fremgangsmåde til fremstilling af proteiner under inducerende betingelser
WO2019074828A1 (en) 2017-10-09 2019-04-18 Danisco Us Inc CELLOBIOSE DEHYDROGENASE VARIANTS AND METHODS OF USE
CN114555778A (zh) * 2019-08-29 2022-05-27 丹尼斯科美国公司 在酵母中表达β-葡糖苷酶以提高乙醇生产
CN115125152A (zh) * 2022-03-28 2022-09-30 湖南科技学院 一种降解木质纤维素的混合菌、混合酶和降解方法

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5366558A (en) 1979-03-23 1994-11-22 Brink David L Method of treating biomass material
DK494089D0 (es) * 1989-10-06 1989-10-06 Novo Nordisk As
ES2182818T5 (es) 1990-12-10 2015-07-06 Danisco Us Inc. Sacarificación mejorada de celulosa por clonación y amplificación del gen de beta-glucosidasa de Trichoderma reesei
US5405769A (en) 1993-04-08 1995-04-11 National Research Council Of Canada Construction of thermostable mutants of a low molecular mass xylanase
US5705369A (en) 1994-12-27 1998-01-06 Midwest Research Institute Prehydrolysis of lignocellulose
US5811381A (en) 1996-10-10 1998-09-22 Mark A. Emalfarb Cellulase compositions and methods of use
KR100618495B1 (ko) 1998-10-06 2006-08-31 마크 아론 에말파브 섬유상의 진균성 숙주 영역에서의 형질전환 시스템:크리소스포륨속에서
US6409841B1 (en) 1999-11-02 2002-06-25 Waste Energy Integrated Systems, Llc. Process for the production of organic products from diverse biomass sources
US6423145B1 (en) 2000-08-09 2002-07-23 Midwest Research Institute Dilute acid/metal salt hydrolysis of lignocellulosics
WO2002095014A2 (en) 2001-05-18 2002-11-28 Novozymes A/S Polypeptides having cellobiase activity and polynucleotides encoding same
US6982159B2 (en) * 2001-09-21 2006-01-03 Genencor International, Inc. Trichoderma β-glucosidase
US7045332B2 (en) 2001-12-18 2006-05-16 Genencor International, Inc. BGL4 β-glucosidase and nucleic acids encoding the same
US7005289B2 (en) 2001-12-18 2006-02-28 Genencor International, Inc. BGL5 β-glucosidase and nucleic acids encoding the same
MXPA05003382A (es) 2002-10-04 2005-06-22 Du Pont Proceso para la produccion biologica de 1,3-propanodiol con alto rendimiento.
WO2004043980A2 (en) 2002-11-07 2004-05-27 Genencor International, Inc. Bgl6 beta-glucosidase and nucleic acids encoding the same
US7449550B2 (en) 2003-02-27 2008-11-11 Alliance For Sustainable Energy, Llc Superactive cellulase formulation using cellobiohydrolase-1 from Penicillium funiculosum
US20040231060A1 (en) 2003-03-07 2004-11-25 Athenix Corporation Methods to enhance the activity of lignocellulose-degrading enzymes
US7459299B2 (en) 2003-04-01 2008-12-02 Danisco A/S, Genencor Division Variant Humicola grisea CBH1.1
EP1862540B1 (en) 2003-05-29 2011-09-14 Genencor International, Inc. Novel trichoderma genes
CA2567570C (en) 2004-05-27 2014-07-08 Genencor International, Inc. Aspergillus kawachi acid-stable alpha amylase and applications in granular starch hydrolysis
EP1869197A2 (en) 2005-04-12 2007-12-26 E.I. Dupont De Nemours And Company Treatment of biomass to obtain ethanol
US7781191B2 (en) 2005-04-12 2010-08-24 E. I. Du Pont De Nemours And Company Treatment of biomass to obtain a target chemical
EP2420570B1 (en) * 2006-02-10 2013-12-04 Verenium Corporation Arabinofuranosidase enzymes, nucleic acids encoding them and methods for making and using them
US9512448B2 (en) * 2007-05-09 2016-12-06 Stellenbosch University Method for enhancing cellobiose utilization
DK2152892T3 (da) 2007-05-21 2013-07-22 Danisco Us Inc Genencor Div Fremgangsmåde til indføring af nukleinsyrer i fungale celler
US9969993B2 (en) * 2007-05-31 2018-05-15 Novozymes, Inc. Filamentous fungal host cells and methods of recombinantly producing proteins
US20100233780A1 (en) * 2007-06-06 2010-09-16 Wolfgang Aehle Methods for Improving Protein Properties
MX2010002474A (es) * 2007-09-07 2010-03-29 Danisco Us Inc Composiciones de celulasa completa fungica filamentosa mejoradas de beta-glucosidasa y metodos de uso.
EP2225372A2 (en) * 2007-12-05 2010-09-08 Novozymes A/S Polypeptides having endoglucanase activity and polynucleotides encoding same
SG191671A1 (en) 2007-12-13 2013-07-31 Danisco Us Inc Cultured cells that produce isoprene and methods for producing isoprene
CA2716806A1 (en) * 2008-02-29 2009-09-03 University Of Central Florida Research Foundation, Inc. Production and use of plant degrading materials
WO2010148148A2 (en) * 2009-06-16 2010-12-23 Codexis, Inc. β-GLUCOSIDASE VARIANTS
JP5641478B2 (ja) * 2010-07-18 2014-12-17 独立行政法人国際農林水産業研究センター 酵素の再利用方法
WO2013028701A1 (en) * 2011-08-22 2013-02-28 Codexis, Inc. Gh61 glycoside hydrolase protein variants and cofactors that enhance gh61 activity
BR112014007651A2 (pt) * 2011-09-30 2017-04-11 Novozymes Inc polipeptídeo quimérico isolado, polinucleotídeo isolado, métodos para produzir um polipeptídeo quimérico e um produto de fermentação, para degradar ou converter um material celulósico, e para fermentar um material celulósico, planta, parte de planta ou célula de planta transgênica, e, formulação de caldo inteiro ou composição de cultura de células
JP2015533293A (ja) * 2012-10-31 2015-11-24 ダニスコ・ユーエス・インク 組成物及び使用方法

Also Published As

Publication number Publication date
BR112013023715A2 (pt) 2016-09-13
CN109371002A (zh) 2019-02-22
CA2829918A1 (en) 2012-09-20
ZA201305532B (en) 2014-10-29
SG192097A1 (en) 2013-08-30
KR20140023313A (ko) 2014-02-26
WO2012125951A1 (en) 2012-09-20
JP6148183B2 (ja) 2017-06-21
RU2013146341A (ru) 2015-04-27
AU2012228968B2 (en) 2017-05-18
EP2686427A1 (en) 2014-01-22
CN103492561A (zh) 2014-01-01
JP2014509858A (ja) 2014-04-24
US20140073017A1 (en) 2014-03-13
US20180119125A1 (en) 2018-05-03

Similar Documents

Publication Publication Date Title
AU2012228968B2 (en) Cellulase compositions and methods of using the same for improved conversion of lignocellulosic biomass into fermentable sugars
US20190249160A1 (en) Method for reducing viscosity in saccharification process
AU2012229042B2 (en) Glycosyl hydrolase enzymes and uses thereof for biomass hydrolysis
AU2012228968A1 (en) Cellulase compositions and methods of using the same for improved conversion of lignocellulosic biomass into fermentable sugars
EP3296394B1 (en) Novel glycosyl hydrolase enzymes and uses thereof
AU2012229042A1 (en) Glycosyl hydrolase enzymes and uses thereof for biomass hydrolysis
AU2016203478A1 (en) Method for reducing viscosity in saccharification process
AU2012229030A1 (en) Method for reducing viscosity in saccharification process