CN102666848B - 用于从纤维素生物质产生可发酵的糖的重组嗜热子囊菌β-葡糖苷酶变体 - Google Patents
用于从纤维素生物质产生可发酵的糖的重组嗜热子囊菌β-葡糖苷酶变体 Download PDFInfo
- Publication number
- CN102666848B CN102666848B CN201080051889.6A CN201080051889A CN102666848B CN 102666848 B CN102666848 B CN 102666848B CN 201080051889 A CN201080051889 A CN 201080051889A CN 102666848 B CN102666848 B CN 102666848B
- Authority
- CN
- China
- Prior art keywords
- beta
- glucosidase enzyme
- sequence
- glucosidase
- variant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 102000006995 beta-Glucosidase Human genes 0.000 title claims abstract description 300
- 108010047754 beta-Glucosidase Proteins 0.000 title claims abstract description 300
- 239000002028 Biomass Substances 0.000 title claims abstract description 47
- 235000000346 sugar Nutrition 0.000 title claims abstract description 41
- 238000004519 manufacturing process Methods 0.000 title abstract description 3
- 150000008163 sugars Chemical class 0.000 title abstract 2
- 241000228182 Thermoascus aurantiacus Species 0.000 title description 2
- 238000000034 method Methods 0.000 claims abstract description 99
- 239000000203 mixture Substances 0.000 claims abstract description 56
- 230000000694 effects Effects 0.000 claims description 81
- 102000004190 Enzymes Human genes 0.000 claims description 64
- 108090000790 Enzymes Proteins 0.000 claims description 64
- 229940088598 enzyme Drugs 0.000 claims description 64
- 239000002157 polynucleotide Substances 0.000 claims description 62
- 102000040430 polynucleotide Human genes 0.000 claims description 61
- 108091033319 polynucleotide Proteins 0.000 claims description 61
- 235000001014 amino acid Nutrition 0.000 claims description 60
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 56
- 150000001413 amino acids Chemical class 0.000 claims description 45
- 239000011159 matrix material Substances 0.000 claims description 43
- 239000008103 glucose Substances 0.000 claims description 40
- 108010059892 Cellulase Proteins 0.000 claims description 38
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims description 38
- 229940106157 cellulase Drugs 0.000 claims description 27
- 239000013604 expression vector Substances 0.000 claims description 27
- 238000006243 chemical reaction Methods 0.000 claims description 21
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 claims description 3
- 230000014509 gene expression Effects 0.000 abstract description 38
- 108090000765 processed proteins & peptides Proteins 0.000 description 165
- 229920001184 polypeptide Polymers 0.000 description 153
- 102000004196 processed proteins & peptides Human genes 0.000 description 153
- 210000004027 cell Anatomy 0.000 description 145
- 241000235349 Ascomycota Species 0.000 description 70
- 108090000623 proteins and genes Proteins 0.000 description 57
- 101001047514 Bos taurus Lethal(2) giant larvae protein homolog 1 Proteins 0.000 description 45
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 45
- 229940024606 amino acid Drugs 0.000 description 44
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 43
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 36
- 239000001913 cellulose Substances 0.000 description 30
- 229920002678 cellulose Polymers 0.000 description 30
- 102000004169 proteins and genes Human genes 0.000 description 30
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 27
- 108020004705 Codon Proteins 0.000 description 26
- 125000000539 amino acid group Chemical group 0.000 description 26
- 230000002538 fungal effect Effects 0.000 description 26
- 150000007523 nucleic acids Chemical class 0.000 description 26
- 235000018102 proteins Nutrition 0.000 description 26
- 108010076504 Protein Sorting Signals Proteins 0.000 description 25
- 230000001580 bacterial effect Effects 0.000 description 24
- 102000039446 nucleic acids Human genes 0.000 description 24
- 108020004707 nucleic acids Proteins 0.000 description 24
- 238000000855 fermentation Methods 0.000 description 23
- 230000004151 fermentation Effects 0.000 description 23
- 239000002773 nucleotide Substances 0.000 description 22
- 125000003729 nucleotide group Chemical group 0.000 description 22
- 241000894006 Bacteria Species 0.000 description 20
- 230000008034 disappearance Effects 0.000 description 19
- 230000008859 change Effects 0.000 description 17
- 108020004414 DNA Proteins 0.000 description 15
- 230000004048 modification Effects 0.000 description 15
- 238000012986 modification Methods 0.000 description 15
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 14
- 241000223259 Trichoderma Species 0.000 description 14
- 230000004927 fusion Effects 0.000 description 14
- 239000000463 material Substances 0.000 description 14
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 13
- 241000233866 Fungi Species 0.000 description 13
- 125000003412 L-alanyl group Chemical group [H]N([H])[C@@](C([H])([H])[H])(C(=O)[*])[H] 0.000 description 13
- 230000007062 hydrolysis Effects 0.000 description 13
- 238000006460 hydrolysis reaction Methods 0.000 description 13
- 239000000243 solution Substances 0.000 description 13
- 239000000758 substrate Substances 0.000 description 13
- -1 β-L-arabinose glycosides Chemical class 0.000 description 13
- IFBHRQDFSNCLOZ-UHFFFAOYSA-N 2-(hydroxymethyl)-6-(4-nitrophenoxy)oxane-3,4,5-triol Chemical compound OC1C(O)C(O)C(CO)OC1OC1=CC=C([N+]([O-])=O)C=C1 IFBHRQDFSNCLOZ-UHFFFAOYSA-N 0.000 description 12
- 241000589516 Pseudomonas Species 0.000 description 12
- 239000013592 cell lysate Substances 0.000 description 12
- 238000000926 separation method Methods 0.000 description 12
- 241000193830 Bacillus <bacterium> Species 0.000 description 11
- 241000235648 Pichia Species 0.000 description 11
- 241000499912 Trichoderma reesei Species 0.000 description 11
- 239000003795 chemical substances by application Substances 0.000 description 11
- 230000000295 complement effect Effects 0.000 description 11
- 239000002609 medium Substances 0.000 description 11
- 239000000047 product Substances 0.000 description 11
- 241000588698 Erwinia Species 0.000 description 10
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 10
- 108091028043 Nucleic acid sequence Proteins 0.000 description 10
- 241000186063 Arthrobacter Species 0.000 description 9
- 241000228245 Aspergillus niger Species 0.000 description 9
- 239000002253 acid Substances 0.000 description 9
- 239000003153 chemical reaction reagent Substances 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- 239000012634 fragment Substances 0.000 description 9
- 230000006872 improvement Effects 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 230000028327 secretion Effects 0.000 description 9
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 8
- 102000035195 Peptidases Human genes 0.000 description 8
- 108091005804 Peptidases Proteins 0.000 description 8
- 210000004899 c-terminal region Anatomy 0.000 description 8
- 239000000835 fiber Substances 0.000 description 8
- 238000004128 high performance liquid chromatography Methods 0.000 description 8
- 238000009396 hybridization Methods 0.000 description 8
- 239000013612 plasmid Substances 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 230000001131 transforming effect Effects 0.000 description 8
- 240000006439 Aspergillus oryzae Species 0.000 description 7
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 7
- 241000194108 Bacillus licheniformis Species 0.000 description 7
- 102000005575 Cellulases Human genes 0.000 description 7
- 108010084185 Cellulases Proteins 0.000 description 7
- 108091026890 Coding region Proteins 0.000 description 7
- 239000013543 active substance Substances 0.000 description 7
- 239000006143 cell culture medium Substances 0.000 description 7
- 229930182817 methionine Natural products 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 6
- 241000228212 Aspergillus Species 0.000 description 6
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 6
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 6
- 241000223218 Fusarium Species 0.000 description 6
- 241000223198 Humicola Species 0.000 description 6
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 6
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 6
- 241000221960 Neurospora Species 0.000 description 6
- 241000190932 Rhodopseudomonas Species 0.000 description 6
- 241000223258 Thermomyces lanuginosus Species 0.000 description 6
- 108090000637 alpha-Amylases Proteins 0.000 description 6
- 238000012239 gene modification Methods 0.000 description 6
- 230000005017 genetic modification Effects 0.000 description 6
- 235000013617 genetically modified food Nutrition 0.000 description 6
- 244000005700 microbiome Species 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 238000012797 qualification Methods 0.000 description 6
- 241000186216 Corynebacterium Species 0.000 description 5
- 101710112457 Exoglucanase Proteins 0.000 description 5
- 241000605909 Fusobacterium Species 0.000 description 5
- 102220475366 Iduronate 2-sulfatase_S87N_mutation Human genes 0.000 description 5
- 102220575132 Leucine-rich repeat transmembrane protein FLRT1_S86N_mutation Human genes 0.000 description 5
- 241000187747 Streptomyces Species 0.000 description 5
- 150000007513 acids Chemical class 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 230000004071 biological effect Effects 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 102220346405 c.164A>G Human genes 0.000 description 5
- 239000007795 chemical reaction product Substances 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 150000002016 disaccharides Chemical class 0.000 description 5
- 230000000968 intestinal effect Effects 0.000 description 5
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 5
- 238000002703 mutagenesis Methods 0.000 description 5
- 231100000350 mutagenesis Toxicity 0.000 description 5
- 238000003752 polymerase chain reaction Methods 0.000 description 5
- 238000002203 pretreatment Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 241000589158 Agrobacterium Species 0.000 description 4
- 241001513093 Aspergillus awamori Species 0.000 description 4
- 241000194107 Bacillus megaterium Species 0.000 description 4
- 241000123346 Chrysosporium Species 0.000 description 4
- 241001674013 Chrysosporium lucknowense Species 0.000 description 4
- 108700010070 Codon Usage Proteins 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 229920002307 Dextran Polymers 0.000 description 4
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 4
- 241000588722 Escherichia Species 0.000 description 4
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 4
- MHAJPDPJQMAIIY-UHFFFAOYSA-N Hydrogen peroxide Chemical compound OO MHAJPDPJQMAIIY-UHFFFAOYSA-N 0.000 description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 4
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 4
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 4
- 241000235395 Mucor Species 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- 241000228143 Penicillium Species 0.000 description 4
- 108700008625 Reporter Genes Proteins 0.000 description 4
- 241000187561 Rhodococcus erythropolis Species 0.000 description 4
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 4
- 239000004141 Sodium laurylsulphate Substances 0.000 description 4
- 241000194017 Streptococcus Species 0.000 description 4
- 241000187432 Streptomyces coelicolor Species 0.000 description 4
- 241001655322 Streptomycetales Species 0.000 description 4
- 241001149964 Tolypocladium Species 0.000 description 4
- 241000222354 Trametes Species 0.000 description 4
- 241000588901 Zymomonas Species 0.000 description 4
- 230000000735 allogeneic effect Effects 0.000 description 4
- 102000004139 alpha-Amylases Human genes 0.000 description 4
- 229940024171 alpha-amylase Drugs 0.000 description 4
- 102220415795 c.161A>G Human genes 0.000 description 4
- 238000006555 catalytic reaction Methods 0.000 description 4
- 238000007599 discharging Methods 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 230000003087 glucogenic effect Effects 0.000 description 4
- 230000035800 maturation Effects 0.000 description 4
- 229910052757 nitrogen Inorganic materials 0.000 description 4
- 210000001236 prokaryotic cell Anatomy 0.000 description 4
- 239000011541 reaction mixture Substances 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000001632 sodium acetate Substances 0.000 description 4
- 235000017281 sodium acetate Nutrition 0.000 description 4
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 4
- 239000002904 solvent Substances 0.000 description 4
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 3
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- 241000589291 Acinetobacter Species 0.000 description 3
- 239000004382 Amylase Substances 0.000 description 3
- 108010065511 Amylases Proteins 0.000 description 3
- 102000013142 Amylases Human genes 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 241000351920 Aspergillus nidulans Species 0.000 description 3
- 241001112741 Bacillaceae Species 0.000 description 3
- 241001328122 Bacillus clausii Species 0.000 description 3
- 241000194103 Bacillus pumilus Species 0.000 description 3
- 235000014469 Bacillus subtilis Nutrition 0.000 description 3
- 241000186000 Bifidobacterium Species 0.000 description 3
- 241001453698 Buchnera <proteobacteria> Species 0.000 description 3
- 244000025254 Cannabis sativa Species 0.000 description 3
- 241000193403 Clostridium Species 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 101000925662 Enterobacteria phage PRD1 Endolysin Proteins 0.000 description 3
- 241000194033 Enterococcus Species 0.000 description 3
- 241000589565 Flavobacterium Species 0.000 description 3
- 241000626621 Geobacillus Species 0.000 description 3
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 3
- 102100022624 Glucoamylase Human genes 0.000 description 3
- 102000005720 Glutathione transferase Human genes 0.000 description 3
- 108010070675 Glutathione transferase Proteins 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 101710154606 Hemagglutinin Proteins 0.000 description 3
- 241001480714 Humicola insolens Species 0.000 description 3
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 3
- 241000235058 Komagataella pastoris Species 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- 125000000769 L-threonyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](O[H])(C([H])([H])[H])[H] 0.000 description 3
- 241000186660 Lactobacillus Species 0.000 description 3
- 241000194036 Lactococcus Species 0.000 description 3
- 239000001698 Lecitin citrate Substances 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 3
- 240000007594 Oryza sativa Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 3
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 3
- 241000588912 Pantoea agglomerans Species 0.000 description 3
- 241000192608 Phormidium Species 0.000 description 3
- 101710176177 Protein A56 Proteins 0.000 description 3
- 241000235403 Rhizomucor miehei Species 0.000 description 3
- 241000235527 Rhizopus Species 0.000 description 3
- 241000607142 Salmonella Species 0.000 description 3
- 241000191940 Staphylococcus Species 0.000 description 3
- 229920002472 Starch Polymers 0.000 description 3
- 241000192707 Synechococcus Species 0.000 description 3
- 241001494489 Thielavia Species 0.000 description 3
- 239000006035 Tryptophane Substances 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- LPQOADBMXVRBNX-UHFFFAOYSA-N ac1ldcw0 Chemical compound Cl.C1CN(C)CCN1C1=C(F)C=C2C(=O)C(C(O)=O)=CN3CCSC1=C32 LPQOADBMXVRBNX-UHFFFAOYSA-N 0.000 description 3
- 125000003342 alkenyl group Chemical group 0.000 description 3
- 125000000217 alkyl group Chemical group 0.000 description 3
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 3
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 3
- 235000011130 ammonium sulphate Nutrition 0.000 description 3
- 235000019418 amylase Nutrition 0.000 description 3
- 239000003945 anionic surfactant Substances 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 150000001720 carbohydrates Chemical class 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 235000013339 cereals Nutrition 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 229960002989 glutamic acid Drugs 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 229940039696 lactobacillus Drugs 0.000 description 3
- 125000005647 linker group Chemical group 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 239000004337 magnesium citrate Substances 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Natural products C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 3
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 235000016709 nutrition Nutrition 0.000 description 3
- 239000002953 phosphate buffered saline Substances 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000035484 reaction time Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000009991 scouring Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 239000012064 sodium phosphate buffer Substances 0.000 description 3
- 239000008107 starch Substances 0.000 description 3
- 235000019698 starch Nutrition 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 229960004799 tryptophan Drugs 0.000 description 3
- 235000013311 vegetables Nutrition 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- NWXMGUDVXFXRIG-WESIUVDSSA-N (4s,4as,5as,6s,12ar)-4-(dimethylamino)-1,6,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4,4a,5,5a-tetrahydrotetracene-2-carboxamide Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(=O)C(C(N)=O)=C(O)[C@@]4(O)C(=O)C3=C(O)C2=C1O NWXMGUDVXFXRIG-WESIUVDSSA-N 0.000 description 2
- FJKROLUGYXJWQN-UHFFFAOYSA-N 4-hydroxybenzoic acid Chemical compound OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 2
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- 102000002659 Amyloid Precursor Protein Secretases Human genes 0.000 description 2
- 108010043324 Amyloid Precursor Protein Secretases Proteins 0.000 description 2
- 241000185996 Arthrobacter citreus Species 0.000 description 2
- 241000228215 Aspergillus aculeatus Species 0.000 description 2
- 241001480052 Aspergillus japonicus Species 0.000 description 2
- 241000131386 Aspergillus sojae Species 0.000 description 2
- 241000223651 Aureobasidium Species 0.000 description 2
- 241000589151 Azotobacter Species 0.000 description 2
- 241000193738 Bacillus anthracis Species 0.000 description 2
- 241000193752 Bacillus circulans Species 0.000 description 2
- 241000193749 Bacillus coagulans Species 0.000 description 2
- 241000193747 Bacillus firmus Species 0.000 description 2
- 241000193422 Bacillus lentus Species 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 241000193388 Bacillus thuringiensis Species 0.000 description 2
- 241000221198 Basidiomycota Species 0.000 description 2
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 2
- 241000193764 Brevibacillus brevis Species 0.000 description 2
- 241000186146 Brevibacterium Species 0.000 description 2
- 241000605902 Butyrivibrio Species 0.000 description 2
- 229920000018 Callose Polymers 0.000 description 2
- 241000589876 Campylobacter Species 0.000 description 2
- 241000222122 Candida albicans Species 0.000 description 2
- 241001619326 Cephalosporium Species 0.000 description 2
- 241000195585 Chlamydomonas Species 0.000 description 2
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 2
- 241000190831 Chromatium Species 0.000 description 2
- 241000193401 Clostridium acetobutylicum Species 0.000 description 2
- 241000193468 Clostridium perfringens Species 0.000 description 2
- 241000193449 Clostridium tetani Species 0.000 description 2
- 241000228437 Cochliobolus Species 0.000 description 2
- 102000004405 Collectins Human genes 0.000 description 2
- 108090000909 Collectins Proteins 0.000 description 2
- 241000222511 Coprinus Species 0.000 description 2
- 241000222356 Coriolus Species 0.000 description 2
- 241001252397 Corynascus Species 0.000 description 2
- 241000186226 Corynebacterium glutamicum Species 0.000 description 2
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 2
- 241000192700 Cyanobacteria Species 0.000 description 2
- 241000935926 Diplodia Species 0.000 description 2
- 241000588914 Enterobacter Species 0.000 description 2
- 108010013369 Enteropeptidase Proteins 0.000 description 2
- 102100029727 Enteropeptidase Human genes 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 108091060211 Expressed sequence tag Proteins 0.000 description 2
- 241000567163 Fusarium cerealis Species 0.000 description 2
- 241000223195 Fusarium graminearum Species 0.000 description 2
- 241000223221 Fusarium oxysporum Species 0.000 description 2
- 101150108358 GLAA gene Proteins 0.000 description 2
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 2
- 101100369308 Geobacillus stearothermophilus nprS gene Proteins 0.000 description 2
- 241000896533 Gliocladium Species 0.000 description 2
- 239000004366 Glucose oxidase Substances 0.000 description 2
- 108010015776 Glucose oxidase Proteins 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 241000606790 Haemophilus Species 0.000 description 2
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 2
- 102000004157 Hydrolases Human genes 0.000 description 2
- 108090000604 Hydrolases Proteins 0.000 description 2
- 101150045458 KEX2 gene Proteins 0.000 description 2
- 241000186984 Kitasatospora aureofaciens Species 0.000 description 2
- 241000588748 Klebsiella Species 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- 125000001176 L-lysyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C([H])([H])C([H])([H])C(N([H])[H])([H])[H] 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 125000003798 L-tyrosyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C1=C([H])C([H])=C(O[H])C([H])=C1[H] 0.000 description 2
- 125000003580 L-valyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(C([H])([H])[H])(C([H])([H])[H])[H] 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 241001467578 Microbacterium Species 0.000 description 2
- 241000192041 Micrococcus Species 0.000 description 2
- 241000226677 Myceliophthora Species 0.000 description 2
- 241000186359 Mycobacterium Species 0.000 description 2
- 241000588653 Neisseria Species 0.000 description 2
- 241000320412 Ogataea angusta Species 0.000 description 2
- 241001452677 Ogataea methanolica Species 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 241000233654 Oomycetes Species 0.000 description 2
- 241000194109 Paenibacillus lautus Species 0.000 description 2
- 241000588696 Pantoea ananatis Species 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000235062 Pichia membranifaciens Species 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 241000589540 Pseudomonas fluorescens Species 0.000 description 2
- 241000589776 Pseudomonas putida Species 0.000 description 2
- 229920001131 Pulp (paper) Polymers 0.000 description 2
- 241000231139 Pyricularia Species 0.000 description 2
- 241000235402 Rhizomucor Species 0.000 description 2
- 240000005384 Rhizopus oryzae Species 0.000 description 2
- 241000190967 Rhodospirillum Species 0.000 description 2
- 241000186567 Romboutsia lituseburensis Species 0.000 description 2
- 241000193448 Ruminiclostridium thermocellum Species 0.000 description 2
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 2
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 2
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 2
- 241001123227 Saccharomyces pastorianus Species 0.000 description 2
- 241000195663 Scenedesmus Species 0.000 description 2
- 241000235060 Scheffersomyces stipitis Species 0.000 description 2
- 241000222480 Schizophyllum Species 0.000 description 2
- 241000235346 Schizosaccharomyces Species 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- 102000040739 Secretory proteins Human genes 0.000 description 2
- 108091058545 Secretory proteins Proteins 0.000 description 2
- 241000607720 Serratia Species 0.000 description 2
- 241000607768 Shigella Species 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- PXIPVTKHYLBLMZ-UHFFFAOYSA-N Sodium azide Chemical compound [Na+].[N-]=[N+]=[N-] PXIPVTKHYLBLMZ-UHFFFAOYSA-N 0.000 description 2
- 241001085826 Sporotrichum Species 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 241000194054 Streptococcus uberis Species 0.000 description 2
- 241000187392 Streptomyces griseus Species 0.000 description 2
- 229910004533 TaB2 Inorganic materials 0.000 description 2
- 241000228341 Talaromyces Species 0.000 description 2
- 241001540751 Talaromyces ruber Species 0.000 description 2
- 241001516650 Talaromyces verruculosus Species 0.000 description 2
- 241001495429 Thielavia terrestris Species 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000082085 Verticillium <Phyllachorales> Species 0.000 description 2
- 241001507667 Volvariella Species 0.000 description 2
- 241000589634 Xanthomonas Species 0.000 description 2
- 241000235015 Yarrowia lipolytica Species 0.000 description 2
- 241000607734 Yersinia <bacteria> Species 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 241000758405 Zoopagomycotina Species 0.000 description 2
- 241000588902 Zymomonas mobilis Species 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- SRBFZHDQGSBBOR-LECHCGJUSA-N alpha-D-xylose Chemical compound O[C@@H]1CO[C@H](O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-LECHCGJUSA-N 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229960003311 ampicillin trihydrate Drugs 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 101150100570 bglA gene Proteins 0.000 description 2
- 239000002551 biofuel Substances 0.000 description 2
- 229940098773 bovine serum albumin Drugs 0.000 description 2
- 229940095731 candida albicans Drugs 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 101150052795 cbh-1 gene Proteins 0.000 description 2
- 101150114858 cbh2 gene Proteins 0.000 description 2
- 238000005352 clarification Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 239000003636 conditioned culture medium Substances 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 230000004907 flux Effects 0.000 description 2
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 2
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 2
- 229940116332 glucose oxidase Drugs 0.000 description 2
- 235000019420 glucose oxidase Nutrition 0.000 description 2
- 229930182478 glucoside Natural products 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 230000012447 hatching Effects 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 102000057593 human F8 Human genes 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 239000011777 magnesium Substances 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 150000008300 phosphoramidites Chemical class 0.000 description 2
- 150000003016 phosphoric acids Chemical class 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- YPFDHNVEDLHUCE-UHFFFAOYSA-N propane-1,3-diol Chemical compound OCCCO YPFDHNVEDLHUCE-UHFFFAOYSA-N 0.000 description 2
- 229940047431 recombinate Drugs 0.000 description 2
- 230000008521 reorganization Effects 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 239000002002 slurry Substances 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000004575 stone Substances 0.000 description 2
- 239000010902 straw Substances 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 210000002268 wool Anatomy 0.000 description 2
- 229960003487 xylose Drugs 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- PUPZLCDOIYMWBV-UHFFFAOYSA-N (+/-)-1,3-Butanediol Chemical compound CC(O)CCO PUPZLCDOIYMWBV-UHFFFAOYSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 101150084750 1 gene Proteins 0.000 description 1
- LDVVTQMJQSCDMK-UHFFFAOYSA-N 1,3-dihydroxypropan-2-yl formate Chemical compound OCC(CO)OC=O LDVVTQMJQSCDMK-UHFFFAOYSA-N 0.000 description 1
- FFRBMBIXVSCUFS-UHFFFAOYSA-N 2,4-dinitro-1-naphthol Chemical compound C1=CC=C2C(O)=C([N+]([O-])=O)C=C([N+]([O-])=O)C2=C1 FFRBMBIXVSCUFS-UHFFFAOYSA-N 0.000 description 1
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical compound NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 description 1
- NLJVXZFCYKWXLH-DXTIXLATSA-N 3-[(3r,6s,9s,12s,15s,17s,20s,22r,25s,28s)-20-(2-amino-2-oxoethyl)-9-(3-aminopropyl)-3,22,25-tribenzyl-15-[(4-hydroxyphenyl)methyl]-6-(2-methylpropyl)-2,5,8,11,14,18,21,24,27-nonaoxo-12-propan-2-yl-1,4,7,10,13,16,19,23,26-nonazabicyclo[26.3.0]hentriacontan Chemical compound C([C@H]1C(=O)N[C@H](C(=O)N[C@@H](CCCN)C(=O)N[C@H](C(N[C@H](CC=2C=CC=CC=2)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@H](CC=2C=CC=CC=2)C(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)N1)=O)CC(C)C)C(C)C)C1=CC=C(O)C=C1 NLJVXZFCYKWXLH-DXTIXLATSA-N 0.000 description 1
- 229940090248 4-hydroxybenzoic acid Drugs 0.000 description 1
- 101150011812 AADAC gene Proteins 0.000 description 1
- 101150078509 ADH2 gene Proteins 0.000 description 1
- 101150026777 ADH5 gene Proteins 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 241001578974 Achlya <moth> Species 0.000 description 1
- 241001134629 Acidothermus Species 0.000 description 1
- 241001134630 Acidothermus cellulolyticus Species 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 244000198134 Agave sisalana Species 0.000 description 1
- 235000011624 Agave sisalana Nutrition 0.000 description 1
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 1
- 241001135511 Agrobacterium rubi Species 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 241001147780 Alicyclobacillus Species 0.000 description 1
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 1
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 1
- 241000609240 Ambelania acida Species 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 101150086876 Amy gene Proteins 0.000 description 1
- 241000192542 Anabaena Species 0.000 description 1
- 244000099147 Ananas comosus Species 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 241000726091 Aphanocladium album Species 0.000 description 1
- 101100453572 Arabidopsis thaliana KCO3 gene Proteins 0.000 description 1
- 241000186074 Arthrobacter globiformis Species 0.000 description 1
- 108010017640 Aspartic Acid Proteases Proteins 0.000 description 1
- 102000004580 Aspartic Acid Proteases Human genes 0.000 description 1
- 108091005502 Aspartic proteases Proteins 0.000 description 1
- 102000035101 Aspartic proteases Human genes 0.000 description 1
- 101100460671 Aspergillus flavus (strain ATCC 200026 / FGSC A1120 / IAM 13836 / NRRL 3357 / JCM 12722 / SRRC 167) norA gene Proteins 0.000 description 1
- 241000892910 Aspergillus foetidus Species 0.000 description 1
- 241001225321 Aspergillus fumigatus Species 0.000 description 1
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 1
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 1
- 241000228257 Aspergillus sp. Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 108090000145 Bacillolysin Proteins 0.000 description 1
- 241000006382 Bacillus halodurans Species 0.000 description 1
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 1
- 108010029675 Bacillus licheniformis alpha-amylase Proteins 0.000 description 1
- 241000151861 Barnettozyma salicaria Species 0.000 description 1
- 108091005658 Basic proteases Proteins 0.000 description 1
- KWIUHFFTVRNATP-UHFFFAOYSA-N Betaine Natural products C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 1
- 241001436672 Bhatia Species 0.000 description 1
- 241000222490 Bjerkandera Species 0.000 description 1
- 241001274890 Boeremia exigua Species 0.000 description 1
- 241000588807 Bordetella Species 0.000 description 1
- 241000208199 Buxus sempervirens Species 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 101000898643 Candida albicans Vacuolar aspartic protease Proteins 0.000 description 1
- 101000898783 Candida tropicalis Candidapepsin Proteins 0.000 description 1
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 1
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 241000146399 Ceriporiopsis Species 0.000 description 1
- 241001558164 Ceriporiopsis sp. Species 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 241000195628 Chlorophyta Species 0.000 description 1
- 241000985909 Chrysosporium keratinophilum Species 0.000 description 1
- 241001556045 Chrysosporium merdarium Species 0.000 description 1
- 241000123350 Chrysosporium sp. Species 0.000 description 1
- 241001674001 Chrysosporium tropicum Species 0.000 description 1
- 241000355696 Chrysosporium zonatum Species 0.000 description 1
- 235000005979 Citrus limon Nutrition 0.000 description 1
- 244000131522 Citrus pyriformis Species 0.000 description 1
- 241000193454 Clostridium beijerinckii Species 0.000 description 1
- 241000429427 Clostridium saccharobutylicum Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241001464948 Coprococcus Species 0.000 description 1
- 241001341504 Cortinarius inops Species 0.000 description 1
- 240000007582 Corylus avellana Species 0.000 description 1
- 241001517047 Corynebacterium acetoacidophilum Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000221755 Cryphonectria Species 0.000 description 1
- 101000898784 Cryphonectria parasitica Endothiapepsin Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 101100317179 Dictyostelium discoideum vps26 gene Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 101100085603 Drosophila melanogaster nclb gene Proteins 0.000 description 1
- 101150015836 ENO1 gene Proteins 0.000 description 1
- 241001063191 Elops affinis Species 0.000 description 1
- 101100407639 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) prtB gene Proteins 0.000 description 1
- 241001246273 Endothia Species 0.000 description 1
- 240000000664 Eriochloa polystachya Species 0.000 description 1
- 235000002756 Erythrina berteroana Nutrition 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 101710089384 Extracellular protease Proteins 0.000 description 1
- 241001608234 Faecalibacterium Species 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 241000145614 Fusarium bactridioides Species 0.000 description 1
- 241000223194 Fusarium culmorum Species 0.000 description 1
- 241000146406 Fusarium heterosporum Species 0.000 description 1
- 241000221779 Fusarium sambucinum Species 0.000 description 1
- 241001149959 Fusarium sp. Species 0.000 description 1
- 241000567178 Fusarium venenatum Species 0.000 description 1
- 101150094690 GAL1 gene Proteins 0.000 description 1
- 102100021736 Galectin-1 Human genes 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 1
- 229920001503 Glucan Polymers 0.000 description 1
- 241001401556 Glutamicibacter mysorens Species 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000223199 Humicola grisea Species 0.000 description 1
- 241001373560 Humicola sp. Species 0.000 description 1
- 101100232312 Hypocrea jecorina hfb1 gene Proteins 0.000 description 1
- 101100232315 Hypocrea jecorina hfb2 gene Proteins 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 241000411968 Ilyobacter Species 0.000 description 1
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 1
- 241000274177 Juniperus sabina Species 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- 102000011782 Keratins Human genes 0.000 description 1
- 108010076876 Keratins Proteins 0.000 description 1
- 101100288095 Klebsiella pneumoniae neo gene Proteins 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 240000006240 Linum usitatissimum Species 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000970829 Mesorhizobium Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000589323 Methylobacterium Species 0.000 description 1
- 101100412856 Mus musculus Rhod gene Proteins 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- KWIUHFFTVRNATP-UHFFFAOYSA-O N,N,N-trimethylglycinium Chemical compound C[N+](C)(C)CC(O)=O KWIUHFFTVRNATP-UHFFFAOYSA-O 0.000 description 1
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical class CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 1
- 241001226034 Nectria <echinoderm> Species 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 102000035092 Neutral proteases Human genes 0.000 description 1
- 108091005507 Neutral proteases Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 241000489469 Ogataea kodamae Species 0.000 description 1
- 241000489470 Ogataea trehalophila Species 0.000 description 1
- 241000826199 Ogataea wickerhamii Species 0.000 description 1
- 101100453573 Oryza sativa subsp. japonica TPKC gene Proteins 0.000 description 1
- 241000157908 Paenarthrobacter aurescens Species 0.000 description 1
- 241001524178 Paenarthrobacter ureafaciens Species 0.000 description 1
- 241000157907 Paeniglutamicibacter sulfureus Species 0.000 description 1
- 241001520808 Panicum virgatum Species 0.000 description 1
- 241000520272 Pantoea Species 0.000 description 1
- 241000588701 Pectobacterium carotovorum Species 0.000 description 1
- 241000228150 Penicillium chrysogenum Species 0.000 description 1
- 241000228168 Penicillium sp. Species 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- 241000530350 Phaffomyces opuntiae Species 0.000 description 1
- 241000529953 Phaffomyces thermotolerans Species 0.000 description 1
- 241000222395 Phlebia Species 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 241000221945 Podospora Species 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 241000192138 Prochlorococcus Species 0.000 description 1
- 241000157935 Promicromonospora citrea Species 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 241001453299 Pseudomonas mevalonii Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 101100292548 Rattus norvegicus Adi1 gene Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241001633102 Rhizobiaceae Species 0.000 description 1
- 101000968489 Rhizomucor miehei Lipase Proteins 0.000 description 1
- 101000933133 Rhizopus niveus Rhizopuspepsin-1 Proteins 0.000 description 1
- 101000910082 Rhizopus niveus Rhizopuspepsin-2 Proteins 0.000 description 1
- 101000910079 Rhizopus niveus Rhizopuspepsin-3 Proteins 0.000 description 1
- 101000910086 Rhizopus niveus Rhizopuspepsin-4 Proteins 0.000 description 1
- 101000910088 Rhizopus niveus Rhizopuspepsin-5 Proteins 0.000 description 1
- 235000013752 Rhizopus oryzae Nutrition 0.000 description 1
- 241000191025 Rhodobacter Species 0.000 description 1
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 1
- 241000605947 Roseburia Species 0.000 description 1
- 241001453443 Rothia <bacteria> Species 0.000 description 1
- 244000016016 Rubus hypargyrus var. niveus Species 0.000 description 1
- 241000187792 Saccharomonospora Species 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 101000898773 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Saccharopepsin Proteins 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 241001407717 Saccharomyces norbensis Species 0.000 description 1
- 241001123228 Saccharomyces paradoxus Species 0.000 description 1
- 241000124033 Salix Species 0.000 description 1
- 235000017276 Salvia Nutrition 0.000 description 1
- 240000007164 Salvia officinalis Species 0.000 description 1
- 241000223255 Scytalidium Species 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 102000013275 Somatomedins Human genes 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000521540 Starmera quercuum Species 0.000 description 1
- 241000264435 Streptococcus dysgalactiae subsp. equisimilis Species 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 241000958303 Streptomyces achromogenes Species 0.000 description 1
- 241000187758 Streptomyces ambofaciens Species 0.000 description 1
- 241001454747 Streptomyces aureus Species 0.000 description 1
- 241001468227 Streptomyces avermitilis Species 0.000 description 1
- 241000971005 Streptomyces fungicidicus Species 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- 241000701093 Suid alphaherpesvirus 1 Species 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 239000005864 Sulphur Substances 0.000 description 1
- 241000638881 Talaromyces aurantiacus Species 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 108700007696 Tetrahydrofolate Dehydrogenase Proteins 0.000 description 1
- 101100242191 Tetraodon nigroviridis rho gene Proteins 0.000 description 1
- 241001137870 Thermoanaerobacterium Species 0.000 description 1
- 241000228178 Thermoascus Species 0.000 description 1
- 241000203780 Thermobifida fusca Species 0.000 description 1
- 241000205188 Thermococcus Species 0.000 description 1
- 241001313706 Thermosynechococcus Species 0.000 description 1
- 241001515886 Tolypocladium geodes Species 0.000 description 1
- 241001079967 Tolypocladium sp. Species 0.000 description 1
- 244000084746 Trachelospermum inflatum Species 0.000 description 1
- 241000222355 Trametes versicolor Species 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 241000719329 Trentepohlia Species 0.000 description 1
- 241000223260 Trichoderma harzianum Species 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241001557886 Trichoderma sp. Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- 240000001274 Trichosanthes villosa Species 0.000 description 1
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 241000203807 Tropheryma Species 0.000 description 1
- 108010021006 Tyrothricin Proteins 0.000 description 1
- 241000202898 Ureaplasma Species 0.000 description 1
- 241001409553 Uredo Species 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 1
- 241000370136 Wickerhamomyces pijperi Species 0.000 description 1
- 241000204366 Xylella Species 0.000 description 1
- 101150075580 Xyn1 gene Proteins 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 229920002494 Zein Polymers 0.000 description 1
- DPDMMXDBJGCCQC-UHFFFAOYSA-N [Na].[Cl] Chemical compound [Na].[Cl] DPDMMXDBJGCCQC-UHFFFAOYSA-N 0.000 description 1
- 108010048241 acetamidase Proteins 0.000 description 1
- 239000008351 acetate buffer Substances 0.000 description 1
- 238000005903 acid hydrolysis reaction Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000000516 activation analysis Methods 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 229910001413 alkali metal ion Inorganic materials 0.000 description 1
- 229910001420 alkaline earth metal ion Inorganic materials 0.000 description 1
- 150000008052 alkyl sulfonates Chemical class 0.000 description 1
- 125000002947 alkylene group Chemical group 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- 101150073130 ampR gene Proteins 0.000 description 1
- 239000002280 amphoteric surfactant Substances 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 229940091771 aspergillus fumigatus Drugs 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 229940065181 bacillus anthracis Drugs 0.000 description 1
- 229940054340 bacillus coagulans Drugs 0.000 description 1
- 229940005348 bacillus firmus Drugs 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 239000010905 bagasse Substances 0.000 description 1
- 235000013527 bean curd Nutrition 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-FPRJBGLDSA-N beta-D-galactose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-FPRJBGLDSA-N 0.000 description 1
- 229960003237 betaine Drugs 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000036983 biotransformation Effects 0.000 description 1
- 235000020299 breve Nutrition 0.000 description 1
- HKPHPIREJKHECO-UHFFFAOYSA-N butachlor Chemical compound CCCCOCN(C(=O)CCl)C1=C(CC)C=CC=C1CC HKPHPIREJKHECO-UHFFFAOYSA-N 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 235000009120 camo Nutrition 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 125000001547 cellobiose group Chemical group 0.000 description 1
- 150000001773 cellobioses Chemical class 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 235000005607 chanvre indien Nutrition 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000011098 chromatofocusing Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 239000000287 crude extract Substances 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 101150066032 egl-1 gene Proteins 0.000 description 1
- 101150003727 egl2 gene Proteins 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 108010091371 endoglucanase 1 Proteins 0.000 description 1
- 150000002085 enols Chemical class 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 239000003248 enzyme activator Substances 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009313 farming Methods 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- PGBHMTALBVVCIT-VCIWKGPPSA-N framycetin Chemical compound N[C@@H]1[C@@H](O)[C@H](O)[C@H](CN)O[C@@H]1O[C@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](N)C[C@@H](N)[C@@H]2O)O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CN)O2)N)O[C@@H]1CO PGBHMTALBVVCIT-VCIWKGPPSA-N 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 150000002303 glucose derivatives Chemical class 0.000 description 1
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- OIZJPMOIAMYNJL-UHFFFAOYSA-H gold(3+);trisulfate Chemical compound [Au+3].[Au+3].[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O OIZJPMOIAMYNJL-UHFFFAOYSA-H 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 239000011487 hemp Substances 0.000 description 1
- 238000012203 high throughput assay Methods 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- YQYJSBFKSSDGFO-FWAVGLHBSA-N hygromycin A Chemical compound O[C@H]1[C@H](O)[C@H](C(=O)C)O[C@@H]1Oc1ccc(\C=C(/C)C(=O)N[C@@H]2[C@@H]([C@H]3OCO[C@H]3[C@@H](O)[C@@H]2O)O)cc1O YQYJSBFKSSDGFO-FWAVGLHBSA-N 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 239000002563 ionic surfactant Substances 0.000 description 1
- CJWQYWQDLBZGPD-UHFFFAOYSA-N isoflavone Natural products C1=C(OC)C(OC)=CC(OC)=C1C1=COC2=C(C=CC(C)(C)O3)C3=C(OC)C=C2C1=O CJWQYWQDLBZGPD-UHFFFAOYSA-N 0.000 description 1
- 235000008696 isoflavones Nutrition 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 229920005610 lignin Polymers 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 238000005360 mashing Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- HOVAGTYPODGVJG-UHFFFAOYSA-N methyl beta-galactoside Natural products COC1OC(CO)C(O)C(O)C1O HOVAGTYPODGVJG-UHFFFAOYSA-N 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- ZAHQPTJLOCWVPG-UHFFFAOYSA-N mitoxantrone dihydrochloride Chemical compound Cl.Cl.O=C1C2=C(O)C=CC(O)=C2C(=O)C2=C1C(NCCNCCO)=CC=C2NCCNCCO ZAHQPTJLOCWVPG-UHFFFAOYSA-N 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 125000000740 n-pentyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 101150105920 npr gene Proteins 0.000 description 1
- 101150017837 nprM gene Proteins 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- LCCNCVORNKJIRZ-UHFFFAOYSA-N parathion Chemical compound CCOP(=S)(OCC)OC1=CC=C([N+]([O-])=O)C=C1 LCCNCVORNKJIRZ-UHFFFAOYSA-N 0.000 description 1
- 229940049547 paraxin Drugs 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000006072 paste Substances 0.000 description 1
- 101150093025 pepA gene Proteins 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 1
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 239000008057 potassium phosphate buffer Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 101150108007 prs gene Proteins 0.000 description 1
- 101150086435 prs1 gene Proteins 0.000 description 1
- 101150070305 prsA gene Proteins 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 235000020995 raw meat Nutrition 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 229940083538 smallpox vaccine Drugs 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000007974 sodium acetate buffer Substances 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 229940115922 streptococcus uberis Drugs 0.000 description 1
- 108010008664 streptomycin 3''-kinase Proteins 0.000 description 1
- QTENRWWVYAAPBI-YCRXJPFRSA-N streptomycin sulfate Chemical compound OS(O)(=O)=O.OS(O)(=O)=O.OS(O)(=O)=O.CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](N=C(N)N)[C@H](O)[C@@H](N=C(N)N)[C@H](O)[C@H]1O.CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](N=C(N)N)[C@H](O)[C@@H](N=C(N)N)[C@H](O)[C@H]1O QTENRWWVYAAPBI-YCRXJPFRSA-N 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 230000001810 trypsinlike Effects 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- 229960003281 tyrothricin Drugs 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 101150052264 xylA gene Proteins 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
- 239000005019 zein Substances 0.000 description 1
- 229940093612 zein Drugs 0.000 description 1
- 150000008498 β-D-glucosides Chemical class 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2445—Beta-glucosidase (3.2.1.21)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/14—Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01021—Beta-glucosidase (3.2.1.21)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明提供了用于表达重组β-葡糖苷酶变体的组合物和方法以及重组β-葡糖苷酶变体在从纤维素生物质产生可发酵的糖中的用途。
Description
本申请要求2009年11月25日提交的美国临时专利申请系列第61/264,605号的优选权。
发明领域
本发明提供了用于表达重组β-葡糖苷酶变体的组合物和方法及其在从纤维素生物质产生可发酵的糖中的用途。
发明背景
纤维素生物质是用于生成糖类的重要的可再生资源。这些糖类的发酵可产生有商业价值的终产物,包括生物燃料和目前从石油获取的化学品。虽然将单糖发酵为乙醇相对直接,但将纤维素生物质有效转化为可发酵的糖诸如葡萄糖是有挑战的(见,例如,Ladisch等人,Enz.Microb.Technol.,5:82[1983])。纤维素可以用化学方法、机械方法或用其他方法进行预处理以提高纤维素对水解的敏感性。这种预处理之后可以是使用专门打破纤维素的β-1-4糖苷键的酶进行的纤维素到纤维二糖、纤维寡糖、葡萄糖和类似物的酶促转化。这些酶总称为“纤维素酶”。
纤维素酶被分为三个亚类的酶:1,4-β-D-葡聚糖葡聚糖水解酶(“内切葡聚糖酶”或“EG”);1,4-β-D-葡聚糖纤维二糖水解酶(“外切葡聚糖酶”、“纤维二糖水解酶”或“CBH”);和“β-D-葡糖苷-葡糖水解酶”(“β-葡糖苷酶”、“纤维二糖酶”或“Bgl”)。内切葡聚糖酶随机地攻击内部部分并主要攻击纤维素的无定形区域,主要产生葡萄糖、纤维三糖、以及纤维二糖,纤维二糖是一种水溶性β-1,4-连接的葡萄糖二聚体。外切葡聚糖酶通过结合葡聚糖末端并从纤维素聚合物的末端主要释放纤维二糖单元而逐渐缩短葡聚糖分 子。β-葡糖苷酶将纤维二糖***为两个葡萄糖单元。
用于加工纤维素生物质的纤维素酶的有效产生将会降低成本并提高生物燃料和其他有商业价值的化合物的生产效率。
发明概述
本发明提供了用于表达重组β-葡糖苷酶变体的组合物和方法,及其在从纤维素生物质产生可发酵的糖中的用途。
在一些实施方案中,本发明提供了包括如下氨基酸序列的分离或重组的嗜热子囊菌(T.aurantiacus)β-葡糖苷酶变体:所述氨基酸序列与SEQID NO:2(野生型嗜热子囊菌β-葡糖苷酶)至少约70%相同,或由在严格条件下与SEQ ID NO:1的精确互补序列(exact complement)杂交的核酸编码,并且具有至少一种相对于SEQ ID NO:2的本文所述的氨基酸残基取代,其中该变体具有比SEQ ID NO:2中给出的酶的酶活性更大的酶活性。在其他一些实施方案中,本发明提供了包括如下氨基酸序列的分离的β-葡糖苷酶多肽变体:所述氨基酸序列与SEQ ID NO:4至少约70%相同,并且具有至少一种相对于SEQ ID NO:4的本文所述的氨基酸残基取代,其中该变体具有比SEQ ID NO:4中给出的酶的酶活性更大的酶活性。还提供了编码所述β-葡糖苷酶变体的多核苷酸、包含所述多核苷酸的表达载体、以及用所述表达载体转化的宿主细胞。
本发明还提供了通过将用编码至少一种β-葡糖苷酶变体的至少一种多核苷酸转化的宿主细胞在适于表达所述β-葡糖苷酶变体的条件下培养来产生至少一种β-葡糖苷酶变体(即,多肽变体)的方法。在一些实施方案中,从培养基或从转化和培养的细胞回收β-葡糖苷酶变体。
本发明还提供包含分离或重组的嗜热子囊菌β-葡糖苷酶变体的酶组合物。在一些实施方案中,酶组合物还包括至少一种另外的纤维素酶。在另外一些实施方案中,酶组合物包括至少一种另外的纤维素酶和/或至少一种另外的酶。
在一些实施方案中,本发明提供了通过使β-葡糖苷酶变体与生物质基 质(biomass substrate)在适于产生可发酵的糖的条件下接触来将该生物质基质(如纤维二糖)转化成可发酵的糖的方法。在一些实施方案中,生物质基质被保持在包含表达至少一种β-葡糖苷酶变体的细胞的介质中。在一些实施方案中,表达至少一种β-葡糖苷酶变体的重组宿主细胞还表达至少一种其他重组纤维素酶和/或至少一种其他重组或天然的酶。在一些实施方案中,在使生物质基质与β-葡糖苷酶变体或多于一种β-葡糖苷酶变体接触之前,任选地对该生物质基质进行预处理。
在一些实施方案中,本发明提供了包括如下氨基酸序列的β-葡糖苷酶变体:所述氨基酸序列具有至少一种修饰、与SEQ ID NO:2至少约70%相同或由在严格条件下与SEQ ID NO:1的互补序列杂交的核酸编码,其中该变体具有比SEQ ID NO:2更大的酶活性。在一些实施方案中,该β-葡糖苷酶变体在选自以下的位置包括至少一种氨基酸残基取代:A478、D203、E344、F287、H684、K100、K291、K342、K456、K54、L149、N355、N650、P739、P790、R330、S408、S86、T150、Y331、Y641、Y679和Y746。
在一些可选的实施方案中,本发明提供了包括如下氨基酸序列的β-葡糖苷酶变体:所述氨基酸序列与SEQ ID NO:4至少约70%相同并且具有至少一种相对于SEQ ID NO:4的本文所述的氨基酸残基的修饰,其中该变体具有比SEQ ID NO:4更大的酶活性。在一些实施方案中,该β-葡糖苷酶变体在选自以下的位置包括至少一种氨基酸残基取代:A479、D204、E345、F288、H685、K101、K292、K343、K457、K55、L150、M1、N356、N651、P740、P791、R331、S409、S87、T151、Y332、Y642、Y680、和Y747。在一些实施方案中,该β-葡糖苷酶变体包括选自以下的至少一种氨基酸取代:T151S、Y642N、N651K、K101R、T151S、K343R、N356S、S409N、Y642N、N651K、K101R、T151S、K343R、N356S、S409N、Y642N、N651K、M1T、K55R、K101R、T151S、R331K、Y332C、K343R、N356S、S409N、Y642N、M1T、K101R、T151S、K292E、K343R、S409N、Y642N、P740S、M1T、T151S、K343R、S409N、A479V、Y642N、Y680F、L150V、T151S、K343R、S409N、K457R,Y642N、N651K、S87N、T151S、F288Y、Y642N、和N651K。在另外一些实施方案中,该β-葡糖苷酶变体包括选自以下的至少 一种氨基酸取代:T151S、Y642N、N651K、D204G、K292I、E345V、Y747C、H685Y、和P791T。在另外一些实施方案中,编码β-葡糖苷酶变体的多核苷酸序列包括选自t1044c、t1656a、t2052c和a2520g的至少一种碱基改变。在又另外一些实施方案中,编码β-葡糖苷酶变体的多核苷酸序列包括选自a1515g、g165a、t651c和726c的至少一种碱基改变。在另外一些实施方案中,β-葡糖苷酶变体包括选自取代组合(substitution set)T151S-Y642N-N651K、D204G-K292I-E345V-Y747C和H685Y-P791T的至少一种氨基酸取代。在另外一些实施方案中,β-葡糖苷酶变体包括选自以下取代组合的至少一种氨基酸取代:T151S-Y642N-N651K、K101R-T151S-K343R-N356S-S409N-Y642N-N651K 、M1T-K55R-K101R-T151S-R331K-Y332C-K343R-N356S-S409N-Y642N 、M1T-K101R-T151S-K292E-K343R-S409N-Y642N-P740S 、M1T-T151S-K343R-S409N-A479V-Y642N-Y680F 、L150V-T151S-K343R-S409N-K457R-Y642N-N651K 、 和S87N-T151S-F288Y-Y642N-N651K。
本发明还提供了编码本文提供的β-葡糖苷酶变体的多核苷酸序列。本发明还提供了包含表达至少一种β-葡糖苷酶变体的至少一种多核苷酸序列的表达载体。本发明还提供了包括包含表达至少一种β-葡糖苷酶变体的至少一种多核苷酸序列的表达载体的宿主细胞。
本发明还提供了用于产生至少一种β-葡糖苷酶变体的方法,该方法包括提供宿主细胞和包含编码至少一种β-葡糖苷酶变体的至少一种多核苷酸序列的表达载体,将该表达载体引入该宿主细胞以产生被转化的宿主细胞,并且在使得至少一种β-葡糖苷酶变体被表达的条件下培养所述被转化的宿主细胞。认为多种宿主细胞将在本发明中具有用途。在一些实施方案中,使用一种表达载体,而在其他实施方案中使用多于一种表达载体。而且,在一些实施方案中,表达载体包含单一β-葡糖苷酶变体,而在其他一些实施方案中,表达载体包括多于一种β-葡糖苷酶变体。此外,在一些实施方案中,表达载体包括编码至少一种另外的酶的至少一种多核苷酸序列,所述至少一种另外的酶包括但不限于至少一种纤维素酶。在一些实施方案中,方法还包括分离产生的β-葡糖苷酶变体的步骤。在另外一些实施方案中,方法还包括分离使用所述方法产生的至少一种另外的酶。
本发明还提供了包含至少一种β-葡糖苷酶变体的组合物。在一些实施方案中,组合物包括至少一种缓冲剂、表面活性剂、精练剂(scouring agent)和/或其他剂。在一些实施方案中,组合物还包括至少一种另外的酶。在一些实施方案中,所述至少一种另外的酶是纤维素酶。认为由本发明提供的β-葡糖苷酶变体将在众多适合的组合物中具有用途。实际上,意图在于本文提供的β-葡糖苷酶变体将在多种应用中具有用途。
本发明还提供了转化生物质基质以产生至少一种可发酵的糖的方法,该方法包括提供至少一种β-葡糖苷酶变体和生物质基质,并且在该至少一种β-葡糖苷酶变体使该生物质基质转化为至少一种可发酵的糖的条件下将该生物质基质暴露于该至少一种β-葡糖苷酶变体。在一些实施方案中,通过β-葡糖苷酶变体的作用从生物质基质产生的可发酵的糖是葡萄糖。在另外一些实施方案中,产生葡萄糖以外的糖。在其他一些实施方案中,产生糖的混合物。在一些实施方案中,产生包括葡萄糖的糖的混合物。在其他一些实施方案中,产生包含除葡萄糖之外的糖的混合物的组合。在另外一些实施方案中,在将生物质基质暴露于至少一种β-葡糖苷酶变体之前,对生物质基质进行预处理。
附图简述
图1提供了显示使用补充β-葡糖苷酶的C.lucknowense(C1)发酵培养液从纤维素产生葡萄糖的图。在该图中,“C1”和“TaB6”分别代表来自C1-真菌发酵培养液和嗜热子囊菌Bgl1衍生变体TaB6的样品。反应条件是65℃,pH 5,200g/L纤维素,100g/L木糖。添加的β-葡糖苷酶的量是基于克干重粉末,而不是活性β-葡糖苷酶的量。
发明描述
本发明提供了用于表达重组β-葡糖苷酶变体的组合物和方法,及其在从纤维素生物质产生可发酵的糖中的用途。
定义
提供以下定义来帮助读者。除非另外定义,否则领域内的所有技术、科学和其他术语均旨在具有分子生物学领域、发酵领域、微生物学领域和相关领域的技术人员所通常理解的含义。在一些情况下,具有通常理解含义的术语为了清晰和/或为了现成参考而在此定义,并且在此包含此类定义不应一定被认作代表与相关领域一般理解的术语定义相比有实质差异。
本文提到的所有专利和出版物,包括在这些专利和出版物中公开的所有序列均通过引用明确地并入本文。除非另外指明,否则本发明的实施涉及在分子生物学领域、发酵领域、微生物学领域和相关领域中通常使用的常规技术,这些技术是所属领域普通技术人员已知的。尽管在本发明的实施或试验中可使用与本文所述的方法和材料相似或等同的任何方法和材料,但描述了一些优选的方法和材料。实际上,意图在于本发明不限于本文所述的特定方法学、方案和试剂,因为这些可随使用它们的背景而改变。本文提供的标题不是对本发明的多个方面或实施方案的限制。
尽管如此,为了促进对本发明的理解,以下定义了若干术语。数值范围包括限定范围的数字。这样,本文公开的每个数值范围旨在包括落在这种较宽的数值范围内的每个较窄的数值范围,如同这种较窄的数值范围全部被明确写在本文一样。意图还在于本文公开的每个最大(或最小)的数值限制包括每个较低(或较高)的数值限制,如同这种较低(或较高)的数值限制被明确地写在本文一样。
如本文所用,术语“包括”及其同源词以其包含的意义使用(即,等同于术语“包含”及其对应的同源词)。
如在此处和在所附权利要求中所用,除非上下文另外清楚地表示,否则单数“一(a)”、“一(an)”和“该(the)”包括复数指代。因此,例如,提到“宿主细胞”包括多个此类宿主细胞。
除非另外指明,否则分别以5′至3′方向从左到右书写核酸;以氨基到羧基方向从左到右书写氨基酸序列。本文提供的标题不是对可通过参照作为整体的说明书而具有的本发明的多个方面或实施方案的限制。据此,通过参照作为整体的说明书更完全地定义以下所定义的术语。
如本文所用,术语“分离的”和“纯化的”用于指从与之天然缔合的至少一种另外的组分(例如,其他蛋白、核酸、细胞、合成试剂等等)中被除 去(即,部分或完全分开)的分子(例如,分离的核酸、多肽等等)或其他组分。
如本文所用,术语“衍生酶(derivative enzyme)”(例如“酶衍生物”或“β-葡糖苷酶衍生物”)是指保留野生型酶、天然酶或参考酶(例如β-葡糖苷酶)的特征活性达到该衍生物可用于与野生型形式、天然形式或参考形式相似的目的的程度的酶。β-葡糖苷酶的“功能衍生物”包括具有本发明的β-葡糖苷酶的一般特征的自然存在的、合成的或重组产生的多肽或肽片段。
如本文所用,术语“过表达”旨在包括将蛋白的表达提高到大于细胞正常产生的水平。意欲使该术语包括内源蛋白以及异源蛋白的过表达。
如本文所用,术语“纤维二糖”具有其普通含义并且是指具有式C12H22O11的二糖。
如本文所用,术语“纤维素酶”是指能够将纤维素(β-1,4-葡聚糖或β-D-葡糖苷键)水解成较短低聚糖、纤维二糖和/或葡萄糖的一类酶。
如本文所用,术语“β-葡糖苷酶”或“纤维二糖酶”被互换使用并且是指催化糖二聚体包括但不限于纤维二糖的水解同时释放对应的糖单体的β-D-葡糖苷葡糖水解酶。在一些实施方案中,β-葡糖苷酶是催化纤维二糖水解为葡萄糖的分类为E.C.3.2.1.21的β-葡糖苷酶葡糖水解酶。一些β-葡糖苷酶还具有水解β-D-半乳糖苷、β-L-***糖苷和/或β-D-岩藻糖苷的能力,并且另外一些β-葡糖苷酶可作用于α-1,4-底物如淀粉。β-葡糖苷酶活性可通过方法本领域已知的任何适宜方法来测量,包括本文以下描述的测定。
如本文所用,术语“β-葡糖苷酶多肽”是指具有β-葡糖苷酶活性的多肽。
如本文所用,术语“β-葡糖苷酶多核苷酸”是指编码具有β-葡糖苷酶活性的多肽的多核苷酸。
如本文所用,“纤维素水解活性”包括外切葡聚糖酶活性(CBH)、内切葡聚糖酶(EG)活性和/或β-葡糖苷酶活性。
如本文所用,术语“外切葡聚糖酶”、“外切纤维二糖水解酶”、或“CBH”是指分类为E.C.3.2.1.91的一组纤维素酶。这些酶从纤维素的还原末端或非还原末端水解纤维二糖。
如本文所用,术语“内切葡聚糖酶”或“EG”是指分类为E.C.3.2.1.4的一组纤维素酶。这些酶水解纤维素内部的β-1,4糖苷键。
如本文所用,术语“野生型(wildtype)”和“野生-型(wild-type)”当应用于多肽(蛋白)时是指由自然存在的微生物诸如细菌或丝状真菌表达的多肽(蛋白)。当应用于微生物时,术语“野生型”和“野生-型”是指天然的非重组微生物。
如本文所用,术语“野生型基因”和“野生型多核苷酸序列”是指宿主细胞中天然的或自然存在的多核苷酸序列。在一些实施方案中,野生型序列是指为蛋白工程项目的起点的感兴趣的序列。野生型序列可编码同源蛋白(即,细胞在没有干预的情况下产生的蛋白)或异源蛋白(即,细胞本来不产生但在干预下而产生的蛋白)。
如本文所用,术语“自然存在的酶”是指具有未修饰的氨基酸序列(即,与自然界发现的氨基酸序列相同的序列)的酶。自然存在的酶包括被自然表达的那些酶。
如本文所用,术语“修饰的多核苷酸序列”、“修饰的核苷酸序列”和“修饰的基因”是指包括感兴趣的自然存在的或起始的核酸序列的缺失、***、取代或间断(interruption)的核苷酸序列。在一些实施方案中,修饰的序列的表达产物是截短的蛋白(例如,如果修饰是起始序列的缺失或间断的话)。在一些实施方案中,截短的蛋白保留生物学活性。在一些可选实施方案中,修饰的序列的表达产物是延长的蛋白(例如,修饰包括向起始核酸序列中***)。在一些实施方案中,***导致截短的蛋白(例如,当***导致终止密码子的形成时)。因而,***可导致截短的蛋白或延长的蛋白作为表达产物。在一些实施方案中,修饰是起始序列中至少一个核酸残基的取代。
如本文所用,“修饰的多肽序列”和“修饰的蛋白”是指包括感兴趣的自然存在的或起始的多肽序列的缺失、***、取代或间断的多肽序列。在一些实施方案中,修饰的序列是截短的蛋白(例如,如果修饰是起始序列的缺失或间断的话)。在一些实施方案中,截短的蛋白保留生物学活性。在一些可选实施方案中,修饰的序列是延长的蛋白(例如,修饰包括在起始序列中***)。在一些实施方案中,修饰是起始序列中至少一个氨基酸残 基的取代。
如本文所用,“感兴趣的蛋白”和“感兴趣的多肽”是指期望的和/或所评价的蛋白和/或多肽。
如本文所用,术语“感兴趣的起始序列”和“起始序列”是指充当用于比较或用于工程目的的起始点的核酸(例如,“感兴趣的起始多核苷酸”)或氨基酸序列(例如,“感兴趣的起始多肽”)。在一些实施方案中,起始序列被称为“参考序列”。在一些实施方案中,起始序列是野生型序列,而在其他实施方案中,起始序列是修饰的序列(即,重组序列)。
如本文所用,术语“β-葡糖苷酶变体”、“β-葡糖苷酶变体多肽”和“β-葡糖苷酶变体蛋白”是指在多肽或多核苷酸中包括相对于野生型β-葡糖苷酶(Bgl1)多肽或野生型多核苷酸的一个或多个特定的氨基酸残基或者一个或多个特定的核苷酸或密码子的一个或多个修饰(例如,取代、缺失、***、和/或截短)的β-葡糖苷酶多肽或编码β-葡糖苷酶的多核苷酸。在一些实施方案中,β-葡糖苷酶变体是嗜热子囊菌β-葡糖苷酶变体。
如本文所用,“参考β-葡糖苷酶序列”是指用作序列比较的基础或用作“起始序列”的限定序列,诸如SEQ ID NO:2或SEQ ID NO:4。在一些实施方案中,参考β-葡糖苷酶序列包括较大序列的子集(subset)。一般地说,参考序列为多肽的至少约25个氨基酸残基长度、至少约50个残基长度、至少约100个残基长度、至少约150个残基长度、至少约200个残基长度、至少约300个残基长度、至少约350个残基长度、至少约500个残基长度、至少约600个残基长度、至少约700个残基长度、或多肽的全长。
如本文所用,术语“重组”是指宿主细胞中非自然存在的多核苷酸或多肽。重组分子可包含以非自然存在的方式连接在一起的两个或多个自然存在的序列。重组细胞包含重组的多核苷酸或多肽。核酸(诸如多核苷酸)、多肽或细胞当是人工的或工程改造的,或衍生自或包含人工的或工程改造的蛋白或核酸时,它们是“重组的”。例如,多核苷酸被***到载体中或任何其他异源位置(例如,重组生物的基因组中)以使其不与自然界发现的正常情况下在该多核苷酸两侧的核苷酸序列相缔合,这样的多核苷酸是重组多核苷酸。从重组多核苷酸体外或体内表达的蛋白是重组多肽的实例。同样,不在自然界出现的多核苷酸序列(例如,自然存在的基因的变体) 是重组的。
如本文所用,“改进的特性”是指与野生型嗜热子囊菌β-葡糖苷酶(Bgl1)(SEQ ID NO:2)相比展示任何特性上的改进的β-葡糖苷酶多肽。改进的特性包括但不限于增加的蛋白表达、热活性、热稳定性、pH活性、pH稳定性、产物特异性、提高的比活度、底物特异性、对底物或终产物抑制的提高的抗性、改变的pH/温度曲线和/或化学稳定性。
如本文所用,“具有改进的β-葡糖苷酶活性的变体”是指显示在指定的时间在指定的反应条件下发生的底物水解的量相对于参考β-葡糖苷酶增加的变体。可使用本领域已知的多种方法测量β-葡糖苷酶活性,包括但不限于本文所述的纤维二糖测定。为了比较两个重组表达的蛋白的β-葡糖苷酶活性,可比较比活度(即,每摩尔酶的酶活性或每克酶的酶活性)。可选地,在相同条件下培养表达和分泌重组蛋白的细胞并且比较每体积培养基的β-葡糖苷酶活性。
术语“百分比同一性(percent identity)”、“%同一性”、“百分比同一(percent identical)”和“%同一”在本文被互换使用是指通过ClustalW分析(例如,可从European Bioinformatics Institute,Cambridge,UK获得的W1.8版)获得的百分比氨基酸序列同一性:计算比对中相同匹配的数目并用此相同匹配的数目除以参考序列的长度,并且使用以下缺省ClustalW参数以达到缓慢的/准确的逐对最佳比对-空位开放罚分(Gap OpenPenalty):10;空位延伸罚分(Gap Extension Penalty):0.10;蛋白权重矩阵(Protein weight matrix):Gonnet系列;DNA权重矩阵:IUB;Toggle慢/快逐对比对=SLOW或FULL比对。
两条序列当以下时候是“最佳比对的”:为相似性评分使用限定的氨基酸取代矩阵(例如,BLOSUM62)、空位存在罚分和空位延伸罚分对这两条序列进行比对以达到该序列对可能的最高分数。氨基酸取代矩阵及其在定量两条序列之间的相似性上的应用是本领域熟知的(见,例如,Dayhoff等人,Atlas Prot.Seq.Struct.,5,Suppl.3:345-352[1978];和Henikoff等人,Proc.Natl.Acad.Sci.,89:10915-10919[1992],二者均通过引用并入本文)。BLOSUM62矩阵在序列比对方案诸如Gapped BLAST 2.0中通常用作缺省评分取代矩阵(default scoring substitution matrix)。空位存在罚分用于在 比对序列之一引入单个氨基酸空位,而空位延伸罚分用于被***到已开放的空位中的每个另外的氨基酸空位置。通过比对开始和结束所在的每条序列的氨基酸位置以及任选地通过在一条或两条序列中***一个空位或多个空位以达到最高可能评分,来限定比对。尽管最佳比对和评分可手动完成,但通过使用计算机执行的比对算法(例如,Gapped BLAST 2.0;见Altschul,等人,Nucl.Acids Res.,25:3389-3402[1997],通过引用并入本文)促进该过程,并且该算法在美国国立生物技术中心(National Center forBiotechnology Information)网站为公众可用。可使用容易获得的程序诸如PSI-BLAST;Altschul等人,上文,准备最佳比对,包括多重比对。
如本文所用,术语“对应于”、“参考”和“相对于”在对给定的氨基酸序列或多核苷酸序列编号的背景下使用时,是指在给定的氨基酸序列或多核苷酸序列与参考序列比较时对指定的参考序列的残基编号。
氨基酸或核苷酸碱基的“位置”由根据其相对于N末端的位置顺序地辨别每个氨基酸(或核苷酸碱基)的编号表示。由于在确定最佳比对时必须被考虑的缺失、***、截短、融合等,通过简单地从N末端计数而确定的测试序列中的氨基酸残基编号不一定与其在参考序列中的对应位置的编号相同。例如,在比对的测试序列中存在缺失的情况下,在缺失位点将不存在对应于参考序列中的位置的氨基酸。在比对的参考序列中存在***的情况下,该***将不会对应于参考序列中的任何氨基酸位置。在截短或融合的情况下,在参考序列或比对序列中可存在不对应于对应序列中的任何氨基酸的氨基酸串(stretches of amino acids)。
当核酸缔合,通常在溶液中缔合时,它们“杂交”。核酸杂交是由于各种被很好表征的物理-化学力,诸如氢键键合、溶剂排斥(solvent exclusion)、碱基堆积等。如本文所用,在核酸杂交实验诸如Southern杂交或Northern杂交的背景下术语“严格的杂交洗涤条件”是序列依赖性的,并且在不同环境参数下是不同的。杂交方法是本领域熟知的并且任何适宜方法在本发明中具有用途。对于至少100个核苷酸长度的多核苷酸而言,对低严格条件到极高严格条件限定如下:在标准的DNA印迹程序后,在42℃在5×SSPE,0.3%SDS,200μg/ml剪切和变性的鲑鱼精DNA,以及对于低严格性的25%甲酰胺,对于中等和中-高严格性的35%甲酰胺,或对于高严格性和极高严 格性的50%甲酰胺中预杂交和杂交。对于至少100个核苷酸长度的多核苷酸,使用2×SSC,0.2%SDS至少在50℃(低严格性)、至少在55℃(中等严格性)、至少在60℃(中-高严格性)、至少在65℃(高严格性)以及至少在70℃(极高严格性)将载体材料最终洗涤三次,每次15分钟。
如本文所用,术语“培养(culturing)”和“培养(cultivation)”指在液体、半固体或固体培养基中在适宜的条件下使微生物细胞的群体生长。在一些实施方案中,“培养”指纤维素底物发酵性地生物转化为终产物。
当用于指酶活性时,术语“接触”是指将酶放置在与相应的底物足够靠近的位置以使酶能够将底物转化成产物。本领域中的技术人员将认识到将酶的溶液与相应的底物相混合将实现“接触”。“接触”还包括在包含酶底物的介质中孵育分泌酶的细胞。
如本文所用,β-葡糖苷酶变体多肽在其具有β-葡糖苷酶活性时是“有酶活性的(enzymatically active)”。
如本文所用,当提及细胞时使用的术语“转化的(transformed)”和“转化(transformation)”表示细胞具有整合入其基因组的非天然核酸序列或具有作为经过多代被维持的游离型质粒。
术语“引入”在将核酸序列***细胞中的背景下表示该细胞已被转染、转导或转化(统称为“转化”)或该核酸以其他方式并入到细胞的基因组或作为附加体被保持在细胞内。
如本文所用,“可操作地连接”是指如下配置:在该配置中控制序列被适当安放在相对于DNA序列的编码序列的位置以使得该控制序列影响多肽的表达。
如本文所用,术语“编码序列”旨在包括直接编码其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界一般由开放阅读框确定,开放阅读框通常以ATG起始密码子开始。在一些实施方案中,编码序列包括DNA、cDNA和/或重组核苷酸序列。
启动子序列、信号肽、或其他序列当可操作地连接于在自然界与该启动子、信号肽或其他序列不相关的核酸或蛋白序列时,它们是“异源的”。
如本文所用,术语“表达”包括多肽的产生所涉及的任何步骤,包括但 不限于:转录、转录后修饰、翻译、翻译后修饰和分泌。
如本文所用,术语“表达载体”在本文是指包括编码本发明的多肽的区段并且可操作地连接于提供其转录的另外区段的线型或环状的DNA分子。
如本文所用,术语“前蛋白(pre-protein)”是指包括附加的氨基末端信号肽(或前导序列)区域的蛋白。在分泌之前信号肽酶将信号肽从前蛋白上切割以产生“成熟的”或“分泌的”蛋白。
如本文所用,“起始密码子”是编码蛋白的第一个氨基酸残基(甲硫氨酸)的ATG密码子。
以下命名法在描述参考序列中相对参考序列的取代或变异的多肽或核酸序列上具有用途:“R-#-V,”,其中#是指在参考序列中的位置,R是指在参考序列中该位置处的氨基酸(或碱基),并且V是指在变异序列中该位置处的氨基酸(或碱基)。例如,对于参考SEQ ID NO:4而描述的多肽变体而言,“A479V”表示在该多肽变体中,在该参考序列第479位的丙氨酸被缬氨酸取代,其中通过该变异序列与SEQ ID NO:4的最佳比对来确定氨基酸位置。
以下习惯用来描述Bgl1变体中的氨基酸位置。相对于参考序列SEQID NO:2或SEQ ID NO:4对氨基酸位置进行编号,SEQ ID NO:2是野生型(WT)Bgl1分泌蛋白,SEQ ID NO:4是本文描述的WTM形式。SEQ ID NO:6提供了野生型成熟蛋白的氨基酸序列,包括信号肽。SEQ ID NO:1提供了野生型成熟蛋白的DNA序列,而SEQ ID NO:3提供了WTM蛋白的DNA序列,并且SEQ ID NO:5提供了野生型序列的DNA序列,包括信号肽序列。
以下提供了编码野生型嗜热子囊菌β-葡糖苷酶蛋白(分泌形式)的多核苷酸:
AAGGATGACTTGGCCTACTCGCCGCCTTTCTACCCGTCGCCGTGGATGGACGGAAACGGAGAGTGGGCGGAGGCCTACCGCAGGGCTGTCGACTTCGTCTCGCAGCTGACCCTCGCGGAGAAGGTCAACCTGACGACCGGTGTCGGGTGGATGCAGGAGAAATGTGTCGGTGAAACGGGCAGCATTCCGAGGCTGGGGTTCCGTGGACTGTGCCTCCAAGACTCGCCCCTTGGTGTCAGATTTGCTGACTACGTTTCTGCCTTCCCCGCCGGTGTCAACGTCGCTGCAACGTGGGATAAGAACCTCGCCTACCTTCGTGGGAAGGCGATGGGTGAGGAACACCGTGGTAAGGGCGTCGACGTCCAGCTGGGACCTGTCGCCGGCCCTCTTGGCAGACACCCCGACGGTGGCAGAAACTG GGAGGGTTTCTCTCCTGACCCCGTCCTGACCGGTGTGCTTATGGCGGAGACGATCAAGGGTATCCAGGACGCCGGTGTGATTGCTTGCGCCAAGCACTTCATTGGTAACGAGATGGAGCACTTCCGGCAAGCCAGTGAGGCTGTTGGTTATGGTTTCGATATTACCGAGAGTGTCAGCTCAAATATCGACGACAAGACGCTTCACGAGCTGTACCTTTGGCCCTTTGCGGATGCTGTTCGCGCTGGCGTTGGTTCGTTCATGTGCTCCTACAACCAGGTTAACAACAGCTACAGCTGCTCGAACAGCTACCTCCTAAACAAGTTGCTCAAATCGGAGCTTGATTTTCAGGGCTTCGTGATGAGTGACTGGGGAGCGCACCACAGCGGCGTTGGAGCTGCCCTGGCTGGCCTTGACATGTCGATGCCAGGAGACACCGCCTTTGGTACCGGCAAATCCTTCTGGGGAACCAACCTGACCATCGCCGTTCTCAACGGCACTGTTCCGGAATGGCGTGTGGATGACATGGCTGTTCGCATCATGGCGGCCTTTTACAAGGTTGGTCGCGACCGTTACCAGGTGCCGGTCAACTTCGACTCGTGGACGAAGGATGAATACGGTTACGAGCACGCACTGGTTGGCCAGAACTATGTCAAGGTCAATGACAAGGTGGATGTTCGTGCCGACCATGCGGACATCATCCGTCAAATTGGGTCTGCTAGTGTTGTCCTTCTTAAGAACGATGGAGGACTCCCATTGACCGGCTATGAAAAGTTCACCGGAGTTTTTGGAGAGGATGCCGGATCGAACCGTTGGGGCGCTGACGGCTGCTCTGATCGTGGTTGCGACAACGGCACGTTGGCAATGGGTTGGGGCAGTGGCACTGCTGACTTCCCCTACCTTGTCACTCCCGAGCAGGCAATCCAGAATGAAATCCTTTCCAAGGGGAAGGGGTTAGTGAGTGCTGTCACCGACAATGGTGCCCTGGACCAGATGGAACAGGTTGCGTCTCAGGCCAGCGTTTCTATCGTTTTCGTCAACGCCGACTCTGGTGAAGGCTACATCAACGTTGATGGCAACGAAGGTGATCGAAGAACCTCACCCTCTGGAAGGGAGGCGAGGAGGTGATCAAGACTGTTGCAGCCAACTGCAACAACACCATTGTTGTGATGCACACTGTGGGACCTGTCTTGATCGATGAGTGGTATGACAACCCCAACGTCACCGCCATCGTCTGGGCCGGTCTTCCAGGCCAGGAGAGCGGCAACAGTCTCGTCGATGTGCTCTACGGCCGTGTCAGCCCCGGAGGAAAGACGCCGTTTACGTGGGGAAAGACTCGCGAGTCGTACGGCGCTCCTCTGCTCACCAAACCCAACAACGGCAAGGGTGCCCCCCAGGACGACTTCACCGAGGGCGTCTTCATCGACTACAGAAGGTTCGACAAGTACAACGAGACGCCCATCTATGAGTTCGGGTTTGGTCTGAGTTATACCACTTTTGAATACTCGGACATCTACGTCCAGCCCCTTAACGCACGACCTTACACCCCAGCCTCCGGCAGCACCAAGGCGGCTCCTACCTTTGGGAACATCAGCACGGACTATGCAGATTACTTGTACCCTGAGGATATACACAAGGTCCCATTATACATCTATCCTTGGCTTAACACGACGGACCCGAAGAAGTCCTCCGGCGATCCCGACTACGGAATGAAGGCCGAGGACTACATCCCATCTGGCGCGACTGATGGATCTCCTCAGCCCATCCTTCCGGCAGGCGGTGCTCCTGGTGGCAACCCGGGTCTCTATGATGAGATGTACAGGGTATCTGCAATCATCACCAACACCGGTAACGTTGTTGGTGATGAGGTTCCTCAGCTGTATGTCTCTCTTGGTGGTCCAGATGACCCCAAGGTCGTGCTCCGCAACTTTGACCGCATCACGCTCCACCCCGGCCAGCAGACAATGTGGACCACGACATTGACGCGACGCGATATCTCGAACTGGGACCCTGCCTCCCAGAATTGGGTTGTGACCAAATATCCCAAGACAGTCTACATCGGCAGCTCTTCGCGGAAACTGCACCTGCAGGCACCGCTTCCCCCTTAC (SEQ ID NO:1)
以下提供了编码野生型嗜热子囊菌β-葡糖苷酶蛋白(分泌形式)的多肽序列:
KDDLAYSPPFYPSPWMDGNGEWAEAYRRAVDFVSQLTLAEKVNLTTGVGWMQEKCVGETGSIPRLGFRGLCLQDSPLGVRFADYVSAFPAGVNVAATWDKNLAYLRGKAMGEEHRGKGVDVQLGPVAGPLGRHPDGGRNWEGFSPDPVLTGVLMAETIKGIQDAGVIACAKHFIGNEMEHFRQASEAVGYGFDITESVSSNIDDKTLHELYLWPFADAVRAGVGSFMCSYNQVNNSYSCSNSYLLNKLLKSELDFQGFVMSDWGAHHSGVGAALAGLDMSMPGDTAFGTGKSFWGTNLTIAVLNGTVPEWRVDDMAVRIMAAFYKVGRDRYQVPVNFDSWTKDEYGYEHALVGQNYVKVNDKVDVRADHADIIRQIGSASVVLLKNDGGLPLTGYEKFTGVFGEDAGSNRWGADGCSDRGCDNGTLAMGWGSGTADFPYLVTPEQAIQNEILSKGKGLVSAVTDNGALDQMEQVASQASVSIVFVNADSGEGYINVDGNEGDRKNLTLWKGGEEVIKTVAANCNNTIVVMHTVGPVLIDEWYDNPNV TAIVWAGLPGQESGNSLVDVLYGRVSPGGKTPFTWGKTRESYGAPLLTKPNNGKGAPQDDFTEGVFIDYRRFDKYNETPIYEFGFGLSYTTFEYSDIYVQPLNARPYTPASGSTKAAPTFGNISTDYADYLYPEDIHKVPLYIYPWLNTTDPKKSSGDPDYGMKAEDYIPSGATDGSPQPILPAGGAPGGNPGLYDEMYRVSAIITNTGNVVGDEVPQLYVSLGGPDDPKVVLRNFDRITLHPGQQTMWTTTLTRRDISNWDPASQNWVVTKYPKTVYIGSSSRKLHLQAPLPPY (SEQ ID NO:2)
以下显示了编码嗜热子囊菌β-葡糖苷酶蛋白(WTM形式)的多核苷酸序列:
ATGAAGGATGACTTGGCCTACTCGCCGCCTTTCTACCCGTCGCCGTGGATGGACGGAAACGGAGAGTGGGCGGAGGCCTACCGCAGGGCTGTCGACTTCGTCTCGCAGCTGACCCTCGCGGAGAAGGTCAACCTGACGACCGGTGTCGGGTGGATGCAGGAGAAATGTGTCGGTGAAACGGGCAGCATTCCGAGGCTGGGGTTCCGTGGACTGTGCCTCCAAGACTCGCCCCTTGGTGTCAGATTTGCTGACTACGTTTCTGCCTTCCCCGCCGGTGTCAACGTCGCTGCAACGTGGGATAAGAACCTCGCCTACCTTCGTGGGAAGGCGATGGGTGAGGAACACCGTGGTAAGGGCGTCGACGTCCAGCTGGGACCTGTCGCCGGCCCTCTTGGCAGACACCCCGACGGTGGCAGAAACTGGGAGGGTTTCTCTCCTGACCCCGTCCTGACCGGTGTGCTTATGGCGGAGACGATCAAGGGTATCCAGGACGCCGGTGTGATTGCTTGCGCCAAGCACTTCATTGGTAACGAGATGGAGCACTTCCGGCAAGCCAGTGAGGCTGTTGGTTATGGTTTCGATATTACCGAGAGTGTCAGCTCAAATATCGACGACAAGACGCTTCACGAGCTGTACCTTTGGCCCTTTGCGGATGCTGTTCGCGCTGGCGTTGGTTCGTTCATGTGCTCCTACAACCAGGTTAACAACAGCTACAGCTGCTCGAACAGCTACCTCCTAAACAAGTTGCTCAAATCGGAGCTTGATTTTCAGGGCTTCGTGATGAGTGACTGGGGAGCGCACCACAGCGGCGTTGGAGCTGCCCTGGCTGGCCTTGACATGTCGATGCCAGGAGACACCGCCTTTGGTACCGGCAAATCCTTCTGGGGAACCAACCTGACCATCGCCGTTCTCAACGGCACTGTTCCGGAATGGCGTGTGGATGACATGGCTGTTCGCATCATGGCGGCCTTTTACAAGGTTGGTCGCGACCGTTACCAGGTGCCGGTCAACTTCGACTCGTGGACGAAGGATGAATACGGTTACGAGCACGCACTGGTTGGCCAGAACTATGTCAAGGTCAATGACAAGGTGGATGTTCGTGCCGACCATGCGGACATCATCCGTCAAATTGGGTCTGCTAGTGTTGTCCTTCTTAAGAACGATGGAGGACTCCCATTGACCGGCTATGAAAAGTTCACCGGAGTTTTTGGAGAGGATGCCGGATCGAACCGTTGGGGCGCTGACGGCTGCTCTGATCGTGGTTGCGACAACGGCACGTTGGCAATGGGTTGGGGCAGTGGCACTGCTGACTTCCCCTACCTTGTCACTCCCGAGCAGGCAATCCAGAATGAAATCCTTTCCAAGGGGAAGGGGTTAGTGAGTGCTGTCACCGACAATGGTGCCCTGGACCAGATGGAACAGGTTGCGTCTCAGGCCAGCGTTTCTATCGTTTTCGTCAACGCCGACTCTGGTGAAGGCTACATCAACGTTGATGGCAACGAAGGTGATCGGAAGAACCTCACCCTCTGGAAGGGAGGCGAGGAGGTGATCAAGACTGTTGCAGCCAACTGCAACAACACCATTGTTGTGATGCACACTGTGGGACCTGTCTTGATCGATGAGTGGTATGACAACCCCAACGTCACCGCCATCGTCTGGGCCGGTCTTCCAGGCCAGGAGAGCGGCAACAGTCTCGTCGATGTGCTCTACGGCCGTGTCAGCCCCGGAGGAAAGACGCCGTTTACGTGGGGAAAGACTCGCGAGTCGTACGGCGCTCCTCTGCTCACCAAACCCAACAACGGCAAGGGTGCCCCCCAGGACGACTTCACCGAGGGCGTCTTCATCGACTACAGAAGGTTCGACAAGTACAACGAGACGCCCATCTATGAGTTCGGGTTTGGTCTGAGTTATACCACTTTTGAATACTCGGACATCTACGTCCAGCCCCTTAACGCACGACCTTACACCCCAGCCTCCGGCAGCACCAAGGCGGCTCCTACCTTTGGGAACATCAGCACGGACTATGCAGATTACTTGTACCCTGAGGATATACACAAGGTCCCATTATACATCTATCCTTGGCTTAACACGACGGACCCGAAGAAGTCCTCCGGCGATCCCGACTACGGAATGAAGGCCGAGGACTACATCCCATCTGGCGCGACTGATGGATCTCCTCAGCCCATCCTTCCGGCAGGCGGTGCTCCTGGTGGCAACCCGGGTCTCTATGATGAGATGTACAGGGTATCTGCAATCATCACCAACACCGGTAACGTTGTTGGTGATGAGGTTCCTCAGCTGTATGTCTCTCTTGGTGGTCCAGATGACCCCAAGGTCG TGCTCCGCAACTTTGACCGCATCACGCTCCACCCCGGCCAGCAGACAATGTGGACCACGACATTGACGCGACGCGATATCTCGAACTGGGACCCTGCCTCCCAGAATTGGGTTGTGACCAAATATCCCAAGACAGTCTACATCGGCAGCTCTTCGCGGAAACTGCACCTGCAGGCACCGCTTCCCCCTTAC (SEQ ID NO:3)
以下显示了嗜热子囊菌β-葡糖苷酶蛋白WTM形式的多肽序列:
MKDDLAYSPPFYPSPWMDGNGEWAEAYRRAVDFVSQLTLAEKVNLTTGVGWMQEKCVGETGSIPRLGFRGLCLQDSPLGVRFADYVSAFPAGVNVAATWDKNLAYLRGKAMGEEHRGKGVDVQLGPVAGPLGRHPDGGRNWEGFSPDPVLTGVLMAETIKGIQDAGVIACAKHFIGNEMEHFRQASEAVGYGFDITESVSSNIDDKTLHELYLWPFADAVRAGVGSFMCSYNQVNNSYSCSNSYLLNKLLKSELDFQGFVMSDWGAHHSGVGAALAGLDMSMPGDTAFGTGKSFWGTNLTIAVLNGTVPEWRVDDMAVRIMAAFYKVGRDRYQVPVNFDSWTKDEYGYEHALVGQNYVKVNDKVDVRADHADIIRQIGSASVVLLKNDGGLPLTGYEKFTGVFGEDAGSNRWGADGCSDRGCDNGTLAMGWGSGTADFPYLVTPEQAIQNEILSKGKGLVSAVTDNGALDQMEQVASQASVSIVFVNADSGEGYINVDGNEGDRKNLTLWKGGEEVIKTVAANCNNTIVVMHTVGPVLIDEWYDNPNVTAIVWAGLPGQESGNSLVDVLYGRVSPGGKTPFTWGKTRESYGAPLLTKTNNGKGAPQDDFTEGVFIDYRRFDKYNETPIYEFGFGLSYTTFEYSDIYVQPLNARPYTPASGSTKAAPTFGNISTDYADYLYPEDIHKVPLYIYPWLNTTDPKKSSGDPDYGMKAEDYIPSGATDGSPQPILPAGGAPGGNPGLYDEMYRVSAIITNTGNVVGDEVPQLYVSLGGPDDPKVVLRNFDRITLHPGQQTMWTTTLTRRDISNWDPASQNWVVTKYPKTVYIGSSSRKLHLQAPLPPY (SEQ ID NO:4)
以下显示了编码嗜热子囊菌β-葡糖苷酶前蛋白的多核苷酸:
ATGAGGCTTGGGTGGCTGGAGCTGGCCGTCGCGGCGGCCGCGACCGTCGCCAGCGCCAAGGATGACTTGGCCTACTCGCCGCCTTTCTACCCGTCGCCGTGGATGGACGGAAACGGAGAGTGGGCGGAGGCCTACCGCAGGGCTGTCGACTTCGTCTCGCAGCTGACCCTCGCGGAGAAGGTCAACCTGACGACCGGTGTCGGGTGGATGCAGGAGAAATGTGTCGGTGAAACGGGCAGCATTCCGAGGCTGGGGTTCCGTGGACTGTGCCTCCAAGACTCGCCCCTTGGTGTCAGATTTGCTGACTACGTTTCTGCCTTCCCCGCCGGTGTCAACGTCGCTGCAACGTGGGATAAGAACCTCGCCTACCTTCGTGGGAAGGCGATGGGTGAGGAACACCGTGGTAAGGGCGTCGACGTCCAGCTGGGACCTGTCGCCGGCCCTCTTGGCAGACACCCCGACGGTGGCAGAAACTGGGAGGGTTTCTCTCCTGACCCCGTCCTGACCGGTGTGCTTATGGCGGAGACGATCAAGGGTATCCAGGACGCCGGTGTGATTGCTTGCGCCAAGCACTTCATTGGTAACGAGATGGAGCACTTCCGGCAAGCCAGTGAGGCTGTTGGTTATGGTTTCGATATTACCGAGAGTGTCAGCTCAAATATCGACGACAAGACGCTTCACGAGCTGTACCTTTGGCCCTTTGCGGATGCTGTTCGCGCTGGCGTTGGTTCGTTCATGTGCTCCTACAACCAGGTTAACAACAGCTACAGCTGCTCGAACAGCTACCTCCTAAACAAGTTGCTCAAATCGGAGCTTGATTTTCAGGGCTTCGTGATGAGTGACTGGGGAGCGCACCACAGCGGCGTTGGAGCTGCCCTGGCTGGCCTTGACATGTCGATGCCAGGAGACACCGCCTTTGGTACCGGCAAATCCTTCTGGGGAACCAACCTGACCATCGCCGTTCTCAACGGCACTGTTCCGGAATGGCGTGTGGATGACATGGCTGTTCGCATCATGGCGGCCTTTTACAAGGTTGGTCGCGACCGTTACCAGGTGCCGGTCAACTTCGACTCGTGGACGAAGGATGAATACGGTTACGAGCACGCACTGGTTGGCCAGAACTATGTCAAGGTCAATGACAAGGTGGATGTTCGTGCCGACCATGCGGACATCATCCGTCAAATTGGGTCTGCTAGTGTTGTCCTTCTTAAGAACGATGGAGGACTCCCATTGACCGGCTATGAAAAGTTCACCGG AGTTTTTGGAGAGGATGCCGGATCGAACCGTTGGGGCGCTGACGGCTGCTCTGATCGTGGTTGCGACAACGGCACGTTGGCAATGGGTTGGGGCAGTGGCACTGCTGACTTCCCCTACCTTGTCACTCCCGAGCAGGCAATCCAGAATGAAATCCTTTCCAAGGGGAAGGGGTTAGTGAGTGCTGTCACCGACAATGGTGCCCTGGACCAGATGGAACAGGTTGCGTCTCAGGCCAGCGTTTCTATCGTTTTCGTCAACGCCGACTCTGGTGAAGGCTACATCAACGTTGATGGCAACGAAGGTGATCGGAAGAACCTCACCCTCTGGAAGGGAGGCGAGGAGGTGATCAAGACTGTTGCAGCCAACTGCAACAACACCATTGTTGTGATGCACACTGTGGGACCTGTCTTGATCGATGAGTGGTATGACAACCCCAACGTCACCGCCATCGTCTGGGCCGGTCTTCCAGGCCAGGAGAGCGGCAACAGTCTCGTCGATGTGCTCTACGGCCGTGTCAGCCCCGGAGGAAAGACGCCGTTTACGTGGGGAAAGACTCGCGAGTCGTACGGCGCTCCTCTGCTCACCAAACCCAACAACGGCAAGGGTGCCCCCCAGGACGACTTCACCGAGGGCGTCTTCATCGACTACAGAAGGTTCGACAAGTACAACGAGACGCCCATCTATGAGTTCGGGTTTGGTCTGAGTTATACCACTTTTGAATACTCGGACATCTACGTCCAGCCCCTTAACGCACGACCTTACACCCCAGCCTCCGGCAGCACCAAGGCGGCTCCTACCTTTGGGAACATCAGCACGGACTATGCAGATTACTTGTACCCTGAGGATATACACAAGGTCCCATTATACATCTATCCTTGGCTTAACACGACGGACCCGAAGAAGTCCTCCGGCGATCCCGACTACGGAATGAAGGCCGAGGACTACATCCCATCTGGCGCGACTGATGGATCTCCTCAGCCCATCCTTCCGGCAGGCGGTGCTCCTGGTGGCAACCCGGGTCTCTATGATGAGATGTACAGGGTATCTGCAATCATCACCAACACCGGTAACGTTGTTGGTGATGAGGTTCCTCAGCTGTATGTCTCTCTTGGTGGTCCAGATGACCCCAAGGTCGTGCTCCGCAACTTTGACCGCATCACGCTCCACCCCGGCCAGCAGACAATGTGGACCACGACATTGACGCGACGCGATATCTCGAACTGGGACCCTGCCTCCCAGAATTGGGTTGTGACCAAATATCCCAAGACAGTCTACATCGGCAGCTCTTCGCGGAAACTGCACCTGCAGCACCGCTTCCCCCTTAC (SEQ ID NO:5)
以下显示了嗜热子囊菌β-葡糖苷酶前蛋白的多肽序列:
MRLGWLELAVAAAATVASAKDDLAYSPPFYPSPWMDGNGEWAEAYRRAVDFVSQLTLAEKVNLTTGVGWMQEKCVGETGSIPRLGFRGLCLQDSPLGVRFADYVSAFPAGVNVAATWDKNLAYLRGKAMGEEHRGKGVDVQLGPVAGPLGRHPDGGRNWEGFSPDPVLTGVLMAETIKGIQDAGVIACAKHFIGNEMEHFRQASEAVGYGFDITESVSSNIDDKTLHELYLWPFADAVRAGVGSFMCSYNQVNNSYSCSNSYLLNKLLKSELDFQGFVMSDWGAHHSGVGAALAGLDMSMPGDTAFGTGKSFWGTNLTIAVLNGTVPEWRVDDMAVRIMAAFYKVGRDRYQVPVNFDSWTKDEYGYEHALVGQNYVKVNDKVDVRADHADIIRQIGSASVVLLKNDGGLPLTGYEKFTGVFGEDAGSNRWGADGCSDRGCDNGTLAMGWGSGTADFPYLVTPEQAIQNEILSKGKGLVSAVTDNGALDQMEQVASQASVSIVFVNADSGEGYINVDGNEGDRKNLTLWKGGEEVIKTVAANCNNTIVVMHTVGPVLIDEWYDNPNVTAIVWAGLPGQESGNSLVDVLYGRVSPGGKTPFTWGKTRESYGAPLLTKPNNGKGAPQDDFTEGVFIDYRRFDKYNETPIYEFGFGLSYTTFEYSDIYVQPLNARPYTPASGSTKAAPTFGNISTDYADYLYPEDIHKVPLYTYPWLNTTDPKKSSGDPDYGMKAEDYIPSGATDGSPQPILPAGGAPGGNPGLYDEMYRVSAIITNTGNVVGDEVPQLYVSLGGPDDPKVVLRNFDRITLHPGQQTMWTTTLTRRDISNWDPASQNWVVTKYPKTVYIGSSSRKLHLQAPLPPY (SEQID NO:6)
以下显示了被设计为具有在酿酒酵母(Saccharomyces cerevisiae)中表达的密码子偏倚性的编码WTM的多核苷酸序列:
TGAAAGATGATTTGGCTTATAGTCCACCTTTCTACCCATCACCTTGGATGGACGGTAACGGAGAATGGGCTGAAGCCTATAGAAGAGCCGTCGATTTCGTATCCCAATTGACATTGGCAG AGAAGGTAAATTTGACAACCGGAGTGGGTTGGATGCAGGAAAAGTGTGTAGGCGAAACTGGTTCTATACCAAGATTAGGCTTTAGGGGTTTGTGCTTACAAGATTCTCCCTTAGGTGTAAGATTCGCCGACTACGTAAGTGCTTTTCCTGCAGGAGTTAACGTTGCAGCAACTTGGGATAAAAACCTTGCATATTTGAGAGGTAAGGCAATGGGTGAAGAACATCGTGGCAAGGGTGTCGATGTGCAGTTAGGCCCAGTTGCTGGACCATTGGGAAGACATCCCGACGGCGGAAGAAACTGGGAGGGTTTTAGTCCAGACCCCGTTTTGACTGGAGTCTTGATGGCAGAGACTATCAAAGGTATACAAGACGCTGGAGTGATTGCTTGTGCTAAACATTTCATTGGTAACGAAATGGAACATTTCAGACAAGCCTCCGAAGCAGTTGGCTATGGTTTTGATATTACTGAGTCCGTTTCATCAAACATAGATGACAAAACCCTTCACGAACTATATTTATGGCCATTCGCTGATGCCGTCAGAGCTGGTGTAGGTTCTTTCATGTGTTCATACAACCAAGTCAACAACTCTTATTCATGCTCTAATTCCTACTTGTTGAACAAATTATTAAAGTCAGAACTTGACTTTCAAGGTTTCGTAATGTCCGACTGGGGTGCTCACCATTCCGGAGTTGGTGCAGCTTTGGCCGGTTTAGACATGTCAATGCCAGGTGATACTGCATTTGGAACGGGTAAATCCTTTTGGGGTACCAATCTAACCATCGCCGTCCTTAATGGTACAGTTCCTGAATGGAGAGTAGATGATATGGCTGTTAGAATCATGGCCGCATTTTACAAAGTTGGTAGAGATAGGTACCAAGTGCCTGTCAACTTTGACTCCTGGACCAAAGATGAATATGGTTATGAACACGCATTGGTGGGCCAGAATTATGTTAAGGTCAATGATAAAGTGGATGTGAGAGCTGACCACGCTGATATTATCCGTCAGATTGGTAGTGCATCAGTTGTTTTGTTAAAAAATGACGGAGGACTTCCTTTAACTGGTTATGAGAAGTTCACAGGCGTATTCGGCGAAGATGCCGGTAGTAATCGTTGGGGTGCTGACGGATGCAGTGACA
GAGGCTGCGATAATGGTACCCTTGCCATGGGTTGGGGATCTGGAACGGCCGACTTTCCTTACTTAGTTACGCCAGAGCAGGCTATACAAAATGAGATTTTGTCTAAAGGCAAGGGATTGTCTCTGCCGTGACGGATAACGGAGCTTTAGACCAAATGGAACAGGTCGCTTCCCAAGCTTCTGTAAGTATTGTTTTTGTTAATGCCGACTCAGGAGAAGGCTATATTAACGTTGATGGAAATGAAGGTGATAGGAAAAATCTAACTCTTTGGAAGGGTGGTGAAGAGGTCATTAAGACAGTCGCAGCCAATTGTAACAATACCATCGTCGTAATGCACACCGTTGGACCTGTGTTAATAGATGAATGGTATGATAATCCTAATGTCACTGCAATTGTTTGGGCAGGCTTGCCTGGTCAGGAATCCGGTAATTCTCTTGTTGATGTCCTATATGGAAGGGTGTCCCCTGGTGGAAAAACTCCCTTTACTTGGGGCAAGACACGTGAAAGTTATGGAGCACCATTATTAACAAAACCAAACAACGGAAAGGGAGCTCCTCAAGATGATTTTACAGAGGGTGTTTTCATCGACTACAGGCGTTTCGACAAGTATAACGAGACTCCTATATATGAGTTCGGATTTGGTCTATCCTACACAACTTTTGAGTACTCAGATATCTACGTACAGCCCTTGAACGCACGTCCATACACCCCTGCTTCAGGTTCTACTAAGGCCGCCCCAACGTTTGGAAATATATCTACTGATTACGCTGATTACCTATACCCAGAGGATATTCATAAAGTTCCACTTTATATCTACCCATGGCTTAATACGACAGACCCAAAAAAGTCAAGTGGTGATCCAGATTACGGAATGAAAGCTGAAGATTACATTCCTTCAGGCGCTACGGACGGCTCTCCCCAACCAATTCTACCAGCTGGAGGTGCTCCAGGTGGTAATCCTGGCTTGTATGATGAGATGTATAGGGTTTCTGCTATAATTACAAATACAGGTAACGTTGTTGGTGATGAGGTACCTCAACTATACGTGTCTTTAGGTGGTCCCGATGACCCCAAGGTAGTTTTGCGTAACTTTGACAGAATCACTTTGCATCCAGGACAACAAACCATGTGGACTACGACTTTGACAAGAAGAGATATATCTAATTGGGACCCTGCATCTCAGAATTGGGTTGTGACAAAGTACCCAAAAACTGTCTATATCGGCTCAAGTTCCAGGAAGCTTCACTTGCAGGCCCCTCTACCCCCATACTAA (SEQ ID NO:7)
真菌嗜热子囊菌(Thermoascus aurantiacus)产生一致地起作用来催化纤维素的解晶和水解以产生可溶性糖类的多种酶。在这些酶中有嗜热子囊菌β-葡糖苷酶1(Bgl1)(Parry等人,Biochem.J.353:117[2001],通过引用并入本文)。嗜热子囊菌β-葡糖苷酶蛋白序列被提供在Hong等人,APPl.Microbiol.Biotechnol.,73:1331[2007]中,其通过引用并入本文。Hong等人(Hong等人NCBI登录号DQ114396.1;Genbank登录号AAZ95588)报告了bgl1基因的序列。嗜热子囊菌野生型β-葡糖苷酶cDNA 序列以GenBank登录号DQ114397提供(也见,Hong等人,J.Biotechnol.,130:114-23[2007]),并且在本文作为SEQ ID NO:6在此给出。嗜热子囊菌β-葡糖苷酶前蛋白(SEQ ID NO:6)包括19-残基信号肽,MRLGWLELAVAAAATVASA,对应于SEQ ID NO:6的残基1-19(编码这种前蛋白的多核苷酸在SEQ ID NO:5中提供)。
本文描述的嗜热子囊菌β-葡糖苷酶变体对于从纤维素生物质产生可发酵的糖是极其有用的。在一些实施方案中,本发明提供了通过使包含纤维二糖的组合物与至少一种重组表达的嗜热子囊菌β-葡糖苷酶变体在其中纤维二糖被酶促转化为葡萄糖的条件下接触来产生葡萄糖的方法。在一些实施方案中,将表达至少一种β-葡糖苷酶变体的重组宿主细胞与纤维二糖在其中β-葡糖苷酶被细胞表达(和优选地分泌)的条件下组合。在一些可选实施方案中,将纯化的或部分纯化的重组β-葡糖苷酶与纤维二糖接触。在本发明的一些实施方案中,接触包括在包含从纤维素原料产生的纤维二糖的培养基中培养重组宿主细胞。例如,本文描述的嗜热子囊菌β-葡糖苷酶变体显示与其他纤维素酶联合的在糖化反应中的益处,所述其他纤维素酶诸如里氏木霉(T.reesei)纤维素酶(例如,里氏木霉CBH1、CBH2和/或EG1或其变体,和/或里氏木霉培养液)和C.lucknowense纤维素酶(美国专利第6,015,707号、5,811,381号和6,573,086号;美国专利公布第2007/0238155号、2008/0194005号、2009/0099079号;以及WO 2008/073914和WO 98/15633,其全部通过引用并入本文)。
在一些实施方案中,本发明提供了通过将包括含编码嗜热子囊菌Bgl1变体的核酸序列的载体的宿主细胞培养在其中β-葡糖苷酶蛋白或其酶活性片段被表达的条件下来表达β-葡糖苷酶的方法。在一些实施方案中,表达的蛋白包含在分泌酶时被细胞除去的信号肽。在一些实施方案中,编码嗜热子囊菌Bgl1变体的序列的转录受可操作地连接的异源启动子控制。
β-葡糖苷酶多肽变体
本发明提供了为嗜热子囊菌β-葡糖苷酶(Bgl1)变体的新颖的酶。本发明的β-葡糖苷酶多肽变体是显示β-葡糖苷酶活性、通常是比野生型嗜热 子囊菌β-葡糖苷酶(SEQ ID NO:2)或WTM嗜热子囊菌β-葡糖苷酶(SEQID NO:4)更大的β-葡糖苷酶活性的Bgl1的变体。还包括在商业化糖化工艺相关的条件下显示更大稳定性的β-葡糖苷酶多肽变体。
本发明提供了具有比野生型嗜热子囊菌Bgl1蛋白更大的活性并且具有在本文所述的显示提高的活性的变体中发现的至少一种取代的Bgl1变体。如在本文更详细讨论的,制备了编码野生型(WT)嗜热子囊菌Bgl1蛋白(SEQ ID NO:2)或通过在成熟蛋白的氨基末端增添甲硫氨酸而修饰的野生型嗜热子囊菌Bgl1蛋白(WTM;SEQ ID NO:4)的多核苷酸。多核苷酸连同编码异源信号肽的序列被***表达载体中,如实施例所述。通过诱变和定向进化制备编码Bgl1蛋白变体的多核苷酸的文库,并且评价个体Bgl1变体的特性(例如,β-葡糖苷酶活性),如实施例所述。在具有比野生型酶活性更大活性的变体中鉴定了许多氨基酸取代和取代的组合。还旨在本发明包括包含相比于参考序列(例如SEQ ID NO:2或4)的至少一个***和/或缺失的Bgl1变体。
更具体地说,本发明提供了具有提高的活性的分离的和/或重组的β-葡糖苷酶多肽变体,其包括与野生型嗜热子囊菌β-葡糖苷酶多肽(Bgl1)(SEQ ID NO:2)至少约70%相同且在选自以下的位置具有至少一种氨基酸残基取代的氨基酸序列:A478、D203、E344、F287、H684、K100、K291、K342、K456、K54、L149、N355、N650、P739、P790、R330、S408、S86、T150、Y331、Y641、Y679、Y746(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。本发明还提供了包括如下氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体:所述氨基酸序列与WTM嗜热子囊菌β-葡糖苷酶多肽(Bgl1)(SEQ ID NO:4)至少约70%相同且在选自以下的位置具有至少一种氨基酸残基取代或缺失:A479、D204、E345、F288、H685、K101、K292、K343、K457、K55、L150、M1、N356、N651、P740、P791、R331、S409、S87、T151、Y332、Y642、Y680、和Y747(其中通过与SEQID NO:4最佳比对来确定氨基酸位置)。“取代”在该背景下表示该变体蛋白中的残基是除了参考序列(例如SEQ ID NO:2或4)中此位置处的残基以外的任何残基。例如,“A479X”表示在第479位包含除了丙氨酸以外的 氨基酸(即,另外19个自然存在的氨基酸之一)的变体。在一些实施方案中,蛋白变体中的氨基酸既不是野生型残基也不是为该野生型残基的保守性替代物(substitute)的残基。如以下指出的,在该背景下,残基的保守性替代物是在同一组(即,碱性氨基酸,诸如精氨酸、赖氨酸或组氨酸;酸性氨基酸,诸如谷氨酸或天冬氨酸;极性氨基酸,诸如谷氨酰胺或天冬酰胺;疏水氨基酸,诸如亮氨酸、异亮氨酸或缬氨酸;芳香族氨基酸,诸如苯丙氨酸、色氨酸或酪氨酸;或小氨基酸,诸如甘氨酸、丙氨酸、丝氨酸、苏氨酸、脯氨酸、半胱氨酸或甲硫氨酸)中的另一个残基。
在一些实施方案中,蛋白变体中的氨基酸既不是野生型残基也不是为如以下的对所限定的那样通常与该野生型残基交换的残基的残基:Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
在一些实施方案中,本发明提供了具有比野生型(WT)嗜热子囊菌Bgl1蛋白更大的活性和/或热稳定性并且包括如下氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体:该氨基酸序列与野生型嗜热子囊菌β-葡糖苷酶(Bgl1)(SEQ ID NO:2)至少约70%相同并且具有选自以下的至少一种氨基酸残基取代:A478V、D203G、E344V、F287Y、H684Y、K100R、K291E、K291I、K342R、K456R、K54R、L149V、N355S、N650K、P739S、P790T、R330K、S408N、S86N、T150S、Y331C、Y641N、Y679F、Y746C(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。以上列出的发明的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、或24或更多个位置处的取代的任何组合。
本发明还提供了具有比野生型(WT)嗜热子囊菌Bgl1蛋白更大的活性和/或热稳定性并且包括如下氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体:该氨基酸序列与WTM嗜热子囊菌β-葡糖苷酶(Bgl1)(SEQID NO:4)至少约70%相同并且在选自以下位置具有至少一种氨基酸残基取代:A479V、D204G、E345V、F288Y、H685Y、K101R、K292E、 K292I、K343R、K457R、K55R、L150V、M1T、N356S、N651K、P740S、P791T、R331K、S409N、S87N、T151S、Y332C、Y642N、Y680F、和Y747C(其中通过与SEQ ID NO:4最佳比对来确定氨基酸位置)。以上列出的发明的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、或24或更多个位置处的取代的任何组合。
在一些实施方案中,本发明提供了具有由在严格条件下与SEQ IDNO:1的互补序列杂交(例如,在与SEQ ID NO:1精确互补的核酸的实质上整个长度上杂交)的核酸编码的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体,其中该编码多肽在选自以下的位置具有至少一种或多种取代或缺失:A478、D203、E344、F287、H684、K100、K291、K342、K456、K54、L149、N355、N650、P739、P790、R330、S408、S86、T150、Y331、Y641、Y679、Y746(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。本发明还提供了具有由在严格条件下与SEQ ID NO:1的互补序列杂交(例如,在与SEQ ID NO:1精确互补的核酸的实质上整个长度上杂交)的核酸编码的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体,其中该编码多肽在选自以下的位置具有至少一种或多种取代或缺失:A479、D204、E345、F288、H685、K101、K292、K343、K457、K55、L150、M1、N356、N651、P740、P791、R331、S409、S87、T151、Y332、Y642、Y680和Y747(其中通过与SEQ ID NO:4最佳比对来确定氨基酸位置)。
本发明还提供了具有由在严格条件下与SEQ ID NO:1的互补序列杂交(例如,在与SEQ ID NO:1精确互补的核酸的实质上整个长度上杂交)的核酸编码的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体,其中该编码多肽在选自以下的位置具有至少一种或多种取代或缺失:A478V、D203G、E344V、F287Y、H684Y、K100R、K291E、K291I、K342R、K456R、K54R、L149V、N355S、N650K、P739S、P790T、R330K、S408N、S86N、T150S、Y331C、Y641N、Y679F、Y746C和Y747C(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置),或其在选自以下的 位置具有至少一种氨基酸残基取代或缺失:A479V、D204G、E345V、F288Y、H685Y、K101R、K292E、K292I、K343R、K457R、K55R、L150V、M1T、N356S、N651K、P740S、P791T、R331K、S409N、S87N、T151S、Y332C、Y642N、Y680F(其中通过与SEQ ID NO:4最佳比对来确定氨基酸位置)。以上列出的发明的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、或24或更多个位置处的取代的任何组合。
旨在本文提供的Bgl1变体包括除以上列出的氨基酸取代以外的另外的氨基酸取代(例如,另外的保守性取代)并且与野生型嗜热子囊菌Bgl1蛋白相比可小于全长。因而,在一些实施方案中,本发明的Bgl1变体包括相对于SEQ ID NO:2的***和/或缺失(例如,在氨基端和/或羧基端截短)。嗜热子囊菌Bgl1蛋白的野生型分泌形式为约842个残基长度;本发明的变体可比野生型蛋白更长或更短。为了举例说明且非限制,在一些实施方案中,变体可比野生型长度长或短达约10%、达约5%、达约4%、达约3%、达约2%、或约达1%。
根据本领域已知的方法(见WO 03/075129和美国专利申请序列第10/379,378号,以及Fox等人,Protein Eng.,16(8):589-597[2003];和Fox等人,J.Theor.Biol.234(2):187-199[2005],其全部通过引用并入本文)进行变体的序列-活性分析,以鉴定可能提供对活性的最显著影响的取代。本发明的一些β-葡糖苷酶变体具有在第287位和第86位中的任一个或两个位置包括至少一种氨基酸残基取代(例如,F287Y和S86N)的氨基酸序列。本发明的一些β-葡糖苷酶变体具有在选自以下的位置包括至少一种氨基酸残基取代的氨基酸序列:H684Y、K342R、P790T、S408N、T150S和Y641N,所述取代显示是非常有益的取代。本发明的一些β-葡糖苷酶变体具有在选自以下的位置包括至少一种氨基酸残基取代的氨基酸序列:A478V、D203G、E344V、K291E、K291I、K456R、K54R、L149V、P739S、Y679F、和Y746C。另外,一些变体包括在SEQ ID NO:2的氨基末端增添苏氨酸残基的序列。应认识到,使用SEQ ID NO:2的编号提及上述有益的取代。使用SEQ ID NO:4的编号,高度有益的取代包括F288Y和S87N,极其有益的取代包括H685Y、K343R、P791T、S409N、T151S和Y642N, 并且另外的有益取代包括A479V、D204G、E345V、K292E、K292I、K457R、K55R、L150V、M1T、P740S、Y680F和Y747C。适宜的组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18或更多个位置处的取代的任何组合。在一些实施方案中,本发明的β-葡糖苷酶变体还具有其中在对应于N356(使用SEQ ID NO:2的编号)的位置没有作出取代的氨基酸序列。
在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型嗜热子囊菌Bgl1或WTM Bgl1至少约70%相同,并且包括选自以下的取代组合:T150S+Y641N+N650K;K100R+T150S+K291E+K342R+S408N+Y641N+P739S;T150S+K342R+S408N+A478V+Y641N+Y679F;L149V+T150S+K342R+S408N+K456R+Y641N+N650K;S86N+T150S+F287Y+Y641N+N650K;K100R+T150S+K342R+N355S+S408N+Y641N+N650K;S86N+T150S+F287Y+Y641N+N650K;K54R+K100R+T150S+R330K+Y331C+K342R+N355S+S408N+Y641N;D203G+K291I+E344V+Y746C;和H684Y+P790T(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置),或T151S+Y642N+N651K;M1T+K101R+T151S+K292E+K343R+S409N+Y642N+P740S;M1T+T151S+K343R+S409N+A479V+Y642N+Y680F;L150V+T151S+K343R+S409N+K457R+Y642N+N651K;S87N+T151S+F288Y+Y642N+N651K;K101R+T151S+K343R+N356S+S409N+Y642N+N651K;M1T+K55R+K101R+T151S+R331K+Y332C+K343R+N356S+S409N+Y642N;K101R+T151S+K343R+N356S+S409N+Y642N+N651K;D204G+K292I+E345V+Y747C;和H685Y+P791T(其中通过与SEQ ID NO:4最佳比对来确定氨基酸位置)。
如以上指出的,本发明包括的β-葡糖苷酶多肽具有与SEQ ID NO:2或与SEQ ID NO:4至少约70%的序列同一性。在一些实施方案中,本发明包括的β-葡糖苷酶多肽包括具有与SEQ ID NO:2或与SEQ ID NO:4至少约71%相同、至少约72%相同、至少约73%相同、至少约73%相同、至少约74%相同、至少约75%相同、至少约76%相同、至少约77%相同、至少约78%相同、至少约79%相同、至少约80%相同、至少约81%相同、至少约 82%相同、至少约83%相同、至少约84%相同、至少约85%相同、至少约86%相同、至少约87%相同、至少约88%相同、至少约89%相同、至少约90%相同、至少约91%相同、至少约92%相同、至少约93%相同、至少约94%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同或至少约99%相同的氨基酸序列的β-葡糖苷酶多肽。
本文的每个“至少约70%”叙述应理解成还可选地包括以上更高值中的任何一个。
如以上所指出的,在一些实施方案中,本发明的Bgl1变体还包括除以上列出的取代之外的另外的氨基酸取代,包括,例如具有在氨基酸序列中作出的一个或多个另外的保守性取代的变体。保守性取代的实例在碱性氨基酸(精氨酸、赖氨酸或组氨酸)、酸性氨基酸(谷氨酸或天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)以及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸、脯氨酸、半胱氨酸和甲硫氨酸)的组内。一般不改变比活度(specific activity)的氨基酸取代是本领域已知的。最常出现的交换包括但不限于:Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly,以及这些对颠倒过来。
本发明的β-葡糖苷酶多肽变体的保守取代的变异包括用同一保守取代组的保守选择的氨基酸取代小百分比、通常少于约5%、更通常少于约2%、并且通常少于约1%的多肽序列的氨基酸。不改变编码的β-葡糖苷酶活性的序列的增添,诸如非功能性或非编码序列的增添被认为是β-葡糖苷酶多核苷酸的保守变异。
本发明还提供了本文描述的β-葡糖苷酶多肽变体的酶活性片段,其中该片段具有β-葡糖苷酶活性和本文描述的至少一种取代。本发明还包括含截短的氨基末端和/或羧基末端的β-葡糖苷酶变体。据此,本发明还提供了具有如下氨基酸序列的分离的和/或重组的β-葡糖苷酶变体:所述氨基酸序列具有相对于SEQ ID NO:2或4的来自羧基(C-)末端、氨基(N-)末端、或二者的约1个至约50个氨基酸残基的缺失(即,来自N末端或C末端中任一个或二者的1、2、3、4、5、6、7、8、9、10、12、13、14、15、 16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、或50个氨基酸残基的缺失)。在一些实施方案中,缺失是来自N末端的约1个至约15个氨基酸残基和/或来自C末端的约1个至约40个氨基酸残基。这些β-葡糖苷酶片段在本文还分别称为“N末端截短的”和“C末端截短的”β-葡糖苷酶多肽变体。在一些实施方案中,缺失是来自C末端、N末端或两个末端的约1个至约30个、或约1个至约20个、或约1个至约10个残基、或约1个至约5个残基。
与SEQ ID NO:2具有至少约70%序列同一性和本文公开的一个或多个取代的本发明的一些β-葡糖苷酶变体除本文具体给出的那些以外还具有一个或多个取代、缺失或***。此类取代、缺失或***对β-葡糖苷酶活性和热稳定性的作用(如果有的话)可使用本领域已知的任何适宜的测定来确定。为了举例说明,TaB2具有以下相对于SEQ ID NO:2的取代:T151S+Y642N+N651K。为了确定为了确定另外的取代(例如,SEQ ID NO:2第4位的亮氨酸被缬氨酸替代)的作用,表达了变体(在该实例中,SEQ IDNO:2,具有L4V+T151S+Y642N+N651K)并将其性质与亲本(在该实例中,TaB2)进行比较。
在一些实施方案中,产生了β-葡糖苷酶多肽变体(以及编码变体的多核苷酸)的文库并筛选(例如,使用高通量筛选)β-葡糖苷酶活性的存在。在一些实施方案中,本领域已知的诱变和定向进化方法被应用于编码本文示例的β-葡糖苷酶变体的多核苷酸来产生变体文库,使用任何适宜的方法包括本文描述的那些方法对所述变体文库进行表达、筛选和测定。诱变和定向进化方法是本领域熟知的(见,例如,Ling,等人,Anal.Biochem.,254:157-78[1999];Dale等人,Methods Mol.Biol.,57:369-74[1996];Smith,Ann.Rev.Genet.,19:423-462[1985];Botstein等人,Science,229:1193-1201[1985];Carter,Biochem.J.,237:1-7[1986];Kramer等人,Cell,38:879-887[1984];Wells等人,Gene,34:315-323[1985];Minshull等人,Curr.Op.Chem.Biol.,3:284-290[1999];Christians等人,Nat.Biotechnol.,17:259-264[1999];Crameri等人,Nature,391:288-291[1998];Crameri等人,Nat.Biotechnol.,15:436-438[1997];Zhang等人,Proc.Nat.Acad.Sci.,U.S.A.,94:45-4-4509[1997];Crameri等人,Nat. Biotechnol.,14:315-319[1996];Stemmer,Nature,370:389-391[1994];Stemmer,Proc.Nat.Acad.Sci.,U.S.A.,91:10747-10751[1994];WO95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;和WO 01/75767,其全部通过引用并入本文)。
在产生在除上文描述的那些以外的位置包括取代、***或缺失的变体时,普通熟练的实践者将认识到β-葡糖苷酶蛋白的某些区域对取代(尤其是非保守性取代)的耐受性比其他区域更小。因而,在一些实施方案中,Bgl1蛋白变体保留来自亲本的保守性残基和功能结构域。例如,几个糖基水解酶第3家族(CH3型)的酶包括嗜热子囊菌β-葡糖苷酶1的比对在确定用于修饰的位点方面具有用途。在这些比对的一些中,确定了GH3活性位点、催化残基和该家族中保守的(相似的)或高度保守的(相同的)的残基(见,例如,Bhatia等人,Crit Rev Biotechnol.,22:375-407[2002];和Hong等人,上文;二者均通过引用并入本文)。在本发明的一些实施方案中,蛋白变体保留了来自亲本的这些残基或残基类别中的一些或全部(即,不存在对一些或全部保守位置的取代)。
信号肽
在一些实施方案中,β-葡糖苷酶多肽自其被表达的宿主细胞(例如,酵母或其他真菌细胞)分泌,并且作为包括信号肽(即,连接于多肽的氨基末端并引导编码多肽进入细胞分泌途径的氨基酸序列)的前蛋白表达。在一些实施方案中,信号肽是具有作为SEQ ID NO:6的残基1-19给出的序列的内源性嗜热子囊菌β-葡糖苷酶信号肽。在一些其他实施方案中,使用来自其他嗜热子囊菌分泌蛋白的信号肽。
在另外一些实施方案中,取决于宿主细胞和其他因素,使用其他信号肽。用于丝状真菌宿主细胞的有效的信号肽编码区包括但不限于从米曲霉(Aspergillus oryzae)TAKA淀粉酶、黑曲霉(Aspergillus niger)中性淀粉酶、黑曲霉葡萄糖淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶、柔毛腐质霉(Humicolalanuginosa)脂肪酶以及里氏木霉(T.reesei)纤维二糖水解酶II(TrCBH2)获得的信号肽编码区。
用于细菌宿主细胞的有效的信号肽编码区包括但不限于从芽孢杆菌(Bacillus)NClB 11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)α-淀粉酶、地衣芽孢杆菌(Bacillus licheniformis)枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌(Bacillus subtilis)prsA的基因中获得的信号肽编码区。另外的信号肽是本领域已知的(见,例如,Simonen和Palva,Microbiol.Rev.,57:109-137[1993],通过引用并入本文)。
用于酵母宿主细胞的有用的信号肽还包括来自酿酒酵母(Saccharomyces cerevisiae)α-因子,酿酒酵母SUC2转化酶(见,例如,Taussig和Carlson,Nucl.Acids Res.,11:1943-54[1983];和SwissProt登录号P00724),以及其他(见,例如,Romanos等人,Yeast 8:423-488[1992],其通过引用并入本文)的基因的那些。这些信号肽和其他信号肽的适宜的变体也在本发明中有用途。
融合多肽和另外的序列元件
在一些实施方案中,本发明的β-葡糖苷酶多肽变体包括不改变β-葡糖苷酶的编码活性的另外的序列。例如,在一些实施方案中,β-葡糖苷酶与表位标签或与在β-葡糖苷酶纯化中有用的其他序列连接。
本发明还提供了β-葡糖苷酶变体融合多肽。在一些实施方案中,融合多肽包括编码本发明的β-葡糖苷酶多肽变体或其片段的氨基酸序列,该β-葡糖苷酶多肽变体通过其N末端或C末端与编码至少第二(另一个)多肽的氨基酸序列直接或间接地连接。在一些实施方案中,β-葡糖苷酶变体融合多肽还包括编码第三、第四、第五或另外的多肽的氨基酸序列。通常,每个另外的多肽具有生物学活性,或可选地,为具有生物学活性的多肽的一部分,其中该部分具有改进融合多肽从期望的表达宿主表达和/或分泌的作用。在一些实施方案中,这些序列被直接或间接地融合到β-葡糖苷酶多肽变体或其片段的N末端或C末端,或可选地融合到具有生物学活性的另外的多肽的N末端或C末端。
在一些实施方案中,另外的多肽编码酶或其活性片段,和/或改进融合多肽从期望的表达宿主表达和/或分泌的多肽。在其他一些实施方案中,另外的多肽编码纤维素酶(例如,具有不同于融合多肽中的β-葡糖苷酶多肽变体的氨基酸序列的β-葡糖苷酶,例如,野生型β-葡糖苷酶或其变体,包括不同的嗜热子囊菌β-葡糖苷酶多肽变体),或表现CBH或EG活性的多肽),和/或改进从期望的宿主细胞表达和分泌的多肽(例如,从期望的表达宿主正常表达和分泌的多肽,如从丝状真菌正常表达的分泌多肽)。这些包括但不限于来自黑曲霉、黑曲霉泡盛变种(A.niger var.awamori)、米曲霉的葡萄糖淀粉酶、α-淀粉酶和天冬氨酰蛋白酶,纤维二糖水解酶I,和纤维二糖水解酶II,木霉属(Trichoderma)内切葡聚糖酶I和内切葡聚糖酶III,以及链孢霉属(Neurospora)和腐质霉属(Humicola)葡萄糖淀粉酶(见,例如,WO 98/31821,其通过引用并入本文)。
在一些实施方案中,融合多肽的多肽组分彼此经接头(linker)间接连接。适宜在本发明的实践中使用的接头包括但不限于在通过引用并入本文 的WO 2007/075899中描述的那些。示例性接头包括约1个至约40个氨基酸残基长度的肽接头,包括约1个至约20个氨基酸残基长度的那些以及约1个至约10个氨基酸残基长度的那些。在一些实施方案中,接头由单一氨基酸残基组成,诸如,例如,Gly、Ser、Ala或Thr残基,或其组合,特别是Gly和Ser。在一些实施方案中,本发明的实践中采用的接头是可切割的。在一些实施方案中,适合的可切割的接头包括切割位点,诸如蛋白酶识别位点。示例性蛋白酶识别位点是本领域熟知的并且包括但不限于Lys-Arg(例如,KEX2蛋白酶识别位点,其可被天然曲霉属KEX2样蛋白酶)以及Lys和Arg(例如,胰蛋白酶蛋白酶识别位点)(见,例如,WO07/075899,其通过引用并入本文)。
β-葡糖苷酶活性
本发明的β-葡糖苷酶多肽变体包括在指定条件下具有相对于野生型嗜热子囊菌β-葡糖苷酶(SEQ ID NO:2)的改进(例如,更大)的β-葡糖苷酶活性的那些。改进的β-葡糖苷酶活性可如本文所述测量。在一些实施方案中,当在相同条件下测定时,本发明的β-葡糖苷酶多肽具有比野生型嗜热子囊菌β-葡糖苷酶(SEQ ID NO:2)大至少约1倍、至少约2倍、至少约2.5倍、至少约2.7倍或多于2.7倍的β-葡糖苷酶活性水平。因而,本发明提供了与野生型Bgl1蛋白相比具有至少约1.1倍至约1.5倍、至少约1.5倍至约2.5倍以及大于约2.5倍的β-葡糖苷酶活性的β-葡糖苷酶多肽变体。本文提供了相比于野生型嗜热子囊菌β-葡糖苷酶具有改进的β-葡糖苷酶活性的示例性β-葡糖苷酶多肽变体。在一些实施方案中,本发明的β-葡糖苷酶多肽变体相比于野生型嗜热子囊菌β-葡糖苷酶还具有改进的热活性、改进的热稳定性和/或在低和/或高pH下改进的稳定性。在一些实施方案中,酶变体可操作的pH范围是在约pH3至约pH8的范围内(例如,约pH5)。在一些实施方案中,酶变体可操作的温度范围是在约50℃至约80℃的范围内(例如,约70℃)。
β-葡糖苷酶可通过本领域已知的任何适宜的方法确定。在一些实施方案中,使用对硝基苯基-β-D-吡喃葡萄糖苷(pNPG)测定来确定β-葡糖苷 酶活性。在其他一些实施方案中,使用纤维二糖测定来确定β-葡糖苷酶活性。
例如,基于pNPG(对硝基苯基-β-D-吡喃葡萄糖苷)的比色测定在测量β-葡糖苷酶活性上具有用途。在另一个示例性pNPG测定中,在100μL的总体积中,将20μL包含β-葡糖苷酶的澄清培养基上清添加到pH 6.5的50mM磷酸钠缓冲液中的4mM pNPG溶液中。反应在pH 6.5、45℃下孵育1小时。用100μL pH 11的1M碳酸钠溶液猝灭反应混合物。在405nm测量溶液的吸光度来确定pNPG向对硝基苯酚的转化。在405nm测量对硝基苯酚(ε=17,700M-1cm-1)的释放来计算β-葡糖苷酶活性。在一些实施方案中,在高通量筛选条件(pH 7,50℃)下观察可检测的β-葡糖苷酶活性(见,例如,Breves等人,Appl.Environ.Microbiol,.63:3902[1997],通过引用并入本文)。
可选地,可使用利用纤维二糖作为底物的测定来确定β-葡糖苷酶活性。在100μL的总体积中,将25μL包含β-葡糖苷酶的澄清培养基上清添加到在100mM磷酸钠缓冲液(pH 6-7)或乙酸钠缓冲液(pH 5-5.5)中的10g/L纤维二糖(Fluka目录号22150,Sigma-Aldrich,Inc.,St.Louis,MO)中。反应在45-70℃下孵育适当时间(取决于酶浓度,25分钟至过夜)同时摇动。使用酶促葡萄糖测定(例如K-GLUC,Megazyme,Ireland)确定葡萄糖产生。10μl的每个反应被添加到190μl GOPOD试剂(作为K-GLUC测定试剂盒的一部分提供)中。反应在45℃孵育20分钟并且在510nm测量溶液的吸光度。GOPOD试剂包含50mM磷酸钾缓冲液pH7.4,0.011M对羟基苯甲酸、0.008%w/v叠氮化钠、葡萄糖氧化酶(>12,000U/L)、过氧化物酶(>650U/L)和80mg/L 4-氨基安替比林。试剂中的葡萄糖氧化酶与样品中存在的任何葡萄糖反应并产生过氧化氢,过氧化氢随后与4-氨基安替比林反应产生醌亚胺染料,醌亚胺染料的数量与存在的葡萄糖的量成比例并且可用分光光度计在510nm测量。
β-葡糖苷酶多核苷酸和表达***
本发明提供了编码本发明的嗜热子囊菌β-葡糖苷酶变体的多核苷酸序 列。本文提供了嗜热子囊菌基因组序列和cDNA序列。
在一些实施方案中,为了本文描述的β-葡糖苷酶变体的表达,使用野生型嗜热子囊菌cDNA序列(SEQ ID NO:1)或其包括开放阅读框的部分(根据需要,具有在对应于产生相对于野生型序列的残基改变的取代的密码子处的改变)。此外,在一些实施方案中,本文所述的“沉默”核苷酸中的一个或多个被并入。
在其他一些实施方案中,非自然存在的序列是优选的。本领域技术人员理解由于遗传密码的简并性,存在众多编码本发明的β-葡糖苷酶多肽的核苷酸序列。例如,密码子AGA、AGG、CGA、CGC、CGG和CGU均编码氨基酸精氨酸。因而,在密码子指定精氨酸的本发明核酸中的每个位置,该密码子可被改变为以上所述的对应密码子中的任何一个而不改变所编码的多肽。应理解RNA序列中的U对应于DNA序列中的T。本发明考虑并提供可通过选择基于可能的密码子选择的组合而做出的编码本发明多肽的核酸序列的每种和每个可能的变化。
还可以关于高密码子使用偏倚性密码子(即,在蛋白编码区中以高于编码同一氨基酸的其他密码子的频率被使用的密码子)来设计DNA序列。可以根据在单基因、一组具有共同功能或起源的基因、高表达基因中的密码子使用,在整个生物体的聚集蛋白编码区中的密码子频率,在相关生物体中的聚集蛋白编码区中的密码子频率或它们的组合来确定优选的密码子。频率随基因表达水平而提高的密码子通常是用于表达的优化密码子。在一些实施方案中,编码β-葡糖苷酶的DNA序列被优化以用于在特定宿主生物中表达。任何适宜的产生优化密码子的方法在本发明中有用途。通过举例说明,但非限制,SEQ ID NO:7提供了被设计具有用于在酿酒酵母中表达的密码子偏倚性的编码WTM(SEQ ID NO:4)的多核苷酸序列。表2提供了每个氨基酸的密码子。
已知用于确定具体生物体中的密码子频率(例如,密码子使用,相关的同义密码子使用)和密码子偏爱的多种方法,包括多变量分析,例如使用聚类分析或对应性分析,以及在基因中使用的密码子的有效数目(见例如,GCG CodonPreference,Genetics Computer Group Wisconsin Package;John Peden,“Codon W,”University of Nottingham[1999];McInerney,Bioinformatics 14:372-73 [1998];Stenico等人,Nucl.Acids Res.,22:2437-46[1994];Wright,Gene 87:23-29 [1990];Wada等人,Nucl.Acids Res.,20:2111-2118 [1992];Nakamura 等人,2000,Nucl.Acids Res.,28:292;以及Henaut和Danchin,于:Neidhardt等人(编),Escherichia coli andSalmonella,ASM Press,Washington D.C.,[1996],页码2047-2066,其均通过引用并入本文)。用于获得密码子使用的数据源可能依赖于任何可用的能够编码蛋白的核苷酸序列。这些数据集包括实际已知编码表达的蛋白的核酸序列(例如,完整的蛋白编码序列-CDS)、表达序列标签(EST)、 或基因组序列的预测编码区(见,例如Mount,Bioinformatics:Sequence andGenome Analysis,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,[2001],第8章;Uberbacher,Meth.Enzymol.266:259-281[1996];以及Tiwari等人,Comput.Appl.Biosci.,13:263-270[1997],其均通过引用并入本文)。
表达载体
在一些实施方案中,本发明利用包含编码如以上所述的至少一种β-葡糖苷酶的序列的重组构建体。在一些实施方案中,本发明提供了包括与异源启动子可操作地连接的至少一种β-葡糖苷酶多核苷酸的表达载体。本发明的表达载体在转化适当宿主细胞以允许宿主表达β-葡糖苷酶蛋白方面有用途。用于在真菌和其他生物体中重组表达蛋白的方法是本领域熟知的,并且许多表达载体是可用的或可使用本领域已知的常规方法来构建(见,例如,Zhu等人,Plasmid 6:128-33[2009],其通过引用并入本文)。
在一些实施方案中,本发明的核酸构建体包括本发明的至少一种核酸序列被***其中的载体(例如,质粒、黏粒、噬菌体、病毒、细菌人工染色体[BAC]、酵母人工染色体[YAC]等等)。本发明的多核苷酸可被并入适于表达多肽的各种表达载体中的任何一种。适合的载体包括但不限于:染色体、非染色体和合成的DNA序列(例如,SV40的衍生物),细菌质粒,噬菌体DNA,杆状病毒,酵母质粒,从质粒和噬菌体DNA的组合衍生的载体,或病毒DNA(例如,牛痘苗、腺病毒、鸡痘病毒、伪狂犬病毒、腺病毒、腺相关病毒、逆转录病毒等等)。将遗传物质转导到细胞中并且,如果复制是令人期望的,在选择宿主中可复制和可维持的任何适宜载体在本发明中具有用途。
在一些实施方案中,构建体还包括与蛋白编码序列可操作地连接的调节序列,包括例如,启动子。大量的适宜载体和启动子是本领域技术人员已知的。
启动子/基因构建体
如以上所指出的,为了在特定宿主中获得高表达水平,在异源启动子的控制下表达嗜热子囊菌β-葡糖苷酶通常是有用的。在一些实施方案中,使用常规方法将启动子序列与嗜热子囊菌β-葡糖苷酶编码序列的5’区域可操作地连接。
用于表达β-葡糖苷酶多核苷酸的有用的启动子的实例包括但不限于来自真菌的启动子。例如,驱动嗜热子囊菌中除β-葡糖苷酶1基因以外的基因的表达的启动子序列(例如,来自编码纤维二糖水解酶的基因的真菌启动子)在本发明中有用途。
其他可用于指导本发明的核苷酸构建体在丝状真菌宿主细胞中转录的适宜启动子的实例包括但不限于:从米曲霉TAKA淀粉酶、米黑根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定的α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡萄糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillusnidulans)乙酰胺酶、以及尖镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶(见,例如,WO 96/00787,通过引用并入本文)的基因获得的启动子,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因的启动子的杂合体),启动子诸如cbh1、cbh2、egl1、egl2、pepA、hfb1、hfb2、xyn1、amy、和glaA(见,例如,Nunberg等人,Mol.Cell Biol.,4:2306-2315 [1984];Boel等人,EMBO J.3:1581-85 [1984];和欧洲专利申请公布第137280号,其全部通过引用并入本文),及其突变的、截短的和杂合的启动子。在酵母宿主细胞中,有用的启动子包括但不限于来自酿酒酵母烯醇化酶(eno-1)、酿酒酵母半乳糖激酶(gal1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)以及酿酒酵母3-磷酸甘油酸激酶的基因的那些。用于酵母宿主细胞的其他有用的启动子包括由Romanos等人,(Romanos等人,Yeast 8:423-488[1992],其通过引用并入本文)描述的那些。与真菌(例如,白色扁丝霉(Aphanocladium album)和哈茨木霉(Trichoderma harzianum))中几丁质酶的产生有关的启动子也有用途(见,例如,Blaiseau和Lafay,Gene 120243-248[1992];和Limon等人,Curr. Genet.,28:478-83 [1995],二者均通过引用并入本文)。
已知在原核细胞或真核细胞或其病毒中控制基因表达且在本发明的一些实施方案中有用途的启动子包括但不限于SV40启动子、大肠杆菌lac或trp启动子、噬菌体λPL启动子、tac启动子、T7启动子等。对于在细菌宿主细胞中使用,适宜启动子包括但不限于从大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacilluslicheniformis)α-淀粉酶基因(amyl)、嗜热脂肪芽孢杆菌麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、枯草芽孢杆菌xylA和xylB基因,和原核β-内酰胺酶基因获得的启动子。
实际上,在适宜宿主细胞中驱动表达的任何适宜的启动子序列在本发明中具有用途。适宜的启动子序列可使用熟知方法来鉴定。在一种方法中,推定的启动子序列与编码报道蛋白的序列5’连接,将该构建体转染到宿主细胞(例如,嗜热子囊菌)中并测量报道基因的表达水平。可通过测量例如报道基因序列的mRNA水平、报道蛋白的酶活性、和/或产生的报道蛋白的量来确定报道基因的表达。例如,可通过使用绿色荧光蛋白作为编码序列(见Henriksen等人,Microbiol.,145:729-34 [1999],通过引用并入本文)或lacZ报道基因(Punt等人,Gene,197:189-93 [1997],通过引用并入本文)来确定启动子活性。可使用任何本领域已知的适宜方法借助定向进化法从自然存在的启动子序列获取功能启动子(见例如,Wright等人,Hum.Gene Ther.,16:881-892[2005],通过引用并入本文)。
表达载体任选地包含用于翻译起始的核糖体结合位点和转录终止子(例如PinII)。在一些实施方案中,载体还包括用于扩大表达的适当的序列(例如,增强子)。
此外,在一些实施方案中,本发明的表达载体包含一个或多个选择性标记基因来提供用于选择转化的宿主细胞的表型性状。适宜的标记基因包括但不限于编码抗微生物抗性(例如,对氨苄西林(ampR)、卡那霉素、氯霉素、四环素、链霉素、壮观霉素、新霉素、遗传霉素、潮霉素等等) 的那些标记基因,包括但不限于aada基因、链霉素磷酸转移酶(spt)基因、新霉素磷酸转移酶(nptII)基因或潮霉素磷酸转移酶(hpt)基因。另外的选择性标记基因包括但不限于用于真核细胞的二氢叶酸还原酶或新霉素抗性,以及在大肠杆菌中的四环素或氨苄西林抗性。
β-葡糖苷酶多核苷酸的合成和操作
可使用本领域已知的任何适宜方法制备编码β-葡糖苷酶的多核苷酸。在一些实施方案中,高达大约40个碱基的寡核苷酸被个体地合成,然后连接(例如,通过酶连接或化学连接方法或聚合酶介导的方法)形成基本上任何期望的连续序列。在一些实施方案中,通过使用例如经典亚磷酰胺方法(见例如,Beaucage等人,Tetrahed.Lett.,22:1859-69[1981];和Matthes,等人,EMBO J.3:801-05[1984],二者均通过引用并入本文)的化学合成来制备本发明的多核苷酸。这些方法通常在自动化合成方法中实践。例如,在亚磷酰胺方法中,寡核苷酸被合成(例如在自动化DNA合成器中),纯化,退火,连接并克隆到适当载体中。
另外,基本上任何核酸都可以从各种商业来源中的任何一种定制,诸如The Midland Certified Reagent Company(Midland,TX),The GreatAmerican Gene Company(Ramona,CA),ExpressGen Inc.(Chicago,IL),Operon Technologies Inc.(Alameda,CA)以及许多其他来源。因而,这些商业公司提供的核酸也在本发明中具有用途。
还旨在通过诉诸熟知技术来合成本发明的多核苷酸(见例如,Carruthers,等人,Cold Spring Harbor Symp.Quant.Biol.,47:411-18 [1982];和Adams等人,J.Am.Chem.Soc.,105:661 [1983],二者均通过引用并入本文)。在一些实施方案中,然后通过合成互补链并且在适当条件下使链退火在一起,或者使用DNA聚合酶与适当引物序列添加互补链来获得双链DNA片段。对于体外扩增方法,包括聚合酶链反应(PCR)和连接酶链反应(LCR),以及许多其他的相关方法,存在许多本领域技术人员已知的教科书和参考文献。
表达宿主
本发明还提供了用编码β-葡糖苷酶的表达载体或DNA构建体转化的工程化(重组)的宿主细胞。在一些实施方案中,细胞中β-葡糖苷酶的表达在异源启动子的控制之下。在一些实施方案中,本发明的宿主细胞用于产生β-葡糖苷酶多肽。因而,本发明涉及至少一种包含被描述的本发明的任何β-葡糖苷酶多核苷酸的宿主细胞。如本文所用,遗传修饰的或重组的宿主细胞包括含编码本发明的至少一种重组多肽的至少一种β-葡糖苷酶多核苷酸的宿主细胞的后代。在一些实施方案中,遗传修饰的或重组的宿主细胞是微生物。在一些实施方案中,遗传修饰的或重组的宿主细胞是原核细胞。在一些实施方案中,遗传修饰的或重组的宿主细胞是真核细胞。在一些实施方案中,真核宿主细胞是非人类细胞。适宜的真核宿主细胞包括但不限于真菌细胞、藻类细胞、昆虫细胞和植物细胞。在一些实施方案中,宿主细胞被修饰以增加蛋白表达、分泌或稳定性,或赋予其他期望的特征。已被突变或选择具有低蛋白酶活性的细胞(例如真菌)对于表达是特别有用的。例如,在一些实施方案中,嗜热子囊菌的蛋白酶缺陷菌株(例如,其中碱性蛋白酶基因座已被缺失或破坏)具有用途。
适宜的真菌宿主细胞包括但不限于子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、不完全菌(Deuteromycota)、接合菌门(Zygomycota)和半知菌(Fungi imperfecti)。在一些实施方案中,真菌宿主细胞是酵母细胞或丝状真菌细胞。本发明的丝状真菌宿主细胞包括真菌亚门(Eumycotina)和卵菌门(Oomycota)的所有丝状形式。丝状真菌的特征为营养菌丝和由几丁质、纤维素及其他复杂多糖组成的细胞壁。本发明的丝状真菌宿主细胞与酵母在形态学上是不同的。在一些实施方案中,丝状真菌宿主细胞是绵霉属(Achlya)、枝顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管菌属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、头孢霉属(Cephalosporium)、金孢属(Chrysosporium)、旋孢腔菌属(Cochliobolus)、棒囊壳属(Corynascus)、隐丛赤壳属(Cryphonectria)、隐球菌属(Cryptococcus)、鬼伞属(Coprinus)、 革盖菌属(Coriolus)、色二孢属(Diplodia)、内座壳属(Endothia)、镰孢菌属(Fusarium)、赤霉菌属(Gibberella)、粘帚霉属(Gliocladium)、腐质霉属(Humicola)、肉座菌属(Hypocrea)、毁丝霉属(Myceliophthora)、毛霉属(Mucor)、链孢霉属(Neurospora)、青霉属(Penicillium)、Podospora、射脉革菌属(Phlebia)、Piromyces、梨孢属(Pyricularia)、根毛霉属(Rhizomucor)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、节格孢属(Scytalidium)、侧孢霉属(Sporotrichum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、栓菌属(Trametes)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)的种,或其无性型或有性型,以及同义词或分类学等同物。然而,不旨在本发明被限于任何具体物种的丝状真菌宿主细胞。
在本发明的一些实施方案中,丝状真菌宿主细胞是曲霉属物种(Aspergillus sp.)、拟蜡菌属物种(Ceriporiopsis sp.)、金孢属物种(Chrysosporium sp.)、棒囊壳菌属物种(Corynascus sp.)、镰孢菌属物种(Fusarium sp.)、腐质霉属物种(Humicola sp.)、链孢霉属物种(Neurosporasp.)、青霉属物种(Penicillium sp.)、弯颈霉属物种(Tolypocladium sp.)、栓菌属物种(Tramates sp.)或木霉属物种(Trichoderma sp.)。
在本发明的一些实施方案中,丝状真菌宿主细胞是木霉属的种(例如,长枝木霉(T.longibrachiatum)、绿色木霉(T.viride)[例如,ATCC32098和32086]),红褐肉座菌(Hypocreajecorina)或里氏木霉(NRRL15709、ATTC 13631、56764、56765、56466、56767和RL-P37及其衍生物;见Sheir-Neiss等人,Appl.Microbiol.Biotechnol.,20:46-53[1984],其通过引用并入本文),康氏木霉(T.koningii)或哈茨木霉。另外,术语“木霉属”是指之前分类为木霉属的任何真菌菌株以及目前分类为木霉属的那些菌株。
在本发明的一些实施方案中,丝状真菌宿主细胞是曲霉属的种(例如,泡盛曲霉、烟曲霉(A.funigatus)、日本曲霉(A.japonicus)、构巢曲霉、黑曲霉、棘孢曲霉(A.aculeatus)、臭曲霉(A.foetidus)、米曲霉、 酱油曲霉(A.sojae)、或A.kawachi;见例如,Kelly和Hynes、EMBO J.4,475479[1985];NRRL 3112、ATCC 11490、22342、44733、及14331;Yelton等人,Proc.Natl.Acad.Sci.USA,81,1470-1474[1984];Tilburn等人,Gene 26,205-221[1982];和Johnston等人,EMBO J.,4:1307-1311[1985],其全部通过引用并入本文)。
在本发明的一些实施方案中,丝状真菌宿主细胞是镰孢菌属的种(例如,F.bactridioides、F.cerealis、克鲁克威尔镰孢(F.crookwellense)、大刀镰孢(F.culmorum)、禾谷镰孢(F.graminearum)、禾赤镰孢(F.graminum)、尖镰孢(F.oxysporum)、粉红镰孢(F.roseum)或F.venenatum)。在本发明的一些实施方案中,丝状真菌细胞是链孢霉属的种(例如,N.crassa;见例如Case等人,Proc.Natl.Acad.Sci.USA,76,5259-5263[1979];美国专利第4,486,553号;以及Kinsey和Rambosek,Mol.Cell.Biol.,4:117-122[1984],其全部通过引用并入本文)。
在本发明的一些实施方案中,丝状真菌宿主细胞是腐质霉属的种(例如,特异腐质霉、灰腐质霉(H.grisea)或柔毛腐质霉(H.lanuginosa))。在本发明的一些实施方案中,丝状真菌宿主细胞是毛霉属(例如,米黑毛霉或卷枝毛霉(M circinelloides))。在本发明的一些实施方案中,丝状真菌宿主细胞是根霉属的种(例如,米根霉(R.oryzae)或雪白根霉(R.niveus))。在本发明的一些实施方案中,丝状真菌宿主细胞是青霉属的种(例如,产紫青霉(P.purpurogenum)、产黄青霉(P.chrysogenum)或疣孢青霉(P.verruculosum))。在本发明的一些实施方案中,丝状真菌宿主细胞是梭孢壳属的种(例如,太瑞斯梭孢壳霉(T.terrestris))。在本发明的一些实施方案中,丝状真菌宿主细胞是弯颈霉属的种(例如,膨大弯颈霉(T.inflatum)或T.geodes)。在本发明的一些实施方案中,丝状真菌宿主细胞是栓菌属的种(例如,长绒毛栓菌(T.villosa)或变色栓菌(T.versicolor))。
在本发明的一些实施方案中,丝状真菌宿主细胞是金孢属的种(例如,C.lucknowense、嗜角蛋白金孢(C.keratinophilum)、热带金孢(C.tropicum)、粪状金孢(C.merdarium)、C.inops、C.pannicola或C. zonatum)。在一些实施方案中,宿主细胞是C.lucknowense。
在本发明的一些实施方案中,酵母宿主细胞具有用途,包括但不限于假丝酵母属(Candida)、汉逊酵母属(Hansenula)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyce)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)和耶氏酵母属(Yarrowia)的种。在本发明的一些实施方案中,酵母细胞是多形汉逊酵母(Hansenulapolymorpha)、酿酒酵母(Saccharomyces cerevisiae)、卡氏酵母(Saccharomyces carlsbergensis)、糖化酵母(Saccharomyces diastaticus)、奇异酵母(Saccharomyces norbensis)、克氏酵母(Saccharomyceskluyveri)、粟酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母(Pichia pastoris)、芬兰毕赤酵母(Pichia finlandica)、喜海藻糖毕赤酵母(Pichia trehalophila)、Pichia kodamae、膜醭毕赤酵母(Pichiamembranaefaciens)、Pichia opuntiae、耐热毕赤酵母(Pichiathermotolerans)、柳毕赤酵母(Pichia salictaria)、Pichia quercuum、皮杰普毕赤酵母(Pichia pijperi)、树干毕赤酵母(Pichia stipitis)、甲醇毕赤酵母(Pichia methanolica)、安格斯毕赤酵母(Pichia angusta)、乳酸克鲁维酵母(Kluyveromyces lactis)、白色念珠菌(Candida albicans)或解脂耶氏酵母(Yarrowia lipolytica)。
在本发明的一些实施方案中,宿主细胞是藻类细胞诸如衣藻属(Chlamydomonas)(例如,莱茵衣藻(C.Reinhardtii))或席藻属(Phormidium)(席藻属物种(P.sp.)ATCC29409)。
在其他一些实施方案中,宿主细胞是原核细胞。适宜的原核细胞包括革兰氏阳性、革兰氏阴性和革兰氏染色不定(Gram-variable)的细菌细胞。在一些实施方案中,宿主细胞是土壤杆菌属(Agrobacterium)、脂环酸杆菌属(Alicyclobacillus)、鱼腥蓝细菌属(Anabaena)、组囊蓝细菌属(Anacystis)、不动杆菌属(Acinetobacter)、热酸菌属(Acidothermus)、Arthrobacter(节杆菌属)、固氮菌属(Azobacter)、芽孢杆菌属(Bacillus)、双歧杆菌属(Bifidobacterium)、短杆菌属(Brevibacterium)、丁酸弧菌属(Butyrivibrio)、巴克纳氏菌属(Buchnera)、Campestris、弯曲菌属 (Camplyobacter)、梭菌属(Clostridium)、棒杆菌属(Corynebacterium)、着色菌属(Chromatium)、粪球菌属(Coprococcus)、埃希氏菌属(Escherichia)、肠球菌属(Enterococcus)、肠杆菌属(Enterobacter)、欧文氏菌属(Erwinia)、梭杆菌属(Fusobacterium)、Faecalibacterium、弗朗西丝氏菌属(Francisella)、黄杆菌属(Flavobacterium)、土芽孢杆菌属(Geobacillus)、嗜血菌属(Haemophilus)、螺杆菌属(Helicobacter)、克雷伯氏菌属(Klebsiella)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、泥杆菌属(Ilyobacter)、微球菌属(Micrococcus)、微杆菌属(Microbacterium)、中慢生根瘤菌属(Mesorhizobium)、甲基杆菌属(Methylobacterium)、甲基杆菌属、分枝杆菌属(Mycobacterium)、奈瑟氏球菌属(Neisseria)、泛菌属(Pantoea)、假单胞菌属(Pseudomonas)、原绿球藻属(Prochlorococcus)、红细菌属(Rhodobacter)、红假单胞菌属(Rhodopseudomonas)、红假单胞菌属、罗氏菌属(Roseburia)、红螺菌属(Rhodospirillum)、红球菌属(Rhodococcus)、栅藻属(Scenedesmus)、链霉菌属(Streptomyces)、链球菌属(Streptococcus)、集球藻属(Synechococcus)、糖单孢菌属(Saccharomonospora)、葡萄球菌属(Staphylococcus)、沙雷氏菌属(Serratia)、沙门氏菌属(Salmonella)、志贺氏菌属(Shigella)、热厌氧杆菌属(Thermoanaerobacterium)、Tropheryma、Tularensis、Temecula、嗜热聚球蓝细菌属(Thermosynechococcus)、热球菌属(Thermococcus)、尿枝原体属(Ureaplasma)、黄单胞菌属(Xanthomonas)、木杆菌属(Xylella)、耶尔森氏菌属(Yersinia)或发酵单胞菌属(Zymomonas)的种。然而,不旨在宿主细胞被限于任何具体的属或种的细菌,因为任何适宜的细菌在本发明中具有用途。
在一些实施方案中,宿主细胞是土壤杆菌属、不动杆菌属、固氮菌属、芽孢杆菌属、双歧杆菌属、巴克纳氏菌属、土芽孢杆菌属、弯曲菌属、梭菌属、棒杆菌属、埃希氏菌属、肠球菌属、欧文氏菌属、黄杆菌属、乳杆菌属、乳球菌属、泛菌属、假单胞菌属、葡萄球菌属、沙门氏菌属、链球菌属、链霉菌属、或发酵单胞菌属的种。
在其他一些实施方案中,细菌宿主菌株是对人非致病的。在一些实施 方案中,细菌宿主菌株是工业菌株。众多细菌工业菌株是已知的且适合用于本发明。实际上,旨在任何适宜菌株在本发明中具有用途。
在本发明的一些实施方案中,细菌宿主细胞是土壤杆菌属的种(例如,放射形土壤杆菌(A.radiobacter)、发根土壤杆菌(A.rhizogenes)或钩子土壤杆菌(A.rubi))。在本发明的一些实施方案中,细菌宿主细胞是节杆菌属的种(例如,金黄节杆菌(A.aurescens)、柠檬节杆菌(A.citreus)、球形节杆菌(A.globformis)、裂烃谷氨酸节杆菌(A.hydrocarboglutamicus)、迈索尔节杆菌(A.mysorens)、烟草节杆菌(A.nicotianae)、石蜡节杆菌(A.paraffineus)、原玻璃蝇短杆菌(A.protophonniae)、玫瑰色石蜡节杆菌(A.roseoparqffinus)、硫磺节杆菌(A.sulfureus)、或产脲节杆菌(A.ureafaciens))。在本发明的另外一些实施方案中,细菌宿主细胞是芽孢杆菌属的种(例如,苏云金芽孢杆菌(B.thuringiensis)、炭疽芽孢杆菌(B.anthracis)、巨大芽孢杆菌(B.megaterium)、枯草芽孢杆菌(B.subtilis)、迟缓芽孢杆菌(B.lentus)、环状芽孢杆菌(B.circulans)、短小芽孢杆菌(B.pumilus)、灿烂芽孢杆菌(B.lautus)、凝结芽孢杆菌(B.coagulans)、短芽孢杆菌(B.brevis)、坚强芽孢杆菌(B.firmus)、B.alkaophius、地衣芽孢杆菌(B.licheniformis)、克劳氏芽孢杆菌(B.clausii)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、耐盐嗜碱芽孢杆菌(B.halodurans)、或解淀粉芽孢杆菌(B.amyloliquefaciens)。在特定实施方案中,宿主细胞将是工业芽孢杆菌菌株,包括但不限于枯草芽孢杆菌、短小芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、克劳氏芽孢杆菌、嗜热脂肪芽孢杆菌、或解淀粉芽孢杆菌)。在一些实施方案中,芽孢杆菌属宿主细胞是枯草芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、或解淀粉芽孢杆菌。在一些实施方案中,细菌宿主细胞是梭菌属的种(例如,丙酮丁醇梭菌(C.acetobutylicum)、破伤风梭菌(C.tetani)E88、象牙海岸梭菌(C.lituseburense)、糖丁酸梭菌(C.saccharobutylicum)、产气荚膜梭菌(C.perfringens)、热纤梭菌(C.thermocellum)或拜氏梭菌(C.beijerinckii))。在一些实施方案中,细菌宿主细胞是棒杆菌属的种(例如,谷氨酸棒杆菌(C.glutamicum)或嗜乙酰乙酸棒杆菌(C.acetoacidophilum))。在一些实施方案中,细菌宿主细胞 是埃希氏菌属的种(例如大肠杆菌)。在一些实施方案中,细菌宿主细胞是欧文氏菌属的种(例如,噬夏孢欧文氏菌(E.uredovora)、胡萝卜软腐欧文氏菌(E.carotovora)、菠萝欧文氏菌(E.ananas)、草生欧文氏菌(E.herbicola)、点状欧文氏菌(E.punctata)或土欧文氏菌(E.terreus))。在一些实施方案中,细菌宿主细胞是泛菌属的种(例如柠檬泛菌(P.citrea)或成团泛菌(P.agglomerans))。在一些实施方案中,细菌宿主细胞是假单胞菌属的种(例如,恶臭假单胞菌(P.putida)、荧光假单胞菌(P.fluorescens)、铜绿假单胞菌(P.aeruginosa)、P.mevalonii或假单胞菌D-0l10)。在一些实施方案中,细菌宿主细胞是链球菌属的种(例如,似马链球菌(S.equisimiles)、酿脓链球菌(S.pyogenes)或***链球菌(S.uberis))。在一些实施方案中,细菌宿主细胞是链霉菌属的种(例如,产二素链霉菌(S.ambofaciens)、不产色链霉菌(S.achromogenes)、除虫链霉菌(S.avermitilis)、天蓝色链霉菌(S.coelicolor)、生金色链霉菌(S.aureofaciens)、金色链霉菌(S.aureus)、杀真菌素链霉菌(S.fungicidicus)、灰色链霉菌(S.griseus)或浅青紫链霉菌(S.lividans))。在一些实施方案中,细菌宿主细胞是发酵单胞菌属的种(例如,运动发酵单胞菌(Z.mobilis)或解脂发酵单胞菌(Z.lipolytica))。
在本发明中具有用途的菌株包括原核和真核菌株,对于公众来说是容易从许多培养物保藏中心获得,诸如美国模式培养物保藏中心(American Type Culture Collection,ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH,DSM)、皇家荷兰生物科技研究所培养物保藏中心(Centraalbureau VoorSchimmelcultures,CBS)和美国北部区域研究中心农业研究服务专利培养物保藏中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center,NRRL)。
在本发明的一些实施方案中,宿主细胞被遗传修饰以具有改进蛋白分泌、蛋白稳定性或其他蛋白表达和/或分泌所期望的特性的特征。旨在通过使用任何本领域已知的适宜方法实现遗传修饰,包括但不限于基因工程技术、经典微生物学技术(例如,化学诱变或紫外线诱变以及随后的选择)。 在一些实施方案中,重组修饰和经典选择技术的组合用于产生感兴趣的生物体。使用重组技术,以导致生物体或培养物内β-葡糖苷酶产量增加的方式将核酸分子引入、缺失、抑制或修饰。例如,Alp1功能的敲除得到不表达大部分或全部纤维素酶的细胞。pyr5功能的敲除得到具有嘧啶缺陷表型的细胞。这些修饰和其他修饰在本发明中具有用途。
转化和培养
用于将载体或DNA构建体引入宿主细胞的任何适宜方法在本发明中具有用途,包括但不限于磷酸钙转染、DEAE-葡聚糖介导的转染、电穿孔或其他本领域已知的常见技术。
在本发明的一些实施方案中,工程化宿主细胞被培养在改良为适合激活启动子、选择转化子和/或扩增β-葡糖苷酶多核苷酸的常规营养培养基中。培养条件诸如温度、pH等是之前被选择用于表达的宿主细胞所用的培养条件,并且将对本领域技术人员是明显的。许多参考文献对本领域技术人员已知的并且对于许多细胞的培养和产生是可用的,所述细胞包括细菌、植物、动物(尤其是哺乳动物)和古细菌来源的细胞。
在本发明的一些实施方案中,表达本发明的β-葡糖苷酶多肽的宿主细胞生长在分批发酵或连续发酵条件下。经典的“分批发酵”是封闭***,其中培养基的组成在发酵开始时设定并且在发酵期间不经历人为改变。批次***的改变是“分批补料发酵(fed-batch fermentation)”,其也在本发明中具有用途。在分批补料***中,基质随着发酵进行被增量加入。当分解代谢物阻遏(catabolite repression)可能抑制细胞的代谢时和在期望培养基中具有有限量的基质的情况下,分批补料***是有用的。分批发酵和分批补料发酵在本领域中是常见的和熟知的。“连续发酵”是确定成分的发酵培养基被连续添加到生物反应器并且等量的条件培养基被同时移出用于加工的开放***。连续发酵一般保持培养物在恒定的高密度,其中细胞主要处于对数期生长。连续发酵***努力保持稳定态生长条件。用于调整营养和生长因子用于连续发酵过程的方法以及使产物形成速率最大化的技术是工业微生物学领域熟知的。
在本发明的一些实施方案中,使用本发明的多核苷酸采用无细胞的转录/翻译***来产生β-葡糖苷酶多肽。几种此类***是市售的并且是本领域技术人员熟知的。
β-葡糖苷酶多肽的产生和回收
本发明提供了制备具有β-葡糖苷酶活性的多肽的方法。在一些实施方案中,方法包括提供用本发明的任何一种(或多种)描述的β-葡糖苷酶多核苷酸转化的宿主细胞;在宿主细胞表达编码的β-葡糖苷酶多肽的条件下将该转化的宿主细胞培养在培养基中;和任选地回收或分离表达的β-葡糖苷酶多肽,或回收或分离含表达的β-葡糖苷酶多肽的培养基。在本发明的一些实施方案中,方法还提供在表达编码的β-葡糖苷酶多肽后裂解转化的宿主细胞的步骤。在一些实施方案中,在转化的细胞被裂解后,表达的β-葡糖苷酶多肽从细胞裂解物中被回收或分离。本发明还提供了制备至少一种β-葡糖苷酶多肽的方法,包括在适于产生至少一种β-葡糖苷酶多肽的条件下培养用至少一种β-葡糖苷酶多核苷酸转化的宿主细胞并且回收至少一种产生的β-葡糖苷酶多肽。
在一些实施方案中,使用本领域熟知的蛋白回收技术包括本文描述的那些技术,从宿主细胞培养基、宿主细胞或二者中回收或分离β-葡糖苷酶多肽。在一些实施方案中,通过离心收集细胞,通过物理或化学手段破坏细胞,且保留所得粗提取物用于进一步纯化。考虑任何适于破坏表达β-葡糖苷酶多肽的细胞的任何方法在本发明中具有用途,这些方法包括但不限于冻-融循环、声处理、机械破坏或使用细胞裂解剂,或本领域技术人员熟知的其他方法。
在本发明的一些实施方案中,所得多肽被回收/分离并任选地通过许多本领域已知方法中的任一种被纯化。例如,在一些实施方案中,多肽通过常规程序从营养培养基中分离,所述常规程序包括但不限于离心、过滤、提取、喷雾干燥、蒸发、色谱(例如,离子交换色谱、亲和色谱、疏水相互作用色谱、色谱聚焦、和/或尺寸排阻色谱)和/或沉淀。在一些实施方案中,根据期望/需要使用蛋白重折叠步骤,以获得多肽的正确构象。另外, 在一些实施方案中,在最后的纯化步骤中利用高效液相色谱(HPLC)(见例如,Parry等人,Biochem.J.,353:117[2001];和Hong等人,Appl.Microbiol.Biotechnol.73:1331[2007],二者均通过引用并入本文)。存在本领域已知的多种纯化方法并且任何适宜方法在本发明中具有用途。
在一些实施方案中,使用免疫学方法来纯化β-葡糖苷酶多肽。在一些实施方案中,使用常规方法针对至少β-葡糖苷酶多肽(例如针对包含SEQID NO:2的多肽或其免疫原性片段)产生的抗体被固定在珠上,在β-葡糖苷酶被结合的条件下与细胞培养基混合,并沉淀。在其他一些实施方案中,免疫色谱具有用途。
在本发明的一些实施方案中,β-葡糖苷酶作为包含非酶部分的融合蛋白表达。在一些实施方案中,β-葡糖苷酶序列与促进纯化的结构域(purification facilitating domain)融合。如本文所用,术语“促进纯化的结构域”是指介导与之融合的多肽的纯化的结构域。适宜的纯化结构域包括但不限于金属螯合肽,允许在固定化金属上纯化的组氨酸-色氨酸模块,结合谷胱甘肽的序列(例如GST),血凝素(HA)标签(即,对应于从流感血凝素蛋白获取的表位;Wilson等人,Cell 37:767 [1984]),麦芽糖结合蛋白序列,在FLAGS延伸/亲和纯化***(Immunex Corp,Seattle,Wash)中利用的FLAG表位,以及类似的纯化结构域。在纯化结构域和HHDH多肽之间包含蛋白酶可切割的多肽连接体序列可用于促进纯化。考虑在本文所述的组合物和方法中使用的一种表达载体提供包含由肠激酶切割位点分隔的融合于聚组氨酸区域的本发明多肽的融合蛋白的表达。组氨酸残基促进IMIAC(固定化金属离子纯化色谱;见例如,Porath等人,Prot.Express.Purific.,3:263-281[1992])纯化,而肠激酶切割位点提供将HHDH多肽从融合蛋白分离的手段。pGEX载体(Promega;Madison,Wis.)在表达具有谷胱甘肽S转移酶(GST)的本发明的融合多肽方面也具有用途。一般地说,这些融合蛋白是可溶的,并且通过吸附于配体-琼脂糖珠(例如,在GST-融合物情况下的谷胱甘肽-琼脂糖),接着在游离配体的存在下洗脱,可容易地从裂解细胞中纯化。
使用β-葡糖苷酶多肽和表达β-葡糖苷酶多肽的细胞的方法
如本文所述,本发明的β-葡糖苷酶多肽在催化糖二聚体的水解同时释放相应的糖单体(例如,纤维二糖的转化同时释放葡萄糖)方面具有用途。因而,本发明提供了通过以下方式产生葡萄糖的方法:(a)提供纤维二糖;和(b)使纤维二糖与本发明的至少一种β-葡糖苷酶多肽在足以形成将纤维二糖转化为葡萄糖的反应混合物的条件下接触。在一些实施方案中,在此类方法中以分离形式利用β-葡糖苷酶多肽,而在其他实施方案中,至少一种β-葡糖苷酶多肽被用作组合物的一部分。在一些实施方案中,β-葡糖苷酶多肽在细胞培养基或在细胞裂解物中提供。在一些实施方案中,在通过培养用本发明的β-葡糖苷酶多核苷酸或载体转化的宿主细胞产生β-葡糖苷酶多肽以后,β-葡糖苷酶不必从培养基(即,如果β-葡糖苷酶被分泌到培养基中的话)或细胞裂解物(即,如果β-葡糖苷酶没有被分泌到培养基中的话)中分离或不必以可用于使用β-葡糖苷酶多肽的另外的方法的纯化形式使用。旨在包含本发明的至少一种β-葡糖苷酶多肽的任何组合物、细胞培养基或细胞裂解物适于在利用β-葡糖苷酶的方法中使用。因此,本发明还提供了通过以下方式产生葡萄糖的方法:(a)提供纤维二糖;和(b)使纤维二糖与包含本发明的至少一种β-葡糖苷酶多肽的培养基或细胞裂解物或组合物在足以形成将纤维二糖转化为葡萄糖的反应混合物的条件下接触。
本发明还提供了可用于将纤维二糖酶促转化为葡萄糖的组合物。例如,在本发明的一些实施方案中,将一种或多种β-葡糖苷酶多肽与如本文所述的至少一种另外的酶和/或改变块体材料处理特性或β-葡糖苷酶另外的加工性的剂(例如,助流剂、水、缓冲剂、表面活性剂等)或改进纤维二糖转化成葡萄糖的效率的剂组合。在一些实施方案中,另外的酶是不同的β-葡糖苷酶,而在其他实施方案中,是另一种纤维素酶或来自不同类别的酶(例如,淀粉酶等等)。
纤维素酶混合物
在本发明的一些实施方案中,将本文提供的至少一种β-葡糖苷酶与其 他纤维素酶组合形成纤维素酶混合物。在一些实施方案中,纤维素酶混合物包括选自CBH、EG和BG纤维素酶的纤维素酶(例如,来自里氏木霉(例如,可购自Sigma-Aldrich,Inc.的来自里氏木霉ATCC编号25921的C2730纤维素酶;和可购自Genencor的C9870 ACCELLERASETM 1500),解纤维热酸菌(Acidothermus cellulolyticus)、褐色嗜热裂孢菌(Thermobifidafusca)、灰腐质霉和金孢菌的纤维素酶)。纤维素酶混合物的酶一起作用来解晶并水解生物质基质中的纤维素以产生可溶性糖,包括但不限于葡萄糖。
用于有效酶促水解纤维素的纤维素酶混合物是已知的(见例如,Viikari等人,Adv.Biochem.Eng.Biotechnol.,108:121-45,[2007];和美国专利申请公布US 2009/0061484;US 2008/0057541;和US 2009/0209009;每一篇均通过引用并入本文)。在一些实施方案中,将纯化的自然存在或重组的酶的混合物与纤维素原料或纤维素水解产物组合。可选地或另外地,可将各自产生一种或多种自然存在或重组的纤维素酶的一个或多个细胞群体与纤维素原料或纤维素水解产物组合。
β-葡糖苷酶组合物的其他组分
在一些实施方案中,本发明的β-葡糖苷酶多肽在包含多肽与其他任选成分诸如缓冲剂、表面活性剂和/或精练剂的组合的组合物中使用。在一些实施方案中,至少一种缓冲剂用于本发明的β-葡糖苷酶多肽(任选地与其他纤维素酶组合,包括另一种β-葡糖苷酶和/或其他酶)以保持采用β-葡糖苷酶的溶液中期望的pH。采用的缓冲液的精确浓度将取决于本领域技术人员可确定的若干因素。适宜的缓冲剂是本领域熟知的。在一些实施方案中,至少一种表面活性剂与本发明的β-葡糖苷酶组合使用。适宜的表面活性剂包括与β-葡糖苷酶以及任选地使用的任何其他纤维素酶和/或酶相容的任何表面活性剂。示例性表面活性剂包括但不限于阴离子表面活性剂、非离子表面活性剂和两性表面活性剂。
适合的阴离子表面活性剂包括但不限于直链或支链的烷基苯磺酸盐;具有直链或支链的烷基或烯基的烷基或烯基醚硫酸盐;烷基或烯基硫酸 盐;烯基磺酸盐;烷基磺酸盐等等。适合的阴离子表面活性剂的反离子包括但不限于碱金属离子(例如,钠和钾);碱土金属离子(例如,钙和镁);铵离子;和具有1到3个碳数目2或3的链烷醇基团的链烷醇胺。适于在本发明的实践中使用的两性表面活性剂包括但不限于季铵盐磺酸盐、甜菜碱型两性表面活性剂等等。适合的非离子表面活性剂包括但不限于聚氧化烯醚以及高级脂肪酸烷醇酰胺或其烯化氧加合物,脂肪酸甘油单酯等等。在一些实施方案中,表面活性剂的混合物(例如,本领域熟知的那些)在本发明中具有用途。
从纤维素生物质产生可发酵的糖
在本发明的一些实施方案中,本发明的β-葡糖苷酶多肽以及包含此类β-葡糖苷酶多肽的任何组合物、培养基或细胞裂解物用于从生物质产生作为化学原料或发酵原料的单糖、二糖或单糖或二糖的寡聚物。如本文所用,术语“生物质”是指包含多糖基质(例如,纤维素、淀粉等等)的活的或死的生物材料。因此,本发明提供了用于将生物质基质转化为可发酵的糖的方法,所述方法包括使包含本发明的至少一种β-葡糖苷酶多肽的培养基或细胞裂解物与生物质基质在适于产生可发酵的糖的条件下接触。本发明还提供了通过以下方式将生物质基质转化为可发酵的糖的方法:(a)预处理纤维素基质以提高其对水解的敏感性;(b)将步骤(a)的预处理的纤维素基质与包含本发明的至少一种β-葡糖苷酶多肽(和任选的其他纤维素酶和/或其他酶)的组合物、培养基或细胞裂解物在适于产生可发酵的糖的条件下接触。
在本发明的一些实施方案中,生物质包括但不限于纤维素基质,纤维素基质包括但不限于木材、木浆、纸浆、玉米秸秆、玉米纤维、稻、纸和浆加工废物(paper and pulp processing waste)、木本植物或草本植物、水果或蔬菜浆(fruit or vegetable pulp)、酒糟(distillers grain)、草、稻壳、麦秸、棉花、***、亚麻、剑麻、玉米芯、甘蔗渣、柳枝稷及其混合物。在一些实施方案中,使用本领域已知的方法诸如化学、物理和生物学预处理(例如,蒸汽***、制浆、研磨、酸水解、溶剂暴露等等以及其组合) 对生物质进行预处理以提高纤维素对水解的敏感性。在一些实施方案中,生物质包括表达降解木质素和纤维素的木质素酶和/或纤维素酶的转基因植物(见例如,美国专利申请公布第2008/0104724号,其通过引用并入本文)。
在一些实施方案中,β-葡糖苷酶多肽、包含β-葡糖苷酶多肽的组合物、细胞培养基和/或细胞裂解物与生物质或预处理的生物质在以下范围内的温度反应:约25℃至约100℃、约30℃至约90℃、约30℃至约80℃、约40℃至约80℃以及约35℃至约75℃。而且,生物质可与β-葡糖苷酶多肽、包含β-葡糖苷酶多肽的组合物、细胞培养基和/或细胞裂解物在约25℃、在约30℃、在约35℃、在约40℃、在约45℃、在约50℃、在约55℃、在约60℃、在约65℃、在约70℃、在约75℃、在约80℃、在约85℃、在约90℃、在约95℃、或在约100℃的温度反应。除了以上所述的温度以外,适于采用本发明的至少一种β-葡糖苷酶多肽(任选地在组合物、细胞培养基或细胞裂解物中)将生物质基质转化为可发酵的糖的条件包括在以下范围内的pH进行该过程:约pH 3.0至约8.5、约pH 3.5至约8.5、约pH 4.0至约7.5、约pH 4.0至约7.0以及约pH 4.0至约6.5。本领域技术人员理解用于将具体生物质基质转化为可发酵的糖的反应时间可改变,但最佳反应时间可容易地确定。示例性反应时间包括但不限于以下范围内的时间:约1至约240小时、约5至约180小时以及约10至约150小时。例如,孵育时间可以是至少1小时、至少5小时、至少10小时、至少15小时、至少25小时、至少50hr、至少100小时、至少180小时等等(即,用于使用的特定***的任何适宜的孵育时间)。
在一些实施方案中,β-葡糖苷酶与生物质基质或预处理的生物质基质在这些条件下的反应导致大量可溶性糖从基质中释放。例如,在一些实施方案中,与野生型嗜热子囊菌释放的糖相比,至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或更多的可溶性糖是可用的。在一些实施方案中,制得的可用的可溶性糖的量比相同条件下野生型嗜热子囊菌制得的可用的量大至少2倍、至少3倍、至少4倍、或至少5倍。在一些实施方案中,可溶性糖包括葡萄糖。
在一些实施方案中,由本发明的方法产生的可溶性糖用于产生至少一种醇(例如,乙醇、丁醇等等)。本发明因此提供了产生至少一种醇的方法,其中该方法包括:(a)提供使用本发明的至少一种β-葡糖苷酶多肽在本文所述的方法中产生的可发酵的糖;(b)使该可发酵的糖与发酵微生物接触以产生至少一种醇和/或其他代谢产物;和(c)回收至少一种醇和/或其他代谢产物。
在一些实施方案中,本发明的至少一种β-葡糖苷酶多肽、包含β-葡糖苷酶多肽的组合物、包含β-葡糖苷酶多肽的细胞培养基和/或细胞裂解物用于在存在发酵微生物诸如酵母(例如酵母菌,诸如酿酒酵母;毕赤酵母;等等)或其他本领域熟知的C5或C6发酵微生物(例如,发酵单胞菌、大肠杆菌)来催化生物质基质水解成可发酵的糖,以产生终产物诸如乙醇。在涉及同步糖化和发酵(SSF)工艺的方法中,通过发酵工艺从***中除去可发酵的糖(例如,葡萄糖和/或木糖)。
通过利用本发明的β-葡糖苷酶多肽产生的可溶性糖也在产生其他终产物(例如,丙酮、氨基酸[例如,甘氨酸、赖氨酸等等],有机酸[例如,乳酸等等],甘油,二醇[例如,1,3丙二醇、丁二醇等等],和动物饲料)中具有用途。
本领域技术人员将容易地理解本发明的β-葡糖苷酶多肽组合物也以水溶液或固体浓缩物的形式应用。在一些实施方案中,当采用水溶液时,β-葡糖苷酶浓缩物溶液被稀释以提供预定使用的准确浓度。浓缩物以任何适宜形式提供(例如,本领域公认的形式,包括但不限于液体、乳液、悬浮液、凝胶、糊、颗粒、粉末、附聚物、固体圆盘(solid disk)等等)。在一些实施方案中,取决于组合物的预定用途,如果期望的话另外的材料也与本发明的β-葡糖苷酶组合物一起使用或被包括在本发明的β-葡糖苷酶组合物中,另外的材料包括但不限于石头、浮石、填充剂、溶剂、酶激活物、以及抗再沉积剂等等。
由本发明提供的β-葡糖苷酶多肽和组合物还在食品和饮料工业例如在有效释放单萜烯醇的制酒工艺(见例如,Yanai和Sato,Am.J.Enol.Eitic.,50:231-235[1999],其通过引用并入本文)和用于制备富含糖基异黄酮的 豆腐的工艺(见例如,Mase等人,J.Appl.Glycosci.,51:211-216[2004],其通过引用并入本文)中具有用途。本发明的β-葡糖苷酶多肽还在改进清洁性能的去污剂组合物中具有用途(见例如,美国专利第7,244,605号和5,648,263号;以及WO 2004/048592,其全部通过引用并入本文)。
结合以下非限制性实例可更好地理解本发明的前述方面和其他方面。在以下实施例中更详细的描述本发明,实施例不旨在以任何方式限定要求专利保护的本发明的范围。
实验
在下面的实验性公开内容中,应用以下缩写:WT和wt(野生型);ppm(百万分率);M(摩尔/升);mM(毫摩尔/升);μM(微摩尔/升);nM(纳摩尔/升);mol(摩尔);mmol(毫摩尔);μmol和umol(微摩尔);nmol(纳摩尔);gm(克);mg(毫克);μg(微克);pg(皮克);L(升);ml和mL(毫升);μl和uL(微升);cm(厘米);mm(毫米);μm和um(微米);nm(纳米);U(单位);V(伏特);MW(分子量);sec(秒);min(分);h和hr(小时);℃(摄氏度);QS(足量);ND(未做);rpm(每分钟转数);H2O(水);dH2O(去离子水);(HCl(盐酸);aa(氨基酸);bp(碱基对);kb(千碱基);kbp(千碱基对);kD(千道尔顿);cDNA(拷贝或互补的DNA);DNA(脱氧核糖核酸);ssDNA(单链DNA);dsDNA(双链DNA);dNTP(脱氧核糖核苷三磷酸);RNA(核糖核酸);MgCl2(氯化镁);NaCl(氯化钠);w/v(重量比体积);v/v(体积比体积);g(重力);xg(乘以重力);OD(光密度);Vmax(酶催化的反应的最大初始速率);PAGE(聚丙烯酰胺凝胶电泳);PBS(磷酸盐缓冲盐水[150mM NaCl,10mM磷酸钠缓冲液,pH 7.2]);PCR(聚合酶链反应);SDS(十二烷基硫酸钠);Tris(三(羟甲基)氨基甲烷);HPLC(高压液相色谱);RP-HPLC(反相高压液相色谱);ATCC(美国模式培养物保藏中心,Rockville,Md.);Gibco/BRL(Gibco/BRL,Grand Island,N.Y.);Sigma(Sigma Chemical Co.,St.Louis,Mo.);Gene Oracle(Gene Oracle,Inc., Mountain View,Calif.);USBio(United States Biological,Swampscott,MA);Sartorius(Sartorius Stedim Biotech,Division of Sartorius AG,Goettingen,Germany);Eppendorf(Eppendorf North America,Westbury,NY);Phenomenex(Phenomenex,Inc.,Torrance,Calif);FMC(FMCCorporation,Philadelphia,PA);Difco(Difco Laboratories,Detroit,Mich.);Molecular Devices(Molecular Devices,Corp.,Sunnyvale,Calif);Fluka(Fluka Chemie AG,Buchs,Switzerland)。
实施例1
野生型嗜热子囊菌Bgl1基因获取和表达载体的构建
基于来自合并的酿酒酵母和巴斯德毕赤酵母密码子偏倚性表的密码子选择并排除BamHI、SalI、SfiI、BglI、NgoMIV和SpeI限制酶切位点,使用嗜热子囊菌Bgl1蛋白(“Bgl1 WT”;SEQ ID NO:2)的分泌形式设计合成的核苷酸序列。另外,添加氨基末端的甲硫氨酸残基(“Bgl1 WTM”;SEQ ID NO:4)。由Gene Oracle合成Bgl1 WTM编码序列,并且制备了其中Bgl1 WTM序列与适于在酿酒酵母中分泌的酵母或真菌信号肽连接的表达构建体。通过PCR引物重叠延伸来添加信号肽序列。将Bgl1构建体克隆到pYT72穿梭载体(即,被修饰以使得在酿酒酵母adh2启动子的控制下转录的pBS24Ub;见例如,Sabin等人,BioTechnol.,7:705[1989])。
用表达载体转化酿酒酵母细胞。在包含50μg/ml X-葡糖糖苷(5-溴-4-氯-3-吲哚基-β-D-吡喃葡萄糖苷;Sigma)的琼脂平板上鉴定具有β-葡糖苷酶活性的克隆并且证实来自转化子的序列。
实施例2
β-葡糖苷酶粉末的产生-摇瓶程序
将包含编码Bgl1WTM的质粒的酿酒酵母的一个菌落接种到包含60g/L葡萄糖、6.7g/L酵母氮源(yeast nitrogen base)、5g/L硫酸铵和2g/L减去尿嘧啶的氨基酸漏失混合物(amino acid drop-out mix)(USBio #D9535)的3ml合成的确定成分培养基中。在250rpm摇动下,使细胞在30℃培养箱中生长过夜(至少16小时)。然后,将1ml的这种培养物稀释到250ml烧瓶中的包含20g/L葡萄糖、6.7g/L酵母氮源、5g/L硫酸铵和2g/L减去尿嘧啶的氨基酸漏失混合物(USBio#D9535)的25ml合成的确定成分培养基中。将这种培养物在30℃孵育72小时,同时以250rpm摇动。通过离心(3000×g,15分钟,5℃)收集细胞。将上清液滗入新试管并使用离心浓缩机(VIVASPIN20;Sartorius)浓缩10倍。用Hong等人描述的方法(Hong等人,Appl.Environ.Microbiol.,73:1331[2007],其通过引用并入本文)使用pNPG(对硝基苯基-β-D-吡喃葡萄糖苷)作为底物证实WTM Bgl1的活性。
实施例3:
确定β-葡糖苷酶活性的测定
这个实施例描述了用于确定β-葡糖苷酶的存在或活性的三个测定。
A.5-溴-4-氯-3-吲哚基-β-d-吡喃葡萄糖苷(X-glu)测定
制备了包含合成的确定成分培养基(SD-ura;包括20g/L葡萄糖、6.7g/L酵母氮源、5g/L硫酸铵、2g/L减去尿嘧啶的氨基酸漏失混合物(USBio D9535)、15g/L琼脂和40mg/L 5-溴-4-氯-3-吲哚基-β-d-吡喃葡萄糖苷)的陪替氏平板(petri plate)。将包含具有bgl1基因的质粒的酿酒酵母铺板到这些平板上并且在30℃孵育3天。在平板中观察到的所有菌落变蓝色,指示这些生物体正在产生水解X-glu以释放生色团的活性β-葡糖苷酶。由以空载体转化的酿酒酵母组成的阴性对照产生白色菌落。
B.对硝基苯基葡萄糖苷(pNPG)测定
在100μl的总体积中,将30μl来自实施例2的浓缩上清液添加至在包含25mM乙酸钠的pH 5的溶液中的4mM pNPG(Fluka)。反应在50℃ 摇动30min并且随后添加100μl的2M KCO3以终止反应。用Spectramax190(Molecular Devices)以分光光度法在405nm测量释放的对硝基苯酚,并且使用本领域已知的方法从405nm的吸光度计算释放的对硝基苯酚的量(见例如,Hong等人,Appl.Environ.Microbiol.,73:1331[2007])。
当如实施例2所述产生的野生型(WTM)酶与pNPG反应时,所得混合物产生的吸光度为4。这是饱和的活性水平的指示。由以空载体转化的酿酒酵母组成的阴性对照在相同反应条件下产生0-0.1的吸光度。
C.纤维二糖测定
使用包含20μl培养物上清液、10g/L纤维二糖(Fluka目录号22150)和25mM乙酸钠的pH 5的100μl体积的反应混合物来确定对底物纤维二糖的活性。反应在60℃孵育适当的时间(1小时到过夜,取决于酶浓度和活性)同时摇动,用等体积的10mM猝灭并充分混合。然后,150μl的反应通过0.4μm滤器(使用滤板)过滤,通过以2000rpm(Eppendorf,离心机型号5810R(15amps))离心2min。通过使用具有保护柱的 Rezex RHM-单糖150*7.8mm(005-0132-KO)HPLC(Phenomenex)的HPLC分析追踪葡萄糖产生和/或纤维二糖消耗。流动相是流速1ml/min的水。柱在50℃的温度下使用,通常的样品注入体积是20μl,并且运行时间是3.8-4min。根据用葡萄糖和纤维二糖作为标准品的在1-73mM范围内的校准曲线定量峰面积。对纤维二糖和葡萄糖观察到的通常的保留时间分别是2.85和3.5min。
实施例4
重组嗜热子囊菌Bgl1的表征
通过在pH 2、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5和8的纤维二糖测定中测量酿酒酵母产生的嗜热子囊菌Bgl1的活性来确定其pH依赖性。用25mM缓冲液(pH 2的磷酸盐、pH范围3-3.5的柠檬酸钠、pH范围4-5.5的乙酸钠、和pH范围6-8的磷酸盐)在50℃用10g/L的纤维二 糖进行实验。发现对酶起作用的pH范围在pH 3-8之间。在pH 5测量到最佳活性,与之前的研究一致(见例如,Hong等人,Appl.Microbiol.Biotechnol.,73:1331[2007])。
通过在30℃和95℃之间的温度的纤维二糖测定中测量酿酒酵母产生的嗜热子囊菌Bgl1的活性来确定其温度依赖性。实验在pH 5乙酸盐缓冲液中在10g/L纤维二糖的存在下进行60分钟。酶促活性被测定为被转化为产物的初始纤维二糖的比例。测定对Bgl1野生型酶起作用的温度范围在50-80℃之间。酿酒酵母产生的嗜热子囊菌Bgl1的最适温度是70℃,与之前的研究一致(见例如,Hong等人,Appl.Microbiol.Biotechnol.,73:1331[2007])。
实施例5
鉴定具有改进特性的嗜热子囊菌β-葡糖苷酶多肽变体的高通量测定
使用诱变和定向进化方法获得了产生嗜热子囊菌β-葡糖苷酶多肽变体的细胞的库。如实施例2中所述将个体酵母细胞克隆并使之生长在X-glu平板上。挑出蓝色菌落并如实施例2所述进行培养,但有以下例外。初始生长在250μl体积中进行,并且表达在350μl体积中进行。在表达后,细胞上清液用于测定酶活性。
使用实施例3的纤维二糖测定,筛选并评估上清液相比于野生型嗜热子囊菌Bgl1的改进。如实施例3所述进行这些测定,但有以下例外。用3.3g/L纤维二糖在60℃用20μl酶进行纤维二糖反应。葡萄糖以50g/L终浓度添加到反应中。在使用包含0.125mg/ml牛血清白蛋白(BSA)的pH 5的25mM乙酸钠稀释酶来筛选之前,优化每个测定的反应时间。稀释水平通常在1-4倍之间。
实施例6
工程化嗜热子囊菌β-葡糖苷酶多肽变体的改进的β-葡糖苷酶活性
表6-1和6-2显示了使用实施例3所述的纤维二糖测定,本发明包括的示例性嗜热子囊菌β-葡糖苷酶多肽变体的活性及其将纤维二糖转化为葡萄糖的活性的改进(作为相比于在相似条件下测量的WTM酶活性的改进倍数(fold improvement))。在这些表中,活性被描述为相比于酶(WTM;SEQ ID NO:4)的改进倍数(“FI”)。
表6-1和6-2的注释:
“+”表示1.0到1.5的改进倍数(FI)。
“++”表示大于1.5到2.5的FI。
“+++”表示大于2.5的FI。
*残基编号是指SEQ ID NO:4。
**残基编号是指SEQ ID NO:3。
***在再次转化(retransformation)后变体相比于WTM没有改进。
实施例7
TaB6变体的葡萄糖产生
当以1g/L C1纤维素酶和5g/L TaB6Bgl1变体测试时,TaB6变体显示从纤维素产生葡萄糖(见图1)。用20%纤维素在pH 5在65℃下进行实验48小时,同时以200rpm摇动。通过使用具有保护柱的Rezex RHM-单糖150*7.8mm(005-0132-KO)HPLC(Phenomenex,Inc.,Torrance,CA)的HPLC分析追踪葡萄糖产生和/或纤维二糖消耗。使用的流动相是流速1ml/min的水。柱在50℃的温度下使用,通常的样品注入体积是20μl,并且运行时间是3.8-4min。根据用葡萄糖和纤维二糖作为标准品的在1-73mM范围内的校准曲线定量峰面积。对纤维二糖和葡萄糖观察到的通常的保留时间分别是2.85和3.5min。
尽管已参考本发明的具体实施方案对本发明进行了描述,但本领域技术人员应理解可以做出各种改变并且可以替换等同物而不背离本发明的范围。另外,可以做出许多改变以适应具体情况、材料、物质组成、工艺、一个或多个工艺步骤,以达到由本发明所提供的益处而不背离本发明的范围。所有这些改变旨在处于本文所附权利要求的范围之内。
本文引用的所有出版物和专利文件均通过引用并入本文,如同每篇此类出版物或文件被具体地和单独地指出通过引用并入本文。出版物和专利文件的引用并非旨在指示任何此类文件是相关现有技术,并且其不构成对任何此类文件的内容或日期的任何承认。
Claims (12)
1.一种β-葡糖苷酶变体,其中与SEQIDNO:4相比,所述变体的氨基酸取代组合如下:T151S-Y642N-N651K、M1T-K55R-K101R-T151S-R331K-Y332C-K343R-N356S-S409N-Y642N、M1T-K101R-T151S-K292E-K343R-S409N-Y642N-P740S、M1T-T151S-K343R-S409N-A479V-Y642N-Y680F、L150V-T151S-K343R-S409N-K457R-Y642N-N651K或S87N-T151S-F288Y-Y642N-N651K,并且所述变体具有比氨基酸序列为SEQIDNO:4的β-葡糖苷酶更大的酶活性。
2.一种多核苷酸序列,编码权利要求1给出的所述β-葡糖苷酶变体。
3.一种表达载体,包括至少一种权利要求2所述的多核苷酸序列。
4.一种宿主细胞,包含权利要求3所述的表达载体。
5.一种用于产生至少一种β-葡糖苷酶变体的方法,所述方法包括提供包含权利要求3所述的表达载体的权利要求4所述的宿主细胞,并且在使得所述β-葡糖苷酶变体被表达的条件下培养所述转化的宿主细胞。
6.如权利要求5所述的方法,还包括分离所述β-葡糖苷酶变体的步骤。
7.一种组合物,其包括至少一种权利要求1所述的β-葡糖苷酶变体。
8.如权利要求7所述的组合物,还包括至少一种另外的酶。
9.如权利要求8所述的组合物,其中所述至少一种另外的酶是纤维素酶。
10.一种转化生物质基质以产生至少一种可发酵的糖的方法,所述方法包括提供权利要求1所述的至少一种β-葡糖苷酶变体和生物质基质,并且在使得所述至少一种β-葡糖苷酶变体将所述生物质基质转化为至少一种可发酵的糖的条件下将所述生物质基质暴露于所述至少一种β-葡糖苷酶变体。
11.如权利要求10所述的方法,其中所述至少一种可发酵的糖是葡萄糖。
12.如权利要求10或权利要求11所述的方法,其中在所述生物质基质暴露于所述至少一种β-葡糖苷酶变体之前,所述生物质基质被预处理。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US26460509P | 2009-11-25 | 2009-11-25 | |
US61/264,605 | 2009-11-25 | ||
PCT/US2010/057409 WO2011066187A1 (en) | 2009-11-25 | 2010-11-19 | Recombinant thermoascus aurantiacus beta-glucosidase variants for production of fermentable sugars from cellulosic biomass |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102666848A CN102666848A (zh) | 2012-09-12 |
CN102666848B true CN102666848B (zh) | 2014-09-24 |
Family
ID=44062370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080051889.6A Expired - Fee Related CN102666848B (zh) | 2009-11-25 | 2010-11-19 | 用于从纤维素生物质产生可发酵的糖的重组嗜热子囊菌β-葡糖苷酶变体 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8652813B2 (zh) |
EP (1) | EP2504431A4 (zh) |
CN (1) | CN102666848B (zh) |
BR (1) | BR112012012192A2 (zh) |
CA (1) | CA2781399C (zh) |
WO (1) | WO2011066187A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102666848B (zh) | 2009-11-25 | 2014-09-24 | 科德克希思公司 | 用于从纤维素生物质产生可发酵的糖的重组嗜热子囊菌β-葡糖苷酶变体 |
CA2807702C (en) | 2010-08-20 | 2018-07-24 | Codexis, Inc. | Use of glycoside hydrolase 61 family proteins in processing of cellulose |
BR112014004171A2 (pt) | 2011-08-22 | 2018-11-06 | Codexis Inc | variantes da proteína glicósideo hidrolase gh61 e cofatores que aumentam a atividade de gh61 |
WO2013048661A1 (en) | 2011-09-30 | 2013-04-04 | Codexis, Inc. | Fungal proteases |
CN103004533A (zh) * | 2012-11-27 | 2013-04-03 | 天津滨海国际花卉科技园区股份有限公司 | 一种预防仙客来枯萎病的方法 |
US9850512B2 (en) | 2013-03-15 | 2017-12-26 | The Research Foundation For The State University Of New York | Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield |
CN105829530A (zh) * | 2013-12-04 | 2016-08-03 | 丹尼斯科美国公司 | 包含β-葡萄糖苷酶多肽的组合物及其使用方法 |
US9951363B2 (en) | 2014-03-14 | 2018-04-24 | The Research Foundation for the State University of New York College of Environmental Science and Forestry | Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects |
CN104498456B (zh) * | 2014-12-01 | 2017-03-29 | 中国农业科学院饲料研究所 | 一种酸性β‑葡萄糖苷酶Bgl3B及其基因和应用 |
TWI619810B (zh) * | 2016-11-03 | 2018-04-01 | 行政院原子能委員會核能研究所 | 可用於製備生質酒精的釀酒酵母菌株 |
WO2023225459A2 (en) | 2022-05-14 | 2023-11-23 | Novozymes A/S | Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3009104C2 (de) | 1980-03-10 | 1990-10-04 | Odenwald-Chemie GmbH, 6901 Schönau | Verwendung eines Epoxydharzes zur Herstellung von feuerhemmenden Schichten oder Überzügen und Verfahren zur Herstellung derselben |
CA1338400C (en) | 1983-08-31 | 1996-06-18 | David H. Gelfand | Recombinant fungal cellulases |
US5648263A (en) | 1988-03-24 | 1997-07-15 | Novo Nordisk A/S | Methods for reducing the harshness of a cotton-containing fabric |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US5837458A (en) | 1994-02-17 | 1998-11-17 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US6335160B1 (en) | 1995-02-17 | 2002-01-01 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
EP1559776A3 (en) | 1994-06-30 | 2006-01-11 | Novozymes Biotech, Inc. | Non-toxic, non-toxigenic, non-pathogenic Fusarium expression system and promoters and terminators for use therein |
FI104465B (fi) | 1995-06-14 | 2000-02-15 | Valio Oy | Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö |
US5811381A (en) | 1996-10-10 | 1998-09-22 | Mark A. Emalfarb | Cellulase compositions and methods of use |
US7883872B2 (en) | 1996-10-10 | 2011-02-08 | Dyadic International (Usa), Inc. | Construction of highly efficient cellulase compositions for enzymatic hydrolysis of cellulose |
US6265204B1 (en) | 1997-01-17 | 2001-07-24 | Genencor International, Inc. | DNA sequences, vectors, and fusion polypeptides for secretion of polypeptides in filamentous fungi |
KR100618495B1 (ko) | 1998-10-06 | 2006-08-31 | 마크 아론 에말파브 | 섬유상의 진균성 숙주 영역에서의 형질전환 시스템:크리소스포륨속에서 |
JP4221100B2 (ja) | 1999-01-13 | 2009-02-12 | エルピーダメモリ株式会社 | 半導体装置 |
US7884066B2 (en) * | 1999-10-05 | 2011-02-08 | The Regents Of The University Of California | NELL-1 enhanced bone mineralization |
EP1272967A2 (en) | 2000-03-30 | 2003-01-08 | Maxygen, Inc. | In silico cross-over site selection |
US7049485B2 (en) | 2000-10-20 | 2006-05-23 | Board Of Trustees Of Michigan State University | Transgenic plants containing ligninase and cellulase which degrade lignin and cellulose to fermentable sugars |
DK2390803T3 (da) | 2002-03-01 | 2014-01-27 | Codexis Mayflower Holdings Llc | Fremgangsmåder, systemer og software til identificering af funktionelle biomolekyler |
US7407788B2 (en) | 2002-11-21 | 2008-08-05 | Danisco A/S, Genencor Division | BGL7 beta-glucosidase and nucleic acids encoding the same |
US7785601B2 (en) * | 2002-12-31 | 2010-08-31 | Sygnis Bioscience Gmbh & Co. Kg | Methods of treating neurological conditions with hematopoietic growth factors |
ES2393058T3 (es) * | 2003-05-02 | 2012-12-18 | Novozymes Inc. | Variantes de beta-glucosidasa |
US7244605B2 (en) | 2003-10-28 | 2007-07-17 | Novozymes, Inc. | Polypeptides having beta-glucosidase activity and polynucleotides encoding same |
BRPI0519985B1 (pt) * | 2005-02-23 | 2018-01-30 | University Of Kentucky Research Foundation | Método para redução do nível de nornicotina ou n-nitrosonornicotina em uma planta do gênero nicotiana ou parte desta ou em um produto de tabaco, cassete de expressão e método para a produção de uma planta do gênero nicotiana |
WO2007075899A2 (en) | 2005-12-21 | 2007-07-05 | Maxygen, Inc. | Dual agonist compounds and uses thereof |
FI120045B (fi) | 2005-12-22 | 2009-06-15 | Roal Oy | Selluloosamateriaalin käsittely ja siinä käyttökelpoiset entsyymit |
CA2655645A1 (en) | 2006-06-22 | 2007-12-27 | Iogen Energy Corporation | Enzyme compositions for the improved enzymatic hydrolysis of cellulose and methods of using same |
US8017373B2 (en) | 2006-08-31 | 2011-09-13 | Iogen Energy Corporation | Process for enzymatic hydrolysis of pretreated lignocellulosic feedstocks |
EP2102366A4 (en) | 2006-12-10 | 2010-01-27 | Dyadic International Inc | EXPRESSION AND HIGH-DROP SCREENING OF COMPLEX EXPRESSED DNA LIBRARIES IN FADENED MUSHROOMS |
BRPI0816177B1 (pt) | 2007-08-30 | 2018-07-17 | Iogen Energy Corp | processo para a conversão de uma matéria-prima lignocelulósica pré-tratada em açúcares solúveis |
WO2009033071A2 (en) | 2007-09-07 | 2009-03-12 | Dyadic International, Inc. | Novel fungal enzymes |
CN102666848B (zh) * | 2009-11-25 | 2014-09-24 | 科德克希思公司 | 用于从纤维素生物质产生可发酵的糖的重组嗜热子囊菌β-葡糖苷酶变体 |
-
2010
- 2010-11-19 CN CN201080051889.6A patent/CN102666848B/zh not_active Expired - Fee Related
- 2010-11-19 BR BR112012012192A patent/BR112012012192A2/pt active Search and Examination
- 2010-11-19 WO PCT/US2010/057409 patent/WO2011066187A1/en active Application Filing
- 2010-11-19 US US12/950,150 patent/US8652813B2/en not_active Expired - Fee Related
- 2010-11-19 EP EP10833801.3A patent/EP2504431A4/en not_active Withdrawn
- 2010-11-19 CA CA2781399A patent/CA2781399C/en not_active Expired - Fee Related
-
2013
- 2013-12-19 US US14/134,839 patent/US8993277B2/en active Active
Non-Patent Citations (4)
Title |
---|
Cloning and functional expression of thermostable beta-glucosidase gene from thermoascus aurantiacus;Hong et al;《Appl Microbiol Biotechnol》;20070131;第73卷(第6期);第1331-1339页 * |
DQ114397;Hong J. et al;《Genbank》;20070418;全文 * |
Hong et al.Cloning and functional expression of thermostable beta-glucosidase gene from thermoascus aurantiacus.《Appl Microbiol Biotechnol》.2007,第73卷(第6期),第1331-1339页. |
Hong J. et al.DQ114397.《Genbank》.2007, |
Also Published As
Publication number | Publication date |
---|---|
US20140113352A1 (en) | 2014-04-24 |
US8993277B2 (en) | 2015-03-31 |
US8652813B2 (en) | 2014-02-18 |
CN102666848A (zh) | 2012-09-12 |
CA2781399C (en) | 2015-01-20 |
CA2781399A1 (en) | 2011-06-03 |
EP2504431A1 (en) | 2012-10-03 |
BR112012012192A2 (pt) | 2017-07-04 |
EP2504431A4 (en) | 2013-10-16 |
WO2011066187A1 (en) | 2011-06-03 |
US20110124058A1 (en) | 2011-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102666848B (zh) | 用于从纤维素生物质产生可发酵的糖的重组嗜热子囊菌β-葡糖苷酶变体 | |
CN102740868B (zh) | 用于从纤维素生物质产生可溶性糖的重组β-葡糖苷酶变体 | |
US9150843B2 (en) | Beta-glucosidase variants | |
EP2195424B1 (en) | Polypeptides having cellobiohydrolase ii activity and polynucleotides encoding same | |
JP5221347B2 (ja) | β−グルコシダーゼ活性を有するポリペプチドおよびそれをコードするポリヌクレオチド | |
CA2776170C (en) | Recombinant c1 .beta.-glucosidase for production of sugars from cellulosic biomass | |
CN102428170B (zh) | 改良的内切葡聚糖酶 | |
CN105916981A (zh) | 变体酶 | |
US8715975B2 (en) | Method for producing an alcohol using β-glucosidase variant enzymes | |
US9080162B2 (en) | Cellulase variants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140924 Termination date: 20151119 |
|
EXPY | Termination of patent right or utility model |