CN103080126B - 具有c4-二羧酸转运蛋白活性的多肽和编码该多肽的多核苷酸 - Google Patents
具有c4-二羧酸转运蛋白活性的多肽和编码该多肽的多核苷酸 Download PDFInfo
- Publication number
- CN103080126B CN103080126B CN201180040520.XA CN201180040520A CN103080126B CN 103080126 B CN103080126 B CN 103080126B CN 201180040520 A CN201180040520 A CN 201180040520A CN 103080126 B CN103080126 B CN 103080126B
- Authority
- CN
- China
- Prior art keywords
- polypeptide
- sequence
- seqidno
- host cell
- dicarboxylic acids
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 563
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 546
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 546
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 312
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 312
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 312
- 108010078791 Carrier Proteins Proteins 0.000 title claims abstract description 128
- 102000014914 Carrier Proteins Human genes 0.000 title claims abstract description 109
- 230000004952 protein activity Effects 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 claims abstract description 137
- BJEPYKJPYRNKOW-UHFFFAOYSA-N alpha-hydroxysuccinic acid Natural products OC(=O)C(O)CC(O)=O BJEPYKJPYRNKOW-UHFFFAOYSA-N 0.000 claims abstract description 85
- 239000001630 malic acid Substances 0.000 claims abstract description 83
- BJEPYKJPYRNKOW-REOHCLBHSA-N (S)-malic acid Chemical compound OC(=O)[C@@H](O)CC(O)=O BJEPYKJPYRNKOW-REOHCLBHSA-N 0.000 claims abstract description 82
- 235000011090 malic acid Nutrition 0.000 claims abstract description 82
- 238000000926 separation method Methods 0.000 claims abstract description 48
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 28
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 28
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 28
- 150000001413 amino acids Chemical class 0.000 claims description 112
- 240000006439 Aspergillus oryzae Species 0.000 claims description 86
- 235000002247 Aspergillus oryzae Nutrition 0.000 claims description 86
- 108010053763 Pyruvate Carboxylase Proteins 0.000 claims description 85
- 108010026217 Malate Dehydrogenase Proteins 0.000 claims description 83
- 102100039895 Pyruvate carboxylase, mitochondrial Human genes 0.000 claims description 82
- 102000013460 Malate Dehydrogenase Human genes 0.000 claims description 81
- 125000003729 nucleotide group Chemical group 0.000 claims description 80
- 239000002773 nucleotide Substances 0.000 claims description 79
- 244000005700 microbiome Species 0.000 claims description 43
- 230000001105 regulatory effect Effects 0.000 claims description 42
- 241000228212 Aspergillus Species 0.000 claims description 38
- 230000001276 controlling effect Effects 0.000 claims description 38
- 230000002538 fungal effect Effects 0.000 claims description 34
- 241000228215 Aspergillus aculeatus Species 0.000 claims description 33
- 239000013604 expression vector Substances 0.000 claims description 33
- 239000000203 mixture Substances 0.000 claims description 28
- 241000588724 Escherichia coli Species 0.000 claims description 27
- 239000001963 growth medium Substances 0.000 claims description 27
- 241000233866 Fungi Species 0.000 claims description 25
- 230000001131 transforming effect Effects 0.000 claims description 9
- 210000004027 cell Anatomy 0.000 description 278
- 235000001014 amino acid Nutrition 0.000 description 109
- 229940024606 amino acid Drugs 0.000 description 109
- 108090000623 proteins and genes Proteins 0.000 description 105
- 239000012634 fragment Substances 0.000 description 77
- 241000196324 Embryophyta Species 0.000 description 61
- 239000002253 acid Substances 0.000 description 52
- 108020004414 DNA Proteins 0.000 description 49
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 49
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 48
- 230000008034 disappearance Effects 0.000 description 42
- 108010076504 Protein Sorting Signals Proteins 0.000 description 41
- 230000000295 complement effect Effects 0.000 description 39
- 238000006243 chemical reaction Methods 0.000 description 37
- 125000003275 alpha amino acid group Chemical group 0.000 description 36
- 230000014509 gene expression Effects 0.000 description 36
- 238000011534 incubation Methods 0.000 description 35
- 239000000047 product Substances 0.000 description 35
- 108090000790 Enzymes Proteins 0.000 description 32
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 31
- 102000004190 Enzymes Human genes 0.000 description 31
- 229940088598 enzyme Drugs 0.000 description 31
- 238000009396 hybridization Methods 0.000 description 31
- 238000003780 insertion Methods 0.000 description 30
- 230000037431 insertion Effects 0.000 description 30
- 239000013612 plasmid Substances 0.000 description 30
- 125000000539 amino acid group Chemical group 0.000 description 28
- 239000007788 liquid Substances 0.000 description 28
- 235000018102 proteins Nutrition 0.000 description 27
- 102000004169 proteins and genes Human genes 0.000 description 27
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 26
- 239000002299 complementary DNA Substances 0.000 description 25
- 239000000243 solution Substances 0.000 description 25
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 25
- 230000029087 digestion Effects 0.000 description 24
- 239000000523 sample Substances 0.000 description 23
- 230000004087 circulation Effects 0.000 description 22
- 238000000855 fermentation Methods 0.000 description 22
- 230000004151 fermentation Effects 0.000 description 22
- 239000002609 medium Substances 0.000 description 22
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 21
- 239000002853 nucleic acid probe Substances 0.000 description 21
- 238000003860 storage Methods 0.000 description 21
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 20
- 210000001938 protoplast Anatomy 0.000 description 20
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 19
- 239000007853 buffer solution Substances 0.000 description 18
- 241000589516 Pseudomonas Species 0.000 description 17
- 230000000694 effects Effects 0.000 description 17
- 241000894006 Bacteria Species 0.000 description 16
- 108091026890 Coding region Proteins 0.000 description 16
- 230000008859 change Effects 0.000 description 16
- 241000193830 Bacillus <bacterium> Species 0.000 description 15
- 108091028043 Nucleic acid sequence Proteins 0.000 description 15
- 230000035800 maturation Effects 0.000 description 15
- 230000001580 bacterial effect Effects 0.000 description 13
- 238000010790 dilution Methods 0.000 description 13
- 239000012895 dilution Substances 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 13
- 239000001530 fumaric acid Substances 0.000 description 13
- 238000002703 mutagenesis Methods 0.000 description 13
- 231100000350 mutagenesis Toxicity 0.000 description 13
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 13
- 241000223218 Fusarium Species 0.000 description 12
- 241000235395 Mucor Species 0.000 description 12
- 239000002202 Polyethylene glycol Substances 0.000 description 12
- 241000499912 Trichoderma reesei Species 0.000 description 12
- 230000004048 modification Effects 0.000 description 12
- 238000012986 modification Methods 0.000 description 12
- 229920001223 polyethylene glycol Polymers 0.000 description 12
- 240000007594 Oryza sativa Species 0.000 description 11
- 235000007164 Oryza sativa Nutrition 0.000 description 11
- 241000223259 Trichoderma Species 0.000 description 11
- 238000004519 manufacturing process Methods 0.000 description 11
- 238000002360 preparation method Methods 0.000 description 11
- 235000009566 rice Nutrition 0.000 description 11
- 238000012163 sequencing technique Methods 0.000 description 11
- KDYFGRWQOYBRFD-UHFFFAOYSA-N succinic acid Chemical compound OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 11
- 230000008685 targeting Effects 0.000 description 11
- 239000003643 water by type Substances 0.000 description 11
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 10
- 241000351920 Aspergillus nidulans Species 0.000 description 10
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 10
- OFOBLEOULBTSOW-UHFFFAOYSA-N Malonic acid Chemical compound OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 10
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 10
- 239000008103 glucose Substances 0.000 description 10
- 239000003550 marker Substances 0.000 description 10
- 229940107700 pyruvic acid Drugs 0.000 description 10
- 230000010076 replication Effects 0.000 description 10
- 108020005038 Terminator Codon Proteins 0.000 description 9
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 9
- -1 example 1-3 amino acid Chemical class 0.000 description 9
- 230000028327 secretion Effects 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 9
- 238000013519 translation Methods 0.000 description 9
- 230000014616 translation Effects 0.000 description 9
- 229910001868 water Inorganic materials 0.000 description 9
- 241000228245 Aspergillus niger Species 0.000 description 8
- 241000223651 Aureobasidium Species 0.000 description 8
- 241000123346 Chrysosporium Species 0.000 description 8
- 241000222511 Coprinus Species 0.000 description 8
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 8
- 241000223198 Humicola Species 0.000 description 8
- 241000226677 Myceliophthora Species 0.000 description 8
- 241000221960 Neurospora Species 0.000 description 8
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 8
- 241000228143 Penicillium Species 0.000 description 8
- 241000222480 Schizophyllum Species 0.000 description 8
- 241001494489 Thielavia Species 0.000 description 8
- 238000000246 agarose gel electrophoresis Methods 0.000 description 8
- 239000008367 deionised water Substances 0.000 description 8
- 229910021641 deionized water Inorganic materials 0.000 description 8
- 230000002255 enzymatic effect Effects 0.000 description 8
- 239000012535 impurity Substances 0.000 description 8
- 238000003199 nucleic acid amplification method Methods 0.000 description 8
- KHPXUQMNIQBQEV-UHFFFAOYSA-N oxaloacetic acid Chemical compound OC(=O)CC(=O)C(O)=O KHPXUQMNIQBQEV-UHFFFAOYSA-N 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 244000063299 Bacillus subtilis Species 0.000 description 7
- 235000014469 Bacillus subtilis Nutrition 0.000 description 7
- 241000222356 Coriolus Species 0.000 description 7
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 7
- 101710088194 Dehydrogenase Proteins 0.000 description 7
- 241001344131 Magnaporthe grisea Species 0.000 description 7
- 108091005804 Peptidases Proteins 0.000 description 7
- 102000035195 Peptidases Human genes 0.000 description 7
- 241000222350 Pleurotus Species 0.000 description 7
- 241000187747 Streptomyces Species 0.000 description 7
- 241000222354 Trametes Species 0.000 description 7
- 239000003513 alkali Substances 0.000 description 7
- 230000003321 amplification Effects 0.000 description 7
- 235000013339 cereals Nutrition 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 150000007524 organic acids Chemical class 0.000 description 7
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 6
- 239000004382 Amylase Substances 0.000 description 6
- 241000235349 Ascomycota Species 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- 125000003412 L-alanyl group Chemical group [H]N([H])[C@@](C([H])([H])[H])(C(=O)[*])[H] 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 241001655322 Streptomycetales Species 0.000 description 6
- 241000228341 Talaromyces Species 0.000 description 6
- 241001149964 Tolypocladium Species 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 238000004520 electroporation Methods 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 230000002779 inactivation Effects 0.000 description 6
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 6
- 238000004321 preservation Methods 0.000 description 6
- 239000011535 reaction buffer Substances 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 108010065511 Amylases Proteins 0.000 description 5
- 102000013142 Amylases Human genes 0.000 description 5
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 5
- 241000194108 Bacillus licheniformis Species 0.000 description 5
- 244000025254 Cannabis sativa Species 0.000 description 5
- 241000235457 Chytridium Species 0.000 description 5
- RGHNJXZEOKUKBD-SQOUGZDYSA-N D-gluconic acid Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)=O RGHNJXZEOKUKBD-SQOUGZDYSA-N 0.000 description 5
- 238000001712 DNA sequencing Methods 0.000 description 5
- 108010000912 Egg Proteins Proteins 0.000 description 5
- 102000002322 Egg Proteins Human genes 0.000 description 5
- 241000605909 Fusobacterium Species 0.000 description 5
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 5
- 241001480714 Humicola insolens Species 0.000 description 5
- 108700011259 MicroRNAs Proteins 0.000 description 5
- 241000222385 Phanerochaete Species 0.000 description 5
- 241000235648 Pichia Species 0.000 description 5
- 241000235527 Rhizopus Species 0.000 description 5
- 241000235070 Saccharomyces Species 0.000 description 5
- 108020004459 Small interfering RNA Proteins 0.000 description 5
- 241000194017 Streptococcus Species 0.000 description 5
- 241000223258 Thermomyces lanuginosus Species 0.000 description 5
- 235000019418 amylase Nutrition 0.000 description 5
- 239000002585 base Substances 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 239000002361 compost Substances 0.000 description 5
- 210000000172 cytosol Anatomy 0.000 description 5
- 238000009795 derivation Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 150000001991 dicarboxylic acids Chemical class 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 239000002679 microRNA Substances 0.000 description 5
- 235000015097 nutrients Nutrition 0.000 description 5
- 230000008488 polyadenylation Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 239000000376 reactant Substances 0.000 description 5
- 238000003259 recombinant expression Methods 0.000 description 5
- 238000011218 seed culture Methods 0.000 description 5
- 239000000779 smoke Substances 0.000 description 5
- 239000002689 soil Substances 0.000 description 5
- 229960005137 succinic acid Drugs 0.000 description 5
- 230000032258 transport Effects 0.000 description 5
- 210000003462 vein Anatomy 0.000 description 5
- 239000002023 wood Substances 0.000 description 5
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 4
- QCVGEOXPDFCNHA-UHFFFAOYSA-N 5,5-dimethyl-2,4-dioxo-1,3-oxazolidine-3-carboxamide Chemical compound CC1(C)OC(=O)N(C(N)=O)C1=O QCVGEOXPDFCNHA-UHFFFAOYSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 102000010911 Enzyme Precursors Human genes 0.000 description 4
- 108010062466 Enzyme Precursors Proteins 0.000 description 4
- 241000726221 Gemma Species 0.000 description 4
- 101000777550 Homo sapiens CCN family member 2 Proteins 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 4
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 4
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 4
- 240000008042 Zea mays Species 0.000 description 4
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 4
- WNLRTRBMVRJNCN-UHFFFAOYSA-N adipic acid Chemical compound OC(=O)CCCCC(O)=O WNLRTRBMVRJNCN-UHFFFAOYSA-N 0.000 description 4
- 108090000637 alpha-Amylases Proteins 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 210000001367 artery Anatomy 0.000 description 4
- 239000012620 biological material Substances 0.000 description 4
- 230000033228 biological regulation Effects 0.000 description 4
- 238000009395 breeding Methods 0.000 description 4
- 230000001488 breeding effect Effects 0.000 description 4
- 239000012876 carrier material Substances 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 238000006555 catalytic reaction Methods 0.000 description 4
- 239000007795 chemical reaction product Substances 0.000 description 4
- 239000012084 conversion product Substances 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 235000014103 egg white Nutrition 0.000 description 4
- 210000000969 egg white Anatomy 0.000 description 4
- 241001233957 eudicotyledons Species 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 210000004602 germ cell Anatomy 0.000 description 4
- 235000011187 glycerol Nutrition 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- 102000047612 human CCN2 Human genes 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 239000002054 inoculum Substances 0.000 description 4
- 230000014759 maintenance of location Effects 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 4
- 239000001965 potato dextrose agar Substances 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 235000019419 proteases Nutrition 0.000 description 4
- 101150096049 pyc gene Proteins 0.000 description 4
- 229940076788 pyruvate Drugs 0.000 description 4
- 238000011069 regeneration method Methods 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- 240000000073 Achillea millefolium Species 0.000 description 3
- 235000007754 Achillea millefolium Nutrition 0.000 description 3
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 3
- 241000222518 Agaricus Species 0.000 description 3
- 229920000936 Agarose Polymers 0.000 description 3
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 3
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 3
- 241001513093 Aspergillus awamori Species 0.000 description 3
- 241000228197 Aspergillus flavus Species 0.000 description 3
- 241001225321 Aspergillus fumigatus Species 0.000 description 3
- 241000193752 Bacillus circulans Species 0.000 description 3
- 241001328122 Bacillus clausii Species 0.000 description 3
- 241000193749 Bacillus coagulans Species 0.000 description 3
- 241000193747 Bacillus firmus Species 0.000 description 3
- 241000194103 Bacillus pumilus Species 0.000 description 3
- 241000193388 Bacillus thuringiensis Species 0.000 description 3
- 241000222490 Bjerkandera Species 0.000 description 3
- 240000002791 Brassica napus Species 0.000 description 3
- 241000193764 Brevibacillus brevis Species 0.000 description 3
- 241000589876 Campylobacter Species 0.000 description 3
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 3
- 108010059892 Cellulase Proteins 0.000 description 3
- 241000146399 Ceriporiopsis Species 0.000 description 3
- 241000985909 Chrysosporium keratinophilum Species 0.000 description 3
- 241001674001 Chrysosporium tropicum Species 0.000 description 3
- 229920000742 Cotton Polymers 0.000 description 3
- 241001362614 Crassa Species 0.000 description 3
- RGHNJXZEOKUKBD-UHFFFAOYSA-N D-gluconic acid Natural products OCC(O)C(O)C(O)C(O)C(O)=O RGHNJXZEOKUKBD-UHFFFAOYSA-N 0.000 description 3
- 241000589565 Flavobacterium Species 0.000 description 3
- 241000223195 Fusarium graminearum Species 0.000 description 3
- 241000221779 Fusarium sambucinum Species 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- 241000186660 Lactobacillus Species 0.000 description 3
- 241001344133 Magnaporthe Species 0.000 description 3
- BAWFJGJZGIEFAR-NNYOXOHSSA-O NAD(+) Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 BAWFJGJZGIEFAR-NNYOXOHSSA-O 0.000 description 3
- 241000233892 Neocallimastix Species 0.000 description 3
- 241000233654 Oomycetes Species 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 241000194109 Paenibacillus lautus Species 0.000 description 3
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 3
- 244000046052 Phaseolus vulgaris Species 0.000 description 3
- 241000222395 Phlebia Species 0.000 description 3
- 241000235379 Piromyces Species 0.000 description 3
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 3
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 3
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 3
- 241001123227 Saccharomyces pastorianus Species 0.000 description 3
- 241000607142 Salmonella Species 0.000 description 3
- 241000235346 Schizosaccharomyces Species 0.000 description 3
- 244000061456 Solanum tuberosum Species 0.000 description 3
- 235000002595 Solanum tuberosum Nutrition 0.000 description 3
- 241000191940 Staphylococcus Species 0.000 description 3
- 229920002472 Starch Polymers 0.000 description 3
- 241000264435 Streptococcus dysgalactiae subsp. equisimilis Species 0.000 description 3
- 241000194054 Streptococcus uberis Species 0.000 description 3
- 241001540751 Talaromyces ruber Species 0.000 description 3
- 241000228178 Thermoascus Species 0.000 description 3
- 241000223260 Trichoderma harzianum Species 0.000 description 3
- 241000202898 Ureaplasma Species 0.000 description 3
- 244000301083 Ustilago maydis Species 0.000 description 3
- 235000015919 Ustilago maydis Nutrition 0.000 description 3
- 235000010749 Vicia faba Nutrition 0.000 description 3
- 240000006677 Vicia faba Species 0.000 description 3
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 102000004139 alpha-Amylases Human genes 0.000 description 3
- 229940024171 alpha-amylase Drugs 0.000 description 3
- 210000000544 articulatio talocruralis Anatomy 0.000 description 3
- 229940091771 aspergillus fumigatus Drugs 0.000 description 3
- 229940054340 bacillus coagulans Drugs 0.000 description 3
- 229940005348 bacillus firmus Drugs 0.000 description 3
- 229940097012 bacillus thuringiensis Drugs 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 235000015165 citric acid Nutrition 0.000 description 3
- 210000004748 cultured cell Anatomy 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000000593 degrading effect Effects 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 239000000174 gluconic acid Substances 0.000 description 3
- 235000012208 gluconic acid Nutrition 0.000 description 3
- 229930182470 glycoside Natural products 0.000 description 3
- 150000002338 glycosides Chemical class 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 229910052737 gold Inorganic materials 0.000 description 3
- 239000010931 gold Substances 0.000 description 3
- 229910001385 heavy metal Inorganic materials 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 239000004310 lactic acid Substances 0.000 description 3
- 235000014655 lactic acid Nutrition 0.000 description 3
- 229940039696 lactobacillus Drugs 0.000 description 3
- 229940049920 malate Drugs 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 239000011785 micronutrient Substances 0.000 description 3
- 235000013369 micronutrients Nutrition 0.000 description 3
- 210000003470 mitochondria Anatomy 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 239000003208 petroleum Substances 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000002994 raw material Substances 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000008929 regeneration Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000008107 starch Substances 0.000 description 3
- 235000019698 starch Nutrition 0.000 description 3
- 229940115922 streptococcus uberis Drugs 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- 210000002268 wool Anatomy 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- SMZOUWXMTYCWNB-UHFFFAOYSA-N 2-(2-methoxy-5-methylphenyl)ethanamine Chemical compound COC1=CC=C(C)C=C1CCN SMZOUWXMTYCWNB-UHFFFAOYSA-N 0.000 description 2
- NIXOWILDQLNWCW-UHFFFAOYSA-N 2-Propenoic acid Natural products OC(=O)C=C NIXOWILDQLNWCW-UHFFFAOYSA-N 0.000 description 2
- DLFVBJFMPXGRIB-UHFFFAOYSA-N Acetamide Chemical compound CC(N)=O DLFVBJFMPXGRIB-UHFFFAOYSA-N 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 2
- 101710197633 Actin-1 Proteins 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- 241000743339 Agrostis Species 0.000 description 2
- 241000220433 Albizia Species 0.000 description 2
- 108010088751 Albumins Proteins 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical group N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- 102000035101 Aspartic proteases Human genes 0.000 description 2
- 108091005502 Aspartic proteases Proteins 0.000 description 2
- 241001480052 Aspergillus japonicus Species 0.000 description 2
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- 241000193422 Bacillus lentus Species 0.000 description 2
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 2
- 241000194107 Bacillus megaterium Species 0.000 description 2
- 241000221198 Basidiomycota Species 0.000 description 2
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 2
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 2
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 2
- 241000219193 Brassicaceae Species 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 2
- 229920002101 Chitin Polymers 0.000 description 2
- 108010022172 Chitinases Proteins 0.000 description 2
- 102000012286 Chitinases Human genes 0.000 description 2
- 241000701248 Chlorella virus Species 0.000 description 2
- 241001674013 Chrysosporium lucknowense Species 0.000 description 2
- 241001556045 Chrysosporium merdarium Species 0.000 description 2
- 241000080524 Chrysosporium queenslandicum Species 0.000 description 2
- 241000355696 Chrysosporium zonatum Species 0.000 description 2
- 241000233652 Chytridiomycota Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 2
- 241000935926 Diplodia Species 0.000 description 2
- 241001063191 Elops affinis Species 0.000 description 2
- 241000194033 Enterococcus Species 0.000 description 2
- 235000002756 Erythrina berteroana Nutrition 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- PLUBXMRUUVWRLT-UHFFFAOYSA-N Ethyl methanesulfonate Chemical compound CCOS(C)(=O)=O PLUBXMRUUVWRLT-UHFFFAOYSA-N 0.000 description 2
- 241000221433 Exidia Species 0.000 description 2
- 241000234642 Festuca Species 0.000 description 2
- 241000567163 Fusarium cerealis Species 0.000 description 2
- 241000146406 Fusarium heterosporum Species 0.000 description 2
- 102000048120 Galactokinases Human genes 0.000 description 2
- 108700023157 Galactokinases Proteins 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 101100369308 Geobacillus stearothermophilus nprS gene Proteins 0.000 description 2
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 2
- 239000005980 Gibberellic acid Substances 0.000 description 2
- 108010044091 Globulins Proteins 0.000 description 2
- 102000006395 Globulins Human genes 0.000 description 2
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 2
- 108010068370 Glutens Proteins 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- 241000006384 Jeotgalibacillus marinus Species 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 2
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- 108010029541 Laccase Proteins 0.000 description 2
- 241000194036 Lactococcus Species 0.000 description 2
- 101710094902 Legumin Proteins 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 241000209510 Liliopsida Species 0.000 description 2
- 108090001060 Lipase Proteins 0.000 description 2
- 102000004882 Lipase Human genes 0.000 description 2
- 239000004367 Lipase Substances 0.000 description 2
- 241000209082 Lolium Species 0.000 description 2
- 241000219745 Lupinus Species 0.000 description 2
- 108050000210 Malic acid transport proteins Proteins 0.000 description 2
- 108090000157 Metallothionein Proteins 0.000 description 2
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 2
- BOPGDPNILDQYTO-NNYOXOHSSA-L NADH(2-) Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP([O-])(=O)OP([O-])(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-L 0.000 description 2
- 244000061176 Nicotiana tabacum Species 0.000 description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 2
- 108090000913 Nitrate Reductases Proteins 0.000 description 2
- 241000123526 Peziza Species 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 241000235402 Rhizomucor Species 0.000 description 2
- 241000235403 Rhizomucor miehei Species 0.000 description 2
- 240000005384 Rhizopus oryzae Species 0.000 description 2
- 235000013752 Rhizopus oryzae Nutrition 0.000 description 2
- 241000235343 Saccharomycetales Species 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- 101000693530 Staphylococcus aureus Staphylokinase Proteins 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 241000194048 Streptococcus equi Species 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 241000187432 Streptomyces coelicolor Species 0.000 description 2
- 241000187392 Streptomyces griseus Species 0.000 description 2
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 235000021536 Sugar beet Nutrition 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 239000005864 Sulphur Substances 0.000 description 2
- 241001136494 Talaromyces funiculosus Species 0.000 description 2
- FEWJPZIEWOKRBE-UHFFFAOYSA-N Tartaric acid Natural products [H+].[H+].[O-]C(=O)C(O)C(O)C([O-])=O FEWJPZIEWOKRBE-UHFFFAOYSA-N 0.000 description 2
- 244000152045 Themeda triandra Species 0.000 description 2
- 241000223261 Trichoderma viride Species 0.000 description 2
- 235000002098 Vicia faba var. major Nutrition 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 241000409279 Xerochrysium dermatitidis Species 0.000 description 2
- 241001523965 Xylaria Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- 241000758405 Zoopagomycotina Species 0.000 description 2
- 108010048241 acetamidase Proteins 0.000 description 2
- 235000011054 acetic acid Nutrition 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 239000001361 adipic acid Substances 0.000 description 2
- 235000011037 adipic acid Nutrition 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 2
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 2
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 2
- 239000004327 boric acid Substances 0.000 description 2
- HKPHPIREJKHECO-UHFFFAOYSA-N butachlor Chemical compound CCCCOCN(C(=O)CCl)C1=C(CC)C=CC=C1CC HKPHPIREJKHECO-UHFFFAOYSA-N 0.000 description 2
- MJBPUQUGJNAPAZ-AWEZNQCLSA-N butin Chemical compound C1([C@@H]2CC(=O)C3=CC=C(C=C3O2)O)=CC=C(O)C(O)=C1 MJBPUQUGJNAPAZ-AWEZNQCLSA-N 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 229910002092 carbon dioxide Inorganic materials 0.000 description 2
- 229940106157 cellulase Drugs 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 235000010980 cellulose Nutrition 0.000 description 2
- 239000002962 chemical mutagen Substances 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- FCRACOPGPMPSHN-UHFFFAOYSA-N desoxyabscisic acid Natural products OC(=O)C=C(C)C=CC1C(C)=CC(=O)CC1(C)C FCRACOPGPMPSHN-UHFFFAOYSA-N 0.000 description 2
- NEKNNCABDXGBEN-UHFFFAOYSA-L disodium;4-(4-chloro-2-methylphenoxy)butanoate;4-(2,4-dichlorophenoxy)butanoate Chemical compound [Na+].[Na+].CC1=CC(Cl)=CC=C1OCCCC([O-])=O.[O-]C(=O)CCCOC1=CC=C(Cl)C=C1Cl NEKNNCABDXGBEN-UHFFFAOYSA-L 0.000 description 2
- 210000002615 epidermis Anatomy 0.000 description 2
- 239000000262 estrogen Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- IXORZMNAPKEEDV-UHFFFAOYSA-N gibberellic acid GA3 Natural products OC(=O)C1C2(C3)CC(=C)C3(O)CCC2C2(C=CC3O)C1C3(C)C(=O)O2 IXORZMNAPKEEDV-UHFFFAOYSA-N 0.000 description 2
- IXORZMNAPKEEDV-OBDJNFEBSA-N gibberellin A3 Chemical compound C([C@@]1(O)C(=C)C[C@@]2(C1)[C@H]1C(O)=O)C[C@H]2[C@]2(C=C[C@@H]3O)[C@H]1[C@]3(C)C(=O)O2 IXORZMNAPKEEDV-OBDJNFEBSA-N 0.000 description 2
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 2
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 210000004209 hair Anatomy 0.000 description 2
- XLYOFNOQVPJJNP-ZSJDYOACSA-N heavy water Substances [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000011081 inoculation Methods 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 235000019421 lipase Nutrition 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 229960000485 methotrexate Drugs 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 239000003471 mutagenic agent Substances 0.000 description 2
- 231100000707 mutagenic chemical Toxicity 0.000 description 2
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 2
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 125000003431 oxalo group Chemical group 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 235000019629 palatability Nutrition 0.000 description 2
- 235000012736 patent blue V Nutrition 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 238000005373 pervaporation Methods 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 239000003375 plant hormone Substances 0.000 description 2
- 235000019833 protease Nutrition 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 238000009938 salting Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 2
- FQENQNTWSFEDLI-UHFFFAOYSA-J sodium diphosphate Chemical compound [Na+].[Na+].[Na+].[Na+].[O-]P([O-])(=O)OP([O-])([O-])=O FQENQNTWSFEDLI-UHFFFAOYSA-J 0.000 description 2
- 239000012064 sodium phosphate buffer Substances 0.000 description 2
- 229940048086 sodium pyrophosphate Drugs 0.000 description 2
- 230000001954 sterilising effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 235000002906 tartaric acid Nutrition 0.000 description 2
- 239000011975 tartaric acid Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 235000019818 tetrasodium diphosphate Nutrition 0.000 description 2
- 239000001577 tetrasodium phosphonato phosphate Substances 0.000 description 2
- 239000011573 trace mineral Substances 0.000 description 2
- 235000013619 trace mineral Nutrition 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 150000003628 tricarboxylic acids Chemical class 0.000 description 2
- 210000003934 vacuole Anatomy 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- TWNIBLMWSKIRAT-RWOPYEJCSA-N (1r,2s,3s,4s,5r)-6,8-dioxabicyclo[3.2.1]octane-2,3,4-triol Chemical compound O1[C@@]2([H])OC[C@]1([H])[C@@H](O)[C@H](O)[C@@H]2O TWNIBLMWSKIRAT-RWOPYEJCSA-N 0.000 description 1
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- OCUSNPIJIZCRSZ-ZTZWCFDHSA-N (2s)-2-amino-3-methylbutanoic acid;(2s)-2-amino-4-methylpentanoic acid;(2s,3s)-2-amino-3-methylpentanoic acid Chemical compound CC(C)[C@H](N)C(O)=O.CC[C@H](C)[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O OCUSNPIJIZCRSZ-ZTZWCFDHSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-L (R)-2-Hydroxy-3-(phosphonooxy)-propanal Natural products O=C[C@H](O)COP([O-])([O-])=O LXJXRIRHZLFYRP-VKHMYHEASA-L 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- ZENKESXKWBIZCV-UHFFFAOYSA-N 2,2,4,4-tetrafluoro-1,3-benzodioxin-6-amine Chemical group O1C(F)(F)OC(F)(F)C2=CC(N)=CC=C21 ZENKESXKWBIZCV-UHFFFAOYSA-N 0.000 description 1
- JAHNSTQSQJOJLO-UHFFFAOYSA-N 2-(3-fluorophenyl)-1h-imidazole Chemical compound FC1=CC=CC(C=2NC=CN=2)=C1 JAHNSTQSQJOJLO-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- YEJRWHAVMIAJKC-UHFFFAOYSA-N 4-Butyrolactone Chemical compound O=C1CCCO1 YEJRWHAVMIAJKC-UHFFFAOYSA-N 0.000 description 1
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- 108010011619 6-Phytase Proteins 0.000 description 1
- 101150008391 A1 gene Proteins 0.000 description 1
- 101150104118 ANS1 gene Proteins 0.000 description 1
- 101100510736 Actinidia chinensis var. chinensis LDOX gene Proteins 0.000 description 1
- 108700016155 Acyl transferases Proteins 0.000 description 1
- 102000057234 Acyl transferases Human genes 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 1
- 241001677738 Aleuron Species 0.000 description 1
- 241000223600 Alternaria Species 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 108010037870 Anthranilate Synthase Proteins 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241001076939 Artines Species 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 1
- 241000228193 Aspergillus clavatus Species 0.000 description 1
- 241000308822 Aspergillus fumigatus Af293 Species 0.000 description 1
- 101001082821 Aspergillus niger Pyruvate carboxylase Proteins 0.000 description 1
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 1
- 101900333744 Aspergillus terreus Pyruvate carboxylase Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 235000007558 Avena sp Nutrition 0.000 description 1
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 1
- 101000775727 Bacillus amyloliquefaciens Alpha-amylase Proteins 0.000 description 1
- 108010023063 Bacto-peptone Proteins 0.000 description 1
- 239000005711 Benzoic acid Substances 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-M Bicarbonate Chemical compound OC([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-M 0.000 description 1
- 241000222478 Bjerkandera adusta Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- MJBPUQUGJNAPAZ-UHFFFAOYSA-N Butine Natural products O1C2=CC(O)=CC=C2C(=O)CC1C1=CC=C(O)C(O)=C1 MJBPUQUGJNAPAZ-UHFFFAOYSA-N 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 101100494262 Caenorhabditis elegans best-12 gene Proteins 0.000 description 1
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- 101100520142 Caenorhabditis elegans pin-2 gene Proteins 0.000 description 1
- 108090000489 Carboxy-Lyases Proteins 0.000 description 1
- 108010006303 Carboxypeptidases Proteins 0.000 description 1
- 102000005367 Carboxypeptidases Human genes 0.000 description 1
- 102100035882 Catalase Human genes 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 108010031396 Catechol oxidase Proteins 0.000 description 1
- 102000030523 Catechol oxidase Human genes 0.000 description 1
- 241000324343 Causa Species 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 241001466517 Ceriporiopsis aneirina Species 0.000 description 1
- 241001646018 Ceriporiopsis gilvescens Species 0.000 description 1
- 241001277875 Ceriporiopsis rivulosa Species 0.000 description 1
- 241000524302 Ceriporiopsis subrufa Species 0.000 description 1
- 241000259840 Chaetomidium Species 0.000 description 1
- 241001057137 Chaetomium fimeti Species 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 108700031407 Chloroplast Genes Proteins 0.000 description 1
- 241000221760 Claviceps Species 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 241000228437 Cochliobolus Species 0.000 description 1
- 241000020428 Colea Species 0.000 description 1
- 241001085790 Coprinopsis Species 0.000 description 1
- 244000251987 Coprinus macrorhizus Species 0.000 description 1
- 235000001673 Coprinus macrorhizus Nutrition 0.000 description 1
- 241001509964 Coptotermes Species 0.000 description 1
- 241001252397 Corynascus Species 0.000 description 1
- 241000221755 Cryphonectria Species 0.000 description 1
- 241001559589 Cullen Species 0.000 description 1
- 108010025880 Cyclomaltodextrin glucanotransferase Proteins 0.000 description 1
- 102100028717 Cytosolic 5'-nucleotidase 3A Human genes 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-N D-glyceraldehyde 3-phosphate Chemical compound O=C[C@H](O)COP(O)(O)=O LXJXRIRHZLFYRP-VKHMYHEASA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- ZAQJHHRNXZUBTE-WUJLRWPWSA-N D-xylulose Chemical compound OC[C@@H](O)[C@H](O)C(=O)CO ZAQJHHRNXZUBTE-WUJLRWPWSA-N 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 101150060155 Dcc gene Proteins 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010001682 Dextranase Proteins 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 241000223924 Eimeria Species 0.000 description 1
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 1
- 235000007810 Eryngium campestre Nutrition 0.000 description 1
- 240000005980 Eryngium maritimum Species 0.000 description 1
- 235000003933 Eryngium maritimum Nutrition 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 241000145614 Fusarium bactridioides Species 0.000 description 1
- 241000223194 Fusarium culmorum Species 0.000 description 1
- 241000223221 Fusarium oxysporum Species 0.000 description 1
- 241001112697 Fusarium reticulatum Species 0.000 description 1
- 241001014439 Fusarium sarcochroum Species 0.000 description 1
- 241000223192 Fusarium sporotrichioides Species 0.000 description 1
- 241001465753 Fusarium torulosum Species 0.000 description 1
- 241000567178 Fusarium venenatum Species 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 241000146398 Gelatoporia subvermispora Species 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 241000626621 Geobacillus Species 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 1
- 229920001503 Glucan Polymers 0.000 description 1
- 102100022624 Glucoamylase Human genes 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241001497663 Holomastigotoides Species 0.000 description 1
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 241000223199 Humicola grisea Species 0.000 description 1
- 108010020056 Hydrogenase Proteins 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- 241000411968 Ilyobacter Species 0.000 description 1
- 241000222342 Irpex Species 0.000 description 1
- 241000222344 Irpex lacteus Species 0.000 description 1
- 102100027612 Kallikrein-11 Human genes 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- 125000001176 L-lysyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C([H])([H])C([H])([H])C(N([H])[H])([H])[H] 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 125000000769 L-threonyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](O[H])(C([H])([H])[H])[H] 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 125000003798 L-tyrosyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C1=C([H])C([H])=C(O[H])C([H])=C1[H] 0.000 description 1
- 125000003580 L-valyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(C([H])([H])[H])(C([H])([H])[H])[H] 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000222435 Lentinula Species 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 102100024295 Maltase-glucoamylase Human genes 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108010054377 Mannosidases Proteins 0.000 description 1
- 102000001696 Mannosidases Human genes 0.000 description 1
- 241000183011 Melanocarpus Species 0.000 description 1
- 241001184659 Melanocarpus albomyces Species 0.000 description 1
- 241000123315 Meripilus Species 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- GMPKIPWJBDOURN-UHFFFAOYSA-N Methoxyamine Chemical compound CON GMPKIPWJBDOURN-UHFFFAOYSA-N 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 241000533901 Narcissus papyraceus Species 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- IOVCWXUNBOPUCH-UHFFFAOYSA-N Nitrous acid Chemical compound ON=O IOVCWXUNBOPUCH-UHFFFAOYSA-N 0.000 description 1
- 241001072230 Oceanobacillus Species 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 240000004371 Panax ginseng Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 241000364057 Peoria Species 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- 241000222397 Phlebia radiata Species 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 1
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 1
- 241000233622 Phytophthora infestans Species 0.000 description 1
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 235000011613 Pinus brutia Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 244000208734 Pisonia aculeata Species 0.000 description 1
- 108700001094 Plant Genes Proteins 0.000 description 1
- 244000252132 Pleurotus eryngii Species 0.000 description 1
- 235000001681 Pleurotus eryngii Nutrition 0.000 description 1
- 241000209048 Poa Species 0.000 description 1
- 241000209049 Poa pratensis Species 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 241001451060 Poitrasia Species 0.000 description 1
- 241000222640 Polyporus Species 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- ATUOYWHBWRKTHZ-UHFFFAOYSA-N Propane Chemical compound CCC ATUOYWHBWRKTHZ-UHFFFAOYSA-N 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 101710123874 Protein-glutamine gamma-glutamyltransferase Proteins 0.000 description 1
- 235000010829 Prunus spinosa Nutrition 0.000 description 1
- 241000383860 Pseudoplectania Species 0.000 description 1
- 241001497658 Pseudotrichonympha Species 0.000 description 1
- 206010061926 Purulence Diseases 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 241000959173 Rasamsonia emersonii Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 101100076264 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MDH1 gene Proteins 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 101900084120 Saccharomyces cerevisiae Triosephosphate isomerase Proteins 0.000 description 1
- 241000204893 Saccharomyces douglasii Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 235000017276 Salvia Nutrition 0.000 description 1
- 240000007164 Salvia officinalis Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 101900348120 Schizosaccharomyces pombe Pyruvate carboxylase Proteins 0.000 description 1
- 241000223255 Scytalidium Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 244000082988 Secale cereale Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- 244000046109 Sorghum vulgare var. nervosum Species 0.000 description 1
- 241000120569 Streptococcus equi subsp. zooepidemicus Species 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 241000958303 Streptomyces achromogenes Species 0.000 description 1
- 241001468227 Streptomyces avermitilis Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- 241001215623 Talaromyces cellulolyticus Species 0.000 description 1
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 1
- 241001313536 Thermothelomyces thermophila Species 0.000 description 1
- 241000183057 Thielavia microspora Species 0.000 description 1
- 241000182980 Thielavia ovispora Species 0.000 description 1
- 241000183053 Thielavia subthermophila Species 0.000 description 1
- 241001495429 Thielavia terrestris Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241000222357 Trametes hirsuta Species 0.000 description 1
- 241000222355 Trametes versicolor Species 0.000 description 1
- 241000217816 Trametes villosa Species 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000215642 Trichophaea Species 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 101710152431 Trypsin-like protease Proteins 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 241000082085 Verticillium <Phyllachorales> Species 0.000 description 1
- 241001507667 Volvariella Species 0.000 description 1
- GLLRIXZGBQOFLM-UHFFFAOYSA-N Xanthorin Natural products C1=C(C)C=C2C(=O)C3=C(O)C(OC)=CC(O)=C3C(=O)C2=C1O GLLRIXZGBQOFLM-UHFFFAOYSA-N 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 240000008866 Ziziphus nummularia Species 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 108010045649 agarase Proteins 0.000 description 1
- 108010050181 aleurone Proteins 0.000 description 1
- SRBFZHDQGSBBOR-LECHCGJUSA-N alpha-D-xylose Chemical compound O[C@@H]1CO[C@H](O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-LECHCGJUSA-N 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 101150078331 ama-1 gene Proteins 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 101150039403 ams gene Proteins 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- QLULGSLAHXLKSR-UHFFFAOYSA-N azane;phosphane Chemical compound N.P QLULGSLAHXLKSR-UHFFFAOYSA-N 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 210000003323 beak Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 235000010233 benzoic acid Nutrition 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 125000000188 beta-D-glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 102000005936 beta-Galactosidase Human genes 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000009141 biological interaction Effects 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- WERYXYBDKMZEQL-UHFFFAOYSA-N butane-1,4-diol Chemical compound OCCCCO WERYXYBDKMZEQL-UHFFFAOYSA-N 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011088 calibration curve Methods 0.000 description 1
- 108010089934 carbohydrase Proteins 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- CURLTUGMZLYLDI-UHFFFAOYSA-N carbon dioxide Natural products O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000021523 carboxylation Effects 0.000 description 1
- 238000006473 carboxylation reaction Methods 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 235000013351 cheese Nutrition 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 238000011098 chromatofocusing Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000013065 commercial product Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 230000008473 connective tissue growth Effects 0.000 description 1
- 239000012531 culture fluid Substances 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 108010005400 cutinase Proteins 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002050 diffraction method Methods 0.000 description 1
- 102000006795 dihydrofolate reductase activity proteins Human genes 0.000 description 1
- 108040000939 dihydrofolate reductase activity proteins Proteins 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 108010091384 endoglucanase 2 Proteins 0.000 description 1
- 108010092413 endoglucanase V Proteins 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 238000011067 equilibration Methods 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 239000006052 feed supplement Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 210000003495 flagella Anatomy 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000004459 forage Substances 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 239000010437 gem Substances 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 229960004198 guanidine Drugs 0.000 description 1
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 1
- 229940093915 gynecological organic acid Drugs 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000009399 inbreeding Methods 0.000 description 1
- 229910052738 indium Inorganic materials 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 239000003317 industrial substance Substances 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000017730 intein-mediated protein splicing Effects 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000010829 isocratic elution Methods 0.000 description 1
- 238000001155 isoelectric focusing Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 238000000622 liquid--liquid extraction Methods 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000005374 membrane filtration Methods 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- LVHBHZANLOWSRM-UHFFFAOYSA-N methylenebutanedioic acid Natural products OC(=O)CC(=C)C(O)=O LVHBHZANLOWSRM-UHFFFAOYSA-N 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- QXYJCZRRLLQGCR-UHFFFAOYSA-N molybdenum(IV) oxide Inorganic materials O=[Mo]=O QXYJCZRRLLQGCR-UHFFFAOYSA-N 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 150000004712 monophosphates Chemical class 0.000 description 1
- 229910000403 monosodium phosphate Inorganic materials 0.000 description 1
- 235000019799 monosodium phosphate Nutrition 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 101150105920 npr gene Proteins 0.000 description 1
- 101150017837 nprM gene Proteins 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 230000031787 nutrient reservoir activity Effects 0.000 description 1
- 230000000050 nutritive effect Effects 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 210000004681 ovum Anatomy 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 108010087558 pectate lyase Proteins 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 239000012466 permeate Substances 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 210000002824 peroxisome Anatomy 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 238000005222 photoaffinity labeling Methods 0.000 description 1
- 229940085127 phytase Drugs 0.000 description 1
- 230000010152 pollination Effects 0.000 description 1
- 229920006393 polyether sulfone Polymers 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- UAJUXJSXCLUTNU-UHFFFAOYSA-N pranlukast Chemical compound C=1C=C(OCCCCC=2C=CC=CC=2)C=CC=1C(=O)NC(C=1)=CC=C(C(C=2)=O)C=1OC=2C=1N=NNN=1 UAJUXJSXCLUTNU-UHFFFAOYSA-N 0.000 description 1
- 229960004583 pranlukast Drugs 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 108060006613 prolamin Proteins 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 101150108007 prs gene Proteins 0.000 description 1
- 101150086435 prs1 gene Proteins 0.000 description 1
- 101150070305 prsA gene Proteins 0.000 description 1
- 101150054232 pyrG gene Proteins 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 230000033458 reproduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229940079827 sodium hydrogen sulfite Drugs 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- 238000010563 solid-state fermentation Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000010025 steaming Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 229940076156 streptococcus pyogenes Drugs 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- HOWHQWFXSLOJEF-MGZLOUMQSA-N systemin Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H]2N(CCC2)C(=O)[C@H]2N(CCC2)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)C(C)C)CCC1 HOWHQWFXSLOJEF-MGZLOUMQSA-N 0.000 description 1
- 108010050014 systemin Proteins 0.000 description 1
- OFVLGDICTFRJMM-WESIUVDSSA-N tetracycline Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(O)=C(C(N)=O)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O OFVLGDICTFRJMM-WESIUVDSSA-N 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- HNBDQABBWNOTRU-UHFFFAOYSA-N thalline Chemical compound C1=CC=[Tl]C=C1 HNBDQABBWNOTRU-UHFFFAOYSA-N 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 239000010937 tungsten Substances 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 101150052264 xylA gene Proteins 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
- 229960003487 xylose Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/38—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from Aspergillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/44—Polycarboxylic acids
- C12P7/46—Dicarboxylic acids having four or less carbon atoms, e.g. fumaric acid, maleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y604/00—Ligases forming carbon-carbon bonds (6.4)
- C12Y604/01—Ligases forming carbon-carbon bonds (6.4.1)
- C12Y604/01001—Pyruvate carboxylase (6.4.1.1)
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Mycology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明涉及具有C4-二羧酸转运蛋白活性的分离的多肽,和编码所述多肽的分离的多核苷酸。本发明亦涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及产生和使用所述多肽的方法,和产生C4-二羧酸如苹果酸的方法。
Description
涉及序列表
本申请包含计算机可读形式的序列表,其通过提述并入本文。
涉及生物材料的保藏
本申请包含对生物材料的保藏的引用,其通过提述并入本文。
发明背景
技术领域
本发明涉及具有C4-二羧酸转运蛋白活性的多肽和编码所述多肽的多核苷酸。本发明亦涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及产生和使用所述多肽的方法,和产生C4-二羧酸如苹果酸的方法。
背景技术
有机酸在多种工业中具有悠久历史的商业使用。举例而言,有机酸用于食品和饲料工业(柠檬酸、抗坏血酸、乳酸、乙酸和葡糖酸),作为用于产生多种聚合物的单体(己二酸、乳酸、丙烯酸和衣康酸),作为金属螯合剂(葡糖酸)和作为“绿色”溶剂(乙酸)(Sauer等,2008,TrendsinBiotechnology26:100-108)。有机酸自身可为商业产品或其可为用于制造其他化学品的化学构件(buildingblock)。除了专门用途之外,长久以来公认C4-二羧酸亦可充当构件化合物以供产生大体积的工业化学品,如1,4-丁二醇,四氢呋喃和γ-丁内酯。由于石油衍生构件的高成本,通过传统石油化学途径产生这些大体积工业化学品的成本显著增加。
有机酸在商业上是通过从石油衍生原料的化学合成(例如,延胡索酸、苹果酸、丙烯酸和己二酸)或通过微生物发酵(例如柠檬酸、乳酸、葡糖酸和衣康酸)产生的。一些有机酸如延胡索酸和苹果酸亦可通过微生物发酵来产生,但由于更低的生产成本,目前在商业上仍通过化学合成从石油化学原料产生。然而,石油衍生构件化学品的成本的日益升高,地缘政治的不稳定性对原油价格的影响,以及对实施利用来源于可再生资源的原料的制造工艺的期望,刺激了通过微生物发酵产生有机酸和其他化学品中的重建的兴趣。
虽然现在通过化学合成从石油化学原料商业性产生苹果酸,其亦可通过微生物发酵产生。苹果酸已在基因工程改造的酵母(酿酒酵母(Saccharomycescerevisia))(Zelle等,2008,Appl.Environ.Microbiol.74:2766-2777)和天然存在的丝状真菌如曲霉属菌种(Aspergillusspp.)(美国专利号3,063,910;Bercovitz等,1990,Appl.Environ.Microbiol.56:1594-1597)中以高水平产生。Abe等(美国专利号3,063,910)和Bercovitz等(1990,Appl.Environ.Microbiol.56:1594-1597)报道了在几种曲霉属菌种中高水平的苹果酸产生。而且,Battat等(1991,Biotechnol.Bioengineering,37:1108-1116)报道了在优化条件下在搅拌的发酵罐中由黄曲霉(Aspergillusflavus)产生了高至113g/L的苹果酸。在WO2010/003728中描述了在酵母中通过微生物发酵产生二羧酸。亦在WO2009/011974和WO2009/155382中描述了通过微生物发酵产生苹果酸。通过对曲霉属(Aspergillus)进行遗传工程改造改善苹果酸产生会使得能够通过发酵经济地商业性生产苹果酸。
曲霉属菌种(Aspergillusspp.)中的苹果酸过量产生在特定的培养条件(有氧条件和高C:N比;碳酸钙亦作为中和剂和作为用于苹果酸生物合成的CO2源添加)下发生。在这些条件下,通过胞质溶胶的、还原性三羧酸(TCA)循环的溢出代谢(overflowmetabolism)导致增加的苹果酸生物合成和分泌入培养基。已在酿酒酵母中报道了通过使用遗传工程增加丙酮酸羧化酶(Bauer等,1999,FEMSMicrobiolLett.179:107-113)或苹果酸脱氢酶(Pines等,1997,Appl.Microbiol.Biotechnol.48:248-255)的水平和增加苹果酸转运蛋白的表达(Zelle等,2008,见上)而增加苹果酸产生。基于生物化学证据,提出了在黄曲霉菌株ATCC13697中,苹果酸脱氢酶活性限制苹果酸产生(Peleg等,1988,Appl.Microbiol.Biotechnol.28:69-75)。2010年8月27日提交、题为“MethodsforImprovingMalicAcidProductioninFilamentousFungi”的PCT申请号PCT/US10/47002(其内容通过提述以其整体并入本文)描述了丝状真菌中的苹果酸产生。
在本领域中,在曲霉属中作为使用重组DNA技术的遗传工程改造的结果而改善C4-二羧酸产生如苹果酸产生会是有益的。本发明提供了具有C4-二羧酸转运蛋白活性的多肽,编码所述多肽的多核苷酸,和用于改善C4-二羧酸产生(例如苹果酸产生)的方法等。
发明内容
本发明涉及具有C4-二羧酸转运蛋白活性的分离的多肽。在一个方面,所述具有C4-二羧酸转运蛋白活性的分离的多肽选自:(a)多肽,其与SEQIDNO:2、4或6,或其成熟多肽序列具有至少65%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1、3或5,或其成熟多肽编码序列,或前述序列的全长互补链在低严格条件下杂交;(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1、3或5,或其成熟多肽编码序列具有至少65%序列同一性;(d)SEQIDNO:2、4或6,或其成熟多肽序列的包含一个或多个(例如两个,几个)氨基酸的取代、缺失和/或***的变体;和(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段。
本发明亦涉及产生C4-二羧酸(例如苹果酸)的方法。在一个方面,该方法包括:(a)培养宿主细胞(例如丝状真菌宿主细胞),所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸;和(b)回收所述C4-二羧酸(例如苹果酸)。在另一个方面,该方法包括(a)将编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸转化入宿主细胞(例如丝状真菌宿主细胞);(b)在培养基中培养经转化的生物;和(c)回收所述C4-二羧酸(例如苹果酸)。在所述方法的一些方面,所述宿主细胞进一步包含编码苹果酸脱氢酶和/或丙酮酸羧化酶的异源多核苷酸。
本发明还涉及宿主细胞(例如丝状真菌宿主细胞,如米曲霉(Aspergillusoryzae)),所述宿主细胞包含本文中所述的编码C4-二羧酸转运蛋白的异源多核苷酸,其中所述宿主细胞分泌和/或能够分泌增加水平的C4-二羧酸(例如苹果酸)。在一些方面,所述宿主细胞进一步包含编码苹果酸脱氢酶和/或丙酮酸羧化酶的异源多核苷酸。
本发明亦涉及信号肽和编码该信号肽的多核苷酸。在一个方面,本发明涉及多核苷酸,其编码可操作地连接于编码蛋白的基因的信号肽,所述信号肽包含或组成为(consistingof)SEQIDNO:2的氨基酸1至61或1至68。在另一个方面,本发明涉及多核苷酸,其编码可操作地连接于编码蛋白的基因的信号肽,所述信号肽包含或组成为SEQIDNO:4的氨基酸1至17。在另一个方面,本发明涉及多核苷酸,其编码可操作地连接于编码蛋白的基因的信号肽,所述信号肽包含或组成为SEQIDNO:6的氨基酸1至68。
本发明亦涉及包含本文中所述的多肽的组合物,编码所述多肽的分离的多核苷酸,包含所述多核苷酸的核酸构建体、表达载体、重组宿主细胞,和产生所述多肽的方法。
附图说明
图1显示pShTh60的限制图谱。
图2显示pSaMF35的限制图谱。
图3显示棘孢曲霉(Aspergillusaculeatus)C4-二羧酸转运蛋白基因(c4t737)的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:1和2)。
图4显示pSaMF36的限制图谱。
图5显示棘孢曲霉C4-二羧酸转运蛋白基因(c4t521)的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:3和4)。
图6显示米曲霉(Aspergillusoryzae)NRRL3488苹果酸脱氢酶基因(mdh3)的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:11和12)。
图7显示pSaMF21的限制图谱。
图8A和8B一同显示了米曲霉NRRL3488丙酮酸羧化酶(pyc)的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:15和16)。
图9显示pRYAN1的限制图谱。
图10显示pAaMAT737的限制图谱。
图11显示pSaMF38的限制图谱。
图12显示棘孢曲霉C4-二羧酸转运蛋白基因(mat737)的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:5和6)。
定义
C4-二羧酸转运蛋白:术语“C4-二羧酸转运蛋白”在本文中定义为可将苹果酸、琥珀酸、草酰乙酸、丙二酸和/或延胡索酸转运至细胞外的二羧酸通透酶(Grobler等,1995,Yeast11:1485-1491;Camarasa等,2001,AppliedandEnvironmentalMicrobiology67:4144-4151)。用于预测线粒体输入的蛋白及其靶向序列的计算方法由Claros和Vincens,1996,Eur.J.Biochem.241:779-786描述。
在一些方面,所述C4-二羧酸转运蛋白具有成熟多肽SEQIDNO:2、SEQIDNO:4和/或SEQIDNO:6的C4-二羧酸转运蛋白活性(例如苹果酸转运蛋白活性)的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%。
苹果酸脱氢酶:术语“苹果酸脱氢酶”在本文中定义为在NADH+H+的存在下催化将草酰乙酸还原为苹果酸和NAD+的苹果酸:NAD+氧还酶(EC1.1.1.37)。就本发明而言,根据下述步骤确定苹果酸脱氢酶活性。测定溶液由1mM草酰乙酸,100mMTrispH8.0,10mMNaHCO3,5mMMgCl2,和0.1mMNADH(SigmaChemicalCo.,St.Louis,MO,USA)组成。将不含草酰乙酸作为底物的测定溶液作为对照运行以测量背景NADH降解率(degradationrates)。用双蒸水制备每种上清的1/100,1/500,1/2500和1/12500的稀释物。将测定溶液的270μl的等分试样分配入96孔聚苯乙烯平底板。添加每种稀释的上清的30μl样品以起始测定。使用340PC读板器(MolecularDevices,Sunnyvale,CA,USA)以下述设定监测反应:340nm,动力学读取(kineticreading)。使用NADH的浓度系列以构建标准曲线,并使用纯化的苹果酸脱氢酶(SigmaChemicalCo.,St.Louis,MO,USA)的稀释系列作为阳性对照。一单位的苹果酸脱氢酶活性等于能够在pH8.0,25℃每分钟将1微摩尔草酰乙酸和NADH+H+转化为苹果酸和NAD+的酶量。
在一些方面,所述苹果酸脱氢酶具有成熟多肽SEQIDNO:12的苹果酸脱氢酶活性的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%。
丙酮酸羧化酶:术语“丙酮酸羧化酶”在本文中定义为在ATP和HCO3 -存在下催化将丙酮酸羧化为草酰乙酸、ADP和磷酸的丙酮酸:二氧化碳连接酶(ADP-形成)(EC6.4.1.1)。就本发明而言,根据针对丙酮酸羧化酶(SigmaChemicalCo.,St.Louis,MO,USA)的SIGMA?QualityControlTest方法的步骤确定丙酮酸羧化酶活性,只是该测定使用pH8.0的Tris缓冲液。一单位的丙酮酸羧化酶活性等于能够在pH7.8,30℃每分钟将1微摩尔的丙酮酸和CO2转化为草酰乙酸的酶量。
在一些方面,所述丙酮酸羧化酶具有成熟多肽SEQIDNO:16的丙酮酸羧化酶活性的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%。
异源多核苷酸:术语“异源多核苷酸”在本文中定义为对于宿主细胞并非天然的多核苷酸;其中已对编码区进行结构修饰的天然多核苷酸;作为通过重组DNA技术(例如,不同的(外源)启动子)操纵DNA的结果其表达定量改变的天然多核苷酸;或其表达通过将一个或多个(例如,两个、几个)额外拷贝的多核苷酸导入宿主细胞而定量改变的天然多核苷酸。
分离的/纯化的:术语“分离的”和“纯化的”意指从至少一种与其天然结合(associated)的成分分离的多肽或多核苷酸。举例而言,如通过SDS-PAGE确定的,该多肽可为至少1%纯,例如至少5%纯,至少10%纯,至少20%纯,至少40%纯,至少60%纯,至少80%纯,至少90%纯,至少93%纯,至少95%纯,至少97%纯,至少98%纯,或至少99%纯;且如通过琼脂糖电泳确定的,该多核苷酸可为至少1%纯,例如至少5%纯,至少10%纯,至少20%纯,至少40%纯,至少60%纯,至少80%纯,至少90%纯,至少93%纯,至少95%纯,至少97%纯,至少98%纯,或至少99%纯。
编码序列:术语“编码序列”的意思是指定其蛋白产物的氨基酸序列的多核苷酸序列。编码序列的边界通常由开读框确定,所述开读框通常以ATG起始密码子或可供选择的起始密码子如GTG和TTG开始,并且以终止密码子如TAA、TAG和TGA结束。编码序列可以是基因组DNA、cDNA、合成多核苷酸和/或重组多核苷酸的序列。
cDNA序列:术语“cDNA序列”意指从得自真核细胞的成熟的、已剪接的mRNA分子在反转录之后所得的DNA。来自基因组DNA起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列包括剪接的步骤加工然后作为成熟的已剪接的mRNA出现。cDNA序列缺乏可存在于相应基因组DNA序列中的***的内含子。相应地,短语“SEQIDNO:X的cDNA序列”意指将SEQIDNO:X中***的内含子序列(若存在)去除之后所得的序列。在一些情况下—当参照的基因组DNA序列缺乏***的内含子序列时—cDNA序列可与相应的基因组DNA序列完全相同。
基因组DNA序列:术语“基因组DNA序列”意指见于来源生物的基因组(例如真核或原核基因组)的DNA序列。在一些情况下,来自真核基因组的基因组DNA序列含有一个或多个***的内含子序列,其作为RNA剪接的结果从初级RNA转录物去除。相应地,短语“SEQIDNO:Y的基因组DNA序列”意指来自来源生物的相应DNA序列,其含有在RNA剪接之前存在的***的内含子序列(若存在)。
成熟多肽序列:术语“成熟多肽序列”意指参照的多核苷酸序列在任何翻译后序列修饰(如N端加工和/或C端截短)之后的部分。在一些情况下,所述成熟多肽序列可以与整个参照的多肽序列相同。在一个方面,基于预测SEQIDNO:2的氨基酸1至68为信号肽的InterProScan程序(TheEuropeanBioinformaticsInstitute),所述成熟多肽序列是SEQIDNO:2的氨基酸69至397。在另一个方面,基于预测SEQIDNO:2的氨基酸1至61为信号肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),所述成熟多肽序列是SEQIDNO:2的氨基酸62至397。在另一个方面,基于预测SEQIDNO:4的氨基酸1至17为信号肽的SignalP程序,所述成熟多肽序列是SEQIDNO:4的氨基酸18至418。在另一个方面,基于预测无信号肽的InterProScan程序,所述成熟多肽序列是SEQIDNO:4的氨基酸1至418。在一个方面,基于预测SEQIDNO:6的氨基酸1至68为信号肽的InterProScan程序,所述成熟多肽序列是SEQIDNO:2的氨基酸69至397。
成熟多肽编码序列:术语“成熟多肽编码序列”意指参照的多核苷酸序列(例如基因组或cDNA序列)编码成熟多肽序列的部分。在一些情况下,所述成熟多肽编码序列可以与整个参照的多核苷酸序列相同。在一个方面,基于预测SEQIDNO:1的核苷酸1至204编码信号肽的InterProScan程序(TheEuropeanBioinformaticsInstitute),所述成熟多肽编码序列是SEQIDNO:1的核苷酸205至1194。在另一个方面,基于预测SEQIDNO:1的核苷酸1至183编码信号肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),所述成熟多肽编码序列是SEQIDNO:1的核苷酸184至1194。在另一个方面,基于预测SEQIDNO:3的核苷酸1至51编码信号肽的SignalP程序,所述成熟多肽编码序列是SEQIDNO:3的核苷酸52至1257。在另一个方面,基于预测无信号肽的InterProScan程序,所述成熟多肽编码序列是SEQIDNO:3的核苷酸1至1257。在另一个方面,基于预测SEQIDNO:5的核苷酸1至204编码信号肽的InterProScan程序,所述成熟多肽编码序列是SEQIDNO:1的核苷酸205至1194。
片段:术语“片段”意指从参照的多肽序列的氨基和/或羧基末端缺失了一个或多个(例如两个、几个)氨基酸的多肽。在一个方面,所述片段具有C4-二羧酸转运蛋白活性。在另一个方面,片段包含SEQIDNO:2的至少337个氨基酸残基,例如至少357个氨基酸残基或至少377个氨基酸残基。在另一个方面,片段包含SEQIDNO:4的至少355个氨基酸残基,例如至少375个氨基酸残基或至少395个氨基酸残基。在另一个方面,片段包含SEQIDNO:6的至少337个氨基酸残基,例如至少357个氨基酸残基或至少377个氨基酸残基。
亚序列:术语“亚序列(subsequence)”意指从参照的核苷酸序列的5'和/或3'端缺失了一个或多个(例如两个、几个)核苷酸的多核苷酸。在一个方面,所述亚序列编码具有C4-二羧酸转运蛋白活性的片段。在另一个方面,亚序列包含SEQIDNO:1的至少1011个核苷酸,例如至少1171个核苷酸或至少1131个核苷酸。在另一个方面,亚序列包含SEQIDNO:3的至少1065个核苷酸,例如至少1125个核苷酸或至少1185个核苷酸。在另一个方面,亚序列包含SEQIDNO:5的至少1011个核苷酸,例如至少1171个核苷酸或至少1131个核苷酸。
等位变体(allelicvariant):术语“等位变体”意指占据相同染色体基因座的基因的任何两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
序列同一性:两个氨基酸序列间或两个核苷酸序列间的相关性由参数“序列同一性”所描述。
就本发明而言,两个氨基酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套组(TheEuropeanMolecularBiologyOpenSoftwareSuite),Rice等,2000,TrendsGenet.16:276-277)的Needle程序(优选为3.0.0版或之后的版本)中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)确定的。所用的可选参数为缺口开放罚分(gapopenpenalty)10,缺口延伸罚分(gapextensionpenalty)0.5,和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用标记为“最长同一性”的Needle输出(使用-nobrief选项获得)作为百分比同一性并如下计算:
(相同的残基×100)/(比对长度-比对中缺口总数)
就本发明而言,两个脱氧核糖核苷酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套组(TheEuropeanMolecularBiologyOpenSoftwareSuite),Rice等,2000,见上)的Needle程序(优选为3.0.0版或之后的版本)中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上)确定的。所用的可选参数为缺口开放罚分10,缺口延伸罚分0.5,和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩阵。使用标记为”最长同一性”的Needle输出(使用-nobrief选项获得)作为百分比同一性并如下计算:
(相同的脱氧核糖核苷酸×100)/(比对长度-比对中缺口总数)。
表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,其分离自天然存在的基因,或经修饰以本来不存在于(nototherwiseexist)自然界中的方式含有核酸的区段,或为合成的,其中所述核酸分子包含一个或多个(例如两个,几个)调控序列。
调控序列(controlsequence):术语“调控序列”意指对于多肽表达必需的核酸序列。调控序列对于编码所述多肽的多核苷酸可以是天然的或外源的,以及对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子序列、信号肽序列和转录终止子序列。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的多核苷酸编码区的连接。
可操作地连接:术语“可操作地连接”意指这样的构型,其中将调控序列置于相对于多核苷酸的编码序列的适当位置,使得调控序列指导编码序列的表达。
表达载体:术语“表达载体”意指线性的或环状的DNA分子,其包含编码多肽的多核苷酸,并与调控序列可操作地连接,其中所述调控序列提供编码所述多肽的多核苷酸的表达。最少的情况,所述表达载体包含启动子序列,和转录和翻译终止信号序列。
宿主细胞:术语“宿主细胞”意指任何细胞类型,所述细胞类型对于用包含本发明的多核苷酸(例如编码C4-二羧酸转运蛋白的多核苷酸)的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。术语“宿主细胞”涵盖亲本细胞的任何后代,其由于在复制过程中发生的突变而不同于亲本细胞。
变体:术语“变体”意指在一个或多个位置包含变化即取代、***和/或缺失一个或多个(例如两个、几个)氨基酸残基的,具有活性例如C4-二羧酸转运蛋白活性的多肽。取代意指将占据某位置的氨基酸用不同氨基酸替换;缺失意指去除占据某位置的氨基酸;而***意指在占据某位置的氨基酸的相邻处添加一个或多个,例如1-3个氨基酸。
体积产量:术语“体积产量”指每单位时间每体积(例如,培养基及其中内含物的总体积)使用的***所产生的参照的产物的量(例如,产生的C4-二羧酸的量)。
发酵培养基:术语“发酵培养基”指包含一种或多种(例如,两种,几种)糖如葡萄糖、果糖、蔗糖、纤维二糖、木糖、木酮糖、***糖、甘露糖、半乳糖和/或可溶性寡糖的培养基,其中所述培养基能够部分地通过宿主细胞转化(发酵)为所需产物,如C4-二羧酸。在一些情况下,所述发酵培养基源自天然来源,如甘蔗,淀粉,或纤维素,并可为通过酶水解(糖化)而预处理所述来源的结果。
在本文中,提及“约”某值或参数包括了涉及该值或参数本身的方面。举例而言,提及“约X”的描述包括了“X”的方面。
如用于本文中和所附权利要求中,除非上下文明确地表示相反,单数形式“一(个/种…)(a)”或“所述/该(the)”包括了对复数的提及。应理解本文中所述的发明的各方面包括了“由…组成(consisting)”和/或“基本上由…组成(consistingessentiallyof)”的方面。
除非另行定义或上下文明确指出,本文中使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含意。
发明详述
具有C-4二羧酸转运蛋白活性的多肽
本发明涉及具有C4-二羧酸转运蛋白活性的分离的多肽。在一个方面,所述具有C4-二羧酸转运蛋白活性的分离的多肽选自:
(a)多肽,其与SEQIDNO:2、4或6,或其成熟多肽序列具有至少65%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在低严格条件下与SEQIDNO:1、3或5,其成熟多肽编码序列,或前述序列的全长互补链杂交;
(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1、3或5,或其成熟多肽编码序列具有至少65%序列同一性;
(d)SEQIDNO:2、4或6,或其成熟多肽序列的包含一个或多个(例如两个,几个)氨基酸的取代、缺失和/或***的变体;和
(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段。
在另一个方面,所述具有C4-二羧酸转运蛋白活性的分离的多肽选自:
(a)多肽,其与SEQIDNO:2,或其成熟多肽序列具有至少65%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在低严格条件下与SEQIDNO:1,其成熟多肽编码序列,或前述序列的全长互补链杂交;
(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1,或其成熟多肽编码序列具有至少65%序列同一性;
(d)SEQIDNO:2,或其成熟多肽序列的包含一个或多个(例如两个,几个)氨基酸的取代、缺失和/或***的变体;和
(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段。
在另一个方面,所述具有C4-二羧酸转运蛋白活性的分离的多肽选自:
(a)多肽,其与SEQIDNO:4,或其成熟多肽序列具有至少65%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在低严格条件下与SEQIDNO:3,其成熟多肽编码序列,或前述序列的全长互补链杂交;
(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:3,或其成熟多肽编码序列具有至少65%序列同一性;
(d)SEQIDNO:4,或其成熟多肽序列的包含一个或多个(例如两个,几个)氨基酸的取代、缺失和/或***的变体;和
(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段。
在另一个方面,所述具有C4-二羧酸转运蛋白活性的分离的多肽选自:
(a)多肽,其与SEQIDNO:6,或其成熟多肽序列具有至少65%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在低严格条件下与SEQIDNO:5,其成熟多肽编码序列,或前述序列的全长互补链杂交;
(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:5,或其成熟多肽编码序列具有至少65%序列同一性;
(d)SEQIDNO:6,或其成熟多肽序列的包含一个或多个(例如两个,几个)氨基酸的取代、缺失和/或***的变体;和
(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段。
在一些这些方面,所述分离的多肽具有氨基酸序列,所述氨基酸序列与SEQIDNO:2,或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,并具有C4-二羧酸转运蛋白活性。在一个方面,所述多肽包含氨基酸序列,所述氨基酸序列与SEQIDNO:2,或其成熟多肽序列相差不多于十个氨基酸,例如五个氨基酸,四个氨基酸,三个氨基酸,两个氨基酸,或一个氨基酸。
在一个方面,所述多肽包含或组成为SEQIDNO:2的氨基酸序列,SEQIDNO:2的成熟多肽序列,其等位变体,或前述序列的具有C4-二羧酸转运蛋白活性的片段。在另一个方面,所述多肽包含或组成为SEQIDNO:2的氨基酸序列。在另一个方面,所述多肽包含或组成为SEQIDNO:2的成熟多肽序列。在另一个优选的方面,所述多肽包含或组成为SEQIDNO:2的氨基酸62至397或69至397。
在一些这些方面,所述分离的多肽具有氨基酸序列,所述氨基酸序列与SEQIDNO:4,或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,并具有C4-二羧酸转运蛋白活性。在一个方面,所述多肽包含氨基酸序列,所述氨基酸序列与SEQIDNO:4,或其成熟多肽序列相差不多于十个氨基酸,例如五个氨基酸,四个氨基酸,三个氨基酸,两个氨基酸,或一个氨基酸。
在一个方面,所述多肽包含或组成为SEQIDNO:4的氨基酸序列,SEQIDNO:4的成熟多肽序列,其等位变体,或前述序列的具有C4-二羧酸转运蛋白活性的片段。在另一个方面,所述多肽包含或组成为SEQIDNO:4的氨基酸序列。在另一个方面,所述多肽包含或组成为SEQIDNO:4的成熟多肽序列。在另一个优选的方面,所述多肽包含或组成为SEQIDNO:2的氨基酸52至418。
在一些这些方面,所述分离的多肽具有氨基酸序列,所述氨基酸序列与SEQIDNO:6,或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性,并具有C4-二羧酸转运蛋白活性。在一个方面,所述多肽包含氨基酸序列,所述氨基酸序列与SEQIDNO:6,或其成熟多肽序列相差不多于十个氨基酸,例如五个氨基酸,四个氨基酸,三个氨基酸,两个氨基酸,或一个氨基酸。
在一个方面,所述多肽包含或组成为SEQIDNO:6的氨基酸序列,SEQIDNO:6的成熟多肽序列,其等位变体,或前述序列的具有C4-二羧酸转运蛋白活性的片段。在另一个方面,所述多肽包含或组成为SEQIDNO:6的氨基酸序列。在另一个方面,所述多肽包含或组成为SEQIDNO:6的成熟多肽序列。在另一个优选的方面,所述多肽包含或组成为SEQIDNO:6的氨基酸69至397。
在一个方面,所述具有C4-二羧酸转运蛋白活性的分离的多肽由多核苷酸编码,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:1,其成熟多肽编码序列,或前述序列的全长互补链(参见,例如J.Sambrook,E.F.Fritsch和T.Maniatus,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。
在另一个方面,所述具有C4-二羧酸转运蛋白活性的分离的多肽由多核苷酸编码,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:3,其成熟多肽编码序列,或前述序列的全长互补链。
在另一个方面,所述具有C4-二羧酸转运蛋白活性的分离的多肽由多核苷酸编码,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:5,其成熟多肽编码序列,或前述序列的全长互补链。
在另一个方面,所述具有C4-二羧酸转运蛋白活性的分离的多肽由多核苷酸编码,所述多核苷酸与SEQIDNO:1、3或5,其成熟多肽编码序列,或前述序列的全长互补链具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
在一个方面,所述具有C4-二羧酸转运蛋白活性的分离的多肽由多核苷酸编码,所述多核苷酸与SEQIDNO:1,其成熟多肽编码序列,或前述序列的全长互补链具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
在一个方面,所述具有C4-二羧酸转运蛋白活性的分离的多肽由多核苷酸编码,所述多核苷酸与SEQIDNO:3,其成熟多肽编码序列,或前述序列的全长互补链具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
在一个方面,所述具有C4-二羧酸转运蛋白活性的分离的多肽由多核苷酸编码,所述多核苷酸与SEQIDNO:5,其成熟多肽编码序列,或前述序列的全长互补链具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
在一个方面,所述多肽由SEQIDNO:1、3或5,或其成熟多肽编码序列编码。在一个方面,所述多肽由SEQIDNO:1或其成熟多肽编码序列编码。在一个方面,所述多肽由SEQIDNO:1编码。在一个方面,所述多肽由SEQIDNO:3或其成熟多肽编码序列编码。在一个方面,所述多肽由SEQIDNO:3编码。在一个方面,所述多肽由SEQIDNO:5或其成熟多肽编码序列编码。在一个方面,所述多肽由SEQIDNO:5编码。在一个方面,所述多肽由SEQIDNO:1、3或5的亚序列编码,其中所述亚序列编码具有C4-二羧酸转运蛋白活性的多肽。在一个方面,所述多肽由SEQIDNO:1的亚序列编码,其中所述亚序列编码具有C4-二羧酸转运蛋白活性的多肽。在一个方面,所述多肽由SEQIDNO:3的亚序列编码,其中所述亚序列编码具有C4-二羧酸转运蛋白活性的多肽。在一个方面,所述多肽由SEQIDNO:5的亚序列编码,其中所述亚序列编码具有C4-二羧酸转运蛋白活性的多肽。
在一个方面,所述分离的多肽是SEQIDNO:2、4或6,或其成熟多肽编码序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体。在一个方面,所述多肽是SEQIDNO:2的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一个方面,所述多肽是SEQIDNO:2的成熟多肽的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一个方面,所述多肽是SEQIDNO:4的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一个方面,所述多肽是SEQIDNO:4的成熟多肽的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一个方面,所述多肽是SEQIDNO:6的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一个方面,所述多肽是SEQIDNO:6的成熟多肽的包含一个或多个氨基酸的取代、缺失和/或***的变体。
优选地,氨基酸改变的性质是较不重要的(ofaminornature),即保守的氨基酸取代或***,其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或结合域(bindingdomain)。
保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specificactivity)的氨基酸取代是本领域已知的,并且由例如H.Neurath和R.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
或者,氨基酸改变具有这样的性质:使多肽的物理化学性质改变。例如,氨基酸改变可改善多肽的热稳定性,改变底物特异性,改变最适pH等。
能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的C4-二羧酸转运蛋白活性以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来确定。参见例如deVos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBSLett.309:59-64。必需氨基酸的身份(identity)也能够从与多肽的同一性分析来推断,所述多肽与亲本多肽相关。
能够使用已知的诱变、重组和/或改组(shuffling)方法接着进行有关的筛选方法,例如那些由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;WO95/17413;或WO95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或***。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman等,1991,Biochemistry30:10832-10837;美国专利No.5,223,409;WO92/06204)和区域定向的诱变(Derbyshire等,1986,Gene46:145;Ner等,1988,DNA7:127)。
诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域中的标准方法快速测序。这些方法允许快速确定多肽中单个氨基酸残基的重要性。
在一些方面,SEQIDNO:2、4或6,或其成熟多肽序列的氨基酸取代、缺失和/或***的总数不多于10,例如不多于1,2,3,4,5,6,7,8或9。
在另一个方面,所述多肽是SEQIDNO:2、4或6,或其成熟多肽序列的片段,其中所述片段具有C4-二羧酸转运蛋白活性。在一个方面,所述多肽是SEQIDNO:2或其成熟多肽序列的片段,其中所述片段具有C4-二羧酸转运蛋白活性。在一个方面,所述片段含有SEQIDNO:2的至少337个氨基酸残基,例如至少357个氨基酸残基,或至少377个氨基酸残基。在另一个方面,所述多肽是SEQIDNO:4或其成熟多肽序列的片段,其中所述片段具有C4-二羧酸转运蛋白活性。在一个方面,所述片段含有SEQIDNO:4的至少355个氨基酸残基,例如至少375个氨基酸残基,或至少395个氨基酸残基。在另一个方面,所述多肽是SEQIDNO:6或其成熟多肽序列的片段,其中所述片段具有C4-二羧酸转运蛋白活性。在一个方面,所述片段含有SEQIDNO:6的至少337个氨基酸残基,例如至少357个氨基酸残基,或至少377个氨基酸残基。
所述多肽可为杂合的多肽,其中一个多肽的一部分融合于另一个多肽的一部分的N端或C端。
所述多肽可为融合多肽或可切割的融合多肽,其中另一种多肽融合于本发明多肽的N端或C端。通过将编码另一个多肽的多核苷酸融合于本发明的多核苷酸来产生融合的多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们符合读框(inframe),并且使融合多肽的表达在相同启动子和终止子的调控下。融合蛋白亦可使用内蛋白(intein)技术构建,其中融合物在翻译后产生(Cooper等,1993,EMBOJ.12:2575-2583;Dawson等,1994,Science266:776-779)。
融合多肽还可以包含在两个多肽之间的切割位点。一旦分泌了融合多肽,就切割所述位点,释放所述两个多肽。切割位点的实例包括,但不限于,Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology9:378-381;Eaton等,1986,Biochem.25:505-512;Collins-Racie等,1995,Biotechnology13:982-987;Carter等,1989,Proteins:Structure,Function,andGenetics6:240-248;以及Stevens,2003,DrugDiscoveryWorld4:35-48中公开的位点。
具有C4-二羧酸转运蛋白活性的多肽的来源
本发明的具有C4-二羧酸转运蛋白活性的多肽(例如SEQIDNO:2、4或6,或其成熟多肽序列的多肽)可获得自任何属的微生物。就本发明而言,如用于本文中的、与给定的来源相联的术语“获得自”,意思应为由多核苷酸编码的多肽由所述来源产生,或由其中***了来自所述来源的多核苷酸的株产生。在一个方面,从给定来源获得的多肽分泌至胞外。
所述多肽可为细菌多肽。例如,所述多肽可为***多肽如具有C4-二羧酸转运蛋白活性的芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、肠球菌属(Enterococcus)、地芽孢杆菌属(Geobacillus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、海洋芽孢杆菌属(Oceanobacillus)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)或链霉菌属(Streptomyces)多肽;或革兰氏阴性细菌多肽,如具有C4-二羧酸转运蛋白活性的弯曲杆菌属(Campylobacter)、大肠杆菌(E.coli)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、螺杆菌属(Helicobacter)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)或脲原体属(Ureaplasma)多肽。
在一个方面,所述多肽是嗜碱芽孢杆菌(Bacillusalkalophilus)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、短芽孢杆菌(Bacillusbrevis)、环状芽孢杆菌(Bacilluscirculans)、克劳氏芽孢杆菌(Bacillusclausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillusfirmus)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacilluslentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、短小芽孢杆菌(Bacilluspumilus)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillussubtilis)或苏云金芽孢杆菌(Bacillusthuringiensis)多肽。
在另一个方面,所述多肽是似马链球菌(Streptococcusequisimilis)、酿脓链球菌(Streptococcuspyogenes)、***链球菌(Streptococcusuberis)或马链球菌兽瘟亚种(Streptococcusequisubsp.Zooepidemicus)多肽。
在另一个方面,所述多肽是不产色链霉菌(Streptomycesachromogenes)、除虫链霉菌(Streptomycesavermitilis)、天蓝链霉菌(Streptomycescoelicolor)、灰色链霉菌(Streptomycesgriseus)或浅青紫链霉菌(Streptomyceslividans)多肽。
所述多肽亦可为真菌多肽。例如,所述多肽可为酵母多肽,如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽,或丝状真菌多肽,如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、Claviceps、Cochliobolus、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、蘑菇属(Lentinula)、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、包脚菇属(Volvariella)或炭角菌属(Xylaria)多肽。
在另一个方面,所述多肽是卡尔酵母(Saccharomycescarlsbergensis)、酿酒酵母、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多肽。
在另一个方面,所述多肽是解纤维枝顶孢霉(Acremoniumcellulolyticus)、棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、臭曲霉(Asperigullusfoetidus)、烟曲霉(Aspergillusfumigatus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉、Chrysosporiuminops、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、Chrysosporiummerdarium、毡金孢子菌(Chrysosporiumpannicola)、Chrysosporiumqueenslandicum、热带金孢子菌(Chrysosporiumtropicum)、Chrysosporiumzonatum、杆孢状镰孢(Fusariumbactridioides)、禾谷镰孢(Fusariumcerealis)、库威镰孢(Fusariumcrookwellense)、大刀镰孢(Fusariumculmorum)、禾本科镰孢(Fusariumgraminearum)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusariumnegundi)、尖镰孢(Fusariumoxysporum)、多枝镰孢(Fusariumreticulatum)、粉红镰孢(Fusariumroseum)、接骨木镰孢(Fusariumsambucinum)、肤色镰孢(Fusariumsarcochroum)、拟分枝孢镰孢(Fusariumsporotrichioides)、硫色镰孢(Fusariumsulphureum)、圆镰孢(Fusariumtorulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusariumvenenatum)、灰腐质霉(Humicolagrisea)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicolalanuginosa)、白耙齿菌(Irpexlacteus)、米黑毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurosporacrassa)、绳状青霉(Penicilliumfuniculosum)、产紫青霉(Penicilliumpurpurogenum)、黄孢平革菌(Phanerochaetechrysosporium)、无色梭孢壳(Thielaviaachromatica)、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭孢壳(Thielaviaaustraleinsis)、Thielaviafimeti、小孢梭孢壳(Thielaviamicrospora)、卵孢梭孢壳(Thielaviaovispora)、Thielaviaperuviana、毛梭孢壳(Thielaviasetosa)、瘤孢梭孢壳(Thielaviaspededonium)、Thielaviasubthermophila、土生梭孢霉(Thielaviaterrestris)、哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或绿色木霉(Trichodermaviride)多肽。
在另一个方面,所述多肽是曲霉属多肽,例如棘孢曲霉多肽,如来自大肠杆菌NRRLB-50400、大肠杆菌NRRLB-50388或大肠杆菌NRRLB-50401的棘孢曲霉多肽。
在另一个方面,所述多肽是SEQIDNO:2或SEQIDNO:4的棘孢曲霉多肽。在另一个方面,所述多肽是SEQIDNO:2的棘孢曲霉多肽。在另一个方面,所述多肽是SEQIDNO:4的棘孢曲霉多肽。
可理解的是对于前述的种,本发明包含完全和不完全阶段(perfectandimperfectstates),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域技术人员将容易地识别适合的等同物的身份。
这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和细胞培养物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌种保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。
亦可使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得所述多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。然后可通过相似地筛选另一种微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码所述多肽的多核苷酸。一旦用探针检测到编码所述多肽的多核苷酸,就能够使用本领域普通技术人员公知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,见上文)。
多核苷酸
本发明亦涉及编码本发明的多肽的分离的多核苷酸(例如,编码任何涉及SEQIDNO:2、4或6的方面的多肽的分离的多核苷酸)。
用于分离或克隆编码编码多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆多核苷酸。参见,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化转录(ligatedactivatedtranscription;LAT)和基于核苷酸序列的扩增(NASBA)。可以从曲霉属(例如棘孢曲霉)菌株,或其他或相关生物体克隆所述多核苷酸,并且因此可为所述核苷酸序列的多肽编码区的等位变体或种变体(speciesvariant)。
本发明亦涉及分离的多核苷酸,其包含或组成为核苷酸序列,所述核苷酸序列与SEQIDNO:1、3或5,或其成熟多肽编码序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性,并编码具有C4-二羧酸转运蛋白活性的多肽。
在一个方面,所述分离的多核苷酸包含或组成为核苷酸序列,所述核苷酸序列与SEQIDNO:1或其成熟多肽编码序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性,并编码具有C4-二羧酸转运蛋白活性的多肽。
在一个方面,所述分离的多核苷酸包含或组成为核苷酸序列,所述核苷酸序列与SEQIDNO:3或其成熟多肽编码序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性,并编码具有C4-二羧酸转运蛋白活性的多肽。
在一个方面,所述分离的多核苷酸包含或组成为核苷酸序列,所述核苷酸序列与SEQIDNO:5或其成熟多肽编码序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性,并编码具有C4-二羧酸转运蛋白活性的多肽。
修饰编码本发明多肽的多核苷酸对于合成与所述多肽基本上相似的多肽可为必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适pH等方面不同的变体。可以在作为SEQIDNO:1、3或5的成熟多肽编码序列存在的多核苷酸,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建变体序列:所述取代不产生所述多肽的氨基酸序列的变化,但是符合意欲产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述,参见,例如,Ford等,1991,ProteinExpressionandPurification2:95-107。
本发明亦涉及编码本发明的多肽的分离的多核苷酸,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:1、3或5;SEQIDNO:1、3或5的成熟多肽编码序列;其全长互补链;或前述序列的等位变体或亚序列(参见,例如Sambrook等,1989,见上文),如本文中所定义。
在一个方面,所述分离的多核苷酸在非常低严格条件,低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:1;SEQIDNO:1的成熟多肽编码序列;其全长互补链;或前述序列的等位变体或亚序列(参见,例如Sambrook等,1989,见上文),如本文中所定义。
在一个方面,所述分离的多核苷酸在非常低严格条件,低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:3或1;SEQIDNO:3的成熟多肽编码序列;其全长互补链;或前述序列的等位变体或亚序列(参见,例如Sambrook等,1989,见上文),如本文中所定义。
在一个方面,所述分离的多核苷酸在非常低严格条件,低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:5或1;SEQIDNO:5的成熟多肽编码序列;其全长互补链;或前述序列的等位变体或亚序列(参见,例如Sambrook等,1989,见上文),如本文中所定义。
在一个方面,所述多核苷酸包含或组成为SEQIDNO:1,SEQIDNO:1的成熟多肽编码序列,或大肠杆菌NRRLB-50400中包含的质粒pAaC4T737中包含的序列,或SEQIDNO:1编码SEQIDNO:2的具有C4-二羧酸转运蛋白活性的片段(例如SEQIDNO:2的氨基酸69-397或62至397)的亚序列,如SEQIDNO:1的核苷酸204至1194或184至1194的多核苷酸。
在另一个方面,所述多核苷酸包含或组成为SEQIDNO:3,SEQIDNO:3的成熟多肽编码序列,或大肠杆菌NRRLB-50388中包含的质粒pAaC4T521中包含的序列,或SEQIDNO:3编码SEQIDNO:4的具有C4-二羧酸转运蛋白活性的片段(例如SEQIDNO:4的氨基酸18-418)的亚序列,如SEQIDNO:3的核苷酸52至1257的多核苷酸。
在另一个方面,所述多核苷酸包含或组成为SEQIDNO:5,SEQIDNO:5的成熟多肽编码序列,或大肠杆菌NRRLB-50401中包含的质粒pAaMAT737中包含的序列,或SEQIDNO:5编码SEQIDNO:6的具有C4-二羧酸转运蛋白活性的片段(例如SEQIDNO:6的氨基酸69-397)的亚序列,如SEQIDNO:5的核苷酸205至1194的多核苷酸。
SEQIDNO:1、3或5的多核苷酸,或亚序列,以及SEQIDNO:2、4或6的氨基酸序列,或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有C4-二羧酸转运蛋白活性的多肽的DNA。具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组DNA或cDNA杂交,以鉴定和分离其中相应的基因。这些探针可明显短于完整序列,但长度上应为至少14个核苷酸,例如至少25个核苷酸,至少35个核苷酸,或至少70个核苷酸。优选地,所述核酸探针为至少100个核苷酸的长度,例如至少200个核苷酸,至少300个核苷酸,至少400个核苷酸,或至少500个核苷酸的长度,至少600个核苷酸,例如至少700个核苷酸,至少800个核苷酸,或至少900个核苷酸的长度。DNA和RNA探针二者均可使用。通常将探针标记以供检测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。这些探针涵盖于本发明中。
可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选与上述探针杂交并且编码具有C4-二羧酸转运蛋白活性的多肽的DNA。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的担载体材料并且固定于其上。为了鉴定与SEQIDNO:1、3或5,或其亚序列同源的克隆或DNA,所述担载体材料优选用于Sounthern印迹。
就本发明而言,杂交表示多核苷酸在非常低至非常高的严格条件下与标记的核酸探针杂交,所述核酸探针对应于SEQIDNO:1、3或5,SEQIDNO:1、3或5的成熟多肽编码序列,其全长互补链;或前述序列的亚序列。可使用例如X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。
在一个方面,核酸探针是SEQIDNO:1、3或5。在另一个方面,核酸探针是SEQIDNO:1、3或5的成熟多肽编码序列。在另一个方面,核酸探针是编码SEQIDNO:2、4或6的多肽,或其片段的多核苷酸。在另一个方面,核酸探针是SEQIDNO:1。在另一个方面,核酸探针是SEQIDNO:3。在另一个方面,核酸探针是SEQIDNO:5。在另一个方面,核酸探针是大肠杆菌NRRLB-50400中包含的质粒pAaC4T737中包含的多核苷酸,其中所述多核苷酸编码具有C4-二羧酸转运蛋白活性的多肽。在另一个方面,核酸探针是大肠杆菌NRRLB-50400中包含的质粒pAaC4T737中包含的成熟多肽编码序列,其中所述多肽具有C4-二羧酸转运蛋白活性。在另一个方面,核酸探针是大肠杆菌NRRLB-50388中包含的质粒pAaC4T521中包含的多核苷酸,其中所述多核苷酸编码具有C4-二羧酸转运蛋白活性的多肽。在另一个方面,核酸探针是大肠杆菌NRRLB-50388中包含的质粒pAaC4T521中包含的成熟多肽编码序列,其中所述多肽具有C4-二羧酸转运蛋白活性。在另一个方面,核酸探针是大肠杆菌NRRLB-50401中包含的质粒pAaMAT737中包含的多核苷酸,其中所述多核苷酸编码具有C4-二羧酸转运蛋白活性的多肽。在另一个方面,核酸探针是大肠杆菌NRRLB-50401中包含的质粒pAaMAT737中包含的成熟多肽编码序列,其中所述多肽具有C4-二羧酸转运蛋白活性。
对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42℃,在5XSSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严格性为25%的甲酰胺、对于中和中-高严格性为35%的甲酰胺、或对于高和非常高严格性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。使用2XSSC、0.2%SDS在45℃(非常低严格性),在50℃(低严格性),在55℃(中严格性),在60℃(中-高严格性),在65℃(高严格性),和在70℃(非常高严格性)将载体材料最终洗涤三次,每次15分钟。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严格条件定义为在比使用根据Bolton和McCarthy计算法(1962,Proc.Natl.Acad.Sci.USA48:1390)计算的Tm低大约5℃至大约10℃,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,1×Denhardt溶液,1mM焦磷酸钠(sodiumpyrophosphate),1mM磷酸二氢钠(sodiummonobasicphosphate),0.1mMATP和0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交和杂交最佳12至24小时。将所述载体材料在6×SSC加0.1%SDS中最终洗涤一次15分钟,并用6×SSC在比计算的Tm低5℃至10℃的温度洗涤两次,每次15分钟。
核酸构建体
本发明还涉及核酸构建体,所述核酸构建体包含可操作地连接于一个或多个(例如两个、几个)调控序列的本发明的多核苷酸,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。本发明亦涵盖利用核酸构建体的宿主细胞和方法,所述核酸构建体包含连接于一个或多个调控序列、编码本文中所述的C4-二羧酸转运蛋白(和/或本文中所述的苹果酸脱氢酶,或丙酮酸羧化酶)的异源多核苷酸,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导表达。此类核酸构建体可用于本文中所述的任何宿主细胞和方法中。
可以用许多方式操作本文中所述的多核苷酸以提供多肽的表达。依赖于表达载体,在将多核苷酸***载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
调控序列可为启动子序列,其是由用于表达编码本发明的多肽的多核苷酸的宿主细胞所识别的多核苷酸。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何多核苷酸,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
本文中所述的每个多核苷酸可以可操作地连接于对于所述多核苷酸是外源的启动子。例如,在一个方面,编码C4-二羧酸转运蛋白的异源多核苷酸可操作地连接于对于所述多核苷酸是外源的启动子。在另一个方面,编码苹果酸脱氢酶的异源多核苷酸可操作地连接于对于所述多核苷酸是外源的启动子。在一个方面,编码丙酮酸羧化酶的异源多核苷酸可操作地连接于对于所述多核苷酸是外源的启动子。
用于指导本发明的核酸构建体在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、大肠杆菌lac操纵子、天蓝色链霉菌琼脂糖酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731),以及tac启动子(DeBoer等,1983,Proc.Natl.Acad.Sci.USA80:21-25)。另外的启动子在"Usefulproteinsfromrecombinantbacteria"于Gilbert等,1980,ScientificAmerican,242:74-94中;和在Sambrook等,1989,见上文描述。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(WO96/00787)、镶片镰孢淀粉葡糖苷酶(WO00/56900)、镶片镰孢Daria(WO00/56900)、镶片镰孢Quinn(WO00/56900)、曼赫根毛霉(Rhizomucormiehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(一种修饰的启动子,其来自曲霉属中编码中性α-淀粉酶的基因,其中未翻译的前导序列已由曲霉属(Aspergilli)中编码丙糖磷酸异构酶的基因的未翻译的前导序列所替代;非限制性实例包括修饰的启动子,其来自黑曲霉中编码中性α-淀粉酶的基因,其中未翻译的前导序列已由构巢曲霉或米曲霉中编码丙糖磷酸异构酶的基因的未翻译的前导序列所替代);和它们的突变的、截短的和杂合的启动子。
在酵母宿主中,有用的启动子从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast8:423-488描述。
调控序列也可以是合适的转录终止子序列,其由宿主细胞识别以终止转录。所述终止子序列与编码所述多肽的多核苷酸的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。
对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞优选的终止子从如下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。
调控序列还可以是合适的前导序列,当被转录时其为对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的多核苷酸的5’-末端。可使用在所选宿主细胞中有功能的任何前导序列。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
对于酵母宿主细胞合适的前导序列从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
调控序列也可以是聚腺苷酸化序列,其是与多核苷酸的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可使用在所选宿主细胞中有功能的任何聚腺苷酸化序列。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。
对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.15:5983-5990描述。
调控序列还可以是信号肽编码区,其编码与多肽的N端相连的信号肽,并且指导多肽进入细胞的分泌途径。多核苷酸的编码序列5’端可固有地包含信号肽编码序列,其与编码所述多肽的编码序列的区段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列外源的信号肽编码序列。外源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者,外源信号肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而,可使用指导表达的多肽进入所选宿主细胞的分泌途径的任何信号肽编码序列。
对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列:芽孢杆菌属NCIB11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,MicrobiologicalReviews57:109-137描述。
对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。
对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码序列由Romanos等,1992,见上文描述。
调控序列还可以是前肽编码序列,其编码位于多肽N端的前肽。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的,并且能够通过前肽的催化或自催化切割从前多肽转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE),枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO95/33836)、曼赫根毛霉天冬氨酸蛋白酶和酿酒酵母α因子的基因获得前肽编码序列。
当信号肽和前肽序列二者均出现在多肽的N端时,将前肽序列置于紧接着(nextto)多肽N端,并且将信号肽序列置于紧接着前肽序列的N端。
同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节***的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些***。原核***中的调节***包括lac、tac和trp操纵基因***。在酵母中,可使用ADH2***或GAL1***。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子。调节序列的其它实例是那些允许基因扩增的序列。在真核***中,这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(withheavymetal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的多核苷酸将与调节序列可操作地连接。
表达载体
本发明亦涉及包含本发明的多核苷酸、启动子和转录和翻译终止信号的重组表达载体。本发明亦涵盖利用重组表达载体的重组宿主细胞和方法,所述重组表达载体包含编码C4-二羧酸转运蛋白(和/或苹果酸脱氢酶或丙酮酸羧化酶)的异源多核苷酸,以及启动子和转录和翻译终止信号。此类重组表达载体可用于本文中所述的任何宿主细胞和方法中。
多种核苷酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个(例如两个、几个)方便的限制位点以允许在这些位点***或取代编码多肽的多核苷酸。可供选择的是,可以通过在适当的用于表达的载体中***包含所述序列的多核苷酸或核酸构建体来表达所述多核苷酸。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的表达调控序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生多核苷酸的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
在一个方面,每个编码本文中所述的C4-二羧酸转运蛋白、苹果酸脱氢酶,和/或丙酮酸羧化酶的多核苷酸包含于各自独立的载体上。在一个方面,至少两个所述多核苷酸包含于单一的载体上。在一个方面,所有编码C4-二羧酸转运蛋白,苹果酸脱氢酶,和丙酮酸羧化酶的多核苷酸包含于单一的载体上。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(totalDNA),或可以使用转座子(transposon)。
载体优选含有一个或多个(例如两个、几个)选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophytoauxotrophs)等。
细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性如氨苄青霉素、氯霉素、卡那霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitratereductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyceshygroscopicus)的bar基因。
载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。
为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的多核苷酸,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应含有足够数量的核酸,如100至10,000碱基对,400至10,000碱基对,和800至10,000碱基对,其与相应的目标序列具有高度序列同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可以是非编码或编码的多核苷酸。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”意指能够使质粒或载体体内复制的多核苷酸。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARS1,ARS4,ARS1和CEN3的组合,和ARS4和CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsRes.15:9163-9175;WO00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO00/24883中的方法完成。
可以将多于一个拷贝的本发明的多核苷酸***宿主细胞以增加多肽的产生。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectableagent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,且由此含有多核苷酸的额外拷贝的细胞。
用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上文)。
苹果酸脱氢酶和编码苹果酸脱氢酶的多核苷酸
在重组宿主细胞及其使用方法的一些方面,所述宿主细胞具有苹果酸脱氢酶活性。在一些方面,所述宿主细胞包含编码苹果酸脱氢酶的异源多核苷酸。所述苹果酸脱氢酶可为任何适于实施本发明的苹果酸脱氢酶。在一个方面,所述苹果酸脱氢酶是存在于宿主细胞胞质溶胶中的酶。
在本文所述的重组宿主细胞和方法的一个方面,所述苹果酸脱氢酶是:(a)苹果酸脱氢酶,其与SEQIDNO:12或其成熟多肽序列具有至少60%序列同一性;(b)苹果酸脱氢酶,其由多核苷酸编码,所述多核苷酸在低严格条件下与以下杂交:(i)SEQIDNO:11或其成熟多肽编码序列,(ii)SEQIDNO:11的cDNA序列或其成熟多肽编码序列,或(iii)(i)或(ii)的全长互补链;(c)苹果酸脱氢酶,其由多核苷酸编码,所述多核苷酸与以下具有至少60%序列同一性:(iv)SEQIDNO:11或其成熟多肽编码序列,(v)SEQIDNO:11的cDNA序列或其成熟多肽编码序列,或(vi)(iv)或(v)的全长互补链;(d)SEQIDNO:12或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或***的苹果酸脱氢酶变体;和(e)(a)、(b)、(c)或(d)的多肽具有苹果酸脱氢酶活性的片段。
在一个方面,所述苹果酸脱氢酶包含或组成为氨基酸序列,所述氨基酸序列与SEQIDNO:12或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%序列同一性。在一个方面,所述苹果酸脱氢酶包含氨基酸序列,所述氨基酸序列与SEQIDNO:12或其成熟多肽序列相差不多于十个氨基酸,例如不多于五个氨基酸,不多于四个氨基酸,不多于三个氨基酸,不多于两个氨基酸,或一个氨基酸。
在一个方面,所述苹果酸脱氢酶包含或组成为SEQIDNO:12的氨基酸序列,SEQIDNO:12的成熟多肽序列,其等位变体,或前述的具有苹果酸脱氢酶活性的片段。在另一个方面,所述苹果酸脱氢酶包含或组成为SEQIDNO:12的氨基酸序列。在另一个方面,所述苹果酸脱氢酶包含或组成为SEQIDNO:12的成熟多肽序列。在另一个方面,所述苹果酸脱氢酶包含或组成为SEQIDNO:12的氨基酸1至330。
在一个方面,所述苹果酸脱氢酶由多核苷酸编码,所述多核苷酸在至少低严格条件,例如中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:(i)SEQIDNO:11或其成熟多肽编码序列,(ii)SEQIDNO:11的cDNA序列或其成熟多肽编码序列,或(iii)(i)或(ii)的全长互补链(参见,例如J.Sambrook,E.F.Fritsch和T.Maniatus,1989,见上文)。
在一个方面,所述苹果酸脱氢酶由多核苷酸编码,所述多核苷酸与(iv)SEQIDNO:11或其成熟多肽编码序列,(v)SEQIDNO:11的cDNA序列或其成熟多肽编码序列,或(vi)(iv)或(v)的全长互补链具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
在一个方面,所述苹果酸脱氢酶由SEQIDNO:11,或其成熟多肽编码序列编码。在一个方面,所述苹果酸脱氢酶由SEQIDNO:11编码。在一个方面,所述苹果酸脱氢酶由SEQIDNO:11的成熟多肽编码序列编码。在一个方面,所述苹果酸脱氢酶由SEQIDNO:11的亚序列编码,其中所述亚序列编码具有苹果酸脱氢酶活性的多肽。在一个方面,所述亚序列含有SEQIDNO:11的至少885个核苷酸,例如至少930个核苷酸或至少975个核苷酸。
在一个方面,所述苹果酸脱氢酶为SEQIDNO:12或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体,如上文所述。在一个方面,所述苹果酸脱氢酶为SEQIDNO:12的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一个方面,所述苹果酸脱氢酶为SEQIDNO:12的成熟多肽序列的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一些方面,SEQIDNO:12或其成熟多肽序列的氨基酸取代、缺失和/或***的总数不多于10,例如不多于1,2,3,4,5,6,7,8或9。
在另一个方面,所述苹果酸脱氢酶是SEQIDNO:12或其成熟多肽序列的片段,其中所述片段具有苹果酸脱氢酶活性。在一个方面,所述的片段含有SEQIDNO:12的至少295个氨基酸残基,例如至少310个氨基酸残基,或至少325个氨基酸残基。
所述苹果酸脱氢酶亦可为苹果酸脱氢酶的等位变体或人工变体。
所述苹果酸脱氢酶亦可包括融合多肽或可切割的融合多肽,如上文所述。
用于分离或克隆编码苹果酸脱氢酶的多核苷酸的技术如上文中所述。
SEQIDNO:11的多核苷酸;或其亚序列;以及SEQIDNO:12的氨基酸序列;或其片段;可用于设计核酸探针以从不同属或种的菌株鉴定和克隆编码苹果酸脱氢酶的DNA,如上文中所述。本发明涵盖此类探针。可对从此类其它生物制备的基因组DNA或cDNA筛选与如上所述的探针杂交并编码苹果酸脱氢酶的DNA,如上文中所述。
在一个方面,所述核酸探针为SEQIDNO:11。在另一个方面,所述核酸探针为SEQIDNO:11的成熟多肽编码序列。在另一个方面,所述核酸探针是多核苷酸序列,其编码SEQIDNO:12,其成熟多肽序列或前述序列的片段。
对于长度至少100个核苷酸的长探针,非常低至非常高的严格条件和洗涤条件如上文中所述定义。对于长度大约15个核苷酸至大约70个核苷酸的短探针,严格条件和洗涤条件如上文中所述定义。
所述苹果酸脱氢酶可获得自任何属的微生物。在一个方面,所述苹果酸脱氢酶可为从本文中所述的微生物获得的细菌、酵母或丝状真菌苹果酸脱氢酶。在另一个方面,所述苹果酸脱氢酶是米曲霉苹果酸脱氢酶,例如SEQIDNO:12的米曲霉苹果酸脱氢酶。
其它可用于实施本发明的苹果酸脱氢酶包括但不限于:构巢曲霉苹果酸脱氢酶(AN6717.1;SIMS等,2004,Mycol.Res.108:853-857);黑曲霉苹果酸脱氢酶(An16g00120;Pel等,2007,NatureBiotechnology25:221-231);Phytophthorainfestans苹果酸脱氢酶(PITG13614.1;Calcagno等,2009,MycologicalResearch113:771-781);酿酒酵母苹果酸脱氢酶(YKL085W;McAlister-Henn和Thompson,1987,JBacteriol.169:5157-5166);埃默森踝节菌(Talaromycesemersonii)苹果酸脱氢酶(AF439996,AF487682;Maloney等,2004,Eur.J.Biochem.271:3115-3126);以及玉蜀黍黑粉菌(Ustilagomaydis)苹果酸脱氢酶(um00403,um11161;McCann和Snetselaar,2008,FungalGeneticsandBiology45:S77–S87),SEQIDNO:20的米曲霉苹果酸脱氢酶(其由SEQIDNO:19的核苷酸序列所编码;参见美国申请号12/870,523,标题为“MethodsforImprovingMalicAcidProductioninFilamentousFungi”,2010年8月27日提交),或任何相应的参考文献中所述的苹果酸脱氢酶的任何方面。
本发明涵盖将本文中所述的序列同一性、杂交、变体和片段的任何方面适用于如上所述的苹果酸脱氢酶多肽序列和多核苷酸序列。举例而言,在一个方面,所述苹果酸脱氢酶是(a)苹果酸脱氢酶,其与SEQIDNO:20或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;(b)苹果酸脱氢酶,其由多核苷酸编码,所述多核苷酸在低严格条件,例如中等严格条件,中等-高严格条件,高严格条件或非常高严格条件下与以下杂交:(i)SEQIDNO:19或其成熟多肽编码序列,(ii)SEQIDNO:19的cDNA序列或其成熟多肽编码序列,或(iii)(i)或(ii)的全长互补链;(c)苹果酸脱氢酶,其由多核苷酸编码,所述多核苷酸与(iv)SEQIDNO:19或其成熟多肽编码序列,(v)SEQIDNO:19的cDNA序列或其成熟多肽编码序列,或(vi)(iv)或(v)的全长互补链具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;(d)SEQIDNO:20或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或***的苹果酸脱氢酶变体;和(e)(a)、(b)、(c)或(d)的多肽具有苹果酸脱氢酶活性的片段。
所述苹果酸脱氢酶亦可从其它来源鉴定和获取,所述来源包括从自然界(例如土壤、堆肥、水等)分离的微生物或直接从自然材料(例如土壤、堆肥、水等)获得的DNA样品,如上文中所述。
丙酮酸羧化酶和编码丙酮酸羧化酶的多核苷酸
在重组宿主细胞及其使用方法的一些方面,所述宿主细胞具有丙酮酸羧化酶活性。在一些方面,所述宿主细胞包含编码丙酮酸羧化酶的异源多核苷酸。所述丙酮酸羧化酶可为任何适于实施本发明的丙酮酸羧化酶。在一个方面,所述丙酮酸羧化酶是存在于宿主细胞胞质溶胶中的酶。
在本文所述的重组宿主细胞和方法的一个方面,所述丙酮酸羧化酶是:(a)丙酮酸羧化酶,其与SEQIDNO:16或其成熟多肽序列具有至少60%序列同一性;(b)丙酮酸羧化酶,其由多核苷酸编码,所述多核苷酸在低严格条件下与以下杂交:(i)SEQIDNO:15或其成熟多肽编码序列,(ii)SEQIDNO:15的cDNA序列或其成熟多肽编码序列,或(iii)(i)或(ii)的全长互补链;(c)丙酮酸羧化酶,其由多核苷酸编码,所述多核苷酸与以下具有至少60%序列同一性:(iv)SEQIDNO:15或其成熟多肽编码序列,(v)SEQIDNO:15的cDNA序列或其成熟多肽编码序列,或(vi)(iv)或(v)的全长互补链;(d)SEQIDNO:16或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或***的丙酮酸羧化酶变体;和(e)(a)、(b)、(c)或(d)的多肽具有丙酮酸羧化酶活性的片段。
在一个方面,所述丙酮酸羧化酶包含或组成为氨基酸序列,所述氨基酸序列与SEQIDNO:16或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%序列同一性。在一个方面,所述丙酮酸羧化酶包含氨基酸序列,所述氨基酸序列与SEQIDNO:16或其成熟多肽序列相差不多于十个氨基酸,例如不多于五个氨基酸,不多于四个氨基酸,不多于三个氨基酸,不多于两个氨基酸,或一个氨基酸。
在一个方面,所述丙酮酸羧化酶包含或组成为SEQIDNO:16的氨基酸序列,SEQIDNO:16的成熟多肽序列,其等位变体,或前述序列的具有丙酮酸羧化酶活性的片段。在另一个方面,所述丙酮酸羧化酶包含或组成为SEQIDNO:16的氨基酸序列。在另一个方面,所述丙酮酸羧化酶包含或组成为SEQIDNO:16的成熟多肽序列。在另一个方面,所述丙酮酸羧化酶包含或组成为SEQIDNO:16的氨基酸1至1193。
在一个方面,所述丙酮酸羧化酶由多核苷酸编码,所述多核苷酸在至少低严格条件,例如中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:(i)SEQIDNO:15或其成熟多肽编码序列,(ii)SEQIDNO:15的cDNA序列或其成熟多肽编码序列,或(iii)(i)或(ii)的全长互补链(参见,例如J.Sambrook,E.F.Fritsch和T.Maniatus,1989,见上文)。
在一个方面,所述丙酮酸羧化酶由多核苷酸编码,所述多核苷酸与(iv)SEQIDNO:15或其成熟多肽编码序列,(v)SEQIDNO:15的cDNA序列或其成熟多肽编码序列,或(vi)(iv)或(v)的全长互补链具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
在一个方面,所述丙酮酸羧化酶由SEQIDNO:15或其成熟多肽编码序列编码。在一个方面,所述丙酮酸羧化酶由SEQIDNO:15编码。在一个方面,所述丙酮酸羧化酶由SEQIDNO:15的成熟多肽编码序列编码。在一个方面,所述丙酮酸羧化酶由SEQIDNO:15的亚序列编码,其中所述亚序列编码具有丙酮酸羧化酶活性的多肽。在一个方面,所述亚序列含有SEQIDNO:15的至少3060个核苷酸,例如至少3240个核苷酸或至少3420个核苷酸。
在一个方面,所述丙酮酸羧化酶为SEQIDNO:16或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体,如上文所述。在一个方面,所述丙酮酸羧化酶为SEQIDNO:16的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一个方面,所述丙酮酸羧化酶为SEQIDNO:16的成熟多肽序列的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一些方面,SEQIDNO:16或其成熟多肽序列的氨基酸取代、缺失和/或***的总数不多于16,例如不多于1,2,3,4,5,6,7,8或9。
在另一个方面,所述丙酮酸羧化酶是SEQIDNO:16或其成熟多肽序列的片段,其中所述片段具有丙酮酸羧化酶活性。在一个方面,所述的片段含有SEQIDNO:16的至少1020个氨基酸残基,例如至少1080个氨基酸残基,或至少1140个氨基酸残基。
所述丙酮酸羧化酶亦可为丙酮酸羧化酶的等位变体或人工变体。
所述丙酮酸羧化酶亦可包括融合多肽或可切割的融合多肽,如上文所述。
所述丙酮酸羧化酶可为线粒体丙酮酸羧化酶的变体,使得体内输入线粒体减少,由此增加所述丙酮酸羧化酶在胞质溶胶中的水平。
用于分离或克隆编码丙酮酸羧化酶的多核苷酸的技术如上文中所述。
SEQIDNO:15的多核苷酸;或其亚序列;以及SEQIDNO:16的氨基酸序列;或其片段;可用于设计核酸探针以从不同属或种的菌株鉴定和克隆编码丙酮酸羧化酶的DNA,如上文中所述。本发明涵盖此类探针。可对从此类其它生物制备的基因组DNA或cDNA筛选与如上所述的探针杂交并编码丙酮酸羧化酶的DNA,如上文所述。
在一个方面,所述核酸探针为SEQIDNO:15。在另一个方面,所述核酸探针为SEQIDNO:15的成熟多肽编码序列。在另一个方面,所述核酸探针是多核苷酸序列,其编码SEQIDNO:16,其成熟多肽序列或前述序列的片段。
对于长度至少100个核苷酸的长探针,非常低至非常高的严格条件和洗涤条件如上文中所述定义。对于长度大约15个核苷酸至大约70个核苷酸的短探针,严格条件和洗涤条件如上文中所述定义。
所述丙酮酸羧化酶可获得自任何属的微生物。在一个方面,所述丙酮酸羧化酶可为从本文中所述的微生物获得的细菌、酵母或丝状真菌丙酮酸羧化酶。在另一个方面,所述丙酮酸羧化酶是米曲霉丙酮酸羧化酶,例如SEQIDNO:16的米曲霉丙酮酸羧化酶。
其它可用于实施本发明的丙酮酸羧化酶包括但不限于:棒曲霉(Aspergillusclavatus)NRRL1丙酮酸羧化酶(XP_001271664;DirectSubmission,Submitted(26-OCT-2006),TheInstituteforGenomicResearch,9712MedicalCenterDrive,Rockville,MD20850,USA);烟曲霉Af293丙酮酸羧化酶(XP_752054;Nierman等,2005,Nature438:1151-1156);构巢曲霉FGSCA4丙酮酸羧化酶(XP_662066;Galagan等,2005,Nature438:1105-1115);黑曲霉丙酮酸羧化酶(An15g02820;Pel等,2007,NatureBiotechnology25:221-231;ASPNG5061;Panneman等,(JUL-1998)提交至EMBL/GenBank/DDBJ数据库);土曲霉丙酮酸羧化酶(O93918;DirectSubmission,Submitted(OCT-1998)TheInstituteforGenomicResearch,9712MedicalCenterDrive,Rockville,MD20850,USA);灰梨孢菌(Magnaporthegrisea)70-15丙酮酸羧化酶(XP_367852;DirectSubmission,Submitted(26-SEP-2005)BroadInstituteofMITandHarvard,320CharlesStreet,Cambridge,MA02142,USA);粗糙脉孢菌OR74A丙酮酸羧化酶(XP_965636;Galagan等,2003,Nature422:859-868);米根霉(Rhizopusoryzae)丙酮酸羧化酶(RO3G_06931.1);酿酒酵母丙酮酸羧化酶(NP_009777;Gaffeau等,1996,Science274:546-547);粟酒裂殖酵母丙酮酸羧化酶(NP_595900;DirectSubmission,Submitted(29-JUN-2007)EuropeanSchizosaccharomycesgenomesequencingproject,SangerInstitute,TheWellcomeTrustGenomeCampus,Hinxton,CambridgeCB101SA);和玉蜀黍黑粉菌丙酮酸羧化酶(um01054;McCann和Snetselaar,2008,FungalGeneticsandBiology45:S77-S87)。本发明涵盖将本文中所述的序列同一性、杂交、变体和片段的任何方面适用于其它如上所述的丙酮酸羧化酶多肽序列和多核苷酸序列。
所述丙酮酸羧化酶亦可从其它来源鉴定和获取,所述来源包括从自然界(例如土壤、堆肥、水等)分离的微生物或直接从自然材料(例如土壤、堆肥、水等)获得的DNA样品,如上文中所述。
宿主细胞
如本文中所述,本发明还涉及重组宿主细胞,其包含本文中所述的多核苷酸可操作地连接于一个或多个(例如两个、几个)调控序列,所述调控序列指导本文中所述的多肽的产生。本发明还涵盖重组宿主细胞,其包含一个或多个本文中所述的多核苷酸,所述多核苷酸可为可操作地连接于一个或多个调控序列,所述调控序列指导一种或多种所述多肽的表达,以供重组产生C4-二羧酸,以及本发明涉及使用此类宿主细胞以供产生C4-二羧酸的方法。所述宿主细胞可包含任何一种或多种本文中所述的多核苷酸的组合。举例而言,在一个方面,所述重组宿主细胞包含编码C4-二羧酸转运蛋白的异源多核苷酸,并任选地包含编码苹果酸脱氢酶的异源多核苷酸,和/或编码丙酮酸脱羧酶的异源多核苷酸;其中所述宿主细胞与不含有所述编码C4-二羧酸转运蛋白的异源多核苷酸的宿主细胞在相同条件下培养时相比产生(或能够产生)更多量的C4-二羧酸。
在一个方面,所述重组宿主细胞包含:
(1)异源多核苷酸,其编码C4-二羧酸转运蛋白,如选自下组的C4-二羧酸转运蛋白:(a)C4-二羧酸转运蛋白,其与SEQIDNO:2、4或6,或其成熟多肽序列具有至少60%序列同一性;(b)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸在低严格条件下与以下杂交:SEQIDNO:1、3或5,其成熟多肽编码序列,或前述序列的全长互补链;(c)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1、3或5,其成熟多肽编码序列,或前述序列的全长互补链具有至少60%序列同一性;(d)SEQIDNO:2、4或6,或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或***的C4-二羧酸转运蛋白变体;和(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段;
(2)任选的异源第二多核苷酸,其编码苹果酸脱氢酶,如选自下组的苹果酸脱氢酶:(a)苹果酸脱氢酶,其与SEQIDNO:12或其成熟多肽序列具有至少60%序列同一性;(b)苹果酸脱氢酶,其由多核苷酸编码,所述多核苷酸在低严格条件下与以下杂交:(i)SEQIDNO:11或其成熟多肽编码序列,(ii)SEQIDNO:11的cDNA序列或其成熟多肽编码序列,或(iii)(i)或(ii)的全长互补链;(c)苹果酸脱氢酶,其由多核苷酸编码,所述多核苷酸与以下具有至少60%序列同一性:(iv)SEQIDNO:11或其成熟多肽编码序列,(v)SEQIDNO:11的cDNA序列或其成熟多肽编码序列,或(vi)(iv)或(v)的全长互补链;(d)SEQIDNO:12或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或***的苹果酸脱氢酶变体;和(e)(a)、(b)、(c)或(d)的多肽具有苹果酸脱氢酶活性的片段;和
(3)任选的异源第三多核苷酸,其编码丙酮酸羧化酶,如选自下组的丙酮酸羧化酶:(a)丙酮酸羧化酶,其与SEQIDNO:16或其成熟多肽序列具有至少60%序列同一性;(b)丙酮酸羧化酶,其由多核苷酸编码,所述多核苷酸在低严格条件下与以下杂交:(i)SEQIDNO:15或其成熟多肽编码序列,(ii)SEQIDNO:15的cDNA序列或其成熟多肽编码序列,或(iii)(i)或(ii)的全长互补链;(c)丙酮酸羧化酶,其由多核苷酸编码,所述多核苷酸与以下具有至少60%序列同一性:(iv)SEQIDNO:15或其成熟多肽编码序列,(v)SEQIDNO:15的cDNA序列或其成熟多肽编码序列,或(vi)(iv)或(v)的全长互补链;(d)SEQIDNO:16或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或***的丙酮酸羧化酶变体;和(e)(a)、(b)、(c)或(d)的多肽具有丙酮酸羧化酶活性的片段;
其中所述宿主细胞与不含有所述一种或多种多核苷酸(例如不含有编码C4-二羧酸转运蛋白的异源多核苷酸)的宿主细胞在相同条件下培养时相比产生(或能够产生)更多量的C4-二羧酸。
在一个方面,所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1、3或5,或任何其所述的方面)和编码苹果酸脱氢酶的异源多核苷酸。在本发明中,所述苹果酸脱氢酶可为任何适于实施本发明的苹果酸脱氢酶,如上文所述。在另一个方面,所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1、3或5,或任何其所述的方面)和编码丙酮酸羧化酶的异源多核苷酸。在本发明中,所述丙酮酸羧化酶可为任何适于实施本发明的丙酮酸羧化酶,如上文所述。具体而言,所述丙酮酸羧化酶优选为存在于宿主细胞胞质溶胶中的酶。在一个方面,所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1、3或5,或任何其所述的方面),编码苹果酸脱氢酶的第二异源多核苷酸,和编码丙酮酸羧化酶的第三异源多核苷酸。
将包含一个或多个(例如两个、几个)的多核苷酸的一个构建体或载体(或多个构建体或载体)导入宿主细胞,使所述构建体或载体如前所述作为染色体整合体或者作为自复制的染色体外载体维持。术语“宿主细胞”涵盖任何亲本细胞的后代,其由于在复制中发生的突变而与亲本细胞不同。在一些情况下,宿主细胞的选择会很大程度上依赖于编码多肽的基因及其来源。下文中所述的方面适用于宿主细胞本身,以及使用宿主细胞的方法。
所述宿主细胞可为任何能够重组产生本发明的多肽的细胞,例如原核细胞或真核细胞,和/或任何能够重组产生C4-二羧酸(例如苹果酸)的细胞(例如任何丝状真菌细胞)。
原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。***包括但不限于,芽孢杆菌属、梭菌属、肠球菌属、地芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属和链霉菌属。革兰氏阴性细菌包括但不限于,弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属和脲原体属。
细菌宿主细胞可以是任何芽孢杆菌属细胞,包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。
细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于,似马链球菌、酿脓链球菌、***链球菌和马链球菌兽瘟亚种细胞。
细菌宿主细胞还可以是任何链霉菌属细胞,包括但不限于,不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞。
可通过如下方法实现将DNA引入到芽孢杆菌属细胞:例如原生质体转化(参见,例如,Chang和Cohen,1979,Mol.Gen.Genet.168:111-115),使用感受态细胞(参见,例如,Young和Spizizen,1961,J.Bacteriol.81:823-829或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.56:209-221),电穿孔(参见,例如,Shigekawa和Dower,1988,Biotechniques6:742-751)或接合(参见,例如,Koehler和Thorne,1987,J.Bacteriol.169:5771-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞:例如原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见,例如,Dower等,1988,NucleicAcidsRes.16:6127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞:例如原生质体转化和电穿孔(参见,例如,Gong等,2004,FoliaMicrobiol.(Praha)49:399-405),接合(参见,例如,Mazodier等,1989,J.Bacteriol.171:3583-3585),或转导(参见,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞:例如电穿孔(参见,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(参见,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入到链球菌属细胞:例如天然感受态(naturalcompetence)(参见,例如,Perry和Kuramitsu,1981,Infect.Immun.32:1295-1297),原生质体转化(参见,例如,Catt和Jollick,1991,Microbios.68:189-207),电穿孔(参见,例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(参见,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可以使用本领域已知的用于将DNA引入宿主细胞的任何方法。
宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。
所述宿主细胞可为真菌细胞。“真菌”用在本文包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等,于AinsworthandBisby’sDictionaryofTheFungi,第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用)和所有有丝***孢子真菌(mitosporicfungi)(Hawksworth等,1995,见上)。
所述真菌宿主细胞可为酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenousyeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenousyeast)和属于半知菌类(FungiImperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,将酵母定义为如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.编,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。
所述酵母宿主细胞可为假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞,如乳酸克鲁维酵母(Kluyveromyceslactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、或解脂西洋蓍霉(Yarrowialipolytica)细胞。
所述真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。
所述丝状真菌宿主细胞可为枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
所述丝状真菌宿主细胞可为棘孢曲霉、泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkanderaadusta)、干拟蜡菌(Ceriporiopsisaneirina)、Ceriporiopsiscaregiea、Ceriporiopsisgilvescens、Ceriporiopsispannocinta、Ceriporiopsisrivulosa、Ceriporiopsissubrufa、虫拟蜡菌(Ceriporiopsissubvermispora)、Chrysosporiuminops、嗜角质金孢子菌、Chrysosporiumlucknowense、Chrysosporiummerdarium、毡金孢子菌、Chrysosporiumqueenslandicum、热带金孢子菌、Chrysosporiumzonatum、灰盖鬼伞(Coprinuscinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotuseryngii)、土生梭孢霉、长绒毛栓菌(Trametesvillosa)、变色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
在一个方面,所述宿主细胞是曲霉属宿主细胞。在另一个方面,所述宿主细胞是米曲霉。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023和Yelton等,1984,Proc.Natl.Acad.Sci.USA81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,pp182-187,AcademicPress,Inc.,NewYork;Ito等,1983,J.Bacteriol.153:163;和Hinnen等,1978,Proc.Natl.Acad.Sci.USA75:1920。
在一些方面,所述宿主细胞包含一种或多种(例如两种、几种)本文中所述的多核苷酸,其中所述宿主细胞与不含有所述一种或多种多核苷酸的宿主细胞在相同条件下培养时相比分泌(或能够分泌)增加水平的C4-二羧酸。在一些方面,所述宿主细胞与不含有所述一种或多种多核苷酸(例如不含有编码C4-二羧酸转运蛋白的异源多核苷酸)的宿主细胞在相同条件下培养时相比,分泌和/或能够分泌增加至少5%,例如至少10%,至少15%,至少20%,至少25%,至少50%,至少100%,至少150%,至少200%,至少300%,或500%的水平的C4-二羧酸(例如苹果酸)。
在本文中所述的重组宿主细胞和方法的任何方面中,所述C4-二羧酸可为苹果酸、琥珀酸、草酰乙酸、丙二酸或延胡索酸,或其组合。在一些方面中,所述C4-二羧酸是苹果酸、琥珀酸或延胡索酸,或其组合。在一些方面中,所述C4-二羧酸是苹果酸或延胡索酸,或苹果酸和延胡索酸的组合。在一些方面中,所述C4-二羧酸是苹果酸。
在任何这些方面,所述宿主细胞以比理论值高至少10%,例如至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%或至少90%的产率(yield)产生(和/或能够产生)C4-二羧酸。
在任何这些方面,所述重组宿主具有大于约0.1g/L每小时,例如,大于约0.2g/L每小时,0.5g/L每小时,0.6g/L每小时,0.7g/L每小时,0.8g/L每小时,0.9g/L每小时,1.0g/L每小时,1.1g/L每小时,1.2g/L每小时,1.3g/L每小时,1.5g/L每小时,1.75g/L每小时,2.0g/L每小时,2.25g/L每小时,2.5g/L每小时,或3.0g/L每小时;或约0.1g/L每小时至约2.0g/L每小时,例如,约0.3g/L每小时至约1.7g/L每小时,约0.5g/L每小时至约1.5g/L每小时,约0.7g/L每小时至约1.3g/L每小时,约0.8g/L每小时至约1.2g/L每小时,或约0.9g/L每小时至约1.1g/L每小时的C4-二羧酸体积生产力(volumetricproductivity)(例如苹果酸体积生产力)。
可将所述重组宿主细胞在适于产生C4-二羧酸转运蛋白、苹果酸脱氢酶或丙酮酸羧化酶的营养培养基中使用如下所述的本领域中公知的方法进行培养。
所述C4-二羧酸转运蛋白、苹果酸脱氢酶和丙酮酸羧化酶,及其活性,可使用本领域中公知的方法检测。这些检测方法可包括使用特异性抗体,酶产物的形成,或酶底物的消失。参见,例如Sambrook等,MolecularCloning:ALaboratoryManual,第3版,ColdSpringHarborLaboratory,NewYork(2001);Ausubel等,CurrentProtocolsinMolecularBiology,JohnWileyandSons,Baltimore,MD(1999);及Hanai等,Appl.Environ.Microbiol.73:7814-7818(2007))。
产生方法
本发明还涉及产生本文中所述的多肽(例如,包含或组成为SEQIDNO:2、4、6或其任何所述的方面的多肽)的方法,其包括:(a)在有助于产生多肽的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。在一个方面,所述细胞是曲霉属的细胞。在另一个的方面,所述细胞是棘孢曲霉。在另一个的方面,所述细胞是大肠杆菌NRRLB50400、大肠杆菌NRRLB-50388或大肠杆菌NRRLB50401。
本发明还涉及产生本发明的多肽的方法,包括:(a)在有助于产生多肽的条件下培养本发明的重组宿主细胞,和(b)回收所述多肽。
使用本领域熟知的方法在适合于产生C4-二羧酸转运蛋白的营养培养基中培养宿主细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽未分泌,其可从细胞裂解物(lysate)回收。
如上文中所述,可以使用本领域已知的对于多肽是特异性的方法来检测C4-二羧酸转运蛋白。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzymeassay)可用于确定多肽的活性。
多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,ProteinPurification,J.-C.Janson和LarsRyden,editors,VCHPublishers,NewYork,1989)。
在另一个方面,不回收所述多肽,而是使用表达多肽的本发明的宿主细胞作为多肽的来源。
植物
本发明还涉及植物,例如,转基因植物、植物部分或植物细胞,其包含本发明的多肽,从而以可回收的量表达和产生所述多肽。多肽可从植物或植物部分回收。或者,同样可以将含有该多肽的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheologicalproperties),或用于破坏抗营养因子。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadowgrass)(蓝草(bluegrass),早熟禾属(Poa));饲用牧草(foragegrass)如羊茅属(Festuca)、黑麦草属(Lolium);寒地型牧草(temperategrass),如Agrostis(翦股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。
双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜籽(rapeseed)和紧密相关的模式生物体拟南芥(Arabidopsisthaliana)。
植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如分离以促进本发明的应用的具体组织和细胞也被认为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seedcoat)。
同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的后代。
表达多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下构建所述植物或植物细胞:将编码多肽的一个或多个(例如两个、几个)表达构建体并入植物宿主基因组或叶绿体基因组,并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。
表达构建体便利地是包含编码多肽的多核苷酸的核酸构建体,所述多核苷酸与在选择的植物或植物部分中表达该多核苷酸所需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定整合了该表达构建体的宿主细胞有用的选择性标记,和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。
调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达多肽而确定。例如,编码多肽的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,PlantPhysiology86:506所述。
对于组成型表达,可以使用35S-CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck等,1980,Cell21:285-294,Christensen等,1992,PlantMo.Biol.18:675-689;Zhang等,1991,PlantCell3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storagesinktissue)例如种子、马铃薯块茎和果实的启动子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303),或来自代谢库组织(metabolicsinktissue)例如分生组织的启动子(Ito等,1994,PlantMol.Biol.24:863-878),种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,PlantCellPhysiol.39:885-889),来自豆球蛋白(legumin)B4和蚕豆(Viciafaba)的未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,J.PlantPhysiol.152:708-711)、来自种子油体蛋白(oilbodyprotein)的启动子(Chen等,1998,PlantCellPhysiol.39:935-941),来自欧洲油菜(Brassicanapus)的贮藏蛋白napA启动子,或本技术领域公知的任何其他种子特异性的启动子,例如,在WO91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(Kyozuka等,1993,PlantPhysiol.102:991-1000),小球藻病毒(chlorellavirus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,PlantMol.Biol.26:85-93),或来自稻的aldP基因启动子(Kagaya等,1995,Mol.Gen.Genet.248:668-674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,1993,PlantMol.Biol.22:573-588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的物质诱导,例如乙醇、***(oestrogens)、植物激素(planthormones)如乙烯、脱落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金属。
启动子增强子元件也可以用于实现多肽在植物中的较高表达。例如,启动子增强子元件可以是内含子,其置于启动子和编码多肽的多核苷酸之间。例如Xu等,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。
选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。
将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science244:1293;Potrykus,1990,Bio/Technology8:535;Shimamoto等,1989,Nature338:274)。
目前,根癌土壤杆菌(Agrobacteriumtumefaciens)介导的基因转移(genetransfer),是产生转基因双子叶植物的优选方法(为了参考,见Hooykas和Schilperoort,1992,PlantMol.Biol.19:15-38),而且它也可以用于转化单子叶植物,虽然对于这些植物常常使用其他的转化方法。目前,产生转基因单子叶植物的优选的方法,是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryoniccalli)或发育中的胚(developingembryos)(Christou,1992,PlantJ.2:275-281;Shimamoto,1994,Curr.Opin.Biotechnol.5:158-162;Vasil等,1992,Bio/Technology10:667-674)。转化单子叶植物的可供选择的方法基于原生质体转化,如由Omirulleh等,1993,PlantMol.Biol.21:415-428所描述的。其它依照本公开使用的转化方法包括描述于美国专利号6,395,966和7,151,204中的那些(两者均通过全文提述并入本文)。
转化之后,根据本领域熟知的方法选择具有并入的表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因:例如,使用带有两个独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。
除了用根据本发明制备的构建体直接转化具体植物基因型之外,还可通过将具有构建体的植物与缺乏该构建体的第二植物杂交来制备转基因植物。举例而言,可将编码多肽的构建体通过杂交而引入特定植物品种,而根本无需直接转化该给定品种的植物。因此,本发明不仅涵盖从依照本发明经转化的细胞直接再生的植物,还包括此类植物的后代(progeny)。如用于本文,后代可指依照本发明制备的亲本植物任何世代的后裔(offspring)。此种后代可包含依据本发明制备的DNA构建体,或依据本发明制备的DNA构建体的一部分。杂交导致转基因通过将起始种系与供体植物种系交叉授粉而引入植物种系。此类步骤的非限制性实例进一步阐述于美国专利7,151,204号。
植物可通过回交转化的过程生成。举例而言,植物包括称作回交转化的基因型、种系、近交体(inbred)或杂交体(hybrid)的植物。
可使用遗传标记以协助本发明的一种或多种转基因从一个遗传背景基因渗入(introgression)至另一个。标记协助的选择提供了相对于常规育种的优势,在于其可用于避免由表型变异导致的错误。进一步,遗传标记可在特定杂交的个体后代中提供有关良种种质相对程度的数据。举例而言,当具有期望性状但除此之外(otherwise)具有非农艺学期望的遗传背景的植物与良种亲本杂交时,可使用遗传标记来选择不仅具有该目标性状,还具有相对较大比例期望种质的后代。以此方式,使一种或多种性状基因渗入特定遗传背景所需的世代数得到最小化。
本发明亦涉及产生本发明的多肽的方法,其包括:(a)在有助于产生所述多肽的条件下培养包含编码所述多肽的多核苷酸的转基因植物或植物细胞;和(b)回收所述多肽。
去除或减少C4-二羧酸转运蛋白活性
本发明还涉及用于产生亲本细胞突变体的方法,其包括破坏或缺失编码本发明的多肽的多核苷酸或其部分,所述方法导致在相同条件下培养时,与亲本细胞相比突变细胞产生较少的所述多肽。
可以使用本领域熟知的方法(例如,***、破坏、替代或缺失)通过减少或消除编码所述多核苷酸的表达来构建突变细胞。在一个优选的方面,所述核苷酸序列是失活的。待修饰或失活的多核苷酸可以是,例如,编码区或其对活性关键的部分,或表达编码区所需的调节元件。此种调节或调控序列的实例可以是启动子序列或其功能部分,即,足以影响多核苷酸表达的部分。其它用于可能的修饰的调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录激活子。
可以通过向亲本细胞施以诱变,并且选择其中已将所述多核苷酸的表达减少或消除的突变细胞来进行多核苷酸的修饰或失活。诱变(其可为特异性的或随机的)可以通过例如使用合适的物理或化学诱变剂进行,通过使用合适的寡核苷酸进行,或通过对所述DNA序列进行PCR产生的诱变来进行。此外,可以通过使用这些诱变剂的任何组合来进行诱变。
适合于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、亚硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。
当使用这些试剂时,通常通过如下方法来进行所述诱变:在合适条件下存在所选的诱变剂时温育待诱变的亲本细胞,并筛选和/或选择显示基因表达减少的或无基因表达的突变细胞。
通过导入、取代或去除基因或其转录或翻译所需的调控元件中的一个或多个(例如两个、几个)核苷酸可以实现所述核苷酸序列的修饰或失活。例如,可以***或去除核苷酸从而导致引入终止密码子,去除起始密码子,或改变开读框。按照本领域已知的方法通过定位诱变或PCR产生的诱变可以完成此种修饰或失活。尽管在理论上所述修饰可以在体内进行,即,直接在表达待修饰的多核苷酸的细胞上进行,但优选如下面所示例的那样在体外进行所述修饰。
消除或减少核苷酸序列通过细胞的表达的便利方式的例子是基于基因取代,基因缺失,或基因破坏的技术。例如,在基因破坏方法中,将相应于内源多核苷酸的核酸序列在体外进行诱变以产生缺陷性的核酸序列,然后将其转化入亲本细胞中以产生缺陷基因。通过同源重组,所述缺陷性核酸序列替代内源性核苷酸序列。理想的是所述缺陷性核苷酸序列还编码标记,其可用于选择其中多核苷酸被修饰或破坏的转化体。在一个特别优选的方面,用选择性标记,如本文所述的那些,来破坏所述核苷酸序列。
本发明亦涉及在细胞中抑制具有C4-二羧酸转运蛋白活性的多肽的表达的方法,其包括向细胞施以或在细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含本发明的多核苷酸的亚序列。在一个优选的方面,所述dsRNA长度为约15,16,17,18,19,20,21,22,23,24,25或更多个双链核苷酸。
所述dsRNA优选为小干扰RNA(siRNA)或微RNA(miRNA)。在一个优选的方面,所述dsRNA是用于抑制转录的小干扰RNA(siRNA)。在另一个优选的方面,所述dsRNA是用于抑制翻译的微RNA(miRNA)。
本发明亦涉及此种双链RNA(dsRNA)分子,其包含SEQIDNO:1、3或5的一部分,或其成熟多肽编码序列,以供抑制所述多肽在细胞中的表达。尽管本发明并不限于任何特定的作用机制,但所述dsRNA可进入细胞,并导致类似或相同序列的单链RNA(ssRNA),包括内源mRNA的降解。当细胞暴露于dsRNA时,来自同源基因的mRNA通过称为RNA干扰(RNAi)的过程被选择性降解。
本发明的dsRNA可用于基因沉默。在一个方面,本发明提供了使用本发明的dsRNAi选择性降解RNA的方法。该工艺可在体外、离体或体内实施。在一个方面,所述dsRNA分子可用于在细胞、器官或动物中生成功能丧失突变。用于制备和使用dsRNA分子以选择性降解RNA的方法在本领域中是公知的,参见,例如美国专利号6,489,127;6,506,559;6,511,824;和6,515,109。
本发明进一步涉及亲本细胞的突变细胞,其包含编码所述多肽的多核苷酸或其调控序列的破坏或缺失,或编码所述多肽的基因的沉默,这导致突变细胞与亲本细胞相比产生较少的所述多肽或不产生所述多肽。
多肽缺陷突变细胞作为用于表达天然或异源多肽的宿主细胞是特别有用的。因此,本发明进一步涉及产生天然或异源多肽的方法,其包括:(a)在有助于产生所述多肽的条件下培养突变细胞;和(b)回收所述多肽。术语“异源多肽”意指对于宿主细胞并非天然的多肽,例如,天然蛋白的变体。所述宿主细胞可包含多于一个拷贝的编码所述天然或异源多肽的多核苷酸。
用于培养和纯化感兴趣的产物的方法可通过本领域中已知的方法进行。
C4-二羧酸产生的方法
本发明还涉及使用具有C4-二羧酸转运蛋白活性的多肽的方法,或使用编码具有C4-二羧酸转运蛋白活性的多肽的多核苷酸的方法。本文中所述的C4-二羧酸转运蛋白或编码该蛋白的多核苷酸可用于宿主细胞(例如丝状真菌宿主细胞)以协助(如增加)C4-二羧酸(例如苹果酸)的产生。对于这些方法,可使用任何本文中所述的本发明的多核苷酸或多肽(例如SEQIDNO:1、2、3、4、5和/或6,或任何其所述的方面),如下文所列的方面中所例示的。
在一个方面,本发明涉及产生C4-二羧酸(例如苹果酸)的方法,其包括:(1)培养宿主细胞(例如丝状真菌宿主细胞),其包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1、3、5或任何其所述的方面),其中所述宿主细胞与不含有编码C4-二羧酸转运蛋白的异源多核苷酸的宿主细胞相比分泌增加水平的C4-二羧酸;和(2)回收所述苹果酸。
在另一个方面,本发明涉及相对于亲本宿主细胞增加C4-二羧酸产生(例如苹果酸产生)的方法,其包括:(1)将编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1、3、5或任何其所述的方面)转化入宿主细胞,其中所述宿主细胞与不含有所述异源多核苷酸的丝状真菌宿主细胞相比分泌增加水平的C4-二羧酸;(2)在培养基中培养经转化的宿主细胞;和(3)回收所述C4-二羧酸。
在所述方法的这些方面中的一些,C4-二羧酸是苹果酸、琥珀酸、草酰乙酸、丙二酸或延胡索酸,或其组合。在一些方面,C4-二羧酸是苹果酸、琥珀酸或延胡索酸,或其组合。在一些方面,C4-二羧酸是苹果酸或延胡索酸,或苹果酸和延胡索酸的组合。在一些方面,所述C4-二羧酸是苹果酸。
如上文所述,所述C4-二羧酸转运蛋白可为任何本文中所述的C4-二羧酸转运蛋白,例如选自下组的C4-二羧酸转运蛋白:(a)多肽,其与SEQIDNO:2、4或6,或其成熟多肽序列具有至少60%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1、3或5,其成熟多肽编码序列,或前述序列的全长互补链在低严格条件下杂交;(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1、3或5,或其成熟多肽编码序列具有至少65%序列同一性;(d)SEQIDNO:2、4或6,或其成熟多肽的包含一个或多个(例如两个,几个)氨基酸的取代、缺失和/或***的变体;和(e)(a)、(b)、(c)或(d)的多肽的片段。
举例而言,在一个方面,本发明涉及产生C4-二羧酸(例如苹果酸)的方法,其包括:
(1)培养宿主细胞(例如丝状真菌宿主细胞),其包含编码C4-二羧酸转运蛋白的异源多核苷酸,其中所述C4-二羧酸转运蛋白选自:(a)多肽,其与SEQIDNO:2或其成熟多肽序列具有至少60%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1,其成熟多肽编码序列,或前述序列的全长互补链在低严格条件下杂交;(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1或其成熟多肽编码序列具有至少65%序列同一性;(d)SEQIDNO:2或其成熟多肽序列的包含一个或多个(例如两个,几个)氨基酸的取代、缺失和/或***的变体;和(e)(a)、(b)、(c)或(d)的多肽的片段;其中所述宿主细胞与不含有编码C4-二羧酸转运蛋白的异源多核苷酸的宿主细胞相比分泌增加水平的C4-二羧酸;和
(2)回收所述苹果酸。
在另一个例示性方面,本发明涉及产生C4-二羧酸(例如苹果酸)的方法,其包括:
(1)培养宿主细胞(例如丝状真菌宿主细胞),其包含编码C4-二羧酸转运蛋白的异源多核苷酸,其中所述C4-二羧酸转运蛋白选自:(a)多肽,其与SEQIDNO:4或其成熟多肽序列具有至少60%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:3,其成熟多肽编码序列,或前述序列的全长互补链在低严格条件下杂交;(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:3或其成熟多肽编码序列具有至少65%序列同一性;(d)SEQIDNO:4或其成熟多肽序列的包含一个或多个(例如两个,几个)氨基酸的取代、缺失和/或***的变体;和(e)(a)、(b)、(c)或(d)的多肽的片段;其中所述宿主细胞与不含有编码C4-二羧酸转运蛋白的异源多核苷酸的宿主细胞相比分泌增加水平的C4-二羧酸;和
(2)回收所述苹果酸。
在另一个例示性方面,本发明涉及产生C4-二羧酸(例如苹果酸)的方法,其包括:
(1)培养宿主细胞(例如丝状真菌宿主细胞),其包含编码C4-二羧酸转运蛋白的异源多核苷酸,其中所述C4-二羧酸转运蛋白选自:(a)多肽,其与SEQIDNO:6或其成熟多肽序列具有至少60%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:5,其成熟多肽编码序列,或前述序列的全长互补链在低严格条件下杂交;(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:5或其成熟多肽编码序列具有至少65%序列同一性;(d)SEQIDNO:6或其成熟多肽序列的包含一个或多个(例如两个,几个)氨基酸的取代、缺失和/或***的变体;和(e)(a)、(b)、(c)或(d)的多肽的片段;其中所述宿主细胞与不含有编码C4-二羧酸转运蛋白的异源多核苷酸的宿主细胞相比分泌增加水平的C4-二羧酸;和
(2)回收所述苹果酸。
在本申请全文内描述了上述方法中涵盖的具有C4-二羧酸转运蛋白活性的多肽的其它变化和实施方案。
在所述方法的一个方面,以大于约10g/L,例如,大于约25g/L,50g/L,75g/L,100g/L,125g/L,150g/L,160g/L,170g/L,180g/L,190g/L,200g/L,210g/L,225g/L,250g/L,275g/L,300g/L,325g/L,350g/L,400g/L,或500g/L;或约10g/L至约500g/L,例如,约50g/L至约350g/L,约100g/L至约300g/L,约150g/L至约250g/L,约175g/L至约225g/L,或约190g/L至约210g/L的效价产生或分泌所述C4-二羧酸(例如苹果酸)。
在所述方法的任何方面,在宿主细胞中产生或分泌的C4-二羧酸(例如苹果酸)的水平与不包含编码所述异源多核苷酸的多核苷酸的宿主细胞相比,在相同条件下培养时增加至少25%,例如至少50%,至少100%,至少150%,至少200%,至少300%,或至少500%。
在所述方法的任何这些方面,所述异源多核苷酸可能可操作地连接于对于所述多核苷酸为外源的启动子。
在所述方法的任何这些方面,所述宿主细胞可进一步包含编码苹果酸脱氢酶的异源第二多核苷酸(例如,SEQIDNO:11的成熟多肽编码序列,或其任何所述的方面)和/或编码丙酮酸羧化酶的异源第三多核苷酸(例如,SEQIDNO:15的成熟多肽编码序列,或其任何所述的方面),如上文中所述。在一些方面中,所述异源第二和/或第三多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。可用于这些方法的苹果酸脱氢酶和丙酮酸羧化酶的实例可见于例如2010年8月27日提交的题为“MethodsforImprovingMalicAcidProductioninFilamentousFungi”的PCT申请号PCT/US10/47002,其内容通过全文提述并入本文,特别是其中关于编码苹果酸脱氢酶和丙酮酸羧化酶多肽的多核苷酸所述的内容。
在所述方法的任何这些方面,所述宿主细胞可为任何上述的宿主细胞,例如,丝状真菌宿主细胞,如选自下组的宿主细胞:枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)和木霉属(Trichoderma)。举例而言,所述宿主细胞可为曲霉属宿主细胞,如米曲霉宿主细胞。
在本发明的方法中,所述重组宿主细胞在适于产生C4-二羧酸转运蛋白的培养基中,使用本领域中公知的方法进行培养,如上文中所述。
重组C4-二羧酸可任选地使用任何本领域中已知的方法从发酵培养基回收(参见,例如WO1998/022611和U.S.7,601,865),所述方法包括但不限于层析(例如大小排阻层析、吸附层析、离子交换层析),电泳方法,差示溶解度,渗透,蒸馏,萃取(例如液-液萃取),渗透蒸发(pervaporation),提取过滤,膜过滤,膜分离,反向过滤或超滤。在一个实例中,C4-二羧酸通过过滤从发酵培养基中的其它材料回收。
在所述方法的一些方面,在任选地纯化之前和/或之后的重组C4-二羧酸是基本上纯的。对于产生C4-二羧酸(或其具体的C4-二羧酸,如苹果酸)的方法,“基本上纯的”意指C4-二羧酸的回收的制备物含有不超过15%杂质,其中杂质意指除了C4-二羧酸之外的化合物。在一个变化中,提供了基本上纯的C4-二羧酸的制备物,其中所述制备物含有不超过25%杂质,或不超过20%杂质,或不超过10%杂质,或不超过5%杂质,或不超过3%杂质,或不超过1%杂质,或不超过0.5%杂质。
用于对于本文中所述的产生方法和宿主细胞测试C4-二羧酸产生的合适测定法可使用本文中已知的方法进行。举例而言,最终C4-二羧酸产物(例如苹果酸),和其它有机化合物,可通过方法如HPLC(高效液相色谱),GC-MS(气相色谱-质谱)和LC-MS(液相色谱-质谱)或其它合适的分析方法使用本领域公知的常规步骤进行分析。发酵液中C4-二羧酸的释放亦可用培养上清来进行测试。发酵培养基中的副产物和残余糖(例如葡萄糖)可通过HPLC使用例如针对葡萄糖和醇的折射率检测器,和针对有机酸的UV检测器(Lin等,Biotechnol.Bioeng.90:775-779(2005)),或使用其它本领域中公知的合适测定法和检测方法来进行定量。
信号肽
本发明亦涉及编码信号肽的分离的多核苷酸。在一个方面,所述信号肽包含或组成为SEQIDNO:2的氨基酸1至61或1至68。在一些方面,编码所述信号肽的分离的多核苷酸是SEQIDNO:1的核苷酸1至183或1至204。在另一个方面,所述信号肽包含或组成为SEQIDNO:4的氨基酸1至17。在一些方面,编码所述信号肽的分离的多核苷酸是SEQIDNO:3的1至51。在另一个方面,所述信号肽包含或组成为SEQIDNO:6的1至68。在一些方面,编码所述信号肽的分离的多核苷酸是SEQIDNO:5的核苷酸1至204。
所述多核苷酸可进一步包含编码蛋白的基因,其可操作地连接于信号肽和/或前肽。所述蛋白优选对于信号肽和/或前肽是外源的。
本发明亦涉及包含此类多核苷酸的核酸构建体、表达载体和重组宿主细胞。
本发明亦涉及产生蛋白质的方法,其包括:(a)培养包含此种多核苷酸的重组宿主细胞;和(b)回收所述蛋白质。
所述蛋白质对于宿主细胞可为天然的或异源的。术语“蛋白质”在本文中并不意指特定长度的编码产物,并因此涵盖肽、寡肽和蛋白。术语“蛋白质”亦涵盖组合以形成编码产物的两个或多个多肽。蛋白质亦包括杂合多肽和融合多肽。
优选地,所述蛋白是激素或其变体,酶,受体或其部分,抗体或其部分,或报道蛋白。举例而言,所述蛋白可为氧还酶,转移酶,水解酶,裂合酶,异构酶,或连接酶,如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、另外的脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶酸裂合酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
所述基因可从任何原核、真核或其它来源获得。
本发明进一步通过下述实施例描述,其不应视为对本发明范围的限制。
实施例
用作缓冲液和底物是至少试剂级的商品。
真菌菌株
使用棘孢曲霉作为C4-二羧酸转运蛋白基因c4t737、c4t521和mat737的来源。使用米曲霉NRRL3488(或ATCC56747)作为丙酮酸羧化酶基因、苹果酸脱氢酶基因的来源,并用于产生C4-二羧酸。
培养基
YEG培养基组成为:20g葡萄糖,5g酵母提取物,和去离子水加至1升。
COVE平板组成为:1M蔗糖,2%COVE盐溶液,10mM乙酰胺,15mMCsCl,和25g/lAgarNoble。
COVE盐溶液组成为:26gKCl,26gMgSO4·7H2O,76gKH2PO4,50mlCOVE痕量元素溶液,和去离子水加至1升。
COVE痕量元素溶液组成为:0.04gNa2B4O7·10H2O,0.04gCuSO4·5H2O,1.2gFeSO4·7H2O,0.7gMnSO4·H2O,0.8gNa2MoO2·2H2O,10gZnSO4·7H2O和去离子水加至1升。
种子培养基组成为:40g葡萄糖,6gBactoPeptone(细菌用蛋白胨),750mgKH2PO4,750mgK2HPO4,100mgMgSO4·7H2O,100mgCaCl2·H2O,5mgFeSO4·7H2O,5mgNaCl,和去离子水加至1升。
种子培养基B组成为:30g葡萄糖,3gBactoPeptone,560mgKH2PO4,560mgK2HPO4,925mgNaH2PO4·H2O,820mgNa2HPO4,75mgMgSO4·7H2O,75mgCaCl2·H2O,0.75ml的1000X微量营养物溶液(MicronutrientSolution),和去离子水加至1升。
酸产生培养基C组成为:100g葡萄糖,80gCaCO3,6gBactoPeptone,150mgKH2PO4,150mgK2HPO4,100mgMgSO4·7H2O,100mgCaCl2·H2O,1ml1000X微量营养物溶液,和去离子水加至1升。
发酵器批式培养基组成为:120g葡萄糖,120gCaCO3,9gBactoPeptone,150mgKH2PO4,150mgK2HPO4,100mgMgSO·7H2O,100mgCaCl2-2H2O,5mgFeSO4·7H2O,5mgNaCl,5mLPluronicL61,和去离子水加至1升。
1000X微量营养物溶液组成为:5gNaCl,5gFeSO4·7H2O,1g柠檬酸,和去离子水加至1升。
PDA平板组成为:39g/l马铃薯右旋糖琼脂。
2XYT+amp平板组成为16g胰蛋白胨,10g酵母提取物,5gNaCl,100mg氨苄青霉素,15gBacto琼脂,和去离子水加至1升。
实施例1:棘孢曲霉C4-二羧酸转运蛋白基因的克隆和表达载体pSaMF35的构建
分离来自棘孢曲霉的基因组DNA,即用2x106个孢子接种至摇瓶中的100ml的YEG培养基,并将所述烧瓶在34℃以160rpm振荡温育过夜。将菌丝体通过使用(Calbiochem,SanDiego,CA,USA)带衬里的漏斗(linedfunnel)的过滤来收获,并回收了大约2g的菌丝体,并将其冻结于液氮。将冻结的菌丝体通过仍包裹在中时迅速用锤子锤碎来破坏。然后将破坏的菌丝体转移至含有10ml的1X裂解缓冲液(100mMEDTA,10mMTrispH8.0,1%X-100,0.5M胍-HCl,200mMNaCl)和3μl的RNaseA(QIAGENInc.,Valencia,CA,USA,100mg/ml)的50ml聚丙烯锥形离心管中。将管通过轻柔的涡旋来混合,然后在室温温育5分钟,之后添加150μl蛋白酶K(QIAGENInc.,Valencia,CA,USA;20mg/ml)。将管通过倒置混合,并在50℃温育1小时。然后将管在7240xg离心20分钟,然后将上清添加至预平衡的QIAGEN-tip100(QIAGENInc.,Valencia,CA,USA),而剩余的DNA提取步骤根据生产商的指示进行。将DNA重悬于100μlTE缓冲液(10mMTris碱,1mMEDTA,pH8.0)中。
将1194bpC4-二羧酸转运蛋白基因c4t737从棘孢曲霉基因组DNA使用下示的引物069698和069699扩增。
引物069698:
5’-GTGATAGAACATCGTCCATAATGCTCGGGCAACACT-3’(SEQIDNO:7)
引物069699:
5’-GTGTCAGTCACCTCTAGTTATTACTCCGATACATCCTCGT-3’(SEQIDNO:8)
PCR反应物组成为:5μl10X反应缓冲液(Stratagene,LaJolla,CA,USA),1μl棘孢曲霉DNA模板(105ng/μl),1μl引物069698(100ng/μl),1μl引物069699(100ng/μl),1μldNTP混合物(10mM),40.5μl去离子水,和0.5μlHotStartDNA聚合酶(Stratagene,LaJolla,CA,USA)。将扩增反应温育于 (EppendorfScientificInc.Westbury,NewYork,USA),其程序如下:1个循环,在95℃进行2分钟;10个循环,每个95℃进行10秒,60℃进行30秒,和72℃进行1.5分钟;和20个循环,每个在95℃进行10秒,60℃进行30秒,72℃进行1.5分钟且每循环加10秒。然后使用PCRPurificationKit(QIAGENInc.,Valencia,CA,USA)纯化PCR产物。
将质粒pShTh60(图1;亦参见2010年8月27日提交的PCR申请号PCT/US10/47002)用SexAI和PacI消化,通过TBE缓冲液(10.8g/LTris碱,5.5g/L硼酸,2mMEDTA,pH8.0)中的0.8%琼脂糖凝胶电泳分离,并使用GelExtractionKit(QIAGENInc.,Valencia,CA,USA)纯化。然后将上述纯化的PCR产物使用In-FusionTMAdvantage反应试剂盒(Clontech,MountainView,CA,USA)***消化的pShTh60片段中,该反应组成为2μl5X缓冲液(Clontech,MountainView,CA,USA),2.4μl纯化的PCR产物(33ng/μl),1.5μl消化和凝胶纯化的pShTh60(132ng/μl),1μlIn-FusionTM酶和3.1μl去离子水。将反应在37℃温育15分钟,50℃温育15分钟,置于冰上5分钟,并用40μlTE缓冲液(10mMTris碱,1mMEDTA,pH8.0)稀释,得到pSaMF35(图2)。
将上述含有pSaMF35的连接反应产物的2.5μl等分试样根据生产商的指示转化入TOP10化学感受态大肠杆菌细胞(Invitrogen,SanDiego,CA,USA)。将转化物铺板于2XYT+amp平板上,并在37℃温育过夜。挑取所得的转化体,并对其进行DNA测序以确认c4t737基因整合入载体。
棘孢曲霉c4t737基因的核苷酸序列(SEQIDNO:1)和推导的氨基酸序列(SEQIDNO:2)显示于图3。编码序列为1194bp,包含终止密码子。编码的预测蛋白为397个氨基酸,具有44.3kDa的预测分子量和6.93的等电点pH。该基因不含内含子。使用SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),预测了61个残基的信号肽。基于该程序,预测的成熟蛋白含有336个氨基酸,具有37.3kDa的预测分子量和6.52的等电点pH。使用InterProScan程序(TheEuropeanBioinformaticsInstitute),预测了68个残基的信号肽。基于该程序,预测的成熟蛋白含有329个氨基酸,具有36.5kDa的预测分子量和6.52的等电点pH。
实施例2:将pSaMF35的表达载体片段转化入棘孢曲霉NRRL3488(SaMF35)
进行米曲霉NRRL3488的原生质体制备和转化,即将大约2x107个孢子接种入100mLYEG培养基,并将烧瓶在27℃以140rpm温育16-18小时。收集菌丝体,即将培养物倾倒透过衬有(Calbiochem,SanDiego,CA,USA)的灭菌漏斗,并用50mL的0.7MKCl漂洗。将经洗涤的菌丝体重悬于含有20mL原生质体化溶液的125mL烧瓶,所述溶液包含每mL0.7MKCl(经过滤灭菌)5mg的GLUCANEXTM(NovozymesA/S,,Denmark)和0.5mg的壳多糖酶(SigmaChemicalCo.,St.Louis,MO,USA),并将该烧瓶在34℃以80rpm混合温育30分钟。将原生质体化溶液倾倒透过衬有的灭菌漏斗,并用50mL的STC缓冲液(1M山梨醇-10mMTris-HClpH6.5-10mMCaCl2)漂洗。将流过物在两个50mL聚丙烯管中收集。将管在室温以1300xg离心10分钟。弃去上清并将原生质体沉淀重悬于20mL的STC缓冲液。洗涤原生质体,即进行两轮的将沉淀重悬于20mL的STC缓冲液并在室温在1300xg离心10分钟。将最终沉淀重悬于2mL的STC缓冲液。对原生质体进行计数,即移取10μl样品并在血细胞计数器(VWR,WestChester,PA,USA)中对其进行计数。用STC缓冲液调整体积以获得2x107每mL的原生质体浓度。
通过用PmeI进行限制性消化制备质粒pSaMF35以供转化。通过TBE缓冲液中的0.8%琼脂糖凝胶电泳从消化的载体分离4977bp表达盒,并使用GelExtractionKit进行纯化。准备了两个转化反应。对于每个反应,将100μL原生质体制备的溶液转移至12mL聚丙烯管,对其添加5μg直链化的pSaMF35和250μlPEG溶液(60%w/v聚乙二醇(PEG),10mMTris6.5,10mMCaCl)接着进行轻柔地混合,并在37℃温育30分钟。将每个转化反应物用9mL的STC溶液稀释,接着将三个不同的3ml等分试样铺板于COVE平板上。然后将每个平板在34℃温育7-10日。将二十个SaMF35转化体转移至单个COVE平板,并在34℃温育5日。通过将孢子收集于0.1%80来制备孢子储液。储藏培养物,即制备每个的甘油储液(800μl孢子储液,200μl0.1%80)并冻结于-80℃。
实施例3:在含有pSaMF35的表达载体片段的米曲霉转化体(SaMF35)的摇瓶培养中产生苹果酸
将来自实施例2中所述的每个pSaMF35转化体和作为对照的米曲霉NRRL3488的孢子铺板于单个PDA平板,并允许其在34℃进行5至7日的孢子形成。在0.1%80中收集孢子,并使用血细胞计数器进行计数。在含有100ml的种子培养基B的250ml烧瓶中制备种子培养物,并用300μl的孢子悬液接种。将种子培养物在30℃以200rpm振荡生长大约17个小时。在含有50ml的酸产生培养基C和3ml的17小时种子培养物的250ml不带挡板的烧瓶中制备酸产生培养物。将培养物在30℃以200rpm振荡温育2-10日。
对于摇瓶培养转化体的苹果酸定量通过使用1200SeriesBinaryLCSystem和1200SeriesDiodeArrayDetector(DAD)(AgilentTechnologies,SantaClara,CAUSA)的ReversePhaseHighPressureLiquidChromatography(RP-HPLC)进行。使用Aqua5μC18205x4.6mmID柱和AQC184x3.0mmSecurityGuardCartridge(Phenomenex,Inc.,Torrance,CA,USA)进行反向分离。流动相由10%甲醇(HPLC级)和90%145mM磷酸盐pH1.5缓冲液组成。
移出全培养样品,并将其在由850ml的64mM磷酸盐缓冲液和150ml的甲醇pH1.65组成的HPLCRunningBuffer中以1:10稀释。然后将样品透过25mm0.45微米聚醚砜膜(Whatman,FlorhamPark,NJ,USA)进行过滤,并将1.5ml滤过物置入HPLC小瓶进行酸分析。将剩余量的摇瓶培养物透过3层粗滤布(cheesecloth)过滤,并用10体积的双蒸无菌水漂洗三次以去除不溶的CaCO3。从粗滤布收获细胞沉淀,置入15ml培养管,并储藏于-20℃。
使用10μl的注入体积以0.7ml/分钟(等度洗脱)的流速以25℃的柱温度和11分钟的运行时间进行RP-HPLC。检测设定为210nm,8nm带宽,参照为360nm,40nm带宽。确定空白时间(voidtime)为3.8分钟。通过进行浓度范围为49.2至3.93mM的系列稀释的苹果酸标样的重复注入,对于苹果酸确定了反相方法的定量能力。对于重复注入的相对标准偏差(RSD)为≤5%。苹果酸显示R2≥0.9999。
在3日摇瓶生长之后,含有pSaMF35的米曲霉转化体与米曲霉NRRL3488对照菌株相比显示了超过2倍的苹果酸产生方面的改善。
实施例3B:含有pSaMF35的表达载体片段的米曲霉转化体(SaMF35)的发酵。
制备了实施例2中所述的米曲霉pSaMF35转化体和对照转化体米曲霉ShTh1040(参见2010年8月27日提交的PCR申请号PCT/US10/47002)并将其如下文实施例7中所述进行发酵。
发酵中苹果酸的定量如上所述进行。米曲霉pSaMF35转化体的相对苹果酸效价类似于米曲霉ShTh1040转化体,表明基于之前描述的ShTh1040和NRRL3488的比较,米曲霉pSaMF35转化体与米曲霉NRRL3488对照(其缺乏过表达的C4-二羧酸转运蛋白基因)相比性能更好。
实施例4:棘孢曲霉C4-二羧酸转运蛋白基因的克隆和表达载体pSaMF36的构建
将1257bpC4-二羧酸转运蛋白基因c4t521从棘孢曲霉基因组DNA(实施例1)使用下示的引物069700和069701扩增。
引物069700:
5’-TGTGATAGAACATCGTCCATAATGCACGACCACAGC-3’(SEQIDNO:9)
引物069701:
5’-GTGTCAGTCACCTCTAGTTATCATTCGAACAACTCGGACA-3’(SEQIDNO:10)
PCR反应物组成为:10μl5X反应缓冲液,1μl棘孢曲霉DNA模板(105ng/μl),1μl引物069700(100ng/μl),1μl引物069701(100ng/μl),1μldNTP混合物(10mM),35.5μl去离子水,和0.5μlPhusionTMHotStartHigh-FidelityDNA聚合酶(Finnzymes,Inc,Massachusetts,USA)。将扩增反应温育于 ,其程序如下:1个循环,在98℃进行30秒;30个循环,每个在98℃进行10秒,60℃进行30秒,72℃进行1分钟,和一个循环,在72℃进行10分钟。将PCR产物用DpnI消化1小时以降解任何质粒DNA模板。
将质粒pShTh60(图1)用SexAI和PacI消化,通过TBE缓冲液中的0.8%琼脂糖凝胶电泳分离,并使用GelExtractionKit纯化。然后将上述纯化的PCR产物使用In-FusionTMAdvantage反应试剂盒***消化的pShTh60片段中,该反应组成为2μl5X缓冲液,3μl纯化的PCR产物(26ng/μl),1.5μl凝胶纯化的SexAI和PacI消化的和凝胶纯化的pShTh60(132ng/μl),1μlIn-FusionTM酶和2.5μl去离子水。将反应在37℃温育15分钟,50℃温育15分钟,置于冰上5分钟,并用40μlTE缓冲液稀释,得到pSaMF36(图4)。
将上述连接反应产物的2.5μl等分试样根据生产商的指示转化入ONETOP10化学感受态大肠杆菌细胞。将转化物铺板于2XYT+amp平板上,并在37℃温育过夜。挑取所得的转化体,并对其进行DNA测序以确认mat521基因成功整合入载体。
棘孢曲霉c4t521基因的核苷酸序列(SEQIDNO:3)和推导的氨基酸序列(SEQIDNO:4)显示于图5。编码序列为1257bp,包含终止密码子。编码的预测蛋白为418个氨基酸,具有46.8kDa的预测分子量和6.36的等电点pH。该基因不含内含子。使用SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),预测了17个残基的信号肽。基于该程序,预测的成熟蛋白含有401个氨基酸,具有44.9kDa的预测分子量和6.89的等电点pH。
实施例5:将pSaMF36的表达载体片段转化入棘孢曲霉NRRL3488(SaMF36)
米曲霉NRRL3488的原生质体制备和转化如实施例2中所述进行。
通过用PmeI进行限制性消化制备质粒pSaMF35以供转化。通过TBE缓冲液中的0.8%琼脂糖凝胶电泳从消化的载体分离5040bp表达盒,并使用GelExtractionKit进行纯化。准备了两个转化反应。对于每个反应,将100μL原生质体制备的溶液转移至12mL聚丙烯管,对其添加5μg直链化的pSaMF36和250μlPEG溶液(60%w/v聚乙二醇(PEG),10mMTris6.5,10mMCaCl)接着进行轻柔地混合,并在37℃温育30分钟。将每个转化反应物用9mL的STC溶液稀释,接着将三个不同的3ml等分试样铺板于COVE平板上。然后将每个平板在34℃温育7-10日。将二十个SaMF36转化体转移至单个COVE平板,并在34℃温育5日。通过将孢子收集于0.1%80来制备孢子储液。储藏培养物,即制备每个的甘油储液(800μl孢子储液,200μl0.1%80)并冻结于-80℃。
实施例6:在含有pSaMF36的表达载体片段的米曲霉转化体(SaMF36)的摇瓶培养中产生苹果酸
来自实施例5中所述的每个pSaMF36转化体和作为对照的米曲霉NRRL3488的孢子如实施例3中所述制备。对于摇瓶培养转化体的苹果酸的定量如实施例3中所述进行。
表1显示了在3日的摇瓶生长之后,转化体米曲霉SaMF36-3和米曲霉SaMF36-4与作为对照的米曲霉NRRL3488的苹果酸产生相比的苹果酸效价的相对增加。相对于米曲霉NRRL3488,米曲霉SaMF36-3和米曲霉SaMF36-4分别产生了2.1倍和2.3倍的苹果酸效价的增加。
表1
菌株 | 苹果酸的相对效价 | %CV |
NRRL3488 | 1 | 0.7% |
SaMF36-3 | 2.1 | 4.8% |
SaMF36-4 | 2.3 | 0.2% |
实施例7:含有pSaMF36的表达载体片段的米曲霉转化体(SaMF36)的发酵
将描述于实施例5中的米曲霉pSaMF36转化体和对照转化体米曲霉ShTh1040(参见2010年8月27日提交的PCR申请号PCT/US10/47002)在34℃在PDA平板上生长大约7日。将5-6ml体积的含有0.2%80的灭菌的50mM磷酸钠缓冲液(pH6.8)添加至每个平板,并通过用接种环刮擦使孢子悬浮。通过移液将每个悬液转移至50ml锥形管。对于每个管,将25ml的灭菌的磷酸钠缓冲液(50mM,pH6.8)添加至含有75ml的种子培养基的500ml不带挡板的烧瓶,然后将其用2ml的孢子悬液接种。然后将烧瓶在34℃和180rpm温育约24小时。合并所述种子烧瓶以供应每罐所需的144ml接种物。
通过导入144ml(8%)的来自米曲霉pSaMF36转化体或米曲霉ShTh1040转化体的合并的种子***种子培养液来分别接种含有1.8升的发酵罐批式培养基的三升发酵罐。仅对该实验,将发酵罐批式培养基中的葡萄糖浓度减少至60g/L,并将补料起始推迟一日。将发酵罐平衡于34±0.1℃并以500rpm搅拌。入口空气流量维持在1v/v/m。自发酵约43小时开始,将20%葡萄糖流以大约7.3g/hr的速率施加。在大约第5或6日添加灭菌的CaCO3(约100g)以保持发酵pH在6至7的范围。每日取出样品,并如实施例3中所述就苹果酸产生进行分析。发酵在7或8日之后完成。
发酵中苹果酸的定量如实施例3中所述进行。米曲霉pSaMF36转化体的相对苹果酸效价类似于米曲霉ShTh1040转化体,表明基于之前描述的ShTh1040和NRRL3488的比较,米曲霉pSaMF36转化体与米曲霉NRRL3488对照(其缺乏过表达的C4-二羧酸转运蛋白基因)相比在苹果酸产生方面性能更好。
实施例8:米曲霉苹果酸脱氢酶基因的克隆和载体pSaMF21的构建
构建质粒pSaMF21以包含NAD-依赖性苹果酸脱氢酶(mdh3)基因序列(DOGAN:AO090701000013),如2010年8月27日提交的PCT申请号PCT/US10/47002中所述的来自米曲霉的1430bp片段。米曲霉NRRL3488苹果酸脱氢酶mdh3基因的核苷酸序列(SEQIDNO:11)和推导的氨基酸序列(SEQIDNO:12)显示于图6。1430bp的基因组编码序列(包含终止密码子)编码330个氨基酸的多肽,其具有35kDa的预测分子量。编码序列被57bp(14-70bp),70bp(103-172bp),74bp(284-357bp),68bp(446-513bp),58bp(892-949bp),48bp(1035-1082bp),和62bp(1228-1289bp)的7个内含子打断,mdh3基因的编码区的G+C含量为50.3%。
简言之,该质粒通过藉由用SexAI和PacI的限制性消化直链化pShTh60(图1)来构建。消化的载体通过TBE缓冲液中的0.8%琼脂糖凝胶电泳来分离,并使用GelExtractionKit纯化。将mdh3基因使用引物067522和067525从pShTh71(2010年8月27日提交的PCT申请号PCT/US10/47002)扩增。
引物067522:
5’-AGAACATCGTCCATAATGGTCAAAGCTGGTGAGTTA-3’(SEQIDNO:13)
引物067525:
5’-GTGTCAGTCACCTCTAGTTATTACTTTGGTGGTGGGTTCT-3’(SEQIDNO:14)
PCR反应组成为:5μl10X反应缓冲液,1μlpShTh71模板(87ng/μl),1μl引物067522(100ng/μl),1μl引物067525(100ng/μl),1μldNTP混合物(10mM),45.5μl去离子水,和0.5μlHotStartDNA聚合酶(Stratagene,LaJolla,CA,USA)。将扩增反应温育于 ,其程序如下:1个循环,在95℃进行2分钟;10个循环,每个在95℃进行10秒,58℃进行30秒,和72℃进行1.5分钟;20个循环,每个在95℃进行10秒,50℃进行30秒,和72℃进行1.5分钟每循环增加10秒。对PCR反应产物进行用DpnI的限制性消化1小时以降解任何质粒DNA模板。然后使用PCRPurificationKit(QIAGENInc.,Valencia,CA,USA)纯化PCR产物。将纯化的PCR产物使用In-FusionTMAdvantage反应***载体,所述反应组成为2μl5X缓冲液,0.5μl纯化的PCR产物(110ng/μl),1.7μl凝胶纯化的SexAI和PacI限制性消化的pShTh60(Figure1;78ng/μl),1μlIn-FusionTM酶和4.8μl去离子水。将反应在37℃温育15分钟,接着在50℃温育15分钟,然后将其置于冰上5分钟,并用40μlTE稀释,得到pSaMF21(图7)。将连接反应的2μl等分试样根据生产商的指示转化入ONETOP10化学感受态细胞(Invitrogen,SanDiego,CA,USA)。将转化体铺板于2XYT+amp上,并在37℃温育过夜。挑取所得的转化体,并对其进行DNA测序以确认mdh3基因成功地整合入载体。
实施例9:米曲霉丙酮酸羧化酶基因的克隆和表达载体pRyan1的构建
构建质粒pRyan1以包含丙酮酸羧化酶(pyc)基因序列(DOGAN:AO090023000801),如2010年8月27日提交的PCT申请号PCT/US10/47002中所述的来自米曲霉的3646bp片段(包含两个终止密码子)。米曲霉丙酮酸羧化酶基因的核苷酸序列(SEQIDNO:15)和推导的氨基酸序列(SEQIDNO:16)显示于图8A和8B。米曲霉NRRL3488和ATCC56747丙酮酸羧化酶基因均具有相同的核苷酸序列。3643bp的基因组编码序列(包含一个终止密码子)编码1193个氨基酸的多肽,其具有131kDa的预测分子量。编码序列由61bp(3475-3535bp)的1个内含子打断。基因的编码区的G+C含量为57.1%。
简言之,该质粒通过藉由用SexAI和PacI的限制性消化直链化pShTh60(图1)来构建。消化的载体通过TBE缓冲液中的0.8%琼脂糖凝胶电泳来分离,并使用GelExtractionKit纯化。将pyc基因使用下示的引物066549和067388从米曲霉NRRL3488基因组DNA扩增。
引物066549:
5’-TAGAACATCGTCCATAATGGCGGCTCCGTTTCGTCA-3’(SEQIDNO:17)
引物067388:
5’-GTGTCAGTCACCTCTAGTTATTATTACGCTTTGACGATCT-3’(SEQIDNO:18)
PCR反应组成为:5μl10X反应缓冲液,1μl米曲霉NRRL3488基因组DNA(110ng/μl),1μl引物066549(100ng/μl),1μl引物067388(100ng/μl),1μldNTP混合物(10mM),45.5μl去离子水,和0.5μlHotStartDNA聚合酶。将扩增反应温育于 ,其程序如下:1个循环,在95℃进行2分钟;10个循环,每个在95℃进行10秒,58℃进行30秒,和72℃进行3.5分钟;20个循环,每个在95℃进行10秒,58℃进行30秒,和72℃进行3.5分钟每循环增加10秒。然后使用PCRPurificationKit纯化PCR产物。
将纯化的PCR产物使用In-FusionTMAdvantage反应***载体,所述反应组成为2μl5X缓冲液,0.5μl纯化的PCR产物(144ng/μl),2μl凝胶纯化的SexAI和PacI限制性消化的pShTh60(图1;78ng/μl),1μlIn-FusionTM酶和4μl去离子水。将反应在37℃温育15分钟,接着在50℃温育15分钟,然后将其置于冰上5分钟,并用40μlTE稀释,得到pRYAN1(图9)。将连接反应的2μl等分试样根据生产商的指示转化入ONETOP10化学感受态细胞。将转化体铺板于2XYT+amp上,并在37℃温育过夜。挑取所得的转化体,并对其进行DNA测序以确认pyc基因成功地整合入载体。核苷酸1308从C变为T,但并不影响蛋白序列。
实施例10:将pSaMF36、pSaMF21和pRyan1的表达载体片段转化入米曲霉NRRL3488(SaMF3603)
通过用PmeI在37℃消化4小时准备载体pSaMF36(实施例4),pSaMF21(实施例8)和pRyan1(实施例9)以供转化。将消化的载体在0.8%琼脂糖TBE凝胶上分离,对于pSaMF36切出5040bp的条带,对于pSaMF21切出5213bp的条带,而对于pRyan1切出7429bp的条带。将含有表达盒的条带各自使用Macherey-NagelExtractIIKit(Düren,Germany)依照生产商的指示进行纯化。
准备了三个转化反应。对于每个反应,将100μL原生质体制备物(实施例2)转移至12mL聚丙烯管。对其以等摩尔量添加总共五微克的不含amp标志物、直链化的pShTh104、pSaMF21和pRyan1,和250μl聚乙二醇(PEG)溶液(60%w/v聚乙二醇(PEG),10mMTris6.5,10mMCaCl)接着进行轻柔地混合,并在37℃温育30分钟。将每个转化反应物用9mL的STC缓冲液稀释,接着将三个不同的3ml等分试样铺板于COVE平板上。然后将每个平板在34℃温育7-10日。将所得的转化体转移至单个COVE平板,并在34℃温育5日。通过将孢子收集于0.1%80来制备孢子储液。储藏培养物,即制备每个的甘油储液(800μl孢子储液,200μl0.1%80)并冻结于-80℃。
实施例11:在含有pSaMF36、pSaMF21和pRyan1的表达载体片段的米曲霉转化体(SaMF3603)的摇瓶培养中产生苹果酸
来自实施例10中所述的每个米曲霉三重转化体SaMF3603和作为对照的米曲霉NRRL3488的孢子如实施例3中所述制备。对于摇瓶培养转化体苹果酸的定量如实施例3中所述进行。
含有pSaMF36、pSaMF21和pRyan1的米曲霉转化体SaMF3603与米曲霉NRRL3488对照菌株相比在苹果酸产生方面显示超过2.55倍的改善。
实施例12:含有pSaMF36、pSaMF21和pRyan1的表达载体片段的米曲霉转化体(SaMF3603)的发酵
如实施例7中所述准备并发酵描述于实施例10中的米曲霉三重转化体SaMF3603和对照转化体米曲霉SaMF2103(参见2010年8月27日提交的PCR申请号PCT/US10/47002)
发酵中苹果酸的定量如实施例3中所述进行。米曲霉三重转化体SaMF3603的相对苹果酸效价类似于米曲霉转化体SaMF2103,表明基于之前描述的比较,米曲霉三重转化体SaMF3603转化体与米曲霉pSaMF36单转化体和米曲霉NRRL3488对照相比在苹果酸产生方面性能更好。
实施例13:棘孢曲霉C4-二羧酸转运蛋白的克隆和表达载体pSaMF38的构建
将1194bpC4-二羧酸转运蛋白基因mat737合成地构建入pAaMAT737(图10;DNA2.0,MenloPark,CA,USA)。从pAaMAT737使用069698和069699(实施例1)扩增mat737基因
PCR反应物组成为:10μl5X反应缓冲液,1μlpAaMAT737模板(20ng/μl),1μl引物069698(100ng/μl),1μl引物069699(100ng/μl),1μldNTP混合物(10mM),35.5μl去离子水,和0.5μlPhusionTMHotStartHigh-FidelityDNA聚合酶。将扩增反应温育于 ,其程序如下:1个循环,在98℃进行30秒;30个循环,每个在98℃进行10秒,65℃进行30秒,72℃进行1分钟,和一个循环,在72℃进行10分钟。将PCR产物用DpnI消化1小时以降解任何质粒DNA模板,并使用PCRPurificationKit纯化PCR产物。
将质粒pShTh60(图1)用SexAI和PacI消化,通过TBE缓冲液(10.8g/LTris碱,5.5g/L硼酸,2mMEDTA,pH8.0)中的0.8%琼脂糖凝胶电泳分离,并使用GelExtractionKit纯化。然后将上述纯化的PCR产物使用In-FusionTMAdvantage反应试剂盒***消化的pShTh60片段中,该反应组成为2μl5X缓冲液,0.5μl纯化的PCR产物(187ng/μl),1.5μl消化的和凝胶纯化的pShTh60(132ng/μl),1μlIn-FusionTM酶和5μl去离子水。将反应在37℃温育15分钟,50℃温育15分钟,置于冰上5分钟,并用40μlTE缓冲液(10mMTris碱,1mMEDTA,pH8.0)稀释,得到pSaMF38(图11)。
将上述含有pSaMF38的连接反应产物的2.5μl等分试样根据生产商的指示转化入ONETOP10化学感受态大肠杆菌细胞。将转化物铺板于2XYT+amp平板上,并在37℃温育过夜。挑取所得的转化体,并对其进行DNA测序以确认mat737基因整合入载体。
mat737基因的核苷酸序列(SEQIDNO:5)和推导的氨基酸序列(SEQIDNO:6)显示于图12。编码序列为1194bp,包含终止密码子。编码的预测蛋白为397个氨基酸,具有44.3kDa的预测分子量和7.32的等电点pH。该基因不含内含子。使用InterProScan程序(TheEuropeanBioinformaticsInstitute),预测了68个残基的信号肽。基于该程序,预测的成熟蛋白含有329个氨基酸,具有36.6kDa的预测分子量和6.52的等电点pH。
实施例14:将表达载体片段pSaMF38转化入米曲霉NRRL3488(SaMF38)
米曲霉NRRL3488的原生质体制备和转化如实施例2中所述进行。
通过用PmeI进行限制性消化制备质粒pSaMF38以供转化。通过TBE缓冲液中的0.8%琼脂糖凝胶电泳从消化的载体分离4977bp表达盒,并使用Macherey-NagelNucleospinExtractIIKit进行纯化。准备了两个转化反应。对于每个反应,将100μL原生质体制备物转移至12mL聚丙烯管,对其添加5μg直链化的pSaMF38和250μlPEG溶液(60%w/v聚乙二醇(PEG),10mMTris6.5,10mMCaCl)接着进行轻柔地混合,并在37℃温育30分钟。将每个转化反应物用9mL的STC缓冲液稀释,接着将三个不同的3ml等分试样铺板于COVE平板上。然后将每个平板在34℃温育7-10日。将二十个SaMF38转化体转移至单个COVE平板,并在34℃温育5日。通过将孢子收集于0.1%80来制备孢子储液。储藏培养物,即制备每个的甘油储液(800μl孢子储液,200μl0.1%80)并冻结于-80℃。
实施例15:在含有pSaMF38的表达载体片段的米曲霉转化体(SaMF38)的摇瓶培养中产生苹果酸
来自实施例14中所述的米曲霉pSaMF38转化体和作为对照的米曲霉NRRL3488的孢子如实施例3中所述制备。对于摇瓶培养转化体苹果酸的定量如实施例3中所述进行。
米曲霉pSaMF38转化体与米曲霉NRRL3488对照菌株相比,在苹果酸产生方面显示超过1.8倍的改善。
实施例16:棘孢曲霉C4-二羧酸转运蛋白基因的克隆和在另一种启动子调控下的表达载体pSaMF41的构建
下述实施例说明棘孢曲霉C4-二羧酸转运蛋白基因可通过使用另一种gpd启动子进行驱动。
将1257bpC4-二羧酸转运蛋白基因c4t521从pSaMF36(见上文)使用下示的引物0611384和069701扩增。
引物0611384:
5’-CCAACAGACACATCTAAACAATGCACGACCACAGCA-3’(SEQIDNO:21)
引物069701:
5’-GTGTCAGTCACCTCTAGTTATCATTCGAACAACTCGGACA-3’(SEQIDNO:22)
PCR反应物组成为:5μl10X反应缓冲液,1μlpSaMF36模板(50ng/μl),1μl引物0611384(100ng/μl),1μl引物069701(100ng/μl),1μldNTP混合物(10mM),40.5μl去离子水,和0.5μlHotStartDNA聚合酶(Stratagene,LaJolla,CA,USA)。将扩增反应温育于 其程序如下:1个循环,在95℃进行2分钟;10个循环,每个在95℃进行10秒,60℃进行30秒,和72℃进行1.5分钟;20个循环,每个在95℃进行10秒,60℃进行30秒,和72℃进行1.5分钟每循环增加10秒。将PCR产物用DpnI消化1小时以降解任何质粒DNA模板。然后使用PCRPurificationKit(QIAGENInc.)纯化PCR产物。
将纯化的PCR产物使用In-FusionTMAdvantage反应试剂盒***含有gpd启动子的载体(pShTh108)中,该反应组成为2μl5X缓冲液,0.6μl纯化的PCR产物(127ng/μl),1.75μl凝胶纯化的HindIII和PacI消化的pShTh108(114ng/μl),1μlIn-FusionTM酶和4.65μl去离子水。将反应在37℃温育15分钟,然后在50℃温育15分钟,然后置于冰上5分钟,并用40μlTE缓冲液稀释,得到pSaMF41。
将连接反应产物的2.5μl等分试样根据生产商的指示转化入ONETOP10化学感受态大肠杆菌细胞(Invitrogen)。将转化物铺板于2XYT+amp平板上,并在37℃温育过夜。挑取所得的转化体,并对其进行DNA测序以确认c4t521基因成功地整合入载体。
棘孢曲霉c4t521基因的核苷酸序列(SEQIDNO:3)和推导的氨基酸序列(SEQIDNO:4)显示于图5。编码序列为1257bp,包含终止密码子,并由gpd启动子驱动,与之相对,实施例4中为pgk启动子。
实施例17:将表达载体片段pSaMF41转化入棘孢曲霉NRRL3488(SaMF41)
米曲霉3488的原生质体制备和转化如实施例2中所述进行。
通过藉由用PmeI限制性消化进行的直链化制备质粒pSaMF41以供转化。通过TBE缓冲液中的0.8%琼脂糖凝胶电泳从消化的载体分离5025bp表达盒,并使用供凝胶分离的Macherey-NagelExtractIIKit依照生产商的指示进行纯化。准备了两个转化反应。对于每个反应,将100μL原生质体制备的溶液转移至12mL聚丙烯管,对其添加5μg直链化的pSaMF41和250μlPEG溶液(60%w/v聚乙二醇(PEG),10mMTris6.5,10mMCaCl)接着进行轻柔地混合,并在37℃温育30分钟。将每个转化反应物用9mL的STC缓冲液稀释,接着将三个不同的3ml等分试样铺板于COVE平板上。然后将每个平板在34℃温育7-10日。将SaMF41转化体转移至单个COVE平板,并在34℃温育5日。通过将孢子收集于0.1%80来制备孢子储液。储藏培养物,即制备每个的甘油储液(800μl孢子储液,200μl0.1%80)并冻结于-80℃。
实施例18:在含有pSaMF41的表达载体片段的米曲霉转化体(SaMF41)的摇瓶培养中产生苹果酸
来自实施例17中所述的每个pSaMF41转化体(SaMF41)、实施例5中所述的pSaMF36转化体(SaMF36)和作为对照的米曲霉NRRL3488的孢子如实施例3中所述制备。对于摇瓶培养转化体苹果酸的定量如实施例3中所述进行。
含有由gpd启动子驱动的棘孢曲霉c4t521基因(SEQIDNO:3)的米曲霉SaMF41转化体与含有由pgk启动子驱动的棘孢曲霉c4t521基因(SEQIDNO:3)的米曲霉SaMF36转化体显示类似的苹果酸产生,并与缺乏c4t521基因的米曲霉NRRL3488对照相比在苹果酸效价方面显示约2倍的增加。
实施例19:含有pSaMF41的表达载体片段的米曲霉转化体(SaMF41)的发酵
如实施例7中所述制备和发酵实施例18中所述的米曲霉pSaMF41转化体和对照转化体米曲霉ShTh1040(参见2010年8月27日提交的PCT申请号PCT/US10/47002)。
发酵中苹果酸的定量如上文所述进行。米曲霉pSaMF41转化体的相对苹果酸效价类似于米曲霉ShTh1040转化体,表明基于之前描述的ShTh1040和NRRL3488的比较,米曲霉pSaMF41转化体与米曲霉NRRL3488对照(其缺乏过表达的C4-二羧酸转运蛋白基因)相比性能更好。
生物材料的保藏
依据布达佩斯条约的条款,下述的生物材料已经保藏于农业研究机构专利培养物保藏中心/农业研究培养物保藏中心(AgriculturalResearchServicePatentCultureCollection),北区研究中心(NorthernRegionalResearchCenter),1815UniversityStreet,Peoria,Illinois,61604,并给予下述的登录号:
保藏物登录号保藏日期
大肠杆菌pAaC4T737NRRLB-504002010年6月17日
大肠杆菌pAaC4T521NRRLB-503882010年6月4日
大肠杆菌pAaMAT737NRRLB-504012010年6月17日
所述菌株于下述条件下保藏:确保在本专利申请未决期间,由外国专利法律决定授权的人能够获得所述培养物。所述保藏物为所保藏菌株的基本上纯的培养物。在提交了题述申请的副本或其后续文本的国家,依据该外国专利法律的要求,可以获得所述保藏物。然而,应当理解,保藏物的获得并不构成对实施题述发明的许可,实施题述发明是对政府行为所授予的专利权的侵犯。
本发明可进一步通过下述编号段落描述:
[1]一种具有C4-二羧酸转运蛋白活性的分离的多肽,其选自:
(a)多肽,其与SEQIDNO:2、4或6,或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:1、3或5,其成熟多肽编码序列,或前述序列的全长互补链;
(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1、3或5,其成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(d)SEQIDNO:2、4或6或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体;和
(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段。
[2]一种具有C4-二羧酸转运蛋白活性的分离的多肽,其选自:
(a)多肽,其与SEQIDNO:2或其成熟多肽序列具有至少75%,例如至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:1,其成熟多肽编码序列,或前述序列的全长互补链;
(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1或其成熟多肽编码序列具有至少75%,例如至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(d)SEQIDNO:2或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体;和
(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段。
[3]一种具有C4-二羧酸转运蛋白活性的分离的多肽,其选自:
(a)多肽,其与SEQIDNO:4或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:3,其成熟多肽编码序列,或前述序列的全长互补链;
(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:3或其成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(d)SEQIDNO:4或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体;和
(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段。
[4]一种具有C4-二羧酸转运蛋白活性的分离的多肽,其选自:
(a)多肽,其与SEQIDNO:6或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:5,其成熟多肽编码序列,或前述序列的全长互补链;
(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:5或其成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(d)SEQIDNO:6或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体;和
(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段。
[5]段[1]-[4]任一项的多肽,其与SEQIDNO:2、4或6,或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性。
[6]段[1]-[5]任一项的多肽,其由多核苷酸编码,所述多核苷酸在低严格条件,低-中等严格条件,中等严格条件,中等-高严格条件,高严格条件下,或非常高严格条件与以下杂交:SEQIDNO:1、3或5,其成熟多肽编码序列,或前述序列的全长互补链。
[7]段[1]-[6]任一项的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1、3或5,或其成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性。
[8]段[1]-[7]任一项的多肽,其包含或组成为SEQIDNO:2、4或6。
[9]段[1]-[7]任一项的多肽,其包含或组成为SEQIDNO:2、4或6的成熟多肽序列。
[10]段[9]的多肽,其中所述SEQIDNO:2的成熟多肽是SEQIDNO:2的氨基酸62至397或69至397。
[11]段[9]的多肽,其中所述SEQIDNO:4的成熟多肽是SEQIDNO:4的氨基酸18至418。
[12]段[9]的多肽,其中所述SEQIDNO:6的成熟多肽是SEQIDNO:6的氨基酸69至397。
[13]段[1]-[7]任一项的多肽,其为SEQIDNO:2、4或6的片段,其中所述片段具有C4-二羧酸转运蛋白活性。
[14]段[1]-[7]任一项的多肽,其为SEQIDNO:2、4或6或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体。
[15]段[1]-[13]任一项的多肽,其由大肠杆菌NRRLB-50400中包含的质粒pAaC4T737中包含的多核苷酸编码。
[16]段[1]-[13]任一项的多肽,其由大肠杆菌NRRLB-50388中包含的质粒pAaC4t521中包含的多核苷酸编码。
[17]段[1]-[13]任一项的多肽,其由大肠杆菌NRRLB-50401中包含的质粒pAaMAT737中包含的多核苷酸编码。
[18]一种组合物,其包含段[1]-[17]任一项的多肽。
[19]一种分离的多核苷酸,其编码段[1]-[17]任一项的多肽。
[20]一种核酸构建体或表达载体,其包含段[19]的多核苷酸,所述多核苷酸可操作地连接于一个或多个(例如两个、几个)调控序列,所述调控序列指导所述多肽在表达宿主中的产生。
[21]一种重组宿主细胞,其包含段[19]的多核苷酸,所述多个核酸可操作地连接于一个或多个调控序列,所述调控序列指导所述多肽的产生。
[22]一种产生段[1]-[17]任一项的多肽的方法,其包括:
(a)在有助于所述多肽产生的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和
(b)回收所述多肽。
[23]一种产生段[1]-[17]任一项的多肽的方法,其包括:
(a)在有助于产生所述多肽的条件下培养段[21]的重组宿主细胞;和
(b)回收所述多肽。
[24]一种转基因植物、植物部分或植物细胞,其用编码段[1]-[17]任一项的多肽的多核苷酸转化。
[25]一种产生段[1]-[17]任一项的多肽的方法,其包括:
(a)在有助于产生所述多肽的条件下培养段[24]的转基因植物或植物细胞;和
(b)回收所述多肽。
[26]一种产生亲本细胞的突变体的方法,其包括使编码段[1]-[17]任一项的多肽的多核苷酸失活,这导致突变体与亲本细胞相比产生较少的所述多肽。
[27]一种通过段[26]的方法产生的突变细胞。
[28]段[27]的突变细胞,其进一步包含编码天然或异源蛋白的基因。
[29]一种产生蛋白的方法,其包括:
(a)在有助于产生所述蛋白的条件下培养段[27]或[28]的突变细胞;和
(b)回收所述蛋白。
[30]一种双链抑制性RNA(dsRNA)分子,其包含段[19]的多核苷酸的亚序列,其中所述dsRNA任选地是siRNA或miRNA分子。
[31]段[30]的双链抑制性RNA(dsRNA)分子,其长度为约15、16、17、18、19、20、21、22、23、24、25或更多个双链体核苷酸。
[32]一种抑制细胞中具有C4-二羧酸转运蛋白活性的多肽的表达的方法,其包括对细胞施用或在细胞中表达段[30]或[31]的双链RNA(dsRNA)分子。
[33]一种由段[31]或[32]的方法产生的细胞。
[34]段[33]的细胞,其进一步包含编码天然或异源蛋白的基因。
[35]一种产生蛋白的方法,其包括:
(a)在有助于产生所述蛋白的条件下培养段[33]或[34]的突变细胞;和
(b)回收所述蛋白。
[36]一种分离的多核苷酸,其编码信号肽,所述信号肽包含或组成为SEQIDNO:2的氨基酸1至61或1至68。
[37]一种分离的多核苷酸,其编码信号肽,所述信号肽包含或组成为SEQIDNO:4的氨基酸1至17。
[38]一种分离的多核苷酸,其编码信号肽,所述信号肽包含或组成为SEQIDNO:6的氨基酸1至68。
[39]一种核酸构建体或表达载体,其包含编码蛋白的基因,所述基因可操作地连接于段[36]-[38]任一项的多核苷酸,其中所述基因对于编码所述信号肽的多核苷酸是外源的。
[40]一种重组宿主细胞,其包含段[39]的核酸构建体或表达载体。
[41]一种产生蛋白的方法,其包括:
(a)在有助于产生所述蛋白的条件下培养段[40]的重组宿主细胞;和
(b)回收所述蛋白。
[42]一种产生C4-二羧酸的方法,其包括:
(a)在培养基中培养宿主细胞,其包含编码段[1]-[17]任一项的多肽的异源多核苷酸;和
(b)回收所述C4-二羧酸。
[43]一种增加C4-二羧酸产生的方法,其包括:
(a)将编码段[1]-[17]任一项的多肽的异源多核苷酸转化入宿主细胞;
(b)在培养基中培养经转化的生物体;和
(c)回收所述C4-二羧酸。
[44]段[42]或[43]的方法,其中所述异源多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。
[45]段[42]-[44]任一项的方法,其中所述宿主细胞进一步包含异源第二多核苷酸,所述多核苷酸编码苹果酸脱氢酶(例如,SEQIDNO:11的成熟多肽编码序列,或其任何所述的方面)。
[46]段[45]的方法,其中所述异源第二多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。
[47]段[42]-[46]任一项的方法,其中所述宿主细胞进一步包含异源第三多核苷酸,所述多核苷酸编码丙酮酸羧化酶(例如,SEQIDNO:15的成熟多肽编码序列,或其任何所述的方面)。
[48]段[47]的方法,其中所述异源第三多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。
[49]段[42]-[48]任一项的方法,其中所述宿主细胞是丝状真菌宿主细胞。
[50]段[49]的方法,其中所述丝状真菌宿主细胞选自:枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)和木霉属(Trichoderma)。
[51]段[50]的方法,其中所述宿主细胞是曲霉属宿主细胞。
[52]段[50]的方法,其中所述宿主细胞是米曲霉宿主细胞。
[53]段[42]-[52]任一项的方法,其中所述培养基是可发酵培养基。
[54]段[42]-[53]任一项的方法,其中所述C4-二羧酸为大于约10g/L,例如,大于约25g/L,50g/L,75g/L,100g/L,125g/L,150g/L,160g/L,170g/L,180g/L,190g/L,200g/L,210g/L,225g/L,250g/L,275g/L,300g/L,325g/L,350g/L,400g/L,或500g/L;或约10g/L至约500g/L,例如,约50g/L至约350g/L,约100g/L至约300g/L,约150g/L至约250g/L,约175g/L至约225g/L,或约190g/L至约210g/L的效价。
[55]段[42]-[54]任一项的方法,其中C4-二羧酸的水平与不包含编码C4-二羧酸转运蛋白的多核苷酸的宿主细胞相比,在相同条件下培养时增加至少25%,例如至少50%,至少100%,至少150%,至少200%,至少300%,或至少500%。
[56]段[42]-[55]任一项的方法,其中所述C4-二羧酸选自苹果酸、琥珀酸、草酰乙酸、丙二酸和延胡索酸。
[57]段[56]的方法,其中所述C4-二羧酸是苹果酸。
[58]一种宿主细胞,其包含编码段[1]-[17]任一项的多肽的异源多核苷酸;其中所述宿主细胞与不包含编码所述异源多核苷酸的宿主细胞相比,在相同条件下培养时,能够分泌增加水平的C4-二羧酸。
[59]段[58]的宿主细胞,其中所述异源多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。
[60]段[57]或[58]的宿主细胞,其中所述宿主细胞进一步包含异源第二多核苷酸,所述多核苷酸编码苹果酸脱氢酶(例如,SEQIDNO:11的成熟多肽编码序列,或其任何所述的方面)。
[61]段[60]的宿主细胞,其中所述异源第二多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。
[62]段[58]-[61]任一项的宿主细胞,其中所述宿主细胞进一步包含异源第三多核苷酸,所述多核苷酸编码丙酮酸羧化酶(例如,SEQIDNO:15的成熟多肽编码序列,或其任何所述的方面)。
[62]段[62]的宿主细胞,其中所述异源第三多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。
[63]段[58]-[62]任一项的宿主细胞,其中所述宿主细胞是丝状真菌宿主细胞。
[64]段[63]的丝状真菌宿主细胞,其中宿主细胞选自:枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、根霉属、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属和木霉属细胞。
[65]段[64]的丝状真菌宿主细胞,其中所述宿主细胞是曲霉属宿主细胞。
[66]段[65]的丝状真菌宿主细胞,其中所述宿主细胞是米曲霉宿主细胞。
[67]段[58]-[66]任一项的宿主细胞,其中所述细胞能够具有大于约0.1g/L每小时,例如,大于约0.2g/L每小时,0.5g/L每小时,0.6g/L每小时,0.7g/L每小时,0.8g/L每小时,0.9g/L每小时,1.0g/L每小时,1.1g/L每小时,1.2g/L每小时,1.3g/L每小时,1.5g/L每小时,1.75g/L每小时,2.0g/L每小时,2.25g/L每小时,2.5g/L每小时,或3.0g/L每小时;或约0.1g/L每小时至约2.0g/L每小时,例如,约0.3g/L每小时至约1.7g/L每小时,约0.5g/L每小时至约1.5g/L每小时,约0.7g/L每小时至约1.3g/L每小时,约0.8g/L每小时至约1.2g/L每小时,或约0.9g/L每小时至约1.1g/L每小时的C4-二羧酸体积产量/体积生产力。
[68]段[58]-[67]任一项的宿主细胞,其中所述宿主细胞与不包含编码所述异源第一多核苷酸的宿主细胞相比,在相同条件下培养时能够分泌增加至少25%,例如至少50%,至少100%,至少150%,至少200%,至少300%,或至少500%的水平的C4-二羧酸。
[69]段[58]-[68]任一项的宿主细胞,其中所述C4-二羧酸选自苹果酸、琥珀酸、草酰乙酸、丙二酸和延胡索酸。
[70]段[69]的宿主细胞,其中所述C4-二羧酸是苹果酸。
本文描述和要求保护的本发明并不局限于本文公开的具体方面的范围内,因为这些方面旨在作为本发明几个方面的说明。旨在将任何等同的方面包含于本发明的范围内。实际上,从前面的说明中,除本文所显示和描述的之外,本发明的多种修改对于本领域的技术人员来说是显而易见的。这些修改也旨在落入所附的权利要求的范围内。在冲突的情况下,将以包括定义部分的本公开为准。
Claims (18)
1.一种具有C4-二羧酸转运蛋白活性的分离的多肽,其为SEQIDNO:4或SEQIDNO:4的氨基酸18至418。
2.权利要求1的多肽,其中所述多肽由大肠杆菌NRRLB-50388中包含的质粒pAaC4t521中包含的多核苷酸编码。
3.权利要求1或2的多肽,其中所述多肽是曲霉属(Aspergillus)多肽。
4.权利要求3的多肽,其中所述多肽是棘孢曲霉(Aspergillusaculeatus)多肽。
5.一种组合物,其包含权利要求1-4任一项的多肽。
6.一种分离的多核苷酸,其编码权利要求1-4任一项的多肽。
7.一种核酸构建体或表达载体,其包含权利要求6的多核苷酸可操作地连接于一个或多个调控序列,所述调控序列指导所述多肽在表达宿主中的产生。
8.一种重组宿主细胞,其包含权利要求6的多核苷酸,所述多核苷酸可操作地连接于一个或多个调控序列,所述调控序列指导所述多肽的产生。
9.一种宿主细胞,其包含编码C4-二羧酸转运蛋白的异源多核苷酸;其中所述异源多核苷酸:
(a)编码C4-二羧酸转运蛋白,所述转运蛋白由SEQIDNO:4的序列,或SEQIDNO:4的氨基酸18-418组成;或
(b)为SEQIDNO:3或SEQIDNO:3的核苷酸52-1257;
其中所述宿主细胞与不包含所述异源多核苷酸的宿主细胞相比,在相同条件下培养时,能够产生更大量的C4-二羧酸。
10.权利要求9的宿主细胞,其中所述异源多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。
11.权利要求9或10的宿主细胞,其中所述宿主细胞进一步包含异源第二多核苷酸,所述多核苷酸编码苹果酸脱氢酶。
12.权利要求9或10的宿主细胞,其中所述宿主细胞进一步包含异源第三多核苷酸,所述多核苷酸编码丙酮酸羧化酶。
13.权利要求9或10的宿主细胞,其中所述宿主细胞是丝状真菌宿主细胞。
14.权利要求13的丝状真菌宿主细胞,其中所述宿主细胞是曲霉属宿主细胞。
15.权利要求13的丝状真菌宿主细胞,其中所述宿主细胞是米曲霉宿主细胞。
16.权利要求9或10的宿主细胞,其中所述C4-二羧酸是苹果酸。
17.一种产生C4-二羧酸的方法,其包括:
(a)在培养基中在合适的条件下培养权利要求9-16任一项的宿主细胞以产生C4-二羧酸;和
(b)回收所述C4-二羧酸。
18.一种增加C4-二羧酸产生的方法,其包括:
(a)将编码权利要求1-4任一项的多肽的异源多核苷酸转化入宿主细胞;
(b)在培养基中在合适的条件下培养经转化的宿主细胞以产生C4-二羧酸;和
(c)回收所述C4-二羧酸。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US35686810P | 2010-06-21 | 2010-06-21 | |
US61/356,868 | 2010-06-21 | ||
PCT/US2011/041300 WO2011163269A1 (en) | 2010-06-21 | 2011-06-21 | Aspergillus aculeatus derived polypeptides having c4-dicarboxylic acid transporter activity and polynucleotides encoding same |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103080126A CN103080126A (zh) | 2013-05-01 |
CN103080126B true CN103080126B (zh) | 2016-05-11 |
Family
ID=44314352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180040520.XA Active CN103080126B (zh) | 2010-06-21 | 2011-06-21 | 具有c4-二羧酸转运蛋白活性的多肽和编码该多肽的多核苷酸 |
Country Status (12)
Country | Link |
---|---|
US (3) | US8158395B2 (zh) |
EP (2) | EP2769985B1 (zh) |
JP (1) | JP5912111B2 (zh) |
KR (1) | KR20130113937A (zh) |
CN (1) | CN103080126B (zh) |
AU (1) | AU2011271094B2 (zh) |
BR (1) | BR112012029891A2 (zh) |
CA (1) | CA2803343C (zh) |
DK (1) | DK2769985T3 (zh) |
MX (1) | MX2012014627A (zh) |
WO (1) | WO2011163269A1 (zh) |
ZA (1) | ZA201209441B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102597224B (zh) * | 2009-09-01 | 2015-07-15 | 诺维信股份有限公司 | 用于在丝状真菌中改善苹果酸产生的方法 |
CN106148208B (zh) * | 2015-03-23 | 2020-12-18 | 中国科学院天津工业生物技术研究所 | 新的二元有机酸生产菌株及其制备和应用 |
CN106148209B (zh) * | 2015-03-23 | 2020-11-20 | 中国科学院天津工业生物技术研究所 | 新的二元有机酸生产菌株及其制备和应用 |
CN109415720B (zh) * | 2016-06-29 | 2021-11-26 | 花王株式会社 | C4二羧酸的制造方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008144626A1 (en) * | 2007-05-18 | 2008-11-27 | Microbia Precision Engineering, Inc. | Malic acid production in recombinant yeast |
WO2009011974A1 (en) * | 2007-05-18 | 2009-01-22 | Microbia Precision Engineering, Inc. | Organic acid production by fungal cells |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1047002A (en) | 1911-04-03 | 1912-12-10 | James S Diehl | Scissors. |
US3063910A (en) | 1960-02-03 | 1962-11-13 | Kyowa Hakko Kogyo Kk | Method of producing l-malic acid by fermentation |
DK122686D0 (da) | 1986-03-17 | 1986-03-17 | Novo Industri As | Fremstilling af proteiner |
US5536661A (en) | 1987-03-10 | 1996-07-16 | Novo Nordisk A/S | Process for the production of protein products in aspergillus |
US5223409A (en) | 1988-09-02 | 1993-06-29 | Protein Engineering Corp. | Directed evolution of novel binding proteins |
IL97645A (en) | 1990-03-23 | 1997-03-18 | Gist Brocades Nv | Production of enzymes in seeds and their use |
US6395966B1 (en) | 1990-08-09 | 2002-05-28 | Dekalb Genetics Corp. | Fertile transgenic maize plants containing a gene encoding the pat protein |
IL99552A0 (en) | 1990-09-28 | 1992-08-18 | Ixsys Inc | Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof |
DE4343591A1 (de) | 1993-12-21 | 1995-06-22 | Evotec Biosystems Gmbh | Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
MX9606013A (es) | 1994-06-03 | 1997-12-31 | Novo Nordisk Biotech Inc | Lacasas purificadas de myceliophthora y acidos nucleicos que codifican para las mismas. |
EP0777737B1 (en) | 1994-06-30 | 2005-05-04 | Novozymes Biotech, Inc. | Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein |
US5766439A (en) | 1996-10-10 | 1998-06-16 | A. E. Staley Manufacturing Co. | Production and recovery of organic acids |
US6506559B1 (en) | 1997-12-23 | 2003-01-14 | Carnegie Institute Of Washington | Genetic inhibition by double-stranded RNA |
US7504490B1 (en) | 1998-10-16 | 2009-03-17 | Oscient Pharmaceuticals Corporation | Nucleic acid and amino acid sequences relating to Apergillus fumigatus for diagnostics and therapeutics |
ATE332968T1 (de) | 1998-10-26 | 2006-08-15 | Novozymes As | Erstellung und durchmusterung von interessierenden dna-banken in zellen von filamentösen pilzen |
US6511824B1 (en) | 1999-03-17 | 2003-01-28 | Exelixis, Inc. | Nucleic acids and polypeptides of invertebrate TWIK channels and methods of use |
EP2278016B1 (en) | 1999-03-22 | 2012-09-26 | Novozymes Inc. | Promoter sequences derived from Fusarium Venenatum and uses thereof |
US6531644B1 (en) | 2000-01-14 | 2003-03-11 | Exelixis, Inc. | Methods for identifying anti-cancer drug targets |
AU1166502A (en) | 2000-10-12 | 2002-04-22 | Exelixis Inc | Human ect2 and methods of use |
US7151204B2 (en) | 2001-01-09 | 2006-12-19 | Monsanto Technology Llc | Maize chloroplast aldolase promoter compositions and methods for use thereof |
MX306561B (es) | 2004-01-29 | 2013-01-09 | Zeachem Inc | Recuperacion de acidos organicos. |
US20080090273A1 (en) | 2005-11-21 | 2008-04-17 | Aaron Adriaan Winkler | Malic Acid Production in Recombinant Yeast |
US9340804B2 (en) | 2007-11-20 | 2016-05-17 | Dsm Ip Assets B.V. | Dicarboxylic acid production in eukaryotes |
WO2009155382A1 (en) | 2008-06-17 | 2009-12-23 | Genomatica, Inc. | Microorganisms and methods for the biosynthesis of fumarate, malate, and acrylate |
CA2730595C (en) | 2008-07-08 | 2014-12-16 | Dsm Ip Assets B.V. | Low ph dicarboxylic acid production |
WO2010111344A2 (en) | 2009-03-24 | 2010-09-30 | Microbia, Inc. | Methods and microorganisms for production of c4-dicarboxylic acids |
JP2012223091A (ja) | 2009-08-25 | 2012-11-15 | Ajinomoto Co Inc | L−アミノ酸の製造法 |
CN102597224B (zh) | 2009-09-01 | 2015-07-15 | 诺维信股份有限公司 | 用于在丝状真菌中改善苹果酸产生的方法 |
EP3222716B1 (en) | 2009-11-06 | 2020-08-19 | Novozymes, Inc. | Composition for saccharification of cellulosic material |
WO2011066304A2 (en) | 2009-11-25 | 2011-06-03 | Codexis, Inc. | Engineered beta-class carbonic anhydrase polypeptides and uses thereof |
-
2011
- 2011-06-21 DK DK14162246.4T patent/DK2769985T3/da active
- 2011-06-21 EP EP14162246.4A patent/EP2769985B1/en not_active Not-in-force
- 2011-06-21 WO PCT/US2011/041300 patent/WO2011163269A1/en active Application Filing
- 2011-06-21 BR BR112012029891A patent/BR112012029891A2/pt not_active Application Discontinuation
- 2011-06-21 EP EP11728506.4A patent/EP2582716A1/en not_active Withdrawn
- 2011-06-21 CN CN201180040520.XA patent/CN103080126B/zh active Active
- 2011-06-21 US US13/165,696 patent/US8158395B2/en not_active Expired - Fee Related
- 2011-06-21 CA CA2803343A patent/CA2803343C/en not_active Expired - Fee Related
- 2011-06-21 JP JP2013516699A patent/JP5912111B2/ja active Active
- 2011-06-21 AU AU2011271094A patent/AU2011271094B2/en not_active Ceased
- 2011-06-21 MX MX2012014627A patent/MX2012014627A/es active IP Right Grant
- 2011-06-21 KR KR1020127032159A patent/KR20130113937A/ko not_active Application Discontinuation
-
2012
- 2012-02-24 US US13/404,258 patent/US8518676B2/en not_active Expired - Fee Related
- 2012-12-12 ZA ZA2012/09441A patent/ZA201209441B/en unknown
-
2013
- 2013-07-23 US US13/948,945 patent/US9303275B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008144626A1 (en) * | 2007-05-18 | 2008-11-27 | Microbia Precision Engineering, Inc. | Malic acid production in recombinant yeast |
WO2009011974A1 (en) * | 2007-05-18 | 2009-01-22 | Microbia Precision Engineering, Inc. | Organic acid production by fungal cells |
Non-Patent Citations (3)
Title |
---|
Aspergillus oryzae RIB40 hypothetical protein partial mRNA;Machida M et al.;《GenBank》;20080411;全文 * |
C4-dicarboxylate transporter/malic acid transport protein [Aspergillus oryzae RIB40];Machida M et al.;《GenBank》;20080411;全文 * |
Malic Acid Production by Saccharomyces cerevisiae: Engineering of Pyruvate Carboxylation,Oxaloacetate Reduction,and Malate Export;Rintze M.Zelle et al.;《Appl Environ Microbiol》;20080314;第74卷(第9期);摘要 * |
Also Published As
Publication number | Publication date |
---|---|
US20130302865A1 (en) | 2013-11-14 |
US8158395B2 (en) | 2012-04-17 |
AU2011271094A1 (en) | 2012-11-29 |
CA2803343C (en) | 2018-08-07 |
JP5912111B2 (ja) | 2016-04-27 |
EP2582716A1 (en) | 2013-04-24 |
CN103080126A (zh) | 2013-05-01 |
EP2769985A1 (en) | 2014-08-27 |
KR20130113937A (ko) | 2013-10-16 |
AU2011271094B2 (en) | 2015-01-22 |
EP2769985B1 (en) | 2017-12-06 |
US20110312047A1 (en) | 2011-12-22 |
US20120149079A1 (en) | 2012-06-14 |
JP2013534825A (ja) | 2013-09-09 |
ZA201209441B (en) | 2013-08-28 |
CA2803343A1 (en) | 2011-12-29 |
MX2012014627A (es) | 2013-02-21 |
BR112012029891A2 (pt) | 2021-07-06 |
US8518676B2 (en) | 2013-08-27 |
WO2011163269A1 (en) | 2011-12-29 |
DK2769985T3 (da) | 2018-01-29 |
US9303275B2 (en) | 2016-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101903518B (zh) | 具有乙酰木聚糖酯酶活性的多肽和编码该多肽的多核苷酸 | |
CN102947458B (zh) | 用于丝状真菌中c4-二羧酸的改善的产生的方法 | |
CN101909461B (zh) | 具有乙酰木聚糖酯酶活性的多肽和编码该多肽的多核苷酸 | |
CN102027004A (zh) | 具有α-淀粉酶活性的多肽和编码该多肽的多核苷酸 | |
CN102869771A (zh) | 具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸 | |
CN101939420A (zh) | 具有阿魏酸酯酶活性的多肽和编码该多肽的多核苷酸 | |
CN104169417A (zh) | 具有葡糖淀粉酶活性的多肽及其编码多核苷酸 | |
CN102869770B (zh) | 具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸 | |
CN103917649A (zh) | 用于生产c4-二羧酸的重组微生物 | |
CN103857791B (zh) | 脱氢酶变体和编码它们的多核苷酸 | |
CN103492551A (zh) | 用于生产c4-二羧酸的微生物 | |
CN103080126B (zh) | 具有c4-二羧酸转运蛋白活性的多肽和编码该多肽的多核苷酸 | |
CN103003298B (zh) | 在丝状真菌中产生c4二羧酸 | |
CN104640874A (zh) | 具有纤维素分解增强活性的多肽以及对其进行编码的多核苷酸 | |
CN102933596B (zh) | 具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸 | |
CN103282376A (zh) | 具有琥珀酰CoA:乙酰乙酸转移酶活性的多肽及其编码多核苷酸 | |
AU2015202004A1 (en) | Aspergillus aculeatus derived polypeptides having C4-dicarboxylic acid transporter activity and polynucleotides encoding same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |