EA046005B1 - A NEW MAIN FACTOR SUPERFAMILY (MFS) PROTEIN (Fred) IN THE PRODUCTION OF OGM - Google Patents
A NEW MAIN FACTOR SUPERFAMILY (MFS) PROTEIN (Fred) IN THE PRODUCTION OF OGM Download PDFInfo
- Publication number
- EA046005B1 EA046005B1 EA202292161 EA046005B1 EA 046005 B1 EA046005 B1 EA 046005B1 EA 202292161 EA202292161 EA 202292161 EA 046005 B1 EA046005 B1 EA 046005B1
- Authority
- EA
- Eurasian Patent Office
- Prior art keywords
- genetically modified
- gene
- ogm
- pglpf
- mfs
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims description 145
- 102000004169 proteins and genes Human genes 0.000 title claims description 41
- 238000004519 manufacturing process Methods 0.000 title description 69
- 150000007523 nucleic acids Chemical group 0.000 claims description 96
- 230000014509 gene expression Effects 0.000 claims description 60
- 108010078791 Carrier Proteins Proteins 0.000 claims description 59
- SNFSYLYCDAVZGP-OLAZETNGSA-N 2'-fucosyllactose Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)O[C@H](CO)[C@H](O)[C@@H]1O SNFSYLYCDAVZGP-OLAZETNGSA-N 0.000 claims description 58
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 58
- SNFSYLYCDAVZGP-UHFFFAOYSA-N UNPD26986 Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(OC(O)C(O)C2O)CO)OC(CO)C(O)C1O SNFSYLYCDAVZGP-UHFFFAOYSA-N 0.000 claims description 58
- 108020004707 nucleic acids Proteins 0.000 claims description 54
- 102000039446 nucleic acids Human genes 0.000 claims description 54
- 241000588724 Escherichia coli Species 0.000 claims description 50
- WJPIUUDKRHCAEL-UHFFFAOYSA-N 3FL Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(CO)OC(O)C1O WJPIUUDKRHCAEL-UHFFFAOYSA-N 0.000 claims description 47
- 150000002482 oligosaccharides Chemical class 0.000 claims description 47
- 229920001542 oligosaccharide Polymers 0.000 claims description 45
- 238000000034 method Methods 0.000 claims description 40
- LKOHREGGXUJGKC-UHFFFAOYSA-N Lactodifucotetraose Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)OC2CO)OC2C(C(O)C(O)C(C)O2)O)OC(CO)C(O)C1O LKOHREGGXUJGKC-UHFFFAOYSA-N 0.000 claims description 34
- LKOHREGGXUJGKC-GXSKDVPZSA-N alpha-L-Fucp-(1->3)-[alpha-L-Fucp-(1->2)-beta-D-Galp-(1->4)]-beta-D-Glcp Chemical compound C[C@@H]1O[C@@H](O[C@@H]2[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]2O[C@@H]2[C@@H](CO)O[C@@H](O)[C@H](O)[C@H]2O[C@@H]2O[C@@H](C)[C@@H](O)[C@@H](O)[C@@H]2O)[C@@H](O)[C@H](O)[C@@H]1O LKOHREGGXUJGKC-GXSKDVPZSA-N 0.000 claims description 34
- IEQCXFNWPAHHQR-UHFFFAOYSA-N lacto-N-neotetraose Natural products OCC1OC(OC2C(C(OC3C(OC(O)C(O)C3O)CO)OC(CO)C2O)O)C(NC(=O)C)C(O)C1OC1OC(CO)C(O)C(O)C1O IEQCXFNWPAHHQR-UHFFFAOYSA-N 0.000 claims description 34
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 33
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 29
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 29
- 229920001184 polypeptide Polymers 0.000 claims description 28
- 230000001105 regulatory effect Effects 0.000 claims description 25
- 108700023372 Glycosyltransferases Proteins 0.000 claims description 24
- 235000020256 human milk Nutrition 0.000 claims description 23
- 210000004251 human milk Anatomy 0.000 claims description 21
- 108010001671 galactoside 3-fucosyltransferase Proteins 0.000 claims description 20
- 102000004190 Enzymes Human genes 0.000 claims description 18
- 108090000790 Enzymes Proteins 0.000 claims description 18
- 230000000694 effects Effects 0.000 claims description 18
- 230000001580 bacterial effect Effects 0.000 claims description 16
- 102000051366 Glycosyltransferases Human genes 0.000 claims description 13
- 101000896564 Homo sapiens Glycoprotein-N-acetylgalactosamine 3-beta-galactosyltransferase 1 Proteins 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 12
- 102100021700 Glycoprotein-N-acetylgalactosamine 3-beta-galactosyltransferase 1 Human genes 0.000 claims description 10
- -1 α-1 Proteins 0.000 claims description 10
- 229940062827 2'-fucosyllactose Drugs 0.000 claims description 9
- HWHQUWQCBPAQQH-UHFFFAOYSA-N 2-O-alpha-L-Fucosyl-lactose Natural products OC1C(O)C(O)C(C)OC1OC1C(O)C(O)C(CO)OC1OC(C(O)CO)C(O)C(O)C=O HWHQUWQCBPAQQH-UHFFFAOYSA-N 0.000 claims description 9
- 108010083651 3-galactosyl-N-acetylglucosaminide 4-alpha-L-fucosyltransferase Proteins 0.000 claims description 8
- 101100212709 Bacillus subtilis (strain 168) yabM gene Proteins 0.000 claims description 6
- 101100256741 Escherichia coli (strain K12) setA gene Proteins 0.000 claims description 6
- 239000006228 supernatant Substances 0.000 claims description 6
- 108010046068 N-Acetyllactosamine Synthase Proteins 0.000 claims description 5
- 241001148127 Yersinia frederiksenii Species 0.000 claims description 4
- 241001327829 Erwinia pyrifoliae Species 0.000 claims description 2
- 241000494079 Rosenbergiella nectarea Species 0.000 claims description 2
- 241001295614 Rouxiella badensis Species 0.000 claims description 2
- 241000607715 Serratia marcescens Species 0.000 claims description 2
- 101710161145 Sugar efflux transporter Proteins 0.000 claims description 2
- 241000607475 Yersinia bercovieri Species 0.000 claims description 2
- 238000004113 cell culture Methods 0.000 claims description 2
- IEQCXFNWPAHHQR-YKLSGRGUSA-N beta-D-Gal-(1->4)-beta-D-GlcNAc-(1->3)-beta-D-Gal-(1->4)-D-Glc Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)O[C@@H]1[C@H]([C@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)O[C@H](CO)[C@@H]1O)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O IEQCXFNWPAHHQR-YKLSGRGUSA-N 0.000 claims 3
- 239000011248 coating agent Substances 0.000 claims 1
- 238000000576 coating method Methods 0.000 claims 1
- 238000012216 screening Methods 0.000 claims 1
- 210000004027 cell Anatomy 0.000 description 198
- 101000877889 Pseudomonas putida Flavin reductase Proteins 0.000 description 75
- AXQLFFDZXPOFPO-UHFFFAOYSA-N UNPD216 Natural products O1C(CO)C(O)C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(=O)C)C1OC(C1O)C(O)C(CO)OC1OC1C(O)C(O)C(O)OC1CO AXQLFFDZXPOFPO-UHFFFAOYSA-N 0.000 description 51
- AXQLFFDZXPOFPO-UNTPKZLMSA-N beta-D-Galp-(1->3)-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-beta-D-Glcp Chemical compound O([C@@H]1O[C@H](CO)[C@H](O)[C@@H]([C@H]1O)O[C@H]1[C@@H]([C@H]([C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O1)O)NC(=O)C)[C@H]1[C@H](O)[C@@H](O)[C@H](O)O[C@@H]1CO AXQLFFDZXPOFPO-UNTPKZLMSA-N 0.000 description 51
- USIPEGYTBGEPJN-UHFFFAOYSA-N lacto-N-tetraose Natural products O1C(CO)C(O)C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(=O)C)C1OC1C(O)C(CO)OC(OC(C(O)CO)C(O)C(O)C=O)C1O USIPEGYTBGEPJN-UHFFFAOYSA-N 0.000 description 51
- 108020004414 DNA Proteins 0.000 description 43
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 42
- AUNPEJDACLEKSC-ZAYDSPBTSA-N 3-fucosyllactose Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)O[C@H](CO)[C@@H]1O AUNPEJDACLEKSC-ZAYDSPBTSA-N 0.000 description 40
- 239000000047 product Substances 0.000 description 40
- 235000018102 proteins Nutrition 0.000 description 38
- 108050004064 Major facilitator superfamily Proteins 0.000 description 35
- 239000013612 plasmid Substances 0.000 description 34
- 102000015841 Major facilitator superfamily Human genes 0.000 description 33
- 229940062780 lacto-n-neotetraose Drugs 0.000 description 31
- RBMYDHMFFAVMMM-PLQWBNBWSA-N neolactotetraose Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)O[C@@H]1[C@H]([C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]1O)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O RBMYDHMFFAVMMM-PLQWBNBWSA-N 0.000 description 31
- FZIVHOUANIQOMU-YIHIYSSUSA-N alpha-L-Fucp-(1->2)-beta-D-Galp-(1->3)-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H]([C@H](O[C@@H]4[C@H](OC(O)[C@H](O)[C@H]4O)CO)O[C@H](CO)[C@@H]3O)O)O[C@H](CO)[C@H]2O)NC(C)=O)O[C@H](CO)[C@H](O)[C@@H]1O FZIVHOUANIQOMU-YIHIYSSUSA-N 0.000 description 29
- FZIVHOUANIQOMU-UHFFFAOYSA-N lacto-N-fucopentaose I Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(OC3C(C(OC4C(OC(O)C(O)C4O)CO)OC(CO)C3O)O)OC(CO)C2O)NC(C)=O)OC(CO)C(O)C1O FZIVHOUANIQOMU-UHFFFAOYSA-N 0.000 description 29
- 230000015572 biosynthetic process Effects 0.000 description 26
- 235000000346 sugar Nutrition 0.000 description 25
- DMYPRRDPOMGEAK-XWDFSUOISA-N beta-D-Galp-(1->3)-[alpha-L-Fucp-(1->4)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-[alpha-L-Fucp-(1->3)]-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O[C@H]4[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O4)O)[C@H](O[C@H]4[C@H]([C@H](O)[C@H](O)[C@H](C)O4)O)[C@@H](CO)O3)NC(C)=O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](CO)OC(O)[C@@H]1O DMYPRRDPOMGEAK-XWDFSUOISA-N 0.000 description 24
- DMYPRRDPOMGEAK-UHFFFAOYSA-N lacto-N-difucohexaose II Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(OC3C(C(OC4C(C(O)C(O)C(CO)O4)O)C(OC4C(C(O)C(O)C(C)O4)O)C(CO)O3)NC(C)=O)C(O)C(CO)O2)O)C(CO)OC(O)C1O DMYPRRDPOMGEAK-UHFFFAOYSA-N 0.000 description 24
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 22
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 21
- 238000000855 fermentation Methods 0.000 description 20
- 230000004151 fermentation Effects 0.000 description 20
- 239000006227 byproduct Substances 0.000 description 18
- 239000002609 medium Substances 0.000 description 18
- 241000894006 Bacteria Species 0.000 description 17
- DUKURNFHYQXCJG-JEOLMMCMSA-N alpha-L-Fucp-(1->4)-[beta-D-Galp-(1->3)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](NC(C)=O)[C@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H](OC(O)[C@H](O)[C@H]3O)CO)O[C@H](CO)[C@@H]2O)O)O[C@@H]1CO DUKURNFHYQXCJG-JEOLMMCMSA-N 0.000 description 17
- 239000008103 glucose Substances 0.000 description 17
- FKADDOYBRRMBPP-UHFFFAOYSA-N lacto-N-fucopentaose II Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(C)=O)C(OC2C(C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C2O)O)OC1CO FKADDOYBRRMBPP-UHFFFAOYSA-N 0.000 description 17
- 238000012217 deletion Methods 0.000 description 16
- 230000037430 deletion Effects 0.000 description 16
- 229940088598 enzyme Drugs 0.000 description 16
- 238000003780 insertion Methods 0.000 description 16
- 230000037431 insertion Effects 0.000 description 16
- 238000013518 transcription Methods 0.000 description 15
- 230000035897 transcription Effects 0.000 description 15
- 108091026890 Coding region Proteins 0.000 description 14
- ZDZMLVPSYYRJNI-CYQYEHMMSA-N p-lacto-n-hexaose Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1N=C(C)O)O[C@@H]1[C@@H](O)[C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)OC([C@@H]1O)CO[C@H]1[C@@H]([C@H](C(O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](CO)O1)O)N=C(O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O ZDZMLVPSYYRJNI-CYQYEHMMSA-N 0.000 description 14
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 13
- 230000010354 integration Effects 0.000 description 13
- 102100040837 Galactoside alpha-(1,2)-fucosyltransferase 2 Human genes 0.000 description 12
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 12
- TYALNJQZQRNQNQ-JLYOMPFMSA-N alpha-Neup5Ac-(2->6)-beta-D-Galp-(1->4)-beta-D-Glcp Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)OC[C@@H]1[C@H](O)[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O)O[C@@H]2CO)O)O1 TYALNJQZQRNQNQ-JLYOMPFMSA-N 0.000 description 12
- 230000032258 transport Effects 0.000 description 12
- 238000010521 absorption reaction Methods 0.000 description 11
- 239000012634 fragment Substances 0.000 description 11
- 239000008101 lactose Substances 0.000 description 11
- 239000000203 mixture Substances 0.000 description 11
- 229950006780 n-acetylglucosamine Drugs 0.000 description 11
- 239000002773 nucleotide Substances 0.000 description 11
- 230000001965 increasing effect Effects 0.000 description 10
- 241001646716 Escherichia coli K-12 Species 0.000 description 9
- 108091034117 Oligonucleotide Proteins 0.000 description 9
- 101150045500 galK gene Proteins 0.000 description 9
- 230000007935 neutral effect Effects 0.000 description 9
- 125000003729 nucleotide group Chemical group 0.000 description 9
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 239000002028 Biomass Substances 0.000 description 8
- DUKURNFHYQXCJG-UHFFFAOYSA-N Lewis A pentasaccharide Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(C)=O)C(OC2C(C(OC3C(OC(O)C(O)C3O)CO)OC(CO)C2O)O)OC1CO DUKURNFHYQXCJG-UHFFFAOYSA-N 0.000 description 8
- 102000004357 Transferases Human genes 0.000 description 8
- 108090000992 Transferases Proteins 0.000 description 8
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- DVGKRPYUFRZAQW-UHFFFAOYSA-N 3 prime Natural products CC(=O)NC1OC(CC(O)C1C(O)C(O)CO)(OC2C(O)C(CO)OC(OC3C(O)C(O)C(O)OC3CO)C2O)C(=O)O DVGKRPYUFRZAQW-UHFFFAOYSA-N 0.000 description 7
- 229960000723 ampicillin Drugs 0.000 description 7
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 7
- 229960005091 chloramphenicol Drugs 0.000 description 7
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 7
- 238000010276 construction Methods 0.000 description 7
- 102000045442 glycosyltransferase activity proteins Human genes 0.000 description 7
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 7
- 150000004043 trisaccharides Chemical class 0.000 description 7
- WQZGKKKJIJFFOK-SVZMEOIVSA-N (+)-Galactose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-SVZMEOIVSA-N 0.000 description 6
- OIZGSVFYNBZVIK-FHHHURIISA-N 3'-sialyllactose Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)O[C@@H]1[C@@H](O)[C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]1O OIZGSVFYNBZVIK-FHHHURIISA-N 0.000 description 6
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 6
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 6
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 6
- 150000001720 carbohydrates Chemical class 0.000 description 6
- 239000013611 chromosomal DNA Substances 0.000 description 6
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 238000006911 enzymatic reaction Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 150000004044 tetrasaccharides Chemical class 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 101710098620 Alpha-1,2-fucosyltransferase Proteins 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 5
- 108060003306 Galactosyltransferase Proteins 0.000 description 5
- TVVLIFCVJJSLBL-SEHWTJTBSA-N Lacto-N-fucopentaose V Chemical compound O[C@H]1C(O)C(O)[C@H](C)O[C@H]1OC([C@@H](O)C=O)[C@@H](C(O)CO)O[C@H]1[C@H](O)[C@@H](OC2[C@@H](C(OC3[C@@H](C(O)C(O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](O)[C@@H](CO)O1 TVVLIFCVJJSLBL-SEHWTJTBSA-N 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 235000014633 carbohydrates Nutrition 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 230000002255 enzymatic effect Effects 0.000 description 5
- 235000013305 food Nutrition 0.000 description 5
- 108010079306 galactoside 2-alpha-L-fucosyltransferase Proteins 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 230000006801 homologous recombination Effects 0.000 description 5
- 238000002744 homologous recombination Methods 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 101150076570 nanK gene Proteins 0.000 description 5
- 238000010561 standard procedure Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 229920001817 Agar Polymers 0.000 description 4
- 102100029962 CMP-N-acetylneuraminate-beta-1,4-galactoside alpha-2,3-sialyltransferase Human genes 0.000 description 4
- 101710136075 CMP-N-acetylneuraminate-beta-1,4-galactoside alpha-2,3-sialyltransferase Proteins 0.000 description 4
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 4
- SHZGCJCMOBCMKK-PQMKYFCFSA-N L-Fucose Natural products C[C@H]1O[C@H](O)[C@@H](O)[C@@H](O)[C@@H]1O SHZGCJCMOBCMKK-PQMKYFCFSA-N 0.000 description 4
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 4
- PNNNRSAQSRJVSB-UHFFFAOYSA-N L-rhamnose Natural products CC(O)C(O)C(O)C(O)C=O PNNNRSAQSRJVSB-UHFFFAOYSA-N 0.000 description 4
- 101710119106 N-acetylneuraminate transporter Proteins 0.000 description 4
- 108091092724 Noncoding DNA Proteins 0.000 description 4
- 229910019142 PO4 Inorganic materials 0.000 description 4
- 108020004511 Recombinant DNA Proteins 0.000 description 4
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 4
- LFTYTUAZOPRMMI-CFRASDGPSA-N UDP-N-acetyl-alpha-D-glucosamine Chemical compound O1[C@H](CO)[C@@H](O)[C@H](O)[C@@H](NC(=O)C)[C@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-CFRASDGPSA-N 0.000 description 4
- LFTYTUAZOPRMMI-UHFFFAOYSA-N UNPD164450 Natural products O1C(CO)C(O)C(O)C(NC(=O)C)C1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-UHFFFAOYSA-N 0.000 description 4
- 239000008272 agar Substances 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 108010005774 beta-Galactosidase Proteins 0.000 description 4
- 230000006652 catabolic pathway Effects 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 210000000805 cytoplasm Anatomy 0.000 description 4
- 229930182830 galactose Natural products 0.000 description 4
- 235000003869 genetically modified organism Nutrition 0.000 description 4
- 101150066555 lacZ gene Proteins 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 210000001322 periplasm Anatomy 0.000 description 4
- 239000010452 phosphate Substances 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 150000008163 sugars Chemical class 0.000 description 4
- 229960003495 thiamine Drugs 0.000 description 4
- 239000011721 thiamine Substances 0.000 description 4
- 235000019157 thiamine Nutrition 0.000 description 4
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 4
- TYALNJQZQRNQNQ-UHFFFAOYSA-N #alpha;2,6-sialyllactose Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OCC1C(O)C(O)C(O)C(OC2C(C(O)C(O)OC2CO)O)O1 TYALNJQZQRNQNQ-UHFFFAOYSA-N 0.000 description 3
- TXCIAUNLDRJGJZ-UHFFFAOYSA-N CMP-N-acetyl neuraminic acid Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(N=C(N)C=C2)=O)O1 TXCIAUNLDRJGJZ-UHFFFAOYSA-N 0.000 description 3
- TXCIAUNLDRJGJZ-BILDWYJOSA-N CMP-N-acetyl-beta-neuraminic acid Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@]1(C(O)=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(N=C(N)C=C2)=O)O1 TXCIAUNLDRJGJZ-BILDWYJOSA-N 0.000 description 3
- 241000589875 Campylobacter jejuni Species 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 102000030902 Galactosyltransferase Human genes 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 3
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 3
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 3
- 230000002378 acidificating effect Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 125000002446 fucosyl group Chemical group C1([C@@H](O)[C@H](O)[C@H](O)[C@@H](O1)C)* 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- RJTOFDPWCJDYFZ-UHFFFAOYSA-N lacto-N-triose Natural products CC(=O)NC1C(O)C(O)C(CO)OC1OC1C(O)C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C1O RJTOFDPWCJDYFZ-UHFFFAOYSA-N 0.000 description 3
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 3
- 235000019341 magnesium sulphate Nutrition 0.000 description 3
- 235000013336 milk Nutrition 0.000 description 3
- 239000008267 milk Substances 0.000 description 3
- 210000004080 milk Anatomy 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 150000002772 monosaccharides Chemical group 0.000 description 3
- 230000002018 overexpression Effects 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 125000005630 sialyl group Chemical group 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 239000011573 trace mineral Substances 0.000 description 3
- 235000013619 trace mineral Nutrition 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- CILYIEBUXJIHCO-UHFFFAOYSA-N 102778-91-6 Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OC1C(O)C(OC2C(C(O)C(O)OC2CO)O)OC(CO)C1O CILYIEBUXJIHCO-UHFFFAOYSA-N 0.000 description 2
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 2
- 101100325906 Bacillus subtilis (strain 168) ganA gene Proteins 0.000 description 2
- 241000186000 Bifidobacterium Species 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 241000194033 Enterococcus Species 0.000 description 2
- 101100156625 Escherichia coli (strain K12) wcaJ gene Proteins 0.000 description 2
- 101150102398 Galt gene Proteins 0.000 description 2
- 241001674329 Helicobacter pylori 26695 Species 0.000 description 2
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 101100301239 Myxococcus xanthus recA1 gene Proteins 0.000 description 2
- CILYIEBUXJIHCO-UITFWXMXSA-N N-acetyl-alpha-neuraminyl-(2->3)-beta-D-galactosyl-(1->4)-beta-D-glucose Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)O[C@@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O)O[C@@H]2CO)O)O[C@H](CO)[C@@H]1O CILYIEBUXJIHCO-UITFWXMXSA-N 0.000 description 2
- 108700023220 N-acetylneuraminate lyases Proteins 0.000 description 2
- 102000048245 N-acetylneuraminate lyases Human genes 0.000 description 2
- SQVRNKJHWKZAKO-LUWBGTNYSA-N N-acetylneuraminic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)CC(O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-LUWBGTNYSA-N 0.000 description 2
- OIZGSVFYNBZVIK-UHFFFAOYSA-N N-acetylneuraminosyl-D-lactose Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OC1C(O)C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C1O OIZGSVFYNBZVIK-UHFFFAOYSA-N 0.000 description 2
- 241000588650 Neisseria meningitidis Species 0.000 description 2
- 241000588912 Pantoea agglomerans Species 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 101100111413 Thermoanaerobacter pseudethanolicus (strain ATCC 33223 / 39E) lacZ gene Proteins 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 2
- XHMJOUIAFHJHBW-UKFBFLRUSA-N alpha-D-glucosamine 6-phosphate Chemical compound N[C@H]1[C@@H](O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O XHMJOUIAFHJHBW-UKFBFLRUSA-N 0.000 description 2
- RQNFGIWYOACERD-OCQMRBNYSA-N alpha-L-Fucp-(1->4)-[alpha-L-Fucp-(1->2)-beta-D-Galp-(1->3)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](CO)O[C@@H](O[C@@H]3[C@H]([C@H](O[C@@H]4[C@H](OC(O)[C@H](O)[C@H]4O)CO)O[C@H](CO)[C@@H]3O)O)[C@@H]2NC(C)=O)O[C@H]2[C@H]([C@H](O)[C@H](O)[C@H](C)O2)O)O[C@H](CO)[C@H](O)[C@@H]1O RQNFGIWYOACERD-OCQMRBNYSA-N 0.000 description 2
- NPPRJALWPIXIHO-PNCMPRLYSA-N beta-D-Gal-(1->4)-beta-D-GlcNAc-(1->3)-[beta-D-Gal-(1->4)-beta-D-GlcNAc-(1->6)]-beta-D-Gal-(1->4)-D-Glc Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)OC[C@@H]1[C@@H]([C@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O[C@H]3[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O3)O)[C@@H](CO)O2)NC(C)=O)[C@@H](O)[C@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)O1)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O NPPRJALWPIXIHO-PNCMPRLYSA-N 0.000 description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 2
- MSWZFWKMSRAUBD-UHFFFAOYSA-N beta-D-galactosamine Natural products NC1C(O)OC(CO)C(O)C1O MSWZFWKMSRAUBD-UHFFFAOYSA-N 0.000 description 2
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 2
- 238000013452 biotechnological production Methods 0.000 description 2
- 238000009835 boiling Methods 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 239000006143 cell culture medium Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- RPKLZQLYODPWTM-KBMWBBLPSA-N cholanoic acid Chemical compound C1CC2CCCC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@@H](CCC(O)=O)C)[C@@]1(C)CC2 RPKLZQLYODPWTM-KBMWBBLPSA-N 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000012411 cloning technique Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011143 downstream manufacturing Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 101150106565 gmd gene Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000009776 industrial production Methods 0.000 description 2
- 230000004941 influx Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000011081 inoculation Methods 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 239000001573 invertase Substances 0.000 description 2
- 235000011073 invertase Nutrition 0.000 description 2
- 101150086432 lacA gene Proteins 0.000 description 2
- RQNFGIWYOACERD-UHFFFAOYSA-N lacto-N-Difucosylhexaose I Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(CO)OC(OC3C(C(OC4C(OC(O)C(O)C4O)CO)OC(CO)C3O)O)C2NC(C)=O)OC2C(C(O)C(O)C(C)O2)O)OC(CO)C(O)C1O RQNFGIWYOACERD-UHFFFAOYSA-N 0.000 description 2
- OQIUPKPUOLIHHS-UHFFFAOYSA-N lacto-N-difucohexaose I Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(CO)OC(OC3C(C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C3O)O)C2NC(C)=O)OC2C(C(O)C(O)C(C)O2)O)OC(CO)C(O)C1O OQIUPKPUOLIHHS-UHFFFAOYSA-N 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 101150111351 mdoH gene Proteins 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 101150047229 opgH gene Proteins 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 238000011027 product recovery Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 210000003705 ribosome Anatomy 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- BRGMHAYQAZFZDJ-UHFFFAOYSA-N (5-acetamido-3,4,6-trihydroxyoxan-2-yl)methyl dihydrogen phosphate Chemical compound CC(=O)NC1C(O)OC(COP(O)(O)=O)C(O)C1O BRGMHAYQAZFZDJ-UHFFFAOYSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- IHPYMWDTONKSCO-UHFFFAOYSA-N 2,2'-piperazine-1,4-diylbisethanesulfonic acid Chemical compound OS(=O)(=O)CCN1CCN(CCS(O)(=O)=O)CC1 IHPYMWDTONKSCO-UHFFFAOYSA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000193755 Bacillus cereus Species 0.000 description 1
- 241000193752 Bacillus circulans Species 0.000 description 1
- 241000193749 Bacillus coagulans Species 0.000 description 1
- 241000193422 Bacillus lentus Species 0.000 description 1
- 241000194108 Bacillus licheniformis Species 0.000 description 1
- 241000194107 Bacillus megaterium Species 0.000 description 1
- 241000194106 Bacillus mycoides Species 0.000 description 1
- 241000194103 Bacillus pumilus Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000770536 Bacillus thermophilus Species 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 101710173142 Beta-fructofuranosidase, cell wall isozyme Proteins 0.000 description 1
- 241001608472 Bifidobacterium longum Species 0.000 description 1
- 241000186015 Bifidobacterium longum subsp. infantis Species 0.000 description 1
- 241000193417 Brevibacillus laterosporus Species 0.000 description 1
- 101100245749 Campylobacter jejuni subsp. jejuni serotype O:23/36 (strain 81-176) pseF gene Proteins 0.000 description 1
- 241000588919 Citrobacter freundii Species 0.000 description 1
- GSXOAOHZAIYLCY-UHFFFAOYSA-N D-F6P Natural products OCC(=O)C(O)C(O)C(O)COP(O)(O)=O GSXOAOHZAIYLCY-UHFFFAOYSA-N 0.000 description 1
- 125000002353 D-glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 241000194031 Enterococcus faecium Species 0.000 description 1
- 241001452028 Escherichia coli DH1 Species 0.000 description 1
- 101100186924 Escherichia coli neuC gene Proteins 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241000320863 Flavobacterium limnosediminis Species 0.000 description 1
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- 101100503580 Helicobacter pylori fucT gene Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- PSJVAGXZRSPYJB-UUXGNFCPSA-N Lacto-N-difucohexaose Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H](CO)[C@H]([C@H](O[C@@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)NC(C)=O)[C@@H](O[C@@H]1[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O1)O)C=O)O[C@@H]1[C@H](O[C@H]2[C@H]([C@H](O)[C@H](O)[C@H](C)O2)O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 PSJVAGXZRSPYJB-UUXGNFCPSA-N 0.000 description 1
- 240000001046 Lactobacillus acidophilus Species 0.000 description 1
- 235000013956 Lactobacillus acidophilus Nutrition 0.000 description 1
- 244000199885 Lactobacillus bulgaricus Species 0.000 description 1
- 235000013960 Lactobacillus bulgaricus Nutrition 0.000 description 1
- 244000199866 Lactobacillus casei Species 0.000 description 1
- 235000013958 Lactobacillus casei Nutrition 0.000 description 1
- 241000186673 Lactobacillus delbrueckii Species 0.000 description 1
- 241000186606 Lactobacillus gasseri Species 0.000 description 1
- 240000002605 Lactobacillus helveticus Species 0.000 description 1
- 235000013967 Lactobacillus helveticus Nutrition 0.000 description 1
- 241001561398 Lactobacillus jensenii Species 0.000 description 1
- 240000006024 Lactobacillus plantarum Species 0.000 description 1
- 235000013965 Lactobacillus plantarum Nutrition 0.000 description 1
- 241000186604 Lactobacillus reuteri Species 0.000 description 1
- 241000218588 Lactobacillus rhamnosus Species 0.000 description 1
- 241000186869 Lactobacillus salivarius Species 0.000 description 1
- 241000194036 Lactococcus Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 101100186921 Legionella pneumophila subsp. pneumophila (strain Philadelphia 1 / ATCC 33152 / DSM 7513) neuB gene Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 201000009906 Meningitis Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000192041 Micrococcus Species 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 101100350989 Mus musculus Paqr7 gene Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- OVRNDRQMDRJTHS-OZRXBMAMSA-N N-acetyl-beta-D-mannosamine Chemical compound CC(=O)N[C@@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-OZRXBMAMSA-N 0.000 description 1
- SQVRNKJHWKZAKO-PFQGKNLYSA-N N-acetyl-beta-neuraminic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-PFQGKNLYSA-N 0.000 description 1
- 108010056664 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyltransferase Proteins 0.000 description 1
- 102100033341 N-acetylmannosamine kinase Human genes 0.000 description 1
- 101710179749 N-acetylmannosamine kinase Proteins 0.000 description 1
- 108010035265 N-acetylneuraminate synthase Proteins 0.000 description 1
- 241000588652 Neisseria gonorrhoeae Species 0.000 description 1
- 241000156211 Neisseria meningitidis 053442 Species 0.000 description 1
- 108091005461 Nucleic proteins Chemical group 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 239000007990 PIPES buffer Substances 0.000 description 1
- 241001480343 Pantoea vagans Species 0.000 description 1
- 241000588701 Pectobacterium carotovorum Species 0.000 description 1
- 101710178100 Probable UDP-N-acetylglucosamine 2-epimerase Proteins 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 241000589540 Pseudomonas fluorescens Species 0.000 description 1
- 101710086464 Putative UDP-N-acetylglucosamine 2-epimerase Proteins 0.000 description 1
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 102100029954 Sialic acid synthase Human genes 0.000 description 1
- 102000003838 Sialyltransferases Human genes 0.000 description 1
- 108090000141 Sialyltransferases Proteins 0.000 description 1
- 241000204117 Sporolactobacillus Species 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000193985 Streptococcus agalactiae Species 0.000 description 1
- 244000057717 Streptococcus lactis Species 0.000 description 1
- 235000014897 Streptococcus lactis Nutrition 0.000 description 1
- 108050007025 Sugar transport proteins Proteins 0.000 description 1
- 102000017952 Sugar transport proteins Human genes 0.000 description 1
- 241000520244 Tatumella citrea Species 0.000 description 1
- 101710091363 UDP-N-acetylglucosamine 2-epimerase Proteins 0.000 description 1
- 241000681719 Vibrio brasiliensis Species 0.000 description 1
- 241000589636 Xanthomonas campestris Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- CMQZRJBJDCVIEY-JEOLMMCMSA-N alpha-L-Fucp-(1->3)-[beta-D-Galp-(1->4)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](CO)O[C@@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H](OC(O)[C@H](O)[C@H]3O)CO)O[C@H](CO)[C@@H]2O)O)[C@@H]1NC(C)=O CMQZRJBJDCVIEY-JEOLMMCMSA-N 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- LFVGISIMTYGQHF-UHFFFAOYSA-N ammonium dihydrogen phosphate Chemical compound [NH4+].OP(O)([O-])=O LFVGISIMTYGQHF-UHFFFAOYSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 229940054340 bacillus coagulans Drugs 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- BGWGXPAPYGQALX-ARQDHWQXSA-N beta-D-fructofuranose 6-phosphate Chemical compound OC[C@@]1(O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BGWGXPAPYGQALX-ARQDHWQXSA-N 0.000 description 1
- 102000005936 beta-Galactosidase Human genes 0.000 description 1
- 229940004120 bifidobacterium infantis Drugs 0.000 description 1
- 229940009291 bifidobacterium longum Drugs 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 235000013365 dairy product Nutrition 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- AIUDWMLXCFRVDR-UHFFFAOYSA-N dimethyl 2-(3-ethyl-3-methylpentyl)propanedioate Chemical compound CCC(C)(CC)CCC(C(=O)OC)C(=O)OC AIUDWMLXCFRVDR-UHFFFAOYSA-N 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 101150012763 endA gene Proteins 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 235000013350 formula milk Nutrition 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 235000001727 glucose Nutrition 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000007407 health benefit Effects 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- BJHIKXHVCXFQLS-PQLUHFTBSA-N keto-D-tagatose Chemical compound OC[C@@H](O)[C@H](O)[C@H](O)C(=O)CO BJHIKXHVCXFQLS-PQLUHFTBSA-N 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 101150001899 lacY gene Proteins 0.000 description 1
- 229930187367 lacto-N-difucohexaose Natural products 0.000 description 1
- CMQZRJBJDCVIEY-UHFFFAOYSA-N lacto-N-fucopentaose III Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(CO)OC(OC2C(C(OC3C(OC(O)C(O)C3O)CO)OC(CO)C2O)O)C1NC(C)=O CMQZRJBJDCVIEY-UHFFFAOYSA-N 0.000 description 1
- 229940039695 lactobacillus acidophilus Drugs 0.000 description 1
- 229940004208 lactobacillus bulgaricus Drugs 0.000 description 1
- 229940017800 lactobacillus casei Drugs 0.000 description 1
- 229940054346 lactobacillus helveticus Drugs 0.000 description 1
- 229940072205 lactobacillus plantarum Drugs 0.000 description 1
- 229940001882 lactobacillus reuteri Drugs 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 101150018810 lgtB gene Proteins 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 101150019075 neuA gene Proteins 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000002417 nutraceutical Substances 0.000 description 1
- 235000021436 nutraceutical agent Nutrition 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 238000002888 pairwise sequence alignment Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 235000013406 prebiotics Nutrition 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 101150028958 wcaF gene Proteins 0.000 description 1
- 101150033687 yabM gene Proteins 0.000 description 1
Description
Область техники, к которой относится изобретениеField of technology to which the invention relates
Настоящее изобретение относится к области рекомбинантного получения биологических молекул в генетически модифицированных клетках. Более конкретно, оно относится к способу рекомбинантного получения олигосахаридов грудного молока (ОГМ) с применением генетически модифицированных клеток, экспрессирующих белок суперсемейство основных посредников (MFS), экспрессируемый белок представляет собой Fred.The present invention relates to the field of recombinant production of biological molecules in genetically modified cells. More specifically, it relates to a method for recombinantly producing human milk oligosaccharides (HMOs) using genetically modified cells expressing a major mediator superfamily (MFS) protein, the expressed protein being Fred.
Уровень техникиState of the art
Грудное молоко представляет собой сложную смесь углеводов, жиров, белков, витаминов, минералов и микроэлементов. Безусловно, наиболее преобладающая фракция представлена углеводами, которые можно далее разделить на лактозу и более сложные олигосахариды (олигосахариды грудного молока, ОГМ). В то время как лактозу применяют в качестве источника энергии, сложные олигосахариды не метаболизируются младенцем. Фракция сложных олигосахаридов составляет до 1/10 от общей углеводной фракции и состоит, вероятно, из более чем 150 различных олигосахаридов. Наличие и концентрация этих сложных олигосахаридов специфичны для человека и поэтому не могут быть обнаружены в больших количествах в молоке других млекопитающих, таких как, например, домашние молочные животные.Breast milk is a complex mixture of carbohydrates, fats, proteins, vitamins, minerals and trace elements. By far the most predominant fraction is carbohydrates, which can be further divided into lactose and more complex oligosaccharides (human milk oligosaccharides, HMOs). While lactose is used as an energy source, complex oligosaccharides are not metabolized by the infant. The complex oligosaccharide fraction accounts for up to 1/10 of the total carbohydrate fraction and probably consists of more than 150 different oligosaccharides. The presence and concentration of these complex oligosaccharides are specific to humans and therefore cannot be found in large quantities in the milk of other mammals, such as, for example, domestic dairy animals.
На сегодняшний день определена структура не менее 115 ОГМ (см. Urashima et al. Milk Oligosaccharides, Nova Biomedical Books, New York, 2011, ISBN: 978-1-61122-831-1), и, вероятно, значительно больше присутствует в грудном молоке (Kunz С. et al., (2014) Food Oligo-saccharides: Production, Analysis and Bioactivity, 1st Edition, p. 5-20, Eds. Moreno J. and Luz Sanz M., John Wiley & Sons, Ltd).To date, the structure of at least 115 OGMs has been determined (see Urashima et al. Milk Oligosaccharides, Nova Biomedical Books, New York, 2011, ISBN: 978-1-61122-831-1), and many more are likely to be present in breast milk (Kunz S. et al., (2014) Food Oligo-saccharides: Production, Analysis and Bioactivity, 1st Edition, p. 5-20, Eds. Moreno J. and Luz Sanz M., John Wiley & Sons, Ltd) .
ОГМ вызвали большой интерес в последнее десятилетие в связи с открытием их важной функциональности в развитии человека. Помимо своих пребиотических свойств, ОГМ связаны с дополнительными положительными эффектами, что расширяет область их применения (Kunz С. et al., (2014) Food Oligosaccharides: Production, Analysis and Bioactivity, 1st Edition, p 5-20, Eds. Moreno J. and Luz Sanz M., John Wiley & Sons, Ltd). Польза ОГМ для здоровья позволила разрешить их применение в пищевых продуктах, таких как детские смеси и пищевые продукты, а также в потребительских товарах для здоровья.GGMs have attracted much interest in the last decade due to the discovery of their important functionality in human development. In addition to their prebiotic properties, HMOs are associated with additional beneficial effects, which expands the scope of their application (Kunz S. et al., (2014) Food Oligosaccharides: Production, Analysis and Bioactivity, 1st Edition, p 5-20, Eds. Moreno J. and Luz Sanz M., John Wiley & Sons, Ltd). The health benefits of HGMs have led to their approval for use in foods such as infant formula and food products, as well as in consumer health products.
Из-за ограниченной доступности ОГМ крайне желательно эффективное коммерческое, т.е. крупномасштабное производство. Разработаны химические маршруты к некоторым ОГМ. Однако производство ОГМ путем химического синтеза, ферментативного синтеза или ферментации оказалось сложной задачей. Производство в больших количествах, а также качества, необходимые для пищевых и медицинских целей, путем химического синтеза еще предстоит обеспечить. Кроме того, химические синтетические пути к ОГМ включают несколько вредных химических веществ, которые создают риск загрязнения конечного продукта.Due to the limited availability of OGM, effective commercial, i.e. large scale production. Chemical routes to some OGMs have been developed. However, the production of OGM by chemical synthesis, enzymatic synthesis, or fermentation has proven challenging. Production in large quantities, as well as the qualities required for food and medicinal purposes, through chemical synthesis have yet to be achieved. In addition, chemical synthetic routes to HMOs include several harmful chemicals that pose a risk of contamination of the final product.
Чтобы обойти недостатки, связанные с химическим синтезом ОГМ, были разработаны несколько этимологических способов и ферментативных подходов. Процессы на основе ферментации были разработаны для нескольких ОГМ, таких как 2'-фукозиллактоза, 3-фукозиллактоза, ласто-Ы-тетраоза, лакто-Nнеотетраоза, З'-сиалиллактоза и 6'-сиалиллактоза. В процессах, основанных на ферментации, обычно применяют генетически модифицированные бактериальные штаммы, такие как рекомбинантная кишечная палочка (E.coli).To circumvent the disadvantages associated with the chemical synthesis of HMOs, several etymological routes and enzymatic approaches have been developed. Fermentation-based processes have been developed for several HGMs, such as 2'-fucosyllactose, 3-fucosyllactose, lasto-N-tetraose, lacto-Nneotetraose, 3'-sialyllactose and 6'-sialyllactose. Fermentation-based processes typically use genetically modified bacterial strains such as recombinant Escherichia coli (E. coli).
Биотехнологическое производство ОГМ, такое как ферментативный способ, представляет собой ценный экономичный и масштабный подход к производству ОГМ. Оно основано на генетически модифицированных бактериях, сконструированных таким образом, чтобы экспрессировать гликозилтрансферазы, необходимые для синтеза желаемых олигосахаридов, и в нем применяют врожденный пул нуклеотидных Сахаров бактерий в качестве предшественников ОГМ.Biotechnological production of HMOs, such as the enzymatic route, represents a valuable cost-effective and large-scale approach to the production of HMOs. It is based on genetically modified bacteria engineered to express the glycosyltransferases required to synthesize the desired oligosaccharides, and utilizes the bacteria's innate pool of nucleotide sugars as OGM precursors.
Недавние разработки в биотехнологическом производстве ОГМ позволили преодолеть некоторые присущие бактериальным экспрессионным системам ограничения. Например, бактериальные клетки, продуцирующие ОГМ, могут быть генетически модифицированы для увеличения ограниченного внутриклеточного пула нуклеотидных сахаров в бактериях (WO 2012112777), для повышения активности ферментов, участвующих в продукции ОГМ (WO 2016040531), или для облегчения секреции синтезированных ОГМ во внеклеточную среду (WO 2010142305, WO 2017042382). Кроме того, экспрессию представляющих интерес генов в рекомбинантных клетках можно регулировать с помощью конкретных промоторов или других регуляторов экспрессии генов, таких как, например, те, что недавно были описаны в WO 2019123324.Recent developments in the biotechnological production of HGM have overcome some of the inherent limitations of bacterial expression systems. For example, bacterial cells that produce OGM can be genetically modified to increase the limited intracellular pool of nucleotide sugars in bacteria (WO 2012112777), to increase the activity of enzymes involved in the production of OGM (WO 2016040531), or to facilitate the secretion of synthesized OGM into the extracellular environment (WO 2012112777). WO 2010142305, WO 2017042382). In addition, the expression of genes of interest in recombinant cells can be regulated by specific promoters or other gene expression regulators, such as those recently described in WO 2019123324.
Подход, описанный в WO 2010142305 и WO 2017042382, имеет то преимущество, что он позволяет снизить метаболическую нагрузку, воздействующую на продуцирующую клетку, за счет высоких уровней экспрессии рекомбинантных генов, т.е. с применением способов WO 2012112777, WO 2016040531 или WO 2019123324. Этот подход привлекает все большее внимание к конструированию рекомбинантных клеток, продуцирующих ОГМ, например, недавно были описаны также несколько новых генов переносчиков сахара, кодирующих белки, и процедуры ферментации, которые могут способствовать выведению рекомбинантно продуцируемой 2'-фукозиллактозы (2'-FL), самого распространенного ОГМ грудного молока (WO 2018077892, US 201900323053, US 201900323052).The approach described in WO 2010142305 and WO 2017042382 has the advantage that it reduces the metabolic burden on the producing cell due to high levels of recombinant gene expression, i.e. using the methods of WO 2012112777, WO 2016040531 or WO 2019123324. This approach is attracting increasing attention to the construction of recombinant cells producing HGM, for example, several new sugar transporter genes encoding proteins and fermentation procedures that can facilitate recombinant production have also been recently described produced by 2'-fucosyllactose (2'-FL), the most common HGM in human milk (WO 2018077892, US 201900323053, US 201900323052).
Однако в настоящее время не существует алгоритма, который мог бы точно определить правильный белок-транспортер для оттока различных структур ОГМ, полученных рекомбинантно, среди многочис- 1 046005 ленных бактериальных белков с предсказанной функцией транспортера в нескольких базах данных белков, например, в UniProt, поскольку отношение структуры-функции, определяющие субстратную специфичность переносчиков сахаров, до сих пор недостаточно изучены и остаются крайне непредсказуемыми.However, there is currently no algorithm that can accurately identify the correct transporter protein for the efflux of various recombinantly produced OGM structures among the numerous bacterial proteins with predicted transporter function in several protein databases, such as UniProt, because The structure-function relationships that determine the substrate specificity of sugar transporters are still poorly understood and remain highly unpredictable.
Раскрытие изобретенияDisclosure of the Invention
Настоящее раскрытие показывает, что сверхэкспрессия в штаммах, продуцирующих ОГМ, гетерологичного гена fred, который кодирует белок Fred из суперсемейства основных переносчиков (MFS), увеличивает количество ОГМ, продуцируемого клетками. Выявление новых эффективных белковтранспортеров оттока сахаров, имеющих эффективность для различных рекомбинантно полученных ОГМ и разработка рекомбинантных клеток, экспрессирующих указанные белки, выгодны для крупномасштабного промышленного производства ОГМ.The present disclosure shows that overexpression in OGM-producing strains of the heterologous fred gene, which encodes the Fred protein of the major transporter superfamily (MFS), increases the amount of OGM produced by the cells. The identification of new efficient sugar efflux transporter proteins that have efficacy for various recombinantly produced OGMs and the development of recombinant cells expressing these proteins are beneficial for large-scale industrial production of OHMs.
Таким образом, в самом широком аспекте настоящее изобретение относится к генетически модифицированной клетке, способной продуцировать один или несколько олигосахаридов грудного молока (ОГМ), причем указанная генетически модифицированная клетка включает гетерологичную последовательность нуклеиновой кислоты, кодирующую полипептид главного облегчающего суперсемейства (MFS), показанный на SEQ ID NO: 1 или ее функциональный гомолог, аминокислотная последовательность которого более чем на 95,4% идентична SEQ ID NO: 1, например, по меньшей мере, на 95,5, например, по меньшей мере, на 96% идентична SEQ ID NO: 1.Thus, in its broadest aspect, the present invention relates to a genetically modified cell capable of producing one or more human milk oligosaccharides (HMOs), wherein said genetically modified cell comprises a heterologous nucleic acid sequence encoding a major facilitator superfamily (MFS) polypeptide shown in SEQ ID NO: 1 or a functional homolog thereof, the amino acid sequence of which is more than 95.4% identical to SEQ ID NO: 1, for example, at least 95.5, for example, at least 96% identical to SEQ ID NO : 1.
Генетически модифицированная клетка по настоящему изобретению может дополнительно включать последовательность нуклеиновой кислоты, включающую регуляторный элемент для регуляции экспрессии гетерологичной последовательности нуклеиновой кислоты. Указанный регуляторный элемент в одном аспекте регулирует экспрессию полипептида MFS, показанного в SEQ ID NO: 1, или его функционального гомолога, аминокислотная последовательность которого более чем на 95,4% идентична SEQ ID NO: 1.The genetically modified cell of the present invention may further include a nucleic acid sequence including a regulatory element for regulating the expression of a heterologous nucleic acid sequence. Said regulatory element in one aspect regulates the expression of the MFS polypeptide shown in SEQ ID NO: 1, or a functional homolog thereof, the amino acid sequence of which is more than 95.4% identical to SEQ ID NO: 1.
Аминокислотная последовательность, обозначенная в настоящем документе как SEQ ID NO: 1, представляет собой аминокислотную последовательность, которая на 100% идентична аминокислотной последовательности, имеющей номер доступа GenBank ID WP_087817556.1. Белок-транспортер MFS, имеющий аминокислотную последовательность SEQ ID NO: 1, идентифицируется в настоящем документе как белок Fred или переносчик Fred или Fred, взаимозаменяемо; последовательность нуклеиновой кислоты, кодирующая белок Fred, обозначена в настоящем документе как SEQ ID NO: 2 Fred, кодирующая нуклеиновую кислоту/ДНК, или ген fred, или fred.The amino acid sequence designated herein as SEQ ID NO: 1 is an amino acid sequence that is 100% identical to the amino acid sequence having GenBank accession ID WP_087817556.1. The MFS transporter protein having the amino acid sequence of SEQ ID NO: 1 is identified herein as the Fred protein or the Fred or Fred transporter, interchangeably; the nucleic acid sequence encoding the Fred protein is designated herein as SEQ ID NO: 2 Fred encoding the nucleic acid/DNA or fred gene or fred gene.
Настоящее изобретение показывает, что применение рекомбинантных клеток, продуцирующих ОГМ, которые экспрессируют белок Fred, приводит к весьма отчетливым улучшениям процесса производства ОГМ как с точки зрения ферментации, так и очистки ОГМ. Описанные в настоящем документе рекомбинантные клетки и способы получения ОГМ обеспечивают как более высокие выходы всех произведенных ОГМ, сниженное образование побочных продуктов или отношение побочного продукта к продукту и облегченное извлечение ОГМ во время последующей обработки ферментационный бульон.The present invention shows that the use of recombinant OGM-producing cells that express the Fred protein leads to very distinct improvements in the OGM production process, both in terms of fermentation and OGM purification. The recombinant cells and methods for producing HMOs described herein provide both higher yields of total HMOs produced, reduced by-product formation or byproduct-to-product ratio, and easier recovery of HMOs during downstream processing of the fermentation broth.
Неожиданно было обнаружено, что экспрессия последовательности ДНК, кодирующей Fred, в различных ОГМ-продуцирующих клетках связана с накоплением некоторых ОГМ во внеклеточной среде и других ОГМ внутри продуцирующих клеток, и с увеличением общей продукции ОГМ. Неожиданно оказалось, что увеличение выхода образующихся ОГМ характерно для ОГМ, состоящих либо из трех, либо из четырех звеньев моносахаридов, т.е. 2'-фукозиллактозы (2'-FL), 3-фукозиллактозы (3-FL), 3сиалиллактозы (3'SL), 6'-сиалиллактозы (6'SL), лакто-Ы-триозы 2, (LNT-2), лакто-Ы-неотетраозы (LNnT) и лакто-Н-тетраозы (LNT), особенно для 2'-фукозиллактозы (2'-FL), 3-фукозиллактозы (3-FL) и лакто-Nтетраозы (LNT), как видно из приведенных в настоящем документе примеров, но не для более крупных олигосахаридных структур, таких как пентасахариды и гексасахариды, которые накапливаются внутри продуцирующих клеток.Surprisingly, it was found that expression of the DNA sequence encoding Fred in various OGM-producing cells is associated with the accumulation of some OGM in the extracellular environment and other OGM within the producing cells, and with an increase in overall OGM production. Unexpectedly, it turned out that an increase in the yield of the resulting OHMs is characteristic of OHMs consisting of either three or four monosaccharide units, i.e. 2'-fucosyllactose (2'-FL), 3-fucosyllactose (3-FL), 3-sialyllactose (3'SL), 6'-sialyllactose (6'SL), lacto-N-triose 2, (LNT-2), lacto-N-neotetraose (LNnT) and lacto-N-tetraose (LNT), especially for 2'-fucosyllactose (2'-FL), 3-fucosyllactose (3-FL) and lacto-N-tetraose (LNT), as seen in examples given herein, but not for larger oligosaccharide structures such as pentasaccharides and hexasaccharides that accumulate within producing cells.
Неожиданно также обнаружено, что общая продукция основного ОГМ, например, 2'фукозиллактозы (2'-FL), 3-фукозиллактозы (3-FL), и лакто-М-тетраозы (LNT) в соответствующих ОГМпродуцирующих клетках, экспрессирующих ген fred, также увеличивается, в то время как образование побочных продуктов, например, например дифукозиллактозы (DFL), лакто-N-фукоπентаозы V (LNFP V) или паралактонеогексаозы-1 (pLNH-I) в этих клетках, соответственно, часто снижены, и указанные побочные олигосахариды обычно накапливаются внутри продуцирующих клеток.Surprisingly, it was also found that the total production of major OGM, e.g., 2'fucosyllactose (2'-FL), 3-fucosyllactose (3-FL), and lacto-M-tetraose (LNT), in the corresponding OGM-producing cells expressing the fred gene was also increases, while the formation of by-products, for example, difucosyllactose (DFL), lacto-N-fucopentaose V (LNFP V) or paralactoneohexaose-1 (pLNH-I) in these cells, respectively, is often reduced, and these by-product oligosaccharides usually accumulate inside producing cells.
Неожиданно было также обнаружено, что общая продукция основных ОГМ, т.е. 2'-фукозиллактозы (2'-FL), 3-фукозиллактозы (3-FL) и лакто-N-теΊраозы (LNT) в соответствующих ОГМ-продуцирующих клетках, экспрессирующих ген fred, также увеличивается, в то время как продукция побочных продуктов, т.е. дифукозиллактозы (DFL), лакто-N-фукопентаозы V (LNFP V) или паралактонеогексаозы-I (pLNH-I) в этих клетках, соответственно, часто снижается, и указанные побочные продукты олигосахаридов обычно накапливаются внутри продуцирующих клеток.Surprisingly, it was also found that the total production of the main HMOs, i.e. 2'-fucosyllactose (2'-FL), 3-fucosyllactose (3-FL) and lacto-N-theraose (LNT) in the corresponding OGM-producing cells expressing the fred gene are also increased, while the production of by-products, those. difucosyllactose (DFL), lacto-N-fucopentaose V (LNFP V) or paralactoneohexaose-I (pLNH-I) in these cells, respectively, is often reduced, and these oligosaccharide by-products usually accumulate inside the producing cells.
Генетически модифицированная клетка по настоящему изобретению обычно дополнительно включает последовательность нуклеиновой кислоты, включающую регуляторный элемент. Регуляторный элемент может регулировать экспрессию нуклеиновой кислоты, кодирующей полипептид суперсемейстThe genetically modified cell of the present invention typically further includes a nucleic acid sequence including a regulatory element. The regulatory element may regulate the expression of a nucleic acid encoding a superfamily polypeptide
- 2 046005 ва основных переносчиков (MFS), и может быть выбран из группы, состоящей из PglpF, PglpF_SD4 и PglpF_SD7.- 2 046005 va major transporters (MFS), and can be selected from the group consisting of PglpF, PglpF_SD4 and PglpF_SD7.
Изобретение также относится к конструкции нуклеиновой кислоты, включающей последовательность нуклеиновой кислоты, кодирующую полипептид суперсемейства основных переносчиков (MFS), где последовательность нуклеиновых кислот, кодирующая полипептид суперсемейства основных переносчиков (MFS), имеет, по меньшей мере, 70%, более предпочтительно, по меньшей мере, 80%, более предпочтительно, по меньшей мере, 90%, более предпочтительно, по меньшей мере, 95% и еще более предпочтительно, по меньшей мере, 99% идентичности с последовательностью SEQ ID NO: 2, также изобретение относится к генетически модифицированной клетке, включающей конструкцию нуклеиновой кислоты, которая представляет собой Escherichia coli.The invention also relates to a nucleic acid construct comprising a nucleic acid sequence encoding a major transporter superfamily (MFS) polypeptide, wherein the nucleic acid sequence encoding a major transporter superfamily (MFS) polypeptide has at least 70%, more preferably at least at least 80%, more preferably at least 90%, more preferably at least 95% and even more preferably at least 99% identity with the sequence SEQ ID NO: 2, the invention also relates to genetically modified cell comprising a nucleic acid construct that is Escherichia coli.
В одном аспекте конструкция нуклеиновой кислоты, включающая последовательность(последовательности) нуклеиновой кислоты, кодирующую(кодирующие) полипептид, относящийся к суперсемейству основных переносчиков (MFS), в которой последовательность нуклеиновой кислоты, по меньшей мере, на 70% идентична SEQ ID NO: 2.In one aspect, a nucleic acid construct comprising nucleic acid sequence(s) encoding a polypeptide belonging to the major transporter superfamily (MFS), wherein the nucleic acid sequence is at least 70% identical to SEQ ID NO: 2.
Изобретение также обеспечивает способ биосинтетического производства одного или нескольких олигосахаридов грудного молока (ОГМ), включающий следующие стадии:The invention also provides a method for the biosynthetic production of one or more human milk oligosaccharides (HMOs), comprising the following steps:
(i) обеспечение генетически модифицированной клетки по настоящему изобретению;(i) providing a genetically modified cell according to the present invention;
(ii) культивирование генетически модифицированной клетки в соответствии с (i) в подходящей среде для культивирования клеток для экспрессии указанного полипептида, способного к транспортировке выходящего сахара и продуцированию одного или нескольких олигосахаридов грудного молока (ОГМ), и;(ii) culturing the genetically modified cell in accordance with (i) in a suitable cell culture medium to express said polypeptide capable of transporting output sugar and producing one or more human milk oligosaccharides (HMOs), and;
(iii) сбор одного или нескольких ОГМ, полученных на стадии (ii).(iii) collecting one or more OGM obtained in step (ii).
Изобретение также относится к применению генетически модифицированной клетки или конструкции нуклеиновой кислоты, включающей гетерологичную последовательность нуклеиновой кислоты, кодирующую полипептид суперсемейства основных посредников (MFS), причем указанная последовательность нуклеиновой кислоты имеет, по меньшей мере, 70% идентичности последовательности с SEQ ID NO: 2, для биосинтетического производства одного или нескольких олигосахаридов грудного молока (ОГМ).The invention also relates to the use of a genetically modified cell or nucleic acid construct comprising a heterologous nucleic acid sequence encoding a master mediator superfamily (MFS) polypeptide, wherein said nucleic acid sequence has at least 70% sequence identity with SEQ ID NO: 2. for the biosynthetic production of one or more human milk oligosaccharides (HMOs).
Как упоминалось выше, при культивировании генетически модифицированных клеток, способных продуцировать один или несколько ОГМ и включающих последовательность нуклеиновой кислоты, кодирующую белок-транспортер Fred, неожиданно было обнаружено, что соответствующие один или несколько ОГМ продуцируются с высокими выходами, тогда как образование побочных продуктов и биомассы снижается. Это облегчает извлечение этих ОГМ в последующих процессах, например, общая процедура извлечения и очистки может включать меньше стадий, и общее время очистки сокращается.As mentioned above, when cultivating genetically modified cells capable of producing one or more OGMs and including a nucleic acid sequence encoding the Fred transporter protein, it was unexpectedly found that the corresponding one or more OHMs were produced in high yields, while the formation of by-products and biomass decreases. This makes it easier to recover these HMOs in downstream processes, for example the overall recovery and purification procedure may involve fewer steps and the overall purification time is reduced.
Эти эффекты повышенного выхода продукта и облегчения извлечения продукта делают настоящее изобретение превосходящим раскрытия предшествующего уровня техники.These effects of increased product yield and easier product recovery make the present invention superior to the disclosures of the prior art.
Другие аспекты и полезные признаки настоящего изобретения подробно описаны и проиллюстрированы приведенными ниже неограничивающими рабочими примерами.Other aspects and useful features of the present invention are described in detail and illustrated by the following non-limiting worked examples.
Краткое описание чертежейBrief description of drawings
На фиг. 1 показана относительная продукция 2'-FL модифицированным штаммом E.coli (штамм 1) с интеграцией и без интеграции гена fred в соответствии с SEQ ID NO: 2, кодирующего экспрессию белкатранспортера Fred MFS в соответствии с SEQ ID NO: 1, штамм 2 и штамм 1, соответственно. Данные получены анализом культуры с подпиткой способом с глубокими лунками.In fig. 1 shows the relative production of 2'-FL by a modified E. coli strain (strain 1) with and without integration of the fred gene in accordance with SEQ ID NO: 2, encoding the expression of the Fred MFS transporter protein in accordance with SEQ ID NO: 1, strain 2 and strain 1, respectively. Data were obtained by fed-batch culture analysis using the deep well method.
На фиг. 2 показано относительное распределение 2'-FL внутри и снаружи клеток модифицированного штамма E.coli (штамм 1) с интеграцией и без интеграции гена fred в соответствии с SEQ ID NO: 2, кодирующего экспрессию белка-транспортера Fred MFS в соответствии с SEQ ID NO: 1, штамм 2 и штамм 1, соответственно. Данные получены анализом культуры с подпиткой способом с глубокими лунками.In fig. 2 shows the relative distribution of 2'-FL inside and outside the cells of a modified E. coli strain (strain 1) with and without integration of the fred gene in accordance with SEQ ID NO: 2, encoding the expression of the Fred MFS transporter protein in accordance with SEQ ID NO : 1, strain 2 and strain 1, respectively. Data were obtained by fed-batch culture analysis using the deep well method.
На фиг. 3 показана относительная продукция 3-FL модифицированным штаммом E.coli (штамм 3) с интеграцией и без интеграции гена fred в соответствии с SEQ ID NO: 2, кодирующего экспрессию белкатранспортера Fred MFS в соответствии с SEQ ID NO: 1, штамм 4 и штамм 3, соответственно. Данные получены анализом культуры с подпиткой способом с глубокими лунками.In fig. 3 shows the relative production of 3-FL by a modified E. coli strain (strain 3) with and without integration of the fred gene in accordance with SEQ ID NO: 2, encoding the expression of the Fred MFS transporter protein in accordance with SEQ ID NO: 1, strain 4 and strain 3, respectively. Data were obtained by fed-batch culture analysis using the deep well method.
На фиг. 4 показано относительное распределение 3-FL внутри и снаружи клеток модифицированного штамма E.coli (штамм 3) с интеграцией гена fred и без нее в соответствии с SEQ ID NO: 2, кодирующего экспрессию белка-транспортера Fred MFS в соответствии с SEQ ID. NO: 1, штамм 4 и штамм 3, соответственно. Данные получены анализом культуры с подпиткой способом с глубокими лунками.In fig. 4 shows the relative distribution of 3-FL inside and outside the cells of a modified E. coli strain (strain 3) with and without integration of the fred gene in accordance with SEQ ID NO: 2, encoding the expression of the Fred MFS transporter protein in accordance with SEQ ID. NO: 1, strain 4 and strain 3, respectively. Data were obtained by fed-batch culture analysis using the deep well method.
На фиг. 5 показана относительная продукция LNT модифицированным штаммом E.coli (штамм 5) с интеграцией и без интеграции гена fred в соответствии с SEQ ID NO: 2, кодирующего экспрессию белкатранспортера Fred MFS в соответствии с SEQ ID NO: 1, штаммы 6 и 7 по сравнению со штаммом 5, соответственно. Данные получены анализом культуры с подпиткой способом с глубокими лунками.In fig. 5 shows the relative production of LNT by a modified E. coli strain (strain 5) with and without integration of the fred gene in accordance with SEQ ID NO: 2, encoding the expression of the Fred MFS transporter protein in accordance with SEQ ID NO: 1, strains 6 and 7 compared with strain 5, respectively. Data were obtained by fed-batch culture analysis using the deep well method.
На фиг. 6 показано относительное распределение LNT внутри и снаружи клеток модифицированного штамма E.coli (штамм 5) с интеграцией и без интеграции гена fred в соответствии с SEQ ID NO: 2, коIn fig. 6 shows the relative distribution of LNT inside and outside the cells of a modified E. coli strain (strain 5) with and without integration of the fred gene in accordance with SEQ ID NO: 2, which
- 3 046005 дирующего экспрессию белка-транспортера Fred MFS. согласно SEQ ID NO: 1, штаммы 6 и 7 по сравнению со штаммом 5, соответственно. Данные получены анализом культуры с подпиткой способом с глубокими лунками.- 3 046005 directing the expression of the Fred MFS transporter protein. according to SEQ ID NO: 1, strains 6 and 7 compared to strain 5, respectively. Data were obtained by fed-batch culture analysis using the deep well method.
На фиг. 7 показан процент (%) относительных концентраций LNnT в общих образцах для семи штаммов, которые экспрессируют гены GlcNacT и Gal4T и ген гетерологичного транспортера, yberC0001_9420, bad, fred, marc, vag, пес или yabM, соответственно. Штамм МР3672 экспрессирует гены гликозилтрансферазы и не экспрессирует гены транспортера;In fig. Figure 7 shows the percentage (%) of relative concentrations of LNnT in total samples for seven strains that express the GlcNacT and Gal4T genes and the heterologous transporter gene, yberC0001_9420, bad, fred, marc, vag, dog, or yabM, respectively. Strain MP3672 expresses glycosyltransferase genes and does not express transporter genes;
На фиг. 8 показан процент (%) относительных концентраций LNnT в супернатанте клеток, экспрессирующих vag или yabM.In fig. Figure 8 shows the percentage (%) of relative concentrations of LNnT in the supernatant of cells expressing vag or yabM.
Осуществление изобретенияCarrying out the invention
Далее воплощения изобретения будут описаны более подробно. Каждая конкретная вариация признаков может быть применена к другим воплощениям изобретения, если специально не указано иное.In the following, embodiments of the invention will be described in more detail. Each specific feature variation may be applied to other embodiments of the invention unless specifically stated otherwise.
Как правило, все применяемые в настоящем документе термины следует интерпретировать в соответствии с их обычным значением в технической области и как применимые ко всем аспектам и воплощениям изобретения, если явно не определено или не указано иное.In general, all terms used herein should be interpreted in accordance with their ordinary meaning in the technical field and as applicable to all aspects and embodiments of the invention, unless expressly defined or indicated otherwise.
Все ссылки на [клетка, последовательность, ген, транспортер, стадия и т.д.] нужно интерпретировать открыто как относящиеся, по меньшей мере, к одному экземпляру указанной клетки, последовательности, гена, транспортера, стадии и т.д. если прямо не указано иное.All references to [cell, sequence, gene, transporter, stage, etc.] should be interpreted explicitly as referring to at least one instance of the specified cell, sequence, gene, transporter, stage, etc. unless expressly stated otherwise.
Этапы любого раскрытого в настоящем документе способа не обязательно выполнять в точном раскрытом порядке, если это не указано явно.The steps of any method disclosed herein do not have to be performed in the exact order disclosed unless explicitly stated.
Настоящее изобретение в целом относится к генетически модифицированной клетке для эффективного производства олигосахаридов и к применению указанной генетически модифицированной клетки в способе получения олигосахаридов. В особенности, настоящее изобретение относится к генетически модифицированной клетке, способной синтезировать олигосахарид, предпочтительно, гетерологичный олигосахарид, в особенности, олигосахарид грудного молока (ОГМ).The present invention generally relates to a genetically modified cell for efficient production of oligosaccharides and to the use of said genetically modified cell in a process for producing oligosaccharides. In particular, the present invention relates to a genetically modified cell capable of synthesizing an oligosaccharide, preferably a heterologous oligosaccharide, especially human milk oligosaccharide (HMO).
Соответственно, генетически модифицированная клетка по изобретению модифицируют для экспрессии набора рекомбинантных нуклеиновых кислот, которые необходимы для синтеза клетками одного или нескольких ОГМ (которые позволяют клетке-хозяину синтезировать один или несколько ОГМ), таких как гены, кодирующие один или несколько ферментов с гликозилтрансферазной активностью, как описано ниже. Продуцирующую олигосахарид рекомбинантную клетку по изобретению дополнительно модифицируют для включения гетерологичной последовательности рекомбинантной нуклеиновой кислоты, предпочтительно, последовательности ДНК, кодирующей предположительный транспортный белок MFS (major facilitator superfamily, суперсемейство основных посредников), происходящий из бактерии Yersinia frederiksenii.Accordingly, the genetically modified cell of the invention is modified to express a set of recombinant nucleic acids that are necessary for the cell to synthesize one or more OGMs (which enable the host cell to synthesize one or more OGMs), such as genes encoding one or more enzymes with glycosyltransferase activity, as described below. The oligosaccharide-producing recombinant cell of the invention is further modified to include a heterologous recombinant nucleic acid sequence, preferably a DNA sequence encoding a putative MFS (major facilitator superfamily) transport protein derived from the bacterium Yersinia frederiksenii.
Более конкретно, изобретение относится к генетически модифицированной клетке, оптимизированной для продукции одного или нескольких конкретных олигосахаридов, в особенности, одного или нескольких конкретных ОГМ, включающей рекомбинантную нуклеиновую кислоту, кодирующую белок Fred.More specifically, the invention relates to a genetically modified cell optimized for the production of one or more specific oligosaccharides, in particular one or more specific OGMs, comprising a recombinant nucleic acid encoding the Fred protein.
Последовательность нуклеиновой кислоты, кодирующая белок Fred, имеющая последовательность нуклеиновой кислоты SEQ ID NO: 2, идентифицируют в настоящем документе как нуклеиновая кислота/ДНК, кодирующая Fred, или ген fred, или fred.The nucleic acid sequence encoding the Fred protein having the nucleic acid sequence SEQ ID NO: 2 is identified herein as the nucleic acid/DNA encoding Fred, or the fred gene, or fred.
Белок-транспортер MFS, обозначенный в настоящем документе как белок Fred или транспортер Fred или Fred, взаимозаменяемо, имеет аминокислотную последовательность SEQ ID NO: 1; Аминокислотная последовательность, обозначенная в настоящем документе как SEQ ID NO: 1, представляет собой аминокислотную последовательность, которая имеет 100% идентичность с аминокислотной последовательностью, имеющей номер доступа GenBank ID WP_087817556.1.The MFS transporter protein, referred to herein as Fred protein or Fred or Fred transporter, interchangeably, has the amino acid sequence of SEQ ID NO: 1; The amino acid sequence designated herein as SEQ ID NO: 1 is an amino acid sequence that has 100% identity with the amino acid sequence having GenBank accession ID WP_087817556.1.
Соответственно, один аспект изобретения относится к генетически модифицированной клетке, способной продуцировать один или несколько олигосахаридов грудного молока (ОГМ), в котором указанная генетически модифицированная клетка включает гетерологичную последовательность нуклеиновой кислоты, кодирующую полипептид, способный транспортировать сахар, причем указанная последовательность нуклеиновой кислоты, имеющая, по меньшей мере, 70%, более предпочтительно, по меньшей мере, 80%, более предпочтительно, по меньшей мере, 90%, более предпочтительно, по меньшей мере, 95% и еще более предпочтительно, по меньшей мере, 99% идентичности с последовательностью SEQ ID NO: 2.Accordingly, one aspect of the invention relates to a genetically modified cell capable of producing one or more human milk oligosaccharides (HMOs), wherein said genetically modified cell includes a heterologous nucleic acid sequence encoding a polypeptide capable of transporting a sugar, wherein said nucleic acid sequence having, at least 70%, more preferably at least 80%, more preferably at least 90%, more preferably at least 95% and even more preferably at least 99% sequence identity SEQ ID NO: 2.
Кроме того, изобретение относится к генетически модифицированной клетке, оптимизированной для продукции одного или нескольких конкретных олигосахаридов, в особенности, одной или нескольких конкретных ОГМ, включающей рекомбинантную нуклеиновую кислоту, кодирующую белок, содержащий более 95,4%, например, по меньшей мере, 95,5% идентичности последовательности, предпочтительно, по меньшей мере, на 96%, более предпочтительно, по меньшей мере, на 97%, более предпочтительно, по меньшей мере, на 98% и еще более предпочтительно, по меньшей мере, на 99% идентичности последовательности с аминокислотной последовательностью SEQ ID NO: 1.In addition, the invention relates to a genetically modified cell optimized for the production of one or more specific oligosaccharides, in particular one or more specific OGM, comprising a recombinant nucleic acid encoding a protein containing more than 95.4%, for example, at least 95 .5% sequence identity, preferably at least 96%, more preferably at least 97%, more preferably at least 98%, and even more preferably at least 99% identity sequences with amino acid sequence SEQ ID NO: 1.
Соответственно, один аспект изобретения относится к генетически модифицированной клетке, способной продуцировать один или несколько олигосахаридов грудного молока (ОГМ), где указанная генеAccordingly, one aspect of the invention relates to a genetically modified cell capable of producing one or more human milk oligosaccharides (HMO), wherein said gene
- 4 046005 тически модифицированная клетка включает гетерологичную последовательность нуклеиновой кислоты, кодирующую полипептид, способный транспортировать сахар, причем указанная последовательность нуклеиновой кислоты, имеющая, по меньшей мере, 70%, более предпочтительно, по меньшей мере, 75%, более предпочтительно, по меньшей мере, 80%, более предпочтительно, по меньшей мере, 90% и еще более предпочтительно, по меньшей мере, 95%, например, на 99% идентичности с последовательностью SEQ ID NO: 2.- 4 046005 a chemically modified cell comprises a heterologous nucleic acid sequence encoding a polypeptide capable of transporting sugar, said nucleic acid sequence having at least 70%, more preferably at least 75%, more preferably at least , 80%, more preferably at least 90% and even more preferably at least 95%, for example 99% identity with the sequence of SEQ ID NO: 2.
Соответственно, другой аспект изобретения относится к генетически модифицированной клетке, способной продуцировать одну или несколько ОГМ, при этом указанная клетка включает рекомбинантную нуклеиновую кислоту, кодирующую белок SEQ ID NO: 1, или его функциональный гомолог, аминокислотная последовательность которого идентична, по меньшей мере, на 95,4%, предпочтительно, по меньшей мере, на 96%, более предпочтительно, по меньшей мере, на 97%, более предпочтительно, по меньшей мере, на 99% идентична SEQ ID NO: 1.Accordingly, another aspect of the invention relates to a genetically modified cell capable of producing one or more HGMs, wherein said cell includes a recombinant nucleic acid encoding a protein of SEQ ID NO: 1, or a functional homolog thereof, the amino acid sequence of which is identical at least in 95.4%, preferably at least 96%, more preferably at least 97%, more preferably at least 99% identical to SEQ ID NO: 1.
Под термином функциональный гомолог в настоящем контексте подразумевается белок, аминокислотная последовательность которого более чем на 95,4%, например, на 95,5-99,9% идентична SEQ ID NO: 1, и имеет полезную функцию для достижения, по меньшей мере, одного полезного эффекта изобретения, т.е. увеличение общей продукции ОГМ или выборки ОГМ генетически модифицированной клеткой, облегчают восстановление продуцированного(продуцированных) ОГМ, эффективность продукции ОГМ и/или жизнеспособность клетки, продуцирующей ОГМ.By the term functional homologue, as used herein, is meant a protein whose amino acid sequence is greater than 95.4%, e.g., 95.5-99.9% identical to SEQ ID NO: 1, and has a useful function to achieve at least one useful effect of the invention, i.e. increasing the total production of OGM or sampling of OGM by the genetically modified cell facilitates the recovery of the produced OGM, the efficiency of OGM production, and/or the viability of the OGM producing cell.
Под термином суперсемейства основных посредников (MFS) подразумевают большое и исключительно разнообразное семейство класса вторичных активных транспортеров, которые отвечают за транспорт ряда различных субстратов, включая сахара, лекарства, гидрофобные молекулы, пептиды, органические ионы и т.д. Специфичность белков-переносчиков сахара крайне непредсказуема, и идентификация нового белка-переносчика со специфичностью, например, в отношении олигосахаридов требует необременительных лабораторных экспериментов (более подробную информацию смотри в обзоре Reddy V.S. et al., (2012), FEBS J. 279(11): 2022-2035). Термин переносчик MFS в данном контексте означает белок, который облегчает транспорт олигосахарида, предпочтительно ОГМ, через клеточную мембрану, предпочтительно транспорт ОГМ/олигосахарида, синтезированного генетически модифицированной клеткой, из цитозоля клетки во внешнюю среду клетки, предпочтительно ОГМ/олигосахарида, включающего три или четыре звена сахара, например, 2'-FL, 3-FL, LNT-2, LNT, LNnT, 3'-SL или 6'-SL. Дополнительно или альтернативно переносчик MFS может также способствовать оттоку молекул, которые не считаются ОГМ или олигосахаридами согласно настоящему изобретению, таких как лактоза, глюкоза, клеточные метаболиты или токсины.The term master messenger superfamilies (MFS) refers to a large and extremely diverse family of a class of secondary active transporters that are responsible for the transport of a number of different substrates, including sugars, drugs, hydrophobic molecules, peptides, organic ions, etc. The specificity of sugar transport proteins is highly unpredictable, and the identification of a new transport protein with specificity for, for example, oligosaccharides requires simple laboratory experiments (for more information, see review by Reddy V.S. et al., (2012), FEBS J. 279(11) : 2022-2035). The term MFS transporter in this context means a protein that facilitates the transport of an oligosaccharide, preferably OGM, across the cell membrane, preferably the transport of an OGM/oligosaccharide synthesized by a genetically modified cell from the cytosol of the cell to the external environment of the cell, preferably an OGM/oligosaccharide comprising three or four units sugars, for example 2'-FL, 3-FL, LNT-2, LNT, LNnT, 3'-SL or 6'-SL. Additionally or alternatively, the MFS transporter may also promote the efflux of molecules that are not considered OGM or oligosaccharides according to the present invention, such as lactose, glucose, cellular metabolites or toxins.
Термин идентичность последовательности [определенного]% в контексте двух или более последовательностей нуклеиновых кислот или аминокислот означает, что две или более последовательностей имеют общие нуклеотиды или аминокислотные остатки в данном проценте при сравнении и выравнивании для максимального соответствие в окне сравнения или обозначенных последовательностях нуклеиновых кислот или аминокислот (т.е. последовательности имеют, по меньшей мере, 90-процентную (%) идентичность). Процентную идентичность последовательностей нуклеиновых кислот или аминокислот можно определить с помощью алгоритма сравнения последовательностей BLAST 2.0 с параметрами по умолчанию или путем ручного выравнивания и визуального контроля (см., например, http://www.ncbi.nlm.nih.gov/BLAST/). Это определение также применимо к комплементу тестируемой последовательности и к последовательностям, которые имеют делеции и/или добавления, а также к тем, которые имеют замены. Примером алгоритма, подходящего для определения процента идентичности, сходства последовательностей и выравнивания, служит алгоритм BLAST 2.2.20+, описанный в Altschul et al. Nucl. Acids Res. 25, 3389 (1997). BLAST 2.2.20+ применяют для определения процента идентичности последовательностей нуклеиновых кислот и белков по изобретению. Программное обеспечение для проведения анализов BLAST общедоступно через Национальный центр биотехнологической информации, (http://www.ncbi.nlm.nih.gov/). CLUSTAL Omega (http://www.ebi.ac.uk/Tools/msa/clustalo/), EMBOSS Needle (http://www.ebi.ac.uk/Tools/psa/emboss_needle/), MAFFT (http://mafft.cbrc.jp/alignment/server/) or MUSCLE (http://www.ebi.ac.uk/Tools/msa/muscle/) представляют собой примеры алгоритмов выравнивания последовательностей.The term [specified]% sequence identity in the context of two or more nucleic acid or amino acid sequences means that two or more sequences share a given percentage of nucleotides or amino acid residues when compared and aligned for maximum agreement in the comparison window or designated nucleic acid or amino acid sequences (i.e., the sequences have at least 90 percent (%) identity). Percent identity of nucleic acid or amino acid sequences can be determined using the BLAST 2.0 sequence comparison algorithm with default parameters or by manual alignment and visual inspection (see, for example, http://www.ncbi.nlm.nih.gov/BLAST/) . This definition also applies to the complement of the test sequence and to sequences that have deletions and/or additions, as well as those that have substitutions. An example of an algorithm suitable for determining percent identity, sequence similarity and alignment is the BLAST 2.2.20+ algorithm described in Altschul et al. Nucl. Acids Res. 25, 3389 (1997). BLAST 2.2.20+ is used to determine the percentage identity of nucleic acid and protein sequences according to the invention. Software for performing BLAST analyzes is publicly available through the National Center for Biotechnology Information, (http://www.ncbi.nlm.nih.gov/). CLUSTAL Omega (http://www.ebi.ac.uk/Tools/msa/clustalo/), EMBOSS Needle (http://www.ebi.ac.uk/Tools/psa/emboss_needle/), MAFFT (http: //mafft.cbrc.jp/alignment/server/) or MUSCLE (http://www.ebi.ac.uk/Tools/msa/muscle/) are examples of sequence alignment algorithms.
В контексте изобретения термин олигосахарид означает сахаридный полимер, содержащий ряд моносахаридных звеньев. В некоторых воплощениях предпочтительными олигосахариды представляют собой полимеры сахаридов, состоящие из трех или четырех моносахаридных звеньев, т.е. трисахариды или тетрасахариды. Предпочтительные олигосахариды изобретения представляют собой олигосахариды грудного молока (ОГМ).In the context of the invention, the term oligosaccharide means a saccharide polymer containing a number of monosaccharide units. In some embodiments, preferred oligosaccharides are polymers of saccharides consisting of three or four monosaccharide units, i.e. trisaccharides or tetrasaccharides. Preferred oligosaccharides of the invention are human milk oligosaccharides (HMOs).
ОГМ.OGM.
Термин олигосахарид грудного молока или ОГМ в данном контексте означает сложный углевод, обнаруженный в грудном молоке человека (для отсылки смотри Urashima et al.: Milk Oligosaccharides. Nova Science Publisher (2011); или Chen, Adv. Carbohydr. Chem. Biochem. 72, 113 (2015)). ОГМ имеют структуру ядра, включающую единицу лактозы на восстанавливающем конце, которая может быть удлинена одной или несколькими единицами e-N-ацетиллактозаминила и/или одной или нескольThe term human milk oligosaccharide or HMO in this context means the complex carbohydrate found in human breast milk (for reference, see Urashima et al.: Milk Oligosaccharides. Nova Science Publisher (2011); or Chen, Adv. Carbohydr. Chem. Biochem. 72, 113 (2015)). HMOs have a core structure comprising a lactose unit at the reducing end, which may be extended by one or more e-N-acetyllactosaminyl units and/or one or more
- 5 046005 кими единицами β-лакто-Н-биозила, и эта структура ядра может быть замещенный α-Lфукопиранозильной и/или α-Ν-ацетилнейраминильной (сиалильной) частью. В связи с этим некислотные (или нейтральные) ОГМ лишены остатка сиалила, а кислые ОГМ имеют в своей структуре хотя бы один остаток сиалила. Некислотный (или нейтральный) ОГМ может быть фукозилированным или нефукозилированным. Примеры таких нейтральных нефукозилированных ОГМ включают лакто-Н-триозу 2 (LNT2), лакто-Н-тетраозу (LNT), лакто-Н-неотетраозу (LNnT), лакто-Н-неогексаозу (LNnH), паралакто-Nнеогексаозу (pLNnH), паралакто-Н-гексаозу (pL-НН) и лакто-Н-гексаозу (L-НН). Примеры нейтральных фукозилированных ОГМ включают 2'-фукозиллактозу (2'-FL), лакто-Н-фукопентаозу I (LOTT-I), лактоН-дифукогексаозу I (LNDFH-I), 3-фукозиллактозу (3-FL), дифукозиллактозу (DFL), лакто-Нфукопентаозу II (LXER-II), лакто-Н-фукопентаозу III (LMEP-III), лакто-Н-дифукогексаозу III (LNDFHIII), фукозиллакто-Н-гексаозу II (FLNH-II), лакто-Н-фукопентаозу V (LOTT-V), лакто-Н-дифукогексаозу II (LНDFH-II), фукозил-лакто-Н-гексаозу I (ЕЕ-НН-!). фукозилпаралакто-Н-гексаозу I (ЕрЕНН-I). фукозилпаралакто-Н-неогексаозу II (Е-pLNnH II) и фукозиллакто-Н-неогексаозу (ЕLNnH). Примеры кислотных ОГМ включают З'-сиалиллактозу (3'-SL), 6'-сиалиллактозу (6'-SL), 3-фукозил-3'-сиалиллактозу (FSL), З'-О-сиалиллакто-Н-тетраозу a (LST а), фукозил-LST а (FLST а), 6'-О-сиалиллакто-Н-тетраозу b (LST b), фукозил-LST b (FLST b), 6'-О-сиалиллакто-Н-неотетраозу (LST c), фукозил-LST с (FLST c), З'-Осиалиллакто-Н-неотетраозу (LST d), фукозил-LST d (FLST d), сиалиллакто-Н-гексаозу (SLNH), сиалиллакто-Н-неогексаозу I (SLНH-I), сиалиллакто-Н-неогексаозу II (SLNH-II) и дисиалиллакто-Н-тетраозу (DSLNT). В контексте настоящего изобретения лактозу не рассматривают как разновидность ОГМ.- 5 046005 β-lacto-N-biosyl units, and this core structure may be substituted by an α-L-fucopyranosyl and/or α-N-acetylneuraminyl (sialyl) moiety. In this regard, non-acidic (or neutral) OGMs are devoid of a sialyl residue, while acidic OHMs have at least one sialyl residue in their structure. Non-acidic (or neutral) OGM can be fucosylated or non-fucosylated. Examples of such neutral non-fucosylated HMOs include lacto-N-triose 2 (LNT2), lacto-N-tetraose (LNT), lacto-N-neotetraose (LNnT), lacto-N-neohexaose (LNnH), paralacto-Nneohexaose (pLNnH), paralacto-H-hexaose (pL-НН) and lacto-Н-hexaose (L-НН). Examples of neutral fucosylated HMOs include 2'-fucosyllactose (2'-FL), lacto-H-fucopentaose I (LOTT-I), lacto-H-difucohexaose I (LNDFH-I), 3-fucosyllactose (3-FL), difucosyllactose (DFL ), lacto-N-fucopentaose II (LXER-II), lacto-N-fucopentaose III (LMEP-III), lacto-N-difucohexaose III (LNDFHIII), fucosyllacto-N-hexaose II (FLNH-II), lacto-N- fucopentaose V (LOTT-V), lacto-H-difucohexaose II (LНDFH-II), fucosyl-lacto-H-hexaose I (EE-HH-!). fucosylparalacto-H-hexaose I (EHH-I). fucosylparalacto-N-neohexaose II (E-pLNnH II) and fucosyllacto-N-neohexaose (ELNnH). Examples of acidic HMOs include 3'-sialyllactose (3'-SL), 6'-sialyllactose (6'-SL), 3-fucosyl-3'-sialyllactose (FSL), 3'-O-sialyllacto-H-tetraose a ( LST a), fucosyl-LST a (FLST a), 6'-O-sialyllacto-H-tetraose b (LST b), fucosyl-LST b (FLST b), 6'-O-sialyllacto-H-neotetraose (LST c), fucosyl-LST c (FLST c), 3'-Osialyllacto-H-neotetraose (LST d), fucosyl-LST d (FLST d), sialyllacto-H-hexaose (SLNH), sialyllacto-H-neohexaose I ( SLHH-I), sialyllacto-H-neohexaose II (SLNH-II) and disialyl lacto-H-tetraose (DSLNT). In the context of the present invention, lactose is not considered as a type of HGM.
В некоторых воплощениях изобретения предпочтительными могут быть три-ОГМ и тетра-ОГМ, например, трисахариды 2'-FL, 3-FL, LOT^, З'-SL, 6'-SL, и тетрасахариды DFL, LNT, L^T, FSL.In some embodiments of the invention, tri-OHM and tetra-OHM may be preferred, for example, trisaccharides 2'-FL, 3-FL, LOT^, 3'-SL, 6'-SL, and tetrasaccharides DFL, LNT, L^T, FSL.
В предпочтительном в настоящее время аспекте изобретения предпочтительные ОГМ представляют собой три-ОГМ, в особенности, трисахариды, выбранные из 2'-FL и 3-FL, и тетрасахариды, выбранные из DFL и LOT, такие как, в особенности, 3-FL.In a presently preferred aspect of the invention, preferred OGMs are tri-OHMs, especially trisaccharides selected from 2'-FL and 3-FL, and tetrasaccharides selected from DFL and LOT, such as especially 3-FL.
2'-FL.2'-FL.
2'-Фукозиллактоза (2'-FL или 2'0-фукозиллактоза) представляет собой трисахарид, точнее, фукозилированный, нейтральный трисахарид, состоящий из единиц L-фукозы, D-галактозы и D-глюкозы (Fuca1-2Gaiei-4Glc). Это наиболее распространенный олигосахарид грудного молока (ОГМ), естественным образом присутствующий в человеческом грудном молоке, составляя около 30% всех ОГМ. В генетически модифицированной клетке или в ферментативной реакции 2'-FL продуцируется главным образом в результате ферментативной реакции а-1,2-фукозилтрансферазы с лактозой и донором фукозила.2'-Fucosyllactose (2'-FL or 2'0-fucosyllactose) is a trisaccharide, more precisely a fucosylated, neutral trisaccharide, consisting of L-fucose, D-galactose and D-glucose units (Fuca1-2Gaiei-4Glc). It is the most abundant human milk oligosaccharide (HMO) naturally present in human breast milk, accounting for about 30% of all HMOs. In a genetically modified cell or enzymatic reaction, 2'-FL is produced primarily by the enzymatic reaction of α-1,2-fucosyltransferase with lactose and a fucosyl donor.
3-FL.3-FL.
З-Фукозиллактоза (3-FL) представляет собой трисахарид, точнее, фукозилированный, нейтральный трисахарид, состоящий из D-галактозы, L-фукозы и D-глюкозы (Gaiei-4(Fuca1-3)Glc). Он естественным образом присутствует в грудном молоке. В генетически модифицированной клетке или в ферментативной реакции 3-FL продуцируется, главным образом, ферментативной реакцией а-1,3-фукозилтрансферазы или а-1,3/4-фукозилтрансферазы с лактозой и донором фукозила.3-Fucosyllactose (3-FL) is a trisaccharide, more precisely a fucosylated, neutral trisaccharide consisting of D-galactose, L-fucose and D-glucose (Gaiei-4(Fuca1-3)Glc). It is naturally present in breast milk. In a genetically modified cell or enzymatic reaction, 3-FL is produced primarily by the enzymatic reaction of α-1,3-fucosyltransferase or α-1,3/4-fucosyltransferase with lactose and a fucosyl donor.
LNT.LNT.
Лакто-Н-тетраоза (LOT) представляет собой тетрасахарид, точнее, нейтральный тетрасахарид, состоящий из галактозы, Н-ацетилглюкозамина, галактозы и глюкозы (GlcNAcβ1-3Galβ1-4Glc). Он естественным образом присутствует в грудном молоке.Lacto-N-tetraose (LOT) is a tetrasaccharide, more precisely a neutral tetrasaccharide, consisting of galactose, N-acetylglucosamine, galactose and glucose (GlcNAcβ1-3Galβ1-4Glc). It is naturally present in breast milk.
DFL.DFL.
Дифукозиллактоза (DFL или 2',3-ди-О-фукозиллактоза) представляет собой олигосахарид, точнее, фукузилированный нейтральный тетрасахарид, состоящий из L-фукозы, D-галактозы, L-фукозы и Dглюкозы (Fuca1-2Gaiei-4(Fuca1-3)Glc). Он естественным образом присутствует в грудном молоке. В генетически модифицированной клетке или в ферментативной реакции DFL продуцируется, главным образом, ферментативной реакцией а-1,2-фукозилтрансферазы, а-1,3-фукозилтрансферазы и/или α1,З/4-фукозилтрансферазы с лактозой и двумя донорами фукозилов.Difucosyllactose (DFL or 2',3-di-O-fucosyllactose) is an oligosaccharide, more precisely a fucusylated neutral tetrasaccharide, consisting of L-fucose, D-galactose, L-fucose and D-glucose (Fuca1-2Gaiei-4(Fuca1-3 )Glc). It is naturally present in breast milk. In a genetically modified cell or enzymatic reaction, DFL is produced primarily by the enzymatic reaction of α-1,2-fucosyltransferase, α-1,3-fucosyltransferase and/or α1,3/4-fucosyltransferase with lactose and two fucosyl donors.
Функциональные ферменты.Functional enzymes.
Чтобы иметь возможность синтезировать один или несколько ОГМ, рекомбинантная клетка по изобретению включает, по меньшей мере, одну рекомбинантную нуклеиновую кислоту, которая кодирует функциональный фермент с гликозилтрансферазной активностью. Ген галактозилтрансферазы может быть интегрирован в геном (посредством хромосомной интеграции) генетически модифицированной клетки, или, альтернативно, он может быть включен в плазмидную ДНК и экспрессироваться как переносимый плазмидой. Если для производства ОГМ необходимы две или более гликозилтрансфераз, например, LKT или LNriΓ, то две или более рекомбинантных нуклеиновых кислоты, кодирующих разные ферменты с гликозилтрансферазной активностью, могут быть интегрированы в геном и/или экспрессированы из плазмиды, например в-1,3-Нацетилглюкозаминилтрансферазу (первая рекомбинантная нуклеиновая кислота, кодирующая первую гликозилтрансферазу) в комбинации с в-1,3-галактозилтрансферазой (вторая рекомбинантная нуклеиновая кислота, кодирующая вторую гликозилтрансферазу) для продукции LKT, где первая и вторая рекомбинантные нуклеиновые кислоты могут быть независимо друг от друга интегрированы в хромосомно или на плазмиде.To be able to synthesize one or more OGMs, the recombinant cell of the invention includes at least one recombinant nucleic acid that encodes a functional enzyme with glycosyltransferase activity. The galactosyltransferase gene can be integrated into the genome (via chromosomal integration) of a genetically modified cell, or, alternatively, it can be included in plasmid DNA and expressed as plasmid-borne. If two or more glycosyltransferases, such as LKT or LNriΓ, are required for the production of OGM, then two or more recombinant nucleic acids encoding different enzymes with glycosyltransferase activity can be integrated into the genome and/or expressed from a plasmid, for example β-1,3- Acetylglucosaminyltransferase (the first recombinant nucleic acid encoding the first glycosyltransferase) in combination with β-1,3-galactosyltransferase (the second recombinant nucleic acid encoding the second glycosyltransferase) to produce LKT, where the first and second recombinant nucleic acids can be independently integrated into chromosomal or on a plasmid.
- 6 046005- 6 046005
В одном предпочтительном воплощении, как первая, так и вторая рекомбинантные нуклеиновые кислоты интегрированы в хромосому клетки-продуцента; в другом воплощении, по меньшей мере, одна из первой и второй гликозилтрансфераз представляет собой переносимую плазмидой. Белок/фермент с гликозилтрансферазной активностью (гликозилтрансфераза) может быть выбран в различных воплощениях из ферментов, обладающих активностью а-1,2-фукозилтрансферазы, а-1,3-фукозилтрансферазы, α1,3/4-фукозилтрансферазы, α-1,4-фукозилтрансферазы, а-2,3-сиалилтрансферазы, а-2,6-сиалилтрансферазы, в-1,3-Л-ацетилглюкозаминилтрансферазы, в-1,6-Л-ацетилглюкозаминилтрансферазы, β-1,3галактозилтрансферазы и в-1,4-галактозилтрансферазы. Например, для производства 2'-FL требуется, чтобы модифицированная клетка экспрессировала активный фермент а-1,2-фукозилтрансферазу; для продукции 3-FL модифицированная клетка нуждается в экспрессии активного фермента α-1,3фукозилтрансферазы; для продукции LNT модифицированная клетка должна экспрессировать по меньшей мере две гликозилтрансферазы, в-1,3-Л-ацетилглюкозаминилтрансферазу и β-1,3галактозилтрансферазу; для продукции 6'-SL модифицированная клетка должна экспрессировать активный фермент а-2,6-сиалилтрансферазу и путь для синтеза СМР-сиаловой кислоты; для производства 3'SL модифицированная клетка должна экспрессировать активный фермент а-2,3-сиалилтрансферазу и путь для синтеза СМР-сиаловой кислоты. Некоторые неограничивающие воплощения белков, обладающих гликозилтрансферазной активностью, которые могут кодироваться рекомбинантными генами, включенными в клетку-продуцент, могут быть выбраны из неограничивающих примеров табл. 1.In one preferred embodiment, both the first and second recombinant nucleic acids are integrated into the chromosome of the producing cell; in another embodiment, at least one of the first and second glycosyltransferases is plasmid-borne. The protein/enzyme with glycosyltransferase activity (glycosyltransferase) can be selected in various embodiments from enzymes having α-1,2-fucosyltransferase, α-1,3-fucosyltransferase, α1,3/4-fucosyltransferase, α-1,4- fucosyltransferases, α-2,3-sialyltransferases, α-2,6-sialyltransferases, β-1,3-L-acetylglucosaminyltransferases, β-1,6-L-acetylglucosaminyltransferases, β-1,3-galactosyltransferases and β-1,4- galactosyltransferases. For example, the production of 2'-FL requires that the modified cell express the active enzyme α-1,2-fucosyltransferase; for the production of 3-FL, the modified cell requires the expression of the active enzyme α-1,3 fucosyltransferase; to produce LNT, the modified cell must express at least two glycosyltransferases, β-1,3-L-acetylglucosaminyltransferase and β-1,3galactosyltransferase; to produce 6'-SL, the modified cell must express the active enzyme a-2,6-sialyltransferase and the pathway for the synthesis of CMP-sialic acid; To produce 3'SL, the modified cell must express the active enzyme α-2,3-sialyltransferase and the pathway for the synthesis of CMP-sialic acid. Certain non-limiting embodiments of proteins having glycosyltransferase activity that may be encoded by recombinant genes included in the producer cell may be selected from the non-limiting examples in Table. 1.
Таблица 1Table 1
- 7 046005- 7 046005
Гетерологичная последовательность нуклеиновой кислоты.Heterologous nucleic acid sequence.
Один из аспектов настоящего изобретения представляет собой обеспечение конструкции нуклеиновой кислоты, включающей гетерологичную(гетерологичные) последовательность(последовательности) нуклеиновой кислоты, кодирующую(кодирующие) полипептид, способный к транспортировке сахара, который представляет собой полипептид суперсемейства основных посредников (MFS), как показано в SEQ ID NO: 1, или его функциональный гомолог, аминокислотная последовательность которого более чем на 95,4% идентична последовательности SEQ ID NO: 1, при этом последовательность нуклеиновой кислоты, кодирующая полипептид транспортер Сахаров, имеет, по меньшей мере, 70% идентичности с последовательностью SEQ ID NO: 2.One aspect of the present invention is to provide a nucleic acid construct comprising heterologous nucleic acid sequence(s) encoding a polypeptide capable of transporting a sugar that is a major messenger superfamily (MFS) polypeptide as shown in SEQ ID NO: 1, or a functional homologue thereof, the amino acid sequence of which is more than 95.4% identical to the sequence of SEQ ID NO: 1, and the nucleic acid sequence encoding the sugar transporter polypeptide has at least 70% identity with the sequence SEQ ID NO: 2.
Под термином гетерологичная последовательность нуклеиновой кислоты, кодирующая рекомбиUnder the term heterologous nucleic acid sequence encoding a recombinant
- 8 046005 нантный ген/нуклеиновая кислота/ДНК или кодирующая последовательность нуклеиновой кислоты подразумевают искусственную последовательность нуклеиновой кислоты (т.е. полученную in vitro с применением стандартных лабораторных способов получения последовательностей нуклеиновых кислот), которая включает набор последовательных, неперекрывающихся триплетов (кодонов), которые транскрибируются в мРНК и транслируются в полипептид, когда они находятся под контролем соответствующих контрольных последовательностей, т.е. промотора. Границы кодирующей последовательности обычно определяются сайтом связывания рибосомы, расположенным прямо перед открытой рамкой считывания на 5'-конце мРНК, стартовым кодоном транскрипции (AUG, GUG или UUG) и стоп-кодоном трансляции (UAA, UGA или UAG). Кодирующая последовательность может включать, но не ограничиваться ими, геномную ДНК, кДНК, синтетические и рекомбинантные последовательности нуклеиновых кислот.- 8 046005 nt gene/nucleic acid/DNA or nucleic acid coding sequence means an artificial nucleic acid sequence (i.e. obtained in vitro using standard laboratory methods for obtaining nucleic acid sequences) which includes a set of consecutive, non-overlapping triplets (codons), which are transcribed into mRNA and translated into polypeptide when they are under the control of appropriate control sequences, i.e. promoter The boundaries of the coding sequence are usually defined by the ribosome binding site located just upstream of the open reading frame at the 5' end of the mRNA, the transcription start codon (AUG, GUG, or UUG), and the translation stop codon (UAA, UGA, or UAG). The coding sequence may include, but is not limited to, genomic DNA, cDNA, synthetic and recombinant nucleic acid sequences.
Термин нуклеиновая кислота включает молекулы РНК, ДНК и кДНК. Понятно, что в результате вырождения генетического кода может быть получено множество нуклеотидных последовательностей, кодирующих данный белок. Термин нуклеиновая кислота применяют взаимозаменяемо с термином полинуклеотид.The term nucleic acid includes RNA, DNA and cDNA molecules. It is clear that as a result of the degeneration of the genetic code, many nucleotide sequences encoding a given protein can be obtained. The term nucleic acid is used interchangeably with the term polynucleotide.
Олигонуклеотид представляет собой молекулу нуклеиновой кислоты с короткой цепью.An oligonucleotide is a short-chain nucleic acid molecule.
Праймер представляет собой олигонуклеотид, встречающийся в природе в виде очищенного фрагмента рестрикции или полученный синтетическим путем, который способен действовать как точка инициации синтеза при помещении в условия, в которых индуцируется синтез продукта удлинения праймера, комплементарного цепи нуклеиновой кислоты (т.е. в присутствии нуклеотидов и индуцирующего агента, такого как ДНК-полимераза, и при подходящей температуре и рН). Праймер предпочтительно применяют одноцепочечный для максимальной эффективности амплификации, но альтернативно он может быть двухцепочечным. Если праймер двухцепочечный, то его сначала обрабатывают, чтобы разделить его нити, прежде чем применять для приготовления продуктов для удлинения. Предпочтительно праймер представляет собой дезоксирибонуклеотидную последовательность. Праймер должен быть достаточно длинным, чтобы инициировать синтез продуктов удлинения в присутствии индуцирующего агента. Точная длина праймеров будет зависеть от многих факторов, включая температуру, источник праймера и применение способа.A primer is an oligonucleotide, occurring naturally as a purified restriction fragment or produced synthetically, that is capable of acting as an initiation point for synthesis when placed under conditions that induce synthesis of a primer extension product complementary to the nucleic acid strand (i.e., in the presence of nucleotides and an inducing agent such as DNA polymerase, and at a suitable temperature and pH). The primer is preferably single-stranded for maximum amplification efficiency, but alternatively it can be double-stranded. If the primer is double-stranded, it is first processed to separate its strands before being used to prepare extension products. Preferably the primer is a deoxyribonucleotide sequence. The primer must be long enough to initiate the synthesis of extension products in the presence of an inducing agent. The exact length of the primers will depend on many factors, including temperature, primer source, and method application.
Рекомбинантная нуклеиновая последовательность по изобретению может представлять собой кодирующую последовательность ДНК, например, ген или некодирующая последовательность ДНК, например, регуляторную ДНК, такую как промоторная последовательность. Один аспект изобретения относится к получению рекомбинантной клетки, включающей последовательности рекомбинантной ДНК, кодирующие ферменты, необходимые для продукции одного или нескольких ОГМ, и последовательность ДНК, кодирующую переносчик Fred. Соответственно, в одном воплощении изобретение относится к конструкции нуклеиновой кислоты, включающей кодирующую последовательность нуклеиновой кислоты, т.е. последовательность рекомбинантной ДНК представляющего интерес гена, например, гена гликозилтрансферазы или гена fred, и некодирующую последовательность ДНК, например, последовательность промоторной ДНК, например, рекомбинантную промоторную последовательность, полученную из промотора оперона lac или оперона glp, или промоторную последовательность, полученную из другой последовательности ДНК геномного промотора, или синтетическая промоторная последовательность, где кодирующая и промоторная последовательности функционально связаны. Термин функционально связанный относится к функциональной взаимосвязи между двумя или более сегментами нуклеиновой кислоты (например, ДНК). Как правило, это относится к функциональной связи регуляторной последовательности транскрипции с транскрибируемой последовательностью. Например, промоторная последовательность функционально связана с кодирующей последовательностью, если она стимулирует или модулирует транскрипцию кодирующей последовательности в подходящей клетке-хозяине или другой системе экспрессии. Как правило, промоторные регуляторные последовательности транскрипции, которые функционально связаны с транскрибируемой последовательностью, физически примыкают к транскрибируемой последовательности, т.е. они представляют собой цис-действующие последовательности.The recombinant nucleic acid sequence of the invention may be a DNA coding sequence, such as a gene, or a non-coding DNA sequence, such as regulatory DNA, such as a promoter sequence. One aspect of the invention relates to the production of a recombinant cell comprising recombinant DNA sequences encoding enzymes necessary for the production of one or more OGMs and a DNA sequence encoding the Fred transporter. Accordingly, in one embodiment, the invention relates to a nucleic acid construct comprising a nucleic acid coding sequence, i.e. a recombinant DNA sequence of a gene of interest, e.g., a glycosyltransferase gene or a fred gene, and a non-coding DNA sequence, e.g., a promoter DNA sequence, e.g., a recombinant promoter sequence derived from the promoter of the lac operon or the glp operon, or a promoter sequence derived from another DNA sequence genomic promoter, or synthetic promoter sequence, where the coding and promoter sequences are operably linked. The term operably linked refers to a functional relationship between two or more nucleic acid segments (eg, DNA). Typically, this refers to the functional relationship of a transcription regulatory sequence to a transcribed sequence. For example, a promoter sequence is operably linked to a coding sequence if it stimulates or modulates transcription of the coding sequence in a suitable host cell or other expression system. Typically, promoter transcriptional control sequences that are operably linked to the transcribed sequence are physically adjacent to the transcribed sequence, i.e. they are cis-acting sequences.
В одном воплощении конструкция нуклеиновой кислоты по изобретению может представлять собой частью векторной ДНК, в другом воплощении конструкция представляет собой экспрессионную кассету/картридж, интегрированную в геном клетки-хозяина. Соответственно, термин конструкция нуклеиновой кислоты означает искусственно сконструированный сегмент нуклеиновой кислоты, в особенности, сегмент ДНК, который предназначен для трансплантации в клетку-мишень, например, в клеткумишень, например, в бактериальную клетку, для модификации экспрессии гена генома или экспрессии последовательности гена/кодирующей ДНК, которая может быть включена в конструкцию. В контексте изобретения конструкция нуклеиновой кислоты включает последовательность рекомбинантной ДНК, включающую две или более последовательностей рекомбинантной ДНК по существу, некодирующую последовательность ДНК, включающую последовательность промоторной ДНК, и кодирующую последовательность ДНК, кодирующую представляющий интерес ген, например белок Fred, гликозилтрансферазу или другой ген, пригодный для продукции ОГМ в клетке-хозяине. Предпочтительно конструкция включает дополнительные некодирующие последовательности ДНК, которые либо регулируют трансIn one embodiment, the nucleic acid construct of the invention may be part of a vector DNA; in another embodiment, the construct is an expression cassette/cartridge integrated into the genome of a host cell. Accordingly, the term nucleic acid construct means an artificially engineered segment of nucleic acid, especially a segment of DNA, that is intended to be transplanted into a target cell, e.g., a target cell, e.g., a bacterial cell, to modify the expression of a gene genome or the expression of a gene/coding sequence DNA that can be included in the design. In the context of the invention, the nucleic acid construct includes a recombinant DNA sequence comprising two or more substantially recombinant DNA sequences, a non-coding DNA sequence including a promoter DNA sequence, and a coding DNA sequence encoding a gene of interest, such as a Fred protein, a glycosyltransferase or other gene suitable for the production of OGM in the host cell. Preferably, the construct includes additional non-coding DNA sequences that either regulate trans
- 9 046005 крипцию, либо трансляцию кодирующей ДНК конструкции, например, последовательность ДНК, облегчающую связывание рибосомы с транскриптом, лидирующую последовательность ДНК, которая стабилизирует транскрипт.- 9 046005 transcription, or translation of a DNA coding construct, for example, a DNA sequence that facilitates the binding of a ribosome to a transcript, a leading DNA sequence that stabilizes the transcript.
Интеграция интересующего рекомбинантной нуклеиновой кислоты, включенной в конструкции (в кассету экспрессии), в бактериальный геном может быть достигнута обычными способами, например, с помощью линейных картриджей, содержащих фланкирующие последовательности, гомологичные определенному участку на хромосоме, как описано для attTn7-сайта (Waddell C.S. and Craig N.L., Genes Dev. (1988) Feb;2(2):137-49); способами геномной интеграции последовательностей нуклеиновых кислот, в которых рекомбинация опосредована рекомбиназной функцией Red фага λ или рекомбиназной функцией RecE/RecT профага Rac (Murphy, J Bacteriol. (1998);180(8):2063-7; Zhang et al., Nature Genetics (1998)20: 123-128 Muyrers et al., EMBO Rep.(2000) 1(3): 239-243); способами, основанными на рекомбинации Red/ET (Wenzel et al., Chem Biol. (2005), 12(3):349-56.; Vetcher et al., Appl Environ Microbiol. (2005);71(4):1829-35); или с помощью положительных клонов, т.е. клонов, которые несут кассету экспрессии, могут быть отобраны, например, с помощью маркерного гена, или потери или усиления функции гена.Integration of the recombinant nucleic acid of interest included in the constructs (in the expression cassette) into the bacterial genome can be achieved by conventional methods, for example, using linear cartridges containing flanking sequences homologous to a specific region on the chromosome, as described for the attTn7 site (Waddell C.S. and Craig N.L., Genes Dev. (1988) Feb;2(2):137-49); by means of genomic integration of nucleic acid sequences in which recombination is mediated by the Red recombinase function of phage λ or the RecE/RecT recombinase function of Rac prophage (Murphy, J Bacteriol. (1998);180(8):2063-7; Zhang et al., Nature Genetics (1998)20: 123-128 Muyrers et al., EMBO Rep.(2000) 1(3): 239-243); in ways based on Red/ET recombination (Wenzel et al., Chem Biol. (2005), 12(3):349-56.; Vetcher et al., Appl Environ Microbiol. (2005);71(4):1829 -35); or using positive clones, i.e. clones that carry an expression cassette can be selected, for example, using a marker gene, or a loss or gain of function gene.
Одной копии кассеты экспрессии, включающей интересующий ген, может быть достаточно для обеспечения продукции желаемого ОГМ и достижения желаемых эффектов согласно изобретению. Соответственно, в некоторых предпочтительных воплощениях изобретение относится к рекомбинантной ОГМ-продуцирующей клетке, которая включает одну, две или три копии представляющего интерес гена, интегрированного в геномную ДНК клетки. В некоторых воплощениях предпочтительна единственная копия гена.One copy of an expression cassette comprising the gene of interest may be sufficient to produce the desired OGM and achieve the desired effects of the invention. Accordingly, in some preferred embodiments, the invention provides a recombinant OGM-producing cell that includes one, two or three copies of a gene of interest integrated into the genomic DNA of the cell. In some embodiments, a single copy of the gene is preferred.
В одном предпочтительном воплощении рекомбинантная кодирующая последовательность нуклеиновой кислоты конструкции нуклеиновой кислоты по изобретению представляет собой гетерологичную последовательность по отношению к промотору, что означает, что эквивалентная нативная кодирующая последовательность в геноме вида происхождения транскрибируется под контролем другой промоторной последовательности (т.е. не промоторной последовательности конструкции). Тем не менее, что касается клетки-хозяина, кодирующая ДНК может быть либо гетерологичной (т.е. полученной из другого биологического вида или рода), такой как, например, последовательность ДНК, кодирующая белок Fred, экспрессированная в клетках-хозяевах Escherichia coli, или гомологичной (т.е. полученной из клеткихозяина), такой как, например, гены оперона толстой кишки, гены wca.In one preferred embodiment, the recombinant nucleic acid coding sequence of the nucleic acid construct of the invention is a heterologous sequence with respect to the promoter, which means that the equivalent native coding sequence in the genome of the species of origin is transcribed under the control of a different promoter sequence (i.e., not the promoter sequence of the construct ). However, with respect to the host cell, the encoding DNA may be either heterologous (i.e., derived from another species or genus), such as, for example, the DNA sequence encoding the Fred protein expressed in Escherichia coli host cells, or homologous (ie, derived from a host cell), such as, for example, the colon operon genes, wca genes.
Предпочтительно конструкция по настоящему изобретению, включающая ген, связанный с биосинтетической продукцией ОГМ, промоторную последовательность ДНК и другие регуляторные последовательности, такие как последовательность сайта связывания рибосомы (например, последовательность Шайна-Дальгарно), экспрессируемая в генетически модифицированной клетке, обеспечивает ОГМ на уровне не менее 0,03 г /OD (оптическая плотность) на 1 л ферментационной среды, включающей суспензию генетически модифицированных клеток, например, на уровне от около 0,05 г/л/OD до около 0,5 г/л/OD. Для целей изобретения последний уровень продукции ОГМ считается достаточным, а генетически модифицированная клетка, способная продуцировать желаемый уровень ОГМ, считается подходящей генетически модифицированной клеткой, т.е. клетка может быть дополнительно модифицирована для экспрессии белка-переносчика ОГМ, например, Fred, для достижения хотя бы одного из описанных в настоящем документе эффектов, выгодных для производства ОГМ.Preferably, the construct of the present invention, including a gene associated with the biosynthetic production of OGM, a promoter DNA sequence and other regulatory sequences, such as a ribosome binding site sequence (for example, the Shine-Dalgarno sequence), expressed in a genetically modified cell, provides an OGM at a level of at least 0.03 g/OD (optical density) per 1 liter of fermentation medium comprising a suspension of genetically modified cells, for example at a level of from about 0.05 g/L/OD to about 0.5 g/L/OD. For the purposes of the invention, the latest level of HGM production is considered sufficient, and a genetically modified cell capable of producing the desired level of HGM is considered a suitable genetically modified cell, i.e. the cell may be further modified to express an OGM transporter protein, such as Fred, to achieve at least one of the effects described herein beneficial to OGM production.
Генетически модифицированная клетка или конструкция нуклеиновой кислоты по настоящему изобретению включает последовательность нуклеиновой кислоты, такую как гетерологичный ген, кодирующий предполагаемый белок-переносчик MFS (суперсемейство основных посредников).The genetically modified cell or nucleic acid construct of the present invention includes a nucleic acid sequence, such as a heterologous gene encoding a putative MFS (major mediator superfamily) transporter protein.
Белок Fred - это MFS-транспортер, представляющий особый интерес в настоящем изобретении. Таким образом, конструкция нуклеиновой кислоты по настоящему изобретению включает последовательность нуклеиновой кислоты, имеющую, по меньшей мере, 70% идентичности последовательности с геном, fred, SEQ ID NO: 2.The Fred protein is an MFS transporter of particular interest in the present invention. Thus, the nucleic acid construct of the present invention includes a nucleic acid sequence having at least 70% sequence identity with the gene, fred, SEQ ID NO: 2.
Последовательность нуклеиновой кислоты, содержащаяся в генетически модифицированной клетке или в конструкции нуклеиновой кислоты, кодирует белок последовательности SEQ ID NO: 1 или его функциональный гомолог, аминокислотная последовательность которого, по меньшей мере, на более чем 95,4% идентична SEQ ID NO: 1.The nucleic acid sequence contained in the genetically modified cell or nucleic acid construct encodes a protein of SEQ ID NO: 1 or a functional homolog thereof, the amino acid sequence of which is at least greater than 95.4% identical to SEQ ID NO: 1.
Функциональный гомолог белка последовательности SEQ ID NO: 1 может быть получен путем мутагенеза. Функциональный гомолог должен иметь оставшуюся функциональность не менее 50%, такую как 60%, 70%, 80%, 90% или 100% по сравнению с функциональностью аминокислотной последовательности SEQ ID NO: 1. Функциональный гомолог может иметь более высокую функциональность по сравнению с функциональностью аминокислотной последовательности SEQ ID NO: 1. Функциональный гомолог последовательности SEQ ID NO: 1 должен быть способен усиливать продукцию ОГМ генетически модифицированной клетки по изобретению.A functional homolog of the protein of SEQ ID NO: 1 can be obtained by mutagenesis. A functional homologue must have a remaining functionality of at least 50%, such as 60%, 70%, 80%, 90%, or 100%, compared to the functionality of the amino acid sequence SEQ ID NO: 1. A functional homolog may have higher functionality than the functionality amino acid sequence SEQ ID NO: 1. A functional homolog of the sequence SEQ ID NO: 1 should be capable of enhancing the production of OGM by the genetically modified cell of the invention.
Генетически модифицированная клетка.Genetically modified cell.
Термин генетически модифицированная клетка, применяемый в настоящем документе, понимают как клетку, которая была трансформирована или трансфицирована гетерологичной полинуклеотиднойThe term genetically modified cell as used herein is understood to mean a cell that has been transformed or transfected with a heterologous polynucleotide
- 10 046005 последовательностью. В данном контексте термины генетически модифицированная клетка и клеткахозяин применяют взаимозаменяемо.- 10 046005 sequence. In this context, the terms genetically modified cell and host cell are used interchangeably.
Соответственно, термин генетически модифицированная клетка или генетически модифицированная клетка в данном контексте понимают как клетку-хозяина, которая была трансформирована или трансфицирована экзогенной полинуклеотидной последовательностью.Accordingly, the term genetically modified cell or genetically modified cell in this context is understood as a host cell that has been transformed or transfected with an exogenous polynucleotide sequence.
Генетически модифицированная клетка предпочтительно представляет собой прокариотическую клетку. Подходящие микробные клетки, которые могут функционировать в качестве клетки-хозяина, включают дрожжевые клетки, бактериальные клетки, клетки архебактерий, клетки водорослей и клетки грибов.The genetically modified cell is preferably a prokaryotic cell. Suitable microbial cells that can function as a host cell include yeast cells, bacterial cells, archaebacterial cells, algal cells and fungal cells.
Клетка-хозяин.Host cell.
Генетически модифицированная клетка (клетка-хозяин или рекомбинантная клетка) может представлять собой, например, бактериальную или дрожжевую клетку. В одном предпочтительном воплощении генетически модифицированная клетка представляет собой бактериальную клетку.The genetically modified cell (host cell or recombinant cell) may be, for example, a bacterial or yeast cell. In one preferred embodiment, the genetically modified cell is a bacterial cell.
Что касается бактериальных клеток-хозяев, то, в принципе ограничений нет; они могут представлять собой эубактерии (грамм-положительные или грамм-отрицательные) или архебактерий, если они допускают генетические манипуляции для вставки интересующего гена и их можно культивировать в производственных масштабах. Предпочтительно клетка-хозяин обладает свойством культивирования до высокой плотности клеток. Неограничивающими примерами бактериальных клеток-хозяев, подходящих для рекомбинантного промышленного производства ОГМ согласно изобретению, могут представлять собой Erwinia herbicola (Pantoea agglomerans), Citrobacter freundii, Pantoea citrea, Pectobacterium carotovorum или Xanthomonas campestris. Также могут быть применены бактерии рода Bacillus, в том числе Bacillus subtilis, Bacillus licheniformis, Bacillus coagulans, Bacillus thermophilus, Bacillus laterosporus, Bacillus megaterium, Bacillus mycoides, Bacillus pumilus, Bacillus lentus, Bacillus cereus и Bacillus circulans. Аналогично, бактерии родов Lactobacillus и Lactococcus могут быть модифицированы с применением способов по данному изобретению, включая, но не ограничиваясь ими, Lactobacillus acidophilus, Lactobacillus salivarius, Lactobacillus plantarum, Lactobacillus helveticus, Lactobacillus delbrueckii, Lactobacillus rhamnosus, Lactobacillus bulgaricus, Lactobacillus crispatus, Lactobacillus gasseri, Lactobacillus casei, Lactobacillus reuteri, Lactobacillus jensenii и Lactococcus lactis. Streptococcus thermophiles и Proprionibacterium freudenreichii также представляют собой подходящие виды бактерий для описанного в настоящем документе изобретения. Также часть этого изобретения представляют собой штаммы, модифицированные, как описано в настоящем документе, из родов Enterococcus (например, Enterococcus faecium и Enterococcus thermophiles), Bifidobacterium (например, Bifidobacterium longum, Bifidobacterium infantis и Bifidobacterium bijidum), Sporolactobacillus spp., Micromomospora spp., Micrococcus spp., Rhodococcus spp. и Pseudomonas (например, Pseudomonas fluorescens и Pseudomonas aeruginosa).As far as bacterial host cells are concerned, there are in principle no restrictions; they may be eubacteria (gram-positive or gram-negative) or archaebacteria if they can be genetically manipulated to insert the gene of interest and can be cultured on a commercial scale. Preferably, the host cell has the ability to be cultured to a high cell density. Non-limiting examples of bacterial host cells suitable for the recombinant industrial production of HMOs according to the invention include Erwinia herbicola (Pantoea agglomerans), Citrobacter freundii, Pantoea citrea, Pectobacterium carotovorum or Xanthomonas campestris. Bacteria of the genus Bacillus can also be used, including Bacillus subtilis, Bacillus licheniformis, Bacillus coagulans, Bacillus thermophilus, Bacillus laterosporus, Bacillus megaterium, Bacillus mycoides, Bacillus pumilus, Bacillus lentus, Bacillus cereus and Bacillus circulans. Likewise, bacteria of the genera Lactobacillus and Lactococcus can be modified using the methods of this invention, including, but not limited to, Lactobacillus acidophilus, Lactobacillus salivarius, Lactobacillus plantarum, Lactobacillus helveticus, Lactobacillus delbrueckii, Lactobacillus rhamnosus, Lactobacillus bulgaricus, Lactobacillus crispat us, Lactobacillus gasseri , Lactobacillus casei, Lactobacillus reuteri, Lactobacillus jensenii and Lactococcus lactis. Streptococcus thermophiles and Proprionibacterium freudenreichii are also suitable bacterial species for the invention described herein. Also part of this invention are strains modified as described herein from the genera Enterococcus (for example, Enterococcus faecium and Enterococcus thermophiles), Bifidobacterium (for example, Bifidobacterium longum, Bifidobacterium infantis and Bifidobacterium bijidum), Sporolactobacillus spp., Micromomospora spp. , Micrococcus spp., Rhodococcus spp. and Pseudomonas (eg Pseudomonas fluorescens and Pseudomonas aeruginosa).
Бактерии, включающие характеристики, описанные в настоящем документе, культивируют в присутствии лактозы, и олигосахарид, такой как ОГМ, продуцируемый клеткой, выделяют либо из самой бактерии, либо из культурального супернатанта бактерии. В одном предпочтительном воплощении генетически модифицированная клетка по изобретению представляет собой клетку Escherichia coli.Bacteria comprising the characteristics described herein are cultured in the presence of lactose, and an oligosaccharide, such as OGM, produced by the cell is isolated either from the bacterium itself or from the culture supernatant of the bacterium. In one preferred embodiment, the genetically modified cell of the invention is an Escherichia coli cell.
В другом предпочтительном воплощении клетка-хозяин представляет собой дрожжевую клетку, например, Saccharomyces cerevisiae, Schizosaccharomyces pombe, Pichia pastoris, Kluveromyces lactis, Kluveromyces marxianus и т.п.In another preferred embodiment, the host cell is a yeast cell, for example, Saccharomyces cerevisiae, Schizosaccharomyces pombe, Pichia pastoris, Kluveromyces lactis, Kluveromyces marxianus, and the like.
Генетически модифицированные клетки по изобретению могут быть получены с применением стандартных способов в данной области техники, например, описанных в руководствах Sambrook et al., Wilson & Walker, Maniatise et al. и Ausubel et al.Genetically modified cells according to the invention can be obtained using standard methods in the art, for example, described in the manuals of Sambrook et al., Wilson & Walker, Maniatise et al. and Ausubel et al.
Хозяин, подходящий для производства ОГМ, например E.coli, может включать эндогенный ген β-галактозидазы или экзогенный ген β-галактозидазы, например, E.coli включает эндогенный ген lacZ (например, номер доступа в GenBank V00296 (GL41901)). Для целей изобретения клетка-хозяин, продуцирующая ОГМ, подвергается генетическим манипуляциям либо для включения любого гена β-галактозидазы, либо для включения гена, который инактивирован. Ген может быть инактивирован путем полной или частичной делеции соответствующей последовательности нуклеиновой кислоты из бактериального генома, или последовательность гена может быть мутирована так, как она транскрибируется, или, если транскрибируется, транскрипт не транслируется, или если транслируется в белок (т.е. β-галактозидазу), то белок не обладает соответствующей ферментативной активностью. Таким образом, бактерия, продуцирующая ОГМ, накапливает повышенный внутриклеточный пул лактозы, что полезно для продукции ОГМ.A host suitable for OGM production, eg E. coli, may include an endogenous β-galactosidase gene or an exogenous β-galactosidase gene, eg E. coli includes an endogenous lacZ gene (eg, GenBank accession number V00296 (GL41901)). For the purposes of the invention, the host cell producing OGM is genetically manipulated to either turn on any β-galactosidase gene or turn on a gene that is inactivated. A gene may be inactivated by complete or partial deletion of the corresponding nucleic acid sequence from the bacterial genome, or the gene sequence may be mutated as it is transcribed, or, if transcribed, the transcript is not translated, or if translated into a protein (i.e., β- galactosidase), then the protein does not have the appropriate enzymatic activity. Thus, the OGM-producing bacterium accumulates an increased intracellular pool of lactose, which is beneficial for OGM production.
В некоторых воплощениях сконструированная бактерия включает дефицитный катаболический путь сиаловой кислоты. Под катаболическим путем сиаловой кислоты подразумевается последовательность реакций, обычно контролируемая и катализируемая ферментами, которая приводит к разложению сиаловой кислоты. Примерный путь катаболизма сиаловой кислоты, описанный в настоящем документе, представляет собой путь E.coli. В этом пути сиаловая кислота (Neu5Ac; N-ацетилнейраминовая кислота) расщепляется ферментами NanA (лиаза N-ацетилнейраминовой кислоты), NanK (N-ацетилманIn some embodiments, the engineered bacterium includes a deficient sialic acid catabolic pathway. The sialic acid catabolic pathway refers to the sequence of reactions, usually controlled and catalyzed by enzymes, that leads to the degradation of sialic acid. An exemplary sialic acid catabolic pathway described herein is the E. coli pathway. In this pathway, sialic acid (Neu5Ac; N-acetylneuraminic acid) is degraded by the enzymes NanA (N-acetylneuraminic acid lyase), NanK (N-acetylman
- 11 046005 нозаминкиназа) и NanE (N-ацетилманнозамин-б-фосфатэпимераза), все кодируемые из оперона nanATEK-yhcH, и подавляется NanR (http://ecocyc.org/ECOLI). Недостаточный катаболический путь сиаловой кислоты воспроизводится у хозяина E.coli путем внесения мутации в эндогенные гены nanA (Nацетилнейраминалиаза) (например, номер доступа в GenBank D00067.1(GL216588)) и/или nanK (Nацетилманнозаминкиназа) (например, номер доступа в GenBank (аминокислота) ВАЕ77265.1 (GL85676015)), и/или nanE (N-ацетилманнозамин-б-фосфатэпимераза, GI: 947745, включена сюда посредством отсылки). Необязательно, ген nanT (транспортер N-ацетилнейрамината) также инактивируют или мутируют. Другие промежуточные продукты метаболизма сиаловой кислоты включают: (ManNAc-6P) N-ацетилманнозамин-б-фосфат; (GlcNAc-6-P) N-ацетилглюкозамин-б-фосфат; (GlcN-6-P) глюкозамин6-фосфат и (Fruc-6-P) фруктозо-6-фосфат. В некоторых предпочтительных воплощениях, nanA мутирован. В других предпочтительных воплощениях, nanA и nanK мутированы, тогда как nanE остается функциональным. В другом предпочтительном воплощении, nanA и nanE мутированы, тогда как nanK не был мутирован, инактивирован или удален. Мутация представляет собой одно или несколько изменений в последовательности нуклеиновой кислоты, кодирующей продукт гена nanA, nanK, nanE и/или nanT. Например, мутация может представлять собой 1, 2, до 5, до 10, до 25, до 50 или до 100 изменений в последовательности нуклеиновой кислоты. Например, nanA, nanK, nanE и/или nanT гены мутируют путем нулевой мутации. Нулевые мутации, как описано в настоящем документе, включают аминокислотные замены, добавления, делеции или вставки, которые либо вызывают потерю функции фермента (т.е. снижение или отсутствие активности), либо потерю фермента (т.е. отсутствие генного продукта). Под удаленными подразумевают, что кодирующая область удалена полностью или частично, так что не образуется (функциональный) продукт гена. Под инактивацией подразумевается, что кодирующая последовательность была изменена таким образом, что полученный генный продукт будет функционально неактивным или будет кодировать генный продукт с активностью, менее чем на 100%, например, на 90%, 80%, 70%, 60%, 50%, 40%, 30% или 20% по сравнению с активностью нативного, встречающегося в природе, эндогенного генного продукта. Немутированный ген или белок не отличается от нативной, встречающейся в природе или эндогенной кодирующей последовательности на 1, 2, вплоть до 5, вплоть до 10, вплоть до 20, вплоть до 50, вплоть до 100, вплоть до от 200 или вплоть до 500 или более кодонов или до соответствующей закодированной аминокислотной последовательности.- 11 046005 nosamine kinase) and NanE (N-acetylmannosamine-b-phosphate epimerase), all encoded from the nanATEK-yhcH operon, and repressed by NanR (http://ecocyc.org/ECOLI). The deficient sialic acid catabolic pathway is replicated in the E. coli host by introducing mutations into the endogenous nanA (Nacetylneuraminaliase) (e.g., GenBank accession number D00067.1(GL216588)) and/or nanK (Nacetylmannosamine kinase) genes (e.g., GenBank accession number ( amino acid) BAE77265.1 (GL85676015)), and/or nanE (N-acetylmannosamine-b-phosphate epimerase, GI: 947745, incorporated herein by reference). Optionally, the nanT (N-acetylneuraminate transporter) gene is also inactivated or mutated. Other intermediates of sialic acid metabolism include: (ManNAc-6P) N-acetylmannosamine b-phosphate; (GlcNAc-6-P) N-acetylglucosamine-b-phosphate; (GlcN-6-P) glucosamine 6-phosphate and (Fruc-6-P) fructose 6-phosphate. In some preferred embodiments, nanA is mutated. In other preferred embodiments, nanA and nanK are mutated while nanE remains functional. In another preferred embodiment, nanA and nanE are mutated, while nanK has not been mutated, inactivated or deleted. A mutation is one or more changes in the nucleic acid sequence encoding the gene product nanA, nanK, nanE and/or nanT. For example, a mutation may represent 1, 2, up to 5, up to 10, up to 25, up to 50, or up to 100 changes in the nucleic acid sequence. For example, the nanA, nanK, nanE and/or nanT genes are mutated by null mutation. Null mutations, as described herein, include amino acid substitutions, additions, deletions or insertions that either cause loss of enzyme function (ie, decreased or absent activity) or loss of enzyme (ie, absence of gene product). By deleted we mean that the coding region has been removed in whole or in part so that no (functional) gene product is generated. By inactivation it is meant that the coding sequence has been altered such that the resulting gene product is functionally inactive or encodes a gene product with less than 100% activity, e.g. 90%, 80%, 70%, 60%, 50% , 40%, 30% or 20% compared to the activity of the native, naturally occurring, endogenous gene product. An unmutated gene or protein does not differ from the native, naturally occurring, or endogenous coding sequence by 1, 2, up to 5, up to 10, up to 20, up to 50, up to 100, up to 200, or up to 500 or more codons or up to the corresponding encoded amino acid sequence.
Кроме того, бактерия (например, E.coli) также обладает способностью к синтезу сиаловой кислоты. Например, бактерия обладает способностью синтезировать сиаловую кислоту за счет экзогенной UDPGlcNAc 2-эпимеразы (например, neuC из Campylobacter jejuni (GenBank AAK91727.1) или ее эквивалента (например, (GenBank CAR04561.1), синтазы Neu5Ac (например, neuB из С. jejuni (GenBank AAK91726.1) или ее эквивалента (например, синтазы сиаловой кислоты из Flavobacterium limnosediminis, GenBank WP_023580510.1), и/или синтазы CMP-Neu5Ac (например, neuA из С. jejuni (GenBank AAK91728.1) или ее эквивалента (например, СМР-синтазы сиаловой кислоты из Vibrio brasiliensis, GenBank WP_006881452.1).In addition, the bacterium (eg E. coli) also has the ability to synthesize sialic acid. For example, the bacterium has the ability to synthesize sialic acid through exogenous UDPGlcNAc 2-epimerase (for example, neuC from Campylobacter jejuni (GenBank AAK91727.1) or its equivalent (for example, (GenBank CAR04561.1), Neu5Ac synthase (for example, neuB from C. jejuni (GenBank AAK91726.1) or its equivalent (e.g., sialic acid synthase from Flavobacterium limnosediminis, GenBank WP_023580510.1), and/or CMP-Neu5Ac synthase (e.g., neuA from C. jejuni (GenBank AAK91728.1) or its equivalent (e.g. sialic acid CMP synthase from Vibrio brasiliensis, GenBank WP_006881452.1).
Получение нейтрального ОГМ, содержащего N-ацетилглюкозамин, в модифицированных бактериях также известно в данной области техники (смотри, например, Gebus С. et al. (2012) Carbohydrate Research 363 83-90).The production of neutral OGM containing N-acetylglucosamine in modified bacteria is also known in the art (see, for example, Gebus C. et al. (2012) Carbohydrate Research 363 83-90).
Для производства ОГМ, содержащих N-ацетилглюкозамин, таких как лакто-Ы-триоза 2 (LNT-2), лакто-Ы-тетраоза (LNT), лакто-Н-неотетраоза (LNnT), лакто-Н-фукопентаоза I (LNFP-I), лакто-Nфукопентаоза II (LNFP-II), лакто-М-фукопентаоза III (LNFP-III), лакто-М-фукопентаоза V (LNFP-V), лакTO-N-дифукогексаоза I (LDFH-I), лaкто-N-дифукогексаоза II (LDFH-II) и лαкто-N-неодифукогексаоза II (LNDFH-III), как описано выше, и она модифицирована так, чтобы включать экзогенный ген UDPGlcNAc:Gala/e-R в-3-\-ацетилглюкозаминилтрансферазы или его функциональный вариант или фрагмент. Этот экзогенный ген UDP-GlcNAc:Gala/e-R β-3-N-ацетилглюкозаминилтрaнсферaзы может быть получен из любого из ряда источников, например, из гена lgtA, описанного в N. meningitides (номер доступа белка в GenBank AAF42258.1) или N. gonorrhoeae (номер доступа белка в GenBank ACF31229.1). Необязательно дополнительный ген экзогенной гликозилтрансферазы может быть коэкспрессирован в бактерии, включающей экзогенный ген UDP-GlcNAc:Gala/e-R в-3-\-ацетилглюкозаминилтрансферазы. Например, ген в-1,4-галактозилтрансферазы коэкспрессируется с геном UDP-GlcNAc:Gala/e-R β-3-Nацетилглюкозаминилтрансферазы. Этот экзогенный ген в-1,4-галактозилтрансферазы может быть получен из любого источника, например, описанного в N. meningitidis, ген lgtB (номер доступа белка в GenBank AAF42257.1) или из Н. pylori, ген HP0826lgalT (номер доступа белка в GenBank NP_207619.1). Необязательно дополнительный ген экзогенной гликозилтрансферазы, коэкспрессируемый в бактерии, включающей экзогенный ген UDP-GlcNAc:Gala/e-R в-3-\-ацетилглюкозаминилтрансферазы, представляет собой ген в-1,3-галактозилтрансферазы, например, тот, что описан из E.coli 055:Н7, ген wbgO (номер доступа белка в GenBank WP_000582563.1), или из Н. pylori, ген jhp0563 (номер доступа белка в GenBank AEZ55696.1), или из Streptococcus agalactiae тип Ib OI2 ген cpslBJ g (номер доступа белка в GenBank АВ050723).Раскрытое изобретение также охватывает функциональные варианты и фрагменты любого из ферментов, описанных выше.For the production of OGM containing N-acetylglucosamine, such as lacto-N-triose 2 (LNT-2), lacto-N-tetraose (LNT), lacto-N-neotetraose (LNnT), lacto-N-fucopentaose I (LNFP- I), lacto-N-fucopentaose II (LNFP-II), lacto-M-fucopentaose III (LNFP-III), lacto-M-fucopentaose V (LNFP-V), lacTO-N-difucohexaose I (LDFH-I), lacto -N-difucohexaose II (LDFH-II) and lαcto-N-neodifucohexaose II (LNDFH-III) as described above, and it is modified to include the exogenous UDPGlcNAc:Gala/e-R b-3-\-acetylglucosaminyltransferase gene or its functional variant or fragment. This exogenous UDP-GlcNAc:Gala/e-R β-3-N-acetylglucosaminyltransferase gene can be obtained from any of a number of sources, for example, from the lgtA gene described in N. meningitides (GenBank protein accession number AAF42258.1) or N. gonorrhoeae (GenBank protein accession number ACF31229.1). Optionally, an additional exogenous glycosyltransferase gene can be coexpressed in the bacterium including an exogenous UDP-GlcNAc:Gala/e-R β-3-\-acetylglucosaminyltransferase gene. For example, the β-1,4-galactosyltransferase gene is coexpressed with the UDP-GlcNAc:Gala/e-R β-3-Nacetylglucosaminyltransferase gene. This exogenous β-1,4-galactosyltransferase gene can be obtained from any source, for example, those described in N. meningitidis, lgtB gene (GenBank protein accession number AAF42257.1) or from H. pylori, gene HP0826lgalT (protein accession number in GenBank NP_207619.1). Optionally, the additional exogenous glycosyltransferase gene coexpressed in the bacterium including the exogenous UDP-GlcNAc:Gala/e-R β-3-\-acetylglucosaminyltransferase gene is a β-1,3-galactosyltransferase gene, such as that described from E. coli 055 :H7, gene wbgO (GenBank protein accession number WP_000582563.1), or from H. pylori, gene jhp0563 (GenBank protein accession number AEZ55696.1), or from Streptococcus agalactiae type Ib OI2 gene cpslBJ g (protein accession number in GenBank AB050723). The disclosed invention also covers functional variants and fragments of any of the enzymes described above.
- 12 046005- 12 046005
Ген N-ацетилглюкозаминилтрансферазы и/или ген галактозилтрансферазы также может быть функционально связан с Pglp и экспрессироваться из соответствующей интегрированной в геном кассеты. В одном воплощении ген, интегрированный в геном, представляет собой ген, кодирующий галактозилтрансферазу, например, ген НР0826, кодирующий фермент GalT из Н. pylori (номер доступа белка в GenBank NP_207619.1); в другом воплощении ген, интегрированный в геном, представляет собой ген, кодирующий в-1,3-Н-ацетилглюкозаминилтрансферазу, например, ген lgtA из N. meningitidis (номер доступа белка в GenBank AAF42258.1). В этих воплощениях второй ген, т.е. ген, кодирующий p-1,3-Nацетилглюкозаминилтрансферазу или галактозилтрансферазу, соответственно, может экспрессироваться либо из интегрированной в геном, либо из переносимой плазмидой кассеты. Второй ген необязательно может экспрессироваться либо под контролем промотора glp или под контролем любого другого промотора, подходящего для системы экспрессии, например, Plac.The N-acetylglucosaminyltransferase gene and/or the galactosyltransferase gene may also be operably linked to Pglp and expressed from the corresponding genomically integrated cassette. In one embodiment, the gene integrated into the genome is a gene encoding a galactosyltransferase, for example, the HP0826 gene encoding the GalT enzyme from H. pylori (GenBank protein accession number NP_207619.1); in another embodiment, the gene integrated into the genome is a gene encoding a β-1,3-H-acetylglucosaminyltransferase, for example, the lgtA gene from N. meningitidis (GenBank protein accession number AAF42258.1). In these embodiments, the second gene, i.e. the gene encoding p-1,3-Nacetylglucosaminyltransferase or galactosyltransferase, respectively, can be expressed from either a genome-integrated or plasmid-borne cassette. The second gene may optionally be expressed either under the control of a glp promoter or under the control of any other promoter suitable for the expression system, for example, Plac.
Клетки-хозяева, продуцирующие ОГМ, обычно включают функциональный ген lacY и дисфункциональный ген lacZ.Host cells that produce OGM typically include a functional lacY gene and a dysfunctional lacZ gene.
ОГМ, продуцируемые рекомбинантными клетками по изобретению, могут быть очищены с применением подходящей процедуры, доступной в данной области техники (например, такой, как описана в WO 2015188834, WO 2017182965 или WO 2017152918).The OGM produced by the recombinant cells of the invention can be purified using a suitable procedure available in the art (eg, such as described in WO 2015188834, WO 2017182965 or WO 2017152918).
Кодируемый полипептид, способный транспортировать сахар.An encoded polypeptide capable of transporting sugar.
Транспорт сахара относится к транспорту сахара, такого как, но не ограничиваясь этим, олигосахарида, а в связи с изобретением к транспорту притока и/или оттока одного и/или нескольких ОГМ из цитоплазмы или периплазмы генетически модифицированной клетки в продукционную среду и/или из продукционной среды в цитоплазму или периплазму генетически модифицированной клетки. Таким образом, экспрессируемый в генетически модифицированной клетке полипептид, способный транспортировать ГМО из цитоплазмы или периплазмы в продукционную среду и/или из продукционной среды в цитоплазму или периплазму генетически модифицированной клетки, представляет собой полипептид, способный к транспорту сахара. Таким образом, в настоящем изобретении транспортировка сахара может означать транспортировку оттока и/или притока сахара, такого как, но, не ограничиваясь этим, олигосахарида.Sugar transport refers to the transport of a sugar, such as, but not limited to, an oligosaccharide, and in connection with the invention, to the transport of the influx and/or efflux of one and/or several OGMs from the cytoplasm or periplasm of a genetically modified cell into and/or out of the production environment environment into the cytoplasm or periplasm of a genetically modified cell. Thus, a polypeptide expressed in a genetically modified cell that is capable of transporting GMOs from the cytoplasm or periplasm to the production environment and/or from the production environment to the cytoplasm or periplasm of the genetically modified cell is a polypeptide capable of transporting sugar. Thus, in the present invention, transport of sugar may mean transport of efflux and/or influx of sugar, such as, but not limited to, an oligosaccharide.
В этом отношении полипептид, способный транспортировать сахар, представляет собой полипептид, принадлежащий к суперсемейству основных переносчиков (MFS). В особенности, полипептид имеет более чем 95,4%, например, по меньшей мере, 95,5%, например, по меньшей мере, 96%, 97%, 98% или 99% идентичности последовательности с SEQ ID NO: 1, или он представляет собой его функциональный вариант, как описано в настоящем документе. SEQ ID NO: 1 представляет собой аминокислотную последовательность белка Fred.In this regard, the polypeptide capable of transporting sugar is a polypeptide belonging to the major transporter superfamily (MFS). Specifically, the polypeptide has greater than 95.4%, such as at least 95.5%, such as at least 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO: 1, or it represents a functional variant thereof as described herein. SEQ ID NO: 1 is the amino acid sequence of the Fred protein.
Генетически модифицированная клетка или конструкция нуклеиновой кислоты по настоящему изобретению включает последовательность нуклеиновой кислоты, такую как гетерологичный ген, кодирующий белок Fred. Указанная последовательность нуклеиновой кислоты имеет, по меньшей мере, 70% идентичности последовательности с геном fred, как показано в SEQ ID NO: 2, например, по меньшей мере, 75/, 80%, 85%, 90%, 95% или 99%.The genetically modified cell or nucleic acid construct of the present invention includes a nucleic acid sequence, such as a heterologous gene encoding the Fred protein. Said nucleic acid sequence has at least 70% sequence identity with the fred gene as shown in SEQ ID NO: 2, for example, at least 75/, 80%, 85%, 90%, 95% or 99% .
Конструкция последовательности нуклеиновой кислоты кодирует белок SEQ ID NO: 1 или его функциональный гомолог, аминокислотная последовательность которого более чем на 95,4%, например, по меньшей мере, на 95,5%, 96%, 97%, 98 или 99% идентична SEQ ID NO: 1.The nucleic acid sequence construct encodes a protein of SEQ ID NO: 1 or a functional homolog thereof that has greater than 95.4%, such as at least 95.5%, 96%, 97%, 98, or 99% amino acid sequence identity SEQ ID NO: 1.
Функциональный гомолог белка SEQ ID NO: 1 может быть получен путем мутагенеза. Функциональный гомолог должен иметь остаточную функциональность по меньшей мере 50%, например, 60%, 70%, 80%, 90% или 100%, по сравнению с функциональностью аминокислотной последовательности SEQ ID NO: 1. Функциональный гомолог может иметь более высокую функциональность по сравнению с функциональностью аминокислотной последовательности SEQ ID NO: 1. Функциональный гомолог SEQ ID NO: 1 должен быть способен усиливать продукцию ОГМ генетически модифицированной клеткой согласно изобретению.A functional homologue of the protein SEQ ID NO: 1 can be obtained by mutagenesis. The functional homolog must have a residual functionality of at least 50%, such as 60%, 70%, 80%, 90%, or 100%, compared to the functionality of the amino acid sequence SEQ ID NO: 1. The functional homolog may have higher functionality than with the functionality of the amino acid sequence SEQ ID NO: 1. The functional homolog of SEQ ID NO: 1 should be capable of enhancing the production of OGM by the genetically modified cell according to the invention.
Генетически модифицированная клетка или конструкция нуклеиновой кислоты может содержать одну или несколько последовательностей нуклеиновой кислоты, кодирующих полипептид, способный к транспортировке сахара. Чаще генетически модифицированная клетка или конструкция нуклеиновой кислоты по изобретению кодирует единственную копию полипептида, способного транспортировать сахар.The genetically modified cell or nucleic acid construct may contain one or more nucleic acid sequences encoding a polypeptide capable of transporting a sugar. More commonly, the genetically modified cell or nucleic acid construct of the invention encodes a single copy of a polypeptide capable of transporting sugar.
Одной копии экспрессионной кассеты, включающей интересующий ген, может быть достаточно для обеспечения продукции желаемого ОГМ и достижения желаемых эффектов согласно изобретению. Соответственно, в некоторых предпочтительных вариантах осуществления изобретение относится к клетке, продуцирующей рекомбинантный ОГМ, которая включает одну, две или три копии интересующего гена или генов, интегрированных в геномную ДНК клетки. В некоторых воплощениях предпочтительна единственная копия гена или генов.One copy of an expression cassette comprising the gene of interest may be sufficient to produce the desired OGM and achieve the desired effects of the invention. Accordingly, in some preferred embodiments, the invention relates to a cell producing a recombinant HGM that includes one, two or three copies of the gene or genes of interest integrated into the genomic DNA of the cell. In some embodiments, a single copy of the gene or genes is preferred.
Генетически модифицированная клетка или конструкция нуклеиновой кислоты может также содержать один или несколько регуляторных элементов для регуляции экспрессии последовательностиThe genetically modified cell or nucleic acid construct may also contain one or more regulatory elements to regulate the expression of the sequence
- 13 046005 нуклеиновой кислоты, кодирующей полипептид, транспортирующий сахар, и при этом указанная последовательность нуклеиновой кислоты имеет, по меньшей мере, 70% идентичности последовательности с SEQ ID NO: 2.- 13 046005 of a nucleic acid encoding a sugar transport polypeptide, wherein said nucleic acid sequence has at least 70% sequence identity with SEQ ID NO: 2.
Регуляторный элемент.Regulatory element.
Как указано выше, генетически модифицированная клетка или конструкция нуклеиновой кислоты могут дополнительно включать последовательность нуклеиновой кислоты, включающую регуляторный элемент для регуляции экспрессии последовательности нуклеиновой кислоты, имеющей, по меньшей мере, 70% идентичности последовательности с SEQ ID NO: 2. Последовательность нуклеиновой кислоты регуляторной области может быть гетерологичной или гомологичной.As stated above, the genetically modified cell or nucleic acid construct may further include a nucleic acid sequence including a regulatory element for regulating the expression of a nucleic acid sequence having at least 70% sequence identity with SEQ ID NO: 2. Regulatory Region Nucleic Acid Sequence may be heterologous or homologous.
Термин регуляторный элемент, или промотор, или промоторная область, или промоторный элемент представляет собой последовательность нуклеиновой кислоты, которая распознается и связывается ДНК-зависимой РНК-полимеразой во время инициации транскрипции. Промотор вместе с другими последовательностями нуклеиновых кислот, регулирующими транскрипцию и трансляцию (также называемыми контрольными последовательностями), необходим для экспрессии данного гена или группы генов (оперона). Как правило, транскрипционные и трансляционные регуляторные последовательности включают, но не ограничиваются ими, промоторные последовательности, сайты связывания рибосом, последовательности начала и остановки транскрипции, последовательности начала и остановки трансляции и энхансерные или активаторные последовательности. Сайт начала транскрипции означает первый транскрибируемый нуклеотид и обозначен как +1. Нуклеотиды ниже стартового сайта пронумерованы +2, +3, +4 и т.д., а нуклеотиды в 5' противоположном (выше) направлении пронумерованы -1, -2, -3 и т.д. Промотор конструкции может происходить из промоторной области любого гена, закодированного в геноме вида. Предпочтительна промоторная область геномной ДНК E.coli. Соответственно, любой промотор, способный связываться с РНК-полимеразой и инициировать транскрипцию, подходит для осуществления изобретения. В принципе, для контроля транскрипции рекомбинантного гена можно применять любой промотор, такой как транспортер MFS или гликозилтрансферазы по изобретению. При осуществлении изобретения могут быть применены разные или идентичные промоторные последовательности для запуска транскрипции различных представляющих интерес генов, интегрированных в геном клетки-хозяина или в ДНК вектора экспрессии. В одном примере промоторная последовательность А способствует экспрессии переносчика MFS, а другая промоторная последовательность В, или идентичная промоторная последовательность А, способствует экспрессии гликозилтрансферазы.The term regulatory element or promoter or promoter region or promoter element is a nucleic acid sequence that is recognized and bound by DNA-dependent RNA polymerase during transcription initiation. A promoter, together with other nucleic acid sequences that regulate transcription and translation (also called control sequences), is necessary for the expression of a given gene or group of genes (operon). Typically, transcriptional and translational control sequences include, but are not limited to, promoter sequences, ribosome binding sites, transcription start and stop sequences, translation start and stop sequences, and enhancer or activator sequences. The transcription start site refers to the first nucleotide transcribed and is designated +1. Nucleotides downstream of the start site are numbered +2, +3, +4, etc., and nucleotides in the 5' opposite (upstream) direction are numbered -1, -2, -3, etc. The promoter construct can be derived from the promoter region of any gene encoded in the genome of the species. The promoter region of E. coli genomic DNA is preferred. Accordingly, any promoter capable of binding to RNA polymerase and initiating transcription is suitable for practicing the invention. In principle, any promoter, such as the MFS transporter or glycosyltransferase of the invention, can be used to control the transcription of a recombinant gene. In the practice of the invention, different or identical promoter sequences may be used to drive the transcription of different genes of interest integrated into the genome of a host cell or into the DNA of an expression vector. In one example, promoter sequence A promotes expression of the MFS transporter, and another promoter sequence B, or an identical promoter sequence A, promotes expression of the glycosyltransferase.
Для оптимальной экспрессии рекомбинантных генов, включенных в конструкцию, конструкция может включать дополнительные регуляторные последовательности, например ведущая последовательность ДНК, такая как последовательность ДНК, полученная из 5'-нетранслируемой области (5'UTR) гена glp E.coli, последовательность для рибосомного связывания. Примеры более поздних последовательностей описаны в WO 2019123324 (включена в настоящий документ в качестве отсылки) и проиллюстрированы в настоящем документе в неограничивающих рабочих примерах.For optimal expression of the recombinant genes included in the construct, the construct may include additional regulatory sequences, for example a guide DNA sequence, such as a DNA sequence derived from the 5' untranslated region (5'UTR) of the E. coli glp gene, a ribosomal binding sequence. Examples of later sequences are described in WO 2019123324 (incorporated herein by reference) and are illustrated herein by non-limiting worked examples.
В одном аспекте изобретения один или несколько регуляторных элементов могут быть вставлены в конструкцию ДНК, кодирующую ген fred согласно SEQ ID NO: 2, и/или в конструкцию ДНК, кодирующую одну или несколько гликозилтрансфераз согласно изобретению. В другом аспекте изобретения одна или несколько копий гена fred в соответствии с SEQ ID NO: 2 могут быть встроены в конструкцию ДНК согласно изобретению. В еще одном аспекте изобретения ген fred в соответствии с SEQ ID NO: 2 может быть встроен в одну или несколько идентичных или неидентичных конструкций ДНК согласно изобретению.In one aspect of the invention, one or more regulatory elements may be inserted into a DNA construct encoding the fred gene of SEQ ID NO: 2 and/or into a DNA construct encoding one or more glycosyltransferases of the invention. In another aspect of the invention, one or more copies of the fred gene according to SEQ ID NO: 2 can be inserted into the DNA construct of the invention. In yet another aspect of the invention, the fred gene of SEQ ID NO: 2 may be inserted into one or more identical or non-identical DNA constructs of the invention.
В одном аспекте изобретения регуляторным элементом для регуляции экспрессии рекомбинантного гена, включенного в конструкцию по изобретению, представляет собой промотор оперона glpFKX, PglpF. В другом аспекте изобретения промотор представляет собой промотор оперона lac, Plac. И в еще одном аспекте изобретения регуляторный элемент представляет собой PglpF_SD4 и/или PglpF_SD7, которые представляют собой модифицированную версию последовательности PglpF, включающую модифицированную последовательность сайта связывания рибосомы ниже последовательности промотора. Однако любой промотор, обеспечивающий транскрипцию и/или регуляцию уровня транскрипции одной или нескольких рекомбинантных нуклеиновых кислот, кодирующих один или несколько полипептидов по изобретению, представляет собой подходящий промотор для практического применения изобретения.In one aspect of the invention, the regulatory element for regulating expression of the recombinant gene included in the construct of the invention is the promoter of the glpFKX operon, PglpF. In another aspect of the invention, the promoter is the promoter of the lac operon, Plac. And in yet another aspect of the invention, the regulatory element is PglpF_SD4 and/or PglpF_SD7, which is a modified version of the PglpF sequence including a modified ribosome binding site sequence downstream of the promoter sequence. However, any promoter that provides transcription and/or regulation of the level of transcription of one or more recombinant nucleic acids encoding one or more polypeptides of the invention is a suitable promoter for the practice of the invention.
Как правило, промоторы для экспрессии гетерологичного гена по настоящему изобретению выбирают из табл. 2.Typically, promoters for expression of the heterologous gene of the present invention are selected from Table. 2.
- 14 046005- 14 046005
Таблица 2table 2
Предпочтительные регуляторные элементы, присутствующие в генетически модифицированной клетке или в конструкции нуклеиновой кислоты по настоящему изобретению, выбирают из группы, состоящей из: PgatY_70UTR, PglpF, PglpF_SD1, PglpF_SD10, PglpF_SD2, PglpF_SD3, PglpF_SD4, PglpF_SD5, PglpF_SD6, PglpF_SD7, PglpF_SD8, PglpF_SD9, Plac_16UTR, Plac, PmglB_70UTR и PmglB_70UTR_SD4.Preferred regulatory elements present in the genetically modified cell or nucleic acid construct of the present invention are selected from the group consisting of: PgatY_70UTR, PglpF, PglpF_SD1, PglpF_SD10, PglpF_SD2, PglpF_SD3, PglpF_SD4, PglpF_SD5, PglpF_SD6, PglpF_SD7 , PglpF_SD8, PglpF_SD9, Plac_16UTR , Plac, PmglB_70UTR and PmglB_70UTR_SD4.
Особенно предпочтительные регуляторные элементы, присутствующие в генетически модифицированной клетке или в конструкции нуклеиновой кислоты по настоящему изобретению, выбирают из группы, состоящей из PglpF, PglpF_SD4 и PglpF_SD7.Particularly preferred regulatory elements present in the genetically modified cell or nucleic acid construct of the present invention are selected from the group consisting of PglpF, PglpF_SD4 and PglpF_SD7.
Г енетически модифицированные клетки для биосинтетического производства.Genetically modified cells for biosynthetic production.
В настоящем изобретении промоторы могут быть либо необходимыми, либо полезными для достижения оптимального уровня биосинтетического производства одной или нескольких ОГМ в генетически модифицированной клетке и обеспечения желаемых эффектов согласно изобретению. Таким образом, промоторная последовательность по настоящему изобретению обеспечивает транскрипцию и/или регулирует экспрессию полипептида, способного к транспорту сахара, и/или гликозилтрансфераз по изобретению, что приводит к оптимизации биосинтеза и транспорта ОГМ или предшественников ОГМ и/или деградации побочных продуктов получения ОГМ.In the present invention, promoters may be either necessary or beneficial to achieve the optimal level of biosynthetic production of one or more HMOs in a genetically modified cell and provide the desired effects of the invention. Thus, the promoter sequence of the present invention drives the transcription and/or regulates the expression of the sugar transport polypeptide and/or glycosyltransferases of the invention, resulting in optimization of the biosynthesis and transport of OGM or OGM precursors and/or degradation of by-products of OGM production.
В генетически модифицированной клетке по изобретению конструкция нуклеиновой кислоты включена в генетически модифицированную клетку, которая кодирует, по меньшей мере, один ген, связанный с биосинтетическим продуцированием одной или нескольких ОГМ, последовательность промоторной ДНК и другие регуляторные последовательности, такие как последовательность сайта связывания рибосомы (например, последовательность Шайна-Дальгарно). Экспрессия гена или генов, связанных с биосинтетической продукцией одной или нескольких ОГМ в генетически модифицированной клетке, делает возможным продуцирование ОГМ, делая клетку-хозяина подходящей клеткой-хозяином для осуществления изобретения, как описано. В генетически модифицированной клетке экспрессия гена или генов, связанных с биосинтетическим производством ОГМ, как упоминалось выше, позволяет производить одно или несколько ОГМ на уровне 0,03 г/л/OD (оптическая плотность) из 1 литра ферментационной среды, включавшей суспензию генетически модифицированных клеток. Таким образом, уровень ОГМ может быть от около 0,05 г/л/OD до около 0,5 г/л/OD, например, по меньшей мере, 0,4 г/л/OD. Для целей изобретения уровень продукции ОГМ рассматривают как достаточный, и генетически модифицированная клетка, способная продуцировать желаемый уровень ОГМ или смеси ОГМ, считается подходящей генетически модифицированной клеткой для осуществления изобретения.In the genetically modified cell of the invention, a nucleic acid construct is included in the genetically modified cell that encodes at least one gene associated with the biosynthetic production of one or more OGMs, a promoter DNA sequence, and other regulatory sequences such as a ribosome binding site sequence (eg , Shine-Dalgarno sequence). Expression of a gene or genes associated with the biosynthetic production of one or more HGMs in a genetically modified cell enables the production of HGMs, making the host cell a suitable host cell for practicing the invention as described. In a genetically modified cell, expression of the gene or genes associated with the biosynthetic production of OGM, as mentioned above, allows the production of one or more OGM at a level of 0.03 g/L/OD (optical density) from 1 liter of fermentation medium containing a suspension of genetically modified cells . Thus, the OGM level may be from about 0.05 g/L/OD to about 0.5 g/L/OD, such as at least 0.4 g/L/OD. For the purposes of the invention, the level of production of HGM is considered to be sufficient, and a genetically modified cell capable of producing the desired level of HGM or a mixture of HGM is considered a suitable genetically modified cell for practicing the invention.
Таким образом, в свете изобретения подходящая генетически модифицированная клетка может быть дополнительно модифицирована, как описано выше, для экспрессии полипептида сахара, способного к транспортировке сахара семейства MFS, например, fred, для достижения, тем или иным образом,Thus, in light of the invention, a suitable genetically modified cell can be further modified, as described above, to express a sugar polypeptide capable of transporting MFS family sugars, for example, fred, to achieve, in one way or another,
- 15 046005 выгодного производства ОГМ, такого как, помимо прочего, более высокий уровень ОГМ в биосинтетическом производстве, более высокий уровень чистоты в биосинтетическом производстве, сокращение длительности производства и/или более эффективное биосинтетическое производство ГМО.- 15 046005 beneficial production of GMOs, such as, but not limited to, higher levels of GMOs in biosynthetic production, higher levels of purity in biosynthetic production, reduced production times, and/or more efficient biosynthetic production of GMOs.
Способ получения.Method of receipt.
Второй аспект изобретения относится к способу получения одного или нескольких ОГМ, включающему следующие этапы:The second aspect of the invention relates to a method for producing one or more OGM, including the following steps:
(i) обеспечение генетически модифицированной клетки, способной продуцировать ОГМ, причем указанная клетка включает рекомбинантную нуклеиновую кислоту, кодирующую белок последовательности SEQ ID NO: 1, или ее функциональный гомолог, аминокислотная последовательность которого идентична более чем на 95,4%, идентична, по меньшей мере, на 95,5%, предпочтительно идентична, по меньшей мере, на 96%, более предпочтительно идентична, по меньшей мере, на 99,9% последовательности SEQ ID NO: 1;(i) providing a genetically modified cell capable of producing HGM, wherein said cell includes a recombinant nucleic acid encoding a protein of the sequence SEQ ID NO: 1, or a functional homolog thereof, the amino acid sequence of which is more than 95.4% identical, identical to at least at least 95.5% identical, preferably at least 96% identical, more preferably at least 99.9% identical to the sequence of SEQ ID NO: 1;
(ii) культивирование клетки (i) в подходящей среде для культивирования клеток для обеспечения продукции ОГМ и экспрессии последовательности ДНК с получением белка, имеющего аминокислотную последовательность SEQ ID NO: 1, или его функциональную аминокислоту последовательность более чем на 95,4% идентична, например, по меньшей мере, на 95,5% идентична, предпочтительно, по меньшей мере, на 96% идентична, более предпочтительно, по меньшей мере, на 99,9% идентична SEQ ID NO: 1;(ii) culturing the cell (i) in a suitable cell culture medium to permit production of OGM and expression of the DNA sequence to produce a protein having the amino acid sequence of SEQ ID NO: 1, or its functional amino acid sequence being more than 95.4% identical, e.g. at least 95.5% identical, preferably at least 96% identical, more preferably at least 99.9% identical to SEQ ID NO: 1;
(iii) сбор ОГМ, полученного на этапе (ii).(iii) collection of the GMS obtained in step (ii).
Согласно изобретению термин культивирование (или культивирование или культивирование, также называемое ферментация) относится к размножению бактериальных экспрессирующих клеток в контролируемом биореакторе в соответствии со способами, известными в промышленности.According to the invention, the term cultivation (or culturing or cultivation, also called fermentation) refers to the propagation of bacterial expressing cells in a controlled bioreactor in accordance with methods known in the industry.
Для получения одного или нескольких ОГМ бактерии, продуцирующие ОГМ, как описано в настоящем документе, культивируют в соответствии с процедурами, известными в данной области техники, в присутствии подходящего источника углерода, например глюкозы, глицерина, лактозы и т.д., и полученный ОГМ собирают из сред культивирования и микробной биомассы, образующейся в процессе культивирования. После этого ОГМ очищают в соответствии с процедурами, известными в данной области техники, например, такими, как описаны в WO 2015188834, WO 2017182965 или WO 2017152918, и очищенный ОГМ применяют в качестве нутрицевтиков, фармацевтических препаратов или для любых других целей, например, для исследований.To obtain one or more OGM, bacteria producing OGM as described herein are cultured according to procedures known in the art in the presence of a suitable carbon source, for example glucose, glycerol, lactose, etc., and the resulting OGM collected from cultivation media and microbial biomass formed during the cultivation process. Thereafter, the HMO is purified according to procedures known in the art, such as those described in WO 2015188834, WO 2017182965 or WO 2017152918, and the purified HMO is used as nutraceuticals, pharmaceuticals or for any other purpose, e.g. research.
Производство ОГМ обычно осуществляется путем культивирования в больших объемах. Термин производство и производственный масштаб в значении изобретения определяет ферментацию с минимальным объемом 5 л культурального бульона. Обычно процесс в производственном масштабе определяют способностью обрабатывать большие объемы препарата, содержащего продукт, и производить такие количества представляющего интерес белка, которые соответствуют, например, в случае терапевтического соединения или композиции, требованиям для клинических испытаний, а также для предложения на рынке. Помимо большого объема, способ в производственных масштабах, в отличие от простых способов в лабораторных масштабах, таких как культивирование во встряхиваемых колбах, характеризуется применением технической системы биореактора (ферментера), оснащенного устройствами для перемешивания, аэрации, подачи питательных веществ, слежения за параметрами процесса и контроля параметров процесса (рН, температура, давление растворенного кислорода, обратное давление и др.). В значительной степени поведение системы экспрессии в лабораторном масштабе, например, во встряхиваемых колбах, настольных биореакторах или формате глубоких лунок, описанных в примерах настоящего раскрытия, позволяет предсказать поведение этой системы этой системы в сложной среде биореактора.The production of OGM is usually carried out through large-scale cultivation. The term production and production scale within the meaning of the invention defines fermentation with a minimum volume of 5 liters of culture broth. Typically, a manufacturing scale process is defined by the ability to process large volumes of a formulation containing a product and to produce quantities of the protein of interest that meet, for example, in the case of a therapeutic compound or composition, requirements for clinical testing as well as for marketing. In addition to its large volume, the method on a production scale, in contrast to simple methods on a laboratory scale, such as cultivation in shake flasks, is characterized by the use of a technical bioreactor (fermenter) system equipped with devices for mixing, aeration, supply of nutrients, monitoring process parameters and control of process parameters (pH, temperature, dissolved oxygen pressure, back pressure, etc.). To a large extent, the behavior of an expression system on a laboratory scale, such as in shake flasks, benchtop bioreactors, or the deep well format described in the examples of the present disclosure, allows one to predict the behavior of that system in a complex bioreactor environment.
Что касается подходящей среды для клеток, применяемой в процессе ферментации, ограничений нет. Культуральная среда может быть полуопределенной, то есть содержащей комплексные соединения среды (например, дрожжевой экстракт, соевый пептон, казаминовые кислоты и т.д.), или она может быть химически определенной, без каких-либо комплексных соединений.There are no restrictions regarding the suitable cell medium used in the fermentation process. The culture medium may be semi-defined, that is, containing complex compounds of the medium (eg, yeast extract, soy peptone, casamino acids, etc.), or it may be chemically defined, without any complex compounds.
Под термином один или несколько ОГМ подразумевают, что производственная ячейка ОГМ может быть способна производить одну структуру ОГМ (первый ОГМ) или несколько структур ОГМ (второй, третий и т.д. ОГМ). В некоторых воплощениях может быть предпочтительной генетически модифицированная клетка, которая продуцирует один ОГМ, в других предпочтительных воплощениях может быть предпочтительной генетически модифицированная клетка, продуцирующая несколько структур ОГМ. Клетки, продуцирующие 2'-FL, 3-FL, 3'-SL, 6'-SL или LNT-2 представляют собой неограничивающие примеры генетически модифицированных клеток, продуцирующих ОГМ единственной структуры. Неограничивающие примеры генетически модифицированных клеток, способных продуцировать несколько структур ОГМ, могут представлять собой клетки-продуценты DFL, FSL, LNT, LNnT, LNFP-I, LNFP-II, LNFP-Ш, LNFP-IV, LNFP-V, pLNnH, pLNH2.By the term one or more OGMs, it is meant that a OGM production cell may be capable of producing one OGM structure (first OGM) or multiple OGM structures (second, third, etc. OGM). In some embodiments, a genetically modified cell that produces a single OGM may be preferred; in other preferred embodiments, a genetically modified cell that produces multiple OGM structures may be preferred. Cells producing 2'-FL, 3-FL, 3'-SL, 6'-SL or LNT-2 are non-limiting examples of genetically modified cells that produce a single structure OGM. Non-limiting examples of genetically modified cells capable of producing multiple HGM structures include DFL, FSL, LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-IV, LNFP-V, pLNnH, pLNH2 producer cells.
В особенности, настоящее изобретение относится к генетически модифицированным клеткам, продуцирующим одну или несколько одиночных структур ОГМ, которые выбирают из группы, состоящей из клеток, продуцирующих 2'-FL, 3-FL, DFL и LNT.In particular, the present invention relates to genetically modified cells producing one or more single OGM structures, which are selected from the group consisting of cells producing 2'-FL, 3-FL, DFL and LNT.
- 16 046005- 16 046005
Термин сбор в контексте изобретения относится к сбору полученных ОГМ после прекращения ферментации. В различных воплощениях это может включать сбор ОГМ, включенных как в биомассу (т.е. генетически модифицированные клетки), так и в среду культивирования, т.е. до/без отделения ферментационного бульона от биомассы. В других воплощениях полученный ОГМ можно собирать отдельно от биомассы и ферментационного бульона, т.е. после отделения /следом за отделением биомассы от среды культивирования (т.е. ферментационного бульона). Отделение клеток от среды может быть осуществлено любым из способов, хорошо известных специалисту в данной области техники, например, любым подходящим типом центрифугирования или фильтрации. Отделение клеток от среды может следовать сразу за сбором ферментационного бульона или осуществляться на более позднем этапе после хранения ферментационного бульона в соответствующих условиях. Извлечение произведенных ОГМ из оставшейся биомассы (или полная ферментация) включает их извлечение из биомассы (клетокпродуцентов). Это можно осуществить любыми подходящими способами в данной области техники, например, обработкой ультразвуком, кипячением, гомогенизацией, ферментативным лизисом с применением лизоцима или замораживанием и измельчением.The term collection in the context of the invention refers to the collection of the resulting OGM after the cessation of fermentation. In various embodiments, this may involve collecting HGMs included in both the biomass (i.e., genetically modified cells) and the culture medium, i.e. before/without separating the fermentation broth from the biomass. In other embodiments, the resulting OGM can be collected separately from the biomass and fermentation broth, i.e. after/following the separation of the biomass from the cultivation medium (i.e. fermentation broth). Separation of cells from the medium can be accomplished by any of the methods well known to one skilled in the art, for example, any suitable type of centrifugation or filtration. Separation of cells from the medium may immediately follow collection of the fermentation broth or may be carried out at a later stage after the fermentation broth has been stored under appropriate conditions. Extraction of produced HMOs from the remaining biomass (or complete fermentation) involves their extraction from the biomass (producer cells). This can be accomplished by any suitable methods in the art, for example, sonication, boiling, homogenization, enzymatic lysis using lysozyme, or freezing and grinding.
После восстановления после ферментации ОГМ (доступен)доступны для дальнейшей обработки и очистки.After recovery from fermentation, the OGM (available) are available for further processing and purification.
Очистку ОГМ, полученных ферментацией, можно проводить с применением подходящей процедуры, описанной в WO 2016095924, WO 2015188834, WO 2017152918, WO 2017182965, US 20190119314 (все включены посредством отсылки).Purification of OHMs obtained by fermentation can be carried out using a suitable procedure described in WO 2016095924, WO 2015188834, WO 2017152918, WO 2017182965, US 20190119314 (all incorporated by reference).
В некоторых воплощениях изобретения генетически модифицированная клетка может продуцировать несколько ОГМ, где один ОГМ представляет собой ОГМ-продукт, а некоторые/все прочие ОГМ представляют собой ОГМ-побочный продукт. Как правило, побочные ОГМ представляют собой либо основных предшественников ОГМ, либо продукты дальнейшей модификации основных ОГМ. В некоторых воплощениях может быть желательно производить продукт ОГМ в больших количествах и побочный продукт ОГМ в малых количествах. Клетки и способы получения ОГМ, описанные в настоящем документе, обеспечивают контролируемое производство продукта ОГМ с заданным профилем ОГМ, например, в одном воплощении полученная смесь ОГМ, в которой продукт ОГМ представляет собой доминирующим ОГМ по сравнению с другими ОГМ (т.е. побочными ОГМ) смеси, т.е. ОГМ-продукт производится в большем количестве, чем другие ОГМ-побочные продукты; в других воплощениях клетка, производящая одну и ту же смесь ОГМ, может быть настроена на производство одного или нескольких побочных продуктов ОГМ в большем количестве, чем ОГМ-продукт. Например, при производстве 2'-FL и/или 3-FL, ОГМ-продукта, часто образуется значительное количество DFL, ОГМ-побочного продукта. С генетически модифицированными клетками по настоящему изобретению уровень DFL в 2'-FL и/или 3-FL -продукте может быть значительно снижен.In some embodiments of the invention, a genetically modified cell can produce multiple HGMs, where one HGM is a HGM product and some/all of the other HGMs are HGM by-products. As a rule, side HMOs are either the main precursors of the HMOs or products of further modification of the main HMOs. In some embodiments, it may be desirable to produce the OGM product in large quantities and the OGM by-product in small quantities. The cells and methods for producing OGM described herein provide controlled production of an OGM product with a given OGM profile, for example, in one embodiment, a resulting mixture of OGM in which the OGM product is the dominant OGM relative to other OGMs (i.e., by-product OGMs). ) mixtures, i.e. The OGM product is produced in greater quantities than other OGM by-products; in other embodiments, a cell producing the same mixture of OGM may be configured to produce one or more OGM by-products in greater quantities than the OGM product. For example, the production of 2'-FL and/or 3-FL, an OGM product, often produces significant amounts of DFL, an OGM byproduct. With the genetically modified cells of the present invention, the level of DFL in the 2'-FL and/or 3-FL product can be significantly reduced.
Преимущественно изобретение обеспечивает как снижение отношения побочного продукта к продукту, так и увеличение общего выхода продукта (и/или ОГМ в целом). Это, сниженное образование побочных продуктов по сравнению с образованием продукта, способствует повышенному образованию продукта и повышает эффективность как производства, так и процесса извлечения продукта, обеспечивая превосходную технологию производства ОГМ.Advantageously, the invention provides both a reduction in the by-product to product ratio and an increase in the overall product yield (and/or OGM in general). This reduced byproduct formation relative to product formation promotes increased product formation and increases the efficiency of both the production and product recovery process, providing superior OGM production technology.
В различных предпочтительных воплощениях могут быть выбраны различные генетически модифицированные клетки, продуцирующие 2'-FL, 3-FL, DFL и/или LNT, в качестве ОГМ продукта или побочного продукта. В одном предпочтительном воплощении продукт представляет собой 3-FL. В другом предпочтительном воплощении продукт представляет собой 2'-FL, а побочный продукт представляет собой DFL. В другом предпочтительном воплощении продукт представляет собой LNT-2, а побочный продукт представляет собой LNT and LNFP I.In various preferred embodiments, various genetically modified cells producing 2'-FL, 3-FL, DFL and/or LNT may be selected as the HGM product or by-product. In one preferred embodiment, the product is 3-FL. In another preferred embodiment, the product is 2'-FL and the by-product is DFL. In another preferred embodiment, the product is LNT-2 and the by-product is LNT and LNFP I.
2'-FL, LNT и 3-FL представляют собой предпочтительные ОГМ-продукты по изобретению, как описано.2'-FL, LNT and 3-FL are the preferred OGM products of the invention as described.
Применение.Application.
Настоящее изобретение также относится к применению клетки-хозяина, описанной в настоящем документе, для получения одного или нескольких олигосахаридов грудного молока (ОГМ). В особенности, изобретение относится к применению клетки-хозяина, как описано в настоящем документе, для продукции конкретного ОГМ, при этом клетка-хозяин выбирают с целью получения большей части одного конкретного ОГМ, предпочтительно выбранного из 2'-FL, 3-FL и LNT, в настоящее время наиболее предпочтителен, 3-FL.The present invention also relates to the use of a host cell described herein to produce one or more human milk oligosaccharides (HMOs). In particular, the invention relates to the use of a host cell, as described herein, for the production of a particular HGM, wherein the host cell is selected to produce a majority of one particular HGM, preferably selected from 2'-FL, 3-FL and LNT , currently the most preferred, 3-FL.
Общее.General.
Следует понимать, что любой признак и/или аспект, рассмотренный выше в связи с описываемым изобретением, применим по аналогии с описанными в настоящем документе способами.It should be understood that any feature and/or aspect discussed above in connection with the described invention is applicable by analogy to the methods described herein.
Следующие фигуры и примеры представлены ниже для иллюстрации настоящего изобретения. Они предназначены для иллюстрации и никоим образом не должны рассматриваться как ограничивающие.The following figures and examples are presented below to illustrate the present invention. They are intended to be illustrative and should not be construed as limiting in any way.
Примеры.Examples.
Материалы и методы.Materials and methods.
Если не указано иное, для манипулирования с нуклеиновыми кислотами, трансформации и экспрессии нуклеиновых кислот применяют стандартные методики, векторы, элементы контрольной последоваUnless otherwise stated, standard techniques, vectors, control sequence elements are used for nucleic acid manipulation, transformation, and expression of nucleic acids.
- 17 046005 тельности и другие элементы системы экспрессии, известные в области молекулярной биологии. Такие стандартные техники, векторы и элементы можно найти, например, в руководствах: Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley & Sons); Sambrook, Fritsch, & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.), DNA Insertion Elements, Plasmids and Episomes (1977) (Cold Spring Harbor Laboratory Press, NY); Miller, J.H. Experiments in molecular genetics (1972.) (Cold spring Harbor Laboratory Press, NY)- 17 046005 telities and other elements of the expression system known in the field of molecular biology. Such standard techniques, vectors and elements can be found, for example, in the manuals: Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley &Sons); Sambrook, Fritsch, & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.), DNA Insertion Elements, Plasmids and Episomes (1977) (Cold Spring Harbor Laboratory Press, NY); Miller, J.H. Experiments in molecular genetics (1972.) (Cold spring Harbor Laboratory Press, NY)
Описанные ниже воплощения выбраны для иллюстрации изобретения и никоим образом не ограничивают изобретение.The embodiments described below are chosen to illustrate the invention and are not intended to limit the invention in any way.
Штаммы.Strains.
Штаммы, примененные в настоящих примерах, описаны в приведенной ниже табл. 3.The strains used in the present examples are described in the table below. 3.
Таблица 3Table 3
СА = gmd-wcaG-wcaH-wcaI-manC-manB.CA = gmd-wcaG-wcaH-wcaI-manC-manB.
*Штаммы МР3672 и МР3020 несут одни и те же гетерологичные GlcNAcT и Gal4T, но отличаются количеством копий соответствующего гена, кодирующего GlcNAcT.*Strains MP3672 and MP3020 carry the same heterologous GlcNAcT and Gal4T, but differ in the number of copies of the corresponding gene encoding GlcNAcT.
**Штаммы МР3994 и МР4065 несут одни и те же гетерологичные GlcNAcT и Gal4T, но отличаются числом копий соответствующего гена, кодирующего GlcNAcT.**Strains MP3994 and MP4065 carry the same heterologous GlcNAcT and Gal4T, but differ in the copy number of the corresponding gene encoding GlcNAcT.
Культивирование.Cultivation.
Если не указано иное, штаммы E.coli размножали в среде базовой минимальной среде, содержавшей 0,2% глюкозы, при 37°C при перемешивании. Чашки с агаром инкубировали при 37°C в течение ночи.Unless otherwise stated, E. coli strains were propagated in basal minimal medium containing 0.2% glucose at 37°C with agitation. Agar plates were incubated at 37°C overnight.
Базовая минимальная среда имела следующий состав: NaOH (1 г/л), KOH (2,5 г/л), KH2PO4 (7 г/л), NH4H2PO4 (7 г/л), лимонная кислота (0,5 г/л), раствор микроэлементов (5 мл/л). Исходный раствор микроэлементов содержал: ZnSO4-7H2O 0,82 г/л, лимонную кислоту 20 г/л, MnSO4-H2O 0,98 г/л, FeSO4-7H2O 3,925 г/л, CuSO4-5H2O 0,2 г/л. рН базовой минимальной среды доводили до 7,0 с помощью 5н. NaOH и автоклавировали.The basic minimal medium had the following composition: NaOH (1 g/l), KOH (2.5 g/l), KH 2 PO 4 (7 g/l), NH4H2PO4 (7 g/l), citric acid (0.5 g/l), solution of trace elements (5 ml/l). The initial solution of trace elements contained: ZnSO 4 -7H 2 O 0.82 g/l, citric acid 20 g/l, MnSO 4 -H 2 O 0.98 g/l, FeSO 4 -7H 2 O 3.925 g/l, CuSO 4 -5H 2 O 0.2 g/l. The pH of the basic minimal medium was adjusted to 7.0 using 5N. NaOH and autoclaved.
Перед инокуляцией в базовую минимальную среду добавляли 1 мМ MgSO4, 4 мкг/мл тиамина, 0,5% заданного источника углерода (глицерин (Carbosynth)). Тиамин, антибиотики стерилизовали фильтрованием. Все процентные концентрации для глицерина выражены как объем/объем, а для глюкозы - масса/объем.Before inoculation, 1 mM MgSO 4 , 4 μg/ml thiamine, and 0.5% of a given carbon source (glycerol (Carbosynth)) were added to the basic minimal medium. Thiamine, antibiotics were sterilized by filtration. All percentage concentrations for glycerol are expressed as v/v and for glucose as w/v.
Химически компетентные клетки и трансформации E.coli инокулировали из чашек LB в 5 мл LB, содержащего 0,2% глюкозы, при 37°C при встряхивании до OD600 ~0,4. 2 мл культуры собирали центрифугированием в течение 25 с при 13000 g. Супернатант удаляли, а клеточный осадок ресуспендировали в 600 мкл холодных растворов ТВ (10 мМ PIPES, 15 мМ CaCl2, 250 мМ KCl). Клетки инкубировали на льду в течение 20 мин с последующим осаждением в течение 15 с при 13000 g. Супернатант удаляли, а клеточный осадок ресуспендировали в 100 мкл холодного раствора ТВ. Трансформацию плазмид проводили с применением 100 мкл компетентных клеток и 1-10 нг плазмидной ДНК. Клетки и ДНК инкубировали на льду в течение 20 мин, а затем подвергали тепловому шоку при 42°C в течение 45 с. После 2минутной инкубации на льду добавляли 400 мкл SOC (20 г/л триптона, 5 г/л дрожжевого экстракта, 0,5 г/л NaCl, 0,186 г/л KCl, 10 мМ MgCl2, 10 мМ MgSO4 и 20 мМ глюкозы) и культуру клеток инкубировали при 37 °C при встряхивании в течение 1-го часа перед посевом на селективные чашки.Chemically competent E. coli cells and transformations were inoculated from LB plates into 5 ml LB containing 0.2% glucose at 37°C with shaking to OD 600 ~0.4. 2 ml of culture were collected by centrifugation for 25 s at 13000 g. The supernatant was removed, and the cell pellet was resuspended in 600 μl of cold TB solutions (10 mM PIPES, 15 mM CaCl 2 , 250 mM KCl). Cells were incubated on ice for 20 min followed by sedimentation for 15 s at 13,000 g. The supernatant was removed, and the cell pellet was resuspended in 100 μl of cold TB solution. Plasmid transformation was carried out using 100 μl of competent cells and 1-10 ng of plasmid DNA. Cells and DNA were incubated on ice for 20 min and then heat shocked at 42°C for 45 s. After a 2-minute incubation on ice, 400 μl of SOC (20 g/l tryptone, 5 g/l yeast extract, 0.5 g/l NaCl, 0.186 g/l KCl, 10 mM MgCl2 , 10 mM MgSO4 and 20 mM glucose) was added ) and the cell culture was incubated at 37 °C with shaking for 1 hour before plating on selective plates.
- 18 046005- 18 046005
Плазмиду трансформировали в химически компетентные клетки ТОР10 в условиях, рекомендованных поставщиком (ThermoFisher Scientific).The plasmid was transformed into chemically competent TOP10 cells under conditions recommended by the supplier (ThermoFisher Scientific).
ДНК-технологии.DNA technology.
Плазмидную ДНК из E.coli выделяли с применением набора QIAprep Spin Miniprep (Qiagen). Хромосомную ДНК из E.coli выделяли с применением набора QIAmp DNA Mini Kit (Qiagen). Продукты ПНР очищали с применением набора QIAquick PCR Purification Kit (Qiagen). Мастер-микс для ПНР DreamTaq (Thermofisher), мастер-микс для ПНР с горячим стартом Phusion U (Thermofisher), USER Enzyme (New England Biolab) применяли в соответствии с рекомендациями поставщика. Праймеры были поставлены компанией Eurofins Genomics, Германия. Фрагменты ПЦР и плазмиды были секвенированы компанией Eurofins Genomics. ПНР колоний проводили с применением DreamTaq PCR Master Mix в термоциклере Т100ТМ (Bio-Rad).Plasmid DNA from E. coli was isolated using the QIAprep Spin Miniprep kit (Qiagen). Chromosomal DNA from E. coli was isolated using the QIAmp DNA Mini Kit (Qiagen). PNR products were purified using the QIAquick PCR Purification Kit (Qiagen). DreamTaq PNR Master Mix (Thermofisher), Phusion U Hot Start PNR Master Mix (Thermofisher), USER Enzyme (New England Biolab) were used according to the supplier's recommendations. Primers were supplied by Eurofins Genomics, Germany. PCR fragments and plasmids were sequenced by Eurofins Genomics. PNR of colonies was carried out using DreamTaq PCR Master Mix in a T100TM thermal cycler (Bio-Rad).
Гетерологичные белки, экспрессированные в генетически модифицированных клетках, продуцирующих ОГМ, по данному изобретению, описаны в табл. 4, промоторные элементы, которые применяли в приведенных ниже примерах изобретения, описаны в табл. 5, а олигонуклеотиды, примененные для амплификации остовов плазмиды, промотора, элементов и fred, описаны в табл. 6.Heterologous proteins expressed in genetically modified OGM-producing cells according to this invention are described in table. 4, the promoter elements that were used in the following examples of the invention are described in table. 5, and the oligonucleotides used to amplify the plasmid backbone, promoter, elements and fred are described in table. 6.
Таблица 4Table 4
Гетерологичные белки, экспрессированные в генетически модифицированных клетках, продуцирующих ОГМHeterologous proteins expressed in genetically modified cells producing OGM
*Название гена дано для идентификации нуклеиновой кислоты, кодирующей белок, имеющий аминокислотную последовательность, соответствующую номеру доступа в GenBank, для целей настоящего изобретения.*The gene name is given to identify the nucleic acid encoding the protein having the amino acid sequence corresponding to the GenBank accession number for the purposes of the present invention.
Таблица 5Table 5
Элементы синтетической ДНК, примененные для экспрессии fredSynthetic DNA elements used for fred expression
- 19 046005- 19 046005
- 20 046005- 20 046005
Таблица 6 Олигонуклеотиды, применяемые для амплификации остова плазмиды, промоторных элементов и представляющих интерес генов, включая fredTable 6 Oligonucleotides used to amplify the plasmid backbone, promoter elements and genes of interest, including fred
Конструирование плазмид.Construction of plasmids.
Были синтезированы плазмидные скелеты, содержащие два эндонуклеазных сайта I-SceI, разделенных двумя фрагментами ДНК, приспособленными для гомологичной рекомбинации в геном E.coli, и последовательностью терминатора транскрипции Т1. Например, в одной плазмидной основе (pUC57::gal) был синтезирован оперон gal (необходимый для гомологичной рекомбинации в galK) и последовательность терминатора транскрипции T1 (GeneScript). Последовательности ДНК, примененные для гомологичной рекомбинации в гал-опероне, охватывают пары оснований 3.628.621-3.628.720 и 3.627.5723.627.671 в последовательности Escherichia coli K-12 MG155, полный геном GenBank: ID: СР014225.1. Вставка путем гомологичной рекомбинации привела бы к делеции 949 пар оснований galK и фенотипа galK-. Подобным образом могут быть синтезированы скелеты на основе pUC57 (GeneScript) или любого другого подходящего вектора, содержащего два сайта эндонуклеазы I-Scel, разделенных двумя фрагментами ДНК, приспособленными для гомологичной рекомбинации в геном E.coli, и последовательностью терминатора транскрипции Т1. Для конструирования праймеров и амплификации специфических последовательностей ДНК хромосомной ДНК Escherichia coli K-12 DH1 применяли стандартные методики, хорошо известные в области молекулярной биологии. Такие стандартные приемы, векторы и элементы можно найти, например, в руководствах: Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley & Sons); Sambrook, Fritsch, & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.).Plasmid backbones were synthesized containing two I-SceI endonuclease sites separated by two DNA fragments adapted for homologous recombination into the E. coli genome and a T1 transcription terminator sequence. For example, in one plasmid backbone (pUC57::gal) the gal operon (required for homologous recombination in galK) and a T1 transcription terminator sequence were synthesized (GeneScript). The DNA sequences used for homologous recombination in the gal operon span base pairs 3.628.621-3.628.720 and 3.627.5723.627.671 in the Escherichia coli K-12 MG155 sequence, GenBank complete genome: ID: CP014225.1. Insertion by homologous recombination would result in a 949 bp deletion of galK and a galK- phenotype. In a similar manner, scaffolds can be synthesized from pUC57 (GeneScript) or any other suitable vector containing two I-Scel endonuclease sites separated by two DNA fragments adapted for homologous recombination into the E. coli genome and a T1 transcription terminator sequence. Standard techniques well known in the field of molecular biology were used to design primers and amplify specific DNA sequences from Escherichia coli K-12 DH1 chromosomal DNA. Such standard techniques, vectors and elements can be found, for example, in the manuals: Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley &Sons); Sambrook, Fritsch, & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.).
Хромосомную ДНК, полученную из E.coli DH1, применяли для амплификации фрагмента ДНК размером 300 п.н., содержащего промотор PglpF, с применением олигонуклеотидов 0261 и 0262,Chromosomal DNA obtained from E. coli DH1 was used to amplify a 300 bp DNA fragment containing the PglpF promoter using oligonucleotides 0261 and 0262,
- 21 046005- 21 046005
PglpF_SD4 применяя олигонуклеотиды 0261 и 0459, nPglpF_SD7 применяя олигонуклеотиды 0261 м 0462 (табл. 6).PglpF_SD4 using oligonucleotides 0261 and 0459, nPglpF_SD7 using oligonucleotides 0261 and 0462 (Table 6).
Фрагмент ДНК длиной 1.182 п.н., содержащий кодоноптимизированную версию гена fred, SEQ ID NO: 2, происходящего из Yersinia frederiksenii синтезировали с помощью GeneScript (табл. 4). Ген fred амплифицировали с применением олигонуклеотидов KABY733 and KABY734.A 1,182 bp DNA fragment containing a codon-optimized version of the fred gene, SEQ ID NO: 2, originating from Yersinia frederiksenii was synthesized using GeneScript (Table 4). The fred gene was amplified using oligonucleotides KABY733 and KABY734.
Все ПЦР-фрагменты (основы плазмиды, элементы, содержащие промотор, и ген fred) очищали и собирали основы плазмиды, элементы промотора (Plac, PglpF или PglpF_SD4 или PglpF_SD7), и содержащий fred (или другой представляющий интерес ген, смотри табл. 4) фрагмент ДНК. Плазмиды клонировали с помощью стандартного клонирования USER. Клонирование в любой подходящей плазмиде может быть осуществлено с помощью любых стандартных способов клонирования ДНК. Плазмиды трансформировали в клетки ТОР10 и отбирали на чашках LB, содержащих 100 мкг/мл ампициллина (или любого подходящего антибиотика) и 0,2% глюкозы. Сконструированные плазмиды очищали, а последовательность промотора и 5'-конец гена fred подтверждали секвенированием ДНК (MWG Eurofins Genomics). Таким образом конструировали генетическую кассету, содержавшую любой представляющий интерес промотор, связанный с геном fred (или другим представляющим интерес геном, смотри табл. 4).All PCR fragments (plasmid backbones, promoter-containing elements, and fred gene) were purified and the plasmid backbone, promoter elements (Plac, PglpF or PglpF_SD4 or PglpF_SD7), and fred-containing (or other gene of interest, see Table 4) were assembled. DNA fragment. Plasmids were cloned using USER standard cloning. Cloning into any suitable plasmid can be accomplished using any standard DNA cloning techniques. Plasmids were transformed into TOP10 cells and selected on LB plates containing 100 μg/ml ampicillin (or any suitable antibiotic) and 0.2% glucose. The constructed plasmids were purified, and the promoter sequence and the 5′ end of the fred gene were confirmed by DNA sequencing (MWG Eurofins Genomics). In this way, a genetic cassette was constructed containing any promoter of interest associated with the fred gene (or other gene of interest, see Table 4).
Конструирование штаммов.Strain construction.
Примененный бактериальный штамм, MDO, был сконструирован из Escherichia coli K-12 DHL Гентип E.coli K-12 DH1 представлял собой: F-, λ-, gyrA96, recA1, relA1, endA1, thi-1, hsdR17, supE44. В дополнение к генотипу E.coli K-12 DH1 MDO имеет следующие модификации: lacZ: делеция, размером 1,5 т.п.н., lacA: делеция, размером 0,5 т.п.н., nanKETA: делеция, размером 3,3 т.п.н., melA: делеция, размером 0,9 т.п.н., wcaJ: делеция, размером 0,5 т.п.н., mdoH: делеция, размером 0,5 т.п.н., и вставка промотора Plac выше гена gmd.The bacterial strain used, MDO, was constructed from Escherichia coli K-12 DHL Gentype E. coli K-12 DH1 were: F - , λ - , gyrA96, recA1, relA1, endA1, thi-1, hsdR17, supE44. In addition to the E. coli K-12 genotype, DH1 MDO has the following modifications: lacZ: 1.5 kb deletion, lacA: 0.5 kb deletion, nanKETA: deletion, 3.3 kb, melA: 0.9 kb deletion, wcaJ: 0.5 kb deletion, mdoH: 0.5 k deletion .bp, and insertion of the Plac promoter upstream of the gmd gene.
Вставку кассеты экспрессии, содержавшей промотор, связанный с геном fred Вставку кассеты экспрессии, содержавшей промотор, связанный с геном Т1 в хромосомной ДНК E.coli K-12 DH1 MDO осуществляли с помощью Gene Gorging по существу, как описано в работе Herring et al. (Herring, CD., Glasner, J.D. and Blattner, F.R. (2003). Gene (311). 153-163). Вкратце, донорную плазмиду и хелперную плазмиду котрансформировали в MDO и отбирали на чашках с LB, содержавших 0,2% глюкозы, ампициллин (100 мкг/мл) или канамицин (50 мг/мл) и хлорамфеникол (20 мкг/мл). Одиночную колонию инокулировали в 1 мл LB, содержащего хлорамфеникол (20 мкг/мл) и 10 мкл 20% L-арабинозы, и инкубировали при 37°C при встряхивании в течение 7-8 ч. Для интеграции в локусы galK клеток E.coli затем высевали на чашки M9-DOG и инкубировали при 37°C в течение 48 ч. Отдельные колонии, сформированные на чашках MM-DOG, повторно высевали штрихом на чашки с LB, содержавшие 0,2% глюкозы, и инкубировали в течение 24-х часов при 37°C. Ожидалось, что колонии, которые выглядели белыми на чашках с агаром MacConkey-галактоза и были чувствительны как к ампициллину, так и к хлорамфениколу, потеряли донорную и вспомогательную плазмиду и содержали вставку в локусах galK. Отдельные колонии, сформированные на чашках MM-DOG, повторно высевали штрихом на чашки с LB, содержавшие 0,2% глюкозы, и инкубировали в течение 24-х часов при 37°C. Ожидалось, что колонии, которые выглядели белыми на чашках с агаром MacConkey-галактоза и были чувствительны как к ампициллину, так и к хлорамфениколу, потеряли донорную и вспомогательную плазмиду и содержали вставку в локусах galK. 17) и 049 (SEQ ID NO: 18) а вставленную ДНК проверяли секвенированием (Eurofins Genomics, Германия).Insertion of an expression cassette containing a promoter associated with the fred gene Insertion of an expression cassette containing a promoter associated with the T1 gene into the chromosomal DNA of E. coli K-12 DH1 MDO was performed using Gene Gorging essentially as described in Herring et al. (Herring, C. D., Glasner, J. D. and Blattner, F. R. (2003). Gene (311). 153-163). Briefly, donor plasmid and helper plasmid were cotransformed into MDO and selected on LB plates containing 0.2% glucose, ampicillin (100 μg/ml) or kanamycin (50 mg/ml), and chloramphenicol (20 μg/ml). A single colony was inoculated in 1 ml of LB containing chloramphenicol (20 μg/ml) and 10 μl of 20% L-arabinose and incubated at 37°C with shaking for 7-8 hours. For integration into the galK loci of E. coli cells, plated on M9-DOG plates and incubated at 37°C for 48 hours. Individual colonies formed on MM-DOG plates were streaked again onto LB plates containing 0.2% glucose and incubated for 24 hours at 37°C. The colonies, which appeared white on MacConkey-galactose agar plates and were sensitive to both ampicillin and chloramphenicol, were expected to have lost the donor and helper plasmid and contained an insertion at the galK loci. Individual colonies formed on MM-DOG plates were streaked again onto LB plates containing 0.2% glucose and incubated for 24 hours at 37°C. The colonies, which appeared white on MacConkey-galactose agar plates and were sensitive to both ampicillin and chloramphenicol, were expected to have lost the donor and helper plasmid and contained an insertion at the galK loci. 17) and 049 (SEQ ID NO: 18) and the inserted DNA was verified by sequencing (Eurofins Genomics, Germany).
Встраивание генетических кассет в другие локусы хромосомной ДНК E.coli осуществляли аналогичным образом с применением различных маркерных генов селекции.The integration of genetic cassettes into other loci of E. coli chromosomal DNA was carried out in a similar way using various selection marker genes.
Анализ в глубоких лунках.Analysis in deep wells.
Анализ в глубоких лунках выполняли, как первоначально описано в работе Lv et al. (Bioprocess Biosyst Eng (2016) 39:1737-1747) и оптимизировали для целей настоящего изобретения.The deep well assay was performed as originally described by Lv et al. (Bioprocess Biosyst Eng (2016) 39:1737–1747) and optimized for the purposes of the present invention.
Более конкретно, штаммы, раскрытые в примерах, подвергали скринингу в 24 планшетах с глубокими лунками с применением 4-дневного протокола. В течение первых 24-х часов клетки культуры на шейкере выращивали при 34°C при встряхивании со скоростью 700 об/мин до высокой плотности, в то время как в следующие 48 ч для клеток, продуцирующих 2'-FL и 3-FL, и 72 ч для клеток, продуцирующих LNT, клетки переносили в среду, которая позволяла индуцировать экспрессию генов и образование продукта. В особенности, в течение 1 дня готовили свежие инокуляты с применением базовой минимальной среды с добавлением сульфата магния, тиамина и глюкозы. Через 24 ч инкубации клетки переносили на новую базовую минимальную среду (2 мл) с добавлением сульфата магния и тиамина с добавлением исходного болюса, состоящего из 20% раствора глюкозы (1 мкл) и 10% раствора лактозы (0,1 мл). Затем к клеткам добавляли 50% раствор сахарозы (0,04 мл) в качестве источника углерода, сопровождаемый добавлением сахарозогидролазы (инвертазы, 5 мкл раствора 0,1 г/л), так что глюкоза поступала с медленной скоростью для роста за счет расщепление сахарозы инвертазой. После инокуляции новой среды клетки встряхивали при 700 об/мин при 28°C в течение 48 ч. После денатурации и последующего центрифугирования супернатанты анализировали с помощью HPLC. Для анализа общих образцов клеточный лизат, приготовленный кипячением, осаждали центрифугированием в течение 10 мин при 4700 об/мин. Концентрацию ОГМ в супернатанте определяли с помощью HPLC или НРАС.More specifically, the strains disclosed in the examples were screened in 24 deep well plates using a 4 day protocol. During the first 24 hours, shaker culture cells were grown at 34°C with shaking at 700 rpm to high density, while in the next 48 hours for cells producing 2'-FL and 3-FL, and 72 h for LNT-producing cells, cells were transferred to a medium that allowed gene expression and product formation to be induced. Specifically, fresh inocula were prepared for 1 day using basic minimal medium supplemented with magnesium sulfate, thiamine, and glucose. After 24 h of incubation, cells were transferred to new basal minimal medium (2 ml) supplemented with magnesium sulfate and thiamine supplemented with an initial bolus of 20% glucose (1 μl) and 10% lactose (0.1 ml). A 50% sucrose solution (0.04 mL) was then added to the cells as a carbon source, followed by the addition of sucrose hydrolase (invertase, 5 μL of a 0.1 g/L solution) so that glucose was supplied at a slow rate for growth due to the breakdown of sucrose by invertase . After inoculation of new medium, cells were shaken at 700 rpm at 28°C for 48 h. After denaturation and subsequent centrifugation, supernatants were analyzed by HPLC. For analysis of total samples, cell lysate prepared by boiling was pelleted by centrifugation for 10 min at 4700 rpm. The concentration of OGM in the supernatant was determined using HPLC or HPAS.
- 22 046005- 22 046005
Пример 1. Получение 2'-FL.Example 1. Preparation of 2'-FL.
Разработка Escherichia coli для производства 2'-FL, экспрессирующих ген fred.Engineering Escherichia coli to produce 2'-FL expressing the fred gene.
Штамм Escherichia coli K-12 (DH1) MDO) можно изменять для экспрессии представляющих интерес гетерологичных генов. Например, штамм 1 представляет собой штамм, продуцирующий 2'-FL, со сверхэкспрессией гена а-1,2-фукозилтрансферазы, futC, и генов колановой кислоты (gmd-wcaG-wcaH-wcaImanC-manB). Вставка экспрессионной кассеты, содержащей промоторный элемент (PglpF), связанный с fred в единственной копии, в фоновый штамм 1 привела к штамму 2. Результаты анализов в глубоких лунках показали, что экспрессия гена fred применением PglpF i) увеличивает продукцию 2'-FL в 1,5 раза (увеличение общей продукции 2'-FL на 15%) и ii) улучшает распределение продукта 2'-FL за счет снижения количества 2'-FL в клеточной фракции и увеличения количества продукцию в среде.Escherichia coli strain K-12 (DH1) MDO) can be modified to express heterologous genes of interest. For example, strain 1 is a 2'-FL producing strain overexpressing the α-1,2-fucosyltransferase gene, futC, and colanic acid genes (gmd-wcaG-wcaH-wcaImanC-manB). Insertion of an expression cassette containing a promoter element (PglpF) bound to fred in a single copy into background strain 1 resulted in strain 2. The results of deep well assays showed that expression of the fred gene using PglpF i) increases 2'-FL production in 1 .5-fold (15% increase in total 2'-FL production) and ii) improves the distribution of 2'-FL product by reducing the amount of 2'-FL in the cell fraction and increasing the amount of production in the medium.
Пример 2. Получение 3-FL.Example 2. Preparation of 3-FL.
Конструирование Escherichia coli, экспрессирующих ген fred, для получения 3-FL Штамм Escherichia coli K-12 (DH1) MDO) можно изменять для экспрессии представляющих интерес гетерологичных генов. Например, штамм представляет собой штамм-продуцент 3-FL со сверхэкспрессией гена альфа-1,3-фукозилтрансферазы, futA и генов колановой кислоты (gmd-wcaG-wcaH-wcaI-manC-manB). Вставка экспрессионной кассеты, содержащей промоторный элемент (PglpF) связанный с геном fred в единственной копии, в остов штамма 3 привела к штамму 4. Результаты анализов в глубоких лунках показали, что экспрессия гена fred с применением PglpF i) увеличивает продукцию 3-FL почти в 2 раза (увеличение общей продукции 3-FL на 90%) и ii) улучшает распределение продуктов 3-FL за счет снижения количества 3-FL в клеточной фракции и увеличения количества 3-FL в среде.Construction of Escherichia coli expressing the fred gene to produce 3-FL Escherichia coli strain K-12 (DH1) MDO) can be modified to express heterologous genes of interest. For example, the strain is a 3-FL producing strain with overexpression of the alpha-1,3-fucosyltransferase gene, futA and colanic acid genes (gmd-wcaG-wcaH-wcaI-manC-manB). Insertion of an expression cassette containing a promoter element (PglpF) linked to the fred gene in a single copy into the backbone of strain 3 resulted in strain 4. The results of deep well assays showed that expression of the fred gene using PglpF i) increases 3-FL production by almost 2-fold (90% increase in total 3-FL production) and ii) improves the distribution of 3-FL products by reducing the amount of 3-FL in the cell fraction and increasing the amount of 3-FL in the medium.
Пример 3. Получение LNT.Example 3. Preparation of LNT.
Конструирование Escherichia coli, экспрессирующих ген fred, для получения LNT Штаммы Escherichia coli K-12 (DH1) MDO) можно изменять для экспрессии представляющих интерес гетерологичных генов. Например, штамм 5 представляет собой штамм-продуцент LNT со сверхэкспрессией гена β1,3-И-ацетилглюкозаминилтрансферазы, lgtA, и в-1,3-галактозилтрансферазы, galTK. Вставка экспрессионной кассеты, содержащей промоторный элемент (PglpF_SD4) связанный с геном fred, в единственной копии в остов штамма 5 привела к штамму 6. Вставка экспрессионной кассеты, содержащей промоторный элемент (PglpF_SD7), связанный с геном fred, в единственной копии в остов штамма 5 привела к штамму 7. Результаты анализов в глубоких лунках показали, что экспрессия гена fred с применением PglpF_SD4 или PglpF_SD7: i) увеличение продукции LNT в 1,2-1,3 раза (увеличение общей продукции LNT на 20-30%) и ii) небольшое улучшение распределения продукта LNT за счет снижения количества LNT в клеточной фракции и увеличение количества LNT в среде.Construction of Escherichia coli expressing the fred gene to produce LNT Escherichia coli strains K-12 (DH1) MDO) can be modified to express heterologous genes of interest. For example, strain 5 is an LNT-producing strain with overexpression of the β1,3-N-acetylglucosaminyltransferase, lgtA, and β-1,3-galactosyltransferase, galTK genes. Insertion of an expression cassette containing the promoter element (PglpF_SD4) associated with the fred gene in a single copy into the backbone of strain 5 resulted in strain 6. Insertion of an expression cassette containing the promoter element (PglpF_SD7) associated with the fred gene in a single copy into the backbone of strain 5 led to strain 7. The results of deep well assays showed that expression of the fred gene using PglpF_SD4 or PglpF_SD7: i) increased LNT production by 1.2-1.3 times (increase in total LNT production by 20-30%) and ii) slight improvement in the distribution of the LNT product due to a decrease in the amount of LNT in the cell fraction and an increase in the amount of LNT in the medium.
Резюме примеров 1-3.Summary of Examples 1-3.
Хромосомная экспрессия fred в штамме-продуценте 2'-FL, LNT или 3-FL увеличивала продукцию ОГМ, а в случае 2'-FL и 3-FL экспрессия fred снижала количество ОГМ внутри клеток (фракция осадка).Chromosomal expression of fred in a strain producing 2'-FL, LNT or 3-FL increased the production of OGM, and in the case of 2'-FL and 3-FL, expression of fred decreased the amount of OGM inside the cells (pellet fraction).
Следовательно, экспорт ОГМ белками суперсемейства основных посредников fred увеличивает способность штаммов-продуцентов продуцировать ОГМ.Therefore, export of OGM by proteins of the fred superfamily of proteins increases the ability of producer strains to produce OGM.
Таблица 7Table 7
* Основа штамма для продукции ОГМ.* The basis of the strain for OGM production.
Пример 4. Транспортер Vag представляет собой новый переносчик ядра LNT-2 с высокой селективностью в отношении LNnT.Example 4 The Vag transporter is a novel LNT-2 core transporter with high selectivity for LNnT.
Таблица 6аTable 6a
Примеры хелперных и донорных плазмид, применяемых для конструирования штаммовExamples of helper and donor plasmids used to construct strains
Последовательности ДНК гетерологичных генов, кодирующих представляющие интерес транспортеры или гликозилтрансферазы, были оптимизированы по кодонам и синтезированы с помощью GenScript. Интересующие гены, кодирующие белки-транспортеры, как показано в табл. 4, амплифицировали с помощью ПЦР с применением подходящих праймеров, охватывающих стартовый кодон ATG и стопкодон ТАА гена (табл. 3). Для конструирования донорных плазмид с любым представляющего интерес гетерологичного гена, применяли стандартное клонирование USER для объединения очищенных ПЦРфрагментов соответствующего скелета плазмиды, промоторного элемента и представляющего интерес гена. Клонирование в соответствующей плазмиде может быть осуществлено с применением любого стандартного способа клонирования ДНК. После клонирования ДНК трансформировали в клетки ТОР10DNA sequences of heterologous genes encoding transporters or glycosyltransferases of interest were codon optimized and synthesized using GenScript. Genes of interest encoding transporter proteins, as shown in Table. 4 were amplified by PCR using suitable primers covering the ATG start codon and the TAA stop codon of the gene (Table 3). To construct donor plasmids with any heterologous gene of interest, standard USER cloning was used to combine purified PCR fragments of the corresponding plasmid backbone, promoter element, and gene of interest. Cloning into the appropriate plasmid can be accomplished using any standard DNA cloning technique. After cloning, the DNA was transformed into TOP10 cells
- 23 046005 и отбирали на чашках LB, содержащих 100 мкг/мл ампициллина (или 50 мг/мл канамицина в зависимости от применяемой основы) и 0,2% глюкозы.- 23 046005 and were selected on LB plates containing 100 μg/ml ampicillin (or 50 mg/ml kanamycin depending on the base used) and 0.2% glucose.
Сконструированные плазмиды очищали, а последовательность промотора и 5'-конец интересующего гена подтверждали секвенированием ДНК (MWG Eurofins Genomics).The constructed plasmids were purified, and the promoter sequence and 5′ end of the gene of interest were confirmed by DNA sequencing (MWG Eurofins Genomics).
Конструирование штаммов.Strain construction.
Применяемые бактериальный штамм, MDO, был сконструирован из Escherichia coli K-12 DHL Генотип E.coli K-12 DH1 представляет собой: F-, λ-, gyrA96, recA1, relA1, endA1, thi-1, hsdR17, supE44. В дополнение к генотипу E.coli K-12 DH1 MDO имеет следующие модификации: lacZ: делеция, размером 1,5 т.п.н., lacA: делеция, размером 0,5 т.п.н., nanKETA: делеция, размером 3,3 т.п.н., melA: делеция, размером 0,9 т.п.н., wcaJ: делеция, размером 0,5 т.п.н., mdoH: делеция, размером 0,5 т.п.н., и вставка промотора Plac выше гена gmd.The bacterial strain used, MDO, was constructed from Escherichia coli K-12 DHL The genotype of E. coli K-12 DH1 is: F - , λ - , gyrA96, recA1, relA1, endA1, thi-1, hsdR17, supE44. In addition to the E. coli K-12 genotype, DH1 MDO has the following modifications: lacZ: 1.5 kb deletion, lacA: 0.5 kb deletion, nanKETA: deletion, 3.3 kb, melA: 0.9 kb deletion, wcaJ: 0.5 kb deletion, mdoH: 0.5 k deletion .bp, and insertion of the Plac promoter upstream of the gmd gene.
Вставку кассеты экспрессии, содержавшей промотор, связанный с геном Fred и последовательностью терминатора транскрипции Т1, осуществляли с помощью Gene Gorging, по существу, как описано Herring et al. (Herring, C.D., Glasner, J.D. and Blattner, F.R. (2003) 311) 153-163), а примеры хелперной и донорной плазмид, примененных для конструирования штаммов, представленных в настоящей заявке, приведены в табл. 6. Вкратце, донорную плазмиду и хелперную плазмиду котрансформировали в MDO и отбирали на чашках с LB, содержавших 0,2% глюкозы, ампициллин (100 мкг/мл) или канамицин (50 мг/мл) и хлорамфеникол (20 мкг/мл). Одиночную колонию инокулировали в 1 мл LB, содержащего хлорамфеникол (20 мкг/мл) и 10 мкл 20% L-арабинозы, и инкубировали при 37°C при встряхивании в течение 7-8 ч. Для интеграции в локусы galK клеток E.coli затем высевали на чашки M9-DOG и инкубировали при 37°C в течение 48 ч. Отдельные колонии, сформированные на чашках MM-DOG, повторно высевали штрихом на чашки с LB, содержавшие 0,2% глюкозы, и инкубировали в течение 24 ч при 37°C. Колонии, которые выглядели белыми на чашках с агаром MacConkey-галактоза и были чувствительны как к ампициллину, так и к хлорамфениколу, потеряли донорную и вспомогательную плазмиду и содержали вставку в локусах galK. Вставки в сайт galK идентифицировали с помощью ПНР колоний с применением праймеров 048 (SEQ ID NO: 23) и 049 (SEQ ID NO: 24), а вставленную ДНК проверяли секвенированием (Eurofins Genomics, Германия).Insertion of an expression cassette containing a promoter linked to the Fred gene and a T1 transcription terminator sequence was accomplished using Gene Gorging essentially as described by Herring et al. (Herring, C.D., Glasner, J.D. and Blattner, F.R. (2003) 311) 153-163), and examples of helper and donor plasmids used to construct the strains presented in this application are given in table. 6. Briefly, donor plasmid and helper plasmid were cotransformed into MDO and selected on LB plates containing 0.2% glucose, ampicillin (100 μg/ml) or kanamycin (50 mg/ml), and chloramphenicol (20 μg/ml). A single colony was inoculated in 1 ml of LB containing chloramphenicol (20 μg/ml) and 10 μl of 20% L-arabinose and incubated at 37°C with shaking for 7-8 hours. For integration into the galK loci of E. coli cells, were plated on M9-DOG plates and incubated at 37°C for 48 hours. Individual colonies formed on MM-DOG plates were streaked again onto LB plates containing 0.2% glucose and incubated for 24 hours at 37 °C. Colonies that appeared white on MacConkey-galactose agar plates and were sensitive to both ampicillin and chloramphenicol had lost the donor and helper plasmid and contained an insertion at the galK loci. Insertions into the galK site were identified by colony PNR using primers 048 (SEQ ID NO: 23) and 049 (SEQ ID NO: 24), and the inserted DNA was verified by sequencing (Eurofins Genomics, Germany).
Встраивание генетических кассет в другие локусы хромосомной ДНК E.coli осуществляли аналогичным образом с применением различных маркерных генов селекции.The integration of genetic cassettes into other loci of E. coli chromosomal DNA was carried out in a similar way using various selection marker genes.
Выравнивание последовательности.Sequence alignment.
Эвристическое парное выравнивание последовательностей, реализованное в BLAST 2.1.2 (Basic Local Alignment Search Tool) (Altschul et al. 1990) в базе данных NCBI (http://www.ncbi.nlm.nih.gov), выполняли для проверки гомологии последовательностей белков-транспортеров, упомянутых в настоящем изобретении. Все параметры сохраняли со значениями по умолчанию для каждого выравнивания BLAST.Heuristic pairwise sequence alignment implemented in BLAST 2.1.2 (Basic Local Alignment Search Tool) (Altschul et al. 1990) in the NCBI database (http://www.ncbi.nlm.nih.gov) was performed to check sequence homology transporter proteins mentioned in the present invention. All parameters were kept at default values for each BLAST alignment.
В настоящем изобретении мы проверили способность выбранных гетерологичных транспортеров MFS экспортировать LNnT из клетки-хозяина с применением эталонного штамма, а именно МР3672. Штамм имеет одну PglpF-управляемую копию каждой гетерологичной гликозилтрансферазы, которая необходима для образования продукта.In the present invention, we tested the ability of selected heterologous MFS transporters to export LNnT from the host cell using a reference strain, namely MP3672. The strain has one PglpF-driven copy of each heterologous glycosyltransferase that is required for product formation.
Одна копия каждого из выбранных гетерологичных генов-транспортеров, т.е. vag, yberC0001_9420, marc, bad, пес, yabM и fred (табл. 4), индивидуально интегрировали в геном штамма МР3672 под контролем промотора Plac, который, как известно, обеспечивает умеренные уровни транскриптов. Сайт связывания рибосом промотора Plac (т.е. 16 п.н. выше сайта начала трансляции) был модифицирован (см. табл. 5) для усиления рибосомного связывания с синтезированными транскриптами и, таким образом, позитивно регулирует управляемую Plac экспрессию на уровне трансляции.One copy of each of the selected heterologous transporter genes, i.e. vag, yberC0001_9420, marc, bad, dog, yabM and fred (Table 4), were individually integrated into the genome of strain MP3672 under the control of the Plac promoter, which is known to provide moderate levels of transcripts. The ribosome binding site of the Plac promoter (i.e., 16 bp upstream of the translation start site) has been modified (see Table 5) to enhance ribosomal binding to synthesized transcripts and thus positively regulates Plac-driven expression at the translational level.
Следуя описанному выше подходу к конструированию штамма и тестируя эффективность штамма в DWA, мы сообщаем в настоящем документе, что только Vag-экспрессирующие клетки, продуцирующие LNnT, демонстрируют относительное увеличение как оттока продуцируемого LNnT, так и общей продукции LNnT по сравнению с эталонным штаммом.Following the strain construction approach described above and testing strain performance in DWA, we report here that only Vag-expressing LNnT-producing cells exhibit a relative increase in both the efflux of LNnT produced and the total LNnT production compared to the reference strain.
Как показано на фиг. 7, Plac- управляемая экспрессия большинства генов-транспортеров (marc, fred, bad, пес, yabM, yberC0001-9420) либо не оказывает существенного влияния, либо снижает продукцию LNnT (до 45%). Напротив, введение гена vag в генетический фон штамма МР3672 приводит к заметному увеличению титра LNnT (фиг. 7).As shown in FIG. 7, Plac-driven expression of most transporter genes (marc, fred, bad, dog, yabM, yberC0001-9420) either does not have a significant effect or reduces LNnT production (up to 45%). On the contrary, introduction of the vag gene into the genetic background of strain MP3672 leads to a noticeable increase in LNnT titer (Fig. 7).
Выравнивание аминокислотных последовательностей семи протестированных предполагаемых переносчиков MSF показало, что переносчик Vag имеет очень высокий охват последовательностей (от 99 до 100%) по сравнению с остальными шестью транспортерами, протестированными в настоящем изобретении, с идентичностью последовательностей от 65 до 75%. Самая высокая идентичность последовательности (75%) была оценена для последовательности Vag и последовательности транспортера MFS, кодируемого геном yabM (табл. 8). Интересно, что транспортер MFS YabM, описанный в WO 2017042382 в качестве предполагаемого эффективного экспортера LNT, не оказывал существенного влияния ни на окончательный общий титр LNnT, ни на отток LNnT (фиг. 7, 8). Таким образом, вопреки относительно высокому сходству его белковой последовательности с Vag, транспортер YabM, повидимому, неэффективен в отношении транспорта LNnT, что ясно отражается в концентрациях продукAmino acid sequence alignment of the seven putative MSF transporters tested showed that the Vag transporter has very high sequence coverage (99 to 100%) compared to the other six transporters tested in the present invention, with sequence identity ranging from 65 to 75%. The highest sequence identity (75%) was estimated for the Vag sequence and the sequence of the MFS transporter encoded by the yabM gene (Table 8). Interestingly, the MFS transporter YabM, described in WO 2017042382 as a putative efficient LNT exporter, had no significant effect on either the final total LNnT titer or LNnT efflux (Figures 7, 8). Thus, despite its relatively high protein sequence similarity to Vag, the YabM transporter appears to be inefficient in LNnT transport, as clearly reflected in product concentrations.
--
Claims (8)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DKPA202000087 | 2020-01-23 |
Publications (1)
Publication Number | Publication Date |
---|---|
EA046005B1 true EA046005B1 (en) | 2024-01-31 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230072639A1 (en) | New major facilitator superfamily (mfs) protein (bad) in hmo production | |
US20230193335A1 (en) | Hmo production | |
US20230227876A1 (en) | Hmo production | |
US20230109661A1 (en) | Hmo production | |
US20240102063A1 (en) | New major facilitator superfamily (mfs) protein (fred) in production of sialylated hmos | |
US20230109937A1 (en) | New major facilitator superfamily (mfs) protein (fred) in hmo production | |
US20240043891A1 (en) | A dfl-producing strain | |
EA046005B1 (en) | A NEW MAIN FACTOR SUPERFAMILY (MFS) PROTEIN (Fred) IN THE PRODUCTION OF OGM | |
EA046260B1 (en) | OBTAINING OGM | |
EA046248B1 (en) | OBTAINING OGM | |
EA046241B1 (en) | OBTAINING OGM | |
CN116802302A (en) | Novel Major Facilitator Superfamily (MFS) proteins (FREDs) in sialylated HMO production |