EA046248B1 - OBTAINING OGM - Google Patents

OBTAINING OGM Download PDF

Info

Publication number
EA046248B1
EA046248B1 EA202292159 EA046248B1 EA 046248 B1 EA046248 B1 EA 046248B1 EA 202292159 EA202292159 EA 202292159 EA 046248 B1 EA046248 B1 EA 046248B1
Authority
EA
Eurasian Patent Office
Prior art keywords
lnfp
gene
nucleic acid
strain
lnt
Prior art date
Application number
EA202292159
Other languages
Russian (ru)
Inventor
Маргит Педерсен
Манос Пападакис
Катрине Бых Кампманн
Original Assignee
Глюком А/С
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Глюком А/С filed Critical Глюком А/С
Publication of EA046248B1 publication Critical patent/EA046248B1/en

Links

Description

Область техники, к которой относится изобретениеField of technology to which the invention relates

Настоящее изобретение относится к области рекомбинантного получения биологических молекул в клетках-хозяевах. Более конкретно, оно относится к способу рекомбинантного получения олигосахаридов грудного молока (ОГМ) с применением генетически модифицированных клеток, экспрессирующих белок суперсемейства основных посредников (MFS).The present invention relates to the field of recombinant production of biological molecules in host cells. More specifically, it relates to a method for recombinantly producing human milk oligosaccharides (HMOs) using genetically modified cells expressing a major messenger superfamily (MFS) protein.

Уровень техникиState of the art

Олигосахариды грудного молока (ОГМ) составляют третий по величине твердый компонент грудного молока и обладают высокой устойчивостью к ферментативному гидролизу. Как следствие, значительная часть ОГМ остается в значительной степени непереваренной и неабсорбированной, что делает возможным их проникновение в толстую кишку. В толстой кишке ОГМ могут служить субстратами для формирования кишечной экосистемы путем избирательной стимуляции роста специфических сахаролитических бактерий. Эта избирательность считается полезной как для младенцев, так и для взрослых, поскольку считается, что штаммы видов Bifidobacterium положительно влияют на здоровье кишечника (Chichiowski M. et al., (2012) J. Pediatr. Gastroenterol. Nutr. 5:251-258; Elison E. et al., (2016) Brit J. Nutr, 116: 1356-1368).Human milk oligosaccharides (HMOs) constitute the third largest solid component of human milk and are highly resistant to enzymatic hydrolysis. As a consequence, a significant portion of the HMOs remains largely undigested and unabsorbed, allowing them to pass into the colon. In the colon, HMOs can serve as substrates for the formation of the intestinal ecosystem by selectively stimulating the growth of specific saccharolytic bacteria. This selectivity is considered beneficial for both infants and adults, as strains of Bifidobacterium species are thought to have positive effects on gut health (Chichiowski M. et al., (2012) J. Pediatr. Gastroenterol. Nutr. 5:251-258; Elison E. et al., (2016) Brit J. Nutr, 116: 1356-1368).

Помимо своих пребиотических свойств, ОГМ связаны с дополнительными положительными эффектами, что расширяет область их применения (Kunz С. et al., (2014) Food Oligosaccharides: Production, Analysis and Bioactivity, 1st Edition, p 5-20, Eds. Moreno J. and Luz Sanz M., John Wiley & Sons, Ltd).In addition to their prebiotic properties, HMOs are associated with additional beneficial effects, which expands the scope of their application (Kunz S. et al., (2014) Food Oligosaccharides: Production, Analysis and Bioactivity, 1st Edition, p 5-20, Eds. Moreno J. and Luz Sanz M., John Wiley & Sons, Ltd).

Очевидная польза ОГМ для здоровья позволила разрешить их применение в пищевых продуктах, таких как детские смеси и пищевые продукты, а также в потребительских товарах для здоровья. Биотехнологическое производство ОГМ представляет собой ценный экономичный и масштабный способ производства ОГМ. Оно основано на генетически модифицированных бактериях, сконструированных таким образом, чтобы экспрессировать гликозилтрансферазы, необходимые для синтеза желаемых олигосахаридов, и в нем применяют врожденный пул нуклеотидных Сахаров бактерий в качестве предшественников ОГМ. Недавние разработки в биотехнологическом производстве ОГМ позволили преодолеть некоторые присущие бактериальным экспрессионным системам ограничения. Например, бактериальные клетки, продуцирующие ОГМ, могут быть генетически модифицированы для увеличения ограниченного внутриклеточного пула нуклеотидных Сахаров в бактериях (WO2012112777), для повышения активности ферментов, участвующих в продукции ОГМ (WO2016040531), или для облегчения секреции синтезированных ОГМ во внеклеточную среду (WO2010142305, WO2017042382). Кроме того, экспрессию представляющих интерес генов в рекомбинантных клетках можно регулировать с помощью конкретных промоторов или других регуляторов экспрессии генов, таких как, например, те, что недавно были описаны в WO 2019123324.The obvious health benefits of HGMs have led to approval of their use in food products such as infant formula and food products, as well as in consumer health products. Biotechnological production of OGM represents a valuable, cost-effective and large-scale method for the production of OGM. It is based on genetically modified bacteria engineered to express the glycosyltransferases required to synthesize the desired oligosaccharides, and utilizes the bacteria's innate pool of nucleotide sugars as OGM precursors. Recent developments in the biotechnological production of HGM have overcome some of the inherent limitations of bacterial expression systems. For example, bacterial cells that produce OGM can be genetically modified to increase the limited intracellular pool of nucleotide sugars in bacteria (WO2012112777), to increase the activity of enzymes involved in the production of OGM (WO2016040531), or to facilitate the secretion of synthesized OGM into the extracellular environment (WO2010142305, WO2017042382). In addition, the expression of genes of interest in recombinant cells can be regulated by specific promoters or other gene expression regulators, such as those recently described in WO 2019123324.

Подход, описанный в WO 2010142305 и WO 2017042382, имеет то преимущество, что он позволяет снизить метаболическую нагрузку, воздействующую на продуцирующую клетку, за счет высоких уровней экспрессии рекомбинантных генов, т.е. с применением способов WO2012112777, WO2016040531 или WO2019123324. Этот подход привлекает все большее внимание к конструированию рекомбинантных клеток, продуцирующих ОГМ, например, недавно были описаны несколько новых генов переносчиков сахара, кодирующих белки и процедуры ферментации, которые могут способствовать выведению рекомбинантно продуцируемой 2'-фукозиллактозы (2'-FL), самого распространенного ОГМ грудного молока (WO2018077892, US201900323053, US201900323052). Однако в настоящее время не существует алгоритма, который мог бы точно определить правильный белок-транспортер, способный обеспечивать отток различных структур ОГМ, полученных рекомбинантно, среди многочисленных бактериальных белков с предсказанной функцией транспортера в нескольких базах данных белков, например, в UniProt, поскольку структуры/факторы, определяющие субстратную специфичность переносчиков Сахаров, до сих пор недостаточно изучены и остаются крайне непредсказуемыми.The approach described in WO 2010142305 and WO 2017042382 has the advantage that it reduces the metabolic burden on the producing cell due to high levels of recombinant gene expression, i.e. using methods WO2012112777, WO2016040531 or WO2019123324. This approach is attracting increasing attention to the construction of recombinant cells producing HGM, for example, several new sugar transporter genes encoding proteins and fermentation procedures that can facilitate the clearance of recombinantly produced 2'-fucosyllactose (2'-FL), the most abundant OGM of breast milk (WO2018077892, US201900323053, US201900323052). However, there is currently no algorithm that can accurately identify the correct transporter protein capable of mediating the efflux of various recombinantly produced OGM structures among the numerous bacterial proteins with predicted transporter function in several protein databases, such as UniProt, since the structures the factors that determine the substrate specificity of sugar transporters are still poorly understood and remain extremely unpredictable.

Раскрытие изобретенияDisclosure of the Invention

Идентификация новых эффективных белков-транспортеров оттока Сахаров, обладающих специфичностью к различным рекомбинантно полученным ОГМ и разработка рекомбинантных клеток, экспрессирующих указанный белок, выгодны для крупномасштабного промышленного производства ОГМ.The identification of new efficient sugar efflux transporter proteins with specificity for various recombinantly produced OGMs and the development of recombinant cells expressing the said protein are beneficial for large-scale industrial production of OGMs.

Настоящее изобретение относится к рекомбинантным клеткам, способным продуцировать олигосахарид грудного молока (ОГМ), при этом клетки экспрессируют гетерологичный ген, кодирующий предполагаемый транспортный белок MFS (major facilitator superfamily, суперсемейство основных посредников), происходящий из бактерии Rosenbergiella nectarea. Более конкретно, изобретение относится к генетически модифицированной клетке, оптимизированной для продукции олигосахаридов, в особенности, ОГМ, содержащей рекомбинантную нуклеиновую кислоту, кодирующую белок, последовательность которого, по меньшей мере, на 80% сходна с аминокислотной последовательностью SEQ ID NO:1. Аминокислотная последовательность, обозначенная в настоящем документе как SEQ ID NO:1, представляет собой аминокислотную последовательность, которая на 100% идентична аминокислотной последовательности, имеющей номер доступа в GenBank IDWP_092672081.1(https://www.ncbi.nlm.nih.gov/protein/WP_092672081.1). Белок-транспортер MFS, имеющий аминокислотную последовательность SEQ ID NO:1, идентифицируют в настоящем документе как белок Nec, или транспортер Nec, или Nec, взаимозаменяемо; последовательность нуклеиновой кислоты,The present invention relates to recombinant cells capable of producing human milk oligosaccharide (HMO), wherein the cells express a heterologous gene encoding a putative MFS (major facilitator superfamily) transport protein derived from the bacterium Rosenbergiella nectarea. More specifically, the invention relates to a genetically modified cell optimized for the production of oligosaccharides, especially OGM, containing a recombinant nucleic acid encoding a protein having at least 80% sequence similarity to the amino acid sequence of SEQ ID NO:1. The amino acid sequence designated herein as SEQ ID NO:1 is an amino acid sequence that is 100% identical to the amino acid sequence having GenBank accession number IDWP_092672081.1(https://www.ncbi.nlm.nih.gov/ protein/WP_092672081.1). The MFS transporter protein having the amino acid sequence of SEQ ID NO:1 is identified herein as Nec protein, or Nec transporter, or Nec, interchangeably; nucleic acid sequence,

- 1 046248 кодирующую белок Nec, идентифицируют в настоящем документе как кодирующая nec нуклеиновая кислота/ДНК, или ген nec, или nec.- 1 046248 encoding the Nec protein is identified herein as the nec encoding nucleic acid/DNA, or the nec gene, or nec.

Настоящее изобретение показывает, что применение рекомбинантных клеток, продуцирующих ОГМ, которые экспрессируют белок Nec, приводит к весьма отчетливым улучшениям процесса производства ОГМ как с точки зрения ферментации, так и очистки ОГМ. Описанные в настоящем документе рекомбинантные клетки и способы получения ОГМ обеспечивают как более высокие выходы всех произведенных ОГМ, более низкое образование побочных продуктов или отношение побочного продукта к продукту, более низкое образование биомассы за ферментацию, так и облегченное извлечение ОГМ во время последующей обработки ферментационный бульон.The present invention shows that the use of recombinant OGM-producing cells that express the Nec protein leads to very distinct improvements in the OGM production process, both in terms of fermentation and OGM purification. The recombinant cells and methods for producing HMOs described herein provide both higher yields of total HMOs produced, lower byproduct formation or byproduct to product ratio, lower biomass production per fermentation, and easier recovery of HMOs during downstream processing of the fermentation broth.

Неожиданно было обнаружено, что экспрессия последовательности ДНК, кодирующей Nec, в различных ОГМ-продуцирующих клетках связана с накоплением некоторых ОГМ во внеклеточной среде и других ОГМ внутри продуцирующих клеток, а также с увеличением общей продукции ОГМ. Неожиданно оказалось, что увеличение выхода образующихся ОГМ характерно для ОГМ, состоящих либо из трех, либо из четырех звеньев моносахаридов, т.е. для ОГМ, которые представляют собой трисахариды и тетрасахариды, например, 2'-фукозиллактозы (2'-FL), 3-фукозиллактозы (3-FL), 3-сиалиллактозы (3'-SL), 6'сиалиллактозы (6'-SL), лакто-Ы-триозы 2, (LNT-2), лакто-Ы-неотетраозы (LNnT) и лакто-Ы-тетраозы (LNT), но не для более крупных олигосахаридных структур, таких как пентасахариды и гексасахариды, которые накапливаются внутри продуцирующих клеток. Неожиданно также обнаружено, что общая продукция основных ОГМ, например, 2'-фукозиллактозы (2'-FL), 3-фукозиллактозы (3-FL), лакто-Ы-триозы (LNT II) и лакто-Ы-тетраозы (LNT) соответствующими ОГМ-продуцирующими клетками, экспрессирующими Nec, также увеличивается, в то время как образование побочных продуктов, например, дифукозиллактозы (DFL), лакто-Ы-фукопентаозы V (LNFP V) или паралактонеогексаозы-I (pLNH-I), в этих клетках, соответственно, часто снижены, и указанные побочные олигосахариды обычно накапливаются внутри ОГМ-продуцирующих клеток. Далее, весьма неожиданно, оказалось, что экспрессия белка Nec в клетках, продуцирующих ОГМ, приводит к снижению образования биомассы во время ферментации и к более здоровым клеточным культурам, отражаясь в уменьшении количества мертвых клеток в конце ферментации, что делает производственный процесс более эффективным, поскольку на единицу биомассы производится больше продукта.Surprisingly, it was found that expression of the DNA sequence encoding Nec in various OGM-producing cells is associated with the accumulation of some OGMs in the extracellular environment and other OGMs within the producing cells, as well as an increase in overall OGM production. Unexpectedly, it turned out that an increase in the yield of the resulting OHMs is characteristic of OHMs consisting of either three or four monosaccharide units, i.e. for OGM, which are trisaccharides and tetrasaccharides, for example, 2'-fucosyllactose (2'-FL), 3-fucosyllactose (3-FL), 3-sialyllactose (3'-SL), 6'sialyllactose (6'-SL ), lacto-N-triose 2, (LNT-2), lacto-N-neotetraose (LNnT) and lacto-N-tetraose (LNT), but not for larger oligosaccharide structures such as pentasaccharides and hexasaccharides, which accumulate internally producing cells. Surprisingly, it was also found that the total production of major HMOs, such as 2'-fucosyllactose (2'-FL), 3-fucosyllactose (3-FL), lacto-N-triose (LNT II) and lacto-N-tetraose (LNT) corresponding OGM-producing cells expressing Nec is also increased, while the formation of by-products such as difucosyllactose (DFL), lacto-N-fucopentaose V (LNFP V) or paralactoneohexaose-I (pLNH-I) in these cells , accordingly, are often reduced, and these by-product oligosaccharides usually accumulate inside OGM-producing cells. Further, quite unexpectedly, it was found that the expression of the Nec protein in HGM-producing cells leads to reduced biomass production during fermentation and healthier cell cultures, reflected in a decrease in the number of dead cells at the end of fermentation, which makes the production process more efficient since More product is produced per unit of biomass.

Соответственно, первый аспект изобретения относится к генетически модифицированной клетке, способной продуцировать один или несколько ОГМ, где указанная клетка включает рекомбинантную нуклеиновую кислоту, кодирующую белок SEQ ID NO:1 (фиг. 6), или его функциональный гомолог, аминокислотная последовательность которого идентична, по меньшей мере, на 80%, предпочтительно идентична, по меньшей мере, на 85%, более предпочтительно идентична, по меньшей мере, на 90% последовательности SEQ ID NO: 1.Accordingly, the first aspect of the invention relates to a genetically modified cell capable of producing one or more HGMs, wherein said cell comprises a recombinant nucleic acid encoding a protein of SEQ ID NO:1 (FIG. 6), or a functional homolog thereof, the amino acid sequence of which is identical to at least 80% identical, preferably at least 85% identical, more preferably at least 90% identical to the sequence of SEQ ID NO: 1.

Второй аспект изобретения относится к конструкции нуклеиновой кислоты, включающей последовательность(последовательности) нуклеиновой кислоты, кодирующую(кодирующие) белок-транспортер MFS, где последовательность нуклеиновой кислоты, кодирующая белок, имеет, по меньшей мере, 70% идентичности с последовательностью SEQ ID NO: 2, например, по меньшей мере, 80%, например, по меньшей мере, 85%, например, по меньшей мере, 95%, например, по меньшей мере, 99%, а также к генетически модифицированной клетке, включающей конструкцию нуклеиновой кислоты, которая представляет собой Escherichia coli.A second aspect of the invention relates to a nucleic acid construct comprising nucleic acid sequence(s) encoding an MFS transporter protein, wherein the nucleic acid sequence encoding the protein has at least 70% identity to the sequence of SEQ ID NO: 2 , for example at least 80%, for example at least 85%, for example at least 95%, for example at least 99%, as well as to a genetically modified cell including a nucleic acid construct that is Escherichia coli.

В одном аспекте конструкция нуклеиновой кислоты включает последовательность(последовательности) нуклеиновой кислоты, кодирующую(кодирующие) белок-транспортер MFS, в которой последовательность нуклеиновой кислоты идентична, по меньшей мере, на 70% последовательности SEQ ID NO:2.In one aspect, the nucleic acid construct includes nucleic acid sequence(s) encoding an MFS transporter protein, wherein the nucleic acid sequence is at least 70% identical to the sequence of SEQ ID NO:2.

Третий аспект изобретения относится к способу получения одного или нескольких олигосахаридов, включающему следующие стадии:The third aspect of the invention relates to a method for producing one or more oligosaccharides, comprising the following steps:

(i) получение генетически модифицированной клетки, способной продуцировать ОГМ, в котором указанная клетка включает рекомбинантную нуклеиновую кислоту, кодирующую белок SEQ ID NO:1, или его функциональный гомолог, аминокислотная последовательность которого идентична, по меньшей мере, на 80%, предпочтительно идентична, по меньшей мере, на 85%, более предпочтительно идентична, по меньшей мере, на 90% последовательности SEQ ID NO: 1;(i) obtaining a genetically modified cell capable of producing HGM, wherein said cell includes a recombinant nucleic acid encoding a protein of SEQ ID NO:1, or a functional homolog thereof, the amino acid sequence of which is at least 80% identical, preferably identical, at least 85%, more preferably at least 90% identical to the sequence of SEQ ID NO: 1;

(ii) культивирование клеток в соответствии с (i) в подходящей среде культивирования клеток для экспрессии указанной рекомбинантной нуклеиновой кислоты;(ii) culturing cells in accordance with (i) in a suitable cell culture medium to express said recombinant nucleic acid;

(iii) сбор одного или нескольких ОГМ, полученных на стадии (ii).(iii) collecting one or more OGM obtained in step (ii).

Изобретение также относится к применению генетически модифицированной клетки или конструкции нуклеиновой кислоты, содержащей гетерологичную последовательность нуклеиновой кислоты, кодирующую белок суперсемейства основных посредников (MFS), причем указанная последовательность нуклеиновой кислоты имеет, по меньшей мере, 70% идентичности последовательности с SEQ ID NO: 2, для производства одного или нескольких олигосахаридов грудного молока (ОГМ).The invention also relates to the use of a genetically modified cell or nucleic acid construct comprising a heterologous nucleic acid sequence encoding a major messenger superfamily (MFS) protein, wherein said nucleic acid sequence has at least 70% sequence identity with SEQ ID NO: 2. to produce one or more human milk oligosaccharides (HMOs).

Как упоминалось выше, при культивировании генетически модифицированных клеток, способных продуцировать один или несколько ОГМ, клеток включающих нуклеиновую кислоту, кодирующую беAs mentioned above, when cultivating genetically modified cells capable of producing one or more OGM, cells including a nucleic acid encoding be

- 2 046248 лок-транспортер Nec, неожиданно было обнаружено, что соответствующие один или несколько ОГМ продуцируются с высокими выходами, тогда как образование побочных продуктов и биомассы снижается. Это облегчает извлечение ОГМ в последующих процессах, например, общая процедура извлечения и очистки может включать меньше стадий и общее время очистки может быть сокращено.- 2 046248 Nec loc transporter, it was unexpectedly found that the corresponding one or more OGMs are produced in high yields, while the formation of by-products and biomass is reduced. This facilitates the recovery of HMOs in downstream processes, for example, the overall recovery and purification procedure can involve fewer steps and the overall purification time can be reduced.

Эти эффекты повышенного выхода продукта и облегчения извлечения продукта делают настоящее изобретение превосходящим раскрытия предшествующего уровня техники.These effects of increased product yield and easier product recovery make the present invention superior to the disclosures of the prior art.

Другие аспекты и полезные признаки настоящего изобретения подробно описаны и проиллюстрированы приведенными ниже неограничивающими рабочими примерами.Other aspects and useful features of the present invention are described in detail and illustrated by the following non-limiting worked examples.

Краткое описание чертежейBrief description of drawings

На фиг. 1 показаны относительная продукция 2'-FL (фиг. 1А), относительное распределение 2'-FL внутри и снаружи клеток (фиг. 1В), относительное соотношение DFL к 2'-FL (фиг. 1В), и относительная оптическая плотность (фиг. 1D) модифицированной Е. coli со сверхэкспрессией белка-транспортера MFS с последовательностью SEQ ID NO: 1 и без сверхэкспрессии.In fig. Figure 1 shows the relative production of 2'-FL (Fig. 1A), the relative distribution of 2'-FL inside and outside cells (Fig. 1B), the relative ratio of DFL to 2'-FL (Fig. 1B), and the relative optical density (Fig. 1D) modified E. coli with overexpression of the MFS transporter protein with the sequence SEQ ID NO: 1 and without overexpression.

На фиг. 2 показано относительное распределение 3 -FL внутри и снаружи клеток в модифицированной Е. coli со сверхэкспрессией белка-транспортера MFS с последовательностью SEQ ID NO: 1 и без сверхэкспрессии.In fig. 2 shows the relative distribution of 3-FL inside and outside cells in modified E. coli with and without overexpression of the MFS transporter protein of SEQ ID NO: 1.

На фиг. 3 показаны относительные концентрации LNT2 в процентах (%) для штаммов МР4002 и МР4039 в общих образцах и в образцах супернатанта и осадка. Хотя оба штамма демонстрируют оптимальную экспрессию гена гликозилтрансферазы lgtA, только МР4039 экспрессирует ген гетерологичного переносчика nec.In fig. Figure 3 shows the relative concentrations of LNT2 in percent (%) for strains MP4002 and MP4039 in total samples and in supernatant and sediment samples. Although both strains exhibit optimal expression of the lgtA glycosyltransferase gene, only MP4039 expresses the heterologous nec transporter gene.

На фиг. 4 показано процентное содержание (%) относительных концентраций LNT и побочных продуктов для штаммов МР4473 и МР4537 в общих образцах и в образцах супернатанта и осадка. Хотя оба штамма демонстрируют оптимальную экспрессию генов гликозилтрансфераз lgtA и galTK, только МР4537 экспрессирует ген гетерологичного переносчика nec.In fig. Figure 4 shows the percentage (%) of the relative concentrations of LNT and byproducts for strains MP4473 and MP4537 in the total samples and in the supernatant and sediment samples. Although both strains exhibit optimal expression of the glycosyltransferase genes lgtA and galTK, only MP4537 expresses the heterologous transporter gene nec.

На фиг. 5 показано процентное соотношение (%) относительной суммарной концентраций LNFP-I, 2'-FL, LNT и ОГМ для штаммов МР2789 и МР4597 во всех образцах. Хотя оба штамма демонстрируют оптимальную экспрессию генов гликозилтрансфераз IgtA, galTK и futC, только МР4597 экспрессирует ген гетерологичного переносчика nec.In fig. Figure 5 shows the percentage (%) of the relative total concentrations of LNFP-I, 2'-FL, LNT and OGM for strains MP2789 and MP4597 in all samples. Although both strains exhibit optimal expression of the glycosyltransferase genes IgtA, galTK, and futC, only MP4597 expresses the heterologous transporter gene nec.

На фиг. 6 представлена аминокислотная последовательность белка Nec (SEQ ID NO: 1).In fig. Figure 6 shows the amino acid sequence of the Nec protein (SEQ ID NO: 1).

Осуществление изобретенияCarrying out the invention

Далее воплощения изобретения будут описаны более подробно. Каждая конкретная вариация признаков может быть применена к другим воплощениям изобретения, если специально не указано иное.In the following, embodiments of the invention will be described in more detail. Each specific feature variation may be applied to other embodiments of the invention unless specifically stated otherwise.

Как правило, все применяемые в настоящем документе термины следует интерпретировать в соответствии с их обычным значением в технической области и как применимые ко всем аспектам и воплощениям изобретения, если явно не определено или не указано иное. Все ссылки на a/an/the [клетка, последовательность, ген, транспортер, стадия и т.д.] нужно интерпретировать открыто как относящиеся, по меньшей мере, к одному экземпляру указанной клетки, последовательности, гена, транспортера, стадии и т.д. если прямо не указано иное. Этапы любого раскрытого в настоящем документе способа не обязательно выполнять в точном раскрытом порядке, если это не указано явно.In general, all terms used herein should be interpreted in accordance with their ordinary meaning in the technical field and as applicable to all aspects and embodiments of the invention, unless expressly defined or indicated otherwise. All references to a/an/the [cell, sequence, gene, transporter, stage, etc.] should be interpreted explicitly as referring to at least one instance of the specified cell, sequence, gene, transporter, stage, etc. d. unless expressly stated otherwise. The steps of any method disclosed herein do not have to be performed in the exact order disclosed unless explicitly stated.

Настоящее изобретение в целом относится к генетически модифицированной клетке для эффективного производства олигосахаридов и к применению указанной генетически модифицированной клетки в способе получения олигосахаридов. В особенности, настоящее изобретение относится к генетически модифицированной клетке, способной к синтезу олигосахарида, предпочтительно, гетерологичный олигосахарид, в особенности, олигосахарид грудного молока (ОГМ). Соответственно, клетка по изобретению модифицируют для экспрессии набора рекомбинантных нуклеиновых кислот, которые необходимы для синтеза клетками одного или нескольких ОГМ (которые позволяют клетке синтезировать один или несколько ОГМ), таких как гены, кодирующие один или несколько ферментов с гликозилтрансферазной активностью, описанных ниже.The present invention generally relates to a genetically modified cell for efficient production of oligosaccharides and to the use of said genetically modified cell in a process for producing oligosaccharides. In particular, the present invention relates to a genetically modified cell capable of synthesizing an oligosaccharide, preferably a heterologous oligosaccharide, especially human milk oligosaccharide (HMO). Accordingly, a cell of the invention is modified to express a set of recombinant nucleic acids that are necessary for the cell to synthesize one or more OGMs (which enable the cell to synthesize one or more OGMs), such as genes encoding one or more enzymes with glycosyltransferase activity described below.

Продуцирующую олигосахарид рекомбинантную клетку по изобретению дополнительно модифицируют для включения гетерологичной последовательности рекомбинантной нуклеиновой кислоты, предпочтительно, последовательности ДНК, кодирующей предполагаемый транспортный белок MFS (major facilitator superfamily, суперсемейство основных посредников), происходящий из бактерии Rosenbergiella nectarea. Более конкретно, изобретение относится к генетически модифицированной клетке, оптимизированной для продукции одного или нескольких конкретных олигосахаридов, в особенности, одного или нескольких конкретных ОГМ, содержащей рекомбинантную нуклеиновую кислоту, кодирующую белок, имеющий, по меньшей мере, 80% сходства последовательности, предпочтительно, по меньшей мере, 85%, более предпочтительно, по меньшей мере, 90% и еще более предпочтительно, по меньшей мере, 95% сходства последовательности с аминокислотной последовательностью SEQ ID NO:1 (фиг. 6). Аминокислотная последовательность, обозначенная в настоящем документе как SEQ ID NO:1, представляет собой аминокислотную последовательность, которая на 100% идентична аминокислотной последовательности, имеющей номер доступа в GenBank: WP_092672081.1.The oligosaccharide-producing recombinant cell of the invention is further modified to include a heterologous recombinant nucleic acid sequence, preferably a DNA sequence encoding a putative MFS (major facilitator superfamily) transport protein derived from the bacterium Rosenbergiella nectarea. More particularly, the invention relates to a genetically modified cell optimized for the production of one or more specific oligosaccharides, in particular one or more specific OGMs, comprising a recombinant nucleic acid encoding a protein having at least 80% sequence similarity, preferably in at least 85%, more preferably at least 90%, and even more preferably at least 95% sequence similarity to the amino acid sequence of SEQ ID NO:1 (Fig. 6). The amino acid sequence designated herein as SEQ ID NO:1 is an amino acid sequence that is 100% identical to the amino acid sequence having GenBank accession number: WP_092672081.1.

Соответственно, первый аспект изобретения относится к генетически модифицированной клетке, способной продуцировать один или несколько ОГМ, при этом указанная клетка включает рекомбинантAccordingly, the first aspect of the invention relates to a genetically modified cell capable of producing one or more OGM, wherein said cell includes a recombinant

- 3 046248 ную нуклеиновую кислоту, кодирующую белок SEQ ID NO:1, или его функциональный гомолог, аминокислотная последовательность которого идентична, по меньшей мере, на 80%, предпочтительно идентична, по меньшей мере, на 85%, более предпочтительно идентична, по меньшей мере, на 90% последовательности SEQ ID NO: 1. Под термином функциональный гомолог в настоящем контексте подразумевают белок, аминокислотная последовательность которого на 80-99,9 % идентична SEQ ID NO: 1, и который обладает функцией, полезной для достижения по меньшей мере одного преимущественного эффекта изобретения, т.е. увеличение общего производства ОГМ клеткой-хозяином, облегчение восстановления произведенного(произведенных) ОГМ, эффективность продукции ОГМ и/или жизнеспособность клетки, продуцирующей ОГМ.- 3 046248 nucleic acid encoding a protein of SEQ ID NO:1, or a functional homolog thereof, the amino acid sequence of which is at least 80% identical, preferably at least 85% identical, more preferably at least identical at least 90% of the sequence of SEQ ID NO: 1. The term functional homolog as used herein means a protein whose amino acid sequence is 80-99.9% identical to SEQ ID NO: 1 and which has a function useful to achieve at least one advantageous effect of the invention, i.e. increasing the overall production of OGM by the host cell, facilitating recovery of the produced OGM, the efficiency of OGM production, and/or the viability of the OGM producing cell.

Белок-транспортер MFS, имеющий аминокислотную последовательность SEQ ID NO:1, идентифицируют в настоящем документе как белок Nec, или транспортер Nec, или Nec, взаимозаменяемо; последовательность нуклеиновой кислоты, кодирующую белок Nec, идентифицируют в настоящем документе как кодирующую nec нуклеиновую кислоту/ДНК, или ген nec, или nec.The MFS transporter protein having the amino acid sequence of SEQ ID NO:1 is identified herein as Nec protein, or Nec transporter, or Nec, interchangeably; a nucleic acid sequence encoding a Nec protein is identified herein as a nec nucleic acid/DNA encoding or nec gene or nec.

Под термином суперсемейства основных посредников (MFS) подразумевают большое и исключительно разнообразное семейство класса вторичных активных транспортеров, которые отвечают за транспорт ряда различных субстратов, включая сахара, лекарства, гидрофобные молекулы, пептиды, органические ионы и т.д. Специфичность белков-переносчиков сахара крайне непредсказуема, и идентификация нового белка-переносчика со специфичностью, например, в отношении олигосахаридов требует необременительных лабораторных экспериментов (более подробную информацию смотри в обзоре Reddy V.S. et al., (2012), FEBS J. 279(11): 2022-2035). Термин переносчик MFS в данном контексте означает белок, который облегчает транспорт олигосахарида, предпочтительно ОГМ, через клеточную мембрану, предпочтительно транспорт ОГМ/олигосахарида, синтезированного клеткой-хозяином, из цитозоля клетки в клеточную среду, предпочтительно, ОГМ/олигосахарида, содержащего три или четыре звена сахара, например, 2'-FL, 3-FL, LNT-2, LNT, LNnT, 3'-SL или 6'-SL. Дополнительно или альтернативно переносчик MFS может также способствовать оттоку молекул, которые не считаются ОГМ или олигосахаридами согласно настоящему изобретению, таких как лактоза, глюкоза, клеточные метаболиты или токсины.The term master messenger superfamilies (MFS) refers to a large and extremely diverse family of a class of secondary active transporters that are responsible for the transport of a number of different substrates, including sugars, drugs, hydrophobic molecules, peptides, organic ions, etc. The specificity of sugar transport proteins is highly unpredictable, and the identification of a new transport protein with specificity for, for example, oligosaccharides requires simple laboratory experiments (for more information, see review by Reddy V.S. et al., (2012), FEBS J. 279(11) : 2022-2035). The term MFS transporter in this context means a protein that facilitates the transport of an oligosaccharide, preferably OGM, across the cell membrane, preferably the transport of an OGM/oligosaccharide synthesized by the host cell from the cytosol of the cell into the cellular environment, preferably an OGM/oligosaccharide containing three or four units sugars, for example 2'-FL, 3-FL, LNT-2, LNT, LNnT, 3'-SL or 6'-SL. Additionally or alternatively, the MFS transporter may also promote the efflux of molecules that are not considered OGM or oligosaccharides according to the present invention, such as lactose, glucose, cellular metabolites or toxins.

Термин идентичность последовательности [определенного] % в контексте двух или более последовательностей нуклеиновых кислот или аминокислот означает, что две или более последовательностей имеют общие нуклеотиды или аминокислотные остатки в данном проценте при сравнении и выравнивании для максимального соответствие в окне сравнения или обозначенных последовательностях нуклеиновых кислот или аминокислот (т.е. последовательности имеют, по меньшей мере, 90-процентную (%) идентичность). Процентную идентичность последовательностей нуклеиновых кислот или аминокислот можно определить с помощью алгоритма сравнения последовательностей BLAST 2.0 с параметрами по умолчанию или путем ручного выравнивания и визуального контроля (см., например, http://www.ncbi.nlm.nih.gov/BLAST/). Это определение также применимо к комплементу тестируемой последовательности и к последовательностям, которые имеют делеции и/или добавления, а также к тем, которые имеют замены. Примером алгоритма, подходящего для определения процента идентичности, сходства последовательностей и выравнивания, служит алгоритм BLAST 2.2.20+, описанный в Altschul et al. Nucl. Acids Res. 25, 3389 (1997). BLAST 2.2.20+ применяют для определения процента идентичности последовательностей нуклеиновых кислот и белков по изобретению. Программное обеспечение для проведения анализов BLAST общедоступно через Национальный центр биотехнологической информации, (http://www.ncbi.nlm.nih.gov/). CLUSTAL Omega (http://www.ebi.ac.uk/Tools/msa/clustalo/), EMBOSS Needle (http://www.ebi.ac.uk/Tools/psa/emboss_needle/), MAFFT (http://mafftcbrc.jp/alignment/server/) или MUSCLE (http://www.ebi.ac.uk/Tools/msa/muscle/) представляют собой примеры алгоритмов выравнивания последовательностей.The term [defined] % sequence identity in the context of two or more nucleic acid or amino acid sequences means that two or more sequences share a given percentage of nucleotides or amino acid residues when compared and aligned for maximum agreement in the comparison window or designated nucleic acid or amino acid sequences (i.e., the sequences have at least 90 percent (%) identity). Percent identity of nucleic acid or amino acid sequences can be determined using the BLAST 2.0 sequence comparison algorithm with default parameters or by manual alignment and visual inspection (see, for example, http://www.ncbi.nlm.nih.gov/BLAST/) . This definition also applies to the complement of the test sequence and to sequences that have deletions and/or additions, as well as those that have substitutions. An example of an algorithm suitable for determining percent identity, sequence similarity and alignment is the BLAST 2.2.20+ algorithm described in Altschul et al. Nucl. Acids Res. 25, 3389 (1997). BLAST 2.2.20+ is used to determine the percentage identity of nucleic acid and protein sequences according to the invention. Software for performing BLAST analyzes is publicly available through the National Center for Biotechnology Information, (http://www.ncbi.nlm.nih.gov/). CLUSTAL Omega (http://www.ebi.ac.uk/Tools/msa/clustalo/), EMBOSS Needle (http://www.ebi.ac.uk/Tools/psa/emboss_needle/), MAFFT (http: //mafftcbrc.jp/alignment/server/) or MUSCLE (http://www.ebi.ac.uk/Tools/msa/muscle/) are examples of sequence alignment algorithms.

В контексте изобретения термин олигосахарид означает сахаридный полимер, содержащий ряд моносахаридных звеньев. В некоторых воплощениях предпочтительными олигосахариды представляют собой полимеры сахаридов, состоящие из трех или четырех моносахаридных звеньев, т.е. трисахариды или тетрасахариды. Предпочтительные олигосахариды изобретения представляют собой олигосахариды грудного молока (ОГМ).In the context of the invention, the term oligosaccharide means a saccharide polymer containing a number of monosaccharide units. In some embodiments, preferred oligosaccharides are polymers of saccharides consisting of three or four monosaccharide units, i.e. trisaccharides or tetrasaccharides. Preferred oligosaccharides of the invention are human milk oligosaccharides (HMOs).

Термин олигосахарид грудного молока или ОГМ в данном контексте означает сложный углевод, обнаруженный в грудном молоке человека (для отсылки смотри Urashima et al:. Milk Oligosaccharides. Nova Science Publisher (2011); или Chen, Adv. Carbohydr. Chem. Biochem. 72, 113 (2015)). ОГМ имеют структуру ядра, включающую единицу лактозы на восстанавливающем конце, которая может быть удлинена одной или несколькими единицами бета-Ы-ацетил-лактозаминила и/или одной или несколькими единицами бета-лакто-Н-биозила, и эта структура ядра может быть замещенный альфа-Lфукопиранозильной и/или альфа-М-ацетилнейраминильной (сиалильной) частью. В связи с этим некислотные (или нейтральные) ОГМ лишены остатка сиалила, а кислые ОГМ имеют в своей структуре хотя бы один остаток сиалила. Некислотный (или нейтральный) ОГМ может быть фукозилированным или нефукозилированным. Примеры таких нейтральных нефукозилированных ОГМ включают лакто-Nтриозу 2 (LNT-2), лакто-И-тетраозу (LNT), лакто-N-неотетраозу (LNnT), лαкто-N-неогексаозу (LNnH),The term human milk oligosaccharide or HMO in this context means the complex carbohydrate found in human breast milk (for reference see Urashima et al: Milk Oligosaccharides. Nova Science Publisher (2011); or Chen, Adv. Carbohydr. Chem. Biochem. 72, 113 (2015)). HMOs have a core structure comprising a lactose unit at the reducing end, which may be extended by one or more beta-N-acetyl-lactosaminyl units and/or one or more beta-lacto-N-biosyl units, and this core structure may be substituted alpha -Lfucopyranosyl and/or alpha-M-acetylneuraminyl (sialyl) moiety. In this regard, non-acidic (or neutral) OGMs are devoid of a sialyl residue, while acidic OHMs have at least one sialyl residue in their structure. Non-acidic (or neutral) OGM can be fucosylated or non-fucosylated. Examples of such neutral non-fucosylated HMOs include lacto-N-triose 2 (LNT-2), lacto-N-tetraose (LNT), lacto-N-neotetraose (LNnT), lacto-N-neohexaose (LNnH),

- 4 046248 пара-лакто-Ы-неогексаозу (pLNnH), пара-лакто-Ы-гексаозу (pLNH) и лакто-Ы-гексаозу (LNH). Примеры нейтральных фукозилированных ОГМ включают 2'-фукозиллактозу (2'-FL), лакто-Ы-фукопентаозу I (LNFP-I), лакто-Ы-дифукогексаозу I (LNDFH-I), 3-фукозиллактозу (3-FL), дифукозиллактозу (DFL), лакто-Ы-фукопентаозу II (ЪЫРР-П), лакто-Ы-фукопентаозу III (ЪЫЕР-111). лакто-Ы-дифукогексаозу III (LNDFH-Ш), фукозил-лакто-Ы-гексаозу II (FLNH-II), лакто-Ы-фукопентаозу V (LOTP-V), лакто-Ыдифукогексаозу II (LNDFH-II), фукозил-лакто-Ы-гексаозу I (FLNH-I), фукозил-пара-лакто-Ы-гексаозу I (FpLNH-I), фукозил-пара-лакто-Ы-неогексаозу II (F-pLNnH II) и фукозил-лакто-Ы-неогексаозу (FLNnH). Примеры кислотных ОГМ включают З'-сиалиллактозу (3'-SL), 6'-сиалиллактозу (6'-SL), 3-фукозил- 3'сиалиллактозу (FSL), З'-О-сиалиллакто-Ы-тетраозу a (LST а), фукозил-LST a (FLST а), 6'-О-сиалиллактоЫ-тетраозу b (LST b), фукозил-LST b (FLST b), 6'-О-сиалиллакто-Ы-неотетраозу (LST c), фукозил-LST с (FLST с), З'-О-сиалиллакто-Ы-неотетраозу (LST d), фукозил-LST d (FLST d), сиалил-лакто-Ы-гексаозу (SLNH), сиалил-лакто-Ы-неогексаозу I (SLNH-I), сиалил-лакто-Ы-неогексаозу II (SLNH-II) и дисиалиллакто-Ы-тетраозу (DSLKT). В контексте настоящего изобретения лактозу не рассматривают как разновидность ОГМ.- 4 046248 para-lacto-N-neohexaose (pLNnH), para-lacto-N-hexaose (pLNH) and lacto-N-hexaose (LNH). Examples of neutral fucosylated HMOs include 2'-fucosyllactose (2'-FL), lacto-N-fucopentaose I (LNFP-I), lacto-N-difucohexaose I (LNDFH-I), 3-fucosyllactose (3-FL), difucosyllactose (DFL), lacto-N-fucopentaose II (LFPP-P), lacto-N-fucopentaose III (LYEP-111). lacto-N-difucohexaose III (LNDFH-III), fucosyl-lacto-N-hexaose II (FLNH-II), lacto-N-fucopentaose V (LOTP-V), lacto-N-difucohexaose II (LNDFH-II), fucosyl- lacto-N-hexaose I (FLNH-I), fucosyl-p-lacto-N-hexaose I (FpLNH-I), fucosyl-p-lacto-N-neohexaose II (F-pLNnH II) and fucosyl-lacto-N -neohexaose (FLNnH). Examples of acidic HMOs include 3'-sialyllactose (3'-SL), 6'-sialyllactose (6'-SL), 3-fucosyl-3'sialyllactose (FSL), 3'-O-sialyllactose-N-tetraose (LST a), fucosyl-LST a (FLST a), 6'-O-sialyllacto-N-tetraose b (LST b), fucosyl-LST b (FLST b), 6'-O-sialyllacto-N-neotetraose (LST c), fucosyl-LST c (FLST c), 3'-O-sialyllacto-N-neotetraose (LST d), fucosyl-LST d (FLST d), sialyl-lacto-N-hexaose (SLNH), sialyl-lacto-N- neohexaose I (SLNH-I), sialyl-lacto-N-neohexaose II (SLNH-II) and disialyl-lacto-N-tetraose (DSLKT). In the context of the present invention, lactose is not considered as a type of HGM.

В некоторых воплощениях изобретения предпочтительными могут быть три-ОГМ и тетра-ОГМ, например, трисахариды 2'-FL, 3-FL, LOT^, З'-SL, 6'-SL и тетрасахариды DFL, Ь-ЫП 1.ЫпГ FSL.In some embodiments of the invention, tri-OHM and tetra-OHM may be preferred, for example, trisaccharides 2'-FL, 3-FL, LOT^, 3'-SL, 6'-SL and tetrasaccharides DFL, L-NL 1.LnG FSL .

Чтобы иметь возможность синтезировать один или несколько ОГМ, рекомбинантная клетка по изобретению включает, по меньшей мере, одну рекомбинантную нуклеиновую кислоту, которая кодирует функциональный фермент с гликозилтрансферазной активностью. Ген галактозилтрансферазы может быть интегрирован в геном (посредством хромосомной интеграции) клетки-хозяина, или, альтернативно, он может быть включен в плазмидную ДНК и экспрессироваться как переносимый плазмидой. Если для производства ОГМ необходимы две или более гликозилтрансфераз, например, LNT или LNпT, то две или более рекомбинантных нуклеиновых кислоты, кодирующих разные ферменты с гликозилтрансферазной активностью, могут быть интегрированы в геном и/или экспрессированы из плазмиды, например бета1,3-Ы-ацетилглюкозаминилтрансферазу (первая рекомбинантная нуклеиновая кислота, кодирующая первую гликозилтрансферазу) в сочетании с бета-1,4-галактозилтрансферазой (вторая рекомбинантная нуклеиновая кислота, кодирующая вторую гликозилтрансферазу) для продукции LNT, где первая и вторая рекомбинантные нуклеиновые кислоты могут быть независимо друг от друга интегрированы хромосомно на плазмиде. В одном предпочтительном воплощении как первая, так и вторая рекомбинантные нуклеиновые кислоты стабильно интегрированы в хромосому клетки-продуцента; в другом воплощении, по меньшей мере, одна из первой и второй гликозилтрансфераз представляет собой переносимую плазмидой. Белок/фермент с гликозилтрансферазной активностью (гликозилтрансфераза) может быть выбран в различных воплощениях из ферментов, обладающих активностью альфа-1,2-фукозилтрансферазы, альфа1,3-фукозилтрансферазы, альфа-1,3/4-фукозилтрансферазы, альфа-1,4-фукозилтрансферазы, альфа-2,3сиалилтрансферазы, альфа-2,6-сиалилтрансферазы, бета-1,3-Ы-ацетилглюкозаминилтрансферазы, бета1,6-Ы-ацетилглюкозаминилтрансферазы, бета-1,3-галактозилтрансферазы и бета-1,4-галактозилтрансферазы. Например, для продукции 2'-FL требуется, чтобы модифицированная клетка экспрессировала активный фермент альфа-1,2-фукозилтрансферазу; для продукции 3-FL модифицированная клетка нуждается в экспрессии активного фермента альфа-1,3-фукозилтрансферазы; для продукции LOT модифицированная клетка должна экспрессировать, по крайней мере, две гликозилтрансферазы, бета-1,3-Ыацетилглюкозаминилтрансферазу и бета-1,3-галактозилтрансферазу; для продукции 6'-SL модифицированная клетка должна экспрессировать активный фермент альфа-2,6-сиалилтрансферазу и путь для синтеза СМР-сиаловой кислоты; для производства 3'-SL модифицированная клетка должна экспрессировать активный фермент альфа-2,3-сиалилтрансферазу и путь для синтеза СМР-сиаловой кислоты. Некоторые неограничивающие воплощения белков, обладающих гликозилтрансферазной активностью, которые могут кодироваться рекомбинантными генами, содержащимися в клетке-продуценте, могут быть выбраны из неограничивающих примеров табл. 1.To be able to synthesize one or more OGMs, the recombinant cell of the invention includes at least one recombinant nucleic acid that encodes a functional enzyme with glycosyltransferase activity. The galactosyltransferase gene may be integrated into the genome (via chromosomal integration) of the host cell, or alternatively, it may be incorporated into plasmid DNA and expressed as plasmid-borne. If two or more glycosyltransferases, for example LNT or LNnT, are required for the production of OGM, then two or more recombinant nucleic acids encoding different enzymes with glycosyltransferase activity can be integrated into the genome and/or expressed from a plasmid, for example beta1,3-N- acetylglucosaminyltransferase (the first recombinant nucleic acid encoding the first glycosyltransferase) in combination with beta-1,4-galactosyltransferase (the second recombinant nucleic acid encoding the second glycosyltransferase) to produce LNT, where the first and second recombinant nucleic acids can be independently integrated chromosomally on a plasmid. In one preferred embodiment, both the first and second recombinant nucleic acids are stably integrated into the chromosome of the producing cell; in another embodiment, at least one of the first and second glycosyltransferases is plasmid-borne. The protein/enzyme with glycosyltransferase activity (glycosyltransferase) can be selected in various embodiments from enzymes having alpha-1,2-fucosyltransferase, alpha1,3-fucosyltransferase, alpha-1,3/4-fucosyltransferase, alpha-1,4- fucosyltransferases, alpha-2,3-sialyltransferases, alpha-2,6-sialyltransferases, beta-1,3-N-acetylglucosaminyltransferases, beta1,6-N-acetylglucosaminyltransferases, beta-1,3-galactosyltransferases and beta-1,4-galactosyltransferases. For example, production of 2'-FL requires that the modified cell express the active enzyme alpha-1,2-fucosyltransferase; for the production of 3-FL, the modified cell requires the expression of the active enzyme alpha-1,3-fucosyltransferase; to produce LOT, the modified cell must express at least two glycosyltransferases, beta-1,3-Nacetylglucosaminyltransferase and beta-1,3-galactosyltransferase; to produce 6'-SL, the modified cell must express the active enzyme alpha-2,6-sialyltransferase and the pathway for the synthesis of CMP-sialic acid; To produce 3'-SL, the modified cell must express the active enzyme alpha-2,3-sialyltransferase and the pathway for the synthesis of CMP-sialic acid. Certain non-limiting embodiments of proteins having glycosyltransferase activity that may be encoded by recombinant genes contained in the producer cell may be selected from the non-limiting examples in Table 1. 1.

- 5 046248- 5 046248

Таблица 1Table 1

Ген Gene ID белковой последовательности (GenBank) Protein ID sequences (GenBank) Описание Description Пример ОГМ OGM example IgtANm IgtANm WP 002248149.1 WP 002248149.1 ββ-1,3-Ν- ацетилглюкозаминил-трансфераза ββ-1,3-Ν- acetylglucosaminyl transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH IgtA Nm 54(758 IgtA Nm 54(758 AAF42258.1 AAF42258.1 β-1,3-Ν- ацетилглюкозаминил-трансфераза β-1,3-Ν- acetylglucosaminyl transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH IgtA Hd IgtA Hd AAN05638.1 AAN05638.1 β-1,3-Ν- ацетилглюкозаминил-трансфераза β-1,3-Ν- acetylglucosaminyl transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH IgtA Ng PID2 IgtA Ng PID2 AAK70338.1 AAK70338.1 β-1,3-Ν- ацетилглюкозаминил-трансфераза β-1,3-Ν- acetylglucosaminyl transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH IgtA Ng NCCP1 1945 IgtA Ng NCCP1 1945 ACF31229.1 ACF31229.1 β-1,3-Ν- ацетилглюкозаминил-трансфераза β-1,3-Ν- acetylglucosaminyl transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH IgtA Past IgtA Past AAK02595.1 AAK02595.1 β-1,3-Ν- ацетилглюкозаминил-трансфераза β-1,3-Ν- acetylglucosaminyl transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH IgtANc IgtANc EEZ72046.1 EEZ72046.1 β-1,3-Ν- ацетилглюкозаминил-трансфераза β-1,3-Ν- acetylglucosaminyl transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH IgtA Nm 8 7255 IgtA Nm 8 7255 ELK60643.1 ELK60643.1 β-1,3-Ν- ацетилглюкозаминил-трансфераза β-1,3-Ν- acetylglucosaminyl transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH galT Hp/HP0826 galT Hp/HP0826 NP 207619.1 NP 207619.1 ββ-l,4-гaлaκτoзилтрансфераза ββ-l,4-galaκτosyltransferase LNnT, LNFP-III, LNFP-VI, pLNH I, F-pLNH I, pLNnH LNnT, LNFP-III, LNFP-VI, pLNH I, F-pLNH I, pLNnH

- 6 046248- 6 046248

galT Nm IgtB galT Nm IgtB AAF42257.1 AAF42257.1 β-1,4-галактозилтрансфераза β-1,4-galactosyltransferase LNnT, LNFP-III, LNFP-VI, pLNH I, F-pLNH I, pLNnH LNnT, LNFP-III, LNFP-VI, pLNH I, F-pLNH I, pLNnH wbgO wbgO WP000582563.1 WP000582563.1 β-1,3 -галактозилтрансфераза β-1,3-galactosyltransferase LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI cpsIBJ cpsIBJ AB050723.1 AB050723.1 ββ-1,3 - галактозилтрансфераза ββ-1,3 - galactosyltransferase LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI jhp0563 jhp0563 AEZ55696.1 AEZ55696.1 β-1,3 -галактозилтрансфераза β-1,3-galactosyltransferase LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI galTK galTK homologous to BD182026 homologous to BD182026 β-1,3 -галактозилтрансфераза β-1,3-galactosyltransferase LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI futC futC WP 080473865.1 WP 080473865.1 а-1,2-фукозилтрансфераза a-1,2-fucosyltransferase 2'-FL, DFL, LNFP-I, LNDFH-I 2'-FL, DFL, LNFP-I, LNDFH-I FucT2HpUA802 FucT2HpUA802 AAC99764.1 AAC99764.1 а-1,2-фукозилтрансфераза a-1,2-fucosyltransferase 2'-FL, DFL, LNFP-I, LNDFH-I 2'-FL, DFL, LNFP-I, LNDFH-I FucT2EcO126t FucT2EcO126t ABE98421.1 ABE98421.1 а-1,2-фукозилтрансфераза a-1,2-fucosyltransferase 2'-FL, DFL, LNFP-I, LNDFH-I 2'-FL, DFL, LNFP-I, LNDFH-I FucT2 Hml2198 FucT2 Hml2198 CBG40460.1 CBG40460.1 а-1,2-фукозилтрансфераза a-1,2-fucosyltransferase 2'-FL, DFL, LNFP-I, LNDFH-I 2'-FL, DFL, LNFP-I, LNDFH-I FucT2Pm9515 FucT2Pm9515 ABM71599.1 ABM71599.1 а-1,2-фукозилтрансфераза a-1,2-fucosyltransferase 2'-FL, DFL, LNFP-I, LNDFH-I 2'-FL, DFL, LNFP-I, LNDFH-I FucT2HpF57 FucT2HpF57 BAJ59215.1 BAJ59215.1 а-1,2-фукозилтрансфераза a-1,2-fucosyltransferase 2'-FL, DFL, LNFP-I, LNDFH-I 2'-FL, DFL, LNFP-I, LNDFH-I FucT6 3 Bf FucT6 3 Bf CAH09151.1 CAH09151.1 а-1,3-фукозилтрансфераза a-1,3-fucosyltransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I FucT7 3 Bf FucT7 3 Bf CAH09495.1 CAH09495.1 а-1,3-фукозилтрансфераза a-1,3-fucosyltransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I FucT 3 Am FucT 3 Am ACD04596.1 ACD04596.1 а-1,3-фукозилтрансфераза a-1,3-fucosyltransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I MAMAR764 MAMAR764 AGC02224.1 AGC02224.1 а-1,3-фукозилтрансфераза a-1,3-fucosyltransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I Mg791 Mg791 AEQ33441.1 AEQ33441.1 а-1,3-фукозилтрансфераза a-1,3-fucosyltransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I Moumou 00703 Moumou 00703 YP 007354660 YP 007354660 а-1,3-фукозилтрансфераза a-1,3-fucosyltransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I futA futA NP 207177.1 NP 207177.1 а-1,3-фукозилтрансфераза a-1,3-fucosyltransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I

- 7 046248- 7 046248

fucT fucT AAB81031.1 AAB81031.1 а-1,3-фукозилтрансфераза a-1,3-fucosyltransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I fucTIII fucTIII AY450598.1 AY450598.1 а-1,4-фукозилтрансфераза a-1,4-fucosyltransferase LNDFH-I, LNDFH-II LNDFH-I, LNDFH-II fucTa fucTa AFI94963.1 AFI94963.1 а-1,3/4-фукозилтрансфераза a-1,3/4-fucosyltransferase LNFP-II, LNDFH-I, LNDFH-II LNFP-II, LNDFH-I, LNDFH-II Pd2,6ST Pd2.6ST BAA25316.1 BAA25316.1 а-2,6сиал ил трансфераза a-2,6 sial yl transferase 6'-SL 6'-SL PspST6 PspST6 BAF92026.1 BAF92026.1 а-2,6сиалилтрансфераза a-2,6 sialyltransferase 6'-SL 6'-SL PiST6 145 PiST6 145 BAF91416.1 BAF91416.1 а-2,6сиалилтрансфераза a-2,6 sialyltransferase 6'-SL 6'-SL PiST6 119 PiST6 119 BAI49484.1 BAI49484.1 а-2,6сиалилтрансфераза a-2,6 sialyltransferase 6'-SL 6'-SL NST NST AAC44541.1 AAC44541.1 а-2,3- сиалилтрансфераза a-2,3- sialyltransferase 3'-SL 3'-SL

Один из аспектов настоящего изобретения представляет собой обеспечение конструкции нуклеиновой кислоты, включающей гетерологичную(гетерологичные) последовательность(последовательности) нуклеиновой кислоты, кодирующую(кодирующие) белок, способный к транспортировке сахара, который представляет собой белок суперсемейства основных посредников (MFS), как показано в SEQ ID NO: 1, или его функциональный гомолог, аминокислотная последовательность которого, по меньшей мере, на 80% идентична SEQ ID NO: 1, при этом последовательность нуклеиновой кислоты, кодирующая белок MFS, имеет, по меньшей мере, 70% идентичности последовательности с SEQ ID NO: 2.One aspect of the present invention is to provide a nucleic acid construct comprising heterologous nucleic acid sequence(s) encoding a protein capable of transporting a sugar that is a major messenger superfamily (MFS) protein as shown in SEQ ID NO: 1, or a functional homolog thereof, the amino acid sequence of which is at least 80% identical to SEQ ID NO: 1, and the nucleic acid sequence encoding the MFS protein has at least 70% sequence identity with SEQ ID NO: 2.

Под термином гетерологичная последовательность нуклеиновой кислоты, кодирующая рекомбинантный ген/нуклеиновая кислота/ДНК или кодирующая последовательность нуклеиновой кислоты подразумевают искусственную последовательность нуклеиновой кислоты (т.е. полученную in vitro с применением стандартных лабораторных способов получения последовательностей нуклеиновых кислот), которая включает набор последовательных, неперекрывающихся триплетов (кодонов), которые транскрибируются в мРНК и транслируются в полипептид, когда их помещают под контроль соответствующих контрольных последовательностей, т.е. промотора. Границы кодирующей последовательности обычно определяются сайтом связывания рибосомы, расположенным прямо перед открытой рамкой считывания на 5'-конце мРНК, стартовым кодоном транскрипции (AUG, GUG или UUG) и стоп-кодоном трансляции (UAA, UGA или UAG). Кодирующая последовательность может включать, но не ограничиваться ими, геномную ДНК, кДНК синтетические и рекомбинантные последовательности нуклеиновых кислот. Термин нуклеиновая кислота включает молекулы РНК, ДНК и кДНК. Понятно, что в результате вырождения генетического кода может быть получено множество нуклеотидных последовательностей, кодирующих данный белок. Термин нуклеиновая кислота применяют взаимозаменяемо с термином полинуклеотид. Олигонуклеотид представляет собой молекулу нуклеиновой кислоты с короткой цепью. Праймер представляет собой олигонуклеотид, встречающийся в природе в виде очищенного фрагмента рестрикции или полученный синтетическим путем, который способен действовать как точка инициации синтеза при помещении в условия, в которых индуцируется синтез продукта удлинения праймера, комплементарного цепи нуклеиновой кислоты (т.е. в присутствии нуклеотидов и индуцирующего агента, такого как ДНК-полимераза, и при подходящей температуре и рН). Праймер предпочтительно применяют одноцепочечный для максимальной эффективности амплификации, но альтернативно он может быть двухцепочечным. Если праймер двухцепочечный, то его сначала обрабатывают, чтобы разделить его нити, прежде чем применять для приготовления продуктов для удлинения. Предпочтительно праймер представляет собой дезоксирибонуклеотид. Праймер должен быть достаточно длинным, чтобы инициировать синтез продуктов удлинения в присутствии индуцирующего агента. Точная длина праймеров будет зависеть от многих факторов, включая температуру, источник праймера и применение способа.The term heterologous nucleic acid sequence, recombinant gene/nucleic acid/DNA encoding or nucleic acid encoding sequence refers to an artificial nucleic acid sequence (i.e., obtained in vitro using standard laboratory methods for obtaining nucleic acid sequences) that includes a set of sequential, non-overlapping triplets (codons) that are transcribed into mRNA and translated into a polypeptide when they are placed under the control of appropriate control sequences, i.e. promoter The boundaries of the coding sequence are usually defined by the ribosome binding site located just upstream of the open reading frame at the 5' end of the mRNA, the transcription start codon (AUG, GUG, or UUG), and the translation stop codon (UAA, UGA, or UAG). The coding sequence may include, but is not limited to, genomic DNA, cDNA, synthetic and recombinant nucleic acid sequences. The term nucleic acid includes RNA, DNA and cDNA molecules. It is clear that as a result of the degeneration of the genetic code, many nucleotide sequences encoding a given protein can be obtained. The term nucleic acid is used interchangeably with the term polynucleotide. An oligonucleotide is a short-chain nucleic acid molecule. A primer is an oligonucleotide, occurring naturally as a purified restriction fragment or produced synthetically, that is capable of acting as an initiation point for synthesis when placed under conditions that induce synthesis of a primer extension product complementary to the nucleic acid strand (i.e., in the presence of nucleotides and an inducing agent such as DNA polymerase, and at a suitable temperature and pH). The primer is preferably single-stranded for maximum amplification efficiency, but alternatively it can be double-stranded. If the primer is double-stranded, it is first processed to separate its strands before being used to prepare extension products. Preferably the primer is a deoxyribonucleotide. The primer must be long enough to initiate the synthesis of extension products in the presence of an inducing agent. The exact length of the primers will depend on many factors, including temperature, primer source, and method application.

Рекомбинантная нуклеиновая последовательность по изобретению может представлять собой кодирующую последовательность ДНК, например, ген или некодирующая последовательность ДНК, например, регуляторную ДНК, такую как промоторная последовательность. Один аспект изобретения относится к получению рекомбинантной клетки, включающей последовательности рекомбинантной ДНК, кодирующие ферменты, необходимые для продукции одного или нескольких ОГМ, и последовательность ДНК, кодирующую переносчик Nec. Соответственно, в одном воплощении изобретение относится к конThe recombinant nucleic acid sequence of the invention may be a DNA coding sequence, such as a gene, or a non-coding DNA sequence, such as regulatory DNA, such as a promoter sequence. One aspect of the invention relates to the production of a recombinant cell comprising recombinant DNA sequences encoding enzymes necessary for the production of one or more OGMs and a DNA sequence encoding the Nec transporter. Accordingly, in one embodiment the invention relates to con

- 8 046248 струкции нуклеиновой кислоты, включающей кодирующую последовательность нуклеиновой кислоты, т.е. последовательность рекомбинантной ДНК представляющего интерес гена, например, гена гликозилтрансферазы или гена nec, и некодирующую последовательность ДНК, например, последовательность промоторной ДНК, например, рекомбинантную промоторную последовательность, полученную из промотора оперона lac или оперона glp, или промоторную последовательность, полученную из другой последовательности ДНК геномного промотора, или синтетическая промоторная последовательность, где кодирующая и промоторная последовательности функционально связаны. Термин функционально связанный относится к функциональной взаимосвязи между двумя или более сегментами нуклеиновой кислоты (например, ДНК). Как правило, это относится к функциональной связи регуляторной последовательности транскрипции с транскрибируемой последовательностью. Например, промоторная последовательность функционально связана с кодирующей последовательностью, если она стимулирует или модулирует транскрипцию кодирующей последовательности в подходящей клетке-хозяине или другой системе экспрессии. Как правило, промоторные регуляторные последовательности транскрипции, которые функционально связаны с транскрибируемой последовательностью, физически примыкают к транскрибируемой последовательности, т.е. они представляют собой цис-действующие последовательности.- 8 046248 nucleic acid structure, including the coding sequence of the nucleic acid, i.e. a recombinant DNA sequence of a gene of interest, e.g., a glycosyltransferase gene or a nec gene, and a non-coding DNA sequence, e.g., a promoter DNA sequence, e.g., a recombinant promoter sequence derived from a lac operon promoter or a glp operon, or a promoter sequence derived from another DNA sequence genomic promoter, or synthetic promoter sequence, where the coding and promoter sequences are operably linked. The term operably linked refers to a functional relationship between two or more nucleic acid segments (eg, DNA). Typically, this refers to the functional relationship of a transcription regulatory sequence to a transcribed sequence. For example, a promoter sequence is operably linked to a coding sequence if it stimulates or modulates transcription of the coding sequence in a suitable host cell or other expression system. Typically, promoter transcriptional control sequences that are operably linked to the transcribed sequence are physically adjacent to the transcribed sequence, i.e. they are cis-acting sequences.

В одном воплощении конструкция нуклеиновой кислоты по изобретению может представлять собой частью векторной ДНК, в другом воплощении конструкция представляет собой экспрессионную кассету/картридж, интегрированную в геном клетки-хозяина. Соответственно, термин конструкция нуклеиновой кислоты означает искусственно сконструированный сегмент нуклеиновой кислоты, в особенности, сегмент ДНК, который предназначен для трансплантации в клетку-мишень, например, в клеткумишень, например, в бактериальную клетку, для модификации экспрессии гена генома или экспрессии последовательности гена/кодирующей ДНК, которая может быть включена в конструкцию. В контексте изобретения конструкция нуклеиновой кислоты включает последовательность рекомбинантной ДНК, включающую две или более последовательностей рекомбинантной ДНК: по существу, некодирующую последовательность ДНК, включающую последовательность промоторной ДНК, и кодирующую последовательность ДНК, кодирующую представляющий интерес ген, например, белка Nec, гликозилтрансферазы или другого гена, пригодного для продукции ОГМ в клетке-хозяине. Предпочтительно конструкция включает дополнительные некодирующие последовательности ДНК, которые либо регулируют транскрипцию, либо трансляцию кодирующей ДНК конструкции, например, последовательность ДНК, облегчающую связывание рибосомы с транскриптом, лидирующую последовательность ДНК, которая стабилизирует транскрипт.In one embodiment, the nucleic acid construct of the invention may be part of a vector DNA; in another embodiment, the construct is an expression cassette/cartridge integrated into the genome of a host cell. Accordingly, the term nucleic acid construct means an artificially engineered segment of nucleic acid, especially a segment of DNA, that is intended to be transplanted into a target cell, e.g., a target cell, e.g., a bacterial cell, to modify the expression of a gene genome or the expression of a gene/coding sequence DNA that can be included in the design. In the context of the invention, the nucleic acid construct includes a recombinant DNA sequence comprising two or more recombinant DNA sequences: a substantially non-coding DNA sequence including a promoter DNA sequence, and a coding DNA sequence encoding a gene of interest, such as a Nec protein, glycosyltransferase or other gene , suitable for the production of OGM in the host cell. Preferably, the construct includes additional non-coding DNA sequences that either regulate transcription or translation of the coding DNA construct, for example, a DNA sequence that facilitates ribosome binding to the transcript, a leader DNA sequence that stabilizes the transcript.

Интеграция представляющей интерес рекомбинантной нуклеиновой кислоты, включенной в конструкции (т.е. в экспрессионную кассету), в бактериальный геном может быть достигнута обычными способами, например, с помощью линейных картриджей, содержащих фланкирующие последовательности, гомологичные определенному участку на хромосоме, как описано для attTn7-сайта (Waddell C.S. and Craig N.L., Genes Dev. (1988) Feb;2(2):137-49.); способами геномной интеграции последовательностей нуклеиновых кислот, в которых рекомбинация опосредована рекомбиназной функцией Red фага λ или рекомбиназной функцией RecE/RecT профага Rac (Murphy, J Bacteriol.(1998);180(8):2063-7; Zhang et al., Nature Genetics (1998)20: 123-128 Muyrers et al., EMBO Rep.(2000) 1(3): 239-243); способами, основанными на рекомбинации Red/ET (Wenzel et al., Chem Biol. (2005), 12(3):349-56.; Vetcher et al., Appl Environ Microbiol. (2005);71(4): 1829-35); или с помощью положительных клонов, т.е. клонов, которые несут кассету экспрессии, могут быть отобраны, например, с помощью маркерного гена, или потери или усиления функции гена.Integration of the recombinant nucleic acid of interest included in the constructs (i.e., expression cassette) into the bacterial genome can be achieved by conventional methods, for example, using linear cartridges containing flanking sequences homologous to a specific region on the chromosome, as described for attTn7 -site (Waddell C.S. and Craig N.L., Genes Dev. (1988) Feb;2(2):137-49.); by means of genomic integration of nucleic acid sequences in which recombination is mediated by the Red recombinase function of phage λ or the RecE/RecT recombinase function of Rac prophage (Murphy, J Bacteriol. (1998);180(8):2063-7; Zhang et al., Nature Genetics (1998)20: 123-128 Muyrers et al., EMBO Rep.(2000) 1(3): 239-243); in ways based on Red/ET recombination (Wenzel et al., Chem Biol. (2005), 12(3):349-56.; Vetcher et al., Appl Environ Microbiol. (2005);71(4): 1829 -35); or using positive clones, i.e. clones that carry an expression cassette can be selected, for example, using a marker gene, or a loss or gain of function gene.

Одной копии кассеты экспрессии, включающей интересующий ген, может быть достаточно для обеспечения продукции желаемого ОГМ и достижения желаемых эффектов согласно изобретению. Соответственно, в некоторых предпочтительных воплощениях изобретение относится к рекомбинантной ОГМ-продуцирующей клетке, которая включает одну, две или три копии представляющего интерес гена, интегрированного в геномную ДНК клетки. В некоторых воплощениях предпочтительна единственная копия гена.One copy of an expression cassette comprising the gene of interest may be sufficient to produce the desired OGM and achieve the desired effects of the invention. Accordingly, in some preferred embodiments, the invention provides a recombinant OGM-producing cell that includes one, two or three copies of a gene of interest integrated into the genomic DNA of the cell. In some embodiments, a single copy of the gene is preferred.

В одном предпочтительном воплощении рекомбинантная кодирующая последовательность нуклеиновой кислоты конструкции нуклеиновой кислоты по изобретению представляет собой гетерологичную последовательность по отношению к промотору, что означает, что эквивалентная нативная кодирующая последовательность в геноме вида происхождения транскрибируется под контролем другой промоторной последовательности (т.е. не промоторной последовательности конструкции). Тем не менее, что касается клетки-хозяина, кодирующая ДНК может быть либо гетерологичной (т.е. полученной из другого биологического вида или рода), такой как, например, последовательность ДНК, кодирующая белок Nec, экспрессированная в клетках-хозяевах Escherichia coli, или гомологичной (т.е. полученной из клеткихозяина), такой как, например, гены оперона толстой кишки, гены wca.In one preferred embodiment, the recombinant nucleic acid coding sequence of the nucleic acid construct of the invention is a heterologous sequence with respect to the promoter, which means that the equivalent native coding sequence in the genome of the species of origin is transcribed under the control of a different promoter sequence (i.e., not the promoter sequence of the construct ). However, with respect to the host cell, the encoding DNA may be either heterologous (i.e., derived from another species or genus), such as, for example, the DNA sequence encoding the Nec protein expressed in Escherichia coli host cells, or homologous (ie, derived from a host cell), such as, for example, the colon operon genes, wca genes.

Термин регуляторный элемент, или промотор, или промоторная область, или промоторный элемент представляет собой последовательность нуклеиновой кислоты, которая распознается и связывается ДНК-зависимой РНК-полимеразой во время инициации транскрипции. Промотор вместе с другими последовательностями нуклеиновых кислот, регулирующими транскрипцию и трансляцию (такжеThe term regulatory element or promoter or promoter region or promoter element is a nucleic acid sequence that is recognized and bound by DNA-dependent RNA polymerase during transcription initiation. The promoter, together with other nucleic acid sequences that regulate transcription and translation (also

- 9 046248 называемыми контрольными последовательностями), необходим для экспрессии данного гена или группы генов (оперона). Как правило, транскрипционные и трансляционные регуляторные последовательности включают, но не ограничиваются ими, промоторные последовательности, сайты связывания рибосом, последовательности начала и остановки транскрипции, последовательности начала и остановки трансляции и последовательности энхансера или активатора. Сайт старта транскрипции означает первый транскрибируемый нуклеотид и обозначен как +1. Нуклеотиды ниже стартового сайта пронумерованы +2, +3, +4 и т.д., а нуклеотиды в 5' противоположном (выше) направлении пронумерованы -1, -2, -3 и т.д. Последовательность промоторной ДНК конструкции может происходить из промоторной области любого гена генома выбранного вида, предпочтительно, из промоторной области геномной ДНК E.coli. Соответственно, любая промоторная последовательность ДНК, которая способна связываться с РНКполимеразой и инициировать транскрипцию, подходит для осуществления изобретения. В принципе, любая промоторная последовательность ДНК может быть применена для контроля транскрипции интересующего рекомбинантного гена конструкции, разные или одинаковые промоторные последовательности могут быть применены для управления транскрипцией различных представляющих интерес генов, интегрированных в геном клетки-хозяина или в ДНК вектора экспрессии. Для обеспечения оптимальной экспрессии рекомбинантного гена(рекомбинантных генов), включенного(включенных) в конструкцию, конструкция может содержать дополнительные регуляторные последовательности, например, лидирующую последовательность ДНК, такую как последовательность ДНК, полученную из 5'-нетранслируемой области (5UTR) гена glp E. coli, последовательность для рибосомного связывания. Примеры последних последовательностей описаны в WO 2019123324 (включена в настоящий документ в качестве отсылки) и проиллюстрированы в настоящем документе в неограничивающих рабочих примерах.- 9 046248 called control sequences), is necessary for the expression of a given gene or group of genes (operon). Typically, transcriptional and translational control sequences include, but are not limited to, promoter sequences, ribosome binding sites, transcription start and stop sequences, translation start and stop sequences, and enhancer or activator sequences. The transcription start site refers to the first nucleotide transcribed and is designated +1. Nucleotides downstream of the start site are numbered +2, +3, +4, etc., and nucleotides in the 5' opposite (upstream) direction are numbered -1, -2, -3, etc. The promoter DNA sequence of the construct can be derived from the promoter region of any gene in the genome of the selected species, preferably from the promoter region of the genomic DNA of E. coli. Accordingly, any DNA promoter sequence that is capable of binding to RNA polymerase and initiating transcription is suitable for practicing the invention. In principle, any promoter DNA sequence can be used to control the transcription of a recombinant gene construct of interest, and different or the same promoter sequences can be used to control the transcription of different genes of interest integrated into the genome of a host cell or into the DNA of an expression vector. To ensure optimal expression of the recombinant gene(s) included in the construct, the construct may contain additional regulatory sequences, for example, a leader DNA sequence, such as a DNA sequence derived from the 5' untranslated region (5UTR) of the glp E gene. coli, ribosomal binding sequence. Examples of the latter sequences are described in WO 2019123324 (incorporated herein by reference) and are illustrated herein by non-limiting working examples.

В некоторых предпочтительных воплощениях регуляторный элемент для регуляции экспрессии рекомбинантного гена, включенного в конструкцию по изобретению, представляет собой промотор оперона glpFKX, PglpF, в других предпочтительных воплощениях промотор представляет собой промотор оперона lac, Plac.In some preferred embodiments, the regulatory element for regulating expression of the recombinant gene included in the construct of the invention is the promoter of the glpFKX operon, PglpF; in other preferred embodiments, the promoter is the promoter of the lac operon, Plac.

В еще одном аспекте регуляторный элемент для регуляции экспрессии рекомбинантного гена, включенного в конструкцию по изобретению, представляет собой mglBAC; промотор транспортера галактозы/метилгалактозидазы PmglB или их варианты, такие как, но не ограничиваясь ими, PmglB_70UTR последовательности SEQ ID NO: 15 или PmglB_70UTR_SD4 последовательности SEQ ID NO: 16.In yet another aspect, the regulatory element for regulating the expression of the recombinant gene included in the construct of the invention is mglBAC; the galactose transporter/methylgalactosidase promoter PmglB or variants thereof, such as, but not limited to, PmglB_70UTR of the sequence SEQ ID NO: 15 or PmglB_70UTR_SD4 of the sequence SEQ ID NO: 16.

В еще одном аспекте регуляторный элемент для регуляции экспрессии рекомбинантного гена, включенного в конструкцию по изобретению, представляет собой gatYZABCD] промотор тагатозо-1,6бисР-альдолазы PgatY или его варианты, такие как, но, не ограничиваясь ими PgatY_U70UTR последовательности SEQ ID NO: 17.In yet another aspect, the regulatory element for regulating the expression of the recombinant gene included in the construct of the invention is the gatYZABCD] tagatose-1,6bisP-aldolase promoter PgatY or variants thereof, such as, but not limited to, PgatY_U70UTR of the sequence SEQ ID NO: 17 .

Предпочтительный регуляторный элемент, присутствующий в генетически модифицированной клетке или в конструкции нуклеиновой кислоты по настоящему изобретению, выбирают из группы, состоящей из PgatY_70UTR, PglpF, PglpF_SD1, PglpF_SD10, PglpF_SD2, PglpF_SD3, PglpF_SD4, PglpF_SD5, PglpF_SD6, PglpF_SD7, PglpF_SD8, PglpF_SD9, Plac_16UTR, Plac, PmglB_70UTR и PmglB_70UTR_SD4.The preferred regulatory element present in the genetically modified cell or nucleic acid construct of the present invention is selected from the group consisting of PgatY_70UTR, PglpF, PglpF_SD1, PglpF_SD10, PglpF_SD2, PglpF_SD3, PglpF_SD4, PglpF_SD5, PglpF_SD6, PglpF_SD7, PglpF_SD8, PglpF_SD9, Plac_16UTR, Plac, PmglB_70UTR and PmglB_70UTR_SD4.

Особенно предпочтительные регуляторные элементы, присутствующие в генетически модифицированной клетке или в конструкции нуклеиновой кислоты по настоящему изобретению, выбирают из группы, состоящей из PglpF и Plac.Particularly preferred regulatory elements present in the genetically modified cell or nucleic acid construct of the present invention are selected from the group consisting of PglpF and Plac.

Однако любой промотор, обеспечивающий транскрипцию и/или регуляцию уровня транскрипции одной или нескольких рекомбинантных нуклеиновых кислот, кодирующих один или несколько белков (или одну или несколько регуляторных нуклеиновых кислот), которые либо необходимы, либо полезны для достижения оптимального уровня биосинтетического производства одного или нескольких ОГМ в клетке-хозяине, например, белков, участвующих в трансмембранном транспорте ОГМ или предшественника, результат разложения побочных продуктов продукции ОГМ, белков, регулирующих экспрессию генов, и т.д., и позволяющих достичь желаемых эффектов по изобретению, подходят для практического применения изобретения.However, any promoter that provides transcription and/or regulation of the transcription level of one or more recombinant nucleic acids encoding one or more proteins (or one or more regulatory nucleic acids) that are either necessary or useful for achieving an optimal level of biosynthetic production of one or more OGMs in the host cell, for example, proteins involved in the transmembrane transport of OGM or a precursor, the result of degradation of by-products of OGM production, proteins that regulate gene expression, etc., and allowing the desired effects of the invention to be achieved are suitable for the practical application of the invention.

Предпочтительно конструкция по настоящему изобретению, включающая ген, связанный с биосинтетическим продуцированием ОГМ, промоторную последовательность ДНК и другие регуляторные последовательности, такие как последовательность сайта связывания рибосомы (например, последовательность Шайна-Дальгарно), экспрессируемая в клетке-хозяине, обеспечивает ОГМ на уровне не менее 0,03 г /OD (оптическая плотность) на 1 л ферментационной среды, содержащей суспензию клеток-хозяев, например, на уровне от около 0,05 г/л/OD до около 0,1 г/л/OD. Для целей изобретения последний уровень продукции ОГМ считается достаточным, а клетка-хозяин, способная продуцировать желаемый уровень ОГМ, считается подходящей клеткой-хозяином, т.е. клетка может быть дополнительно модифицирована для экспрессии белка-переносчика ОГМ, например, Nec, для достижения хотя бы одного из описанных в настоящем документе эффектов, выгодных для производства ОГМ.Preferably, the construct of the present invention, including a gene associated with the biosynthetic production of OGM, a promoter DNA sequence and other regulatory sequences, such as a ribosome binding site sequence (for example, the Shine-Dalgarno sequence) expressed in the host cell, provides an OGM of at least 0.03 g/OD (optical density) per 1 L of fermentation medium containing a host cell suspension, for example at a level of about 0.05 g/L/OD to about 0.1 g/L/OD. For the purposes of the invention, the final level of OGM production is considered sufficient, and a host cell capable of producing the desired level of OGM is considered a suitable host cell, i.e. the cell may be further modified to express an OGM transporter protein, such as Nec, to achieve at least one of the effects described herein beneficial to OGM production.

Генетически модифицированная клетка или конструкция нуклеиновой кислоты по настоящему изобретению включает последовательность нуклеиновой кислоты, такую как гетерологичный ген, кодирующий предполагаемый белок-переносчик MFS (суперсемейство основных посредников).The genetically modified cell or nucleic acid construct of the present invention includes a nucleic acid sequence, such as a heterologous gene encoding a putative MFS (major mediator superfamily) transporter protein.

- 10 046248- 10 046248

Белок Nec - это транспортный белок MFS, представляющий особый интерес в настоящем изобретении. Таким образом, конструкция нуклеиновой кислоты по настоящему изобретению включает последовательность нуклеиновой кислоты, имеющую, по меньшей мере, 70% идентичности последовательности с геном, nec, SEQ ID NO: 2.The Nec protein is an MFS transport protein of particular interest in the present invention. Thus, the nucleic acid construct of the present invention includes a nucleic acid sequence having at least 70% sequence identity with the gene, nec, SEQ ID NO: 2.

Последовательность нуклеиновой кислоты, содержащаяся в генетически модифицированной клетке или в конструкции нуклеиновой кислоты, кодирует белок последовательности SEQ ID NO: 1 или его функциональный гомолог, аминокислотная последовательность которого, по меньшей мере, на 80% идентична SEQ ID NO: 1.The nucleic acid sequence contained in the genetically modified cell or nucleic acid construct encodes a protein of SEQ ID NO: 1 or a functional homolog thereof, the amino acid sequence of which is at least 80% identical to SEQ ID NO: 1.

Функциональный гомолог белка последовательности SEQ ID NO: 1 может быть получен путем мутагенеза. Функциональный гомолог должен иметь оставшуюся функциональность не менее 50%, такую как 60%, 70%, 80%, 90% или 100% по сравнению с функциональностью аминокислотной последовательности SEQ ID NO: 1. Функциональный гомолог может иметь более высокую функциональность по сравнению с функциональностью аминокислотной последовательности SEQ ID NO: 1. Функциональный гомолог последовательности SEQ ID NO: 1 должен быть способен усиливать продукцию ОГМ генетически модифицированной клетки по изобретению.A functional homolog of the protein of SEQ ID NO: 1 can be obtained by mutagenesis. A functional homologue must have a remaining functionality of at least 50%, such as 60%, 70%, 80%, 90%, or 100%, compared to the functionality of the amino acid sequence SEQ ID NO: 1. A functional homolog may have higher functionality than the functionality amino acid sequence SEQ ID NO: 1. A functional homolog of the sequence SEQ ID NO: 1 should be capable of enhancing the production of OGM by the genetically modified cell of the invention.

Генетически модифицированная клетка (клетка-хозяин или рекомбинантная клетка) может представлять собой, например, бактериальную или дрожжевую клетку. В одном предпочтительном воплощении генетически модифицированная клетка представляет собой бактериальную клетку. Что касается бактериальных клеток-хозяев, то, в принципе ограничений нет; они могут представлять собой эубактерии (грамположительные или грамотрицательные) или архебактерии, если они допускают генетические манипуляции для вставки интересующего гена и их можно культивировать в производственных масштабах. Предпочтительно клетка-хозяин обладает свойством культивирования до высокой плотности клеток. Неограничивающими примерами бактериальных клеток-хозяев, подходящих для рекомбинантного промышленного производства ОГМ согласно изобретению, могут представлять собой Erwinia herbicola (Pantoea agglomerans),Citrobacter freundii, Pantoea citrea, Pectobacterium carotovorum или Xanthomonas campestris. Также могут быть применены бактерии рода Bacillus, в том числе Bacillus subtilis, Bacillus licheniformis, Bacillus coagulans, Bacillus thermophilus, Bacillus laterosporus, Bacillus megaterium, Bacillus mycoides, Bacillus pumilus, Bacillus lentus, Bacillus cereus и Bacillus circulans. Аналогично, бактерии родов Lactobacillus and Lactococcus могут быть модифицированы с применением способов по данному изобретению, включая, но не ограничиваясь ими, Lactobacillus acidophilus, Lactobacillus salivarius, Lactobacillus plantarum, Lactobacillus helveticus, Lactobacillus delbrueckii, Lactobacillus rhamnosus, Lactobacillus bulgaricus, Lactobacillus crispatus, Lactobacillus gasseri, Lactobacillus casei, Lactobacillus reuteri, Lactobacillus jensenii и Lactococcus lactis. Streptococcus thermophiles и Proprionibacterium freudenreichii также представляют собой подходящие виды бактерий для описанного в настоящем документе изобретения. Также часть этого изобретения представляют собой штаммы, модифицированные, как описано в настоящем документе, из родов Enterococcus (например, Enterococcus faecium и Enterococcus thermophiles), Bifidobacterium (например, Bifidobacterium longum, Bifidobacterium infantis и Bifidobacterium bifidum), Sporolactobacillus spp., Micromomospora spp., Micrococcus spp., Rhodococcus spp. и Pseudomonas (например, Pseudomonas fluorescens и Pseudomonas aeruginosa). Бактерии, обладающие характеристиками, описанными в настоящем документе, культивируют в присутствии лактозы, и олигосахарид, такой как ОГМ, продуцируемый клеткой, выделяют либо из самой бактерии, либо из культурального супернатанта бактерии. В одном предпочтительном воплощении генетически модифицированная клетка по изобретению представляет собой клетку Escherichia coli.The genetically modified cell (host cell or recombinant cell) may be, for example, a bacterial or yeast cell. In one preferred embodiment, the genetically modified cell is a bacterial cell. As far as bacterial host cells are concerned, there are in principle no restrictions; they may be eubacteria (Gram-positive or Gram-negative) or archaebacteria if they can be genetically manipulated to insert the gene of interest and can be cultured on a commercial scale. Preferably, the host cell has the ability to be cultured to a high cell density. Non-limiting examples of bacterial host cells suitable for the recombinant industrial production of HGM according to the invention may include Erwinia herbicola (Pantoea agglomerans), Citrobacter freundii, Pantoea citrea, Pectobacterium carotovorum or Xanthomonas campestris. Bacteria of the genus Bacillus can also be used, including Bacillus subtilis, Bacillus licheniformis, Bacillus coagulans, Bacillus thermophilus, Bacillus laterosporus, Bacillus megaterium, Bacillus mycoides, Bacillus pumilus, Bacillus lentus, Bacillus cereus and Bacillus circulans. Likewise, bacteria of the genera Lactobacillus and Lactococcus can be modified using the methods of this invention, including, but not limited to, Lactobacillus acidophilus, Lactobacillus salivarius, Lactobacillus plantarum, Lactobacillus helveticus, Lactobacillus delbrueckii, Lactobacillus rhamnosus, Lactobacillus bulgaricus, Lactobacillus crispat us, Lactobacillus gasseri , Lactobacillus casei, Lactobacillus reuteri, Lactobacillus jensenii and Lactococcus lactis. Streptococcus thermophiles and Proprionibacterium freudenreichii are also suitable bacterial species for the invention described herein. Also part of this invention are strains modified as described herein from the genera Enterococcus (for example, Enterococcus faecium and Enterococcus thermophiles), Bifidobacterium (for example, Bifidobacterium longum, Bifidobacterium infantis and Bifidobacterium bifidum), Sporolactobacillus spp., Micromomospora spp. , Micrococcus spp., Rhodococcus spp. and Pseudomonas (eg Pseudomonas fluorescens and Pseudomonas aeruginosa). Bacteria having the characteristics described herein are cultured in the presence of lactose, and an oligosaccharide, such as OGM, produced by the cell is isolated either from the bacterium itself or from the culture supernatant of the bacterium. In one preferred embodiment, the genetically modified cell of the invention is an Escherichia coli cell.

В другом предпочтительном воплощении клетка-хозяин представляет собой дрожжевую клетку, например, Saccharomyces cerevisiae, Schizosaccharomyces pombe, Pichia pastoris, Kluveromyces lactis, Kluveromyces marxianus и т.п.In another preferred embodiment, the host cell is a yeast cell, for example, Saccharomyces cerevisiae, Schizosaccharomyces pombe, Pichia pastoris, Kluveromyces lactis, Kluveromyces marxianus, and the like.

ОГМ, продуцируемый рекомбинантными клетками по изобретению, могут быть очищены с применением подходящей процедуры, доступной в данной области техники (например, такой, как описан в WO2015188834, WO2017182965 или WO2017152918).The OGM produced by the recombinant cells of the invention can be purified using a suitable procedure available in the art (eg, such as described in WO2015188834, WO2017182965 or WO2017152918).

Генетически модифицированные клетки по изобретению могут быть получены с применением стандартных способов в данной области техники, например, описанных в руководствах Sambrook et al., Wilson & Walker, Maniatise et al. и Ausubel et al.Genetically modified cells according to the invention can be obtained using standard methods in the art, for example, described in the manuals of Sambrook et al., Wilson & Walker, Maniatise et al. and Ausubel et al.

Хозяин, подходящий для продукции ОГМ, например Е. coli, может включать эндогенный ген Ргалактозидазы или экзогенный ген β-галактозидазы, например, Е. coli включает эндогенный ген lacZ (например, номер доступа в GenBank V00296 (GL41901)). Для целей изобретения клетка-хозяин, продуцирующая ОГМ, подвергается генетическим манипуляциям либо для включения любого гена βгалактозидазы, либо для включения гена, который инактивирован. Ген может быть инактивирован путем полной или частичной делеции соответствующей последовательности нуклеиновой кислоты из бактериального генома, или последовательность гена может быть мутирована так, как она транскрибируется, или, если транскрибируется, транскрипт не транслируется, или если транслируется в белок (т.е. βгалактозидазу), то белок не обладает соответствующей ферментативной активностью. Таким образом,A host suitable for OGM production, eg E. coli, may include an endogenous β-galactosidase gene or an exogenous β-galactosidase gene, eg E. coli includes an endogenous lacZ gene (eg, GenBank accession number V00296 (GL41901)). For the purposes of the invention, the host cell producing OGM is genetically manipulated to either turn on any β-galactosidase gene or turn on a gene that is inactivated. A gene may be inactivated by complete or partial deletion of the corresponding nucleic acid sequence from the bacterial genome, or the gene sequence may be mutated as it is transcribed, or, if transcribed, the transcript is not translated, or if translated into a protein (i.e., β-galactosidase) , then the protein does not have the appropriate enzymatic activity. Thus,

- 11 046248 бактерия, продуцирующая ОГМ, накапливает повышенный внутриклеточный пул лактозы, что полезно для продукции ОГМ.- 11 046248 the bacterium producing OGM accumulates an increased intracellular pool of lactose, which is useful for the production of OGM.

В некоторых воплощениях сконструированная клетка, например, бактерия, включает дефицитный катаболический путь сиаловой кислоты. Под катаболическим путем сиаловой кислоты подразумевается последовательность реакций, обычно контролируемая и катализируемая ферментами, которая приводит к разложению сиаловой кислоты. Примерный путь катаболизма сиаловой кислоты, описанный в настоящем документе, представляет собой путь Е. coli. В этом пути сиаловая кислота (Neu5Ac; Nацетилнейраминовая кислота) расщепляется ферментами NanA (лиаза N-ацетилнейраминовой кислоты), NanK (N-ацетилманнозаминкиназа) и NanE (N-ацетилманнозамин-б-фосфатэпимераза), все кодируемые из оперона nanATEK-yhcH, и подавляется NanR (http://ecocyc.org/ECOLI). Дефицитный катаболический путь сиаловой кислоты воспроизводится у хозяина Е. coli путем внесения мутации в эндогенные гены nanA (N-ацетилнейраминалиаза) (например, номер доступа в GenBank D00067.1 (GL216588)) и/или nanK (N-ацетилманнозаминкиназа) (например, номер доступа в GenBank (аминокислота) ВАЕ77265.1 (GL85676015)), и/или nanE (N-ацетилманнозамин-б-фосфатэпимераза, GI: 947745, включена сюда посредством отсылки). Необязательно, ген nanT (транспортер N-ацетилнейрамината) также инактивируют или мутируют. Другие промежуточные продукты метаболизма сиаловой кислоты включают: (ManNAc-6P) N-ацетилманнозамин-б-фосфат; (GlcNAc-6-P) N-ацетилглюкозаминил-б-фосфат; (GlcN-6-P) глюкозамин-6-фосфат и (Fruc-6-P) фруктозо-6-фосфат. В некоторых предпочтительных воплощениях, nanA мутирован. В других предпочтительных воплощениях, nanA и nanK мутированы, тогда как nanE остается функциональным. В другом предпочтительном воплощении, nanA и nanE мутированы, тогда как nanK не был мутирован, инактивирован или удален. Мутация представляет собой одно или несколько изменений в последовательности нуклеиновой кислоты, кодирующей продукт гена nanA, nanK, nanE и/или nanT. Например, мутация может представлять собой 1, 2, до 5, до 10, до 25, до 50 или до 100 изменений в последовательности нуклеиновой кислоты. Например, nanA, nanK, nanE и/или nanT гены мутируют путем нулевой мутации. Нулевые мутации, как описано в настоящем документе, включают аминокислотные замены, добавления, делеции или вставки, которые либо вызывают потерю функции фермента (т.е. снижение или отсутствие активности), либо потерю фермента (т.е. отсутствие генного продукта). Под удаленными подразумевают, что кодирующая область удалена полностью или частично, так что не образуется (функциональный) продукт гена. Под инактивацией подразумевается, что кодирующая последовательность была изменена таким образом, что полученный генный продукт будет функционально неактивным или будет кодировать генный продукт с активностью, менее чем на 100%, например, на 90%, 80%, 70%, 60%, 50%, 40%, 30% или 20% по сравнению с активностью нативного, встречающегося в природе, эндогенного генного продукта. Немутированный ген или белок не отличается от нативной, встречающейся в природе или эндогенной кодирующей последовательности на 1, 2, вплоть до 5, вплоть до 10, вплоть до 20, вплоть до 50, вплоть до 100, вплоть до от 200 или вплоть до 500 или более кодонов или до соответствующей закодированной аминокислотной последовательности.In some embodiments, the engineered cell, such as a bacterium, includes a deficient sialic acid catabolic pathway. The sialic acid catabolic pathway refers to the sequence of reactions, usually controlled and catalyzed by enzymes, that leads to the degradation of sialic acid. The exemplary sialic acid catabolic pathway described herein is the E. coli pathway. In this pathway, sialic acid (Neu5Ac; N-acetylneuraminic acid) is cleaved by the enzymes NanA (N-acetylneuraminic acid lyase), NanK (N-acetylmannosamine kinase) and NanE (N-acetylmannosamine b-phosphate epimerase), all encoded from the nanATEK-yhcH operon, and is suppressed NanR (http://ecocyc.org/ECOLI). The deficient sialic acid catabolic pathway is replicated in the E. coli host by introducing mutations into the endogenous nanA (N-acetylneuraminaliase) (e.g., GenBank accession no. D00067.1 (GL216588)) and/or nanK (N-acetylmannosamine kinase) genes (e.g., no. GenBank access (amino acid) BAE77265.1 (GL85676015)), and/or nanE (N-acetylmannosamine b-phosphate epimerase, GI: 947745, incorporated herein by reference). Optionally, the nanT (N-acetylneuraminate transporter) gene is also inactivated or mutated. Other intermediates of sialic acid metabolism include: (ManNAc-6P) N-acetylmannosamine b-phosphate; (GlcNAc-6-P) N-acetylglucosaminyl-b-phosphate; (GlcN-6-P) glucosamine 6-phosphate and (Fruc-6-P) fructose 6-phosphate. In some preferred embodiments, nanA is mutated. In other preferred embodiments, nanA and nanK are mutated while nanE remains functional. In another preferred embodiment, nanA and nanE are mutated, while nanK has not been mutated, inactivated or deleted. A mutation is one or more changes in the nucleic acid sequence encoding the gene product nanA, nanK, nanE and/or nanT. For example, a mutation may represent 1, 2, up to 5, up to 10, up to 25, up to 50, or up to 100 changes in the nucleic acid sequence. For example, the nanA, nanK, nanE and/or nanT genes are mutated by null mutation. Null mutations, as described herein, include amino acid substitutions, additions, deletions or insertions that either cause loss of enzyme function (ie, decreased or absent activity) or loss of enzyme (ie, absence of gene product). By deleted we mean that the coding region has been removed in whole or in part so that no (functional) gene product is generated. By inactivation it is meant that the coding sequence has been altered such that the resulting gene product is functionally inactive or encodes a gene product with less than 100% activity, e.g. 90%, 80%, 70%, 60%, 50% , 40%, 30% or 20% compared to the activity of the native, naturally occurring, endogenous gene product. An unmutated gene or protein does not differ from the native, naturally occurring, or endogenous coding sequence by 1, 2, up to 5, up to 10, up to 20, up to 50, up to 100, up to 200, or up to 500 or more codons or up to the corresponding encoded amino acid sequence.

Кроме того, бактерия (например, Е. coli) также обладает способностью к синтезу сиаловой кислоты. Например, бактерия обладает способностью синтезировать сиаловую кислоту за счет экзогенной UDPGlcNAc 2-эпимеразы (например, neuC из Campylobacter jejuni (GenBank AAK91727.1) или ее эквивалента (например, (GenBank CAR04561.1), синтазы Neu5Ac (например, nauB из С. jejuni (GenBank AAK91726.1) или ее эквивалента (например, синтазы сиаловой кислоты из Flavobacterium limnosediminis, GenBank WP_023580510.1), и/или синтазы CMP-Neu5Ac (например, neuA из С. jejuni (GenBank AAK91728.1) или ее эквивалента (например, СМР-синтазы сиаловой кислоты из Vibrio brasiliensis, GenBank WP_006881452.1).In addition, the bacterium (for example, E. coli) also has the ability to synthesize sialic acid. For example, the bacterium has the ability to synthesize sialic acid through exogenous UDPGlcNAc 2-epimerase (for example, neuC from Campylobacter jejuni (GenBank AAK91727.1) or its equivalent (for example, (GenBank CAR04561.1), Neu5Ac synthase (for example, nauB from C. jejuni (GenBank AAK91726.1) or its equivalent (e.g., sialic acid synthase from Flavobacterium limnosediminis, GenBank WP_023580510.1), and/or CMP-Neu5Ac synthase (e.g., neuA from C. jejuni (GenBank AAK91728.1) or its equivalent (e.g. sialic acid CMP synthase from Vibrio brasiliensis, GenBank WP_006881452.1).

Получение нейтрального ОГМ, содержащего N-ацетилглюкозаминил, в сконструированных бактериях также известно в данной области техники (смотри, например, Gebus С. et al. (2012) Carbohydrate Research 363 83-90).The production of neutral OGM containing N-acetylglucosaminyl in engineered bacteria is also known in the art (see, for example, Gebus C. et al. (2012) Carbohydrate Research 363 83-90).

Для производства ОГМ, содержащих N-ацетилглюкозаминил, таких как лакто-Ы-триоза 2 (LNT-2), лакто-Ы-тетраоза (LNT), лакто-Н-неотетраоза (LNnT), лакто-Н-фукопентаоза I (LNFP-I), лакто-Nфукопентаоза II (LNFP-II), лакто-М-фукопентаоза III (LNFP-III), лакто-М-фукопентаоза V (LNFP-V), лакTO-N-дифукогексаоза I (LDFH-I), лакто-N-дифукогексаоза II (LDFH-II) и лакто-N-неодифукогексаоза II (LNDFH-III), бактерия включает функциональный ген lacY и дисфункциональный ген lacZ, как описано выше, и он сконструирован так, чтобы включать экзогенный ген UDP-GlcNAc:Gala/e-R бета-3-Nацетилглюкозаминилтрансферазы или его функциональный вариант или фрагмент. Этот экзогенный ген UDP-GlcNAc:Gala/e-R бета-3-N-ацетилглюкозаминилтрансферазы может быть получен из любого из ряда источников, например, из гена lgtA, описанного в N. meningitides (номер доступа белка в GenBank AAF42258.1) или N. gonorrhoeae (номер доступа белка в GenBank ACF31229.1). Необязательно, дополнительный ген экзогенной гликозилтрансферазы может быть коэкспрессирован в бактерии, включающей экзогенный ген UDP-GlcNAc:Gala/e-R бета-3-N-ацетилглюкозаминилтрансферазы. Например, ген бета1,4-галактозилтрансферазы коэкспрессируется с геном UDP-GlcNAc:Gala/e-R бета-N-ацетилглюкозаминилтрансферазы. Этот экзогенный ген бета-1,4-галактозилтрансферазы может быть полученFor the production of OGM containing N-acetylglucosaminyl, such as lacto-N-triose 2 (LNT-2), lacto-N-tetraose (LNT), lacto-N-neotetraose (LNnT), lacto-N-fucopentaose I (LNFP- I), lacto-N-fucopentaose II (LNFP-II), lacto-M-fucopentaose III (LNFP-III), lacto-M-fucopentaose V (LNFP-V), lacTO-N-difucohexaose I (LDFH-I), lacto -N-difucohexaose II (LDFH-II) and lacto-N-neodifucohexaose II (LNDFH-III), the bacterium includes a functional lacY gene and a dysfunctional lacZ gene as described above, and it is engineered to include an exogenous UDP-GlcNAc gene: Gala/e-R beta-3-Nacetylglucosaminyltransferase or a functional variant or fragment thereof. This exogenous UDP-GlcNAc:Gala/e-R beta-3-N-acetylglucosaminyltransferase gene can be obtained from any of a number of sources, for example, from the lgtA gene described in N. meningitides (GenBank protein accession number AAF42258.1) or N. gonorrhoeae (GenBank protein accession number ACF31229.1). Optionally, an additional exogenous glycosyltransferase gene can be coexpressed in the bacterium including an exogenous UDP-GlcNAc:Gala/e-R beta-3-N-acetylglucosaminyltransferase gene. For example, the beta1,4-galactosyltransferase gene is coexpressed with the UDP-GlcNAc:Gala/e-R beta-N-acetylglucosaminyltransferase gene. This exogenous beta-1,4-galactosyltransferase gene can be obtained

- 12 046248 из любого источника, например, описанного в N. meningitidis, ген lgtB (номер доступа белка в GenBank AAF42257.1) или из Н. pylori, ген HP0826/galT (номер доступа белка в GenBank NP_207619.1). Необязательно дополнительный ген экзогенной гликозилтрансферазы, коэкспрессируемый в бактерии, включающей экзогенный ген UDP-GlcNAc:Gala/e-R бета-3-Ы-ацетилглюкозаминилтрансферазы, представляет собой ген P-1,3-galactosyltransferase, например, тот, что описан из Е. coli 055:Н7, ген wbgO (номер доступа белка в GenBank WP_000582563.1), или из Н. pylori, ген jhp0563 (номер доступа белка в GenBank AEZ55696.1), или из Streptococcus agalactiae type Ib OI2 ген cpslBJ (номер доступа белка в GenBank AB050723). Раскрытое изобретение также охватывает функциональные варианты и фрагменты любого из ферментов, описанных выше.- 12 046248 from any source, for example, described in N. meningitidis gene lgtB (GenBank protein accession number AAF42257.1) or from H. pylori gene HP0826/galT (GenBank protein accession number NP_207619.1). Optionally, the additional exogenous glycosyltransferase gene coexpressed in the bacterium including the exogenous UDP-GlcNAc:Gala/e-R beta-3-N-acetylglucosaminyltransferase gene is a P-1,3-galactosyltransferase gene, such as that described from E. coli 055 :H7, wbgO gene (GenBank protein accession number WP_000582563.1), or from H. pylori, gene jhp0563 (GenBank protein accession number AEZ55696.1), or from Streptococcus agalactiae type Ib OI2 gene cpslBJ (GenBank protein accession number AB050723). The disclosed invention also covers functional variants and fragments of any of the enzymes described above.

Ген N-ацетилглюкозаминилтрансферазы и/или ген галактозилтрансферазы также может быть функционально связан с Pglp и экспрессироваться из соответствующей интегрированной в геном кассеты. В одном воплощении ген, интегрированный в геном, представляет собой ген, кодирующий галактозилтрансферазу, например, ген НР0826, кодирующий фермент GalT из Н. pylori (номер доступа белка в GenBank NP_207619.1); в другом воплощении ген, интегрированный в геном, представляет собой ген, кодирующий бета-1,3-Ы-ацетилглюкозаминилтрансферазу, например, ген lgtA из N. meningitidis (номер доступа белка в GenBank AAF42258.1). В этих воплощениях второй ген, т.е. ген, кодирующий бета-1,3N-ацетилглюкозаминилтрансферазу или галактозилтрансферазу, соответственно, может экспрессироваться либо из интегрированной в геном, либо из переносимой плазмидой кассеты. Второй ген необязательно может экспрессироваться либо под контролем промотора glp или под контролем любого другого промотора, подходящего для системы экспрессии, например, Plac.The N-acetylglucosaminyltransferase gene and/or the galactosyltransferase gene may also be operably linked to Pglp and expressed from the corresponding genomically integrated cassette. In one embodiment, the gene integrated into the genome is a gene encoding a galactosyltransferase, for example, the HP0826 gene encoding the GalT enzyme from H. pylori (GenBank protein accession number NP_207619.1); in another embodiment, the gene integrated into the genome is a gene encoding a beta-1,3-N-acetylglucosaminyltransferase, for example, the lgtA gene from N. meningitidis (GenBank protein accession number AAF42258.1). In these embodiments, the second gene, i.e. the gene encoding beta-1,3N-acetylglucosaminyltransferase or galactosyltransferase, respectively, can be expressed from either a genome-integrated or plasmid-borne cassette. The second gene may optionally be expressed either under the control of a glp promoter or under the control of any other promoter suitable for the expression system, for example, Plac.

Если не указано иное, все технические и научные термины, применяемые в настоящем документе, имеют то же значение, которое обычно понимается специалистом в области, к которой относится данное изобретение. Singleton et al. (1994) Dictionary of Microbiology and Molecular Biology, second edition, John Wiley and Sons (New York) предоставляет специалисту общий словарь многих терминов, применяемых в этом изобретении. Хотя любые способы и материалы, подобные или эквивалентные описанным в настоящем документе, могут быть применены на практике или тестировании настоящего изобретения, описаны предпочтительные способы и материалы. Большую часть номенклатуры и общих лабораторных процедур, необходимых для этого приложения, можно найти в руководствах Sambrook et al., Molecular Cloning: A Laboratory Manual, Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (2012); Wilson K. and Walker J., Principles and Techniques of Biochemistry and Molecular Biology (2010), Cambridge University Press; или в Maniatis et al., Molecular Cloning A laboratory Manual, Cold Spring Harbor Laboratory (2012); или в Ausubel et al., Current protocols in molecular biology, John Wiley and Sohns (2010). Руководства далее именуют Sambrook et al, Wilson & Walker, Maniatise et al., Ausubel et al., соответственно.Unless otherwise specified, all technical and scientific terms used herein have the same meaning as commonly understood by one skilled in the art to which this invention relates. Singleton et al. (1994) Dictionary of Microbiology and Molecular Biology, second edition, John Wiley and Sons (New York) provides one skilled in the art with a general dictionary of many of the terms used in this invention. Although any methods and materials similar or equivalent to those described herein may be used in the practice or testing of the present invention, preferred methods and materials are described. Much of the nomenclature and general laboratory procedures required for this application can be found in Sambrook et al., Molecular Cloning: A Laboratory Manual, Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (2012); Wilson K. and Walker J., Principles and Techniques of Biochemistry and Molecular Biology (2010), Cambridge University Press; or in Maniatis et al., Molecular Cloning A laboratory Manual, Cold Spring Harbor Laboratory (2012); or in Ausubel et al., Current protocols in molecular biology, John Wiley and Sohns (2010). The guidelines are hereafter referred to as Sambrook et al, Wilson & Walker, Maniatise et al., Ausubel et al., respectively.

Второй аспект изобретения относится к способу получения одного или нескольких ОГМ, включающему следующие этапы:The second aspect of the invention relates to a method for producing one or more OGM, including the following steps:

(i) обеспечение генетически модифицированной клетки, способной продуцировать ОГМ, причем указанная клетка включает рекомбинантную нуклеиновую кислоту, кодирующую белок последовательности SEQ ID NO: 1, или ее функциональный гомолог, аминокислотная последовательность которого идентична, по меньшей мере, на 80%, предпочтительно идентична, по меньшей мере, на 85%, более предпочтительно идентична, по меньшей мере, на 90% последовательности SEQ ID NO: 1;(i) providing a genetically modified cell capable of producing HGM, wherein said cell comprises a recombinant nucleic acid encoding a protein of the sequence SEQ ID NO: 1, or a functional homolog thereof, the amino acid sequence of which is at least 80% identical, preferably identical, at least 85%, more preferably at least 90% identical to the sequence of SEQ ID NO: 1;

(ii) культивирование клетки (i) в подходящей среде для культивирования клеток, позволяющей продукцию ОГМ и экспрессию последовательности ДНК для продукции белка, имеющего аминокислотную последовательность SEQ ID NO: 1 или ее функционал, аминокислотная последовательность которого идентична, по меньшей мере, на 80%, предпочтительно идентична, по меньшей мере, на 85%, более предпочтительно идентична, по меньшей мере, на 90% последовательности SEQ ID NO: 1;(ii) culturing the cell (i) in a suitable cell culture medium allowing the production of OGM and the expression of a DNA sequence to produce a protein having the amino acid sequence of SEQ ID NO: 1 or a functional thereof, the amino acid sequence of which is at least 80% identical. , preferably at least 85% identical, more preferably at least 90% identical to the sequence of SEQ ID NO: 1;

(iii) сбор ОГМ, полученного на этапе (ii).(iii) collection of the GMS obtained in step (ii).

Согласно изобретению термин культивирование (culturing) (или культивирование (cultivating) или ведение культуры (cultivation), также называемое ферментация) относится к размножению бактериальных экспрессирующих клеток в контролируемом биореакторе в соответствии со способами, известными в промышленности.According to the invention, the term culturing (or cultivating or cultivating, also called fermentation) refers to the propagation of bacterial expressing cells in a controlled bioreactor in accordance with methods known in the industry.

Для получения одного или нескольких ОГМ бактерии, продуцирующие ОГМ, как описано в настоящем документе, культивируют в соответствии с процедурами, известными в данной области техники, в присутствии подходящего источника углерода, например глюкозы, глицерина, лактозы и т.д., и полученный ОГМ собирают из сред культивирования и микробной биомассы, образующейся в процессе культивирования.To obtain one or more OGM, bacteria producing OGM as described herein are cultured according to procedures known in the art in the presence of a suitable carbon source, for example glucose, glycerol, lactose, etc., and the resulting OGM collected from cultivation media and microbial biomass formed during the cultivation process.

После этого ОГМ очищают в соответствии с процедурами, известными в данной области техники, например, такими, как описаны в WO2015188834, WO2017182965 или WO2017152918, и очищенный ОГМ применяют в качестве нутрицевтиков, фармацевтических препаратов или для любых других целей, например, для исследований. Производство ОГМ обычно осуществляется путем культивирования в больших объемах. Термин производство и производственный масштаб в значении изобретения определяет ферментацию с минимальным объемом 5 л культурального бульона. Обычно процесс в произThe HMOs are then purified according to procedures known in the art, such as those described in WO2015188834, WO2017182965 or WO2017152918, and the purified HMOs are used as nutraceuticals, pharmaceuticals or for any other purposes, such as research. The production of OGM is usually carried out through large-scale cultivation. The term production and production scale within the meaning of the invention defines fermentation with a minimum volume of 5 liters of culture broth. Usually the process in production

- 13 046248 водственном масштабе определяют способностью обрабатывать большие объемы препарата, содержащего ОГМ или представляющий интерес ОГМ, и производить такие количества представляющий интерес белка, которые соответствуют, например, в случае терапевтического соединения или композиции, требованиям для клинических испытаний, а также для предложения на рынке. Помимо большого объема, способ в производственных масштабах, в отличие от простых способов в лабораторных масштабах, таких как культивирование во встряхиваемых колбах, характеризуется применением технической системы биореактора (ферментера), оснащенного устройствами для перемешивания, аэрации, подачи питательных веществ, слежения за параметрами процесса и контроля параметров процесса (рН, температура, давление растворенного кислорода, обратное давление и др.). В значительной степени поведение системы экспрессии в лабораторном масштабе, например, во встряхиваемых колбах, настольных биореакторах или формате глубоких лунок, описанных в примерах настоящего раскрытия, позволяет предсказать поведение этой системы в сложной среде биореактора.- 13 046248 industrial scale is determined by the ability to process large volumes of a drug containing an HMO or an HMO of interest, and to produce such quantities of the protein of interest that meet, for example, in the case of a therapeutic compound or composition, the requirements for clinical trials as well as for offering on the market . In addition to its large volume, the method on a production scale, in contrast to simple methods on a laboratory scale, such as cultivation in shake flasks, is characterized by the use of a technical bioreactor (fermenter) system equipped with devices for mixing, aeration, supply of nutrients, monitoring process parameters and control of process parameters (pH, temperature, dissolved oxygen pressure, back pressure, etc.). To a large extent, the behavior of an expression system on a laboratory scale, such as in shake flasks, benchtop bioreactors, or the deep well format described in the examples of this disclosure, allows one to predict the behavior of that system in a complex bioreactor environment.

Что касается подходящей среды для культивирования, применяемой в процессе ферментации, ограничений нет. Культуральная среда может быть полуопределенной, то есть содержащей комплексные соединения среды (например, дрожжевой экстракт, соевый пептон, казаминовые кислоты и т.д.), или она может быть химически определенной, без каких-либо комплексных соединений.There are no restrictions regarding the suitable culture medium used in the fermentation process. The culture medium may be semi-defined, that is, containing complex compounds of the medium (eg, yeast extract, soy peptone, casamino acids, etc.), or it may be chemically defined, without any complex compounds.

Под термином один или несколько ОГМ подразумевают, что производственная ячейка ОГМ может быть способна производить одну структуру ОГМ (первый ОГМ) или несколько структур ОГМ (второй, третий и т.д. ОГМ). В некоторых воплощениях может быть предпочтительной клетка-хозяин, которая продуцирует один ОГМ, в других предпочтительных воплощениях может быть предпочтительной клетка-хозяин, продуцирующая несколько структур ОГМ. Клетки, продуцирующие 2'-FL, 3-FL, 3'-SL, 6'SL или LNT-2 представляют собой неограничивающие примеры клеток-хозяев, продуцирующих ОГМ единственной структуры. Неограничивающие примеры клеток-хозяев, способных продуцировать несколько структур ОГМ, могут представлять собой клетки-продуценты DFL, FSL, LNT, LNnT, LNFP I, LNFP II, LNFP III, LNFP IV, LNFP V, pLNnH, pLNH2.By the term one or more OGMs, it is meant that a OGM production cell may be capable of producing one OGM structure (first OGM) or multiple OGM structures (second, third, etc. OGM). In some embodiments, a host cell that produces a single OGM may be preferred; in other preferred embodiments, a host cell that produces multiple OGM structures may be preferred. Cells producing 2'-FL, 3-FL, 3'-SL, 6'SL or LNT-2 are non-limiting examples of host cells producing OGM of a single structure. Non-limiting examples of host cells capable of producing multiple OGM structures may include DFL, FSL, LNT, LNnT, LNFP I, LNFP II, LNFP III, LNFP IV, LNFP V, pLNnH, pLNH2 producer cells.

Термин сбор в контексте изобретения относится к сбору полученных ОГМ после прекращения ферментации. В различных воплощениях это может включать сбор ОГМ, включенных как в биомассу (т.е. клетки-хозяева), так и в среду культивирования, т.е. до/без отделения ферментационного бульона от биомассы. В других воплощениях полученный ОГМ можно собирать отдельно от биомассы и ферментационного бульона, т.е. после отделения /следом за отделением биомассы от среды культивирования (т.е. ферментационного бульона). Отделение клеток от среды может быть осуществлено любым из способов, хорошо известных специалисту в данной области техники, например, любым подходящим типом центрифугирования или фильтрации. Отделение клеток от среды может следовать сразу за сбором ферментационного бульона или осуществляться на более позднем этапе после хранения ферментационного бульона в соответствующих условиях. Извлечение произведенных ОГМ из оставшейся биомассы (или полная ферментация) включает их извлечение из биомассы (клеток-продуцентов). Это можно осуществить любыми подходящими способами в данной области техники, например, обработкой ультразвуком, кипячением, гомогенизацией, ферментативным лизисом с применением лизоцима или замораживанием и измельчением.The term collection in the context of the invention refers to the collection of the resulting OGM after the cessation of fermentation. In various embodiments, this may involve collecting OGMs included in both the biomass (i.e., host cells) and the culture medium, i.e. before/without separating the fermentation broth from the biomass. In other embodiments, the resulting OGM can be collected separately from the biomass and fermentation broth, i.e. after/following the separation of the biomass from the cultivation medium (i.e. fermentation broth). Separation of cells from the medium can be accomplished by any of the methods well known to one skilled in the art, for example, any suitable type of centrifugation or filtration. Separation of cells from the medium may immediately follow collection of the fermentation broth or may be carried out at a later stage after the fermentation broth has been stored under appropriate conditions. Extraction of produced HMOs from the remaining biomass (or complete fermentation) involves their extraction from the biomass (producer cells). This can be accomplished by any suitable methods in the art, for example, sonication, boiling, homogenization, enzymatic lysis using lysozyme, or freezing and grinding.

После восстановления после ферментации ОГМ доступны для дальнейшей обработки и очистки.Once recovered from fermentation, the HMOs are available for further processing and purification.

Очистку ОГМ, полученных ферментацией, можно проводить с применением подходящей процедуры, описанной в WO2016095924, WO2015188834, WO2017152918, WO2017182965, US20190119314 (все включены посредством отсылки).Purification of OHMs produced by fermentation can be carried out using a suitable procedure described in WO2016095924, WO2015188834, WO2017152918, WO2017182965, US20190119314 (all incorporated by reference).

В некоторых воплощениях изобретения клетка-хозяин может продуцировать несколько ОГМ, где один ОГМ представляет собой ОГМ-продукт, а некоторые/все прочие ОГМ представляют собой ОГМпобочный продукт. Как правило, побочные ОГМ представляют собой либо основных предшественников ОГМ, либо продукты дальнейшей модификации основных ОГМ. В некоторых воплощениях может быть желательно производить продукт ОГМ в больших количествах и побочный продукт ОГМ в малых количествах. Клетки и способы получения ОГМ, описанные в настоящем документе, обеспечивают контролируемое производство продукта ОГМ с заданным профилем ОГМ, например, в одном воплощении полученная смесь ОГМ, в которой продукт ОГМ представляет собой доминирующим ОГМ по сравнению с другими ОГМ (т.е. побочными ОГМ) смеси, т.е. ОГМ-продукт производится в большем количестве, чем другие ОГМ-побочные продукты; в других воплощениях клетка, производящая одну и ту же смесь ОГМ, может быть настроена на производство одного или нескольких побочных продуктов ОГМ в большем количестве, чем ОГМ-продукт. Например, при производстве 2'-FL, ОГМ-продукта, часто образуется значительное количество DFL, ОГМ-побочного продукта. С генетически модифицированными клетками по настоящему изобретению уровень DFL в 2'-РЪ-продукте может быть значительно снижен.In some embodiments of the invention, a host cell may produce multiple OGMs, where one OGM is a product OGM and some/all of the other OGMs are by-product OGMs. As a rule, side HMOs are either the main precursors of the HMOs or products of further modification of the main HMOs. In some embodiments, it may be desirable to produce the OGM product in large quantities and the OGM by-product in small quantities. The cells and methods for producing OGM described herein provide controlled production of an OGM product with a given OGM profile, for example, in one embodiment, a resulting mixture of OGM in which the OGM product is the dominant OGM relative to other OGMs (i.e., by-product OGMs). ) mixtures, i.e. The OGM product is produced in greater quantities than other OGM by-products; in other embodiments, a cell producing the same mixture of OGM may be configured to produce one or more OGM by-products in greater quantities than the OGM product. For example, the production of 2'-FL, an OGM product, often produces significant amounts of DFL, an OGM by-product. With the genetically modified cells of the present invention, the level of DFL in the 2'-Pb product can be significantly reduced.

Преимущественно изобретение обеспечивает как снижение отношения побочного продукта к продукту, так и увеличение общего выхода продукта (и/или ОГМ в целом). Это, сниженное образование побочных продуктов по сравнению с образованием продукта, способствует повышенному образованию продукта и повышает эффективность как производства, так и процесса извлечения продукта, обеспечивая превосходную технологию производства ОГМ.Advantageously, the invention provides both a reduction in the by-product to product ratio and an increase in the overall product yield (and/or OGM in general). This reduced byproduct formation relative to product formation promotes increased product formation and increases the efficiency of both the production and product recovery process, providing superior OGM production technology.

- 14 046248- 14 046248

В различных предпочтительных воплощениях могут быть выбраны различные клетки-хозяева, продуцирующие один/оба 2'-FL, 3-FL, 3'-SL, 6'-SL, LNT-2, DFL, FSL, LNT, LNnT, DFL, FSL, LNT, LNnT, LNFP I, LNFP II, LNFP III, LNFP IV, LNFP V, pLNnH, pLNH2, в качестве ОГМ продукта или побочного продукта. В одном предпочтительном воплощении продукт представляет собой 3-FL, а побочный продукт представляет собой DFL. В другом предпочтительном воплощении продукт представляет собой 2'FL, a побочный продукт представляет собой DFL. В другом предпочтительном воплощении продукт представляет собой LNT-2, а побочный продукт представляет собой LNT и LNFP I.In various preferred embodiments, different host cells producing one/both 2'-FL, 3-FL, 3'-SL, 6'-SL, LNT-2, DFL, FSL, LNT, LNnT, DFL, FSL can be selected , LNT, LNnT, LNFP I, LNFP II, LNFP III, LNFP IV, LNFP V, pLNnH, pLNH2, as an OGM product or by-product. In one preferred embodiment, the product is 3-FL and the by-product is DFL. In another preferred embodiment, the product is 2'FL and the by-product is DFL. In another preferred embodiment, the product is LNT-2 and the by-product is LNT and LNFP I.

Изобретение также относится к применению генетически модифицированной клетки или конструкции нуклеиновой кислоты согласно изобретению для продукции одного или нескольких олигосахаридов, предпочтительно, одного или нескольких олигосахаридов грудного молока. В одном воплощении генетически модифицированную клетку или конструкцию нуклеиновой кислоты по изобретению применяют для получения конкретного ОГМ, выбранного из группы, состоящей из 2'-FL, 3-FL, DLF, LNT, LNT-II, LNnT, LNFP-1, pLNnH and pLNH-II. В предпочтительном воплощении генетически модифицированная клетка или конструкция нуклеиновой кислоты по изобретению используется для получения конкретной ОГМ, выбранной из группы, состоящей из 2'-FL, 3-FL, DLF, LNT, LNT-II, LNnT, pLNnH и pLNH-II.The invention also relates to the use of a genetically modified cell or nucleic acid construct according to the invention for the production of one or more oligosaccharides, preferably one or more human milk oligosaccharides. In one embodiment, a genetically modified cell or nucleic acid construct of the invention is used to produce a specific HGM selected from the group consisting of 2'-FL, 3-FL, DLF, LNT, LNT-II, LNnT, LNFP-1, pLNnH and pLNH -II. In a preferred embodiment, a genetically modified cell or nucleic acid construct of the invention is used to produce a specific HGM selected from the group consisting of 2'-FL, 3-FL, DLF, LNT, LNT-II, LNnT, pLNnH and pLNH-II.

В особенно предпочтительном воплощении генетически модифицированную клетку или конструкцию нуклеиновой кислоты по изобретению применяют для получения конкретного ОГМ, выбранного из группы, состоящей из 2'-FL, 3-FL, LNT, LNT-II, LNnT и pLNH-II.In a particularly preferred embodiment, a genetically modified cell or nucleic acid construct of the invention is used to produce a specific HGM selected from the group consisting of 2'-FL, 3-FL, LNT, LNT-II, LNnT and pLNH-II.

Изобретение дополнительно проиллюстрировано приведенными ниже неограничивающими примерами и воплощениями.The invention is further illustrated by the following non-limiting examples and embodiments.

ПримерыExamples

Материалы и методы.Materials and methods.

Если не указано иное, для манипулирования с нуклеиновыми кислотами, трансформации и экспрессии нуклеиновых кислот применяют стандартные методики, векторы, элементы контрольной последовательности и другие элементы системы экспрессии, известные в области молекулярной биологии. Такие стандартные техники, векторы и элементы можно найти, например, в руководствах: Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley & Sons); Sambrook, Fritsch, & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.), DNA Insertion Elements, Plasmids and Episomes (1977) (Cold Spring Harbor Laboratory Press, NY); Miller, J.H. Experiments in molecular genetics (1972.) (Cold spring Harbor Laboratory Press, NY)Unless otherwise noted, standard techniques, vectors, control sequence elements, and other expression system elements known in the art of molecular biology are used for nucleic acid manipulation, transformation, and expression of nucleic acids. Such standard techniques, vectors and elements can be found, for example, in the manuals: Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley &Sons); Sambrook, Fritsch, & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.), DNA Insertion Elements, Plasmids and Episomes (1977) (Cold Spring Harbor Laboratory Press, NY); Miller, J.H. Experiments in molecular genetics (1972.) (Cold spring Harbor Laboratory Press, NY)

Штаммы.Strains.

Применяемый бактериальный штамм, MDO, был сконструирован из Escherichia coli K12 DH1. Генотип Е. coli K12 DH1 представлял собой: F-, Т-, gyrA96, recA1, relA1, endA1, thi-1, hsdR17, supE44. Штаммы, примененные в настоящих примерах, описаны в табл. 2.The bacterial strain used, MDO, was constructed from Escherichia coli K12 DH1. The genotype of E. coli K12 DH1 was: F - , T -, gyrA96, recA1, relA1, endA1, thi-1, hsdR17, supE44. The strains used in these examples are described in table. 2.

Таблица 2table 2

DH1 DH1 - - 7 eridAlrecADedAlnyrA9(}lhi-la/iV'44hsdRl7(i'K me ) 7 eridAlrecADedAlnyrA9(}lhi-la/iV'44hsdRl7(i'K me ) MDO MDO - - E co!i DHI AlacZ. AlacA. AnanKE'JA, AnteLA, AwcaJ. AmdaH E co!i DHI AlacZ. AlacA. AnanKE'JA, AnteLA, AwcaJ. AmdaH МРА1 MPA1 2‘-PL 2‘-PL MDO CA -futC MDO CA -futC МРА2 MPA2 MDO CA futC nec MDO CA futC nec МРАЗ MRAZ 3-FL 3-FL MDO CA futA MDO CA futA МРА4 MPA4 MDO CA futA nec MDO CA futA nec МР4002 MP4002 LNT2 LNT2 MDO IgtA IgtA MDO IgtA IgtA МР4039 MP4039 MDO IgtA nec MDO IgtA nec МР4473 MP4473 LNT LNT MDO l^tA χιιΙΐΚ MDO l^tA χιιΙΐΚ МР4537 MP4537 MDO -IgtA galTK пел: MDO -IgtA galTK sang: МР2789 MP2789 MDO IgtA galTK futC CA MDO IgtA galTK futC CA LNFP-I LNFP-I МР4597 MP4597 MDO χίΑ χιιίΤΚfutC nec MDO χίΑ χιιίΤΚfutC nec

Среда.Wednesday.

Среду для бульона Луриа (LB) готовили с применением порошка бульона LB, Millers (Fisher Scientific), а чашки с агаром LB готовили с применением порошка агара LB, Millers (Fisher Scientific). При необходимости добавляли ампициллин ((100 мкг/мл) или любой подходящий антибиотик) и/или хлорамфеникол (20 мкг/мл).Luria broth (LB) medium was prepared using LB broth powder, Millers (Fisher Scientific), and LB agar plates were prepared using LB agar powder, Millers (Fisher Scientific). If necessary, ampicillin ((100 μg/ml) or any appropriate antibiotic) and/or chloramphenicol (20 μg/ml) was added.

Базовая минимальная среда имела следующий состав: NaOH (1 г/л), KOH (2,5 г/л), KH2PO4 (7 г/л), NH4H2PO4 (7 г/л), лимонная кислота (0,5 г/л), раствор микроэлементов (5 мл/л). Исходный раствор микроэлементов содержал: ZnSO4-7H2O 0,82 г/л, лимонную кислоту 20 г/л, MnSO4-H2O 0,98 г/л, FeSO4-7H2O 3,925 г/л, CuSO4-5H2O 0,2 г/л. рН базовой минимальной среды доводили до 7,0 с помощью 5 н NaOH и автоклавировали. Перед инокуляцией в базовую минимальную среду добавляли 1 мМ MgSO4, 4 мкг/мл тиамина, 0,5% заданного источника углерода (глицерин (Carbosynth)) и при необходимости добавлялиThe basic minimal medium had the following composition: NaOH (1 g/l), KOH (2.5 g/l), KH 2 PO 4 (7 g/l), NH 4 H 2 PO 4 (7 g/l), lemon acid (0.5 g/l), solution of trace elements (5 ml/l). The initial solution of trace elements contained: ZnSO 4 -7H 2 O 0.82 g/l, citric acid 20 g/l, MnSO 4 -H 2 O 0.98 g/l, FeSO 4 -7H 2 O 3.925 g/l, CuSO 4 -5H 2 O 0.2 g/l. The pH of the basic minimal medium was adjusted to 7.0 with 5 N NaOH and autoclaved. Before inoculation, basal minimal medium was supplemented with 1 mM MgSO 4 , 4 μg/ml thiamine, 0.5% of the given carbon source (glycerol (Carbosynth)) and, if necessary,

- 15 046248 изопропил-в-Э-тиогалактозид (IPTG) (0,2 мМ). Тиамин, антибиотики и IPTG стерилизовали фильтрованием. Все процентные концентрации для глицерина выражены как объем/объем, а для глюкозы - масса/объем.- 15 046248 isopropyl-v-E-thiogalactoside (IPTG) (0.2 mM). Thiamine, antibiotics and IPTG were sterilized by filtration. All percentage concentrations for glycerol are expressed as v/v and for glucose as w/v.

Чашки М9, содержащие 2-дезоксигалактозу, имели следующий состав: 15 г/л агара (Fisher Scientific), 2,26 г/л 5х М9 Minimal Salt (Sigma-Aldrich), 2 мМ MgSO4, 4 мкг/мл тиамина, 0,2% глицерина и 0,2% 2-дезокси-О-галактозы (Carbosynth).M9 plates containing 2-deoxygalactose had the following composition: 15 g/L agar (Fisher Scientific), 2.26 g/L 5x M9 Minimal Salt (Sigma-Aldrich), 2 mM MgSO 4 , 4 μg/mL thiamine, 0 .2% glycerol and 0.2% 2-deoxy-O-galactose (Carbosynth).

Индикаторные планшеты МакКонки имели следующий состав: 40 г/л агаровая основа МакКонки (BD Difco™) и источник углерода в конечной концентрации 1%.MacConkey indicator plates had the following composition: 40 g/L MacConkey agar base (BD Difco™) and a carbon source at a final concentration of 1%.

Культивирование.Cultivation.

Если не указано иное, то штаммы Е. coli размножали в среде Луриа-Бертани (LB), содержащей 0,2% глюкозы, при 37°С при перемешивании. Чашки с агаром инкубировали при 37°С в течение ночи.Unless otherwise stated, E. coli strains were propagated in Luria-Bertani (LB) medium containing 0.2% glucose at 37°C with agitation. Agar plates were incubated at 37°C overnight.

Химически компетентные клетки и трансформации.Chemically competent cells and transformations.

Е. coli инокулировали из чашек LB в 5 мл LB, содержащего 0,2% глюкозы, при 37°С при встряхивании до OD600 ~0,4. 2 мл культуры собирали центрифугированием в течение 25 секунд при 13000 g. Супернатант удаляли, а клеточный осадок ресуспендировали в 600 мкл холодных растворов ТВ (10 мМ PIPES, 15 мМ CaCl2, 250 мМ KCl). Клетки инкубировали на льду в течение 20 минут с последующим осаждением в течение 15 секунд при 13000 g. Супернатант удаляли, а клеточный осадок ресуспендировали в 100 мкл холодного раствора ТВ. Трансформацию плазмид проводили с применением 100 мкл компетентных клеток и 1-10 нг плазмидной ДНК. Клетки и ДНК инкубировали на льду в течение 20 минут, а затем подвергали тепловому шоку при 42°С в течение 45 секунд. После 2-минутной инкубации на льду добавляли 400 мкл SOC (20 г/л триптона, 5 г/л дрожжевого экстракта, 0,5 г/л NaCl, 0,186 г/л KCl, 10 мМ MgCl2, 10 мМ MgSO4 и 20 мМ глюкозы) и культуру клеток инкубировали при 37°С при встряхивании в течение 1-го часа перед посевом на селективные чашки.E. coli was inoculated from LB plates into 5 ml LB containing 0.2% glucose at 37°C with shaking to OD 600 ~0.4. 2 ml of culture were collected by centrifugation for 25 seconds at 13,000 g. The supernatant was removed, and the cell pellet was resuspended in 600 μl of cold TB solutions (10 mM PIPES, 15 mM CaCl 2 , 250 mM KCl). Cells were incubated on ice for 20 minutes followed by pelleting for 15 seconds at 13,000 g. The supernatant was removed, and the cell pellet was resuspended in 100 μl of cold TB solution. Plasmid transformation was carried out using 100 μl of competent cells and 1-10 ng of plasmid DNA. Cells and DNA were incubated on ice for 20 minutes and then heat shocked at 42°C for 45 seconds. After a 2-minute incubation on ice, 400 μl of SOC (20 g/l tryptone, 5 g/l yeast extract, 0.5 g/l NaCl, 0.186 g/l KCl, 10 mM MgCl 2 , 10 mM MgSO 4 and 20 mM glucose) and the cell culture was incubated at 37°C with shaking for 1 hour before plating onto selective dishes.

Плазмиду трансформировали в химически компетентные клетки ТОР10 в условиях, рекомендованных поставщиком (ThermoFisher Scientific).The plasmid was transformed into chemically competent TOP10 cells under conditions recommended by the supplier (ThermoFisher Scientific).

ДНК-технологии.DNA technology.

Плазмидную ДНК из Е. coli выделяли с применением набора QIAprep Spin Miniprep (Qiagen). Хромосомную ДНК из Е. coli выделяли с применением набора QIAmp DNA Mini Kit (Qiagen). Продукты ПЦР очищали с применением набора QIAquick PCR Purification Kit (Qiagen). Мастер-микс для ПЦР DreamTaq (Thermofisher), мастер-микс для ПЦР с горячим стартом Phusion U (Thermofisher), USER Enzyme (New England Biolab) применяли в соответствии с рекомендациями поставщика. Праймеры были поставлены компанией Eurofins Genomics, Германия. Фрагменты ПЦР и плазмиды были секвенированы компанией Eurofins Genomics. ПЦР колоний проводили с применением DreamTaq PCR Master Mix в термоциклере Т100ТМ (Bio-Rad).Plasmid DNA from E. coli was isolated using the QIAprep Spin Miniprep kit (Qiagen). Chromosomal DNA from E. coli was isolated using the QIAmp DNA Mini Kit (Qiagen). PCR products were purified using the QIAquick PCR Purification Kit (Qiagen). DreamTaq PCR Master Mix (Thermofisher), Phusion U Hot Start PCR Master Mix (Thermofisher), USER Enzyme (New England Biolab) were used according to the supplier's recommendations. Primers were supplied by Eurofins Genomics, Germany. PCR fragments and plasmids were sequenced by Eurofins Genomics. Colony PCR was performed using DreamTaq PCR Master Mix in a T100TM thermal cycler (Bio-Rad).

Таблица 3 Олигонуклеотиды, применяемые для амплификации остова плазмиды, промоторных элементов и necTable 3 Oligonucleotides used for amplification of the plasmid backbone, promoter elements and nec

040 040 5 5 АТТА АС ОС U ОС AGGCATCAAATAAAACGAAA GGC ATTA AC OS U OS AGGCATCAAATAAAACGAAA GGC Остов, прямой Frame, straight 068 068 6 6 ATGCGCAAAUTGTGAGTTAGCTCACTCATTAG ATGCGCAAAUTGTGAGTTAGCTCACTCATTAG Р1ас.прямой P1ac.straight 079 079 7 7 A TTTGCG С A UC АСС А А ТС А АА ТТ СА CGCGG СС A TTTGCG C A UC ACC A A TS A AA TT CA CGCGG CC Остов, обратный Backbone, reverse 0113 0113 8 8 A GC Т GTT UC СТС СТТ A GGT АС СС AG CTTTTGTTCC С A GC T GTT UC CTC CTT A GGT AC CC AG CTTTTGTTCC C Р1ас.обратный P1ac.reverse 0261 0261 9 9 ATGC GCAAAUGCGGCACGCCTTGC AGATTACG ATGC GCAAAUGCGGCACGCCTTGC AGATTACG PglpF.прямой PglpF.direct 0262 0262 10 10 A GC Т GTT UC СТС CTTG GTT A A TG TTTG Т TG Т ATGC G A GC T GTT UC CTC CTTG GTT A A TG TTTG T TG T ATGC G PdpF.обратный PdpF.reverse 0741 0741 1 1 eleven AAACAGCUATGCAGAGCTTCACCCCGCC AAACAGCUATGCAGAGCTTCACCCCGCC пес.прямой dog.direct 0742 0742 12 12 AGGGTTAAUTTACGCCTGCTCTTTAACACGCAGC AGGGTTAAUTTACGCCTGCTCTTTAACACGCAGC пес.обратны dog.reverse 048 048 13 13 С СС A GCGA GA С CTG AC CG С AG АА С C CC A GCGA GA C CTG AC CG C AG AA C gillK. прямой gillK. straight 049 049 14 14 С СС С AGT СС АТС AGС GTGАС Т А С С C СС C AGT СС ATS AGC GTGAС Т А С С щйК.обратный schjK.reverse

- 16 046248- 16 046248

Таблица 4Table 4

Г етерологичные белки, эекспрессируемые в ОГМ-продуцирующих клеткахHeterologous proteins expressed in OGM-producing cells

futC futC Helicobacter pylori 26695 Helicobacter pylori 26695 EF452503 EF452503 алпфа-i .З-фукопптране^храш alpfa-i .Z-fukoptrane^hrash IgtA IgtA .Veiss ei io in en ii i^itidis 6534-12 ' .Veiss ei io in en ii i^itidis 6534-12' CPOOO381 CPOOO381 oemu-l Д-.V- apem i n. пока ήι. itnttn. t шраме ферм ча oemu-l D-.V- apem i n. bye ήι. itnttn. t scar farms cha ^ίΤ ^ίΤ Helicobacter prion 26695 Helicobacter prion 26695 AE000511 AE000511 iiemct-l ,4-.’алакп1о--ш.1трансферача iiemct-l ,4-.’alakp1o--sh.1transferacha galTK galTK Helicobacter pylon 43504 Helicobacter pylon 43504 гомологичен BD1S2O26 homologous BD1S2O26 пета-1.3-.’алакто-щлшранефера'ш peta-1.3-.'alakto-schlshranefera'sh Rosen beryicllа л ectarea Rosen beryiclla l ectarea WP 092672081.1 WP 092672081.1 М F S-тра нс [ 1 ордер M F S-tra ns [ 1 order

Таблица 5Table 5

Элементы синтетической ДНК, примененные для экспрессии necSynthetic DNA elements used for nec expression

PtfpFPtfpF

GCGGCACGCCTTGC.AGATTACGGTTTGCCA САСТТТТС ATCCTTCTCCTGGTGAC АТААТС С АС АТ С АА TCG А АА ATGTT А АТ.АА ATTTGT TGC G CGAA TGA ТСТАА САААС ATGCAТСАТ GTACAATCAGATGGAATAAATGGCGCGATA A CGCTC АТТТТ ATGA С GA GG СА С АС АС АТТ TTAAGTTCGATATTTCTCGTTTTTGCTCGTT AACGATAAGTTTACAGCATGCCTACAAGCA TCGTGG AGGTCC GTGA С ТТТС AC GC АТАСА А С AAA С АТТ АА СС A AG GAGG АА AC A GC ТGCGGCACGCCTTGC.AGATTACGGTTTGCCA SASTTTTS ATCCTTCCTGGTGAC ATAATS C AC AT C AA TCG A AA ATGTT A AT.AA ATTTGT TGC G CGAA TGA TCTAA CAAAC ATGCATSAT GTACAATCAGATGGAATAAATGGCGCGATA A CGCTC ATTTT ATGA C GA GG CA C AC AC ATT TTAAGTTCGATATTTCTCGTTTTTGCTCGTT AACGATAAGTTTACAGCATGCCTACAAGCA TCGTGG AGGTCC GTGA WITH TTTC AC GC ATACA A C AAA C ATT AA CC A AG GAGG AA AC A GC T

Элемент экспрессии ДНК из 300DNA expression element of 300

HYK) ICO гидовHYK) ICO guides

ATGCGCAAATTGTGAGTTAGCTCАСТСАТТ A GG СА С СС С AG GC Т ТТА С А CTTTATG СТТС С GGCTCGTATGTTGTGTGGAATTGTGAGCGG А ТА АС А АТТТ СА СА С AG GAAA CAG СТA TG А CCATGATTACGCCA AGC GCGCA АТТААССС ТС АС ТА A AG GG А АСА А АА GC TGG GT А СС ТА AGGAGGAAACAGCTATGCGCAAATTGTGAGTTAGCTCACTCATT A GG CA C CC C AG GC T TTA C A CTTTATG STTS C GGCTCGTATGTTGTGTGGAATTGTGAGCGG A TA AC A ATTT SA SA C AG GAAA CAG CTA TG A CCATGATTACGCCA AGC GCGCA ATTAASS TS AC TA A AG GG A ASA A AA GC TGG GT A SS TA AGGAGGAAACAGCT

A TG С AG AGCTT С АССС CGC С GG CG С CG A A G GGTGGC AACCCGGTGTTCATGATGTTTATG CTGGTGACCTTCTTTGTGAGCATTGCGGGTG CGCTGCAGGCGCCGACCCTGAGCCTGTACC TGAGCCAAGAGCTGGC GGCGAAACCGTTC А TGG TGGGC C TG TTC TTTA С С A T TA AC G CG GT ТАС CGGT АТС ATT АТС AG CTTT ATCC TGGCG A AG CG TAGCGAC CGT AAAGG T GA CC GTC GT C GTC TG C TG ATG T TC TGC TGC GC GATGGCG A TC G CG A A C GC GC TG AT GTTCG CG TT TG TTC G TC A GTACG TG GTTC TG ATTA CC CTG GG C CT G АТС CTG AG CG CG C TG A CC AG C GTGG TT AT G CC GCA AC TGTTCG C GCT GG CG CGTGAGTA TGC G GA CC G T A CCG GTC GTG AA GTGG TT AT G TTTAG CAGCG TGAT GCGTA CC C AA ATGAG CCTGGC GTGGGTTATTGGCC CGCCG АТС AGA TG C AG AGCTT C ACCC CGC C GG CG C CG A A G GGTGGC AACCCGGTGTTCATGATGTTTATG CTGGTGACCTTCTTTGTGAGCATTGCGGGTG CGCTGCAGGCGCCGACCCTGAGCCTGTACC TGAGCCAAGAGCTGGC GGCGAAACCGTTC A TGG TGGGC C TG TTC TTTA C C A T TA AC G CG GT TAC CGGT ATC A TT ATC AG CTTT ATCC TGGCG A AG CG TAGCGAC CGT AAAGG T GA CC GTC GT C GTC TG C TG ATG T TC TGC TGC GC GATGGCG A TC G CG A A C GC GC TG AT GTTCG CG TT TG TTC G TC A GTACG TG GTTC TG ATTA CC CTG GG C CT G ATC CTG AG CG CG C TG A CC AG C GTGG TT AT G CC GCA AC TGTTCG C GCT GG CG CGTGAGTA TGC G GA CC G T A CCG GTC GTG AA GTGG TT AT G TTTAG CAGCG TGAT GCGTA CC C AA ATGAG CCTGGC GTGGGTTATTGGCC CGCCG ATC AG

Элемент экспрессии ДНК из 195 нуклеотидов195 nucleotide DNA expression element

ДНК.DNA.

кодирующая предполагаемый транспортер MFSencoding a putative MFS transporter

WP_092672081.1 (Nec)WP_092672081.1 (Nec)

- 17 046248- 17 046248

CTTCGCGCTGGC GCTGAACT.ACGGTTTTATT АССС TGT.ATCTGGTGGCTGCGGC 'GC TGTTTC TGCTGA GC С TG АТТС TG А ТС А AG АС С А ССС TGCCGAGCGTTCCGCGTCTGT.ATCCGGCGG A AGAC CTGGCGAAGAGC GCG GC GA G CGGT TGGAAACGTACCGATGTGC GTTTCCTGTTTG CGGCGAGCGTGCTGATGTGGGTTTGCAACC TGA TGTA СА ТТА TCG ATA TG С CGCTGTА Т АТ С AGCAAAAGCC TGGGT.ATGCCGGAGAGC ТТ CGC G GG TG ТТС TG ATGG GC AC CGC G GCGG G TC TG GA ААТТС CGGTGA TG C TG C TG GC GGG CTACCTGGCGAAGCGTGTTGGTAAACGTCC G CTG GTG ATTG TTGC GGCG G TG TGC GG C CT G GC GTTC TA TCCGG C GA TG C TG G TTTT TC AC CAGCAAACCGGTCTGCTGATTATCCAGC TG CT GA AC GCG GTGTTC ATT GG CA TCG T GGCG G GTC TG GTTATG CTG TGG TTTC AA G ACC TG ATGCCGGGTAAAGCGGGTGCGGCGACCAC CCTGTTC ACC.AACAGCGTTAGC ACC GGC AT G.ATC TTTGCGGGCCTGTGCCAGGGTCTGCT G AGCG АТС TGC TGG GTC ACCA A GCGAT TT A CGTG CTG GC GA CCGTGC TGATGGTTATC GC G CTG CTG CTGC TGC TGC G TG TTA A A G AGCA GGCGTAA CTTCGCGCTGGC GCTGAACT.ACGGTTTTATT ACC TGT.ATCTGGTGGCTGCGGC 'GC TGTTTC TGCTGA GC C TG ATTC TG A TC A AG ACC A CCC TGCCGAGCGTTCCGCGTCTGT.ATCCGGCGG A AGAC CTGGCGAAGAGC GCG GC GA G CGGT TGGAAACGTACCGATGTGC GTTTCCTGTTTG CGGCGAG CGTGCTGATGTGGGTTTGCAACC TGA TGTA CA TTA TCG ATA TG C CGCTGTA T AT C AGCAAAAGCC TGGGT.ATGCCGGAGAGC TT CGC G GG TG TTC TG ATGG GC AC CGC G GCGG G TC TG GA AATTC CGGTGA TG C TG C TG GC GGG CTACCTGGCGAAGCGTGTTGGTAAACGTCC G CTG GTG ATTG TTGC GGCG G TG TGC GG C CT G GC GTTC TA TCCGG C GA TG C TG G TTTT TC AC CAGCAAACCGGTCTGCTGATTATCCAGC TG CT GA AC GCG GTGTTC ATT GG CA TCG T GGCG G GTC TG GTTATG CTG TGG TTTC AA G ACC TG ATGCCGGGTAAAGCGGGTGCGGCGACCAC CCTGTTC ACC.AACAGCGTTAGC ACC GGC AT G.ATC TTTGCGGGCCTGTGCCAGGGTCTGCT G AGCG PBX TGC TGG GTC ACCA A GCGAT TT A CGTG CTG GC GA CCGTGC TGATGGTTATC GC G CTG CTG CTGC TGC TGC G TG TTA A A G AGCA GGCGTAA

Конструирование плазмид.Construction of plasmids.

Были синтезированы плазмидные скелеты, содержащие два эндонуклеазных сайта I-SceI, разделенных двумя фрагментами ДНК, приспособленными для гомологичной рекомбинации в геном Е. coli, и последовательностью терминатора транскрипции Т1. Например, в одной плазмидной основе был синтезирован оперон gal (необходимый для гомологичной рекомбинации в galK) и последовательность терминатора транскрипции Т1 (pUC57::gal) (GeneScript). Последовательности ДНК, примененные для гомологичной рекомбинации в гал-опероне, охватывают пары оснований 3.628.621-3.628.720 и 3.627.5723.627.671 в последовательности Escherichia coli K-12 MG155, полный геном GenBank: ID: CP014225.1. Вставка путем гомологичной рекомбинации привела бы к делеции 949 пар оснований galK и фенотипа galK-. Подобным образом могут быть синтезированы скелеты на основе pUC57 (GeneScript) или любого другого подходящего вектора, содержащего два сайта эндонуклеазы I-Scel, разделенных двумя фрагментами ДНК, приспособленными для гомологичной рекомбинации в геном Е. coli, и последовательностью терминатора транскрипции Т1. Для конструирования праймеров и амплификации специфических последовательностей ДНК хромосомной ДНК Escherichia coli K-12 DH1 применяли стандартные методики, хорошо известные в области молекулярной биологии. Такие стандартные приемы, векторы и элементы можно найти, например, в руководствах: Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley & Sons); Sambrook, Fritsch, & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.).Plasmid backbones were synthesized containing two I-SceI endonuclease sites separated by two DNA fragments adapted for homologous recombination into the E. coli genome and a T1 transcription terminator sequence. For example, the gal operon (required for homologous recombination in galK) and the T1 transcription terminator sequence (pUC57::gal) were synthesized in one plasmid backbone (GeneScript). The DNA sequences used for homologous recombination in the gal operon span base pairs 3.628.621-3.628.720 and 3.627.5723.627.671 in the Escherichia coli K-12 MG155 sequence, GenBank complete genome: ID: CP014225.1. Insertion by homologous recombination would result in a 949 bp deletion of galK and a galK- phenotype. In a similar manner, scaffolds can be synthesized from pUC57 (GeneScript) or any other suitable vector containing two I-Scel endonuclease sites separated by two DNA fragments adapted for homologous recombination into the E. coli genome and a T1 transcription terminator sequence. Standard techniques well known in the field of molecular biology were used to design primers and amplify specific DNA sequences from Escherichia coli K-12 DH1 chromosomal DNA. Such standard techniques, vectors and elements can be found, for example, in the manuals: Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley &Sons); Sambrook, Fritsch, & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.).

Хромосомную ДНК, полученную из Е. coli DH1, применяли для амплификации фрагмента ДНК размером 300 п.н., содержащего промотор PglpF, с применением олигонуклеотидов O261 и O262, и фрагмента ДНК длиной 195 п.н., содержащего Plac, с применением олигонуклеотидов O68 и O113 (табл. 3).Chromosomal DNA obtained from E. coli DH1 was used to amplify a 300 bp DNA fragment containing the PglpF promoter using oligonucleotides O261 and O262, and a 195 bp DNA fragment containing Plac using O68 oligonucleotides and O113 (Table 3).

Фрагмент ДНК длиной 1.185 п.н., содержащий кодон-оптимизированную версию гена nec, происходящего из Rosenbergiella nectarea синтезировали с помощью GeneScript (табл. 5). Ген nec амплифицировали методом ПЦР с применением олигонуклеотидов O741 и O742.A 1,185 bp DNA fragment containing a codon-optimized version of the nec gene derived from Rosenbergiella nectarea was synthesized using GeneScript (Table 5). The nec gene was amplified by PCR using oligonucleotides O741 and O742.

Все ПЦР-фрагменты (основы плазмиды, элементы, содержащие промотор, и ген nec) очищали и собирали основы плазмиды, элементы промотора (PglpF или Plac) и фрагмент ДНК, содержащий nec. Плазмиды клонировали с помощью стандартного клонирования USER. Клонирование в любой подходящей плазмиде может быть осуществлено с помощью любых стандартных способов клонирования ДНК. Плазмиды трансформировали в клетки ТОР10 и отбирали на чашках LB, содержащих 100 мкг/мл ампициллина (или любого подходящего антибиотика) и 0,2% глюкозы. Сконструированные плазмиды очищали, а последовательность промотора и 5'-конец гена nec подтверждали секвенированием ДНК (MWG Eurofins Genomics). Таким образом конструировали генетическую кассету, содержавшую любой представляющий интерес промотор, связанный с геном nec.All PCR fragments (plasmid backbones, promoter-containing elements, and nec gene) were purified and the plasmid backbones, promoter elements (PglpF or Plac), and DNA fragment containing nec were assembled. Plasmids were cloned using USER standard cloning. Cloning into any suitable plasmid can be accomplished using any standard DNA cloning techniques. Plasmids were transformed into TOP10 cells and selected on LB plates containing 100 μg/ml ampicillin (or any suitable antibiotic) and 0.2% glucose. The constructed plasmids were purified, and the promoter sequence and the 5′ end of the nec gene were confirmed by DNA sequencing (MWG Eurofins Genomics). In this way, a genetic cassette was constructed containing any promoter of interest associated with the nec gene.

- 18 046248- 18 046248

Таблица 6Table 6

Примеры хелперных и донорных плазмид, применяемых для конструирования штаммовExamples of helper and donor plasmids used to construct strains

pACBSR pACBSR Para-i-Rcel-/. Red, pl5.4 on. aunr Para-i-Rcel-/. Red, pl5.4 on. aun r cam cam pUC57 pUC57 pMB!. Mu pMB!. Mu Bia Bia pUC57: pUC57: pl‘C5 7::%alTK' / ΤΙ-χαΙΚΜ' pl‘C5 7::%alTK' / ΤΙ-χαΙΚΜ' Bia Bia

Конструирование штаммов.Strain construction.

Применяемый бактериальный штамм, MDO, был сконструирован из Escherichia coli K-12 DHL Генотип Е. coli K-12 DH1 представляет собой: F-, Ϊ-, gyrA96, recA1, relA1, endA1, thi-1, hsdR17, supE44. В дополнение к генотипу Е. coli K-12 DH1 MDO имеет следующие модификации: lacZ: делеция, размером 1,5 т.п.н., lacA: делеция, размером 0,5 т.п.н., nanKETA: делеция, размером 3,3 т.п.н., melA: делеция, размером 0,9 т.п.н., wcaJ: делеция, размером 0,5 т.п.н., mdoH: делеция, размером 0,5 т.п.н., и вставка промотора Plac выше гена gmd.The bacterial strain used, MDO, was constructed from Escherichia coli K-12 DHL The genotype of E. coli K-12 DH1 is: F - , Ϊ -, gyrA96, recA1, relA1, endA1, thi-1, hsdR17, supE44. In addition to the E. coli K-12 genotype, DH1 MDO has the following modifications: lacZ: 1.5 kb deletion, lacA: 0.5 kb deletion, nanKETA: deletion, 3.3 kb, melA: 0.9 kb deletion, wcaJ: 0.5 kb deletion, mdoH: 0.5 k deletion .bp, and insertion of the Plac promoter upstream of the gmd gene.

Вставку кассеты экспрессии, содержавшей промотор, связанный с геном nec и последовательностью терминатора транскрипции Т1, осуществляли с помощью Gene Gorging, по существу, как описано Herring et al. (Herring, C.D., Glasner, J.D. and Blattner, F.R. (2003). 311). 153-163). Вкратце, донорную плазмиду и хелперную плазмиду ко-трансформировали в MDO и отбирали на чашках с LB, содержавших 0,2% глюкозы, ампициллин (100 мкг/мл) или канамицин (50 мг/мл) и хлорамфеникол (20 мкг/мл). Одиночную колонию инокулировали в 1 мл LB, содержащего хлорамфеникол (20 мкг/мл) и 10 мкл 20% Lарабинозы, и инкубировали при 37°С при встряхивании в течение 7-8 ч. Для интеграции в локусы galK клеток Е. coli затем высевали на чашки M9-DOG и инкубировали при 37°С в течение 48 ч. Отдельные колонии, сформированные на чашках MM-DOG, повторно высевали штрихом на чашки с LB, содержавшие 0,2% глюкозы, и инкубировали в течение 24 ч при 37°С. Ожидалось, что колонии, которые выглядили белыми на чашках с агаром MacConkey-галактоза и были чувствительны как к ампициллину, так и к хлорамфениколу, потеряли донорную и вспомогательную плазмиду и содержали вставку в локусах galK. Вставки в сайт galK идентифицировали с помощью ПЦР колоний с применением праймеров 048 (SEQ ID NO: 13) и 049 (SEQ ID NO: 14), а вставленную ДНК проверяли секвенированием (Eurofins Genomics, Германия).Insertion of an expression cassette containing a promoter linked to the nec gene and a T1 transcription terminator sequence was accomplished using Gene Gorging essentially as described by Herring et al. (Herring, C.D., Glasner, J.D. and Blattner, F.R. (2003). 311). 153-163). Briefly, donor plasmid and helper plasmid were co-transformed into MDO and selected on LB plates containing 0.2% glucose, ampicillin (100 μg/ml) or kanamycin (50 mg/ml), and chloramphenicol (20 μg/ml). A single colony was inoculated in 1 ml of LB containing chloramphenicol (20 μg/ml) and 10 μl of 20% L-arabinose and incubated at 37°C with shaking for 7-8 hours. To integrate into the galK loci of cells, E. coli was then plated on M9-DOG plates and incubated at 37°C for 48 hours. Individual colonies formed on MM-DOG plates were streaked again onto LB plates containing 0.2% glucose and incubated for 24 hours at 37°C . The colonies, which appeared white on MacConkey-galactose agar plates and were sensitive to both ampicillin and chloramphenicol, were expected to have lost the donor and helper plasmid and contained an insertion at the galK loci. Insertions into the galK site were identified by colony PCR using primers 048 (SEQ ID NO: 13) and 049 (SEQ ID NO: 14), and the inserted DNA was verified by sequencing (Eurofins Genomics, Germany).

Встраивание генетических кассет в другие локусы хромосомной ДНК Е. coli осуществляли аналогичным образом с применением различных маркерных генов селекции.The integration of genetic cassettes into other loci of E. coli chromosomal DNA was carried out in a similar way using various selection marker genes.

Анализ в глубоких лунках.Analysis in deep wells.

Одиночную колонию из LB-чашки предварительно культивировали в 1 мл базовой минимальной среды, содержащей 5 г/л глюкозы, 1 М MgSO4 и 4 мг/л тиамина, в 10 мл 24-луночном планшете с глубокими лунками (Axygen). Перед культивированием планшет запечатывали гидрофобной газопроницаемой самоклеющейся пленкой (Axygen) и инкубировали в течение 24 ч при 34°С при встряхивании при 700 об/мин на орбитальном шейкере (Edmund Buhler GmbH). Плотность клеток культуры контролировали при 600 нм на спектрофотометре S-20 (Воесо, Германия). 40 мкл ночной культуры применяли для инокуляции в 2 мл базовой минимальной среды, содержавшей 0,1 г/л глюкозы, 5 г/л лактозы, 20 г/л сахарозы, 1 М MgSO4, 4 мг/л тиамина и 0,25 мг/л SUH (Sigma). При необходимости добавляли IPTG. Планшеты с глубокими лунками запечатывали самоклеющейся пленкой и инкубировали в течение 48 или 72 ч при 28°С с орбитальным встряхиванием при 700 об/мин. После инкубации измеряли OD600, планшет накрывали герметизирующей лентой для нагревания (Saveen Werner) и инкубировали в термомиксере в течение 1 ч при 100°С при встряхивании при 400 об/мин.A single colony from an LB plate was precultured in 1 ml of basic minimal medium containing 5 g/L glucose, 1 M MgSO 4 and 4 mg/L thiamine in a 10 ml 24-well deep well plate (Axygen). Before cultivation, the plate was sealed with a hydrophobic gas-permeable self-adhesive film (Axygen) and incubated for 24 h at 34°C with shaking at 700 rpm on an orbital shaker (Edmund Buhler GmbH). The cell density of the culture was monitored at 600 nm on an S-20 spectrophotometer (Boeso, Germany). 40 μl of an overnight culture was used for inoculation into 2 ml of basic minimal medium containing 0.1 g/l glucose, 5 g/l lactose, 20 g/l sucrose, 1 M MgSO 4 , 4 mg/l thiamine and 0.25 mg /l SUH (Sigma). IPTG was added if necessary. Deep well plates were sealed with self-adhesive film and incubated for 48 or 72 h at 28°C with orbital shaking at 700 rpm. After incubation, OD600 was measured, the plate was covered with heat sealing tape (Saveen Werner) and incubated in a thermomixer for 1 h at 100°C with shaking at 400 rpm.

Для анализа общих образцов клеточный лизат, приготовленный кипячением, осаждали центрифугированием в течение 10 мин при 4700 об/мин. Концентрацию ОГМ в супернатанте определяли с помощью HPLC или HPAC.For analysis of total samples, cell lysate prepared by boiling was pelleted by centrifugation for 10 min at 4700 rpm. The concentration of OGM in the supernatant was determined using HPLC or HPAC.

После первоначального центрифугирования планшета с глубокими лунками в течение 10 мин при 4700 об/мин образцы надосадочной жидкости сохраняли для аналитических измерений. Для анализа клеточного осадка оставшийся супернатант выбрасывали, а клетки промывали 2 мл холодного PBS. После этой стадии промывки и повторного центрифугирования осадок повторно суспендировали в 500 мл MQ воды и весь планшет с глубокими лунками кипятили в термомиксере в течение 1 ч при встряхивании со скоростью 400 об/мин. Лизат клеток, приготовленный кипячением, осаждали центрифугированием в течение 10 мин при 4700 об/мин. Концентрацию НМО в супернатанте определяли с помощью HPLC или HPAC.After initial centrifugation of the deep well plate for 10 min at 4700 rpm, supernatant samples were saved for analytical measurements. For cell pellet analysis, the remaining supernatant was discarded and the cells were washed with 2 ml of cold PBS. After this washing and re-centrifugation step, the pellet was resuspended in 500 ml MQ water and the entire deep well plate was boiled in a thermomixer for 1 h while shaking at 400 rpm. The cell lysate, prepared by boiling, was pelleted by centrifugation for 10 min at 4700 rpm. The concentration of HMO in the supernatant was determined by HPLC or HPAC.

Результаты.Results.

Пример 1. Конструирование Escherichia coli, экспрессирующих ген nec, для продукции 2'-FL.Example 1: Construction of Escherichia coli expressing the nec gene to produce 2'-FL.

Штаммы Escherichia coli K-12 (DH1) MDO можно изменять для экспрессии представляющих интерес гетерологичных генов. Например, штамм МРА1 представляет собой штамм-продуцент 2'-FL со сверхэкспрессией гена альфа-1,2-фукозилтрансферазы, futC, и генов колановой кислоты (gmd-fcI-gmmwcaI-cpsB-cpsG). Вставка экспрессионной кассеты, содержащей промоторный элемент (PglpF), связанный с геном nec, в хромосомную ДНК МРА2 приводила к: i) относительно более высоким титрам 2'-FLEscherichia coli K-12 (DH1) MDO strains can be modified to express heterologous genes of interest. For example, strain MPA1 is a 2'-FL producing strain with overexpression of the alpha-1,2-fucosyltransferase gene, futC, and colanic acid genes (gmd-fcI-gmmwcaI-cpsB-cpsG). Insertion of an expression cassette containing a promoter element (PglpF) associated with the nec gene into the MPA2 chromosomal DNA resulted in: i) relatively higher titers of 2'-FL

--

Claims (16)

(фиг. 1А), ii) более низкому количеству 2'-FL в фракция клеток и более высокое количество 2'_FL в среде (фиг. 1B), iii) относительно более низкому отношению DFL к 2'-FL (фиг. 1С) и iv) относительно более низкой оптической плотности при измерении плотности клеток при 600 нм (фиг. 1D).(Figure 1A), ii) lower amount of 2'-FL in the cell fraction and higher amount of 2'_FL in the medium (Figure 1B), iii) relatively lower ratio of DFL to 2'-FL (Figure 1C) and iv) relatively lower optical density when measuring cell density at 600 nm (Figure 1D). Пример 2. Конструирование Escherichia coli, экспрессирующих ген nec, для продукции 3-FL.Example 2: Construction of Escherichia coli expressing the nec gene to produce 3-FL. Штаммы Escherichia coli K-12 (DH1) MDO можно изменять для экспрессии представляющих интерес гетерологичных генов. Например, штамм МРА3 представляет собой штамм-продуцент 3-FL со сверхэкспрессией гена альфа-1,3-фукозилтрансферазы, futA и генов колановой кислоты (gmd-fcI-gmmwcaI-cpsB-cpsG). Вставка экспрессионной кассеты, содержащей промоторный элемент (Plac), связанный с геном nec в единственной копии, в основной штамм МРА3 (см. штамм МРА4), привела к i) относительно более высоким количествам 3-FL во фракции среды и ii) относительному снижению количествам 3FL, обнаруживаемым внутри клеток.Escherichia coli K-12 (DH1) MDO strains can be modified to express heterologous genes of interest. For example, strain MPA3 is a 3-FL producing strain with overexpression of the alpha-1,3-fucosyltransferase, futA and colanic acid genes (gmd-fcI-gmmwcaI-cpsB-cpsG). Insertion of an expression cassette containing a promoter element (Plac) linked to the nec gene in a single copy into the main strain MPA3 (see strain MPA4) resulted in i) relatively higher amounts of 3-FL in the medium fraction and ii) relatively lower amounts 3FL found inside cells. Пример 3. Конструирование Escherichia coli, экспрессирующих ген nec, для продукции LNT2.Example 3: Construction of Escherichia coli expressing the nec gene to produce LNT2. Штаммы Escherichia coli K-12 (DH1) MDO можно изменять для экспрессии представляющих интерес гетерологичных генов. Например, штамм МР4002 представляет собой штамм-продуцент LNT2 с оптимальной сверхэкспрессией гена бета-1,3-Н-ацетилглюкозаминилтрансферазы, igtA (табл. 4).Escherichia coli K-12 (DH1) MDO strains can be modified to express heterologous genes of interest. For example, strain MP4002 is an LNT2-producing strain with optimal overexpression of the beta-1,3-H-acetylglucosaminyltransferase gene, igtA (Table 4). Анализ всех образцов (фиг. 3) показал, что титр LNT2 может быть заметно улучшен, если экспрессионную кассету, содержащую промоторный элемент (PglpF), связанный с геном nec, интегрируют в хромосомную ДНК штамма МР4002 для создания штамма МР4039 (табл. 2). Интересно, что внеклеточная фракция LNT2 также была намного больше у штамма МР4039, чем у штамма МР4002, факт, который также проявляется в более низких уровнях трисахаридов, которые обнаруживают во фракции осадка штамма МР4039, экспрессирующего nec, по сравнению с соответствующими уровнями в штамме МР4002, не экспрессирующем транспортер (фиг. 3).Analysis of all samples (Fig. 3) showed that LNT2 titer could be markedly improved if an expression cassette containing a promoter element (PglpF) linked to the nec gene was integrated into the chromosomal DNA of strain MP4002 to create strain MP4039 (Table 2). Interestingly, the extracellular fraction of LNT2 was also much greater in strain MP4039 than in strain MP4002, a fact that is also reflected in the lower levels of trisaccharides found in the pellet fraction of strain MP4039 expressing nec compared to the corresponding levels in strain MP4002. not expressing the transporter (Fig. 3). Пример 4. Конструирование Escherichia coli для продукции LNT с применением гена nec.Example 4: Engineering Escherichia coli to produce LNT using the nec gene. Штаммы Escherichia coli K-12 (DH1) MDO можно изменять для экспрессии представляющих интерес гетерологичных генов. Например, штамм МР4473 представляет собой штамм-продуцент LNT со сверхэкспрессией гена бета-1,3-№ацетилглюкозаминилтрансферазы, IgtA, и гена бета-1,3галактозилтрансферазы, galTK (табл. 4).Escherichia coli K-12 (DH1) MDO strains can be modified to express heterologous genes of interest. For example, strain MP4473 is an LNT-producing strain with overexpression of the beta-1,3-Na-acetylglucosaminyltransferase gene, IgtA, and the beta-1,3-galactosyltransferase gene, galTK (Table 4). Вставка экспрессионной кассеты, содержащей промоторный элемент (PglpF), связанный с геном nec, в хромосомную ДНК штамма МР4473, генерирующего штамм МР4537 (табл. 2), приводила к: i) увеличению общего титра LNT более чем в 2 раза, ii) умеренному увеличению общей концентрации LNT2 и iii) более чем в 2 раза более высокому общему образованию pLNH2 (фиг. 4).The insertion of an expression cassette containing a promoter element (PglpF) associated with the nec gene into the chromosomal DNA of strain MP4473, generating strain MP4537 (Table 2), led to: i) an increase in the total LNT titer by more than 2 times, ii) a moderate increase total LNT2 concentration and iii) more than 2-fold higher total pLNH2 production (Figure 4). Концентрация LNT в фракции супернатантов культур штамма МР4537 повышена была в 2 раза по сравнению с таковой, измеренной в среде МР4473 (фиг. 4). Хотя можно наблюдать ограниченный Necопосредованный экспорт LNT2, внеклеточная фракция LNT2 у штамма МР4537 была лишь немного выше, чем у штамма МР4473. Явление транспорта LNT2 происходит предположительно медленнее, чем Nec-опосредованный экспорт LNT. Интересно, что, несмотря на значительное увеличение общего образования pLNH2 в клетках, экспрессирующих транспортер, pLNH2 обнаруживают исключительно в осадке клеток штамма МР4537 (фиг. 4).The concentration of LNT in the fraction of culture supernatants of strain MP4537 was increased by 2 times compared to that measured in MP4473 medium (Fig. 4). Although limited Neco-mediated LNT2 export could be observed, the extracellular fraction of LNT2 in strain MP4537 was only slightly higher than that in strain MP4473. The phenomenon of LNT2 transport occurs presumably at a slower rate than Nec-mediated LNT export. Interestingly, despite a significant increase in the overall production of pLNH2 in cells expressing the transporter, pLNH2 was detected exclusively in the cell pellet of strain MP4537 (Fig. 4). Пример 5. Конструирование Escherichia coli для получения LNFP-I с применением гена nec.Example 5: Engineering Escherichia coli to produce LNFP-I using the nec gene. Штаммы Escherichia coli K-12 (DH1) MDO можно изменять для экспрессии представляющих интерес гетерологичных генов. Например, штамм МР2789 представляет собой штамм-продуцент LNFP-I со сверхэкспрессией гена бета-1,3-Н-ацетилглюкозаминилтрансферазы, lgtA, гена бета-1,3-галактозилтрансферазы, galTK, гена альфа-1,2-фукозилтрансферазы, futC и нативных генов колановой кислоты (gmd-fcI-gmm-wcaI-cpsB-cpsG) (табл. 4). Введение экспрессионной кассеты, содержащей промоторный элемент (PglpF), связанный с геном nec, в хромосомную ДНК штамма МР2789 для получения штамма МР4597 (табл. 2), приводило к: i) сходным титрам LNFP-I, ii) более чем 2-кратному увеличению общего титра 2'-FL и iii) заметно более высокой общей сумме HMO (2'-FL, LNFP-I и LNT) (фиг. 5). Представленные в настоящем документе данные показывают, что 2'-FL, а не LNFP-I и LNT, эффективно транспортируются из клеток, экспрессирующих переносчик Nec, и, таким образом, образование 2'-FL и последующий экспорт благоприятны в nec-экспрессирующих клетках, продуцирующих LNFP-I.Escherichia coli K-12 (DH1) MDO strains can be modified to express heterologous genes of interest. For example, strain MP2789 is an LNFP-I producing strain with overexpression of the beta-1,3-H-acetylglucosaminyltransferase gene, lgtA, beta-1,3-galactosyltransferase gene, galTK, alpha-1,2-fucosyltransferase gene, futC and native colanic acid genes (gmd-fcI-gmm-wcaI-cpsB-cpsG) (Table 4). Introduction of an expression cassette containing a promoter element (PglpF) associated with the nec gene into the chromosomal DNA of strain MP2789 to obtain strain MP4597 (Table 2) resulted in: i) similar LNFP-I titers, ii) more than 2-fold increase total 2′-FL titer and iii) a markedly higher total amount of HMOs (2′-FL, LNFP-I and LNT) (Fig. 5). The data presented herein indicate that 2'-FL, but not LNFP-I and LNT, are efficiently transported from cells expressing the Nec transporter, and thus 2'-FL formation and subsequent export are favored in nec-expressing cells. producing LNFP-I. ФОРМУЛА ИЗОБРЕТЕНИЯCLAIM 1. Генетически модифицированная клетка, способная продуцировать один или несколько олигосахаридов грудного молока (ОГМ), где указанная клетка включает рекомбинантную нуклеиновую кислоту, кодирующую белок-транспортер суперсемейства major facilitator superfamily (MFS) с последовательностью SEQ ID NO: 1 или его функциональный гомолог, аминокислотная последовательность которого идентична по меньшей мере на 85% последовательности SEQ ID NO: 1.1. A genetically modified cell capable of producing one or more human milk oligosaccharides (HMO), where said cell includes a recombinant nucleic acid encoding a major facilitator superfamily (MFS) transporter protein with the sequence SEQ ID NO: 1 or its functional homologue, amino acid which is at least 85% sequence identical to SEQ ID NO: 1. 2. Генетически модифицированная клетка по п.1, где олигосахарид выбирают из 2'-фукозиллактозы (2'-FL), 3-фукозиллактозы (3-FL), дифукозиллактозы (DFL), 3'-сиалиллактозы (3'-SL), 6'-сиалиллактозы (6'-SL), лакто-Н-триозы-2 (LNT-2), лакто-Ы-тетраозы (LNT), лакто-Ы-фукопентаозы I (LNFP I), лакто-Nфукопентаозы II (LNFP II), лакто-К-фукопентаозы III (LNFP III), лакто-К-фукопентаозы IV (LNFP IV) и лакто-К-фукопентаозы V (LNFP V) и/или пара-лакто-К-неогексаозы (pLNnH).2. A genetically modified cell according to claim 1, where the oligosaccharide is selected from 2'-fucosyllactose (2'-FL), 3-fucosyllactose (3-FL), difucosyllactose (DFL), 3'-sialyllactose (3'-SL), 6'-sialyllactose (6'-SL), lacto-N-triose-2 (LNT-2), lacto-N-tetraose (LNT), lacto-N-fucopentaose I (LNFP I), lacto-N-fucopentaose II (LNFP II), lacto-K-fucopentaose III (LNFP III), lacto-K-fucopentaose IV (LNFP IV) and lacto-K-fucopentaose V (LNFP V) and/or para-lacto-K-neohexaose (pLNnH). - 20 046248- 20 046248 3. Генетически модифицированная клетка по любому из предшествующих пунктов, где генетически модифицированная клетка представляет собой Escherichia coli.3. The genetically modified cell as claimed in any one of the preceding claims, wherein the genetically modified cell is Escherichia coli. 4. Генетически модифицированная клетка по любому из предшествующих пунктов, где генетически модифицированная клетка дополнительно содержит по меньшей мере одну рекомбинантную нуклеиновую кислоту, которая кодирует функциональный фермент с гликозилтрансферазной активностью, выбранный из группы, состоящей из альфа-1,2-фукозилтрансферазы, альфа-1,3-фукозилтрансферазы, альфа-1,3/4-фукозилтрансферазы, альфа-1,4-фукозилтрансферазы, альфа-2,3-сиалилтрансферазы, альфа-2,6сиалилтрансферазы, бета- 1,3-Ы-ацетилглюкозаминилтрансферазы, бета-1,6-Ы-ацетилглюкозаминилтрансферазы, бета-1,3-галактозилтрансферазы и бета-1,4-галактозилтрансферазы.4. The genetically modified cell as claimed in any one of the preceding claims, wherein the genetically modified cell further comprises at least one recombinant nucleic acid that encodes a functional enzyme with glycosyltransferase activity selected from the group consisting of alpha-1,2-fucosyltransferase, alpha-1 ,3-fucosyltransferase, alpha-1,3/4-fucosyltransferase, alpha-1,4-fucosyltransferase, alpha-2,3-sialyltransferase, alpha-2,6-sialyltransferase, beta-1,3-N-acetylglucosaminyltransferase, beta-1 ,6-N-acetylglucosaminyltransferase, beta-1,3-galactosyltransferase and beta-1,4-galactosyltransferase. 5. Генетически модифицированная клетка по любому из предшествующих пунктов, где клетка дополнительно включает последовательность рекомбинантной ДНК, включающую регуляторный элемент для регуляции экспрессии рекомбинантной нуклеиновой кислоты.5. The genetically modified cell according to any one of the preceding claims, wherein the cell further includes a recombinant DNA sequence including a regulatory element for regulating the expression of the recombinant nucleic acid. 6. Генетически модифицированная клетка по п.5, где регуляторный элемент для регуляции экспрессии рекомбинантной нуклеиновой кислоты представляет собой элемент экспрессии, выбранный из lacпромотора или glp-промотора.6. The genetically modified cell according to claim 5, wherein the regulatory element for regulating the expression of the recombinant nucleic acid is an expression element selected from a lac promoter or a glp promoter. 7. Конструкция нуклеиновой кислоты, включающая последовательность нуклеиновой кислоты, кодирующую белок-транспортер суперсемейства major facilitator superfamily (MFS) с последовательностью SEQ ID NO: 1 или его функциональный гомолог, имеющая более чем 85% идентичности последовательности с последовательностью SEQ ID NO: 1, где последовательность нуклеиновой кислоты, кодирующая белок с последовательностью SEQ ID NO: 1, имеет по меньшей мере 85% идентичности последовательности с SEQ ID NO: 2, в котором конструкция дополнительно включает последовательность нуклеиновой кислоты, включающую регуляторный элемент.7. A nucleic acid construct comprising a nucleic acid sequence encoding a major facilitator superfamily (MFS) transporter protein with the sequence SEQ ID NO: 1 or a functional homolog thereof, having more than 85% sequence identity with the sequence SEQ ID NO: 1, where the nucleic acid sequence encoding the protein of SEQ ID NO: 1 has at least 85% sequence identity to SEQ ID NO: 2, wherein the construct further includes a nucleic acid sequence including a regulatory element. 8. Конструкция нуклеиновой кислоты по п.7, где регуляторный элемент регулирует экспрессию последовательности нуклеиновой кислоты, имеющей по меньшей мере 85% идентичности последовательности с SEQ ID NO:2.8. The nucleic acid construct of claim 7, wherein the regulatory element controls the expression of a nucleic acid sequence having at least 85% sequence identity to SEQ ID NO:2. 9. Конструкция нуклеиновой кислоты по п.7 или 8, где регуляторный элемент для регуляции экспрессии рекомбинантной нуклеиновой кислоты представляет собой элемент экспрессии, выбранный из lac-промотора или glp-промотора.9. The nucleic acid construct according to claim 7 or 8, wherein the regulatory element for regulating the expression of the recombinant nucleic acid is an expression element selected from a lac promoter or a glp promoter. 10. Конструкция нуклеиновой кислоты по п.7 или 8, где конструкция нуклеиновой кислоты является частью векторной ДНК или кассеты/картриджа экспрессии, интегрированной в геном клетки-хозяина.10. The nucleic acid construct according to claim 7 or 8, wherein the nucleic acid construct is part of a vector DNA or expression cassette/cartridge integrated into the genome of the host cell. 11. Способ получения одного или нескольких олигосахаридов, включающий стадии: (i) обеспечения генетически модифицированной клетки, способной продуцировать ОГМ, по любому из пп.1-6; (ii) культивирование клетки в соответствии с (i) в подходящей среде для культивирования клеток для экспрессии указанной рекомбинантной нуклеиновой кислоты; (iii) сбор одного или нескольких ОГМ, полученных на этапе (ii).11. A method for producing one or more oligosaccharides, comprising the steps of: (i) providing a genetically modified cell capable of producing OGM, according to any one of claims 1 to 6; (ii) culturing the cell in accordance with (i) in a suitable cell culture medium to express said recombinant nucleic acid; (iii) collection of one or more OGMs obtained in step (ii). 12. Способ по п.11, где полученный ОГМ собирают из среды культивирования и микробной биомассы, образующейся в процессе культивирования.12. The method according to claim 11, where the resulting OGM is collected from the cultivation medium and microbial biomass formed during the cultivation process. 13. Применение генетически модифицированной клетки по любому из пп.1-6 или конструкции нуклеиновой кислоты по любому из пп.7-10 для получения одного или нескольких олигосахаридов грудного молока (ОГМ).13. Use of a genetically modified cell according to any one of claims 1 to 6 or a nucleic acid construct according to any of claims 7 to 10 for the production of one or more human milk oligosaccharides (HMOs). 14. Применение по п.13, где ОГМ выбран из группы, состоящей из 2'-FL, 3-FL, DLF, LNT, LNT-II, LNnT, LNFP-I, pLNnH и pLNH-II.14. Use according to claim 13, wherein the OGM is selected from the group consisting of 2'-FL, 3-FL, DLF, LNT, LNT-II, LNnT, LNFP-I, pLNnH and pLNH-II. 15. Применение по п.14, где ОГМ выбран из группы, состоящей из 2'-FL, 3-FL, DFL, LNT, LNT-II, LNnT, pLNnH и pLNH-II.15. Use according to claim 14, where the OGM is selected from the group consisting of 2'-FL, 3-FL, DFL, LNT, LNT-II, LNnT, pLNnH and pLNH-II. 16. Применение по любому из пп.14 или 15, где ОГМ выбран из группы, состоящей из 2'-FL, 3-FL, LNT, LNT-II, LNnT и pLNH-II.16. Use according to any one of claims 14 or 15, wherein the OGM is selected from the group consisting of 2'-FL, 3-FL, LNT, LNT-II, LNnT and pLNH-II. --
EA202292159 2020-01-23 2021-01-22 OBTAINING OGM EA046248B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DKPA202000085 2020-01-23
DKPA202000833 2020-07-13

Publications (1)

Publication Number Publication Date
EA046248B1 true EA046248B1 (en) 2024-02-20

Family

ID=

Similar Documents

Publication Publication Date Title
US20230193335A1 (en) Hmo production
US20230072639A1 (en) New major facilitator superfamily (mfs) protein (bad) in hmo production
US20230227876A1 (en) Hmo production
US20230109661A1 (en) Hmo production
US20240102063A1 (en) New major facilitator superfamily (mfs) protein (fred) in production of sialylated hmos
US20230109937A1 (en) New major facilitator superfamily (mfs) protein (fred) in hmo production
US20240043891A1 (en) A dfl-producing strain
JP2024516207A (en) Microbial strains expressing invertase/sucrose hydrolase
EA046248B1 (en) OBTAINING OGM
EA046005B1 (en) A NEW MAIN FACTOR SUPERFAMILY (MFS) PROTEIN (Fred) IN THE PRODUCTION OF OGM
EA046241B1 (en) OBTAINING OGM
EA046260B1 (en) OBTAINING OGM
CN116802302A (en) Novel Major Facilitator Superfamily (MFS) proteins (FREDs) in sialylated HMO production
JP2023154004A (en) New sialyltransferases for in vivo synthesis of 3'sl
CN117321071A (en) Microbial strains expressing invertase/sucrose hydrolase