EA046005B1 - A NEW MAIN FACTOR SUPERFAMILY (MFS) PROTEIN (Fred) IN THE PRODUCTION OF OGM - Google Patents

A NEW MAIN FACTOR SUPERFAMILY (MFS) PROTEIN (Fred) IN THE PRODUCTION OF OGM Download PDF

Info

Publication number
EA046005B1
EA046005B1 EA202292161 EA046005B1 EA 046005 B1 EA046005 B1 EA 046005B1 EA 202292161 EA202292161 EA 202292161 EA 046005 B1 EA046005 B1 EA 046005B1
Authority
EA
Eurasian Patent Office
Prior art keywords
genetically modified
gene
ogm
pglpf
mfs
Prior art date
Application number
EA202292161
Other languages
Russian (ru)
Inventor
Маргит Педерсен
Изотта Д'Арриго
Катрине Бых Кампманн
Манос Пападакис
Original Assignee
Глюком А/С
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Глюком А/С filed Critical Глюком А/С
Publication of EA046005B1 publication Critical patent/EA046005B1/en

Links

Description

Область техники, к которой относится изобретениеField of technology to which the invention relates

Настоящее изобретение относится к области рекомбинантного получения биологических молекул в генетически модифицированных клетках. Более конкретно, оно относится к способу рекомбинантного получения олигосахаридов грудного молока (ОГМ) с применением генетически модифицированных клеток, экспрессирующих белок суперсемейство основных посредников (MFS), экспрессируемый белок представляет собой Fred.The present invention relates to the field of recombinant production of biological molecules in genetically modified cells. More specifically, it relates to a method for recombinantly producing human milk oligosaccharides (HMOs) using genetically modified cells expressing a major mediator superfamily (MFS) protein, the expressed protein being Fred.

Уровень техникиState of the art

Грудное молоко представляет собой сложную смесь углеводов, жиров, белков, витаминов, минералов и микроэлементов. Безусловно, наиболее преобладающая фракция представлена углеводами, которые можно далее разделить на лактозу и более сложные олигосахариды (олигосахариды грудного молока, ОГМ). В то время как лактозу применяют в качестве источника энергии, сложные олигосахариды не метаболизируются младенцем. Фракция сложных олигосахаридов составляет до 1/10 от общей углеводной фракции и состоит, вероятно, из более чем 150 различных олигосахаридов. Наличие и концентрация этих сложных олигосахаридов специфичны для человека и поэтому не могут быть обнаружены в больших количествах в молоке других млекопитающих, таких как, например, домашние молочные животные.Breast milk is a complex mixture of carbohydrates, fats, proteins, vitamins, minerals and trace elements. By far the most predominant fraction is carbohydrates, which can be further divided into lactose and more complex oligosaccharides (human milk oligosaccharides, HMOs). While lactose is used as an energy source, complex oligosaccharides are not metabolized by the infant. The complex oligosaccharide fraction accounts for up to 1/10 of the total carbohydrate fraction and probably consists of more than 150 different oligosaccharides. The presence and concentration of these complex oligosaccharides are specific to humans and therefore cannot be found in large quantities in the milk of other mammals, such as, for example, domestic dairy animals.

На сегодняшний день определена структура не менее 115 ОГМ (см. Urashima et al. Milk Oligosaccharides, Nova Biomedical Books, New York, 2011, ISBN: 978-1-61122-831-1), и, вероятно, значительно больше присутствует в грудном молоке (Kunz С. et al., (2014) Food Oligo-saccharides: Production, Analysis and Bioactivity, 1st Edition, p. 5-20, Eds. Moreno J. and Luz Sanz M., John Wiley & Sons, Ltd).To date, the structure of at least 115 OGMs has been determined (see Urashima et al. Milk Oligosaccharides, Nova Biomedical Books, New York, 2011, ISBN: 978-1-61122-831-1), and many more are likely to be present in breast milk (Kunz S. et al., (2014) Food Oligo-saccharides: Production, Analysis and Bioactivity, 1st Edition, p. 5-20, Eds. Moreno J. and Luz Sanz M., John Wiley & Sons, Ltd) .

ОГМ вызвали большой интерес в последнее десятилетие в связи с открытием их важной функциональности в развитии человека. Помимо своих пребиотических свойств, ОГМ связаны с дополнительными положительными эффектами, что расширяет область их применения (Kunz С. et al., (2014) Food Oligosaccharides: Production, Analysis and Bioactivity, 1st Edition, p 5-20, Eds. Moreno J. and Luz Sanz M., John Wiley & Sons, Ltd). Польза ОГМ для здоровья позволила разрешить их применение в пищевых продуктах, таких как детские смеси и пищевые продукты, а также в потребительских товарах для здоровья.GGMs have attracted much interest in the last decade due to the discovery of their important functionality in human development. In addition to their prebiotic properties, HMOs are associated with additional beneficial effects, which expands the scope of their application (Kunz S. et al., (2014) Food Oligosaccharides: Production, Analysis and Bioactivity, 1st Edition, p 5-20, Eds. Moreno J. and Luz Sanz M., John Wiley & Sons, Ltd). The health benefits of HGMs have led to their approval for use in foods such as infant formula and food products, as well as in consumer health products.

Из-за ограниченной доступности ОГМ крайне желательно эффективное коммерческое, т.е. крупномасштабное производство. Разработаны химические маршруты к некоторым ОГМ. Однако производство ОГМ путем химического синтеза, ферментативного синтеза или ферментации оказалось сложной задачей. Производство в больших количествах, а также качества, необходимые для пищевых и медицинских целей, путем химического синтеза еще предстоит обеспечить. Кроме того, химические синтетические пути к ОГМ включают несколько вредных химических веществ, которые создают риск загрязнения конечного продукта.Due to the limited availability of OGM, effective commercial, i.e. large scale production. Chemical routes to some OGMs have been developed. However, the production of OGM by chemical synthesis, enzymatic synthesis, or fermentation has proven challenging. Production in large quantities, as well as the qualities required for food and medicinal purposes, through chemical synthesis have yet to be achieved. In addition, chemical synthetic routes to HMOs include several harmful chemicals that pose a risk of contamination of the final product.

Чтобы обойти недостатки, связанные с химическим синтезом ОГМ, были разработаны несколько этимологических способов и ферментативных подходов. Процессы на основе ферментации были разработаны для нескольких ОГМ, таких как 2'-фукозиллактоза, 3-фукозиллактоза, ласто-Ы-тетраоза, лакто-Nнеотетраоза, З'-сиалиллактоза и 6'-сиалиллактоза. В процессах, основанных на ферментации, обычно применяют генетически модифицированные бактериальные штаммы, такие как рекомбинантная кишечная палочка (E.coli).To circumvent the disadvantages associated with the chemical synthesis of HMOs, several etymological routes and enzymatic approaches have been developed. Fermentation-based processes have been developed for several HGMs, such as 2'-fucosyllactose, 3-fucosyllactose, lasto-N-tetraose, lacto-Nneotetraose, 3'-sialyllactose and 6'-sialyllactose. Fermentation-based processes typically use genetically modified bacterial strains such as recombinant Escherichia coli (E. coli).

Биотехнологическое производство ОГМ, такое как ферментативный способ, представляет собой ценный экономичный и масштабный подход к производству ОГМ. Оно основано на генетически модифицированных бактериях, сконструированных таким образом, чтобы экспрессировать гликозилтрансферазы, необходимые для синтеза желаемых олигосахаридов, и в нем применяют врожденный пул нуклеотидных Сахаров бактерий в качестве предшественников ОГМ.Biotechnological production of HMOs, such as the enzymatic route, represents a valuable cost-effective and large-scale approach to the production of HMOs. It is based on genetically modified bacteria engineered to express the glycosyltransferases required to synthesize the desired oligosaccharides, and utilizes the bacteria's innate pool of nucleotide sugars as OGM precursors.

Недавние разработки в биотехнологическом производстве ОГМ позволили преодолеть некоторые присущие бактериальным экспрессионным системам ограничения. Например, бактериальные клетки, продуцирующие ОГМ, могут быть генетически модифицированы для увеличения ограниченного внутриклеточного пула нуклеотидных сахаров в бактериях (WO 2012112777), для повышения активности ферментов, участвующих в продукции ОГМ (WO 2016040531), или для облегчения секреции синтезированных ОГМ во внеклеточную среду (WO 2010142305, WO 2017042382). Кроме того, экспрессию представляющих интерес генов в рекомбинантных клетках можно регулировать с помощью конкретных промоторов или других регуляторов экспрессии генов, таких как, например, те, что недавно были описаны в WO 2019123324.Recent developments in the biotechnological production of HGM have overcome some of the inherent limitations of bacterial expression systems. For example, bacterial cells that produce OGM can be genetically modified to increase the limited intracellular pool of nucleotide sugars in bacteria (WO 2012112777), to increase the activity of enzymes involved in the production of OGM (WO 2016040531), or to facilitate the secretion of synthesized OGM into the extracellular environment (WO 2012112777). WO 2010142305, WO 2017042382). In addition, the expression of genes of interest in recombinant cells can be regulated by specific promoters or other gene expression regulators, such as those recently described in WO 2019123324.

Подход, описанный в WO 2010142305 и WO 2017042382, имеет то преимущество, что он позволяет снизить метаболическую нагрузку, воздействующую на продуцирующую клетку, за счет высоких уровней экспрессии рекомбинантных генов, т.е. с применением способов WO 2012112777, WO 2016040531 или WO 2019123324. Этот подход привлекает все большее внимание к конструированию рекомбинантных клеток, продуцирующих ОГМ, например, недавно были описаны также несколько новых генов переносчиков сахара, кодирующих белки, и процедуры ферментации, которые могут способствовать выведению рекомбинантно продуцируемой 2'-фукозиллактозы (2'-FL), самого распространенного ОГМ грудного молока (WO 2018077892, US 201900323053, US 201900323052).The approach described in WO 2010142305 and WO 2017042382 has the advantage that it reduces the metabolic burden on the producing cell due to high levels of recombinant gene expression, i.e. using the methods of WO 2012112777, WO 2016040531 or WO 2019123324. This approach is attracting increasing attention to the construction of recombinant cells producing HGM, for example, several new sugar transporter genes encoding proteins and fermentation procedures that can facilitate recombinant production have also been recently described produced by 2'-fucosyllactose (2'-FL), the most common HGM in human milk (WO 2018077892, US 201900323053, US 201900323052).

Однако в настоящее время не существует алгоритма, который мог бы точно определить правильный белок-транспортер для оттока различных структур ОГМ, полученных рекомбинантно, среди многочис- 1 046005 ленных бактериальных белков с предсказанной функцией транспортера в нескольких базах данных белков, например, в UniProt, поскольку отношение структуры-функции, определяющие субстратную специфичность переносчиков сахаров, до сих пор недостаточно изучены и остаются крайне непредсказуемыми.However, there is currently no algorithm that can accurately identify the correct transporter protein for the efflux of various recombinantly produced OGM structures among the numerous bacterial proteins with predicted transporter function in several protein databases, such as UniProt, because The structure-function relationships that determine the substrate specificity of sugar transporters are still poorly understood and remain highly unpredictable.

Раскрытие изобретенияDisclosure of the Invention

Настоящее раскрытие показывает, что сверхэкспрессия в штаммах, продуцирующих ОГМ, гетерологичного гена fred, который кодирует белок Fred из суперсемейства основных переносчиков (MFS), увеличивает количество ОГМ, продуцируемого клетками. Выявление новых эффективных белковтранспортеров оттока сахаров, имеющих эффективность для различных рекомбинантно полученных ОГМ и разработка рекомбинантных клеток, экспрессирующих указанные белки, выгодны для крупномасштабного промышленного производства ОГМ.The present disclosure shows that overexpression in OGM-producing strains of the heterologous fred gene, which encodes the Fred protein of the major transporter superfamily (MFS), increases the amount of OGM produced by the cells. The identification of new efficient sugar efflux transporter proteins that have efficacy for various recombinantly produced OGMs and the development of recombinant cells expressing these proteins are beneficial for large-scale industrial production of OHMs.

Таким образом, в самом широком аспекте настоящее изобретение относится к генетически модифицированной клетке, способной продуцировать один или несколько олигосахаридов грудного молока (ОГМ), причем указанная генетически модифицированная клетка включает гетерологичную последовательность нуклеиновой кислоты, кодирующую полипептид главного облегчающего суперсемейства (MFS), показанный на SEQ ID NO: 1 или ее функциональный гомолог, аминокислотная последовательность которого более чем на 95,4% идентична SEQ ID NO: 1, например, по меньшей мере, на 95,5, например, по меньшей мере, на 96% идентична SEQ ID NO: 1.Thus, in its broadest aspect, the present invention relates to a genetically modified cell capable of producing one or more human milk oligosaccharides (HMOs), wherein said genetically modified cell comprises a heterologous nucleic acid sequence encoding a major facilitator superfamily (MFS) polypeptide shown in SEQ ID NO: 1 or a functional homolog thereof, the amino acid sequence of which is more than 95.4% identical to SEQ ID NO: 1, for example, at least 95.5, for example, at least 96% identical to SEQ ID NO : 1.

Генетически модифицированная клетка по настоящему изобретению может дополнительно включать последовательность нуклеиновой кислоты, включающую регуляторный элемент для регуляции экспрессии гетерологичной последовательности нуклеиновой кислоты. Указанный регуляторный элемент в одном аспекте регулирует экспрессию полипептида MFS, показанного в SEQ ID NO: 1, или его функционального гомолога, аминокислотная последовательность которого более чем на 95,4% идентична SEQ ID NO: 1.The genetically modified cell of the present invention may further include a nucleic acid sequence including a regulatory element for regulating the expression of a heterologous nucleic acid sequence. Said regulatory element in one aspect regulates the expression of the MFS polypeptide shown in SEQ ID NO: 1, or a functional homolog thereof, the amino acid sequence of which is more than 95.4% identical to SEQ ID NO: 1.

Аминокислотная последовательность, обозначенная в настоящем документе как SEQ ID NO: 1, представляет собой аминокислотную последовательность, которая на 100% идентична аминокислотной последовательности, имеющей номер доступа GenBank ID WP_087817556.1. Белок-транспортер MFS, имеющий аминокислотную последовательность SEQ ID NO: 1, идентифицируется в настоящем документе как белок Fred или переносчик Fred или Fred, взаимозаменяемо; последовательность нуклеиновой кислоты, кодирующая белок Fred, обозначена в настоящем документе как SEQ ID NO: 2 Fred, кодирующая нуклеиновую кислоту/ДНК, или ген fred, или fred.The amino acid sequence designated herein as SEQ ID NO: 1 is an amino acid sequence that is 100% identical to the amino acid sequence having GenBank accession ID WP_087817556.1. The MFS transporter protein having the amino acid sequence of SEQ ID NO: 1 is identified herein as the Fred protein or the Fred or Fred transporter, interchangeably; the nucleic acid sequence encoding the Fred protein is designated herein as SEQ ID NO: 2 Fred encoding the nucleic acid/DNA or fred gene or fred gene.

Настоящее изобретение показывает, что применение рекомбинантных клеток, продуцирующих ОГМ, которые экспрессируют белок Fred, приводит к весьма отчетливым улучшениям процесса производства ОГМ как с точки зрения ферментации, так и очистки ОГМ. Описанные в настоящем документе рекомбинантные клетки и способы получения ОГМ обеспечивают как более высокие выходы всех произведенных ОГМ, сниженное образование побочных продуктов или отношение побочного продукта к продукту и облегченное извлечение ОГМ во время последующей обработки ферментационный бульон.The present invention shows that the use of recombinant OGM-producing cells that express the Fred protein leads to very distinct improvements in the OGM production process, both in terms of fermentation and OGM purification. The recombinant cells and methods for producing HMOs described herein provide both higher yields of total HMOs produced, reduced by-product formation or byproduct-to-product ratio, and easier recovery of HMOs during downstream processing of the fermentation broth.

Неожиданно было обнаружено, что экспрессия последовательности ДНК, кодирующей Fred, в различных ОГМ-продуцирующих клетках связана с накоплением некоторых ОГМ во внеклеточной среде и других ОГМ внутри продуцирующих клеток, и с увеличением общей продукции ОГМ. Неожиданно оказалось, что увеличение выхода образующихся ОГМ характерно для ОГМ, состоящих либо из трех, либо из четырех звеньев моносахаридов, т.е. 2'-фукозиллактозы (2'-FL), 3-фукозиллактозы (3-FL), 3сиалиллактозы (3'SL), 6'-сиалиллактозы (6'SL), лакто-Ы-триозы 2, (LNT-2), лакто-Ы-неотетраозы (LNnT) и лакто-Н-тетраозы (LNT), особенно для 2'-фукозиллактозы (2'-FL), 3-фукозиллактозы (3-FL) и лакто-Nтетраозы (LNT), как видно из приведенных в настоящем документе примеров, но не для более крупных олигосахаридных структур, таких как пентасахариды и гексасахариды, которые накапливаются внутри продуцирующих клеток.Surprisingly, it was found that expression of the DNA sequence encoding Fred in various OGM-producing cells is associated with the accumulation of some OGM in the extracellular environment and other OGM within the producing cells, and with an increase in overall OGM production. Unexpectedly, it turned out that an increase in the yield of the resulting OHMs is characteristic of OHMs consisting of either three or four monosaccharide units, i.e. 2'-fucosyllactose (2'-FL), 3-fucosyllactose (3-FL), 3-sialyllactose (3'SL), 6'-sialyllactose (6'SL), lacto-N-triose 2, (LNT-2), lacto-N-neotetraose (LNnT) and lacto-N-tetraose (LNT), especially for 2'-fucosyllactose (2'-FL), 3-fucosyllactose (3-FL) and lacto-N-tetraose (LNT), as seen in examples given herein, but not for larger oligosaccharide structures such as pentasaccharides and hexasaccharides that accumulate within producing cells.

Неожиданно также обнаружено, что общая продукция основного ОГМ, например, 2'фукозиллактозы (2'-FL), 3-фукозиллактозы (3-FL), и лакто-М-тетраозы (LNT) в соответствующих ОГМпродуцирующих клетках, экспрессирующих ген fred, также увеличивается, в то время как образование побочных продуктов, например, например дифукозиллактозы (DFL), лакто-N-фукоπентаозы V (LNFP V) или паралактонеогексаозы-1 (pLNH-I) в этих клетках, соответственно, часто снижены, и указанные побочные олигосахариды обычно накапливаются внутри продуцирующих клеток.Surprisingly, it was also found that the total production of major OGM, e.g., 2'fucosyllactose (2'-FL), 3-fucosyllactose (3-FL), and lacto-M-tetraose (LNT), in the corresponding OGM-producing cells expressing the fred gene was also increases, while the formation of by-products, for example, difucosyllactose (DFL), lacto-N-fucopentaose V (LNFP V) or paralactoneohexaose-1 (pLNH-I) in these cells, respectively, is often reduced, and these by-product oligosaccharides usually accumulate inside producing cells.

Неожиданно было также обнаружено, что общая продукция основных ОГМ, т.е. 2'-фукозиллактозы (2'-FL), 3-фукозиллактозы (3-FL) и лакто-N-теΊраозы (LNT) в соответствующих ОГМ-продуцирующих клетках, экспрессирующих ген fred, также увеличивается, в то время как продукция побочных продуктов, т.е. дифукозиллактозы (DFL), лакто-N-фукопентаозы V (LNFP V) или паралактонеогексаозы-I (pLNH-I) в этих клетках, соответственно, часто снижается, и указанные побочные продукты олигосахаридов обычно накапливаются внутри продуцирующих клеток.Surprisingly, it was also found that the total production of the main HMOs, i.e. 2'-fucosyllactose (2'-FL), 3-fucosyllactose (3-FL) and lacto-N-theraose (LNT) in the corresponding OGM-producing cells expressing the fred gene are also increased, while the production of by-products, those. difucosyllactose (DFL), lacto-N-fucopentaose V (LNFP V) or paralactoneohexaose-I (pLNH-I) in these cells, respectively, is often reduced, and these oligosaccharide by-products usually accumulate inside the producing cells.

Генетически модифицированная клетка по настоящему изобретению обычно дополнительно включает последовательность нуклеиновой кислоты, включающую регуляторный элемент. Регуляторный элемент может регулировать экспрессию нуклеиновой кислоты, кодирующей полипептид суперсемейстThe genetically modified cell of the present invention typically further includes a nucleic acid sequence including a regulatory element. The regulatory element may regulate the expression of a nucleic acid encoding a superfamily polypeptide

- 2 046005 ва основных переносчиков (MFS), и может быть выбран из группы, состоящей из PglpF, PglpF_SD4 и PglpF_SD7.- 2 046005 va major transporters (MFS), and can be selected from the group consisting of PglpF, PglpF_SD4 and PglpF_SD7.

Изобретение также относится к конструкции нуклеиновой кислоты, включающей последовательность нуклеиновой кислоты, кодирующую полипептид суперсемейства основных переносчиков (MFS), где последовательность нуклеиновых кислот, кодирующая полипептид суперсемейства основных переносчиков (MFS), имеет, по меньшей мере, 70%, более предпочтительно, по меньшей мере, 80%, более предпочтительно, по меньшей мере, 90%, более предпочтительно, по меньшей мере, 95% и еще более предпочтительно, по меньшей мере, 99% идентичности с последовательностью SEQ ID NO: 2, также изобретение относится к генетически модифицированной клетке, включающей конструкцию нуклеиновой кислоты, которая представляет собой Escherichia coli.The invention also relates to a nucleic acid construct comprising a nucleic acid sequence encoding a major transporter superfamily (MFS) polypeptide, wherein the nucleic acid sequence encoding a major transporter superfamily (MFS) polypeptide has at least 70%, more preferably at least at least 80%, more preferably at least 90%, more preferably at least 95% and even more preferably at least 99% identity with the sequence SEQ ID NO: 2, the invention also relates to genetically modified cell comprising a nucleic acid construct that is Escherichia coli.

В одном аспекте конструкция нуклеиновой кислоты, включающая последовательность(последовательности) нуклеиновой кислоты, кодирующую(кодирующие) полипептид, относящийся к суперсемейству основных переносчиков (MFS), в которой последовательность нуклеиновой кислоты, по меньшей мере, на 70% идентична SEQ ID NO: 2.In one aspect, a nucleic acid construct comprising nucleic acid sequence(s) encoding a polypeptide belonging to the major transporter superfamily (MFS), wherein the nucleic acid sequence is at least 70% identical to SEQ ID NO: 2.

Изобретение также обеспечивает способ биосинтетического производства одного или нескольких олигосахаридов грудного молока (ОГМ), включающий следующие стадии:The invention also provides a method for the biosynthetic production of one or more human milk oligosaccharides (HMOs), comprising the following steps:

(i) обеспечение генетически модифицированной клетки по настоящему изобретению;(i) providing a genetically modified cell according to the present invention;

(ii) культивирование генетически модифицированной клетки в соответствии с (i) в подходящей среде для культивирования клеток для экспрессии указанного полипептида, способного к транспортировке выходящего сахара и продуцированию одного или нескольких олигосахаридов грудного молока (ОГМ), и;(ii) culturing the genetically modified cell in accordance with (i) in a suitable cell culture medium to express said polypeptide capable of transporting output sugar and producing one or more human milk oligosaccharides (HMOs), and;

(iii) сбор одного или нескольких ОГМ, полученных на стадии (ii).(iii) collecting one or more OGM obtained in step (ii).

Изобретение также относится к применению генетически модифицированной клетки или конструкции нуклеиновой кислоты, включающей гетерологичную последовательность нуклеиновой кислоты, кодирующую полипептид суперсемейства основных посредников (MFS), причем указанная последовательность нуклеиновой кислоты имеет, по меньшей мере, 70% идентичности последовательности с SEQ ID NO: 2, для биосинтетического производства одного или нескольких олигосахаридов грудного молока (ОГМ).The invention also relates to the use of a genetically modified cell or nucleic acid construct comprising a heterologous nucleic acid sequence encoding a master mediator superfamily (MFS) polypeptide, wherein said nucleic acid sequence has at least 70% sequence identity with SEQ ID NO: 2. for the biosynthetic production of one or more human milk oligosaccharides (HMOs).

Как упоминалось выше, при культивировании генетически модифицированных клеток, способных продуцировать один или несколько ОГМ и включающих последовательность нуклеиновой кислоты, кодирующую белок-транспортер Fred, неожиданно было обнаружено, что соответствующие один или несколько ОГМ продуцируются с высокими выходами, тогда как образование побочных продуктов и биомассы снижается. Это облегчает извлечение этих ОГМ в последующих процессах, например, общая процедура извлечения и очистки может включать меньше стадий, и общее время очистки сокращается.As mentioned above, when cultivating genetically modified cells capable of producing one or more OGMs and including a nucleic acid sequence encoding the Fred transporter protein, it was unexpectedly found that the corresponding one or more OHMs were produced in high yields, while the formation of by-products and biomass decreases. This makes it easier to recover these HMOs in downstream processes, for example the overall recovery and purification procedure may involve fewer steps and the overall purification time is reduced.

Эти эффекты повышенного выхода продукта и облегчения извлечения продукта делают настоящее изобретение превосходящим раскрытия предшествующего уровня техники.These effects of increased product yield and easier product recovery make the present invention superior to the disclosures of the prior art.

Другие аспекты и полезные признаки настоящего изобретения подробно описаны и проиллюстрированы приведенными ниже неограничивающими рабочими примерами.Other aspects and useful features of the present invention are described in detail and illustrated by the following non-limiting worked examples.

Краткое описание чертежейBrief description of drawings

На фиг. 1 показана относительная продукция 2'-FL модифицированным штаммом E.coli (штамм 1) с интеграцией и без интеграции гена fred в соответствии с SEQ ID NO: 2, кодирующего экспрессию белкатранспортера Fred MFS в соответствии с SEQ ID NO: 1, штамм 2 и штамм 1, соответственно. Данные получены анализом культуры с подпиткой способом с глубокими лунками.In fig. 1 shows the relative production of 2'-FL by a modified E. coli strain (strain 1) with and without integration of the fred gene in accordance with SEQ ID NO: 2, encoding the expression of the Fred MFS transporter protein in accordance with SEQ ID NO: 1, strain 2 and strain 1, respectively. Data were obtained by fed-batch culture analysis using the deep well method.

На фиг. 2 показано относительное распределение 2'-FL внутри и снаружи клеток модифицированного штамма E.coli (штамм 1) с интеграцией и без интеграции гена fred в соответствии с SEQ ID NO: 2, кодирующего экспрессию белка-транспортера Fred MFS в соответствии с SEQ ID NO: 1, штамм 2 и штамм 1, соответственно. Данные получены анализом культуры с подпиткой способом с глубокими лунками.In fig. 2 shows the relative distribution of 2'-FL inside and outside the cells of a modified E. coli strain (strain 1) with and without integration of the fred gene in accordance with SEQ ID NO: 2, encoding the expression of the Fred MFS transporter protein in accordance with SEQ ID NO : 1, strain 2 and strain 1, respectively. Data were obtained by fed-batch culture analysis using the deep well method.

На фиг. 3 показана относительная продукция 3-FL модифицированным штаммом E.coli (штамм 3) с интеграцией и без интеграции гена fred в соответствии с SEQ ID NO: 2, кодирующего экспрессию белкатранспортера Fred MFS в соответствии с SEQ ID NO: 1, штамм 4 и штамм 3, соответственно. Данные получены анализом культуры с подпиткой способом с глубокими лунками.In fig. 3 shows the relative production of 3-FL by a modified E. coli strain (strain 3) with and without integration of the fred gene in accordance with SEQ ID NO: 2, encoding the expression of the Fred MFS transporter protein in accordance with SEQ ID NO: 1, strain 4 and strain 3, respectively. Data were obtained by fed-batch culture analysis using the deep well method.

На фиг. 4 показано относительное распределение 3-FL внутри и снаружи клеток модифицированного штамма E.coli (штамм 3) с интеграцией гена fred и без нее в соответствии с SEQ ID NO: 2, кодирующего экспрессию белка-транспортера Fred MFS в соответствии с SEQ ID. NO: 1, штамм 4 и штамм 3, соответственно. Данные получены анализом культуры с подпиткой способом с глубокими лунками.In fig. 4 shows the relative distribution of 3-FL inside and outside the cells of a modified E. coli strain (strain 3) with and without integration of the fred gene in accordance with SEQ ID NO: 2, encoding the expression of the Fred MFS transporter protein in accordance with SEQ ID. NO: 1, strain 4 and strain 3, respectively. Data were obtained by fed-batch culture analysis using the deep well method.

На фиг. 5 показана относительная продукция LNT модифицированным штаммом E.coli (штамм 5) с интеграцией и без интеграции гена fred в соответствии с SEQ ID NO: 2, кодирующего экспрессию белкатранспортера Fred MFS в соответствии с SEQ ID NO: 1, штаммы 6 и 7 по сравнению со штаммом 5, соответственно. Данные получены анализом культуры с подпиткой способом с глубокими лунками.In fig. 5 shows the relative production of LNT by a modified E. coli strain (strain 5) with and without integration of the fred gene in accordance with SEQ ID NO: 2, encoding the expression of the Fred MFS transporter protein in accordance with SEQ ID NO: 1, strains 6 and 7 compared with strain 5, respectively. Data were obtained by fed-batch culture analysis using the deep well method.

На фиг. 6 показано относительное распределение LNT внутри и снаружи клеток модифицированного штамма E.coli (штамм 5) с интеграцией и без интеграции гена fred в соответствии с SEQ ID NO: 2, коIn fig. 6 shows the relative distribution of LNT inside and outside the cells of a modified E. coli strain (strain 5) with and without integration of the fred gene in accordance with SEQ ID NO: 2, which

- 3 046005 дирующего экспрессию белка-транспортера Fred MFS. согласно SEQ ID NO: 1, штаммы 6 и 7 по сравнению со штаммом 5, соответственно. Данные получены анализом культуры с подпиткой способом с глубокими лунками.- 3 046005 directing the expression of the Fred MFS transporter protein. according to SEQ ID NO: 1, strains 6 and 7 compared to strain 5, respectively. Data were obtained by fed-batch culture analysis using the deep well method.

На фиг. 7 показан процент (%) относительных концентраций LNnT в общих образцах для семи штаммов, которые экспрессируют гены GlcNacT и Gal4T и ген гетерологичного транспортера, yberC0001_9420, bad, fred, marc, vag, пес или yabM, соответственно. Штамм МР3672 экспрессирует гены гликозилтрансферазы и не экспрессирует гены транспортера;In fig. Figure 7 shows the percentage (%) of relative concentrations of LNnT in total samples for seven strains that express the GlcNacT and Gal4T genes and the heterologous transporter gene, yberC0001_9420, bad, fred, marc, vag, dog, or yabM, respectively. Strain MP3672 expresses glycosyltransferase genes and does not express transporter genes;

На фиг. 8 показан процент (%) относительных концентраций LNnT в супернатанте клеток, экспрессирующих vag или yabM.In fig. Figure 8 shows the percentage (%) of relative concentrations of LNnT in the supernatant of cells expressing vag or yabM.

Осуществление изобретенияCarrying out the invention

Далее воплощения изобретения будут описаны более подробно. Каждая конкретная вариация признаков может быть применена к другим воплощениям изобретения, если специально не указано иное.In the following, embodiments of the invention will be described in more detail. Each specific feature variation may be applied to other embodiments of the invention unless specifically stated otherwise.

Как правило, все применяемые в настоящем документе термины следует интерпретировать в соответствии с их обычным значением в технической области и как применимые ко всем аспектам и воплощениям изобретения, если явно не определено или не указано иное.In general, all terms used herein should be interpreted in accordance with their ordinary meaning in the technical field and as applicable to all aspects and embodiments of the invention, unless expressly defined or indicated otherwise.

Все ссылки на [клетка, последовательность, ген, транспортер, стадия и т.д.] нужно интерпретировать открыто как относящиеся, по меньшей мере, к одному экземпляру указанной клетки, последовательности, гена, транспортера, стадии и т.д. если прямо не указано иное.All references to [cell, sequence, gene, transporter, stage, etc.] should be interpreted explicitly as referring to at least one instance of the specified cell, sequence, gene, transporter, stage, etc. unless expressly stated otherwise.

Этапы любого раскрытого в настоящем документе способа не обязательно выполнять в точном раскрытом порядке, если это не указано явно.The steps of any method disclosed herein do not have to be performed in the exact order disclosed unless explicitly stated.

Настоящее изобретение в целом относится к генетически модифицированной клетке для эффективного производства олигосахаридов и к применению указанной генетически модифицированной клетки в способе получения олигосахаридов. В особенности, настоящее изобретение относится к генетически модифицированной клетке, способной синтезировать олигосахарид, предпочтительно, гетерологичный олигосахарид, в особенности, олигосахарид грудного молока (ОГМ).The present invention generally relates to a genetically modified cell for efficient production of oligosaccharides and to the use of said genetically modified cell in a process for producing oligosaccharides. In particular, the present invention relates to a genetically modified cell capable of synthesizing an oligosaccharide, preferably a heterologous oligosaccharide, especially human milk oligosaccharide (HMO).

Соответственно, генетически модифицированная клетка по изобретению модифицируют для экспрессии набора рекомбинантных нуклеиновых кислот, которые необходимы для синтеза клетками одного или нескольких ОГМ (которые позволяют клетке-хозяину синтезировать один или несколько ОГМ), таких как гены, кодирующие один или несколько ферментов с гликозилтрансферазной активностью, как описано ниже. Продуцирующую олигосахарид рекомбинантную клетку по изобретению дополнительно модифицируют для включения гетерологичной последовательности рекомбинантной нуклеиновой кислоты, предпочтительно, последовательности ДНК, кодирующей предположительный транспортный белок MFS (major facilitator superfamily, суперсемейство основных посредников), происходящий из бактерии Yersinia frederiksenii.Accordingly, the genetically modified cell of the invention is modified to express a set of recombinant nucleic acids that are necessary for the cell to synthesize one or more OGMs (which enable the host cell to synthesize one or more OGMs), such as genes encoding one or more enzymes with glycosyltransferase activity, as described below. The oligosaccharide-producing recombinant cell of the invention is further modified to include a heterologous recombinant nucleic acid sequence, preferably a DNA sequence encoding a putative MFS (major facilitator superfamily) transport protein derived from the bacterium Yersinia frederiksenii.

Более конкретно, изобретение относится к генетически модифицированной клетке, оптимизированной для продукции одного или нескольких конкретных олигосахаридов, в особенности, одного или нескольких конкретных ОГМ, включающей рекомбинантную нуклеиновую кислоту, кодирующую белок Fred.More specifically, the invention relates to a genetically modified cell optimized for the production of one or more specific oligosaccharides, in particular one or more specific OGMs, comprising a recombinant nucleic acid encoding the Fred protein.

Последовательность нуклеиновой кислоты, кодирующая белок Fred, имеющая последовательность нуклеиновой кислоты SEQ ID NO: 2, идентифицируют в настоящем документе как нуклеиновая кислота/ДНК, кодирующая Fred, или ген fred, или fred.The nucleic acid sequence encoding the Fred protein having the nucleic acid sequence SEQ ID NO: 2 is identified herein as the nucleic acid/DNA encoding Fred, or the fred gene, or fred.

Белок-транспортер MFS, обозначенный в настоящем документе как белок Fred или транспортер Fred или Fred, взаимозаменяемо, имеет аминокислотную последовательность SEQ ID NO: 1; Аминокислотная последовательность, обозначенная в настоящем документе как SEQ ID NO: 1, представляет собой аминокислотную последовательность, которая имеет 100% идентичность с аминокислотной последовательностью, имеющей номер доступа GenBank ID WP_087817556.1.The MFS transporter protein, referred to herein as Fred protein or Fred or Fred transporter, interchangeably, has the amino acid sequence of SEQ ID NO: 1; The amino acid sequence designated herein as SEQ ID NO: 1 is an amino acid sequence that has 100% identity with the amino acid sequence having GenBank accession ID WP_087817556.1.

Соответственно, один аспект изобретения относится к генетически модифицированной клетке, способной продуцировать один или несколько олигосахаридов грудного молока (ОГМ), в котором указанная генетически модифицированная клетка включает гетерологичную последовательность нуклеиновой кислоты, кодирующую полипептид, способный транспортировать сахар, причем указанная последовательность нуклеиновой кислоты, имеющая, по меньшей мере, 70%, более предпочтительно, по меньшей мере, 80%, более предпочтительно, по меньшей мере, 90%, более предпочтительно, по меньшей мере, 95% и еще более предпочтительно, по меньшей мере, 99% идентичности с последовательностью SEQ ID NO: 2.Accordingly, one aspect of the invention relates to a genetically modified cell capable of producing one or more human milk oligosaccharides (HMOs), wherein said genetically modified cell includes a heterologous nucleic acid sequence encoding a polypeptide capable of transporting a sugar, wherein said nucleic acid sequence having, at least 70%, more preferably at least 80%, more preferably at least 90%, more preferably at least 95% and even more preferably at least 99% sequence identity SEQ ID NO: 2.

Кроме того, изобретение относится к генетически модифицированной клетке, оптимизированной для продукции одного или нескольких конкретных олигосахаридов, в особенности, одной или нескольких конкретных ОГМ, включающей рекомбинантную нуклеиновую кислоту, кодирующую белок, содержащий более 95,4%, например, по меньшей мере, 95,5% идентичности последовательности, предпочтительно, по меньшей мере, на 96%, более предпочтительно, по меньшей мере, на 97%, более предпочтительно, по меньшей мере, на 98% и еще более предпочтительно, по меньшей мере, на 99% идентичности последовательности с аминокислотной последовательностью SEQ ID NO: 1.In addition, the invention relates to a genetically modified cell optimized for the production of one or more specific oligosaccharides, in particular one or more specific OGM, comprising a recombinant nucleic acid encoding a protein containing more than 95.4%, for example, at least 95 .5% sequence identity, preferably at least 96%, more preferably at least 97%, more preferably at least 98%, and even more preferably at least 99% identity sequences with amino acid sequence SEQ ID NO: 1.

Соответственно, один аспект изобретения относится к генетически модифицированной клетке, способной продуцировать один или несколько олигосахаридов грудного молока (ОГМ), где указанная генеAccordingly, one aspect of the invention relates to a genetically modified cell capable of producing one or more human milk oligosaccharides (HMO), wherein said gene

- 4 046005 тически модифицированная клетка включает гетерологичную последовательность нуклеиновой кислоты, кодирующую полипептид, способный транспортировать сахар, причем указанная последовательность нуклеиновой кислоты, имеющая, по меньшей мере, 70%, более предпочтительно, по меньшей мере, 75%, более предпочтительно, по меньшей мере, 80%, более предпочтительно, по меньшей мере, 90% и еще более предпочтительно, по меньшей мере, 95%, например, на 99% идентичности с последовательностью SEQ ID NO: 2.- 4 046005 a chemically modified cell comprises a heterologous nucleic acid sequence encoding a polypeptide capable of transporting sugar, said nucleic acid sequence having at least 70%, more preferably at least 75%, more preferably at least , 80%, more preferably at least 90% and even more preferably at least 95%, for example 99% identity with the sequence of SEQ ID NO: 2.

Соответственно, другой аспект изобретения относится к генетически модифицированной клетке, способной продуцировать одну или несколько ОГМ, при этом указанная клетка включает рекомбинантную нуклеиновую кислоту, кодирующую белок SEQ ID NO: 1, или его функциональный гомолог, аминокислотная последовательность которого идентична, по меньшей мере, на 95,4%, предпочтительно, по меньшей мере, на 96%, более предпочтительно, по меньшей мере, на 97%, более предпочтительно, по меньшей мере, на 99% идентична SEQ ID NO: 1.Accordingly, another aspect of the invention relates to a genetically modified cell capable of producing one or more HGMs, wherein said cell includes a recombinant nucleic acid encoding a protein of SEQ ID NO: 1, or a functional homolog thereof, the amino acid sequence of which is identical at least in 95.4%, preferably at least 96%, more preferably at least 97%, more preferably at least 99% identical to SEQ ID NO: 1.

Под термином функциональный гомолог в настоящем контексте подразумевается белок, аминокислотная последовательность которого более чем на 95,4%, например, на 95,5-99,9% идентична SEQ ID NO: 1, и имеет полезную функцию для достижения, по меньшей мере, одного полезного эффекта изобретения, т.е. увеличение общей продукции ОГМ или выборки ОГМ генетически модифицированной клеткой, облегчают восстановление продуцированного(продуцированных) ОГМ, эффективность продукции ОГМ и/или жизнеспособность клетки, продуцирующей ОГМ.By the term functional homologue, as used herein, is meant a protein whose amino acid sequence is greater than 95.4%, e.g., 95.5-99.9% identical to SEQ ID NO: 1, and has a useful function to achieve at least one useful effect of the invention, i.e. increasing the total production of OGM or sampling of OGM by the genetically modified cell facilitates the recovery of the produced OGM, the efficiency of OGM production, and/or the viability of the OGM producing cell.

Под термином суперсемейства основных посредников (MFS) подразумевают большое и исключительно разнообразное семейство класса вторичных активных транспортеров, которые отвечают за транспорт ряда различных субстратов, включая сахара, лекарства, гидрофобные молекулы, пептиды, органические ионы и т.д. Специфичность белков-переносчиков сахара крайне непредсказуема, и идентификация нового белка-переносчика со специфичностью, например, в отношении олигосахаридов требует необременительных лабораторных экспериментов (более подробную информацию смотри в обзоре Reddy V.S. et al., (2012), FEBS J. 279(11): 2022-2035). Термин переносчик MFS в данном контексте означает белок, который облегчает транспорт олигосахарида, предпочтительно ОГМ, через клеточную мембрану, предпочтительно транспорт ОГМ/олигосахарида, синтезированного генетически модифицированной клеткой, из цитозоля клетки во внешнюю среду клетки, предпочтительно ОГМ/олигосахарида, включающего три или четыре звена сахара, например, 2'-FL, 3-FL, LNT-2, LNT, LNnT, 3'-SL или 6'-SL. Дополнительно или альтернативно переносчик MFS может также способствовать оттоку молекул, которые не считаются ОГМ или олигосахаридами согласно настоящему изобретению, таких как лактоза, глюкоза, клеточные метаболиты или токсины.The term master messenger superfamilies (MFS) refers to a large and extremely diverse family of a class of secondary active transporters that are responsible for the transport of a number of different substrates, including sugars, drugs, hydrophobic molecules, peptides, organic ions, etc. The specificity of sugar transport proteins is highly unpredictable, and the identification of a new transport protein with specificity for, for example, oligosaccharides requires simple laboratory experiments (for more information, see review by Reddy V.S. et al., (2012), FEBS J. 279(11) : 2022-2035). The term MFS transporter in this context means a protein that facilitates the transport of an oligosaccharide, preferably OGM, across the cell membrane, preferably the transport of an OGM/oligosaccharide synthesized by a genetically modified cell from the cytosol of the cell to the external environment of the cell, preferably an OGM/oligosaccharide comprising three or four units sugars, for example 2'-FL, 3-FL, LNT-2, LNT, LNnT, 3'-SL or 6'-SL. Additionally or alternatively, the MFS transporter may also promote the efflux of molecules that are not considered OGM or oligosaccharides according to the present invention, such as lactose, glucose, cellular metabolites or toxins.

Термин идентичность последовательности [определенного]% в контексте двух или более последовательностей нуклеиновых кислот или аминокислот означает, что две или более последовательностей имеют общие нуклеотиды или аминокислотные остатки в данном проценте при сравнении и выравнивании для максимального соответствие в окне сравнения или обозначенных последовательностях нуклеиновых кислот или аминокислот (т.е. последовательности имеют, по меньшей мере, 90-процентную (%) идентичность). Процентную идентичность последовательностей нуклеиновых кислот или аминокислот можно определить с помощью алгоритма сравнения последовательностей BLAST 2.0 с параметрами по умолчанию или путем ручного выравнивания и визуального контроля (см., например, http://www.ncbi.nlm.nih.gov/BLAST/). Это определение также применимо к комплементу тестируемой последовательности и к последовательностям, которые имеют делеции и/или добавления, а также к тем, которые имеют замены. Примером алгоритма, подходящего для определения процента идентичности, сходства последовательностей и выравнивания, служит алгоритм BLAST 2.2.20+, описанный в Altschul et al. Nucl. Acids Res. 25, 3389 (1997). BLAST 2.2.20+ применяют для определения процента идентичности последовательностей нуклеиновых кислот и белков по изобретению. Программное обеспечение для проведения анализов BLAST общедоступно через Национальный центр биотехнологической информации, (http://www.ncbi.nlm.nih.gov/). CLUSTAL Omega (http://www.ebi.ac.uk/Tools/msa/clustalo/), EMBOSS Needle (http://www.ebi.ac.uk/Tools/psa/emboss_needle/), MAFFT (http://mafft.cbrc.jp/alignment/server/) or MUSCLE (http://www.ebi.ac.uk/Tools/msa/muscle/) представляют собой примеры алгоритмов выравнивания последовательностей.The term [specified]% sequence identity in the context of two or more nucleic acid or amino acid sequences means that two or more sequences share a given percentage of nucleotides or amino acid residues when compared and aligned for maximum agreement in the comparison window or designated nucleic acid or amino acid sequences (i.e., the sequences have at least 90 percent (%) identity). Percent identity of nucleic acid or amino acid sequences can be determined using the BLAST 2.0 sequence comparison algorithm with default parameters or by manual alignment and visual inspection (see, for example, http://www.ncbi.nlm.nih.gov/BLAST/) . This definition also applies to the complement of the test sequence and to sequences that have deletions and/or additions, as well as those that have substitutions. An example of an algorithm suitable for determining percent identity, sequence similarity and alignment is the BLAST 2.2.20+ algorithm described in Altschul et al. Nucl. Acids Res. 25, 3389 (1997). BLAST 2.2.20+ is used to determine the percentage identity of nucleic acid and protein sequences according to the invention. Software for performing BLAST analyzes is publicly available through the National Center for Biotechnology Information, (http://www.ncbi.nlm.nih.gov/). CLUSTAL Omega (http://www.ebi.ac.uk/Tools/msa/clustalo/), EMBOSS Needle (http://www.ebi.ac.uk/Tools/psa/emboss_needle/), MAFFT (http: //mafft.cbrc.jp/alignment/server/) or MUSCLE (http://www.ebi.ac.uk/Tools/msa/muscle/) are examples of sequence alignment algorithms.

В контексте изобретения термин олигосахарид означает сахаридный полимер, содержащий ряд моносахаридных звеньев. В некоторых воплощениях предпочтительными олигосахариды представляют собой полимеры сахаридов, состоящие из трех или четырех моносахаридных звеньев, т.е. трисахариды или тетрасахариды. Предпочтительные олигосахариды изобретения представляют собой олигосахариды грудного молока (ОГМ).In the context of the invention, the term oligosaccharide means a saccharide polymer containing a number of monosaccharide units. In some embodiments, preferred oligosaccharides are polymers of saccharides consisting of three or four monosaccharide units, i.e. trisaccharides or tetrasaccharides. Preferred oligosaccharides of the invention are human milk oligosaccharides (HMOs).

ОГМ.OGM.

Термин олигосахарид грудного молока или ОГМ в данном контексте означает сложный углевод, обнаруженный в грудном молоке человека (для отсылки смотри Urashima et al.: Milk Oligosaccharides. Nova Science Publisher (2011); или Chen, Adv. Carbohydr. Chem. Biochem. 72, 113 (2015)). ОГМ имеют структуру ядра, включающую единицу лактозы на восстанавливающем конце, которая может быть удлинена одной или несколькими единицами e-N-ацетиллактозаминила и/или одной или нескольThe term human milk oligosaccharide or HMO in this context means the complex carbohydrate found in human breast milk (for reference, see Urashima et al.: Milk Oligosaccharides. Nova Science Publisher (2011); or Chen, Adv. Carbohydr. Chem. Biochem. 72, 113 (2015)). HMOs have a core structure comprising a lactose unit at the reducing end, which may be extended by one or more e-N-acetyllactosaminyl units and/or one or more

- 5 046005 кими единицами β-лакто-Н-биозила, и эта структура ядра может быть замещенный α-Lфукопиранозильной и/или α-Ν-ацетилнейраминильной (сиалильной) частью. В связи с этим некислотные (или нейтральные) ОГМ лишены остатка сиалила, а кислые ОГМ имеют в своей структуре хотя бы один остаток сиалила. Некислотный (или нейтральный) ОГМ может быть фукозилированным или нефукозилированным. Примеры таких нейтральных нефукозилированных ОГМ включают лакто-Н-триозу 2 (LNT2), лакто-Н-тетраозу (LNT), лакто-Н-неотетраозу (LNnT), лакто-Н-неогексаозу (LNnH), паралакто-Nнеогексаозу (pLNnH), паралакто-Н-гексаозу (pL-НН) и лакто-Н-гексаозу (L-НН). Примеры нейтральных фукозилированных ОГМ включают 2'-фукозиллактозу (2'-FL), лакто-Н-фукопентаозу I (LOTT-I), лактоН-дифукогексаозу I (LNDFH-I), 3-фукозиллактозу (3-FL), дифукозиллактозу (DFL), лакто-Нфукопентаозу II (LXER-II), лакто-Н-фукопентаозу III (LMEP-III), лакто-Н-дифукогексаозу III (LNDFHIII), фукозиллакто-Н-гексаозу II (FLNH-II), лакто-Н-фукопентаозу V (LOTT-V), лакто-Н-дифукогексаозу II (LНDFH-II), фукозил-лакто-Н-гексаозу I (ЕЕ-НН-!). фукозилпаралакто-Н-гексаозу I (ЕрЕНН-I). фукозилпаралакто-Н-неогексаозу II (Е-pLNnH II) и фукозиллакто-Н-неогексаозу (ЕLNnH). Примеры кислотных ОГМ включают З'-сиалиллактозу (3'-SL), 6'-сиалиллактозу (6'-SL), 3-фукозил-3'-сиалиллактозу (FSL), З'-О-сиалиллакто-Н-тетраозу a (LST а), фукозил-LST а (FLST а), 6'-О-сиалиллакто-Н-тетраозу b (LST b), фукозил-LST b (FLST b), 6'-О-сиалиллакто-Н-неотетраозу (LST c), фукозил-LST с (FLST c), З'-Осиалиллакто-Н-неотетраозу (LST d), фукозил-LST d (FLST d), сиалиллакто-Н-гексаозу (SLNH), сиалиллакто-Н-неогексаозу I (SLНH-I), сиалиллакто-Н-неогексаозу II (SLNH-II) и дисиалиллакто-Н-тетраозу (DSLNT). В контексте настоящего изобретения лактозу не рассматривают как разновидность ОГМ.- 5 046005 β-lacto-N-biosyl units, and this core structure may be substituted by an α-L-fucopyranosyl and/or α-N-acetylneuraminyl (sialyl) moiety. In this regard, non-acidic (or neutral) OGMs are devoid of a sialyl residue, while acidic OHMs have at least one sialyl residue in their structure. Non-acidic (or neutral) OGM can be fucosylated or non-fucosylated. Examples of such neutral non-fucosylated HMOs include lacto-N-triose 2 (LNT2), lacto-N-tetraose (LNT), lacto-N-neotetraose (LNnT), lacto-N-neohexaose (LNnH), paralacto-Nneohexaose (pLNnH), paralacto-H-hexaose (pL-НН) and lacto-Н-hexaose (L-НН). Examples of neutral fucosylated HMOs include 2'-fucosyllactose (2'-FL), lacto-H-fucopentaose I (LOTT-I), lacto-H-difucohexaose I (LNDFH-I), 3-fucosyllactose (3-FL), difucosyllactose (DFL ), lacto-N-fucopentaose II (LXER-II), lacto-N-fucopentaose III (LMEP-III), lacto-N-difucohexaose III (LNDFHIII), fucosyllacto-N-hexaose II (FLNH-II), lacto-N- fucopentaose V (LOTT-V), lacto-H-difucohexaose II (LНDFH-II), fucosyl-lacto-H-hexaose I (EE-HH-!). fucosylparalacto-H-hexaose I (EHH-I). fucosylparalacto-N-neohexaose II (E-pLNnH II) and fucosyllacto-N-neohexaose (ELNnH). Examples of acidic HMOs include 3'-sialyllactose (3'-SL), 6'-sialyllactose (6'-SL), 3-fucosyl-3'-sialyllactose (FSL), 3'-O-sialyllacto-H-tetraose a ( LST a), fucosyl-LST a (FLST a), 6'-O-sialyllacto-H-tetraose b (LST b), fucosyl-LST b (FLST b), 6'-O-sialyllacto-H-neotetraose (LST c), fucosyl-LST c (FLST c), 3'-Osialyllacto-H-neotetraose (LST d), fucosyl-LST d (FLST d), sialyllacto-H-hexaose (SLNH), sialyllacto-H-neohexaose I ( SLHH-I), sialyllacto-H-neohexaose II (SLNH-II) and disialyl lacto-H-tetraose (DSLNT). In the context of the present invention, lactose is not considered as a type of HGM.

В некоторых воплощениях изобретения предпочтительными могут быть три-ОГМ и тетра-ОГМ, например, трисахариды 2'-FL, 3-FL, LOT^, З'-SL, 6'-SL, и тетрасахариды DFL, LNT, L^T, FSL.In some embodiments of the invention, tri-OHM and tetra-OHM may be preferred, for example, trisaccharides 2'-FL, 3-FL, LOT^, 3'-SL, 6'-SL, and tetrasaccharides DFL, LNT, L^T, FSL.

В предпочтительном в настоящее время аспекте изобретения предпочтительные ОГМ представляют собой три-ОГМ, в особенности, трисахариды, выбранные из 2'-FL и 3-FL, и тетрасахариды, выбранные из DFL и LOT, такие как, в особенности, 3-FL.In a presently preferred aspect of the invention, preferred OGMs are tri-OHMs, especially trisaccharides selected from 2'-FL and 3-FL, and tetrasaccharides selected from DFL and LOT, such as especially 3-FL.

2'-FL.2'-FL.

2'-Фукозиллактоза (2'-FL или 2'0-фукозиллактоза) представляет собой трисахарид, точнее, фукозилированный, нейтральный трисахарид, состоящий из единиц L-фукозы, D-галактозы и D-глюкозы (Fuca1-2Gaiei-4Glc). Это наиболее распространенный олигосахарид грудного молока (ОГМ), естественным образом присутствующий в человеческом грудном молоке, составляя около 30% всех ОГМ. В генетически модифицированной клетке или в ферментативной реакции 2'-FL продуцируется главным образом в результате ферментативной реакции а-1,2-фукозилтрансферазы с лактозой и донором фукозила.2'-Fucosyllactose (2'-FL or 2'0-fucosyllactose) is a trisaccharide, more precisely a fucosylated, neutral trisaccharide, consisting of L-fucose, D-galactose and D-glucose units (Fuca1-2Gaiei-4Glc). It is the most abundant human milk oligosaccharide (HMO) naturally present in human breast milk, accounting for about 30% of all HMOs. In a genetically modified cell or enzymatic reaction, 2'-FL is produced primarily by the enzymatic reaction of α-1,2-fucosyltransferase with lactose and a fucosyl donor.

3-FL.3-FL.

З-Фукозиллактоза (3-FL) представляет собой трисахарид, точнее, фукозилированный, нейтральный трисахарид, состоящий из D-галактозы, L-фукозы и D-глюкозы (Gaiei-4(Fuca1-3)Glc). Он естественным образом присутствует в грудном молоке. В генетически модифицированной клетке или в ферментативной реакции 3-FL продуцируется, главным образом, ферментативной реакцией а-1,3-фукозилтрансферазы или а-1,3/4-фукозилтрансферазы с лактозой и донором фукозила.3-Fucosyllactose (3-FL) is a trisaccharide, more precisely a fucosylated, neutral trisaccharide consisting of D-galactose, L-fucose and D-glucose (Gaiei-4(Fuca1-3)Glc). It is naturally present in breast milk. In a genetically modified cell or enzymatic reaction, 3-FL is produced primarily by the enzymatic reaction of α-1,3-fucosyltransferase or α-1,3/4-fucosyltransferase with lactose and a fucosyl donor.

LNT.LNT.

Лакто-Н-тетраоза (LOT) представляет собой тетрасахарид, точнее, нейтральный тетрасахарид, состоящий из галактозы, Н-ацетилглюкозамина, галактозы и глюкозы (GlcNAcβ1-3Galβ1-4Glc). Он естественным образом присутствует в грудном молоке.Lacto-N-tetraose (LOT) is a tetrasaccharide, more precisely a neutral tetrasaccharide, consisting of galactose, N-acetylglucosamine, galactose and glucose (GlcNAcβ1-3Galβ1-4Glc). It is naturally present in breast milk.

DFL.DFL.

Дифукозиллактоза (DFL или 2',3-ди-О-фукозиллактоза) представляет собой олигосахарид, точнее, фукузилированный нейтральный тетрасахарид, состоящий из L-фукозы, D-галактозы, L-фукозы и Dглюкозы (Fuca1-2Gaiei-4(Fuca1-3)Glc). Он естественным образом присутствует в грудном молоке. В генетически модифицированной клетке или в ферментативной реакции DFL продуцируется, главным образом, ферментативной реакцией а-1,2-фукозилтрансферазы, а-1,3-фукозилтрансферазы и/или α1,З/4-фукозилтрансферазы с лактозой и двумя донорами фукозилов.Difucosyllactose (DFL or 2',3-di-O-fucosyllactose) is an oligosaccharide, more precisely a fucusylated neutral tetrasaccharide, consisting of L-fucose, D-galactose, L-fucose and D-glucose (Fuca1-2Gaiei-4(Fuca1-3 )Glc). It is naturally present in breast milk. In a genetically modified cell or enzymatic reaction, DFL is produced primarily by the enzymatic reaction of α-1,2-fucosyltransferase, α-1,3-fucosyltransferase and/or α1,3/4-fucosyltransferase with lactose and two fucosyl donors.

Функциональные ферменты.Functional enzymes.

Чтобы иметь возможность синтезировать один или несколько ОГМ, рекомбинантная клетка по изобретению включает, по меньшей мере, одну рекомбинантную нуклеиновую кислоту, которая кодирует функциональный фермент с гликозилтрансферазной активностью. Ген галактозилтрансферазы может быть интегрирован в геном (посредством хромосомной интеграции) генетически модифицированной клетки, или, альтернативно, он может быть включен в плазмидную ДНК и экспрессироваться как переносимый плазмидой. Если для производства ОГМ необходимы две или более гликозилтрансфераз, например, LKT или LNriΓ, то две или более рекомбинантных нуклеиновых кислоты, кодирующих разные ферменты с гликозилтрансферазной активностью, могут быть интегрированы в геном и/или экспрессированы из плазмиды, например в-1,3-Нацетилглюкозаминилтрансферазу (первая рекомбинантная нуклеиновая кислота, кодирующая первую гликозилтрансферазу) в комбинации с в-1,3-галактозилтрансферазой (вторая рекомбинантная нуклеиновая кислота, кодирующая вторую гликозилтрансферазу) для продукции LKT, где первая и вторая рекомбинантные нуклеиновые кислоты могут быть независимо друг от друга интегрированы в хромосомно или на плазмиде.To be able to synthesize one or more OGMs, the recombinant cell of the invention includes at least one recombinant nucleic acid that encodes a functional enzyme with glycosyltransferase activity. The galactosyltransferase gene can be integrated into the genome (via chromosomal integration) of a genetically modified cell, or, alternatively, it can be included in plasmid DNA and expressed as plasmid-borne. If two or more glycosyltransferases, such as LKT or LNriΓ, are required for the production of OGM, then two or more recombinant nucleic acids encoding different enzymes with glycosyltransferase activity can be integrated into the genome and/or expressed from a plasmid, for example β-1,3- Acetylglucosaminyltransferase (the first recombinant nucleic acid encoding the first glycosyltransferase) in combination with β-1,3-galactosyltransferase (the second recombinant nucleic acid encoding the second glycosyltransferase) to produce LKT, where the first and second recombinant nucleic acids can be independently integrated into chromosomal or on a plasmid.

- 6 046005- 6 046005

В одном предпочтительном воплощении, как первая, так и вторая рекомбинантные нуклеиновые кислоты интегрированы в хромосому клетки-продуцента; в другом воплощении, по меньшей мере, одна из первой и второй гликозилтрансфераз представляет собой переносимую плазмидой. Белок/фермент с гликозилтрансферазной активностью (гликозилтрансфераза) может быть выбран в различных воплощениях из ферментов, обладающих активностью а-1,2-фукозилтрансферазы, а-1,3-фукозилтрансферазы, α1,3/4-фукозилтрансферазы, α-1,4-фукозилтрансферазы, а-2,3-сиалилтрансферазы, а-2,6-сиалилтрансферазы, в-1,3-Л-ацетилглюкозаминилтрансферазы, в-1,6-Л-ацетилглюкозаминилтрансферазы, β-1,3галактозилтрансферазы и в-1,4-галактозилтрансферазы. Например, для производства 2'-FL требуется, чтобы модифицированная клетка экспрессировала активный фермент а-1,2-фукозилтрансферазу; для продукции 3-FL модифицированная клетка нуждается в экспрессии активного фермента α-1,3фукозилтрансферазы; для продукции LNT модифицированная клетка должна экспрессировать по меньшей мере две гликозилтрансферазы, в-1,3-Л-ацетилглюкозаминилтрансферазу и β-1,3галактозилтрансферазу; для продукции 6'-SL модифицированная клетка должна экспрессировать активный фермент а-2,6-сиалилтрансферазу и путь для синтеза СМР-сиаловой кислоты; для производства 3'SL модифицированная клетка должна экспрессировать активный фермент а-2,3-сиалилтрансферазу и путь для синтеза СМР-сиаловой кислоты. Некоторые неограничивающие воплощения белков, обладающих гликозилтрансферазной активностью, которые могут кодироваться рекомбинантными генами, включенными в клетку-продуцент, могут быть выбраны из неограничивающих примеров табл. 1.In one preferred embodiment, both the first and second recombinant nucleic acids are integrated into the chromosome of the producing cell; in another embodiment, at least one of the first and second glycosyltransferases is plasmid-borne. The protein/enzyme with glycosyltransferase activity (glycosyltransferase) can be selected in various embodiments from enzymes having α-1,2-fucosyltransferase, α-1,3-fucosyltransferase, α1,3/4-fucosyltransferase, α-1,4- fucosyltransferases, α-2,3-sialyltransferases, α-2,6-sialyltransferases, β-1,3-L-acetylglucosaminyltransferases, β-1,6-L-acetylglucosaminyltransferases, β-1,3-galactosyltransferases and β-1,4- galactosyltransferases. For example, the production of 2'-FL requires that the modified cell express the active enzyme α-1,2-fucosyltransferase; for the production of 3-FL, the modified cell requires the expression of the active enzyme α-1,3 fucosyltransferase; to produce LNT, the modified cell must express at least two glycosyltransferases, β-1,3-L-acetylglucosaminyltransferase and β-1,3galactosyltransferase; to produce 6'-SL, the modified cell must express the active enzyme a-2,6-sialyltransferase and the pathway for the synthesis of CMP-sialic acid; To produce 3'SL, the modified cell must express the active enzyme α-2,3-sialyltransferase and the pathway for the synthesis of CMP-sialic acid. Certain non-limiting embodiments of proteins having glycosyltransferase activity that may be encoded by recombinant genes included in the producer cell may be selected from the non-limiting examples in Table. 1.

Таблица 1Table 1

Ген Gene ID белковой последовательности (GenBank) Protein sequence ID (GenBank) Описание Description Пример ОГМ OGM example IgtANm IgtANm WP 002248149.1 WP 002248149.1 ββ-1,3-Ν- ацетилглюкозаминтрансфераза ββ-1,3-Ν- acetylglucosamine transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH lgtA_Nm_MC58 lgtA_Nm_MC58 AAF42258.1 AAF42258.1 β-1,3-Ν- ацетилглюкозаминтрансфераза β-1,3-Ν- acetylglucosamine transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH IgtAHd IgtAHd AAN05638.1 AAN05638.1 β-1,3-Ν- ацетилглюкозаминтрансфераза β-1,3-Ν- acetylglucosamine transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH IgtANg_PID2 IgtANg_PID2 AAK70338.1 AAK70338.1 β-1,3-Ν- ацетилглюкозаминтрансфераза β-1,3-Ν- acetylglucosamine transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH IgtANgNCCP 1 1945 IgtANgNCCP 1 1945 ACF31229.1 ACF31229.1 β-1,3-Ν- ацетилглюкозаминтрансфераза β-1,3-Ν- acetylglucosamine transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH IgtA Past IgtA Past AAKO2595.1 AAKO2595.1 β-1,3-Ν- ацетилглюкозаминтрансфераза β-1,3-Ν- acetylglucosamine transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH IgtANc IgtANc EEZ72046.1 EEZ72046.1 β-1,3-Ν- ацетилглюкозаминтрансфераза β-1,3-Ν- acetylglucosamine transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH lgtA_Nm_87255 lgtA_Nm_87255 ELK60643.1 ELK60643.1 β-1,3-Ν- ацетилглюкозаминтрансфераза β-1,3-Ν- acetylglucosamine transferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, FpLNH I, pLNnH galT Hp/HP0826 galT Hp/HP0826 NP 207619.1 NP 207619.1 ββ-1,4- галактозилтрансфераза ββ-1,4- galactosyltransferase LNnT, LNFP-III, LNFP-VI, pLNH I, F-pLNH I, pLNnH LNnT, LNFP-III, LNFP-VI, pLNH I, F-pLNH I, pLNnH

- 7 046005- 7 046005

galTNm/ IgtB galTNm/ IgtB AAF42257.1 AAF42257.1 β-1,4- галактозилтрансфераза β-1,4- galactosyltransferase LNnT, LNFP-III, LNFP-VI, pLNH I, F-pLNH I, pLNnH LNnT, LNFP-III, LNFP-VI, pLNH I, F-pLNH I, pLNnH wbgO wbgO WP 000582563.1 WP 000582563.1 β-1,3- галактозилтрансфераза β-1,3- galactosyltransferase LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI cpsIBJ cpsIBJ ABO50723.1 ABO50723.1 ββ-1,3 -галактозилтрансфераза ββ-1,3-galactosyltransferase LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI Jhp0563 Jhp0563 AEZ55696.1 AEZ55696.1 β-1,3- галактозилтрансфераза β-1,3- galactosyltransferase LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI galTK galTK homologous to BD182026 homologous to BD182026 β-1,3- галактозилтрансфераза β-1,3- galactosyltransferase LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, FpLNHI fiitC fiitC WP 080473865.1 WP 080473865.1 а-1,2- фукозилтрансфераза a-1,2- fucosyltransferase 2'-FL, DFL, LNFP-I, LNDFH-I 2'-FL, DFL, LNFP-I, LNDFH-I FucT2_HpUA802 FucT2_HpUA802 AAC99764.1 AAC99764.1 а-1,2- фукозилтрансфераза a-1,2- fucosyltransferase 2'-FL, DFL, LNFP-I, LNDFH-I 2'-FL, DFL, LNFP-I, LNDFH-I FucT2_EcO126t FucT2_EcO126t ABE98421.1 ABE98421.1 а-1,2- фукозилтрансфераза a-1,2- fucosyltransferase 2'-FL, DFL, LNFP-I, LNDFH-I 2'-FL, DFL, LNFP-I, LNDFH-I FucT2_Hml2198 FucT2_Hml2198 CBG40460.1 CBG40460.1 а-1,2- фукозилтрансфераза a-1,2- fucosyltransferase 2'-FL, DFL, LNFP-I, LNDFH-I 2'-FL, DFL, LNFP-I, LNDFH-I FucT2_Pm9515 FucT2_Pm9515 ABM71599.1 ABM71599.1 а-1,2-фукозилтрансфераза a-1,2-fucosyltransferase 2'-FL, DFL, LNFP-I, LNDFH-I 2'-FL, DFL, LNFP-I, LNDFH-I FucT2_HpF57 FucT2_HpF57 BAJ59215.1 BAJ59215.1 а-1,2- фукозилтрансфераза a-1,2- fucosyltransferase 2'-FL, DFL, LNFP-I, LNDFH-I 2'-FL, DFL, LNFP-I, LNDFH-I FucT6_3_Bf FucT6_3_Bf CAH09151.1 CAH09151.1 а-1,3- фукозилтрансфераза a-1,3- fucosyltransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I FucT7_3_Bf FucT7_3_Bf CAH09495.1 CAH09495.1 а-1,3- фукозилтрансфераза a-1,3- fucosyltransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I FucT_3_Am FucT_3_Am ACD04596.1 ACD04596.1 а-1,3- фукозилтрансфераза a-1,3- fucosyltransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I MAMAR764 MAMAR764 AGC02224.1 AGC02224.1 а-1,3- фукозилтрансфераза a-1,3- fucosyltransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I Mg791 Mg791 AEQ33441.1 AEQ33441.1 а-1,3- фукозилтрансфераза a-1,3- fucosyltransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I Moumou 00703 Moumou 00703 YP 007354660 YP 007354660 а-1,3- фукозилтрансфераза a-1,3- fucosyltransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I futA futA NP207177.1 NP207177.1 а-1,3- фукозшпрансфераза a-1,3- fucose spransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I fucT fucT AAB81031.1 AAB81031.1 а-1,3- фукозилтрансфераза a-1,3- fucosyltransferase 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I 2'-FL, 3-FL, DFL, LNFP-I, LNFPIII, LNFP-V, LNFP-VI, LNDFH-II, F-pLNH I fucTIII fucTIII AY450598.1 AY450598.1 а-1,4- фукозилтрансфераза a-1,4- fucosyltransferase LNDFH-I, LNDFH-II LNDFH-I, LNDFH-II fucTa fucTa AFI 94963.1 AFI 94963.1 а-1,3/4- фукозилтрансфераза a-1.3/4- fucosyltransferase LNFP-II, LNDFH-I, LNDFH-II LNFP-II, LNDFH-I, LNDFH-II Pd2,6ST Pd2.6ST BAA25316.1 BAA25316.1 а-2,6- сиалилтрансфераза a-2.6- sialyltransferase 6'-SL 6'-SL PspST6 PspST6 BAF92026.1 BAF92026.1 а-2,6- сиалилтрансфераза a-2.6- sialyltransferase 6'-SL 6'-SL PiST6_145 PiST6_145 ВAF91416.1 VAF91416.1 а-2,6- сиалилтрансфераза a-2.6- sialyltransferase 6'-SL 6'-SL PiST6_119 PiST6_119 BAI49484.1 BAI49484.1 а-2,6- сиалилтрансфераза a-2.6- sialyltransferase 6'-SL 6'-SL NST NST AAC44541.1 AAC44541.1 а-2,3- сиалилтрансфераза a-2,3- sialyltransferase 3'-SL 3'-SL

Гетерологичная последовательность нуклеиновой кислоты.Heterologous nucleic acid sequence.

Один из аспектов настоящего изобретения представляет собой обеспечение конструкции нуклеиновой кислоты, включающей гетерологичную(гетерологичные) последовательность(последовательности) нуклеиновой кислоты, кодирующую(кодирующие) полипептид, способный к транспортировке сахара, который представляет собой полипептид суперсемейства основных посредников (MFS), как показано в SEQ ID NO: 1, или его функциональный гомолог, аминокислотная последовательность которого более чем на 95,4% идентична последовательности SEQ ID NO: 1, при этом последовательность нуклеиновой кислоты, кодирующая полипептид транспортер Сахаров, имеет, по меньшей мере, 70% идентичности с последовательностью SEQ ID NO: 2.One aspect of the present invention is to provide a nucleic acid construct comprising heterologous nucleic acid sequence(s) encoding a polypeptide capable of transporting a sugar that is a major messenger superfamily (MFS) polypeptide as shown in SEQ ID NO: 1, or a functional homologue thereof, the amino acid sequence of which is more than 95.4% identical to the sequence of SEQ ID NO: 1, and the nucleic acid sequence encoding the sugar transporter polypeptide has at least 70% identity with the sequence SEQ ID NO: 2.

Под термином гетерологичная последовательность нуклеиновой кислоты, кодирующая рекомбиUnder the term heterologous nucleic acid sequence encoding a recombinant

- 8 046005 нантный ген/нуклеиновая кислота/ДНК или кодирующая последовательность нуклеиновой кислоты подразумевают искусственную последовательность нуклеиновой кислоты (т.е. полученную in vitro с применением стандартных лабораторных способов получения последовательностей нуклеиновых кислот), которая включает набор последовательных, неперекрывающихся триплетов (кодонов), которые транскрибируются в мРНК и транслируются в полипептид, когда они находятся под контролем соответствующих контрольных последовательностей, т.е. промотора. Границы кодирующей последовательности обычно определяются сайтом связывания рибосомы, расположенным прямо перед открытой рамкой считывания на 5'-конце мРНК, стартовым кодоном транскрипции (AUG, GUG или UUG) и стоп-кодоном трансляции (UAA, UGA или UAG). Кодирующая последовательность может включать, но не ограничиваться ими, геномную ДНК, кДНК, синтетические и рекомбинантные последовательности нуклеиновых кислот.- 8 046005 nt gene/nucleic acid/DNA or nucleic acid coding sequence means an artificial nucleic acid sequence (i.e. obtained in vitro using standard laboratory methods for obtaining nucleic acid sequences) which includes a set of consecutive, non-overlapping triplets (codons), which are transcribed into mRNA and translated into polypeptide when they are under the control of appropriate control sequences, i.e. promoter The boundaries of the coding sequence are usually defined by the ribosome binding site located just upstream of the open reading frame at the 5' end of the mRNA, the transcription start codon (AUG, GUG, or UUG), and the translation stop codon (UAA, UGA, or UAG). The coding sequence may include, but is not limited to, genomic DNA, cDNA, synthetic and recombinant nucleic acid sequences.

Термин нуклеиновая кислота включает молекулы РНК, ДНК и кДНК. Понятно, что в результате вырождения генетического кода может быть получено множество нуклеотидных последовательностей, кодирующих данный белок. Термин нуклеиновая кислота применяют взаимозаменяемо с термином полинуклеотид.The term nucleic acid includes RNA, DNA and cDNA molecules. It is clear that as a result of the degeneration of the genetic code, many nucleotide sequences encoding a given protein can be obtained. The term nucleic acid is used interchangeably with the term polynucleotide.

Олигонуклеотид представляет собой молекулу нуклеиновой кислоты с короткой цепью.An oligonucleotide is a short-chain nucleic acid molecule.

Праймер представляет собой олигонуклеотид, встречающийся в природе в виде очищенного фрагмента рестрикции или полученный синтетическим путем, который способен действовать как точка инициации синтеза при помещении в условия, в которых индуцируется синтез продукта удлинения праймера, комплементарного цепи нуклеиновой кислоты (т.е. в присутствии нуклеотидов и индуцирующего агента, такого как ДНК-полимераза, и при подходящей температуре и рН). Праймер предпочтительно применяют одноцепочечный для максимальной эффективности амплификации, но альтернативно он может быть двухцепочечным. Если праймер двухцепочечный, то его сначала обрабатывают, чтобы разделить его нити, прежде чем применять для приготовления продуктов для удлинения. Предпочтительно праймер представляет собой дезоксирибонуклеотидную последовательность. Праймер должен быть достаточно длинным, чтобы инициировать синтез продуктов удлинения в присутствии индуцирующего агента. Точная длина праймеров будет зависеть от многих факторов, включая температуру, источник праймера и применение способа.A primer is an oligonucleotide, occurring naturally as a purified restriction fragment or produced synthetically, that is capable of acting as an initiation point for synthesis when placed under conditions that induce synthesis of a primer extension product complementary to the nucleic acid strand (i.e., in the presence of nucleotides and an inducing agent such as DNA polymerase, and at a suitable temperature and pH). The primer is preferably single-stranded for maximum amplification efficiency, but alternatively it can be double-stranded. If the primer is double-stranded, it is first processed to separate its strands before being used to prepare extension products. Preferably the primer is a deoxyribonucleotide sequence. The primer must be long enough to initiate the synthesis of extension products in the presence of an inducing agent. The exact length of the primers will depend on many factors, including temperature, primer source, and method application.

Рекомбинантная нуклеиновая последовательность по изобретению может представлять собой кодирующую последовательность ДНК, например, ген или некодирующая последовательность ДНК, например, регуляторную ДНК, такую как промоторная последовательность. Один аспект изобретения относится к получению рекомбинантной клетки, включающей последовательности рекомбинантной ДНК, кодирующие ферменты, необходимые для продукции одного или нескольких ОГМ, и последовательность ДНК, кодирующую переносчик Fred. Соответственно, в одном воплощении изобретение относится к конструкции нуклеиновой кислоты, включающей кодирующую последовательность нуклеиновой кислоты, т.е. последовательность рекомбинантной ДНК представляющего интерес гена, например, гена гликозилтрансферазы или гена fred, и некодирующую последовательность ДНК, например, последовательность промоторной ДНК, например, рекомбинантную промоторную последовательность, полученную из промотора оперона lac или оперона glp, или промоторную последовательность, полученную из другой последовательности ДНК геномного промотора, или синтетическая промоторная последовательность, где кодирующая и промоторная последовательности функционально связаны. Термин функционально связанный относится к функциональной взаимосвязи между двумя или более сегментами нуклеиновой кислоты (например, ДНК). Как правило, это относится к функциональной связи регуляторной последовательности транскрипции с транскрибируемой последовательностью. Например, промоторная последовательность функционально связана с кодирующей последовательностью, если она стимулирует или модулирует транскрипцию кодирующей последовательности в подходящей клетке-хозяине или другой системе экспрессии. Как правило, промоторные регуляторные последовательности транскрипции, которые функционально связаны с транскрибируемой последовательностью, физически примыкают к транскрибируемой последовательности, т.е. они представляют собой цис-действующие последовательности.The recombinant nucleic acid sequence of the invention may be a DNA coding sequence, such as a gene, or a non-coding DNA sequence, such as regulatory DNA, such as a promoter sequence. One aspect of the invention relates to the production of a recombinant cell comprising recombinant DNA sequences encoding enzymes necessary for the production of one or more OGMs and a DNA sequence encoding the Fred transporter. Accordingly, in one embodiment, the invention relates to a nucleic acid construct comprising a nucleic acid coding sequence, i.e. a recombinant DNA sequence of a gene of interest, e.g., a glycosyltransferase gene or a fred gene, and a non-coding DNA sequence, e.g., a promoter DNA sequence, e.g., a recombinant promoter sequence derived from the promoter of the lac operon or the glp operon, or a promoter sequence derived from another DNA sequence genomic promoter, or synthetic promoter sequence, where the coding and promoter sequences are operably linked. The term operably linked refers to a functional relationship between two or more nucleic acid segments (eg, DNA). Typically, this refers to the functional relationship of a transcription regulatory sequence to a transcribed sequence. For example, a promoter sequence is operably linked to a coding sequence if it stimulates or modulates transcription of the coding sequence in a suitable host cell or other expression system. Typically, promoter transcriptional control sequences that are operably linked to the transcribed sequence are physically adjacent to the transcribed sequence, i.e. they are cis-acting sequences.

В одном воплощении конструкция нуклеиновой кислоты по изобретению может представлять собой частью векторной ДНК, в другом воплощении конструкция представляет собой экспрессионную кассету/картридж, интегрированную в геном клетки-хозяина. Соответственно, термин конструкция нуклеиновой кислоты означает искусственно сконструированный сегмент нуклеиновой кислоты, в особенности, сегмент ДНК, который предназначен для трансплантации в клетку-мишень, например, в клеткумишень, например, в бактериальную клетку, для модификации экспрессии гена генома или экспрессии последовательности гена/кодирующей ДНК, которая может быть включена в конструкцию. В контексте изобретения конструкция нуклеиновой кислоты включает последовательность рекомбинантной ДНК, включающую две или более последовательностей рекомбинантной ДНК по существу, некодирующую последовательность ДНК, включающую последовательность промоторной ДНК, и кодирующую последовательность ДНК, кодирующую представляющий интерес ген, например белок Fred, гликозилтрансферазу или другой ген, пригодный для продукции ОГМ в клетке-хозяине. Предпочтительно конструкция включает дополнительные некодирующие последовательности ДНК, которые либо регулируют трансIn one embodiment, the nucleic acid construct of the invention may be part of a vector DNA; in another embodiment, the construct is an expression cassette/cartridge integrated into the genome of a host cell. Accordingly, the term nucleic acid construct means an artificially engineered segment of nucleic acid, especially a segment of DNA, that is intended to be transplanted into a target cell, e.g., a target cell, e.g., a bacterial cell, to modify the expression of a gene genome or the expression of a gene/coding sequence DNA that can be included in the design. In the context of the invention, the nucleic acid construct includes a recombinant DNA sequence comprising two or more substantially recombinant DNA sequences, a non-coding DNA sequence including a promoter DNA sequence, and a coding DNA sequence encoding a gene of interest, such as a Fred protein, a glycosyltransferase or other gene suitable for the production of OGM in the host cell. Preferably, the construct includes additional non-coding DNA sequences that either regulate trans

- 9 046005 крипцию, либо трансляцию кодирующей ДНК конструкции, например, последовательность ДНК, облегчающую связывание рибосомы с транскриптом, лидирующую последовательность ДНК, которая стабилизирует транскрипт.- 9 046005 transcription, or translation of a DNA coding construct, for example, a DNA sequence that facilitates the binding of a ribosome to a transcript, a leading DNA sequence that stabilizes the transcript.

Интеграция интересующего рекомбинантной нуклеиновой кислоты, включенной в конструкции (в кассету экспрессии), в бактериальный геном может быть достигнута обычными способами, например, с помощью линейных картриджей, содержащих фланкирующие последовательности, гомологичные определенному участку на хромосоме, как описано для attTn7-сайта (Waddell C.S. and Craig N.L., Genes Dev. (1988) Feb;2(2):137-49); способами геномной интеграции последовательностей нуклеиновых кислот, в которых рекомбинация опосредована рекомбиназной функцией Red фага λ или рекомбиназной функцией RecE/RecT профага Rac (Murphy, J Bacteriol. (1998);180(8):2063-7; Zhang et al., Nature Genetics (1998)20: 123-128 Muyrers et al., EMBO Rep.(2000) 1(3): 239-243); способами, основанными на рекомбинации Red/ET (Wenzel et al., Chem Biol. (2005), 12(3):349-56.; Vetcher et al., Appl Environ Microbiol. (2005);71(4):1829-35); или с помощью положительных клонов, т.е. клонов, которые несут кассету экспрессии, могут быть отобраны, например, с помощью маркерного гена, или потери или усиления функции гена.Integration of the recombinant nucleic acid of interest included in the constructs (in the expression cassette) into the bacterial genome can be achieved by conventional methods, for example, using linear cartridges containing flanking sequences homologous to a specific region on the chromosome, as described for the attTn7 site (Waddell C.S. and Craig N.L., Genes Dev. (1988) Feb;2(2):137-49); by means of genomic integration of nucleic acid sequences in which recombination is mediated by the Red recombinase function of phage λ or the RecE/RecT recombinase function of Rac prophage (Murphy, J Bacteriol. (1998);180(8):2063-7; Zhang et al., Nature Genetics (1998)20: 123-128 Muyrers et al., EMBO Rep.(2000) 1(3): 239-243); in ways based on Red/ET recombination (Wenzel et al., Chem Biol. (2005), 12(3):349-56.; Vetcher et al., Appl Environ Microbiol. (2005);71(4):1829 -35); or using positive clones, i.e. clones that carry an expression cassette can be selected, for example, using a marker gene, or a loss or gain of function gene.

Одной копии кассеты экспрессии, включающей интересующий ген, может быть достаточно для обеспечения продукции желаемого ОГМ и достижения желаемых эффектов согласно изобретению. Соответственно, в некоторых предпочтительных воплощениях изобретение относится к рекомбинантной ОГМ-продуцирующей клетке, которая включает одну, две или три копии представляющего интерес гена, интегрированного в геномную ДНК клетки. В некоторых воплощениях предпочтительна единственная копия гена.One copy of an expression cassette comprising the gene of interest may be sufficient to produce the desired OGM and achieve the desired effects of the invention. Accordingly, in some preferred embodiments, the invention provides a recombinant OGM-producing cell that includes one, two or three copies of a gene of interest integrated into the genomic DNA of the cell. In some embodiments, a single copy of the gene is preferred.

В одном предпочтительном воплощении рекомбинантная кодирующая последовательность нуклеиновой кислоты конструкции нуклеиновой кислоты по изобретению представляет собой гетерологичную последовательность по отношению к промотору, что означает, что эквивалентная нативная кодирующая последовательность в геноме вида происхождения транскрибируется под контролем другой промоторной последовательности (т.е. не промоторной последовательности конструкции). Тем не менее, что касается клетки-хозяина, кодирующая ДНК может быть либо гетерологичной (т.е. полученной из другого биологического вида или рода), такой как, например, последовательность ДНК, кодирующая белок Fred, экспрессированная в клетках-хозяевах Escherichia coli, или гомологичной (т.е. полученной из клеткихозяина), такой как, например, гены оперона толстой кишки, гены wca.In one preferred embodiment, the recombinant nucleic acid coding sequence of the nucleic acid construct of the invention is a heterologous sequence with respect to the promoter, which means that the equivalent native coding sequence in the genome of the species of origin is transcribed under the control of a different promoter sequence (i.e., not the promoter sequence of the construct ). However, with respect to the host cell, the encoding DNA may be either heterologous (i.e., derived from another species or genus), such as, for example, the DNA sequence encoding the Fred protein expressed in Escherichia coli host cells, or homologous (ie, derived from a host cell), such as, for example, the colon operon genes, wca genes.

Предпочтительно конструкция по настоящему изобретению, включающая ген, связанный с биосинтетической продукцией ОГМ, промоторную последовательность ДНК и другие регуляторные последовательности, такие как последовательность сайта связывания рибосомы (например, последовательность Шайна-Дальгарно), экспрессируемая в генетически модифицированной клетке, обеспечивает ОГМ на уровне не менее 0,03 г /OD (оптическая плотность) на 1 л ферментационной среды, включающей суспензию генетически модифицированных клеток, например, на уровне от около 0,05 г/л/OD до около 0,5 г/л/OD. Для целей изобретения последний уровень продукции ОГМ считается достаточным, а генетически модифицированная клетка, способная продуцировать желаемый уровень ОГМ, считается подходящей генетически модифицированной клеткой, т.е. клетка может быть дополнительно модифицирована для экспрессии белка-переносчика ОГМ, например, Fred, для достижения хотя бы одного из описанных в настоящем документе эффектов, выгодных для производства ОГМ.Preferably, the construct of the present invention, including a gene associated with the biosynthetic production of OGM, a promoter DNA sequence and other regulatory sequences, such as a ribosome binding site sequence (for example, the Shine-Dalgarno sequence), expressed in a genetically modified cell, provides an OGM at a level of at least 0.03 g/OD (optical density) per 1 liter of fermentation medium comprising a suspension of genetically modified cells, for example at a level of from about 0.05 g/L/OD to about 0.5 g/L/OD. For the purposes of the invention, the latest level of HGM production is considered sufficient, and a genetically modified cell capable of producing the desired level of HGM is considered a suitable genetically modified cell, i.e. the cell may be further modified to express an OGM transporter protein, such as Fred, to achieve at least one of the effects described herein beneficial to OGM production.

Генетически модифицированная клетка или конструкция нуклеиновой кислоты по настоящему изобретению включает последовательность нуклеиновой кислоты, такую как гетерологичный ген, кодирующий предполагаемый белок-переносчик MFS (суперсемейство основных посредников).The genetically modified cell or nucleic acid construct of the present invention includes a nucleic acid sequence, such as a heterologous gene encoding a putative MFS (major mediator superfamily) transporter protein.

Белок Fred - это MFS-транспортер, представляющий особый интерес в настоящем изобретении. Таким образом, конструкция нуклеиновой кислоты по настоящему изобретению включает последовательность нуклеиновой кислоты, имеющую, по меньшей мере, 70% идентичности последовательности с геном, fred, SEQ ID NO: 2.The Fred protein is an MFS transporter of particular interest in the present invention. Thus, the nucleic acid construct of the present invention includes a nucleic acid sequence having at least 70% sequence identity with the gene, fred, SEQ ID NO: 2.

Последовательность нуклеиновой кислоты, содержащаяся в генетически модифицированной клетке или в конструкции нуклеиновой кислоты, кодирует белок последовательности SEQ ID NO: 1 или его функциональный гомолог, аминокислотная последовательность которого, по меньшей мере, на более чем 95,4% идентична SEQ ID NO: 1.The nucleic acid sequence contained in the genetically modified cell or nucleic acid construct encodes a protein of SEQ ID NO: 1 or a functional homolog thereof, the amino acid sequence of which is at least greater than 95.4% identical to SEQ ID NO: 1.

Функциональный гомолог белка последовательности SEQ ID NO: 1 может быть получен путем мутагенеза. Функциональный гомолог должен иметь оставшуюся функциональность не менее 50%, такую как 60%, 70%, 80%, 90% или 100% по сравнению с функциональностью аминокислотной последовательности SEQ ID NO: 1. Функциональный гомолог может иметь более высокую функциональность по сравнению с функциональностью аминокислотной последовательности SEQ ID NO: 1. Функциональный гомолог последовательности SEQ ID NO: 1 должен быть способен усиливать продукцию ОГМ генетически модифицированной клетки по изобретению.A functional homolog of the protein of SEQ ID NO: 1 can be obtained by mutagenesis. A functional homologue must have a remaining functionality of at least 50%, such as 60%, 70%, 80%, 90%, or 100%, compared to the functionality of the amino acid sequence SEQ ID NO: 1. A functional homolog may have higher functionality than the functionality amino acid sequence SEQ ID NO: 1. A functional homolog of the sequence SEQ ID NO: 1 should be capable of enhancing the production of OGM by the genetically modified cell of the invention.

Генетически модифицированная клетка.Genetically modified cell.

Термин генетически модифицированная клетка, применяемый в настоящем документе, понимают как клетку, которая была трансформирована или трансфицирована гетерологичной полинуклеотиднойThe term genetically modified cell as used herein is understood to mean a cell that has been transformed or transfected with a heterologous polynucleotide

- 10 046005 последовательностью. В данном контексте термины генетически модифицированная клетка и клеткахозяин применяют взаимозаменяемо.- 10 046005 sequence. In this context, the terms genetically modified cell and host cell are used interchangeably.

Соответственно, термин генетически модифицированная клетка или генетически модифицированная клетка в данном контексте понимают как клетку-хозяина, которая была трансформирована или трансфицирована экзогенной полинуклеотидной последовательностью.Accordingly, the term genetically modified cell or genetically modified cell in this context is understood as a host cell that has been transformed or transfected with an exogenous polynucleotide sequence.

Генетически модифицированная клетка предпочтительно представляет собой прокариотическую клетку. Подходящие микробные клетки, которые могут функционировать в качестве клетки-хозяина, включают дрожжевые клетки, бактериальные клетки, клетки архебактерий, клетки водорослей и клетки грибов.The genetically modified cell is preferably a prokaryotic cell. Suitable microbial cells that can function as a host cell include yeast cells, bacterial cells, archaebacterial cells, algal cells and fungal cells.

Клетка-хозяин.Host cell.

Генетически модифицированная клетка (клетка-хозяин или рекомбинантная клетка) может представлять собой, например, бактериальную или дрожжевую клетку. В одном предпочтительном воплощении генетически модифицированная клетка представляет собой бактериальную клетку.The genetically modified cell (host cell or recombinant cell) may be, for example, a bacterial or yeast cell. In one preferred embodiment, the genetically modified cell is a bacterial cell.

Что касается бактериальных клеток-хозяев, то, в принципе ограничений нет; они могут представлять собой эубактерии (грамм-положительные или грамм-отрицательные) или архебактерий, если они допускают генетические манипуляции для вставки интересующего гена и их можно культивировать в производственных масштабах. Предпочтительно клетка-хозяин обладает свойством культивирования до высокой плотности клеток. Неограничивающими примерами бактериальных клеток-хозяев, подходящих для рекомбинантного промышленного производства ОГМ согласно изобретению, могут представлять собой Erwinia herbicola (Pantoea agglomerans), Citrobacter freundii, Pantoea citrea, Pectobacterium carotovorum или Xanthomonas campestris. Также могут быть применены бактерии рода Bacillus, в том числе Bacillus subtilis, Bacillus licheniformis, Bacillus coagulans, Bacillus thermophilus, Bacillus laterosporus, Bacillus megaterium, Bacillus mycoides, Bacillus pumilus, Bacillus lentus, Bacillus cereus и Bacillus circulans. Аналогично, бактерии родов Lactobacillus и Lactococcus могут быть модифицированы с применением способов по данному изобретению, включая, но не ограничиваясь ими, Lactobacillus acidophilus, Lactobacillus salivarius, Lactobacillus plantarum, Lactobacillus helveticus, Lactobacillus delbrueckii, Lactobacillus rhamnosus, Lactobacillus bulgaricus, Lactobacillus crispatus, Lactobacillus gasseri, Lactobacillus casei, Lactobacillus reuteri, Lactobacillus jensenii и Lactococcus lactis. Streptococcus thermophiles и Proprionibacterium freudenreichii также представляют собой подходящие виды бактерий для описанного в настоящем документе изобретения. Также часть этого изобретения представляют собой штаммы, модифицированные, как описано в настоящем документе, из родов Enterococcus (например, Enterococcus faecium и Enterococcus thermophiles), Bifidobacterium (например, Bifidobacterium longum, Bifidobacterium infantis и Bifidobacterium bijidum), Sporolactobacillus spp., Micromomospora spp., Micrococcus spp., Rhodococcus spp. и Pseudomonas (например, Pseudomonas fluorescens и Pseudomonas aeruginosa).As far as bacterial host cells are concerned, there are in principle no restrictions; they may be eubacteria (gram-positive or gram-negative) or archaebacteria if they can be genetically manipulated to insert the gene of interest and can be cultured on a commercial scale. Preferably, the host cell has the ability to be cultured to a high cell density. Non-limiting examples of bacterial host cells suitable for the recombinant industrial production of HMOs according to the invention include Erwinia herbicola (Pantoea agglomerans), Citrobacter freundii, Pantoea citrea, Pectobacterium carotovorum or Xanthomonas campestris. Bacteria of the genus Bacillus can also be used, including Bacillus subtilis, Bacillus licheniformis, Bacillus coagulans, Bacillus thermophilus, Bacillus laterosporus, Bacillus megaterium, Bacillus mycoides, Bacillus pumilus, Bacillus lentus, Bacillus cereus and Bacillus circulans. Likewise, bacteria of the genera Lactobacillus and Lactococcus can be modified using the methods of this invention, including, but not limited to, Lactobacillus acidophilus, Lactobacillus salivarius, Lactobacillus plantarum, Lactobacillus helveticus, Lactobacillus delbrueckii, Lactobacillus rhamnosus, Lactobacillus bulgaricus, Lactobacillus crispat us, Lactobacillus gasseri , Lactobacillus casei, Lactobacillus reuteri, Lactobacillus jensenii and Lactococcus lactis. Streptococcus thermophiles and Proprionibacterium freudenreichii are also suitable bacterial species for the invention described herein. Also part of this invention are strains modified as described herein from the genera Enterococcus (for example, Enterococcus faecium and Enterococcus thermophiles), Bifidobacterium (for example, Bifidobacterium longum, Bifidobacterium infantis and Bifidobacterium bijidum), Sporolactobacillus spp., Micromomospora spp. , Micrococcus spp., Rhodococcus spp. and Pseudomonas (eg Pseudomonas fluorescens and Pseudomonas aeruginosa).

Бактерии, включающие характеристики, описанные в настоящем документе, культивируют в присутствии лактозы, и олигосахарид, такой как ОГМ, продуцируемый клеткой, выделяют либо из самой бактерии, либо из культурального супернатанта бактерии. В одном предпочтительном воплощении генетически модифицированная клетка по изобретению представляет собой клетку Escherichia coli.Bacteria comprising the characteristics described herein are cultured in the presence of lactose, and an oligosaccharide, such as OGM, produced by the cell is isolated either from the bacterium itself or from the culture supernatant of the bacterium. In one preferred embodiment, the genetically modified cell of the invention is an Escherichia coli cell.

В другом предпочтительном воплощении клетка-хозяин представляет собой дрожжевую клетку, например, Saccharomyces cerevisiae, Schizosaccharomyces pombe, Pichia pastoris, Kluveromyces lactis, Kluveromyces marxianus и т.п.In another preferred embodiment, the host cell is a yeast cell, for example, Saccharomyces cerevisiae, Schizosaccharomyces pombe, Pichia pastoris, Kluveromyces lactis, Kluveromyces marxianus, and the like.

Генетически модифицированные клетки по изобретению могут быть получены с применением стандартных способов в данной области техники, например, описанных в руководствах Sambrook et al., Wilson & Walker, Maniatise et al. и Ausubel et al.Genetically modified cells according to the invention can be obtained using standard methods in the art, for example, described in the manuals of Sambrook et al., Wilson & Walker, Maniatise et al. and Ausubel et al.

Хозяин, подходящий для производства ОГМ, например E.coli, может включать эндогенный ген β-галактозидазы или экзогенный ген β-галактозидазы, например, E.coli включает эндогенный ген lacZ (например, номер доступа в GenBank V00296 (GL41901)). Для целей изобретения клетка-хозяин, продуцирующая ОГМ, подвергается генетическим манипуляциям либо для включения любого гена β-галактозидазы, либо для включения гена, который инактивирован. Ген может быть инактивирован путем полной или частичной делеции соответствующей последовательности нуклеиновой кислоты из бактериального генома, или последовательность гена может быть мутирована так, как она транскрибируется, или, если транскрибируется, транскрипт не транслируется, или если транслируется в белок (т.е. β-галактозидазу), то белок не обладает соответствующей ферментативной активностью. Таким образом, бактерия, продуцирующая ОГМ, накапливает повышенный внутриклеточный пул лактозы, что полезно для продукции ОГМ.A host suitable for OGM production, eg E. coli, may include an endogenous β-galactosidase gene or an exogenous β-galactosidase gene, eg E. coli includes an endogenous lacZ gene (eg, GenBank accession number V00296 (GL41901)). For the purposes of the invention, the host cell producing OGM is genetically manipulated to either turn on any β-galactosidase gene or turn on a gene that is inactivated. A gene may be inactivated by complete or partial deletion of the corresponding nucleic acid sequence from the bacterial genome, or the gene sequence may be mutated as it is transcribed, or, if transcribed, the transcript is not translated, or if translated into a protein (i.e., β- galactosidase), then the protein does not have the appropriate enzymatic activity. Thus, the OGM-producing bacterium accumulates an increased intracellular pool of lactose, which is beneficial for OGM production.

В некоторых воплощениях сконструированная бактерия включает дефицитный катаболический путь сиаловой кислоты. Под катаболическим путем сиаловой кислоты подразумевается последовательность реакций, обычно контролируемая и катализируемая ферментами, которая приводит к разложению сиаловой кислоты. Примерный путь катаболизма сиаловой кислоты, описанный в настоящем документе, представляет собой путь E.coli. В этом пути сиаловая кислота (Neu5Ac; N-ацетилнейраминовая кислота) расщепляется ферментами NanA (лиаза N-ацетилнейраминовой кислоты), NanK (N-ацетилманIn some embodiments, the engineered bacterium includes a deficient sialic acid catabolic pathway. The sialic acid catabolic pathway refers to the sequence of reactions, usually controlled and catalyzed by enzymes, that leads to the degradation of sialic acid. An exemplary sialic acid catabolic pathway described herein is the E. coli pathway. In this pathway, sialic acid (Neu5Ac; N-acetylneuraminic acid) is degraded by the enzymes NanA (N-acetylneuraminic acid lyase), NanK (N-acetylman

- 11 046005 нозаминкиназа) и NanE (N-ацетилманнозамин-б-фосфатэпимераза), все кодируемые из оперона nanATEK-yhcH, и подавляется NanR (http://ecocyc.org/ECOLI). Недостаточный катаболический путь сиаловой кислоты воспроизводится у хозяина E.coli путем внесения мутации в эндогенные гены nanA (Nацетилнейраминалиаза) (например, номер доступа в GenBank D00067.1(GL216588)) и/или nanK (Nацетилманнозаминкиназа) (например, номер доступа в GenBank (аминокислота) ВАЕ77265.1 (GL85676015)), и/или nanE (N-ацетилманнозамин-б-фосфатэпимераза, GI: 947745, включена сюда посредством отсылки). Необязательно, ген nanT (транспортер N-ацетилнейрамината) также инактивируют или мутируют. Другие промежуточные продукты метаболизма сиаловой кислоты включают: (ManNAc-6P) N-ацетилманнозамин-б-фосфат; (GlcNAc-6-P) N-ацетилглюкозамин-б-фосфат; (GlcN-6-P) глюкозамин6-фосфат и (Fruc-6-P) фруктозо-6-фосфат. В некоторых предпочтительных воплощениях, nanA мутирован. В других предпочтительных воплощениях, nanA и nanK мутированы, тогда как nanE остается функциональным. В другом предпочтительном воплощении, nanA и nanE мутированы, тогда как nanK не был мутирован, инактивирован или удален. Мутация представляет собой одно или несколько изменений в последовательности нуклеиновой кислоты, кодирующей продукт гена nanA, nanK, nanE и/или nanT. Например, мутация может представлять собой 1, 2, до 5, до 10, до 25, до 50 или до 100 изменений в последовательности нуклеиновой кислоты. Например, nanA, nanK, nanE и/или nanT гены мутируют путем нулевой мутации. Нулевые мутации, как описано в настоящем документе, включают аминокислотные замены, добавления, делеции или вставки, которые либо вызывают потерю функции фермента (т.е. снижение или отсутствие активности), либо потерю фермента (т.е. отсутствие генного продукта). Под удаленными подразумевают, что кодирующая область удалена полностью или частично, так что не образуется (функциональный) продукт гена. Под инактивацией подразумевается, что кодирующая последовательность была изменена таким образом, что полученный генный продукт будет функционально неактивным или будет кодировать генный продукт с активностью, менее чем на 100%, например, на 90%, 80%, 70%, 60%, 50%, 40%, 30% или 20% по сравнению с активностью нативного, встречающегося в природе, эндогенного генного продукта. Немутированный ген или белок не отличается от нативной, встречающейся в природе или эндогенной кодирующей последовательности на 1, 2, вплоть до 5, вплоть до 10, вплоть до 20, вплоть до 50, вплоть до 100, вплоть до от 200 или вплоть до 500 или более кодонов или до соответствующей закодированной аминокислотной последовательности.- 11 046005 nosamine kinase) and NanE (N-acetylmannosamine-b-phosphate epimerase), all encoded from the nanATEK-yhcH operon, and repressed by NanR (http://ecocyc.org/ECOLI). The deficient sialic acid catabolic pathway is replicated in the E. coli host by introducing mutations into the endogenous nanA (Nacetylneuraminaliase) (e.g., GenBank accession number D00067.1(GL216588)) and/or nanK (Nacetylmannosamine kinase) genes (e.g., GenBank accession number ( amino acid) BAE77265.1 (GL85676015)), and/or nanE (N-acetylmannosamine-b-phosphate epimerase, GI: 947745, incorporated herein by reference). Optionally, the nanT (N-acetylneuraminate transporter) gene is also inactivated or mutated. Other intermediates of sialic acid metabolism include: (ManNAc-6P) N-acetylmannosamine b-phosphate; (GlcNAc-6-P) N-acetylglucosamine-b-phosphate; (GlcN-6-P) glucosamine 6-phosphate and (Fruc-6-P) fructose 6-phosphate. In some preferred embodiments, nanA is mutated. In other preferred embodiments, nanA and nanK are mutated while nanE remains functional. In another preferred embodiment, nanA and nanE are mutated, while nanK has not been mutated, inactivated or deleted. A mutation is one or more changes in the nucleic acid sequence encoding the gene product nanA, nanK, nanE and/or nanT. For example, a mutation may represent 1, 2, up to 5, up to 10, up to 25, up to 50, or up to 100 changes in the nucleic acid sequence. For example, the nanA, nanK, nanE and/or nanT genes are mutated by null mutation. Null mutations, as described herein, include amino acid substitutions, additions, deletions or insertions that either cause loss of enzyme function (ie, decreased or absent activity) or loss of enzyme (ie, absence of gene product). By deleted we mean that the coding region has been removed in whole or in part so that no (functional) gene product is generated. By inactivation it is meant that the coding sequence has been altered such that the resulting gene product is functionally inactive or encodes a gene product with less than 100% activity, e.g. 90%, 80%, 70%, 60%, 50% , 40%, 30% or 20% compared to the activity of the native, naturally occurring, endogenous gene product. An unmutated gene or protein does not differ from the native, naturally occurring, or endogenous coding sequence by 1, 2, up to 5, up to 10, up to 20, up to 50, up to 100, up to 200, or up to 500 or more codons or up to the corresponding encoded amino acid sequence.

Кроме того, бактерия (например, E.coli) также обладает способностью к синтезу сиаловой кислоты. Например, бактерия обладает способностью синтезировать сиаловую кислоту за счет экзогенной UDPGlcNAc 2-эпимеразы (например, neuC из Campylobacter jejuni (GenBank AAK91727.1) или ее эквивалента (например, (GenBank CAR04561.1), синтазы Neu5Ac (например, neuB из С. jejuni (GenBank AAK91726.1) или ее эквивалента (например, синтазы сиаловой кислоты из Flavobacterium limnosediminis, GenBank WP_023580510.1), и/или синтазы CMP-Neu5Ac (например, neuA из С. jejuni (GenBank AAK91728.1) или ее эквивалента (например, СМР-синтазы сиаловой кислоты из Vibrio brasiliensis, GenBank WP_006881452.1).In addition, the bacterium (eg E. coli) also has the ability to synthesize sialic acid. For example, the bacterium has the ability to synthesize sialic acid through exogenous UDPGlcNAc 2-epimerase (for example, neuC from Campylobacter jejuni (GenBank AAK91727.1) or its equivalent (for example, (GenBank CAR04561.1), Neu5Ac synthase (for example, neuB from C. jejuni (GenBank AAK91726.1) or its equivalent (e.g., sialic acid synthase from Flavobacterium limnosediminis, GenBank WP_023580510.1), and/or CMP-Neu5Ac synthase (e.g., neuA from C. jejuni (GenBank AAK91728.1) or its equivalent (e.g. sialic acid CMP synthase from Vibrio brasiliensis, GenBank WP_006881452.1).

Получение нейтрального ОГМ, содержащего N-ацетилглюкозамин, в модифицированных бактериях также известно в данной области техники (смотри, например, Gebus С. et al. (2012) Carbohydrate Research 363 83-90).The production of neutral OGM containing N-acetylglucosamine in modified bacteria is also known in the art (see, for example, Gebus C. et al. (2012) Carbohydrate Research 363 83-90).

Для производства ОГМ, содержащих N-ацетилглюкозамин, таких как лакто-Ы-триоза 2 (LNT-2), лакто-Ы-тетраоза (LNT), лакто-Н-неотетраоза (LNnT), лакто-Н-фукопентаоза I (LNFP-I), лакто-Nфукопентаоза II (LNFP-II), лакто-М-фукопентаоза III (LNFP-III), лакто-М-фукопентаоза V (LNFP-V), лакTO-N-дифукогексаоза I (LDFH-I), лaкто-N-дифукогексаоза II (LDFH-II) и лαкто-N-неодифукогексаоза II (LNDFH-III), как описано выше, и она модифицирована так, чтобы включать экзогенный ген UDPGlcNAc:Gala/e-R в-3-\-ацетилглюкозаминилтрансферазы или его функциональный вариант или фрагмент. Этот экзогенный ген UDP-GlcNAc:Gala/e-R β-3-N-ацетилглюкозаминилтрaнсферaзы может быть получен из любого из ряда источников, например, из гена lgtA, описанного в N. meningitides (номер доступа белка в GenBank AAF42258.1) или N. gonorrhoeae (номер доступа белка в GenBank ACF31229.1). Необязательно дополнительный ген экзогенной гликозилтрансферазы может быть коэкспрессирован в бактерии, включающей экзогенный ген UDP-GlcNAc:Gala/e-R в-3-\-ацетилглюкозаминилтрансферазы. Например, ген в-1,4-галактозилтрансферазы коэкспрессируется с геном UDP-GlcNAc:Gala/e-R β-3-Nацетилглюкозаминилтрансферазы. Этот экзогенный ген в-1,4-галактозилтрансферазы может быть получен из любого источника, например, описанного в N. meningitidis, ген lgtB (номер доступа белка в GenBank AAF42257.1) или из Н. pylori, ген HP0826lgalT (номер доступа белка в GenBank NP_207619.1). Необязательно дополнительный ген экзогенной гликозилтрансферазы, коэкспрессируемый в бактерии, включающей экзогенный ген UDP-GlcNAc:Gala/e-R в-3-\-ацетилглюкозаминилтрансферазы, представляет собой ген в-1,3-галактозилтрансферазы, например, тот, что описан из E.coli 055:Н7, ген wbgO (номер доступа белка в GenBank WP_000582563.1), или из Н. pylori, ген jhp0563 (номер доступа белка в GenBank AEZ55696.1), или из Streptococcus agalactiae тип Ib OI2 ген cpslBJ g (номер доступа белка в GenBank АВ050723).Раскрытое изобретение также охватывает функциональные варианты и фрагменты любого из ферментов, описанных выше.For the production of OGM containing N-acetylglucosamine, such as lacto-N-triose 2 (LNT-2), lacto-N-tetraose (LNT), lacto-N-neotetraose (LNnT), lacto-N-fucopentaose I (LNFP- I), lacto-N-fucopentaose II (LNFP-II), lacto-M-fucopentaose III (LNFP-III), lacto-M-fucopentaose V (LNFP-V), lacTO-N-difucohexaose I (LDFH-I), lacto -N-difucohexaose II (LDFH-II) and lαcto-N-neodifucohexaose II (LNDFH-III) as described above, and it is modified to include the exogenous UDPGlcNAc:Gala/e-R b-3-\-acetylglucosaminyltransferase gene or its functional variant or fragment. This exogenous UDP-GlcNAc:Gala/e-R β-3-N-acetylglucosaminyltransferase gene can be obtained from any of a number of sources, for example, from the lgtA gene described in N. meningitides (GenBank protein accession number AAF42258.1) or N. gonorrhoeae (GenBank protein accession number ACF31229.1). Optionally, an additional exogenous glycosyltransferase gene can be coexpressed in the bacterium including an exogenous UDP-GlcNAc:Gala/e-R β-3-\-acetylglucosaminyltransferase gene. For example, the β-1,4-galactosyltransferase gene is coexpressed with the UDP-GlcNAc:Gala/e-R β-3-Nacetylglucosaminyltransferase gene. This exogenous β-1,4-galactosyltransferase gene can be obtained from any source, for example, those described in N. meningitidis, lgtB gene (GenBank protein accession number AAF42257.1) or from H. pylori, gene HP0826lgalT (protein accession number in GenBank NP_207619.1). Optionally, the additional exogenous glycosyltransferase gene coexpressed in the bacterium including the exogenous UDP-GlcNAc:Gala/e-R β-3-\-acetylglucosaminyltransferase gene is a β-1,3-galactosyltransferase gene, such as that described from E. coli 055 :H7, gene wbgO (GenBank protein accession number WP_000582563.1), or from H. pylori, gene jhp0563 (GenBank protein accession number AEZ55696.1), or from Streptococcus agalactiae type Ib OI2 gene cpslBJ g (protein accession number in GenBank AB050723). The disclosed invention also covers functional variants and fragments of any of the enzymes described above.

- 12 046005- 12 046005

Ген N-ацетилглюкозаминилтрансферазы и/или ген галактозилтрансферазы также может быть функционально связан с Pglp и экспрессироваться из соответствующей интегрированной в геном кассеты. В одном воплощении ген, интегрированный в геном, представляет собой ген, кодирующий галактозилтрансферазу, например, ген НР0826, кодирующий фермент GalT из Н. pylori (номер доступа белка в GenBank NP_207619.1); в другом воплощении ген, интегрированный в геном, представляет собой ген, кодирующий в-1,3-Н-ацетилглюкозаминилтрансферазу, например, ген lgtA из N. meningitidis (номер доступа белка в GenBank AAF42258.1). В этих воплощениях второй ген, т.е. ген, кодирующий p-1,3-Nацетилглюкозаминилтрансферазу или галактозилтрансферазу, соответственно, может экспрессироваться либо из интегрированной в геном, либо из переносимой плазмидой кассеты. Второй ген необязательно может экспрессироваться либо под контролем промотора glp или под контролем любого другого промотора, подходящего для системы экспрессии, например, Plac.The N-acetylglucosaminyltransferase gene and/or the galactosyltransferase gene may also be operably linked to Pglp and expressed from the corresponding genomically integrated cassette. In one embodiment, the gene integrated into the genome is a gene encoding a galactosyltransferase, for example, the HP0826 gene encoding the GalT enzyme from H. pylori (GenBank protein accession number NP_207619.1); in another embodiment, the gene integrated into the genome is a gene encoding a β-1,3-H-acetylglucosaminyltransferase, for example, the lgtA gene from N. meningitidis (GenBank protein accession number AAF42258.1). In these embodiments, the second gene, i.e. the gene encoding p-1,3-Nacetylglucosaminyltransferase or galactosyltransferase, respectively, can be expressed from either a genome-integrated or plasmid-borne cassette. The second gene may optionally be expressed either under the control of a glp promoter or under the control of any other promoter suitable for the expression system, for example, Plac.

Клетки-хозяева, продуцирующие ОГМ, обычно включают функциональный ген lacY и дисфункциональный ген lacZ.Host cells that produce OGM typically include a functional lacY gene and a dysfunctional lacZ gene.

ОГМ, продуцируемые рекомбинантными клетками по изобретению, могут быть очищены с применением подходящей процедуры, доступной в данной области техники (например, такой, как описана в WO 2015188834, WO 2017182965 или WO 2017152918).The OGM produced by the recombinant cells of the invention can be purified using a suitable procedure available in the art (eg, such as described in WO 2015188834, WO 2017182965 or WO 2017152918).

Кодируемый полипептид, способный транспортировать сахар.An encoded polypeptide capable of transporting sugar.

Транспорт сахара относится к транспорту сахара, такого как, но не ограничиваясь этим, олигосахарида, а в связи с изобретением к транспорту притока и/или оттока одного и/или нескольких ОГМ из цитоплазмы или периплазмы генетически модифицированной клетки в продукционную среду и/или из продукционной среды в цитоплазму или периплазму генетически модифицированной клетки. Таким образом, экспрессируемый в генетически модифицированной клетке полипептид, способный транспортировать ГМО из цитоплазмы или периплазмы в продукционную среду и/или из продукционной среды в цитоплазму или периплазму генетически модифицированной клетки, представляет собой полипептид, способный к транспорту сахара. Таким образом, в настоящем изобретении транспортировка сахара может означать транспортировку оттока и/или притока сахара, такого как, но, не ограничиваясь этим, олигосахарида.Sugar transport refers to the transport of a sugar, such as, but not limited to, an oligosaccharide, and in connection with the invention, to the transport of the influx and/or efflux of one and/or several OGMs from the cytoplasm or periplasm of a genetically modified cell into and/or out of the production environment environment into the cytoplasm or periplasm of a genetically modified cell. Thus, a polypeptide expressed in a genetically modified cell that is capable of transporting GMOs from the cytoplasm or periplasm to the production environment and/or from the production environment to the cytoplasm or periplasm of the genetically modified cell is a polypeptide capable of transporting sugar. Thus, in the present invention, transport of sugar may mean transport of efflux and/or influx of sugar, such as, but not limited to, an oligosaccharide.

В этом отношении полипептид, способный транспортировать сахар, представляет собой полипептид, принадлежащий к суперсемейству основных переносчиков (MFS). В особенности, полипептид имеет более чем 95,4%, например, по меньшей мере, 95,5%, например, по меньшей мере, 96%, 97%, 98% или 99% идентичности последовательности с SEQ ID NO: 1, или он представляет собой его функциональный вариант, как описано в настоящем документе. SEQ ID NO: 1 представляет собой аминокислотную последовательность белка Fred.In this regard, the polypeptide capable of transporting sugar is a polypeptide belonging to the major transporter superfamily (MFS). Specifically, the polypeptide has greater than 95.4%, such as at least 95.5%, such as at least 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO: 1, or it represents a functional variant thereof as described herein. SEQ ID NO: 1 is the amino acid sequence of the Fred protein.

Генетически модифицированная клетка или конструкция нуклеиновой кислоты по настоящему изобретению включает последовательность нуклеиновой кислоты, такую как гетерологичный ген, кодирующий белок Fred. Указанная последовательность нуклеиновой кислоты имеет, по меньшей мере, 70% идентичности последовательности с геном fred, как показано в SEQ ID NO: 2, например, по меньшей мере, 75/, 80%, 85%, 90%, 95% или 99%.The genetically modified cell or nucleic acid construct of the present invention includes a nucleic acid sequence, such as a heterologous gene encoding the Fred protein. Said nucleic acid sequence has at least 70% sequence identity with the fred gene as shown in SEQ ID NO: 2, for example, at least 75/, 80%, 85%, 90%, 95% or 99% .

Конструкция последовательности нуклеиновой кислоты кодирует белок SEQ ID NO: 1 или его функциональный гомолог, аминокислотная последовательность которого более чем на 95,4%, например, по меньшей мере, на 95,5%, 96%, 97%, 98 или 99% идентична SEQ ID NO: 1.The nucleic acid sequence construct encodes a protein of SEQ ID NO: 1 or a functional homolog thereof that has greater than 95.4%, such as at least 95.5%, 96%, 97%, 98, or 99% amino acid sequence identity SEQ ID NO: 1.

Функциональный гомолог белка SEQ ID NO: 1 может быть получен путем мутагенеза. Функциональный гомолог должен иметь остаточную функциональность по меньшей мере 50%, например, 60%, 70%, 80%, 90% или 100%, по сравнению с функциональностью аминокислотной последовательности SEQ ID NO: 1. Функциональный гомолог может иметь более высокую функциональность по сравнению с функциональностью аминокислотной последовательности SEQ ID NO: 1. Функциональный гомолог SEQ ID NO: 1 должен быть способен усиливать продукцию ОГМ генетически модифицированной клеткой согласно изобретению.A functional homologue of the protein SEQ ID NO: 1 can be obtained by mutagenesis. The functional homolog must have a residual functionality of at least 50%, such as 60%, 70%, 80%, 90%, or 100%, compared to the functionality of the amino acid sequence SEQ ID NO: 1. The functional homolog may have higher functionality than with the functionality of the amino acid sequence SEQ ID NO: 1. The functional homolog of SEQ ID NO: 1 should be capable of enhancing the production of OGM by the genetically modified cell according to the invention.

Генетически модифицированная клетка или конструкция нуклеиновой кислоты может содержать одну или несколько последовательностей нуклеиновой кислоты, кодирующих полипептид, способный к транспортировке сахара. Чаще генетически модифицированная клетка или конструкция нуклеиновой кислоты по изобретению кодирует единственную копию полипептида, способного транспортировать сахар.The genetically modified cell or nucleic acid construct may contain one or more nucleic acid sequences encoding a polypeptide capable of transporting a sugar. More commonly, the genetically modified cell or nucleic acid construct of the invention encodes a single copy of a polypeptide capable of transporting sugar.

Одной копии экспрессионной кассеты, включающей интересующий ген, может быть достаточно для обеспечения продукции желаемого ОГМ и достижения желаемых эффектов согласно изобретению. Соответственно, в некоторых предпочтительных вариантах осуществления изобретение относится к клетке, продуцирующей рекомбинантный ОГМ, которая включает одну, две или три копии интересующего гена или генов, интегрированных в геномную ДНК клетки. В некоторых воплощениях предпочтительна единственная копия гена или генов.One copy of an expression cassette comprising the gene of interest may be sufficient to produce the desired OGM and achieve the desired effects of the invention. Accordingly, in some preferred embodiments, the invention relates to a cell producing a recombinant HGM that includes one, two or three copies of the gene or genes of interest integrated into the genomic DNA of the cell. In some embodiments, a single copy of the gene or genes is preferred.

Генетически модифицированная клетка или конструкция нуклеиновой кислоты может также содержать один или несколько регуляторных элементов для регуляции экспрессии последовательностиThe genetically modified cell or nucleic acid construct may also contain one or more regulatory elements to regulate the expression of the sequence

- 13 046005 нуклеиновой кислоты, кодирующей полипептид, транспортирующий сахар, и при этом указанная последовательность нуклеиновой кислоты имеет, по меньшей мере, 70% идентичности последовательности с SEQ ID NO: 2.- 13 046005 of a nucleic acid encoding a sugar transport polypeptide, wherein said nucleic acid sequence has at least 70% sequence identity with SEQ ID NO: 2.

Регуляторный элемент.Regulatory element.

Как указано выше, генетически модифицированная клетка или конструкция нуклеиновой кислоты могут дополнительно включать последовательность нуклеиновой кислоты, включающую регуляторный элемент для регуляции экспрессии последовательности нуклеиновой кислоты, имеющей, по меньшей мере, 70% идентичности последовательности с SEQ ID NO: 2. Последовательность нуклеиновой кислоты регуляторной области может быть гетерологичной или гомологичной.As stated above, the genetically modified cell or nucleic acid construct may further include a nucleic acid sequence including a regulatory element for regulating the expression of a nucleic acid sequence having at least 70% sequence identity with SEQ ID NO: 2. Regulatory Region Nucleic Acid Sequence may be heterologous or homologous.

Термин регуляторный элемент, или промотор, или промоторная область, или промоторный элемент представляет собой последовательность нуклеиновой кислоты, которая распознается и связывается ДНК-зависимой РНК-полимеразой во время инициации транскрипции. Промотор вместе с другими последовательностями нуклеиновых кислот, регулирующими транскрипцию и трансляцию (также называемыми контрольными последовательностями), необходим для экспрессии данного гена или группы генов (оперона). Как правило, транскрипционные и трансляционные регуляторные последовательности включают, но не ограничиваются ими, промоторные последовательности, сайты связывания рибосом, последовательности начала и остановки транскрипции, последовательности начала и остановки трансляции и энхансерные или активаторные последовательности. Сайт начала транскрипции означает первый транскрибируемый нуклеотид и обозначен как +1. Нуклеотиды ниже стартового сайта пронумерованы +2, +3, +4 и т.д., а нуклеотиды в 5' противоположном (выше) направлении пронумерованы -1, -2, -3 и т.д. Промотор конструкции может происходить из промоторной области любого гена, закодированного в геноме вида. Предпочтительна промоторная область геномной ДНК E.coli. Соответственно, любой промотор, способный связываться с РНК-полимеразой и инициировать транскрипцию, подходит для осуществления изобретения. В принципе, для контроля транскрипции рекомбинантного гена можно применять любой промотор, такой как транспортер MFS или гликозилтрансферазы по изобретению. При осуществлении изобретения могут быть применены разные или идентичные промоторные последовательности для запуска транскрипции различных представляющих интерес генов, интегрированных в геном клетки-хозяина или в ДНК вектора экспрессии. В одном примере промоторная последовательность А способствует экспрессии переносчика MFS, а другая промоторная последовательность В, или идентичная промоторная последовательность А, способствует экспрессии гликозилтрансферазы.The term regulatory element or promoter or promoter region or promoter element is a nucleic acid sequence that is recognized and bound by DNA-dependent RNA polymerase during transcription initiation. A promoter, together with other nucleic acid sequences that regulate transcription and translation (also called control sequences), is necessary for the expression of a given gene or group of genes (operon). Typically, transcriptional and translational control sequences include, but are not limited to, promoter sequences, ribosome binding sites, transcription start and stop sequences, translation start and stop sequences, and enhancer or activator sequences. The transcription start site refers to the first nucleotide transcribed and is designated +1. Nucleotides downstream of the start site are numbered +2, +3, +4, etc., and nucleotides in the 5' opposite (upstream) direction are numbered -1, -2, -3, etc. The promoter construct can be derived from the promoter region of any gene encoded in the genome of the species. The promoter region of E. coli genomic DNA is preferred. Accordingly, any promoter capable of binding to RNA polymerase and initiating transcription is suitable for practicing the invention. In principle, any promoter, such as the MFS transporter or glycosyltransferase of the invention, can be used to control the transcription of a recombinant gene. In the practice of the invention, different or identical promoter sequences may be used to drive the transcription of different genes of interest integrated into the genome of a host cell or into the DNA of an expression vector. In one example, promoter sequence A promotes expression of the MFS transporter, and another promoter sequence B, or an identical promoter sequence A, promotes expression of the glycosyltransferase.

Для оптимальной экспрессии рекомбинантных генов, включенных в конструкцию, конструкция может включать дополнительные регуляторные последовательности, например ведущая последовательность ДНК, такая как последовательность ДНК, полученная из 5'-нетранслируемой области (5'UTR) гена glp E.coli, последовательность для рибосомного связывания. Примеры более поздних последовательностей описаны в WO 2019123324 (включена в настоящий документ в качестве отсылки) и проиллюстрированы в настоящем документе в неограничивающих рабочих примерах.For optimal expression of the recombinant genes included in the construct, the construct may include additional regulatory sequences, for example a guide DNA sequence, such as a DNA sequence derived from the 5' untranslated region (5'UTR) of the E. coli glp gene, a ribosomal binding sequence. Examples of later sequences are described in WO 2019123324 (incorporated herein by reference) and are illustrated herein by non-limiting worked examples.

В одном аспекте изобретения один или несколько регуляторных элементов могут быть вставлены в конструкцию ДНК, кодирующую ген fred согласно SEQ ID NO: 2, и/или в конструкцию ДНК, кодирующую одну или несколько гликозилтрансфераз согласно изобретению. В другом аспекте изобретения одна или несколько копий гена fred в соответствии с SEQ ID NO: 2 могут быть встроены в конструкцию ДНК согласно изобретению. В еще одном аспекте изобретения ген fred в соответствии с SEQ ID NO: 2 может быть встроен в одну или несколько идентичных или неидентичных конструкций ДНК согласно изобретению.In one aspect of the invention, one or more regulatory elements may be inserted into a DNA construct encoding the fred gene of SEQ ID NO: 2 and/or into a DNA construct encoding one or more glycosyltransferases of the invention. In another aspect of the invention, one or more copies of the fred gene according to SEQ ID NO: 2 can be inserted into the DNA construct of the invention. In yet another aspect of the invention, the fred gene of SEQ ID NO: 2 may be inserted into one or more identical or non-identical DNA constructs of the invention.

В одном аспекте изобретения регуляторным элементом для регуляции экспрессии рекомбинантного гена, включенного в конструкцию по изобретению, представляет собой промотор оперона glpFKX, PglpF. В другом аспекте изобретения промотор представляет собой промотор оперона lac, Plac. И в еще одном аспекте изобретения регуляторный элемент представляет собой PglpF_SD4 и/или PglpF_SD7, которые представляют собой модифицированную версию последовательности PglpF, включающую модифицированную последовательность сайта связывания рибосомы ниже последовательности промотора. Однако любой промотор, обеспечивающий транскрипцию и/или регуляцию уровня транскрипции одной или нескольких рекомбинантных нуклеиновых кислот, кодирующих один или несколько полипептидов по изобретению, представляет собой подходящий промотор для практического применения изобретения.In one aspect of the invention, the regulatory element for regulating expression of the recombinant gene included in the construct of the invention is the promoter of the glpFKX operon, PglpF. In another aspect of the invention, the promoter is the promoter of the lac operon, Plac. And in yet another aspect of the invention, the regulatory element is PglpF_SD4 and/or PglpF_SD7, which is a modified version of the PglpF sequence including a modified ribosome binding site sequence downstream of the promoter sequence. However, any promoter that provides transcription and/or regulation of the level of transcription of one or more recombinant nucleic acids encoding one or more polypeptides of the invention is a suitable promoter for the practice of the invention.

Как правило, промоторы для экспрессии гетерологичного гена по настоящему изобретению выбирают из табл. 2.Typically, promoters for expression of the heterologous gene of the present invention are selected from Table. 2.

- 14 046005- 14 046005

Таблица 2table 2

Название промотора Promoter name Описание Description Ссылка Link SEQ ID NO: SEQ ID NO: PgatY_70UTR PgatY_70UTR Промотор E. coll для gatYZABCD; тагатозо1,6-бисР-альдолаза E. coll promoter for gatYZABCD; tagatose 1,6-bisP-aldolase NA N.A. 3 3 PglpF PglpF Промотор E. coli для glpFKX; поглощение глицерина E. coli promoter for glpFKX; glycerol absorption WO2019123324 WO2019123324 4 4 PglpFSDl PglpFSDl Промотор Е. coll для оперона glpFKX; поглощение глицерина E. coll promoter for the glpFKX operon; glycerol absorption WO2019123324 WO2019123324 PglpFSDlO PglpFSDlO Промотор Е. coli для оперона glpFKX; поглощение глицерина E. coli promoter for the glpFKX operon; glycerol absorption WO2019123324 WO2019123324 PglpF_SD2 PglpF_SD2 Промотор Е. coli для оперона glpFKX; поглощение глицерина E. coli promoter for the glpFKX operon; glycerol absorption WO2019123324 WO2019123324 PglpF SD3 PglpF SD3 Промотор Е. coli для оперона glpFKX; E. coli promoter for the glpFKX operon; WO2019123324 WO2019123324 поглощение глицерина glycerol absorption PglpF_SD4 PglpF_SD4 Промотор Е. coli для оперона glpFKX; поглощение глицерина E. coli promoter for the glpFKX operon; glycerol absorption WO2019123324 WO2019123324 5 5 PglpF_SD5 PglpF_SD5 Промотор Е. coli для glpFKX; поглощение глицерина E. coli promoter for glpFKX; glycerol absorption WO2019123324 WO2019123324 PglpF_SD6 PglpF_SD6 Промотор Е. coli для оперона glpFKX; поглощение глицерина E. coli promoter for the glpFKX operon; glycerol absorption WO2019123324 WO2019123324 PglpF_SD7 PglpF_SD7 Промотор Е. coli для оперона glpFKX; поглощение глицерина E. coli promoter for the glpFKX operon; glycerol absorption WO2019123324 WO2019123324 6 6 PglpF_SD8 PglpF_SD8 Промотор Е. coli для оперона glpFKX; поглощение глицерина E. coli promoter for the glpFKX operon; glycerol absorption WO2019123324 WO2019123324 PglpF_SD9 PglpF_SD9 Промотор Е. coli для оперона glpFKX; поглощение глицерина E. coli promoter for the glpFKX operon; glycerol absorption WO2019123324 WO2019123324 Plac_16UTR Plac_16UTR Промотор Е. coli для оперона lacZYA: 1асоперон E. coli promoter for the lacZYA operon: 1asoperon WO2019123324 WO2019123324 Plac Plac Промотор Е. coli для оперона lacZYA: 1асоперон E. coli promoter for the lacZYA operon: 1asoperon WO2019123324 WO2019123324 19 19 PmglB_70UTR PmglB_70UTR Промотор Е. coli для mglBAC; транспортер галактозы/метилгалактозидазы E. coli promoter for mglBAC; galactose/methylgalactosidase transporter NA N.A. 7 7 PmglB_70UTR SD4 PmglB_70UTR SD4 Промотор Е. coli для mglBAC·, транспортер галактозы/метилгалактозидазы E. coli promoter for mglBAC·, galactose/methylgalactosidase transporter NA N.A. 8 8

Предпочтительные регуляторные элементы, присутствующие в генетически модифицированной клетке или в конструкции нуклеиновой кислоты по настоящему изобретению, выбирают из группы, состоящей из: PgatY_70UTR, PglpF, PglpF_SD1, PglpF_SD10, PglpF_SD2, PglpF_SD3, PglpF_SD4, PglpF_SD5, PglpF_SD6, PglpF_SD7, PglpF_SD8, PglpF_SD9, Plac_16UTR, Plac, PmglB_70UTR и PmglB_70UTR_SD4.Preferred regulatory elements present in the genetically modified cell or nucleic acid construct of the present invention are selected from the group consisting of: PgatY_70UTR, PglpF, PglpF_SD1, PglpF_SD10, PglpF_SD2, PglpF_SD3, PglpF_SD4, PglpF_SD5, PglpF_SD6, PglpF_SD7 , PglpF_SD8, PglpF_SD9, Plac_16UTR , Plac, PmglB_70UTR and PmglB_70UTR_SD4.

Особенно предпочтительные регуляторные элементы, присутствующие в генетически модифицированной клетке или в конструкции нуклеиновой кислоты по настоящему изобретению, выбирают из группы, состоящей из PglpF, PglpF_SD4 и PglpF_SD7.Particularly preferred regulatory elements present in the genetically modified cell or nucleic acid construct of the present invention are selected from the group consisting of PglpF, PglpF_SD4 and PglpF_SD7.

Г енетически модифицированные клетки для биосинтетического производства.Genetically modified cells for biosynthetic production.

В настоящем изобретении промоторы могут быть либо необходимыми, либо полезными для достижения оптимального уровня биосинтетического производства одной или нескольких ОГМ в генетически модифицированной клетке и обеспечения желаемых эффектов согласно изобретению. Таким образом, промоторная последовательность по настоящему изобретению обеспечивает транскрипцию и/или регулирует экспрессию полипептида, способного к транспорту сахара, и/или гликозилтрансфераз по изобретению, что приводит к оптимизации биосинтеза и транспорта ОГМ или предшественников ОГМ и/или деградации побочных продуктов получения ОГМ.In the present invention, promoters may be either necessary or beneficial to achieve the optimal level of biosynthetic production of one or more HMOs in a genetically modified cell and provide the desired effects of the invention. Thus, the promoter sequence of the present invention drives the transcription and/or regulates the expression of the sugar transport polypeptide and/or glycosyltransferases of the invention, resulting in optimization of the biosynthesis and transport of OGM or OGM precursors and/or degradation of by-products of OGM production.

В генетически модифицированной клетке по изобретению конструкция нуклеиновой кислоты включена в генетически модифицированную клетку, которая кодирует, по меньшей мере, один ген, связанный с биосинтетическим продуцированием одной или нескольких ОГМ, последовательность промоторной ДНК и другие регуляторные последовательности, такие как последовательность сайта связывания рибосомы (например, последовательность Шайна-Дальгарно). Экспрессия гена или генов, связанных с биосинтетической продукцией одной или нескольких ОГМ в генетически модифицированной клетке, делает возможным продуцирование ОГМ, делая клетку-хозяина подходящей клеткой-хозяином для осуществления изобретения, как описано. В генетически модифицированной клетке экспрессия гена или генов, связанных с биосинтетическим производством ОГМ, как упоминалось выше, позволяет производить одно или несколько ОГМ на уровне 0,03 г/л/OD (оптическая плотность) из 1 литра ферментационной среды, включавшей суспензию генетически модифицированных клеток. Таким образом, уровень ОГМ может быть от около 0,05 г/л/OD до около 0,5 г/л/OD, например, по меньшей мере, 0,4 г/л/OD. Для целей изобретения уровень продукции ОГМ рассматривают как достаточный, и генетически модифицированная клетка, способная продуцировать желаемый уровень ОГМ или смеси ОГМ, считается подходящей генетически модифицированной клеткой для осуществления изобретения.In the genetically modified cell of the invention, a nucleic acid construct is included in the genetically modified cell that encodes at least one gene associated with the biosynthetic production of one or more OGMs, a promoter DNA sequence, and other regulatory sequences such as a ribosome binding site sequence (eg , Shine-Dalgarno sequence). Expression of a gene or genes associated with the biosynthetic production of one or more HGMs in a genetically modified cell enables the production of HGMs, making the host cell a suitable host cell for practicing the invention as described. In a genetically modified cell, expression of the gene or genes associated with the biosynthetic production of OGM, as mentioned above, allows the production of one or more OGM at a level of 0.03 g/L/OD (optical density) from 1 liter of fermentation medium containing a suspension of genetically modified cells . Thus, the OGM level may be from about 0.05 g/L/OD to about 0.5 g/L/OD, such as at least 0.4 g/L/OD. For the purposes of the invention, the level of production of HGM is considered to be sufficient, and a genetically modified cell capable of producing the desired level of HGM or a mixture of HGM is considered a suitable genetically modified cell for practicing the invention.

Таким образом, в свете изобретения подходящая генетически модифицированная клетка может быть дополнительно модифицирована, как описано выше, для экспрессии полипептида сахара, способного к транспортировке сахара семейства MFS, например, fred, для достижения, тем или иным образом,Thus, in light of the invention, a suitable genetically modified cell can be further modified, as described above, to express a sugar polypeptide capable of transporting MFS family sugars, for example, fred, to achieve, in one way or another,

- 15 046005 выгодного производства ОГМ, такого как, помимо прочего, более высокий уровень ОГМ в биосинтетическом производстве, более высокий уровень чистоты в биосинтетическом производстве, сокращение длительности производства и/или более эффективное биосинтетическое производство ГМО.- 15 046005 beneficial production of GMOs, such as, but not limited to, higher levels of GMOs in biosynthetic production, higher levels of purity in biosynthetic production, reduced production times, and/or more efficient biosynthetic production of GMOs.

Способ получения.Method of receipt.

Второй аспект изобретения относится к способу получения одного или нескольких ОГМ, включающему следующие этапы:The second aspect of the invention relates to a method for producing one or more OGM, including the following steps:

(i) обеспечение генетически модифицированной клетки, способной продуцировать ОГМ, причем указанная клетка включает рекомбинантную нуклеиновую кислоту, кодирующую белок последовательности SEQ ID NO: 1, или ее функциональный гомолог, аминокислотная последовательность которого идентична более чем на 95,4%, идентична, по меньшей мере, на 95,5%, предпочтительно идентична, по меньшей мере, на 96%, более предпочтительно идентична, по меньшей мере, на 99,9% последовательности SEQ ID NO: 1;(i) providing a genetically modified cell capable of producing HGM, wherein said cell includes a recombinant nucleic acid encoding a protein of the sequence SEQ ID NO: 1, or a functional homolog thereof, the amino acid sequence of which is more than 95.4% identical, identical to at least at least 95.5% identical, preferably at least 96% identical, more preferably at least 99.9% identical to the sequence of SEQ ID NO: 1;

(ii) культивирование клетки (i) в подходящей среде для культивирования клеток для обеспечения продукции ОГМ и экспрессии последовательности ДНК с получением белка, имеющего аминокислотную последовательность SEQ ID NO: 1, или его функциональную аминокислоту последовательность более чем на 95,4% идентична, например, по меньшей мере, на 95,5% идентична, предпочтительно, по меньшей мере, на 96% идентична, более предпочтительно, по меньшей мере, на 99,9% идентична SEQ ID NO: 1;(ii) culturing the cell (i) in a suitable cell culture medium to permit production of OGM and expression of the DNA sequence to produce a protein having the amino acid sequence of SEQ ID NO: 1, or its functional amino acid sequence being more than 95.4% identical, e.g. at least 95.5% identical, preferably at least 96% identical, more preferably at least 99.9% identical to SEQ ID NO: 1;

(iii) сбор ОГМ, полученного на этапе (ii).(iii) collection of the GMS obtained in step (ii).

Согласно изобретению термин культивирование (или культивирование или культивирование, также называемое ферментация) относится к размножению бактериальных экспрессирующих клеток в контролируемом биореакторе в соответствии со способами, известными в промышленности.According to the invention, the term cultivation (or culturing or cultivation, also called fermentation) refers to the propagation of bacterial expressing cells in a controlled bioreactor in accordance with methods known in the industry.

Для получения одного или нескольких ОГМ бактерии, продуцирующие ОГМ, как описано в настоящем документе, культивируют в соответствии с процедурами, известными в данной области техники, в присутствии подходящего источника углерода, например глюкозы, глицерина, лактозы и т.д., и полученный ОГМ собирают из сред культивирования и микробной биомассы, образующейся в процессе культивирования. После этого ОГМ очищают в соответствии с процедурами, известными в данной области техники, например, такими, как описаны в WO 2015188834, WO 2017182965 или WO 2017152918, и очищенный ОГМ применяют в качестве нутрицевтиков, фармацевтических препаратов или для любых других целей, например, для исследований.To obtain one or more OGM, bacteria producing OGM as described herein are cultured according to procedures known in the art in the presence of a suitable carbon source, for example glucose, glycerol, lactose, etc., and the resulting OGM collected from cultivation media and microbial biomass formed during the cultivation process. Thereafter, the HMO is purified according to procedures known in the art, such as those described in WO 2015188834, WO 2017182965 or WO 2017152918, and the purified HMO is used as nutraceuticals, pharmaceuticals or for any other purpose, e.g. research.

Производство ОГМ обычно осуществляется путем культивирования в больших объемах. Термин производство и производственный масштаб в значении изобретения определяет ферментацию с минимальным объемом 5 л культурального бульона. Обычно процесс в производственном масштабе определяют способностью обрабатывать большие объемы препарата, содержащего продукт, и производить такие количества представляющего интерес белка, которые соответствуют, например, в случае терапевтического соединения или композиции, требованиям для клинических испытаний, а также для предложения на рынке. Помимо большого объема, способ в производственных масштабах, в отличие от простых способов в лабораторных масштабах, таких как культивирование во встряхиваемых колбах, характеризуется применением технической системы биореактора (ферментера), оснащенного устройствами для перемешивания, аэрации, подачи питательных веществ, слежения за параметрами процесса и контроля параметров процесса (рН, температура, давление растворенного кислорода, обратное давление и др.). В значительной степени поведение системы экспрессии в лабораторном масштабе, например, во встряхиваемых колбах, настольных биореакторах или формате глубоких лунок, описанных в примерах настоящего раскрытия, позволяет предсказать поведение этой системы этой системы в сложной среде биореактора.The production of OGM is usually carried out through large-scale cultivation. The term production and production scale within the meaning of the invention defines fermentation with a minimum volume of 5 liters of culture broth. Typically, a manufacturing scale process is defined by the ability to process large volumes of a formulation containing a product and to produce quantities of the protein of interest that meet, for example, in the case of a therapeutic compound or composition, requirements for clinical testing as well as for marketing. In addition to its large volume, the method on a production scale, in contrast to simple methods on a laboratory scale, such as cultivation in shake flasks, is characterized by the use of a technical bioreactor (fermenter) system equipped with devices for mixing, aeration, supply of nutrients, monitoring process parameters and control of process parameters (pH, temperature, dissolved oxygen pressure, back pressure, etc.). To a large extent, the behavior of an expression system on a laboratory scale, such as in shake flasks, benchtop bioreactors, or the deep well format described in the examples of the present disclosure, allows one to predict the behavior of that system in a complex bioreactor environment.

Что касается подходящей среды для клеток, применяемой в процессе ферментации, ограничений нет. Культуральная среда может быть полуопределенной, то есть содержащей комплексные соединения среды (например, дрожжевой экстракт, соевый пептон, казаминовые кислоты и т.д.), или она может быть химически определенной, без каких-либо комплексных соединений.There are no restrictions regarding the suitable cell medium used in the fermentation process. The culture medium may be semi-defined, that is, containing complex compounds of the medium (eg, yeast extract, soy peptone, casamino acids, etc.), or it may be chemically defined, without any complex compounds.

Под термином один или несколько ОГМ подразумевают, что производственная ячейка ОГМ может быть способна производить одну структуру ОГМ (первый ОГМ) или несколько структур ОГМ (второй, третий и т.д. ОГМ). В некоторых воплощениях может быть предпочтительной генетически модифицированная клетка, которая продуцирует один ОГМ, в других предпочтительных воплощениях может быть предпочтительной генетически модифицированная клетка, продуцирующая несколько структур ОГМ. Клетки, продуцирующие 2'-FL, 3-FL, 3'-SL, 6'-SL или LNT-2 представляют собой неограничивающие примеры генетически модифицированных клеток, продуцирующих ОГМ единственной структуры. Неограничивающие примеры генетически модифицированных клеток, способных продуцировать несколько структур ОГМ, могут представлять собой клетки-продуценты DFL, FSL, LNT, LNnT, LNFP-I, LNFP-II, LNFP-Ш, LNFP-IV, LNFP-V, pLNnH, pLNH2.By the term one or more OGMs, it is meant that a OGM production cell may be capable of producing one OGM structure (first OGM) or multiple OGM structures (second, third, etc. OGM). In some embodiments, a genetically modified cell that produces a single OGM may be preferred; in other preferred embodiments, a genetically modified cell that produces multiple OGM structures may be preferred. Cells producing 2'-FL, 3-FL, 3'-SL, 6'-SL or LNT-2 are non-limiting examples of genetically modified cells that produce a single structure OGM. Non-limiting examples of genetically modified cells capable of producing multiple HGM structures include DFL, FSL, LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-IV, LNFP-V, pLNnH, pLNH2 producer cells.

В особенности, настоящее изобретение относится к генетически модифицированным клеткам, продуцирующим одну или несколько одиночных структур ОГМ, которые выбирают из группы, состоящей из клеток, продуцирующих 2'-FL, 3-FL, DFL и LNT.In particular, the present invention relates to genetically modified cells producing one or more single OGM structures, which are selected from the group consisting of cells producing 2'-FL, 3-FL, DFL and LNT.

- 16 046005- 16 046005

Термин сбор в контексте изобретения относится к сбору полученных ОГМ после прекращения ферментации. В различных воплощениях это может включать сбор ОГМ, включенных как в биомассу (т.е. генетически модифицированные клетки), так и в среду культивирования, т.е. до/без отделения ферментационного бульона от биомассы. В других воплощениях полученный ОГМ можно собирать отдельно от биомассы и ферментационного бульона, т.е. после отделения /следом за отделением биомассы от среды культивирования (т.е. ферментационного бульона). Отделение клеток от среды может быть осуществлено любым из способов, хорошо известных специалисту в данной области техники, например, любым подходящим типом центрифугирования или фильтрации. Отделение клеток от среды может следовать сразу за сбором ферментационного бульона или осуществляться на более позднем этапе после хранения ферментационного бульона в соответствующих условиях. Извлечение произведенных ОГМ из оставшейся биомассы (или полная ферментация) включает их извлечение из биомассы (клетокпродуцентов). Это можно осуществить любыми подходящими способами в данной области техники, например, обработкой ультразвуком, кипячением, гомогенизацией, ферментативным лизисом с применением лизоцима или замораживанием и измельчением.The term collection in the context of the invention refers to the collection of the resulting OGM after the cessation of fermentation. In various embodiments, this may involve collecting HGMs included in both the biomass (i.e., genetically modified cells) and the culture medium, i.e. before/without separating the fermentation broth from the biomass. In other embodiments, the resulting OGM can be collected separately from the biomass and fermentation broth, i.e. after/following the separation of the biomass from the cultivation medium (i.e. fermentation broth). Separation of cells from the medium can be accomplished by any of the methods well known to one skilled in the art, for example, any suitable type of centrifugation or filtration. Separation of cells from the medium may immediately follow collection of the fermentation broth or may be carried out at a later stage after the fermentation broth has been stored under appropriate conditions. Extraction of produced HMOs from the remaining biomass (or complete fermentation) involves their extraction from the biomass (producer cells). This can be accomplished by any suitable methods in the art, for example, sonication, boiling, homogenization, enzymatic lysis using lysozyme, or freezing and grinding.

После восстановления после ферментации ОГМ (доступен)доступны для дальнейшей обработки и очистки.After recovery from fermentation, the OGM (available) are available for further processing and purification.

Очистку ОГМ, полученных ферментацией, можно проводить с применением подходящей процедуры, описанной в WO 2016095924, WO 2015188834, WO 2017152918, WO 2017182965, US 20190119314 (все включены посредством отсылки).Purification of OHMs obtained by fermentation can be carried out using a suitable procedure described in WO 2016095924, WO 2015188834, WO 2017152918, WO 2017182965, US 20190119314 (all incorporated by reference).

В некоторых воплощениях изобретения генетически модифицированная клетка может продуцировать несколько ОГМ, где один ОГМ представляет собой ОГМ-продукт, а некоторые/все прочие ОГМ представляют собой ОГМ-побочный продукт. Как правило, побочные ОГМ представляют собой либо основных предшественников ОГМ, либо продукты дальнейшей модификации основных ОГМ. В некоторых воплощениях может быть желательно производить продукт ОГМ в больших количествах и побочный продукт ОГМ в малых количествах. Клетки и способы получения ОГМ, описанные в настоящем документе, обеспечивают контролируемое производство продукта ОГМ с заданным профилем ОГМ, например, в одном воплощении полученная смесь ОГМ, в которой продукт ОГМ представляет собой доминирующим ОГМ по сравнению с другими ОГМ (т.е. побочными ОГМ) смеси, т.е. ОГМ-продукт производится в большем количестве, чем другие ОГМ-побочные продукты; в других воплощениях клетка, производящая одну и ту же смесь ОГМ, может быть настроена на производство одного или нескольких побочных продуктов ОГМ в большем количестве, чем ОГМ-продукт. Например, при производстве 2'-FL и/или 3-FL, ОГМ-продукта, часто образуется значительное количество DFL, ОГМ-побочного продукта. С генетически модифицированными клетками по настоящему изобретению уровень DFL в 2'-FL и/или 3-FL -продукте может быть значительно снижен.In some embodiments of the invention, a genetically modified cell can produce multiple HGMs, where one HGM is a HGM product and some/all of the other HGMs are HGM by-products. As a rule, side HMOs are either the main precursors of the HMOs or products of further modification of the main HMOs. In some embodiments, it may be desirable to produce the OGM product in large quantities and the OGM by-product in small quantities. The cells and methods for producing OGM described herein provide controlled production of an OGM product with a given OGM profile, for example, in one embodiment, a resulting mixture of OGM in which the OGM product is the dominant OGM relative to other OGMs (i.e., by-product OGMs). ) mixtures, i.e. The OGM product is produced in greater quantities than other OGM by-products; in other embodiments, a cell producing the same mixture of OGM may be configured to produce one or more OGM by-products in greater quantities than the OGM product. For example, the production of 2'-FL and/or 3-FL, an OGM product, often produces significant amounts of DFL, an OGM byproduct. With the genetically modified cells of the present invention, the level of DFL in the 2'-FL and/or 3-FL product can be significantly reduced.

Преимущественно изобретение обеспечивает как снижение отношения побочного продукта к продукту, так и увеличение общего выхода продукта (и/или ОГМ в целом). Это, сниженное образование побочных продуктов по сравнению с образованием продукта, способствует повышенному образованию продукта и повышает эффективность как производства, так и процесса извлечения продукта, обеспечивая превосходную технологию производства ОГМ.Advantageously, the invention provides both a reduction in the by-product to product ratio and an increase in the overall product yield (and/or OGM in general). This reduced byproduct formation relative to product formation promotes increased product formation and increases the efficiency of both the production and product recovery process, providing superior OGM production technology.

В различных предпочтительных воплощениях могут быть выбраны различные генетически модифицированные клетки, продуцирующие 2'-FL, 3-FL, DFL и/или LNT, в качестве ОГМ продукта или побочного продукта. В одном предпочтительном воплощении продукт представляет собой 3-FL. В другом предпочтительном воплощении продукт представляет собой 2'-FL, а побочный продукт представляет собой DFL. В другом предпочтительном воплощении продукт представляет собой LNT-2, а побочный продукт представляет собой LNT and LNFP I.In various preferred embodiments, various genetically modified cells producing 2'-FL, 3-FL, DFL and/or LNT may be selected as the HGM product or by-product. In one preferred embodiment, the product is 3-FL. In another preferred embodiment, the product is 2'-FL and the by-product is DFL. In another preferred embodiment, the product is LNT-2 and the by-product is LNT and LNFP I.

2'-FL, LNT и 3-FL представляют собой предпочтительные ОГМ-продукты по изобретению, как описано.2'-FL, LNT and 3-FL are the preferred OGM products of the invention as described.

Применение.Application.

Настоящее изобретение также относится к применению клетки-хозяина, описанной в настоящем документе, для получения одного или нескольких олигосахаридов грудного молока (ОГМ). В особенности, изобретение относится к применению клетки-хозяина, как описано в настоящем документе, для продукции конкретного ОГМ, при этом клетка-хозяин выбирают с целью получения большей части одного конкретного ОГМ, предпочтительно выбранного из 2'-FL, 3-FL и LNT, в настоящее время наиболее предпочтителен, 3-FL.The present invention also relates to the use of a host cell described herein to produce one or more human milk oligosaccharides (HMOs). In particular, the invention relates to the use of a host cell, as described herein, for the production of a particular HGM, wherein the host cell is selected to produce a majority of one particular HGM, preferably selected from 2'-FL, 3-FL and LNT , currently the most preferred, 3-FL.

Общее.General.

Следует понимать, что любой признак и/или аспект, рассмотренный выше в связи с описываемым изобретением, применим по аналогии с описанными в настоящем документе способами.It should be understood that any feature and/or aspect discussed above in connection with the described invention is applicable by analogy to the methods described herein.

Следующие фигуры и примеры представлены ниже для иллюстрации настоящего изобретения. Они предназначены для иллюстрации и никоим образом не должны рассматриваться как ограничивающие.The following figures and examples are presented below to illustrate the present invention. They are intended to be illustrative and should not be construed as limiting in any way.

Примеры.Examples.

Материалы и методы.Materials and methods.

Если не указано иное, для манипулирования с нуклеиновыми кислотами, трансформации и экспрессии нуклеиновых кислот применяют стандартные методики, векторы, элементы контрольной последоваUnless otherwise stated, standard techniques, vectors, control sequence elements are used for nucleic acid manipulation, transformation, and expression of nucleic acids.

- 17 046005 тельности и другие элементы системы экспрессии, известные в области молекулярной биологии. Такие стандартные техники, векторы и элементы можно найти, например, в руководствах: Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley & Sons); Sambrook, Fritsch, & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.), DNA Insertion Elements, Plasmids and Episomes (1977) (Cold Spring Harbor Laboratory Press, NY); Miller, J.H. Experiments in molecular genetics (1972.) (Cold spring Harbor Laboratory Press, NY)- 17 046005 telities and other elements of the expression system known in the field of molecular biology. Such standard techniques, vectors and elements can be found, for example, in the manuals: Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley &Sons); Sambrook, Fritsch, & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.), DNA Insertion Elements, Plasmids and Episomes (1977) (Cold Spring Harbor Laboratory Press, NY); Miller, J.H. Experiments in molecular genetics (1972.) (Cold spring Harbor Laboratory Press, NY)

Описанные ниже воплощения выбраны для иллюстрации изобретения и никоим образом не ограничивают изобретение.The embodiments described below are chosen to illustrate the invention and are not intended to limit the invention in any way.

Штаммы.Strains.

Штаммы, примененные в настоящих примерах, описаны в приведенной ниже табл. 3.The strains used in the present examples are described in the table below. 3.

Таблица 3Table 3

ID штаммов Strain IDs Продукт Product Соответствующий генотип Corresponding genotype DH1 DH1 - - 1·' /. endA IrecA IrelA IgvrA96thi-IglnV44hsdRI 7(гк тк) 1·' /. endA IrecA IrelA IgvrA96thi-IglnV44hsdRI 7(gk tk) MDO MDO - - Е coli DH1 AlacZ AlacA, АпапКЕТА, AmelA, AwcaJ, AmdoH wcaF::Plac E coli DH1 AlacZ AlacA, ApanKETA, AmelA, AwcaJ, AmdoH wcaF::Plac Штамм 1 Strain 1 2’-FL 2'-FL MDO PglpF-CA PglpF-futC Alaci MDO PglpF-CA PglpF-futC Alaci Штамм 2 Strain 2 MDO PglpF-CA PglpF-futC Alaci PglpF-fred MDO PglpF-CA PglpF-futC Alaci PglpF-fred Штамм 3 Strain 3 3-FL 3-FL MDO PglpF-CA PglpF-futA Alaci MDO PglpF-CA PglpF-futA Alaci Штамм 4 Strain 4 MDO PglpF-CA PglpF-futA Alaci PglpF-fred MDO PglpF-CA PglpF-futA Alaci PglpF-fred Штамм 5 Strain 5 LNT LNT MDO PglpF-lgtA PglpF-galTK MDO PglpF-lgtA PglpF-galTK Штамм 6 Strain 6 MDO PglpF-lgtA PglpF-galTK PglpF SD4-fred MDO PglpF-lgtA PglpF-galTK PglpF SD4-fred Штамм 7 Strain 7 MDO PglpF-lgtA PglpF-galTKPglpF SD7-fred MDO PglpF-lgtA PglpF-galTKPglpF SD7-fred MP3 672 MP3 672 LNnT LNnT MDOPglpF-GlcNAcTPglpF-Gal4T (version 1)* MDOPglpF-GlcNAcTPglpF-Gal4T (version 1)* МР3708 MP3708 MDO PglpF-GlcNAcT PglpF-Gal4TPlac-yberC000I 9420 MDO PglpF-GlcNAcT PglpF-Gal4TPlac-yberC000I 9420 MP3 972 MP3 972 MDO PglpF-GlcNAcT PglpF-Gal4TPlac-bad MDO PglpF-GlcNAcT PglpF-Gal4TPlac-bad MP3 979 MP3 979 MDO PglpF-GlcNAcT PglpF-Gal4TPlac-fred MDO PglpF-GlcNAcT PglpF-Gal4TPlac-fred МР4011 MP4011 MDO PglpF-GlcNAcT PglpF-Gal4TPlac-marc MDO PglpF-GlcNAcT PglpF-Gal4TPlac-marc MP3 994 MP3 994 MDO PglpF-GlcNAcT PglpF-Gal4TPlac-vag(version 1) ** MDO PglpF-GlcNAcT PglpF-Gal4TPlac-vag(version 1) ** МР3984 MP3984 MDO PglpF-GlcNAcT PglpF-Gal4TPlac-nec MDO PglpF-GlcNAcT PglpF-Gal4TPlac-nec МР4362 MP4362 MDO PglpF-GlcNAcT PglpF-Gal4T Plac-yabM MDO PglpF-GlcNAcT PglpF-Gal4T Plac-yabM MP3 020 MP3 020 MDO PglpF-GlcNAcT PglpF-Gal4T(version 2) * MDO PglpF-GlcNAcT PglpF-Gal4T(version 2) * МР4064 MP4064 MDO PglpF-GlcNAcT PglpF-Gal4TPglpF-vag MDO PglpF-GlcNAcT PglpF-Gal4TPglpF-vag МР4065 MP4065 MDOPglpF-GlcNAcTPglpF-Gal4TPlac-vag(version 2)** MDOPglpF-GlcNAcTPglpF-Gal4TPlac-vag(version 2)** МР4473 MP4473 LNT LNT MDO PglpF-GlcNAcT PglpF-Gal3T MDO PglpF-GlcNAcT PglpF-Gal3T МР4546 MP4546 MDO PglpF-GlcNAcT PglpF-Gal3T PglpF-vag MDO PglpF-GlcNAcT PglpF-Gal3T PglpF-vag

СА = gmd-wcaG-wcaH-wcaI-manC-manB.CA = gmd-wcaG-wcaH-wcaI-manC-manB.

*Штаммы МР3672 и МР3020 несут одни и те же гетерологичные GlcNAcT и Gal4T, но отличаются количеством копий соответствующего гена, кодирующего GlcNAcT.*Strains MP3672 and MP3020 carry the same heterologous GlcNAcT and Gal4T, but differ in the number of copies of the corresponding gene encoding GlcNAcT.

**Штаммы МР3994 и МР4065 несут одни и те же гетерологичные GlcNAcT и Gal4T, но отличаются числом копий соответствующего гена, кодирующего GlcNAcT.**Strains MP3994 and MP4065 carry the same heterologous GlcNAcT and Gal4T, but differ in the copy number of the corresponding gene encoding GlcNAcT.

Культивирование.Cultivation.

Если не указано иное, штаммы E.coli размножали в среде базовой минимальной среде, содержавшей 0,2% глюкозы, при 37°C при перемешивании. Чашки с агаром инкубировали при 37°C в течение ночи.Unless otherwise stated, E. coli strains were propagated in basal minimal medium containing 0.2% glucose at 37°C with agitation. Agar plates were incubated at 37°C overnight.

Базовая минимальная среда имела следующий состав: NaOH (1 г/л), KOH (2,5 г/л), KH2PO4 (7 г/л), NH4H2PO4 (7 г/л), лимонная кислота (0,5 г/л), раствор микроэлементов (5 мл/л). Исходный раствор микроэлементов содержал: ZnSO4-7H2O 0,82 г/л, лимонную кислоту 20 г/л, MnSO4-H2O 0,98 г/л, FeSO4-7H2O 3,925 г/л, CuSO4-5H2O 0,2 г/л. рН базовой минимальной среды доводили до 7,0 с помощью 5н. NaOH и автоклавировали.The basic minimal medium had the following composition: NaOH (1 g/l), KOH (2.5 g/l), KH 2 PO 4 (7 g/l), NH4H2PO4 (7 g/l), citric acid (0.5 g/l), solution of trace elements (5 ml/l). The initial solution of trace elements contained: ZnSO 4 -7H 2 O 0.82 g/l, citric acid 20 g/l, MnSO 4 -H 2 O 0.98 g/l, FeSO 4 -7H 2 O 3.925 g/l, CuSO 4 -5H 2 O 0.2 g/l. The pH of the basic minimal medium was adjusted to 7.0 using 5N. NaOH and autoclaved.

Перед инокуляцией в базовую минимальную среду добавляли 1 мМ MgSO4, 4 мкг/мл тиамина, 0,5% заданного источника углерода (глицерин (Carbosynth)). Тиамин, антибиотики стерилизовали фильтрованием. Все процентные концентрации для глицерина выражены как объем/объем, а для глюкозы - масса/объем.Before inoculation, 1 mM MgSO 4 , 4 μg/ml thiamine, and 0.5% of a given carbon source (glycerol (Carbosynth)) were added to the basic minimal medium. Thiamine, antibiotics were sterilized by filtration. All percentage concentrations for glycerol are expressed as v/v and for glucose as w/v.

Химически компетентные клетки и трансформации E.coli инокулировали из чашек LB в 5 мл LB, содержащего 0,2% глюкозы, при 37°C при встряхивании до OD600 ~0,4. 2 мл культуры собирали центрифугированием в течение 25 с при 13000 g. Супернатант удаляли, а клеточный осадок ресуспендировали в 600 мкл холодных растворов ТВ (10 мМ PIPES, 15 мМ CaCl2, 250 мМ KCl). Клетки инкубировали на льду в течение 20 мин с последующим осаждением в течение 15 с при 13000 g. Супернатант удаляли, а клеточный осадок ресуспендировали в 100 мкл холодного раствора ТВ. Трансформацию плазмид проводили с применением 100 мкл компетентных клеток и 1-10 нг плазмидной ДНК. Клетки и ДНК инкубировали на льду в течение 20 мин, а затем подвергали тепловому шоку при 42°C в течение 45 с. После 2минутной инкубации на льду добавляли 400 мкл SOC (20 г/л триптона, 5 г/л дрожжевого экстракта, 0,5 г/л NaCl, 0,186 г/л KCl, 10 мМ MgCl2, 10 мМ MgSO4 и 20 мМ глюкозы) и культуру клеток инкубировали при 37 °C при встряхивании в течение 1-го часа перед посевом на селективные чашки.Chemically competent E. coli cells and transformations were inoculated from LB plates into 5 ml LB containing 0.2% glucose at 37°C with shaking to OD 600 ~0.4. 2 ml of culture were collected by centrifugation for 25 s at 13000 g. The supernatant was removed, and the cell pellet was resuspended in 600 μl of cold TB solutions (10 mM PIPES, 15 mM CaCl 2 , 250 mM KCl). Cells were incubated on ice for 20 min followed by sedimentation for 15 s at 13,000 g. The supernatant was removed, and the cell pellet was resuspended in 100 μl of cold TB solution. Plasmid transformation was carried out using 100 μl of competent cells and 1-10 ng of plasmid DNA. Cells and DNA were incubated on ice for 20 min and then heat shocked at 42°C for 45 s. After a 2-minute incubation on ice, 400 μl of SOC (20 g/l tryptone, 5 g/l yeast extract, 0.5 g/l NaCl, 0.186 g/l KCl, 10 mM MgCl2 , 10 mM MgSO4 and 20 mM glucose) was added ) and the cell culture was incubated at 37 °C with shaking for 1 hour before plating on selective plates.

- 18 046005- 18 046005

Плазмиду трансформировали в химически компетентные клетки ТОР10 в условиях, рекомендованных поставщиком (ThermoFisher Scientific).The plasmid was transformed into chemically competent TOP10 cells under conditions recommended by the supplier (ThermoFisher Scientific).

ДНК-технологии.DNA technology.

Плазмидную ДНК из E.coli выделяли с применением набора QIAprep Spin Miniprep (Qiagen). Хромосомную ДНК из E.coli выделяли с применением набора QIAmp DNA Mini Kit (Qiagen). Продукты ПНР очищали с применением набора QIAquick PCR Purification Kit (Qiagen). Мастер-микс для ПНР DreamTaq (Thermofisher), мастер-микс для ПНР с горячим стартом Phusion U (Thermofisher), USER Enzyme (New England Biolab) применяли в соответствии с рекомендациями поставщика. Праймеры были поставлены компанией Eurofins Genomics, Германия. Фрагменты ПЦР и плазмиды были секвенированы компанией Eurofins Genomics. ПНР колоний проводили с применением DreamTaq PCR Master Mix в термоциклере Т100ТМ (Bio-Rad).Plasmid DNA from E. coli was isolated using the QIAprep Spin Miniprep kit (Qiagen). Chromosomal DNA from E. coli was isolated using the QIAmp DNA Mini Kit (Qiagen). PNR products were purified using the QIAquick PCR Purification Kit (Qiagen). DreamTaq PNR Master Mix (Thermofisher), Phusion U Hot Start PNR Master Mix (Thermofisher), USER Enzyme (New England Biolab) were used according to the supplier's recommendations. Primers were supplied by Eurofins Genomics, Germany. PCR fragments and plasmids were sequenced by Eurofins Genomics. PNR of colonies was carried out using DreamTaq PCR Master Mix in a T100TM thermal cycler (Bio-Rad).

Гетерологичные белки, экспрессированные в генетически модифицированных клетках, продуцирующих ОГМ, по данному изобретению, описаны в табл. 4, промоторные элементы, которые применяли в приведенных ниже примерах изобретения, описаны в табл. 5, а олигонуклеотиды, примененные для амплификации остовов плазмиды, промотора, элементов и fred, описаны в табл. 6.Heterologous proteins expressed in genetically modified OGM-producing cells according to this invention are described in table. 4, the promoter elements that were used in the following examples of the invention are described in table. 5, and the oligonucleotides used to amplify the plasmid backbone, promoter, elements and fred are described in table. 6.

Таблица 4Table 4

Гетерологичные белки, экспрессированные в генетически модифицированных клетках, продуцирующих ОГМHeterologous proteins expressed in genetically modified cells producing OGM

Ген Gene Происхождение гена Origin of the gene Номер доступа белка Protein accession number Функция белка Protein function fiitC fiitC Helicobacter pylori 26695 Helicobacter pylori 26695 WP_080473865.1 WP_080473865.1 a-1,2-фукозилтрансфераза a-1,2-fucosyltransferase fiitA fiitA Helicobacter pylori 26695 Helicobacter pylori 26695 WP_000487428.1 WP_000487428.1 a-1,3- фукозилтрансфераза a-1,3-fucosyltransferase IgtA IgtA Neisseria meningitidis 053442 Neisseria meningitidis 053442 WP_002248149.1 WP_002248149.1 β-1,3- ацетилглюкозаминилтрансфераза β-1,3- acetylglucosaminyltransferase galTK galTK Helicobacter pylori 43504 Helicobacter pylori 43504 BD182026 BD182026 β-1,3- галактозилтрансфераза β-1,3-galactosyltransferase fred fred Yersinia frederiksenii Yersinia frederiksenii WP_087817556.1 WP_087817556.1 MFS-транспортер MFS conveyor yberC0001_9420 yberC0001_9420 Yersinia bercovieri Yersinia bercovieri EEQ08298.1 EEQ08298.1 Суперсемейство основных переносчиков MFS 1 Superfamily of major MFS 1 vectors пес* dog* Rosenbergiella nectarea Rosenbergiella nectarea WP 092672081.1 WP 092672081.1 MFS-транспортер MFS conveyor marc* marc* Serratia marcescens Serratia marcescens WP 060448169.1 WP 060448169.1 MFS-транспортер MFS conveyor bad* bad* Rouxiella badensis Rouxiella badensis WP_017489914.1 WP_017489914.1 MFS-транспортер MFS conveyor vag* vag* Pantoea vagans Pantoea vagans WP 048785139.1 WP 048785139.1 MFS-транспортер MFS conveyor yabM yabM Erwinia pyrifoliae Erwinia pyrifoliae CAY73138.1 CAY73138.1 Предполагаемый транспортер сахаров MFS Putative transporter MFS sugars

*Название гена дано для идентификации нуклеиновой кислоты, кодирующей белок, имеющий аминокислотную последовательность, соответствующую номеру доступа в GenBank, для целей настоящего изобретения.*The gene name is given to identify the nucleic acid encoding the protein having the amino acid sequence corresponding to the GenBank accession number for the purposes of the present invention.

Таблица 5Table 5

Элементы синтетической ДНК, примененные для экспрессии fredSynthetic DNA elements used for fred expression

Название последовательности Sequence name SEQ ID NO SEQ ID NO Последовательность (5 ’ -3 ’) Sequence (5’ -3’) Описание Description PglpF PglpF 4 4 GCGGCACGCCTTGCAGATTACGGTTTG CCACACTTTTCATCCTTCTCCTGGTGAC ATAATCCACATCAATCGAAAATGTTAA TAAATTTGTTGCGCGAATGATCTAACA AACATGCATCATGTACAATCAGATGGA ATAAATGGCGCGATAACGCTCATTTTA TGACGAGGCACACACATTTTAAGTTCG atatttctcgtttttgctcgttaacgat AAGTTTACAGCATGCCTACAAGCATCG TGGAGGTCCGTGACTTTCACGCATACA ACAAACATTAACCAAGGAGGAAACAG CT GCGGCACGCCTTGCAGATTACGGTTTG CCACACTTTTCATCTTCTCCTGGTGAC ATAATCCACATCAATCGAAAATGTTAA TAAATTTGTTGCGCGAATGATCTAACA AACATGCATCATGTACAATCAGATGGA ATAAATGGCGCGATAACGCTCATTTTA TGACGAGGCACACACATTTTAAGTTCG atatttctcgtttttgctcgttaacgat AAGTTTACAGCATG CCTACAAGCATCG TGGAGGTCCGTGACTTTCACGCATACA ACAAACATTAACCAAGGAGGAAACAG CT Элемент экспрессии ДНК из 300 нуклеотидов Element of expression DNA of 300 nucleotides PglpF SD4 PglpF SD4 5 5 GCGGCACGCCTTGCAGATTACGGTTTG CCACACTTTTCATCCTTCTCCTGGTGAC ATAATCCACATCAATCGAAAATGTTAA TAAATTTGTTGCGCGAATGATCTAACA AACATGCATCATGTACAATCAGATGGA ATAAATGGCGCGATAACGCTCATTTTA TGACGAGGCACACACATTTTAAGTTCG ATATTTCTCGTTTTTGCTCGTTAACGAT GCGGCACGCCTTGCAGATTACGGTTTG CCACACTTTTCATCTTCTCCTGGTGAC ATAATCCACATCAATCGAAAATGTTAA TAAATTTGTTGCGCGAATGATCTAACA AACATGCATCATGTACAATCAGATGGA ATAAATGGCGCGATAACGCTCATTTTA TGACGAGGCACACACATTTTAAGTTCG ATATTTCTCGTTTTTGCTCGTTAACGAT Элемент экспрессии ДНК из 300 нуклеотидов Element of expression DNA of 300 nucleotides

- 19 046005- 19 046005

AAGTTTACAGCATGCCTACAAGCATCG TGGAGGTCCGTGACTTTCACGCATACA ACAAACATTAACCAACTAGGAAACAG CT AAGTTTACAGCATGCCTACAAGCATCG TGGAGGTCCGTGACTTTCACGCATACA ACAAACATTAACCAACTAGGAAACAG CT PglpF_SD7 PglpF_SD7 6 6 GCGGCACGCCTTGCAGATTACGGTTTG CCACACTTTTCATCCTTCTCCTGGTGAC ATAATCCACATCAATCGAAAATGTTAA TAAATTTGTTGCGCGAATGATCTAACA AACATGCATCATGTACAATCAGATGGA ATAAATGGCGCGATAACGCTCATTTTA TGACGAGGCACACACATTTTAAGTTCG atatttctcgtttttgctcgttaacgat AAGTTTACAGCATGCCTACAAGCATCG TGGAGGTCCGTGACTTTCACGCATACA ACAAACATTAACCAAGAGCAAAACAG CT GCGGCACGCCTTGCAGATTACGGTTTG CCACACTTTTCATCTTCTCCTGGTGAC ATAATCCACATCAATCGAAAATGTTAA TAAATTTGTTGCGCGAATGATCTAACA AACATGCATCATGTACAATCAGATGGA ATAAATGGCGCGATAACGCTCATTTTA TGACGAGGCACACACATTTTAAGTTCG atatttctcgtttttgctcgttaacgat AAGTTTACAGCATG CCTACAAGCATCG TGGAGGTCCGTGACTTTCACGCATACA ACAAACATTAACCAAGAGCAAAACAG CT Элемент экспрессии ДНК из 300 нуклеотидов Element of expression DNA of 300 nucleotides fred fred 2 2 ATGAAGAGCGCGCTGACCTTCAGCCGT CGTATTAACCCGGTTTTTCTGGCGTTCT TTGTGGTTGCGTTCCTGAGCGGTATTGC GGGTGCGCTGCAGGCGCCGACCCTGAG CCTGTTCCTGAGCACCGAGGTGAAAGT TCGTCCGCTGTGGGTGGGCCTGTTCTA CACCGTTAACGCGATTGCGGGTATCAC CGTGAGCTTTGTTCTGGCGAAGCGTAG CGACCTGCGTGGCGATCGTCGTAAACT GATCCTGGTGTGCTACCTGATGGCGGT TGGTAACTGCCTGCTGTTCGCGTTTAAC CGTGACTATCTGACCCTGATTACCGCG GGCGTGCTGCTGGCGGCGGTTGCGAAC ACCGCGATGCCGCAGATTTTCGCGCTG GCGCGTGAGTACGCGGATAACAGCGC GCGTGAAGTGGTTATGTTTAGCAGCAT TATGCGTGCGCAACTGAGCCTGGCGTG GGTTATCGGTCCGCCGCTGAGCTTCAT GCTGGCGCTGAACTATGGCTTCACCCT GATGTTTTGCATTGCGGCGGGTATCTTC GTGCTGAGCGCGCTGGTTGTGTGGTTT ATTCTGCCGAGCGTGCAGCGTGCGGAA CCGGTTATGGATGCGCCGACCGTGGCG CAAGGCAGCCTGTTCGCGGACAAGGAT GTTCTGCTGCTGTTTATTGCGAGCATGC TGATGTGGACCTGCAACACCATGTACA TCATTGATATGCCGCTGTATATCACCG CGAGCCTGGGTCTGCCGGAGCGTCTGG CGGGTCTGCTGATGGGCACCGCGGCGG GTCTGGAAATCCCGATTATGCTGCTGG CGGGCTACAGCGTGCGTCGTTTTGGCA AGCGTAAAATCATGCTGTTCGCGGTGC TGGCGGGCGTTCTGTTTTATACCGGTCT GGTTCTGTTCAAGTTTAAAAGCGCGCT GATGCTGCTGCAGATTTTCAACGCGAT CTTTATTGGTATCGTGGCGGGTATCGG CATGCTGTACTTCCAAGACCTGATGCC GGGTCGTGCGGGTGCGGCGACCACCCT GTTTACCAACAGCATTAGCACCGGCGT TATCCTGGCGGGCGTGCTGCAAGGTGT TCTGACCGAAACCTGGGGTCACAACAG ATGAAGAGCGCGCTGACCTTCAGCCGT CGTATTAACCCGGTTTTTCTGGCGTTCT TTGTGGTTGCGTTCCTGAGCGGTATTGC GGGTGCGCTGCAGGCGCCGACCCTGAG CCTGTTCCTGAGCACCGAGGTGAAAGT TCGTCCGCTGTGGGTGGGCCTGTTCTA CACCGTTAACGCGATTGCGGGTATCAC CGTGAGCTTTGTTCTGGCGAAGCGTAG CGACCTGCG TGGCGATCGTCGTAAACT GATCCTGGTGTGCTACCTGATGGCGGT TGGTAACTGCCTGCTGTTCGCGTTTAAC CGTGACTATCTGACCCTGATTACCGCG GGCGTGCTGCTGGCGGCGGTTGCGAAC ACCGCGATGCCGCAGATTTTCGCGCTG GCGCGTGAGTACGCGGATAACAGCGC GCGTGAAGTGGTTATGTTTAGCAGCAT TATGCGTGCGCAACTGAGCCTGGCGTG GGTTATTCGGTCCGCCGCTGAGCTTCAT GCTGGCGCTGAACTATGGCTTCACCCT GATGTTTTGCATTGCGGCGGGTATCTTC GTGCTGAGCGCGCTGGTTGTGTGGTTT ATTCTGCCGAGCGTGCAGCGTGCGGAA CCGGTTATGGATGCGCCGACCGTGGCG CAAGGCAGCCTGTTCGCGGACAAGGAT GTTCTGCTGCTGTTTATTGCGAGCATGC TGATGTGGACCTGCAAC ACCATGTACA TCATTGATATGCCGCTGTATATCACG CGAGCCTGGGTCTGCCGGAGCGTCTGG CGGGTCTGCTGATGGGCACCGCGGCGG GTCTGGAAATCCCGATTATGCTGCTGG CGGGCTACAGCGTGCGTCGTTTTGGCA AGCGTAAAATCATGCTGTTCGCGGTGC TGGCGGGCGTTCTGTTTTATACCGGTCT GGTTCTGTTCAAGTTTAAAAGCGCGCT GATGCTG CTGCAGATTTTCAACGCGAT CTTTATTGGTATCGTGGCGGGTATCGG CATGCTGTACTTCCAAGACCTGATGCC GGGTCGTGCGGGTGCGGCGACCACCCT GTTTACCAACAGCATTAGCACCGGCGT TATCCTGGCGGGCGTGCTGCAAGGTGT TCTGACCGAAACCTGGGGTCACAACAG ДНК, кодирующая транспортер MFS DNA encoding conveyor MFS Plac Plac 19 19 CGTGTATGTTATGGCGATGATTCTGGC GATCCTGAGCCTGATCATTTGCGCGCG TGTGCGTGAAGCGTAA ATGCGCAAATTGTGAGTTAGCTCACTC ATTAGGCACCCCAGGCTTTACACTTTA TGCTTCCGGCTCGTATGTTGTGTGGAAT TGTGAGCGGATAACAATTTCACACAGG AAACAGCTATGACCATGATTACGCCAA GCGCGCAATTAACCCTCACTAAAGGGA ACAAAAGCTGGGTACCTAAGGAGGAA ACAGCT CGTGTATGTTATGGCGATGATTCTGGC GATCCTGAGCCTGATCATTTGCGCGCG TGTGCGTGAAGCGTAA ATGCGCAAATTGTGAGTTAGCTCACTC ATTAGGCACCCAGGCTTTACACTTTA TGCTTCCGGCTCGTATGTTGTGTGGAAT TGTGAGCGGATAACAATTTCACACAGG AAACAGCTATGACCATGATTACGCCAA GCGCGCAATTAACCCTCACTAAAGGGA ACAAAAGCTGGGTACCTAAGGAGGAA ACAGCT Элемент экспрессии ДНК из 195 нуклеотидов Element of expression DNA of 195 nucleotides

- 20 046005- 20 046005

Таблица 6 Олигонуклеотиды, применяемые для амплификации остова плазмиды, промоторных элементов и представляющих интерес генов, включая fredTable 6 Oligonucleotides used to amplify the plasmid backbone, promoter elements and genes of interest, including fred

Название Name SEQ ID NO SEQ ID NO Олигонуклеотидная последовательность 5’-3’ Oligonucleotide sequence 5'-3' Описание Description 040 040 9 9 ATTAACCCUCCAGGCATCAAATAAAAC GAAAGGC ATTAACCCUCCAGGCATCAAATAAAAC GAAAGGC Остов, прямой Frame, straight 079 079 10 10 ATTTGCGCAUCACCAATCAAATTCACG CGGCC ATTTGCGCAUCACCAATCAAATTCACG CGGCC Остов, обратный Backbone, reverse 0261 0261 11 eleven ATGCGCAAAUGCGGCACGCCTTGCAGA TTACG ATGCGCAAAUGCGGCACGCCTTGCAGA TTACG PglpF.прямой PglpF.direct 0262 0262 12 12 AGCTGTTUCCTCCTTGGTTAATGTTTGT TGTATGCG AGCTGTTUCCTCCTTGGTTAATGTTTGT TGTATGCG PglpF.o6parHbm PglpF.o6parHbm 0459 0459 13 13 AGCTGTTUCCTAGTTGGTTAATGTTTGT TGTATGCG AGCTGTTUCCTAGTTGGTTAATGTTTGT TGTATGCG PglpF SD 4 PglpF SD 4 0462 0462 14 14 AGCTGTTUTGCTCTTGGTTAATGTTTGT TGTATGCG AGCTGTTUTGCTCTTGGTTAATGTTTGT TGTATGCG PglpF SD7 PglpF SD7 KABY733 KABY733 15 15 AAACAGCUATGAAGAGCGCGCTGACCT TCAG AAACAGCUATGAAGAGCGCGCTGACCT TCAG fred. прямой fred. straight KABY734 KABY734 16 16 AGGGTTAAUTTACGCTTCACGCACACG CG AGGGTTAAUTTACGCTTCACGCACACG CG fred. обратный fred. back 048 048 17 17 CCCAGCGAGACCTGACCGCAGAAC CCCAGCGAGACCTGACCGCAGAAC до/К.прямой to/K.direct 049 049 18 18 CCCCAGTCCATCAGCGTGACTACC CCCCAGTCCATCAGCGTGACTACC galK. обратный galK. back 068 068 20 20 ATGCGCAAAUTGTGAGTTAGCTCACTC ATTAG ATGCGCAAAUTGTGAGTTAGCTCACTC ATTAG Plac. прямой Plac. straight 0113 0113 21 21 AGCTGTTUCCTCCTTAGGTACCCAGCTT TTGTTCCC AGCTGTTUCCTCCTTAGGTACCCAGCTT TTGTTCCC Plac. обратный Plac. back KABY745 KABY745 22 22 AAACAGCUATGAAGAGCCTGCTGACCC GTAAAC AAACAGCUATGAAGAGCCTGCTGACCC GTAAAC vag.прямой vag.straight KABY746 KABY746 23 23 AGGGTTAAUTTAAACGTTTTTCACACGC GCG AGGGTTAAUTTAAAACGTTTTTCACACGC GCG vag.обратный vag.reverse KABY721 KABY721 24 24 AAACAGCUATGAAGAGCGCGCTGACCT TTAGC AAACAGCUATGAAGAGCGCGCTGACCT TTAGC уЬегС0001_9420.прям ой yberC0001_9420.straight oh KABY722 KABY722 25 25 AGGGTTAAUTTACGCCTCACGCACACG CG AGGGTTAAUTTACGCTCACGCACACG CG уЬегС0001_9420.обра тный yberC0001_9420.reverse KABY729 KABY729 26 26 AAACAGCUATGAGCAGCCGTCGTCTGA GC AAACAGCUATGACAGCCGTCGTCTGA GC bad.прямой bad.straight KABY730 KABY730 27 27 AGGGTTAAUTTACACGTTTTTAACACG GGTCATCAG AGGGTTAAUTTACACGTTTTTAACACG GGTCATCAG bad.обратный bad.reverse KABY741 KABY741 28 28 AAACAGCUATGCAGAGCTTCACCCCGC C AAACAGCUATGCAGAGCTTCACCCCGC C пес.прямой dog.direct KABY742 KABY742 29 29 AGGGTTAAUTTACGCCTGCTCTTTAACA CGCAGC AGGGTTAAUTTACGCCTGCTCTTTAACA CGCAGC пес.обратный dog reverse KABY737 KABY737 30 thirty AAACAGCUATGCAGCGTCTGAGCCGTC TGAG AAACAGCUATGCAGCGTCTGAGCCGTCTGAG marc.прямой marc.direct KABY738 KABY738 31 31 AGGGTTAAUTTAAACTTCACGCACTTTC GCGC AGGGTTAAUTTAAACTTCACGCACTTTC GCGC marc.обратный marc.reverse МР1217 MP1217 32 32 AAACAGCUATGAAGGCGCTGTGGAGCC GTCG AAACAGCUATGAAGGCGCTGTGGAGCC GTCG уаЬМ.прямой uAM.straight МР1218 MP1218 33 33 AGGGTTAAUCGCCAGCGGAACGCTCTT CACG AGGGTTAAUCGCCAGCGGAACGCTCTT CACG уаЬМ.обратный UAM.reverse

Конструирование плазмид.Construction of plasmids.

Были синтезированы плазмидные скелеты, содержащие два эндонуклеазных сайта I-SceI, разделенных двумя фрагментами ДНК, приспособленными для гомологичной рекомбинации в геном E.coli, и последовательностью терминатора транскрипции Т1. Например, в одной плазмидной основе (pUC57::gal) был синтезирован оперон gal (необходимый для гомологичной рекомбинации в galK) и последовательность терминатора транскрипции T1 (GeneScript). Последовательности ДНК, примененные для гомологичной рекомбинации в гал-опероне, охватывают пары оснований 3.628.621-3.628.720 и 3.627.5723.627.671 в последовательности Escherichia coli K-12 MG155, полный геном GenBank: ID: СР014225.1. Вставка путем гомологичной рекомбинации привела бы к делеции 949 пар оснований galK и фенотипа galK-. Подобным образом могут быть синтезированы скелеты на основе pUC57 (GeneScript) или любого другого подходящего вектора, содержащего два сайта эндонуклеазы I-Scel, разделенных двумя фрагментами ДНК, приспособленными для гомологичной рекомбинации в геном E.coli, и последовательностью терминатора транскрипции Т1. Для конструирования праймеров и амплификации специфических последовательностей ДНК хромосомной ДНК Escherichia coli K-12 DH1 применяли стандартные методики, хорошо известные в области молекулярной биологии. Такие стандартные приемы, векторы и элементы можно найти, например, в руководствах: Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley & Sons); Sambrook, Fritsch, & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.).Plasmid backbones were synthesized containing two I-SceI endonuclease sites separated by two DNA fragments adapted for homologous recombination into the E. coli genome and a T1 transcription terminator sequence. For example, in one plasmid backbone (pUC57::gal) the gal operon (required for homologous recombination in galK) and a T1 transcription terminator sequence were synthesized (GeneScript). The DNA sequences used for homologous recombination in the gal operon span base pairs 3.628.621-3.628.720 and 3.627.5723.627.671 in the Escherichia coli K-12 MG155 sequence, GenBank complete genome: ID: CP014225.1. Insertion by homologous recombination would result in a 949 bp deletion of galK and a galK- phenotype. In a similar manner, scaffolds can be synthesized from pUC57 (GeneScript) or any other suitable vector containing two I-Scel endonuclease sites separated by two DNA fragments adapted for homologous recombination into the E. coli genome and a T1 transcription terminator sequence. Standard techniques well known in the field of molecular biology were used to design primers and amplify specific DNA sequences from Escherichia coli K-12 DH1 chromosomal DNA. Such standard techniques, vectors and elements can be found, for example, in the manuals: Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley &Sons); Sambrook, Fritsch, & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.).

Хромосомную ДНК, полученную из E.coli DH1, применяли для амплификации фрагмента ДНК размером 300 п.н., содержащего промотор PglpF, с применением олигонуклеотидов 0261 и 0262,Chromosomal DNA obtained from E. coli DH1 was used to amplify a 300 bp DNA fragment containing the PglpF promoter using oligonucleotides 0261 and 0262,

- 21 046005- 21 046005

PglpF_SD4 применяя олигонуклеотиды 0261 и 0459, nPglpF_SD7 применяя олигонуклеотиды 0261 м 0462 (табл. 6).PglpF_SD4 using oligonucleotides 0261 and 0459, nPglpF_SD7 using oligonucleotides 0261 and 0462 (Table 6).

Фрагмент ДНК длиной 1.182 п.н., содержащий кодоноптимизированную версию гена fred, SEQ ID NO: 2, происходящего из Yersinia frederiksenii синтезировали с помощью GeneScript (табл. 4). Ген fred амплифицировали с применением олигонуклеотидов KABY733 and KABY734.A 1,182 bp DNA fragment containing a codon-optimized version of the fred gene, SEQ ID NO: 2, originating from Yersinia frederiksenii was synthesized using GeneScript (Table 4). The fred gene was amplified using oligonucleotides KABY733 and KABY734.

Все ПЦР-фрагменты (основы плазмиды, элементы, содержащие промотор, и ген fred) очищали и собирали основы плазмиды, элементы промотора (Plac, PglpF или PglpF_SD4 или PglpF_SD7), и содержащий fred (или другой представляющий интерес ген, смотри табл. 4) фрагмент ДНК. Плазмиды клонировали с помощью стандартного клонирования USER. Клонирование в любой подходящей плазмиде может быть осуществлено с помощью любых стандартных способов клонирования ДНК. Плазмиды трансформировали в клетки ТОР10 и отбирали на чашках LB, содержащих 100 мкг/мл ампициллина (или любого подходящего антибиотика) и 0,2% глюкозы. Сконструированные плазмиды очищали, а последовательность промотора и 5'-конец гена fred подтверждали секвенированием ДНК (MWG Eurofins Genomics). Таким образом конструировали генетическую кассету, содержавшую любой представляющий интерес промотор, связанный с геном fred (или другим представляющим интерес геном, смотри табл. 4).All PCR fragments (plasmid backbones, promoter-containing elements, and fred gene) were purified and the plasmid backbone, promoter elements (Plac, PglpF or PglpF_SD4 or PglpF_SD7), and fred-containing (or other gene of interest, see Table 4) were assembled. DNA fragment. Plasmids were cloned using USER standard cloning. Cloning into any suitable plasmid can be accomplished using any standard DNA cloning techniques. Plasmids were transformed into TOP10 cells and selected on LB plates containing 100 μg/ml ampicillin (or any suitable antibiotic) and 0.2% glucose. The constructed plasmids were purified, and the promoter sequence and the 5′ end of the fred gene were confirmed by DNA sequencing (MWG Eurofins Genomics). In this way, a genetic cassette was constructed containing any promoter of interest associated with the fred gene (or other gene of interest, see Table 4).

Конструирование штаммов.Strain construction.

Примененный бактериальный штамм, MDO, был сконструирован из Escherichia coli K-12 DHL Гентип E.coli K-12 DH1 представлял собой: F-, λ-, gyrA96, recA1, relA1, endA1, thi-1, hsdR17, supE44. В дополнение к генотипу E.coli K-12 DH1 MDO имеет следующие модификации: lacZ: делеция, размером 1,5 т.п.н., lacA: делеция, размером 0,5 т.п.н., nanKETA: делеция, размером 3,3 т.п.н., melA: делеция, размером 0,9 т.п.н., wcaJ: делеция, размером 0,5 т.п.н., mdoH: делеция, размером 0,5 т.п.н., и вставка промотора Plac выше гена gmd.The bacterial strain used, MDO, was constructed from Escherichia coli K-12 DHL Gentype E. coli K-12 DH1 were: F - , λ - , gyrA96, recA1, relA1, endA1, thi-1, hsdR17, supE44. In addition to the E. coli K-12 genotype, DH1 MDO has the following modifications: lacZ: 1.5 kb deletion, lacA: 0.5 kb deletion, nanKETA: deletion, 3.3 kb, melA: 0.9 kb deletion, wcaJ: 0.5 kb deletion, mdoH: 0.5 k deletion .bp, and insertion of the Plac promoter upstream of the gmd gene.

Вставку кассеты экспрессии, содержавшей промотор, связанный с геном fred Вставку кассеты экспрессии, содержавшей промотор, связанный с геном Т1 в хромосомной ДНК E.coli K-12 DH1 MDO осуществляли с помощью Gene Gorging по существу, как описано в работе Herring et al. (Herring, CD., Glasner, J.D. and Blattner, F.R. (2003). Gene (311). 153-163). Вкратце, донорную плазмиду и хелперную плазмиду котрансформировали в MDO и отбирали на чашках с LB, содержавших 0,2% глюкозы, ампициллин (100 мкг/мл) или канамицин (50 мг/мл) и хлорамфеникол (20 мкг/мл). Одиночную колонию инокулировали в 1 мл LB, содержащего хлорамфеникол (20 мкг/мл) и 10 мкл 20% L-арабинозы, и инкубировали при 37°C при встряхивании в течение 7-8 ч. Для интеграции в локусы galK клеток E.coli затем высевали на чашки M9-DOG и инкубировали при 37°C в течение 48 ч. Отдельные колонии, сформированные на чашках MM-DOG, повторно высевали штрихом на чашки с LB, содержавшие 0,2% глюкозы, и инкубировали в течение 24-х часов при 37°C. Ожидалось, что колонии, которые выглядели белыми на чашках с агаром MacConkey-галактоза и были чувствительны как к ампициллину, так и к хлорамфениколу, потеряли донорную и вспомогательную плазмиду и содержали вставку в локусах galK. Отдельные колонии, сформированные на чашках MM-DOG, повторно высевали штрихом на чашки с LB, содержавшие 0,2% глюкозы, и инкубировали в течение 24-х часов при 37°C. Ожидалось, что колонии, которые выглядели белыми на чашках с агаром MacConkey-галактоза и были чувствительны как к ампициллину, так и к хлорамфениколу, потеряли донорную и вспомогательную плазмиду и содержали вставку в локусах galK. 17) и 049 (SEQ ID NO: 18) а вставленную ДНК проверяли секвенированием (Eurofins Genomics, Германия).Insertion of an expression cassette containing a promoter associated with the fred gene Insertion of an expression cassette containing a promoter associated with the T1 gene into the chromosomal DNA of E. coli K-12 DH1 MDO was performed using Gene Gorging essentially as described in Herring et al. (Herring, C. D., Glasner, J. D. and Blattner, F. R. (2003). Gene (311). 153-163). Briefly, donor plasmid and helper plasmid were cotransformed into MDO and selected on LB plates containing 0.2% glucose, ampicillin (100 μg/ml) or kanamycin (50 mg/ml), and chloramphenicol (20 μg/ml). A single colony was inoculated in 1 ml of LB containing chloramphenicol (20 μg/ml) and 10 μl of 20% L-arabinose and incubated at 37°C with shaking for 7-8 hours. For integration into the galK loci of E. coli cells, plated on M9-DOG plates and incubated at 37°C for 48 hours. Individual colonies formed on MM-DOG plates were streaked again onto LB plates containing 0.2% glucose and incubated for 24 hours at 37°C. The colonies, which appeared white on MacConkey-galactose agar plates and were sensitive to both ampicillin and chloramphenicol, were expected to have lost the donor and helper plasmid and contained an insertion at the galK loci. Individual colonies formed on MM-DOG plates were streaked again onto LB plates containing 0.2% glucose and incubated for 24 hours at 37°C. The colonies, which appeared white on MacConkey-galactose agar plates and were sensitive to both ampicillin and chloramphenicol, were expected to have lost the donor and helper plasmid and contained an insertion at the galK loci. 17) and 049 (SEQ ID NO: 18) and the inserted DNA was verified by sequencing (Eurofins Genomics, Germany).

Встраивание генетических кассет в другие локусы хромосомной ДНК E.coli осуществляли аналогичным образом с применением различных маркерных генов селекции.The integration of genetic cassettes into other loci of E. coli chromosomal DNA was carried out in a similar way using various selection marker genes.

Анализ в глубоких лунках.Analysis in deep wells.

Анализ в глубоких лунках выполняли, как первоначально описано в работе Lv et al. (Bioprocess Biosyst Eng (2016) 39:1737-1747) и оптимизировали для целей настоящего изобретения.The deep well assay was performed as originally described by Lv et al. (Bioprocess Biosyst Eng (2016) 39:1737–1747) and optimized for the purposes of the present invention.

Более конкретно, штаммы, раскрытые в примерах, подвергали скринингу в 24 планшетах с глубокими лунками с применением 4-дневного протокола. В течение первых 24-х часов клетки культуры на шейкере выращивали при 34°C при встряхивании со скоростью 700 об/мин до высокой плотности, в то время как в следующие 48 ч для клеток, продуцирующих 2'-FL и 3-FL, и 72 ч для клеток, продуцирующих LNT, клетки переносили в среду, которая позволяла индуцировать экспрессию генов и образование продукта. В особенности, в течение 1 дня готовили свежие инокуляты с применением базовой минимальной среды с добавлением сульфата магния, тиамина и глюкозы. Через 24 ч инкубации клетки переносили на новую базовую минимальную среду (2 мл) с добавлением сульфата магния и тиамина с добавлением исходного болюса, состоящего из 20% раствора глюкозы (1 мкл) и 10% раствора лактозы (0,1 мл). Затем к клеткам добавляли 50% раствор сахарозы (0,04 мл) в качестве источника углерода, сопровождаемый добавлением сахарозогидролазы (инвертазы, 5 мкл раствора 0,1 г/л), так что глюкоза поступала с медленной скоростью для роста за счет расщепление сахарозы инвертазой. После инокуляции новой среды клетки встряхивали при 700 об/мин при 28°C в течение 48 ч. После денатурации и последующего центрифугирования супернатанты анализировали с помощью HPLC. Для анализа общих образцов клеточный лизат, приготовленный кипячением, осаждали центрифугированием в течение 10 мин при 4700 об/мин. Концентрацию ОГМ в супернатанте определяли с помощью HPLC или НРАС.More specifically, the strains disclosed in the examples were screened in 24 deep well plates using a 4 day protocol. During the first 24 hours, shaker culture cells were grown at 34°C with shaking at 700 rpm to high density, while in the next 48 hours for cells producing 2'-FL and 3-FL, and 72 h for LNT-producing cells, cells were transferred to a medium that allowed gene expression and product formation to be induced. Specifically, fresh inocula were prepared for 1 day using basic minimal medium supplemented with magnesium sulfate, thiamine, and glucose. After 24 h of incubation, cells were transferred to new basal minimal medium (2 ml) supplemented with magnesium sulfate and thiamine supplemented with an initial bolus of 20% glucose (1 μl) and 10% lactose (0.1 ml). A 50% sucrose solution (0.04 mL) was then added to the cells as a carbon source, followed by the addition of sucrose hydrolase (invertase, 5 μL of a 0.1 g/L solution) so that glucose was supplied at a slow rate for growth due to the breakdown of sucrose by invertase . After inoculation of new medium, cells were shaken at 700 rpm at 28°C for 48 h. After denaturation and subsequent centrifugation, supernatants were analyzed by HPLC. For analysis of total samples, cell lysate prepared by boiling was pelleted by centrifugation for 10 min at 4700 rpm. The concentration of OGM in the supernatant was determined using HPLC or HPAS.

- 22 046005- 22 046005

Пример 1. Получение 2'-FL.Example 1. Preparation of 2'-FL.

Разработка Escherichia coli для производства 2'-FL, экспрессирующих ген fred.Engineering Escherichia coli to produce 2'-FL expressing the fred gene.

Штамм Escherichia coli K-12 (DH1) MDO) можно изменять для экспрессии представляющих интерес гетерологичных генов. Например, штамм 1 представляет собой штамм, продуцирующий 2'-FL, со сверхэкспрессией гена а-1,2-фукозилтрансферазы, futC, и генов колановой кислоты (gmd-wcaG-wcaH-wcaImanC-manB). Вставка экспрессионной кассеты, содержащей промоторный элемент (PglpF), связанный с fred в единственной копии, в фоновый штамм 1 привела к штамму 2. Результаты анализов в глубоких лунках показали, что экспрессия гена fred применением PglpF i) увеличивает продукцию 2'-FL в 1,5 раза (увеличение общей продукции 2'-FL на 15%) и ii) улучшает распределение продукта 2'-FL за счет снижения количества 2'-FL в клеточной фракции и увеличения количества продукцию в среде.Escherichia coli strain K-12 (DH1) MDO) can be modified to express heterologous genes of interest. For example, strain 1 is a 2'-FL producing strain overexpressing the α-1,2-fucosyltransferase gene, futC, and colanic acid genes (gmd-wcaG-wcaH-wcaImanC-manB). Insertion of an expression cassette containing a promoter element (PglpF) bound to fred in a single copy into background strain 1 resulted in strain 2. The results of deep well assays showed that expression of the fred gene using PglpF i) increases 2'-FL production in 1 .5-fold (15% increase in total 2'-FL production) and ii) improves the distribution of 2'-FL product by reducing the amount of 2'-FL in the cell fraction and increasing the amount of production in the medium.

Пример 2. Получение 3-FL.Example 2. Preparation of 3-FL.

Конструирование Escherichia coli, экспрессирующих ген fred, для получения 3-FL Штамм Escherichia coli K-12 (DH1) MDO) можно изменять для экспрессии представляющих интерес гетерологичных генов. Например, штамм представляет собой штамм-продуцент 3-FL со сверхэкспрессией гена альфа-1,3-фукозилтрансферазы, futA и генов колановой кислоты (gmd-wcaG-wcaH-wcaI-manC-manB). Вставка экспрессионной кассеты, содержащей промоторный элемент (PglpF) связанный с геном fred в единственной копии, в остов штамма 3 привела к штамму 4. Результаты анализов в глубоких лунках показали, что экспрессия гена fred с применением PglpF i) увеличивает продукцию 3-FL почти в 2 раза (увеличение общей продукции 3-FL на 90%) и ii) улучшает распределение продуктов 3-FL за счет снижения количества 3-FL в клеточной фракции и увеличения количества 3-FL в среде.Construction of Escherichia coli expressing the fred gene to produce 3-FL Escherichia coli strain K-12 (DH1) MDO) can be modified to express heterologous genes of interest. For example, the strain is a 3-FL producing strain with overexpression of the alpha-1,3-fucosyltransferase gene, futA and colanic acid genes (gmd-wcaG-wcaH-wcaI-manC-manB). Insertion of an expression cassette containing a promoter element (PglpF) linked to the fred gene in a single copy into the backbone of strain 3 resulted in strain 4. The results of deep well assays showed that expression of the fred gene using PglpF i) increases 3-FL production by almost 2-fold (90% increase in total 3-FL production) and ii) improves the distribution of 3-FL products by reducing the amount of 3-FL in the cell fraction and increasing the amount of 3-FL in the medium.

Пример 3. Получение LNT.Example 3. Preparation of LNT.

Конструирование Escherichia coli, экспрессирующих ген fred, для получения LNT Штаммы Escherichia coli K-12 (DH1) MDO) можно изменять для экспрессии представляющих интерес гетерологичных генов. Например, штамм 5 представляет собой штамм-продуцент LNT со сверхэкспрессией гена β1,3-И-ацетилглюкозаминилтрансферазы, lgtA, и в-1,3-галактозилтрансферазы, galTK. Вставка экспрессионной кассеты, содержащей промоторный элемент (PglpF_SD4) связанный с геном fred, в единственной копии в остов штамма 5 привела к штамму 6. Вставка экспрессионной кассеты, содержащей промоторный элемент (PglpF_SD7), связанный с геном fred, в единственной копии в остов штамма 5 привела к штамму 7. Результаты анализов в глубоких лунках показали, что экспрессия гена fred с применением PglpF_SD4 или PglpF_SD7: i) увеличение продукции LNT в 1,2-1,3 раза (увеличение общей продукции LNT на 20-30%) и ii) небольшое улучшение распределения продукта LNT за счет снижения количества LNT в клеточной фракции и увеличение количества LNT в среде.Construction of Escherichia coli expressing the fred gene to produce LNT Escherichia coli strains K-12 (DH1) MDO) can be modified to express heterologous genes of interest. For example, strain 5 is an LNT-producing strain with overexpression of the β1,3-N-acetylglucosaminyltransferase, lgtA, and β-1,3-galactosyltransferase, galTK genes. Insertion of an expression cassette containing the promoter element (PglpF_SD4) associated with the fred gene in a single copy into the backbone of strain 5 resulted in strain 6. Insertion of an expression cassette containing the promoter element (PglpF_SD7) associated with the fred gene in a single copy into the backbone of strain 5 led to strain 7. The results of deep well assays showed that expression of the fred gene using PglpF_SD4 or PglpF_SD7: i) increased LNT production by 1.2-1.3 times (increase in total LNT production by 20-30%) and ii) slight improvement in the distribution of the LNT product due to a decrease in the amount of LNT in the cell fraction and an increase in the amount of LNT in the medium.

Резюме примеров 1-3.Summary of Examples 1-3.

Хромосомная экспрессия fred в штамме-продуценте 2'-FL, LNT или 3-FL увеличивала продукцию ОГМ, а в случае 2'-FL и 3-FL экспрессия fred снижала количество ОГМ внутри клеток (фракция осадка).Chromosomal expression of fred in a strain producing 2'-FL, LNT or 3-FL increased the production of OGM, and in the case of 2'-FL and 3-FL, expression of fred decreased the amount of OGM inside the cells (pellet fraction).

Следовательно, экспорт ОГМ белками суперсемейства основных посредников fred увеличивает способность штаммов-продуцентов продуцировать ОГМ.Therefore, export of OGM by proteins of the fred superfamily of proteins increases the ability of producer strains to produce OGM.

Таблица 7Table 7

Исходный штамм* Original strain* ID нового штамма, экспрессирующего fred ID of the new strain expressing fred ОГМ OGM Продукция ОГМ OGM products Снижение ОГМ в осадках Reduction of TGM in sediments Штамм 1 Strain 1 Штамм 2 Strain 2 2’- FL 2'- FL 115% 115% да Yes Штамм 3 Strain 3 Штамм 4 Strain 4 3-FL 3-FL 190 % 190% да Yes Штамм 5 Strain 5 Штамм 6 Штамм 7 Strain 6 Strain 7 LNT LNT 130% 120% 130% 120% нет нет No No

* Основа штамма для продукции ОГМ.* The basis of the strain for OGM production.

Пример 4. Транспортер Vag представляет собой новый переносчик ядра LNT-2 с высокой селективностью в отношении LNnT.Example 4 The Vag transporter is a novel LNT-2 core transporter with high selectivity for LNnT.

Таблица 6аTable 6a

Примеры хелперных и донорных плазмид, применяемых для конструирования штаммовExamples of helper and donor plasmids used to construct strains

Плазмида Plasmid Соответствующий генотип Corresponding genotype Маркерный ген Marker gene pACBSR pACBSR Para-I-SceI-λ Red, р!5А on, cam* Para-I-SceI-λ Red, р!5А on, cam* cam cam pUC57 pUC57 pMBl, Ыа pMBl, Na Bia Bia pUC57::ga/ pUC57::ga/ pUC57::galTK’/ Tl-galKM’ pUC57::galTK’/ Tl-galKM’ Bia Bia

Последовательности ДНК гетерологичных генов, кодирующих представляющие интерес транспортеры или гликозилтрансферазы, были оптимизированы по кодонам и синтезированы с помощью GenScript. Интересующие гены, кодирующие белки-транспортеры, как показано в табл. 4, амплифицировали с помощью ПЦР с применением подходящих праймеров, охватывающих стартовый кодон ATG и стопкодон ТАА гена (табл. 3). Для конструирования донорных плазмид с любым представляющего интерес гетерологичного гена, применяли стандартное клонирование USER для объединения очищенных ПЦРфрагментов соответствующего скелета плазмиды, промоторного элемента и представляющего интерес гена. Клонирование в соответствующей плазмиде может быть осуществлено с применением любого стандартного способа клонирования ДНК. После клонирования ДНК трансформировали в клетки ТОР10DNA sequences of heterologous genes encoding transporters or glycosyltransferases of interest were codon optimized and synthesized using GenScript. Genes of interest encoding transporter proteins, as shown in Table. 4 were amplified by PCR using suitable primers covering the ATG start codon and the TAA stop codon of the gene (Table 3). To construct donor plasmids with any heterologous gene of interest, standard USER cloning was used to combine purified PCR fragments of the corresponding plasmid backbone, promoter element, and gene of interest. Cloning into the appropriate plasmid can be accomplished using any standard DNA cloning technique. After cloning, the DNA was transformed into TOP10 cells

- 23 046005 и отбирали на чашках LB, содержащих 100 мкг/мл ампициллина (или 50 мг/мл канамицина в зависимости от применяемой основы) и 0,2% глюкозы.- 23 046005 and were selected on LB plates containing 100 μg/ml ampicillin (or 50 mg/ml kanamycin depending on the base used) and 0.2% glucose.

Сконструированные плазмиды очищали, а последовательность промотора и 5'-конец интересующего гена подтверждали секвенированием ДНК (MWG Eurofins Genomics).The constructed plasmids were purified, and the promoter sequence and 5′ end of the gene of interest were confirmed by DNA sequencing (MWG Eurofins Genomics).

Конструирование штаммов.Strain construction.

Применяемые бактериальный штамм, MDO, был сконструирован из Escherichia coli K-12 DHL Генотип E.coli K-12 DH1 представляет собой: F-, λ-, gyrA96, recA1, relA1, endA1, thi-1, hsdR17, supE44. В дополнение к генотипу E.coli K-12 DH1 MDO имеет следующие модификации: lacZ: делеция, размером 1,5 т.п.н., lacA: делеция, размером 0,5 т.п.н., nanKETA: делеция, размером 3,3 т.п.н., melA: делеция, размером 0,9 т.п.н., wcaJ: делеция, размером 0,5 т.п.н., mdoH: делеция, размером 0,5 т.п.н., и вставка промотора Plac выше гена gmd.The bacterial strain used, MDO, was constructed from Escherichia coli K-12 DHL The genotype of E. coli K-12 DH1 is: F - , λ - , gyrA96, recA1, relA1, endA1, thi-1, hsdR17, supE44. In addition to the E. coli K-12 genotype, DH1 MDO has the following modifications: lacZ: 1.5 kb deletion, lacA: 0.5 kb deletion, nanKETA: deletion, 3.3 kb, melA: 0.9 kb deletion, wcaJ: 0.5 kb deletion, mdoH: 0.5 k deletion .bp, and insertion of the Plac promoter upstream of the gmd gene.

Вставку кассеты экспрессии, содержавшей промотор, связанный с геном Fred и последовательностью терминатора транскрипции Т1, осуществляли с помощью Gene Gorging, по существу, как описано Herring et al. (Herring, C.D., Glasner, J.D. and Blattner, F.R. (2003) 311) 153-163), а примеры хелперной и донорной плазмид, примененных для конструирования штаммов, представленных в настоящей заявке, приведены в табл. 6. Вкратце, донорную плазмиду и хелперную плазмиду котрансформировали в MDO и отбирали на чашках с LB, содержавших 0,2% глюкозы, ампициллин (100 мкг/мл) или канамицин (50 мг/мл) и хлорамфеникол (20 мкг/мл). Одиночную колонию инокулировали в 1 мл LB, содержащего хлорамфеникол (20 мкг/мл) и 10 мкл 20% L-арабинозы, и инкубировали при 37°C при встряхивании в течение 7-8 ч. Для интеграции в локусы galK клеток E.coli затем высевали на чашки M9-DOG и инкубировали при 37°C в течение 48 ч. Отдельные колонии, сформированные на чашках MM-DOG, повторно высевали штрихом на чашки с LB, содержавшие 0,2% глюкозы, и инкубировали в течение 24 ч при 37°C. Колонии, которые выглядели белыми на чашках с агаром MacConkey-галактоза и были чувствительны как к ампициллину, так и к хлорамфениколу, потеряли донорную и вспомогательную плазмиду и содержали вставку в локусах galK. Вставки в сайт galK идентифицировали с помощью ПНР колоний с применением праймеров 048 (SEQ ID NO: 23) и 049 (SEQ ID NO: 24), а вставленную ДНК проверяли секвенированием (Eurofins Genomics, Германия).Insertion of an expression cassette containing a promoter linked to the Fred gene and a T1 transcription terminator sequence was accomplished using Gene Gorging essentially as described by Herring et al. (Herring, C.D., Glasner, J.D. and Blattner, F.R. (2003) 311) 153-163), and examples of helper and donor plasmids used to construct the strains presented in this application are given in table. 6. Briefly, donor plasmid and helper plasmid were cotransformed into MDO and selected on LB plates containing 0.2% glucose, ampicillin (100 μg/ml) or kanamycin (50 mg/ml), and chloramphenicol (20 μg/ml). A single colony was inoculated in 1 ml of LB containing chloramphenicol (20 μg/ml) and 10 μl of 20% L-arabinose and incubated at 37°C with shaking for 7-8 hours. For integration into the galK loci of E. coli cells, were plated on M9-DOG plates and incubated at 37°C for 48 hours. Individual colonies formed on MM-DOG plates were streaked again onto LB plates containing 0.2% glucose and incubated for 24 hours at 37 °C. Colonies that appeared white on MacConkey-galactose agar plates and were sensitive to both ampicillin and chloramphenicol had lost the donor and helper plasmid and contained an insertion at the galK loci. Insertions into the galK site were identified by colony PNR using primers 048 (SEQ ID NO: 23) and 049 (SEQ ID NO: 24), and the inserted DNA was verified by sequencing (Eurofins Genomics, Germany).

Встраивание генетических кассет в другие локусы хромосомной ДНК E.coli осуществляли аналогичным образом с применением различных маркерных генов селекции.The integration of genetic cassettes into other loci of E. coli chromosomal DNA was carried out in a similar way using various selection marker genes.

Выравнивание последовательности.Sequence alignment.

Эвристическое парное выравнивание последовательностей, реализованное в BLAST 2.1.2 (Basic Local Alignment Search Tool) (Altschul et al. 1990) в базе данных NCBI (http://www.ncbi.nlm.nih.gov), выполняли для проверки гомологии последовательностей белков-транспортеров, упомянутых в настоящем изобретении. Все параметры сохраняли со значениями по умолчанию для каждого выравнивания BLAST.Heuristic pairwise sequence alignment implemented in BLAST 2.1.2 (Basic Local Alignment Search Tool) (Altschul et al. 1990) in the NCBI database (http://www.ncbi.nlm.nih.gov) was performed to check sequence homology transporter proteins mentioned in the present invention. All parameters were kept at default values for each BLAST alignment.

В настоящем изобретении мы проверили способность выбранных гетерологичных транспортеров MFS экспортировать LNnT из клетки-хозяина с применением эталонного штамма, а именно МР3672. Штамм имеет одну PglpF-управляемую копию каждой гетерологичной гликозилтрансферазы, которая необходима для образования продукта.In the present invention, we tested the ability of selected heterologous MFS transporters to export LNnT from the host cell using a reference strain, namely MP3672. The strain has one PglpF-driven copy of each heterologous glycosyltransferase that is required for product formation.

Одна копия каждого из выбранных гетерологичных генов-транспортеров, т.е. vag, yberC0001_9420, marc, bad, пес, yabM и fred (табл. 4), индивидуально интегрировали в геном штамма МР3672 под контролем промотора Plac, который, как известно, обеспечивает умеренные уровни транскриптов. Сайт связывания рибосом промотора Plac (т.е. 16 п.н. выше сайта начала трансляции) был модифицирован (см. табл. 5) для усиления рибосомного связывания с синтезированными транскриптами и, таким образом, позитивно регулирует управляемую Plac экспрессию на уровне трансляции.One copy of each of the selected heterologous transporter genes, i.e. vag, yberC0001_9420, marc, bad, dog, yabM and fred (Table 4), were individually integrated into the genome of strain MP3672 under the control of the Plac promoter, which is known to provide moderate levels of transcripts. The ribosome binding site of the Plac promoter (i.e., 16 bp upstream of the translation start site) has been modified (see Table 5) to enhance ribosomal binding to synthesized transcripts and thus positively regulates Plac-driven expression at the translational level.

Следуя описанному выше подходу к конструированию штамма и тестируя эффективность штамма в DWA, мы сообщаем в настоящем документе, что только Vag-экспрессирующие клетки, продуцирующие LNnT, демонстрируют относительное увеличение как оттока продуцируемого LNnT, так и общей продукции LNnT по сравнению с эталонным штаммом.Following the strain construction approach described above and testing strain performance in DWA, we report here that only Vag-expressing LNnT-producing cells exhibit a relative increase in both the efflux of LNnT produced and the total LNnT production compared to the reference strain.

Как показано на фиг. 7, Plac- управляемая экспрессия большинства генов-транспортеров (marc, fred, bad, пес, yabM, yberC0001-9420) либо не оказывает существенного влияния, либо снижает продукцию LNnT (до 45%). Напротив, введение гена vag в генетический фон штамма МР3672 приводит к заметному увеличению титра LNnT (фиг. 7).As shown in FIG. 7, Plac-driven expression of most transporter genes (marc, fred, bad, dog, yabM, yberC0001-9420) either does not have a significant effect or reduces LNnT production (up to 45%). On the contrary, introduction of the vag gene into the genetic background of strain MP3672 leads to a noticeable increase in LNnT titer (Fig. 7).

Выравнивание аминокислотных последовательностей семи протестированных предполагаемых переносчиков MSF показало, что переносчик Vag имеет очень высокий охват последовательностей (от 99 до 100%) по сравнению с остальными шестью транспортерами, протестированными в настоящем изобретении, с идентичностью последовательностей от 65 до 75%. Самая высокая идентичность последовательности (75%) была оценена для последовательности Vag и последовательности транспортера MFS, кодируемого геном yabM (табл. 8). Интересно, что транспортер MFS YabM, описанный в WO 2017042382 в качестве предполагаемого эффективного экспортера LNT, не оказывал существенного влияния ни на окончательный общий титр LNnT, ни на отток LNnT (фиг. 7, 8). Таким образом, вопреки относительно высокому сходству его белковой последовательности с Vag, транспортер YabM, повидимому, неэффективен в отношении транспорта LNnT, что ясно отражается в концентрациях продукAmino acid sequence alignment of the seven putative MSF transporters tested showed that the Vag transporter has very high sequence coverage (99 to 100%) compared to the other six transporters tested in the present invention, with sequence identity ranging from 65 to 75%. The highest sequence identity (75%) was estimated for the Vag sequence and the sequence of the MFS transporter encoded by the yabM gene (Table 8). Interestingly, the MFS transporter YabM, described in WO 2017042382 as a putative efficient LNT exporter, had no significant effect on either the final total LNnT titer or LNnT efflux (Figures 7, 8). Thus, despite its relatively high protein sequence similarity to Vag, the YabM transporter appears to be inefficient in LNnT transport, as clearly reflected in product concentrations.

--

Claims (8)

та, обнаруженных во внеклеточной фракции соответствующих культур клеток-хозяев (фиг. 8). В особенности, как показал анализ супернатантов фракций бактериальных культур, внеклеточные концентрации LNnT были намного выше для штамма МР3994 (клетки, экспрессирующие vag), чем для штаммов МР4362 (клетки, экспрессирующие yabM) и МР3672 (клетки сравнения, не экспрессирующие гетерологичный транспортер) (фиг. 8).those found in the extracellular fraction of the corresponding host cell cultures (Fig. 8). In particular, as shown by analysis of supernatants of bacterial culture fractions, extracellular concentrations of LNnT were much higher for strain MP3994 (cells expressing vag) than for strains MP4362 (cells expressing yabM) and MP3672 (comparison cells not expressing the heterologous transporter) (Fig. . 8). В совокупности эти данные свидетельствуют о том, что транспортер Vag представляет собой эффективный переносчик LNnT. Этот вывод основан как на результатах процедуры скрининга семи геновтранспортеров, геномно экспрессированных в одном и том же эталонном штамме, в тех же условиях культивирования и под контролем одного и того же промотора, Plac, так и на анализе последовательностей белков-транспортеров, который показал, что белки-транспортеры с относительно высокой гомологией к Vag, такие как YabM и Marc (75% и 71%), вообще не экспортируют LNnT или если экспортируют, то с очень низкой эффективностью.Taken together, these data suggest that the Vag transporter is an efficient transporter of LNnT. This conclusion is based both on the results of a screening procedure for seven transporter genes genomically expressed in the same reference strain, under the same culture conditions and under the control of the same promoter, Plac, and on analysis of transporter protein sequences, which showed that transporter proteins with relatively high homology to Vag, such as YabM and Marc (75% and 71%), do not export LNnT at all or, if they do, do so with very low efficiency. Таблица 8Table 8 Г омология между различными гетерологичными транспортерами по настоящему изобретениюHomology between the various heterologous transporters of the present invention Название белка Идентификация Из организма Идентичен VagWP_048785139.1 (покрытие)Protein name Identification From the body Identical to VagWP_048785139.1 (coating) YberC0001_94 20 EEQ08298.1 Суперсемейство основных переносчиков MFS 1 Yersinia bercovieri 68% (99%)YberC0001_94 20 EEQ08298.1 MFS core transporter superfamily 1 Yersinia bercovieri 68% (99%) Fred WP_087817556.1 транспортер MFS Yersinia frederiksenii 69% (99%)Fred WP_087817556.1 MFS conveyor Yersinia frederiksenii 69% (99%) Bad WP_017489914.1 транспортер MFS Rouxiella badensis 65% (99%)Bad WP_017489914.1 MFS conveyor Rouxiella badensis 65% (99%) Nee WP 092672081.1 транспортер MFS Rosenbergiella nectarea 66% (99%)Nee WP 092672081.1 MFS conveyor Rosenbergiella nectarea 66% (99%) Marc WP_060448169.1 транспортер MFS Serratia marcescens 71% (99%)Marc WP_060448169.1 MFS conveyor Serratia marcescens 71% (99%) YabM CAY73138.1 Предполагаемый переносчик оттока сахара MFS Erwinia pyrifoliae 75% (99%)YabM CAY73138.1 Putative sugar efflux transporter MFS Erwinia pyrifoliae 75% (99%) ФОРМУЛА ИЗОБРЕТЕНИЯCLAIM 1. Генетически модифицированная клетка, способная продуцировать один или несколько олигосахаридов грудного молока (ОГМ), где указанная генетически модифицированная клетка включает последовательность гетерологичной нуклеиновой кислоты, кодирующую полипептид суперсемейства основных переносчиков (MFS), показанный в SEQ ID NO: 1, или его функциональный гомолог, аминокислотная последовательность которого более чем на 97% идентична SEQ ID NO: 1.1. A genetically modified cell capable of producing one or more human milk oligosaccharides (HMOs), wherein said genetically modified cell comprises a heterologous nucleic acid sequence encoding a major transporter superfamily (MFS) polypeptide shown in SEQ ID NO: 1, or a functional homologue thereof , the amino acid sequence of which is more than 97% identical to SEQ ID NO: 1. 2. Генетически модифицированная клетка по п.1, где регуляторный элемент регулирует экспрессию полипептида MFS, показанного в SEQ ID NO: 1, или его функционального гомолога, аминокислотная последовательность которого более чем на 97% идентична SEQ ID NO: 1.2. The genetically modified cell according to claim 1, wherein the regulatory element regulates the expression of the MFS polypeptide shown in SEQ ID NO: 1, or a functional homolog thereof, the amino acid sequence of which is more than 97% identical to SEQ ID NO: 1. 3. Генетически модифицированная клетка по п.2, где регуляторный элемент выбран из группы, состоящей из PglpF, PglpF_SD4 и PglpF_SD7.3. A genetically modified cell according to claim 2, where the regulatory element is selected from the group consisting of PglpF, PglpF_SD4 and PglpF_SD7. 4. Генетически модифицированная клетка по любому из предшествующих пунктов, где указанная генетически модифицированная клетка дополнительно содержит по меньшей мере одну рекомбинантную нуклеиновую кислоту, которая кодирует функциональный фермент с активностью гликозилтрансферазы, выбранный из группы, состоящей из а-1,2-фукозилтрансферазы, а-1,3-фукозилтрансферазы, α-1,3/4-фукозилтрансферазы, α-1,4-фукозилтрансферазы, а-2,3-сиалилтрансферазы, а-2,6-сиалилтрансферазы, в-1,3-И-ацетилглюкозаминилтрансферазы, в-1,6-И-ацетилглюкозаминилтрансферазы, β-1,3галактозилтрансферазы и в-1,4-галактозилтрансферазы.4. The genetically modified cell according to any one of the preceding paragraphs, wherein said genetically modified cell further comprises at least one recombinant nucleic acid that encodes a functional enzyme with glycosyltransferase activity selected from the group consisting of a-1,2-fucosyltransferase, a- 1,3-fucosyltransferases, α-1,3/4-fucosyltransferases, α-1,4-fucosyltransferases, α-2,3-sialyltransferases, α-2,6-sialyltransferases, β-1,3-I-acetylglucosaminyltransferases, β-1,6-I-acetylglucosaminyltransferase, β-1,3-galactosyltransferase and β-1,4-galactosyltransferase. 5. Генетически модифицированная клетка по любому из предшествующих пунктов, где генетически модифицированная клетка представляет собой Escherichia coli.5. The genetically modified cell according to any one of the preceding claims, wherein the genetically modified cell is Escherichia coli. 6. Генетически модифицированная клетка по любому из предшествующих пунктов, где олигосахарид грудного молока выбирают из группы, состоящей из 2'-фукозиллактозы (2'-FL), 3-фукозиллактозы (3-FL), дифукозиллактозы (DFL) и лакто-И-тетраоза (LNT).6. The genetically modified cell according to any one of the preceding claims, wherein the human milk oligosaccharide is selected from the group consisting of 2'-fucosyllactose (2'-FL), 3-fucosyllactose (3-FL), difucosyllactose (DFL) and lacto-I- tetraose (LNT). 7. Генетически модифицированная клетка по любому из предшествующих пунктов, где клетка содержит активный фермент а-1,3-фукозилтрансферазу и продуцирует 3'FL, предпочтительно фермент а-1,3-фукозилтрансфераза представляет собой FutA.7. The genetically modified cell according to any one of the preceding claims, wherein the cell contains an active α-1,3-fucosyltransferase enzyme and produces 3'FL, preferably the α-1,3-fucosyltransferase enzyme is FutA. 8. Генетически модифицированная клетка по пп.1-6, где клетка содержит в-1,3-И-ацетилглюкозаминилтрансферазу и в-1,3-галактозилтрансферазу и продуцирует LNT, предпочтительно фермент в-1,3-И-ацетилглюкозаминилтрансфераза представляет собой lgtA, а фермент в-1,3-галактозилтрансфераза представляет собой galTK.8. A genetically modified cell according to claims 1 to 6, where the cell contains β-1,3-I-acetylglucosaminyltransferase and β-1,3-galactosyltransferase and produces LNT, preferably the enzyme β-1,3-I-acetylglucosaminyltransferase is lgtA , and the β-1,3-galactosyltransferase enzyme is galTK. --
EA202292161 2020-01-23 2021-01-22 A NEW MAIN FACTOR SUPERFAMILY (MFS) PROTEIN (Fred) IN THE PRODUCTION OF OGM EA046005B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DKPA202000087 2020-01-23

Publications (1)

Publication Number Publication Date
EA046005B1 true EA046005B1 (en) 2024-01-31

Family

ID=

Similar Documents

Publication Publication Date Title
US20230072639A1 (en) New major facilitator superfamily (mfs) protein (bad) in hmo production
US20230193335A1 (en) Hmo production
US20230227876A1 (en) Hmo production
US20230109661A1 (en) Hmo production
US20240102063A1 (en) New major facilitator superfamily (mfs) protein (fred) in production of sialylated hmos
US20230109937A1 (en) New major facilitator superfamily (mfs) protein (fred) in hmo production
US20240043891A1 (en) A dfl-producing strain
EA046005B1 (en) A NEW MAIN FACTOR SUPERFAMILY (MFS) PROTEIN (Fred) IN THE PRODUCTION OF OGM
EA046260B1 (en) OBTAINING OGM
EA046248B1 (en) OBTAINING OGM
EA046241B1 (en) OBTAINING OGM
CN116802302A (en) Novel Major Facilitator Superfamily (MFS) proteins (FREDs) in sialylated HMO production