EA045556B1

EA045556B1 - Способ и компьютерная система для формирования рабочих инструкций для терморегулирования доменной печи

Info

Publication number: EA045556B1
Application number: EA202390995
Authority: EA
Inventors: Седрик Сокарт; Фабрис Ханзен; Лионель Хауземер; Марьям Баниасади; Филипп Бермес
Original assignee: Пауль Вюрт С.А.
Priority date: 2020-09-30
Filing date: 2021-09-28
Publication date: 2023-12-05

Description

Область техники

Настоящее изобретение относится к системе для управления доменной печью, и более конкретно относится к способу, компьютерным программным продуктам и системам для использования способа машинного обучения для генерирования рабочих инструкций для доменной печи.

Предпосылки создания изобретения

Доменные печи используются для производства расплавленного чугуна в качестве сырьевого материала для стали. Доменная печь имеет много подлежащих моделированию сложных процессов, поскольку они зависят от многовариантных входных данных процессов и помех. Целью является снижение потребления топлива для оптимизации общей эффективности печи и стабильности, качества плавленого чугуна, а также улучшение срока службы печи. Следовательно, желательно обеспечить оптимизированные рабочие инструкции для определения комплексной цели производства.

Краткое изложение сущности изобретения

Эта техническая проблема решена посредством признаков независимых пунктов формулы изобретения посредством модели обучения с подкреплением (RL), реализованной посредством рекуррентной нейронной сети для формирования рабочих инструкций для терморегулирования доменной печи. Рабочие инструкции относятся к соответствующим терморегулирующим действиям.

Использованное здесь терморегулирующее действие относится к любому действию, которое воздействует на исполнительный механизм с целью осуществления терморегулирования процесса доменной печи. В зависимости от уровня автоматизации регулирования рабочие инструкции могут иметь целью человека-оператора, чтобы обеспечить ему руководство по правильному регулированию доменной печи, или они могут напрямую давать команду регулятору температуры доменной печи, который может выполнять такие инструкции без взаимодействия с человеком.

Таким образом, реальные (измеренные) эксплуатационные данные от нескольких доменных печей используются вместе с имитационной моделью (переходной моделью - transient model''-англ.) процесса доменной печи для тренировки модели рекуррентной нейронной сети посредством обучения с подкреплением. Это может быть понято как тренировка рекуррентной нейронной сети в режиме офлайн на уровне данных и уровне имитационной модели. Из записанных в прошлом данных могут быть сгенерированы многочисленные дополнительные признаки, обеспечивающие лучшее понимание характеристик процесса доменной печи. Эти признаки являются явлениями, определенными посредством правил, реализованных из записанных необработанных данных или прогноза явлений процесса, доступных в виде прогноза, обеспеченного моделью машинного обучения.

Во время тренировки RL модель обеспечивает рекомендации для рабочих инструкций главным исполнительным механизмам доменной печи, такие как, например, установки режима фурм и дутья, такие как скорость ввода порошкообразного угля (PCI) (кг/с), скорость потока дутья (нм³/с), обогащение кислородом (%) и т.п. и/или состав шихты и установки загрузки, такие как расход кокса (кг/загрузка), основность, распределение шихты и т.п. Разработанные рекомендации обеспечивают, что целевая функция будет оптимизирована, когда процесс находится в его тепловом равновесии, следуя реализации вышеупомянутых рекомендаций или посредством виртуального оператора (уровень 5 максимального уровня автономии) или вручную посредством человека-оператора. Цель определяется экспертом по доменным печам и может быть сформирована из нескольких целей, таких как, например, (1) минимизация потребления топлива, (2) максимизация срока службы доменной печи. (3) минимизация выбросом СО₂, (4) качество чугуна и количество, стабилизируя работу печи. Каждая цель взвешивается (например, экспертом) для определения общей цели, используемой для тренировки RL модели. Когда модель натренирована и используется в производстве, она может продолжать обучение непрерывно (онлайн тренировка RL модели) из отклонений между общей целью и фактической целью, которая была достигнута после выполнения рекомендованных рабочих инструкций для теплового контроля соответствующей доменной печи.

В одном варианте осуществления разработан компьютеризированный способ тренировки модели обучения с подкреплением для формирования рабочих инструкций для терморегулирования доменной печи. Например, модель обучения с подкреплением может быть реализована посредством рекуррентной нейронной сети.

Модель машинного обучения в доменной адаптации, которая была натренирована посредством трансферного обучения, обрабатывает ретроспективные эксплуатационные данные, полученных в виде многопараметрических временных рядов из нескольких доменных печей из множества доменов. Ретроспективные эксплуатационные данные отражают тепловые состояние соответствующих доменных печей из множества доменов. Типичным образом несколько тысяч датчиков на доменную печь измеряют эксплуатационные параметры, такие как, например, температура, давление, химические составы и т.п. Такие измеренные в отдельные моменты времени параметры определяют соответствующее тепловое состояние доменной печи в этот момент времени. В силу множественных характеристик каждой доменной печи (например, рабочий режим, размер, используемый материал (состав материала) и т.п.) невозможно сравниваться непосредственно две доменные печи (исходную и целевую доменные печи) без применения специальных преобразований данных многопараметрических временных рядов.

- 1 045556

Модель машинного обучения в доменной адаптации генерирует в качестве выходных данных первый инвариантный набор (массив) данных домена (предметной области), представляющих тепловое состояние любой из доменных печей независимо от домена. Ретроспективные эксплуатационные данные типичным образом были собраны в прошлом от нескольких разных доменных печей (например, разного размера, эксплуатируемых в разных условиях и т.п.) в ответ на соответствующие терморегулирующего действия. Типичным образом, каждая доменная печь соответствует отдельному домену, но домен может быть также отдельным действием доменной печи. Модель машинного обучения в доменной адаптации тренируется для выполнения некоторого вида операции нормализации данных, полученных из разных доменов так, что в конечном счете такие данные становятся сравнимыми.

Могут быть использованы разные подходы к трансферному обучению. Например, модель машинного обучения в доменной адаптации может быть реализована посредством нейронной сети глубокого обучения со сверточными и/или рекуррентными слоями, обученными извлекать доменные постоянные признаки из ретроспективных эксплуатационных данных в качестве первого инвариантного признака домена. В данном варианте осуществления трансферное обучение реализовано для извлечения инвариантных признаков домена из ретроспективных эксплуатационных данных. Признак в глубоком обучении является абстрактным представлением характеристик конкретной доменной печи, извлеченных из данных многопараметрических временных рядов, которые генерированы при эксплуатации этой конкретной доменной печи. Путем применения трансферного обучения можно извлекать инвариантные признаки домена от нескольких реальных доменных печей, которые является независимыми от определенной печи (то есть, независимыми от разных доменов).

В альтернативном подходе модель машинного обучения в доменной адаптации тренировалась для обучения множеству отображений соответствующих необработанных данных от нескольких доменных печей в эталонную доменную печь. Эталонная доменная печь может быть виртуальной доменной печью, которая представляет разновидность средней доменной печи или фактической доменной печи. Каждое отображение является представлением преобразования соответствующей конкретной доменной печи в эталонную доменную печь. В этом подходе несколько отображений соответствуют первому инвариантному набору данных (датасету - data set англ.) домена. Например, такая модель машинного обучения в доменной адаптации может быть реализована посредством генерирующей архитектуры глубокого обучения, основанной на CycleGAN архитектуре, популярной для генерирования фальшивых изображений. CycleGAN архитектура является расширением GAN архитектуры, которая включает в себя одновременную тренировку двух моделей генератора и двух моделей дискриминатора. Один генератор берет данные из первого домена в качестве входных данных и выдает данные для второго домена, и другой генератор берет данные из второго домена в качестве входных данных и генерирует данные для первого домена. Затем модели дискриминатора используются для определения, насколько правдоподобными являются сгенерированные данные и соответственно этому обновляет модели генератора. CycleGAN использует дополнительное расширение к архитектуре, называемое связностью цикла. Лежащей в основе идеей является то, что выходные данные от первого генератора могут быть использованы в качестве входных данных для второго генератора, и входные данные от второго генератора должны совпадать с исходными данными. Возможно также обратное: что выходные данные от второго генератора могут подаваться в качестве входных данных к первому генератору, и результат должен совпадать с входными данными второго генератора.

Связность цикла является концепцией из машинного перевода, где переведенная с английского языка на французский язык должна переводиться с французского языка на английский и быть идентичной исходной фразе. Должен быть также действительным обратный процесс. CycleGAN поддерживает связность цикла посредством добавления дополнительных потерь для измерения разности между сгенерированными выходными данными второго генератора и исходным изображением, и наоборот. Это действует как регуляризация модели генератора, направляя процесс генерации изображения в новый домен в направлении преобразования изображения. Для адаптации исходной CycieGA архитектуры из обработки изображений в обработку данных многопараметрических временных рядов для получения для инвариантного набора данных первого домена могут быть реализованы следующие модификации посредством использования рекуррентных слоев (как пример LSTM), объединенных со сверточным слоем для изучения временной зависимости данных многопараметрических временных рядов, подробно описанной С. Schockaert, H. Hoyez, (2020) MTS-CycleGAN: An Adversarial-based Deep Mapping Learning Network for Multivariate Time Series Domain Adaptation Applied to the lronmaking Industry, In arXiv: 2007.07518 (Основанная на состязательности сеть глубокого обучения с отображением для многопараметрических временных рядов доменной адаптации в приложении к чугунолитейной промышленности).

Полученный первый инвариантный набор данных отражает тепловые состояния доменных печей, которые имелись после соответствующих терморегулирующих действий, были применены к соответствующим печам. После доменной адаптации это отображение больше не привязано к конкретной доменной печи (или в виде выученного отображения для эталонной доменной печи или в виде извлеченных общих признаков).

Параллельно динамическая модель процесса типовой доменной печи используется для генерирова

- 2 045556 ния моделированных эксплуатационных данных в виде многопараметрических временных рядов для конкретного терморегулирующего действия, отображающего тепловое состояние, в которое типовая доменная печь переходит после приложения определенного управляющего действия. Типовая доменная печь является виртуальным устройством (подобным эталонной доменной печи). Переходная модель является основанной на переходе цифровой моделью с соответствующими физическими, химическими, тепловыми условиями и условиями потока для генерирования приемлемых моделированных данных, представляющих тепловые состояние типовой доменной печи.

Переходная модель отражает соответствующие физические, химические, тепловые и потоковые условия типовой доменной печи и обеспечивает решения для восходящего потока газа и нисходящего перемещения слоев твердой фазы, как структурировано в типовой доменной печи при обмене тепла, массы и переносе импульса.

Модель получает в качестве входных параметров количество шихтового материала и результаты химического анализа вместе с условиями горячего дутья, такими как температура, давление, скорость ввода порошкообразного угля и обогащение кислородом. Переходная модель имеет: уравнение энергии для прогнозирования температуры горячего металла, уравнения компонентов для вычисления химического состава горячего металла и уравнения газовой фазы для прогнозирования температуры доменного газа, эффективности (Eta СО) и давления. В силу переходной природы модели, моделированные динамические данные временных рядов могут быть сгенерированы посредством изменения входных параметров во времени, имеющих сходство с работой реальных доменных печей. Является благоприятным, что переходная модель может использовать диапазон данных входных параметров, который превосходит диапазон данных, который перекрывается ретроспективными эксплуатационными данными реальных доменных печей. Другими словами диапазон параметров для типовой доменной печи может быть расширен до пространства эксплуатационных параметров, который не может быть перекрыт эксплуатационными данными реальной доменной печи.

Типовая доменная печь разделена на конечное число слоев по высоте печи. Каждый слой состоит из одной загрузки сырьевого материала (например, железной руды и кокса). Эти слои представляют вычислительные ячейки, для которых происходит цифровое решение уравнений. Граничные условия свойств газовой фазы, такие как состав, скорость и температура, определяются с использованием субмодели канала, в то время как граничные условия для твердой фазы определяются как составы загружаемого материала при комнатной температуре. Такая модель канала описана, например, в Deepak Sau et. AI. A reduced order mathematical model of the blast furnace raceway with and without pulverized coal injection for real time plant application. International Journal of Modelling and Simulation, DOI: 10.1080/02286203.2018.1435759. Февраль 2018. (Математическая модель пониженного порядка канала доменной печи с вводом и без ввода порошкообразного угля для применения установки в реальном времени). Порошкообразный уголь вводится в фурмы доменной печи для снижения расхода кокса, а также для снижения стоимости производства горячего металла. Являются важными сведения о процессе горения порошкообразного угля в зоне канала доменной печи и накоплении несгоревшего угля. Эта статья описывает модель канала пониженного порядка доменной печи для применения установки в реальном времени. Модель способна прогнозировать радиальные температуры и профили состава газа в зоне канала с вводом и без ввода порошкообразного угля (PCI). Влияние всех основных параметров рабочего процесса, таких как скорость ввода порошкообразного угля, температура дутья, объем дутья, обогащение кислородом и добавление пара на поведение при сжигании в канале, температуру и профили состава газа, а также глубину канала были исследованы и проверены по мере возможности на правильность с помощью литературы и заводской базой данных.

Полное решение для газовой и твердой фазы вычислительным путем является очень дорогостоящим. Поэтому согласно одному варианту осуществления для экономии вычислительных ресурсов (и, следовательно, энергии), газовая фаза может рассматриваться как устойчивое состояние, поскольку время устойчивости газа (примерно 3 с) намного меньше, чем временной шаг (примерно 2 мин). Однако твердая фаза рассматривается как переходная фаза. Алгоритм решения сначала решает уравнение газовой фазы итеративным последовательным путем, чтобы удовлетворять относительному допуску параметров в каждом временном шаге. Когда параметры газовой фазы сходятся к предварительно заданному значению допуска, тогда на том же временном шаге последовательно решаются уравнения твердой фазы. Временной цикл продолжается до конца моделирования. Параметры газа и твердой фазы, а также параметры переноса, такие как перенос тепла и массы, обновляются в начале каждого временного шага. В последовательном подходе при решении для одного параметра другие параметры рассматриваются как известные, подразумевая, что используются старые значения. Таким образом, нелинейные члены и связанные параметры могут быть решены, избегая сложных и дорогостоящих решающих устройств.

В одном варианте осуществления переходная модель имеет несколько расчетных ячеек, причем каждая ячейка представляют соответствующий слой типовой доменной печи, составленный из одной загрузки сырого материала. Каждая расчетная ячейка решает уравнения газовой фазы итеративным последовательным путем, чтобы удовлетворять относительным допускам параметра газовой фазы на каждом временном шаге. Когда параметры газовой фазы сходятся к предварительно заданному значению допус- 3 045556 ка, тогда в том же временном шаге последовательно решаются уравнения твердой фазы.

Итеративное решение уравнений газовой фазы включает для каждой корректирующей давлениескорость итерации: вычисление свойств газа, твердой фазы и жидкости, вычисление скоростей реакции и коэффициентов теплопередачи, и вычисление температуры газа, компонентов, скорости и падения давления.

После того как параметры газовой фазы сошлись до заданного значения допуска, вычисление продолжается с последовательным решением уравнения твердой фазы в том же временном шаге, включающем в себя: вычисление температуры твердой фазы и компонентов, вычисление температуры жидкости и компонентов, и вычисление скорости твердой фазы.

Моделированные эксплуатационные данные, полученные от переходной модели, затем обрабатываются посредством сети генеративного глубокого обучения, натренированной на многопараметрических временных рядах ретроспективных эксплуатационных данных. Это позволяет пополнять моделированные эксплуатационные данные признаками реальных эксплуатационных данных, чтобы сделать их более реалистичными.

Надлежащим образом натренированная генеративная сеть глубокого обучения может дополнять моделированные данные таким образом, что дополненные синтетические эксплуатационные данные становятся неотличимыми для эксперта от реальных эксплуатационных данных. Является предпочтительным для тренировки модели обучения с подкреплением с данными, которые имеют характеристики, подобные входным данным реальных тестов, которые ожидаются при работе модели обучения с подкреплением в фазе прогнозирования. То есть, обработка моделированных эксплуатационных данных генерирует второй инвариантный набор данных домена, который дополнен признаками, выученными из ретроспективных эксплуатационных данных. Хотя второй инвариантный набор данных домена является всего лишь синтетическим набором данных, основанным на вычислениях переходной модели, тем не менее, он является инвариантным набором данных домена, который проявляет характерные признаки, которые присутствуют в реальных временных рядах ретроспективных эксплуатационных данных.

Теперь модель обучения с подкреплением тренируется с объединенными первым и вторым инвариантными наборами данных домена. Если тренировка будет основываться только на первом наборе данных, модель обучения с подкреплением не сможет обучиться оптимизированным командам управления, которые не были приложены к нескольким доменным печам. Путем объединения таких реальных тренирующих наборов данных со смоделировано сгенерированными наборами данных, переходная модель может быть использована для моделирования реакции типовой доменной печи на альтернативные команды управления, приложенные к данному тепловому состоянию типичной доменной печи при переменных целях оптимизации. При обработке объединенных первого и второго инвариантных наборов данных модель обучения с подкреплением определяет вознаграждение (reward - англ.) для отдельного действия терморегулирования, которое было использовано переходной моделью для вычисления второго инвариантного набора данных, принимая во внимание данную целевую функцию и текущее состояние доменной печи.

Функция вознаграждения теперь описывает, как модель обучения с подкреплением (то есть, агент) должна себя вести. Другими словами, они имеют нормативное содержание, предусматривающее, какой агент должен быть завершен. Абсолютных ограничений нет, но если функция вознаграждения ведет себя лучше, тогда агент обучается лучше. Практически это означает, что скорость схождения увеличена, и агент не застревает на локальном минимуме. Как пример, функция вознаграждения может измерять, как далеко от Парето-фронта многоцелевой функции отдельное действие терморегулирования ведет процесс. По определению Парето-фронт является набором недоминируемых решений, выбираемых в качестве оптимальных, если никакая цель не может быть улучшена без жертвования по меньшей мере одной целью. Для данной цели измерение допустимой ошибки улучшения другой цели может быть, например, измерена посредством градиентного анализа. Функция вознаграждения может быть функцией измерений, характеризующих свойства Парето-фронта. Специалист в данной области может использовать другие подходящие функции вознаграждения.

Если определенное вознаграждение находится ниже предварительно заданного минимального вознаграждения, тогда рекомендованное терморегулирующее действие (команда управления) была не оптимальной относительно намеченного влияния не тепловое состояние доменной печи. В таких случаях переходной моделью могут быть смоделированы альтернативные управляющие действия. С этой целью поиск измененных параметров (то есть, входных параметров для переходной модели) для другого (альтернативного) действия терморегулирования, основанного на текущем окружении модели обучения с подкреплением и выходном результате терморегулирующего действия данного шага обучения (то есть, управляющем действии, которое приводило к слишком низкому вознаграждению) направляется алгоритмом генетического поиска и/или байесовской оптимизации). Переходная модель теперь регенерирует (генерирует заново) второй инвариантный набор данных домена (обновленный второй набор данных), основанный на измененных параметрах. Затем обновленный второй набор данных подается во входной слой модели обучения с подкреплением, и для второго обновленного набора данных определяется новое вознаграждение. Этот процесс повторяется многократно до тех пор, пока модель обучения с подкрепле- 4 045556 нием не научилась выдавать оптимизированные рабочие инструкции для оптимизированных терморегулирующих действий для предсказуемых ситуаций.

После того как модель обучения с подкреплением была натренирована как описано, она может эксплуатироваться для предсказания оптимизированных рабочих инструкций по меньшей мере для одного исполнительного механизма конкретной доменной печи в производстве, основанных на текущих данных рабочего состояния этой конкретной доменной печи. Другими словами, натренированная модель обучения с подкреплением получает входные данные тестов, которые включают в себя эксплуатационные данные, согласующиеся с входным слоем модели обучения с подкреплением, и которые определяют текущее (тепловое) состояние доменной печи. Модель обрабатывает входные данные теста и обеспечивает в качестве выходных данных прогноз для оптимизированной рабочей инструкции, соответствующей терморегулирующему действию, которая должна быть применена к доменной печи для достижения оптимизированного результата, принимая во внимание данную целевую функцию.

Предпочтительно, каждый набор данных прогноза может быть использован для дальнейшего улучшения тренировки модели обучения с подкреплением. С этой целью модель определяет вознаграждение после применения терморегулирующего действия в соответствии с оптимизированной рабочей инструкцией (прогнозированные выходные данные) по меньшей мере для одного исполнительного механизма, основанное на новом состоянии конкретной доменной печи после выполнения терморегулирующего действия. Если вознаграждение находится ниже предварительно заданного порога, переходная модель генерирует второй инвариантный набор данных домена для одной или более альтернативных рабочих инструкций для повторной тренировки модели обучения с подкреплением. Эта повторная тренировка может быть использована после применения любого терморегулирующего действия в соответствии с соответствующей спрогнозированной оптимизированной рабочей инструкцией.

Предпочтительно, модель обучения с подкреплением тренируется для обучения оптимизированным рабочим инструкциям, так что связанное целевое измерение лежит в предварительно заданном диапазоне от Парето-фронта для соответствующей многомерной целевой функции.

В одном варианте осуществления переходная модель имеет несколько вычислительных ячеек с каждой ячейкой, представляющей соответствующий слой типовой доменной печи, состоящий из одной загрузки сырьевого материала. Каждая вычислительная ячейка решает уравнение газовой фазы многократным последовательным путем для удовлетворения относительным допускам параметра газовой фазы на каждом временном шаге. Когда параметры газовой фазы сойдутся к предварительно заданному значению допуска, вычислительная ячейка последовательно решает уравнения твердой фазы в том же временном шаге.

Таблица 1. Уровни автоматизации терморегулирования для управления доменной печью

Уровень 1: Только оператор доменной печи	Уровень 2: Получающий помощь оператор	Уровень 3: Частичная автоматизация	Уровень 4: Высокий уровень автоматизации	Уровень 5: Полная автоматизация
Только выведение необработанных данных на экран	Модель, приводимая в действие данными белого ящика, так что правила обеспечивают оператору значительную информацию для управления доменной печью. Пример: - обнаружение явлений процессов, определяемых технологом - модель машинного обучения прогнозирует содержание кремния в горячем металле или тенденцию изменения температуры	Оператор не должен контролировать все измерения / явления для управления печью. Часть исполнительных механизмов являются автономными. Пример: модели машинного обучения рекомендуют матрицу загрузки - рекомендация по загрузке кокса или ввода угля, основанные на прогнозе содержания Si в горячем металле (определение базовой цели производства)	Оператор не требуется для особых определенных операций печи, но все еще требуется для операций, не охватываемых системой автоматизации. Пример: модель рекомендаций для оптимального терморегулирования при обычной работе, принимая во внимание сложную производственную цель (минимизацию расхода топлива, увеличение срока службы печи, минимизацию выбросов СО₂ и т.п.	Оператор не требуется, нет ручных операций. Все операции выучены посредством способа машинного обучения во всех известных окружениях. Пример: Модель рекомендаций для оптимального регулирования во всех операциях, принимая во внимание определение сложной производственной цели.

Табл. 1 описывает уровни автоматизации для управления доменной печью. Комбинация рекомендаций модели обучения с подкреплением и других связанных моделей машинного обучения (пример: прогнозирование технологических процессов, температуры горячего металла и т.п.), генерирующая расширенную контекстную информацию для характеризации процесса, может быть использована для достижения уровня 4 и 5 автоматизации, в то время как одиночные связанные модели машинного обучения

- 5 045556 могут только вносить вклад в уровни 2 и 3 автоматизации. Тренировка модели рекомендаций без связанных моделей машинного обучения могут привести к уровню 3 автоматизации. Раскрытый здесь подход для тренировки модели обучения с подкреплением для рекомендаций (прогнозирования) оптимальных терморегулирующее действие может быть использован для достижения уровня 4 или 5 автоматизации при условии, что процесс точно представлен расширенными контекстными данными, сгенерированными моделями машинного обучения и дополнительным датчиками для характеризации процесса, как описано более подробно в подробном описании. Такие связанные модели машинного обучения могут быть использованы для добавления других способностей дополнения данных для улучшения тренировочного набора данных для обучения с подкреплением тем, что они обеспечивают прогнозы, основанные на полученных эксплуатационных данных (необработанных данные датчиков), служащих в качестве других входных данных для тренировки модели обучения с подкреплением, выходящих за домен инвариантных эксплуатационных данных. С такой дополнительной контекстуальной информацией модель обучения с подкреплением получает информацию о новых измерениях, которые могут быть использованы для более точного обучения лучшим терморегулирующим действиям.

При использовании таких связанных моделей машинного обучения для прогнозирования информации о будущих тепловых изменениях отдельного состояния доменной печи, основанных на ретроспективных эксплуатационных данных, и/или других измеренных данных об окружающей среде, связанных с окружающей средой доменной печи, связанные модели машинного обучения должны быть тренированы соответствующим образом для дополнения ретроспективных эксплуатационных данных (полученных от датчиков) с будущими данными многопараметрических временных рядов, которые связаны с будущими моментами времени. Сгенерированные будущие многопараметрические временные ряды затем могут быть обработаны посредством модели машинного обучения в доменной адаптации таким же образом, как и ретроспективные эксплуатационные данные для дополнения первого инвариантного набора данных домена данными, которые связаны с будущими моментами времени.

Связанная модель машинного обучения может быть тренирована следующим образом. В первом шаге тренировки несколько базовых моделей тренируются с разными наборами эксплуатационных данных и/или данными об окружающей среде с использованием одного или более алгоритмов машинного обучения для обеспечения особых будущих данных многопараметрических временных рядов в качестве входных данных для обучения для конкретной модели из моделей машинного обучения. Посредством этого каждая базовая модель фокусируется на единичном отдельном аспекте процесса доменной печи (например, прогнозировании тенденции температуры горячего металла во время данного будущего интервала времени). Во втором шаге тренировки связанная модель машинного обучения тренируется с особыми будущими данными многопараметрических временных рядов базовой модели для обучения, какая комбинация базовых моделей является наиболее подходящей для какого состояния доменной печи.

Другие аспекты изобретения будут реализованы и достигнуты посредством элементов и комбинаций особо описанных в прилагаемой формуле изобретения. Следует понимать, что как предшествующее общее описание, так и следующее подробное описание являются приведенным только в качестве примера и пояснительными и не являются ограничивающими изобретение, как оно описано.

Краткое описание чертежей

Фиг. 1 показывает упрощенную схему варианта осуществления компьютерной системы для тренировки модели обучения с подкреплением для обеспечения рабочих инструкция для терморегулирования доменной печи;

фиг. 2 является упрощенной блок-схемой компьютеризированного способа, который может выполняться посредством вариантов осуществления компьютерной системы;

фиг. 3А показывает упрощенную блок-схему, отображающую обработку переходной модели согласно одному варианту осуществления с несколькими вычислительными ячейками с каждой ячейкой, представляющей соответствующий слой типовой доменной печи;

фиг. 3Б показывает вычислительные ячейки в визуальном представлении доменной печи;

фиг. 4 показывает пример осуществления расчета вознаграждения для модели обучения с подкреплением;

фиг. 5 показывает Парето-фронт как границу облака точек в целевом пространстве для функции вознаграждения;

фиг. 6А, 6Б показывают примеры Парето-фронта в целевом пространстве двухмерной целевой функции для соответствующей доменной печи с целью визуализации;

фиг. 7 показывает использование дополнительной модели машинного обучения для дополнения согласно одному варианту осуществления;

фиг. 8 показывает использование образов фурм для дополнения тренировочных данных путем использования дополнительных моделей глубокого обучения согласно одному варианту осуществления;

фиг. 9 показывает использование дополнительных датчиков для характеризации состояния доменной печи для тренировки модели обучения с подкреплением и фиг. 10 является примером типового компьютерного устройства и типового мобильного компьютерного устройства, которые могут быть использованы с описанными здесь способами.

- 6 045556

Подробное описание

Фиг. 1 показывает упрощенную схему базового осуществления компьютерной системы 100 для тренировки модели 130 обучения с подкреплением для формирования рабочих инструкций для терморегулирования доменной печи. Фиг. 1 описана в контексте фиг. 2, которая является упрощенной блоксхемой компьютеризированного способа 1000, который может выполняться посредством вариантов осуществления компьютерной системы 100. Поэтому следующее описание фиг. 1 в контексте фиг. 2 ссылается на ссылочные обозначения обеих фигур.

В одном варианте осуществления компьютерная система коммуникативно связана с несколькими доменными печами BF1-BFn. Доменные печи BF1-BFn могут принадлежать разным доменам и обеспечивать ретроспективные эксплуатационные данные 21, полученные в виде многопараметрических временных рядов и отражающие тепловые состояния соответствующих доменных печей. Примеры таких ретроспективных эксплуатационных данных включают в себя, но не ограничены ими, количество шихтовых материалов и результаты химического анализа, температуру, давление, скорость подачи порошкообразного угля и обогащение кислородом с уравнением энергии для прогнозирования температуры горячего металла, одним или более уравнениями компонентов для вычисления химического состава горячего металла и одно или более уравнение газовой фазы для прогнозирования температуры доменного газа, эффективности (Eta CO) и давления.

В реальных печах разные домены могут быть связаны с разными комбинациями значений параметров в ретроспективных эксплуатационных 21 данных, описывающих тепловые состояния доменных печей в разных доменах, хотя существует сходство между такими тепловыми состояниями.

Следовательно, система 100 имеет модель DAM 110 машинного обучения в доменной адаптации для генерирования 1100 первого инвариантного набора 22 данных домена, представляющего тепловое состояние любой из доменных печей BF1-BFn независимо от домена. DAM 110 была тренирована посредством использования способа TL 111 трансферного обучения. В одном осуществлении DAM 110 может быть реализована посредством генеративной нейронной сети GDL1 113 глубокого обучения со сверточными и рекуррентными слоями, тренированными для извлечения инвариантных признаков домена из ретроспективных эксплуатационных 21 данных в качестве первого инвариантного набора 22 данных домена.

В одном альтернативном варианте осуществления DAM 110 может быть реализована посредством архитектуры генеративного глубокого обучения (например, основанной на описанной ранее архитектуре CycleGAN), которая была тренирована для обучения множеству отображений 112 соответствующих необработанных данных от нескольких доменных печей BF1-BFn в эталонную доменную печь BFr. В этом осуществления несколько отображений соответствуют первому инвариантному набору 22 данных.

Система 100 также имеет модуль ADG 120 генератора моделированных данных для генерирования 1200 моделированных эксплуатационных данных 24а в качестве многопараметрических временных рядов, отображающих тепловое состояние типовой доменной печи BFg для конкретного терморегулирующего действия 26а. С этой целью ADG 120 использует переходную модель 121 процесса типовой доменной печи. Переходная модель 121 является имитационной моделью, которая отображает соответствующие физические, химические, тепловые и потоковые условия типовой доменной печи и обеспечивает решения для восходящего потока газа и нисходящего перемещения слоев твердой фазы, как они структурированы в типовой доменной печи при обмене тепла, массы и переносе импульса. В общем, имитационная модель основана на имитационных параметрах, которые соответствуют таким параметрам состояния, контролируемых в ретроспективных эксплуатационных данных.

Возвращаясь к фиг. 3А, переходная модель 121 включает в себя несколько вычислительных ячеек с каждой из ячеек представляющей соответствующий слой типовой доменной печи BFg, составленный из одной загрузки сырьевого материала. Каждая вычислительная ячейка решает уравнение газовой фазы итеративным последовательным образом для удовлетворения относительным допускам параметра газовой фазы на каждом временном шаге (временном интервале итерации). После того как параметры газовой фазы сходятся к предварительно заданному значению допуска, уравнения твердой фазы последовательно решаются на том же временном шаге. Шаг итеративного решения уравнений газовой фазы может включать в себя для каждой итерации цикл коррекции давление-скорость вычисление 3300 свойств газа, твердой фазы и жидкости, вычисление 3400 скоростей реакции и коэффициентов теплопередачи и вычисление 3500 температуры газа, компонентов, скорости и падения давления.

Последовательно решение уравнения твердой фазы может включать в себя вычисление 3600 температуры твердой фазы и компонентов, вычисление 3700 температуры жидкости и компонентов, и вычисление 3800 скорости твердой фазы.

Обращаясь теперь к фиг. 3Б, которая показывает вычислительные ячейки СС в визуальном представлении 300 доменной печи, переходная модель 121 может получать один или более следующих входных параметров 302: количество шихтового материала 302-1 и результаты химического анализа, температура, давление, скорость 302-2 подачи порошкообразного угля и обогащение кислородом. Далее про

- 7 045556 филь 302-3 описывает геометрию доменной печи и, следовательно, оказывает воздействие на время перемещения загруженного материала (например, высокая доменная печь может иметь время перемещения 8 ч, в то время как для короткой доменной печи оно может быть только 6 ч). Профиль печи 302-3 является постоянным параметром на доменную печь, который используется для генерирования моделированных данных. Для специалиста понятно, что переходная модель принимает во внимание геометрию доменной печи. Переходная модель генерирует выходные данные 303, например, с уравнением энергии для прогнозирования температуры горячего металла, одним или более уравнениями компонентов для вычисления химического состава 303-2 и одним или более уравнениями газовой фазы для прогнозирования температуры доменного газа, эффективности (Eta CO) и давления (условия 303-1 доменного газа).

Другими словами, переходная (моделирующая) модель является цифровой моделью с соответствующими физическими, химическими, тепловыми условиями и условиями потока для генерирования приемлемых моделированных данных. В силу переходной природы модели, моделированные динамические данные временных рядов могут быть сгенерированы посредством изменения по времени входных параметров, напоминающего работу реальной печи. Как следствие, диапазон (параметров) данных может быть расширен до расширенного рабочего пространства, которое не может быть обеспечено фактическими данными доменной печи, полученными из реальных доменных печей.

В переходной модели печь разделена на конечное число слоев по высоте печи. На фиг. 3Б разные слои разделены посредством сплошных горизонтальных линий 301. Каждый слой состоит из одной загрузки сырьевого материала, в данном случае железной руды и кокса. Эти слои представляют вычислительные ячейки СС 310, как описано ранее, для которых уравнения решаются в цифровом виде. В одном варианте осуществления граничное условие для свойств газовой фазы, такие как состав, скорость и температура, определяются с использованием субмодели 310 канала, в то время как граничное условие для твердой фазы определяются в виде состава загружаемого материала при комнатной температуре. Внутреннее состояние 304 доменной печи 300 включает в себя подуровни для газа, твердой и жидкой фаз. Подуровень для газовой фазы может характеризоваться посредством: температуры (Tg, К), давления (р, Па), скорости (Vg, м/с), компонентов (СО, СО₂, Н₂, Н₂О, N2). Подуровень для твердой фазы может характеризоваться посредством: температуры (Tg, К), скорости (Vs, м/с), компонентов (Fe2O₃, Fe₃O₄, FeO, Fe, шлака, углерода кокса, золы кокса). И подуровень жидкой фазы может характеризоваться посредством: температуры (Tl, К) и компонентов (Fe, шлак, FeO).

Полное решение для газовой и твердой фаз является вычислительно очень дорогостоящим (и продолжительным). Поэтому для экономии времени и энергии газовая фаза может рассматриваться как устойчивое состояние, поскольку время устойчивости газа (примерно 3 с) намного меньше, чем временной шаг (примерно 2 мин), определенный как интервал итерации. Однако твердая фаза рассматривается как переходная фаза. Алгоритм (фиг. 3А) решения сначала решает уравнение газовой фазы итеративным последовательным путем, чтобы удовлетворять относительному допуску параметров в каждом временном шаге. Когда параметры газовой фазы сходятся к предварительно заданному значению допуска, тогда уравнения твердой фазы решаются последовательно в том же временном шаге. Временной цикл продолжается до конца моделирования. Параметры газа и твердой фазы, а также параметры переноса, такие как перенос тепла и массы, обновляются в начале каждого временного шага. В последовательном подходе после решения для одного параметра другие параметры рассматриваются как известные, подразумевая, что используются старые значения. Таким образом, нелинейные члены и связанные параметры могут быть решены, избегая сложных и дорогостоящих решающих устройств.

Как описано выше, моделированные эксплуатационные данные 24а, сгенерированные посредством переходной модели 121, сгенерированы согласно математическим уравнениям, которые приводят к чистым данным в том смысле, что моделированные эксплуатационные данные 24а не показывают какиелибо реальные характеристики, такие как, например, шум или сдвиг, обусловленные соответствующими измерительными/сенсорными устройствами. Для тренировки модели RILM 130 обучения с подкреплением для создания в высшей степени точных прогнозов желательно обеспечить тренировочные данные для модели 130, которые отражают характеристики реальных эксплуатационных данных, использованных в качестве тестовых входных данных для RILM 130. Поэтому ADG 120 использует генеративную сеть GDL2 122 глубокого обучения с рекуррентными слоями для генерирования 1300 второго инвариантного набора 23 данных домена посредством передачи признаков, выученных из ретроспективных эксплуатационных 21 данных, к моделированным эксплуатационным данным 24а. GDL2 122 была натренирована на многопараметрических временных рядах ретроспективных эксплуатационных 21 данных для того, чтобы узнать реальные характеристики из ретроспективных эксплуатационных данных и применить изученные признаки к имитированным моделированным эксплуатационным данным 24а. Это приводит к чисто синтетическому набору 23 данных, отражающему тепловое состояние типовой доменной печи BFg в ответ на терморегулирующее действие 26а. Следует отметить, что изучение естественных характеристик каждого сигнала в контексте, заданном другими сигналами посредством использования сети генеративного глубокого обучения с использованием рекуррентных слоев, подобно хорошо известным способам, применяемым к изображениям для обучения стилю отдельного набора рисунков и применения этого стиля к любому другому изображению. Подобные способы могут применяться на многопараметрических

- 8 045556 временных рядах и являются подходами, которые могут быть решены, например посредством основанного на упомянутом ранее CycleGAN алгоритме, когда он адаптирован к данным многопараметрических временных рядов.

Оба набора данных, первый инвариантный набор 22 данных домена и синтетический второй набор 23 данных обеспечены в качестве тренировочных данных RILM 130. RILM 130 определяет 1400 вознаграждение 131 для отдельного терморегулирующего действия 26а с учетом данной целевой функции путем обработки объединенных первого и второго инвариантных наборов 22 данных, 23 а домена. Основываясь на таких тренировочных данных, RILM 130 учится терморегулирующим действиям, которые зависят от состояния (типовой) доменной печи (окружения). Например, это окружение может определяться посредством, для иллюстрации, работы доменной печи, состава материала и т.п.

В зависимости от вознаграждения 131, ADG 120 регенерирует 1300 второй инвариантный набор данных домена, основанный на измененных параметрах 123-2. Генератор PG 123 параметров использует алгоритм 123-1 генетического поиска и/или байесовской оптимизации для направления поиска измененных параметров для другого терморегулирующего действия, основанного на текущем окружении 25а RILM 130 и выходных данных терморегулирующего действия 26а текущего шага обучения. С измененными параметрами переходная модель моделирует тепловое состояние для другого управляющего действия. Затем, к RILM 130 в качестве новых тренировочных входных данных направляется повторно сгенерированный второй инвариантный набор данных домена, и для новых тренировочных входных данных снова определяется вознаграждение. Этот процесс повторяется до тех пор, пока текущее вознаграждение не превысит 1500 предварительно заданное значение порога вознаграждения для обучения оптимизированным рабочим инструкциям для оптимизированных терморегулирующих действий.

Ниже описан пример реального сценария для вычисления вознаграждения, как показано на фиг. 4. Следует отметить, что специалист в данной области может использовать другие подходящие функции вознаграждения для реализации модели обучения с подкреплением. Следующий пример сценария описывает оптимизацию для установления оптимального значения исполнительного механизма для подлежащей оптимизации простой двухцелевой функции посредством использования типового алгоритма поиска.

Цель: максимизация качества (постоянное содержание Si) и максимизация производительности

Исполнительные механизмы: скорость ввода порошкообразного угля (кг/с), скорость дутья (нм /с), расход кокса (кг/загрузка)

Вознаграждение:

= 1/(эвклидово_расстояние_ доПаретофронта)

Аппроксимировано, в качестве примера, посредством улучшенного дельта анализа каждой цели: 1/эвклидово_растояние((качество_предыдущее, производительность _предыдущая),(качество_новое, производительность новая))

В этом примере определение вознаграждения действительно только с типовым алгоритмом поиска, обеспечивающим, что имеется схождение к Парето-фронту. То есть, в этом примере подлежащей оптимизации двухцелевой функции улучшение качества и производительности являются положительными между двумя последовательными итерациями.

- 9 045556

Начальное тепловое состояние доменной печи (текущее окружение): Sinit - итерация 1: значение исполнительных механизмов =

[скорость_ввода_порошкообразного_ угля_1, скоростьдутья!, расход_кокса_1] измерение цели = качество !, производительность !

- итерация 2:

значение исполнительных механизмов =

[скорость_ввода_порошкообразного_ угля_2, скорость_дутья_2, расход_кокса_2] измерение цели = качество_2, производительность_2 вознаграждение=К_2=1/эвклидово_растояние((качество_1, производительность! ),(качество_2, производительность_2)) - итерация 3:

значение исполнительных механизмов =

[скорость_ввода_порошкообразного_ угля_3, скоростьдутьяЗ, расход_кокса_3] измерение цели = качествоЗ, производительностьЗ вознаграждение=К_3 = 1/эвклидово_растояние((качество_2, производительность_2),(качество_3, производительность З))

- итерация ι:

значение исполнительных механизмов =

[скорость_ввода_порошкообразного_ угля_1, скорость дутья !, расход_кокса_1] измерение цели = качество !, производительность !

вознаграждение=К1=1/эвклидово_растояние((качество_!-1, производительность !-1),(качество !, производительность !)) итерация opt: (достигнут Парето- фронт) значение исполнительных механизмов =

[скорость_ввода_порошкообразного_ угля_ор1, скорость дутья ор!, расходкоксаор!] измерение цели = качество ор, производительностьор!

вознаграждение=К_ор11=1/эвклидово_растояние((качество_ор1 -1, производительность_ор1-1),(качество_ор1, производительность орф)

Без использования алгоритма генетического поиска может быть выполнен времязатратный случайный поиск. На фиг. 5 Парето-фронт для такого случая определяется точками (quality_i, prod_i) [(качество_1, производительность^) прим. переводчика] с точечным заполнением (на границе облака точек в целевом пространстве). В этом случае вознаграждение для каждой точки (quality_i, prod_i) может быть вычислено как обратная величина эвклидова расстояния и рассчитывается после того как Парето-фронт был идентифицирован (не во время процесса случайного поиска).

Таким образом, модель 130 обучения с подкреплением натренирована для обучения оптимизированным рабочим инструкциям, так что связанное целевое измерение лежит на предварительно заданном расстоянии от Парето-фронта для соответствующей многомерной целевой функции.

После завершения обучения RILM 130 была натренирована для обеспечения 1600 оптимизированных рабочих инструкций для терморегулирования доменной печи в ответ на тестовые входные данные с текущими эксплуатационными данными, описывающими текущее состояние доменной печи (данные фиг. 2). Факультативно, тренировка RILM 130 может продолжаться в онлайновом режиме во время работы доменной печи.

В онлайновом режиме модель 130 обучения с подкреплением прогнозирует 1700 (данные фиг. 2) оптимизированную рабочую инструкцию по меньшей мере для одного исполнительного механизма конкретной доменной печи в производстве, основанную на данных текущего рабочего состояния доменной печи. Предполагается, что терморегулирующее действие для оптимизированной рабочей инструкции применяется для доменной печи (или посредством оператора или автоматически через соответствующую систему управления). После того как терморегулирующее действие было применено по меньшей мере для одного исполнительного механизма в соответствии с оптимизированной рабочей инструкцией, вознаграждение определяется на основании нового состояния доменной печи, которое достигнуто после

- 10 045556 выполнения терморегулирующего действия. Снова определенное вознаграждение сравнивается 1500 с предварительно заданной пороговой величиной вознаграждения. Если вознаграждение находится ниже этой пороговой величины, ADG 120 регенерирует (используя переходную модель 121) вторые инвариантные данные домена для одной или более альтернативных рабочих инструкций для повторного обучения модели 130.

Фиг. 6А и 6Б показывают Парето-фронт в целевом пространстве двухмерной целевой функции (с двумя целями 01, 02) для соответствующего состояния BFS1, BFS2 (для целей визуализации). Модель RILM должна обучиться оптимальным управляющим инструкциям для доменной печи, так что связанное целевое измерение лежит на Парето-фронте. В этих фигурах цель была вычислена для каждого определенного ранее и моделированного образца данных. Фигуры показывают ограничение ретроспективных данных, которые часто ограничены только немногими эксплуатационными режимами доменной печи, приводя к скоплениям в целевом пространстве. Таким образом, крупные точки типа 22-2 связаны с инвариантным набором данных домена, найденным из ретроспективных данных. Квадраты типа 23а связаны с инвариантным набором данных домена, основанном на моделированных (имитированных) данных. Крупные точки типа 22-1 связаны с данными, сгенерированными посредством глубокой генеративной модели, натренированной на ретроспективных 21 данных (необработанные данные) или 22 (инвариантные необработанные данные домена). Эта глубокая генеративная модель действует как усовершенствованный интерполирующий алгоритм, обеспечивающий новые необработанные данные, сгенерированные из ретроспективных данных. Следовательно, сгенерированные данные могут быть только относительно близкими к существующим ретроспективным данным. Генерирование таких связанных с типом 23 а данных описано более подробно на фиг. 1 и 2. На фиг. 6Б треугольники типа 22-3 связаны с онлайновыми данными, полученными во время работы доменной печи и использованными для онлайнового режима тренировки RILM 130. Треугольники типа 22-3 находятся, естественно, ближе к Парето-фронту, поскольку они происходят из натренированной модели, обеспечивающей рекомендации оптимизированной рабочей инструкции (прогнозирование данных 1700 на фиг. 2). Однако для дальнейшей оптимизации рекомендаций рабочей инструкции в отношении этих данных запускается повторная онлайновая тренировка RILM 130.

В одном варианте осуществления система 100 может включать в себя модуль DA 140 дополнения данных для дополнения необработанных эксплуатационных 21 данных, измеренных посредством датчиков на доменной печи посредством использования одной или более специально натренированных моделей ML1-MLn машинного обучения для прогнозирования информации о будущем тепловом развитии состояния доменной печи или другой информации, связанной с текущим тепловым состоянием (пример: прогнозирование технологических явлений, виртуальный датчик, обеспечивающий измерение при более высокой частоте, чем, например, фактический датчик). Такие прогнозы служат такой же цели, как и необработанные данные для тренировки модели RILM 130, и используются таким же образом, как и необработанные данные 21 (ретроспективные эксплуатационные данные). Примером такой специально натренированной модели машинного обучения является модель, прогнозирующая температуру горячего металла в течение 3 часов. Этот прогноз температуры горячего металла может быть затем использован для тренировки RILM 130. Такое дополнение данных дополнительно улучшает тренировочный набор данных, используемый для обучения с подкреплением RILM 130, и приводит к улучшенной точности прогноза модели обучения с подкреплением. Альтернативно, могут быть добавлены новые датчики, как показано на фиг. 9. Это позволяет более точно охарактеризовать состояние доменной печи для тренировки RILM 130. Как пример, если некоторые характеристики загруженного в доменную печь сырьевого материала отсутствуют (например, пористость, влажность), они могут быть или измерены (используя дополнительные датчики) или они могут быть потенциально оценены с использованием моделей ML1MLn машинного обучения.

Перечень моделей (ML) машинного обучения, которые являются предпочтительными для добавления данных, чтобы сделать возможным более точное описание состояния доменной печи и, как следствие, сделать более точной тренировку RILM 130, перечислены ниже:

A) ML для улучшенной оценки: любые аномалии в необработанных данных, обеспеченных посредством датчиков доменной печи, могут быть обнаружены перед тренировкой модели машинного обучения или могут быть использованы в качестве входных данных в воздании развернутой модели машинного обучения;

Б) ML для прогнозирования теплового состояния доменной печи и производства горячего металла KPIs (главные индикаторы эксплуатационных качеств);

В) ML для оптимизации матрицы загрузки;

Г) ML для основанной на съемочной камере фурмы инспекции процесса;

Д) ML для рекомендаций устройству открывания летки для оптимальной работы;

Е) ML для обнаружения основанных на ТМТ SOMA (акустическое измерение температуры газа) явлений и расчет/прогнозирование главных индикаторов эксплуатационных качеств;

Ж) ML для маркировки явлений посредством технологических правил (возможное использование выходных данных, сгенерированных посредством модели машинного обучения), определенных техноло- 11 045556 гом, или посредством моделей контролируемого или неконтролируемого машинного обучения или моделей обнаружения шаблона;

И) ML для прогнозирования явлений из сгенерированных в Ж) меток;

К) ML для прогнозирования процесса;

Л) ML для прогнозируемого и предписанного технического обслуживания;

М) ML для расширенного контекстного обучения представлениям: датчики окружающей среды могут быть использованы для тренировки неконтролируемой модели глубокого обучения для изучения представления, использованного для дополнения набора данных, для вышеупомянутых случаев требуемого использования.

Фиг. 7 описывает более подробно подход к реализации DA 140 для тренировки модели машинного обучения для прогнозирования температуры горячего металла в течение 3 ч. Фиг. 7 показывает процедуру тренировки 706 модели MLT машинного обучения для прогнозирования температуры горячего металла в будущий момент времени (например, в течение 3 ч) из прогнозов BMP 704 множества моделей машинного обучения, называемых базовыми моделями. Эти базовые модели тренируются 703 для генерирования прогнозов для дополнения измеренных необработанных данных.

Для этой цели несколько базовых моделей тренировались 703 с разными наборами переменных (технологические параметры 701 и/или контекстные параметры 702) и/или алгоритмами машинного обучения. Технологическими параметрами 701 являются необработанные данные (эксплуатационные данные), измеренные посредством соответствующих датчиков непосредственно на доменной печи. Контекстные данные 702 измеряются посредством любого другого датчика, измеряющего переменные окружающей среды, такие как шум, изображения и т.п. Технологические параметры и контекстные параметры являются переменными, которые имеются в наличии для тренировки моделей машинного обучения.

Каждая базовая модель обеспечивает выходные данные 704, 705, которые могут быть использованы для тренировки 706 MLT (в общем для тренировки модели машинного обучения для прогнозирования также иных параметров, чем температура горячего металла в течение 3 ч) для прогнозирования обсуждаемых параметров, которые лучше, чем любой прогноз базовых моделей.

Целью базовых моделей является генерирование дополнительной информации для тренировки более точной модели прогнозирования (то есть, метамодели, такой как MLT). Модель прогнозирования MLT также использует технологические параметры и контекстные параметры 701, 702 в качестве входных данных для изучения, какая комбинация базовых моделей является наиболее подходящей для какого состояния доменной печи. То есть, метамодель учится, как объединять выходные данные всех базовых моделей, чтобы сделать правильный и точный прогноз параметра состояние конкретной доменной печи. Некоторые базовые модели могут не прогнозировать температуру горячего металла в течение 3 ч, но могут прогнозировать тенденцию температуры горячего металла, например, будет ли температура повышаться, снижаться или будет постоянной, или они могут прогнозировать появление особого технологического события в близком будущем, и т.д. Другими словами, базовые модели генерируют в качества выходных данных дополнительную информацию, которая или связана с процессом (технологическая информация PI 705), или уже является прогнозом BMP 704 базовой модели для температуры горячего металла, или характеристикой температуры горячего металла (пример: прогнозирование тенденции). Когда MLT была натренирована 706 на основании выходных данных разных базовых моделей, она обеспечивает более правильный прогноз MLTP 705, чем любая из базовых моделей (BMP 704).

В примере технологическая информация PI 705 может обеспечивать входную информацию для MLT, такую как будущие прогнозы в области [0, 6 ч], включающие в себя, но не ограниченные кластером, технологическими явлениями, технологическими/контекстными параметрами или признаками. Эти выходные данные связаны с процессом и обеспечивают новые входные данные с потенциально более высокой корреляцией с температурой горячего металла, спрогнозированной посредством MLT. Прогнозы BMP 704 базовой модели для температуры горячего метала могут обеспечивать информацию, такую как тенденция температуры горячего металла в течение 3 и 6 ч (например, быстрое повышение, среднее повышение, медленное повышение, стабильность, медленное снижение, среднее снижение быстрое снижение) или спрогнозированное качество производства горячего металла в течение промежутка времени. BMP 704 являются выходными данными базовых моделей, которые непосредственно связаны с выходными данными MLT, или теми же выходными данными или их характеристиками. Примером тех же выходных данных является температура горячего металла в течение 3 ч и примером характеристик этих выходных данных является тенденция температуры, спрогнозированная посредством базовой модели.

Ниже некоторые примеры из приведенного выше перечня моделей машинного обучения будут описаны более подробно.

Улучшенная оценка данных

Пирамида оценки данных может быть определена посредством нескольких уровней оценки данных, как описано ниже, начиная с самого низкого уровня и заканчивая самым высоким уровнем пирамиды.

Техническое обслуживание датчиков и калибровка:

Может быть реализована процедура технического обслуживания и калибровки. Может быть привлечен моделированный интеллект (AI) для оптимального графика технического обслуживания и пред- 12 045556 писания наилучших действий, подлежащих выполнению для поддержания как можно дольше датчика в рабочем режиме.

Способ мин/макс по отдельным сигналам датчика:

Первым уровнем обнаружения аномалий является определение минимальных и максимальных значений, допустимых для каждого сигнала датчика необработанных данных. Минимальное и максимальное значения являются постоянными и поэтому независимыми от технологического процесса. Основанные на условиях способа мин/макс значения могут быть сконфигурированы согласно правилам, определенным специалистом по технологическому процессу, чтобы привести к некоторому контексту.

Обнаружение выпадающих значений и аномалий на отдельных сигналах датчика:

ниже приведены типичные способы в порядке возрастающей сложности:

i) статистические амплитудные выпадающие значения: Способ анализа данных для обнаружения точечных аномалий, которые по определению являются значениями, смещенными от среднего значения в движущемся временном окне длиной L, подлежащими заданию посредством специалиста по технологическому процессу и основанными на типичной глубине автокорреляции временных рядов, записанных датчиком.

ii) Контролируемое обнаружение аномалии:

Контролируемый алгоритм заучивает известные образы в сигнале датчика для обнаружения аномалии.

iii) Неконтролируемое обнаружение выпадающих значений:

Способы этой категории обнаруживают выпадающие значения посредством алгоритма группирования после того, как вычислены признаки из сигнала датчика. Следовательно, такой подход не ограничен необычными амплитудными значениями для данного контекста, но может также принимать во внимание спектральную информацию или любые другие характеристики, определенные признаками.

Обнаружение аномалий многодатчиковых сигналов:

В силу большого числа датчиков ручные перекрестные проверки между избыточными сигналами датчиками являются недостаточными для обнаружения сложных контекстных аномалий в данных. Основанные на правилах подходы обычно ограничены, потому что оцениваются только известные отношения. Такое же ограничение сохраняется для контролируемой управляемой данными модели, которая была натренирована для определения известных аномалий. Неконтролируемый управляемый данными подход является дополняющим шагом проверки для обеспечения обнаружения известных и неизвестных аномалий. Контекстные аномалии могут быть обнаружены посредством управляемой данными модели, которая изучила корреляцию между сигналами датчиков и, следовательно, способна обнаруживать, отклоняются ли измерения датчиком от его нормальной работы в данном контексте, как определено процессом. Обнаружение причинной связи посредством машинного обучения совмещенного с неконтролируемым управляемым данными обнаружением аномалий делает возможным анализ первопричин.

Перекрестная проверка датчиков в сопоставлении с результатами имитационной модели: Если имеется имитационная модель, описывающая процесс, перекрестная проверка результатов модели с необработанными данными датчиков обеспечивает оценку автономных данных на уровне экспертов. Однако оценка данных ограничивается рабочими условиями, свойственными гипотезе имитационной модели.

Пирамида оценки данных направлена на обнаружение аномалий в полученных эксплуатационных данных (необработанные данные). Аномалии могут быть связаны с неисправными датчиками, но также с процессом. В случае аномалий процесса редкие события процесса могут быть должным образом снабжены метками для разработки особой модели машинного обучения, такой как обучение по ограниченному числу попыток (Few-Shot Learning (FSL)) для их правильного обнаружения или прогнозирования. FSL является известным примером машинного обучения по ограниченному числу примеров с контролируемой информацией. Способ, нацеленный на различение аномалий процесса от связанной с неисправными датчиками аномалией, является анализом первопричин. Анализ причинной связи, приводящий к обнаружению аномалии, способен делить аномалии на связанные с процессом или датчиком аномалии. В этой связи технолог определяет правила или модель машинного обучения, и полуконтролируемый классификатор тренируется на причинных связях и метках, сгенерированных исходя из вышеупомянутых правил. Прогнозирование теплового состояния доменной печи Это связано с моделью MLT машинного обучения, использованной посредством примера на фиг. 7. MLT обеспечивает представление о будущем теплового состояния доменной печи и характеристиках производства горячего металла. На подходящих технологических параметрах и других контекстных параметрах, которые являются полезными для прогнозирования теплового состояния доменной печи или характеристик производства горячего металла, MLT тренируется для прогнозирования в данном временном горизонте следующих показателей:

тенденции температуры горячего металла в течение 3 и 6 ч: быстрое повышение, среднее повышение, медленное повышение, стабильность, медленное снижение, среднее снижение быстрое снижение;

прогноз содержания кремния при нескольких временных горизонтах от 1 до 6 ч в будущем;

качество горячего металла при нескольких временных горизонтах от 1 до 6 ч в будущем.

Модель может тренироваться с температурой горячего металла, измеренной вручную для каждой отливки, или непрерывно автономным образом посредством специального датчика. Посредством объе- 13 045556 динения прогнозов нескольких базовых моделей в качестве новых входных данных для тренировки метамодели MLT может быть реализован подход ансамблевого моделирования, приводящий к прогнозу, имеющему уменьшенное прогнозируемое смещение или прогнозируемое изменение.

Оптимизация матрицы загрузки

Распределитель шихты находится среди наиболее важных доступных оператору исполнительных механизмов для оптимизации использования газа (Eta CO) для минимизации удельного расхода кокса и уменьшения выбросов СО2. Распределение шихты всегда должно быть приспособлено к работе доменной печи и является компромиссом между оптимальным использованием газа, плавным опусканием шихты и температурой стенка/шахта (поверхностного потока).

На сегодняшний день некоторые заводы используют модели распределения шихты для оценки влияния данной матрицы загрузки на профиль шихты и определения отношения С/(О+С) по диаметру колошника доменной печи. Эта информация является важной и дает приемлемо хорошие намеки о профиле температуры в зоне спекания. Тем не менее, определение матрицы загрузки в модели не является ясным, и модели только обеспечивают ограниченную помощь в нахождении оптимальной матрицы загрузки для данного процесса. Матрица загрузки определяется оператором для оптимального распределения материала в доменной печи. С этой целью матрица загрузки включает в себя параметры, такие как наклон спускного желоба и число вращений для каждого типа материала. Модель машинного обучения может быть натренирована для прогнозирования оптимальной матрицы загрузки в зависимости от текущего теплового состояния доменной печи, ее спрогнозированного изменения и ее главных индикаторов эксплуатационных качеств производства. Прогнозирующая модель матрицы загрузки может быть натренирована из необработанных данных нескольких доменных печей, если нет достаточного изменения элементов матрицы загрузки для тренировки модели машинного обучения для одной доменной печи.

Основанная на съемочной камере фурмы инспекция процесса

Этот пример связан с фиг. 8. Обеспеченные съемочной камерой фурмы изображения анализируются посредством комбинации сверточной нейронной сети (CNN) и компьютерного зрения 803, нацеленного на обнаружение 804 явлений путем применения компьютерного зрения в областях (например, круг, фурма для вдувания кислорода, область нагнетания в классифицированных изображениях 801с), обнаруженных основанным на CNN классификаторе 802 области. Вместе с изображениями 801 фурмы обнаруженные метки явлений могут служить в качестве входных данных для дальнейшего глубокого обучения 805, натренированного для прогнозирования явлений процесса.

Другим применением анализа последовательности изображений фурмы с использованием машинного обучения является кодирование пространственно-временных признаков для обогащения образа состояния доменной печи, определяющего окружение для модели обучения с подкреплением. Для этой цели может быть использовано мультимодальное обучение 808 в качестве способа изучения образа 809 окружения из гетерогенных данных, таких как изображения, многопараметрические временные ряды 806 и звуки 807. Это делает возможным улучшенный подход по сравнению с унимодальным машинным обучением, предполагая независимость мод.

Рекомендации устройству открывания летки для оптимальной работы:

Использование устройства пробивания летки, а также ее параметризация (например, тип глины и т.п.) может быть рекомендовано посредством модели машинного обучения.

Обнаружения основанных на ТМТ SOMA явлений и расчет главных индикаторов эксплуатационных качеств:

SOMA является инструментом для обеспечения двухмерной информации о распределении температуры в верхней части доменной печи. Температурная карта может быть обработана посредством алгоритма машинного зрения, потенциально объединенного с моделью машинного обучения для целей прогнозирования. Конвейер обработки согласно фиг. 8 для основанной на съемочной камере фурмы инспекции процесса может быть также применен для SOMA.

Маркировка явлений и прогнозирование:

Генерирование маркировок для явлений процесса обеспечивает создание богатой информации для улучшения обучения связям между действиями и окружением RILM 130. Метки могут быть сгенерированы посредством правил, определенных технологом или посредством модели обнаружения образов, натренированной на образах, выбранных в ретроспективных данных технологом. Присутствие образов может быть обнаружено посредством алгоритма, такого как алгоритм динамической трансформации временной шкалы для одномерных или многомерных данных временных рядов или посредством определения признаков для тренировки модели машинного обучения. В дополнение для обеспечения высокого уровня контекстной информации для RILM модели эти метки могут быть использованы для тренировки модели машинного обучения для обнаружения присутствия комбинации явлений или для прогнозирования появления одного явления или комбинации явлений. Тренировка модели контролированного машинного обучения из сгенерированных меток требует, чтобы имелось достаточно меток с достаточным числом изменений.

Прогнозируемое и предписанное техническое обслуживание:

Модели машинного обучения могут тренироваться для прогнозирования технического обслужива- 14 045556 ния и рекомендуемых действия, которые должны предприниматься для отсрочивания технического обслуживания и, как следствие, увеличения срока службы доменной печи или любых объектов, связанных с доменной печью. В этой связи известны многие подходы, такие как использование контролируемого обучения для прогнозирования остаточного срока эксплуатации или времени наработки на отказ связанных с доменной печью объектов. Неконтролируемые модели обучения могут тренироваться для обнаружения редких событий и для временного группирования обучающего набора данных, которые должны быть использованы для тренировки контролируемой модели, прогнозирующей эти редкие событий. Анализ первопричин прогнозов позволяет автономной системе, натренированной с действиями, записанными из прошлых технических обслуживаний, предписывать лучше всего известные действия для отсрочивания технического обслуживания.

Расширенное контекстное обучение представлениям:

Модель обучения с подкреплением требует представление контекста для лучшего моделирования окружения и обучение оптимальным действиям, которые должны предприниматься для этого окружения. С этой целью могут быть разработаны и размещены вокруг печи 90 несколько датчиков для записи изображений (датчик-видеокамера 91), звуковых волн (звуковые датчики 92), вибрации (датчики 93 вибрации) и анализа воздуха (газовые датчики 94) в разных положениях, показанных на фиг. 9. Соответствующие мультимодальные временные ряды могут анализироваться посредством сети глубокого обучения для извлечения значимого представления контекста, которое потенциально может быть объединено с технологическими данными доменной печи или описательными данными материала, или другими характеристиками, которые могут оказать влияние на термогулирование доменной печи.

Фиг. 10 является схемой, на которой показан пример типового компьютерного устройства 900 и типового мобильного компьютерного устройство 950, которые могут быть использованы с описанными здесь способами. Компьютерное устройство 900 предназначена для представления разных форм цифровых компьютеров, таких как лэптопы, настольные компьютеры, рабочие станции, персональные цифровые помощники, серверы, одноплатные серверы, большие ЭВМ и другие подходящие компьютеры.

Типовой компьютер 900 может соответствовать компьютерной системе 100 на фиг. 1. Вычислительное устройство 950 предназначено для представления разных форм мобильных устройств, таких как персональные цифровые помощники, сотовые телефоны, смартфоны, системы помощи при вождении транспорта или бортовые компьютеры автомобилей (например, автомобилей 401, 402, 403, данные фиг. 1) и другие подобные вычислительные устройства. Например, вычислительное устройство 950 может быть использовано как внешний интерфейс пользователем (например, оператором доменной печи) для взаимодействия с вычислительным устройством 900. Показанные здесь компоненты, их соединения и связи и их функции подразумеваются только приведенным в качестве примера и не подразумеваются огранивающими осуществление заявленных в данном документе изобретений.

Вычислительное устройство 900 включает в себя процессор 902, память 904, запоминающее устройство 906, высокоскоростной интерфейс 908, соединенный с памятью 904 и высокоскоростными портами расширения 910, и низкоскоростной интерфейс 912, соединенный с низкоскоростной шиной 914 и запоминающим устройством 906. Каждый из компонентов 902, 904, 906, 908, 910 и 912 соединены между собой с использованием различных шин и могут быть установлены на общей системной плате или другим подходящим образом. Процессор 902 может обрабатывать инструкции для выполнения в вычислительном устройстве 900, включая инструкции, хранящиеся в памяти 904 или в запоминающем устройстве 906 для демонстрации графической информации для графического интерфейса пользователя на внешнем устройстве ввода/вывода, таком как дисплей 916, соединенный с высокоскоростным интерфейсом 908. В других вариантах осуществления в случае необходимости могут быть использованы несколько процессоров и/или несколько шин, вместе с несколькими памятями и типами памяти. Также несколько вычислительных устройств 900 могут быть соединены друг с другом, причем каждое устройство обеспечивает части требуемых операций (например, банк сервера, группа одноплатных серверов или многопроцессорная система).

Память 904 хранит информацию в вычислительном устройстве 900. В одном варианте осуществления память 904 является блоком или блоками энергозависимой памяти. В другом варианте осуществления память 904 является блоком или блоками долговременной памяти. Память 904 может быть также другой формой машинно-читаемой среды, такой как магнитный или оптический диск.

Запоминающее устройство 906 может обеспечивать массовую память для вычислительного устройства 900. В одном варианте осуществления запоминающее устройство может быть или содержать машинно-читаемую среду, такую как накопитель на дискете, накопитель на жестком диске, накопитель на оптическом диске или ленточный накопитель, флэш-память или другие подобные устройства полупроводниковой памяти, или массив устройств, включая устройства в сети хранения данных или другие конфигурации. Компьютерный программный продукт может быть материально встроен в носитель информации. Компьютерный программный продукт может также содержать инструкции, которые при выполнении осуществляют один или более способов, таких как описанные выше. Носитель информации является компьютерно-читаемой или машинно-читаемой средой, такой как память 904, запоминающее устройство 906 или память на процессоре 902.

- 15 045556

Высокоскоростной контроллер 908 управляет требующими широкую полосу операциями для вычислительного устройства 900, в то время как низкоскоростной контроллер 912 управляет требующими более узкую полосу операциями. Такое распределение функций приведено только для примера. В одном варианте осуществления высокоскоростной контроллер 908 связан с памятью 904, дисплеем 916 (например, через графический процессор или ускоритель) и высокоскоростным портом 910 расширения, который может принимать разные расширительные платы (не показано). В варианте осуществления низкоскоростной контроллер 912 связан с запоминающим устройством 906 и низкоскоростным портом 914 расширения. Низкоскоростной порт расширения, который может включать в себя различные связные порты (например, USB, Bluetooth, Ethernet, беспроводной Ethernet), может быть связан с одним из устройств ввода/вывода, таким как клавиатура, указательное устройство, сканер или сетевое устройство, такое как переключатель или роутер, например, через сетевой адаптер.

Вычислительное устройство может быть реализовано в нескольких разных формах, как показано на фигуре. Например, оно может быть реализовано в виде стандартного сервера 920 или нескольких в группе таких серверов. Оно также может быть реализовано в виде части системы 914 стоечных серверов. В дополнение оно может быть реализовано в персональном компьютере, таком как ноутбук 922. Альтернативно, компоненты из вычислительного устройства 900 могут быть объединены с другими компонентами в мобильное устройство (не показано), такое как устройство 950. Каждое из этих устройств может содержать одно или более вычислительных устройств 900, 950, и вся система может быть составлена из нескольких вычислительных устройств 900, 950, сообщающихся друг с другом.

Вычислительное устройство 950 включает в себя наряду с другими компонентами процессор 952, память 964, устройство ввода/вывода, такое как дисплей 954, связной интерфейс 966 и приемопередатчик 968. Устройство 950 может быть также оснащено запоминающим устройством, таким как съемный жесткий диск или другое устройство для обеспечения дополнительной памяти.

Каждый из компонентов 950, 952, 964, 954, 966 и 968 взаимосвязан с использованием различных шин, и некоторые из компонентов могут быть установлены на общей системной плате или в случае необходимости другим образом.

Процессор 952 может выполнять инструкции в вычислительном устройстве 950, включая сохраненные в памяти 964 инструкции. Процессор может быть реализован в виде набора микросхем или микросхем, которые включают в себя отдельные и множественные аналоговые и цифровые процессоры. Процессор может, например, обеспечивать координацию других компонентов устройства 950, такую как управление пользовательскими интерфейсами, выполняемыми устройством 950 приложениями и беспроводной связью посредством устройства 950.

Процессор 952 может общаться с пользователем через управляющий интерфейс 958 и дисплейный интерфейс 956, связанный с дисплеем 954. Дисплей 954 может быть, например, TFT LCD (жидкокристаллическим дисплеем на тонкоплёночных транзисторах), OLED (дисплеем на органических светоизлучающих диодах) или другой соответствующей технологией дисплея.

Дисплейный интерфейс 956 может включать в себя соответствующие схемы для приведения в действие дисплея 954 для предоставления пользователю графической и другой информации. Управляющий интерфейс 958 может получать команды от пользователя и преобразовывать их для представления процессору 952. В дополнение может быть обеспечен внешний интерфейс 962 в связи с процессором 953, так чтобы делать возможной ближнюю связь устройства 950 с другими устройствами. Внешний интерфейс 962 может, например, обеспечивать проводную связь в некоторых вариантах осуществления или беспроводную связь в других вариантах осуществления, и могут быть использованы несколько интерфейсов.

Память 964 хранит информацию в вычислительном устройстве 950. Память 964 может быть реализована в виде одной или более из компьютерно-читаемых среды или сред, блока или блоков энергозависимой памяти или блока или блоков долговременной памяти. Может быть также обеспечена расширительная память 984 и связана с устройством 950 через интерфейс 982 расширения, который может включать в себя, например интерфейс SIMM карты (модуль памяти с однорядным расположением выводов). Такая расширительная память 984 может обеспечивать дополнительное пространство для хранения данных для устройства 950 или также может хранить приложения или другую информацию для устройства 950. Прежде всего, расширительная память 984 может содержать инструкции для выполнения или дополнения описанных выше процессов, и может содержать защищенную информацию. Так, например, расширительная память 984 может действовать в качестве модуля безопасности для устройства 950 и может быть запрограммирована посредством инструкций, которые делают возможным безопасное использование устройства 950. В дополнение приложения безопасности могут быть обеспечены через SIMM карты вместе с дополнительной информацией, такой как размещение идентифицирующей информации на SIMM карте защищенным от хакерских атак образом.

Память может включать с себя, например, флэш-память и/или NVRAM память, как рассмотрено ниже. В одном варианте осуществления компьютерный программный продукт материально встроен в носитель информации. Компьютерный программный продукт содержит инструкции, которые при исполнении выполняют один или более способов, таких как описанные выше. Носитель информации является

- 16 045556 компьютерно-читаемой или машинно-читаемой средой, такой как память 964, расширительная память

984 или память на процессоре 952, которая может быть доступна, например, через приемопередатчик 968 или внешний интерфейс 962.

Устройство 950 может связываться беспроводным образом через связной интерфейс 966, который при необходимости может включать в себя цифровые обрабатывающие сигнал схемы. Связной интерфейс 966 может обеспечивать связь согласно разным режимам или протоколам, таким как в том числе голосовая GSM связь, SMS, EMS или MMS сообщения, CDMA, TDMA, PDC, WCDMA, CDMA2000 или GPRS. Такая связь может происходить, например, через радиочастотный приемопередатчик 968. В дополнение связь на короткой дистанции может происходить через блютус, WiFi и другие подобные приемопередатчики (не показано). В дополнение модуль 980 GPS (системы глобального позиционирования) приемника может обеспечивать дополнительные беспроводные связанные с навигацией и местоположением данные для устройства 950, которые могут быть использованы выполняемыми на устройстве 950 приложениями.

Устройство 950 может также осуществлять голосовую связь с использованием аудиокодека 960, которым может принимать речевую информацию от пользователя и преобразовывать ее в пригодную для применения цифровую информацию. Аудиокодек 960 может также генерировать слышимый звук для пользователя, например, через громкоговоритель, например, в телефонной трубке устройства 950. Такой звук может включать в себя звук голосового телефонного вызова, может включать в себя записанный звук (например, голосовое сообщение, музыкальные файлы и т.п.) и может также включать в себя звук, сгенерированный выполняемым на устройстве 950 приложением.

Вычислительное устройство 950 может быть реализовано в нескольких разных формах, как показано на фигуре. Например, оно может быть реализовано в виде сотового телефона 980. Оно может быть также реализовано в виде части смартфона 982, личного цифрового помощника или другого подобного мобильного устройства.

Различные реализации описанных здесь систем и технологий могут быть реализованы в цифровых электронных схемах, интегральных схемах, специально разработанных ASIC (заказных микросхемах), в компьютерном аппаратном обеспечении, встроенных программах, программном обеспечении или их комбинациях. Эти различные реализации могут включать в себя реализацию в одной или более компьютерных программах, которые являются выполняемыми или интерпретируемыми на программируемых системах, включающих в себя по меньшей мере один программируемый процессор, который может быть специальным или универсальным, связанными для получения данных и инструкций от и передавать данные и инструкции к запоминающей системе, по меньшей мере к одному устройству ввода и по меньшей мере к одному устройству вывода.

Эти компьютерные программы (также известные как программы, программное обеспечение, программные приложения или код) включают в себя машинные команды для программируемого процессора и могут быть реализованы в высокоуровневом процедурном и/или объектно-ориентированном языке программирования или в языке ассемблера или машинном языке. В данном контексте термины машинно-читаемая среда или компьютерно-читаемая среда касаются компьютерного программного продукта, аппарата и/или устройства (например, магнитного диска, оптического диска, памяти, программируемых логических устройств (PLD), используемых для направления машинных команд и/или данных к программируемому процессору, включая машинно-читаемую среду, которая получает машинные команды в качестве машинно-читаемого сигнала. Термин машинно-читаемый сигнал относится к любому сигналу, используемому для направления машинных команд и/или данных к программируемому процессору.

Для обеспечения связи с пользователем описанные здесь способы могут быть реализованы на компьютере, имеющем дисплейное устройство (например, CRT (катодно-лучевой) или LCD (жидкокристаллический) монитор) для отображения информации для пользователя и клавиатуру или указывающее устройство (например, мышку или шаровой манипулятор), посредством которого пользователь может обеспечить вывод к компьютеру. Другие разновидности устройств также могут быть использованы для обеспечения взаимодействия с пользователем, например обратная связь с пользователем может быть любой формой сенсорной обратной связи (например, визуальная обратная связь, слуховая обратная связь или тактильная обратная связь), и входные данные от пользователя могут быть получены в любой форме, включая акустические, речевые или тактильные входные данные.

Описанные здесь система и способы могут быть реализованы в компьютерном устройстве, которое включает в себя серверный компонент (например, в виде сервера данных) или которое включает в себя промежуточное программное обеспечение (например, сервер приложений) или которое включает в себя клиентские компонент (например, компьютер клиента, имеющий графический пользовательский интерфейс или веб-браузер, через который пользователь может взаимодействовать с реализацией описанных здесь систем и способов), или любые комбинации таких серверных компонентов, промежуточного программного обеспечения или клиентских компонентов. Компоненты системы могут быть взаимосвязаны посредством любой формы или среды передачи данных (например, сети связи). Примеры сети связи включают в себя локальную сеть (LAN), глобальную сеть (WAN) и Интернет.

-

Claims

Вычислительное устройство может включать в себя клиенты и серверы. Клиент и сервер обычно удалены друг от друга и типичным образом взаимодействуют через сеть связи. Взаимосвязь клиента и сервера является результатом компьютерных программ, исполняемых на соответствующих компьютерах и имеющих относительно друг друга связь клиент-сервер.

Были описаны несколько вариантов осуществления. Тем не менее, будет понятно, что могут быть выполнены различные модификации без отклонения от сущности и объема изобретения.

В дополнение, показанные на фигурах логические потоки не требуют особого показанного порядка или последовательного порядка для достижения требуемого результата. В дополнение могут быть обеспечены другие шаги или шаги могут быть исключены из описанных потоков, и другие компоненты могут быть добавлены к описанным системам или удалены из описанных систем. Соответственно, в пределах следующей формулы изобретения находятся другие варианты осуществления.

ФОРМУЛА ИЗОБРЕТЕНИЯ

1. Компьютеризированный способ (1000) обучения модели (130) обучения с подкреплением для формирования рабочих инструкций для терморегулирования доменной печи, причем способ включает в себя обработку посредством натренированной посредством трансферного обучения модели (110) машинного обучения в доменной адаптации ретроспективных эксплуатационных (21) данных, полученных в виде многопараметрических временных рядов и отражающих тепловые состояния соответствующих доменных печей (BF1-BFn) множества доменов, для генерирования (1100) первого инвариантного набора (22) данных домена, представляющего тепловое состояние любой из доменных печей (BF1-BFn) независимо от домена, генерирование (1200) моделированных эксплуатационных данных (24а) в виде многопараметрических временных рядов, отображающих тепловое состояние типовой доменной печи (BFg) для конкретного терморегулирующего действия (26а) посредством использования переходной модели (121) типового процесса доменной печи, причем переходная модель (121) отображает соответствующие физические, химические, тепловые и потоковые условия типовой доменной печи и обеспечивает решения для восходящего потока газа и нисходящего перемещения слоев твердой фазы, как они структурированы в типовой доменной печи при обмене тепла, массы и переносе импульса, обработку моделированных эксплуатационных данных (24а) посредством генеративной сети (122) глубокого обучения, натренированной на многопараметрических временных рядах ретроспективных эксплуатационных (21) данных, для генерирования (1300) второго инвариантного набора (23а) данных домена посредством передачи признаков, выученных из ретроспективных эксплуатационных (21) данных, к моделированным эксплуатационным данным (24а), модель (130) обучения с подкреплением, определяющую (1400) вознаграждение (131) для конкретного терморегулирующего действия (26а) с учетом данной целевой функции посредством обработки объединенных первого и второго инвариантных наборов данных (22, 23а) домена, и в зависимости от вознаграждения (131) регенерирование (1300) второго инвариантного набора данных домена, основанного на измененных параметрах (123-2), причем поиск измененных параметров для другого терморегулирующего действия, основанного на текущем окружении (25а) модели (130) обучения с подкреплением и выходных данных терморегулирующего действия (26а) текущего шага обучения, направляется алгоритмом генетического (123-1) поиска и/или байесовской оптимизации, и повторение определяющего (1400) шага для обучения оптимизированным рабочим инструкциям для оптимизации терморегулирующих действий, которые должны быть применены для соответствующих эксплуатационных состояний одной или более доменных печей.
2. Способ по п.1, также включающий в себя модель (130) обучения с подкреплением, прогнозирующую (1700) оптимизированную рабочую инструкцию по меньшей мере для одного исполнительного механизма конкретной доменной печи в производстве, основанную на данных текущего эксплуатационного состояния данных конкретной доменной печи, определение (1400) вознаграждения после применения терморегулирующего действия в соответствии с оптимизированной рабочей инструкцией по меньшей мере для одного исполнительного механизма, основанного на новом состоянии конкретной доменной печи после выполнения терморегулирующего действия, и если вознаграждение ниже предварительно заданного порога, переходная модель регенерирует второй инвариантный набор данных для одной или более альтернативных рабочих инструкций для повторной тренировки модели обучения с подкреплением.
3. Способ по п.1 или 2, причем модель (110) машинного обучения в доменной адаптации реализована посредством генеративной нейронной сети глубокого обучения со сверточными и/или рекуррентными слоями, натренированными извлекать доменные инвариантные признаки из ретроспективных эксплуатационных (21) данных в виде первого инвариантного набора данных домена.

- 18 045556
4. Способ по п.1 или 2, причем модель (110) машинного обучения в доменной адаптации тренировалась для обучения множеству отображений соответствующих необработанных данных от нескольких доменных печей (BF1-BFn) в эталонную доменную печь (BFr), причем каждое отображение является представлением преобразования соответствующей конкретной доменной печи в эталонную доменную печь, и несколько отображений соответствуют первому инвариантному набору данных домена.
5. Способ по п.4, причем модель (110) машинного обучения в доменной адаптации реализована посредством архитектуры генеративного глубокого обучения, основанной на архитектуре CycleGAN.
6. Способ по одному из предшествующих пунктов, причем модель обучения с подкреплением тренируется для обучения оптимизированным рабочим инструкциям так, что связанное целевое измерение лежит в предварительно заданном диапазоне от Парето-фронта для соответствующей многомерной целевой функции.
7. Способ по одному из предшествующих пунктов, причем переходная модель (121) имеет несколько расчетных ячеек, причем каждая ячейка представляет соответствующий слой типовой доменной печи, составленный из одной загрузки сырого материала, причем каждая расчетная ячейка решает уравнения газовой фазы итеративным последовательным путем для удовлетворения относительным допускам параметра газовой фазы на каждом временном интервале итерации и, когда параметры газовой фазы сходятся к предварительно заданному значению допуска, последовательно решает уравнения твердой фазы в том же временном интервале итерации.
8. Способ по п.7, причем итеративное решение уравнений газовой фазы включает в себя для каждой итерации коррекционной петли давление-скорость вычисление (3300) свойств газа, твердой фазы и жидкости, вычисление (3400) скоростей реакции и коэффициентов теплопередачи, вычисление (3500) температуры газа, компонентов, скорости и падения давления и причем последовательное решение уравнений твердой фазы включает в себя вычисление (3600) температуры твердой фазы и компонентов, вычисление (3700) температуры жидкости и компонентов и вычисление (3800) скорости твердой фазы.
9. Способ по одному из предшествующих пунктов, причем переходная модель (121) получает один или более следующих входных параметров: количество шихтового материала и результаты химического анализа, температура, давление, скорость подачи порошкообразного угля и обогащение кислородом, с уравнением энергии для прогнозирования температуры горячего металла, одним или более уравнениями компонентов для вычисления химического состава горячего металла, одним или более уравнениями газовой фазы для прогнозирования температуры доменного газа, эффективности (Eta СО) и давления.
10. Способ по одному из предшествующих пунктов, причем модель обучения с подкреплением реализуют посредством рекуррентной нейронной сети.
11. Способ по одному из предшествующих пунктов, также включающий в себя прогнозирование информации о будущей тепловой эволюции состояния конкретной доменной печи на основании ретроспективных эксплуатационных (21) данных и/или других измеренных данных об окружающей среде, связанных с окружением доменной печи, посредством использования одной или более соответствующим образом натренированных связанных моделей (ML1-MLn) машинного обучения для дополнения ретроспективных эксплуатационных (21) данных будущими данными многопараметрических временных рядов, которые связаны с будущими моментами времени, и обработку посредством модели (110) машинного обучения в доменной адаптации будущих многопараметрических временных рядов для дополнения первого инвариантного набора (22) данных домена данными, которые связаны с будущими моментами времени.
12. Способ по п.11, причем тренировка конкретной модели (MLT) из моделей (ML1-MLn) машинного обучения включает в себя тренировку (703) нескольких базовых моделей с разными наборами эксплуатационных данных (701) и/или данных об окружающей среде (702) с использованием одного или более алгоритмов машинного обучения для обеспечения особых будущих данных многопараметрических временных рядов базовой модели в качестве тренировочных входных данных для конкретной модели из моделей машинного обучения, тренировку (706) конкретной модели из связанных моделей машинного обучения с особыми будущими данными многопараметрических временных рядов базовой модели для обучения, какая комбинация из базовых моделей является наиболее подходящей для какого состояния доменной печи.
13. Способ по п.12, причем конкретная модель из моделей (ML1-MLn) машинного обучения натренирована для прогнозирования одного из следующих параметров будущего момента времени: аномалии в процессе доменной печи, тепловое состояние доменной печи и главных индикаторов эксплуатационных качеств производства горячего металла, оптимизация матрицы загрузки, явления доменной печи, основанные на основанной на съемочной камере фурмы инспекции процесса, рекомендации устройству открывания летки для оптимальной эксплуатации, основанные на ТМТ SOMA явления и индикаторы эксплуатационных качеств, явления, основанные на метках явлений посредством технологических пра

-