JP2023013058A

JP2023013058A - 機械学習装置、生産計画策定装置、及び、推論装置

Info

Publication number: JP2023013058A
Application number: JP2021116966A
Authority: JP
Inventors: 岳志横山; Takashi Yokoyama
Original assignee: JGC Corp
Current assignee: JGC Corp
Priority date: 2021-07-15
Filing date: 2021-07-15
Publication date: 2023-01-26

Abstract

【課題】生産計画の策定に要する作業負担の軽減を可能とする機械学習装置を提供する。【解決手段】機械学習装置４は、作業者の運転操作下にて所定の反応プロセスを行う反応装置により生産される生成物の生産計画策定装置５で用いられる学習モデル１１を生成する。機械学習装置４は、生成物の品目を入力データとして少なくとも含む学習用データを複数組記憶する学習用データ記憶部４１と、学習モデル１１に学習用データを複数組入力することで、入力データと、品目を生産する際に必要な生産リソースの割当を示す割当データとの相関関係を学習モデル１１に学習させる機械学習部４２と、機械学習部４２により学習させた学習モデル４２を記憶する学習済みモデル記憶部４３とを備える。【選択図】図６

Description

本発明は、機械学習装置、生産計画策定装置、及び、推論装置に関する。

原材料から所定の反応プロセスにより生成物を生産する生産設備として、反応槽を備える反応装置が広く使用されている。反応装置の一例として、特許文献１には、反応槽と、反応槽の外周に設けられた温度調節用のジャケットと、反応槽の内部に配置された攪拌翼と、攪拌翼の動力源となる撹拌動力とを備える反応装置が開示されている。特許文献１に開示されたような反応装置では、例えば、原材料の投入量や投入順序、反応槽の温度調節、撹拌速度、反応時間等が定められた標準的な生産工程表に従って、作業者による手動での運転操作が行われる。

特開２０００－２６４９０９号公報

作業者の運転操作下にて反応プロセスを行う反応装置が複数設置されて、複数の品目の生成物を生産する生産工場では、複数の作業者に対して、例えば、三交代制（日勤、準夜勤、夜勤）の勤務形態で勤務する勤務シフトが編成される。生産工場では、品目が指定された生産オーダに適時に対応するため、反応装置や作業者等の生産リソースを各生産オーダに割り当てた生産計画を策定する必要がある。

しかしながら、生産計画の策定に際しては、生産工場の現場に依存する様々な要素が存在することから、生産工場の管理者が生産リソースの割当を決定するには、それらの要素を詳細に検討しなければならず、生産計画策定作業は、非常な労力を要するものとなっていた。特に、生産リソースとして、反応装置の割当を決定する場合には、生成物の品目と反応装置との組み合わせに関する要素を検討したり、作業者の割当を決定する場合には、生成物の品目と作業者との組み合わせ、作業者の作業スキル、勤務シフトのバランス配分に関する要素を検討したり、生産リソースとして、反応装置及び作業者の割当を同時に決定する場合には、上記の他に、生成物の品目と反応装置と作業者との組み合わせに関する要素を検討したりする必要があるため、生産品質や生産効率を向上させる適切な生産計画を策定することは非常に困難であった。

本発明は、上記の課題に鑑みてなされたものであり、生産計画の策定に要する作業負担の軽減を可能とする機械学習装置、生産計画策定装置、及び、推論装置を提供することを目的とする。

上記目的を達成するために、本発明の一態様に係る機械学習装置は、
作業者の運転操作下にて所定の反応プロセスを行う反応装置により生産される生成物の生産計画策定装置で用いられる学習モデルを生成する機械学習装置であって、
前記生成物の品目を入力データとして少なくとも含む学習用データを複数組記憶する学習用データ記憶部と、
前記学習モデルに前記学習用データを複数組入力することで、前記入力データと、前記品目を生産する際に必要な生産リソースの割当を示す割当データとの相関関係を前記学習
モデルに学習させる機械学習部と、
前記機械学習部により学習させた前記学習モデルを記憶する学習済みモデル記憶部と、備える。

本発明の機械学習装置によれば、生成物の品目に基づいて生産リソースの割当を推論可能な学習モデルを提供することができる。よって、この学習モデルを利用することにより、生産計画の策定に要する作業負担の軽減を図ることができる。

上記以外の課題、構成及び効果は、後述する発明を実施するための形態にて明らかにされる。

生産管理システム１の一例を示す概略全体図である。生産計画の一例を示す工程管理図である。生産管理データベース６０の一例を示すデータ構成図である。反応装置２の一例を示す概略構成図である。コンピュータ９００の一例を示すハードウエア構成図である。機械学習装置４の一例を示すブロック図である。機械学習装置４で使用されるデータの一例と、強化学習の関係を示す概略図である。機械学習装置４で使用されるニューラルネットワークモデルの一例を示す模式図である。機械学習装置４による機械学習方法の一例を示すフローチャートである。生産計画策定装置５の一例を示すブロック図である。生産計画策定装置５による生産計画策定方法の一例を示すフローチャートである。

以下、図面を参照して本発明を実施するための実施形態について説明する。以下では、本発明の目的を達成するための説明に必要な範囲を模式的に示し、本発明の該当部分の説明に必要な範囲を主に説明することとし、説明を省略する箇所については公知技術によるものとする。

図１は、生産管理システム１の一例を示す概略全体図である。生産管理システム１は、生産オーダに対して生産工場１０が有する生産リソースを割り当てることで、作業者３_１,３_２,３_３，…，３_Ｎ（以下、「作業者３」と略す）の運転操作下にて所定の反応プロセスを行う反応装置２_１,２_２,２_３，…，２_Ｍ（以下、「反応装置２」と略す）により生産される生成物の生産計画を策定し、その生産計画に沿って生産管理を行うシステムである。

生産オーダは、生成物の品目が指定されるとともに、その生成物の生産量や納期が指定される。

生産工場１０には、複数の反応装置２が設置されるとともに、複数の作業者３により反応装置２の運転操作がそれぞれ行われる。生産リソースは、原材料から生成物を生産する際に必要な物的リソースや人的リソースである。物的リソースの代表例としては、反応装置２が挙げられる。人的リソースの代表例としては、作業者３が挙げられる。

反応装置２は、原材料に対してバッチ方式又は連続方式の反応プロセスを行うことで生
成物を生産する。反応装置２は、例えば、合成樹脂等を重合プロセスにて生産する化学分野、酒や醤油等を醸造プロセスにて生成する食品分野、薬品やワクチン等を培養反応にて生産する薬品分野にて利用される。なお、反応装置２は、上記の例に限定されず、任意の生成物を生産し、各種の分野で利用されるものでもよい。

本実施形態では、反応装置２は、１又は複数種のモノマー、溶媒、重合開始剤、添加剤等を原材料として、バッチ方式の重合プロセス（反応プロセスの一形態）を行うことで、合成樹脂（例えば、ポリプロピレン、ポリエチレン、ポリ塩化ビニル、メラミン樹脂、エポキシ樹脂、ウレタン樹脂、アクリル樹脂及びシリコン樹脂等）を生産する場合を中心に説明する。

作業者３は、反応装置２の運転操作を行う。具体的には、作業者３は、原材料を反応装置２に投入し、反応プロセスの進行状況を確認しながら、反応装置２の各部を手動で操作する生産工程と、生産工程終了後、反応装置２を洗浄したり、次の生産工程を準備したりする段替え工程とを行う。作業者３は、例えば、三交代制（日勤、準夜勤、夜勤）の勤務形態にて反応装置２を稼働させる。そのため、反応プロセスを含む生産工程が複数の勤務シフトにまたがる場合には、複数の作業者３が交代で１つの反応装置２の運転操作を行う。

生産管理システム１は、その主要な構成として、機械学習装置４と、生産計画策定装置５と、生産管理データベース装置６と、生産シミュレーション装置７とを備える。機械学習装置４、生産計画策定装置５、生産管理データベース装置６、及び、生産シミュレーション装置７は、例えば、汎用又は専用のコンピュータ（後述の図５参照）で構成されるとともに、有線又は無線のネットワーク８に接続されて、各種のデータを相互に送受信可能に構成される。

機械学習装置４は、機械学習の学習フェーズの主体として動作し、生産計画策定装置５にて用いられる学習モデル１１を機械学習により生成する。学習済みの学習モデル１１は、ネットワーク８や記録媒体等を介して生産計画策定装置５に提供される。機械学習装置４は、機械学習の手法として、例えば、強化学習又は教師あり学習を採用する。本実施形態では、強化学習を採用する場合を中心に説明する。

生産計画策定装置５は、機械学習の推論フェーズの主体として動作し、機械学習装置４により生成された学習モデル１１を用いて、反応装置２により生産される生成物の生産計画を策定する。生産計画策定装置５は、生産オーダを受け付けて、その生産オーダに対して生産リソース（本実施形態では、反応装置２及び作業者３）の割当を行うことで、生成物の生産計画を策定する。

生産管理データベース装置６は、生産計画を作成する際に必要な各種のデータを記憶する生産管理データベース６０（後述の図３参照）を備える。

生産シミュレーション装置７は、反応プロセスをモデル化し、反応プロセスのシミュレーションを実行可能に構成される。生産シミュレーション装置７は、例えば、指定された品目の生成物を生産する際の生産リソースとして、反応装置２及び作業者３が割り当てられた場合に、その反応装置２がその作業者３の運転操作下でその品目を生産したときの反応プロセスのシミュレーションを実行し、生成物が生産されたときの生産評価指標を推定する。

図２は、生産計画の一例を示す工程管理図である。工程管理図は、複数の生産オーダに対して策定された生産計画をガントチャート形式で表したものである。図２の例では、横
軸に時間、縦軸に反応装置２をそれぞれ配置し、各品目Ｐ_１～Ｐ_４に対する反応装置２及び作業者３の割当が表されている。作業者３の割当は、矩形内に記載された「３_１～３_６」の文字にて表されている。

図３は、生産管理データベース６０の一例を示すデータ構成図である。生産管理データベース６０は、例えば、生産オーダテーブル６００、生成物テーブル６０１、反応装置テーブル６０２、作業者テーブル６０３、及び、生産管理テーブル６０４から構成される。

生産オーダテーブル６００は、生産オーダＩＤにより特定される生産オーダ毎にレコードを有し、各レコードには、品目ＩＤにより特定される品目、生産量、及び、納期が登録される。

生成物テーブル６０１は、生成物の品目ＩＤにより特定される品目毎にレコードを有し、各レコードには、品目名、原材料、生産工程表（原材料の投入量や投入順序、反応槽の温度調節、撹拌速度、反応時間等）、及び、生産評価指標の目標値が登録される。原材料に、複数の種類の原材料が登録されてもよいし、重合開始剤や添加剤等がさらに登録されてもよい。

反応装置テーブル６０２は、反応装置ＩＤにより特定される反応装置２毎にレコードを有し、各レコードには、反応装置２の設置場所、反応装置２の仕様（大きさ、形状、材質等）、及び、過去に生産実績を有する生成物の品目が登録される。なお、複数の反応装置２は、仕様が同じでもよいし、一部又は全ての仕様が異なるものでもよい。

作業者テーブル６０３は、作業者ＩＤにより特定される作業者３毎にレコードを有し、各レコードには、所定の期間先までの勤務シフト、及び、過去に生産実績を有する生成物の品目が登録される。

生産管理テーブル６０４は、生産管理ＩＤにより特定される生産管理情報毎にレコードを有し、各レコードには、生産オーダＩＤ、反応装置ＩＤ、作業者ＩＤ、予定開始時刻、予定終了時刻、実績開始時刻、実績終了時刻、及び、生産評価指標の実績値が登録される。反応装置ＩＤ、作業者ＩＤ、予定開始時刻、及び、予定終了時刻は、生産計画を表す情報であり、実績開始時刻、実績終了時刻、及び、生産評価指標の実績値は、生産実績を表す情報である。生産管理テーブル６０４の各レコードに登録された生産管理情報に基づいて、図２に示す工程管理図が作成可能である。

生産評価指標は、生成物の生産品質や生産効率を表す任意の指標である。生産評価指標の実績値は、例えば、反応装置２により生産された生成物を、重量計、粘度計、密度計等の測定機器で測定した測定値や複数の測定値に基づき算出される評価値であり、生産評価指標の目標値は、その測定値や評価値に対する目標値として事前に定められる。また、生産評価指標の実績値は、実績開始時刻と実績終了時刻との差から求められる生産実績時間であり、生産評価指標の目標値は、その生産実績時間に対する生産目標時間として事前に定められる。

図４は、反応装置２の一例を示す概略構成図である。反応装置２は、その主要な構成として、反応槽２０と、撹拌機２１と、センサ群２２と、制御機器群２３と、操作表示盤２４とを備える。反応装置２の各部には、商用電源（不図示）からの電力が供給される。

反応槽２０は、略縦長円筒状の反応槽本体２００と、反応槽本体２００の上面部に形成された原材料投入口２０１と、反応槽本体２００の底面部に形成された生成物排出口２０２と、反応槽本体２００の外周に設けられて、熱媒としての冷水及び温水が流通するジャ
ケット２０３と、冷水を循環させる冷水循環流路２０４と、温水を循環させる温水循環流路２０５とを備える。なお、生成物排出口２０２には、生成物の粘度を測定する粘度計や生成物の密度を測定する密度計が設けられていてもよい。

撹拌機２１は、反応槽本体２００の内部に配置されたプロペラ状の撹拌翼２１０と、反応槽本体２００の上方に配置されて、撹拌翼２１０を回転する駆動源としてのモータ２１１と、撹拌翼２１０及びモータ２１１の間を連結するシャフト状の回転軸２１２とを備える。

センサ群２２は、反応槽２０の各部の物理量や状態量を測定する反応槽センサ群２２０と、撹拌機２１の各部の物理量や状態量を測定する撹拌機センサ群２２１と、反応装置２が設置された環境の物理量や状態量を測定する環境センサ群２２２とを備える。

反応槽センサ群２２０は、熱媒温度Ｔ４を測定するジャケット熱媒温度センサ２２０Ａと、冷水温度Ｔ５を測定する冷水温度センサ２２０Ｂと、温水温度Ｔ６を測定する温水温度センサ２２０Ｃと、熱媒流量Ｆ１を測定するジャケット熱媒流量センサ２２０Ｄと、冷水流量Ｆ２を測定する冷水流量センサ２２０Ｅと、温水流量Ｆ３を測定する温水流量センサ２２０Ｆと、反応槽温度Ｔ１、Ｔ２、Ｔ３をそれぞれ測定する３つの反応槽温度センサ２２０Ｇと、反応槽圧力Ｐ１を測定する反応槽圧力センサ２２０Ｈと、反応槽本体２００の内部の原材料の重量を示す反応槽重量Ｗ１を測定する反応槽重量センサ２２０Ｉとを備える。

撹拌機センサ群２２１は、モータ２１１に加わるトルクを示す撹拌機トルクＳＴ１を測定する撹拌機トルクセンサ２２１Ａと、モータ回転数Ｒ１を測定するモータ回転数センサ２２１Ｂと、モータ電流値Ｉ１を測定するモータ電流センサ２２１Ｃと、撹拌機２１が動作したときの振動値Ｏ１を測定する振動センサ２２１Ｄと、撹拌機２１が動作したときの音響値Ｎ１を測定する音響センサ２２１Ｅとを備える。

環境センサ群２２２は、環境温度Ｔ７を測定する環境温度センサ２２２Ａと、環境湿度Ｈ１を測定する環境湿度センサ２２２Ｂとを備える。

制御機器群２３は、冷水温度Ｔ５を制御する冷却機器２３０と、温水温度Ｔ６を制御する加熱機器２３１と、冷水流量Ｆ２を制御する冷水流量調整弁２３２及び冷水ポンプ２３３と、温水流量Ｆ３を制御する温水流量調整弁２３４及び温水ポンプ２３５と、モータ２１１に駆動電力を供給し、モータ２１１の回転状態（オン又はオフ、回転数等）を制御するインバータ２３６とを備える。

操作表示盤２４は、反応装置２の各部に電気的に接続される。操作表示盤２４は、センサ群２２により測定された各測定値を表示するとともに、作業者３の運転操作を受け付けて、その運転操作に応じた各制御指令値を制御機器群２３に出力する。

なお、センサ群２２による各測定値は、操作表示盤２４に代えて、センサ群２２が有するメータや計器類に直接表示されてもよい。また、制御機器群２３に対する運転操作は、操作表示盤２４に代えて、制御機器群２３が有するスイッチやレバー等に対して直接行われてもよい。さらに、操作表示盤２４は、センサ群２２による各測定値と、制御機器群２３に対する運転操作に応じた各制御指令値を運転履歴データとして記録してもよく、反応プロセスが終了したときに粘度計や密度計で生成物の粘度や密度を測定した結果を、生産評価指標の実績値として記録してもよい。

図５は、コンピュータ９００の一例を示すハードウエア構成図である。機械学習装置４
、生産計画策定装置５、生産管理データベース装置６、及び、生産シミュレーション装置７の各々は、汎用又は専用のコンピュータ９００により構成される。

コンピュータ９００は、図５に示すように、その主要な構成要素として、バス９１０、プロセッサ９１２、メモリ９１４、入力デバイス９１６、出力デバイス９１７、表示デバイス９１８、ストレージ装置９２０、通信Ｉ／Ｆ（インターフェース）部９２２、外部機器Ｉ／Ｆ部９２４、Ｉ／Ｏ（入出力）デバイスＩ／Ｆ部９２６、及び、メディア入出力部９２８を備える。なお、上記の構成要素は、コンピュータ９００が使用される用途に応じて適宜省略されてもよい。

プロセッサ９１２は、１つ又は複数の演算処理装置（ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＭＰＵ（Ｍｉｃｒｏ－ｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）、ＤＳＰ（ｄｉｇｉｔａｌｓｉｇｎａｌｐｒｏｃｅｓｓｏｒ）、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）等）で構成され、コンピュータ９００全体を統括する制御部として動作する。メモリ９１４は、各種のデータ及びプログラム９３０を記憶し、例えば、メインメモリとして機能する揮発性メモリ（ＤＲＡＭ、ＳＲＡＭ等）と、不揮発性メモリ（ＲＯＭ）、フラッシュメモリ等とで構成される。

入力デバイス９１６は、例えば、キーボード、マウス、テンキー、電子ペン等で構成され、入力部として機能する。出力デバイス９１７は、例えば、音（音声）出力装置、バイブレーション装置等で構成され、出力部として機能する。表示デバイス９１８は、例えば、液晶ディスプレイ、有機ＥＬディスプレイ、電子ペーパー、プロジェクタ等で構成され、出力部として機能する。入力デバイス９１６及び表示デバイス９１８は、タッチパネルディスプレイのように、一体的に構成されていてもよい。ストレージ装置９２０は、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等で構成され、記憶部として機能する。ストレージ装置９２０は、オペレーティングシステムやプログラム９３０の実行に必要な各種のデータを記憶する。

通信Ｉ／Ｆ部９２２は、インターネットやイントラネット等のネットワーク９４０（図１のネットワーク８と同じであってもよい）に有線又は無線により接続され、所定の通信規格に従って他のコンピュータとの間でデータの送受信を行う通信部として機能する。外部機器Ｉ／Ｆ部９２４は、カメラ、プリンタ、スキャナ、リーダライタ等の外部機器９５０に有線又は無線により接続され、所定の通信規格に従って外部機器９５０との間でデータの送受信を行う通信部として機能する。Ｉ／ＯデバイスＩ／Ｆ部９２６は、各種のセンサ、アクチュエータ等のＩ／Ｏデバイス９６０に接続され、Ｉ／Ｏデバイス９６０との間で、例えば、センサによる検出信号やアクチュエータへの制御信号等の各種の信号やデータの送受信を行う通信部として機能する。メディア入出力部９２８は、例えば、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）ドライブ、ＣＤ（ＣｏｍｐａｃｔＤｉｓｃ）ドライブ等のドライブ装置で構成され、ＤＶＤ、ＣＤ等のメディア（非一時的な記憶媒体）９７０に対してデータの読み書きを行う。

上記構成を有するコンピュータ９００において、プロセッサ９１２は、ストレージ装置９２０に記憶されたプログラム９３０をメモリ９１４に呼び出して実行し、バス９１０を介してコンピュータ９００の各部を制御する。なお、プログラム９３０は、ストレージ装置９２０に代えて、メモリ９１４に記憶されていてもよい。プログラム９３０は、インストール可能なファイル形式又は実行可能なファイル形式でメディア９７０に記録され、メディア入出力部９２８を介してコンピュータ９００に提供されてもよい。プログラム９３０は、通信Ｉ／Ｆ部９２２を介してネットワーク９４０経由でダウンロードすることによりコンピュータ９００に提供されてもよい。また、コンピュータ９００は、プロセッサ９１２がプログラム９３０を実行することで実現する各種の機能を、例えば、ＦＰＧＡ（ｆ
ｉｅｌｄ－ｐｒｏｇｒａｍｍａｂｌｅｇａｔｅａｒｒａｙ）、ＡＳＩＣ（ａｐｐｌｉｃａｔｉｏｎｓｐｅｃｉｆｉｃｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ）等のハードウエアで実現するものでもよい。

コンピュータ９００は、例えば、据置型コンピュータや携帯型コンピュータで構成され、任意の形態の電子機器である。コンピュータ９００は、クライアント型コンピュータでもよいし、サーバ型コンピュータやクラウド型コンピュータでもよい。コンピュータ９００は、機械学習装置４、生産計画策定装置５、生産管理データベース装置６、及び、生産シミュレーション装置７以外の他の装置に適用されてもよい。

（機械学習装置４）
図６は、機械学習装置４の一例を示すブロック図である。機械学習装置４は、学習用データ取得部４０と、学習用データ記憶部４１と、機械学習部４２と、学習済みモデル記憶部４３とを備える。機械学習装置４は、例えば、図５に示すコンピュータ９００で構成される。その場合、学習用データ取得部４０は、入力デバイス９１６、通信Ｉ／Ｆ部９２２又はＩ／ＯデバイスＩ／Ｆ部９２６で構成され、機械学習部４２は、プロセッサ９１２で構成され、学習用データ記憶部４１及び学習済みモデル記憶部４３は、ストレージ装置９２０で構成される。

学習用データ取得部４０は、各種の外部装置とネットワーク８を介して接続され、生成物の品目を入力データとして少なくとも含む学習用データを取得するインタフェースユニットである。外部装置は、生産管理データベース装置６、及び、生産シミュレーション装置７等である。なお、外部装置は、これらの一部でもよいし、他の装置がさらに接続されてもよい。

学習用データ記憶部４１は、学習用データ取得部４０で取得した学習用データを複数組記憶するデータベースである。なお、学習用データ記憶部４１を構成するデータベースの具体的な構成は適宜設計すればよい。

機械学習部４２は、学習用データ記憶部４１に記憶された学習用データを用いて機械学習を実施する。すなわち、機械学習部４２は、学習モデル１１に学習用データを複数組入力することで、学習用データに含まれる入力データと、その入力データに含まれる生成物の品目を生産する際に必要な生産リソースの割当を示す割当データとの相関関係を学習モデル１１に学習させることで、学習済みの学習モデル１１を生成する。本実施形態では、機械学習部４２による機械学習を実現する学習モデル１１として、ニューラルネットワークを採用する場合について説明する。

学習済みモデル記憶部４３は、機械学習部４２により生成された学習済みの学習モデル１１を記憶するデータベースである。学習済みモデル記憶部４３に記憶された学習済みの学習モデル１１は、ネットワーク８や記録媒体等を介して実システム（例えば、生産計画策定装置５）に提供される。なお、図６では、学習用データ記憶部４１と、学習済みモデル記憶部４３とが別々の記憶部として示されているが、これらは単一の記憶部で構成されてもよい。

図７は、機械学習装置４で使用されるデータの一例と、強化学習の関係を示す概略図である。機械学習部４２は、強化学習のエージェントとして機能する。強化学習の基本的な仕組みにおいて、エージェントは、所定の条件下において環境の状態を観測し、その観測された状態に対して所定の方策に従って行動を選択する。そして、その選択した行動により環境の状態が変化したとき、その状態の変化に応じた報酬を受け取り、その選択した行動の価値を評価する。このような一連の処理として、状態の観測、行動の選択、価値の評
価を繰り返すことで、報酬を最も多く獲得できるように行動を選択するための方策を学習モデル１１に学習させる。

機械学習部４２による強化学習を、上記の強化学習の基本的な仕組みに対応させた場合、環境は、Ｍ台（Ｍは２以上の整数）の反応装置２がＮ人（Ｎは２以上の整数）の作業者３による運転操作が行われることで、生産オーダを満たすように、生成物を生産する生産工場１０が対応する。

状態ｓは、生産工場１０にて受け付けられた生産オーダと、生産リソースの稼働状態とで表される。生産オーダは、少なくとも生成物の品目が指定されたものであり、生産オーダにて指定された生成物の品目は、「生産オーダ品目」という。また、生産リソースの稼働状態は、複数の反応装置２が運転中であるか否かをそれぞれ示す運転状態と、複数の作業者３が運転操作中であるか否かをそれぞれ示す操作状態とで表される。

行動ａは、生産オーダ品目を生産する際に必要な生産リソースを割り当てるときの選択肢の候補であり、例えば、複数の反応装置２のうち生産オーダ品目を生産する際に運転される反応装置２の割当と、複数の作業者３のうち生産オーダ品目を生産する際に運転操作を行う作業者３の割当との少なくとも一方を含む。生産オーダ品目を生産する際の反応プロセスが、複数の勤務シフトにまたがる場合には、作業者３の割当としては、各勤務シフトで運転操作を行う各作業者３をそれぞれ割り当てることになる。

本実施形態に係る行動ａは、図７に示すように、反応装置２と、作業者３との各組み合わせで表される。生産オーダ品目を生産する際の反応プロセスが、複数の勤務シフトにまたがる場合には、行動ａは、反応装置２と、各勤務シフトで運転操作を行う各作業者３との組み合わせで表される。本実施形態では、説明の簡略化のため、反応プロセスは、単一の勤務シフト内に反応プロセスが終了する場合について説明する。

報酬ｒは、生産オーダ品目に対する生産評価指標の目標値と、生産オーダ品目が行動ａにて割り当てられる生産リソースを用いて生産されたときの生産評価指標の実績値との差に基づいて算出される。生産評価指標の実績値は、例えば、生産管理データベース６０に登録された過去の生産管理情報に基づいて取得されてもよいし、生産シミュレーション装置７により反応プロセスのシミュレーションが実行されることで推定されてもよい。

報酬ｒは、生産評価指標の目標値と、生産評価指標の実績値との差が小さいほど大きくなるように算出される。なお、行動ａにて割り当てられる反応装置２が運転中である場合には、報酬ｒが小さくなるように補正されるとともに、行動ａにて割り当てられる作業者３が運転操作中である場合には、報酬ｒが小さくなるように補正されるようにしてもよい。また、報酬ｒは、生産評価指標以外の観点がさらに考慮されてもよく、例えば、過去に生産実績を有する反応装置２や作業者３が割り当てられた場合には、報酬ｒが大きくなるように補正されてもよい。

機械学習として、強化学習を採用する場合、学習用データは、状態ｓに対応する入力データのみを含む。すなわち、学習用データは、出力データを含まない構成とされる。本実施形態に係る学習用データを構成する入力データは、図７に示すように、生産オーダ品目と、複数の反応装置２が運転中であるか否かをそれぞれ示す運転状態と、複数の作業者３が運転操作中であるか否かをそれぞれ示す操作状態とを含む。

図８は、機械学習装置４で使用されるニューラルネットワークモデルの一例を示す模式図である。図８では、状態ｓに対して所定の行動ａを取ったときの評価は、Ｑ学習法の行動価値関数Ｑ（ｓ，ａ）を用いて行われる。

行動価値関数Ｑ（ｓ，ａ）は、例えば、ＤＱＮ（ＤｅｅｐＱ－Ｎｅｔｗｏｒｋ）と呼ばれる手法により、状態ｓを入力変数とし、状態ｓにおいて各行動ａ_ｍｎ（ｍ＝１，２，…，Ｍ、及び、ｎ＝１，２，…，Ｎ）をそれぞれ取ったときの行動価値関数Ｑ（ｓ，ａ_ｍｎ）を出力変数とするニューラルネットワークモデルで近似的に算出することができる。この場合、機械学習部４２は、例えば、報酬ｒ、学習率α、割引率γを変数として含む誤差関数（例えば、ＴＤ誤差）が最小になるように、ニューラルネットワークモデルの重みｗｋを調整することで行動価値関数Ｑ（ｓ，ａ_ｍｎ）を更新し、入力データ（状態ｓ）と、生産リソースの割当を示す割当データ（行動ａ_ｍｎ）との相関関係を学習モデル１１に学習させる。なお、強化学習の手法としては、任意の手法を採用すればよく、Ｑ学習法の他に、例えば、ＳＡＲＳＡ法、モンテカルロ法等を採用してもよい。

学習モデル１１は、行動価値関数Ｑ（ｓ，ａ_ｍｎ）を近似的に算出するために、図８に示すニューラルネットワークモデルとして構成される。図８に示すニューラルネットワークモデルは、入力層にあるｉ個のニューロン（ｘ１～ｘｉ）、第１中間層にあるｐ個のニューロン（ｙ１１～ｙ１ｐ）、第２中間層にあるｑ個のニューロン（ｙ２１～ｙ２ｑ）、及び、出力層にあるｊ個（＝Ｍ×Ｎ）のニューロン（ｚ１～ｚＭＮ）から構成される。

入力層の各ニューロンには、学習用データに含まれる入力データ（状態ｓ）としての生産オーダ品目が対応付けられる。また、入力層の各ニューロンには、Ｍ台の反応装置２の運転状態、及び、Ｎ人の作業者３の操作状態のそれぞれが対応付けられる。

出力層の各ニューロンには、状態ｓに対して各行動ａ_ｍｎ（ｍ＝１，２，…，Ｍ、及び、ｎ＝１，２，…，Ｎ）を取ったときの行動価値関数Ｑ（ｓ，ａ_ｍｎ）のそれぞれが対応付けられて、出力層の各ニューロンは、各行動ａ_ｍｎの行動価値関数Ｑ（ｓ，ａ_ｍｎ）の値をそれぞれ出力する。

第１中間層及び第２中間層は、隠れ層とも呼ばれており、ニューラルネットワークとしては、第１中間層及び第２中間層の他に、さらに複数の隠れ層を有するものでもよいし、第１中間層のみを隠れ層とするものでもよい。また、入力層と第１中間層との間、第１中間層と第２中間層との間、第２中間層と出力層との間には、各層のニューロンの間を接続するシナプスが張られており、それぞれのシナプスには、重みｗｋ（ｋは自然数）が対応付けられる。

（機械学習方法）
図９は、機械学習装置４による機械学習方法の一例を示すフローチャートである。

まず、ステップＳ１００において、学習用データ取得部４０は、機械学習を開始するための事前準備として、所望の数の学習用データを準備し、その準備した学習用データを学習用データ記憶部４１に記憶する。学習用データを準備する方法には、いくつかの方法を採用することができる。例えば、学習用データ取得部４０は、生産管理データベース６０の生産管理テーブル６０４に登録された過去の生産管理情報に基づいて、学習用データの入力データ（状態ｓ）を取得してもよいし、将来の生産オーダを予測し、仮想の生産管理情報に基づいて、学習用データの入力データ（状態ｓ）を取得してもよい。

次に、ステップＳ１１０において、機械学習部４２は、機械学習を開始すべく、学習前の学習モデル１１を準備する。ここで準備する学習前の学習モデル１１は、図８に例示したニューラルネットワークモデルで構成されており、各シナプスの重みｗｋが初期値に設定されている。

次に、ステップＳ１２０において、機械学習部４２は、学習用データ記憶部４１に記憶された複数組の学習用データから、例えば、ランダムに一の学習用データを取得する。

次に、ステップＳ１２１において、機械学習部４２は、ステップＳ１２０で取得した一の学習用データに含まれる入力データにおける生産オーダ品目に対する生産評価指標の目標値を取得する。生産評価指標の目標値は、例えば、生産管理データベース６０の生成物テーブル６０１を参照することで取得される。

次に、ステップＳ１３０において、機械学習部４２は、ステップＳ１２０で取得した一の学習用データに含まれる入力データ（状態ｓ１）を、準備された学習前（又は学習中）の学習モデル１１の入力層に入力する。その結果、学習モデル１１の出力層から推論結果として、各行動ａ_ｍｎの価値（行動価値関数Ｑ（ｓ，ａ_ｍｎ）の値）が出力される。

次に、ステップＳ１４０において、機械学習部４２は、ステップＳ１３０において出力層から推論結果として出力された各行動ａ_ｍｎの行動価値関数Ｑ（ｓ，ａ_ｍｎ）の値に基づいて、例えば、最大値に対応する特定の一の行動ａを選択する。特定の一の行動ａを選択する手法としては、例えば、ｇｒｅｅｄｙ法、ε－ｇｒｅｅｄｙ法等を採用すればよい。

次に、ステップＳ１５０において、機械学習部４２は、状態ｓ１に対してステップＳ１４０で選択した行動ａを取った場合の生産評価指標の実績値を取得する。すなわち、機械学習部４２は、入力データ（状態ｓ１）としての生産オーダ品目が、ステップＳ１４０で選択した行動ａに対応する生産リソースとしての反応装置２及び作業者３により生産されたときの生産評価指標の実績値を取得する。

次に、ステップＳ１６０において、機械学習部４２は、ステップＳ１２１で取得した生産評価指標の目標値と、ステップＳ１５０で取得した生産評価指標の実績値との差に基づいて報酬ｒを算出する。

次に、ステップＳ１７０において、機械学習部４２は、ステップＳ１６０で算出した報酬ｒに基づいて、誤差関数が最小になるように、ニューラルネットワークモデルの重みｗｋを調整することで行動価値関数Ｑ（ｓ，ａ_ｍｎ）を更新する。これより、機械学習部４２は、入力データ（状態ｓ）と、割当データ（行動ａ_ｍｎ）との相関関係を学習モデル１１に学習させる。なお、行動価値関数Ｑ（ｓ，ａ_ｍｎ）の更新は、毎回行わなくてもよく、例えば、所定の条件を満たす場合にだけ行うようにしてもよい。

次に、ステップＳ１８０において、機械学習部４２は、機械学習を継続する必要があるか否かを判定する。その結果、継続すると判定した場合（ステップＳ１８０でＮｏ）、ステップＳ１２０に戻り、学習中の学習モデル１１に対してステップＳ１２０～Ｓ１７０の工程を実施し、機械学習を終了すると判定した場合（ステップＳ１８０でＹｅｓ）、ステップＳ１９０に進む。

そして、ステップＳ１９０において、機械学習部４２は、各シナプスに対応付けられた重みｗｋが調整されることで生成された学習済みの学習モデル１１を学習済みモデル記憶部４３に記憶し、図９に示す一連の機械学習方法を終了する。学習済みの学習モデル１１としては、例えば、ニューラルネットワークの構造を表すパラメータや調整済みの重みｗｋの値が記憶される。機械学習方法において、ステップＳ１００が学習用データ記憶工程、ステップＳ１１０～Ｓ１８０が機械学習工程、ステップＳ１９０が学習済みモデル記憶工程に相当する。

以上のように、本実施形態に係る機械学習装置４及び機械学習方法によれば、生産オーダ品目に対する生産リソースを割り当てることで、作業者３の運転操作下にて所定の反応プロセスを行う反応装置２により生産される生成物の生産計画を策定することを可能とする学習モデル１１を提供することができる。よって、この学習モデル１１を利用することにより、生産計画の策定に要する作業負担の軽減を図ることができる。

（生産計画策定装置５）
図１０は、生産計画策定装置５の一例を示すブロック図である。生産計画策定装置５は、入力データ取得部５０と、推論部５１と、学習済みモデル記憶部５２と、出力処理部５３とを備える。生産計画策定装置５は、例えば、図５に示すコンピュータ９００で構成される。その場合、入力データ取得部５０は、入力デバイス９１６、通信Ｉ／Ｆ部９２２又はＩ／ＯデバイスＩ／Ｆ部９２６で構成され、推論部５１及び出力処理部５３は、プロセッサ９１２で構成され、学習済みモデル記憶部５２は、ストレージ装置９２０で構成される。

入力データ取得部５０は、例えば、生産工場１０の管理者が使用する管理者端末装置（不図示）とネットワーク８を介して接続され、生産物の品目を少なくとも含む入力データを取得するインタフェースユニットである。入力データ取得部５０は、生産計画を策定する対象となる生産オーダを管理者端末装置から受信し、その生産オーダにて指定された生成物の品目と、その時点における生産リソースの稼働状態とに基づいて、入力データを取得する。本実施形態に係る入力データは、生産オーダにて指定された生成物の品目と、複数の反応装置２の運転状態と、複数の作業者３の操作状態とで構成される。

推論部５１は、入力データ取得部５０により取得された入力データを学習モデル１１に入力し、その入力データに含まれる生成物の品目を生産する際に必要な生産リソースの割当を推論する推論処理を行う。推論処理には、機械学習装置４及び機械学習方法にて機械学習が実施された学習済みの学習モデル１１が用いられる。

推論部５１は、学習モデル１１を用いた推論処理を行う機能のみならず、推論処理の前処理として、入力データ取得部５０により取得された入力データを所望の形式等に調整して学習モデル１１に入力する前処理機能や、推論処理の後処理として、学習モデル１１から出力された割当データに所定の論理式や計算式を適用することで所望の形式等に調整する後処理機能をも含んでいる。なお、推論部５１の推論結果は、学習済みモデル記憶部５２や他の記憶装置（不図示）に記憶することが好ましく、過去の推論結果は、例えば、学習モデル１１の推論精度の更なる向上のため、オンライン学習や再学習に用いられる学習用データとして利用することが可能である。

学習済みモデル記憶部５２は、推論部５１の推論処理にて用いられる学習済みの学習モデル１１を記憶するデータベースである。なお、学習済みモデル記憶部５２には、複数の学習モデル１１が格納されて、推論部５１により選択的に用いられてもよい。複数の学習モデル１１は、例えば、入力データ及び出力データの数や種類等が異なる毎に生成されたものを用意すればよい。

出力処理部５３は、推論部５１の推論結果、すなわち、割当データを出力する出力処理を行う。具体的な出力手段は、種々の手段を採用することが可能である。例えば、出力処理部５３は、割当データを生産管理データベース装置６に送信することで生産管理データベース６０の生産管理テーブル６０４に登録されてもよいし、管理者端末装置に送信することで管理者端末装置に表示されてもよい。その際、割当データが示す生産リソースの割当は、最終的な生産計画として生産工場１０の管理者により採用されてもよいし、仮の生産計画として生産工場１０の管理者により一部修正されてもよい。

（生産計画策定方法）
図１１は、生産計画策定装置５による生産計画策定方法の一例を示すフローチャートである。

まず、ステップＳ２００において、入力データ取得部５０は、生産物の品目が指定された生産オーダを受け付けることで入力データ（状態ｓ）を取得する。

次に、ステップＳ２１０において、推論部５１は、入力データ（状態ｓ）に前処理（省略してもよい）を施して学習モデル１１の入力層に入力することで推論を実施し、その学習モデル１１の出力層から出力された出力データ（各行動ａ_ｍｎの行動価値関数Ｑ（ｓ，ａ_ｍｎ）の値）を取得する。

次に、ステップＳ２１１において、推論部５１は、強化学習の後処理の一例として、出力データとして出力層の各ニューロンから出力された各行動ａ_ｍｎの行動価値関数Ｑ（ｓ，ａ_ｍｎ）の値に基づいて、その中で最大値を与える行動ａを選択する。

次に、ステップＳ２２０において、出力処理部５３は、ステップＳ２１１で選択した行動ａに対応する割当データを出力し、図１１に示す一連の生産計画策定方法を終了する。生産計画策定方法において、ステップＳ２００が入力データ取得工程、ステップＳ２１０、Ｓ２１１が推論工程、ステップＳ２２０が出力処理工程に相当する。

以上のように、本実施形態に係る生産計画策定装置５及び生産計画策定方法によれば、学習モデル１１を利用することにより、生産オーダ品目に対して生産リソースを割り当てることで、作業者３の運転操作下にて所定の反応プロセスを行う反応装置２により生産される生成物の生産計画を策定することができる。よって、生産計画の策定に要する作業負担の軽減を図ることができる。

（他の実施形態）
本発明は上述した実施形態に制約されるものではなく、本発明の主旨を逸脱しない範囲内で種々変更して実施することが可能である。そして、それらはすべて、本発明の技術思想に含まれるものである。

上記実施形態では、機械学習装置４及び生産計画策定装置５は、別々の装置で構成されるものとして説明したが、単一の装置で構成されていてもよい。その場合、その単一の装置は、オンライン学習による機械学習を適宜行いながら、生産計画の策定を行うようにしてもよい。また、機械学習装置４又は生産計画策定装置５は、生産管理データベース装置６及び生産シミュレーション装置７の少なくとも一方の装置として機能するものでもよい。

上記実施形態では、機械学習装置４は、機械学習の手法として、強化学習を採用した場合について説明したが、教師あり学習を採用してもよい。その場合には、機械学習部４２は、入力データと割付データとを含む学習用データを学習モデル１１に複数組入力することで、入力データと割当データとの相関関係を学習モデル１１に学習させればよい。

上記実施形態では、機械学習部４２による機械学習を実現する学習モデル１１として、ニューラルネットワークを採用した場合について説明したが、他の機械学習のモデルを採用してもよい。他の機械学習のモデルとしては、例えば、決定木、回帰木等のツリー型、バギング、ブースティング等のアンサンブル学習、再帰型ニューラルネットワーク、畳み込みニューラルネットワーク、ＬＳＴＭ等のニューラルネット型(ディープラーニングを
含む)、階層型クラスタリング、非階層型クラスタリング、ｋ近傍法、ｋ平均法等のクラ
スタリング型、主成分分析、因子分析、ロジスティク回帰等の多変量解析、サポートベクターマシン等が挙げられる。

上記実施形態では、入力データは、生産オーダ品目と、複数の反応装置２の運転状態と、複数の作業者３の操作状態とを含む場合について説明したが、生産オーダ品目を少なくとも含むものであればよい。従って、入力データは、例えば、複数の反応装置２の運転状態と、複数の作業者３の操作状態との少なくとも一方を含まない構成としてもよいし、これら以外のデータを含むものでもよい。入力データが、例えば、生産オーダ品目のみを含む場合には、機械学習部４２は、例えば、強化学習の行動ａから運転中の反応装置２や運転操作中の作業者３を除外してもよいし、運転中の反応装置２や運転操作中の作業者３が選択されたときの強化学習の報酬ｒが小さくなるように補正してもよい。また、運転中の反応装置２や運転操作中の作業者３が異なる様々な生産状況に応じた入力データを用意することで、機械学習部４２は、複数の学習モデル１１を生産状況毎に生成してもよい。

（機械学習プログラム及び生産計画策定プログラム）
本発明は、図５に示すコンピュータ９００に、上記実施形態に係る機械学習方法が備える各工程を実行させるためのプログラム（機械学習プログラム）９３０の態様で提供することもできる。また、本発明は、図５に示すコンピュータ９００に、上記実施形態に係る生産計画策定方法が備える各工程を実行させるためのプログラム（反応槽運転支援プログラム）９３０の態様で提供することもできる。

（推論装置、推論方法及び推論プログラム）
本発明は、上記実施形態に係る生産計画策定装置５（生産計画策定方法又は生産計画策定プログラム）の態様によるもののみならず、生成物の生産計画を策定するために用いられる推論装置（推論方法又は推論プログラム）の態様で提供することもできる。その場合、推論装置（推論方法又は推論プログラム）としては、メモリと、プロセッサとを含み、このうちのプロセッサが、一連の処理を実行するものとすることができる。当該一連の処理とは、生成物の品目を少なくとも含む入力データを取得する入力データ取得処理（入力データ取得工程）と、その品目を生産する際に必要な生産リソースの割当を推論する推論処理（推論工程）とを含む。

推論装置（推論方法又は推論プログラム）の態様で提供することで、生産計画策定装置５を実装する場合に比して簡単に種々の装置への適用が可能となる。推論装置（推論方法又は推論プログラム）が生産リソースの割当を推論する際、上記実施形態に係る機械学習装置４及び機械学習方法により生成された学習済みの学習モデル１１を用いて、生産計画策定装置５の推論部５１が実施する推論手法を適用してもよいことは、当業者にとって当然に理解され得るものである。

１…生産管理システム、２…反応装置、３…作業者、４…機械学習装置、
５…生産計画策定装置、６…生産管理データベース装置、
７…生産シミュレーション装置、８…ネットワーク、
１０…生産工場、１１…学習モデル、
２０…反応槽、２１…撹拌機、２２…センサ群、２３…制御機器群、２４…操作表示盤、４０…学習用データ取得部、４１…学習用データ記憶部、４２…機械学習部、
４３…学習済みモデル記憶部、５０…入力データ取得部、５１…推論部、
５２…学習済みモデル記憶部、５３…出力処理部、６０…生産管理データベース、
２００…反応槽本体、２０１…原材料投入口、２０２…生成物排出口、
２０３…ジャケット、２０４…冷水循環流路、２０５…温水循環流路
２１０…撹拌翼、２１１…モータ、２１２…回転軸、
２２０…反応槽センサ群、２２０Ａ…ジャケット熱媒温度センサ、
２２０Ｂ…冷水温度センサ、２２０Ｃ…温水温度センサ、
２２０Ｄ…ジャケット熱媒流量センサ、２２０Ｅ…冷水流量センサ、
２２０Ｆ…温水流量センサ、２２０Ｇ…反応槽温度センサ、
２２０Ｈ…反応槽圧力センサ、２２０Ｉ…反応槽重量センサ
２２１…撹拌機センサ群、２２１Ａ…撹拌機トルクセンサ、
２２１Ｂ…モータ回転数センサ、２２１Ｃ…モータ電流センサ、
２２１Ｄ…振動センサ、２２１Ｅ…音響センサ、
２２２…環境センサ群、２２２Ａ…環境温度センサ、２２２Ｂ…環境湿度センサ
２３０…冷却機器、２３１…加熱機器、２３２…冷水流量調整弁、２３３…冷水ポンプ、２３４…温水流量調整弁、２３５…温水ポンプ、２３６…インバータ、
６００…生産オーダテーブル、６０１…生成物テーブル、６０２…反応装置テーブル、
６０３…作業者テーブル、６０４…生産管理テーブル、９００…コンピュータ

Claims

作業者の運転操作下にて所定の反応プロセスを行う反応装置により生産される生成物の生産計画策定装置で用いられる学習モデルを生成する機械学習装置であって、
前記生成物の品目を入力データとして少なくとも含む学習用データを複数組記憶する学習用データ記憶部と、
前記学習モデルに前記学習用データを複数組入力することで、前記入力データと、前記品目を生産する際に必要な生産リソースの割当を示す割当データとの相関関係を前記学習モデルに学習させる機械学習部と、
前記機械学習部により学習させた前記学習モデルを記憶する学習済みモデル記憶部と、を備える、
機械学習装置。
前記割当データは、
複数の前記反応装置のうち前記品目を生産する際に運転される前記反応装置の割当、及び、
複数の前記作業者のうち前記品目を生産する際に前記運転操作を行う前記作業者の割当の少なくとも一方を含む、
請求項１に記載の機械学習装置。
前記入力データは、
複数の前記反応装置が運転中であるか否かをそれぞれ示す運転状態、及び、
複数の前記作業者が運転操作中であるか否かをそれぞれ示す操作状態の少なくとも一方をさらに含む、
請求項１又は請求項２に記載の機械学習装置。
前記機械学習部は、
前記相関関係を強化学習により前記学習モデルに学習させる、
請求項１乃至請求項３のいずれか一項に記載の機械学習装置。
前記機械学習部は、
前記入力データに基づく前記品目に対する生産評価指標の目標値と、前記入力データに基づく前記品目が、前記割当データが示す前記生産リソースを用いて生産されたときの前記生産評価指標の実績値との差に基づいて、報酬を算出し、
前記報酬に基づいて、前記相関関係を前記学習モデルに学習させる、
請求項４に記載の機械学習装置。
請求項１乃至請求項５のいずれか一項に記載の機械学習装置により生成された学習モデルを用いて、作業者の運転操作下にて所定の反応プロセスを行う反応装置により生産される生成物の生産計画を策定する生産計画策定装置であって、
前記生成物の品目を少なくとも含む入力データを取得する入力データ取得部と、
前記入力データ取得部により取得された前記入力データを前記学習モデルに入力し、前記品目を生産する際に必要な生産リソースの割当を推論する推論部と、を備える、
生産計画策定装置。
作業者の運転操作下にて所定の反応プロセスを行う反応装置により生産される生成物の生産計画を策定するために用いられる推論装置であって、
前記推論装置は、メモリと、プロセッサとを備え、
前記プロセッサは、
前記生成物の品目を少なくとも含む入力データを取得する入力データ取得処理と、
前記入力データ取得処理にて前記入力データを取得すると、前記品目を生産する際に必要な生産リソースの割当を推論する推論処理と、を実行する、
推論装置。