JP2023013058A - 機械学習装置、生産計画策定装置、及び、推論装置 - Google Patents
機械学習装置、生産計画策定装置、及び、推論装置 Download PDFInfo
- Publication number
- JP2023013058A JP2023013058A JP2021116966A JP2021116966A JP2023013058A JP 2023013058 A JP2023013058 A JP 2023013058A JP 2021116966 A JP2021116966 A JP 2021116966A JP 2021116966 A JP2021116966 A JP 2021116966A JP 2023013058 A JP2023013058 A JP 2023013058A
- Authority
- JP
- Japan
- Prior art keywords
- production
- learning
- machine learning
- input data
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 234
- 238000010801 machine learning Methods 0.000 title claims abstract description 99
- 238000009472 formulation Methods 0.000 title abstract description 5
- 239000000203 mixture Substances 0.000 title abstract description 5
- 238000006243 chemical reaction Methods 0.000 claims abstract description 70
- 238000003860 storage Methods 0.000 claims abstract description 30
- 238000013500 data storage Methods 0.000 claims abstract description 12
- 238000000034 method Methods 0.000 claims description 39
- 238000013439 planning Methods 0.000 claims description 32
- 238000011156 evaluation Methods 0.000 claims description 27
- 230000002787 reinforcement Effects 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 12
- 230000009471 action Effects 0.000 description 33
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 31
- 230000006870 function Effects 0.000 description 25
- 238000012545 processing Methods 0.000 description 18
- 238000007726 management method Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 15
- 239000002994 raw material Substances 0.000 description 13
- 238000004088 simulation Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 210000002569 neuron Anatomy 0.000 description 10
- 230000007613 environmental effect Effects 0.000 description 9
- 238000003756 stirring Methods 0.000 description 9
- 238000003062 neural network model Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000005259 measurement Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000010438 heat treatment Methods 0.000 description 4
- 238000004886 process control Methods 0.000 description 4
- 210000000225 synapse Anatomy 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 3
- 239000000654 additive Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000003505 polymerization initiator Substances 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- -1 polypropylene Polymers 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000035484 reaction time Effects 0.000 description 2
- 229920003002 synthetic resin Polymers 0.000 description 2
- 239000000057 synthetic resin Substances 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- 229920000178 Acrylic resin Polymers 0.000 description 1
- 239000004925 Acrylic resin Substances 0.000 description 1
- 239000004640 Melamine resin Substances 0.000 description 1
- 229920000877 Melamine resin Polymers 0.000 description 1
- 238000000342 Monte Carlo simulation Methods 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 238000013124 brewing process Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003822 epoxy resin Substances 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229920000647 polyepoxide Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920000915 polyvinyl chloride Polymers 0.000 description 1
- 239000004800 polyvinyl chloride Substances 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 229920002050 silicone resin Polymers 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 235000013555 soy sauce Nutrition 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 229920002803 thermoplastic polyurethane Polymers 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- General Factory Administration (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】生産計画の策定に要する作業負担の軽減を可能とする機械学習装置を提供する。【解決手段】機械学習装置4は、作業者の運転操作下にて所定の反応プロセスを行う反応装置により生産される生成物の生産計画策定装置5で用いられる学習モデル11を生成する。機械学習装置4は、生成物の品目を入力データとして少なくとも含む学習用データを複数組記憶する学習用データ記憶部41と、学習モデル11に学習用データを複数組入力することで、入力データと、品目を生産する際に必要な生産リソースの割当を示す割当データとの相関関係を学習モデル11に学習させる機械学習部42と、機械学習部42により学習させた学習モデル42を記憶する学習済みモデル記憶部43とを備える。【選択図】 図6
Description
本発明は、機械学習装置、生産計画策定装置、及び、推論装置に関する。
原材料から所定の反応プロセスにより生成物を生産する生産設備として、反応槽を備える反応装置が広く使用されている。反応装置の一例として、特許文献1には、反応槽と、反応槽の外周に設けられた温度調節用のジャケットと、反応槽の内部に配置された攪拌翼と、攪拌翼の動力源となる撹拌動力とを備える反応装置が開示されている。特許文献1に開示されたような反応装置では、例えば、原材料の投入量や投入順序、反応槽の温度調節、撹拌速度、反応時間等が定められた標準的な生産工程表に従って、作業者による手動での運転操作が行われる。
作業者の運転操作下にて反応プロセスを行う反応装置が複数設置されて、複数の品目の生成物を生産する生産工場では、複数の作業者に対して、例えば、三交代制(日勤、準夜勤、夜勤)の勤務形態で勤務する勤務シフトが編成される。生産工場では、品目が指定された生産オーダに適時に対応するため、反応装置や作業者等の生産リソースを各生産オーダに割り当てた生産計画を策定する必要がある。
しかしながら、生産計画の策定に際しては、生産工場の現場に依存する様々な要素が存在することから、生産工場の管理者が生産リソースの割当を決定するには、それらの要素を詳細に検討しなければならず、生産計画策定作業は、非常な労力を要するものとなっていた。特に、生産リソースとして、反応装置の割当を決定する場合には、生成物の品目と反応装置との組み合わせに関する要素を検討したり、作業者の割当を決定する場合には、生成物の品目と作業者との組み合わせ、作業者の作業スキル、勤務シフトのバランス配分に関する要素を検討したり、生産リソースとして、反応装置及び作業者の割当を同時に決定する場合には、上記の他に、生成物の品目と反応装置と作業者との組み合わせに関する要素を検討したりする必要があるため、生産品質や生産効率を向上させる適切な生産計画を策定することは非常に困難であった。
本発明は、上記の課題に鑑みてなされたものであり、生産計画の策定に要する作業負担の軽減を可能とする機械学習装置、生産計画策定装置、及び、推論装置を提供することを目的とする。
上記目的を達成するために、本発明の一態様に係る機械学習装置は、
作業者の運転操作下にて所定の反応プロセスを行う反応装置により生産される生成物の生産計画策定装置で用いられる学習モデルを生成する機械学習装置であって、
前記生成物の品目を入力データとして少なくとも含む学習用データを複数組記憶する学習用データ記憶部と、
前記学習モデルに前記学習用データを複数組入力することで、前記入力データと、前記品目を生産する際に必要な生産リソースの割当を示す割当データとの相関関係を前記学習
モデルに学習させる機械学習部と、
前記機械学習部により学習させた前記学習モデルを記憶する学習済みモデル記憶部と、備える。
作業者の運転操作下にて所定の反応プロセスを行う反応装置により生産される生成物の生産計画策定装置で用いられる学習モデルを生成する機械学習装置であって、
前記生成物の品目を入力データとして少なくとも含む学習用データを複数組記憶する学習用データ記憶部と、
前記学習モデルに前記学習用データを複数組入力することで、前記入力データと、前記品目を生産する際に必要な生産リソースの割当を示す割当データとの相関関係を前記学習
モデルに学習させる機械学習部と、
前記機械学習部により学習させた前記学習モデルを記憶する学習済みモデル記憶部と、備える。
本発明の機械学習装置によれば、生成物の品目に基づいて生産リソースの割当を推論可能な学習モデルを提供することができる。よって、この学習モデルを利用することにより、生産計画の策定に要する作業負担の軽減を図ることができる。
上記以外の課題、構成及び効果は、後述する発明を実施するための形態にて明らかにされる。
以下、図面を参照して本発明を実施するための実施形態について説明する。以下では、本発明の目的を達成するための説明に必要な範囲を模式的に示し、本発明の該当部分の説明に必要な範囲を主に説明することとし、説明を省略する箇所については公知技術によるものとする。
図1は、生産管理システム1の一例を示す概略全体図である。生産管理システム1は、生産オーダに対して生産工場10が有する生産リソースを割り当てることで、作業者31,32,33,…,3N(以下、「作業者3」と略す)の運転操作下にて所定の反応プロセスを行う反応装置21,22,23,…,2M(以下、「反応装置2」と略す)により生産される生成物の生産計画を策定し、その生産計画に沿って生産管理を行うシステムである。
生産オーダは、生成物の品目が指定されるとともに、その生成物の生産量や納期が指定される。
生産工場10には、複数の反応装置2が設置されるとともに、複数の作業者3により反応装置2の運転操作がそれぞれ行われる。生産リソースは、原材料から生成物を生産する際に必要な物的リソースや人的リソースである。物的リソースの代表例としては、反応装置2が挙げられる。人的リソースの代表例としては、作業者3が挙げられる。
反応装置2は、原材料に対してバッチ方式又は連続方式の反応プロセスを行うことで生
成物を生産する。反応装置2は、例えば、合成樹脂等を重合プロセスにて生産する化学分野、酒や醤油等を醸造プロセスにて生成する食品分野、薬品やワクチン等を培養反応にて生産する薬品分野にて利用される。なお、反応装置2は、上記の例に限定されず、任意の生成物を生産し、各種の分野で利用されるものでもよい。
成物を生産する。反応装置2は、例えば、合成樹脂等を重合プロセスにて生産する化学分野、酒や醤油等を醸造プロセスにて生成する食品分野、薬品やワクチン等を培養反応にて生産する薬品分野にて利用される。なお、反応装置2は、上記の例に限定されず、任意の生成物を生産し、各種の分野で利用されるものでもよい。
本実施形態では、反応装置2は、1又は複数種のモノマー、溶媒、重合開始剤、添加剤等を原材料として、バッチ方式の重合プロセス(反応プロセスの一形態)を行うことで、合成樹脂(例えば、ポリプロピレン、ポリエチレン、ポリ塩化ビニル、メラミン樹脂、エポキシ樹脂、ウレタン樹脂、アクリル樹脂及びシリコン樹脂等)を生産する場合を中心に説明する。
作業者3は、反応装置2の運転操作を行う。具体的には、作業者3は、原材料を反応装置2に投入し、反応プロセスの進行状況を確認しながら、反応装置2の各部を手動で操作する生産工程と、生産工程終了後、反応装置2を洗浄したり、次の生産工程を準備したりする段替え工程とを行う。作業者3は、例えば、三交代制(日勤、準夜勤、夜勤)の勤務形態にて反応装置2を稼働させる。そのため、反応プロセスを含む生産工程が複数の勤務シフトにまたがる場合には、複数の作業者3が交代で1つの反応装置2の運転操作を行う。
生産管理システム1は、その主要な構成として、機械学習装置4と、生産計画策定装置5と、生産管理データベース装置6と、生産シミュレーション装置7とを備える。機械学習装置4、生産計画策定装置5、生産管理データベース装置6、及び、生産シミュレーション装置7は、例えば、汎用又は専用のコンピュータ(後述の図5参照)で構成されるとともに、有線又は無線のネットワーク8に接続されて、各種のデータを相互に送受信可能に構成される。
機械学習装置4は、機械学習の学習フェーズの主体として動作し、生産計画策定装置5にて用いられる学習モデル11を機械学習により生成する。学習済みの学習モデル11は、ネットワーク8や記録媒体等を介して生産計画策定装置5に提供される。機械学習装置4は、機械学習の手法として、例えば、強化学習又は教師あり学習を採用する。本実施形態では、強化学習を採用する場合を中心に説明する。
生産計画策定装置5は、機械学習の推論フェーズの主体として動作し、機械学習装置4により生成された学習モデル11を用いて、反応装置2により生産される生成物の生産計画を策定する。生産計画策定装置5は、生産オーダを受け付けて、その生産オーダに対して生産リソース(本実施形態では、反応装置2及び作業者3)の割当を行うことで、生成物の生産計画を策定する。
生産管理データベース装置6は、生産計画を作成する際に必要な各種のデータを記憶する生産管理データベース60(後述の図3参照)を備える。
生産シミュレーション装置7は、反応プロセスをモデル化し、反応プロセスのシミュレーションを実行可能に構成される。生産シミュレーション装置7は、例えば、指定された品目の生成物を生産する際の生産リソースとして、反応装置2及び作業者3が割り当てられた場合に、その反応装置2がその作業者3の運転操作下でその品目を生産したときの反応プロセスのシミュレーションを実行し、生成物が生産されたときの生産評価指標を推定する。
図2は、生産計画の一例を示す工程管理図である。工程管理図は、複数の生産オーダに対して策定された生産計画をガントチャート形式で表したものである。図2の例では、横
軸に時間、縦軸に反応装置2をそれぞれ配置し、各品目P1~P4に対する反応装置2及び作業者3の割当が表されている。作業者3の割当は、矩形内に記載された「31~36」の文字にて表されている。
軸に時間、縦軸に反応装置2をそれぞれ配置し、各品目P1~P4に対する反応装置2及び作業者3の割当が表されている。作業者3の割当は、矩形内に記載された「31~36」の文字にて表されている。
図3は、生産管理データベース60の一例を示すデータ構成図である。生産管理データベース60は、例えば、生産オーダテーブル600、生成物テーブル601、反応装置テーブル602、作業者テーブル603、及び、生産管理テーブル604から構成される。
生産オーダテーブル600は、生産オーダIDにより特定される生産オーダ毎にレコードを有し、各レコードには、品目IDにより特定される品目、生産量、及び、納期が登録される。
生成物テーブル601は、生成物の品目IDにより特定される品目毎にレコードを有し、各レコードには、品目名、原材料、生産工程表(原材料の投入量や投入順序、反応槽の温度調節、撹拌速度、反応時間等)、及び、生産評価指標の目標値が登録される。原材料に、複数の種類の原材料が登録されてもよいし、重合開始剤や添加剤等がさらに登録されてもよい。
反応装置テーブル602は、反応装置IDにより特定される反応装置2毎にレコードを有し、各レコードには、反応装置2の設置場所、反応装置2の仕様(大きさ、形状、材質等)、及び、過去に生産実績を有する生成物の品目が登録される。なお、複数の反応装置2は、仕様が同じでもよいし、一部又は全ての仕様が異なるものでもよい。
作業者テーブル603は、作業者IDにより特定される作業者3毎にレコードを有し、各レコードには、所定の期間先までの勤務シフト、及び、過去に生産実績を有する生成物の品目が登録される。
生産管理テーブル604は、生産管理IDにより特定される生産管理情報毎にレコードを有し、各レコードには、生産オーダID、反応装置ID、作業者ID、予定開始時刻、予定終了時刻、実績開始時刻、実績終了時刻、及び、生産評価指標の実績値が登録される。反応装置ID、作業者ID、予定開始時刻、及び、予定終了時刻は、生産計画を表す情報であり、実績開始時刻、実績終了時刻、及び、生産評価指標の実績値は、生産実績を表す情報である。生産管理テーブル604の各レコードに登録された生産管理情報に基づいて、図2に示す工程管理図が作成可能である。
生産評価指標は、生成物の生産品質や生産効率を表す任意の指標である。生産評価指標の実績値は、例えば、反応装置2により生産された生成物を、重量計、粘度計、密度計等の測定機器で測定した測定値や複数の測定値に基づき算出される評価値であり、生産評価指標の目標値は、その測定値や評価値に対する目標値として事前に定められる。また、生産評価指標の実績値は、実績開始時刻と実績終了時刻との差から求められる生産実績時間であり、生産評価指標の目標値は、その生産実績時間に対する生産目標時間として事前に定められる。
図4は、反応装置2の一例を示す概略構成図である。反応装置2は、その主要な構成として、反応槽20と、撹拌機21と、センサ群22と、制御機器群23と、操作表示盤24とを備える。反応装置2の各部には、商用電源(不図示)からの電力が供給される。
反応槽20は、略縦長円筒状の反応槽本体200と、反応槽本体200の上面部に形成された原材料投入口201と、反応槽本体200の底面部に形成された生成物排出口202と、反応槽本体200の外周に設けられて、熱媒としての冷水及び温水が流通するジャ
ケット203と、冷水を循環させる冷水循環流路204と、温水を循環させる温水循環流路205とを備える。なお、生成物排出口202には、生成物の粘度を測定する粘度計や生成物の密度を測定する密度計が設けられていてもよい。
ケット203と、冷水を循環させる冷水循環流路204と、温水を循環させる温水循環流路205とを備える。なお、生成物排出口202には、生成物の粘度を測定する粘度計や生成物の密度を測定する密度計が設けられていてもよい。
撹拌機21は、反応槽本体200の内部に配置されたプロペラ状の撹拌翼210と、反応槽本体200の上方に配置されて、撹拌翼210を回転する駆動源としてのモータ211と、撹拌翼210及びモータ211の間を連結するシャフト状の回転軸212とを備える。
センサ群22は、反応槽20の各部の物理量や状態量を測定する反応槽センサ群220と、撹拌機21の各部の物理量や状態量を測定する撹拌機センサ群221と、反応装置2が設置された環境の物理量や状態量を測定する環境センサ群222とを備える。
反応槽センサ群220は、熱媒温度T4を測定するジャケット熱媒温度センサ220Aと、冷水温度T5を測定する冷水温度センサ220Bと、温水温度T6を測定する温水温度センサ220Cと、熱媒流量F1を測定するジャケット熱媒流量センサ220Dと、冷水流量F2を測定する冷水流量センサ220Eと、温水流量F3を測定する温水流量センサ220Fと、反応槽温度T1、T2、T3をそれぞれ測定する3つの反応槽温度センサ220Gと、反応槽圧力P1を測定する反応槽圧力センサ220Hと、反応槽本体200の内部の原材料の重量を示す反応槽重量W1を測定する反応槽重量センサ220Iとを備える。
撹拌機センサ群221は、モータ211に加わるトルクを示す撹拌機トルクST1を測定する撹拌機トルクセンサ221Aと、モータ回転数R1を測定するモータ回転数センサ221Bと、モータ電流値I1を測定するモータ電流センサ221Cと、撹拌機21が動作したときの振動値O1を測定する振動センサ221Dと、撹拌機21が動作したときの音響値N1を測定する音響センサ221Eとを備える。
環境センサ群222は、環境温度T7を測定する環境温度センサ222Aと、環境湿度H1を測定する環境湿度センサ222Bとを備える。
制御機器群23は、冷水温度T5を制御する冷却機器230と、温水温度T6を制御する加熱機器231と、冷水流量F2を制御する冷水流量調整弁232及び冷水ポンプ233と、温水流量F3を制御する温水流量調整弁234及び温水ポンプ235と、モータ211に駆動電力を供給し、モータ211の回転状態(オン又はオフ、回転数等)を制御するインバータ236とを備える。
操作表示盤24は、反応装置2の各部に電気的に接続される。操作表示盤24は、センサ群22により測定された各測定値を表示するとともに、作業者3の運転操作を受け付けて、その運転操作に応じた各制御指令値を制御機器群23に出力する。
なお、センサ群22による各測定値は、操作表示盤24に代えて、センサ群22が有するメータや計器類に直接表示されてもよい。また、制御機器群23に対する運転操作は、操作表示盤24に代えて、制御機器群23が有するスイッチやレバー等に対して直接行われてもよい。さらに、操作表示盤24は、センサ群22による各測定値と、制御機器群23に対する運転操作に応じた各制御指令値を運転履歴データとして記録してもよく、反応プロセスが終了したときに粘度計や密度計で生成物の粘度や密度を測定した結果を、生産評価指標の実績値として記録してもよい。
図5は、コンピュータ900の一例を示すハードウエア構成図である。機械学習装置4
、生産計画策定装置5、生産管理データベース装置6、及び、生産シミュレーション装置7の各々は、汎用又は専用のコンピュータ900により構成される。
、生産計画策定装置5、生産管理データベース装置6、及び、生産シミュレーション装置7の各々は、汎用又は専用のコンピュータ900により構成される。
コンピュータ900は、図5に示すように、その主要な構成要素として、バス910、プロセッサ912、メモリ914、入力デバイス916、出力デバイス917、表示デバイス918、ストレージ装置920、通信I/F(インターフェース)部922、外部機器I/F部924、I/O(入出力)デバイスI/F部926、及び、メディア入出力部928を備える。なお、上記の構成要素は、コンピュータ900が使用される用途に応じて適宜省略されてもよい。
プロセッサ912は、1つ又は複数の演算処理装置(CPU(Central Processing Unit)、MPU(Micro-processing unit)、DSP(digital signal processor)、GPU(Graphics Processing Unit)等)で構成され、コンピュータ900全体を統括する制御部として動作する。メモリ914は、各種のデータ及びプログラム930を記憶し、例えば、メインメモリとして機能する揮発性メモリ(DRAM、SRAM等)と、不揮発性メモリ(ROM)、フラッシュメモリ等とで構成される。
入力デバイス916は、例えば、キーボード、マウス、テンキー、電子ペン等で構成され、入力部として機能する。出力デバイス917は、例えば、音(音声)出力装置、バイブレーション装置等で構成され、出力部として機能する。表示デバイス918は、例えば、液晶ディスプレイ、有機ELディスプレイ、電子ペーパー、プロジェクタ等で構成され、出力部として機能する。入力デバイス916及び表示デバイス918は、タッチパネルディスプレイのように、一体的に構成されていてもよい。ストレージ装置920は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)等で構成され、記憶部として機能する。ストレージ装置920は、オペレーティングシステムやプログラム930の実行に必要な各種のデータを記憶する。
通信I/F部922は、インターネットやイントラネット等のネットワーク940(図1のネットワーク8と同じであってもよい)に有線又は無線により接続され、所定の通信規格に従って他のコンピュータとの間でデータの送受信を行う通信部として機能する。外部機器I/F部924は、カメラ、プリンタ、スキャナ、リーダライタ等の外部機器950に有線又は無線により接続され、所定の通信規格に従って外部機器950との間でデータの送受信を行う通信部として機能する。I/OデバイスI/F部926は、各種のセンサ、アクチュエータ等のI/Oデバイス960に接続され、I/Oデバイス960との間で、例えば、センサによる検出信号やアクチュエータへの制御信号等の各種の信号やデータの送受信を行う通信部として機能する。メディア入出力部928は、例えば、DVD(Digital Versatile Disc)ドライブ、CD(Compact Disc)ドライブ等のドライブ装置で構成され、DVD、CD等のメディア(非一時的な記憶媒体)970に対してデータの読み書きを行う。
上記構成を有するコンピュータ900において、プロセッサ912は、ストレージ装置920に記憶されたプログラム930をメモリ914に呼び出して実行し、バス910を介してコンピュータ900の各部を制御する。なお、プログラム930は、ストレージ装置920に代えて、メモリ914に記憶されていてもよい。プログラム930は、インストール可能なファイル形式又は実行可能なファイル形式でメディア970に記録され、メディア入出力部928を介してコンピュータ900に提供されてもよい。プログラム930は、通信I/F部922を介してネットワーク940経由でダウンロードすることによりコンピュータ900に提供されてもよい。また、コンピュータ900は、プロセッサ912がプログラム930を実行することで実現する各種の機能を、例えば、FPGA(f
ield-programmable gate array)、ASIC(application specific integrated circuit)等のハードウエアで実現するものでもよい。
ield-programmable gate array)、ASIC(application specific integrated circuit)等のハードウエアで実現するものでもよい。
コンピュータ900は、例えば、据置型コンピュータや携帯型コンピュータで構成され、任意の形態の電子機器である。コンピュータ900は、クライアント型コンピュータでもよいし、サーバ型コンピュータやクラウド型コンピュータでもよい。コンピュータ900は、機械学習装置4、生産計画策定装置5、生産管理データベース装置6、及び、生産シミュレーション装置7以外の他の装置に適用されてもよい。
(機械学習装置4)
図6は、機械学習装置4の一例を示すブロック図である。機械学習装置4は、学習用データ取得部40と、学習用データ記憶部41と、機械学習部42と、学習済みモデル記憶部43とを備える。機械学習装置4は、例えば、図5に示すコンピュータ900で構成される。その場合、学習用データ取得部40は、入力デバイス916、通信I/F部922又はI/OデバイスI/F部926で構成され、機械学習部42は、プロセッサ912で構成され、学習用データ記憶部41及び学習済みモデル記憶部43は、ストレージ装置920で構成される。
図6は、機械学習装置4の一例を示すブロック図である。機械学習装置4は、学習用データ取得部40と、学習用データ記憶部41と、機械学習部42と、学習済みモデル記憶部43とを備える。機械学習装置4は、例えば、図5に示すコンピュータ900で構成される。その場合、学習用データ取得部40は、入力デバイス916、通信I/F部922又はI/OデバイスI/F部926で構成され、機械学習部42は、プロセッサ912で構成され、学習用データ記憶部41及び学習済みモデル記憶部43は、ストレージ装置920で構成される。
学習用データ取得部40は、各種の外部装置とネットワーク8を介して接続され、生成物の品目を入力データとして少なくとも含む学習用データを取得するインタフェースユニットである。外部装置は、生産管理データベース装置6、及び、生産シミュレーション装置7等である。なお、外部装置は、これらの一部でもよいし、他の装置がさらに接続されてもよい。
学習用データ記憶部41は、学習用データ取得部40で取得した学習用データを複数組記憶するデータベースである。なお、学習用データ記憶部41を構成するデータベースの具体的な構成は適宜設計すればよい。
機械学習部42は、学習用データ記憶部41に記憶された学習用データを用いて機械学習を実施する。すなわち、機械学習部42は、学習モデル11に学習用データを複数組入力することで、学習用データに含まれる入力データと、その入力データに含まれる生成物の品目を生産する際に必要な生産リソースの割当を示す割当データとの相関関係を学習モデル11に学習させることで、学習済みの学習モデル11を生成する。本実施形態では、機械学習部42による機械学習を実現する学習モデル11として、ニューラルネットワークを採用する場合について説明する。
学習済みモデル記憶部43は、機械学習部42により生成された学習済みの学習モデル11を記憶するデータベースである。学習済みモデル記憶部43に記憶された学習済みの学習モデル11は、ネットワーク8や記録媒体等を介して実システム(例えば、生産計画策定装置5)に提供される。なお、図6では、学習用データ記憶部41と、学習済みモデル記憶部43とが別々の記憶部として示されているが、これらは単一の記憶部で構成されてもよい。
図7は、機械学習装置4で使用されるデータの一例と、強化学習の関係を示す概略図である。機械学習部42は、強化学習のエージェントとして機能する。強化学習の基本的な仕組みにおいて、エージェントは、所定の条件下において環境の状態を観測し、その観測された状態に対して所定の方策に従って行動を選択する。そして、その選択した行動により環境の状態が変化したとき、その状態の変化に応じた報酬を受け取り、その選択した行動の価値を評価する。このような一連の処理として、状態の観測、行動の選択、価値の評
価を繰り返すことで、報酬を最も多く獲得できるように行動を選択するための方策を学習モデル11に学習させる。
価を繰り返すことで、報酬を最も多く獲得できるように行動を選択するための方策を学習モデル11に学習させる。
機械学習部42による強化学習を、上記の強化学習の基本的な仕組みに対応させた場合、環境は、M台(Mは2以上の整数)の反応装置2がN人(Nは2以上の整数)の作業者3による運転操作が行われることで、生産オーダを満たすように、生成物を生産する生産工場10が対応する。
状態sは、生産工場10にて受け付けられた生産オーダと、生産リソースの稼働状態とで表される。生産オーダは、少なくとも生成物の品目が指定されたものであり、生産オーダにて指定された生成物の品目は、「生産オーダ品目」という。また、生産リソースの稼働状態は、複数の反応装置2が運転中であるか否かをそれぞれ示す運転状態と、複数の作業者3が運転操作中であるか否かをそれぞれ示す操作状態とで表される。
行動aは、生産オーダ品目を生産する際に必要な生産リソースを割り当てるときの選択肢の候補であり、例えば、複数の反応装置2のうち生産オーダ品目を生産する際に運転される反応装置2の割当と、複数の作業者3のうち生産オーダ品目を生産する際に運転操作を行う作業者3の割当との少なくとも一方を含む。生産オーダ品目を生産する際の反応プロセスが、複数の勤務シフトにまたがる場合には、作業者3の割当としては、各勤務シフトで運転操作を行う各作業者3をそれぞれ割り当てることになる。
本実施形態に係る行動aは、図7に示すように、反応装置2と、作業者3との各組み合わせで表される。生産オーダ品目を生産する際の反応プロセスが、複数の勤務シフトにまたがる場合には、行動aは、反応装置2と、各勤務シフトで運転操作を行う各作業者3との組み合わせで表される。本実施形態では、説明の簡略化のため、反応プロセスは、単一の勤務シフト内に反応プロセスが終了する場合について説明する。
報酬rは、生産オーダ品目に対する生産評価指標の目標値と、生産オーダ品目が行動aにて割り当てられる生産リソースを用いて生産されたときの生産評価指標の実績値との差に基づいて算出される。生産評価指標の実績値は、例えば、生産管理データベース60に登録された過去の生産管理情報に基づいて取得されてもよいし、生産シミュレーション装置7により反応プロセスのシミュレーションが実行されることで推定されてもよい。
報酬rは、生産評価指標の目標値と、生産評価指標の実績値との差が小さいほど大きくなるように算出される。なお、行動aにて割り当てられる反応装置2が運転中である場合には、報酬rが小さくなるように補正されるとともに、行動aにて割り当てられる作業者3が運転操作中である場合には、報酬rが小さくなるように補正されるようにしてもよい。また、報酬rは、生産評価指標以外の観点がさらに考慮されてもよく、例えば、過去に生産実績を有する反応装置2や作業者3が割り当てられた場合には、報酬rが大きくなるように補正されてもよい。
機械学習として、強化学習を採用する場合、学習用データは、状態sに対応する入力データのみを含む。すなわち、学習用データは、出力データを含まない構成とされる。本実施形態に係る学習用データを構成する入力データは、図7に示すように、生産オーダ品目と、複数の反応装置2が運転中であるか否かをそれぞれ示す運転状態と、複数の作業者3が運転操作中であるか否かをそれぞれ示す操作状態とを含む。
図8は、機械学習装置4で使用されるニューラルネットワークモデルの一例を示す模式図である。図8では、状態sに対して所定の行動aを取ったときの評価は、Q学習法の行動価値関数Q(s,a)を用いて行われる。
行動価値関数Q(s,a)は、例えば、DQN(Deep Q-Network)と呼ばれる手法により、状態sを入力変数とし、状態sにおいて各行動amn(m=1,2,…,M、及び、n=1,2,…,N)をそれぞれ取ったときの行動価値関数Q(s,amn)を出力変数とするニューラルネットワークモデルで近似的に算出することができる。この場合、機械学習部42は、例えば、報酬r、学習率α、割引率γを変数として含む誤差関数(例えば、TD誤差)が最小になるように、ニューラルネットワークモデルの重みwkを調整することで行動価値関数Q(s,amn)を更新し、入力データ(状態s)と、生産リソースの割当を示す割当データ(行動amn)との相関関係を学習モデル11に学習させる。なお、強化学習の手法としては、任意の手法を採用すればよく、Q学習法の他に、例えば、SARSA法、モンテカルロ法等を採用してもよい。
学習モデル11は、行動価値関数Q(s,amn)を近似的に算出するために、図8に示すニューラルネットワークモデルとして構成される。図8に示すニューラルネットワークモデルは、入力層にあるi個のニューロン(x1~xi)、第1中間層にあるp個のニューロン(y11~y1p)、第2中間層にあるq個のニューロン(y21~y2q)、及び、出力層にあるj個(=M×N)のニューロン(z1~zMN)から構成される。
入力層の各ニューロンには、学習用データに含まれる入力データ(状態s)としての生産オーダ品目が対応付けられる。また、入力層の各ニューロンには、M台の反応装置2の運転状態、及び、N人の作業者3の操作状態のそれぞれが対応付けられる。
出力層の各ニューロンには、状態sに対して各行動amn(m=1,2,…,M、及び、n=1,2,…,N)を取ったときの行動価値関数Q(s,amn)のそれぞれが対応付けられて、出力層の各ニューロンは、各行動amnの行動価値関数Q(s,amn)の値をそれぞれ出力する。
第1中間層及び第2中間層は、隠れ層とも呼ばれており、ニューラルネットワークとしては、第1中間層及び第2中間層の他に、さらに複数の隠れ層を有するものでもよいし、第1中間層のみを隠れ層とするものでもよい。また、入力層と第1中間層との間、第1中間層と第2中間層との間、第2中間層と出力層との間には、各層のニューロンの間を接続するシナプスが張られており、それぞれのシナプスには、重みwk(kは自然数)が対応付けられる。
(機械学習方法)
図9は、機械学習装置4による機械学習方法の一例を示すフローチャートである。
図9は、機械学習装置4による機械学習方法の一例を示すフローチャートである。
まず、ステップS100において、学習用データ取得部40は、機械学習を開始するための事前準備として、所望の数の学習用データを準備し、その準備した学習用データを学習用データ記憶部41に記憶する。学習用データを準備する方法には、いくつかの方法を採用することができる。例えば、学習用データ取得部40は、生産管理データベース60の生産管理テーブル604に登録された過去の生産管理情報に基づいて、学習用データの入力データ(状態s)を取得してもよいし、将来の生産オーダを予測し、仮想の生産管理情報に基づいて、学習用データの入力データ(状態s)を取得してもよい。
次に、ステップS110において、機械学習部42は、機械学習を開始すべく、学習前の学習モデル11を準備する。ここで準備する学習前の学習モデル11は、図8に例示したニューラルネットワークモデルで構成されており、各シナプスの重みwkが初期値に設定されている。
次に、ステップS120において、機械学習部42は、学習用データ記憶部41に記憶された複数組の学習用データから、例えば、ランダムに一の学習用データを取得する。
次に、ステップS121において、機械学習部42は、ステップS120で取得した一の学習用データに含まれる入力データにおける生産オーダ品目に対する生産評価指標の目標値を取得する。生産評価指標の目標値は、例えば、生産管理データベース60の生成物テーブル601を参照することで取得される。
次に、ステップS130において、機械学習部42は、ステップS120で取得した一の学習用データに含まれる入力データ(状態s1)を、準備された学習前(又は学習中)の学習モデル11の入力層に入力する。その結果、学習モデル11の出力層から推論結果として、各行動amnの価値(行動価値関数Q(s,amn)の値)が出力される。
次に、ステップS140において、機械学習部42は、ステップS130において出力層から推論結果として出力された各行動amnの行動価値関数Q(s,amn)の値に基づいて、例えば、最大値に対応する特定の一の行動aを選択する。特定の一の行動aを選択する手法としては、例えば、greedy法、ε-greedy法等を採用すればよい。
次に、ステップS150において、機械学習部42は、状態s1に対してステップS140で選択した行動aを取った場合の生産評価指標の実績値を取得する。すなわち、機械学習部42は、入力データ(状態s1)としての生産オーダ品目が、ステップS140で選択した行動aに対応する生産リソースとしての反応装置2及び作業者3により生産されたときの生産評価指標の実績値を取得する。
次に、ステップS160において、機械学習部42は、ステップS121で取得した生産評価指標の目標値と、ステップS150で取得した生産評価指標の実績値との差に基づいて報酬rを算出する。
次に、ステップS170において、機械学習部42は、ステップS160で算出した報酬rに基づいて、誤差関数が最小になるように、ニューラルネットワークモデルの重みwkを調整することで行動価値関数Q(s,amn)を更新する。これより、機械学習部42は、入力データ(状態s)と、割当データ(行動amn)との相関関係を学習モデル11に学習させる。なお、行動価値関数Q(s,amn)の更新は、毎回行わなくてもよく、例えば、所定の条件を満たす場合にだけ行うようにしてもよい。
次に、ステップS180において、機械学習部42は、機械学習を継続する必要があるか否かを判定する。その結果、継続すると判定した場合(ステップS180でNo)、ステップS120に戻り、学習中の学習モデル11に対してステップS120~S170の工程を実施し、機械学習を終了すると判定した場合(ステップS180でYes)、ステップS190に進む。
そして、ステップS190において、機械学習部42は、各シナプスに対応付けられた重みwkが調整されることで生成された学習済みの学習モデル11を学習済みモデル記憶部43に記憶し、図9に示す一連の機械学習方法を終了する。学習済みの学習モデル11としては、例えば、ニューラルネットワークの構造を表すパラメータや調整済みの重みwkの値が記憶される。機械学習方法において、ステップS100が学習用データ記憶工程、ステップS110~S180が機械学習工程、ステップS190が学習済みモデル記憶工程に相当する。
以上のように、本実施形態に係る機械学習装置4及び機械学習方法によれば、生産オーダ品目に対する生産リソースを割り当てることで、作業者3の運転操作下にて所定の反応プロセスを行う反応装置2により生産される生成物の生産計画を策定することを可能とする学習モデル11を提供することができる。よって、この学習モデル11を利用することにより、生産計画の策定に要する作業負担の軽減を図ることができる。
(生産計画策定装置5)
図10は、生産計画策定装置5の一例を示すブロック図である。生産計画策定装置5は、入力データ取得部50と、推論部51と、学習済みモデル記憶部52と、出力処理部53とを備える。生産計画策定装置5は、例えば、図5に示すコンピュータ900で構成される。その場合、入力データ取得部50は、入力デバイス916、通信I/F部922又はI/OデバイスI/F部926で構成され、推論部51及び出力処理部53は、プロセッサ912で構成され、学習済みモデル記憶部52は、ストレージ装置920で構成される。
図10は、生産計画策定装置5の一例を示すブロック図である。生産計画策定装置5は、入力データ取得部50と、推論部51と、学習済みモデル記憶部52と、出力処理部53とを備える。生産計画策定装置5は、例えば、図5に示すコンピュータ900で構成される。その場合、入力データ取得部50は、入力デバイス916、通信I/F部922又はI/OデバイスI/F部926で構成され、推論部51及び出力処理部53は、プロセッサ912で構成され、学習済みモデル記憶部52は、ストレージ装置920で構成される。
入力データ取得部50は、例えば、生産工場10の管理者が使用する管理者端末装置(不図示)とネットワーク8を介して接続され、生産物の品目を少なくとも含む入力データを取得するインタフェースユニットである。入力データ取得部50は、生産計画を策定する対象となる生産オーダを管理者端末装置から受信し、その生産オーダにて指定された生成物の品目と、その時点における生産リソースの稼働状態とに基づいて、入力データを取得する。本実施形態に係る入力データは、生産オーダにて指定された生成物の品目と、複数の反応装置2の運転状態と、複数の作業者3の操作状態とで構成される。
推論部51は、入力データ取得部50により取得された入力データを学習モデル11に入力し、その入力データに含まれる生成物の品目を生産する際に必要な生産リソースの割当を推論する推論処理を行う。推論処理には、機械学習装置4及び機械学習方法にて機械学習が実施された学習済みの学習モデル11が用いられる。
推論部51は、学習モデル11を用いた推論処理を行う機能のみならず、推論処理の前処理として、入力データ取得部50により取得された入力データを所望の形式等に調整して学習モデル11に入力する前処理機能や、推論処理の後処理として、学習モデル11から出力された割当データに所定の論理式や計算式を適用することで所望の形式等に調整する後処理機能をも含んでいる。なお、推論部51の推論結果は、学習済みモデル記憶部52や他の記憶装置(不図示)に記憶することが好ましく、過去の推論結果は、例えば、学習モデル11の推論精度の更なる向上のため、オンライン学習や再学習に用いられる学習用データとして利用することが可能である。
学習済みモデル記憶部52は、推論部51の推論処理にて用いられる学習済みの学習モデル11を記憶するデータベースである。なお、学習済みモデル記憶部52には、複数の学習モデル11が格納されて、推論部51により選択的に用いられてもよい。複数の学習モデル11は、例えば、入力データ及び出力データの数や種類等が異なる毎に生成されたものを用意すればよい。
出力処理部53は、推論部51の推論結果、すなわち、割当データを出力する出力処理を行う。具体的な出力手段は、種々の手段を採用することが可能である。例えば、出力処理部53は、割当データを生産管理データベース装置6に送信することで生産管理データベース60の生産管理テーブル604に登録されてもよいし、管理者端末装置に送信することで管理者端末装置に表示されてもよい。その際、割当データが示す生産リソースの割当は、最終的な生産計画として生産工場10の管理者により採用されてもよいし、仮の生産計画として生産工場10の管理者により一部修正されてもよい。
(生産計画策定方法)
図11は、生産計画策定装置5による生産計画策定方法の一例を示すフローチャートである。
図11は、生産計画策定装置5による生産計画策定方法の一例を示すフローチャートである。
まず、ステップS200において、入力データ取得部50は、生産物の品目が指定された生産オーダを受け付けることで入力データ(状態s)を取得する。
次に、ステップS210において、推論部51は、入力データ(状態s)に前処理(省略してもよい)を施して学習モデル11の入力層に入力することで推論を実施し、その学習モデル11の出力層から出力された出力データ(各行動amnの行動価値関数Q(s,amn)の値)を取得する。
次に、ステップS211において、推論部51は、強化学習の後処理の一例として、出力データとして出力層の各ニューロンから出力された各行動amnの行動価値関数Q(s,amn)の値に基づいて、その中で最大値を与える行動aを選択する。
次に、ステップS220において、出力処理部53は、ステップS211で選択した行動aに対応する割当データを出力し、図11に示す一連の生産計画策定方法を終了する。生産計画策定方法において、ステップS200が入力データ取得工程、ステップS210、S211が推論工程、ステップS220が出力処理工程に相当する。
以上のように、本実施形態に係る生産計画策定装置5及び生産計画策定方法によれば、学習モデル11を利用することにより、生産オーダ品目に対して生産リソースを割り当てることで、作業者3の運転操作下にて所定の反応プロセスを行う反応装置2により生産される生成物の生産計画を策定することができる。よって、生産計画の策定に要する作業負担の軽減を図ることができる。
(他の実施形態)
本発明は上述した実施形態に制約されるものではなく、本発明の主旨を逸脱しない範囲内で種々変更して実施することが可能である。そして、それらはすべて、本発明の技術思想に含まれるものである。
本発明は上述した実施形態に制約されるものではなく、本発明の主旨を逸脱しない範囲内で種々変更して実施することが可能である。そして、それらはすべて、本発明の技術思想に含まれるものである。
上記実施形態では、機械学習装置4及び生産計画策定装置5は、別々の装置で構成されるものとして説明したが、単一の装置で構成されていてもよい。その場合、その単一の装置は、オンライン学習による機械学習を適宜行いながら、生産計画の策定を行うようにしてもよい。また、機械学習装置4又は生産計画策定装置5は、生産管理データベース装置6及び生産シミュレーション装置7の少なくとも一方の装置として機能するものでもよい。
上記実施形態では、機械学習装置4は、機械学習の手法として、強化学習を採用した場合について説明したが、教師あり学習を採用してもよい。その場合には、機械学習部42は、入力データと割付データとを含む学習用データを学習モデル11に複数組入力することで、入力データと割当データとの相関関係を学習モデル11に学習させればよい。
上記実施形態では、機械学習部42による機械学習を実現する学習モデル11として、ニューラルネットワークを採用した場合について説明したが、他の機械学習のモデルを採用してもよい。他の機械学習のモデルとしては、例えば、決定木、回帰木等のツリー型、バギング、ブースティング等のアンサンブル学習、再帰型ニューラルネットワーク、畳み込みニューラルネットワーク、LSTM等のニューラルネット型(ディープラーニングを
含む)、階層型クラスタリング、非階層型クラスタリング、k近傍法、k平均法等のクラ
スタリング型、主成分分析、因子分析、ロジスティク回帰等の多変量解析、サポートベクターマシン等が挙げられる。
含む)、階層型クラスタリング、非階層型クラスタリング、k近傍法、k平均法等のクラ
スタリング型、主成分分析、因子分析、ロジスティク回帰等の多変量解析、サポートベクターマシン等が挙げられる。
上記実施形態では、入力データは、生産オーダ品目と、複数の反応装置2の運転状態と、複数の作業者3の操作状態とを含む場合について説明したが、生産オーダ品目を少なくとも含むものであればよい。従って、入力データは、例えば、複数の反応装置2の運転状態と、複数の作業者3の操作状態との少なくとも一方を含まない構成としてもよいし、これら以外のデータを含むものでもよい。入力データが、例えば、生産オーダ品目のみを含む場合には、機械学習部42は、例えば、強化学習の行動aから運転中の反応装置2や運転操作中の作業者3を除外してもよいし、運転中の反応装置2や運転操作中の作業者3が選択されたときの強化学習の報酬rが小さくなるように補正してもよい。また、運転中の反応装置2や運転操作中の作業者3が異なる様々な生産状況に応じた入力データを用意することで、機械学習部42は、複数の学習モデル11を生産状況毎に生成してもよい。
(機械学習プログラム及び生産計画策定プログラム)
本発明は、図5に示すコンピュータ900に、上記実施形態に係る機械学習方法が備える各工程を実行させるためのプログラム(機械学習プログラム)930の態様で提供することもできる。また、本発明は、図5に示すコンピュータ900に、上記実施形態に係る生産計画策定方法が備える各工程を実行させるためのプログラム(反応槽運転支援プログラム)930の態様で提供することもできる。
本発明は、図5に示すコンピュータ900に、上記実施形態に係る機械学習方法が備える各工程を実行させるためのプログラム(機械学習プログラム)930の態様で提供することもできる。また、本発明は、図5に示すコンピュータ900に、上記実施形態に係る生産計画策定方法が備える各工程を実行させるためのプログラム(反応槽運転支援プログラム)930の態様で提供することもできる。
(推論装置、推論方法及び推論プログラム)
本発明は、上記実施形態に係る生産計画策定装置5(生産計画策定方法又は生産計画策定プログラム)の態様によるもののみならず、生成物の生産計画を策定するために用いられる推論装置(推論方法又は推論プログラム)の態様で提供することもできる。その場合、推論装置(推論方法又は推論プログラム)としては、メモリと、プロセッサとを含み、このうちのプロセッサが、一連の処理を実行するものとすることができる。当該一連の処理とは、生成物の品目を少なくとも含む入力データを取得する入力データ取得処理(入力データ取得工程)と、その品目を生産する際に必要な生産リソースの割当を推論する推論処理(推論工程)とを含む。
本発明は、上記実施形態に係る生産計画策定装置5(生産計画策定方法又は生産計画策定プログラム)の態様によるもののみならず、生成物の生産計画を策定するために用いられる推論装置(推論方法又は推論プログラム)の態様で提供することもできる。その場合、推論装置(推論方法又は推論プログラム)としては、メモリと、プロセッサとを含み、このうちのプロセッサが、一連の処理を実行するものとすることができる。当該一連の処理とは、生成物の品目を少なくとも含む入力データを取得する入力データ取得処理(入力データ取得工程)と、その品目を生産する際に必要な生産リソースの割当を推論する推論処理(推論工程)とを含む。
推論装置(推論方法又は推論プログラム)の態様で提供することで、生産計画策定装置5を実装する場合に比して簡単に種々の装置への適用が可能となる。推論装置(推論方法又は推論プログラム)が生産リソースの割当を推論する際、上記実施形態に係る機械学習装置4及び機械学習方法により生成された学習済みの学習モデル11を用いて、生産計画策定装置5の推論部51が実施する推論手法を適用してもよいことは、当業者にとって当然に理解され得るものである。
1…生産管理システム、2…反応装置、3…作業者、4…機械学習装置、
5…生産計画策定装置、6…生産管理データベース装置、
7…生産シミュレーション装置、8…ネットワーク、
10…生産工場、11…学習モデル、
20…反応槽、21…撹拌機、22…センサ群、23…制御機器群、24…操作表示盤、40…学習用データ取得部、41…学習用データ記憶部、42…機械学習部、
43…学習済みモデル記憶部、50…入力データ取得部、51…推論部、
52…学習済みモデル記憶部、53…出力処理部、60…生産管理データベース、
200…反応槽本体、201…原材料投入口、202…生成物排出口、
203…ジャケット、204…冷水循環流路、205…温水循環流路
210…撹拌翼、211…モータ、212…回転軸、
220…反応槽センサ群、220A…ジャケット熱媒温度センサ、
220B…冷水温度センサ、220C…温水温度センサ、
220D…ジャケット熱媒流量センサ、220E…冷水流量センサ、
220F…温水流量センサ、220G…反応槽温度センサ、
220H…反応槽圧力センサ、220I…反応槽重量センサ
221…撹拌機センサ群、221A…撹拌機トルクセンサ、
221B…モータ回転数センサ、221C…モータ電流センサ、
221D…振動センサ、221E…音響センサ、
222…環境センサ群、222A…環境温度センサ、222B…環境湿度センサ
230…冷却機器、231…加熱機器、232…冷水流量調整弁、233…冷水ポンプ、234…温水流量調整弁、235…温水ポンプ、236…インバータ、
600…生産オーダテーブル、601…生成物テーブル、602…反応装置テーブル、
603…作業者テーブル、604…生産管理テーブル、900…コンピュータ
5…生産計画策定装置、6…生産管理データベース装置、
7…生産シミュレーション装置、8…ネットワーク、
10…生産工場、11…学習モデル、
20…反応槽、21…撹拌機、22…センサ群、23…制御機器群、24…操作表示盤、40…学習用データ取得部、41…学習用データ記憶部、42…機械学習部、
43…学習済みモデル記憶部、50…入力データ取得部、51…推論部、
52…学習済みモデル記憶部、53…出力処理部、60…生産管理データベース、
200…反応槽本体、201…原材料投入口、202…生成物排出口、
203…ジャケット、204…冷水循環流路、205…温水循環流路
210…撹拌翼、211…モータ、212…回転軸、
220…反応槽センサ群、220A…ジャケット熱媒温度センサ、
220B…冷水温度センサ、220C…温水温度センサ、
220D…ジャケット熱媒流量センサ、220E…冷水流量センサ、
220F…温水流量センサ、220G…反応槽温度センサ、
220H…反応槽圧力センサ、220I…反応槽重量センサ
221…撹拌機センサ群、221A…撹拌機トルクセンサ、
221B…モータ回転数センサ、221C…モータ電流センサ、
221D…振動センサ、221E…音響センサ、
222…環境センサ群、222A…環境温度センサ、222B…環境湿度センサ
230…冷却機器、231…加熱機器、232…冷水流量調整弁、233…冷水ポンプ、234…温水流量調整弁、235…温水ポンプ、236…インバータ、
600…生産オーダテーブル、601…生成物テーブル、602…反応装置テーブル、
603…作業者テーブル、604…生産管理テーブル、900…コンピュータ
Claims (7)
- 作業者の運転操作下にて所定の反応プロセスを行う反応装置により生産される生成物の生産計画策定装置で用いられる学習モデルを生成する機械学習装置であって、
前記生成物の品目を入力データとして少なくとも含む学習用データを複数組記憶する学習用データ記憶部と、
前記学習モデルに前記学習用データを複数組入力することで、前記入力データと、前記品目を生産する際に必要な生産リソースの割当を示す割当データとの相関関係を前記学習モデルに学習させる機械学習部と、
前記機械学習部により学習させた前記学習モデルを記憶する学習済みモデル記憶部と、を備える、
機械学習装置。 - 前記割当データは、
複数の前記反応装置のうち前記品目を生産する際に運転される前記反応装置の割当、及び、
複数の前記作業者のうち前記品目を生産する際に前記運転操作を行う前記作業者の割当の少なくとも一方を含む、
請求項1に記載の機械学習装置。 - 前記入力データは、
複数の前記反応装置が運転中であるか否かをそれぞれ示す運転状態、及び、
複数の前記作業者が運転操作中であるか否かをそれぞれ示す操作状態の少なくとも一方をさらに含む、
請求項1又は請求項2に記載の機械学習装置。 - 前記機械学習部は、
前記相関関係を強化学習により前記学習モデルに学習させる、
請求項1乃至請求項3のいずれか一項に記載の機械学習装置。 - 前記機械学習部は、
前記入力データに基づく前記品目に対する生産評価指標の目標値と、前記入力データに基づく前記品目が、前記割当データが示す前記生産リソースを用いて生産されたときの前記生産評価指標の実績値との差に基づいて、報酬を算出し、
前記報酬に基づいて、前記相関関係を前記学習モデルに学習させる、
請求項4に記載の機械学習装置。 - 請求項1乃至請求項5のいずれか一項に記載の機械学習装置により生成された学習モデルを用いて、作業者の運転操作下にて所定の反応プロセスを行う反応装置により生産される生成物の生産計画を策定する生産計画策定装置であって、
前記生成物の品目を少なくとも含む入力データを取得する入力データ取得部と、
前記入力データ取得部により取得された前記入力データを前記学習モデルに入力し、前記品目を生産する際に必要な生産リソースの割当を推論する推論部と、を備える、
生産計画策定装置。 - 作業者の運転操作下にて所定の反応プロセスを行う反応装置により生産される生成物の生産計画を策定するために用いられる推論装置であって、
前記推論装置は、メモリと、プロセッサとを備え、
前記プロセッサは、
前記生成物の品目を少なくとも含む入力データを取得する入力データ取得処理と、
前記入力データ取得処理にて前記入力データを取得すると、前記品目を生産する際に必要な生産リソースの割当を推論する推論処理と、を実行する、
推論装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021116966A JP2023013058A (ja) | 2021-07-15 | 2021-07-15 | 機械学習装置、生産計画策定装置、及び、推論装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021116966A JP2023013058A (ja) | 2021-07-15 | 2021-07-15 | 機械学習装置、生産計画策定装置、及び、推論装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023013058A true JP2023013058A (ja) | 2023-01-26 |
Family
ID=85129360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021116966A Pending JP2023013058A (ja) | 2021-07-15 | 2021-07-15 | 機械学習装置、生産計画策定装置、及び、推論装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023013058A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230094381A1 (en) * | 2021-09-24 | 2023-03-30 | Hexagon Technology Center Gmbh | Ai auto-scheduler |
US11948107B2 (en) | 2021-09-24 | 2024-04-02 | Hexagon Technology Center Gmbh | Scheduling multiple work projects with a shared resource |
-
2021
- 2021-07-15 JP JP2021116966A patent/JP2023013058A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230094381A1 (en) * | 2021-09-24 | 2023-03-30 | Hexagon Technology Center Gmbh | Ai auto-scheduler |
US11948107B2 (en) | 2021-09-24 | 2024-04-02 | Hexagon Technology Center Gmbh | Scheduling multiple work projects with a shared resource |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7005782B2 (ja) | クーポン発行のためのシステム及び方法 | |
Chang et al. | Optimisation of distributed manufacturing flexible job shop scheduling by using hybrid genetic algorithms | |
JP2023013058A (ja) | 機械学習装置、生産計画策定装置、及び、推論装置 | |
Li et al. | KMOEA: A knowledge-based multiobjective algorithm for distributed hybrid flow shop in a prefabricated system | |
Wang et al. | Permutation flow shop scheduling with batch delivery to multiple customers in supply chains | |
US10496436B2 (en) | Method and apparatus for automatically scheduling jobs in computer numerical control machines using machine learning approaches | |
US11501215B2 (en) | Hierarchical clustered reinforcement machine learning | |
CN109165081B (zh) | 基于机器学习的Web应用自适应资源配置方法 | |
JP2019505889A (ja) | コスト関数設計システム、コスト関数設計方法、およびコスト関数設計プログラム | |
TWI801502B (zh) | 廠房運轉條件設定支援系統、學習裝置以及運轉條件設定支援裝置 | |
Wu | Cauchy mutation for decision-making variable of Gaussian particle swarm optimization applied to parameters selection of SVM | |
Hosen et al. | Prediction interval-based modelling of polymerization reactor: A new modelling strategy for chemical reactors | |
WO2020121494A1 (ja) | 演算装置、アクション決定方法、及び制御プログラムを格納する非一時的なコンピュータ可読媒体 | |
Tavakkoli-Moghaddam et al. | Accessing feasible space in a generalized job shop scheduling problem with the fuzzy processing times: a fuzzy-neural approach | |
JP7060130B1 (ja) | 運用支援装置、運用支援方法及びプログラム | |
Chatterjee et al. | Stock market prediction using Altruistic Dragonfly Algorithm | |
JP2022081866A (ja) | 機械学習装置、反応槽運転支援装置、及び、推論装置 | |
EP3889840A1 (en) | A recommender system and method for recommending a setting of an adjustable parameter | |
Tiwari et al. | Application of an evolutionary fuzzy system for the estimation of workforce deployment and cross-training in an assembly environment | |
WO2021185579A1 (en) | Manufacturing or controlling a technical system using an optimized parameter set | |
Eker et al. | Using evolution strategies to solve DEC-POMDP problems | |
CN112750500A (zh) | 装置、方法及存储介质 | |
Wang et al. | KERNEL PRINCIPAL COMPONENT ANALYSIS: RADIAL BASIS FUNCTION NEURAL NETWORKS–BASED SOFT-SENSOR MODELING OF POLYMERIZING PROCESS OPTIMIZED BY CULTURAL DIFFERENTIAL EVOLUTION ALGORITHM | |
WO2024029063A1 (ja) | 支援方法、支援装置、及び支援プログラム | |
Mohammadzadeh et al. | Neural Networks Training Based on Genetic Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240426 |