WO2022145106A1

WO2022145106A1 - 動作スケジュール生成装置、方法、プログラム及びシステム

Info

Publication number: WO2022145106A1
Application number: PCT/JP2021/038062
Authority: WO
Inventors: 亮輔川西
Original assignee: 東京ロボティクス株式会社
Priority date: 2020-12-28
Filing date: 2021-10-14
Publication date: 2022-07-07
Also published as: JP2022103968A

Abstract

一定の稼働サイクルで動作するシステムにおいて作業を行うロボットの動作スケジュールを生成する、動作スケジュール生成装置であって、前記ロボットの現在の動作状況を取得する、動作状況取得部と、前記作業に係る作業対象物に関する認識処理を行う、認識処理部と、前記認識処理の結果に基づいて、前記作業対象物毎に前記ロボットの推定動作時間を生成する、推定動作時間生成部と、前記稼働サイクル、前記動作状況及び前記推定動作時間に応じて、前記一定の稼働サイクルの下で前記ロボットを動作させることを可能とする動作スケジュールを生成する、動作スケジュール生成部と、を備える動作スケジュール生成装置が提供される。

Description

動作スケジュール生成装置、方法、プログラム及びシステム

　この発明は、一定の稼働サイクルで動作するシステム内で作業を行うロボットの動作スケジュールを生成する装置に関する。

　一定の稼働サイクルで動作するシステム内に、所定の作業を行うロボットを組み込むことが行われる。

　ところで、この種のロボットが行う作業の中には、その作業の所要時間がサイクル毎に毎回変動してしまう作業が存在する。例えば、作業内容がワークのピッキング作業である場合、把持対象となるワークの位置や姿勢、搬送経路等に応じて、その作業の所要時間は変動する。このような作業がシステム中に存在すると、システム全体の稼働サイクルに影響が及ぼすことがある。

　システム内で動作するロボットの例として、特許文献１には、搬送コンベアで搬送されてくるワークを複数のロボットにより取り出すシステムが開示されている。同文献においては、視覚センサによる認識処理の結果に基づいてワークを把持できるかを判断し、それにより、搬送コンベアの搬送速度を調整する技術が開示されている。

　すなわち、この例にあっては、システムの一部を構成するロボットがワークを把持できるかを判断することにより、搬送速度、すなわち、システム側の条件を変更し、ロボットによる把持動作を保証している。

特開２００５－１１１６０７号公報

　しかしながら、例えば特許文献１に記載の手法では、ロボットの作業時間に応じてシステム内の他の装置の稼働サイクルに変更を加える必要がある。その結果、例えば、システムとしての設計が複雑となったり、生産予測等が困難となってしまうおそれがあった。

　これに対して、所要時間の変動をロボットの側で吸収することも想定される。この場合、ロボットの各動作の最大所要時間を見積もり、それよりも稼働サイクルを大きくするようにしてシステム設計がなされる。しかしながら、このような設計とすると、各稼働サイクルにおいてロボットの停止時間が生じてしまい作業効率は低下する。また、作業効率を優先して稼働サイクルを最大所要時間近傍とすれば、少しの誤差等が生じれば、ロボットが稼働サイクル内に作業を完了することが出来ず、システムの停止や歩留まりの低下等を招くおそれがある。

　すなわち、従前の手法では、一定の稼働サイクルで動作するシステムにおいて、所要時間に変動のある動作を行うロボットを継続して運用することが困難であった。

　本発明は上述の技術的背景に鑑みてなされたものであり、その目的は、一定の稼働サイクルで動作するシステムにおいて、所要時間に変動のある動作を行うロボットを継続して運用することが可能な動作スケジュールを生成することにある。

　上述の技術的課題は、以下の構成を有する装置等により解決することができる。

　すなわち、本発明に係る動作スケジュール生成装置は、一定の稼働サイクルで動作するシステムにおいて作業を行うロボットの動作スケジュールを生成する、動作スケジュール生成装置であって、前記ロボットの現在の動作状況を取得する、動作状況取得部と、前記作業に係る作業対象物に関する認識処理を行う、認識処理部と、前記認識処理の結果に基づいて、前記作業対象物毎に前記ロボットの推定動作時間を生成する、推定動作時間生成部と、前記稼働サイクル、前記動作状況及び前記推定動作時間に応じて、前記一定の稼働サイクルの下で前記ロボットを動作させることを可能とする動作スケジュールを生成する、動作スケジュール生成部と、を備えている。

　このような構成によれば、システムの稼働サイクル、動作状況及び推定動作時間に応じてロボットの動作スケジュールが生成されるので、システム全体又はシステム内の他の装置の稼働サイクルを変更することなく、所要時間に変動のある動作を行うロボットを継続して運用することができる。

　前記稼働サイクルは、前記システムにおける生産時間を前記システムにおいて生産される製品の生産数で除したサイクルタイムであってもよい。

　このような構成によれば、一定のサイクルタイム下でロボットを動作させることが可能な動作スケジュールを生成することができる。

　前記動作スケジュールは、前記動作スケジュールを構成する各動作の完了時刻が、各稼働サイクル内に一度含まれるよう生成されてもよい。

　このような構成によれば、動作スケジュールを構成する各動作が、各稼働サイクル内で完了することを保証することができる。

　前記動作スケジュールは、前記動作スケジュールを構成する各動作の完了時刻が、各稼働サイクル内に一度含まれ、かつ、各稼働サイクル内の所定タイミングより前となるよう生成される、ものであってもよい。

　このような構成によれば、動作スケジュールを構成する各動作が、各稼働サイクル内で完了することを保証し、かつ、動作完了から次の稼働サイクルの開始までの余裕を確保することができる。これにより、動作をより安定的に継続することができる。

　前記動作スケジュールは、前記作業対象物毎の推定動作時間に応じて、前記作業対象物に対する作業順序を決定した動作スケジュールであってもよい。

　このような構成によれば、推定動作時間に応じて、作業対象物に対する作業順序が決定されるので、適切に作業順序を設定して、継続的な動作を担保することができる。

　前記動作スケジュールは、各前記動作の完了時刻から前記稼働サイクルの終端までの余裕時間が所定値以上となるように生成された動作スケジュールであってもよい。

　このような構成によれば、各稼働サイクル内において余裕をもって動作を完了させることができるので、動作をより安定的に継続させることができる動作スケジュールを提供することができる。

　各前記作業対象物の周辺環境を認識する環境認識処理部と、前記周辺環境の変動に応じて前記動作スケジュールの実行を中断させる中断処理部と、を備えるものであってもよい。

　このような構成によれば、環境が大きく変動した場合には、実行中の動作スケジュール一旦中断して、例えば、再スケジュール等を行うことができるので、動作をより安定的に継続させることができる動作スケジュールを提供することができる。

　前記動作スケジュール生成部は、さらに、前記認識処理の実行時間に基づいて、前記動作スケジュールを生成する、ものであってもよい。

　このような構成によれば、認識処理の実行時間も勘案して動作スケジュールを生成することができるので、動作スケジュール中に作業対象物の再度の認識等を行うことができ、動作をより安定的に継続させることができる動作スケジュールを生成することができる。

　前記動作スケジュールは、その終端において実行される前記認識処理を含む、ものであってもよい。

　このような構成によれば、終端において認識処理を行うので、動作完了時点における作業対象物等の状態を把握することができ、それにより、直ちに次の動作スケジュール等を生成することができる。

　前記動作状況と前記認識処理の結果に基づいて、各前記作業対象物に対して作業を行った場合の環境変動を予測する、環境変動予測処理部と、前記動作スケジュール生成部は、さらに、前記環境変動の予測結果に応じて、前記動作スケジュールを生成する、ものであってもよい。

　このような構成によれば、作業の結果として生じる環境変動を予測し、それに応じて動作スケジュールを生成するので、環境変動が少なくなるようにする等動作をより安定的に継続させることができる動作スケジュールを策定すること等が可能となる。

　前記作業対象物に関する認識処理の信頼度を生成する、信頼度生成部、をさらに備え、前記動作スケジュール生成部は、前記信頼度にさらに基づいて、前記動作スケジュールを生成する、ものであってもよい。

　このような構成によれば、認識精度が低い作業対象物に対する作業を見送ったり、動作に余裕がない場合には作業優先度を下げて時間的余裕がある場合に作業すること等が可能となるので、動作をより安定的に継続させることができる。

　前記認識処理部は、前記作業に係る作業対象物に関する認識処理を所定の領域内において行う、ものであってもよい。

　このような構成によれば、所定領域のみ認識処理を行うので、高効率かつ高速に認識処理を行うことができる。

　前記領域は、それより前の認識処理による認識結果から変動がある領域である、ものであってもよい。

　変動がない領域についてはそれより前に行った認識結果を利用することができるので、高効率かつ高速な認識処理を行うことができる。

　前記動作スケジュール又は前記動作スケジュールと関連する情報と、前記動作スケジュールの実行結果に基づいて所定の学習処理を行う、学習処理部、をさらに備える、ものであってもよい。

　このような構成によれば、実行結果を元に学習処理を行うので、漸次的に動作スケジュールを改善することができる。

　前記動作スケジュール生成部は、さらに、前記学習処理の結果に基づいて、前記動作スケジュールを生成する、ものであってもよい。

　前記学習処理は、強化学習処理である、ものであってもよい。

　このような構成によれば、試行を繰り返すことにより漸次的に動作スケジュールを改善することができる。

　前記強化学習処理における評価指標は、一定の稼働サイクルの下で前記ロボットを動作させたときの安定性に関する指標である、ものであってもよい。

　このような構成によれば、評価を大きくするよう強化学習が進行するので、一定の稼働サイクルの下で前記ロボットを安定的に動作させることができるような動作スケジュールを生成することを漸次的に実現することができる。

　本発明は方法として観念することもできる。すなわち、本発明に係る方法は、一定の稼働サイクルで動作するシステムにおいて作業を行うロボットの動作スケジュールを生成する、動作スケジュール生成方法であって、前記ロボットの現在の動作状況を取得する、動作状況取得ステップと、前記作業に係る作業対象物に関する認識処理を行う、認識処理ステップと、前記認識処理の結果に基づいて、前記作業対象物毎に前記ロボットの推定動作時間を生成する、推定動作時間生成ステップと、前記稼働サイクル、前記動作状況及び前記推定動作時間に応じて、前記一定の稼働サイクルの下で前記ロボットを動作させることを可能とする動作スケジュールを生成する、動作スケジュール生成ステップと、を備える、ものであってもよい。

　本発明はコンピュータプログラムとして観念することもできる。すなわち、本発明に係るプログラムは、一定の稼働サイクルで動作するシステムにおいて作業を行うロボットの動作スケジュールを生成する、動作スケジュール生成プログラムであって、前記ロボットの現在の動作状況を取得する、動作状況取得ステップと、前記作業に係る作業対象物に関する認識処理を行う、認識処理ステップと、前記認識処理の結果に基づいて、前記作業対象物毎に前記ロボットの推定動作時間を生成する、推定動作時間生成ステップと、前記稼働サイクル、前記動作状況及び前記推定動作時間に応じて、前記一定の稼働サイクルの下で前記ロボットを動作させることを可能とする動作スケジュールを生成する、動作スケジュール生成ステップと、を備えている。

　本発明はシステムとして観念することもできる。すなわち、本発明に係るシステムは、一定の稼働サイクルで動作するシステムにおいて作業を行うロボットの動作スケジュールを生成する、動作スケジュール生成システムであって、前記ロボットの現在の動作状況を取得する、動作状況取得部と、前記作業に係る作業対象物に関する認識処理を行う、認識処理部と、前記認識処理の結果に基づいて、前記作業対象物毎に前記ロボットの推定動作時間を生成する、推定動作時間生成部と、前記稼働サイクル、前記動作状況及び前記推定動作時間に応じて、前記一定の稼働サイクルの下で前記ロボットを動作させることを可能とする動作スケジュールを生成する、動作スケジュール生成部と、を備えている。

　本発明によれば、一定の稼働サイクルで動作するシステムにおいて、所要時間に変動のある動作を行うロボットを継続して運用することが可能な動作スケジュールを生成することができる。

図１は、システムの概要について示す全体構成図である。図２は、情報処理装置の機能ブロック図（第１の実施形態）である。図３は、動作スケジュール生成処理に関するフローチャート（第１の実施形態）である。図４は、動作スケジュールの一例に関する概念図である。図５は、所要時間が小さい要素動作を配置する例についての説明図である。図６は、各要素動作の開始を稼働サイクルの始期に合わせるようにした構成についての説明図である。図７は、情報処理装置の機能ブロック図（第２の実施形態）である。図８は、動作スケジュール生成処理に関するフローチャート（第２の実施形態）である。図９は、情報処理装置の機能ブロック図（第３の実施形態）である。

　以下、本発明の好適な実施の形態について添付の図を参照しつつ詳細に説明する。

　（１．第１の実施形態）
第１の実施形態として、本発明を、工場内のシステム１００に対して適用した例について説明する。なお、本実施形態においては、工場内における作業を例示するが、本発明はこのような構成に限定されない。従って、例えば、物流倉庫内のシステム等あらゆるシステムに適用することができる。

　（１．１　構成）
図１は、本実施形態に係るシステム１００の概要について示す全体構成図である。同図から明らかな通り、システム１００の一部において、ロボットアーム１は、所定の箱４内の対象物（ワーク）４１を把持（ピッキング）して取り出し、ベルトコンベア９上に配置する動作（タスク）を実行する。このとき、システム１００は、一定のサイクルで稼働しており、これに応じてベルトコンベア９も一定の速度で作動している。このサイクルは、例えば、生産時間をシステム１００において生産される製品の生産数で除したサイクルタイムであってもよい。

　なお、本実施形態においては、ロボットアーム１を用いるものの他の機能・用途を有するロボットを利用してもよい。また、タスクはピッキングに限定されず、他の種々のタスクを含む。

　ロボットアーム１は、システム１００の上位制御装置８と有線又は無線で接続されている。上位制御装置８からは、例えば、ベルトコンベア９を含む製造ラインとの同期をとるための同期信号等が提供される。上位制御装置８は、ＣＰＵ等の制御部、ＲＯＭ、ＲＡＭ又はフラッシュメモリ等の記憶部、通信ユニット、入出力部、等を備える情報処理装置である。

　また、同図の例にあっては、ロボットアーム１は、ロボットアーム１の動作を制御する情報処理装置６と有線又は無線により接続されている。この情報処理装置６は、ＣＰＵ等の制御部、ＲＯＭ、ＲＡＭ又はフラッシュメモリ等の記憶部、通信ユニット、入出力部、等を備える情報処理装置であり、例えば、後述の動作スケジュール等を生成する。ロボットアーム１は、生成された動作スケジュールに応じて動作する。

　情報処理装置６は、３次元情報を取得することが可能な３次元センサ５と接続されておりセンサ情報を取得する。３次元センサ５は、対象物４１が乱雑に格納された箱４の中の全体をその画角内に収めるように撮影を行いセンサ情報を生成する。生成されたセンサ情報は情報処理装置６へと送信される。

　なお、センサは、対象物４１の状態を検出することができるセンサであればいずれのセンサを採用してもよい。従って、２次元情報を取得するものであってもよく、撮像を伴わないセンサであってもよい。また、複数のセンサを設ける構成としてもよい。さらに、センサは対象物４１を環境固定式のものでなくてもよく、例えば、ロボットアーム１の手先に取り付けられる手先カメラ等であってもよい。

　図２は、本実施形態に係る情報処理装置６の機能ブロック図である。同図から明らかな通り、情報処理装置６は、認識処理部６１、動作生成部６２、動作時間推定部６３、動作スケジュール生成部６５、情報取得部６４、及び動作実行部６６を備えている。

　３次元センサ５から取得されたセンサ情報に基づいて認識処理部は、対象物４１に関する認識処理を行う。認識結果は、動作生成部６２へと提供され、動作生成部６２は認識結果に基づいてロボットアーム１の動作を生成する。この動作は、本実施形態においては、箱４内の各対象物４１のうちの１つを把持してベルトコンベア９上へと配置する動作である。

　生成された動作は、動作時間推定部６３へと提供される。動作時間推定部６３は、生成された各動作に要する時間（推定動作時間）を推定する処理を行う。推定動作時間は、動作スケジュール生成部６５へと提供される。

　また、情報取得部６４は、上位制御装置８から提供される同期信号等に基づいて、システム全体の稼働サイクルに関する情報やロボットアーム１の現在の状態（ロボットアーム１が現在行っている動作等）の種々の情報を取得する。これらの情報も、動作スケジュール生成部６５へと提供される。

　動作スケジュール生成部６５は、動作時間推定部６３、情報取得部６４等から提供された情報に基づいて最適な動作スケジュールを生成する。生成された動作スケジュールは、動作実行部６６へと提供される。この動作実行部からの出力に基づいて、ロボットアーム１は動作する。

　なお、上述のシステム及び情報処理装置６の構成は例示であり、様々に変形して実施することができる。例えば、一部の機能を他の装置で実行すること等により処理を分散したり、機能を集約することにより一の装置で実行する等、変形することが可能である。

　（１．２　動作）
続いて、上述の構成を有するシステム１００において動作する情報処理装置６の動作について説明する。

　図３は、情報処理装置６上で実行される動作スケジュール生成処理に関するフローチャートである。同図から明らかな通り、処理が開始すると、認識処理部６１は、対象物４１が乱雑に格納された箱４の中の全体をその画角内に収めるように撮影を行っている３次元センサ５から、３次元センサ情報を取得する（Ｓ１０）。

　この３次元センサ情報を取得した後、認識処理部６１は、３次元センサ情報に基づいて、物体認識処理を行い（Ｓ１２）、箱４内の１又は複数の対象物４１を認識する。

　動作生成部６２は、認識処理の結果に基づいて、対象物４１毎に動作を生成する処理を行う（Ｓ１４）。すなわち、本実施形態においては、ロボットアーム１において所定の姿勢から対象物４１のピッキングを行いベルトコンベア９上へと載置するまでの各関節の時系列の変位等を生成する処理が行われる。

　その後、動作時間推定部６３は、対象物４１毎にロボットアーム１のハードウェアに関する情報と生成された動作に基づいて、当該動作に要する推定動作時間を生成する（Ｓ１６）。推定動作時間は、例えば、搬送距離を移動速度で除した値等であってもよい。この推定動作時間は、動作スケジュール生成部６５へと提供される。

　情報取得部６４は、上位制御装置８からシステム１００全体又はシステム内の他の装置（ベルトコンベア９等）の稼働サイクルに関する同期信号や、ロボットアーム１の各関節等に設けられたセンサから取得される動作状況情報を取得し、動作スケジュール生成部６５へと提供する（Ｓ１７）。なお、動作状況情報は、本実施形態の例に限定されず、ロボットアーム１の状態を表すあらゆる情報を含む。

　動作時間推定部６３及び情報取得部６４からの情報を取得した動作スケジュール生成部は、それらの情報に基づいて、所定の条件を満たすロボットアーム１の動作スケジュールを生成する（Ｓ１８）。

　動作実行部６６は、生成された動作スケジュールに基づいてロボットアーム１へと指令を行う（Ｓ２０）。ロボットアーム１はこの指令に沿って動作を行う。一連の処理が完了すると、処理は再び３次元センサ情報の取得処理（Ｓ１０）へと戻り、以後、終了指令又は中断指令がなされるまで、処理は繰り返される。

　上述の動作スケジュールに関する条件は、一定のサイクルで稼働するシステム１００内において所要時間に変動のある作業を行うロボットアーム１の継続的な動作を保証する条件であり、様々な条件が設定され得る。例えば、動作スケジュールに関する条件は、各要素動作の完了時刻が各稼働サイクル内に一度存在することであってもよい。

　図４は、動作スケジュール生成部６５により生成される動作スケジュールの一例に関する概念図である。同図上段には、一定の稼働サイクルを示す均一な長さの複数の矢印が示され、同図下段には、生成された動作スケジュールが示されている。同図の例にあって、動作スケジュールは、対象物（ワーク）をピッキングする要素動作を複数配置して成り、具体的には、Ａという対象物４１をピッキングして載置するまでの動作に要する時間が「ワークＡ」という矢印で、Ｂという対象物４１をピッキングして載置するまでの動作に要する時間が「ワークＢ」という矢印で、Ｃという対象物４１をピッキングして載置するまでの動作に要する時間が「ワークＣ」、Ｄという対象物４１をピッキングして載置するまでの動作に要する時間が「ワークＤ」、認識処理に要する時間が「認識」として示されている。

　なお、本実施形態においては、認識処理が要素動作に含まれているが、認識処理は別途、常時又定期的に行うものとして、要素動作に含めなくてもよい。

　同図における各要素動作は、所定の将来時間までの間において、各要素動作の所要時間に基づいて、各稼働サイクル中に一度だけ対象物４１（ワーク）に関する動作が行われるよう、順番を調整して配置されたものである（ワークＡ→ワークＢ→ワークＣ→ワークＤ→認識処理）。すなわち、この例にあっては、所定の条件は、各要素動作の完了時刻が各稼働サイクル内に一度存在することである。

　このような構成によれば、システム１００の稼働サイクル、ロボットアーム１の動作状況及び推定動作時間に応じてロボットアーム１の動作スケジュールが生成されるので、システム１００全体の稼働サイクルを変更することなく、所要時間に変動のある動作を行うロボットアーム１を継続して運用することができる。

　なお、動作スケジュールに関する条件は、本実施形態のものに限定されず、様々に変形することができる。

　例えば、所定の条件は、各要素動作の完了時刻が各稼働サイクル内に一度存在し、かつ、各動作の完了時刻から各稼働サイクルの終端までの余裕時間が所定値以上となることという条件としてもよい。

　また、所定の条件は、動作スケジュールを構成する要素動作のうち所要時間が最も小さい要素動作、若しくは、所定値以下の所要時間を有する１又は複数の要素動作を特定し、当該要素動作を、上記余裕時間が所定値以下となる動作の直後に配置するような条件としてもよい。

　図５は、余裕時間が所定値以下となる場合に、所要時間が小さい要素動作を配置する例についての説明図である。

　同図上段の図から明らかな通り、単に各稼働サイクル中に一度だけ対象物４１（ワーク）に関する動作が行われるという条件の下に順番を決定して動作スケジュールを生成した場合、所要時間の小さいワークＣが存在する場合、ワークＢに対する要素動作とワークＣに対する要素動作との間には待機時間が発生してしまう。これにより、システムとしての効率性が低下してしまう。

　これに対して、同図下段の図においては、直前のワークＥに対する要素動作の完了時刻が稼働サイクルの終端と接近して余裕時間が小さいことから、その直後にワークＣに対する要素動作が配置されている。

　このような構成によれば、遅れを取り戻すような動作スケジュールの生成が可能となる。また、動作スケジュールを効率化することができるので、より短い稼働サイクル（同図中の破線矢印を参照）で動作させることが可能なロボットアーム１を提供することができる。

　さらに、本実施形態においては、各要素動作間には隙間を空けない構成としているが、このような構成に限定されない。

　図６は、各要素動作の開始を稼働サイクルの始期に合わせるようにした構成についての説明図である。同図から明らかな通り、この場合には、ロボットアーム１に対して停止時間が生じることとなるが、動作スケジュールの設計は容易となる。

　（２．第２の実施形態）
続いて、本発明の第２の実施形態について説明する。

　（２．１　構成）
第２の実施形態に係るシステムの全体構成は、第１の実施形態に係るシステム１００の全体構成（図１）と略同一であるので、説明を省略する。

　図７は、本実施形態に係る情報処理装置６の機能ブロック図である。同図から明らかな通り、情報処理装置６は、認識処理部６１０、動作生成部６２０、動作時間推定部６３０、動作スケジュール生成部６５０、情報取得部６４０、及び動作実行部６６０を備えているものの、本実施形態ではさらに、評価情報生成部６７０を備えている。また、認識処理部６１０にはさらに認識領域特定処理部６１１が設けられている。なお、第１の実施形態と対応する構成は略同一の動作を行うものであるので、以下、詳細説明は省略する。

　評価情報生成部６７０は、認識処理の結果に基づいて、後述の評価情報を生成し動作スケジュール生成部６５０に対して提供する。なお、評価情報生成部は、ロボットアーム１の動作により対象物４１に生じる環境変動を予測する環境変動予測処理部６７１と、認識結果に対する信頼度等を生成する信頼度評価部６７２とを備えている。

　また、認識領域特定処理部６１１は、認識処理部に対して、認識すべき領域を特定して提供する。

　（２．２　動作）
次に、本実施形態に係る情報処理装置６の動作について説明する。図８は、情報処理装置６上で実行される動作スケジュール生成処理に関するフローチャートである。同図から明らかな通り、処理が開始すると、第１の実施形態と同様、認識処理部６１０は、３次元センサ５から３次元センサ情報を取得する処理を行う（Ｓ２０）。

　この取得処理の後、認識領域特定処理部６１１は、認識すべき領域を特定する。この特定処理は、例えば、前回の認識処理を行ったときから所定量以上の変化がある領域のみを認識領域として特定する。なお、領域特定手法はこのような方法に限定されず当業者に知られる他の種々の手法が利用可能である。

　このような構成によれば、変化がない領域については認識処理を行わないので、高効率かつ高速に認識処理を行うことができる。

　その後、認識処理部６１０は、認識領域内において物体認識処理を行う（Ｓ２１）。物体認識処理の後、第１の実施形態と同様に、対象物４１毎の動作の生成処理（Ｓ２４）、対象物４１毎の動作時間の推定処理が行われる（Ｓ２６）。

　環境変動予測処理部６７１は、対象物４１毎に、要素動作によりその対象物４１周辺の環境に対して生じる変動を予測する処理を行う（Ｓ２７）。例えば、所定の対象物４１に対してピッキング動作を行うことにより、その周囲の対象物４１が転がったり対象物４１から成る山が崩れること等により生じる状態の変動やその程度を予測する。予測処理結果は、動作スケジュール生成部６５０へと提供される。

　また、信頼度評価部６７２は、対象物４１毎の認識結果の信頼度を生成する（Ｓ２８）。認識結果の信頼度は、認識処理の精度に相当する値である。なお、信頼度の生成は、当業者に知られる種々の手法を利用することができる。例えば、認識処理が学習済モデル等を利用して行われる場合には、予測誤差量等の指標に基づいて信頼度を生成してもよい。生成された信頼度は、動作スケジュール生成部６５０へと提供される。

　情報取得部６４は、上位制御装置８からシステム１００全体の稼働サイクルに関する同期信号やロボットアーム１の各関節等に設けられたセンサから取得される情報を取得し、動作スケジュール生成部６５０へと提供する（Ｓ２９）。

　動作時間推定部６３０、情報取得部６４０及び評価情報生成部６７０からの情報を取得した動作スケジュール生成部６５０は、それらの情報に基づいて、所定の条件を満たすロボットアーム１の動作スケジュールを生成する（Ｓ３０）。

　動作実行部６６０は、第１の実施形態と同様に、生成された動作スケジュールに基づいてロボットアーム１へと指令を行う（Ｓ３１）。一連の処理が完了すると、処理は再び３次元センサ情報の取得処理（Ｓ２０）へと戻り、以後、終了指令又は中断指令がなされるまで、処理は繰り返される。

　本実施形態において、動作スケジュールに関する所定の条件は、各要素動作の完了時刻が各稼働サイクル内に一度存在することという条件の他、環境変動が小さいと予測される対象物４１を優先的にピッキングすること、及び信頼度が小さい又は所定値以下の対象物４１に対するピッキング動作の優先度を下げるか又はピッキングを行わないことである。これらの複数の条件を同時に満たすよう動作スケジュールは決定される。

　このような条件とすることにより、要素動作を行うことにより大きな環境変動が生じるおそれを小さくすることができるので、動作をより安定的に継続させることができる。また、認識の信頼度が低い対象物に対する要素動作の優先度を下げるか又は要素動作を行わないので、動作をより安定的に継続させることができる。

　なお、動作スケジュールに関する所定の条件は、様々に変形することができ、例えば、環境変動が所定値以上と予想される対象物４１に対しては要素動作を行わない等といった条件であってもよい。

　（３．第３の実施形態）
次に、第３の実施形態について説明する。

　第３の実施形態に係るシステムの全体構成は、第１の実施形態に係るシステム１００の全体構成（図１）と略同一であるので、説明を省略する。

　図９は、本実施形態に係る情報処理装置６の機能ブロック図である。同図から明らかな通り、情報処理装置６は、第２の実施形態と同様に、認識処理部６１０、動作生成部６２０、動作時間推定部６３０、動作スケジュール生成部６５０、情報取得部６４０、及び動作実行部６６０、評価情報生成部６７０を備えている。しかしながら、本実施形態において、情報処理装置６は、さらに、学習処理部６８０を備えている。なお、第２の実施形態と対応する構成は略同一の動作を行うものであるので、以下、詳細説明は省略する。

　本実施形態においても、第２の実施形態と略同一の動作を行うものの、本実施形態においては、学習処理部６８０は、さらに、生成される動作スケジュールがより動作の継続性をもたらすものとなるよう学習する機械学習処理を行う。その学習処理の結果は、動作スケジュール生成部６５０における動作スケジュールの生成に利用される。

　学習手法は、公知の種々の手法を利用することができる。例えば、教師あり学習を用いてもよいし強化学習を用いてもよい。また、ニューラルネットワーク（又は深層学習）を利用してもよいし他の種々の公知の学習アルゴリズムを利用してもよい。

　本実施形態においては、動作の継続性に関する評価指標として、決定した動作スケジュールと、実際の実行結果に基づいて強化学習を行う。動作の継続性に関する評価指標とは、例えば、認識された対象物４１の個数、推定動作時間、余裕時間等が挙げられる。この場合、認識された対象物４１の個数又は余裕時間が大きい程、或いは、推定動作時間が小さい程、動作の継続性が高いものとして高い報酬が与えられる。また、入力データは、例えば、動作スケジュール生成部６５０へと提供される種々の情報である。これにより、動作スケジュールの策定ポリシー、すなわち、要素動作の配置に関する方針を学習する。学習後、学習済モデルは動作スケジュール生成部６５０において利用され、所定の入力データに応じて、適切な動作スケジュールが生成される。

　このような構成によれば、評価指標を大きくするよう強化学習が進行するので、一定の稼働サイクルの下で前記ロボットを安定的に動作させることができるような動作スケジュールの生成を漸次的に実現することができる。

　（２．変形例）
上述の実施形態においては、各要素動作に対して一の対象物４１（ワーク）を対象とする構成としたが、本発明はこのような構成に限定されない。従って、例えば、各要素動作において複数のワークを対象とする構成等としてもよい。

　上述の実施形態においては、動作スケジュールを生成した後は、当該動作スケジュールに沿ってロボットアーム１を継続的に動作させる構成としたが、本発明はこのような構成に限定されない。従って、例えば、所定の事象の発生により動作スケジュールの実行を中断し、再度認識処理を行って動作スケジュール生成する構成としてもよい。所定の事象とは、例えば、３次元センサ等により取得される環境情報が所定量以上変動した場合等である。

　以上、本発明の実施形態について説明したが、上記実施形態は本発明の適用例の一部を示したに過ぎず、本発明の技術的範囲を上記実施形態の具体的構成に限定する趣旨ではない。また、上記の実施形態は、矛盾が生じない範囲で適宜組み合わせ可能である。

　また、本明細書で示すフローチャートの各ステップの順番は、技術的矛盾を生じない限り、相互に入れ替えることができる。

　本発明は、少なくともロボットを含むシステムを製造等する産業において利用可能である。

　１　ロボットアーム
　４　箱
　４１　対象物
　５　３次元センサ
　６　情報処理装置
　６１　認識処理部
　６２　動作生成部
　６３　動作時間推定部
　６４　情報取得部
　６５　動作スケジュール生成部
　６６　動作実行部
　８　上位制御装置
　９　ベルトコンベア
　１００　システム

Claims

　一定の稼働サイクルで動作するシステムにおいて作業を行うロボットの動作スケジュールを生成する、動作スケジュール生成装置であって、
　前記ロボットの現在の動作状況を取得する、動作状況取得部と、
　前記作業に係る作業対象物に関する認識処理を行う、認識処理部と、
　前記認識処理の結果に基づいて、前記作業対象物毎に前記ロボットの推定動作時間を生成する、推定動作時間生成部と、
　前記稼働サイクル、前記動作状況及び前記推定動作時間に応じて、前記一定の稼働サイクルの下で前記ロボットを動作させることを可能とする動作スケジュールを生成する、動作スケジュール生成部と、を備える、動作スケジュール生成装置。
　前記稼働サイクルは、前記システムにおける生産時間を前記システムにおいて生産される製品の生産数で除したサイクルタイムである、請求項１に記載の動作スケジュール生成装置。
　前記動作スケジュールは、前記動作スケジュールを構成する各動作の完了時刻が、各稼働サイクル内に一度含まれるよう生成される、請求項１に記載の動作スケジュール生成装置。
　前記動作スケジュールは、前記動作スケジュールを構成する各動作の完了時刻が、各稼働サイクル内に一度含まれ、かつ、各稼働サイクル内の所定タイミングより前となるよう生成される、請求項３に記載の動作スケジュール生成装置。
　前記動作スケジュールは、前記作業対象物毎の推定動作時間に応じて、前記作業対象物に対する作業順序を決定した動作スケジュールである、請求項１に記載の動作スケジュール生成装置。
　前記動作スケジュールは、各前記動作の完了時刻から前記稼働サイクルの終端までの余裕時間が所定値以上となるように生成された動作スケジュールである、請求項１に記載の動作スケジュール生成装置。
　各前記作業対象物の周辺環境を認識する環境認識処理部と、
　前記周辺環境の変動に応じて前記動作スケジュールの実行を中断させる中断処理部と、を備える、請求項１に記載の動作スケジュール生成装置。
　前記動作スケジュール生成部は、さらに、前記認識処理の実行時間に基づいて、前記動作スケジュールを生成する、請求項１に記載の動作スケジュール生成装置。
　前記動作スケジュールは、その終端において実行される前記認識処理を含む、請求項８に記載の動作スケジュール生成装置。
　前記動作状況と前記認識処理の結果に基づいて、各前記作業対象物に対して作業を行った場合の環境変動を予測する、環境変動予測処理部と、
　前記動作スケジュール生成部は、さらに、前記環境変動の予測結果に応じて、前記動作スケジュールを生成する、請求項１に記載の動作スケジュール生成装置。
　前記作業対象物に関する認識処理の信頼度を生成する、信頼度生成部、をさらに備え、
　前記動作スケジュール生成部は、前記信頼度にさらに基づいて、前記動作スケジュールを生成する、請求項１に記載の動作スケジュール生成装置。
　前記認識処理部は、前記作業に係る作業対象物に関する認識処理を所定の領域内において行う、請求項１に記載の動作スケジュール生成装置。
　前記領域は、それより前の認識処理による認識結果から変動がある領域である、請求項１２に記載の動作スケジュール生成装置。
　前記動作スケジュール又は前記動作スケジュールと関連する情報と、前記動作スケジュールの実行結果に基づいて所定の学習処理を行う、学習処理部、をさらに備える、請求項１に記載の動作スケジュール生成装置。
　前記動作スケジュール生成部は、さらに、前記学習処理の結果に基づいて、前記動作スケジュールを生成する、請求項１４に記載の動作スケジュール生成装置。
　前記学習処理は、強化学習処理である、請求項１４に記載の動作スケジュール生成装置。
　前記強化学習処理における評価指標は、一定の稼働サイクルの下で前記ロボットを動作させたときの安定性に関する指標である、請求項１６に記載の動作スケジュール生成装置。
　一定の稼働サイクルで動作するシステムにおいて作業を行うロボットの動作スケジュールを生成する、動作スケジュール生成方法であって、
　前記ロボットの現在の動作状況を取得する、動作状況取得ステップと、
　前記作業に係る作業対象物に関する認識処理を行う、認識処理ステップと、
　前記認識処理の結果に基づいて、前記作業対象物毎に前記ロボットの推定動作時間を生成する、推定動作時間生成ステップと、
　前記稼働サイクル、前記動作状況及び前記推定動作時間に応じて、前記一定の稼働サイクルの下で前記ロボットを動作させることを可能とする動作スケジュールを生成する、動作スケジュール生成ステップと、を備える、動作スケジュール生成方法。
　一定の稼働サイクルで動作するシステムにおいて作業を行うロボットの動作スケジュールを生成する、動作スケジュール生成プログラムであって、
　前記ロボットの現在の動作状況を取得する、動作状況取得ステップと、
　前記作業に係る作業対象物に関する認識処理を行う、認識処理ステップと、
　前記認識処理の結果に基づいて、前記作業対象物毎に前記ロボットの推定動作時間を生成する、推定動作時間生成ステップと、
　前記稼働サイクル、前記動作状況及び前記推定動作時間に応じて、前記一定の稼働サイクルの下で前記ロボットを動作させることを可能とする動作スケジュールを生成する、動作スケジュール生成ステップと、を備える、動作スケジュール生成プログラム。
　一定の稼働サイクルで動作するシステムにおいて作業を行うロボットの動作スケジュールを生成する、動作スケジュール生成システムであって、
　前記ロボットの現在の動作状況を取得する、動作状況取得部と、
　前記作業に係る作業対象物に関する認識処理を行う、認識処理部と、
　前記認識処理の結果に基づいて、前記作業対象物毎に前記ロボットの推定動作時間を生成する、推定動作時間生成部と、
　前記稼働サイクル、前記動作状況及び前記推定動作時間に応じて、前記一定の稼働サイクルの下で前記ロボットを動作させることを可能とする動作スケジュールを生成する、動作スケジュール生成部と、を備える、動作スケジュール生成システム。