JP7237249B1

JP7237249B1 - ロボット制御装置、ロボット制御方法およびロボット制御プログラム

Info

Publication number: JP7237249B1
Application number: JP2022544412A
Authority: JP
Inventors: 浩司白土; 清石前川
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2022-02-25
Filing date: 2022-02-25
Publication date: 2023-03-10
Anticipated expiration: 2042-02-25
Also published as: WO2023162124A1; JPWO2023162124A1

Abstract

ロボット制御装置（１０）は、ロボットのハンドをロボットが目的位置に到達させるまでに要する時間であるロボット動作時間と、ハンドの動作が指令された時点から目的位置においてハンドが対象物を把持する動作を終えるまでの時間であるハンド動作時間とを予測する動作時間予測部（１１）と、予測されたロボット動作時間と予測されたハンド動作時間とに基づいて決定されたタイミングでのハンドの動作開始を指示するハンド動作開始指示部（１３）と、を備える。動作時間予測部（１１）は、ロボットの制御系の特性を示すロボット制御系情報を組み入れた計算によりロボット動作時間を予測する。

Description

本開示は、ロボットを制御するロボット制御装置、ロボット制御方法およびロボット制御プログラムに関する。

ロボットの先端部に取り付けられた把持装置すなわちハンドにより物を把持して、把持した物を指定された位置へ搬送するロボットが知られている。このようなロボットは、電気電子分野での組み立て作業または工作機械からの加工物の取り出し作業、食品分野での盛り付け作業、あるいは、物流分野での積み替え作業などに使用される。以下、ハンドによって把持される物を、対象物と称する。ロボットによる搬送作業では、まず、計測装置の使用により認識された対象物の位置、または、プログラムによってあらかじめ指定された位置にロボットが位置決めされる。そして、ハンドが命令を実行することにより、ハンドが動作を開始する。ハンドが対象物を把持してから、あらかじめ指定された待ち時間が経過した後に、ロボットは、次の動作を開始する。かかる一連の把持動作においては、ハンドが命令を実行するタイミング、または待ち時間の長さを最適化することで、ロボットおよびハンドによる把持動作に要する動作時間を短縮することが望まれている。

特許文献１には、対象物の位置である目標位置にロボットが到達する前にハンドによる動作を開始させるロボット制御装置が開示されている。特許文献１のロボット制御装置は、ハンドの動作に要する時間であるハンド動作時間よりも目標位置にロボットが到達するまでの移動時間が短くなった時点で、ハンドによる動作を開始させる。具体的には、特許文献１のロボット制御装置は、ロボットを動作させるロボット動作指令を基に、ロボットの現在位置から目標位置までの移動時間を予測し、予測された移動時間とハンド動作時間とを比較する。特許文献１のロボット制御装置は、予測された移動時間がハンド動作時間よりも短くなった時点で、ハンドへ命令を出力する。

特開２０００－７８７号公報

ロボットがハンドを目標位置へ移動させるまでの時間は、ロボット動作指令のみによって決まるのではなく、ロボット制御系の特性に起因するロボットの動作の遅れによって変動する。ロボット制御系の特性による遅れ時間の長さは、ロボットの各軸の速度または加速度によって変動する。ロボットの位置または姿勢によってロボット制御系のパラメータを可変とする場合は、ロボットの位置または姿勢が変わることによって遅れ時間の長さが変動する。ロボット動作指令を基に予測された移動時間には、実際の移動時間に対して誤差が生じることとなる。このため、ハンドの動作を指示するタイミングを決定するためには、熟練者による長時間に及ぶ調整が必要であった。このように、特許文献１に開示されている従来の技術によると、対象物を把持する把持動作に要する時間を短縮するために、ハンドの動作を指示するタイミングを正確に調整することが困難であるという問題があった。

本開示は、上記に鑑みてなされたものであって、ロボットおよびハンドによる把持動作に要する時間を短縮するために、ハンドの動作を指示するタイミングを正確に調整可能とするロボット制御装置を得ることを目的とする。

上述した課題を解決し、目的を達成するために、本開示にかかるロボット制御装置は、ロボットのハンドをロボットが目的位置に到達させるまでに要する時間であるロボット動作時間と、ハンドの動作が指令された時点から目的位置においてハンドが対象物を把持する動作を終えるまでの時間であるハンド動作時間とを予測する動作時間予測部と、予測されたロボット動作時間と予測されたハンド動作時間とに基づいて決定されたタイミングでのハンドの動作開始を指示するハンド動作開始指示部と、を備える。動作時間予測部は、ロボットの制御系の応答性を決定する制御パラメータを含むロボット制御系情報を組み入れた計算によりロボット動作時間を予測する。

本開示にかかるロボット制御装置は、ロボットおよびハンドによる把持動作に要する時間を短縮するために、ハンドの動作を指示するタイミングを正確に調整できるという効果を奏する。

実施の形態１にかかるロボット制御装置の構成例を示す図実施の形態１にかかるロボット制御装置を含むロボット制御システムの構成例を示す図実施の形態１にかかるロボット制御装置の動作時間予測部によって予測されるロボット動作時間について説明するための図実施の形態１にかかるロボット制御装置による、ハンドの動作開始の指示とロボットの動作開始の指示とについて説明するための図実施の形態１にかかるロボット制御装置の動作手順を示すフローチャート実施の形態２にかかるロボット制御装置の構成例を示す図実施の形態３にかかるロボット制御装置の構成例を示す図実施の形態５にかかるロボット制御装置の構成例を示す図実施の形態６にかかるロボット制御装置の構成例を示す図実施の形態６にかかるロボット制御装置が有する把持制御パラメータ学習部のうち、学習装置および学習済モデル記憶部を示す図実施の形態６における機械学習に使用されるニューラルネットワークの構成例を示す図実施の形態６にかかるロボット制御装置が有する把持制御パラメータ学習部のうち、推論装置および学習済モデル記憶部を示す図実施の形態７にかかるロボット制御装置の構成例を示す図実施の形態１から７にかかる制御回路の構成例を示す図実施の形態１から７にかかる専用のハードウェア回路の構成例を示す図

以下に、実施の形態にかかるロボット制御装置、ロボット制御方法およびロボット制御プログラムを図面に基づいて詳細に説明する。

実施の形態１．
図１は、実施の形態１にかかるロボット制御装置１０の構成例を示す図である。図２は、実施の形態１にかかるロボット制御装置１０を含むロボット制御システム４０の構成例を示す図である。

ロボット制御システム４０は、ロボット制御装置１０と、ロボット３０と、ハンド３１とを備える。ハンド３１は、ロボット３０を構成するアームの先端部に取り付けられている。ロボット制御装置１０は、ロボット３０を制御する。ロボット制御システム４０は、ロボット３０およびハンド３１の動作によって対象物を把持して、把持した対象物を指定した位置へ搬送する。図２に示すロボット制御システム４０は、箱に入れられている対象物を取り出して、箱の外の指定された位置へ対象物を搬送する。

ロボット制御システム４０の周辺機器として、ビジョンセンサといったセンシングデバイスが設置される。センシングデバイスは、対象物の位置を認識する。ロボット制御装置１０は、対象物の位置の情報をセンシングデバイスから取得し、取得された情報を基にロボット指令を生成する。ロボット制御装置１０は、ロボット３０の駆動部へロボット動作指令を送る。駆動部の図示は省略する。駆動部がロボット動作指令に従ってロボット３０を駆動することにより、ロボット３０は、ロボット動作指令に従って動作する。

ハンド３１は、ハンド制御装置によって制御される。ハンド制御装置の図示は省略する。ハンド３１は、ハンド制御装置から送られるハンド動作指令に従って動作する。ロボット制御システム４０は、ハンド制御装置を用いず、ロボット制御装置１０がロボット３０およびハンド３１の双方を制御しても良い。

実施の形態１において、ハンド３１は、開閉動作を行う２つの可動部を備える。ハンド３１は、互いに向かい合う２つの可動部で対象物を掴むことで、対象物を把持する。ハンド３１は、各可動部が互いに近づく向きに移動する閉動作によって、対象物を掴む。ハンド３１は、対象物を掴んでいる状態から各可動部が互いに離れる向きに移動する開動作によって、掴んでいる対象物を離す。なお、ハンド３１は、２つの可動部を備えるものに限られない。ハンド３１に備えられる可動部の数は２つに限られず任意であるものとする。また、ハンド３１は、可動部を備えるものに限られない。例えば、ハンド３１は、吸引力を発生させる部位を備え、当該部位に対象物を吸着させることによって対象物を把持するものであっても良い。なお、以下の説明では、ハンド３１の可動部を、指部と称する。

図１に示すように、ロボット制御装置１０は、動作時間予測部１１と、なじみ時間予測部１２と、ハンド動作開始指示部１３と、把持後動作指示部１４と、記憶部１５とを備える。また、ロボット制御装置１０は、ロボット動作指令を生成する指令生成部を備える。指令生成部の図示は省略する。

動作時間予測部１１は、ロボット動作時間Ｔ１を算出するロボット動作時間算出部１６と、ハンド動作時間Ｔ_gspを算出するハンド動作時間算出部１７とを備える。ロボット動作時間Ｔ１は、ロボット３０のハンド３１をロボット３０が目的位置に到達させるまでに要する時間とする。ハンド動作時間Ｔ_gspは、ハンド３１の動作が指令された時点から目的位置においてハンド３１が対象物を把持する動作を終えるまでの時間とする。動作時間予測部１１は、ロボット動作時間算出部１６によりロボット動作時間Ｔ１を算出することによって、ロボット動作時間Ｔ１を予測する。ロボット動作時間算出部１６は、ロボット動作時間Ｔ１に基づいてロボット残動作時間Ｔ０を算出する。ロボット残動作時間Ｔ０は、ロボット３０の動作を開始した後の任意の時点からロボット３０が目的位置に到達させるまでに要する時間である。動作時間予測部１１は、ハンド動作時間算出部１７によりハンド動作時間Ｔ_gspを算出することによって、ハンド動作時間Ｔ_gspを予測する。

動作時間予測部１１は、ロボット残動作時間Ｔ０の値とハンド動作時間Ｔ_gspの値とをハンド動作開始指示部１３へ出力する。ハンド動作開始指示部１３は、ロボット動作時間Ｔ１の値に基づいて算出されたロボット残動作時間Ｔ０の値と、ハンド動作時間Ｔ_gspの値とを用いて、ハンド３１の動作を開始させるタイミングを決定する。ハンド動作開始指示部１３は、決定されたタイミングでのハンド３１の動作開始を、ハンド制御装置に指示する。すなわち、ハンド動作開始指示部１３は、予測されたロボット動作時間Ｔ１と予測されたハンド動作時間Ｔ_gspとに基づいて決定されたタイミングでのハンド３１の動作開始を指示する。また、ハンド動作開始指示部１３は、ハンド３１の動作開始を指示した時点Ｔｋを示す情報を把持後動作指示部１４へ出力する。

なじみ時間予測部１２は、なじみ時間Ｔ_fitを予測する。なじみ時間Ｔ_fitは、ハンド３１が対象物の把持を開始してからハンド３１が対象物になじむまでの時間とする。ハンド３１が対象物になじむとは、ロボット３０がハンド３１を移動させてもハンド３１が対象物を把持している状態を維持可能に、ハンド３１と対象物との接触が安定することを指す。なじみ時間予測部１２は、予測されたなじみ時間Ｔ_fitの値を把持後動作指示部１４へ出力する。実施の形態１では、ハンド３１が対象物を把持した時点からロボット３０が次の動作を開始するまでの待ち時間の長さには、予測されたなじみ時間Ｔ_fitの長さが設定される。把持後動作指示部１４は、ハンド３１が対象物の把持を開始した時点から、予測されたなじみ時間Ｔ_fitが経過した後に、対象物を把持する動作の次に行われるロボット３０の動作を指示する。

ロボット制御装置１０には、対象物の位置Ｐの情報とハンド動作情報とが入力される。位置Ｐは、ビジョンセンサ等のセンサを用いて計測される。ロボット制御装置１０に入力される位置Ｐの情報は、対象物が１回把持されるごとに更新される。ハンド動作情報は、対象物を把持するときのハンド３１の動作についての情報である。実施の形態１において、ハンド動作情報は、差し込み量ｄ、開き幅ｗ、および把持力Ｆ_gspの各値を含む。

対象物を掴む閉動作が開始される前に、ハンド３１の先端、すなわち各指部の先端は、対象物の周囲へ差し込まれる。差し込み量ｄは、対象物に対する各指部の差し込み度合いを表す。ここでは、対象物の中心位置を基準として、対象物の中心位置に各指部の先端が一致している状態を、ｄ＝０と定義する。対象物の中心位置に各指部の先端が一致しているとは、差し込み方向における各指部の先端の位置と、差し込み方向における対象物の中心位置とが互いに一致していることを指す。差し込み方向とは、閉動作の前におけるロボット３０の動作によって各指部が移動する方向である。また、ｄ＝０であるときに比べて、ハンド３１における各指部の付け根側に対象物の中心位置がある状態を、ｄ＞０とする。ｄ＝０であるときに比べて、対象物の中心位置が各指部の先端側にある状態を、ｄ＜０とする。開き幅ｗは、閉動作の開始時における各指部の先端部同士の間隔である。把持力Ｆ_gspは、ハンド３１が対象物を把持している状態においてハンド３１が対象物に及ぼす力である。

記憶部１５は、ロボット制御系情報と、ハンド特性情報と、対象物特性情報とを記憶する。ロボット制御系情報は、ロボット３０の駆動部を制御するロボット制御系の特性を示す情報である。ロボット制御系情報は、ロボット制御系によるフィードフォワード制御に使用される制御パラメータの値と、ロボット制御系によるフィードバック制御に使用される制御パラメータの値とのうち少なくとも１つを含む。ロボット制御系情報に含まれる制御パラメータは、ロボット制御系の応答性を決定するパラメータである。制御パラメータとしては、例えば、ＰＩＤ（Proportional Integral Differential）制御のＰ（Proportional）ゲイン、Ｉ（Integral）ゲインおよびＤ（Differential）ゲイン、一次遅れ要素の時定数、または、むだ時間要素のむだ時間といった、制御工学において定義されるパラメータである。なお、ロボット制御系情報に含まれる制御パラメータの種類は、ロボット制御系の構成によって異なる。

ハンド特性情報は、ハンド３１の動作特性を示す情報である。ハンド特性情報は、開閉指令速度の値と、ハンド制御系情報と、機構パラメータの値とのうちの少なくとも１つを含む。開閉指令速度は、ハンド制御装置によって指令される速度であって、ハンド３１の開閉動作における各指部の移動速度である。ハンド制御系情報は、ハンド３１の開閉を制御するハンド制御系の特性を示す情報である。ハンド制御系情報は、ハンド制御系の制御パラメータの値を含む。

機構パラメータとは、ハンド３１を駆動するアクチュエータまたは減速機といった要素の位置関係、または、ハンド３１の指部における各部位の寸法を表現する値である。あるいは、機構パラメータとは、ハンド３１に備え付けられたアクチュエータまたは減速機の減速比を表現する値である。ハンド３１に備え付けられたアクチュエータは、モータまたは空気圧アクチュエータである。機構パラメータを使用することによって、ハンド３１の位置または各指部の位置を計算することができる。機構パラメータは、ハンド３１と対象物とが接触するタイミング、または、ハンド３１と対象物の周囲にある物体とが接触するタイミングを計算するために用いられる。

ハンド３１による把持の安定性を高めるために、ハンド３１の指部のうち対象物に触れる部分である指腹部には、柔軟な素材が備えられることがある。この場合、指腹部への対象物の接触が開始されてから対象物の把持が安定するまでには、指腹部の変形によって指腹部に対象物がなじむまでの時間が必要となる。このような指腹部の特性を考慮するために、ハンド特性情報には、ハンド３１の指部のうち対象物に触れる部分である指腹部の物性についての情報が含まれても良い。指腹部の物性についての情報は、指腹部の剛性Ｋｈの値、または、指腹部の粘性Ｄｈの値などを含む。

対象物特性情報は、対象物の物性を示す情報である。対象物特性情報は、対象物の変形についての情報であって、剛性Ｋｗの値または粘性Ｄｗの値などを含む。

図２に示す位置Ｐ_getは、ロボット３０の動作によってハンド３１の先端を到達させる目的位置とする。ロボット制御装置１０には、次に把持する対象物の位置Ｐの情報が入力される。位置Ｐ_getは、対象物の位置Ｐと差し込み量ｄとに基づいて決定される。図２に示す位置Ｐ_upは、ハンド３１の先端を目的位置へ移動させるためのロボット３０の動作を開始する時点におけるハンド３１の位置とする。

ロボット制御システム４０の周辺機器であるセンシングデバイスは、対象物を観測した結果を基に、対象物の位置Ｐと差し込み量ｄとを計算する。ここで計算される差し込み量ｄは、ハンド３１の先端を位置Ｐ_getに到達させた状態における差し込み量ｄである。ロボット制御装置１０の指令生成部は、対象物の位置Ｐの情報と差し込み量ｄとに基づいて、ロボット動作指令を生成する。

位置Ｐ_upは、位置Ｐ_getから上方へ一定の距離だけ離れた位置であって、ユーザが定義可能な位置である。位置Ｐ_upと位置Ｐ_getとの間の距離には、ハンド３１の先端が対象物の周辺にある物に触れることが無いような距離が設定される。位置Ｐ_upにおけるハンド３１の姿勢には、位置Ｐ_getにおいてハンド３１が取る姿勢と同じ姿勢が設定される。このように、位置Ｐ_up、および位置Ｐ_upにおける姿勢が定義されることによって、位置Ｐ_upにハンド３１が到達する直前におけるロボット３０の動作に関わらず、毎回の把持動作における対象物とハンド３１との相対位置関係を同じとすることができる。ロボット３０は、対象物とハンド３１との相対位置関係が毎回同じであることによって、再現性がある動作を実現できる。ここで生成されるロボット動作指令は、対象物の位置Ｐと差し込み量ｄとに基づいて求まる位置Ｐ_get、および、上述の定義に従って求まる位置Ｐ_upについて、位置Ｐ_upから位置Ｐ_getへハンド３１を移動させる動作をロボット３０に行わせるためのロボット動作指令である。このように、対象物の位置Ｐの情報と、ハンド動作情報である差し込み量ｄの値とを基に、ロボット動作指令が生成される。

次に、ロボット制御装置１０の動作について説明する。図３は、実施の形態１にかかるロボット制御装置１０の動作時間予測部１１によって予測されるロボット動作時間Ｔ１について説明するための図である。

ロボット動作時間Ｔ１は、ロボット動作指令に従ってロボット３０が位置Ｐ_upから位置Ｐ_getへハンド３１を移動させる動作を行った場合におけるロボット３０の動作時間である。ロボット動作時間Ｔ１の始点は、ロボット３０が動作を開始した時点である。ロボット動作時間Ｔ１の終点は、ハンド３１の先端の位置と位置Ｐ_getとの誤差があらかじめ指定された範囲内となる時点である。ロボット動作時間算出部１６は、ロボット動作指令を基に、ロボット動作時間Ｔ１を算出する。

時間Ｔａは、ロボット３０が動作を開始した時点からの経過時間である。ロボット動作時間算出部１６は、時間Ｔａを計測する。ロボット動作時間算出部１６は、ロボット動作時間Ｔ１から時間Ｔａを差し引くことによってロボット残動作時間Ｔ０を算出する。動作時間予測部１１は、ロボット残動作時間Ｔ０を算出することによって、ハンド３１の先端が対象物に到達するまでに要する時間を随時把握する。

ロボット動作時間算出部１６は、ロボット動作模擬手段を備える。ロボット動作模擬手段は、ロボット動作指令の生成を模擬し、かつ、ロボット制御系の特性に応じたロボット３０の動作を模擬する。ロボット動作模擬手段は、ロボット制御装置１０へ入力された対象物の位置Ｐの情報を取得する。ロボット動作模擬手段は、ロボット制御装置１０へ入力されたハンド動作情報から差し込み量ｄの値を取得する。ロボット動作模擬手段は、対象物の位置Ｐと差し込み量ｄとを基に、ロボット動作指令の生成を模擬する。

ロボット動作模擬手段は、ロボット制御系の特性に応じたロボット３０の動作を模擬するためのフィルタ手段を備える。フィルタ手段とは、指令値に対する制御系および機械システムの挙動または応答を模擬し、挙動または応答の様子を表現するための数式モデルである。フィルタ手段には、例えば、伝達関数を用いることができる。フィルタ手段へ指令値が入力されることによって、フィルタ手段は、機械システムのうち当該指令値に従って動く部分について、当該指令値に応じた動作による変位量、当該指令値に応じた動作における速度の変化量、または、当該指令値に応じた動作における加速度の変化量を求めることができる。

フィルタ手段は、記憶部１５に記憶されているロボット制御系情報を基に、ロボット３０の動作を模擬する。ロボット動作模擬手段は、フィルタ手段にロボット動作指令を通すことによって、ロボット制御系の特性に応じたロボット３０の動作を模擬する。なお、ロボット動作模擬手段およびフィルタ手段の図示は省略する。

ロボット動作時間算出部１６は、ロボット動作模擬手段によりロボット３０の動作を模擬した結果を基に、ハンド３１の先端の実際の挙動を予測する。ロボット動作時間算出部１６は、予測されたハンド３１の挙動を基にロボット動作時間Ｔ１の終点を予測して、ロボット動作時間Ｔ１を算出する。このように、ロボット動作時間算出部１６は、ロボット制御系情報を組み入れた計算によってロボット動作時間Ｔ１を算出する。動作時間予測部１１は、ロボット制御系情報を組み入れた計算によりロボット動作時間Ｔ１を予測する。

ロボット動作時間算出部１６は、ロボット制御系の特性に応じたロボット３０の動作をロボット動作模擬手段によって模擬するものに限られない。ロボット動作時間算出部１６は、ロボット制御系の特性に応じた、ロボット３０の動作の遅れ時間Ｔ_rsを算出するものであっても良い。ロボット動作時間算出部１６は、ロボット動作指令に示される指令位置とロボット３０を動作させる速度または加速度とを基に遅れ時間Ｔ_rsを算出する近似関数を用いる。複数の動作条件によるロボット制御系の挙動があらかじめシミュレーションされることによって、シミュレーションの結果を基に、近似関数のパラメータの値を同定することができる。近似関数のパラメータの値は、記憶部１５に記憶されるロボット制御系情報に含められる。ロボット動作時間算出部１６は、ロボット制御系情報に含まれる近似関数のパラメータの値を基に、近似関数を用いた遅れ時間Ｔ_rsの算出を行う。近似関数には、多項式を用いられても良く、ニューラルネットワークが用いられても良い。

ロボット動作時間算出部１６は、ロボット動作指令に基づいて時間Ｔ１ｃを算出する。時間Ｔ１ｃは、位置Ｐ_upから位置Ｐ_getへハンド３１を移動させる動作を行った場合におけるロボット３０の動作時間である。ロボット動作時間算出部１６は、時間Ｔ１ｃに遅れ時間Ｔ_rsを加算することによって、ロボット動作時間Ｔ１を算出する。このように、ロボット動作時間算出部１６は、ロボット制御系情報を組み入れた計算によってロボット動作時間Ｔ１を算出する。すなわち、動作時間予測部１１は、ロボット制御系情報を組み入れた計算によりロボット動作時間Ｔ１を予測する。さらに、ロボット動作時間Ｔ１を算出するために使用されるロボット動作指令は、上述するように、対象物の位置Ｐの情報とハンド動作情報である差し込み量ｄの値とを基に生成される。ロボット動作時間算出部１６は、ロボット制御系情報と、対象物の位置Ｐの情報と、ハンド動作情報とを組み入れた計算によってロボット動作時間Ｔ１を算出するといえる。動作時間予測部１１は、ロボット制御系情報と、対象物の位置Ｐの情報と、ハンド動作情報とを組み入れた計算によりロボット動作時間Ｔ１を予測するといえる。

ハンド動作時間算出部１７は、ハンド動作模擬手段を備える。ハンド動作模擬手段は、ハンド動作指令を模擬し、かつ、ハンド制御系の特性に応じたハンド３１の動作を模擬する。ハンド動作模擬手段は、ロボット制御装置１０へ入力されるハンド動作情報から開き幅ｗの値を取得する。ハンド動作模擬手段は、記憶部１５に記憶されているハンド特性情報から、機構パラメータである定数を取得する。ハンド動作模擬手段は、開き幅ｗの値に定数を乗算することによって、ハンド３１のストロークを算出する。ハンド３１のストロークとは、開動作と閉動作との各々におけるハンド３１の先端の移動幅とする。ハンド動作模擬手段は、算出したストロークを基に、ハンド動作指令の生成を模擬する。

ハンド動作模擬手段は、ハンド制御系の特性に応じてハンド３１の動作を模擬するためのフィルタ手段を備える。フィルタ手段は、記憶部１５に記憶されているハンド特性情報のうちのハンド制御系情報を基に、ハンド３１の動作を模擬する。ハンド動作模擬手段は、フィルタ手段にハンド動作指令を通すことによって、ハンド制御系の特性に応じたハンド３１の動作を模擬する。なお、ハンド動作模擬手段およびフィルタ手段の図示は省略する。

ハンド動作時間算出部１７は、ハンド動作模擬手段によりハンド３１の各指部の動作を模擬した結果を基に、時間Ｔ_gsp__oを算出する。時間Ｔ_gsp__oは、各指部が動作を開始してから、各指部が動作を終えるまでの時間である。ハンド動作時間算出部１７は、ハンド動作指令である信号の伝達に要する時間の予測値を時間Ｔ_gsp__oに加算することによって、ハンド動作時間Ｔ_gspを算出する。時間Ｔ_gsp__oには、模擬された指部の位置と指部の目標位置との差があらかじめ設定された値以下となるまでに経過する時間を採用することができる。

ここまで、動作時間予測部１１が、ハンド動作情報のうち、対象物の位置Ｐの情報と差し込み量ｄおよび開き幅ｗの各値とを用いてロボット動作時間Ｔ１とハンド動作時間Ｔ_gspとを予測する例を説明した。動作時間予測部１１は、対象物の位置Ｐの情報と、差し込み量ｄおよび開き幅ｗの各値とのうちの一部のみを用いてロボット動作時間Ｔ１とハンド動作時間Ｔ_gspとを予測しても良い。動作時間予測部１１は、ロボット動作時間Ｔ１とハンド動作時間Ｔ_gspとの予測において差し込み量ｄの値を用いなくても良い。

上記説明は、把持の直前に対象物の近辺において、ハンド３１の各指部の姿勢を固定するとともに、低い速度で直線方向にハンド３１を移動させてハンド３１を位置決めする場合の例とする。この場合は、差し込み量ｄを調整することで対象物の重心付近を把持し易くできるなど、把持の安定性を向上できることがある。一方、対象物の近辺に直線軌道を設けず、曲線軌道におけるハンド３１の高速移動によってハンド３１を位置決めする場合は、ロボット動作時間Ｔ１およびハンド動作時間Ｔ_gspの予測に差し込み量ｄは不要である。また、対象物を吸着させるハンドの場合、ハンド動作時間Ｔ_gspの予測に開き幅ｗの値は不要である。対象物を吸着させるハンドの場合、ハンド動作時間Ｔ_gspは、信号の伝達に要する時間の予測値とする。

図４は、実施の形態１にかかるロボット制御装置１０による、ハンド３１の動作開始の指示とロボット３０の動作開始の指示とについて説明するための図である。図４には、ハンド３１の位置の変化を表すグラフと、ハンド３１の開閉状態を表すグラフとを示す。ハンド３１の位置の変化を表すグラフにおいて、縦軸はハンド３１の位置を表し、横軸は時間Ｔを表す。ハンド３１の開閉状態を表すグラフにおいて、縦軸は開状態または閉状態を表し、横軸は時間Ｔを表す。

動作時間予測部１１は、ロボット残動作時間Ｔ０の値とハンド動作時間Ｔ_gspの値とを基に、ロボット残動作時間Ｔ０の値がＴ０＜Ｔ_gspを充足する値に到達したタイミングを検出する。動作時間予測部１１は、当該タイミングを検出すると、Ｔ０＜Ｔ_gspを充足するタイミングが到来したことをハンド動作開始指示部１３へ伝達する。また、動作時間予測部１１は、当該タイミングにおけるロボット残動作時間Ｔ０の値と、当該タイミングにおけるハンド動作時間Ｔ_gspの値とをハンド動作開始指示部１３へ送る。

ハンド動作開始指示部１３は、Ｔ０＜Ｔ_gspを充足するタイミングが到来したときに、ハンド３１による対象物の把持のための動作、すなわち閉動作の開始をハンド制御装置に指示する。ハンド動作開始指示部１３は、閉動作命令をハンド制御装置へ送ることによって、閉動作の開始をハンド制御装置に指示する。ハンド動作開始指示部１３による指示に従ってハンド制御装置がハンド３１へハンド動作指令を送ることによって、ハンド３１は閉動作を開始する。

ハンド動作開始指示部１３は、時点Ｔｋを示す情報、例えば、時点Ｔｋを示す時刻情報を把持後動作指示部１４へ送る。時点Ｔｋは、Ｔ０＜Ｔ_gspを充足した時点であって、ハンド動作開始指示部１３がハンド制御装置に閉動作の開始を指示した時点である。さらに、ハンド動作開始指示部１３は、ハンド動作時間Ｔ_gspの値と経過時間Ｔｐの値との差分Ｔ_gsp－Ｔｐを、随時、把持後動作指示部１４へ送る。

動作時間予測部１１は、補正量ΔＴを設定しておき、Ｔ０＜Ｔ_gspを充足するタイミングの代わりに、Ｔ０＜（Ｔ_gsp－ΔＴ）を充足するタイミングを検出しても良い。動作時間予測部１１は、当該タイミングを検出すると、Ｔ０＜（Ｔ_gsp－ΔＴ）を充足するタイミングが到来したことをハンド動作開始指示部１３へ伝達する。また、動作時間予測部１１は、当該タイミングにおけるロボット残動作時間Ｔ０の値と、当該タイミングにおけるハンド動作時間Ｔ_gspの値と、補正量ΔＴの値とを、ハンド動作開始指示部１３へ送る。

ここで、補正量ΔＴの例について説明する。ここでは、対象物の外形を半径Ｒ_ｗの球体に近似する。また、対象物は、外力を受けることによって容易に変形するものとする。開状態におけるハンド３１の開き幅をｗ、対象物を把持可能にハンド３１が閉じた状態におけるハンド３１の開き幅をｗｃとする。ハンド３１が開状態から閉じる過程における開き幅ｗａが２Ｒ_ｗになった時点でハンド３１は対象物に接触する。

ｗａ＝２Ｒ_ｗの状態からさらにハンド３１が閉じることによって、ハンド３１の指部同士が向かい合う方向における対象物の幅が２Ｒ_ｗよりも小さい２Ｒ_ｗｃとなるまで対象物が変形したとする。このとき、対象物とハンド３１の指部との間には垂直抗力Ｆｎが発生する。垂直抗力Ｆｎに対する摩擦力の発生と、指部同士の間における対象物の幾何学的な拘束とによって、ハンド３１による対象物の把持が可能となる。このように、ハンド３１が閉じていき、開き幅が２Ｒ_ｗとなって指部が対象物に触れる状態となってから、さらにハンド３１は、開き幅が２Ｒ_ｗｃになるまで閉じる。この場合、ロボット制御装置１０は、Ｔ０＝０の時点でハンド３１の開き幅が２Ｒ_ｗｃとなるように、閉動作の開始をハンド制御装置に指示する。これにより、ロボット制御装置１０は、ΔＴ＞０のときにおいて、ロボット３０の動作が終了するタイミングで指部を対象物に接触させることができる。また、ロボット制御装置１０は、ロボット３０の動作中において対象物に指部を接触させないようにすることで、把持の失敗を低減できる。

なお、Ｔ０≦Ｔ_gspを充足することを初めて検出した時点で閉動作を開始した場合、ロボット３０の動作中にｗａ＜２Ｒ_ｗを充足する状態となる。この場合、ロボット３０の動作中にハンド３１の指部が対象物に接触し始めることになるため、把持が失敗することがある。これに対し、補正量ΔＴが適宜設定されることによって、指部が対象物に接触し始めるタイミングを、ロボット３０の動作が終わる時点に合わせることができる。すなわち、補正量ΔＴが適宜設定されることによって、Ｔ０＝０の時点における開き幅を２Ｒ_ｗとすることができる。これにより、ハンド３１による把持の成功率を向上させることができる。

上記説明では対象物の外形を球体に近似することとしたが、対象物の外形を直方体に近似することとしても良い。この場合、指部同士が向かい合う方向における対象物の長さＬｗに基づいて補正量ΔＴが適宜設定されることによって、ハンド３１による把持の成功率を向上させることができる。

なじみ時間予測部１２は、ハンド特性情報および対象物特性情報の少なくとも一方と、開き幅ｗとに基づいてなじみ時間Ｔ_fitを算出するための関数を保持する。なじみ時間予測部１２は、ハンド特性情報である剛性Ｋｈの値または粘性Ｄｈの値と、対象物特性情報である剛性Ｋｗの値または粘性Ｄｗの値との少なくとも一方を組み入れた計算により、なじみ時間Ｔ_fitを算出する。なじみ時間予測部１２は、なじみ時間Ｔ_fitの値を把持後動作指示部１４へ送る。

対象物が変形したとしても変形が不十分である場合、ロボット３０の動作による慣性力が対象物に生じ、対象物のうち指部と接触している部分が滑ることによって、対象物がハンド３１から抜け落ちることがある。ハンド３１の指部のうち指腹部の物性に関わる情報と、対象物の変形に関わる情報との少なくとも一方を計算に組み入れることで、なじみ時間予測部１２は、対象物を十分に変形させ得るなじみ時間Ｔ_fitを算出することができる。これにより、ハンド３１による把持の成功率を向上させることができる。

なお、実施の形態１において、対象物の変形とは、対象物の全体が変形する場合と、対象物の一部が変形する場合とを含むものとする。対象物のうち、対象物の表面に形成されている突起等のみが変形する場合も、対象物の変形には含まれる。対象物が変形する態様は、特定の態様に限定されないものとする。

実施の形態１において、なじみ時間Ｔ_fitを算出するための関数は、開き幅ｗ、対象物の剛性Ｋｗ、およびなじみ時間Ｔ_fitの関係を表す表形式のデータベースである。表形式のデータベースは、開き幅ｗおよび剛性Ｋｗの２次元の表に限られず、対象物の種類ごとの開き幅ｗおよびなじみ時間Ｔ_fitの表であっても良い。開き幅ｗ、対象物の剛性Ｋｗ、およびなじみ時間Ｔ_fitの関係は、ロボット３０およびハンド３１による把持動作を検証することによりあらかじめ求められる。以下、対象物の種類ごとの開き幅ｗおよびなじみ時間Ｔ_fitの表を例として、表の作成について説明する。

表を作成するためのデータの取得に際し、互いに異なる大きさの複数の対象物が準備される。複数の対象物の各々について、ハンド３１によって対象物を把持してロボット３０により対象物を上昇させる一連の動作の検証により、把持の成否が判定される。具体的には、ハンド３１が閉動作を開始した時点から時間Ｔ_gsp＋Ｔｂが経過した時点で対象物の上昇を開始させる動作をロボット３０に行わせて、把持の成功率が算出される。時間Ｔｂは、あらかじめ定められた刻み時間だけ０秒から徐々に増加させる。互いにＴｂを異ならせた各時間Ｔ_gsp＋Ｔｂについてあらかじめ定められた回数の検証が行われ、把持を成功した回数を基に、各時間Ｔ_gsp＋Ｔｂについての成功率が算出される。対象物を上昇させた状態でロボット３０を停止させ、ロボット３０を停止させた位置で対象物が把持されているか否かが、ビジョンセンサを用いて判定される。

対象物が把持されているか否かの判定には、ビジョンセンサの代わりに力覚センサが用いられても良い。力覚センサの出力を基に、把持の成否が判定される。力覚センサは、ロボット３０のうちハンド３１との接続部分である手首部に取り付けられる。または、ビジョンセンサの代わりにレーザ変位計を用いて、レーザ変位計による計測結果を基に把持の成否が判定されても良い。

算出される成功率があらかじめ定められた閾値以上となるか、または、時間Ｔｂがあらかじめ定められた上限値Ｔｂ_limに達した場合に、刻み時間ごとの時間Ｔｂの増加を終了する。作成される表には、時間Ｔｂの増加を終了した時点における開き幅ｗおよびなじみ時間Ｔ_fitの各値が、互いに対応付けられて書き込まれる。開き幅ｗの値には、検証に使用された対象物の幅の値が採用される。なじみ時間Ｔ_fitの値には、成功率が閾値以上となった場合における時間Ｔｂの値が採用される。

なお、開き幅ｗ、剛性Ｋｗ、およびなじみ時間Ｔ_fitの表を作成する場合、開き幅ｗをあらかじめ定められた幅ｗ０にしてハンド３１が対象物を挟んだときの把持力Ｆ_gspの値を基に、対象物の剛性Ｋｗの値が導き出される。把持力Ｆ_gspの値は、ロボット制御装置１０へ入力されるハンド動作情報から取得される。表には、剛性Ｋｗの値ごとに、剛性Ｋｗ、開き幅ｗおよびなじみ時間Ｔ_fitの各値が互いに対応付けられて書き込まれる。

開き幅ｗが、表に示されている値同士の中間の値である場合、すなわち、対象物の幅が当該中間の値である対象物については、表に示されているなじみ時間Ｔ_fitの複数の値の線形補間によって、なじみ時間Ｔ_fitが算出される。この場合の線形補間に使用される値は、例えば、当該中間の値の両隣のデータ点である開き幅ｗの各値に対応するなじみ時間Ｔ_fitの各値である。対象物の剛性Ｋｗが、表に示されている値同士の中間の値である場合も、当該対象物についてのなじみ時間Ｔ_fitは、表に示されているなじみ時間Ｔ_fitの複数の値の線形補間によって算出される。この場合の線形補間に使用される値は、例えば、当該中間の値の両隣のデータ点である剛性Ｋｗの各値に対応するなじみ時間Ｔ_fitの各値である。

把持後動作指示部１４には、なじみ時間Ｔ_fitの値が入力される。把持後動作指示部１４には、把持動作の開始が指示された時点Ｔｋを示す情報がハンド動作開始指示部１３から入力される。さらに、ハンド動作時間Ｔ_gspの値と経過時間Ｔｐの値との差分Ｔ_gsp－Ｔｐが、ハンド動作開始指示部１３から把持後動作指示部１４へ随時入力される。

把持後動作指示部１４は、Ｔ_gsp－Ｔｐ＝０となった時点からの経過時間となじみ時間Ｔ_fitとを比較する。把持後動作指示部１４は、Ｔ_gsp－Ｔｐ＝０となった時点からの経過時間がなじみ時間Ｔ_fitを超えた時点において、対象物を把持した後の次のロボット動作指令の出力を指令生成部に指示する。このようにして、把持後動作指示部１４は、ハンド３１が対象物の把持を開始した時点から、予測されたなじみ時間Ｔ_fitが経過した後に、ハンド３１が対象物を把持する動作を終えた次のロボット３０の動作開始を指示する。ロボット動作指令に従って駆動部がロボット３０を駆動することにより、ロボット３０は、対象物を把持した後の次の動作を開始する。

ロボット動作時間算出部１６においてロボット動作指令に基づいて時間Ｔ１ｃを算出する場合は、ロボット制御装置１０は、以下に説明する処理を行うこととしても良い。上記説明では、ロボット動作時間算出部１６は、ロボット動作指令に従ってロボット３０が１つの動作を行った場合における時間Ｔ１ｃを算出した。時間Ｔ１ｃは、ロボット動作指令に従ってロボット３０が１つの動作を行った場合における動作時間ではなく、ロボット動作指令に従ってロボット３０が２つの連続する動作を行った場合における動作時間の合計であっても良い。ここで、点Ｐｓから点Ｐｅまでハンド３１を移動させる動作を１つの動作とした場合に、２つの動作とは、１つの動作に続いて点Ｐｅから点Ｐｅ２へハンド３１を移動させる動作とする。２つの動作により、２つの連続した軌道Ｐｓ－Ｐｅ，Ｐｅ－Ｐｅ２においてハンド３１を移動させる。

例えば、ロボット動作指令に従った２つの動作によって、点Ｐｓから対象物の近辺の点Ｐｅへハンド３１を移動させた後に、点Ｐｅから点Ｐｅ２へ、差し込み量ｄに相当する直線移動をハンド３１に行わせるとする。この場合、ロボット動作時間算出部１６は、点Ｐｓからのハンド３１の移動を開始させる時点から、点Ｐｅ２へのハンド３１の移動が終了するまでの時間Ｔ１ｃを算出する。ハンド動作開始指示部１３は、差し込み量ｄに相当する直線移動の開始前か、または、当該直線移動の途中かに関わらず、Ｔ０＜Ｔ_gspを充足した時点Ｔｋにおいて閉動作命令をハンド制御装置へ送る。

次に、ロボット制御装置１０の動作手順について説明する。図５は、実施の形態１にかかるロボット制御装置１０の動作手順を示すフローチャートである。

ステップＳ１において、ロボット制御装置１０は、対象物の位置Ｐの情報とハンド動作情報とを取得する。ステップＳ２において、ロボット制御装置１０は、ハンド動作時間算出部１７において、ハンド特性情報を組み入れた計算によりハンド動作時間Ｔ_gspを算出する。ステップＳ２は、ハンド動作時間Ｔ_gspを予測するステップである。

ステップＳ３において、ロボット制御装置１０は、なじみ時間予測部１２においてなじみ時間Ｔ_fitを算出する。ステップＳ３は、なじみ時間Ｔ_fitを予測するステップである。なじみ時間予測部１２は、ハンド特性情報および対象物特性情報の少なくとも一方と、ハンド動作情報とを組み入れた計算により、なじみ時間Ｔ_fitを算出する。

ステップＳ４において、ロボット制御装置１０は、ロボット動作時間算出部１６において、ロボット残動作時間Ｔ０を算出する。動作時間予測部１１は、ロボット残動作時間Ｔ０を算出する前に、ロボット制御系情報と、位置Ｐの情報と、ハンド動作情報とを組み入れた計算を行うことにより、ロボット動作時間Ｔ１を予測する。ロボット動作時間算出部１６は、ロボット動作時間Ｔ１から経過時間である時間Ｔａを差し引くことによって、ロボット残動作時間Ｔ０を算出する。なお、ステップＳ２と、ステップＳ３と、ロボット動作時間Ｔ１を予測するステップとの順序は任意とする。ロボット制御装置１０は、ステップＳ２と、ステップＳ３と、ロボット動作時間Ｔ１を予測するステップとの各手順のうち２つ以上を同時に行っても良い。

ステップＳ５において、ロボット制御装置１０は、動作時間予測部１１において、Ｔ０＜Ｔ_gspを充足したか否かを判断する。Ｔ０＜Ｔ_gspを充足していない場合（ステップＳ５，Ｎｏ）、ロボット制御装置１０は、ステップＳ４へ手順を戻し、再びロボット残動作時間Ｔ０を算出する。Ｔ０＜Ｔ_gspを充足した場合（ステップＳ５，Ｙｅｓ）、ロボット制御装置１０は、ステップＳ６へ手順を進める。

ステップＳ６において、ロボット制御装置１０は、ハンド動作開始指示部１３により、ハンド３１の動作開始をハンド制御装置に指示する。ステップＳ６は、予測されたロボット動作時間Ｔ１と予測されたハンド動作時間Ｔ_gspとに基づいて決定されたタイミングでのハンド３１の動作開始を指示するステップである。

ステップＳ７において、ロボット制御装置１０は、把持後動作指示部１４において、把持が開始された時点からなじみ時間Ｔ_fitが経過したか否かを判断する。把持が開始された時点からなじみ時間Ｔ_fitが経過していない場合（ステップＳ７，Ｎｏ）、ロボット制御装置１０は、ステップＳ７の手順を繰り返す。把持が開始された時点からなじみ時間Ｔ_fitが経過した場合（ステップＳ７，Ｙｅｓ）、ロボット制御装置１０は、ステップＳ８へ手順を進める。

ステップＳ８において、ロボット制御装置１０は、把持後動作指示部１４により、対象物を把持する動作の次に行われるロボット３０の動作を指示する。ステップＳ８は、ハンド３１が対象物の把持を開始した時点から、予測されたなじみ時間Ｔ_fitが経過した後に、対象物を把持する動作の次に行われるロボット３０の動作を指示するステップである。以上により、ロボット制御装置１０は、図５に示す手順による動作を終了する。

実施の形態１によると、ロボット制御装置１０は、ロボット制御系情報を組み入れた計算によりロボット動作時間Ｔ１を予測することで、ロボット制御系の特性に起因するロボット３０の動作の遅れを加味して、ハンド３１の動作開始を指示するタイミングを調整することができる。ロボット制御装置１０は、ハンド動作情報を組み入れた計算によりロボット動作時間Ｔ１を予測することで、対象物の大きさに応じたハンド３１の動作の態様を加味して、ハンド３１の動作開始を指示するタイミングを調整することができる。ロボット制御装置１０は、ハンド特性情報を組み入れた計算によりハンド動作時間Ｔ_gspを予測することで、ハンド３１の動作特性を加味して、ハンド３１の動作開始を指示するタイミングを調整することができる。ロボット制御装置１０は、熟練者による長時間に及ぶ調整が行われなくても、把持動作に要する時間を短縮するために、ハンド３１の動作を指示するタイミングを正確に調整することができる。以上により、ロボット制御装置１０は、ロボット３０およびハンド３１による把持動作に要する時間を短縮するために、ハンド３１の動作を指示するタイミングを正確に調整することができるという効果を奏する。

さらに、実施の形態１によると、ロボット制御装置１０は、なじみ時間Ｔ_fitを予測して、ハンド３１が対象物の把持を開始した時点から、予測されたなじみ時間Ｔ_fitが経過した後に、把持動作の次に行われるロボット３０の動作を指示する。ロボット制御装置１０は、把持動作の次の動作開始のタイミングを調整するための試行錯誤が行われなくても、把持動作の次の動作を開始させるタイミングを適切に調整することができる。

実施の形態２．
図６は、実施の形態２にかかるロボット制御装置１０Ａの構成例を示す図である。ロボット制御装置１０Ａは、実施の形態１で説明した動作時間予測部１１と同様の動作時間予測部１１Ａを備える。また、ロボット制御装置１０Ａには、実施の形態１で説明したなじみ時間予測部１２は備えられていない。実施の形態２では、上記の実施の形態１と同一の構成要素には同一の符号を付し、実施の形態１とは異なる構成について主に説明する。

実施の形態２において、把持後動作指示部１４は、ハンド３１が対象物を把持した時点からロボット３０が次の動作を開始するまでの待ち時間Ｔｗの値を記憶する。待ち時間Ｔｗの値は、ロボット３０の制御のためのプログラムによりあらかじめ指定されている。または、待ち時間Ｔｗの値は、ロボット制御装置１０Ａのパラメータ値としてあらかじめ指定されている。待ち時間Ｔｗは、あらかじめ設定されたなじみ時間Ｔ_fitに相当する。

待ち時間Ｔｗには、対象物に応じて互いに異なる時間が設定されても良い。例えば、ある型式のハンド３１を使用する場合において、金属製の対象物を把持する場合には待ち時間Ｔｗとして時間Ｔｗ１が設定され、樹脂製の対象物を把持する場合には待ち時間Ｔｗとして時間Ｔｗ２が設定されることとしても良い。

把持後動作指示部１４は、Ｔ_gsp－Ｔｐ＝０となった時点からの経過時間と待ち時間Ｔｗとを比較する。把持後動作指示部１４は、Ｔ_gsp－Ｔｐ＝０となった時点からの経過時間が待ち時間Ｔｗを超えた時点において、対象物を把持した後の次のロボット動作指令の出力を指令生成部に指示する。このようにして、把持後動作指示部１４は、ハンド３１が対象物の把持を開始した時点から待ち時間Ｔｗが経過した後に、対象物を把持する動作の次に行われるロボット３０の動作開始を指示する。ロボット動作指令に従って駆動部がロボット３０を駆動することにより、ロボット３０は、対象物を把持した後の次の動作を開始する。

実施の形態２によると、ロボット制御装置１０Ａは、実施の形態１の場合と同様に、ロボット３０およびハンド３１による把持動作に要する時間を短縮するために、把持動作を指示するタイミングを正確に調整することができる。また、ロボット制御装置１０Ａは、把持動作の次の動作開始のタイミングを調整するための試行錯誤が行われなくても、把持動作の次の動作を開始させるタイミングを適切に調整することができる。

実施の形態３．
図７は、実施の形態３にかかるロボット制御装置１０Ｂの構成例を示す図である。ロボット制御装置１０Ｂは、把持制御パラメータ更新部１８を備える点が、実施の形態１にかかるロボット制御装置１０とは異なる。また、ロボット制御装置１０Ｂは、実施の形態１で説明した動作時間予測部１１とは異なる動作時間予測部１１Ｂと、実施の形態１で説明したなじみ時間予測部１２とは異なるなじみ時間予測部１２Ｂとを備える。実施の形態３では、上記の実施の形態１または２と同一の構成要素には同一の符号を付し、実施の形態１または２とは異なる構成について主に説明する。

把持制御パラメータ更新部１８には、対象物の位置Ｐの情報と、ハンド動作情報と、成否情報とが入力される。成否情報は、対象物の把持の成否についての情報である。把持制御パラメータ更新部１８は、把持制御パラメータを更新させる。把持制御パラメータは、把持動作を制御するためのパラメータである。ここでは、把持制御パラメータは、ハンド動作時間Ｔ_gspおよびなじみ時間Ｔ_fitであるものとする。把持制御パラメータ更新部１８は、ロボット３０およびハンド３１の動作の検証により把持の成否を判定した結果を示す成否情報を取得する。成否情報としては、前回の把持動作である１回の把持動作における把持の成否を判定した結果を示す情報を用いることができる。なお、同じ把持制御パラメータの値を使用して複数回の検証を行った場合には、成否情報は、把持の成功率を示す値とする。以下、同じ把持制御パラメータの値を使用して複数回の検証を行う場合を例に挙げて説明する。

把持制御パラメータ更新部１８には、成否情報と、前回の把持動作におけるハンド動作情報とが入力される。把持制御パラメータ更新部１８は、新しいハンド動作情報を動作時間予測部１１へ出力する。新しいハンド動作情報は、次回の把持動作におけるハンド３１の動作についての更新された情報である。また、把持制御パラメータ更新部１８は、対象物の位置Ｐの情報を動作時間予測部１１Ｂへ出力する。

動作時間予測部１１Ｂは、実施の形態１の動作時間予測部１１と同様に、ロボット動作時間算出部１６を備える。動作時間予測部１１Ｂには、実施の形態１で説明したハンド動作時間算出部１７は備えられていない。

次に、ロボット制御装置１０Ｂの動作について説明する。把持制御パラメータの更新を繰り返しながらロボット３０およびハンド３１の動作が検証される。実施の形態３では、把持制御パラメータ更新部１８は、ハンド動作時間Ｔ_gspの更新を繰り返しながら検証が行われることによって取得された成否情報に基づいてハンド動作時間Ｔ_gspの値を決定する。また、把持制御パラメータ更新部１８は、なじみ時間Ｔ_fitの更新を繰り返しながら検証が行われることによって取得された成否情報に基づいてなじみ時間Ｔ_fitの値を決定する。

把持制御パラメータ更新部１８は、ある決められた刻み幅Ｔｇでハンド動作時間Ｔ_gspの値を変化させることによるハンド動作時間Ｔ_gspの調整によって、ハンド動作時間Ｔ_gspを更新する。把持制御パラメータ更新部１８は、ハンド動作時間Ｔ_gspの更新を繰り返す際における、ハンド動作時間Ｔ_gspの最大値Ｔ_gsp_maxおよびハンド動作時間Ｔ_gspの最小値Ｔ_gsp_minを記憶する。また、把持制御パラメータ更新部１８は、刻み幅Ｔｇの値を記憶する。なお、ハンド動作時間Ｔ_gspの更新においてハンド動作時間Ｔ_gspの値を変化させる態様は、実施の形態３で説明するものに限られず、適宜変更可能であるものとする。

把持制御パラメータ更新部１８は、ある決められた刻み幅Ｔｆでなじみ時間Ｔ_fitの値を変化させることによるなじみ時間Ｔ_fitの調整によって、なじみ時間Ｔ_fitを更新する。把持制御パラメータ更新部１８は、なじみ時間Ｔ_fitの更新を繰り返す際における、なじみ時間Ｔ_fitの最大値Ｔ_fit_maxおよびなじみ時間Ｔ_fitの最小値Ｔ_fit_minを記憶する。また、把持制御パラメータ更新部１８は、刻み幅Ｔｆの値を記憶する。なお、なじみ時間Ｔ_fitの更新においてなじみ時間Ｔ_fitの値を変化させる態様は、実施の形態３で説明するものに限られず、適宜変更可能であるものとする。

ここで、ハンド動作時間Ｔ_gspの値となじみ時間Ｔ_fitの値とを決定する際におけるロボット制御装置１０Ｂの動作について説明する。把持制御パラメータ更新部１８は、ハンド動作時間Ｔ_gspの値を決定し、その後、なじみ時間Ｔ_fitの値を決定する。ロボット制御装置１０Ｂは、なじみ時間Ｔ_fitの値を最大値Ｔ_fit_maxに固定し、かつ、ハンド動作時間Ｔ_gspの値を最小値Ｔ_gsp_minから刻み幅Ｔｇごとに順次増加させて、ロボット３０およびハンド３１の動作を検証する。ロボット制御装置１０Ｂは、かかる検証によって、ハンド動作時間Ｔ_gspの値を決定する。

把持制御パラメータ更新部１８は、ハンド動作時間Ｔ_gspの値を決定するための動作の開始時に、ハンド動作時間Ｔ_gspの値には最小値Ｔ_gsp_minを設定し、なじみ時間Ｔ_fitの値には最大値Ｔ_fit_maxを設定する。把持制御パラメータ更新部１８は、ハンド動作時間Ｔ_gspの値、すなわち最小値Ｔ_gsp_minを動作時間予測部１１Ｂへ出力する。把持制御パラメータ更新部１８は、なじみ時間Ｔ_fitの値、すなわち最大値Ｔ_fit_maxをなじみ時間予測部１２Ｂへ出力する。

実施の形態１の場合と同様に、動作時間予測部１１Ｂは、ロボット動作時間算出部１６において、ロボット制御系情報と、位置Ｐの情報と、ハンド動作情報とを組み入れた計算によってロボット動作時間Ｔ１を算出する。動作時間予測部１１Ｂは、ロボット制御系情報と、位置Ｐの情報と、ハンド動作情報とを組み入れた計算によりロボット動作時間Ｔ１を予測する。ロボット動作時間算出部１６は、ロボット動作時間Ｔ１から経過時間である時間Ｔａを差し引くことによって、ロボット残動作時間Ｔ０を算出する。

動作時間予測部１１Ｂは、ロボット残動作時間Ｔ０の値と、入力されたハンド動作時間Ｔ_gspの値とを比較する。実施の形態１の場合と同様に、動作時間予測部１１Ｂは、ロボット残動作時間Ｔ０の値がＴ０＜Ｔ_gspを充足する値に到達したタイミングを検出する。動作時間予測部１１Ｂは、当該タイミングを検出すると、Ｔ０＜Ｔ_gspを充足するタイミングが到来したことをハンド動作開始指示部１３へ伝達する。また、動作時間予測部１１Ｂは、当該タイミングにおけるロボット残動作時間Ｔ０の値と、当該タイミングにおけるハンド動作時間Ｔ_gspの値とをハンド動作開始指示部１３へ送る。

実施の形態１の場合と同様に、ハンド動作開始指示部１３は、時点Ｔｋを示す情報、例えば、時点Ｔｋを示す時刻情報を把持後動作指示部１４へ送る。さらに、ハンド動作開始指示部１３は、動作時間予測部１１Ｂから入力されたハンド動作時間Ｔ_gspの値と経過時間Ｔｐの値との差分Ｔ_gsp－Ｔｐを、随時、把持後動作指示部１４へ送る。

実施の形態１の場合と同様に、動作時間予測部１１Ｂは、補正量ΔＴを設定しておき、Ｔ０＜Ｔ_gspを充足するタイミングの代わりに、Ｔ０＜Ｔ_gsp－ΔＴを充足するタイミングを検出しても良い。動作時間予測部１１Ｂは、当該タイミングを検出すると、Ｔ０＜Ｔ_gsp－ΔＴを充足するタイミングが到来したことをハンド動作開始指示部１３へ伝達する。また、動作時間予測部１１Ｂは、当該タイミングにおけるロボット残動作時間Ｔ０の値と、当該タイミングにおけるハンド動作時間Ｔ_gspの値と、補正量ΔＴの値とを、ハンド動作開始指示部１３へ送る。

実施の形態１の場合と同様に、ロボット制御装置１０Ｂは、Ｔ０＝０の時点でハンド３１の開き幅が２Ｒ_ｗｃとなるように、ハンド３１による閉動作の開始をハンド制御装置に指示する。これにより、ロボット制御装置１０Ｂは、ΔＴ＞０のときにおいて、ロボット３０の動作が終了するタイミングで指部を対象物に接触させることができる。また、ロボット制御装置１０Ｂは、ロボット３０の動作中において対象物に指部を接触させないようにすることで、把持の失敗を低減できる。

なじみ時間予測部１２Ｂは、把持制御パラメータ更新部１８から入力されたなじみ時間Ｔ_fitの値を、そのまま把持後動作指示部１４へ出力する。実施の形態１の場合と同様に、把持後動作指示部１４には、時点Ｔｋを示す情報と、ハンド動作時間Ｔ_gspの値と経過時間Ｔｐの値との差分Ｔ_gsp－Ｔｐとが入力される。把持後動作指示部１４は、Ｔ_gsp－Ｔｐ＝０となった時点からの経過時間がなじみ時間Ｔ_fitを超えた時点において、対象物を把持した後の次のロボット動作指令の出力を指令生成部に指示する。ロボット動作指令に従って駆動部がロボット３０を駆動することにより、ロボット３０は、対象物を把持した後の次の動作を開始する。

ロボット３０の動作後に、ロボット３０を停止させた位置で対象物が把持されているか否かが、ビジョンセンサを用いて判定される。このように、ハンド３１によって対象物を把持してロボット３０により対象物を上昇させる一連の動作の検証により、把持の成否が判定される。あらかじめ設定された回数の動作をロボット３０とハンド３１とに行わせることによって、把持の成功率が算出される。把持制御パラメータ更新部１８には、成功率の値を示す把持情報が入力される。

成功率があらかじめ設定された閾値以上である場合、把持制御パラメータ更新部１８は、ハンド動作時間Ｔ_gspの最小値Ｔ_gsp_minに刻み幅Ｔｇを加算した値を動作時間予測部１１Ｂへ出力する。把持制御パラメータ更新部１８は、ハンド動作時間Ｔ_gspの値に刻み幅Ｔｇを加算することによりハンド動作時間Ｔ_gspを更新する。ロボット制御装置１０Ｂは、更新されたハンド動作時間Ｔ_gspについて、上記説明と同様の動作を繰り返し、成功率の値を取得する。

把持制御パラメータ更新部１８は、成功率が閾値以下となるか、または、ハンド動作時間Ｔ_gspの値が最大値Ｔ_gsp_maxに到達するまで、ハンド動作時間Ｔ_gspの更新を繰り返すとともに成功率を取得する。把持制御パラメータ更新部１８は、ハンド動作時間Ｔ_gspの更新と検証とを繰り返す間において成功率が閾値以下となること無く、ハンド動作時間Ｔ_gspが最大値Ｔ_gsp_maxに到達した場合は、最大値Ｔ_gsp_maxを、ハンド動作時間Ｔ_gspの値に決定する。把持制御パラメータ更新部１８は、ハンド動作時間Ｔ_gspの更新と検証とを繰り返す間において成功率が閾値以下となった場合、成功率が閾値以下となった検証の１つ前の検証の際に設定されていたハンド動作時間Ｔ_gspの値を、ハンド動作時間Ｔ_gspの値に決定する。

このようにして、把持制御パラメータ更新部１８は、ハンド動作時間Ｔ_gspの更新を繰り返しながら検証が行われて取得された成否情報に基づいてハンド動作時間Ｔ_gspの値を決定する。動作時間予測部１１Ｂは、把持制御パラメータ更新部１８によって成否情報に基づいて決定されたハンド動作時間Ｔ_gspの値を、予測されたハンド動作時間Ｔ_gspの値として出力する。

次に、ロボット制御装置１０Ｂは、なじみ時間Ｔ_fitの値を決定するための動作を行う。ロボット制御装置１０Ｂは、ハンド動作時間Ｔ_gspの値を、決定された値に固定し、かつ、なじみ時間Ｔ_fitの値を最大値Ｔ_fit_maxから刻み幅Ｔｆごとに順次減少させて、ロボット３０およびハンド３１の動作を検証する。ロボット制御装置１０Ｂは、かかる検証によって、なじみ時間Ｔ_fitの値を決定する。

把持制御パラメータ更新部１８は、なじみ時間Ｔ_fitの値を決定する動作の開始時に、なじみ時間Ｔ_fitには最大値Ｔ_fit_maxを設定する。把持制御パラメータ更新部１８は、なじみ時間Ｔ_fitの値、すなわち最大値Ｔ_fit_maxをなじみ時間予測部１２Ｂへ出力する。ハンド動作時間Ｔ_gspの値を決定する場合と同様に、なじみ時間Ｔ_fitの値を決定する場合も、あらかじめ設定された回数の動作をロボット３０とハンド３１とに行わせることによって、把持の成功率が算出される。把持制御パラメータ更新部１８には、成功率の値を示す把持情報が入力される。

成功率があらかじめ設定された閾値以上である場合、把持制御パラメータ更新部１８は、なじみ時間Ｔ_fitの最大値Ｔ_fit_maxから刻み幅Ｔｆを減算した値をなじみ時間予測部１２Ｂへ出力する。把持制御パラメータ更新部１８は、なじみ時間Ｔ_fitの値から刻み幅Ｔｆを減算することによりなじみ時間Ｔ_fitを更新する。ロボット制御装置１０Ｂは、更新されたなじみ時間Ｔ_fitについて、上記説明と同様の動作を繰り返し、成功率の算出結果を取得する。

把持制御パラメータ更新部１８は、成功率が閾値以下となるか、または、なじみ時間Ｔ_fitの値が最小値Ｔ_fit_minに到達するまで、なじみ時間Ｔ_fitの更新を繰り返すとともに成功率を取得する。把持制御パラメータ更新部１８は、なじみ時間Ｔ_fitの更新と検証とを繰り返す間において成功率が閾値以下となること無く、なじみ時間Ｔ_fitの値が最小値Ｔ_fit_minに到達した場合は、最小値Ｔ_fit_minを、なじみ時間Ｔ_fitの値に決定する。把持制御パラメータ更新部１８は、なじみ時間Ｔ_fitの更新と検証とを繰り返す間において成功率が閾値以下となった場合、成功率が閾値以下となった検証の１つ前の検証の際に設定されていたなじみ時間Ｔ_fitの値を、なじみ時間Ｔ_fitの値に決定する。

このようにして、把持制御パラメータ更新部１８は、なじみ時間Ｔ_fitの更新を繰り返しながら検証が行われて取得された成否情報に基づいてなじみ時間Ｔ_fitの値を決定する。なじみ時間予測部１２Ｂは、把持制御パラメータ更新部１８によって成否情報に基づいて決定されたなじみ時間Ｔ_fitの値を、予測されたなじみ時間Ｔ_fitの値として出力する。

ここまで、把持制御パラメータ更新部１８が、ハンド動作時間Ｔ_gspとなじみ時間Ｔ_fitとを更新させ、かつ成否情報に基づいてハンド動作時間Ｔ_gspの値となじみ時間Ｔ_fitの値とを決定する例を説明した。実施の形態３では、把持制御パラメータ更新部１８は、ハンド動作時間Ｔ_gspの代わりに、ロボット３０の動作の遅れ時間Ｔ_rsを更新させて、成否情報に基づいて遅れ時間Ｔ_rsの値を決定しても良い。実施の形態３では、把持制御パラメータは、ロボット制御系情報である遅れ時間Ｔ_rs、および、なじみ時間Ｔ_fitであっても良い。

把持制御パラメータ更新部１８は、遅れ時間Ｔ_rsの更新を繰り返しながら検証が行われて取得された成否情報に基づいて遅れ時間Ｔ_rsの値を決定する。動作時間予測部１１Ｂは、ロボット動作時間算出部１６において、決定された遅れ時間Ｔ_rsの値を組み入れた計算によってロボット動作時間Ｔ１を算出する。動作時間予測部１１Ｂは、決定された遅れ時間Ｔ_rsの値を組み入れた計算によりロボット動作時間Ｔ１を予測する。

把持制御パラメータ更新部１８は、ある決められた刻み幅Ｔｒで遅れ時間Ｔ_rsの値を変化させることによる遅れ時間Ｔ_rsの調整によって、遅れ時間Ｔ_rsを更新する。把持制御パラメータ更新部１８は、遅れ時間Ｔ_rsの更新を繰り返す際における、遅れ時間Ｔ_rsの最大値Ｔ_rs_maxおよび遅れ時間Ｔ_rsの最小値Ｔ_rs_minを記憶する。また、把持制御パラメータ更新部１８は、刻み幅Ｔｒの値を記憶する。なお、遅れ時間Ｔ_rsの更新において遅れ時間Ｔ_rsの値を変化させる態様は、実施の形態３で説明するものに限られず、適宜変更可能であるものとする。

ここで、遅れ時間Ｔ_rsの値を決定する際におけるロボット制御装置１０Ｂの動作について説明する。把持制御パラメータ更新部１８は、遅れ時間Ｔ_rsの値を決定し、その後、なじみ時間Ｔ_fitの値を決定する。ロボット制御装置１０Ｂは、なじみ時間Ｔ_fitの値を固定の値とし、かつ、遅れ時間Ｔ_rsの値を最大値Ｔ_rs_maxまたは最小値Ｔ_rs_minから刻み幅Ｔｒで変化させて、ロボット３０およびハンド３１の動作を検証する。ロボット制御装置１０Ｂは、かかる検証によって、遅れ時間Ｔ_rsの値を決定する。

把持制御パラメータ更新部１８は、遅れ時間Ｔ_rsの値を決定するための動作の開始時に、遅れ時間Ｔ_rsの値には最大値Ｔ_rs_maxまたは最小値Ｔ_rs_minを設定する。把持制御パラメータ更新部１８は、遅れ時間Ｔ_rsの値を動作時間予測部１１Ｂへ出力する。実施の形態１の場合と同様に、ロボット動作時間算出部１６は、ロボット動作指令に基づいて時間Ｔ１ｃを算出する。ロボット動作時間算出部１６は、時間Ｔ１ｃに遅れ時間Ｔ_rsを加算することによって、ロボット動作時間Ｔ１を算出する。ロボット動作時間算出部１６は、ロボット３０が動作を開始した時点からの経過時間である時間Ｔａをロボット動作時間Ｔ１から差し引くことによってロボット残動作時間Ｔ０を算出する。

把持制御パラメータ更新部１８は、成功率が閾値以下となるか、あるいは、遅れ時間Ｔ_rsの値が最大値Ｔ_rs_maxまたは最小値Ｔ_rs_minに到達するまで、遅れ時間Ｔ_rsの更新を繰り返すとともに成功率を取得する。このようにして、把持制御パラメータ更新部１８は、遅れ時間Ｔ_rsの更新を繰り返しながら検証が行われて取得された成否情報に基づいて遅れ時間Ｔ_rsの値を決定する。動作時間予測部１１Ｂは、決定された遅れ時間Ｔ_rsの値を組み入れた計算によりロボット動作時間Ｔ１を予測する。

実施の形態３によると、ロボット制御装置１０Ｂは、ハンド動作時間Ｔ_gspおよびなじみ時間Ｔ_fitの各々を更新させ、検証により取得された成否情報に基づいてハンド動作時間Ｔ_gspの値となじみ時間Ｔ_fitの値とを決定する。または、ロボット制御装置１０Ｂは、ロボット制御系情報である遅れ時間Ｔ_rs、およびなじみ時間Ｔ_fitの各々を更新させ、検証により取得された成否情報に基づいて遅れ時間Ｔ_rsの値となじみ時間Ｔ_fitの値とを決定する。これにより、ロボット制御装置１０Ｂは、把持の成功率を向上させることができ、かつ、ロボット３０およびハンド３１による把持動作に要する時間を短縮することができる。

実施の形態３において、把持制御パラメータ更新部１８は、補正量ΔＴを更新させ、かつ成否情報に基づいて補正量ΔＴの値を決定しても良い。この場合、把持制御パラメータには、補正量ΔＴが含まれる。把持制御パラメータ更新部１８は、補正量ΔＴの更新を繰り返しながら検証が行われて取得された成否情報に基づいて補正量ΔＴの値を決定する。把持制御パラメータ更新部１８は、ある決められた刻み幅で補正量ΔＴの値を変化させることによる補正量ΔＴの調整によって、補正量ΔＴを更新する。動作時間予測部１１Ｂは、ロボット動作時間算出部１６において、決定された補正量ΔＴの値を組み入れた計算によってロボット動作時間Ｔ１を算出する。ロボット制御装置１０Ｂは、成否情報に基づいて補正量ΔＴの値を決定する場合も、ユーザによるマニュアルの調整方法に比べて、簡単に把持の成功率を向上させることができ、かつ、ロボット３０およびハンド３１による把持動作に要する時間を短縮することができる。

実施の形態３において、把持制御パラメータ更新部１８は、差し込み量ｄを更新させ、かつ成否情報に基づいて差し込み量ｄの値を決定しても良い。この場合、把持制御パラメータには、差し込み量ｄが含まれる。把持制御パラメータ更新部１８は、差し込み量ｄの更新を繰り返しながら検証が行われて取得された成否情報に基づいて差し込み量ｄの値を決定する。把持制御パラメータ更新部１８は、ある決められた刻み幅で差し込み量ｄの値を変化させることによる差し込み量ｄの調整によって、差し込み量ｄを更新する。動作時間予測部１１Ｂは、ロボット動作時間算出部１６において、決定された差し込み量ｄの値を組み入れた計算によってロボット動作時間Ｔ１を算出する。ロボット制御装置１０Ｂは、成否情報に基づいて差し込み量ｄの値を決定する場合も、ユーザによるマニュアルの調整方法に比べて、簡単に把持の成功率を向上させることができ、かつ、ロボット３０およびハンド３１による把持動作に要する時間を短縮することができる。

実施の形態４．
実施の形態４では、実施の形態３における把持制御パラメータの更新の態様の変形例について説明する。実施の形態４にかかるロボット制御装置１０Ｂの動作は、把持制御パラメータの調整の態様が実施の形態３とは異なる。ここでは、図７を参照して、実施の形態４にかかるロボット制御装置１０Ｂの動作を説明する。実施の形態４では、上記の実施の形態１から３と同一の構成要素には同一の符号を付し、実施の形態１から３とは異なる構成について主に説明する。

実施の形態４において、把持制御パラメータは、実施の形態３と同様に、ハンド動作時間Ｔ_gspおよびなじみ時間Ｔ_fit、または、ロボット制御系情報である遅れ時間Ｔ_rs、およびなじみ時間Ｔ_fitである。把持制御パラメータには、補正量ΔＴまたは差し込み量ｄが含まれても良い。ここでは、把持制御パラメータがハンド動作時間Ｔ_gspおよびなじみ時間Ｔ_fitである場合を例として説明する。

実施の形態３では、ロボット制御装置１０Ｂは、ハンド動作時間Ｔ_gspの値となじみ時間Ｔ_fitの値とのうち、一方を固定の値とし、他方を決められた刻み幅Ｔｇ，Ｔｆで変化させることによって、ハンド動作時間Ｔ_gspの更新、またはなじみ時間Ｔ_fitの更新を行った。実施の形態４では、ロボット制御装置１０Ｂは、ハンド動作時間Ｔ_gspの値となじみ時間Ｔ_fitの値との組み合わせを、粒子群最適化、ベイズ最適化、または、遺伝的アルゴリズムなどの探索手法を用いて探索する。

探索に用いられる評価関数には、動作時間の短さを評価する関数が使用される。動作時間は、ロボット３０およびハンド３１による把持動作に要する時間であって、ロボット３０が目的位置への移動を開始してからハンド３１が対象物を把持する動作を終えるまでの時間とする。把持に失敗した場合には、評価結果に大きなペナルティが加算される。把持制御パラメータ更新部１８は、把持を成功でき、かつ動作時間を短縮できるハンド動作時間Ｔ_gspの値となじみ時間Ｔ_fitの値との最適な組み合わせを、評価関数を使用して探索する。把持制御パラメータ更新部１８は、探索の回数があらかじめ設定された回数に到達した時点で探索を終了し、それまでの探索において評価関数が最小となったハンド動作時間Ｔ_gspの値となじみ時間Ｔ_fitの値との組み合わせを出力する。

なお、把持制御パラメータが遅れ時間Ｔ_rsおよびなじみ時間Ｔ_fitである場合、把持制御パラメータ更新部１８は、把持を成功でき、かつ動作時間を短縮できる遅れ時間Ｔ_rsの値となじみ時間Ｔ_fitの値との最適な組み合わせを、評価関数を使用して探索する。

実施の形態４によると、ロボット制御装置１０Ｂは、把持を成功でき、かつ動作時間を短縮できるハンド動作時間Ｔ_gspの値となじみ時間Ｔ_fitの値との最適な組み合わせを、評価関数を使用して探索する。または、ロボット制御装置１０Ｂは、把持を成功でき、かつ動作時間を短縮できる遅れ時間Ｔ_rsの値となじみ時間Ｔ_fitの値との最適な組み合わせを、評価関数を使用して探索する。これにより、ロボット制御装置１０Ｂは、把持の成功率を向上させることができ、かつ、ロボット３０およびハンド３１による把持動作に要する時間を短縮することができる。

実施の形態５．
図８は、実施の形態５にかかるロボット制御装置１０Ｃの構成例を示す図である。ロボット制御装置１０Ｃは、実施の形態３で説明した動作時間予測部１１Ｂと同様の動作時間予測部１１Ｃを備える。また、ロボット制御装置１０Ｃには、実施の形態３で説明したなじみ時間予測部１２Ｂは備えられていない。実施の形態５では、上記の実施の形態１から４と同一の構成要素には同一の符号を付し、実施の形態１から４とは異なる構成について主に説明する。

ロボット制御装置１０Ｃは、実施の形態３で説明した把持制御パラメータ更新部１８とは異なる把持制御パラメータ更新部１８Ｃを備える。実施の形態５において、把持制御パラメータは、ハンド動作時間Ｔ_gspまたは遅れ時間Ｔ_rsである。

実施の形態３の場合と同様に、把持制御パラメータ更新部１８Ｃは、ハンド動作時間Ｔ_gspを更新させ、かつ、成否情報を取得する。把持制御パラメータ更新部１８Ｃは、ハンド動作時間Ｔ_gspの更新を繰り返しながら検証が行われて取得された成否情報に基づいてハンド動作時間Ｔ_gspの値を決定する。または、実施の形態３の場合と同様に、把持制御パラメータ更新部１８Ｃは、ロボット制御系情報である遅れ時間Ｔ_rsを更新させ、かつ、成否情報を取得する。把持制御パラメータ更新部１８Ｃは、ハンド動作時間Ｔ_gspの更新を繰り返しながら検証が行われることによって取得された成否情報に基づいてハンド動作時間Ｔ_gspの値を決定する。実施の形態５において、把持制御パラメータ更新部１８Ｃは、なじみ時間Ｔ_fitの更新およびなじみ時間Ｔ_fitの値の決定を行わない。

ハンド動作時間Ｔ_gspの値または遅れ時間Ｔ_rsの値を決定するためのロボット制御装置１０Ｃの動作は、実施の形態３の場合と同様である、実施の形態５によると、ロボット制御装置１０Ｃは、把持の成功率を向上させることができ、かつ、ロボット３０およびハンド３１による把持動作に要する時間を短縮することができる。なお、実施の形態３または４の場合と同様に、把持制御パラメータには、補正量ΔＴまたは差し込み量ｄが含まれても良い。

実施の形態６．
実施の形態６では、機械学習により把持制御パラメータの値を決定する例について説明する。図９は、実施の形態６にかかるロボット制御装置１０Ｄの構成例を示す図である。ロボット制御装置１０Ｄは、把持制御パラメータ学習部２０を備える。ロボット制御装置１０Ｄには、実施の形態３で説明した把持制御パラメータ更新部１８は備えられていない。ロボット制御装置１０Ｄは、実施の形態３で説明した動作時間予測部１１Ｂと同様の動作時間予測部１１Ｄを備える。ロボット制御装置１０Ｄは、実施の形態３で説明したなじみ時間予測部１２Ｂと同様のなじみ時間予測部１２Ｄを備える。実施の形態６では、上記の実施の形態１から５と同一の構成要素には同一の符号を付し、実施の形態１から５とは異なる構成について主に説明する。

把持制御パラメータ学習部２０は、学習装置２１と、推論装置２２と、学習済モデル記憶部２３とを備える。学習装置２１は、対象物の位置Ｐとハンド動作情報と把持制御パラメータとの関係であって、把持の成功率があらかじめ設定された閾値以上、かつ、ロボット３０およびハンド３１による把持動作に要する時間である動作時間が最短となるときにおける関係を学習する。把持制御パラメータは、ハンド動作時間Ｔ_gsp、なじみ時間Ｔ_fit、および、ロボット制御系情報である遅れ時間Ｔ_rsの少なくとも１つである。ここでは、対象物の位置Ｐと、ハンド動作情報と、ハンド動作時間Ｔ_gsp、なじみ時間Ｔ_fit、および遅れ時間Ｔ_rsとの関係を学習する場合を例として説明する。ハンド動作情報は、差し込み量ｄの値、および、開き幅ｗの値とする。ハンド動作情報には、開き幅ｗの値の代わりに、対象物の幅の値が含まれても良い。

学習装置２１は、対象物の位置Ｐとハンド動作情報と把持制御パラメータとの関係を示す学習済モデルを生成する。学習済モデル記憶部２３は、学習済モデルを記憶する。推論装置２２は、学習済モデルを使用して、ハンド動作時間Ｔ_gsp、なじみ時間Ｔ_fit、および遅れ時間Ｔ_rsの各値を推論する。

図１０は、実施の形態６にかかるロボット制御装置１０Ｄが有する把持制御パラメータ学習部２０のうち、学習装置２１および学習済モデル記憶部２３を示す図である。学習装置２１は、データ取得部２４およびモデル生成部２５を備える。データ取得部２４には、遅れ時間Ｔ_rs、ハンド動作時間Ｔ_gsp、およびなじみ時間Ｔ_fitの各値と、位置Ｐの情報と、ハンド動作情報と、成否情報と、動作時間情報とが入力される。

成否情報は、位置Ｐ、差し込み量ｄ、および開き幅ｗの組み合わせごとに遅れ時間Ｔ_rs、ハンド動作時間Ｔ_gsp、およびなじみ時間Ｔ_fitの各値を更新しながら把持動作を検証することによって取得される。実施の形態６において、成否情報は、把持の成功率を示す値とする。動作時間情報は、ロボット３０が目的位置への移動を開始してからハンド３１が対象物を把持する動作を終えるまでの時間の長さを示す値とする。動作時間は、把持動作を検証する際に計測される。

データ取得部２４は、遅れ時間Ｔ_rs、ハンド動作時間Ｔ_gsp、およびなじみ時間Ｔ_fitの各値の組み合わせと、位置Ｐの情報と、ハンド動作情報と、成否情報と、動作時間情報とを使用して、学習用データを作成する。データ取得部２４は、入力された遅れ時間Ｔ_rs、ハンド動作時間Ｔ_gsp、およびなじみ時間Ｔ_fitの各値の組み合わせから、成功率が閾値以上、かつ動作時間が最短となるときの組み合わせを抽出する。データ取得部２４は、位置Ｐの情報と、ハンド動作情報と、抽出された遅れ時間Ｔ_rs、ハンド動作時間Ｔ_gsp、およびなじみ時間Ｔ_fitの各値の組み合わせとを互いに関連付けた学習用データを作成する。このようにして、データ取得部２４は、学習用データを取得する。

モデル生成部２５は、学習用データを用いて、位置Ｐおよびハンド動作情報から、遅れ時間Ｔ_rs、ハンド動作時間Ｔ_gsp、およびなじみ時間Ｔ_fitの各値を推論するための学習済モデルを生成する。学習済モデル記憶部２３は、生成された学習済モデルを記憶する。

モデル生成部２５が用いる学習アルゴリズムとしては、教師あり学習、教師なし学習、または強化学習等の公知のアルゴリズムを用いることができる。一例として、ニューラルネットワークを適用する場合について説明する。モデル生成部２５は、ニューラルネットワークモデルに従い、いわゆる教師あり学習によって、遅れ時間Ｔ_rs、ハンド動作時間Ｔ_gsp、およびなじみ時間Ｔ_fitの各値の組み合わせを学習する。ここで、教師あり学習とは、入力および結果のデータの組を学習装置２１に与えることで、学習用データにある特徴を学習し、入力から結果を推論する手法である。学習用データは、入力と、入力に対応する結果であるラベルとを含む。位置Ｐの情報およびハンド動作情報は入力に相当し、遅れ時間Ｔ_rs、ハンド動作時間Ｔ_gsp、およびなじみ時間Ｔ_fitの各値はラベルに相当する。

図１１は、実施の形態６における機械学習に使用されるニューラルネットワークの構成例を示す図である。ニューラルネットワークは、複数のニューロンからなる入力層と、複数のニューロンからなる中間層である隠れ層と、複数のニューロンからなる出力層とで構成される。中間層は、１層、または２層以上でも良い。入力層へ入力された複数の値の各々は、重みが乗算されて、中間層へ入力される。中間層へ入力された複数の値の各々は、重みが乗算されて、出力層から出力される。出力層から出力される出力結果は、入力層で乗算される重みの値と、中間層で乗算される重みの値とに従って変化する。

ニューラルネットワークは、入力層に位置Ｐの情報およびハンド動作情報を入力して出力層から出力された結果が、遅れ時間Ｔ_rs、ハンド動作時間Ｔ_gsp、およびなじみ時間Ｔ_fitの各値に近づくように重みの値を調整することによって、遅れ時間Ｔ_rs、ハンド動作時間Ｔ_gsp、およびなじみ時間Ｔ_fitの各値の組み合わせを学習する。モデル生成部２５は、以上のような学習を実行することで学習済モデルを生成する。モデル生成部２５は、既に生成された学習済モデルを学習済モデル記憶部２３から読み出し、学習用データに従った再学習により学習済モデルを更新しても良い。

図１２は、実施の形態６にかかるロボット制御装置１０Ｄが有する把持制御パラメータ学習部２０のうち、推論装置２２および学習済モデル記憶部２３を示す図である。推論装置２２は、データ取得部２６および推論部２７を備える。

データ取得部２６に位置Ｐの情報およびハンド動作情報が入力されることによって、データ取得部２６は、推論用データである位置Ｐの情報およびハンド動作情報を取得する。推論部２７は、学習済モデル記憶部２３から学習済モデルを読み出す。推論部２７は、学習済モデルへ位置Ｐの情報およびハンド動作情報を入力することによって、遅れ時間Ｔ_rs、ハンド動作時間Ｔ_gsp、およびなじみ時間Ｔ_fitの各値を出力する。

把持制御パラメータ学習部２０は、遅れ時間Ｔ_rsおよびハンド動作時間Ｔ_gspの各値を動作時間予測部１１Ｄへ出力する。把持制御パラメータ学習部２０は、なじみ時間Ｔ_fitの値をなじみ時間予測部１２Ｄへ出力する。

実施の形態１の場合と同様に、ロボット動作時間算出部１６は、ロボット動作指令に基づいて時間Ｔ１ｃを算出する。ロボット動作時間算出部１６は、時間Ｔ１ｃに遅れ時間Ｔ_rsを加算することによって、ロボット動作時間Ｔ１を算出する。ロボット動作時間算出部１６は、ロボット３０が動作を開始した時点からの経過時間である時間Ｔａをロボット動作時間Ｔ１から差し引くことによってロボット残動作時間Ｔ０を算出する。実施の形態１の場合と同様に、動作時間予測部１１Ｄは、ロボット動作時間算出部１６において、ロボット制御系情報と、対象物の位置Ｐの情報と、ハンド動作情報とを組み入れた計算によってロボット動作時間Ｔ１を算出する。動作時間予測部１１Ｄは、ロボット制御系情報と、対象物の位置Ｐの情報と、ハンド動作情報とを組み入れた計算によりロボット動作時間Ｔ１を予測する。

動作時間予測部１１Ｄは、ロボット残動作時間Ｔ０の値と、入力されたハンド動作時間Ｔ_gspの値とを比較する。実施の形態１の場合と同様に、動作時間予測部１１Ｄは、ロボット残動作時間Ｔ０の値がＴ０＜Ｔ_gspを充足する値に到達したタイミングを検出すると、Ｔ０＜Ｔ_gspを充足するタイミングが到来したことをハンド動作開始指示部１３へ伝達する。また、動作時間予測部１１Ｄは、当該タイミングにおけるロボット残動作時間Ｔ０の値と、当該タイミングにおけるハンド動作時間Ｔ_gspの値とをハンド動作開始指示部１３へ送る。

なお、実施の形態１の場合と同様に、動作時間予測部１１Ｄは、補正量ΔＴを設定しておき、Ｔ０＜Ｔ_gspを充足するタイミングの代わりに、Ｔ０＜Ｔ_gsp－ΔＴを充足するタイミングを検出しても良い。ロボット制御装置１０Ｄは、Ｔ０＝０の時点でハンド３１の開き幅が２Ｒ_ｗｃとなるように、把持動作の開始をハンド制御装置に指示する。これにより、ロボット制御装置１０Ｄは、ΔＴ＞０のときにおいて、ロボット３０の動作が終了するタイミングで指部を対象物に接触させることができる。また、ロボット制御装置１０Ｄは、ロボット３０の動作中において対象物に指部を接触させないようにすることで、把持の失敗を低減できる。

なじみ時間予測部１２Ｄは、把持制御パラメータ学習部２０から入力されたなじみ時間Ｔ_fitの値を、そのまま把持後動作指示部１４へ出力する。なお、ハンド動作開始指示部１３および把持後動作指示部１４の各々の動作は、実施の形態１の場合と同様である。

実施の形態６では、モデル生成部２５が用いる学習アルゴリズムに教師あり学習を適用する場合について説明したが、学習アルゴリズムには、教師あり学習以外の学習が適用されても良い。モデル生成部２５は、強化学習、教師なし学習、または半教師あり学習といった学習アルゴリズムを用いて機械学習を実行しても良い。モデル生成部２５は、深層学習（Deep Learning）、遺伝的プログラミング、帰納論理プログラミング、またはサポートベクターマシンといった学習アルゴリズムを用いて機械学習を実行しても良い。

実施の形態６では、学習装置２１は、ロボット制御装置１０Ｄに内蔵されている。学習装置２１は、ロボット制御装置１０Ｄの外部の装置でも良い。学習装置２１は、ネットワークを介してロボット制御装置１０Ｄに接続される装置でも良く、クラウドサーバ上に存在する装置でも良い。

学習装置２１は、１つのロボット制御装置１０Ｄについて作成された学習用データに従って把持制御パラメータの値を学習するものに限られない。学習装置２１は、複数のロボット制御装置１０Ｄについて作成された学習用データに従って、把持制御パラメータの値を学習しても良い。学習装置２１は、同一の場所で使用される複数のロボット制御装置１０Ｄから学習用データを取得しても良く、または、互いに異なる場所で使用される複数のロボット制御装置１０Ｄから学習用データを取得しても良い。学習用データは、複数の場所において互いに独立して稼働するロボット制御装置１０Ｄから取得されても良い。複数のロボット制御装置１０Ｄからの学習用データの取得を開始した後に、学習用データが取得される対象に新たなロボット制御装置１０Ｄが追加されても良い。また、複数のロボット制御装置１０Ｄからの学習用データの取得を開始した後に、学習用データが取得される対象から、複数のロボット制御装置１０Ｄの一部が除外されても良い。

ある１つのロボット制御装置１０Ｄについて学習を行った学習装置２１は、当該ロボット制御装置１０Ｄ以外の他のロボット制御装置１０Ｄについての学習を行っても良い。学習装置２１は、当該他のロボット制御装置１０Ｄについての再学習によって、学習済モデルを更新することができる。

学習装置２１は、対象物の位置Ｐと、ハンド動作情報と、ハンド動作時間Ｔ_gsp、なじみ時間Ｔ_fit、および、遅れ時間Ｔ_rsの各値のうち少なくとも１つとの関係を学習するものであれば良い。推論装置２２は、学習済モデルを用いて、対象物の位置Ｐおよびハンド動作情報から、ハンド動作時間Ｔ_gsp、なじみ時間Ｔ_fit、および、遅れ時間Ｔ_rsの各値のうち少なくとも１つを推論する。

学習装置２１へ入力されるハンド動作情報には、差し込み量ｄの値、および、開き幅ｗの値のうちの少なくとも１つが含まれていれば良い。学習装置２１へ入力されるハンド動作情報には、差し込み量ｄの値の代わりに、指定位置にて差し込み量ｄによりロボット３０を動作させる際の速度または加速度の情報が含まれても良い。

実施の形態６によると、ロボット制御装置１０Ｄは、対象物の位置Ｐとハンド動作情報と把持制御パラメータとの関係であって、把持の成功率があらかじめ設定された閾値以上、かつ、ロボット３０およびハンド３１による把持動作に要する時間である動作時間が最短となるときにおける関係を学習する。ロボット制御装置１０Ｄは、学習済モデルを用いて、対象物の位置Ｐおよびハンド動作情報から把持制御パラメータの値を推論する。これにより、ロボット制御装置１０Ｄは、把持の成功率を向上させることができ、かつ、ロボット３０およびハンド３１による把持動作に要する時間を短縮することができる。

実施の形態７．
図１３は、実施の形態７にかかるロボット制御装置１０Ｅの構成例を示す図である。ロボット制御装置１０Ｅは、実施の形態６にかかるロボット制御装置１０Ｄと同様に、把持制御パラメータ学習部２０を備える。ロボット制御装置１０Ｅは、実施の形態６で説明した動作時間予測部１１Ｄと同様の動作時間予測部１１Ｅを備える。また、ロボット制御装置１０Ｅには、実施の形態６で説明したなじみ時間予測部１２Ｄは備えられていない。実施の形態７では、上記の実施の形態１から６と同一の構成要素には同一の符号を付し、実施の形態１から６とは異なる構成について主に説明する。

実施の形態７において、把持制御パラメータは、ハンド動作時間Ｔ_gsp、およびロボット制御系情報である遅れ時間Ｔ_rsの少なくとも１つである。学習装置２１は、対象物の位置Ｐと、ハンド動作情報と、ハンド動作時間Ｔ_gspおよび遅れ時間Ｔ_rsの各値のうち少なくとも１つとの関係を学習する。実施の形態７において、学習装置２１にはなじみ時間Ｔ_fitの値は入力されない。推論装置２２は、学習済モデルを使用して、ハンド動作時間Ｔ_gspおよび遅れ時間Ｔ_rsの各値を推論する。推論装置２２は、なじみ時間Ｔ_fitの値の推論を行わない。

実施の形態６の場合と同様に、ロボット制御装置１０Ｅは、対象物の位置Ｐとハンド動作情報と把持制御パラメータとの関係であって、把持の成功率があらかじめ設定された閾値以上、かつ、ロボット３０およびハンド３１による把持動作に要する時間である動作時間が最短となるときにおける関係を学習する。実施の形態６の場合と同様に、ロボット制御装置１０Ｅは、学習済モデルを用いて、位置Ｐおよびハンド動作情報から把持制御パラメータの値を推論する。これにより、ロボット制御装置１０Ｅは、把持の成功率を向上させることができ、かつ、ロボット３０およびハンド３１による把持動作に要する時間を短縮することができる。

次に、実施の形態１から７にかかるロボット制御装置１０，１０Ａ，１０Ｂ，１０Ｃ，１０Ｄ，１０Ｅを実現するハードウェア構成について説明する。ロボット制御装置１０，１０Ａ，１０Ｂ，１０Ｃ，１０Ｄ，１０Ｅは、処理回路により実現される。処理回路は、プロセッサがソフトウェアを実行する回路であっても良いし、専用の回路であっても良い。

処理回路がソフトウェアにより実現される場合、処理回路は、例えば、図１４に示す制御回路である。図１４は、実施の形態１から７にかかる制御回路５０の構成例を示す図である。制御回路５０は、入力部５１、プロセッサ５２、メモリ５３および出力部５４を備える。

入力部５１は、制御回路５０の外部から入力されたデータを受信してプロセッサ５２に与えるインターフェース回路である。出力部５４は、プロセッサ５２またはメモリ５３からのデータを制御回路５０の外部に送るインターフェース回路である。処理回路が図１４に示す制御回路５０である場合、プロセッサ５２がメモリ５３に記憶されたロボット制御プログラムを読み出して実行することにより、ロボット制御装置１０，１０Ａ，１０Ｂ，１０Ｃ，１０Ｄ，１０Ｅの各構成要素が実現される。ロボット制御プログラムは、ロボット制御装置１０，１０Ａ，１０Ｂ，１０Ｃ，１０Ｄ，１０Ｅの各構成要素に対応するプログラムである。また、プロセッサ５２は、演算結果等のデータをメモリ５３の揮発性メモリに出力する。メモリ５３は、プロセッサ５２が実施する各処理における一時メモリとしても使用される。プロセッサ５２は、演算結果等のデータをメモリ５３に出力して記憶させても良いし、演算結果等のデータを、メモリ５３の揮発性メモリを介して補助記憶装置に記憶させても良い。各構成要素において情報を記憶する機能は、メモリ５３または補助記憶装置により実現される。

プロセッサ５２は、ＣＰＵ（Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサ、またはＤＳＰ（Digital Signal Processor）ともいう）である。メモリ５３は、例えば、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ、ＥＰＲＯＭ（Erasable Programmable Read Only Memory）、ＥＥＰＲＯＭ（登録商標）（Electrically Erasable Programmable Read Only Memory）等の、不揮発性または揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスクまたはＤＶＤ（Digital Versatile Disc）等が該当する。

図１４は、汎用のプロセッサ５２およびメモリ５３により各構成要素を実現する場合のハードウェアの例であるが、各構成要素は、専用のハードウェア回路により実現されても良い。図１５は、実施の形態１から７にかかる専用のハードウェア回路５５の構成例を示す図である。

専用のハードウェア回路５５は、入力部５１、出力部５４および処理回路５６を備える。処理回路５６は、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）、またはこれらを組み合わせた回路である。なお、各構成要素は、制御回路５０とハードウェア回路５５とが組み合わされて実現されても良い。

なお、ロボット制御プログラムは、ＣＤ（Compact Disc）－ＲＯＭ、ＤＶＤ－ＲＯＭなどの記録媒体に格納され、各実施の形態を実現させるために記録媒体が提供されてもよい。

以上の各実施の形態に示した構成は、本開示の内容の一例を示すものである。各実施の形態の構成は、別の公知の技術と組み合わせることが可能である。各実施の形態の構成同士が適宜組み合わせられても良い。本開示の要旨を逸脱しない範囲で、各実施の形態の構成の一部を省略または変更することが可能である。

１０，１０Ａ，１０Ｂ，１０Ｃ，１０Ｄ，１０Ｅロボット制御装置、１１，１１Ａ，１１Ｂ，１１Ｃ，１１Ｄ，１１Ｅ動作時間予測部、１２，１２Ｂ，１２Ｄなじみ時間予測部、１３ハンド動作開始指示部、１４把持後動作指示部、１５記憶部、１６ロボット動作時間算出部、１７ハンド動作時間算出部、１８，１８Ｃ把持制御パラメータ更新部、２０把持制御パラメータ学習部、２１学習装置、２２推論装置、２３学習済モデル記憶部、２４，２６データ取得部、２５モデル生成部、２７推論部、３０ロボット、３１ハンド、４０ロボット制御システム、５０制御回路、５１入力部、５２プロセッサ、５３メモリ、５４出力部、５５ハードウェア回路、５６処理回路。

Claims

ロボットのハンドを前記ロボットが目的位置に到達させるまでに要する時間であるロボット動作時間と、前記ハンドの動作が指令された時点から前記目的位置において前記ハンドが対象物を把持する動作を終えるまでの時間であるハンド動作時間とを予測する動作時間予測部と、
予測された前記ロボット動作時間と予測された前記ハンド動作時間とに基づいて決定されたタイミングでの前記ハンドの動作開始を指示するハンド動作開始指示部と、を備え、
前記動作時間予測部は、前記ロボットの制御系の応答性を決定する制御パラメータを含むロボット制御系情報を組み入れた計算により前記ロボット動作時間を予測することを特徴とするロボット制御装置。
ロボットのハンドを前記ロボットが目的位置に到達させるまでに要する時間であるロボット動作時間と、前記ハンドの動作が指令された時点から前記目的位置において前記ハンドが対象物を把持する動作を終えるまでの時間であるハンド動作時間とを予測する動作時間予測部と、
予測された前記ロボット動作時間と予測された前記ハンド動作時間とに基づいて決定されたタイミングでの前記ハンドの動作開始を指示するハンド動作開始指示部と、
前記対象物の位置の情報と、前記ハンドの動作についての情報であって前記対象物についての情報に基づいて得られるハンド動作情報と、把持制御パラメータとの関係であって、把持の成功率があらかじめ定められた閾値以上、かつ、前記対象物を把持する把持動作に要する時間である動作時間が最短となるときにおける前記関係を学習する把持制御パラメータ学習部と、を備え、
前記動作時間予測部は、前記ロボットの制御系の特性を示すロボット制御系情報を組み入れた計算により前記ロボット動作時間を予測し、
前記把持制御パラメータは、前記ハンド動作時間および前記ロボット制御系情報の少なくとも１つであることを特徴とするロボット制御装置。
ロボットのハンドを前記ロボットが目的位置に到達させるまでに要する時間であるロボット動作時間と、前記ハンドの動作が指令された時点から前記目的位置において前記ハンドが対象物を把持する動作を終えるまでの時間であるハンド動作時間とを予測する動作時間予測部と、
予測された前記ロボット動作時間と予測された前記ハンド動作時間とに基づいて決定されたタイミングでの前記ハンドの動作開始を指示するハンド動作開始指示部と、
前記ハンドが前記対象物の把持を開始してから前記ハンドが前記対象物になじむまでの時間であるなじみ時間を予測するなじみ時間予測部と、
前記ハンドが前記対象物の把持を開始した時点から、予測された前記なじみ時間が経過した後に、前記対象物を把持する動作の次に行われる前記ロボットの動作を指示する把持後動作指示部と、を備え、
前記動作時間予測部は、前記ロボットの制御系の特性を示すロボット制御系情報を組み入れた計算により前記ロボット動作時間を予測することを特徴とするロボット制御装置。
前記動作時間予測部は、前記ロボット制御系情報と、前記対象物の位置の情報と、前記対象物を把持するときの前記ハンドの動作についての情報であるハンド動作情報とを組み入れた計算により前記ロボット動作時間を予測することを特徴とする請求項２または３に記載のロボット制御装置。
前記動作時間予測部は、前記ハンドの制御系の特性または前記ハンドを構成する機構の特性を示すハンド特性情報を組み入れた計算により前記ハンド動作時間を予測することを特徴とする請求項１から４のいずれか１つに記載のロボット制御装置。
前記ロボットおよび前記ハンドによる把持動作を制御するための把持制御パラメータである前記ハンド動作時間を更新させ、かつ、前記ロボットおよび前記ハンドの動作の検証により把持の成否を判定した結果を示す成否情報を取得する把持制御パラメータ更新部を備え、
前記把持制御パラメータ更新部は、前記ハンド動作時間の更新を繰り返しながら前記検証が行われて取得された前記成否情報に基づいて前記ハンド動作時間の値を決定し、
前記動作時間予測部は、前記成否情報に基づいて決定された前記ハンド動作時間の値を、予測された前記ハンド動作時間の値として出力することを特徴とする請求項１から５のいずれか１つに記載のロボット制御装置。
前記ロボットおよび前記ハンドによる把持動作を制御するための把持制御パラメータである前記ロボット制御系情報を更新させ、かつ、前記ロボットおよび前記ハンドの動作の検証により把持の成否を判定した結果を示す成否情報を取得する把持制御パラメータ更新部を備え、
前記把持制御パラメータ更新部は、前記ハンド動作時間の更新を繰り返しながら前記検証が行われて取得された前記成否情報に基づいて前記ロボット制御系情報を決定し、
前記動作時間予測部は、前記成否情報に基づいて決定された前記ロボット制御系情報を組み入れた計算により前記ロボット動作時間を予測することを特徴とする請求項１から５のいずれか１つに記載のロボット制御装置。
前記対象物の位置の情報と、前記ハンドの動作についての情報であって前記対象物についての情報に基づいて得られるハンド動作情報と、前記ハンド動作時間および前記ロボット制御系情報の少なくとも１つである把持制御パラメータとの関係であって、把持の成功率があらかじめ定められた閾値以上、かつ、前記対象物を把持する把持動作に要する時間である動作時間が最短となるときにおける前記関係を学習する把持制御パラメータ学習部を備えることを特徴とする請求項１または３に記載のロボット制御装置。
前記ハンドが前記対象物の把持を開始してから前記ハンドが前記対象物になじむまでの時間であるなじみ時間を予測するなじみ時間予測部と、
前記ハンドが前記対象物の把持を開始した時点から、予測された前記なじみ時間が経過した後に、前記対象物を把持する動作の次に行われる前記ロボットの動作を指示する把持後動作指示部と、を備えることを特徴とする請求項１に記載のロボット制御装置。
前記なじみ時間予測部は、前記ハンドの制御系の特性または前記ハンドの動作特性を示すハンド特性情報、および前記対象物の特性を示す対象物特性情報の少なくとも一方と、前記ハンドの動作についての情報であって前記対象物についての情報に基づいて得られるハンド動作情報とを組み入れた計算により前記なじみ時間を予測することを特徴とする請求項９に記載のロボット制御装置。
前記ロボットおよび前記ハンドによる把持動作を制御するための把持制御パラメータである前記ハンド動作時間および前記なじみ時間の各々を更新させ、かつ、前記ロボットおよび前記ハンドの動作の検証により把持の成否を判定した結果を示す成否情報を取得する把持制御パラメータ更新部を備え、
前記把持制御パラメータ更新部は、前記ハンド動作時間の更新を繰り返しながら前記検証が行われて取得された前記成否情報に基づいて前記ハンド動作時間の値を決定し、かつ、前記なじみ時間の更新を繰り返しながら前記検証が行われて取得された前記成否情報に基づいて前記なじみ時間の値を決定し、
前記動作時間予測部は、前記成否情報に基づいて決定された前記ハンド動作時間の値を、予測された前記ハンド動作時間の値として出力し、
前記なじみ時間予測部は、前記成否情報に基づいて決定された前記なじみ時間の値を、予測された前記なじみ時間の値として出力することを特徴とする請求項９または１０に記載のロボット制御装置。
前記ロボットおよび前記ハンドによる把持動作を制御するための把持制御パラメータである前記ロボット制御系情報および前記なじみ時間の各々を更新させ、かつ、前記ロボットおよび前記ハンドの動作の検証により把持の成否を判定した結果を示す成否情報を取得する把持制御パラメータ更新部を備え、
前記把持制御パラメータ更新部は、前記ロボット制御系情報の更新を繰り返しながら前記検証が行われて取得された前記成否情報に基づいて前記ロボット制御系情報を決定し、かつ、前記なじみ時間の更新を繰り返しながら前記検証が行われて取得された前記成否情報に基づいて前記なじみ時間を決定し、
前記動作時間予測部は、前記成否情報に基づいて決定された前記ロボット制御系情報を組み入れた計算により前記ロボット動作時間を予測し、
前記なじみ時間予測部は、前記成否情報に基づいて決定された前記なじみ時間の値を、予測された前記なじみ時間の値として出力することを特徴とする請求項９または１０に記載のロボット制御装置。
前記対象物の位置と、前記ハンドの動作についての情報であって前記対象物についての情報に基づいて得られるハンド動作情報と、前記ハンド動作時間、前記なじみ時間、および前記ロボット制御系情報の少なくとも１つである把持制御パラメータとの関係であって、把持の成功率があらかじめ設定された閾値以上、かつ、前記対象物を把持する把持動作に要する時間である動作時間が最短となるときにおける前記関係を学習する把持制御パラメータ学習部を備えることを特徴とする請求項９または１０に記載のロボット制御装置。
ロボットのハンドを前記ロボットが目的位置に到達させるまでに要する時間であるロボット動作時間を、前記ロボットの制御系の応答性を決定する制御パラメータを含むロボット制御系情報を組み入れた計算により予測するステップと、
前記ハンドの動作が指令されたときから前記目的位置において前記ハンドが対象物を把持する動作を終えるまでの時間であるハンド動作時間を予測するステップと、
予測された前記ロボット動作時間と予測された前記ハンド動作時間とに基づいて決定されたタイミングでの前記ハンドの動作開始を指示するステップと、を含むことを特徴とするロボット制御方法。
ロボットのハンドを前記ロボットが目的位置に到達させるまでに要する時間であるロボット動作時間を、前記ロボットの制御系の応答性を決定する制御パラメータを含むロボット制御系情報を組み入れた計算により予測するステップと、
前記ハンドの動作が指令されたときから前記目的位置において前記ハンドが対象物を把持する動作を終えるまでの時間であるハンド動作時間を予測するステップと、
予測された前記ロボット動作時間と予測された前記ハンド動作時間とに基づいて決定されたタイミングでの前記ハンドの動作開始を指示するステップと、をコンピュータシステムに実行させることを特徴とするロボット制御プログラム。