JP2022176917A - ロボットデバイスを制御するための方法 - Google Patents
ロボットデバイスを制御するための方法 Download PDFInfo
- Publication number
- JP2022176917A JP2022176917A JP2022080087A JP2022080087A JP2022176917A JP 2022176917 A JP2022176917 A JP 2022176917A JP 2022080087 A JP2022080087 A JP 2022080087A JP 2022080087 A JP2022080087 A JP 2022080087A JP 2022176917 A JP2022176917 A JP 2022176917A
- Authority
- JP
- Japan
- Prior art keywords
- trajectory
- manifold
- weight vector
- demonstrated
- combination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1656—Programme controls characterised by programming, planning systems for manipulators
- B25J9/1661—Programme controls characterised by programming, planning systems for manipulators characterised by task planning, object-oriented languages
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/163—Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/161—Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/1653—Programme controls characterised by the control loop parameters identification, estimation, stiffness, accuracy, error analysis
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1656—Programme controls characterised by programming, planning systems for manipulators
- B25J9/1664—Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/42—Recording and playback systems, i.e. in which the programme is recorded from a cycle of operations, e.g. the cycle of operations being manually controlled, after which this record is played back on the same machine
- G05B19/423—Teaching successive positions by walk-through, i.e. the tool head or end effector being grasped and guided directly, with or without servo-assistance, to follow a path
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/36—Nc in input of data, input key till input tape
- G05B2219/36401—Record play back, teach position and record it then play back
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/39—Robotics, robotics to robotics hand
- G05B2219/39001—Robot, manipulator control
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/39—Robotics, robotics to robotics hand
- G05B2219/39298—Trajectory learning
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/40—Robotics, robotics mapping to robotics vision
- G05B2219/40519—Motion, trajectory planning
Landscapes
- Engineering & Computer Science (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Automation & Control Theory (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Manipulator (AREA)
Abstract
【課題】ロボットデバイスを制御するための方法が説明される。【解決手段】ロボットスキルのためのデモンストレーションを提供するステップであって、ロボット構成のシーケンスを含む軌道をデモンストレーションし、リーマン多様体の構造を有する構成空間の要素によって記述されるステップと重みベクトルに従った基本運動と、デモンストレーションされた軌道との間の距離測定値を最小化する重みベクトルを検索することで、ロボットデバイスの基本運動の重みベクトルとしての各軌道の表現を決定するステップであって、組み合わせは、多様体に写像されるステップと、デモンストレーションされた軌道について決定された重みベクトルに確率分布を適合させた基本運動を実行することによってロボットデバイスを制御するステップと、を含む。【選択図】図6
Description
本開示は、ロボットデバイスを制御するための方法に関する。
多くの用途では、ロボットが、場合によっては動的で構造化されていない環境において自律的に動作することが望まれる。このためには、ロボットは、自身の周辺環境の中でどのように動き、どのように対話するかを学習する必要がある。そうするために、ロボットは、単純な動作を実行したり、複雑なタスクを複数のスキルの組み合わせとして実行したりするために使用できるスキルのライブラリに依存する場合がある。動作スキルを学習する手法は、人間の例を介して、デモンストレーションから学ぶこと(LfD:Learning from demonstrations)として公知である。これには、ロボットによって模倣されるべき特定の動作を1回または複数回示す専門家(典型的には人間)が必要である。
A. Paraschos らによる刊行物「Using probabilistic movement primitives in robotics” by A. Paraschos et al., in Autonomous Robots, 42:529-551, 2018」には、ロボット動作スキルを学習して合成するための確率的枠組みである確率的運動プリミティブ(ProMP)が記載されている。ProMPは、コンパクトな基底関数表現に基づく軌道分布を表している。その確率論的定式化により、運動の変調、平行運動の起動、および制御における分散情報の活用が可能になる。
ProMPは、直交運動の学習に使用されてきたが、その定式化では、四元数軌道の形態での配向運動を扱うことができない。しかしながら、四元数は、それらがほぼ最小の表現と、閉ループ配向制御での強い安定性とを提供するなど、ロボット制御にとって好ましい特性を備えている。したがって、四元数軌道を含むデモンストレーションからロボット制御学習を可能にするアプローチが望まれる。
発明の開示
様々な実施形態によれば、ロボットデバイスを制御するための方法が提供され、この方法は、ロボットスキルのためのデモンストレーションを提供するステップであって、ここで、各デモンストレーションは、ロボット構成のシーケンスを含む軌道をデモンストレーションし、ここで、各ロボット構成は、リーマン多様体の構造を有する予め定められた構成空間の要素によって記述されるステップを含む。本方法はさらに、各デモンストレーションされた軌道について、重みベクトルに従った基本運動の組み合わせと、デモンストレーションされた軌道との間の距離測定値を最小化する重みベクトルを検索することによって、ロボットデバイスの予め定められた基本運動の重みベクトルとしての軌道の表現を決定するステップであって、ここで、組み合わせは、多様体に写像されるステップを含む。本方法はさらに、デモンストレーションされた軌道について決定された重みベクトルに確率分布を適合させることによって重みベクトルの確率分布を決定するステップと、重みベクトルの決定された確率分布に従って基本運動を実行することによってロボットデバイスを制御するステップとを含む。
様々な実施形態によれば、ロボットデバイスを制御するための方法が提供され、この方法は、ロボットスキルのためのデモンストレーションを提供するステップであって、ここで、各デモンストレーションは、ロボット構成のシーケンスを含む軌道をデモンストレーションし、ここで、各ロボット構成は、リーマン多様体の構造を有する予め定められた構成空間の要素によって記述されるステップを含む。本方法はさらに、各デモンストレーションされた軌道について、重みベクトルに従った基本運動の組み合わせと、デモンストレーションされた軌道との間の距離測定値を最小化する重みベクトルを検索することによって、ロボットデバイスの予め定められた基本運動の重みベクトルとしての軌道の表現を決定するステップであって、ここで、組み合わせは、多様体に写像されるステップを含む。本方法はさらに、デモンストレーションされた軌道について決定された重みベクトルに確率分布を適合させることによって重みベクトルの確率分布を決定するステップと、重みベクトルの決定された確率分布に従って基本運動を実行することによってロボットデバイスを制御するステップとを含む。
様々な実施形態によれば、上述の方法は、(以下で詳細に説明するように多変量測地線回帰を使用して)確率的動作プリミティブを符号化、再現、および適合させるリーマン多様体アプローチを使用するロボット制御を提供する。特に、様々な実施形態によれば、四元数軌道の空間は、リーマン多様体とみなされる。このアプローチは、ジオメトリを認識しないアプローチ(古典的なProMPなど)と比較して、ともすれば不正確なデータを符号化したり、歪んだ軌道を再現したりすることが少なく、ロボットによるスキルの学習と再現とを可能にさせる。これは大まかな近似に依存しないため、モデルもより説明しやすくなる。その上さらに、このアプローチは、軌道分布の変調や動作プリミティブの混合などの付加的な適合能力も提供する。
様々な実施形態によれば、デモンストレーションされた軌道は、測地線回帰である重みベクトルとして表される。これは、測地線が、各デモンストレーションされた軌道に適合しているように見え得ることを意味する。
以下では様々な例が与えられる。
実施例1は、上述したようなロボットデバイスを制御するための方法である。
実施例2は、実施例1による方法であり、ここで、重みベクトルの確率分布は、デモンストレーションされた軌道について決定された重みベクトルにガウス分布を適合させることによって決定される。
訓練および再現のためにガウス分布を使用することにより、デモンストレーションでは見られなかった制御シナリオの信頼性の高い制御が提供される。
実施例3は、実施例1または2による方法であり、ここで、各デモンストレーションされた軌道は、時点の予め定められたシーケンスの各時点に対するロボット構成を含み、重みベクトルに従った基本運動の各組み合わせは、時点の予め定められたシーケンスの各時点に対するロボット構成を指定し、
各デモンストレーションされた軌道について、重みベクトルは、可能な重みベクトルの集合から、重みベクトルに従った基本運動の組み合わせと、デモンストレーションされた軌道とについての重みベクトルを決定することによって決定され、
組み合わせは、多様体に写像され、可能な重みベクトルの集合の中で最小であり、
多様体に写像された基本運動の組み合わせと、デモンストレーションされた軌道との間の距離は、時点のシーケンスの時点にわたって、多様体に写像されたときの時点における基本運動の組み合わせによって与えられる多様体の要素と、デモンストレーションされた軌道との間の多様体のメトリックの値または値のべき乗を含む各時点についての項を含んだ項にわたる合計によって与えられる。
各デモンストレーションされた軌道について、重みベクトルは、可能な重みベクトルの集合から、重みベクトルに従った基本運動の組み合わせと、デモンストレーションされた軌道とについての重みベクトルを決定することによって決定され、
組み合わせは、多様体に写像され、可能な重みベクトルの集合の中で最小であり、
多様体に写像された基本運動の組み合わせと、デモンストレーションされた軌道との間の距離は、時点のシーケンスの時点にわたって、多様体に写像されたときの時点における基本運動の組み合わせによって与えられる多様体の要素と、デモンストレーションされた軌道との間の多様体のメトリックの値または値のべき乗を含む各時点についての項を含んだ項にわたる合計によって与えられる。
これにより、デモンストレーションされた軌道に重みベクトルを適合させることによって、重みベクトルによりデモンストレーションされた軌道を表現する効率的な手法が提供される。組み合わせは、多様体上の点を選択し、選択された点における多様体の接空間の指数関数により多様体に組み合わせを写像することによって、多様体に写像されてもよい。
実施例4は、実施例1~3までのいずれか1つによる方法であり、この方法は、デモンストレーションされた軌道の1つについて、重みベクトルに従った基本運動の組み合わせと、デモンストレーションされた軌道との間の距離測定値が最小化されるような、多様体の点および重みベクトルを検索するステップを含み、ここで、組み合わせは、点における接空間から前記多様体に写像され、ここで、各デモンストレーションされた軌道について、多様体への各組み合わせの写像は、選択された点における接空間から前記組み合わせを写像することによって実行される。
換言すれば、接空間(すなわち、接空間を取る多様体の点)は、1つの実証された軌道について、重みおよび点にわたる最適化を実行することにより決定される。次いで、この接空間は、組み合わせまたは検索中にこれが必要な任意の組み合わせを、デモンストレーションされたすべての軌道についての多様体に写像するために使用される。換言すれば、同じ接空間、したがって同じ指数写像が、すべてのデモンストレーションされた軌道に使用される。これにより、異なる軌道に対して異なる接空間を使用することが接線重みベクトルを非常に多様化させてしまうという問題を克服する効果的な手法が提供される。
実施例5は、実施例1~4までのいずれか1つによる方法であり、ここで、軌道は、配向軌道であり、各デモンストレーションは、位置軌道をさらにデモンストレーションし、各ロボット構成は、三次元空間におけるベクトルによって記述される姿勢と、予め定められた構成空間の要素によって記述される向きとを含む。
したがって、スキルは、ロボットの姿勢のシーケンス、例えばエンドエフェクタの位置および向きをデモンストレーションすることによって学習されてもよく、ここで、向きのためのモデルは、リーマン多様体に基づくアプローチを使用して学習される。
実施例6は、実施例1~5までのいずれか1つによる方法であり、この方法は、より多くのロボットスキルのデモンストレーションを提供するステップと、各スキルについて、軌道の表現と重みベクトルと重みベクトルの確率分布とを決定するステップと、各スキルについて、重みベクトルの確率分布から、(時点毎に)多様体点のリーマンガウス分布を決定することによって、ロボットデバイスを制御するステップと、スキルのリーマンガウス分布の積分布を決定するステップと、(時点毎に)決定された積確率分布からサンプリングすることによってロボットデバイスを制御するステップと、を含む。
これにより、リーマン多様体上のデモンストレーションから学んだスキルのためのスキルのブレンディングが可能になる。
実施例7は、請求項1から6までのいずれか1項記載の方法を実行するように構成されているロボットデバイスコントローラである。
実施例8は、命令がプロセッサによって実行されるときに、該プロセッサに実施例1から6までのいずれか1つによる方法を実行させる命令を含んでいるコンピュータプログラムである。
実施例9は、命令がプロセッサによって実行されるときに、該プロセッサに実施例1から6までのいずれか1つによる方法を実行させる命令が格納されているコンピュータ可読媒体である。
図面において、同様の参照符号は、一般に、異なる図面を通して同じ部品を指している。これらの図面は必ずしも縮尺通りではなく、代わりに本発明の原理を一般的に説明することに重点が置かれている。以下の明細書では、以下の図面を参照しながら様々な態様が説明される。
以下の詳細な説明は、本発明が実施され得る本開示の特定の詳細および態様を例示として示す添付の図面を参照している。また、本発明の保護範囲から逸脱することなく、他の態様を使用したり、構造的、論理的、および電気的な変更を行ったりしてもよい。本開示のいくつかの態様は、新たな態様を形成するために本開示の1つ以上の他の態様と組み合わせることができるので、本開示の様々な態様は、必ずしも相互に排他的であるとは限らない。
以下では、様々な例をより詳細に説明する。
図1は、ロボット100を示す。
このロボット100は、作業部品(または1つ以上の他の対象物)を操作したり、組み立てたりするためのロボットアーム101、例えば産業用ロボットアームを含む。このロボットアーム101は、マニピュレータ102,103,104と、これらのマニピュレータ102,103,104が支持されている基台(または支持台)105とを含む。「マニピュレータ」という用語は、ロボットアーム101の可動部材を指し、それらの操作が、例えば作業を実行するために環境との物理的な相互作用を可能にしている。制御のために、ロボット100は、制御プログラムに従って環境との相互作用を実施するように構成された(ロボット)コントローラ106を含む。マニピュレータ102,103,104の(支持台105から最も離れた)最後の部材104は、エンドエフェクタ104とも称され、1つ以上のツール、例えば溶接トーチ、把持器具、塗装設備などを含むことができる。
(支持台105の近傍にある)他のマニピュレータ102,103は、例えばエンドエフェクタ104と共に、その端部にエンドエフェクタ104を備えるロボットアーム101が設けられた位置決めデバイスを形成することができる。ロボットアーム101は、人間の腕と同様の機能を提供することができる機械的なアームである(場合によっては、その端部にツールを備える)。
ロボットアーム101は、マニピュレータ102,103,104を互いに相互接続し、さらに支持台105にも相互接続する関節要素107,108,109を含むことができる。関節要素107,108,109は、1つ以上の関節を含むことができ、それらの各々は、互いに関連するマニピュレータに対して回転可能な動作(すなわち回転動作)および/または並進動作(すなわち変位)を提供することができる。マニピュレータ102,103,104の運動は、コントローラ106によって制御されるアクチュエータを用いて開始することができる。
「アクチュエータ」という用語は、駆動されることに応じて機構やプロセスに影響を与えるように適合された構成部品として理解されてもよい。アクチュエータは、コントローラ106によって出力された命令(いわゆる起動)を、機械的な運動として実行することができる。アクチュエータ、例えば電気機械変換器は、駆動に応じて電気エネルギを機械エネルギに変換するように構成されていてもよい。
「コントローラ」という用語は、任意のタイプの論理実装された項目として理解されてもよく、これは、例えば、記録媒体に格納されたソフトウェア、ファームウェア、またはそれらの組み合わせを実行することができ、例えば、本例のアクチュエータに命令を出力することができる回路および/またはプロセッサを含むことができる。コントローラは、例えば、システム、本例ではロボットの運用を制御するためにプログラムコード(例えばソフトウェア)によって構成されていてもよい。
本例では、コントローラ106は、1つ以上のプロセッサ110と、コードおよびデータを格納したメモリ111とを含み、これらのコードおよびデータに基づいて、プロセッサ110はロボットアーム101を制御する。様々な実施形態によれば、コントローラ106は、メモリ111に格納された機械学習モデル112に基づいて、ロボットアーム101を制御する。
様々な実施形態によれば、リーマン多様体アプローチは、ProMPを使用して配向動作プリミティブを学習するために使用される。すなわち、リーマン多様体定式化を使用して「配向ProMP」として示される、古典的ProMPの拡張が提供される。
オリジナルの(すなわち古典的な)確率的運動プリミティブ(ProMP)アプローチは、ユークリッド空間でのロボットのスキルを処理するため、(ロボットの向きを表す)四元数軌道の学習および再現を不可能にさせる。
以下に説明するProMPのリーマン定式化は、四元数データの学習および再現を可能にさせる。その上さらに、本明細書で与えられる一般的な処理のため、一般的なリーマン多様体に対する使用が可能になる。
以下では、ユークリッド空間でのロボットスキルを処理するためのProMPの導入が示される。
一般に、単一の運動実行に対して、所定の軌道
が、変数yの時系列として示される。ここで、ytは、時間tについてのロボット構成とも称され、時間ステップtでのタスク空間内の関節角度または直交位置のいずれかを表すことができる(付加的にyの時間微分が考慮されてもよい)。古典的なProMP表記法に従って、ytは、d自由度(DoF)のシステム、例えば7自由度を有するロボットアーム101の測定値を表すd次元ベクトルである。軌道τの各点は、次式のように線形基底関数モデルとして表すことができる。
yt=Ψtw+εy⇒P(yt│w)=N(yt│Ψtw,Σy) (1)
ここで、wは、dNφ次元の重みベクトルであり、Ψtは、各DoFに対する時間依存の基底関数φtを含むd×dNφ次元のブロック対角行列であり(1つのDoFに対する基底関数は、基本運動(例えば、所定の方向への運動、所定の軸周りの回転)とも称される)、Nφは、基底関数の数を示し、εy~N(0,Σy)は、不確かさΣyを有するゼロ平均i.i.d.ガウスノイズである。
yt=Ψtw+εy⇒P(yt│w)=N(yt│Ψtw,Σy) (1)
ここで、wは、dNφ次元の重みベクトルであり、Ψtは、各DoFに対する時間依存の基底関数φtを含むd×dNφ次元のブロック対角行列であり(1つのDoFに対する基底関数は、基本運動(例えば、所定の方向への運動、所定の軸周りの回転)とも称される)、Nφは、基底関数の数を示し、εy~N(0,Σy)は、不確かさΣyを有するゼロ平均i.i.d.ガウスノイズである。
ProMPは、各デモンストレーションが重みベクトルwの異なる値によって特徴付けられ、分布P(w;θ)=N(w│μw,Σw)となることを想定している。次いで、完全な軌道は、P(w;θ)から引き出された重みwと共に各tにおける基底関数の合成としてモデル化できる。したがって、時間tに対する状態P(yt;θ)の分布は、次式のように計算できる。
この式からは、各タイムステップtにおける平均と分散の両方が推定される。
デモンストレーションから学習する場合、例示的な軌道は時間の長さが異なることが多い。ProMPは、位相変数を導入してデータを時間インスタンスから分離することでこの問題を克服する。これにより、時間変調が可能になる。この場合、デモンストレーションの範囲は、z0=0からzT=1であり、デモンストレーションされた軌道は、
として再定義される。Ψを形成する基底関数は、位相変数zにも依存する。具体的には、ProMPは、幅h、中心ciでもって、bi(zt)=exp((-(zt-ci)2)/2h)として定義されるストロークベースの運動のためのガウス基底関数を使用し、これらはしばしば実験的に設計されている。次いで、これらのガウス基底関数は、正規化され、次式となる。
一般的に言えば、ProMPの学習プロセスは、主に重み分布P(w;θ)を推定することからなる。そうするために、式(1)のようなi番目のデモンストレーションを表す重みベクトルwiが最尤推定によって推定される。これは、次式、
wi=(ΨTΨ+λI)-1ΨTYi (3)
の形態の線形リッジ回帰の解につながる。ここで
は、観測されたすべての軌道点を連結し、Ψは、基底関数行列Ψtについてのすべての時間インスタンスからなる。次いで、N個のデモンストレーションの集合が与えられると、重み分布パラメータθ={μw,Σw}が最尤法で推定できる。新しい状況に適合するために、ProMPは、関連する共分散Σy
*を用いて所期の軌道点
に到達するように動作を条件付けることにより、通過点または目標位置への軌道変調を可能にする。これは、結果として、条件付き確率
となり、そのパラメータは、以下のように計算できる(ガウス分布を想定)。
wi=(ΨTΨ+λI)-1ΨTYi (3)
の形態の線形リッジ回帰の解につながる。ここで
軌道分布の積を計算することにより、異なる運動プリミティブは、単一の動作にブレンドすることができる。具体的には、最終動作への影響がブレンディング重みαt,sに従って変化するS個の異なるProMPの集合Ps(yt)=N(yt│μt,s,Σt,s)に対して、各時間ステップtにおけるブレンドされた軌道は、次の分布
に従う。次いで、
のパラメータは、次のようにガウス分布の加重積から容易に推定される。
タスクパラメータは、例えば、タスクを達成するためにロボット動作を目標対象物に適合させることができる。そのような情報は、デモンストレーション中に得られることが多く、ProMPの定式化に統合させることができる。形式的には、ProMPは、外部状態
を考慮し、
から平均重みベクトルμwへのアフィン写像を学習して以下の結合確率分布となる。
ここで、{O,o}は線形リッジ回帰を使用して学習される。
上述したように、四元数は、ロボット制御に適した特性を備えている。ただし、(ロボット制御に使用される)四元数は、単位ノルム制約を満たすため、ベクトル空間を形成せず、したがって、(単位ノルムを伴う)四元値を有する変数を処理し、分析するための従来のユークリッド空間法の使用は不十分である。
様々な実施形態によれば、リーマン幾何学は、四元数空間上でProMPを定式化するために活用される。
リーマン多様体Mは、各点が局所的にユークリッド空間
に類似し、大域的に定義された微分構造を持つm次元の位相空間である。各点x∈Mに対して、xを通るすべての可能な滑らかな曲線の接ベクトルからなるベクトル空間である接空間TxMが存在する。リーマン多様体は、リーマンメトリックと称される滑らかに変化する正定値の内積を備え、これによりM内の曲線の長さを定義することができる。これらの曲線は、測地線と称され、M内の2点間の最小長さの曲線を表すため、ユークリッド空間上の直線をリーマン多様体に一般化したものである。
図2は、それらの点が例えばロボットエンドエフェクタの可能な向きをそれぞれ表すことができる球面多様体S2の図を示す。
2つの点xおよびyは、ロボットエンドエフェクタ104の2つの異なる方向を表すためにコントローラ106によって使用されてもよい球面上に示されている。
周囲空間における2点間の最短距離は直線201となるが、多様体上の最短経路は測地線202である。
指数写像
は、xから始まり、xとyとの間の測地距離dMが、xとuとの間の距離のノルムに等しくなるようなuの方向における測地線上に存在するように、xの接空間内にある点uを多様体上の点yに写像する。逆の操作は対数写像
と称される。すなわち、
様々な実施形態によれば、線形回帰をリーマン多様体設定に一般化する測地線回帰が使用される(例えばコントローラ106)。この測地線回帰モデルは、以下のように定義される。
ここで、y∈Mおよび
は、それぞれ出力変数と入力変数、p∈Mは、多様体上の基点、u∈TpMは、pにおける接空間内のベクトル、誤差項εは、
における接空間内の値をとる確率変数である。線形回帰と同様に、(p,u)は、切片pおよび傾きuとして解釈することができる。
ここで、点{y1,…,yT}∈Mおよび
の集合を考察する。測地線回帰の目的は、すべてのT個の対(xi,yi)の間の関係を最良にモデル化する測地線曲線γ∈Mを見つけ出すことである。これを達成するために、モデル推定値と観測値との間のリーマン距離の2乗和(つまり誤差)が最小化される。すなわち、
ここで、
は、多様体M上のモデル推定値であり、
は、リーマン誤差であり、対(p,u)∈TMは、接束TMの要素である。測地線モデルの最小二乗推定量は、上記のリーマン距離の二乗和の最小化として定式化できる。すなわち、
しかしながら、式(9)は、式(3)のような解析的な解を与えられない。解は最急降下法によって得ることができるが、これには、リーマン距離関数の導関数と指数写像の導関数とを計算する必要がある。後者は、初期点pおよび初期速度uに関する導関数に分けられる。これらの勾配は、ヤコビ場(すなわち、リーマン曲率テンソルのもとで特定の初期条件に従う2次方程式の解)の観点から計算することができる。
上記の測地線モデルは、スカラー独立変数
のみを考慮していることに留意されたい。これは、導関数が、単一の接ベクトルuによってパラメータ化された単一の測地線曲線に沿ったヤコビ場によって取得されることを意味する。ヤコビ場の計算は、いわゆる随伴演算子に依存し、これは、実際には測地線回帰の誤差項の平行移動の役割を果たす。
の多変量ケースへの拡張には、複数の測地線曲線(これはユークリッド空間における「基底」ベクトルとみなすことができる)の識別を伴う若干異なったアプローチが必要である。リーマン多様体上の多変量一般線形モデル(MGLM)は、この問題の解決策を提供する。
MLGMは、xの次元毎に1つずつ、複数の接ベクトルuj∈TpMによって形成される測地線基底U=[u1…un]を使用する。次いで、問題の式(9)は、
を用いて以下のように再定式化することができる。
式(10)を解くために、対応する勾配は、随伴演算子が平行移動操作に類似しているという洞察を活用して計算することができる。そのようにして、多変量ケースのための特別な随伴演算子を設計するというハードルを克服することができ、代わりに、平行移動操作が、必要な勾配を近似するために実行されてもよい。この多変量の枠組みは、リーマン多様体M上にある各デモンストレーションについて、式(3)に類似した重みベクトルを計算するという目的を果たす。
以下では、デモンストレーションデータが四元数軌道に対応する場合、すなわちM≡S3の場合に、どのようにMLGMが使用され得るかについて説明する。
人間のデモンストレーションが(運動感覚教授または遠隔操作を介して)直交運動パターンによって特徴付けられる場合、ロボットエンドエフェクタの並進運動と回転運動の両方を包含する学習モデル112を有することが必要である。これは、所定のデモンストレーション軌道
が、ここで時間ステップtにおけるエンドエフェクタの完全な直交姿勢を表すデータポイント
として構成されることを意味する。このケースでの課題は、
におけるユークリッドのケースが古典的なProMPに従うため、配向空間におけるProMPの学習である。
この等価性は、ProMPの古典的な定式化と我々の提案する配向軌道のためのアプローチとの間の類似性を確立するときに有用であることが判明した。式(1)と同様に、τの点yt∈Mは、次のように測地線基底関数モデルとして表現することができる。
P(yt│w)=NM(yt│Expp(Ψtw),Σy) (12)
ここで、pは、M上の固定基点であり、
は、Nφ個の重みベクトルwn∈TpMを連結した大きな重みベクトルであり、Ψtは、式(1)と同じ時間依存性の基底関数の行列であり、Σyは、
上の不確実性を符号化した共分散行列である。この定式化に関する2つの特別な態様、詳細には、(i)式(12)のリーマンガウス分布の平均、つまりExpp(Ψtw)∈Mが前述のMGLMの等価的定式化を活用すること、および(ii)式(12)においてwを形成する重みベクトルが、MGLMの測地基底を構成するベクトルに対応することは、とりわけ注目に値する。
P(yt│w)=NM(yt│Expp(Ψtw),Σy) (12)
ここで、pは、M上の固定基点であり、
すべてのデモンストレーションは、異なる重みベクトルwによって特徴付けられるため、ここでも分布P(w;θ)=N(w│μw,Σw)が取得できる。したがって、ytの周辺分布は次のように計算することができる。
P(y;θ)=∫NM(y│Expp(Ψw),Σy)N(w│μw,Σw)dw (13)
ここで、周辺分布は、異なる多様体上にある2つの確率分布に依存する(簡略化のために、ここおよび以下では時間インデックスを省略する)。しかしながら、平均μyは、単一の固定点p∈Mおよびμw∈TpMに依存する。これらの2つの観測値は、以下のように接空間TpM上の境界(13)を解くために活用される。
ここで、
は、μyからpへの平行移動共分散Σyである。この周辺分布は、依然として接空間TpM上にあるため、指数写像を使用してMに逆写像されることに留意されたい。これにより、最終的に周辺分布は次のようになる。
ただし、
P(y;θ)=∫NM(y│Expp(Ψw),Σy)N(w│μw,Σw)dw (13)
ここで、周辺分布は、異なる多様体上にある2つの確率分布に依存する(簡略化のために、ここおよび以下では時間インデックスを省略する)。しかしながら、平均μyは、単一の固定点p∈Mおよびμw∈TpMに依存する。これらの2つの観測値は、以下のように接空間TpM上の境界(13)を解くために活用される。
上述のように、ProMPの学習プロセスは、重み分布P(w;θ)を推定することに集約される。そうするために、各デモンストレーションiについて、コントローラ106は、MGLMを使用して、重みベクトル
を推定する。はじめに、先に導入されたytについての等価式が使用され、ここで、
は、基底関数の数である。その上さらに、yt∈S3を用いてデモンストレーションされた四元数軌道
を考察する。次いで、式(3)と同様にユークリッド空間において、重み推定値が、ここでは式(10)の活用によって取得され、次式となる。
ここで、φtは、時点tにおける基底関数のベクトルであり、Wは、推定された接重みベクトル
(すなわち、点p∈Mから現れるNφ個の接ベクトル)の集合を含んでいる。
図3は、配向ProMPの重みの学習に使用した球面多様体S2上の多変量一般線形回帰を示している。軌道yが与えられれば、接空間TpMの原点pと、接重みベクトルwnとが式(15)を介して推定される。
式(15)を解くために、pおよび各wnに関するE(p,wn)の勾配が計算される。上記で説明したように、これらの勾配は、いわゆる随伴演算子に依存し、大まかに言えば、各誤差項
を、
を用いて
からTpMにもたらしている。したがって、これらの随伴演算子は、平行移動操作として近似させることができる。これは、式(15)の誤差関数を次のような再定式化に導く。
次いで、誤差関数E(p,wn)の近似勾配は次のように対応する。
上記の勾配を用いることにより、コントローラ106は、各デモンストレーションiについて、Nφ個のベクトルwnによって形成されるベクトルpiと重み行列Wiの両方を推定することができる。各デモンストレーションは、各接重みベクトルwn∈TpMを推定するために使用される多様体Mにおける原点を定義するpの異なる推定値につながる可能性があることに留意されたい。これにより、デモンストレーション全体にわたって異なる接空間が生成される可能性があり、したがって、非常に多様な接重みベクトルが生成される可能性がある。この問題を克服する有効な手法は、すべてのデモンストレーションが同じ接空間の原点pを共有していることを想定することであり、これは、測地線基底関数モデル(式(12))を定義するときに行われたのと同じ想定である。したがって、様々な実施形態によれば、コントローラ106は、単一のデモンストレーションについてpを推定し、それを使用して、デモンストレーションの集合全体についてすべての接重みベクトルを推定する。次いで、N個のデモンストレーションの集合が与えられると、重み分布パラメータθ={μw,Σw}は、
として標準最尤法によって推定することができる。
N個のデモンストレーションの集合が提供された(例えば、ロボットアーム101を手で動かすことによってユーザから提供された)後にコントローラ106が実行することができる、配向ProMPによるロボット制御モデル112の学習アルゴリズムの一例は、以下のとおりである。
古典的なProMPと同様に、コントローラ106は、関連する共分散
を有する所期の軌道点
に到達するように動作を調整することによって、軌道変調(すなわち新たな状況に適合するための、すなわち制御シナリオ)を実行することができる。この結果、式(13)と同様に、異なる多様体上にある2つの確率分布に依存する条件付き確率
が得られる。ここで再び、平均μyは、単一で固定されたp∈Mに依存し、それが重み分布の存在する接空間TpMの基底であるということが活用される。これにより、条件付き分布は次のように書き換えることができる。
ここで、
は、結果としての条件付き分布について推定するためのパラメータである。ここで両分布は、ユークリッド空間に埋め込まれたTpM上に存在するため、新しい分布パラメータは、共分散行列の平行移動に特別な注意を払いながら古典的なProMP条件付け手順と同様に推定することができる。次いで、新たな重み分布パラメータは、以下のとおりである。
結果としての新たな重み分布からは、新たな周辺分布P(y;θ*)がここでは式(14)を介して得られる可能性もある。
ブレンディングに関して、古典的なProMPは、ガウス分布の積を使用することによって、運動プリミティブの集合をブレンドする。Mにおいてプリミティブをブレンドする場合、各軌道分布は、異なる接空間TpM上にある重みベクトルの集合によってパラメータ化されることを考慮する必要がある。したがって、ガウス分布の加重積を再定式化する必要がある。そうするために、様々な実施形態によれば、リーマン多様体上のガウス積の定式化が使用され、ここで、積の対数尤度は、勾配ベースのアプローチを使用して繰り返し最大化される。
形式的には、リーマンガウス分布の積の対数尤度は、以下のように与えられる(定数項は除外する)。
ここで、μy,sおよびΣy,sは、スキルsのための周辺分布Ps(y;θ)のパラメータである。なお、式(20)における対数写像は、異なる接空間
に作用することに留意されたい。対数尤度の最大化を実行するために、元の対数尤度関数が変更されないようにしながら、写像の基数と引数とが入れ替えられる。そうするために、Logx(y)=-Logy(x)の関係性ならびに平行移動操作をこの問題の克服のために活用することができ、次式となる。
ここで、μ+は、結果としての(推定される)ガウスの平均であり、
である。式(21)は、ベクトル
とブロック対角行列
とを定義することによって書き直すことができる。この結果、Jは、リーマン多様体M上のガウス分布の経験的平均vを計算するために使用される目的関数の形態を有し、
そこからは、次のように平均を繰り返し計算することが可能である。
ここで、Jは、vkにおけるMの接空間の基底に関するε(v)のヤコビアンである。コントローラ106は、ここでは平均μ+の同様の反復推定を以下に示すように実行することができる。
ただし、
である。反復Kで収束した後、コントローラ106は、分布P(y+)=NM(y+│μ+,Σ+)の最終パラメータを以下に示すように取得する。
上記で説明したように、古典的なProMPでは、重み分布P(w;θ)=N(w│μw,Σw)を外部タスクパラメータ
の関数として適合させることができ、ここでは、各デモンストレーションについて
の値にアクセスできると想定される。タスクパラメータ化は、重みベクトル
として配向ProMPにも同様に適用され、したがって、式(6)は、タスクパラメータ
がユークリッドである限り直接適用することができる。ただし、
がリーマン多様体に属する場合は、より一般的なアプローチが必要となる。
タスクパラメータ
を保持する場合、コントローラ106は、リーマン多様体上のガウス混合モデルを使用して結合確率分布
を学習することができる。その後、コントローラ106は、新たなタスクパラメータ
が提供された場合、再生中に
を計算するためにガウス混合回帰を採用することができる。
配向ProMPにおけるモデル学習、軌道再生、通過点適合、およびスキルブレンディング作業のやり方をより良好に説明するために、手書き文字のデータセットが使用された。元の軌道は、
において生成され、その後の単位ノルムベクトルへの単純な写像によってS2へ投影された。データセット中の各文字は、N=8回デモンストレーションされ、主に可視化の目的で、簡単な平滑化フィルタが各軌道に適用された。4つのProMPモデルがトレーニングされ、1つは{G,I,J,S}のセットの各文字用である。IおよびJについてトレーニングされたモデルには、均一に分布した中心を有するNφ=30個の基底関数が使用され、文字GおよびSについては、Nφ=60個の基底関数が使用された。配向ProMPモデルは、上記で与えられたアルゴリズムに従って、初期学習率α=0.005、対応する上限値αmax=0.03でトレーニングされた。
図4は、文字GおよびSに対してトレーニングされたモデルに対応する、デモンストレーションデータ、式(13)を介して計算された周辺分布P(y;θ)、ならびに式(18)および(19)から得られた通過点適合を示している。周辺分布の平均は、デモンストレーションパターンに従い、対応する共分散プロファイルは、S2におけるデモンストレーションの変動性を捕捉する。文字GおよびSの軌道は、現実的なロボット設定において観察されるものよりもさらに複雑となる可能性のある非常に精巧な「動作」パターンを示しており、その複雑さには注目の価値がある。通過点適合に関しては、共分散
が関連付けられたランダム点y*∈S2が使用された(すなわち、y*を通過する際に高精度が要求された)。
図4に示すように、配向ProMPは、所与の通過点を正確に通過しながら、軌道と関連する共分散プロファイルとの両方をスムーズに適合させることができる。
図5は、{G,I}および{S,J}に対する配向ProMPのブレンディングプロセスを示す。
目標は、集合の中の第1の文字のプロファイルを追従することによって始まり、次いで、第2の文字の軌道分布が途中で滑らかに切り替わる軌道を生成することであった。図5には、前述の2つのケースに対する結果としてのブレンドされた軌道が示されており、ここで、配向ProMPは、所与の2つの軌道分布を上述したように導入された配向ProMPのためのブレンディング手順を追従することによって滑らかにブレンドしている。ブレンディング挙動は、各スキルsに関連付けられた重みαs∈[0,1]の一時的な発生に強く依存することに留意されたい。この一連の実験では、
である間、重み
および
に対してシグモイド状の関数が使用された。前述の結果は、配向ProMPが、S2上の軌道分布を正常に学習および再現し、完全な通過点適合およびブレンディング能力を提供することを示している。
実験によれば、これは、例えば、以前に掴んだ物体を持ち上げ、エンドエフェクタ104を回転させ、当該物体をその元の場所に戻すが、向きは変えて配置することに相当するような再配向スキルのためのロボット設定においても同様に成り立つことを示している。このロボットスキルは、大きな位置および向きの変更を特徴とし、したがって、配向ProMPの機能性を披露するのに適している。
再配向スキルのようなロボットスキルをトレーニングするために、各デモンストレーションは、例えば、フルポーズのロボットエンドエフェクタの軌道
を与える。ここで、
は、タイムステップtにおけるエンドエフェクタの姿勢を表す。このように、各デモンストレーションは、位置軌道(各々が
の要素によって記述される位置の時系列を含む)および配向軌道(各々がS3の要素によって記述される向きの時系列を含む)をデモンストレーションする。これらの軌道からの生データは、位置に対するサブモデルと向きに対するサブモデルとを含んだ
のProMPモデル112をトレーニングするために使用されてもよく、ここでの、位置モデルは、古典的なProMPアプローチを使用して学習され、向きモデルは、配向ProMPアプローチ(例えば上述のアルゴリズム)を使用して学習される。これらのサブモデルの両方については、同じ(例えばNφ=40個の)基底関数の集合が使用されてもよいが、異なる成分について(位置サブモデルにおける各位置成分および向きサブモデルにおける各向き成分について)使用されてもよい。
要約すると、様々な実施形態に従って、本方法は、図6に示されるように提供される。
図6は、ロボットデバイスを制御するための方法を示すフローチャート600を示す。
ステップ601では、デモンストレーションがロボットスキルのために提供され、ここで、各デモンストレーションは、ロボット構成のシーケンスを含む軌道をデモンストレーションし、ここで、各ロボット構成は、リーマン多様体の構造を有する予め定められた構成空間の要素によって記述される。
ステップ602では、各デモンストレーションされた軌道について、ロボットデバイスの予め定められた基本運動の重みベクトルとしての軌道の表現が、重みベクトルに従った基本運動の組み合わせと、デモンストレーションされた軌道との間の距離測定値を最小化する重みベクトルを検索することによって決定され、ここで、組み合わせは、多様体に写像される。
ステップ603では、重みベクトルの確率分布が、デモンストレーションされた軌道について決定された重みベクトルに確率分布を適合させることによって決定される。
ステップ604では、ロボットデバイスが、重みベクトルの決定された確率分布に従って基本運動を実行することによって制御される。
これは、(式(1)に従って)重みベクトルの確率分布からサンプリングし、サンプルベクトルに従って基本運動を実行することを含むことができる。また、(式(14)に従って)軌道の確率分布を導出することも可能であり、そのうちの1つを制御のためにサンプリングすることができ、それらは上記説明のような軌道の混合などの高度な制御に使用されてもよい。
図6の方法は、1つ以上のデータ処理ユニットを含む1つ以上のコンピュータによって実行されてもよい。用語「データ処理ユニット」は、データまたは信号の処理を可能にする任意のタイプの項目として理解することができる。例えば、データまたは信号は、データ処理ユニットによって実行される少なくとも1つの(すなわち1つ以上の)特定の機能に従って処理されてもよい。データ処理ユニットは、アナログ回路、デジタル回路、コンポジット信号回路、ロジック回路、マイクロプロセッサ、マイクロコントローラ、中央処理装置(CPU)、グラフィックス処理ユニット(GPU)、デジタル信号プロセッサ(DSP)、プログラマブルゲートアレイ(FPGA)集積回路、またはそれらの任意の組み合わせを含むことができ、あるいはそれらから形成されてもよい。それぞれの機能を実装する任意の他の手法は、データ処理ユニットまたは論理回路として理解されてもよい。本明細書に詳細に記載される方法ステップのうちの1つ以上は、データ処理ユニットによって実行される1つ以上の特定の機能を通して、データ処理ユニットによって実行(例えば、実装)されてもよいことが理解されるであろう。
様々な実施形態は、例えば、デモンストレーションのデータを取得するために、ビデオ、レーダ、LiDAR、超音波、サーマルイメージング、ソナーなどのような、様々な視覚センサ(カメラ)から画像データを受信し、使用することができる。
図6のアプローチは、例えば、ロボット、車両、家電製品、電動工具、製造機械、パーソナルアシスタント、またはアクセス制御システムなどのコンピュータ制御された機械のような物理システムを制御するための制御信号を計算するために使用することができる。様々な実施形態によれば、物理システムを制御するためのポリシーが学習され、次いで、この物理システムがそれに応じて操作されてもよい。
一実施形態によれば、この方法はコンピュータに実装される。
本明細書では、特定の実施形態が示され説明されてきたが、当業者であるならば、図示され説明されてきたこれらの特定の実施形態を、本発明の保護範囲から逸脱することなく様々な代替的および/または等価的な実装形態に入れ替えてもよいことは明らかであろう。本出願では、本明細書で論じられる特定の実施形態の何らかの適合化または変化形態をカバーすることが意図されている。それゆえ、本発明は、本出願の特許請求の範囲および等価物によってのみ限定されることが意図される。
Claims (9)
- ロボットデバイスを制御するための方法であって、該方法は、
ロボットスキルのためのデモンストレーションを提供するステップであって、各デモンストレーションは、ロボット構成のシーケンスを含む軌道をデモンストレーションし、各ロボット構成は、リーマン多様体の構造を有する予め定められた構成空間の要素によって記述されるステップと、
各デモンストレーションされた軌道について、重みベクトルに従った基本運動の組み合わせと、デモンストレーションされた軌道との間の距離測定値を最小化する重みベクトルを検索することによって、前記ロボットデバイスの予め定められた基本運動の重みベクトルとしての軌道の表現を決定するステップであって、前記組み合わせは、前記多様体に写像されるステップと、
前記デモンストレーションされた軌道について決定された重みベクトルに確率分布を適合させることによって重みベクトルの確率分布を決定するステップと、
前記重みベクトルの決定された確率分布に従って基本運動を実行することによって前記ロボットデバイスを制御するステップと、を含む、方法。 - 前記重みベクトルの確率分布は、前記デモンストレーションされた軌道について決定された重みベクトルにガウス分布を適合させることによって決定される、請求項1記載の方法。
- 前記各デモンストレーションされた軌道は、時点の予め定められたシーケンスの各時点に対するロボット構成を含み、重みベクトルに従った基本運動の各組み合わせは、前記時点の予め定められたシーケンスの各時点に対するロボット構成を指定し、前記各デモンストレーションされた軌道について、前記重みベクトルは、可能な重みベクトルの集合から、前記重みベクトルに従った基本運動の組み合わせと、前記デモンストレーションされた軌道とについての重みベクトルを決定することによって決定され、前記組み合わせは、多様体に写像され、前記可能な重みベクトルの集合の中で最小であり、前記多様体に写像された基本運動の組み合わせと、前記デモンストレーションされた軌道との間の距離は、前記時点のシーケンスの時点にわたって、前記多様体に写像されたときの時点における基本運動の組み合わせによって与えられる前記多様体の要素と、前記デモンストレーションされた軌道との間の前記多様体のメトリックの値または値のべき乗を含む各時点についての項を含んだ項にわたる合計によって与えられる、請求項1または2記載の方法。
- 前記方法は、前記デモンストレーションされた軌道の1つについて、前記重みベクトルに従った基本運動の組み合わせと、前記デモンストレーションされた軌道との間の距離測定値が最小化されるような、多様体の点および重みベクトルを検索するステップを含み、前記組み合わせは、点における接空間から前記多様体に写像され、前記各デモンストレーションされた軌道について、前記多様体への前記各組み合わせの写像は、選択された点における接空間から前記組み合わせを写像することによって実行される、請求項1から3までのいずれか1項記載の方法。
- 前記軌道は、配向軌道であり、前記各デモンストレーションは、位置軌道をさらにデモンストレーションし、前記各ロボット構成は、三次元空間におけるベクトルによって記述される姿勢と、予め定められた構成空間の要素によって記述される向きとを含む、請求項1から4までのいずれか1項記載の方法。
- 前記方法は、より多くのロボットスキルのデモンストレーションを提供するステップと、各スキルについて、軌道の表現と重みベクトルと重みベクトルの確率分布とを決定するステップと、前記各スキルについて、前記重みベクトルの確率分布から、多様体点のリーマンガウス分布を決定することによって、前記ロボットデバイスを制御するステップと、前記スキルのリーマンガウス分布の積分布を決定するステップと、決定された積確率分布からサンプリングすることによって前記ロボットデバイスを制御するステップと、を含む、請求項1から5までのいずれか1項記載の方法。
- ロボットデバイスコントローラであって、請求項1から6までのいずれか1項記載の方法を実行するように構成されている、ロボットデバイスコントローラ。
- コンピュータプログラムであって、命令がプロセッサによって実行されるときに、前記プロセッサに請求項1から6までのいずれか1項記載の方法を実行させる命令を含んでいる、コンピュータプログラム。
- コンピュータ可読媒体であって、命令がプロセッサによって実行されるときに、前記プロセッサに請求項1から6までのいずれか1項記載の方法を実行させる命令が格納されている、コンピュータ可読媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102021204961.3 | 2021-05-17 | ||
DE102021204961.3A DE102021204961B4 (de) | 2021-05-17 | 2021-05-17 | Verfahren zur Steuerung einer Robotervorrichtung |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022176917A true JP2022176917A (ja) | 2022-11-30 |
Family
ID=83806295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022080087A Pending JP2022176917A (ja) | 2021-05-17 | 2022-05-16 | ロボットデバイスを制御するための方法 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP2022176917A (ja) |
KR (1) | KR20220155921A (ja) |
CN (1) | CN115351780A (ja) |
DE (1) | DE102021204961B4 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102022206381A1 (de) | 2022-06-24 | 2024-01-04 | Robert Bosch Gesellschaft mit beschränkter Haftung | Verfahren zum Steuern einer Robotervorrichtung |
DE102022212638B3 (de) | 2022-11-25 | 2024-03-14 | Robert Bosch Gesellschaft mit beschränkter Haftung | Vorrichtung und Verfahren zum Steuern eines Roboters |
CN115946130B (zh) * | 2023-03-13 | 2023-05-23 | 中国人民解放军国防科技大学 | 基于黎曼流形的人机协同方法 |
CN116985144A (zh) * | 2023-09-26 | 2023-11-03 | 珞石(北京)科技有限公司 | 一种具有c2连续的机器人末端姿态规划方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9403273B2 (en) | 2014-05-23 | 2016-08-02 | GM Global Technology Operations LLC | Rapid robotic imitation learning of force-torque tasks |
WO2017129200A1 (en) | 2016-01-28 | 2017-08-03 | MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. | A system for real-world continuous motion optimization and control |
EP3504034A1 (en) | 2016-09-15 | 2019-07-03 | Google LLC. | Deep reinforcement learning for robotic manipulation |
EP3753684B1 (en) | 2019-06-21 | 2022-08-10 | Robert Bosch GmbH | Method and system for robot manipulation planning |
DE102019209616A1 (de) | 2019-07-01 | 2021-01-07 | Kuka Deutschland Gmbh | Durchführen einer vorgegebenen Aufgabe mithilfe wenigstens eines Roboters |
DE102019216229B4 (de) | 2019-10-07 | 2022-11-10 | Robert Bosch Gmbh | Vorrichtung und Verfahren zum Steuern einer Robotervorrichtung |
EP3812972A1 (en) | 2019-10-25 | 2021-04-28 | Robert Bosch GmbH | Method for controlling a robot and robot controller |
DE102019216560B4 (de) | 2019-10-28 | 2022-01-13 | Robert Bosch Gmbh | Verfahren und Vorrichtung zum Trainieren von Manipulationsfertigkeiten eines Robotersystems |
EP3838503B1 (en) | 2019-12-16 | 2024-05-01 | Robert Bosch GmbH | Method for controlling a robot and robot controller |
DE102020207085A1 (de) | 2020-06-05 | 2021-12-09 | Robert Bosch Gesellschaft mit beschränkter Haftung | Verfahren zum steuern eines roboters und robotersteuereinheit |
-
2021
- 2021-05-17 DE DE102021204961.3A patent/DE102021204961B4/de active Active
-
2022
- 2022-05-16 CN CN202210527848.4A patent/CN115351780A/zh active Pending
- 2022-05-16 JP JP2022080087A patent/JP2022176917A/ja active Pending
- 2022-05-17 KR KR1020220059921A patent/KR20220155921A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
DE102021204961B4 (de) | 2023-06-07 |
CN115351780A (zh) | 2022-11-18 |
DE102021204961A1 (de) | 2022-11-17 |
KR20220155921A (ko) | 2022-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022176917A (ja) | ロボットデバイスを制御するための方法 | |
Ekvall et al. | Learning and evaluation of the approach vector for automatic grasp generation and planning | |
Kalakrishnan et al. | Learning force control policies for compliant manipulation | |
Bagnell et al. | An integrated system for autonomous robotics manipulation | |
Ficuciello et al. | FEM-based deformation control for dexterous manipulation of 3D soft objects | |
Yu et al. | Global model learning for large deformation control of elastic deformable linear objects: An efficient and adaptive approach | |
JP2009521334A (ja) | 多関節システムの動作の再構築、リターゲット、軌道追従及び推定 | |
Abu-Dakka et al. | A probabilistic framework for learning geometry-based robot manipulation skills | |
Skoglund et al. | Programming-by-Demonstration of reaching motions—A next-state-planner approach | |
Vochten et al. | Generalizing demonstrated motion trajectories using coordinate-free shape descriptors | |
Chen et al. | A probabilistic framework for uncertainty-aware high-accuracy precision grasping of unknown objects | |
Paraschos et al. | Model-free probabilistic movement primitives for physical interaction | |
Colomé et al. | Reinforcement learning of bimanual robot skills | |
Heins et al. | Mobile manipulation in unknown environments with differential inverse kinematics control | |
Seo et al. | Deep imitation learning for humanoid loco-manipulation through human teleoperation | |
Schperberg et al. | Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse Data using a Learning-based Unscented Kalman Filter | |
Fomena et al. | Towards practical visual servoing in robotics | |
Koropouli et al. | Generalization of Force Control Policies from Demonstrations for Constrained Robotic Motion Tasks: A Regression-Based Approach | |
US20220274255A1 (en) | Control apparatus, control method, and computer-readable storage medium storing a control program | |
Lin | Embedding Intelligence into Robotic Systems-Programming, Learning, and Planning | |
Conradt et al. | On-line learning for humanoid robot systems | |
Ogenyi et al. | An intuitive robot learning from human demonstration | |
Perumal et al. | Physical interaction and control of robotic systems using hardware-in-the-loop simulation | |
Tufail | Haptic teleoperation with impedance control based on learned inverse dynamics with application in homecare robotics | |
Tufail et al. | Real-time impedance control based on learned inverse dynamics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220617 |