JP5329856B2 - 行動推定システム - Google Patents
行動推定システム Download PDFInfo
- Publication number
- JP5329856B2 JP5329856B2 JP2008169534A JP2008169534A JP5329856B2 JP 5329856 B2 JP5329856 B2 JP 5329856B2 JP 2008169534 A JP2008169534 A JP 2008169534A JP 2008169534 A JP2008169534 A JP 2008169534A JP 5329856 B2 JP5329856 B2 JP 5329856B2
- Authority
- JP
- Japan
- Prior art keywords
- behavior
- state variable
- instructor
- estimated
- trajectory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/39—Robotics, robotics to robotics hand
- G05B2219/39254—Behaviour controller, robot have feelings, learns behaviour
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Feedback Control In General (AREA)
- Manipulator (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Description
岡田昌史 大里健太 中村仁彦「非線形力学系のアトラクタ設計によるヒューマノイドロボットの運動創発」計測自動学会論文集 vol.41,No.6,533/540(2005)
インストラクタの行動態様を推定するためのシステムであって、前記インストラクタの動きに伴って変位する状態変数の一または複数の基準時点における位置を、一または複数の基準点の位置として認識する状態認識要素と、前記状態認識要素により認識された前記基準点の位置と、前記インストラクタの複数の行動態様のそれぞれに対応する複数の第1モデルのそれぞれと、第2モデルとに基づき、前記状態変数の推定位置を時系列的に表わす複数の推定軌道を、前記推定軌道が前記基準点またはその近傍範囲を通過するという条件下で生成する軌道生成要素とを備え、前記複数の第1モデルのそれぞれが、アトラクタの引き込み点を基準とする前記状態変数の位置の各時点における偏差の大小と、アトラクタ行列と、確率分布であらわされる不確定要素とに応じて前記状態変数の位置の各時点における変位速度が連続確率変数として定義され、かつ、前記アトラクタの引き込み点が確率分布で表わされる不確定要素を有する連続確率変数として定義されているモデルであり、前記第2モデルが、前記状態変数の今回位置が前記状態変数の前回位置および今回速度により表わされ、前記状態変数の1または各n階時間微分の今回値(n=1,2,‥)が、前記状態変数の1または各n階時間微分の前回値と、前記状態変数の2または各n+1階時間微分の今回値とにより表わされ、かつ、前記状態変数の位置及びその1または各n階時間微分値のそれぞれが確率分布で表わされる不確定要素を有する連続確率変数として定義されているモデルであり、前記軌道生成要素により前記複数の推定軌道が生成される過程における前記引き込み点の時間的な累積変位量が少ないほど前記第1モデルの安定度が高くなるように前記複数の第1モデルのそれぞれの安定度を評価し、前記安定度が最高である一の前記第1モデルに対応する行動態様を、前記インストラクタの行動態様として推定することを特徴とする。
腕部12は肩関節機構を介して基体10に連結された第1腕リンクと、一端が第1腕リンクの端部に肘関節機構を介して連結され、他端が手根関節を介して手部13の付根部に連結されている第2腕リンクとを備えている。脚部14は股関節機構を介して基体10に連結された第1脚リンクと、一端が第1脚リンクの端部に膝関節機構を介して連結され、他端が足関節を介して足部15に連結されている第2脚リンクとを備えている。ロボット1は、左右の脚部14のそれぞれの離床および着床の繰り返しを伴う動きによって自律的に移動することができる。
本発明の構成要素が情報を「認識する」とは、当該構成要素が情報をデータベースから検索すること、メモリ等の記憶装置から情報を読み取ること、センサ等の出力信号に基づき情報を測定、算定、推定、判定すること、測定等された情報をメモリに格納すること等、当該情報をさらなる演算処理のために準備または用意するのに必要なあらゆる情報処理を実行することを意味する。行動推定システム110のうち一部(たとえば、状態認識要素111および軌道生成要素112)がロボット1の外部コンピュータにより構成されてもよい。
機械式モーションキャプチャーシステムによれば、インストラクタに装着されたサポータまたはスーツに取り付けられた複数のポテンショメータからの当該インストラクタ人の各関節角度を表す出力信号に基づいて状態変数の位置が測定される。磁気式モーションキャプチャーシステムによれば、インストラクタに装着されたサポータまたはスーツに取り付けられた複数の磁気センサからの出力信号に基づいて状態変数の位置が測定される。慣性式モーションキャプチャーシステムによれば、インストラクタに装着されたサポータまたはスーツに取り付けられた複数の慣性モーメントセンサからの腕等の慣性モーメントを表す出力信号に基づいて状態変数の位置が測定される。
u(k+1)=u(k)+εi(k)+Ni(μu,Σu) ..(12)
v(k+1)=v(k)+α(k+1)+N(μv,Σv) ..(22)
α(k+1)= α(k)+β(k+1)+N(μα,Σα) ..(23)
P(u(k+1)|u(k),ε(k))=N(u(k)+ε(k),Σu) ..(112)
P(p(k+1)|p(k),v(k+1))=N(p(k)+v(k+1),Σp) ..(121)
P(v(k+1)|v(k),α(k))=N(v(k)+α(k+1),Σv) ..(122)
P(α(k+1)|α(k),β(k))=N(α(k)+β(k+1),Σa) ..(123)
P(β(k))=N(0,Σβ) ..(223)
同様に第2基準時点t=Nから第1基準時点t=0までのノードが、確率遷移モデルにしたがって、時系列的に逆方向(後時点から先時点に向かう方向)に順次推定される。これにより、時系列的に逆方向について状態変数の推定位置の変化態様を表わす逆方向推定軌道Pi -が生成される。さらに、順方向推定軌道Pi +を基準として広がる許容通過範囲が設定され、かつ、逆方向推定軌道Pi -を基準として広がる許容通過範囲が設定される。そして、当該両方の許容通過範囲が合成されることにより合成許容範囲が設定され、各時点における状態変数の位置p(k)が合成許容通過範囲に収まるように推定軌道Piが生成される。
また、図8(a)に示されているように第2基準時点t=Nから第1基準時点t=0まで、状態変数の推定位置p i - (N)(=p(N)),p i - (N−1),p i - (N−2),‥,p i - (0)が時系列逆方向(黒矢印参照)に推定される。これにより、状態変数の推定位置p i - (N),p i - (N−1),p i - (N−2),‥,p i - (0)を順に経由する軌道が逆方向推定軌道P i - として生成される。
そして、安定度siが最高である一の第1モデルに対応する行動態様が、インストラクタの行動態様として推定される(図3/S008)。たとえば「ラケットをゆっくりと振る」または「ラケットを速く振る」等、状態変数位置の変位速度および加速度の高低により区別される行動態様や、「ラケットを大きく振る」または「ラケットを小さく振る」等、状態変数位置の変位量の多少により区別される行動態様や、「インストラクタの上から見て円弧を描くようにラケットを振る」「インストラクタを上から見てS字を描くようにラケットを振る」または「インストラクタを上から見て直線を描くようにラケットを振る」等、状態変数位置の軌道形状により区別される行動態様がインストラクタの行動態様として推定される。
なお、インストラクタの動作スケールに対するロボット1の動作スケールの比率に基づき、推定軌道Piのスケールが調節されてもよい。たとえば、インストラクタの腕の長さに対する、ロボット1の腕部12の長さの比率がアトラクタ行列Riに乗じられることにより、推定軌道Piのスケールが調節されてもよい。また、インストラクタの腕の長さとインストラクタが用いるラケットの長さとの和に対する、ロボット1の腕部12の長さとロボット1が用いるラケットの長さとの和の比率がアトラクタ行列Riに乗じられることにより、推定軌道Piのスケールが調節されてもよい。
また、同じく図12(a)に示されているように中間基準時点t=hから第2基準時点t=Nまで、状態変数の位置p i + (h)(=p(h)),p i + (h+1),p i + (h+2),‥,p i + (N)が時系列順方向(白矢印参照)に順次推定される。これにより、状態変数の推定位置p i + (0),p i + (1),‥,p i + (h−1),p i + (h),p i + (h+1),‥,p i + (N)を順に経由する軌道が順方向推定軌道P i + として生成される。
その一方、図12(a)に示されているように第2基準時点t=Nから中間基準時点t=hの直後時点t=h+1まで、状態変数の位置p i - (N)(=p(N)),p i - (N−1),p i - (N−2),‥,p i - (h+1)が時系列逆方向(黒矢印参照)に順次推定される。
さらに、同じく図12(a)に示されているように中間基準時点t=hから第1基準時点t=0まで、状態変数の位置p i - (h)(=p(h)),p i - (h−1),p i - (h−2),‥,p i - (0)が時系列逆方向(黒矢印参照)に順次推定される。これにより、状態変数の推定位置p i - (N),p i - (N−1),‥,p i - (h+1),p i - (h),p i - (h−1),‥,p i - (0)を順に経由する軌道が逆方向推定軌道P i - として生成される。
そして、図12(b)に示されているように順方向推定軌道の各点p i + (0),‥,p i + (h−1),p i + (h),p i + (h+1),‥,p i + (N)を中心とする確率分布と、逆方向推定軌道の各点p i - (N),‥,p i - (h+1),p i - (h),p i - (h−1),‥,p i - (0)を中心とする確率分布とが重ね合わせられるまたは合成されることにより合成許容通過範囲が設定される。そして、斜線付矢印で示されているように状態変数の位置が各時点における合成許容通過範囲に収まるように推定軌道P i が生成される。
図12(a)に一点鎖線で示されているように順方向推定軌道P i + の各点を中心として許容通過範囲(確率分布範囲)が広がっている(図17(a)参照)。図12(a)に二点鎖線で示されているように逆方向推定軌道P i - の各点を中心として許容通過範囲(確率分布範囲)が広がっている(図7(b)参照)。これら確率分布の重ね合わせの広がり度合が推定軌道P i の「許容通過範囲」に相当する(図7(c)参照)。
たとえば「ボールを打つ前はゆっくりと加速されるようにラケットを振り、ボールを打った後はゆっくりと減速されるようにラケットを振る」または「ボールを打つ前は急に加速された後でその速度が維持されるようにラケットを振り、ボールを打った後は急に減速されるようにラケットを振る」等、状態変数位置の変位速度および加速度の高低により区別される行動態様や、「ラケットを途中までは小さく振り、途中から大きく振る」または「ラケットを途中までは大きく振り、途中から小さく振る」等、状態変数位置の変位量の多少により区別される行動態様や、「インストラクタの上から見て途中まで直線を描くようにラケットを振り、途中から円弧を描くようにラケットを振る」または「インストラクタを上から見て途中まで円弧を描くようにラケットを振り、途中から直線を描くようにラケットを振る」等、状態変数位置の軌道形状により区別される行動態様がインストラクタの行動態様として推定される。
具体的には、モーションキャプチャーシステムまたはロボット1に搭載されているイメージセンサによるボールの検知結果に基づき、ロボット1に向かって飛んでくるボールの位置および速度が測定され、この測定結果に基づいてラケットにボールを当てる中間基準時点t=hにおける状態変数の位置p(h)が予測される。
また、推定軌道Piにおいて行動態様が変化する時点における状態変数の位置p(h)が当該予測状態変数位置に一致するようにロボット1の位置および姿勢が適宜調節される。その上で、状態変数としてのラケット位置が推定軌道Piにしたがった態様で変位するようにアクチュエータ1000の動作が制御される。
これにより、図10(a)〜(c)に順に示されているようにロボット1がその前方から向かってくるボールを、片手で持っているラケットを使ってフォアハンドで前方に打ち返すように行動する。
「第1モデル」はインストラクタの異なる行動態様のそれぞれに対応する、状態変数の位置の時系列的な変化態様を表わす「基準軌道」のそれぞれの形状特性を表わしている(関係式(11)(12)、図6参照)。「第2モデル」は状態変数の位置およびその一または複数のn階時間微分値(n=1,2,‥)(前記実施形態では1階時間微分値(速度v(k))および2階時間微分値(加速度α(k)))が連続的に変化するような前記インストラクタの動作を表わしている(関係式(21)〜(23)、図6参照)。
このため、各推定軌道Pi +およびPi -は、インストラクタが状態変数の位置p(k)、速度v(k)および加速度α(k)が連続になるような円滑な動きにより、ある行動態様をとったと仮定した場合における状態変数の位置p(k)の時系列的な変化態様を表わしている。推定軌道Pi +およびPi -が基準点pCまたはその近傍範囲を通過するように生成されるという条件下で第1モデルに揺らぎが許容されている(関係式(12)参照)。
この累積揺らぎ量が小さい(すなわち安定度siが高い)第1モデルは、インストラクタが行動したときの状態変数の位置の時系列的な変化態様を最も無理なくまたは円滑に再現しうるモデルである蓋然性が高い。したがって、安定度siが高い第1モデルに対応する行動態様は、インストラクタの実際の行動態様に対応している蓋然性が高い。このため、安定度siが最高の第1モデルに対応する行動態様がインストラクタの行動態様として推定されることにより、その推定精度の向上が図られる。
Claims (4)
- インストラクタの行動態様を推定するためのシステムであって、
前記インストラクタの動きに伴って変位する状態変数の一または複数の基準時点における位置を、一または複数の基準点の位置として認識する状態認識要素と、
前記状態認識要素により認識された前記基準点の位置と、前記インストラクタの複数の行動態様のそれぞれに対応する複数の第1モデルのそれぞれと、第2モデルとに基づき、前記状態変数の推定位置を時系列的に表わす複数の推定軌道を、前記推定軌道が前記基準点またはその近傍範囲を通過するという条件下で生成する軌道生成要素とを備え、
前記複数の第1モデルのそれぞれが、アトラクタの引き込み点を基準とする前記状態変数の位置の各時点における偏差の大小と、アトラクタ行列と、確率分布であらわされる不確定要素とに応じて前記状態変数の位置の各時点における変位速度が連続確率変数として定義され、かつ、前記アトラクタの引き込み点が確率分布で表わされる不確定要素を有する連続確率変数として定義されているモデルであり、
前記第2モデルが、前記状態変数の今回位置が前記状態変数の前回位置および今回速度により表わされ、前記状態変数の1または各n階時間微分の今回値(n=1,2,‥)が、前記状態変数の1または各n階時間微分の前回値と、前記状態変数の2または各n+1階時間微分の今回値とにより表わされ、かつ、前記状態変数の位置及びその1または各n階時間微分値のそれぞれが確率分布で表わされる不確定要素を有する連続確率変数として定義されているモデルであり、
前記軌道生成要素により前記複数の推定軌道が生成される過程における前記引き込み点の時間的な累積変位量が少ないほど前記第1モデルの安定度が高くなるように前記複数の第1モデルのそれぞれの安定度を評価し、前記安定度が最高である一の前記第1モデルに対応する行動態様を、前記インストラクタの行動態様として推定することを特徴とする行動推定システム。 - 請求項1記載の行動推定システムにおいて、前記軌道生成要素が、各時点における前記状態変数の位置を時系列的に順方向に推定することにより前記推定軌道として順方向推定軌道を生成するとともに、各時点における前記状態変数の位置を時系列的に逆方向に推定することにより前記推定軌道として逆方向推定軌道とを生成することを特徴とする行動推定システム。
- 請求項1または2記載の行動推定システムにおいて、
前記軌道生成要素が、前記インストラクタの第1行動態様から第2行動態様への変化を伴う行動態様であって、前記第1行動態様から前記第2行動態様に変化する時点が異なる複数の行動態様のそれぞれに対応する前記複数の第1モデルのそれぞれに基づいて前記複数の推定軌道を生成することを特徴とする行動推定システム。 - 請求項3記載の行動推定システムにおいて、
前記軌道生成要素が、前記インストラクタの第1行動態様から第2行動態様への変化を伴う行動態様であって、前記インストラクタが物体に力を作用させるための前記第1行動態様から、前記インストラクタが前記物体に力を作用させた後における前記第2行動態様に変化する時点が異なる複数の行動態様のそれぞれに対応する前記複数の第1モデルのそれぞれに基づいて前記複数の推定軌道を生成することを特徴とする行動推定システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008169534A JP5329856B2 (ja) | 2008-06-27 | 2008-06-27 | 行動推定システム |
US12/487,225 US8099374B2 (en) | 2008-06-27 | 2009-06-18 | Behavior estimating system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008169534A JP5329856B2 (ja) | 2008-06-27 | 2008-06-27 | 行動推定システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010005762A JP2010005762A (ja) | 2010-01-14 |
JP5329856B2 true JP5329856B2 (ja) | 2013-10-30 |
Family
ID=41448386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008169534A Expired - Fee Related JP5329856B2 (ja) | 2008-06-27 | 2008-06-27 | 行動推定システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8099374B2 (ja) |
JP (1) | JP5329856B2 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5109098B2 (ja) * | 2007-06-14 | 2012-12-26 | 本田技研工業株式会社 | 運動制御システム、運動制御方法および運動制御プログラム |
TW201031507A (en) * | 2009-02-25 | 2010-09-01 | Micro Star Int Co Ltd | Control apparatus of a multi-axial joint and control method thereof |
US8527217B2 (en) * | 2009-09-08 | 2013-09-03 | Dynamic Athletic Research Institute, Llc | Apparatus and method for physical evaluation |
JP5489965B2 (ja) * | 2009-12-24 | 2014-05-14 | 本田技研工業株式会社 | 行動制御システムおよびロボット |
JP5465142B2 (ja) * | 2010-09-27 | 2014-04-09 | 本田技研工業株式会社 | ロボットおよびその行動制御システム |
EP2615598B1 (en) * | 2012-01-11 | 2017-12-06 | Honda Research Institute Europe GmbH | Vehicle with computing means for monitoring and predicting traffic participant objects |
US9573276B2 (en) * | 2012-02-15 | 2017-02-21 | Kenneth Dean Stephens, Jr. | Space exploration with human proxy robots |
US8843236B2 (en) * | 2012-03-15 | 2014-09-23 | GM Global Technology Operations LLC | Method and system for training a robot using human-assisted task demonstration |
JP5908350B2 (ja) | 2012-06-21 | 2016-04-26 | 本田技研工業株式会社 | 行動制御システム |
US11041725B2 (en) * | 2012-12-03 | 2021-06-22 | Navisens, Inc. | Systems and methods for estimating the motion of an object |
US9283678B2 (en) * | 2014-07-16 | 2016-03-15 | Google Inc. | Virtual safety cages for robotic devices |
JP1573749S (ja) * | 2016-01-29 | 2017-04-10 | ||
US10676022B2 (en) | 2017-12-27 | 2020-06-09 | X Development Llc | Visually indicating vehicle caution regions |
US20200160210A1 (en) * | 2018-11-20 | 2020-05-21 | Siemens Industry Software Ltd. | Method and system for predicting a motion trajectory of a robot moving between a given pair of robotic locations |
CN112395542B (zh) * | 2020-11-19 | 2024-02-20 | 西安电子科技大学 | 全轨迹位置误差的评估方法 |
US20230142821A1 (en) * | 2021-11-10 | 2023-05-11 | James Walter Beard, III | Method for Precise, Intuitive Positioning of Robotic Welding Machine |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3194395B2 (ja) * | 1992-05-18 | 2001-07-30 | 日本電信電話株式会社 | 経路関数逐次生成方法 |
JPH11198075A (ja) * | 1998-01-08 | 1999-07-27 | Mitsubishi Electric Corp | 行動支援装置 |
JP2002127058A (ja) * | 2000-10-26 | 2002-05-08 | Sanyo Electric Co Ltd | 訓練ロボット、訓練ロボットシステムおよび訓練ロボットの制御方法 |
JP2003094363A (ja) * | 2001-09-27 | 2003-04-03 | Honda Motor Co Ltd | 多関節ロボットの姿勢決定方法および装置 |
JP2006146435A (ja) * | 2004-11-17 | 2006-06-08 | Univ Waseda | 動作伝達システムおよび動作伝達方法 |
JP4853997B2 (ja) * | 2005-08-17 | 2012-01-11 | 株式会社国際電気通信基礎技術研究所 | エージェント学習装置、エージェント学習方法及びエージェント学習プログラム |
JP2007125645A (ja) * | 2005-11-04 | 2007-05-24 | Hitachi Ltd | ロボット動作編集システム |
JP2007280054A (ja) * | 2006-04-06 | 2007-10-25 | Sony Corp | 学習装置および学習方法、並びにプログラム |
-
2008
- 2008-06-27 JP JP2008169534A patent/JP5329856B2/ja not_active Expired - Fee Related
-
2009
- 2009-06-18 US US12/487,225 patent/US8099374B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20090326679A1 (en) | 2009-12-31 |
US8099374B2 (en) | 2012-01-17 |
JP2010005762A (ja) | 2010-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5329856B2 (ja) | 行動推定システム | |
JP5313562B2 (ja) | 行動制御システム | |
JP5489965B2 (ja) | 行動制御システムおよびロボット | |
CN108115681B (zh) | 机器人的模仿学习方法、装置、机器人及存储介质 | |
US8392346B2 (en) | Reinforcement learning system | |
JP5109098B2 (ja) | 運動制御システム、運動制御方法および運動制御プログラム | |
JP5465142B2 (ja) | ロボットおよびその行動制御システム | |
JP6321905B2 (ja) | 関節システムの制御方法、記憶媒体、制御システム | |
CN111580385A (zh) | 基于深度强化学习的机器人行走控制方法、***及介质 | |
Teixeira et al. | Humanoid robot kick in motion ability for playing robotic soccer | |
US12017359B2 (en) | Method for robotic training based on randomization of surface damping | |
Melo et al. | Learning humanoid robot running motions with symmetry incentive through proximal policy optimization | |
Obo et al. | Imitation learning for daily exercise support with robot partner | |
Aoki et al. | Segmentation of human body movement using inertial measurement unit | |
Vogt et al. | Learning two-person interaction models for responsive synthetic humanoids | |
WO2019095108A1 (zh) | 机器人的模仿学习方法、装置、机器人及存储介质 | |
Seekircher et al. | Motion capture and contemporary optimization algorithms for robust and stable motions on simulated biped robots | |
TW202215104A (zh) | 方向預測方法、虛擬實境頭戴式裝置以及非暫態電腦可讀取媒體 | |
JP5465129B2 (ja) | ロボットおよび行動制御システム | |
Taniguchi et al. | Simultaneous localization, mapping and self-body shape estimation by a mobile robot | |
Danner | Qbot: Quadrupedal Ambulation via Reinforcement Learning | |
Kober et al. | Learning new basic Movements for Robotics | |
de Jong et al. | Learning to walk with a soft actor-critic approach | |
CN117961879A (zh) | 机械臂运动控制方法、装置、设备及可读存储介质 | |
CN116360472A (zh) | 动作的生成方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110801 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130405 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130725 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5329856 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |