JP7169328B2 - 自律走行車両ためのニューラル・タスク計画部 - Google Patents

自律走行車両ためのニューラル・タスク計画部 Download PDF

Info

Publication number
JP7169328B2
JP7169328B2 JP2020174568A JP2020174568A JP7169328B2 JP 7169328 B2 JP7169328 B2 JP 7169328B2 JP 2020174568 A JP2020174568 A JP 2020174568A JP 2020174568 A JP2020174568 A JP 2020174568A JP 7169328 B2 JP7169328 B2 JP 7169328B2
Authority
JP
Japan
Prior art keywords
subtask
task
planning
observation data
decision model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020174568A
Other languages
English (en)
Other versions
JP2021113487A (ja
Inventor
リャンジュン・チャン
ジンシン・ジャオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu USA LLC
Original Assignee
Baidu USA LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu USA LLC filed Critical Baidu USA LLC
Publication of JP2021113487A publication Critical patent/JP2021113487A/ja
Application granted granted Critical
Publication of JP7169328B2 publication Critical patent/JP7169328B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0088Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0019Control system elements or transfer functions
    • B60W2050/0028Mathematical models, e.g. for simulation
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F9/00Component parts of dredgers or soil-shifting machines, not restricted to one of the kinds covered by groups E02F3/00 - E02F7/00
    • E02F9/20Drives; Control devices
    • E02F9/2025Particular purposes of control systems not otherwise provided for
    • E02F9/205Remotely operated machines, e.g. unmanned vehicles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Human Computer Interaction (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Remote Sensing (AREA)
  • Operation Control Of Excavators (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、一般的には、自律走行車両のためのタスク計画部に関し、特に、自律走行車両のためのニューラル・ネットワークに基づくタスク計画部に関する。
建設車両(例えば、掘削機)は、採鉱、建築、農業などの産業分野で、トレンチ掘削や資材積み込みなどの土木作業に広く用いられており、自動掘削の解決手段を開発する傾向が現れている。このようなシステムは、人件費の削減と操作の安全性の向上などのメリットがある。一方、近年、自動運転車両に関する広範な研究のおかげで、知覚、位置特定、ナビゲーションのアルゴリズムだけでなく、光検知と測距(LiDAR)やカメラなどのハードウェア・センサも驚くべき進歩を遂げ、完全自動運転の建設車両を製造する可能性を高める。
掘削機などの自律走行車両のプランニングの制御システムを構築することについて、1つの主要な挑戦は、掘削機に実行可能かつ効率的な作業(例えば、掘削)タスクのプランニングおよびモーションのトラックを作成することである。このような建設タスクのプランニングは、基本的な動きが少なく、車両コントローラの制約に適合し、実行の成功率が高い効率的なものである必要がある。一般には、実行可能な離散決定と衝突のない連続モーション、を計算するための結合検索スペースは高次元であり、タスクとモーションのプランニングは要件が異なるため、タスクとモーションの計画部の統合は困難である。
本発明の第1の態様では、タスクを実行するようにタスク・プランニング・ネットワーク(TPN)をトレーニングするためのコンピュータの実行方法が提供されており、この方法は、第1の記録された、いずれも環境観察データを含む入力と、記録された出力、を有する入出力ペア・シーケンスを含むサブタスク・トレーニング・データセットを用いて、第1のプランニング・コア、サブタスク・デコーダ、第1の仕様デコーダ、及び、第1の終了デコーダを含むサブタスク決定モデル(SDM)をトレーニングするステップと、
第2の記録された、環境観察データを含む入力と記録された出力を有する入出力ペア・シーケンスを含むプリミティブ・トレーニング・データセットを用いて、第2のプランニング・コア、プリミティブ・デコーダ、第2の仕様デコーダ、及び、第2の終了デコーダを含むプリミティブ決定モデル(PDM)をトレーニングするステップと、を含み、
SDMのプランニングは、
少なくとも環境観察データに基づき、第1のプランニング・コアを用いて、特徴を抽出することと、
少なくとも環境観察データから抽出された特徴に基づき、サブタスク・デコーダを用いて、予測サブタスクを生成することと、
少なくとも環境観察データから抽出された特徴に基づき、第1の仕様デコーダを用いて、予測サブタスクに対応する第1の予測仕様を生成することと、
少なくとも環境観察データから抽出された特徴に基づき、第1の終了デコーダを用いて、タスクが完了したか否かを示す第1の予測終了ステータスを生成することと、
第1の記録された入出力ペア・シーケンス、予測サブタスク、第1の予測仕様、及び、第1の予測終了ステータスに基づき、第1の損失関数を用いて、SDMをトレーニングすることと、含み、
PDMのプランニングは、
少なくともローカル環境観察データに基づき、第2のプランニング・コアを用いて、特徴を抽出することと、
少なくともローカル環境観察データから抽出された特徴に基づき、プリミティブ・デコーダを用いて、予測プリミティブを生成することと、
少なくともローカル環境観察データから抽出された特徴に基づき、第2の仕様デコーダを用いて、予測プリミティブに対応する第2の予測仕様を生成することと、
第2の終了デコーダを用いて、サブタスクが完了したか否かを示す第2の予測終了ステータスを生成することと、
第2の記録された入出力ペア・シーケンス、予測プリミティブ、第2の予測仕様、及び、第2の予測終了ステータスに基づき、第2の損失関数を用いて、PDMをトレーニングすることと、
TPNの第1のフェーズとしてのトレーニングされたサブSDMと、TPNの第2のフェーズとしてのトレーニングされたPDMと、を組み合わせることによって、トレーニングされたTPNを生成することと、を含む実行方法。
本発明の第2の態様では、タスク・プランニング・ネットワーク(TPN)を用いて、実行するためのコンピュータ実行方法が提供されており、この方法は、少なくともタスク・ディスクリプションと環境観察データを与え、サブタスク決定モデル(SDM)を用いて、サブタスク、サブタスクに関連する仕様、及び、タスクが完了したか否かを示すタスク終了ステータスを出力するステップを含み、
タスク終了ステータスは、タスクが完了したことを示す前、反復は、サブタスク・プランニング・モジュールを呼び出して、グローバル・フレームにおける目標点へのトラックを生成し、目標点に到達した後、SDMに戻ることを含む、モーション・サブタスクとして、サブタスクに応答するステップと、
少なくともローカル実行サブタスクとローカル環境観察データに基づき、PDMを用いて、一つ以上のタスク・プリミティブを生成することと、
一つ以上のタスク・プリミティブを実行し、ローカル環境観察データと環境観察データを更新することと、
ローカル実行サブタスクを完了した後、SDMに戻ることと、を含む、ローカル実行サブタスクとして、サブタスクに応答するステップと、を含む。
本発明の第3の態様では、タスク・プランニング・ネットワーク(TPN)を用いて、タスク・プランニングを実行するためのコンピュータ実行方法が提供されて、この方法は、
環境観察データとタスクをトレーニングされたTPNに入力するステップと、
一つ以上のプリミティブを実行すると、ローカル環境観察データと環境観察データを更新するステップと、
タスク終了ステータスは、サブタスクが完了したことを示す場合、SDMによりタスク・プランニングを終了するステップと、を含み、
トレーニングされたTPNは、
タスクが与えられた場合、環境観察データから特徴を抽出する第1のプランニング・コアと、
第1のプランニング・コアに接続し、少なくとも環境観察データから抽出された特徴に基づき、サブタスクを生成する、サブタスク・デコーダと、
第1のプランニング・コアに接続し、少なくとも環境観察データから抽出された特徴に基づき、サブタスクに対応する仕様を生成する、第1の仕様デコーダと、
第1のプランニング・コアに接続し、少なくとも環境観察データに基づき、タスクが完了したか否かを示すタスク終了ステータスを生成する、第1の終了デコーダと、を含むSDMと、
SDMから出力され、ローカル実行サブタスクであるサブタスクに応答し、少なくともサブタスクに関連するローカル環境観察データを含む入力を用いて、特徴を抽出する、第2のプランニング・コアと、
第2のプランニング・コアに接続し、少なくともローカル環境観察データから抽出された特徴に基づき、一つ以上のプリミティブを生成する、プリミティブ・デコーダと、
第2のプランニング・コアに接続し、少なくともローカル環境観察データから抽出された特徴に基づき、プリミティブに対応する仕様を生成する、第2の仕様デコーダと、
第2のプランニング・コアに接続し、サブタスクが完了したか否かを示すサブタスク終了ステータスを生成する、第2の終了デコーダと、を含むPDMと、を含む、コンピュータ実行方法。
本発明の第4の態様では、コンピュータ・プログラムを提供し、前記コンピュータ・プログラムがプロセッサに実行されると、第1の態様に記載のコンピュータ実行方法を実現させる。
本発明の第5の態様では、コンピュータ・プログラムを提供し、前記コンピュータ・プログラムがプロセッサに実行されると、第2の態様に記載のコンピュータ実行方法を実現させる。
本発明の第6の態様では、コンピュータ・プログラムを提供し、前記コンピュータ・プログラムがプロセッサに実行されると、第3の態様に記載のコンピュータ実行方法を実現させる。
本発明の実施形態を参照しながら、それらの例は図面に示されてもよい。これらの図面は、限定ではなく例示的であることが意図されている。本発明は、概してこれらの実施形態の文脈で説明されているが、本発明の範囲は、これらの特定の実施形態に限定されるものではない、と理解されるべきである。図面の項目は、比例で描かれていない。
本発明の一実施形態に係る現実の世界で捕らえられた3D LiDAR点から変換されたグリッド高さマップの例を示す。 本発明の一実施形態に係るグリッド・マップ、タイル・マップ、セル・マップ、及び、タイルを処理するためのジグザグの順序の例を示す。 本発明の一実施形態に係るタスクからプリミティブまでのシーケンスをグラフィカルの方式で示す。 本発明の一実施形態に係るタスク・プランニングを実行するプロセスを示す。 現在の本発明の一実施形態に係るシステム・モデル構成を示す。 本発明の一実施形態に係るローカル地形掘削の一例を示す。 本発明の一実施形態に係るスキップ・ラインを有する第1のタイル・マップを示す。 本発明の一実施形態に係るスキップ・ラインを有する第2のタイル・マップを示す。 本発明の一実施形態に係るスキップ・ラインを有する第3のタイル・マップを示す。 本発明の一実施形態に係るスキップ・ラインを有する第4のタイル・マップである。 本発明の一実施形態に係るスキップ・ラインを有する第5のタイル・マップである。 本発明の一実施形態に係るスキップ・ラインを有する第6のタイル・マップである。 本発明の一実施形態に係る第1のランダム化タイル・マップを示す。 本発明の一実施形態に係る第2のランダム化タイル・マップを示す。 本発明の一実施形態に係る第3のランダム化タイル・マップを示す。 本発明の一実施形態に係る第4のランダム化タイル・マップを示す。 本発明の一実施形態に係る第5のランダム化タイル・マップを示す。 本発明の一実施形態に係る第6のランダム化タイル・マップを示す。 本発明の一実施形態に係るトレンチ掘削タスクのシミュレーション結果を示す。 本発明の一実施形態に係る広い作業領域で、複数のトレンチを掘削するシミュレーション結果を示す。 本発明の一実施形態に係るタスク・プランニングの実現ための様々なセンサを有するプラットフォームを示す。 本発明の一実施形態に係るコンピューティング・デバイス/情報処理システムを示す簡略ブロック図である。
以下の説明では、本発明をよく理解するために、解釈することを目的として具体的な詳細を説明する。しかしながら、当業者であれば、これらの詳細説明なしに本発明を実践することができることが明らかである。さらに、当業者は、以下に説明された本発明の実施形態は、有形のコンピュータ可読媒体で様々な方法(例えば、プロセス、装置、システム、デバイス、又は、方法)で実施されてもよいことを認識するべきであろう。
図面に示されるコンポーネント、又は、モジュールは、本発明の実施形態の例示的な説明であり、本発明を不明確にすることを避けることを意図している。また、本明細書の全文では、コンポーネントは、個々の機能セル(サブセルを含むことができる)として説明されているが、当業者は、様々なコンポーネント、又は、その部分が個別のコンポーネントに分割されていてもよく、又は、一緒に統合されていてもよい(単一のシステム、又は、コンポーネント内に統合されることを含む)ことを認識するべきである。なお、本明細書に論じた機能、又は、操作は、コンポーネントとして実施されてもよい。コンポーネントは、ソフトウェア、ハードウェア、又は、それらの組み合わせとして実施されてもよい。
また、図面におけるコンポーネント、又は、システム間の接続は、直接接続に限定されるものではない。逆に、これらのコンポーネント間のデータは、中間コンポーネントによって修正され、又は、再フォーマットされ、又は、他の方式で変更されてもよい。また、追加、又は、より少ない接続が用いられてもよい。なお、用語「接続」、「連接」、又は、「通信的接続」は、直接接続、1つ以上の中間デバイスを介して行われる間接接続、及び、無線接続を含むと理解されるべきである。
本明細書では、「一実施形態」、「好ましい実施形態」、「実施形態」、又は、「複数の実施形態」についての言及は、実施形態と組み合わせ説明された具体的な特徴、構造、特性、機能が、本発明の少なくとも一実施形態に含まれていることを示し、さらに、複数の実施形態に含まれてもよい。なお、本明細書の各部分に現れた上記の連語については、必ずしも、全てが同じ実施形態、又は、複数の同じ実施形態を指すとは限らない。
本明細書の各部分における特定の用語の使用は、説明するために、限定して理解されるべきではない。サービス、機能、又は、リソースは、単一のサービス、単一の機能、又は、単一のリソースに限定されない。これらの用語の使用は、関連サービス、機能、又は、リソースの分布、又は、統合可能なパケットを指すことができる。1つ以上の実施形態では、ストップ条件は、(1)設定された反復回数を実行したこと、(2)処理時間量に達したこと、(3)収束(例えば、連続的に反復されたインセンティブ・メトリックの差が第1の閾値より小さい)、(4)発散(例えば、インセンティブ・メトリックの実行の悪化)、及び、(5)許容可能なインセンティブ・メトリックに達したこと、を含むようにしてもよい。
「含む」、「含まれる」、「包含する」、及び、「包含される」という用語は、オープンな用語として理解されるべきであり、その後にリストされているコンテンツは、一例であり、リストされている項目に限定されることを意図しない。「層」は、1つ以上の操作を含んでもよい。「最適」、「高度化」、「最適化」などの用語は、結果、又は、プロセスの改善を指し、指定された結果、又は、プロセスが「最適」、又は、ピーク・ステータスに達していることを要求しない。
本明細書に用いられるいずれの見出しも、組織化の目的のみであり、明細書、又は、特許請求の範囲を限定するために用いられるべきではない。ここで特許文献として言及されている各参考文献は、その全体が本明細書に組み込まれる。
また、当業者は、(1)特定のステップを選択可能に実行してもよいこと、(2)ステップは本明細書に記載された特定の順序に限定されないこと、(3)特定のステップを異なる順序で実行できること。(4)特定のステップを同時に実行できること、を認識するべきである。
A.はじめに
建設車両(例えば、掘削機)は、採鉱、建築、農業などの産業分野で、トレンチ掘削や資材積み込みなどの土木作業に広く用いられており、例えば、自動掘削の解決手段を開発することは傾向になっている。このようなシステムは、人件費の削減と操作の安全性の向上などのメリットがある。一方、近年、自動運転車両に関する広範な研究のおかげで、知覚、位置特定、ナビゲーションのアルゴリズムだけでなく、光検知と測距(LiDAR)やカメラなどのハードウェア・センサも驚くべき進歩を遂げ、完全自動運転の建設車両を製造する可能性を高める。
掘削機などの自律走行車両のプランニング・制御システムの構築することに関して、1つの主要な挑戦は、掘削機に実行可能かつ効率的な作業タスク・プランニング(例えば、掘削)およびモーション・トラックを作成することである。このような建設タスク・プランニングは、基本的な動きが少なく、車両コントローラの制約に適合し、実行の成功率が高い効率的なものである必要がある。一般には、実行可能な離散決定と衝突のない連続モーション、を計算するための結合検索スペースは高次元であり、タスクとモーション・プランニングの要件が異なるため、タスクとモーションの計画部の統合は困難である。いくつかの建設タスク、及び、モーション・プランニングに対して、特定の困難は、建設タスクの性質により起因される。例えば、掘削タスクに対して、油圧駆動ロボット・アームが変形可能な材料である土壌と相互作用する。油圧システムと変形可能な材料の正確なモデリングは高次元空間で行わなければならず、従来のプランニング課題の策定は困難になり、計算の複雑さが大きくなる。別の困難は、掘削機の作業環境により起因される。掘削機の作業環境は、通常、非構造化場所であり、掘削作業の進行に伴って変化する。実際には、人間の掘削機の操作では、モーション・シーケンスの順序を選択するのに経験が重要な役割を果たす。このような人間の行動パターンは、モデリングして検討するのが非試行的である傾向がある。
学習に基づくタスク・プランニングの方法は、ますます注目を集めており、ロボットの分野で活発に研究されている。模倣学習に基づくいくつかの方法は、ニューラル・ネットワーク・モデルの開発に注力しており、人間のデモンストレーションから基礎シーケンス決定戦略を学習する。他の人は、強化学習に基づく方法を利用して解決手段をさらに探索し、効率化を図る。これらの学習に基づく方法は、環境が変化する複数のタスクに拡張することができ、隠れた人間の行動パターンを継承することができる。これらの特性により、自動掘削タスク・プランニングに対して学習に基づく方法を実行可能で実用的な選択肢にする。しかし、このアプリケーションは、特に複雑な掘削タスクについて十分に研究されていない。
本発明の1つ以上の実施形態では、学習に基づく方法で建設タスク・プランニング問題を解決する。例えば、掘削タスクでは、操作シーケンスをベース移動とアーム操作に分けることができ、アーム操作は、さらに、次の掘削点を選択することと、選択した深さで特定の位置を掘削することに分けることができる。ハイレベルなタスクをサブタスクに変換し、さらにタスク・プリミティブに変換するように、掘削タスクのこの階層的性質を利用して、多層モデルを有するTaskNetアーキテクチャの実施形態を開示する。
本特許発明の貢献は、タスク表現(例えば、掘削タスク)の構造と各々のモデルの階層構造を利用し、ニューラル・ネットワークに基づく新規なタスク・プランニング策定を含む。本発明の一実施形態は、観察の結果を潜在的な空間表現に順次変換し、詳細な仕様をサブモデルに伝送することである。
また、モデルでは、畳み込み層を利用してタスク、観察表現、及び、履歴データを処理し、履歴データは、履歴情報とトレーニング・プロセスの速度を利用する。1つ以上の実施形態では、モデル層の個々は、頑健性を保証するために、別々にトレーニングされてもよい。本モデルの実施形態は、環境フィードバックを観察することにより、閉ループ実行のためのリアルタイム・システムに実現できることが証明された。さらに、本方法の実施形態は、人間のエキスパート・データから隠れた行動パターンを学習し、継承することができる。
なお、本発明の1つ以上の実施形態は例として掘削を使用するが、それらの実施形態のプロセスおよびモデル構造は、フロントローダ、バックホーなど他の建築、農業、、又は、産業用途、又は、車両にも適用可能である。
B.いくつかの関連ワーク
1.自動掘削機のタスク・プランニング
掘削タスクを与えられ、自動掘削機は、掘削操作シーケンスを生成するための全体掘削戦略をプランニングする必要がある。既存のタスク・プランニングの方法は、主にステータス間のルールに基づく遷移の有限ステータス機械(FSM)を利用する。いくつかの提案では、大量掘削パラメータ化スクリプトと呼ばれる方法が紹介され、この方法は、一連のステップで所望のタスクを記述する。各ステップは、いずれもイベントに基づく遷移のFSMのステータスとして表される。同様に、いくつかの提案では、別のホイールローダ・プランニング・システムを構築する。シミュレーションにおけるホイールローダの操作のための仮想オペレータ・モデルは、環境条件に基づいて制御入力を生成し、ここでは、イベントに基づく有限ステータス機械に関する。
FSM以外、行動に基づく方法に導入して掘削タスク計画部を設計し、掘削タスクが異なるフェーズとプリミティブに分割され、ここでは、ルールに基づく遷移でタスクをフェーズに分割した後にプリミティブに分割する。いくつかの提案では、作業領域のセグメンテーション、地形のレイヤーへの分解、ベース移動のスケジューリングとプランニング、を含むハイレベルなルールに基づく掘削タスク計画部を提案している。この方法は、現実の世界のシステムにおいてパイル・ローディング・タスクの実施が成功したことにより実証された。
2.ロボット・タスクとモーション・プランニング
タスク、及び、モーション・プランニング(TAMP)の問題は、ロボット工学においてかなり研究されてきた。従来の方法のほとんどは、タスクの分解ための様々なレベルの推論に関する。TAMPの1つのカテゴリは、タスク・プランニング・フェーズで幾何学的制約を考慮する。いくつかの提案では、幾何学的推論、及び、タスク・プランニングに対処するために、運動学的制約問題が公式化されており、ここでは、目標の幾何学的ステータスを達成するために最適化に基づく方法が導入される。TAMPの別のトピックは、タスクの記号表現を使用したハイレベルな論理の推論に注力しる。いくつかの提案では、プランニングのための記号表現方法を説明し、これは、シンボルがプランニング・エージェントによりもたらされる条件、及び、効果を表すことができることを証明する。いくつかの提案では、サンプリングに基づくTAMPエンコード方法がさらに開発され、記号表現を用いて、ロジックを符号化する。いくつかの提案では、時間論理仕様に基づくモーション・プランニング問題が公式化され、また、タスク・シーケンス・ソートの後ろの論理を明らかにしようとする。
進歩がなされているが、統合TAMP方法を開発することの主な挑戦は、依然として、すべての制約が満たされることを保証しながら離散決定と高次元連続運動探索を組み合わせることにある。自動掘削機のタスクの環境では、環境は変形可能で変化しているため、実行可能なタスク・プランニングの計算を困難にする。
3.学習に基づくニューラル・プログラミング
深層学習では、特にニューラル・プログラミングにおける最新の研究成果はタスク・ラーニング問題を解決するための新しい視点を示唆している。これらの方法は、ニューラル・ネットワーク・モデルを開発して、トレーニング・データから基礎シーケンス決定戦略を学習する。ニューラル・プログラミング・インタープリタ(NPI)のニューラル・プログラミングの分野における1つの進歩が紹介された。NPIは、模倣学習を介してトレーニングされたニューラル・ネットワーク・モデルであり、コンピュータ・プログラムの機能を模倣するためである。学習したモデルは、プログラムを再帰的にトリガーし、プログラムを終了し、又は、再帰的に上位レベルのプログラムに戻ることができる。プログラムがタスクとして比較される場合、このような階層レイアウトは掘削タスク計画部と類似点を共有する。一部の研究では、NPIの概念を継承し、それをニューラル・タスク・プログラミング(NTP)に拡張する。これは、タスク・プランニング問題に対してより具体的なものである。NTPは、タスク仕様の分解を細かいサブタスク仕様に明示的に導入し、さらにサブルーチンに導入する。これらのサブルーチンはタスク・ラーニング問題のプリミティブに相当する。NTPは、階層構造を持つ順次タスクに対して強力な汎化機能を示す。
掘削の特定のタスク・ラーニング方法は、汎化問題に遭い、ここでは、設計された計画部を異なるシナリオ、及び、タスクに再利用することは困難になっている。逆に、学習に基づくタスク・ラーニング方法は、それぞれ環境条件とタスク目標への適応性と汎化可能性がある。本発明の明細書の1つ以上の実施形態は、掘削タスク・ラーニングと学習に基づくニューラル・プログラミング方法との間のギャップを埋めることを目的とする。
C.TaskNet計画部の実施形態
1. 問題の定義
1つ以上の実施形態では、タスク・プランニングの問題は、自動掘削機に用いられると考慮される。いくつかの実施形態は、地形の形状を変更することに関するトレンチ掘削、掘削、および材料再配置などの掘削作業に注力する。1つ以上の実施形態では、
Figure 0007169328000001

はタスク・ディスクリプションのセットであり、
Figure 0007169328000002

はすべての環境観察値のセットを表す。関数
Figure 0007169328000003

は、タスクが完成したか
Figure 0007169328000004

否か
Figure 0007169328000005

を表すことに用いられる。設計しようとしているタスク計画部は、そのようなメイン・タスクをサブタスクのシーケンスに分割し、そして、それぞれ仕様を有するタスク・プリミティブに分割することができる。
Figure 0007169328000006

はサブタスクのセットに用いられ、
Figure 0007169328000007

はサブタスク仕様のセットを表す。
Figure 0007169328000008

はタスク・プリミティブのセットのために用いられ、
Figure 0007169328000009

はタスク・プリミティブ仕様のセットを表す。仕様フィールドは、低レベルのモーション計画部およびコントローラが高い成功率で実行するのに役立つ。なお、いくつかのデータ駆動型の方法でこのようなタスク・プランニングの問題を解決することで、人間の行動を模倣する。1つ以上の実施形態では、記述され得る正式な問題のステートメントは、以下のとおりである。
問題1:t時点での環境観察フィードバック
Figure 0007169328000010

とタスク・ディスクリプション
Figure 0007169328000011

が与えられた場合、サブタスク・シーケンスと仕様を生成できるタスク計画部を設計し、
Figure 0007169328000012

(ただし、
Figure 0007169328000013

、且つ、
Figure 0007169328000014

)、また、計画部はこのようなシーケンスを詳細な仕様を有するタスク・プリミティブに変換することができる。
Figure 0007169328000015

(ただし、
Figure 0007169328000016

、且つ、
Figure 0007169328000017

)。そのため、タスク・プリミティブを実行した後、
Figure 0007169328000018
2.環境およびタスク表現のためのグリッド・マップ
1つ以上の実施形態では、環境は2Dグリッド・マップとして表されてもよい。
Figure 0007169328000019

は地形のグリッド・マップのp行目とq列目のセルの高さを表す。図1は、現実の世界で捕獲された3D LiDAR点から変換されたグリッド高さマップの一例を示す。元の3D点、3Dグリッド・マップ、又は、他の表現と比較して、グリッド・マップ表現は、ニューラル・モデルの畳み込み層のテンソル入力として用いられやすくてもよい。1つ以上の実施形態では、環境特徴は、グリッド・マップ表現を使用することで、畳み込みニューラル層に効果的に学習されてもよい。
典型的な掘削タスクは地形の形状を変えることができ、これは、グリッド・マップの各セルに対して目標高さ
Figure 0007169328000020

を指定することで定義されてもよい。1つ以上の実施形態では、一般的なハイレベル・タスクは、以下のように指定されてもよい。
Figure 0007169328000021

(ただし、
Figure 0007169328000022

は掘削精度の公差パラメータである)。
この関数
Figure 0007169328000023

Figure 0007169328000024

を指定することにより、さまざまな掘削タスクを定義できる。例えば、定数0を有する
Figure 0007169328000025

は、領域を格付けするためのタスクを定義でき
Figure 0007169328000026

、定数の負値を有する
Figure 0007169328000027

は、目標深さを含むトレンチを掘るためのタスクを定義できる。
図2に示すように、環境のグリッド・マップ210が与えられたことは、さらにタイル・マップ
Figure 0007169328000028

220定義できる。タイル・マップにおいて、各タイルは長方形であり、複数のセルを含む。セル・マップ
Figure 0007169328000029

230はグリッド・マップ全体から切り取られるサブ・マップに定義される。このタイル内のすべてのセルが処理されている場合、
Figure 0007169328000030

を0に設定し、そうでなければ、
Figure 0007169328000031

は1である。掘削タスクを与え、掘削機はすべてのタイルが処理されるまでタイルごとにタイルを処理する。
3.方法の概要
1つ以上の実施形態では、ニューラル・プログラミングを方法の実施形態に用い、一般的なタスクを入力として、サブタスク、又は、タスク・プリミティブを再帰的にトリガーする。掘削タスクの実施形態では、操作シーケンスは2つのカテゴリに分けられる。1つのカテゴリは車両のベースを特定の場所に移動することであり、別のカテゴリはベースが静止したまま掘削を行うことである。また、静的ベースで、掘削を行っているとともに、掘削機アームのモーションを次の掘削点を選択するステップと、選択した深さで、特定の場所を掘削するステップ、に分解することができる。そのような観察によると、サブタスクとタスク・プリミティブの階層的定義が定義され、表1に示されている。
Figure 0007169328000032
1つ以上の実施形態では、ニューラル・ネットワークに基づくタスク計画部(又は、タスク・プランニング・ネットワーク、TPN)を開示し、前記タスク計画部は、タスクをモーション・プリミティブに変換する2層モデルを含む。第1のモデルは、タイル掘削モデル(TEM)、即ち
Figure 0007169328000033

とも呼ばれるサブ・タスク決定モデル(SDM)であり、下文に記述された1つ以上の実施形態では、一つ以上の所望サブタスクを決定することに用いられる。第2のモデルは、セル掘削モデル(CEM)、即ち
Figure 0007169328000034

とも呼ばれるプリミティブ決定モデル(PDM)であり、下文に記述された1つ以上の実施形態では、少なくともサブタスクに基づき、一つ以上の所望のタスク・プリミティブを決定することに用いられる。
1つ以上の実施形態では、環境観察フィードバック
Figure 0007169328000035

が与えられた場合、TEMモデルは、特定の定仕様
Figure 0007169328000036

と共にトリガーするサブタスク
Figure 0007169328000037

を選択し、計画部
Figure 0007169328000038

を終了するか否かを決定する。1つ以上の実施形態では、このプロセスは(2)により記述される。
Figure 0007169328000039
同様に、CEMは、ローカル環境観察値
Figure 0007169328000040

、サブタスク
Figure 0007169328000041

および仕様
Figure 0007169328000042

に基づき、所望のタスク・プリミティブ
Figure 0007169328000043

、モーション仕様
Figure 0007169328000044

を生成し、サブタスクが完了したか否かと決定し、(3)に示すように記述される。
Figure 0007169328000045
1つ以上の実施形態では、PDMモデルは、TEMモデルによって決定されたサブタスクがmove_to_tileサブタスク割り当てであるときにパス・プランニング問題を処理するパス・プランニング・モジュールである。パス・プランニング・モジュールは、次のように定義できる。
Figure 0007169328000046

ただし、
Figure 0007169328000047

は、
Figure 0007169328000048

の場合、サブタスクが完了すること、又は、
Figure 0007169328000049

の場合、サブタスクが完了しないこと、を示すインジケータである。なお、2つのモデル間の時間スケールを区別するために、TEMのインデックスはtであり、CEM/PATHのインデックスはiである。
1つ以上の実施形態では、全体タスク・プランニング方法が方法論1に示される。
方法論1. TaskNet-掘削机タスク計画部
入力:タスク・ディスクリプション
Figure 0007169328000050

、及び、環境観察値
Figure 0007169328000051

出力:タスク・プリミティブ・シーケンス
Figure 0007169328000052

Figure 0007169328000053
4.離散プランニングから連続モーション
1つ以上の実施形態では、既存の階層タスク計画部は、ハイレベル・タスクを分解し、それに対応して仕様を有するタスク・プリミティブを生成する。例えば、トレンチ領域タスクは、図3に示すように、タスク・プリミティブに分割されてもよい。
1つ以上の実施形態では、生成されたプリミティブのシーケンスは、既存のプランニング・アルゴリズムに対して、生成されたプリミティブ・シーケンスは自然で直接的なモーション・プランニング問題である。詳細な仕様を有するこれらのタスク・プリミティブは、トラック生成のためにモーション計画部に給送される。次に、掘削機コントローラによって、関節運動、又は、掘削機のベース移動のトラックが実行される。
図4は本発明の一実施形態に係るタスク・プランニングを実行するプロセスを示す。主なタスク・ディスクリプション(例えば、
Figure 0007169328000054

)と環境観察値
Figure 0007169328000055

が与えられ、SDMモデル
Figure 0007169328000056

(320、322、324、又は、326)は、最初にサブタスクを決定する(405)。
Figure 0007169328000057

としてサブタスクに応答して、サブタスク・プランニング・モジュール
Figure 0007169328000058

(330、又は、332)を呼び出し(410)、グローバル・フレームの目標点、又は、タイルへのトラックを生成する。目標点(
Figure 0007169328000059

)に到達した後、プランニング・プロセス(415)は
Figure 0007169328000060

に戻り、
Figure 0007169328000061

に応答してローカル実行サブタスク(例えば、掘削動作ためのPDMモデル
Figure 0007169328000062

(340、342、344、又は、346)をトリガーするためのexcavate tileのサブタスク)を生成する(420)。
Figure 0007169328000063

モデルは、サブタスクを完了するために、さまざまなタスク・プリミティブを生成し、完了時に
Figure 0007169328000064

(サブタスク完了信号)を出力する。move_base331、接近341および掘削343などの各タスク・プリミティブの実行は、環境に影響を与え、それにより、観察値
Figure 0007169328000065

および
Figure 0007169328000066

に影響を与え、又は、観察値
Figure 0007169328000067

および
Figure 0007169328000068

を更新する。
Figure 0007169328000069

は最終的にプロセス全体を終了(425)し、観察値
Figure 0007169328000070

を監視しながら
Figure 0007169328000071

(タスク完了信号)を設定する。
D. モデルの実施形態
1つ以上の実施形態では、第1のモデル(例えば、タイル掘削モデル(TEM))と第2のモデル(例えば、セル掘削モデル(CEM))の設計が提供されており、類似の構造が2つのモデルによって共有され、4つのサブモデル、即ちプランニング・コア
Figure 0007169328000072

、サブタスク、又は、プリミティブ・デコーダ
Figure 0007169328000073

、仕様デコーダ
Figure 0007169328000074

、及び、終了デコーダ
Figure 0007169328000075

を含んでもよい。
1つ以上の実施形態では、一般的な入力表現uが与えられ、モデルの一般的なワーク・フローは、式(5)で記述され得る。
Figure 0007169328000076

(ただし、
Figure 0007169328000077

は、サブタスク、又は、プリミティブであり、
Figure 0007169328000078

は、仕様であり、
Figure 0007169328000079

は、終了インジケータである)
各プランニング・モデルの詳細は、以下の説明に記載されている。
1.タイル掘削モデルの実施形態
図5は、現在に開示された実施形態に係るシステム・モデル構成を示す。1つ以上の実施形態では、タイル掘削プランニング・レベルで、タイル・マップを入力タスクに与えた場合、広い地形をカバーするために、グローバル・タイル・シーケンスを決定する必要がある。TEM510は、最新のタイル・マップおよび処理されたタイルの履歴に基づき、掘削機が操作する必要がある次のタイルを予測することができる。具体的には、TEM510は、タイル・マップ
Figure 0007169328000080

511の入力と過去のサブタスク・シーケンス
Figure 0007169328000081

512を採用できる。従って、TEMの入力は次のように表してもよい。
Figure 0007169328000082
1つ以上の実施形態では、TEM510は、環境表現511(例えば、タイル・マップ)を処理するために、複数の畳み込み層を含む第1のプランニング・コア513を含んでもよく、環境表現511から特徴514(例えば、潜在的な空間表現)を抽出する。抽出された特徴514は、さらなる処理のためにTEMの他のサブモデルに伝送される。
1つ以上の実施形態では、TEM510は、サブタスクmove_to_tile、又は、excavate tileを出力するサブタスク・デコーダ515と、サブタスクの仕様を出力する第1の仕様デコーダ516と、入力タスクが完了したか否かを示すように、タスク終了ステータスを出力する第1の終了デコーダ517とをさらに含みてもよい。
TEMがモーション・サブタスク(例えば、move_to_tile)を出力することに応答して、関連する仕様を、移動する次のタイルを示すために、4つの可能な方向{左、右、下、上}から選択できる。移動方向が与えされる場合、グローバル座標位置を計算して、掘削機のベースがどこに移動するかを指定できる。次に、パス・プランニング・モジュール520は、サブタスクmove_to_tileの情報、関連する仕様、およびグローバル座標を使用して、掘削機のモーションを実行する。
1つ以上の実施形態では、TEMはサブタスクexcavate_tileを出力することができる。このタイルの仕様は、このタイル内のセルのグリッド・マップです。次に、CEM530は、サブタスクexcavate_tile、セル・マップ532の関連する仕様を使用して、タイルの掘削を実行する。
1つ以上の実施形態では、CEM530は、セル・マップ532を処理して特徴534を抽出するための複数の畳み込み層を含む第2のプランニング・コア533を含んでもよい。
1つ以上の実施形態では、履歴情報(例えば履歴接近点)は、特徴を抽出するために、第2のプランニング・コア533によって使用されてもよい。
1つ以上の実施形態では、CEM530は、所望のプリミティブを出力するプリミティブ・デコーダ535、プリミティブの仕様を出力する第2の仕様デコーダ536、およびサブタスク終了ステータスを出力してサブタスクが完了したか否かを示す第2の終了デコーダ537をさらに含むことができる。
1つ以上の実施形態では、トレーニング・データからのタイル処理順序を模倣するために、処理されたタイルの履歴レコード512も使用され得る。
1つ以上の実施形態では、タイル移動方向の過去のシーケンスを、タイル・マップから抽出された特徴を有するベクトルとして重畳する。カスケード・ベクトルは、複数の全接続の接続層に給送され、適切なサブタスクを生成する。
LSTMに基づくアーキテクチャを使用するNPIモデルとは異なり、本発明の1つ以上の実施形態では、履歴情報のスタッキングは全接続の接続層への入力として選択され、主に効率的なトレーニングおよび高速収束のためのものである。
2.セル掘削モデル実施形態
1つ以上の実施形態では、セル掘削モデルは、図5に示すように、その仕様を含んだタイル掘削サブタスクによってトリガーされる。
1つ以上の実施形態では、この仕様は、タイル掘削モデルによって切り取られた、タスク全体の地形高さマップの一部であるローカル地形高さマップである。ローカル地形マップが与えられた場合、セル掘削モデルは、接近と掘削のタスク・プリミティブの1つ以上のシーケンスを生成する。
1つ以上の実施形態では、仕様aを有するサブタスクexcavate_tileが与えられ、仕様aおよび最後のタスク・プリミティブ接近仕様
Figure 0007169328000083

に応じて、モデルの入力はローカル地形観測
Figure 0007169328000084

で構成され、それは2次元のワン・ホット・ベクトルとして表される。
1つ以上の実施形態では、セル掘削モデルの入力は、以下のように表してもよい。
Figure 0007169328000085

(ただし、hとwはローカル地形観測値の高さと幅である)。
(5)に続いて、コア・モデルは、最初にそのような入力
Figure 0007169328000086

で、ローカル・プランニング・ステータス
Figure 0007169328000087

を生成する。次に、プリミティブ・デコーダは、ローカル・プランニング・ステータスで、プリミティブ選択
Figure 0007169328000088

を生成する。プリミティブ選択
Figure 0007169328000089

は、エンド・エフェクターを特定の点に接近するか、特定の深さで現在の場所を掘削する。仕様デコーダは、
Figure 0007169328000090

を使用して、各プリミティブの仕様
Figure 0007169328000091

を生成する。つまり、プリミティブのlocal_coordinateに接近すること、又は、プリミティブの深さを掘削することである。
1つ以上の実施形態では、出力は、ワン・ホット・ベクトルとして表すことができる。終了デコーダも
Figure 0007169328000092

でサブタスクが完了したか否かを示すこと
Figure 0007169328000093

を予測する。
図6は、h=4およびw=3のローカル地形掘削の例を示す。ローカル地形掘削は、3×4=12のセル620を含むタイル610で実施される。タイルの高さと幅は、他の状況では変更することができる。
3.モデルトレーニング実施形態
1つ以上の実施形態では、SDMモデル(例えば、TEM)およびPDMモデル(例えば、CEM)の両方が、実行トラックのシーケンスを用いて、監視のような方法でトレーニングする。サブタスク・トレーニング・データセットでSDMモデルをトレーニングでき、プリミティブ・トレーニング・データセットを使用してPDMモデルをトレーニングできる。トレーニング・プロセスを均一に記述することができように、一般的なシンボリック表現をモデルの入力と出力に使用する。
1つ以上の実施形態では、記録されたシーケンスは、入出力ペア
Figure 0007169328000094

のリストであり、ただし、u、y、y、及び、yは、それぞれ(5)、(6)、及び、(7)によってTEMとCEMモデルに定義される。
1つ以上の実施形態では、トレーニングの目標は、正しい実行シーケンスのペアが生成される確率を最大化にすることであり、即ち、最適なモデル・パラメータ
Figure 0007169328000095

が下式で定義される。
Figure 0007169328000096
1つ以上の実施形態では、損失関数は、予測されたサブタスク/プリミティブ、仕様、終了ステータスと、記録されたトレーニング・データにおけるそれらとの間の誤差の重み付け和として定義されてもよい。損失関数は次のように表してもよい。
Figure 0007169328000097

(ただし、
Figure 0007169328000098


Figure 0007169328000099

、及び、
Figure 0007169328000100

は、パラメータであり、
Figure 0007169328000101


Figure 0007169328000102

、及び、
Figure 0007169328000103

は、すべて交差エントロピー損失である。)
SDMの場合、損失関数は第1の損失関数と呼ばれ、ただし、損失項
Figure 0007169328000104

は予測されたサブタスクと記録されたサブタスクとの間の誤差である。PDMの場合、損失関数は第2の損失関数と呼ばれ、ただし、損失項
Figure 0007169328000105

は、予測されたプリミティブと、記録されたプリミティブとの間の誤差である。
E.いくつかの実験結果
なお、これらの実験、及び、結果は例示として提供され、1つ以上の実施形態で特定の条件下で行われた。したがって、これらの実験もその結果も、現在の発明の明細書の範囲を限定するものではない。
1つ以上の実験設定において、提案された方法の性能を評価するために、TEMモデル、及び、CEMモデルが最初にトレーニングされ、テストされた。ニューラル・タスク計画部TaskNetの実施形態はさらに実施され、逆運動学に基づくアーム・モーション計画部と統合されました。システム全体を、様々な掘削シナリオについて3D物理に基づくシミュレータでさらにテストした。
1. データ収集とモデル実施例
1つ以上の実施例では、トラック発生器と呼ばれるカスタマイズ・プログラムを介して、TEM、及び、CEMモデルのためのトレーニング・データ・シーケンスを生成した。
タイル掘削モデル・トラック発生器は、タイル・マップを管理するためのスケッチ・パッド、及び、タイル掘削シミュレーション・モジュールを含む。スケッチ・パッドは、ランダム化された行、及び、列でタイル・マップを初期化できる。スケッチ・パッドは、現在のタイル・ポインタをその隣接したタイルに変更するための「移動タイル」と、現在のタイルの掘削ステータスを変更するための「掘削タイル」(未処理から処理まで)と、を含むアプリケーション・プログラミング・インターフェース(API)を有し、
1つ以上の設定では、現実の世界で観察される典型的な掘削順序をシミュレートした。広い作業領域に掘削機のオペレーターによって用いられる1つの一般的な横方向順序はジグザグ順序であり、図2に示される。トレーニング・データは、1000個の異なる寸法のタイル・マップで構成され、合計71066個のサンプルにおいて寸法は12×12であり、ただし、各サンプルは、現在のタイル・マップ、及び、次のサブタスクを含む観察フィードバック
Figure 0007169328000106

として定義される。
1つ以上の実施例では、128のバッチ・サイズ、及び、学習率1e-4がトレーニングに用いられた。図7A~7Fは、本発明の一実施形態に係るスキップ・ラインを有するタイル・マップを示す。図7A~7Fに示すように、TEMは、モデルを学習することで、非掘削ステータスとして明示的にマークされた行をスキップできる。
そのような行をスキップするために、1つ以上のモデル実施形態は、畳み込み層を利用してこのラインにおける各タイルが非掘削ステータスであることを知る。
図7Aにおいて、灰色の行710はスキップし、濃い灰色のタイル720はタイル・マップの境界を示し、薄い灰色のタイル730のみが処理される必要がある。図7B~7Fは、トレーニングされたTEMモデルが行をスキップし、掘削される必要がある薄い灰色の行のみを処理することができることを示す。さらに、学習されたTEMモデルの実施形態は、トレーニング・データに示すように、ジグザグ順序でタイルをカバーできる。
一つ以上の実験設定では、TEMの汎化機能がさらに評価された。3000個の異なる寸法タイル・マップが生成され、最大の寸法が32x32であり、合計で1,126,900個のサンプルが。各グリッドをランダムに生成し、掘削タイルと非掘削タイルの両方を含む。
このデータセットで一つ以上のTEM実施形態をトレーニングし、ランダムに生成されたタイル・マップにテストし、トレーニング・データセットにタイル・マップを存在しない。
図8A~図8Fでは、本公開の実施形態に係るランダム化されたタイル・マップを示す。図8A~図8Fに示すように、学習されたTEMモデルの実施形態は、非掘削タイルをスキップして、残りのタイルをジグザグの順序で覆うことができる。
図8Aにおいて、初期の30×30タイル・マップをランダムに生成する。TEMモデルは、すべての灰色のタイル820をスキップするとともに、すべての濃い灰色のタイル810を処理する必要があるのみである。
図8B~8Fは、TEMモデルがタイルをスキップし、掘削する必要があるタイルのみを処理できることを示めす。学習されたTEMモデルの実施形態は、ジグザグの順序でタイルをカバーすることができる。このモデルは、トレーニング・データセットに存在しない、見られない、ランダムに生成されたタイル・マップに汎化できる。
セル掘削モデルは、合成データを生成するように、トラック発生器を用いて同様の方法でトレーニングすることもできる。別のスケッチ・パッドは、実行APIで初期化され:「接近」と「掘削」。1つ以上の実験設定では、CEMモデルのトレーニング・データは、10,000個のシーケンスを含み、最大の寸法が6×6である。
モデルの実施形態では、学習率1e-3、バッチ・サイズ1,000でトレーニングした。現在の実施例では、発生器プログラムは論理に従って、最上位のセルに接近して最初に掘り、実際にはそうではない。しかしながら、トレーニングされたモデルの実施形態は、データ内の同じ論理に従い、掘削タスクを完了することができる。
2. いくつかの計画部の実施例とシミュレーションの結果
1つ以上の実験設定において、タスク計画部TaskNetの実施形態は、トレーニングされたモデル「タイル掘削モデル」、及び、「セル掘削モデル」を用いて実施した。タスク計画部は、所望の深さの長方形の形状を掘削することなどのハイレベル・タスクを入力する。タスク計画部は、タスクを分解し、モーション計画部ための仕様を含んだモーション・プリミティブ・シーケンスを生成する。モーション計画部モデルは、仕様に基づいて実行可能なアームに基づくモーションを計算する。アームのモーションについては、逆運動学ソルバーで関節構成を計算する。
タスク計画部の実施形態では、3Dシミュレーション環境で実行されるシミュレーション掘削機にプリミティブを割り当てる。実験では、3.5トンの掘削機モデルを使用する。掘削機モデルは、長さ2.00mのアーム、長さ1.05mのスティック、長さ0.60mのバケット、高さ0.35mのベースを含む。シミュレータは、粒子に基づく地形シミュレーションで掘削機の動的特性と地形との相互作用をシミュレートできる。
図9、及び、図10は、リアルタイム3Dシミュレータでの2つの掘削シナリオの実験結果を示す。地形マップの変化は、様々なフェーズでのシステムの閉ループ実行中に示される。
図9に示されるトレンチ掘削シナリオについて、TaskNet計画部の実施形態は、合理的なタスク・プランニングを生成し、タスク・プランニングは、複数の掘削とダンプ操作でタイルを掘削するステップ、及び、ベースを所望の場所に後方に移動するステップを繰り返す。
図10に示される広い地形領域での複数のトレンチ掘削の例については、計画部はハイレベルのタスクを階層的に分解し、ジグザグのカバー順序で実行可能なタスク・プランニングを計算することができる。要するに、これらの実験結果が示すように、TaskNet計画部の実施形態は、一般的な掘削タスクの分解戦略をデモンストレーション・データから学習して、掘削機に基づくモーションを減らし、全体的な掘削効率を確保する。
F.センサ・プラットフォームの実施形態
図11は、本発明の一実施形態に係るタスク・プランニングの実現のための様々なセンサを含んだセンサ・プラットフォームを示す。図11は、例えば、掘削機1105を使用するが、この例の実施例、及び、センサ・プラットフォームは、他の構成、農業、又は、産業応用、又は、フロントローダ、バックホーなどの車両に適用され得る。
掘削機1105は、図11に示すように、環境、及び/又は、掘削機のステータスを検出するために、複数のセンサを含む。1つ以上の実施形態では、複数のセンサは、掘削機アーム1110のブーム、スティック、及び/又は、バケットの角度を測定するための1つ以上の傾斜計1116(たとえば、Gefran GIBセンサ)と、ブーム、スティック、バケットの移動ように、油圧シリンダ1112の移動距離を測定するための1つ以上の距離センサ1114(たとえば、Gefran GSFセンサ)と、油圧シリンダ用の1つ以上の油圧センサ1118(例えばNAGANO-Keik KM10-1C4センサ)と、キャビン1108の回転を測定するための1つ以上のエンコーダ1107(例えば、LEINE-LINDE ISA608エンコーダ)と、を含んでもよい。
1つ以上の実施形態において、各油圧シリンダは、油圧監視のための2つの油圧センサを有してもよい。
1つ以上の実施形態では、複数のセンサは、環境センサ、及び、1つ以上の視覚センサ1122(たとえば、1つ以上のステレオカメラ)と、GPS、又は、慣性測定セル(IMU)センサと、又は、掘削機1105の方向、及び、速度を計算するために用いられる他のUAVセンサと、を含んでもよい制御コンポーネント1120をさらに含んでもよい。
1つ以上の実施形態では、環境センサ、及び、制御コンポーネント1120は、タスク・プランニングのための1つ以上のコマンド・シーケンスの非一時的な(不揮発性)コンピュータ可読媒体を含むメモリを有するコンピュータ、又は、制御パネルを含んでもよい。
1つ以上の実施形態では、タスクの実現について、知覚フェーズ1130で、1つ以上の環境ステータス、及び、1つ以上の掘削機ステータスを受信する。環境センサ、及び、制御コンポーネント1120内の複数のセンサで、1つ以上の環境ステータスを取得し、画像、又は、点群として格納することができる。掘削機1105に組み込まれた複数のセンサ、例えば、油圧シリンダ距離センサ、油圧センサで、1つ以上の掘削機ステータスを取得することができる。環境ステータスと掘削機ステータスを受信すると、計画部フェーズ1140で、タスク・プランニングを実施する。
1つ以上の実施形態では、タスク・プランニングは、例えば、シャーシ・パスをプランニングするモーション・サブタスク、又は、例えば、アームのトラックをプランニングするローカル実行サブタスクである。プランニングされたサブタスクは、実現するために、コントローラ1150に伝送される。
1つ以上の実施形態では、コントローラは、プランニングされたシャーシ・パスに従って、掘削機のシャーシを移動し、又は、プランニングされたアーム・トラックに従って、アームを移動するコマンドを出力することができる。
G.いくつかの結論
本発明では、自律走行車両(例えば、掘削機)のための新規のニューラル掘削タスク計画部-TaskNetの実施形態を開示し、開示されたニューラル・タスク計画部の実施形態は、2つの学習に基づくニューラル・ネットワーク・モデルを含む。第1のモデルは、タイル・レベルの掘削戦略を学習するために設計されたタイル掘削モデル(TEM)で、第2のモデルは、適当な掘削セルを決定するために設計されたセル掘削モデル(CEM)である。
1つ以上の実施形態では、トラック発生器でニューラル・タスク・モデルをトレーニングし、これらのトレーニングされたモデルでTaskNet計画部を実現する。計画部は、閉ループを実行するために、3Dリアルタイムの物理に基づく地形と掘削機シミュレータでテストされる。実験結果は、TaskNet計画部の実施形態が一般的なタスク分解戦略を効果的に学習し、様々な掘削タスクのもっともらしいタスク・プランを生成できることを示す。
両方のモデルのコアを共有する2つのニューラル・プログラミング・モデルについては、当業者は、本発明の実施形態を容易に修正、又は、変更することができ、それにより、2つのモデルが最終的に統合され、より優れた汎化能力と、より多くのタスク、サブタスク、及び、タスク・プリミティブと組み込む能力と、を有し得ることを認識する。また、当業者は、本明細書の実施形態が、現実の世界の専門家の操作データを収集して現実の掘削機プラットフォームでテスとするように、拡張され得ることを認識するべきである。
H.システムの実施形態
本発明の一実施形態では、1つ以上の情報処理システム/コンピューティング・システムを含んでもよいし、又は、1つ以上の情報処理システム/コンピューティング・システムで実施してもよい。コンピューティング・システムには、計算、運算、決定、分類、処理、伝送、受信、検索、発信、ルーティング、切り替え、記憶、表現、通信、マニフェスト(manifest)、検出、記録、再現、処理、又は、あらゆる形式の情報、インテリジェンス、又は、データとして構成される任意の手段、又は、手段の集合が含まれ得る。例えば、コンピューティング・システムは、パーソナル・コンピュータ(例えば、ラップトップ・コンピュータ)、タブレット・コンピュータ、タブレット、パーソナル・デジタル・アシスタント(PDA)、スマート・フォン、スマート・ウォッチ、スマート・パッケージ、サーバ(例えば、ブレード・サーバ、又は、ラック・サーバ)、ネットワーク・ストレージ・デバイス、カメラ、又は、その他の適切なデバイスであってもよいし、又は、それらを含んでもよい。サイズ、形状、パフォーマンス、機能、価格が変更することができる。コンピューティング・システムは、ランダム・アクセス・メモリ(RAM)、1つ以上の処理リソース(中央処理装置(CPU)、又は、ハードウェア、又は、ソフトウェア制御ロジック)、ROM、及び/又は、他のタイプのメモリを含んでもよい。コンピューティング・システムの追加コンポーネントには、1つ以上のディスク・ドライブと、外部デバイスと通信するための1つ以上のネットワーク・ポートと、様々な入出力(I/O)デバイス(例えば、キーボード、マウス、タッチ・スクリーン、及び/又は、ビデオ・ディスプレイ)と、を含んでもよい。コンピューティング・システムは、様々なハードウェア・コンポーネント間で通信を伝送できるように構成される1つ以上のバスをさらに含んでもよい。
図12は、本発明の一実施形態に係るコンピューティング・デバイス/情報処理システム(又は、コンピューティング・システム)の簡略ブロック図を示す。コンピューティング・システムは、異なる構成であってもよいし、異なるコンポーネントを含んでもよい。図12に示されるコンポーネントにより、多い、又は、少ない、コンポーネントを含んでもよい。システム1200に示される機能は、コンピューティング・システムをサポートする様々な実施形態として構成されることが理解されるべきである。
図12に示すように、コンピューティング・システム1200は、コンピューティング・リソースを提供し、コンピュータを制御する1つ以上の中央処理装置(CPU)1201を含む。CPU1201は、マイクロ・プロセッサなどを有されてもよく、1つ以上のグラフィックス処理セル(GPU)1219、及び/又は、数学的計算のための浮動小数点コ・プロセッサを含んでもよい。システム1200は、ランダム・アクセス・メモリ(RAM)、読み取り専用メモリ(ROM)、又は、その両方の形態であってもよいシステム・メモリ1202をさらに含んでもよい。
図12に示すように、複数のコントローラ、及び、周辺機器が提供されてもよい。入力コントローラ1203は、キーボード、マウス、タッチ・スクリーン、及び/又は、スタイラスなどの様々な入力デバイス1204へのインターフェースを表す。コンピューティング・システム1200は、1つ以上の記憶装置1208とインターフェースするためのメモリ・コントローラ1207をさらに含んでもよい。記憶装置のそれぞれが、記憶媒体(磁気テープ、又は、ディスク)、又は、光学媒体(オペレーティング・システム、ユーティリティ、アプリケーション・プログラムのコマンドを記録するために使用されてもよく、これらは、本発明の様々な態様を実施するプログラムの実施形態を含んでもよい)を含む。記憶装置1208は、さらに、処理されたデータ、又は、本発明に従って、処理対象であるデータを記憶するために用いられてもよい。システム1200は、ディスプレイ・デバイス1211へのインターフェースを提供するためのディスプレイ・コントローラ1209も含んでもよい。ディスプレイ・デバイス1211は、陰極線管(CRT)、薄膜トランジスタ(TFT)ディスプレイ、有機発光ダイオード、エレクトロ・ルミネセント・パネル、プラズマ・パネル、又は、他のタイプのディスプレイであってもよい。コンピューティング・システム1200は、1つ以上の周辺機器1206のための1つ以上の周辺機器コントローラ、又は、インターフェース1205をさらに含んでもよい。周辺機器の例は、1つ以上のプリンタ、スキャナ、入力デバイス、出力デバイス、センサなどを含んでもよい。通信コントローラ1214は、1つ以上の通信デバイス1215とインターフェースすることができ、これにより、システム1200が、様々なネットワーク(インターネット、クラウド・リソース(たとえば、イーサネット・クラウド、ファイバー・チャネル・オーバー・イーサネット(FCoE)/データ・センター・ブリッジング(DCB)クラウドなど)、ローカル・エリア・ネットワーク(LAN)、ワイド・エリア・ネットワーク(WAN)、ストレージ・エリア・ネットワーク(SAN)を含む)のいずれかのネットワーク、又は、任意の適切な電磁搬送信号(赤外線信号を含む)を介してリモート・デバイスに接続できるようになる。
示されたシステムでは、すべての主なシステム・コンポーネントは、バス1216に接続することができ、バスは複数の物理バスを表すことができる。ただし、様々なシステム・コンポーネントが、互いに物理的に接近してもよいし、接近しなくてもよい。例えば、入力データ、及び/又は、出力データは、1つの物理的な場所から別の場所にリモートで送信されてもよい。また、本発明の様々な態様を実施するプログラムは、ネットワークを介して、遠隔位置(例えば、サーバー)からアクセスすることができる。そのようなデータ、及び/又は、プログラムは、様々な機械可読媒体のいずれかを介して伝送することができ、ハード・ディスク、フロッピー・ディスク、及び、磁気テープなどの磁気媒体と、CD-ROMやホログラフィック・デバイスなどの光学媒体と、光磁気媒体と、特定用途向け集積回路(ASIC)、プログラマブル・ロジック・デバイス(PLD)、フラッシュ・メモリ・デバイス、ROM、及び、RAMデバイスなどのプログラム・コードを格納、又は、格納、及び、実行するように特別に構成されたハードウェア・デバイスとを含むがこれらに限定されない。
本発明の一態様は、1つ以上のプロセッサ、又は、処理セルに用いて、ステップを実行させるコマンドで、1つ以上の非一時的なコンピュータ可読媒体に符号化させることができる。なお、1つ以上の非一時的なコンピュータ可読媒体は、揮発性、及び、不揮発性メモリを含むべきである。なお、ハードウェア実施、又は、ソフトウェア/ハードウェア実施を含む、代替実施が可能である。ハードウェア実施の機能は、ASIC、プログラマブル・アレイ、デジタル信号処理回路などで実現できる。したがって、特許請求の範囲の「手段」という用語は、ソフトウェアとハードウェアの両方の実施を含むことを旨とする。同様に、本明細書に用いられる「コンピュータ可読媒体、又は、媒体」という用語は、その上に実施されるコマンドのプログラムを有するソフトウェア、及び/又は、ハードウェア、あるいは、それらの組み合わせを含む。これらの代替実施形態を考える場合、図面、及び、説明は、当業者が必要な処理を実行するように、プログラム・コード(すなわち、ソフトウェア)を作成し、及び/又は、回路(すなわち、ハードウェア)を製造するために必要とする機能情報を提供することが理解されるべきである。
なお、本発明の実施形態は、さらに様々なコンピュータ実施操作を実行するためのコンピュータ・コードを有する非一時的有形のコンピュータ可読媒体を含んだコンピュータ製品に関する。媒体、及び、コンピュータ・コードは、本発明の目的のために特に設計、及び、構築されたものであってもよく、又は、それらは、関連分野の当業者に既知、又は、利用可能な種類のものであってもよい。有形のコンピュータ可読媒体の例としては、ハード・ディスク、フロッピー・ディスク、及び、磁気テープなどの磁気媒体と、CD-ROMやホログラフィック・デバイスなどの光学媒体と、光磁気媒体と、特定用途向け集積回路(ASIC)、プログラマブル・ロジック・デバイス(PLD)、フラッシュ・メモリ・デバイス、ROM、及び、RAMデバイスなどのプログラム・コードを格納、又は、格納、及び、実行するように特別に構成されたハードウェア・デバイスと、を含むがこれらに限定されない。コンピュータ・コードの例には、マシン・コード(例えばコンパイラによって生成されるコード)、及び、インタプリタでコンピュータによって実行されるより高いレベルのコードを含むファイルが含まれる。本発明の実施形態は、処理デバイスによって実行されるプログラム・モジュールに、機械実行可能コマンドとして、全体的、又は、部分的に実施されてもよい。プログラム・モジュールの例としては、ライブラリ、プログラム、ルーチン、オブジェクト、コンポーネント、及び、データ構造が含まれる。分散コンピューティング環境では、プログラム・モジュールは、ローカル、リモート、又は、その両方の設定において物理的に配置できる。
当業者は、コンピューティング・システム、又は、プログラミング言語が本発明の実施に重要ではないことを認識するべきである。当業者は、さらに上記のいくつかの要素が、物理的、及び/又は、機能的にサブ・モジュールに分割され得るか、又は、一緒に組み合わされてもよいと認識するべきである。
当業者は、前述の例、及び、実施形態が例示的であり、本発明の範囲を限定しないと理解されるべきである。当業者が明細書を読んで図面を検討する場合、当業者にとって明らかであるすべての置換、強化、同等、組み合わせ、及び、改善は、本発明の真の精神、及び、範囲内に含まれることを旨とする。なお、特許請求の範囲の要素は、異なって配置され、複数の従属、構成、組み合わせを含んでもよい。

Claims (21)

  1. 自律型作業車両に適用される、タスクを実行するためにタスク・プランニング・ネットワークをトレーニングするためのコンピュータ実行方法であって、
    第1の記録された、いずれも環境観察データを含む入力と記録された出力を有する入出力ペア・シーケンスを含むサブタスク・トレーニング・データセットを用いて、タスクをサブタスクに分割するためのサブタスク決定モデルをトレーニングするステップであって、前記環境観察データは、前記タスクに関連する環境を感知したデータであり、前記サブタスク決定モデルは、第1のプランニング・コア、サブタスク・デコーダ、第1の仕様デコーダ、及び、第1の終了デコーダをサブモデルとして含む、ステップと、
    第2の記録された、ローカル環境観察データを含む入力と記録された出力を有する入出力ペア・シーケンスを含むプリミティブ・トレーニング・データセットを用いて、サブタスクを実行可能なタスク・プリミティブに分割するためのプリミティブ決定モデルをトレーニングするステップであって、前記ローカル環境観察データは、サブタスクに関連する環境を感知したデータであり、第2のプランニング・コア、プリミティブ・デコーダ、第2の仕様デコーダ、及び、第2の終了デコーダをサブモデルとして含む、ステップと、を含み、
    前記サブタスク決定モデルのプランニングは、
    少なくとも前記環境観察データに基づき、前記第1のプランニング・コアを用いて、特徴を抽出することと、
    少なくとも前記環境観察データから抽出された前記特徴に基づき、前記サブタスク・デコーダを用いて、予測サブタスクを生成することと、
    少なくとも前記環境観察データから抽出された前記特徴に基づき、前記第1の仕様デコーダを用いて、前記予測サブタスクに対応する第1の予測仕様を生成することと、
    少なくとも前記環境観察データから抽出された前記特徴に基づき、前記第1の終了デコーダを用いて、前記タスクが完了したか否かを示す第1の予測終了ステータスを生成することと、
    前記第1の記録された入出力ペア・シーケンス、前記予測サブタスク、前記第1の予測仕様、及び、前記第1の予測終了ステータスに基づき、第1の損失関数を用いて、前記サブタスク決定モデルをトレーニングすることと、を含み、
    第1の損失は、前記第1の記録された入出力ペア・シーケンスにおける、前記予測サブタスク、前記第1の予測仕様、前記第1の予測終了ステータスと、対応する記録されたサブタスク、記録された仕様、記録された終了ステータスと、の間の誤差の重み付け和であり、
    前記プリミティブ決定モデルのプランニングは、
    少なくとも前記ローカル環境観察データに基づき、前記第2のプランニング・コアを用いて、特徴を抽出することと、
    少なくとも前記ローカル環境観察データから抽出された特徴に基づき、前記プリミティブ・デコーダを用いて、予測プリミティブを生成することと、
    少なくとも前記ローカル環境観察データから抽出された特徴に基づき、前記第2の仕様デコーダを用いて、前記予測プリミティブに対応する第2の予測仕様を生成することと、
    前記第2の終了デコーダを用いて、前記サブタスクが完了したか否かを示す第2の予測終了ステータスを生成することと、
    前記第2の記録された入出力ペア・シーケンス、前記予測プリミティブ、前記第2の予測仕様、及び、前記第2の予測終了ステータスに基づき、第2の損失関数を用いて、前記プリミティブ決定モデルをトレーニングすることと、
    前記タスク・プランニング・ネットワークの第1のフェーズとしてのトレーニングされたサブタスク決定モデルと、前記タスク・プランニング・ネットワークの第2のフェーズとしてのトレーニングされたプリミティブ決定モデルと、を統合することによって、トレーニングされたタスク・プランニング・ネットワークを生成することと、を含み、
    第2の損失は、前記第2の記録された入出力ペア・シーケンスにおける、前記予測プリミティブ、前記第2の予測仕様、前記第2の予測終了ステータスと、対応する記録されたサブタスク、記録された仕様、記録された終了ステータスと、の間の誤差の重み付け和である、
    コンピュータ実行方法。
  2. 前記タスク・プランニング・ネットワークは、さらに、前記サブタスク決定モデルに接続し、前記サブタスク決定モデルから出力され、モーション・サブタスクであるサブタスク毎に応答し、前記モーション・サブタスクを実行するためのトラックを決定するパス決定モジュールを含む、
    ことを特徴とする請求項1に記載のコンピュータ実行方法。
  3. 前記環境観察データから抽出された前記特徴は、潜在的な空間表現である、
    ことを特徴とする請求項1に記載のコンピュータ実行方法。
  4. 前記第1のプランニング・コアと前記第2のプランニング・コアは、前記プリミティブ決定モデルと前記サブタスク決定モデルによって共有される、
    ことを特徴とする請求項1に記載のコンピュータ実行方法。
  5. 前記ローカル環境観察データは、前記環境観察データから切り取られる、
    ことを特徴とする請求項1に記載のコンピュータ実行方法。
  6. 自律型作業車両に適用される、タスク・プランニング・ネットワークを用いて実行するためのコンピュータ実行方法であって、
    前記タスク・プランニング・ネットワークは、第1のフェーズとしてタスクをサブタスクに分割するためのサブタスク決定モデルと、第2のフェーズとしてサブタスクを実行可能なタスク・プリミティブに分割するためのプリミティブ決定モデルとが統合されたものであり、
    前記コンピュータ実行方法は、
    少なくともタスク・ディスクリプションと前記タスクに関連する環境を感知したデータである環境観察データを与え、サブタスク決定モデルを用いて、サブタスク、前記サブタスクに関連する仕様、及び、前記タスクが完了したか否かを示すタスク終了ステータスを出力するステップ
    前記タスク終了ステータスがタスクの完了を示すまで、
    前記サブタスクがモーション・サブタスクであることに応答して、
    サブタスク・プランニング・モジュールを呼び出して、グローバル・フレームにおける目標点へのトラックを生成し、前記目標点に到達した後に、前記サブタスク決定モデルに戻ることと、
    前記サブタスクがローカル実行サブタスクであることに応答して、
    少なくとも前記ローカル実行サブタスクとサブタスクに関連する環境を感知したデータであるローカル環境観察データに基づき、プリミティブ決定モデルを用いて、一つ以上のタスク・プリミティブを生成し、
    前記一つ以上のタスク・プリミティブを実行し、前記ローカル環境観察データと前記環境観察データを更新し、
    前記ローカル実行サブタスクを完了した後に、前記サブタスク決定モデルに戻ることと、
    を繰り返して実行するステップと、
    を含む、コンピュータ実行方法。
  7. 前記サブタスク決定モデルと前記プリミティブ決定モデルは、予めトレーニングされる、
    ことを特徴とする請求項に記載のコンピュータ実行方法。
  8. 前記サブタスク決定モデルは、
    前記タスクが与えられた場合、前記環境観察データから特徴を抽出する第1のプランニング・コアと、
    前記第1のプランニング・コアに接続し、少なくとも前記環境観察データから抽出された前記特徴に基づき、前記サブタスクを生成するサブタスク・デコーダと、
    前記第1のプランニング・コアに接続し、少なくとも前記環境観察データから抽出された前記特徴に基づき、前記サブタスクに対応する仕様を生成する第1の仕様デコーダと、
    前記第1のプランニング・コアに接続し、前記タスクが完了したか否かを示す前記タスク終了ステータスを生成する第1の終了デコーダと、
    サブモデルとして含む、
    ことを特徴とする請求項に記載のコンピュータ実行方法。
  9. 前記サブタスク・デコーダが少なくとも前記環境観察データから抽出された前記特徴に基づき前記サブタスクを生成するステップは、さらに、
    過去のモーション方向シーケンスを、前記環境観察データから抽出された前記特徴を有するベクトルに重畳して、カスケード・ベクトルを形成するステップと、
    前記カスケード・ベクトルを前記サブタスク・デコーダにおける一つ以上の全接続の接続層に給送し、前記サブタスクを生成するステップと、
    を含む、
    ことを特徴とする請求項に記載のコンピュータ実行方法。
  10. 前記プリミティブ決定モデルは、
    前記サブタスク決定モデルから出力された前記サブタスクが与えられた場合、少なくとも前記ローカル環境観察データを含む入力を用いて特徴を抽出する第2のプランニング・コアと、
    前記第2のプランニング・コアに接続し、少なくとも前記ローカル環境観察データから抽出された特徴に基づき、前記プリミティブを生成するプリミティブ・デコーダと、
    前記第2のプランニング・コアに接続し、少なくとも前記ローカル環境観察データから抽出された特徴に基づき、前記プリミティブに対応する仕様を生成する第2の仕様デコーダと、
    前記第2のプランニング・コアに接続し、前記サブタスクが完了したか否かを示すサブタスク終了ステータスを生成する第2の終了デコーダと、
    を含む、
    ことを特徴とする請求項に記載のコンピュータ実行方法。
  11. 前記第2のプランニング・コアへの入力は、さらに、最後のプリミティブに関連する仕様を含む、
    ことを特徴とする請求項10に記載のコンピュータ実行方法。
  12. 前記第1のプランニング・コアと前記第2のプランニング・コアは、前記プリミティブ決定モデルと前記サブタスク決定モデルによって共有される、
    ことを特徴とする請求項10に記載のコンピュータ実行方法。
  13. 前記ローカル環境観察データは、前記環境観察データから切り取られる、
    ことを特徴とする請求項10に記載のコンピュータ実行方法。
  14. 自律型作業車両に適用される、タスク・プランニング・ネットワークを用いてタスク・プランニングを実行するためのコンピュータ実行方法であって、
    タスクと、前記タスクに関連する環境を感知したデータである環境観察データトレーニングされたタスク・プランニング・ネットワークに入力するステップであって、
    前記トレーニングされたタスク・プランニング・ネットワークは、第1のフェーズとしてタスクをサブタスクに分割するためのサブタスク決定モデルと、第2のフェーズとしてサブタスクを実行可能なタスク・プリミティブに分割するためのプリミティブ決定モデルとが統合されたものであり、
    前記サブタスク決定モデルは、
    前記タスクが与えられた場合、前記環境観察データから特徴を抽出する第1のプランニング・コアと、
    前記第1のプランニング・コアに接続し、少なくとも前記環境観察データから抽出された前記特徴に基づき、サブタスクを生成するサブタスク・デコーダと、
    前記第1のプランニング・コアに接続し、少なくとも前記環境観察データから抽出された前記特徴に基づき、前記サブタスクに対応する仕様を生成する第1の仕様デコーダと、
    前記第1のプランニング・コアに接続し、少なくとも前記環境観察データに基づき、前記タスクが完了したか否かを示すタスク終了ステータスを生成する第1の終了デコーダと、をサブモデルとして含み、
    前記プリミティブ決定モデルは、
    前記サブタスク決定モデルから出力され、ローカル実行サブタスクである前記サブタスクに応答し、少なくとも前記サブタスクに関連するローカル環境観察データを含む入力を用いて、特徴を抽出する第2のプランニング・コアと、
    前記第2のプランニング・コアに接続し、少なくとも前記ローカル環境観察データから抽出された特徴に基づき、一つ以上のプリミティブを生成するプリミティブ・デコーダと、
    前記第2のプランニング・コアに接続し、少なくとも前記ローカル環境観察データから抽出された特徴に基づき、前記プリミティブに対応する仕様を生成する第2の仕様デコーダと、
    前記第2のプランニング・コアに接続し、前記サブタスクが完了したか否かを示すサブタスク終了ステータスを生成する第2の終了デコーダと、を含む、プリミティブ決定モデルと、をサブモデルとして含む、ステップと、
    前記一つ以上のプリミティブを実行すると、前記ローカル環境観察データと前記環境観察データを更新するステップと、
    前記タスク終了ステータスは前記サブタスクが完了したことを示す場合、前記サブタスク決定モデルにより前記タスク・プランニングを終了するステップと、
    を含む、コンピュータ実行方法。
  15. 前記第2のプランニング・コアへの入力は、さらに、最後のプリミティブに関連する仕様を含む、
    ことを特徴とする請求項14に記載のコンピュータ実行方法。
  16. 前記ローカル環境観察データは、前記環境観察データから切り取られる、
    ことを特徴とする請求項14に記載のコンピュータ実行方法。
  17. 前記サブタスク・デコーダが、少なくとも前記環境観察データから抽出された前記特徴に基づき、サブタスクを生成するステップは、
    過去のモーション方向シーケンスを、前記環境観察データから抽出された前記特徴を有するベクトルに重畳して、カスケード・ベクトルを形成するステップと、
    前記カスケード・ベクトルを前記サブタスク・デコーダにおける一つ以上の全接続の接続層に給送し、前記サブタスクを生成するステップと、
    を含む、
    ことを特徴とする請求項14に記載のコンピュータ実行方法。
  18. 前記第1のプランニング・コアと前記第2のプランニング・コアは、前記プリミティブ決定モデルと前記サブタスク決定モデルによって共有される、
    ことを特徴とする請求項14に記載のコンピュータ実行方法。
  19. コンピュータ・プログラムであって、プロセッサにより実行された場合に、請求項1乃至の何れか一項に記載のコンピュータ実行方法を実現させる、
    コンピュータ・プログラム。
  20. コンピュータ・プログラムであって、プロセッサにより実行された場合に、請求項6乃至13の何れか一項に記載のコンピュータ実行方法を実現させる、
    コンピュータ・プログラム。
  21. コンピュータ・プログラムであって、プロセッサにより実行された場合に、請求項14乃至18の何れか一項に記載のコンピュータ実行方法を実現させる、
    コンピュータ・プログラム。
JP2020174568A 2020-01-17 2020-10-16 自律走行車両ためのニューラル・タスク計画部 Active JP7169328B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/746,777 US11409287B2 (en) 2020-01-17 2020-01-17 Neural task planner for autonomous vehicles
US16/746,777 2020-01-17

Publications (2)

Publication Number Publication Date
JP2021113487A JP2021113487A (ja) 2021-08-05
JP7169328B2 true JP7169328B2 (ja) 2022-11-10

Family

ID=72470211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020174568A Active JP7169328B2 (ja) 2020-01-17 2020-10-16 自律走行車両ためのニューラル・タスク計画部

Country Status (4)

Country Link
US (1) US11409287B2 (ja)
EP (1) EP3852018A1 (ja)
JP (1) JP7169328B2 (ja)
CN (1) CN113139652A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK3907171T3 (da) * 2020-05-06 2022-09-26 Hiab Ab En kran, et køretøj, og en metode til kranen
CN113657228A (zh) * 2021-08-06 2021-11-16 北京百度网讯科技有限公司 数据处理的方法、设备和存储介质
US20240093464A1 (en) * 2022-04-07 2024-03-21 AIM Intelligent Machines, Inc. Autonomous Control Of Operations Of Earth-Moving Vehicles Using Trained Machine Learning Models
US11746499B1 (en) * 2022-05-10 2023-09-05 AIM Intelligent Machines, Inc. Hardware component configuration for autonomous control of powered earth-moving vehicles
JP2024005910A (ja) * 2022-06-30 2024-01-17 株式会社小松製作所 作業車両の経路計画生成システム、作業車両の経路計画生成方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018147261A (ja) 2017-03-06 2018-09-20 Kddi株式会社 モデル統合装置、モデル統合システム、方法およびプログラム
US20190129436A1 (en) 2017-10-28 2019-05-02 TuSimple System and method for real world autonomous vehicle trajectory simulation

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2944774B2 (ja) * 1991-03-20 1999-09-06 ヤンマー農機株式会社 自動走行作業機における画像処理方法
US6076030A (en) * 1998-10-14 2000-06-13 Carnegie Mellon University Learning system and method for optimizing control of autonomous earthmoving machinery
JP4293404B2 (ja) 2000-03-02 2009-07-08 ダイセルノバフォーム株式会社 発泡成形体およびその製造方法
US10032117B2 (en) * 2014-09-17 2018-07-24 Caterpillar Inc. Method for developing machine operation classifier using machine learning
US10586173B2 (en) 2016-01-27 2020-03-10 Bonsai AI, Inc. Searchable database of trained artificial intelligence objects that can be reused, reconfigured, and recomposed, into one or more subsequent artificial intelligence models
CN106647742B (zh) * 2016-10-31 2019-09-20 纳恩博(北京)科技有限公司 移动路径规划方法及装置
US10796204B2 (en) * 2017-02-27 2020-10-06 Huawei Technologies Co., Ltd. Planning system and method for controlling operation of an autonomous vehicle to navigate a planned path
CN106970615B (zh) * 2017-03-21 2019-10-22 西北工业大学 一种深度强化学习的实时在线路径规划方法
EP3593293B1 (en) 2017-05-19 2024-01-17 Deepmind Technologies Limited Imagination-based agent neural networks
US10761537B1 (en) * 2017-06-02 2020-09-01 Built Robotics Inc. Obstacle detection and manipulation by a vehicle within a dig site
US11029693B2 (en) * 2017-08-08 2021-06-08 Tusimple, Inc. Neural network based vehicle dynamics model
CN111095291B (zh) * 2018-02-27 2024-04-09 辉达公司 由自动驾驶车辆实时检测车道和边界
DE102019113114A1 (de) * 2018-06-19 2019-12-19 Nvidia Corporation Verhaltensgesteuerte wegplanung in autonomen maschinenanwendungen
CN109992000B (zh) * 2019-04-04 2020-07-03 北京航空航天大学 一种基于分层强化学习的多无人机路径协同规划方法及装置
CN110348636B (zh) * 2019-07-12 2023-07-28 南方科技大学 路径规划预测方法、装置、设备和计算机可读存储介质
US11378964B2 (en) * 2019-10-28 2022-07-05 Caterpillar Inc. Systems and methods for autonomous movement of material

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018147261A (ja) 2017-03-06 2018-09-20 Kddi株式会社 モデル統合装置、モデル統合システム、方法およびプログラム
US20190129436A1 (en) 2017-10-28 2019-05-02 TuSimple System and method for real world autonomous vehicle trajectory simulation

Also Published As

Publication number Publication date
JP2021113487A (ja) 2021-08-05
EP3852018A1 (en) 2021-07-21
US11409287B2 (en) 2022-08-09
US20210223774A1 (en) 2021-07-22
CN113139652A (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
JP7169328B2 (ja) 自律走行車両ためのニューラル・タスク計画部
Zhang et al. An autonomous excavator system for material loading tasks
Schmidt et al. Simulation and control of an autonomous bucket excavator for landscaping tasks
ElNimr et al. Two-way integration of 3D visualization and discrete event simulation for modeling mobile crane movement under dynamically changing site layout
Eraliev et al. Sensing, perception, decision, planning and action of autonomous excavators
Kamat VITASCOPE: Extensible and scalable 3D visualization of simulated construction operations
Naghshbandi et al. Technologies for safe and resilient earthmoving operations: A systematic literature review
Lu et al. Excavation reinforcement learning using geometric representation
EP4083335B1 (en) Hierarchical planning for autonomous machinery on various tasks
Toma et al. Pathbench: A benchmarking platform for classical and learned path planning algorithms
Borngrund et al. Deep-learning-based vision for earth-moving automation
Zhao et al. TaskNet: A neural task planner for autonomous excavator
US20240131705A1 (en) Imitation learning and model integrated trajectory planning
US20240093464A1 (en) Autonomous Control Of Operations Of Earth-Moving Vehicles Using Trained Machine Learning Models
Frontoni et al. A framework for simulations and tests of mobile robotics tasks
Marah et al. An architecture for intelligent agent-based digital twin for cyber-physical systems
Zhu et al. Excavation of fragmented rocks with multi-modal model-based reinforcement learning
CN114723020A (zh) 用于杂乱刚性对象的挖掘学习
Schmidt et al. An autonomous excavator for landscaping tasks
Kamat et al. Software mechanisms for extensible and scalable 3D visualization of construction operations
Feng et al. Task-unit based trajectory generation for excavators utilizing expert operator skills
Cook et al. Towards real-time robot simulation on uneven terrain using neural networks
Shi et al. Autonomous rock excavation: intelligent control techniques and experimentation
Zhang et al. Data-driven excavation trajectory planning for unmanned mining excavator
Somua-Gyimah Dragline excavation simulation, real-time terrain recognition and object detection

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221018

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221028

R150 Certificate of patent or registration of utility model

Ref document number: 7169328

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150