JP7169328B2

JP7169328B2 - 自律走行車両ためのニューラル・タスク計画部

Info

Publication number: JP7169328B2
Application number: JP2020174568A
Authority: JP
Inventors: リャンジュン・チャン; ジンシン・ジャオ
Original assignee: Baidu USA LLC
Current assignee: Baidu USA LLC
Priority date: 2020-01-17
Filing date: 2020-10-16
Publication date: 2022-11-10
Anticipated expiration: 2040-10-16
Also published as: JP2021113487A; EP3852018A1; US11409287B2; US20210223774A1; CN113139652A

Description

本発明は、一般的には、自律走行車両のためのタスク計画部に関し、特に、自律走行車両のためのニューラル・ネットワークに基づくタスク計画部に関する。

建設車両（例えば、掘削機）は、採鉱、建築、農業などの産業分野で、トレンチ掘削や資材積み込みなどの土木作業に広く用いられており、自動掘削の解決手段を開発する傾向が現れている。このようなシステムは、人件費の削減と操作の安全性の向上などのメリットがある。一方、近年、自動運転車両に関する広範な研究のおかげで、知覚、位置特定、ナビゲーションのアルゴリズムだけでなく、光検知と測距（ＬｉＤＡＲ）やカメラなどのハードウェア・センサも驚くべき進歩を遂げ、完全自動運転の建設車両を製造する可能性を高める。

掘削機などの自律走行車両のプランニングの制御システムを構築することについて、１つの主要な挑戦は、掘削機に実行可能かつ効率的な作業（例えば、掘削）タスクのプランニングおよびモーションのトラックを作成することである。このような建設タスクのプランニングは、基本的な動きが少なく、車両コントローラの制約に適合し、実行の成功率が高い効率的なものである必要がある。一般には、実行可能な離散決定と衝突のない連続モーション、を計算するための結合検索スペースは高次元であり、タスクとモーションのプランニングは要件が異なるため、タスクとモーションの計画部の統合は困難である。

本発明の第１の態様では、タスクを実行するようにタスク・プランニング・ネットワーク（ＴＰＮ）をトレーニングするためのコンピュータの実行方法が提供されており、この方法は、第１の記録された、いずれも環境観察データを含む入力と、記録された出力、を有する入出力ペア・シーケンスを含むサブタスク・トレーニング・データセットを用いて、第１のプランニング・コア、サブタスク・デコーダ、第１の仕様デコーダ、及び、第１の終了デコーダを含むサブタスク決定モデル（ＳＤＭ）をトレーニングするステップと、
第２の記録された、環境観察データを含む入力と記録された出力を有する入出力ペア・シーケンスを含むプリミティブ・トレーニング・データセットを用いて、第２のプランニング・コア、プリミティブ・デコーダ、第２の仕様デコーダ、及び、第２の終了デコーダを含むプリミティブ決定モデル（ＰＤＭ）をトレーニングするステップと、を含み、
ＳＤＭのプランニングは、
少なくとも環境観察データに基づき、第１のプランニング・コアを用いて、特徴を抽出することと、
少なくとも環境観察データから抽出された特徴に基づき、サブタスク・デコーダを用いて、予測サブタスクを生成することと、
少なくとも環境観察データから抽出された特徴に基づき、第１の仕様デコーダを用いて、予測サブタスクに対応する第１の予測仕様を生成することと、
少なくとも環境観察データから抽出された特徴に基づき、第１の終了デコーダを用いて、タスクが完了したか否かを示す第１の予測終了ステータスを生成することと、
第１の記録された入出力ペア・シーケンス、予測サブタスク、第１の予測仕様、及び、第１の予測終了ステータスに基づき、第１の損失関数を用いて、ＳＤＭをトレーニングすることと、含み、
ＰＤＭのプランニングは、
少なくともローカル環境観察データに基づき、第２のプランニング・コアを用いて、特徴を抽出することと、
少なくともローカル環境観察データから抽出された特徴に基づき、プリミティブ・デコーダを用いて、予測プリミティブを生成することと、
少なくともローカル環境観察データから抽出された特徴に基づき、第２の仕様デコーダを用いて、予測プリミティブに対応する第２の予測仕様を生成することと、
第２の終了デコーダを用いて、サブタスクが完了したか否かを示す第２の予測終了ステータスを生成することと、
第２の記録された入出力ペア・シーケンス、予測プリミティブ、第２の予測仕様、及び、第２の予測終了ステータスに基づき、第２の損失関数を用いて、ＰＤＭをトレーニングすることと、
ＴＰＮの第１のフェーズとしてのトレーニングされたサブＳＤＭと、ＴＰＮの第２のフェーズとしてのトレーニングされたＰＤＭと、を組み合わせることによって、トレーニングされたＴＰＮを生成することと、を含む実行方法。

本発明の第２の態様では、タスク・プランニング・ネットワーク（ＴＰＮ）を用いて、実行するためのコンピュータ実行方法が提供されており、この方法は、少なくともタスク・ディスクリプションと環境観察データを与え、サブタスク決定モデル（ＳＤＭ）を用いて、サブタスク、サブタスクに関連する仕様、及び、タスクが完了したか否かを示すタスク終了ステータスを出力するステップを含み、
タスク終了ステータスは、タスクが完了したことを示す前、反復は、サブタスク・プランニング・モジュールを呼び出して、グローバル・フレームにおける目標点へのトラックを生成し、目標点に到達した後、ＳＤＭに戻ることを含む、モーション・サブタスクとして、サブタスクに応答するステップと、
少なくともローカル実行サブタスクとローカル環境観察データに基づき、ＰＤＭを用いて、一つ以上のタスク・プリミティブを生成することと、
一つ以上のタスク・プリミティブを実行し、ローカル環境観察データと環境観察データを更新することと、
ローカル実行サブタスクを完了した後、ＳＤＭに戻ることと、を含む、ローカル実行サブタスクとして、サブタスクに応答するステップと、を含む。

本発明の第３の態様では、タスク・プランニング・ネットワーク（ＴＰＮ）を用いて、タスク・プランニングを実行するためのコンピュータ実行方法が提供されて、この方法は、
環境観察データとタスクをトレーニングされたＴＰＮに入力するステップと、
一つ以上のプリミティブを実行すると、ローカル環境観察データと環境観察データを更新するステップと、
タスク終了ステータスは、サブタスクが完了したことを示す場合、ＳＤＭによりタスク・プランニングを終了するステップと、を含み、
トレーニングされたＴＰＮは、
タスクが与えられた場合、環境観察データから特徴を抽出する第１のプランニング・コアと、
第１のプランニング・コアに接続し、少なくとも環境観察データから抽出された特徴に基づき、サブタスクを生成する、サブタスク・デコーダと、
第１のプランニング・コアに接続し、少なくとも環境観察データから抽出された特徴に基づき、サブタスクに対応する仕様を生成する、第１の仕様デコーダと、
第１のプランニング・コアに接続し、少なくとも環境観察データに基づき、タスクが完了したか否かを示すタスク終了ステータスを生成する、第１の終了デコーダと、を含むＳＤＭと、
ＳＤＭから出力され、ローカル実行サブタスクであるサブタスクに応答し、少なくともサブタスクに関連するローカル環境観察データを含む入力を用いて、特徴を抽出する、第２のプランニング・コアと、
第２のプランニング・コアに接続し、少なくともローカル環境観察データから抽出された特徴に基づき、一つ以上のプリミティブを生成する、プリミティブ・デコーダと、
第２のプランニング・コアに接続し、少なくともローカル環境観察データから抽出された特徴に基づき、プリミティブに対応する仕様を生成する、第２の仕様デコーダと、
第２のプランニング・コアに接続し、サブタスクが完了したか否かを示すサブタスク終了ステータスを生成する、第２の終了デコーダと、を含むＰＤＭと、を含む、コンピュータ実行方法。

本発明の第４の態様では、コンピュータ・プログラムを提供し、前記コンピュータ・プログラムがプロセッサに実行されると、第１の態様に記載のコンピュータ実行方法を実現させる。

本発明の第５の態様では、コンピュータ・プログラムを提供し、前記コンピュータ・プログラムがプロセッサに実行されると、第２の態様に記載のコンピュータ実行方法を実現させる。

本発明の第６の態様では、コンピュータ・プログラムを提供し、前記コンピュータ・プログラムがプロセッサに実行されると、第３の態様に記載のコンピュータ実行方法を実現させる。

本発明の実施形態を参照しながら、それらの例は図面に示されてもよい。これらの図面は、限定ではなく例示的であることが意図されている。本発明は、概してこれらの実施形態の文脈で説明されているが、本発明の範囲は、これらの特定の実施形態に限定されるものではない、と理解されるべきである。図面の項目は、比例で描かれていない。

本発明の一実施形態に係る現実の世界で捕らえられた３ＤＬｉＤＡＲ点から変換されたグリッド高さマップの例を示す。本発明の一実施形態に係るグリッド・マップ、タイル・マップ、セル・マップ、及び、タイルを処理するためのジグザグの順序の例を示す。本発明の一実施形態に係るタスクからプリミティブまでのシーケンスをグラフィカルの方式で示す。本発明の一実施形態に係るタスク・プランニングを実行するプロセスを示す。現在の本発明の一実施形態に係るシステム・モデル構成を示す。本発明の一実施形態に係るローカル地形掘削の一例を示す。本発明の一実施形態に係るスキップ・ラインを有する第１のタイル・マップを示す。本発明の一実施形態に係るスキップ・ラインを有する第２のタイル・マップを示す。本発明の一実施形態に係るスキップ・ラインを有する第３のタイル・マップを示す。本発明の一実施形態に係るスキップ・ラインを有する第４のタイル・マップである。本発明の一実施形態に係るスキップ・ラインを有する第５のタイル・マップである。本発明の一実施形態に係るスキップ・ラインを有する第６のタイル・マップである。本発明の一実施形態に係る第１のランダム化タイル・マップを示す。本発明の一実施形態に係る第２のランダム化タイル・マップを示す。本発明の一実施形態に係る第３のランダム化タイル・マップを示す。本発明の一実施形態に係る第４のランダム化タイル・マップを示す。本発明の一実施形態に係る第５のランダム化タイル・マップを示す。本発明の一実施形態に係る第６のランダム化タイル・マップを示す。本発明の一実施形態に係るトレンチ掘削タスクのシミュレーション結果を示す。本発明の一実施形態に係る広い作業領域で、複数のトレンチを掘削するシミュレーション結果を示す。本発明の一実施形態に係るタスク・プランニングの実現ための様々なセンサを有するプラットフォームを示す。本発明の一実施形態に係るコンピューティング・デバイス／情報処理システムを示す簡略ブロック図である。

以下の説明では、本発明をよく理解するために、解釈することを目的として具体的な詳細を説明する。しかしながら、当業者であれば、これらの詳細説明なしに本発明を実践することができることが明らかである。さらに、当業者は、以下に説明された本発明の実施形態は、有形のコンピュータ可読媒体で様々な方法（例えば、プロセス、装置、システム、デバイス、又は、方法）で実施されてもよいことを認識するべきであろう。

図面に示されるコンポーネント、又は、モジュールは、本発明の実施形態の例示的な説明であり、本発明を不明確にすることを避けることを意図している。また、本明細書の全文では、コンポーネントは、個々の機能セル（サブセルを含むことができる）として説明されているが、当業者は、様々なコンポーネント、又は、その部分が個別のコンポーネントに分割されていてもよく、又は、一緒に統合されていてもよい（単一のシステム、又は、コンポーネント内に統合されることを含む）ことを認識するべきである。なお、本明細書に論じた機能、又は、操作は、コンポーネントとして実施されてもよい。コンポーネントは、ソフトウェア、ハードウェア、又は、それらの組み合わせとして実施されてもよい。

また、図面におけるコンポーネント、又は、システム間の接続は、直接接続に限定されるものではない。逆に、これらのコンポーネント間のデータは、中間コンポーネントによって修正され、又は、再フォーマットされ、又は、他の方式で変更されてもよい。また、追加、又は、より少ない接続が用いられてもよい。なお、用語「接続」、「連接」、又は、「通信的接続」は、直接接続、１つ以上の中間デバイスを介して行われる間接接続、及び、無線接続を含むと理解されるべきである。

本明細書では、「一実施形態」、「好ましい実施形態」、「実施形態」、又は、「複数の実施形態」についての言及は、実施形態と組み合わせ説明された具体的な特徴、構造、特性、機能が、本発明の少なくとも一実施形態に含まれていることを示し、さらに、複数の実施形態に含まれてもよい。なお、本明細書の各部分に現れた上記の連語については、必ずしも、全てが同じ実施形態、又は、複数の同じ実施形態を指すとは限らない。

本明細書の各部分における特定の用語の使用は、説明するために、限定して理解されるべきではない。サービス、機能、又は、リソースは、単一のサービス、単一の機能、又は、単一のリソースに限定されない。これらの用語の使用は、関連サービス、機能、又は、リソースの分布、又は、統合可能なパケットを指すことができる。１つ以上の実施形態では、ストップ条件は、（１）設定された反復回数を実行したこと、（２）処理時間量に達したこと、（３）収束（例えば、連続的に反復されたインセンティブ・メトリックの差が第１の閾値より小さい）、（４）発散（例えば、インセンティブ・メトリックの実行の悪化）、及び、（５）許容可能なインセンティブ・メトリックに達したこと、を含むようにしてもよい。

「含む」、「含まれる」、「包含する」、及び、「包含される」という用語は、オープンな用語として理解されるべきであり、その後にリストされているコンテンツは、一例であり、リストされている項目に限定されることを意図しない。「層」は、１つ以上の操作を含んでもよい。「最適」、「高度化」、「最適化」などの用語は、結果、又は、プロセスの改善を指し、指定された結果、又は、プロセスが「最適」、又は、ピーク・ステータスに達していることを要求しない。

本明細書に用いられるいずれの見出しも、組織化の目的のみであり、明細書、又は、特許請求の範囲を限定するために用いられるべきではない。ここで特許文献として言及されている各参考文献は、その全体が本明細書に組み込まれる。

また、当業者は、（１）特定のステップを選択可能に実行してもよいこと、（２）ステップは本明細書に記載された特定の順序に限定されないこと、（３）特定のステップを異なる順序で実行できること。（４）特定のステップを同時に実行できること、を認識するべきである。

Ａ．はじめに
建設車両（例えば、掘削機）は、採鉱、建築、農業などの産業分野で、トレンチ掘削や資材積み込みなどの土木作業に広く用いられており、例えば、自動掘削の解決手段を開発することは傾向になっている。このようなシステムは、人件費の削減と操作の安全性の向上などのメリットがある。一方、近年、自動運転車両に関する広範な研究のおかげで、知覚、位置特定、ナビゲーションのアルゴリズムだけでなく、光検知と測距（ＬｉＤＡＲ）やカメラなどのハードウェア・センサも驚くべき進歩を遂げ、完全自動運転の建設車両を製造する可能性を高める。

掘削機などの自律走行車両のプランニング・制御システムの構築することに関して、１つの主要な挑戦は、掘削機に実行可能かつ効率的な作業タスク・プランニング（例えば、掘削）およびモーション・トラックを作成することである。このような建設タスク・プランニングは、基本的な動きが少なく、車両コントローラの制約に適合し、実行の成功率が高い効率的なものである必要がある。一般には、実行可能な離散決定と衝突のない連続モーション、を計算するための結合検索スペースは高次元であり、タスクとモーション・プランニングの要件が異なるため、タスクとモーションの計画部の統合は困難である。いくつかの建設タスク、及び、モーション・プランニングに対して、特定の困難は、建設タスクの性質により起因される。例えば、掘削タスクに対して、油圧駆動ロボット・アームが変形可能な材料である土壌と相互作用する。油圧システムと変形可能な材料の正確なモデリングは高次元空間で行わなければならず、従来のプランニング課題の策定は困難になり、計算の複雑さが大きくなる。別の困難は、掘削機の作業環境により起因される。掘削機の作業環境は、通常、非構造化場所であり、掘削作業の進行に伴って変化する。実際には、人間の掘削機の操作では、モーション・シーケンスの順序を選択するのに経験が重要な役割を果たす。このような人間の行動パターンは、モデリングして検討するのが非試行的である傾向がある。

学習に基づくタスク・プランニングの方法は、ますます注目を集めており、ロボットの分野で活発に研究されている。模倣学習に基づくいくつかの方法は、ニューラル・ネットワーク・モデルの開発に注力しており、人間のデモンストレーションから基礎シーケンス決定戦略を学習する。他の人は、強化学習に基づく方法を利用して解決手段をさらに探索し、効率化を図る。これらの学習に基づく方法は、環境が変化する複数のタスクに拡張することができ、隠れた人間の行動パターンを継承することができる。これらの特性により、自動掘削タスク・プランニングに対して学習に基づく方法を実行可能で実用的な選択肢にする。しかし、このアプリケーションは、特に複雑な掘削タスクについて十分に研究されていない。

本発明の１つ以上の実施形態では、学習に基づく方法で建設タスク・プランニング問題を解決する。例えば、掘削タスクでは、操作シーケンスをベース移動とアーム操作に分けることができ、アーム操作は、さらに、次の掘削点を選択することと、選択した深さで特定の位置を掘削することに分けることができる。ハイレベルなタスクをサブタスクに変換し、さらにタスク・プリミティブに変換するように、掘削タスクのこの階層的性質を利用して、多層モデルを有するＴａｓｋＮｅｔアーキテクチャの実施形態を開示する。

本特許発明の貢献は、タスク表現（例えば、掘削タスク）の構造と各々のモデルの階層構造を利用し、ニューラル・ネットワークに基づく新規なタスク・プランニング策定を含む。本発明の一実施形態は、観察の結果を潜在的な空間表現に順次変換し、詳細な仕様をサブモデルに伝送することである。

また、モデルでは、畳み込み層を利用してタスク、観察表現、及び、履歴データを処理し、履歴データは、履歴情報とトレーニング・プロセスの速度を利用する。１つ以上の実施形態では、モデル層の個々は、頑健性を保証するために、別々にトレーニングされてもよい。本モデルの実施形態は、環境フィードバックを観察することにより、閉ループ実行のためのリアルタイム・システムに実現できることが証明された。さらに、本方法の実施形態は、人間のエキスパート・データから隠れた行動パターンを学習し、継承することができる。

なお、本発明の１つ以上の実施形態は例として掘削を使用するが、それらの実施形態のプロセスおよびモデル構造は、フロントローダ、バックホーなど他の建築、農業、、又は、産業用途、又は、車両にも適用可能である。

Ｂ．いくつかの関連ワーク
１．自動掘削機のタスク・プランニング
掘削タスクを与えられ、自動掘削機は、掘削操作シーケンスを生成するための全体掘削戦略をプランニングする必要がある。既存のタスク・プランニングの方法は、主にステータス間のルールに基づく遷移の有限ステータス機械（ＦＳＭ）を利用する。いくつかの提案では、大量掘削パラメータ化スクリプトと呼ばれる方法が紹介され、この方法は、一連のステップで所望のタスクを記述する。各ステップは、いずれもイベントに基づく遷移のＦＳＭのステータスとして表される。同様に、いくつかの提案では、別のホイールローダ・プランニング・システムを構築する。シミュレーションにおけるホイールローダの操作のための仮想オペレータ・モデルは、環境条件に基づいて制御入力を生成し、ここでは、イベントに基づく有限ステータス機械に関する。

ＦＳＭ以外、行動に基づく方法に導入して掘削タスク計画部を設計し、掘削タスクが異なるフェーズとプリミティブに分割され、ここでは、ルールに基づく遷移でタスクをフェーズに分割した後にプリミティブに分割する。いくつかの提案では、作業領域のセグメンテーション、地形のレイヤーへの分解、ベース移動のスケジューリングとプランニング、を含むハイレベルなルールに基づく掘削タスク計画部を提案している。この方法は、現実の世界のシステムにおいてパイル・ローディング・タスクの実施が成功したことにより実証された。

２．ロボット・タスクとモーション・プランニング
タスク、及び、モーション・プランニング（ＴＡＭＰ）の問題は、ロボット工学においてかなり研究されてきた。従来の方法のほとんどは、タスクの分解ための様々なレベルの推論に関する。ＴＡＭＰの１つのカテゴリは、タスク・プランニング・フェーズで幾何学的制約を考慮する。いくつかの提案では、幾何学的推論、及び、タスク・プランニングに対処するために、運動学的制約問題が公式化されており、ここでは、目標の幾何学的ステータスを達成するために最適化に基づく方法が導入される。ＴＡＭＰの別のトピックは、タスクの記号表現を使用したハイレベルな論理の推論に注力しる。いくつかの提案では、プランニングのための記号表現方法を説明し、これは、シンボルがプランニング・エージェントによりもたらされる条件、及び、効果を表すことができることを証明する。いくつかの提案では、サンプリングに基づくＴＡＭＰエンコード方法がさらに開発され、記号表現を用いて、ロジックを符号化する。いくつかの提案では、時間論理仕様に基づくモーション・プランニング問題が公式化され、また、タスク・シーケンス・ソートの後ろの論理を明らかにしようとする。

進歩がなされているが、統合ＴＡＭＰ方法を開発することの主な挑戦は、依然として、すべての制約が満たされることを保証しながら離散決定と高次元連続運動探索を組み合わせることにある。自動掘削機のタスクの環境では、環境は変形可能で変化しているため、実行可能なタスク・プランニングの計算を困難にする。

３．学習に基づくニューラル・プログラミング
深層学習では、特にニューラル・プログラミングにおける最新の研究成果はタスク・ラーニング問題を解決するための新しい視点を示唆している。これらの方法は、ニューラル・ネットワーク・モデルを開発して、トレーニング・データから基礎シーケンス決定戦略を学習する。ニューラル・プログラミング・インタープリタ（ＮＰＩ）のニューラル・プログラミングの分野における１つの進歩が紹介された。ＮＰＩは、模倣学習を介してトレーニングされたニューラル・ネットワーク・モデルであり、コンピュータ・プログラムの機能を模倣するためである。学習したモデルは、プログラムを再帰的にトリガーし、プログラムを終了し、又は、再帰的に上位レベルのプログラムに戻ることができる。プログラムがタスクとして比較される場合、このような階層レイアウトは掘削タスク計画部と類似点を共有する。一部の研究では、ＮＰＩの概念を継承し、それをニューラル・タスク・プログラミング（ＮＴＰ）に拡張する。これは、タスク・プランニング問題に対してより具体的なものである。ＮＴＰは、タスク仕様の分解を細かいサブタスク仕様に明示的に導入し、さらにサブルーチンに導入する。これらのサブルーチンはタスク・ラーニング問題のプリミティブに相当する。ＮＴＰは、階層構造を持つ順次タスクに対して強力な汎化機能を示す。

掘削の特定のタスク・ラーニング方法は、汎化問題に遭い、ここでは、設計された計画部を異なるシナリオ、及び、タスクに再利用することは困難になっている。逆に、学習に基づくタスク・ラーニング方法は、それぞれ環境条件とタスク目標への適応性と汎化可能性がある。本発明の明細書の１つ以上の実施形態は、掘削タスク・ラーニングと学習に基づくニューラル・プログラミング方法との間のギャップを埋めることを目的とする。

Ｃ．ＴａｓｋＮｅｔ計画部の実施形態
１．問題の定義
１つ以上の実施形態では、タスク・プランニングの問題は、自動掘削機に用いられると考慮される。いくつかの実施形態は、地形の形状を変更することに関するトレンチ掘削、掘削、および材料再配置などの掘削作業に注力する。１つ以上の実施形態では、

はタスク・ディスクリプションのセットであり、

はすべての環境観察値のセットを表す。関数

は、タスクが完成したか

否か

を表すことに用いられる。設計しようとしているタスク計画部は、そのようなメイン・タスクをサブタスクのシーケンスに分割し、そして、それぞれ仕様を有するタスク・プリミティブに分割することができる。

はサブタスクのセットに用いられ、

はサブタスク仕様のセットを表す。

はタスク・プリミティブのセットのために用いられ、

はタスク・プリミティブ仕様のセットを表す。仕様フィールドは、低レベルのモーション計画部およびコントローラが高い成功率で実行するのに役立つ。なお、いくつかのデータ駆動型の方法でこのようなタスク・プランニングの問題を解決することで、人間の行動を模倣する。１つ以上の実施形態では、記述され得る正式な問題のステートメントは、以下のとおりである。

問題１：ｔ時点での環境観察フィードバック

とタスク・ディスクリプション

が与えられた場合、サブタスク・シーケンスと仕様を生成できるタスク計画部を設計し、

（ただし、

、且つ、

）、また、計画部はこのようなシーケンスを詳細な仕様を有するタスク・プリミティブに変換することができる。

（ただし、

、且つ、

）。そのため、タスク・プリミティブを実行した後、

２．環境およびタスク表現のためのグリッド・マップ
１つ以上の実施形態では、環境は２Ｄグリッド・マップとして表されてもよい。

は地形のグリッド・マップのｐ行目とｑ列目のセルの高さを表す。図１は、現実の世界で捕獲された３ＤＬｉＤＡＲ点から変換されたグリッド高さマップの一例を示す。元の３Ｄ点、３Ｄグリッド・マップ、又は、他の表現と比較して、グリッド・マップ表現は、ニューラル・モデルの畳み込み層のテンソル入力として用いられやすくてもよい。１つ以上の実施形態では、環境特徴は、グリッド・マップ表現を使用することで、畳み込みニューラル層に効果的に学習されてもよい。

典型的な掘削タスクは地形の形状を変えることができ、これは、グリッド・マップの各セルに対して目標高さ

を指定することで定義されてもよい。１つ以上の実施形態では、一般的なハイレベル・タスクは、以下のように指定されてもよい。

（ただし、

は掘削精度の公差パラメータである）。

この関数

を指定することにより、さまざまな掘削タスクを定義できる。例えば、定数０を有する

は、領域を格付けするためのタスクを定義でき

、定数の負値を有する

は、目標深さを含むトレンチを掘るためのタスクを定義できる。

図２に示すように、環境のグリッド・マップ２１０が与えられたことは、さらにタイル・マップ

２２０定義できる。タイル・マップにおいて、各タイルは長方形であり、複数のセルを含む。セル・マップ

２３０はグリッド・マップ全体から切り取られるサブ・マップに定義される。このタイル内のすべてのセルが処理されている場合、

を０に設定し、そうでなければ、

は１である。掘削タスクを与え、掘削機はすべてのタイルが処理されるまでタイルごとにタイルを処理する。

３．方法の概要
１つ以上の実施形態では、ニューラル・プログラミングを方法の実施形態に用い、一般的なタスクを入力として、サブタスク、又は、タスク・プリミティブを再帰的にトリガーする。掘削タスクの実施形態では、操作シーケンスは２つのカテゴリに分けられる。１つのカテゴリは車両のベースを特定の場所に移動することであり、別のカテゴリはベースが静止したまま掘削を行うことである。また、静的ベースで、掘削を行っているとともに、掘削機アームのモーションを次の掘削点を選択するステップと、選択した深さで、特定の場所を掘削するステップ、に分解することができる。そのような観察によると、サブタスクとタスク・プリミティブの階層的定義が定義され、表１に示されている。

１つ以上の実施形態では、ニューラル・ネットワークに基づくタスク計画部（又は、タスク・プランニング・ネットワーク、ＴＰＮ）を開示し、前記タスク計画部は、タスクをモーション・プリミティブに変換する２層モデルを含む。第１のモデルは、タイル掘削モデル（ＴＥＭ）、即ち

とも呼ばれるサブ・タスク決定モデル（ＳＤＭ）であり、下文に記述された１つ以上の実施形態では、一つ以上の所望サブタスクを決定することに用いられる。第２のモデルは、セル掘削モデル（ＣＥＭ）、即ち

とも呼ばれるプリミティブ決定モデル（ＰＤＭ）であり、下文に記述された１つ以上の実施形態では、少なくともサブタスクに基づき、一つ以上の所望のタスク・プリミティブを決定することに用いられる。

１つ以上の実施形態では、環境観察フィードバック

が与えられた場合、ＴＥＭモデルは、特定の定仕様

と共にトリガーするサブタスク

を選択し、計画部

を終了するか否かを決定する。１つ以上の実施形態では、このプロセスは（２）により記述される。

同様に、ＣＥＭは、ローカル環境観察値

、サブタスク

および仕様

に基づき、所望のタスク・プリミティブ

、モーション仕様

を生成し、サブタスクが完了したか否かと決定し、（３）に示すように記述される。

１つ以上の実施形態では、ＰＤＭモデルは、ＴＥＭモデルによって決定されたサブタスクがｍｏｖｅ＿ｔｏ＿ｔｉｌｅサブタスク割り当てであるときにパス・プランニング問題を処理するパス・プランニング・モジュールである。パス・プランニング・モジュールは、次のように定義できる。

ただし、

は、

の場合、サブタスクが完了すること、又は、

の場合、サブタスクが完了しないこと、を示すインジケータである。なお、２つのモデル間の時間スケールを区別するために、ＴＥＭのインデックスはｔであり、ＣＥＭ／ＰＡＴＨのインデックスはｉである。

１つ以上の実施形態では、全体タスク・プランニング方法が方法論１に示される。

方法論１．ＴａｓｋＮｅｔ－掘削机タスク計画部
入力：タスク・ディスクリプション

、及び、環境観察値

出力：タスク・プリミティブ・シーケンス

４．離散プランニングから連続モーション
１つ以上の実施形態では、既存の階層タスク計画部は、ハイレベル・タスクを分解し、それに対応して仕様を有するタスク・プリミティブを生成する。例えば、トレンチ領域タスクは、図３に示すように、タスク・プリミティブに分割されてもよい。

１つ以上の実施形態では、生成されたプリミティブのシーケンスは、既存のプランニング・アルゴリズムに対して、生成されたプリミティブ・シーケンスは自然で直接的なモーション・プランニング問題である。詳細な仕様を有するこれらのタスク・プリミティブは、トラック生成のためにモーション計画部に給送される。次に、掘削機コントローラによって、関節運動、又は、掘削機のベース移動のトラックが実行される。

図４は本発明の一実施形態に係るタスク・プランニングを実行するプロセスを示す。主なタスク・ディスクリプション（例えば、

）と環境観察値

が与えられ、ＳＤＭモデル

（３２０、３２２、３２４、又は、３２６）は、最初にサブタスクを決定する（４０５）。

としてサブタスクに応答して、サブタスク・プランニング・モジュール

（３３０、又は、３３２）を呼び出し（４１０）、グローバル・フレームの目標点、又は、タイルへのトラックを生成する。目標点（

）に到達した後、プランニング・プロセス（４１５）は

に戻り、

に応答してローカル実行サブタスク（例えば、掘削動作ためのＰＤＭモデル

（３４０、３４２、３４４、又は、３４６）をトリガーするためのｅｘｃａｖａｔｅｔｉｌｅのサブタスク）を生成する（４２０）。

モデルは、サブタスクを完了するために、さまざまなタスク・プリミティブを生成し、完了時に

（サブタスク完了信号）を出力する。ｍｏｖｅ＿ｂａｓｅ３３１、接近３４１および掘削３４３などの各タスク・プリミティブの実行は、環境に影響を与え、それにより、観察値

および

に影響を与え、又は、観察値

および

を更新する。

は最終的にプロセス全体を終了（４２５）し、観察値

を監視しながら

（タスク完了信号）を設定する。

Ｄ．モデルの実施形態
１つ以上の実施形態では、第１のモデル（例えば、タイル掘削モデル（ＴＥＭ））と第２のモデル（例えば、セル掘削モデル（ＣＥＭ））の設計が提供されており、類似の構造が２つのモデルによって共有され、４つのサブモデル、即ちプランニング・コア

、サブタスク、又は、プリミティブ・デコーダ

、仕様デコーダ

、及び、終了デコーダ

を含んでもよい。

１つ以上の実施形態では、一般的な入力表現ｕが与えられ、モデルの一般的なワーク・フローは、式（５）で記述され得る。

（ただし、

は、サブタスク、又は、プリミティブであり、

は、仕様であり、

は、終了インジケータである）

各プランニング・モデルの詳細は、以下の説明に記載されている。

１．タイル掘削モデルの実施形態
図５は、現在に開示された実施形態に係るシステム・モデル構成を示す。１つ以上の実施形態では、タイル掘削プランニング・レベルで、タイル・マップを入力タスクに与えた場合、広い地形をカバーするために、グローバル・タイル・シーケンスを決定する必要がある。ＴＥＭ５１０は、最新のタイル・マップおよび処理されたタイルの履歴に基づき、掘削機が操作する必要がある次のタイルを予測することができる。具体的には、ＴＥＭ５１０は、タイル・マップ

５１１の入力と過去のサブタスク・シーケンス

５１２を採用できる。従って、ＴＥＭの入力は次のように表してもよい。

１つ以上の実施形態では、ＴＥＭ５１０は、環境表現５１１（例えば、タイル・マップ）を処理するために、複数の畳み込み層を含む第１のプランニング・コア５１３を含んでもよく、環境表現５１１から特徴５１４（例えば、潜在的な空間表現）を抽出する。抽出された特徴５１４は、さらなる処理のためにＴＥＭの他のサブモデルに伝送される。

１つ以上の実施形態では、ＴＥＭ５１０は、サブタスクｍｏｖｅ＿ｔｏ＿ｔｉｌｅ、又は、ｅｘｃａｖａｔｅｔｉｌｅを出力するサブタスク・デコーダ５１５と、サブタスクの仕様を出力する第１の仕様デコーダ５１６と、入力タスクが完了したか否かを示すように、タスク終了ステータスを出力する第１の終了デコーダ５１７とをさらに含みてもよい。

ＴＥＭがモーション・サブタスク（例えば、ｍｏｖｅ＿ｔｏ＿ｔｉｌｅ）を出力することに応答して、関連する仕様を、移動する次のタイルを示すために、４つの可能な方向｛左、右、下、上｝から選択できる。移動方向が与えされる場合、グローバル座標位置を計算して、掘削機のベースがどこに移動するかを指定できる。次に、パス・プランニング・モジュール５２０は、サブタスクｍｏｖｅ＿ｔｏ＿ｔｉｌｅの情報、関連する仕様、およびグローバル座標を使用して、掘削機のモーションを実行する。

１つ以上の実施形態では、ＴＥＭはサブタスクｅｘｃａｖａｔｅ＿ｔｉｌｅを出力することができる。このタイルの仕様は、このタイル内のセルのグリッド・マップです。次に、ＣＥＭ５３０は、サブタスクｅｘｃａｖａｔｅ＿ｔｉｌｅ、セル・マップ５３２の関連する仕様を使用して、タイルの掘削を実行する。

１つ以上の実施形態では、ＣＥＭ５３０は、セル・マップ５３２を処理して特徴５３４を抽出するための複数の畳み込み層を含む第２のプランニング・コア５３３を含んでもよい。

１つ以上の実施形態では、履歴情報（例えば履歴接近点）は、特徴を抽出するために、第２のプランニング・コア５３３によって使用されてもよい。

１つ以上の実施形態では、ＣＥＭ５３０は、所望のプリミティブを出力するプリミティブ・デコーダ５３５、プリミティブの仕様を出力する第２の仕様デコーダ５３６、およびサブタスク終了ステータスを出力してサブタスクが完了したか否かを示す第２の終了デコーダ５３７をさらに含むことができる。

１つ以上の実施形態では、トレーニング・データからのタイル処理順序を模倣するために、処理されたタイルの履歴レコード５１２も使用され得る。

１つ以上の実施形態では、タイル移動方向の過去のシーケンスを、タイル・マップから抽出された特徴を有するベクトルとして重畳する。カスケード・ベクトルは、複数の全接続の接続層に給送され、適切なサブタスクを生成する。

ＬＳＴＭに基づくアーキテクチャを使用するＮＰＩモデルとは異なり、本発明の１つ以上の実施形態では、履歴情報のスタッキングは全接続の接続層への入力として選択され、主に効率的なトレーニングおよび高速収束のためのものである。

２．セル掘削モデル実施形態
１つ以上の実施形態では、セル掘削モデルは、図５に示すように、その仕様を含んだタイル掘削サブタスクによってトリガーされる。

１つ以上の実施形態では、この仕様は、タイル掘削モデルによって切り取られた、タスク全体の地形高さマップの一部であるローカル地形高さマップである。ローカル地形マップが与えられた場合、セル掘削モデルは、接近と掘削のタスク・プリミティブの１つ以上のシーケンスを生成する。

１つ以上の実施形態では、仕様ａを有するサブタスクｅｘｃａｖａｔｅ＿ｔｉｌｅが与えられ、仕様ａおよび最後のタスク・プリミティブ接近仕様

に応じて、モデルの入力はローカル地形観測

で構成され、それは２次元のワン・ホット・ベクトルとして表される。

１つ以上の実施形態では、セル掘削モデルの入力は、以下のように表してもよい。

（ただし、ｈとｗはローカル地形観測値の高さと幅である）。

（５）に続いて、コア・モデルは、最初にそのような入力

で、ローカル・プランニング・ステータス

を生成する。次に、プリミティブ・デコーダは、ローカル・プランニング・ステータスで、プリミティブ選択

を生成する。プリミティブ選択

は、エンド・エフェクターを特定の点に接近するか、特定の深さで現在の場所を掘削する。仕様デコーダは、

を使用して、各プリミティブの仕様

を生成する。つまり、プリミティブのｌｏｃａｌ＿ｃｏｏｒｄｉｎａｔｅに接近すること、又は、プリミティブの深さを掘削することである。

１つ以上の実施形態では、出力は、ワン・ホット・ベクトルとして表すことができる。終了デコーダも

でサブタスクが完了したか否かを示すこと

を予測する。

図６は、ｈ＝４およびｗ＝３のローカル地形掘削の例を示す。ローカル地形掘削は、３×４＝１２のセル６２０を含むタイル６１０で実施される。タイルの高さと幅は、他の状況では変更することができる。

３．モデルトレーニング実施形態
１つ以上の実施形態では、ＳＤＭモデル（例えば、ＴＥＭ）およびＰＤＭモデル（例えば、ＣＥＭ）の両方が、実行トラックのシーケンスを用いて、監視のような方法でトレーニングする。サブタスク・トレーニング・データセットでＳＤＭモデルをトレーニングでき、プリミティブ・トレーニング・データセットを使用してＰＤＭモデルをトレーニングできる。トレーニング・プロセスを均一に記述することができように、一般的なシンボリック表現をモデルの入力と出力に使用する。

１つ以上の実施形態では、記録されたシーケンスは、入出力ペア

のリストであり、ただし、ｕ、ｙ_１、ｙ_２、及び、ｙ_３は、それぞれ（５）、（６）、及び、（７）によってＴＥＭとＣＥＭモデルに定義される。

１つ以上の実施形態では、トレーニングの目標は、正しい実行シーケンスのペアが生成される確率を最大化にすることであり、即ち、最適なモデル・パラメータ

が下式で定義される。

１つ以上の実施形態では、損失関数は、予測されたサブタスク／プリミティブ、仕様、終了ステータスと、記録されたトレーニング・データにおけるそれらとの間の誤差の重み付け和として定義されてもよい。損失関数は次のように表してもよい。

（ただし、

、

、及び、

は、パラメータであり、

、

、及び、

は、すべて交差エントロピー損失である。）

ＳＤＭの場合、損失関数は第１の損失関数と呼ばれ、ただし、損失項

は予測されたサブタスクと記録されたサブタスクとの間の誤差である。ＰＤＭの場合、損失関数は第２の損失関数と呼ばれ、ただし、損失項

は、予測されたプリミティブと、記録されたプリミティブとの間の誤差である。

Ｅ．いくつかの実験結果
なお、これらの実験、及び、結果は例示として提供され、１つ以上の実施形態で特定の条件下で行われた。したがって、これらの実験もその結果も、現在の発明の明細書の範囲を限定するものではない。

１つ以上の実験設定において、提案された方法の性能を評価するために、ＴＥＭモデル、及び、ＣＥＭモデルが最初にトレーニングされ、テストされた。ニューラル・タスク計画部ＴａｓｋＮｅｔの実施形態はさらに実施され、逆運動学に基づくアーム・モーション計画部と統合されました。システム全体を、様々な掘削シナリオについて３Ｄ物理に基づくシミュレータでさらにテストした。

１．データ収集とモデル実施例
１つ以上の実施例では、トラック発生器と呼ばれるカスタマイズ・プログラムを介して、ＴＥＭ、及び、ＣＥＭモデルのためのトレーニング・データ・シーケンスを生成した。

タイル掘削モデル・トラック発生器は、タイル・マップを管理するためのスケッチ・パッド、及び、タイル掘削シミュレーション・モジュールを含む。スケッチ・パッドは、ランダム化された行、及び、列でタイル・マップを初期化できる。スケッチ・パッドは、現在のタイル・ポインタをその隣接したタイルに変更するための「移動タイル」と、現在のタイルの掘削ステータスを変更するための「掘削タイル」（未処理から処理まで）と、を含むアプリケーション・プログラミング・インターフェース（ＡＰＩ）を有し、

１つ以上の設定では、現実の世界で観察される典型的な掘削順序をシミュレートした。広い作業領域に掘削機のオペレーターによって用いられる１つの一般的な横方向順序はジグザグ順序であり、図２に示される。トレーニング・データは、１０００個の異なる寸法のタイル・マップで構成され、合計７１０６６個のサンプルにおいて寸法は１２×１２であり、ただし、各サンプルは、現在のタイル・マップ、及び、次のサブタスクを含む観察フィードバック

として定義される。

１つ以上の実施例では、１２８のバッチ・サイズ、及び、学習率１ｅ－４がトレーニングに用いられた。図７Ａ～７Ｆは、本発明の一実施形態に係るスキップ・ラインを有するタイル・マップを示す。図７Ａ～７Ｆに示すように、ＴＥＭは、モデルを学習することで、非掘削ステータスとして明示的にマークされた行をスキップできる。

そのような行をスキップするために、１つ以上のモデル実施形態は、畳み込み層を利用してこのラインにおける各タイルが非掘削ステータスであることを知る。

図７Ａにおいて、灰色の行７１０はスキップし、濃い灰色のタイル７２０はタイル・マップの境界を示し、薄い灰色のタイル７３０のみが処理される必要がある。図７Ｂ～７Ｆは、トレーニングされたＴＥＭモデルが行をスキップし、掘削される必要がある薄い灰色の行のみを処理することができることを示す。さらに、学習されたＴＥＭモデルの実施形態は、トレーニング・データに示すように、ジグザグ順序でタイルをカバーできる。

一つ以上の実験設定では、ＴＥＭの汎化機能がさらに評価された。３０００個の異なる寸法タイル・マップが生成され、最大の寸法が３２ｘ３２であり、合計で１，１２６，９００個のサンプルが。各グリッドをランダムに生成し、掘削タイルと非掘削タイルの両方を含む。

このデータセットで一つ以上のＴＥＭ実施形態をトレーニングし、ランダムに生成されたタイル・マップにテストし、トレーニング・データセットにタイル・マップを存在しない。

図８Ａ～図８Ｆでは、本公開の実施形態に係るランダム化されたタイル・マップを示す。図８Ａ～図８Ｆに示すように、学習されたＴＥＭモデルの実施形態は、非掘削タイルをスキップして、残りのタイルをジグザグの順序で覆うことができる。

図８Ａにおいて、初期の３０×３０タイル・マップをランダムに生成する。ＴＥＭモデルは、すべての灰色のタイル８２０をスキップするとともに、すべての濃い灰色のタイル８１０を処理する必要があるのみである。

図８Ｂ～８Ｆは、ＴＥＭモデルがタイルをスキップし、掘削する必要があるタイルのみを処理できることを示めす。学習されたＴＥＭモデルの実施形態は、ジグザグの順序でタイルをカバーすることができる。このモデルは、トレーニング・データセットに存在しない、見られない、ランダムに生成されたタイル・マップに汎化できる。

セル掘削モデルは、合成データを生成するように、トラック発生器を用いて同様の方法でトレーニングすることもできる。別のスケッチ・パッドは、実行ＡＰＩで初期化され：「接近」と「掘削」。１つ以上の実験設定では、ＣＥＭモデルのトレーニング・データは、１０，０００個のシーケンスを含み、最大の寸法が６×６である。

モデルの実施形態では、学習率１ｅ－３、バッチ・サイズ１，０００でトレーニングした。現在の実施例では、発生器プログラムは論理に従って、最上位のセルに接近して最初に掘り、実際にはそうではない。しかしながら、トレーニングされたモデルの実施形態は、データ内の同じ論理に従い、掘削タスクを完了することができる。

２．いくつかの計画部の実施例とシミュレーションの結果
１つ以上の実験設定において、タスク計画部ＴａｓｋＮｅｔの実施形態は、トレーニングされたモデル「タイル掘削モデル」、及び、「セル掘削モデル」を用いて実施した。タスク計画部は、所望の深さの長方形の形状を掘削することなどのハイレベル・タスクを入力する。タスク計画部は、タスクを分解し、モーション計画部ための仕様を含んだモーション・プリミティブ・シーケンスを生成する。モーション計画部モデルは、仕様に基づいて実行可能なアームに基づくモーションを計算する。アームのモーションについては、逆運動学ソルバーで関節構成を計算する。

タスク計画部の実施形態では、３Ｄシミュレーション環境で実行されるシミュレーション掘削機にプリミティブを割り当てる。実験では、３．５トンの掘削機モデルを使用する。掘削機モデルは、長さ２．００ｍのアーム、長さ１．０５ｍのスティック、長さ０．６０ｍのバケット、高さ０．３５ｍのベースを含む。シミュレータは、粒子に基づく地形シミュレーションで掘削機の動的特性と地形との相互作用をシミュレートできる。

図９、及び、図１０は、リアルタイム３Ｄシミュレータでの２つの掘削シナリオの実験結果を示す。地形マップの変化は、様々なフェーズでのシステムの閉ループ実行中に示される。

図９に示されるトレンチ掘削シナリオについて、ＴａｓｋＮｅｔ計画部の実施形態は、合理的なタスク・プランニングを生成し、タスク・プランニングは、複数の掘削とダンプ操作でタイルを掘削するステップ、及び、ベースを所望の場所に後方に移動するステップを繰り返す。

図１０に示される広い地形領域での複数のトレンチ掘削の例については、計画部はハイレベルのタスクを階層的に分解し、ジグザグのカバー順序で実行可能なタスク・プランニングを計算することができる。要するに、これらの実験結果が示すように、ＴａｓｋＮｅｔ計画部の実施形態は、一般的な掘削タスクの分解戦略をデモンストレーション・データから学習して、掘削機に基づくモーションを減らし、全体的な掘削効率を確保する。

Ｆ．センサ・プラットフォームの実施形態
図１１は、本発明の一実施形態に係るタスク・プランニングの実現のための様々なセンサを含んだセンサ・プラットフォームを示す。図１１は、例えば、掘削機１１０５を使用するが、この例の実施例、及び、センサ・プラットフォームは、他の構成、農業、又は、産業応用、又は、フロントローダ、バックホーなどの車両に適用され得る。

掘削機１１０５は、図１１に示すように、環境、及び／又は、掘削機のステータスを検出するために、複数のセンサを含む。１つ以上の実施形態では、複数のセンサは、掘削機アーム１１１０のブーム、スティック、及び／又は、バケットの角度を測定するための１つ以上の傾斜計１１１６（たとえば、ＧｅｆｒａｎＧＩＢセンサ）と、ブーム、スティック、バケットの移動ように、油圧シリンダ１１１２の移動距離を測定するための１つ以上の距離センサ１１１４（たとえば、ＧｅｆｒａｎＧＳＦセンサ）と、油圧シリンダ用の１つ以上の油圧センサ１１１８（例えばＮＡＧＡＮＯ－ＫｅｉｋＫＭ１０－１Ｃ４センサ）と、キャビン１１０８の回転を測定するための１つ以上のエンコーダ１１０７（例えば、ＬＥＩＮＥ－ＬＩＮＤＥＩＳＡ６０８エンコーダ）と、を含んでもよい。

１つ以上の実施形態において、各油圧シリンダは、油圧監視のための２つの油圧センサを有してもよい。

１つ以上の実施形態では、複数のセンサは、環境センサ、及び、１つ以上の視覚センサ１１２２（たとえば、１つ以上のステレオカメラ）と、ＧＰＳ、又は、慣性測定セル（ＩＭＵ）センサと、又は、掘削機１１０５の方向、及び、速度を計算するために用いられる他のＵＡＶセンサと、を含んでもよい制御コンポーネント１１２０をさらに含んでもよい。

１つ以上の実施形態では、環境センサ、及び、制御コンポーネント１１２０は、タスク・プランニングのための１つ以上のコマンド・シーケンスの非一時的な（不揮発性）コンピュータ可読媒体を含むメモリを有するコンピュータ、又は、制御パネルを含んでもよい。

１つ以上の実施形態では、タスクの実現について、知覚フェーズ１１３０で、１つ以上の環境ステータス、及び、１つ以上の掘削機ステータスを受信する。環境センサ、及び、制御コンポーネント１１２０内の複数のセンサで、１つ以上の環境ステータスを取得し、画像、又は、点群として格納することができる。掘削機１１０５に組み込まれた複数のセンサ、例えば、油圧シリンダ距離センサ、油圧センサで、１つ以上の掘削機ステータスを取得することができる。環境ステータスと掘削機ステータスを受信すると、計画部フェーズ１１４０で、タスク・プランニングを実施する。

１つ以上の実施形態では、タスク・プランニングは、例えば、シャーシ・パスをプランニングするモーション・サブタスク、又は、例えば、アームのトラックをプランニングするローカル実行サブタスクである。プランニングされたサブタスクは、実現するために、コントローラ１１５０に伝送される。

１つ以上の実施形態では、コントローラは、プランニングされたシャーシ・パスに従って、掘削機のシャーシを移動し、又は、プランニングされたアーム・トラックに従って、アームを移動するコマンドを出力することができる。

Ｇ．いくつかの結論
本発明では、自律走行車両（例えば、掘削機）のための新規のニューラル掘削タスク計画部－ＴａｓｋＮｅｔの実施形態を開示し、開示されたニューラル・タスク計画部の実施形態は、２つの学習に基づくニューラル・ネットワーク・モデルを含む。第１のモデルは、タイル・レベルの掘削戦略を学習するために設計されたタイル掘削モデル（ＴＥＭ）で、第２のモデルは、適当な掘削セルを決定するために設計されたセル掘削モデル（ＣＥＭ）である。

１つ以上の実施形態では、トラック発生器でニューラル・タスク・モデルをトレーニングし、これらのトレーニングされたモデルでＴａｓｋＮｅｔ計画部を実現する。計画部は、閉ループを実行するために、３Ｄリアルタイムの物理に基づく地形と掘削機シミュレータでテストされる。実験結果は、ＴａｓｋＮｅｔ計画部の実施形態が一般的なタスク分解戦略を効果的に学習し、様々な掘削タスクのもっともらしいタスク・プランを生成できることを示す。

両方のモデルのコアを共有する２つのニューラル・プログラミング・モデルについては、当業者は、本発明の実施形態を容易に修正、又は、変更することができ、それにより、２つのモデルが最終的に統合され、より優れた汎化能力と、より多くのタスク、サブタスク、及び、タスク・プリミティブと組み込む能力と、を有し得ることを認識する。また、当業者は、本明細書の実施形態が、現実の世界の専門家の操作データを収集して現実の掘削機プラットフォームでテスとするように、拡張され得ることを認識するべきである。

Ｈ．システムの実施形態
本発明の一実施形態では、１つ以上の情報処理システム／コンピューティング・システムを含んでもよいし、又は、１つ以上の情報処理システム／コンピューティング・システムで実施してもよい。コンピューティング・システムには、計算、運算、決定、分類、処理、伝送、受信、検索、発信、ルーティング、切り替え、記憶、表現、通信、マニフェスト（ｍａｎｉｆｅｓｔ）、検出、記録、再現、処理、又は、あらゆる形式の情報、インテリジェンス、又は、データとして構成される任意の手段、又は、手段の集合が含まれ得る。例えば、コンピューティング・システムは、パーソナル・コンピュータ（例えば、ラップトップ・コンピュータ）、タブレット・コンピュータ、タブレット、パーソナル・デジタル・アシスタント（ＰＤＡ）、スマート・フォン、スマート・ウォッチ、スマート・パッケージ、サーバ（例えば、ブレード・サーバ、又は、ラック・サーバ）、ネットワーク・ストレージ・デバイス、カメラ、又は、その他の適切なデバイスであってもよいし、又は、それらを含んでもよい。サイズ、形状、パフォーマンス、機能、価格が変更することができる。コンピューティング・システムは、ランダム・アクセス・メモリ（ＲＡＭ）、１つ以上の処理リソース（中央処理装置（ＣＰＵ）、又は、ハードウェア、又は、ソフトウェア制御ロジック）、ＲＯＭ、及び／又は、他のタイプのメモリを含んでもよい。コンピューティング・システムの追加コンポーネントには、１つ以上のディスク・ドライブと、外部デバイスと通信するための１つ以上のネットワーク・ポートと、様々な入出力（Ｉ／Ｏ）デバイス（例えば、キーボード、マウス、タッチ・スクリーン、及び／又は、ビデオ・ディスプレイ）と、を含んでもよい。コンピューティング・システムは、様々なハードウェア・コンポーネント間で通信を伝送できるように構成される１つ以上のバスをさらに含んでもよい。

図１２は、本発明の一実施形態に係るコンピューティング・デバイス／情報処理システム（又は、コンピューティング・システム）の簡略ブロック図を示す。コンピューティング・システムは、異なる構成であってもよいし、異なるコンポーネントを含んでもよい。図１２に示されるコンポーネントにより、多い、又は、少ない、コンポーネントを含んでもよい。システム１２００に示される機能は、コンピューティング・システムをサポートする様々な実施形態として構成されることが理解されるべきである。

図１２に示すように、コンピューティング・システム１２００は、コンピューティング・リソースを提供し、コンピュータを制御する１つ以上の中央処理装置（ＣＰＵ）１２０１を含む。ＣＰＵ１２０１は、マイクロ・プロセッサなどを有されてもよく、１つ以上のグラフィックス処理セル（ＧＰＵ）１２１９、及び／又は、数学的計算のための浮動小数点コ・プロセッサを含んでもよい。システム１２００は、ランダム・アクセス・メモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、又は、その両方の形態であってもよいシステム・メモリ１２０２をさらに含んでもよい。

図１２に示すように、複数のコントローラ、及び、周辺機器が提供されてもよい。入力コントローラ１２０３は、キーボード、マウス、タッチ・スクリーン、及び／又は、スタイラスなどの様々な入力デバイス１２０４へのインターフェースを表す。コンピューティング・システム１２００は、１つ以上の記憶装置１２０８とインターフェースするためのメモリ・コントローラ１２０７をさらに含んでもよい。記憶装置のそれぞれが、記憶媒体（磁気テープ、又は、ディスク）、又は、光学媒体（オペレーティング・システム、ユーティリティ、アプリケーション・プログラムのコマンドを記録するために使用されてもよく、これらは、本発明の様々な態様を実施するプログラムの実施形態を含んでもよい）を含む。記憶装置１２０８は、さらに、処理されたデータ、又は、本発明に従って、処理対象であるデータを記憶するために用いられてもよい。システム１２００は、ディスプレイ・デバイス１２１１へのインターフェースを提供するためのディスプレイ・コントローラ１２０９も含んでもよい。ディスプレイ・デバイス１２１１は、陰極線管（ＣＲＴ）、薄膜トランジスタ（ＴＦＴ）ディスプレイ、有機発光ダイオード、エレクトロ・ルミネセント・パネル、プラズマ・パネル、又は、他のタイプのディスプレイであってもよい。コンピューティング・システム１２００は、１つ以上の周辺機器１２０６のための１つ以上の周辺機器コントローラ、又は、インターフェース１２０５をさらに含んでもよい。周辺機器の例は、１つ以上のプリンタ、スキャナ、入力デバイス、出力デバイス、センサなどを含んでもよい。通信コントローラ１２１４は、１つ以上の通信デバイス１２１５とインターフェースすることができ、これにより、システム１２００が、様々なネットワーク（インターネット、クラウド・リソース（たとえば、イーサネット・クラウド、ファイバー・チャネル・オーバー・イーサネット（ＦＣｏＥ）／データ・センター・ブリッジング（ＤＣＢ）クラウドなど）、ローカル・エリア・ネットワーク（ＬＡＮ）、ワイド・エリア・ネットワーク（ＷＡＮ）、ストレージ・エリア・ネットワーク（ＳＡＮ）を含む）のいずれかのネットワーク、又は、任意の適切な電磁搬送信号（赤外線信号を含む）を介してリモート・デバイスに接続できるようになる。

示されたシステムでは、すべての主なシステム・コンポーネントは、バス１２１６に接続することができ、バスは複数の物理バスを表すことができる。ただし、様々なシステム・コンポーネントが、互いに物理的に接近してもよいし、接近しなくてもよい。例えば、入力データ、及び／又は、出力データは、１つの物理的な場所から別の場所にリモートで送信されてもよい。また、本発明の様々な態様を実施するプログラムは、ネットワークを介して、遠隔位置（例えば、サーバー）からアクセスすることができる。そのようなデータ、及び／又は、プログラムは、様々な機械可読媒体のいずれかを介して伝送することができ、ハード・ディスク、フロッピー・ディスク、及び、磁気テープなどの磁気媒体と、ＣＤ－ＲＯＭやホログラフィック・デバイスなどの光学媒体と、光磁気媒体と、特定用途向け集積回路（ＡＳＩＣ）、プログラマブル・ロジック・デバイス（ＰＬＤ）、フラッシュ・メモリ・デバイス、ＲＯＭ、及び、ＲＡＭデバイスなどのプログラム・コードを格納、又は、格納、及び、実行するように特別に構成されたハードウェア・デバイスとを含むがこれらに限定されない。

本発明の一態様は、１つ以上のプロセッサ、又は、処理セルに用いて、ステップを実行させるコマンドで、１つ以上の非一時的なコンピュータ可読媒体に符号化させることができる。なお、１つ以上の非一時的なコンピュータ可読媒体は、揮発性、及び、不揮発性メモリを含むべきである。なお、ハードウェア実施、又は、ソフトウェア／ハードウェア実施を含む、代替実施が可能である。ハードウェア実施の機能は、ＡＳＩＣ、プログラマブル・アレイ、デジタル信号処理回路などで実現できる。したがって、特許請求の範囲の「手段」という用語は、ソフトウェアとハードウェアの両方の実施を含むことを旨とする。同様に、本明細書に用いられる「コンピュータ可読媒体、又は、媒体」という用語は、その上に実施されるコマンドのプログラムを有するソフトウェア、及び／又は、ハードウェア、あるいは、それらの組み合わせを含む。これらの代替実施形態を考える場合、図面、及び、説明は、当業者が必要な処理を実行するように、プログラム・コード（すなわち、ソフトウェア）を作成し、及び／又は、回路（すなわち、ハードウェア）を製造するために必要とする機能情報を提供することが理解されるべきである。

なお、本発明の実施形態は、さらに様々なコンピュータ実施操作を実行するためのコンピュータ・コードを有する非一時的有形のコンピュータ可読媒体を含んだコンピュータ製品に関する。媒体、及び、コンピュータ・コードは、本発明の目的のために特に設計、及び、構築されたものであってもよく、又は、それらは、関連分野の当業者に既知、又は、利用可能な種類のものであってもよい。有形のコンピュータ可読媒体の例としては、ハード・ディスク、フロッピー・ディスク、及び、磁気テープなどの磁気媒体と、ＣＤ－ＲＯＭやホログラフィック・デバイスなどの光学媒体と、光磁気媒体と、特定用途向け集積回路（ＡＳＩＣ）、プログラマブル・ロジック・デバイス（ＰＬＤ）、フラッシュ・メモリ・デバイス、ＲＯＭ、及び、ＲＡＭデバイスなどのプログラム・コードを格納、又は、格納、及び、実行するように特別に構成されたハードウェア・デバイスと、を含むがこれらに限定されない。コンピュータ・コードの例には、マシン・コード（例えばコンパイラによって生成されるコード）、及び、インタプリタでコンピュータによって実行されるより高いレベルのコードを含むファイルが含まれる。本発明の実施形態は、処理デバイスによって実行されるプログラム・モジュールに、機械実行可能コマンドとして、全体的、又は、部分的に実施されてもよい。プログラム・モジュールの例としては、ライブラリ、プログラム、ルーチン、オブジェクト、コンポーネント、及び、データ構造が含まれる。分散コンピューティング環境では、プログラム・モジュールは、ローカル、リモート、又は、その両方の設定において物理的に配置できる。

当業者は、コンピューティング・システム、又は、プログラミング言語が本発明の実施に重要ではないことを認識するべきである。当業者は、さらに上記のいくつかの要素が、物理的、及び／又は、機能的にサブ・モジュールに分割され得るか、又は、一緒に組み合わされてもよいと認識するべきである。

当業者は、前述の例、及び、実施形態が例示的であり、本発明の範囲を限定しないと理解されるべきである。当業者が明細書を読んで図面を検討する場合、当業者にとって明らかであるすべての置換、強化、同等、組み合わせ、及び、改善は、本発明の真の精神、及び、範囲内に含まれることを旨とする。なお、特許請求の範囲の要素は、異なって配置され、複数の従属、構成、組み合わせを含んでもよい。

Claims

自律型作業車両に適用される、タスクを実行するためにタスク・プランニング・ネットワークをトレーニングするためのコンピュータ実行方法であって、
第１の記録された、いずれも環境観察データを含む入力と記録された出力を有する入出力ペア・シーケンスを含むサブタスク・トレーニング・データセットを用いて、タスクをサブタスクに分割するためのサブタスク決定モデルをトレーニングするステップであって、前記環境観察データは、前記タスクに関連する環境を感知したデータであり、前記サブタスク決定モデルは、第１のプランニング・コア、サブタスク・デコーダ、第１の仕様デコーダ、及び、第１の終了デコーダをサブモデルとして含む、ステップと、
第２の記録された、ローカル環境観察データを含む入力と記録された出力を有する入出力ペア・シーケンスを含むプリミティブ・トレーニング・データセットを用いて、サブタスクを実行可能なタスク・プリミティブに分割するためのプリミティブ決定モデルをトレーニングするステップであって、前記ローカル環境観察データは、サブタスクに関連する環境を感知したデータであり、第２のプランニング・コア、プリミティブ・デコーダ、第２の仕様デコーダ、及び、第２の終了デコーダをサブモデルとして含む、ステップと、を含み、
前記サブタスク決定モデルのプランニングは、
少なくとも前記環境観察データに基づき、前記第１のプランニング・コアを用いて、特徴を抽出することと、
少なくとも前記環境観察データから抽出された前記特徴に基づき、前記サブタスク・デコーダを用いて、予測サブタスクを生成することと、
少なくとも前記環境観察データから抽出された前記特徴に基づき、前記第１の仕様デコーダを用いて、前記予測サブタスクに対応する第１の予測仕様を生成することと、
少なくとも前記環境観察データから抽出された前記特徴に基づき、前記第１の終了デコーダを用いて、前記タスクが完了したか否かを示す第１の予測終了ステータスを生成することと、
前記第１の記録された入出力ペア・シーケンス、前記予測サブタスク、前記第１の予測仕様、及び、前記第１の予測終了ステータスに基づき、第１の損失関数を用いて、前記サブタスク決定モデルをトレーニングすることと、を含み、
第１の損失は、前記第１の記録された入出力ペア・シーケンスにおける、前記予測サブタスク、前記第１の予測仕様、前記第１の予測終了ステータスと、対応する記録されたサブタスク、記録された仕様、記録された終了ステータスと、の間の誤差の重み付け和であり、
前記プリミティブ決定モデルのプランニングは、
少なくとも前記ローカル環境観察データに基づき、前記第２のプランニング・コアを用いて、特徴を抽出することと、
少なくとも前記ローカル環境観察データから抽出された特徴に基づき、前記プリミティブ・デコーダを用いて、予測プリミティブを生成することと、
少なくとも前記ローカル環境観察データから抽出された特徴に基づき、前記第２の仕様デコーダを用いて、前記予測プリミティブに対応する第２の予測仕様を生成することと、
前記第２の終了デコーダを用いて、前記サブタスクが完了したか否かを示す第２の予測終了ステータスを生成することと、
前記第２の記録された入出力ペア・シーケンス、前記予測プリミティブ、前記第２の予測仕様、及び、前記第２の予測終了ステータスに基づき、第２の損失関数を用いて、前記プリミティブ決定モデルをトレーニングすることと、
前記タスク・プランニング・ネットワークの第１のフェーズとしてのトレーニングされたサブタスク決定モデルと、前記タスク・プランニング・ネットワークの第２のフェーズとしてのトレーニングされたプリミティブ決定モデルと、を統合することによって、トレーニングされたタスク・プランニング・ネットワークを生成することと、を含み、
第２の損失は、前記第２の記録された入出力ペア・シーケンスにおける、前記予測プリミティブ、前記第２の予測仕様、前記第２の予測終了ステータスと、対応する記録されたサブタスク、記録された仕様、記録された終了ステータスと、の間の誤差の重み付け和である、
コンピュータ実行方法。
前記タスク・プランニング・ネットワークは、さらに、前記サブタスク決定モデルに接続し、前記サブタスク決定モデルから出力され、モーション・サブタスクであるサブタスク毎に応答し、前記モーション・サブタスクを実行するためのトラックを決定するパス決定モジュールを含む、
ことを特徴とする請求項１に記載のコンピュータ実行方法。
前記環境観察データから抽出された前記特徴は、潜在的な空間表現である、
ことを特徴とする請求項１に記載のコンピュータ実行方法。
前記第１のプランニング・コアと前記第２のプランニング・コアは、前記プリミティブ決定モデルと前記サブタスク決定モデルによって共有される、
ことを特徴とする請求項１に記載のコンピュータ実行方法。
前記ローカル環境観察データは、前記環境観察データから切り取られる、
ことを特徴とする請求項１に記載のコンピュータ実行方法。
自律型作業車両に適用される、タスク・プランニング・ネットワークを用いて実行するためのコンピュータ実行方法であって、
前記タスク・プランニング・ネットワークは、第１のフェーズとしてタスクをサブタスクに分割するためのサブタスク決定モデルと、第２のフェーズとしてサブタスクを実行可能なタスク・プリミティブに分割するためのプリミティブ決定モデルとが統合されたものであり、
前記コンピュータ実行方法は、
少なくともタスク・ディスクリプションと前記タスクに関連する環境を感知したデータである環境観察データを与え、サブタスク決定モデルを用いて、サブタスク、前記サブタスクに関連する仕様、及び、前記タスクが完了したか否かを示すタスク終了ステータスを出力するステップと、
前記タスク終了ステータスがタスクの完了を示すまで、
前記サブタスクがモーション・サブタスクであることに応答して、
サブタスク・プランニング・モジュールを呼び出して、グローバル・フレームにおける目標点へのトラックを生成し、前記目標点に到達した後に、前記サブタスク決定モデルに戻ることと、
前記サブタスクがローカル実行サブタスクであることに応答して、
少なくとも前記ローカル実行サブタスクとサブタスクに関連する環境を感知したデータであるローカル環境観察データに基づき、プリミティブ決定モデルを用いて、一つ以上のタスク・プリミティブを生成し、
前記一つ以上のタスク・プリミティブを実行し、前記ローカル環境観察データと前記環境観察データを更新し、
前記ローカル実行サブタスクを完了した後に、前記サブタスク決定モデルに戻ることと、
を繰り返して実行するステップと、
を含む、コンピュータ実行方法。
前記サブタスク決定モデルと前記プリミティブ決定モデルは、予めトレーニングされる、
ことを特徴とする請求項６に記載のコンピュータ実行方法。
前記サブタスク決定モデルは、
前記タスクが与えられた場合、前記環境観察データから特徴を抽出する第１のプランニング・コアと、
前記第１のプランニング・コアに接続し、少なくとも前記環境観察データから抽出された前記特徴に基づき、前記サブタスクを生成するサブタスク・デコーダと、
前記第１のプランニング・コアに接続し、少なくとも前記環境観察データから抽出された前記特徴に基づき、前記サブタスクに対応する仕様を生成する第１の仕様デコーダと、
前記第１のプランニング・コアに接続し、前記タスクが完了したか否かを示す前記タスク終了ステータスを生成する第１の終了デコーダと、
をサブモデルとして含む、
ことを特徴とする請求項６に記載のコンピュータ実行方法。
前記サブタスク・デコーダが少なくとも前記環境観察データから抽出された前記特徴に基づき前記サブタスクを生成するステップは、さらに、
過去のモーション方向シーケンスを、前記環境観察データから抽出された前記特徴を有するベクトルに重畳して、カスケード・ベクトルを形成するステップと、
前記カスケード・ベクトルを前記サブタスク・デコーダにおける一つ以上の全接続の接続層に給送し、前記サブタスクを生成するステップと、
を含む、
ことを特徴とする請求項８に記載のコンピュータ実行方法。
前記プリミティブ決定モデルは、
前記サブタスク決定モデルから出力された前記サブタスクが与えられた場合、少なくとも前記ローカル環境観察データを含む入力を用いて特徴を抽出する第２のプランニング・コアと、
前記第２のプランニング・コアに接続し、少なくとも前記ローカル環境観察データから抽出された特徴に基づき、前記プリミティブを生成するプリミティブ・デコーダと、
前記第２のプランニング・コアに接続し、少なくとも前記ローカル環境観察データから抽出された特徴に基づき、前記プリミティブに対応する仕様を生成する第２の仕様デコーダと、
前記第２のプランニング・コアに接続し、前記サブタスクが完了したか否かを示すサブタスク終了ステータスを生成する第２の終了デコーダと、
を含む、
ことを特徴とする請求項８に記載のコンピュータ実行方法。
前記第２のプランニング・コアへの入力は、さらに、最後のプリミティブに関連する仕様を含む、
ことを特徴とする請求項１０に記載のコンピュータ実行方法。
前記第１のプランニング・コアと前記第２のプランニング・コアは、前記プリミティブ決定モデルと前記サブタスク決定モデルによって共有される、
ことを特徴とする請求項１０に記載のコンピュータ実行方法。
前記ローカル環境観察データは、前記環境観察データから切り取られる、
ことを特徴とする請求項１０に記載のコンピュータ実行方法。
自律型作業車両に適用される、タスク・プランニング・ネットワークを用いてタスク・プランニングを実行するためのコンピュータ実行方法であって、
タスクと、前記タスクに関連する環境を感知したデータである環境観察データをトレーニングされたタスク・プランニング・ネットワークに入力するステップであって、
前記トレーニングされたタスク・プランニング・ネットワークは、第１のフェーズとしてタスクをサブタスクに分割するためのサブタスク決定モデルと、第２のフェーズとしてサブタスクを実行可能なタスク・プリミティブに分割するためのプリミティブ決定モデルとが統合されたものであり、
前記サブタスク決定モデルは、
前記タスクが与えられた場合、前記環境観察データから特徴を抽出する第１のプランニング・コアと、
前記第１のプランニング・コアに接続し、少なくとも前記環境観察データから抽出された前記特徴に基づき、サブタスクを生成するサブタスク・デコーダと、
前記第１のプランニング・コアに接続し、少なくとも前記環境観察データから抽出された前記特徴に基づき、前記サブタスクに対応する仕様を生成する第１の仕様デコーダと、
前記第１のプランニング・コアに接続し、少なくとも前記環境観察データに基づき、前記タスクが完了したか否かを示すタスク終了ステータスを生成する第１の終了デコーダと、をサブモデルとして含み、
前記プリミティブ決定モデルは、
前記サブタスク決定モデルから出力され、ローカル実行サブタスクである前記サブタスクに応答し、少なくとも前記サブタスクに関連するローカル環境観察データを含む入力を用いて、特徴を抽出する第２のプランニング・コアと、
前記第２のプランニング・コアに接続し、少なくとも前記ローカル環境観察データから抽出された特徴に基づき、一つ以上のプリミティブを生成するプリミティブ・デコーダと、
前記第２のプランニング・コアに接続し、少なくとも前記ローカル環境観察データから抽出された特徴に基づき、前記プリミティブに対応する仕様を生成する第２の仕様デコーダと、
前記第２のプランニング・コアに接続し、前記サブタスクが完了したか否かを示すサブタスク終了ステータスを生成する第２の終了デコーダと、を含む、プリミティブ決定モデルと、をサブモデルとして含む、ステップと、
前記一つ以上のプリミティブを実行すると、前記ローカル環境観察データと前記環境観察データを更新するステップと、
前記タスク終了ステータスは前記サブタスクが完了したことを示す場合、前記サブタスク決定モデルにより前記タスク・プランニングを終了するステップと、
を含む、コンピュータ実行方法。
前記第２のプランニング・コアへの入力は、さらに、最後のプリミティブに関連する仕様を含む、
ことを特徴とする請求項１４に記載のコンピュータ実行方法。
前記ローカル環境観察データは、前記環境観察データから切り取られる、
ことを特徴とする請求項１４に記載のコンピュータ実行方法。
前記サブタスク・デコーダが、少なくとも前記環境観察データから抽出された前記特徴に基づき、サブタスクを生成するステップは、
過去のモーション方向シーケンスを、前記環境観察データから抽出された前記特徴を有するベクトルに重畳して、カスケード・ベクトルを形成するステップと、
前記カスケード・ベクトルを前記サブタスク・デコーダにおける一つ以上の全接続の接続層に給送し、前記サブタスクを生成するステップと、
を含む、
ことを特徴とする請求項１４に記載のコンピュータ実行方法。
前記第１のプランニング・コアと前記第２のプランニング・コアは、前記プリミティブ決定モデルと前記サブタスク決定モデルによって共有される、
ことを特徴とする請求項１４に記載のコンピュータ実行方法。
コンピュータ・プログラムであって、プロセッサにより実行された場合に、請求項１乃至５の何れか一項に記載のコンピュータ実行方法を実現させる、
コンピュータ・プログラム。
コンピュータ・プログラムであって、プロセッサにより実行された場合に、請求項６乃至１３の何れか一項に記載のコンピュータ実行方法を実現させる、
コンピュータ・プログラム。
コンピュータ・プログラムであって、プロセッサにより実行された場合に、請求項１４乃至１８の何れか一項に記載のコンピュータ実行方法を実現させる、
コンピュータ・プログラム。