JP2011503638A

JP2011503638A - カーナビゲーションシステムのための自由会話命令分類の改良

Info

Publication number: JP2011503638A
Application number: JP2010531320A
Authority: JP
Inventors: グプタ、ラケシュ
Original assignee: Honda Motor Co Ltd
Current assignee: Honda Motor Co Ltd
Priority date: 2007-10-26
Filing date: 2008-10-27
Publication date: 2011-01-27
Also published as: US20090112605A1; WO2009055819A1; US8359204B2

Abstract

【課題】自由フォーマット命令を、車両ナビゲーション命令に正確に関連付ける。
【解決手段】本発明は、自由会話命令を、定義済命令のセットからの１又は複数の定義済命令に関連付けるシステム及び方法である。定義済命令のセットが格納され、定義済命令のそれぞれに関連付けられた代替フォームが外部データソースから検索される。代替フォームが定義済命令の言い換え語を表すように、外部データソースは、複数のソースから、定義済命令のそれぞれに関連付けられた代替フォームを受信する。定義済命令からの単語、及び、ベクトル表示のような定義済命令の代替フォームが、定義済命令ごとに生成される。受信された会話データと定義済命令の各表示との間の類似度が計算され、会話データは、会話データとの類似度が最高である表示を有する定義済命令として分類される。
【選択図】図１

Description

（関連出願の参照）
本出願は、２００７年１０月２６日付けの米国特許仮出願第６０／９８３，０６５号、及び２００７年１２月２０日付けの米国特許仮出願第６１／０１５，５１５号を基礎とする優先権を米国特許法１１９条（ｅ）に基づき主張し、これらの出願はその全体がここに引用される。

本発明は、一般的には会話データの分類に関する。より具体的には、車両ナビゲーションシステムによる会話データの分類を改良するために外部データを用いるシステム及び方法に関する。

車両ナビゲーションシステム及び携帯ナビゲーションシステムは、徐々に一般的になりつつある。これらのナビゲーションシステムのおかげで、ユーザは、様々な場所への方向を受信することができ、また、空調制御システム又は音声システムのような他の車両システムと交信することができる。今日、多くの車両ナビゲーションシステムは、会話データを受信し、受信された会話データに応じて動作を実行するようになっている。よって、命令を言葉として話すことによって、搭乗者は、車両ナビゲーションシステムに対して、最も近いガソリンスタンド又は言葉として話された住所のような場所を発見すること、車内温度を調節すること、又は、車内で現在再生されているラジオ放送局を変更することを促すことができる。

しかしながら、従来の車両ナビゲーションシステムは、“最も近いＡＴＭを探せ”又は“次のラジオ局”のような、特定の数の定義済命令を認識するに留まる。これらの定義済命令は、特定の文法フォーマットのような特定のフォーマットを有するので、ユーザは、当該定義済命令の当該特定のフォーマットを記憶して車両ナビゲーションシステムと交信する必要がある。しかしながら、多くのユーザには、従来の車両ナビゲーションシステムによって認識される定義済命令のリストを調べる時間的余裕はなく、従来の車両ナビゲーションシステムによって認識される定義済命令のフォーマットを記憶する時間はさらに少ない。

多くのユーザは、試行錯誤又はディーラの実演説明に頼って従来の車両ナビゲーションシステムの使用方法を学習するので、多くのユーザは、従来の車両ナビゲーションシステムによって認識される命令を知らず、従来の車両ナビゲーションシステムを使用していると直ぐにストレスが溜まる。従来の車両ナビゲーションシステムについて訓練することは限られているとはいっても、車両ナビゲーションシステムが思った通り稼動しないと、ユーザは、使用し始めて間もないうちに、従来の車両ナビゲーションシステムを使用することをやめてしまうことがよくある。

さらに、従来の車両ナビゲーションシステムによって認識される定義済命令は特定のフォーマットを有しており、当該車両ナビゲーションシステムによって要求される当該特定のフォーマットをユーザは通常知らない。したがって、従来の車両ナビゲーションシステムによって受信される会話データのうちの一般的に半分程度しか、所望の動作を起こすための定義済命令として識別されない。従来の車両ナビゲーションシステムによって受信される会話データのうちの四分の一は誤って解釈され、車両ナビゲーションシステムがユーザ所望の動作以外の動作を実行したり、又は全く動作を実行しなかったりする原因となる。受信される会話データの残りの四分の一は、一般的に、従来の車両ナビゲーションシステムに識別されないので、車両ナビゲーションシステムによって取られるべき動作を起こすことはない。このように、従来の車両ナビゲーションシステムが特定のフォーマットを有する会話データを識別する能力は限定されており、従来の車両ナビゲーションシステムが、ユーザが提供する会話データをエラーとして分類してしまう比率又はそもそも認識できない比率は高く、ユーザの従来の車両ナビゲーションシステムに対する不満に繋がる。

以上のように、自由フォーマット命令を、対応する車両ナビゲーション命令に正確に関連付けるシステム及び方法が必要となっている。

（発明の要約）
本発明は、様々なフォーマットの会話命令、すなわち“自由会話命令”を受信し、当該自由会話命令を、定義済命令のセットからの定義済命令に関連付けるシステム及び方法を提供する。定義済命令のセットが格納されており、当該定義済命令のそれぞれに関連付けられた代替フォームが、外部データソースから検索される。ある実施形態においては、外部データソースは、複数のユーザや複数のソースから、定義済命令のそれぞれに関連付けられた代替フォームを受信するので、代替フォームは、言い換え語、すなわち、定義済命令を伝える代替方法を表す。ベクトル表示のような表示が、定義済命令ごとに生成される。表示は、定義済命令を有する単語、及び、定義済命令の代替フォームを有する単語を含む。このことによって、定義済命令の表示は、１又は複数のユーザによって定義済命令に関連付けられた異なる単語を含むことが可能になる。受信された会話データと定義済命令のそれぞれの表示との間の類似度が計算され、会話データが、対応する表示が最高の類似度を有する定義済命令に関連付けられる。こうして、車両ナビゲーションシステムは、会話データに関連付けられた定義済命令に関連付けられた動作を実行することが可能になる。

本明細書に記述されている特徴及び利点は、限定的なものではなく、図面、明細書及び特許請求の範囲を見れば、当業者には、追加的な特徴及び利点が明らかになる。さらに、本明細書中で使用される用語は、主として意味の取りやすさ及び教示目的から選択されており、本発明の主旨を限定するために選択されているものではないことは当然である。

本発明のある実施形態が動作する、コンピューティング機器を示す図である。本発明のある実施形態に係る、車両ナビゲーションシステムの語彙を拡張するシステムのブロック図である。本発明のある実施形態に係る、識別可能な会話データの語彙拡張のための方法を示すフローチャートである。本発明のある実施形態に係る、受信された会話命令を分類する方法を示すフローチャートである。

本発明の好適な一実施形態を、図を参照しつつ説明する。複数の図に跨って同様の参照番号が記される場合、それらは同一の又は機能的に類似した構成要素を意味する。参照番号の最も左の数字は、当該参照番号が初めて使用された図の番号に対応している。

本明細書において、“ある実施形態”又は“一実施形態”と言う場合は、本発明の少なくとも１つの実施形態に、その実施形態に関連して記述される１つの特徴又は構造が含まれていることを意味する。本明細書のあちこちに“ある実施形態においては”という語が出現しても、必ずしも同一の実施形態を指しているわけではない。

後記する詳細説明のいくつかの部分は、アルゴリズム用語や、コンピュータメモリ内のデータビット作業を示す象徴的な表現による。これらのアルゴリズム的な説明や表現は、情報処理分野の当業者が、自らの業績の要旨を、同分野の他の当業者に最も効率的に伝えるために用いる手段である。アルゴリズムとは、ここでは、そして一般的にも、ある所望の結果に至る複数のステップ（指示）の首尾一貫したシーケンスのことを言う。ステップとは、物理量に対する物理的操作を要求するステップのことである。通常、必ずしも必要条件ではないが、それらの数値は、記憶され、転送され、合成され、比較されかつ操作され得る、電子的、磁気的又は光学的信号の形を取る。これらの信号のことを、ビット、値、要素、シンボル、文字、語又は番号等と呼ぶことが主として用語の共通化の理由から便宜である。さらに、物理量に対する物理的操作を要求するステップの配列のうちいくつかのものは、一般性を失うことなく、モジュール又はコードデバイスと呼ぶことが便宜である。

しかしながら、このような用語の全ては適当な物理量と関連付けられており、これらの物理量に付された単なる便宜的なラベルに過ぎない。後記において特段の説明がない限り、明細書本文全体を通じて、“処理”、“計算”、“算出”、“決定”又は“表示”等の用語を用いた説明は、（電子的な）物理量としてのデータを、コンピュータシステムのメモリ、レジスタ又は他の情報ストレージのなかで操作しかつ変形するコンピュータシステムや同様の電子的コンピューティング機器の動作や処理のことを言う。

本発明のいくつかの側面は、アルゴリズムの形になったプロセスステップや指示を含む。本発明のプロセスステップや指示は、ソフトウエア、ファームウエア又はハードウエアによって実施され、ソフトウエアで実施される場合は、ダウンロードされることが可能であり、多様なオペレーティングシステムが用いる別のプラットフォームから操作されることも可能である。

本発明は、操作を実行する装置にも関する。この装置は、所与の目的を達成する専用装置であってもよいし、コンピュータに記憶されたコンピュータプログラムによって動作する汎用コンピュータであってもよい。このようなコンピュータプログラムは、コンピュータが読取り可能な媒体に記憶され得る。その媒体とは、コンピュータシステムバスに接続可能な、フロッピー（登録商標）ディスク、光ディスク、ＣＤ−ＲＯＭ、電磁光学的ディスク、ＲＯＭ、ＲＡＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、電磁的又は光学的カード、ＡＳＩＣ又は電子的命令を記憶し得るあらゆる媒体を含むが、これらに限定されない。さらに、本明細書で言うコンピュータは、単体のプロセッサを含んでもよいし、コンピュータ能力を増加させるために複数のプロセッサを用いた装置であってもよい。

ここでいうアルゴリズムやディスプレイは、もともと特定のコンピュータや他の装置に関係している訳ではない。ここで教示される内容に従って、プログラムとともに多様な一般目的システムが使用され得る。又は、必要とされる方法ステップを実行するためにさらに特化した装置を作成することも便宜である。これらのシステムのそれぞれについてどのような構成が必要となるかは、後記する明細書本文から明らかになる。さらには、本発明は特定のプログラム言語を参照して記載されるものではない。本発明の教示を実装するために、多様なプログラム言語が使用され得る。後記において特定の言語に言及した場合、それは本発明の実施可能性及びベストモードを開示するためである。

さらに、本明細書で使用される言語は、主として意味の取りやすさ及び教示目的から選択されているのであって、本発明の主旨を限定するために選択されているのではない。従って、本発明の開示は、特許請求の範囲にて記述されている本発明の範囲を例示するものであるが限定するものではない。

図１は、本発明のある実施形態が動作する、コンピューティング機器１００を示す図である。コンピューティング機器１００は、プロセッサ１１０、入力装置１２０、出力装置１３０、会話認識モジュール１６０及びメモリ１４０を有する。ある実施形態においては、コンピューティング機器１００は、送受信機又はコネクタを含む通信モジュール１５０をさらに有する。

プロセッサ１１０は、データ信号を処理するものであり、複合指示セットコンピュータ（ＣＩＳＣ）アーキテクチャ、縮小指示セットコンピュータ（ＲＩＳＣ）アーキテクチャ、又は指示セットの組合せを実装するアーキテクチャのような様々なコンピューティングアーキテクチャを含み得る。図１においては単一のプロセッサが示されているが、複数のプロセッサが含まれていてもよい。プロセッサ１１０は、算術論理演算ユニット、マイクロプロセッサ、汎用コンピュータ、若しくは、メモリ１４０、入力装置１２０、出力装置１３０、又は通信モジュール１５０、からの電子データ信号を送信し、受信し、かつ処理し得る他の情報処理製品を含む。

入力装置１２０は、コンピューティング機器１００に対してユーザ入力を提供する、カーソルコントローラ又はキーボードのような任意の機器である。ある実施形態においては、入力装置１２０は、ＱＷＥＲＴＹキーボード、キーパッド又はタッチスクリーン上に表示されたそれらの代替物のような、情報及び／又は命令選択をプロセッサ１１０又はメモリ１４０に送信する英数字入力機器を含み得る。他の実施形態においては、入力装置１２０は、ジョイスティック、マウス、トラックボール、スタイラス、ペン、タッチスクリーン、カーソル移動キー、又は画像の動きを調節する他の機構のような、プロセッサ１１０に対して命令選択と同様に位置データを送信できるユーザ入力装置である。

出力装置１３０は、ここに記述されるような電子画像及び電子データを表示できる任意の機器である。出力装置１３０は、例えば、有機発光ダイオードディスプレイ（ＯＬＥＤ）、液晶ディスプレイ（ＬＣＤ）、陰極管ディスプレイ（ＣＲＴ）、若しくは、表示装置、スクリーン又はモニタを備えた任意の他の同等の装置であってよい。ある実施形態においては、出力装置１３０は、接触感応式透明パネルが出力装置１３０のスクリーンを覆うような、タッチスクリーンを備えている。

メモリ１４０は、プロセッサ１１０によって実行される指示及び／又はデータを格納する。指示及び／又はデータは、ここで記述される任意の及び／又はすべての技術を実行するためのコードを含む。メモリ１４０は、動的ランダムアクセスメモリ（ＤＲＡＭ）デバイス、静的ランダムアクセスメモリ（ＳＲＡＭ）デバイス、フラッシュＲＡＭ、他の不揮発性ストレージ装置、これらの組合せ、又は当業界に知られている他のメモリーデバイスであってもよい。メモリ１４０は、定義済命令格納部１４２、解釈モジュール１４４、及び語彙拡張モジュール１４６を含み、プロセッサ１１０、入力装置１２０、出力装置１３０、会話認識モジュール１６０及び／又は通信モジュール１５０と通信可能に接続されている。

定義済命令格納部１４２は、１又は複数の定義済命令を記述するテキストデータを含む。定義済命令は、コンピューティング機器１００に、１又は複数の車両システムと交信させ、かつ、１又は複数の車両システムを修正させる。格納された定義済命令は、１又は複数の単語及び当該１又は複数の単語に関連付けられた順序を特定する定義された文法構造のような特定のフォーマットを有する。例えば、格納された定義済命令は、“室温を上げろ”、“最も近いＡＴＭを探せ”、“最も近い銀行を探せ”、“ラジオ局を選局せよ”又は特定の語順の１又は複数の単語からなる他のフレーズのような命令を有する。

ある実施形態においては、定義済命令格納部１４２は、定義済命令を上位カテゴリに関連付ける。ある実施形態においては、上位カテゴリは、上位カテゴリ内の定義済命令によって実行される機能のタイプを記述する、又は、上位カテゴリ内の当該命令を実行することによって修正される車両システムを記述する。例えば、定義済カテゴリは、“グローバル命令”、“ナビゲーション一般”、“ナビゲーション表示”、“場所発見”、“空調”、“室温”、“設定”、“ラジオ”、“コンパクトディスク（ＣＤ）”、“情報”及び“ＭＰ３”である。例えば、“空調”という上位カテゴリ内の命令は、その命令が識別された場合、車両空調制御システムの修正を行う。代替的に、定義済カテゴリは、ユーザ定義されたカテゴリ又は他の選好に応じて命令を体系化する。ある実施形態においては、定義済命令格納部１４２は、入力装置１２０又は会話認識モジュール１６０から受信された入力に応じて、命令をカテゴリに体系化する方法を修正する。例えば、ある入力に応じて、定義済命令格納部１４２は、“地図を表示せよ”という命令を、“グローバル命令”という上位カテゴリに関連付けられている状態から、“ナビゲーション表示”という上位カテゴリに関連付けられている状態に修正する。ある実施形態においては、ある上位カテゴリをある命令に関連付けた後で、定義済命令格納部１４２は、当該上位カテゴリ内の命令を追加的に分類する。例えば、定義済命令格納部１４２は、第１の分類器の出力が、上位カテゴリに関連付けられたラベルのセットから選択される場合は、個々の分類器を連結してシーケンスを作成する。

解釈モジュール１４４は、定義済命令格納部１４２、語彙拡張モジュール１４６及び会話認識モジュール１６０と通信し、定義済命令格納部１４２からの定義済命令であって、コンピューティングシステム１００によって実行されるべき定義済命令に、受信された会話データを関連付ける。会話認識モジュール１６０から会話データを受信すると、解釈モジュール１４４は、後記する語彙拡張モジュール１４６にアクセスし、定義済命令格納部１４２は、受信した会話データを定義済命令に関連付ける。

例えば、車両ナビゲーションシステムは、定義済命令格納部１４２に格納されている定義済命令に応じて、動作を認識し実行するように当初は設計されている。解釈モジュール１４４は、定義済命令格納部１４２からのこれらの定義済命令にアクセスし、語彙拡張モジュール１４６からの、定義済命令に関連付けられたデータにもアクセスし、会話データが定義済命令に関連付けられているか否かを決定する。解釈モジュール１４４は、定義済命令格納部１４２内のデータと、語彙拡張モジュール１４６内のデータとの間の関係を使用して、その後受信される会話命令を、定義済命令に関連付ける。語彙拡張モジュール１４６との交信は、解釈モジュール１４４が、定義済命令とは異なるフォーマットで受信される会話データを、受信された会話データ命令に最も類似している定義済命令に関連付けることを可能にする。解釈モジュール１４４については、図４とともに後記する。

語彙拡張モジュール１４６は、定義済命令格納部１４２に含まれる命令の代替フォームを含む。これらの代替フォームは、当該定義済命令と類似の意味を有する別の文法構造、当該定義済命令の変形例、又は、格納された定義済命令に含まれる単語の同義語を記述する。例えば、“最も近いＡＴＭを探せ”という定義済命令に対して、語彙拡張モジュール１４６は、“最寄のＡＴＭ機はどこにあるか”、“最寄の自動支払機を探せ”、“最寄のＡＴＭを探せ”、“最も近い現金支払機へ行け”、“私は現金支払機が必要です”又は“ＡＴＭを探せ”のような代替フォームを含む。従来の車両ナビゲーションシステムが、前記例の“最も近いＡＴＭを探せ”という定義済命令を識別できるに過ぎない一方で、語彙拡張モジュール１４６は、解釈モジュール１４４が、“最も近いＡＴＭを探せ”の代替フォームにアクセスし、受信された会話が“最も近いＡＴＭを探せ”の代替フォームに類似しているか否かを決定することを可能にする、つまり、解釈モジュール１４４が定義済命令の代替フォームを使用して“最も近いＡＴＭを探せ”という命令を識別することを可能にする。このようにして、語彙拡張モジュール１４６によって、語彙拡張モジュール１４６に含まれる定義済命令の代替フォームに関連付けられた会話データを受信すると、解釈モジュール１４４は定義済命令を識別することができる。語彙拡張モジュール１４６のおかげで、搭乗者は、文法フォーマットが異なる会話命令又は定義済命令を含む単語の同義語を使用する会話命令を提供し、定義済命令を識別するために使用され得る会話データの量を増やすことによって、コンピューティング機器１００との交信を単純化することができる。

ある実施形態においては、代替文法フォーマット及び同義語が、通信モジュール１５０を介して様々なソースから受信され、さらに、語彙拡張モジュール１４６に送信される。このことは、分散キャプチュア技術を使用して、様々な代替文法フォーマット及び／又は同義語を受信することを可能にする。分散キャプチュア技術を使用することによって、語彙拡張モジュール１４６は、様々なソースから、非常に様々な代替文法フォーマット及び／又は同義語を受信する。例えば、通信モジュール１５０は、http://openmind.hri-us.comで利用可能なオープンマインド屋内常識データベースのような外部データソースから命令ごとに代替文法フォーマットを受信する。当該外部データソースは、１又は複数の格納された定義済命令に関連付けられた代替文法フォーマット及び／又は代替フレーズを記述する１又は複数のユーザからのデータを含む。ある実施形態においては、語彙拡張モジュール１４６は、ワードネットデータベースのような１又は複数の語彙データベースから通信モジュール１５０を介してデータを受信し、定義済命令格納部１４２内の命令を有する単語の同義語を検索する。

ある実施形態においては、コンピューティング機器１００は、コンピューティング機器１００をネットワーク（図示せず）又は他のコンピューティング機器１００にリンクさせる通信モジュール１５０をさらに有する。ネットワークは、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）（例えば、インターネット）及び／又は複数の機器間の通信を可能にする他の相互接続データパスを有してもよい。ある実施形態においては、通信モジュール１５０は、ＵＳＢ、ＩＥＥＥ１３９４又はイーサネット（登録商標）のような、ファイル及び情報を分配するコンピューティング機器１００との従来式の接続である。他の実施形態においては、通信モジュール１５０は、赤外線通信、ＩＥＥＥ８０２.１１ａ/ｂ/ｇ/ｎ（すなわち、ＷｉＦｉ）通信、Ｂｌｕｅｔｏｏｔｈ（登録商標）通信、３Ｇ通信、ＩＥＥＥ８０２.１６（すなわち、ＷｉＭａｘ）通信又はラジオ周波数通信のような従来タイプの送受信器である。

コンピューティング機器１００は、受信された音声データを、テキストデータのような、コンピューティング機器１００が読取可能なフォーマットに変換する会話認識モジュール１６０も含む。会話認識モジュール１６０の出力は、定義済命令格納部１４２及び／又は語彙拡張モジュール１４６に対してその後の処理のために送信される。ある実施形態においては、会話認識モジュール１６０は、搭乗者のようなユーザから会話語のような音声データを取得するためのマイクロフォン又は他の音声取得機器を含む。ある実施形態においては、会話認識モジュール１６０は、隠れマルコフモデル（ＨＭＭ）ベースの会話認識を使用して音声データを識別する。しかしながら、他の実施形態においては、会話認識モジュール１６０は、音声データを取得し、当該取得された音声データを、定義済命令格納部１４２、解釈モジュール１４４及び／又は語彙拡張モジュール１４６が使用するフォーマットに変換する任意の適当な方法を使用してもよい。

コンピューティング機器１００が、本発明の主旨を逸脱することなく図１に示された以外の構成要素を有してもよいし、図１に示された構成要素を欠いてもよいことは、当業者には明らかである。例えば、コンピューティング機器１００は、例えば第１のレベルキャッシュ又は第２のレベルキャッシュのような追加メモリ、若しくは、１又は複数のアプリケーション特定型集積回路（ＡＳＩＣｓ）を含んでもよい。同様に、コンピューティング機器１００は、追加的な入力装置又は出力装置を含んでもよい。本発明のいくつかの実施形態では、１又は複数の構成要素（１１０、１２０，１３０、１４０，１４２、１４４、１４６、１５０、１６０）は相互に近接して配置され得る一方、他の実施形態では、これらの構成要素は、地理的に離れた場所に配置され得る。例えば、メモリ１４０内のユニットは、コンピューティング機器１００から分離して配置される１又は複数のプロセッサ１１０によって実行され得るプログラムであってもよい。

図２は、本発明のある実施形態に係る、車両ナビゲーションシステムの語彙を拡張するシステム２００のブロック図である。例として、図２は、単一の外部データソース２１０からデータを受信するコンピューティング機器１００を示している。しかしながら、他の実施形態においては、コンピューティング機器１００は、複数の外部データソース２１０からデータを受信する。

コンピューティング機器１００は、車両２２０に含まれ、通信リンク２３０を介して外部データソース２１０と通信を行う。ある実施形態においては、コンピューティング機器１００は、車両に搭載されたナビゲーションシステムであり、空調制御システム、温度センサ、音響システム（例えば、ラジオ、コンパクトディスクプレーヤ、ＭＰ３プレーヤ、又は音声データを再生する他のシステム）のような１又は複数の車両システムと交信する。代替的に、コンピューティング機器１００は、車両２２０内の１又は複数のシステムと通信し、車両２２０の外側で使用するために車両２２０から取り外し可能な携帯ナビゲーションシステムである。

外部データソース２１０は、１又は複数のアクティビティを記述する、http://openmind.hri-us.comで利用可能なオープンマインド屋内常識ウエブサイトのような構造化されたデータを含むデータ格納機器である。ある実施形態においては、外部データソース２１０は、１又は複数のボランティアから受信されたデータを含む。当該データは、コンピューティング機器１００内の定義済命令格納部１４２によって格納された定義済命令の代替フォームを記述する。例えば、外部データソース２１０は、１又は複数のユーザに対して、定義済命令を含むテンプレートを表示し、当該１又は複数のユーザに質問をし、当該定義済命令のための代替フォーマットを提供する。ある実施形態においては、外部データソース２１０は、定義済命令を含む１又は複数の単語の同義語を記述するデータであって、１又は複数のユーザ又は１又は複数のデータリポジトリからのデータも受信し、格納する。このようにして、外部データソース２１０は、１又は複数の定義済命令に関連付けられた代替フォーマット及び／又は同義語を取得し、１又は複数定義済命令に関連付けられ得る会話データの数とタイプを増やす。

通信リンク２３０は、外部データソース２１０とコンピューティング機器１００内に含まれる通信モジュール１５０との間でデータを通信する。ある実施形態においては、通信リンク２３０は、汎用パケットラジオサービス（ＧＰＲＳ）、ＩＥＥＥ８０２.１１（すなわち、ＷｉＦｉ）、ＩＥＥＥ８０２.１６（すなわち、ＷｉＭａｘ）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、又は任意の他の適当な無線通信チャネルのような、無線通信チャネルを有する。代替的に、通信リンク２３０は、イーサネット（登録商標）、デジタル加入者線（ＤＳＬ）、統合サービスデジタルネットワーク（ＩＳＤＮ）、又は任意の他の適当な有線通信システムのような従来の有線通信システムを有する。ある実施形態においては、通信リンク２３０は、無線通信システムと有線通信システムの組み合わせを有する。このようにして、通信リンク２３０は、外部データソース２１０が、定義済命令に関連付けられた代替フォーマット及び／又は同義語を記述するデータを、語彙拡張モジュール１４６内に格納するために、コンピューティング機器１００に送信することを可能にする。ある実施形態においては、通信リンク２３０は、定期的に又はユーザ入力に応答して、接続が確立され、語彙拡張モジュール１４６を追加的な代替フォーマット又は同義語で更新する。

図３は、本発明のある実施形態に係る、車両ナビゲーションシステムの語彙拡張のための方法３００を示すフローチャートである。ある実施形態においては、方法３００のステップは、記述された動作を起こすソフトウエア指示又はファームウエア指示を実行するプロセッサ１１０によって実施される。当業者であれば、ハードウエア及び／又はソフトウエア若しくはそれらの組合によって、１又は複数の方法が実施されてもよいことがわかる。例えば、記述された動作を実行する指示は、コンピュータ読取可能な媒体内に具現化され、又は、格納される。さらに、当業者であれば、他の実施形態では、図３のステップが異なる順序で実行され得ることがわかる。さらに、他の実施形態では、ここに記述された以外の、異なる及び／又は追加的なステップが含まれ得る。

最初に、外部データソース２１０によって定義済命令が受信される（ステップ３１０）。ある実施形態においては、外部データソース２１０は、コンピューティング機器１００に含まれる定義済命令格納部１４２から、通信リンク２３０を介して、定義済命令を受信する（ステップ３１０）。代替的に、外部データソース２１０は、外部データソース２１０によって局部的に格納された定義済命令のセットから定義済命令を受信する（ステップ３１０）。

次に、定義済命令に関連付けられた代替フォームが、外部データソース２１０によって受信される（ステップ３２０）。ある実施形態においては、外部データソース２１０は、定義済命令を表示機器上に視認可能に表示することによって、定義済命令を複数のユーザに提示し、複数のユーザが定義済命令に関連付けて代替フォームを入力するのを促す。例えば、“最も近いＡＴＭを探せ”という定義済命令に対する代替フォームを受信するために、外部データソースは、表示機器上に“車内では、「最も近いＡＴＭを探せ」という代わりに・・・といってもよい”という質問を表示し、１又は複数のユーザから、“最寄のＡＴＭを探せ”、“最も近い現金支払機へ行け”又は“最寄のＡＴＭを示せ”のような１又は複数のユーザが“最も近いＡＴＭを探せ”に関連付けている代替フォームを示す単語又はフレーズを記述する入力を受信する。このようにして、外部データソース２１０によって受信された（ステップ３１０）定義済命令に１又は複数のユーザが関連付けた別表現又は別フレーズを、代替フォームは表す。代替的に、外部データソースは、１又は複数の単語又はフレーズを含む１又は複数のデータベース又は他の格納機器にアクセスすることによって定義済命令に関連付けられた代替フォームを受信する（ステップ３２０）。

ある実施形態においては、外部データソース２１０は、定義済命令に含まれる単語の同義語及び／又は当該定義済命令に関連付けられた１又は複数の代替フォームに含まれる単語の同義語を検索する（ステップ３３０）。例えば、外部データソース２１０は、定義済命令又は当該定義済命令に関連付けられた代替フォームを１又は複数の単語に分解し、ワードネットデータベースのような語彙データベースにアクセスし、分解された個々の単語の同義語を検索する（ステップ３３０）。代替的に、定義済命令又は当該定義済命令の代替フォームを単語に分解した後に、外部データソースは、１又は複数のユーザが分解された個々の単語の同義語を提供するのを促す。

ある実施形態においては、外部データソース２１０は、定義済命令に関連付けられた代替フォーム及び／又は同義語を記述する言い換え語を生成する（ステップ３４０）。例えば、外部データソース２１０は、定義済命令に関連付けられた代替フォームを格納する。ある実施形態においては、外部データソース２１０は、定義済命令内の１又は複数の単語を検索された同義語に置換することによって言い換え語を生成し（ステップ３４０）、当該修正された定義済命令を格納する。他の実施形態においては、外部データソース２１０は、定義済命令に関連付けられた代替フォーム内の１又は複数の単語を検索された同義語に置換することによって定義済命令の代替フォームを修正し、当該修正された定義済命令を、当該定義済命令に関連付けて格納する。

ある実施形態においては、言い換え語が生成されているとき（ステップ３４０）、定義済命令に関連付けられた代替フォームが前処理される。前処理を行うことにより、定義済命令に関連付けられた収集された代替フォームは、データが会話認識モジュール１６０から受信される状態のフォーマットにさらに類似することになる。例えば、“ＡＴＭ”という語は、外部データソース２１０によって前処理されたうえで格納される。つまり、この語は、実際の発音に忠実に３つの別々の文字に区切って“エーティーエム”として格納される。同様の前処理が他の語に対しても適用されて、当該他の語が会話データとしてどのように受信されたかに応じてその態様に一致するフォーマットで格納される。ある実施形態においては、上位カテゴリも、定義済命令の代替フォームに関連付けられるので、定義済命令の代替フォームは、定義済命令格納部１４２によって特定される上位カテゴリに関連付けられる。このようにして、定義済命令の代替フォームのそれぞれは、定義済命令に関連付けられ、オプションとして上位カテゴリにも関連付けられるようにしてもよい。

方法３００は、外部データソース２１０が定義済命令に関連付けられた代替フォームを収集し、格納することを可能にする。当該代替フォームは、ユーザが定義済命令を話し得る代替方法を表すので、外部データソース２１０は、ユーザが定義済命令を話し得る追加的な方法を記述することができる。コンピュータ機器１００が、定義済命令に関連付けられた１又は複数の代替フォームを有する会話データを受信すると、定義済命令を識別することを可能にすることによって、外部データソース２１０とコンピューティング機器１００との交信が単純化される。

図４は、本発明のある実施形態に係る、受信された会話命令を分類する方法４００を示すフローチャートである。ある実施形態においては、方法４００のステップは、記述された動作を起こすソフトウエア指示又はファームウエア指示を実行するプロセッサ１１０によって実施される。当業者であれば、ハードウエア及び／又はソフトウエア又はそれらの組み合せによって、１又は複数の方法が実施されてもよいことがわかる。例えば、記述された動作を実行する指示は、コンピュータ読取可能な媒体内に具現化され、又は、格納される。さらに、当業者であれば、他の実施形態では、図４のステップが異なる順序で実行され得ることがわかる。さらに、他の実施形態では、ここに記述された以外の、異なる及び／又は追加的なステップが含まれ得る。

最初に、会話認識モジュール１６０は、会話データを受信する（ステップ４１０）。ある実施形態においては、会話認識モジュール１６０は、解釈モジュール１４４によって、受信された会話データを後処理のためにテキストデータに変換する。次に、会話データ又は当該会話データから生成されたテキストデータは、解釈モジュール１４４に送信され、ここで、定義済命令として分類される（ステップ４２０）。ある実施形態においては、解釈モジュール１４４は、複数クラス分類方法を使用して、受信された会話データを分類する（ステップ４２０）。例えば、定義済命令格納部１４２に含まれる定義済命令のそれぞれと会話データとが比較され、かつ、語彙拡張モジュール１４６に含まれ、当該定義済命令に関連付けられた代替フォームのそれぞれと会話データとが比較され、当該会話データが定義済命令のそれぞれに対応する確率を決定する。決定された確率に基づいて、会話データは、当該会話データを含む確率が最も高い定義済命令として分類される（ステップ４２０）。別の実施形態においては、解釈モジュール１４４は、別の複数カテゴリ分類方法を使用して、会話データを分類する（ステップ４２０）。複数カテゴリ分類方法の例は後記される。

ある実施形態においては、会話データを分類する（ステップ４２０）ために、定義済命令に関連付けられた単語出現頻度−逆出現頻度（ＴＦＩＤＦ）ウエイトが単語ごとに生成されるので、各カテゴリは、スパースベクトル（sparse vector）によって表され得る。したがって、定義済命令ごとに、当該定義済命令を有する単語及び当該定義済命令の代替表現を有する単語が識別され、ＴＦＩＤＦウエイトが、（１）式にしたがって単語ごとに計算される。

（１）

ここで、ｔｆ_t,cは、カテゴリｃ内に単語ｔが出現する頻度である。しかしながら、ある実施形態においては、逆出現頻度成分は使用されない。なぜならば、すべてのカテゴリ内に出現する単語（例えば、複数の定義済命令に共通の単語）についての当該成分は「０」値となり、最終結果が「０」となるからである。ＴＦＩＤＦウエイトは、定義済命令のそれぞれのベクトル表示を生成するために使用され、当該ベクトル表示は、定義済命令からの単語及び当該定義済命令に関連付けられた１又は複数の代替フォームからの単語を含む。したがって、定義済命令のベクトル表示は、当該定義済命令に含まれる複数の単語及び／又は当該定義済命令代替フォームに含まれる複数の単語を含む。ベクトル表示は、別々の単語が当該定義済命令にどの程度の頻度で関連付けられるかを示している。定義済命令のそれぞれに関連付けるベクトル表示を生成した後に、会話データのベクトル表示が生成され、当該会話データのベクトル表示と定義済命令のそれぞれのベクトル表示との間の余弦ベクトル類似度が生成される。次に、定義済命令は、最大の余弦ベクトル類似度を有する定義済命令として分類される（ステップ４２０）。

代替的に、解釈モジュール１４４は、ナイーブベイズモデルを使用して、受信した会話データを定義済命令として分類する（ステップ４２０）。ナイーブベイズモデルでは、解釈モジュール１４４は、定義済命令のベクトル表示中の単語のそれぞれを以下のようにモデル化する。すなわち、ベクトル表示中の単語のそれぞれは、会話データを（２）式の関係に基づいて定義済命令に分類する際に当該分類に対して独立して貢献するものとする。

（２）

ここで、ｔ_iは、定義済命令の表示内の単語を表す。ｃは、定義済命令を表し、Ｚは、倍率を表す。このようにして、ナイーブベイズモデルは、どの定義済命令が、受信した会話データを含む最高の確率を有するかを決定することによって、当該会話データをその定義済命令として分類する（ステップ４２０）。

他の実施形態においては、解釈モジュール１４４は、定義済命令のそれぞれが受信した会話データを生成する確率をユニグラム（unigram）モデルを使用して計算するために、発生モデルを使用する。

（３）

ここで、ｔ_iは、単語を表す。例えば、会話データが“ラジオをつけろturn radio on”という対応するテキストデータを生成する場合、当該会話データの確率を計算するユニグラムモデルは、（４）式の通りである。

（４）

当該確率を計算する際に、定義済命令と定義済命令のすべての収集結果を混合する。この際使用されるパラメータλは、以下の関係にしたがって混合量を修正する。

（５）

発生言語法が使用される際のパフォーマンスを最適化するには、定義済命令と定義済命令の収集結果との均等混合が使用される。このとき、λは「０.５」に設定される。

最尤法を使用して、定義済命令ごとにかつ定義済命令の収集結果ごとに、以下の（６）式にしたがって左辺の値を求める。

（６）

ここで、Ｍ_cは、定義済命令“ｃ”についての言語モデルである。Ｍ_collectionは、複数の定義済命令の収集結果についての言語モデルである。ｔｆ_t,cは、定義済命令ｃ内に単語ｔが未加工の語として出現する頻度である。Ｌ_cは、定義済命令ｃ内のトークン（例えば、単語）の数である。例えば、定義済命令に関連付けられたデータ内に“ラジオ”という語が現れる確率は、Ｐ（ｒａｄｉｏ）＝（定義済命令に関連付けられたデータ内に“ラジオ”という語が現れる回数）／（当該定義済命令に関連付けられた単語の総数）として計算される。

発生モデル法が使用される場合、解釈モジュール１４４は、６２．９％の確度で、会話データを定義済命令として分類する。人間が会話データを定義済命令として分類する場合の確度は７０％であるので、発生モデル法を使用する解釈モジュール１４４は、分類パフォーマンスの上限に近い。

会話データを分類した（ステップ４２０）後、解釈モジュール１４４は、当該会話データが１つの定義済命令に関連付けられているか、又は、２以上の定義済命令が当該会話データに関連付けられている可能性があるか、のうちの何れであるかを決定する（ステップ４３０）。ある実施形態においては、解釈モジュール１４４は、当該会話データに関連付けられている確率が最も高い定義済命令、及び、当該会話データに関連付けられている確率が２番目に高い定義済命令を識別する。当該会話データに関連付けられている最も高い確率と当該会話データに関連付けられている２番目に高い確率との間の差分が計算されて、閾値と比較される。確率間の差分が当該閾値を超える場合は、解釈モジュール１４４は、最も高い確率に関連付けられた定義済命令に当該会話データが一致すると決定する（ステップ４３０）。当該定義済命令が、分類モジュール１４２から検索され、コンピューティング機器１００によって実行される（ステップ４４０）。

会話データが２以上の定義済命令の候補に一致すると決定した（ステップ４３０）場合は、解釈モジュールは、当該会話データを提供しているユーザに対して当該会話データを明確化することを要求する（ステップ４４５）。例えば、当該会話データに関連付けられている最も高い確率と当該会話データに関連付けられている２番目に高い確率との間の差分が当該閾値を超えない場合は、解釈モジュール１４４は、当該会話データが、最も高い確率に関連付けられた定義済命令及び２番目に高い確率に関連付けられた定義済命令の両者の候補に関連付けられていると決定する（ステップ４３０）。次に、解釈モジュール１４４は、ユーザに対して命令の候補のうちの何れかを選択するように促すことによって、適切な定義済命令の明確化を要求する（ステップ４４５）。例えば、コンピューティング機器１００は、出力装置１３０を使用して、ユーザに対して聴覚的に又は視覚的に定義済命令の候補を提示し、ユーザが所望の定義済命令を選択することを要求する（ステップ４４５）。例えば、会話認識モジュール１６０を介して、所望の定義済命令に関連付けられた会話データを受信することによって、適切な命令の明確化結果を受信した（ステップ４５０）後、コンピューティング機器は、定義済命令格納部１４２から所望の定義済命令を検索し、所望の定義済命令を実行する（ステップ４４０）。

例えば、会話認識モジュール１６０は、会話データ“私は、何冊かの本を必要としています”を受信する（ステップＳ４１０）。次に、解釈モジュール１４４は、当該会話データが、“最も近い書店を探せ”という定義済命令には確率０．５５で関連付けられており、“最も近い図書館を探せ”という定義済命令には確率０．４５で関連付けられていると、分類する（ステップ４２０）。両者の確率の差分が０.１であると計算することによって、解釈モジュール１４４は、会話データ“私は、何冊かの本を必要としています”が、“最も近い書店を探せ”又は“最も近い図書館を探せ”の内の何れかの候補に関連付けられていると決定する（ステップ４３０）。次に、解釈モジュール１４４は、“最も近い書店を探せ”及び“最も近い図書館を探せ”の内の何れかを選択するようにユーザに要求する（ステップ４４５）。例えば、解釈モジュール１４４は、出力装置１３０を使用して、“あなたは最も近い書店を探したいのですか、それとも図書館を探したいのですか”をユーザに尋ねる音声信号を生成する。候補の命令のうちの１つを選択すするユーザの入力を受信すると、定義済命令が定義済命令格納部１４２から検索されて実行される。

ある実施形態においては、解釈モジュール１４４は、使用された定義済命令の履歴を格納しておき、会話データが２以上の定義済命令の候補に関連付けられている場合、当該定義済命令の履歴を再使用して、所望の定義済命令を決定する。こうすることによって、解釈モジュール１４４は、現在の状態を追跡し、所望の命令を決定する要求を行う（ステップ４４５）際の最良の質問を決定できる。ある実施形態においては、解釈モジュール１４４は、会話データが特定の定義済命令に関連付けられている確率が閾値を超えるか否かを決定するために、各ステージにおいて複数の命令仮説を維持する一連の意思決定方法を適用する。

前記では、本発明の特定の実施形態及び適用例を例示及び記述してきたが、本発明がここで開示された構造及び構成そのものに限定されないこと、並びに、添付された特許請求の範囲に記載された本発明の主旨を逸脱せずに、本発明の方法及び装置の配置、動作及び細部について様々な修正、変更及び変形例が可能であることは、当然である。

１００コンピューティング機器
１１０プロセッサ
１２０入力装置
１３０出力装置
１４０メモリ
１４２定義済命令格納部
１４４解釈モジュール
１４６語彙拡張モジュール
１５０通信モジュール（オプション）
１６０会話認識モジュール
２１０外部データソース
２２０車両

Claims

１又は複数の単語を含む会話データを分類するコンピュータを用いた方法であって、
前記方法は、
１又は複数の単語を含む複数の定義済命令を動作に関連付けて格納し、
前記定義済命令のそれぞれに関連付けられた１又は複数の代替フォーマットであって、１又は複数の単語を含み、かつ、前記代替フォーマットを定義済命令に関連付ける識別子を含む前記１又は複数の代替フォーマットをデータソースから受信し、
前記会話データを受信し、
前記会話データが前記定義済命令に関連付けられる尤度を示す値のセットであって、それぞれの値が前記定義済命令に関連付けられている値のセットを生成し、
前記値のセットのうちの値に応じて、前記会話データを定義済命令に関連付け、
前記会話データに関連付けられた前記定義済命令に関連付けられた前記動作を実行するステップを含むこと、
を特徴とする方法。
前記データソースは、
分散データキャプチュア技術を使用して１又は複数のソースから入手されたデータを含むウエブサイトを含むこと、
を特徴とする請求項１に記載の方法。
前記データソースは、
１又は複数の単語及び各単語に関連付けられた１又は複数の同義語を含む語彙データベースを含むこと、
を特徴とする請求項１に記載の方法。
前記データソースは、
分散データキャプチュア技術を使用して１又は複数のソースから入手されたデータを含むウエブサイトと、
１又は複数の単語及び各単語に関連付けられた１又は複数の同義語を含む語彙データベースと、を含むこと、
を特徴とする請求項１に記載の方法。
前記値のセットを生成するステップは、
前記データソースから受信された定義済命令のそれぞれに関連付けられた１又は複数の代替フォーマットを使用して、定義済命令に関連付けられた単語出現頻度ベクトルのセットを生成し、
前記会話データに関連付けられた単語出現頻度ベクトルを生成し、
前記会話データに関連付けられた単語出現頻度ベクトルと、定義済命令に関連付けられた単語出現頻度ベクトルのそれぞれとの間の類似度のセットを決定するステップを含むこと、
を特徴とする請求項１に記載の方法。
前記類似度は、
前記会話データに関連付けられた前記単語出現頻度ベクトルと、定義済命令に関連付けられた単語出現頻度ベクトルとの間の余弦類似度を含むこと、
を特徴とする請求項５に記載の方法。
前記会話データに関連付けられた単語出現頻度ベクトルと、定義済命令に関連付けられた単語出現頻度ベクトルのそれぞれとの間の類似度のセットを決定するステップは、
前記会話データに関連付けられた単語出現頻度ベクトル及び定義済命令に関連付けられたそれぞれの単語出現頻度ベクトルに対してナイーブベイズモデルを適用し、
定義済命令のそれぞれが前記会話データに関連付けられている尤度を決定することを含むこと、
を特徴とする請求項５に記載の方法。
前記会話データに関連付けられた単語出現頻度ベクトルと、定義済命令に関連付けられた単語出現頻度ベクトルのそれぞれとの間の類似度のセットを決定するステップは、
定義済命令に関連付けられた単語出現頻度ベクトルのそれぞれが、前記会話データに関連付けられた単語出現頻度ベクトルを含む確率を、ユニグラムモデルを使用して計算すること、を含むこと、
を特徴とする請求項５に記載の方法。
前記ユニグラムモデルは、
前記定義済命令に関連付けられた単語出現頻度ベクトル及び単語出現頻度ベクトルの前記セットを混合パラメータにしたがって混合すること、
を特徴とする請求項８に記載の方法。
前記値のセットからの値に応じて、前記会話データを定義済命令に関連付けるステップは、
第１の定義済命令に関連付けられた最大類似度を決定し、
第２の定義済命令に関連付けられた２番目に大きい類似度を決定し、
前記最大類似度と前記２番目に大きい類似度との間の差分を計算し、
前記差分が閾値を超えない場合は、第１の定義済命令又は第２の定義済命令のうちの何れかを選択する入力を要求し、
前記入力に応じて、第１の定義済命令又は第２の定義済命令に前記会話データを関連付けること、を含むこと、
を特徴とする請求項５に記載の方法。
前記値のセットからの値に応じて、前記会話データを定義済命令に関連付けるステップは、
前記差分が前記閾値を超える場合は、前記会話データを前記第１の定義済命令に関連付けることを含むこと、
を特徴とする請求項１０に記載の方法。
１又は複数の単語含む会話データを分類するコンピュータ実行可能なコードを格納するコンピュータ読取可能な記録媒体を含むコンピュータプログラム製品であって、
前記コンピュータ実行可能なコードは、
１又は複数の単語を含む複数の定義済命令を動作に関連付けて格納し、
前記定義済命令のそれぞれに関連付けられた１又は複数の代替フォーマットであって、１又は複数の単語を含み、かつ、前記代替フォーマットを定義済命令に関連付ける識別子を含む前記１又は複数の代替フォーマットをデータソースから受信し、
前記会話データを受信し、
前記会話データが前記定義済命令に関連付けられる尤度を示す値のセットであって、それぞれの値が前記定義済命令に関連付けられている値のセットを生成し、
前記値のセットからの値に応じて、前記会話データを定義済命令に関連付け、
前記会話データに関連付けられた前記定義済命令に関連付けられた前記動作を実行するステップを実行すること、
を特徴とするコンピュータプログラム製品。
前記データソースは、
分散データキャプチュア技術を使用して１又は複数のソースから入手されたデータを含むウエブサイトを含むこと、
を特徴とする請求項１２に記載のコンピュータプログラム製品。
前記データソースは、
１又は複数の単語及び各単語に関連付けられた１又は複数の同義語を含む語彙データベースを含むこと、
を特徴とする請求項１２に記載のコンピュータプログラム製品。
前記データソースは、
分散データキャプチュア技術を使用して１又は複数のソースから入手されたデータを含むウエブサイトと、
１又は複数の単語及び各単語に関連付けられた１又は複数の同義語を含む語彙データベースと、を含むこと、
を特徴とする請求項１２に記載のコンピュータプログラム製品。
前記値のセットを生成するステップは、
前記データソースから受信された定義済命令のそれぞれに関連付けられた１又は複数の代替フォーマットを使用して、定義済命令に関連付けられた単語出現頻度ベクトルのセットを生成し、
前記会話データに関連付けられた単語出現頻度ベクトルを生成し、
前記会話データに関連付けられた単語出現頻度ベクトルと、定義済命令に関連付けられた単語出現頻度ベクトルのそれぞれとの間の類似度のセットを決定するステップを含むこと、
を特徴とする請求項１２に記載のコンピュータプログラム製品。
前記類似度は、
前記会話データに関連付けられた前記単語出現頻度ベクトルと、定義済命令に関連付けられた単語出現頻度ベクトルとの間の余弦類似度を含むこと、
を特徴とする請求項１６に記載のコンピュータプログラム製品。
前記会話データに関連付けられた単語出現頻度ベクトルと、定義済命令に関連付けられた単語出現頻度ベクトルのそれぞれとの間の類似度のセットを決定するステップは、
前記会話データに関連付けられた単語出現頻度ベクトル及び定義済命令に関連付けられたそれぞれの単語出現頻度ベクトルに対してナイーブベイズモデルを適用し、
定義済命令のそれぞれが前記会話データに関連付けられている尤度を決定することを含むこと、
を特徴とする請求項１６に記載のコンピュータプログラム製品。
前記会話データに関連付けられた単語出現頻度ベクトルと、定義済命令に関連付けられた単語出現頻度ベクトルのそれぞれとの間の類似度のセットを決定するステップは、
定義済命令に関連付けられた単語出現頻度ベクトルのそれぞれが、前記会話データに関連付けられた単語出現頻度ベクトルを含む確率を、ユニグラムモデルを使用して計算すること、を含むこと、
を特徴とする請求項１６に記載のコンピュータプログラム製品。
前記ユニグラムモデルは、
前記定義済命令に関連付けられた単語出現頻度ベクトル及び単語出現頻度ベクトルの前記セットを混合パラメータにしたがって混合すること、
を特徴とする請求項１９に記載のコンピュータプログラム製品。
前記値のセットからの値に応じて、前記会話データを定義済命令に関連付けるステップは、
第１の定義済命令に関連付けられた最大類似度を決定し、
第２の定義済命令に関連付けられた２番目に大きい類似度を決定し、
前記最大類似度と前記２番目に大きい類似度との間の差分を計算し、
前記差分が閾値を超えない場合は、第１の定義済命令又は第２の定義済命令のうちの何れかを選択する入力を要求し、
前記入力に応じて、第１の定義済命令又は第２の定義済命令に前記会話データを関連付けること、を含むこと、
を特徴とする請求項１６に記載のコンピュータプログラム製品。
前記値のセットからの値に応じて、前記会話データを定義済命令に関連付けるステップは、
前記差分が前記閾値を超える場合は、前記会話データを前記第１の定義済命令に関連付けることを含むこと、
を特徴とする請求項２１に記載のコンピュータプログラム製品。
車両ナビゲーションシステムによって受信される会話データを分類するシステムであって、
１又は複数の単語を含む複数の定義済命令を、車両システムを修正する動作に関連付けて格納する定義済命令格納部と、
前記定義済命令のそれぞれに関連付けられた１又は複数の代替フォーマットであって、１又は複数の単語を含み、かつ、前記代替フォーマットを定義済命令に関連付ける識別子を含む前記１又は複数の代替フォーマットを含む外部データソースと、
前記会話データを受信し、前記会話データをテキストデータに変換する会話認識モジュールと、
前記定義済命令格納部、前記外部データソース及び前記会話認識モジュールに接続された解釈モジュールと、
を有し、
前記解釈モジュールは、
前記テキストデータを受信し、
前記テキストデータを定義済命令のそれぞれの表示と比較し、
前記会話データを前記比較に応じて定義済命令に関連付け、
定義済命令の前記表示は、
前記定義済命令からの単語と、前記定義済命令に関連付けられた１又は複数の代替フォーマットからの単語とを含むこと、
を特徴とするシステム。
前記データソースは、
分散データキャプチュア技術を使用して１又は複数のソースから入手されたデータを含むウエブサイトを含むこと、
を特徴とする請求項２３に記載のシステム。
前記データソースは、
１又は複数の単語及び各単語に関連付けられた１又は複数の同義語を含む語彙データベースを含むこと、
を特徴とする請求項２３に記載のシステム。
前記データソースは、
分散データキャプチュア技術を使用して１又は複数のソースから入手されたデータを含むウエブサイトと、
１又は複数の単語及び各単語に関連付けられた１又は複数の同義語を含む語彙データベースと、を含むこと、
を特徴とする請求項２３に記載のシステム。
前記定義済命令の前記表示は、
単語出現頻度ベクトルを含むこと、
を特徴とする請求項２３に記載のシステム。