次に、本発明に好適な実施の形態について説明する。なお、以下に説明する実施形態は、音声認識機能及び音声合成機能を備え、音声により情報の入出力が可能な車両ナビゲーション装置に対して本発明を適用した場合の実施形態である。
始めに、本実施形態に係る車両ナビゲーション装置の構成について、図1を用いて説明する。
図1に示すように、車両ナビゲーション装置Sは、自車の回転時の角速度を検出し、角速度データ及び相対方位データを出力する角速度センサ1と、車輪の回転に伴って出力される所定周期のパルス信号におけるパルス数をカウントすることにより車輪一回転当たりのパルス数を算出し、当該一回転当たりのパルス数に基づく走行距離データを出力する走行距離センサ2と、GPS衛星からの電波を受信してGPS測位データを出力すると共に、自車の進行方向の絶対方位データを出力するGPSレシーバ3と、相対方位データ、角速度データ、走行距離データ、GPS測位データ及び絶対方位データに基づいて、ナビゲーション装置全体の制御を行うシステムコントローラ4と、各種データを入力するためのリモコン装置等の入力装置10と、システムコントローラ4による制御の下、記録媒体及び記憶手段としてのDVD−ROM(DVD−Read Only Memory)ディスクDKから車線数、道幅等を示す道路データを含む地図データや各施設の名称並びに詳細情報を示すデータ等の各種データを読み出し、出力するDVD−ROMドライブ11と、システムコントローラ4による制御の下、各種表示データを表示する表示ユニット12と、システムコントローラ4による制御の下、各種音声データを再生し、出力する音響再生ユニット17と、入力手段としての外部マイク200から入力される音声の内容を認識する音声認識手段としての音声認識デコーダ21と、音声認識デコーダ21から出力される音声データに基づいて音声合成を行う音声合成部22と、音声合成部22から出力される合成音声信号を外部に出力する出力手段としてのスピーカ23と、を備えて構成されている。
また、システムコントローラ4は、GPSレシーバ3等の外部センサとのインターフェース動作を行うインターフェース部5と、システムコントローラ4全体を制御するコンピュータ、入力制御手段、判定手段及び検索手段としてのCPU6と、CPU6を制御する基本的な制御プログラム等が格納されたROM(Read Only Memory)7と、図示しない不揮発性メモリ等を有し、入力装置10を介して使用者により予め設定された経路データやCPU6における処理に必要なデータ等の各種データを書き込み可能に格納するRAM8とを備えており、入力装置10、DVD−ROMドライブ11、表示ユニット12、音響再生ユニット17及び音声認識デコーダ21とは、バスライン9を介して接続されている。また、CPU6による後述する情報検索処理のための制御プログラムは、予めDVD−ROMディスクDK内に記録されており、必要に応じてDVD−ROMドライブ11を介して読み出されて当該情報検索処理に用いられる。
更に、表示ユニット12は、バスライン9を介してCPU6から送られる制御データに基づいて表示ユニット12全体の制御を行うグラフィックコントローラ13と、VRAM(Video RAM)等のメモリからなり、即時表示可能な画像情報を一時的に記憶するバッファメモリ14と、グラフィックコントローラ13から出力される画像データに基づいて、液晶表示装置又はCRT(Cathode Ray Tube)表示装置等からなるディスプレイ16を表示制御する表示制御部15とを備えて構成されている。
また、音響再生ユニット17は、DVD−ROMドライブ11またはRAM8からバスライン9を介して送られる音声ディジタルデータのD/A変換を行うD/Aコンバータ18と、D/Aコンバータ18から出力される音声アナログ信号を増幅する増幅器19と、増幅された音声アナログ信号を音声に変換して外部へ出力するスピーカ20とを備えて構成されている。
更に、音声認識デコーダ21は、不特定話者の音声を認識する周知の音声認識回路を備えており、外部マイク200を介して音声が入力されると、当該入力された音声の内容に最も近い候補語が、多数の語を示す情報を含む内蔵辞書から選択され、この選択された候補語を示す候補語データをバスライン9を介してCPU6に出力するように構成されている。なお、上記内蔵辞書は、具体的にはDVD−ROMディスクDK内に格納されており、必要に応じてDVD−ROMドライブ11を介して読み出される。
本実施形態の車両ナビゲーション装置Sは、上述した構成により、後述する処理手順に基づいて使用者が外部マイク200を介して目的地点等を示す地点情報等を入力すると、上記音声認識デコーダ21により当該入力内容に相当する候補語の検索が行われ、検索された候補語を基にシステムコントローラ4によりDVD−ROMディスクDK内に記憶された地図データ等を読み出し、表示ユニット12に表示するようになっている。
なお、目的地点等の入力は、入力装置10によっても可能であるが、音声入力によれば、ボタン等の操作が不要となるため、簡単に情報入力を行うことができる。
また、図1に示す車両ナビゲーション装置Sにおいては、頻繁に目的地点として設定する場所名又は施設名を複数種類選択し、これらを目的地点として採用された回数と共にRAM8内に記憶させておくことが可能とされている。
また、最近検索され目的地点として設定された場所名又は施設名についても、過去に溯った複数個についてRAM8内に記憶させておくことも可能とされている。
次に、本発明におけるスピーカ23からの音声出力用の音声出力データ及び外部マイク200を介して入力された音声の認識用ワード(すなわち、入力されるであろう語句に対応する音声認識用データ)のデータ構造について、図2を用いて説明する。
始めに、音声出力データのデータ構造について、図2(a)を用いて説明する。なお、本実施形態においてスピーカ23から出力される音声は、次に入力すべき情報の内容を示して当該情報の入力を催促する催促メッセージであり、図2に示すデータ構造は、当該催促メッセージのデータ構造を示すものである。また、図2に示す催促メッセージを出力するための音声データは、予めDVD−ROMディスクDK内に記録されており、必要に応じてDVD−ROMドライブ11を介して読み出されるものである。更に、以下に説明する各メッセージの用い方については、後ほど示すフローチャートと共に説明する。
図2(a)に示すように、実施形態に係る催促メッセージSMは、6段階の階層に分類されている。
そして、最上位の階層である第0階層30の領域50内には、実施形態に係る車両ナビゲーション装置Sの電源がオンとされた直後(具体的には車両のイグニッションスイッチがオンとされた直後)に、「どちらまで行かれますか?」というメッセージを出力するための音声データが格納されている。
次に、第1階層31の領域51内には、上記「どちらまで行かれますか?」という催促メッセージSMの後にスピーカ23を介して出力されるべき「都道府県名、市外局番、登録した住所、ジャンル、最近検索した住所、のいずれかをどうぞ」というメッセージを出力するための音声データが格納されている。
次に、第2階層32の領域52内には、上記領域51内のメッセージのうちの「都道府県名」という語句に対応した「都道府県名をどうぞ」というメッセージのための音声データが格納されている。
次に、第3階層33の領域53内には、上記領域52内のメッセージに対応した「市町村名をどうぞ」というメッセージのための音声データが格納されている。
また、第4階層34の領域54内には、上記領域53内のメッセージに対応した「住所をどうぞ」というメッセージのための音声データが格納されている。
次に、第2階層32の領域55内には、上記領域51内のメッセージのうちの「市外局番」という語句に対応した「市外局番をどうぞ」というメッセージのための音声データが格納されている。
また、第3階層33の領域56内には、上記領域55内のメッセージに対応した「市内局番をどうぞ」というメッセージのための音声データが格納されている。
更に、第4階層34の領域57内には、上記領域56内のメッセージに対応した「残りの番号をどうぞ」というメッセージのための音声データが格納されている。
次に、第2階層32の領域58内には、上記領域51内のメッセージのうちの「登録した住所」という語句及び「最近検索した住所」という語句に対応した「住所をどうぞ」というメッセージのための音声データが格納されている。
また、第3階層33の領域59内には、上記領域58内のメッセージに対応した第1区分のメッセージとして「○○ですか?××ですか?△△ですか?◆◆ですか?◎◎ですか?その他ですか?」というメッセージのための音声データが格納されている。
更に、第3階層33の領域60内には、上記領域58内のメッセージに対応した第2区分のメッセージとして「●●ですか?▲▲ですか?▽▽ですか?□□ですか?◇◇ですか?」というメッセージのための音声データが各区分毎に格納されている。
ここで、上記「○○」、「××」、「△△」、「◆◆」、「◎◎」、「●●」、「▲▲」、「▽▽」、「□□」及び「◇◇」は、夫々に登録された相互に異なる具体的な住所のうち使用頻度の高いもの又は最近検索された相互に異なる具体的な住所を示している。
次に、第2階層32の領域61内には、上記領域51内のメッセージのうちの「ジャンル」という語句に対応した第1区分のメッセージとして「駅ですか?高速道路施設ですか?遊園地ですか?ゴルフ場ですか?スキー場ですか?その他ですか?」というメッセージのための音声データが格納されている。
また、第2階層32の領域62内には、上記「ジャンル」という語句に対応した第2区分のメッセージとして「宿泊施設ですか?病院ですか?教育施設ですか?公園ですか?キャンプですか?その他ですか?」というメッセージのための音声データが格納されている。
更に、第2階層32の領域63内には、上記「ジャンル」という語句に対応した第3区分のメッセージとして「リゾート施設ですか?役所ですか?フェリーターミナルですか?空港ですか?」というメッセージのための音声データが格納されている。
次に、第3階層33の領域64には、上記領域61、62又は63内のメッセージに対応して上記領域52内のメッセージ(「都道府県名をどうぞ」)を出力すべく、当該領域52へアクセスすべき旨の情報が格納されている。
次に、第4階層34の領域65には、上記領域64内の情報に対応して上記領域53内のメッセージ(「市町村名をどうぞ」)を出力すべく、当該領域53へアクセスすべき旨の情報が格納されている。
最後に、第5階層35の領域66には、上記領域65内の情報に対応して上記領域54内のメッセージ(「住所をどうぞ」)を出力すべく、当該領域54へアクセスすべき旨の情報が格納されている。
ここで、以上説明した催促メッセージSMのデータ構造から明らかなように、第2階層32以下の階層内の催促メッセージSMでは、上位の階層内の一の催促メッセージSMに対しては下位の階層内の一の催促メッセージSMのみが関連付けられており、従って、下位の階層にある催促メッセージSMがその上位にある複数の催促メッセージSMに関連付けられていることはない。
次に、認識用ワードのデータ構造について、図2(b)を用いて説明する。なお、本実施形態における認識用ワードは、上述した催促メッセージSMに対応して入力されることが予測される内容の音声を認識するために当該音声の入力を待ち受けるためのワードであり、図2(b)に示すデータ構造は、当該認識用ワードのデータ構造を示すものである。また、図2(b)に示す認識用ワードに対応する音声データは、上記内部辞書として予めDVD−ROMディスクDK内に記録されており、必要に応じてDVD−ROMドライブ11を介して読み出されるものである。更に、以下に説明する各認識用ワードの用い方については、後ほど示すフローチャートと共に説明する。
図2に示すように、実施形態に係る認識用ワードWは、上述した催促メッセージSMの各階層に対応するように5段階の階層に分類されている。
そして、最上位の階層である第1階層40の領域70には、催促メッセージSMにおける領域51内のメッセージに対応して入力される音声の内容を認識するために、「都道府県名」、「市外局番」、「登録した住所」、「ジャンル」及び「最近検索した住所」という語句そのものを示す辞書が格納されている。
次に、第2階層41の領域71には、領域70内のメッセージの内「都道府県名」という語句に関連付けられていると共に、催促メッセージSMにおける領域52内の語句(「都道府県名をどうぞ」)に対応して入力される音声の内容を認識するための都道府県名の実名(「東京都」、「神奈川県」等の実名)示す辞書が格納されている。
また、第3階層42の領域72内には、領域71内の語句に関連付けられていると共に、催促メッセージSMにおける領域53内の語句(「市町村名をどうぞ」)に対応して入力される音声の内容を認識するための市町村名の実名(「品川区」、「横浜市」等の実名)示す辞書が格納されている。
次に、第4階層43の領域73内には、領域72内の語句に関連付けられていると共に、催促メッセージSMにおける領域54内の語句(「住所をどうぞ」)に対応して入力される音声の内容を認識するための具体的な住所名を示す辞書が格納されている。
また、第2階層41の領域74には、領域70内のメッセージの内「市外局番」という語句に関連付けられていると共に、催促メッセージSMにおける領域55内の語句(「市外局番をどうぞ」)に対応して入力される音声の内容を認識するための市外局番号(「03」、「045」等の実際の番号)示す辞書が格納されている。
次に、第3階層42の領域75内には、領域74内の語句に関連付けられていると共に、催促メッセージSMにおける領域56内の語句(「市内局番をどうぞ」)に対応して入力される音声の内容を認識するための市内局番号(「111」、「987」等の実際の番号)示す辞書が格納されている。
更に、第4階層43の領域76内には、領域75内の語句に関連付けられていると共に、催促メッセージSMにおける領域57内の語句(「残りの番号をどうぞ」)に対応して入力される音声の内容を認識するための電話番号(「2345」、「9876」等の実際の残りの番号)を示す辞書が格納されている。
また、第2階層41の領域77内には、領域70内のメッセージの内「登録した住所」という語句及び「最近検索した住所」という語句に関連付けられていると共に、催促メッセージSMにおける領域58内の語句(「住所をどうぞ」)に対応して入力される音声の内容を認識するための具体的な住所名を示す辞書が格納されている。
次に、第3階層42の領域78内には、領域77内の語句に関連付けられていると共に、催促メッセージSMにおける領域59内の語句(「○○ですか?××ですか?△△ですか?◆◆ですか?◎◎ですか?その他ですか?」)に対応して入力される音声の内容を認識するための具体的な「○○」、「××」、「△△」、「◆◆」、「◎◎」及び「その他」という語句そのものを示す辞書が格納されている。
また、第3階層42の領域79内には、領域77内の語句に関連付けられていると共に、催促メッセージSMにおける領域60内の語句(「●●ですか?▲▲ですか?▽▽ですか?□□ですか?◇◇ですか?」)に対応して入力される音声の内容を認識するための具体的な「●●」、「▲▲」、「▽▽」、「□□」及び「◇◇」という語句そのものを示す辞書が格納されている。
次に、第2階層41の領域79には、領域70内のメッセージの内「ジャンル」という語句に関連付けられていると共に、催促メッセージSMにおける領域61内の語句(「駅ですか?高速道路施設ですか?遊園地ですか?ゴルフ場ですか?スキー場ですか?その他ですか?」)に対応して入力される音声の内容を認識するための「駅」、「高速道路施設」、「遊園地」、「ゴルフ場」、「スキー場」及び「その他」という語句そのものを示す辞書が格納されている。
また、第2階層41の領域80には、領域70内のメッセージの内「ジャンル」という語句に関連付けられていると共に、催促メッセージSMにおける領域62内の語句(「宿泊施設ですか?病院ですか?教育施設ですか?公園ですか?キャンプですか?その他ですか?」)に対応して入力される音声の内容を認識するための「宿泊施設」、「病院」、「教育施設」、「公園」、「キャンプ場」及び「その他」という語句そのものを示す辞書が格納されている。
更に、第3階層42の領域82内には、領域79、80又は81内の語句に関連付けられていると共に、催促メッセージSMにおける領域64内の情報に対応して上記領域71内の語句(都道府県名の実名)を用いて音声入力を待ち受けるべく、当該領域71へアクセスすべき旨の情報が格納されている。
次に、第4階層43の領域83内には、領域82内の語句に関連付けられていると共に、催促メッセージSMにおける領域65内の情報に対応して上記領域72内の語句(市町村名の実名)を用いて音声入力を待ち受けるべく、当該領域72へアクセスすべき旨の情報が格納されている。
次に、第5階層44の領域84内には、領域83内の語句に関連付けられていると共に、催促メッセージSMにおける領域66内の情報に対応して上記領域73内の語句(住所の実名)を用いて音声入力を待ち受けるべく、当該領域73へアクセスすべき旨の情報が格納されている。
ここで、以上説明した認識用ワードWのデータ構造から明らかなように、第2階層41以下の階層内の認識用ワードWでは、上位の階層内の一の認識用ワードWに対しては下位の階層内の一の認識用ワードWのみが関連付けられており、従って、下位の階層にある認識用ワードWがその上位にある複数の認識用ワードWに関連付けられていることはない。よって、音声入力の待ち受け時に全ての認識用ワードWを用いて待ち受ける必要がなく、当該待ち受けに際しては上位の階層で選択された語句に関連付けられた下位の階層の語句のみを用いて待ち受ければよい。
なお、上記催促メッセージSMのうち「都道府県名をどうぞ」というメッセージに対応して例えば「品川区」という音声が入力された場合でもこれを認識できるように、第1階層31内の催促メッセージSMを出力した後に音声入力を待ち受けるとき、当該出力された催促メッセージSMに対応する第1階層40内の認識用ワードWだけでなく、当該待ち受けている第1階層内40の認識用ワードWに対応した上記関連性を有する第2階層41、第3階層42、第4階層43及び第5階層44内の各認識用ワードのみをも参照することが可能なデータ構造とされている。
これと同様に、第2階層32内の催促メッセージSMのうち、先に選択された第1階層31内の催促メッセージSMに関連付けられている第2階層32内の催促メッセージSMを出力した後に音声入力を待ち受けるときには、当該出力された催促メッセージSMに対応する第2階層41内の認識用ワードWだけでなく、当該待ち受けている第2階層内41の認識用ワードWに対応した上記関連性を有する第3階層42、第4階層43及び第5階層44内の各認識用ワードのみをも参照することが可能なデータ構造とされている。
更に、第3階層33内の催促メッセージSMのうち、先に選択された第2階層32内の催促メッセージSMに関連付けられている第3階層33内の催促メッセージSMを出力した後に音声入力を待ち受けるときには、当該出力された催促メッセージSMに対応する第3階層42内の認識用ワードWだけでなく、当該待ち受けている第3階層内42の認識用ワードWに対応した上記関連性を有する第4階層43及び第5階層44内の各認識用ワードのみをも参照することが可能なデータ構造とされている。
次に、図2に示したデータ構造を有する催促メッセージSM及び認識用ワードWを用いた本発明に係る情報検索処理について、図3乃至図12に示すフローチャートを用いて説明する。なお、各フローチャートにおいては、例えば、「第1催促音声出力」と示す場合には、上述した催促メッセージSMにおける第1階層31内のメッセージに対応する音声を出力することを示している。また、各フローチャートで示す動作は、DVD−ROMディスクDKに格納されている制御プログラムを読み出すことにより、CPU6の制御の下で実行される動作である。
図3に示すように、実施形態の情報検索処理においては、始めに、車両のイグニッションキー等がオンとされることにより、車両ナビゲーション装置Sの電源が投入されたか否かが判定される(ステップS1)。そして、投入されていない時は(ステップS1;NO)投入されるまで待機し、投入された時は(ステップS1;YES)、次に、RAM8等の初期化を含む初期設定が実行される(ステップS2)。
そして、入力装置10等における入力操作により情報検索モードがスタートされると(ステップS3)、次に、第0催促音声「どちらまで行かれますか?」をスピーカ23を介して出力する(ステップS4)。
次に、当該第0催促音声に対応する音声入力(以下、各催促音声に対応する音声入力を、単に返答と称する。)があったか否かが判定され(ステップS5)、返答があったときは(ステップS5;YES)、当該返答の内容を音声認識デコータ21において認識し(ステップS8)、次に、当該返答内容の認識用ワードWにおける階層を判別する(ステップS9)。ステップS9の内容については、後述する。
一方、ステップS5の判定において、予め設定された所定時間返答がないときは(ステップS5;NO)、次に、第1催促音声「都道府県名、市外局番、登録した住所、最近検索した住所、ジャンル、のいずれかをどうぞ」をスピーカ23を介して出力する(ステップS6)。そして、返答があったか否かを判定し(ステップS7)、予め設定された所定時間返答がないときは(ステップS7;NO)運転者に情報検索処理をする意志がないものとして情報検索処理を終了し、ステップS7において返答があったときは(ステップS7;YES)、上記ステップS8に移行して返答の内容を認識し、ステップS9に移行する。
次に、図4を用いてステップS9の階層判別の内容について説明する。
ステップS9の階層判別処理においては、始めに、ステップS5における返答が認識用ワードWにおける第1階層40内に含まれている語句であるか否かが判定され(ステップS10)、第1階層40内の語句であるときは(ステップS10;YES)、後述するステップS20に移行する。
一方、ステップS10の判定において、第1階層40内に含まれている語句でないときは(ステップS10;NO)、次に、ステップS5における返答が、都道府県を示す実名(例えば、「東京都」又は「神奈川県」等の実名)であるか否かが判定される(ステップS11)。
そして、都道府県を示す実名であったときは(ステップS11;YES)、後述するステップS32に移行する。また、都道府県を示す実名でなかったときは(ステップS11;NO)、次に、ステップS5における返答が、市町村を示す実名(例えば、「品川区」又は「横浜市」等の実名)であるか否かが判定される(ステップS12)。
そして、市町村を示す実名であったときは(ステップS12;YES)、後述するステップS73に移行する。また、市町村を示す実名でなかったときは(ステップS12;NO)、次に、ステップS5における返答が、施設又は場所を示す実名(例えば、「東京ドーム」又は「横浜スタジアム」等の実名)であるか否かが判定される(ステップS13)。
そして、施設又は場所を示す実名であったときは(ステップS13;YES)、次に、当該示されている施設又は場所が存在する地図を表示すべく、当該施設又は場所を含む地図を検索し、検索された地図に対応する地図データをDVD−ROMディスクDKから読み出して表示して(ステップS17)処理を終了する。
一方、ステップS13の判定において、ステップS5における返答が施設名又は場所名でもないときは(ステップS13;NO)、次に、ステップS5における返答が、電話番号における市外局番を示す番号(数字)(例えば、「03」又は「045」等の数字)であるか否かが判定される(ステップS14)。
そして、市外局番を示す数字であったときは(ステップS14;YES)、後述するステップS51に移行する。また、市外局番を示す数字でなかったときは(ステップS14;NO)、次に、ステップS5における返答が、予め登録されている目的地点を示す実名(例えば、「中華街」又は「六本木」等の実名)であるか否かが判定される(ステップS15)。
そして、登録されている目的地点名であったときは(ステップS15;YES)、ステップS17に移行して検索及び地図表示を行い、登録されている目的地点名でないときは(ステップS15;NO)、次に、ステップS5における返答が、最近検索されて記憶されている場所を示す実名であるか否かが判定される(ステップS16)。
そして、最近検索された場所であったときは(ステップS16;YES)、ステップS17に移行して検索及び地図表示を行い、検索された場所でないときは(ステップS16;NO)、上記ステップS6に移行して今までの処理を繰り返す。
次に、上記ステップS10において、ステップS5における返答が第1階層40内に含まれる内容であった場合の処理について、図5を用いて説明する。
図5に示すように、ステップS10の判定において、ステップS5における返答が第1階層40内に含まれる内容であったときは(ステップS10;YES)、次に、当該返答が「都道府県名」という語句であるか否かが判定される(ステップS20)。そして、「都道府県名」という語句であったときは(ステップS20;YES)、後述するステップS25以降の処理に移行する。
一方、「都道府県名」という語句でなかったときは(ステップS20;NO)、次に、ステップS5における返答が「市外局番」という語句であるか否かが判定される(ステップS21)。そして、「市外局番」という語句であったときは(ステップS21;YES)、後述するステップS47以降の処理に移行する。
一方、「市外局番」という語句でなかったときは(ステップS21;NO)、次に、ステップS5における返答が「登録した住所」という語句であるか否かが判定される(ステップS22)。そして、「登録した住所」という語句であったときは(ステップS22;YES)、後述するステップS90以降の処理に移行する。
一方、「登録した住所」という語句でなかったときは(ステップS22;NO)、次に、ステップS5における返答が「ジャンル名」という語句であるか否かが判定される(ステップS23)。そして、「ジャンル名」という語句であったときは(ステップS23;YES)、後述するステップS59以降の処理に移行する。
一方、「ジャンル名」という語句でなかったときは(ステップS23;NO)、ステップS5における返答は「最近検索した場所」であると判定して(ステップS24)、後述するステップS100以降の処理に移行する。
次に、上記ステップS20において、ステップS5における返答が「都道府県名」という語句であった場合の処理について、図6を用いて説明する。
図6に示すように、ステップS20の判定において、ステップS5における返答が「都道府県名」という語句であったときは(ステップS20;YES)、次に、「都道府県名をどうぞ」という催促メッセージを出力した回数を示すパラメータiを初期化し(ステップS25)、第2催促音声「都道府県名をどうぞ」をスピーカ23を介して出力する(ステップS26)。
そして、返答があったか否かを判定し(ステップS27)、予め設定された所定時間返答がなかったときは(ステップS27;NO)、次に、上記パラメータiを1だけインクリメントし(ステップS28)、インクリメント後のパラメータiの値が「2」となっているか否かを判定し(ステップS29)、「2」であるときは(ステップS29;YES)、同じ「都道府県名をどうぞ」という催促メッセージを2回出力したにも拘わらず返答がないこととなるので、運転者に情報検索する意志がないと判定して処理を終了する。
一方、ステップS29の判定において、パラメータiが「2」でないときは、再度「都道府県名をどうぞ」の催促メッセージを出力すべくステップS26に戻る。
また、ステップS27の判定において、「都道府県名をどうぞ」の催促メッセージに対して返答があったときは(ステップS27;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS30)、当該認識した内容の階層を判別する(ステップS31)。ステップS31の具体的な処理については、後述する。
そして、ステップS30で認識された返答内容が階層が判別されると、次に、第3催促音声「市町村名をどうぞ」をスピーカ23を介して出力する(ステップS32)。
そして、返答があったか否かを判定し(ステップS33)、予め設定された所定時間返答がなかったときは(ステップS33;NO)、ステップS30で認識した内容のうち都道府県名を示す語句に基づいて当該語句で示される都道府県を含む地図を検索し、検索された地図に対応する地図データをDVD−ROMディスクDKから読み出して表示して(ステップS34)処理を終了する。
一方、ステップS33の判定において、「市町村名をどうぞ」の催促メッセージに対して返答があったときは(ステップS33;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS35)、当該認識した内容の階層を判別する(ステップS36)。ステップS36の具体的な処理についても後述する。
そして、ステップS35で認識された返答内容が階層が判別されると、次に、第4催促音声「残りの住所をどうぞ」をスピーカ23を介して出力する(ステップS37)。
そして、返答があったか否かを判定し(ステップS38)、予め設定された所定時間返答がなかったときは(ステップS38;NO)、ステップS35で認識した内容のうち市町村名を示す語句に基づいて当該語句で示される市町村を含む地図を検索し、検索された地図に対応する地図データをDVD−ROMディスクDKから読み出して表示して(ステップS39)処理を終了する。
一方、ステップS38の判定において、「残りの住所をどうぞ」の催促メッセージに対して返答があったときは(ステップS38;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS40)、ステップS17に移行して当該認識した内容に基づいて地図データを検索して表示する。
次に、上記ステップS31及びS36における階層判別処理の内容について、図7を用いて説明する。
始めに、ステップS31における階層判別処理の内容について図7(a)を用いて説明すると、ステップS31においては、先ず、ステップS27における返答が都道府県名を示す実名であるか否かが判定され(ステップS42)、都道府県名を示す実名であったときは(ステップS42;YES)、そのまま上記ステップS32へ移行して上述した動作を繰り返し、一方、都道府県名を示す実名でなかったときは(ステップS42;NO)、次に、ステップS27における返答が市町村名を示す実名であるか否かが判定され(ステップS43)、市町村名を示す実名であったときは(ステップS43;YES)、そのまま上記ステップS37へ移行して上述した動作を繰り返し、一方、市町村名を示す実名でなかったときは(ステップS43;NO)、次に、ステップS27における返答が施設名又は場所名を示す実名であるか否かが判定され(ステップS44)、施設名又は場所名を示す実名であったときは(ステップS44;YES)、そのまま上記ステップS17へ移行して当該施設名又は場所名に基づいて地図データの検索及び対応する地図の表示を行い、一方、施設名又は場所名を示す実名でなかったときは(ステップS44;NO)、そのまま上記ステップS25へ移行して上述した動作を繰り返す。
次に、ステップS36における階層判別処理の内容について図7(b)を用いて説明すると、ステップS36においては、先ず、ステップS33における返答が市町村名を示す実名であるか否かが判定され(ステップS45)、市町村名を示す実名であったときは(ステップS45;YES)、そのまま上記ステップS37へ移行して上述した動作を繰り返し、一方、市町村名を示す実名でなかったときは(ステップS45;NO)、次に、ステップS33における返答が施設名又は場所名を示す実名であるか否かが判定され(ステップS46)、施設名又は場所名を示す実名であったときは(ステップS46;YES)、そのまま上記ステップS17へ移行して当該施設名又は場所名に基づいて地図データの検索及び対応する地図の表示を行い、一方、施設名又は場所名を示す実名でなかったときは(ステップS46;NO)、そのまま上記ステップS25へ移行して上述した動作を繰り返す。
次に、上記ステップS21において、ステップS5における返答が「市外局番」という語句であった場合の処理について、図8を用いて説明する。
図8に示すように、ステップS21の判定において、ステップS5における返答が「市外局番」という語句であったときは(ステップS21;YES)、次に、第1催促音声「市外局番をどうぞ」をスピーカ23を介して出力する(ステップS47)。
そして、返答があったか否かを判定し(ステップS48)、予め設定された所定時間返答がなかったときは(ステップS48;NO)、再度ステップS47に戻って第1催促音声「市外局番をどうぞ」を出力し、返答があったときは(ステップS48;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS49)、当該認識した内容が市外局番号か否かを判定する(ステップS50)。
そして、市外局番号でないときは(ステップS50;NO)、再びステップS47に戻って第2催促音声「市外局番をどうぞ」を出力し、市外局番号であったときは(ステップS50;YES)、次に、第3催促音声「市内局番をどうぞ」をスピーカ23を介して出力する(ステップS51)。
そして、返答があったか否かを判定し(ステップS52)、予め設定された所定時間返答がなかったときは(ステップS52;NO)、再度ステップS51に戻って第3催促音声「市内局番をどうぞ」を出力し、返答があったときは(ステップS52;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS53)、当該認識した内容が市内局番号か否かを判定する(ステップS54)。
そして、市内局番号でないときは(ステップS54;NO)、再びステップS51に戻って第3催促音声「市内局番をどうぞ」を出力し、市内局番号であったときは(ステップS54;YES)、次に、第4催促音声「残りの番号をどうぞ」をスピーカ23を介して出力する(ステップS55)。
そして、返答があったか否かを判定し(ステップS56)、予め設定された所定時間返答がなかったときは(ステップS56;NO)、再度ステップS55に戻って第4催促音声「残りの番号をどうぞ」を出力し、返答があったときは(ステップS56;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS57)、当該認識した内容が残りの番号か否かを判定する(ステップS58)。
そして、残りの番号でないときは(ステップS58;NO)、再びステップS55に戻って第4催促音声「残りの番号をどうぞ」を出力し、残りの番号であったときは(ステップS58;YES)、ステップS17に戻って入力された電話番号(ステップS48、S52及びS56)に基づいて地図データの検索及び対応する地図の表示を行う。
次に、上記ステップS23において、ステップS5における返答が「ジャンル名」という語句であった場合の処理について、図9を用いて説明する。
図9に示すように、ステップS23の判定において、ステップS5における返答が「ジャンル名」という語句であったときは(ステップS23;YES)、次に、ジャンル名に対応する第2催促音声のうち、第1区分である「駅ですか?高速道路施設ですか?遊園地ですか?ゴルフ場ですか?スキー場ですか?その他ですか?」をスピーカ23を介して出力する(ステップS59)。
そして、返答があったか否かを判定し(ステップS60)、予め設定された所定時間返答がなかったときは(ステップS60;NO)、後述するステップS78に移行する。
一方、ステップS60の判定において、返答があったときは(ステップS60;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS61)、当該認識した内容が「その他」という語句か否かを判定する(ステップS62)。そして、「その他」という語句であったときは(ステップS62;YES)、次に、ジャンル名に対応する第2催促音声のうち、第2区分である「宿泊施設ですか?病院ですか?教育施設ですか?公園ですか?キャンプですか?その他ですか?」をスピーカ23を介して出力する(ステップS78)。
そして、返答があったか否かを判定し(ステップS79)、予め設定された所定時間返答がなかったときは(ステップS79;NO)、後述するステップS82に移行する。
一方、ステップS79の判定において、返答があったときは(ステップS79;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS80)、当該認識した内容が「その他」という語句か否かを判定する(ステップS81)。そして、「その他」という語句であったときは(ステップS81;YES)、次に、ジャンル名に対応する第2催促音声のうち、第3区分である「リゾート施設ですか?役所ですか?フェリーターミナルですか?空港ですか?」をスピーカ23を介して出力する(ステップS82)。
そして、返答があったか否かを判定し(ステップS83)、予め設定された所定時間返答がなかったときは(ステップS83;NO)、上記ステップS59に戻って上述した動作を繰り返す。
一方、ステップS83の判定において、返答があったときは(ステップS83;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS84)、ステップS63に移行する。
また、ステップS62又はステップS81の判定において、認識した内容が「その他」という語句でないときは(ステップS62;NO又はS81;NO)、次に、第3催促音声「都道府県名をどうぞ」をスピーカ23を介して出力する(ステップS63)。
そして、返答があったか否かを判定し(ステップS64)、予め設定された所定時間返答がなかったときは(ステップS64;NO)ステップS67に移行し、一方、返答があったときは(ステップS64;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS65)、当該認識した内容の階層を判別する(ステップS66)。ステップS66の具体的な処理については、後述する。
そして、ステップS66で認識された返答内容の階層が判別されると、次に、第4催促音声「市町村名をどうぞ」をスピーカ23を介して出力する(ステップS67)。
そして、返答があったか否かを判定し(ステップS68)、返答があったときは(ステップS68;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS71)、当該認識した内容の階層を判別する(ステップS72)。ステップS72の具体的な処理については、後述する。
一方、ステップS68の判定において、予め設定された所定時間返答がなかったときは(ステップS68;NO)、次に、上記ステップS65において返答認識が為されているか否かが判定され(ステップS69)、返答認識されているときは(ステップS69;YES)、当該認識されている都道府県名を示す語句に基づいて当該語句で示される都道府県を含む地図を検索し、検索された地図に対応する地図データをDVD−ROMディスクDKから読み出して表示して(ステップS70)処理を終了する。
一方、ステップS69の判定において、返答認識がされていないとき又はステップS72における階層判別が完了したときは、次に、第5催促音声「住所又は施設名をどうぞ」をスピーカ23を介して出力する(ステップS73)。
そして、返答があったか否かを判定し(ステップS74)、予め設定された所定時間返答がなかったときは(ステップS74;NO)、次に、上記ステップS71において返答認識が為されているか否かが判定され(ステップS75)、返答認識されているときは(ステップS75;YES)、当該認識されている市町村名を示す語句に基づいて当該語句で示される都道府県を含む地図を検索し、検索された地図に対応する地図データをDVD−ROMディスクDKから読み出して表示して(ステップS70)処理を終了する。
一方、ステップS75の判定において、返答認識がされていないときは(ステップS75;NO)、次に、上記ステップS65において返答認識が為されているか否かが判定され(ステップS76)、返答認識されているときは(ステップS76;YES)、当該認識されている都道府県名を示す語句に基づいて当該語句で示される都道府県を含む地図を検索し、検索された地図に対応する地図データをDVD−ROMディスクDKから読み出して表示して(ステップS70)処理を終了する。
また、ステップS76の判定において、返答認識がされていないときは(ステップS76;NO)、上記ステップS73に戻って上述した動作を繰り返す。
更に、ステップS74の判定において、返答があったときは(ステップS74;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS77)、ステップS17に戻って入力された住所又は施設名に基づいて地図データの検索及び対応する地図の表示を行う。
次に、上記ステップS66及びS72における階層判別処理の内容について、図10を用いて説明する。
始めに、ステップS66における階層判別処理の内容について図10(a)を用いて説明すると、ステップS66においては、先ず、ステップS64における返答が都道府県名を示す実名であるか否かが判定され(ステップS85)、都道府県名を示す実名であったときは(ステップS85;YES)、そのまま上記ステップS67へ移行して上述した動作を繰り返し、一方、都道府県名を示す実名でなかったときは(ステップS85;NO)、次に、ステップS64における返答が市町村名を示す実名であるか否かが判定され(ステップS86)、市町村名を示す実名であったときは(ステップS86;YES)、そのまま上記ステップS73へ移行して上述した動作を繰り返し、一方、市町村名を示す実名でなかったときは(ステップS86;NO)、次に、ステップS64における返答が施設名又は場所名を示す実名であるか否かが判定され(ステップS87)、施設名又は場所名を示す実名であったときは(ステップS87;YES)、そのまま上記ステップS17へ移行して当該施設名又は場所名に基づいて地図データの検索及び対応する地図の表示を行い、一方、施設名又は場所名を示す実名でなかったときは(ステップS87;NO)、そのまま上記ステップS63へ移行して上述した動作を繰り返す。
次に、ステップS72における階層判別処理の内容について図10(b)を用いて説明すると、ステップS72においては、先ず、ステップS68における返答が市町村名を示す実名であるか否かが判定され(ステップS88)、市町村名を示す実名であったときは(ステップS88;YES)、そのまま上記ステップS73へ移行して上述した動作を繰り返し、一方、市町村名を示す実名でなかったときは(ステップS88;NO)、次に、ステップS68における返答が施設名又は場所名を示す実名であるか否かが判定され(ステップS89)、施設名又は場所名を示す実名であったときは(ステップS89;YES)、そのまま上記ステップS17へ移行して当該施設名又は場所名に基づいて地図データの検索及び対応する地図の表示を行い、一方、施設名又は場所名を示す実名でなかったときは(ステップS89;NO)、そのまま上記ステップS73へ移行して上述した動作を繰り返す。
次に、上記ステップS22において、ステップS5における返答が「登録した住所」という語句であった場合の処理について、図11を用いて説明する。
図11に示すように、ステップS23の判定において、ステップS5における返答が「登録した住所」という語句であったときは(ステップS22;YES)、次に、第2催促音声「住所をどうぞ」をスピーカ23を介して出力する(ステップS90)。
そして、返答があったか否かを判定し(ステップS91)、予め設定された所定時間返答がなかったときは(ステップS91;NO)後述するステップS93に移行し、一方、返答があったときは(ステップS91;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS92)、上述したステップS31と同様の階層判別処理を実行する。
一方、ステップS91の判定において、予め設定された所定時間返答がないときは(ステップS91;NO)、次に、登録した住所に対応する第3催促音声のうち、第1区分である「○○ですか?××ですか?△△ですか?◆◆ですか?◎◎ですか?その他ですか?」をスピーカ23を介して出力する(ステップS93)。
そして、返答があったか否かを判定し(ステップS94)、予め設定された所定時間返答がなかったときは(ステップS94;NO)、後述するステップS97に移行する。
一方、ステップS94の判定において、返答があったときは(ステップS94;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS95)、当該認識した内容が「その他」という語句か否かを判定する(ステップS96)。そして、「その他」という語句でないときは(ステップS96;NO)ステップS31に移行し、一方、「その他」という語句であったときは(ステップS96;YES)、次に、登録した住所に対応する第3催促音声のうち、第2区分である「●●ですか?▲▲ですか?▽▽ですか?□□ですか?◇◇ですか?」をスピーカ23を介して出力する(ステップS97)。
そして、返答があったか否かを判定し(ステップS98)、予め設定された所定時間返答がなかったときは(ステップS98;NO)、上記ステップS90に戻って上述した動作を繰り返す。
一方、ステップS98の判定において、返答があったときは(ステップS98;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS99)、ステップS31して上述した階層判別を実行する。
次に、上記ステップ24の処理に引き続いて実行される処理について、図12を用いて説明する。
図12に示すように、ステップS24において、ステップS5における返答が「最近検索した住所」という語句であると判定されると、次に、第2催促音声「住所をどうぞ」をスピーカ23を介して出力する(ステップS100)。
そして、返答があったか否かを判定し(ステップS101)、予め設定された所定時間返答がなかったときは(ステップS101;NO)後述するステップS103に移行し、一方、返答があったときは(ステップS101;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS102)、上述したステップS31と同様の階層判別処理を実行する。
一方、ステップS101の判定において、予め設定された所定時間返答がないときは(ステップS101;NO)、次に、最近検索した場所に対応する第3催促音声のうち、第1区分である「○○ですか?××ですか?△△ですか?◆◆ですか?◎◎ですか?その他ですか?」をスピーカ23を介して出力する(ステップS103)。
そして、返答があったか否かを判定し(ステップS104)、予め設定された所定時間返答がなかったときは(ステップS104;NO)、後述するステップS107に移行する。
一方、ステップS104の判定において、返答があったときは(ステップS104;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS105)、当該認識した内容が「その他」という語句か否かを判定する(ステップS106)。そして、「その他」という語句でないときは(ステップS106;NO)ステップS31に移行し、一方、「その他」という語句であったときは(ステップS106;YES)、次に、最近検索した場所に対応する第3催促音声のうち、第2区分である「●●ですか?▲▲ですか?▽▽ですか?□□ですか?◇◇ですか?」をスピーカ23を介して出力する(ステップS107)。
そして、返答があったか否かを判定し(ステップS108)、予め設定された所定時間返答がなかったときは(ステップS108;NO)、上記ステップS100に戻って上述した動作を繰り返す。
一方、ステップS108の判定において、返答があったときは(ステップS108;YES)、次に当該返答を音声認識デコーダ21において認識し(ステップS109)、ステップS31して上述した階層判別を実行する。
以上説明したように、実施形態の車両ナビゲーション装置Sにおける情報検索処理によれば、入力された音声情報の階層を判定し、判定した階層に基づいて目的地点を検索するので、例えば、階層順に目的地点を検索したり、又は一又は複数の階層を超越して階層を移行しつつ目的地点を検索すること等が可能となる。
また、第n+1(nは2以上4以下の自然数)階層に属する夫々の認識用ワードWが、第n階層に含まれる認識用ワードWのうちいずれか一の認識用ワードWにのみ対応づけられて構成されているので、上位の階層における認識用ワードWが異なれば、当該認識用ワードWに対応づけられている下位の階層の認識用ワードW候補情報も異なることとなり、多種類の認識用ワードWを含んで階層構造を構成することができる。
更に、第p階層(pは5以下の自然数)の催促メッセージSMに対応して入力された音声情報の属する階層が第p階層であると判定されたとき、第p+1階層に属する音声情報を入力する旨の催促メッセージSMを次にスピーカ23を介して出力すると共に、第p階層の催促メッセージSMに対応して入力された音声情報の属する階層が第p+q(p+qは4以下の自然数)階層であると判定されたとき、第(p+q+1)階層に属する音声情報を入力する旨の催促メッセージSMを次にスピーカ23を介して出力するので、階層構造の順を追って目的地点を検索することもできるし、一又は複数の階層を超越しつつ目的地点を検索することもできる。
更にまた、出力された催促メッセージSMで示される階層に属する音声情報の入力がないとき、当該催促メッセージSMに対して一つ下位の階層の音声情報の入力を催促する催促メッセージSMが出力されるので、短時間で迅速に所望の目的地点を検索することができる。
また、登録した住所又は最近検索した住所に対応する第3階層42に属する認識用ワードWが二つの区分に分けられて出力されるので、一回の催促メッセージSMを出力するための時間を短縮化することができると共に、一の階層に属する全ての認識用ワードWに対応する催促メッセージSMを出力することなく所望の音声情報を入力させることができる。
更に、音声により情報の入出力が行えるので、情報検索処理の利便性が更に向上する。
また、図2で示す認識用ワードWにおいて、例えば、第1階層40内の一の認識用ワードWが選択されたときには、第2階層41以下の階層に含まれている認識用ワードWについて、当該選択された第1階層40内の認識用ワードWに関連付けられている認識用ワードWのみを用いて音声の入力を待ち受けるので、待ち受けのための認識用ワードWの数を縮小化することができ、返答認識時の誤認識を抑制することができる。
更に、各階層内の認識用ワードWについて、その使用頻度を記録し、使用頻度の高い認識用ワードWほど優先的に待ち受けに使用したり、或いは、現在待ち受けに用いられている認識用ワードWに近い内容の認識用ワードWほど優先的に返答認識に使用することとすれば、返答認識に使用される認識用ワードWの数を更に縮小化することができ、返答認識における誤認識を更に低減することができる。
なお、上述の実施形態においては、車両ナビゲーション装置Sに本発明を適用した場合について説明したが、これ以外に、例えば、航空機用のナビゲーション装置や船舶用のナビゲーション装置に適用するも可能である。