JP3925368B2 - 制御システム - Google Patents
制御システム Download PDFInfo
- Publication number
- JP3925368B2 JP3925368B2 JP2002271701A JP2002271701A JP3925368B2 JP 3925368 B2 JP3925368 B2 JP 3925368B2 JP 2002271701 A JP2002271701 A JP 2002271701A JP 2002271701 A JP2002271701 A JP 2002271701A JP 3925368 B2 JP3925368 B2 JP 3925368B2
- Authority
- JP
- Japan
- Prior art keywords
- facility
- control system
- landmark
- recognized
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Traffic Control Systems (AREA)
- Navigation (AREA)
Description
【発明の属する技術分野】
本発明は、使用者が発話した音声の認識結果としての施設の名称に基づいて所定の機器を動作させる制御システムに関する。
【0002】
【従来の技術】
従来より、現在地から目的地までの適切な経路(目的地経路)を設定し、その目的地経路を、GPS等により検出した現在位置と共にディスプレイ上に表示して経路案内する車載用のナビゲーションシステムが知られており、より円滑なドライブに寄与している。この際、目的地は利用者自身が入力するようになっている。この入力方法として、例えばディスプレイにおけるメニュー表示から階層的に目的地を検索して、所望の目的地が表示されればそれを指定する、といったものもあるが、例えばタッチスイッチ、リモコン、ハードキーなどを介した手入力が必要となる。そのため、ユーザの利便性を考えて音声によっても目的地を入力ができるようにされていることも多い。特に、いわゆるカーナビゲーションシステムを運転者自身が使用する場合には、スイッチ操作や画面注視などの動作を伴わないので車両の走行中に行っても安全性が高いため、有効な入力方法である。そして、このような音声入力の場合には、適切に音声認識がなされているか否かをユーザが確認できるようにするため、音声認識結果を音声にて出力(いわゆるトークバック)するのが一般的である。このトークバックの内容をユーザが確認し、もしも自分が発した言葉が誤って認識されていたならば再度音声入力する、という対処ができることとなる。
【0003】
なお、上述したトークバックは、音声入力可能なカーナビゲーションシステムにおいては通常行われる一般的な動作であり、公知・公用の技術に該当するので、特に先行技術文献は開示しない。
【0004】
【発明が解決しようとする課題】
しかしながら、従来の音声によるトークバックは、音声認識した結果をそのまま音声出力しているだけであり、つまりユーザが音声入力した目的地の施設名称などをトークバックするのみである。そのため、特に施設名称を音声入力する場合は、正しく認識されていても実際にはユーザの意図しない目的地が設定されてしまう可能性もある。例えば同じ名称の施設が別の場所にも存在する場合、ディスプレイにて地図上で表示すれば、ユーザは周辺の状況も加味して自分が意図している目的地であるか否かが分かるが、トークバックの場合はそのような周辺状況が分からない。したがって、ユーザとしては自分が音声入力した施設名称が正しくトークバックされているため、自分の意図した施設が目的地に設定されていると思ってしまう。それにもかかわらず、実際には同じ名称の別の場所の施設が目的地としてされ、ユーザにとっては無意味な経路が設定されてしまう可能性もある。
【0005】
また、このような事態は経路案内には限られず、例えば施設を指定することで当該施設を含む地図を表示させる場合や、例えば店舗や駐車場などの施設においてその営業時間や料金といった詳しい情報を報知する場合などにおいても同様である。
【0006】
そこで本発明は、使用者が発話した音声の認識結果としての施設の名称に基づいて所定の機器を動作させる制御システムにおいて、当該施設がユーザの意図したものか否かを容易に判断できるトークバックを実現することを目的とする。
【0007】
【課題を解決するための手段及び発明の効果】
本発明の制御システムは、使用者が発話した音声を音声入力手段を介して入力し、音声認識手段にて認識した結果としての施設の名称に基づいて所定の機器を動作させる。例えば請求項6に示すように施設を経路案内のための目的地として設定したり、請求項7に示すように施設を含む地図を表示したり、請求項8に示すように施設に関する情報を報知したりすることなどが考えられる。しかし、従来手法のように単に施設名称をトークバックするだけでは、制御システム側が認識している施設とユーザが認識している施設とが一致しない場合もあり得る。
【0008】
そこで本発明の制御システムによれば、認識した施設の存在位置が把握可能な地理的情報を地図データを用いて取得し、その地理的情報を、音声認識手段にて認識した施設の名称と共にトークバックする。このようにトークバックされた施設周辺の地理的情報に基づいて、ユーザは自分が意図している施設が正しく認識されているのか否かを判断することができる。
【0009】
そして、本発明の制御システムのトークバック手段がトークバックする地理的情報は、認識した施設の周辺に存在する所定の目印用施設との地理的関係を示す情報である。例えば認識した施設の住所をトークバックすることも考えられるが、必ずしもユーザが施設の存在する住所を知っているとは限らない。たとえその施設に過去行ったことがあったとしても、その住所を覚えているとは限らない。むしろその施設周辺の状況の方は覚えているが住所は覚えていない、といったことの方が多い。したがって、本発明のように、認識した施設の周辺に存在する所定の目印用施設との地理的関係を示す情報をトークバックすることが好ましい。例えば学校やデパート、スタジアムといった比較的大きな建造物による施設であれば、目印になり易い。もちろん大きさだけではなく、交番、コンビニエンスストア、ガソリンスタンドといった比較的小さな施設であっても、目印にはなる。そして、交差点も有効な目印になり得る。交差点には交差点名称が信号機に取り付けられていたりして、その名称はユーザの記憶に残りやすいと考えられる。特に自動車を運転している場合にはなおさらである。したがって、「〜交差点角」といった地理的関係をトークバックした場合、ユーザは該当する交差点が自分の意図する施設の近くにあったものなのか、全く的はずれであるものなのかを容易に理解できることが期待される。
ここで、トークバック手段は、請求項2に示すように、音声認識手段にて認識した施設から所定範囲内に目印用施設がある場合に限り、その目印用施設との地理的関係を示す情報を、音声認識手段にて認識した施設の名称と共にトークバックすることが考えられる。また、請求項3に示すように、音声認識手段にて認識した施設から所定範囲に目印用施設がない場合、その施設の住所を、音声認識手段にて認識した施設の名称と共にトークバックするようにしてもよい。
【0010】
また、このような目印用施設との地理的関係を示す情報は、例えば請求項4に示すように、距離が相対的に近い場合と遠い場合とでその表現方法を異ならせることも有効である。例えば相対的に遠ければ「〜付近」と表現し、相対的に近ければ「〜角」「〜前」「〜隣」「〜北」などと表現するのである。このようにトークバックすれば、ユーザは位置関係をイメージし易い。
【0011】
また、目印用施設が複数存在する場合、全ての目印用施設との地理的関係を示す情報をトークバックしてもよいが、例えば本システムをカーナビゲーションシステムとして実現する場合、運転中のユーザに対してあまり多くの情報をトークバックするのは好ましくない。そこで、本発明の制御システムにおいては、両者の距離に基づいて所定数の目印用施設のみとの地理的関係を示す情報をトークバックする。例えば認識した施設に近い順に2つ選択してもよいし、最も近いものと最も遠いものを選択しても良い。これら2つの目印用施設の内のいずれか一方でも覚えていれば、認識した施設の適否が判断できるからである。もちろん、適用する制御システムによっては3つ以上トークバックしてもよい。
【0012】
一方、請求項5に示すように、制御システムが移動体に搭載されている場合、認識した施設との関係で目印用施設が複数存在する場合は、移動体の性質に応じた目印としての機能を加味した優先度の高さに基づいて所定数の目印用施設のみとの地理的関係を示す情報をトークバックすることが考えられる。これは、制御システムの適用先に応じた適切な目印用施設は異なる可能性があることを鑑みたものである。例えば移動体としての自動車に制御システムが搭載されている場合、自動車を運転しているユーザにとって認識し易い目印用施設というものがあるため、それを考慮した目印用施設との地理的関係を示す情報をトークバックするのである。
【0013】
【発明の実施の形態】
以下、本発明が適用された実施例について図面を用いて説明する。なお、本発明の実施の形態は、下記の実施例に何ら限定されることなく、本発明の技術的範囲に属する限り、種々の形態を採り得ることは言うまでもない。
【0014】
本実施例では車載用のナビゲーションシステムに適用しているので、そのナビゲーションシステム1の概略構成を図1を参照して説明する。本ナビゲーションシステム1は、位置検出部11、地図データ格納部12、スイッチ情報入力部13、表示部14、メモリ部15、音声出力部16、音声入力部17、制御部20などを備えている。
【0015】
前記位置検出部11は、周知のジャイロスコープ、距離センサ、衛星からの電波に基づいて車両の位置を検出するGPS(GlobalPositioning System)のためのGPS受信機などを有している。これらのセンサ等は各々が性質の異なる誤差を持っているため、複数のセンサにより各々補間しながら使用するように構成されている。なお、精度によっては上述した内の一部で構成してもよく、さらに、地磁気センサ、ステアリングの回転センサや各転動輪の車輪センサ等を用いてもよい。
【0016】
また、前記地図データ格納部12は、地図データ記憶手段に相当し、位置検出の精度向上のためのいわゆるマップマッチング用データ、地図データを含む各種データを格納しておく部分である。道路データは、交差点等の複数のノード間をリンクにより接続して地図を構成したものであって、それぞれのリンクに対し、リンクを特定する固有番号(リンクID)、リンクの長さを示すリンク長、リンクの始端と終端とのx,y座標、リンクの道路幅、および道路種別(有料道路等の道路情報を示すもの)のデータからなるリンク情報を記憶している。また、地図データには、このような道路データ以外に、住所や交差点、施設を示す文字・記号等で構成される表示アイテムデータも含まれている。この表示アイテムデータは対応する位置情報を有しており、道路地図上の該当位置にこれら表示アイテム(を構成する文字・記号)を重ねて表示させることができる。またここで言うところの施設は、地図上に表示可能な施設であって、施設ジャンル及び地図上に表示する場合の施設位置等を含んでいる。なお、記憶媒体としては、CD−ROM、DVD−ROM又はハードディスクなどを用いるのが一般的であるが、メモリカード等の他の媒体を用いても良い。また当然ではあるが、これらの記憶媒体からデータを読み出す必要があるので、CDプレーヤやDVDプレーヤも備えられている。
【0017】
スイッチ情報入力部13は、例えば表示部14のディスプレイ装置と一体になったタッチスイッチや、ディスプレイ装置の周囲に取り付けられたメカニカルなスイッチ、あるいは後述するトークスイッチなどで構成され、各種入力に使用される。タッチスイッチは、表示画面上に縦横無尽に配置された赤外線センサより構成されており、例えば指やタッチペンなどでその赤外線を遮断すると、その遮断した位置が2次元座標値(X,Y)として検出される。なお、図示しないリモコンによって各種入力を行うようにしてもよく、その場合にはリモコンセンサを準備すればよい。
【0018】
また、表示部14は、その表示画面に、位置検出部11から入力された車両現在位置マークと、地図データ格納部12から入力された地図データと、さらに地図上に表示する誘導経路や後述する設定地点の目印等の付加データとを重ねて表示することができる。
【0019】
また、メモリ部15は、ナビゲーション機能に係る各種処理を実行するためのプログラムを記憶しており、またプログラムを実行する際のワークメモリとしても用いられる。さらに、地図データ格納部12から取得した地図データなどを一時的に格納しておくためにも用いられる。
【0020】
また、音声出力部16は、スピーカを介し、音声にて走行案内をユーザ(運転者など)に報知するように構成されている。したがって、表示部14による表示と音声出力部16からの音声出力との両方で、ユーザに走行案内することができる。
【0021】
また、音声入力部17は、音声入力手段に相当し、ユーザが発した音声をマイクロフォンを介して入力し、その音声信号をデジタルデータに変換して制御部20に入力する。
次に、制御部20について説明する。制御部20は通常のコンピュータとして構成されており、内部には、周知のCPU、ROM、RAM、I/Oおよびこれらの構成を接続するバスラインが備えられているのであるが、ここでは、図1に示すように、機能ブロックとして示してある。すなわち、制御部20は、地図データ取得部21、マップマッチング部22、経路計算部23、経路案内部24、描画部25、画面制御管理部26、音声認識・トークバック制御部27を備えている。
【0022】
マップマッチング部22は、位置検出部11で検出した現在地情報と、地図データ格納部12に格納されている地図データの道路形状データなどを使って、現在位置がどの道路上に存在するかを特定する。また、利用者はスイッチ情報入力部13を使って所望の地図を表示させるなどの指示を入力し、さらに目的地を設定したりする。
【0023】
経路計算部23では、マップマッチング部22で算出された現在位置の情報や利用者が設定した出発地と上記目的地までの経路を計算する。このような自動的に最適な経路を設定する手法は、ダイクストラ法等の手法が知られている。そして、経路案内部24は、上記経路計算部23による計算結果と地図データ内に格納されている道路の形状データや、交差点の位置情報や踏切の位置情報などから経路案内に必要なポイントを算出したり、どのような案内(例えば右に曲がるのか左に曲がるのかなど)が必要であるのかを決定する。
【0024】
描画部25は、現在位置の地図や高速道路の略図、交差点付近では交差点拡大図などを、画面制御管理部26の指示に従ってVRAMなどで構成された描画メモリ部17に描画する。なお、この描画に際しては、アウトラインフォント技術により、文字・記号の表示方法を状況によって決定する。この描画された地図などは、画面制御管理部26の指示によって表示部14へ表示される。
【0025】
一方、音声認識・トークバック制御部27は、音声認識手段及びトークバック制御手段に相当し、音声入力部17を介して入力される音声信号から、ユーザが発話した言葉としてのキーワード(以下、発話キーワードともいう)を認識して取得するための音声認識部を備えており、音声認識部は、照合部及び認識辞書部を備えている。この認識辞書部は、使用者が発話すると想定される複数のキーワード(認識対象語彙)毎の辞書データを記憶している。そして、照合部では、音声入力部17から入力した音声データと認識辞書部の辞書データを用いて照合(認識)を行う。そして、その認識結果をトークバックする。このトークバックは、音声出力部16を制御し、認識した結果を音声によって出力させる。その後、ユーザからの指示に応じた処理を行う。認識結果が施設名称であった場合には単にその施設名称のみをトークバックするのではなく、施設の存在位置が把握可能な地理的情報もトークバックするのであるが、この点については後述する。
【0026】
なお、本実施例においては、利用者がスイッチ情報入力部13を構成するスイッチの一つであるトークスイッチ(図示せず)を押すと、その後に音声入力が可能となるよう構成されている。そして、トークスイッチを押したのに音声入力がされない場合も想定されるため、トークスイッチが押されて音声入力が可能となった後に所定時間以上の無音区間があれば、音声入力が不可能な状態に移行する。したがって、音声入力部17はトークスイッチが押されたタイミングを監視しており、押されたことを検知する。
【0027】
地図データ取得部21は、上記各処理部で必要となる地図データを地図データ格納部12から取得して、各処理部へ供給する。なお、上記各処理は、メモリ部15内のプログラムに基づき実行され、同じくメモリ部15内のワークメモリを用いて実行される。
【0028】
続いて、音声認識に係る処理について、説明する。
まず、スイッチ情報入力部13からの情報に基づいてトークスイッチがオンされたか(押下されたか)否かを判断し(S10)、トークスイッチがオンされた場合には(S10:YES)、音声抽出処理を行う(S20)。この音声抽出処理は、音声入力部17において、マイクを介して入力された音声データに基づき音声区間であるか雑音区間であるかを判定し、音声区間のデータを抽出して音声認識・トークバック制御部27へ出力する処理である。
【0029】
次に、音声認識処理を行い(S30)、その認識結果が施設名称か否かを判断する(S40)。
施設名称でない場合には(S40:NO)、通常のトークバックを実行する(S100)。この通常のトークバックとは、認識結果のみをトークバックするものであり、音声認識・トークバック制御部27が音声出力部16を制御し、認識結果を音声によりスピーカから出力させることによってユーザに認識結果を確認させるものである。
【0030】
そして、正しい認識であったか否かを、利用者からの指示に基づいて判断する(S110)。具体的には、ユーザによるマイクからの音声入力に基づいて判断する。例えば「はい」という肯定的な内容を示す音声入力があれば正しい認識であったと判断できるし、「いいえ」「違う」などの否定的な内容を示す音声入力があれば誤った認識であったと判断できる。誤った認識であった場合には(S110:NO)、S10へ戻って、処理を繰り返す。一方、S110で肯定判断、すなわち正しい認識であると判断した場合には、音声認識・トークバック制御部27にて認識結果を確定し(S120)、所定の確定後処理を実行する(S130)。この場合の確定後処理とは、例えば認識結果が「メニュー画面」であれば、メニュー画面の表示を指示するコマンドが入力されたものとして画面制御管理部26へ出力するといった処理である。S130の処理の後はS110へ戻って、処理を繰り返す。
【0031】
一方、S40にて肯定判断、すなわち認識した結果が施設名称である場合には、S50〜S90の処理を実行する。まず、認識した施設を特定する(S50)。具体的には、その施設が存在する位置座標等を特定する。なお、施設の存在位置が特定できればよいため、位置座標以外のデータであってもよいが、本実施例では地図データ中に施設毎の位置座標が含まれているため、位置座標で特定するものとする。そして、その特定した位置座標等に基づいて当該施設の存在位置が把握可能な地理的情報を地図データ格納部12から取得し(S60)、取得した地理的情報が所定数以上存在する場合には(S70:YES)、所定数未満となるよう地理的情報を選択する(S80)。一方、地理的情報が所定数未満であれば(S70:NO)、地理的情報の選択はしない。このように地理的情報の選択がなされた場合(S80)または地理的情報が所定数未満であった場合(S70:NO)は、施設用のトークバックを実行する(S90)。そして、S90の処理後はS110へ移行する。S110で肯定判断、すなわち正しい認識であると判断した場合には、音声認識・トークバック制御部27にて認識結果を確定し(S120)、所定の確定後処理を実行する(S130)。例えば経路設定のための目的地設定の場面であれば、このように認識・確定した施設を目的地として経路計算部23へ出力するといったことである。なお、「○○を目的地として設定してよいですか?」といった確認のための問い合わせを行うようにしてもよい。また、例えば施設を指定することでその施設を含む地図を表示させる場合や、例えば店舗や駐車場などの施設においてその営業時間や料金といった詳しい情報を報知させる場合などであれば、このようにして確定した施設を各処理の実行主体部に対して出力する。
【0032】
これが施設名称のトークバックの処理の概要であるが、各処理について補足説明する。
(1) S60における地理的情報の取得について
この地理的情報は、S50で特定した施設がどのような位置にあるかを示すための情報であるから、その特定した施設周辺の地理的情報を取得することとなる。本実施例では、その施設の周辺に存在する所定の目印用施設との地理的関係を示す情報をトークバックするため、まず目印用施設を抽出する。目印用施設としては、例えば学校やデパート、スタジアムといった比較的大きな建造物、交番、コンビニエンスストア、ガソリンスタンドといった比較的小さな施設、さらには交差点などが考えられる。交差点には交差点名称が信号機に取り付けられていることも多く、実際にその場にユーザが出向いた際には有効な目印になり得る。
【0033】
この目印用施設の抽出手法について、何例か説明する。
▲1▼まず、例えばS50で特定した施設の位置を中心とした半径Xmの範囲内に存在するものを抽出することが考えられる。最低1個は目印用施設を抽出したいので、数段階の半径Xmを準備しておき、例えば最初半径50mの範囲で探索し、目印用施設が一つも見つからなければ次に半径100mの範囲に広げて探索する、というようにして、一つ以上見つかった場合には、そこで探索を終了することが考えられる。なお、あまり範囲を広げすぎても実質的に目印になり得ないため、上限の半径は決めておく。そして、その準備した最も広い範囲内でも目印用施設が見つからない場合は、例えばS50で特定した施設の住所を利用して「〜市付近」「〜町付近」というように、目印用施設によらない地理的情報を採用しても良い。
【0034】
▲2▼また、「周辺地図区画から設定」する手法も考えられる。地図データは区画分けして格納されているので、区画内で探すのである。その際1区画だけを探索範囲とすると区画の端付近の施設の場合に近くに別施設があっても探せないので、例えばS50で特定した施設が地図区画の端部付近に存在する場合には、その端部に隣接する地図区画も探すようにすればよい。なお、区画の大きさは地図データの量に応じて変わっているので、いわゆる都心部、郊外部、山村部といった地域ごとに探索範囲が変わる可能性がある。
【0035】
▲3▼また、「同一行政区画(大字レベルとか市町村レベル)で設定」する手法も考えられる。この場合も、上記▲2▼と同様に、行政区画の端付近に特定施設が存在する場合には、隣接する行政区画も探索範囲とする。
(2) S80における地理的情報の選択について
S80では、取得した地理的情報が所定数以上存在する場合に(S70:YES)、所定数未満となるよう選択する。この所定数については、例えば3程度が考えられる。本実施例では車載用のナビゲーションシステムに適用しているため、トークバックも基本的には車両を運転しているユーザ(ドライバ)に対してなされることとなる。運転中のユーザに対してあまり多くの情報をトークバックするのは好ましくないため、例えば2つ程度に絞ってトークバックすることが好ましい。そのため、例えばS70で3以上の地理的情報が存在すれば、S80で2以下に絞ることが考えられる。
【0036】
そして、どの地理的情報に絞るかについての手法を何例か説明する。
▲1▼例えばS50で特定した施設との距離に基づくことが考えられる。具体的には、「近い順」に2つ選択したり、あるいは、「最も近いものと最も遠いもの」を選択する、といったことである。これら2つの目印用施設の内のいずれか一方でも覚えていれば、認識した施設の適否が判断できる。
【0037】
▲2▼また、「種別」に基づいて選択することも考えられる。具体的には、本実施例の場合は車載用のナビゲーションシステムであるため、運転者から見て認識し易く、一般的によく知られている施設の優先度を高くし、そのような施設を優先して選択する、といったことである。例えば市役所・駅・スタジアム・学校などは優先すべき施設として有効である。また交差点は自動車からの確認の点、また全国いたるところに存在するという点で、とても有効であると考えられる。なお、この場合、複数の交差点を目印用施設として採用することも可能であるが、一般的には、別の種類の施設を目印用施設として採用した方が好ましい場合が多いと考えられるため、例えば交差点を1つ選択した場合には、2つ目は交差点以外の施設として上述した市役所・駅・スタジアム・学校などを選択することが好ましい。
【0038】
▲3▼また、上述した▲1▼あるいは▲2▼の観点に加えて、トークバックする際の言い回しも考慮することが考えられる。例えば「〜付近〜交差点角」という言い回しはトークバックされたユーザにとって施設の位置をイメージするのに好ましいが、例えば「〜付近〜付近」というように同じ言い回しが続くものは、施設の位置をイメージさせるという目的からすれば相対的に好ましくない。したがって、極力、同じ言い回しが続かないような位置にある施設を採用することが考えられる。
(3) S90における施設用のトークバックについて
S100での通常のトークバックの場合は、認識結果のみをトークバックするものであったが、S90での施設用トークバックは、S50で特定された施設の名称の前に地理的情報を付加してトークバックする。具体的には、「目印用施設の名称」+「その目印用施設とS50で特定された施設との地理的関係を示す言い回し」+「S50で特定された施設の名称」をトークバックする。
【0039】
ここで、地理的関係を示す言い回しとしては、例えば次のようなものが考えられる。
▲1▼「〜付近」:対象となる施設までの距離がある程度離れている場合。例えば100m以上、というようにある程度距離が離れている場合は、「〜付近」という言い回しがユーザの感覚に合うものと考えられる。
【0040】
▲2▼「〜交差点角」:交差点に距離が近い場合。例えば交差点から数十mの距離なら「〜交差点角」を使用できると考えられる。
▲3▼「〜前」:例えば小学校の正門に道を挟んで目的地がある場合には、「△△小学校前」といった言い回しが考えられる。但し目印用施設の正面方向の情報が必要であり、専用データが必要となる。
【0041】
▲4▼「〜隣」:例えば市役所の横に道を挟まずに対象の施設がある場合には、「□□市役所隣」といった言い回しが考えられる。
▲5▼「〜北」「〜南」「〜東」「〜西」:方角が明瞭な場合には、このような表現が考えられる。
【0042】
これら▲1▼〜▲5▼について考えてみると、対象の施設からの距離が近い順に、例えば、▲3▼,▲4▼<▲5▼,▲2▼<▲1▼というような関係が考えられる。これは、▲3▼の「〜前」や「▲4▼の「〜隣」の場合に比べればやや離れている場合にこれらの表現を用いることが好ましいと考えられるからであり、近接していれば、方角は関係なく「〜前」や「〜隣」で位置特定ができるからである。したがって、目印用施設に対してどのような地理的関係を示す言い回しを付加するかについては、例えば近距離の言い回しを優先して選択し、▲2▼〜▲5▼のいずれにも条件が当てはまらない場合には、▲1▼の「〜付近」を選択することが好ましいと考えられる。
【0043】
このようにして「目印用施設の名称」+「地理的関係を示す言い回し」+「S50でされた特定施設の名称」をトークバックする際の具体例としては、例えば「○○○ドーム付近のスーパー△△△大曽根店ですか?」、「刈谷市刈谷駅前交差点角の□□□書店ですか?」といったものが挙げられる。
【0044】
なお、このようにトークバックする際、地理的情報を専用に持つことも可能であるが、本実施例においては、地図データ中に存在する索引、表示文字の情報を利用している。現状のカーナビゲーションシステムにおいては、索引情報、表示文字情報は既に地図データとして格納されているのが一般的である。そして、大抵の場合50音検索は標準機能として実施できるので、索引データに読みのデータが入っており、その読みデータを用いて合成音声を生成し、トークバックすることができる。
【0045】
また、本実施例のシステムは音声認識機能を持つため、その音声認識のためのデータをそのまま使えばよい。音声認識データは施設索引データ、住所索引データと関連付けられているので、それを逆利用すれば容易に実現できる。
一方、表示文字情報については、現状では読みデータが入っていないことが多いため、その場合は読みデータを追加する必要がある。但し、そのような読みデータを追加するのであれば、専用データを持たせる方が実現し易いとも考えられる。そして、専用データを作成する場合には、最低限「座標」「優先付けできる情報(種別など)」「トークバック用データ(肉声もしくは合成音声読み)」が必要と考えられる。
【0046】
また、交差点に関しては、現状においても高機能のナビゲーションでは肉声の音声データが格納されているので、それを利用することもできる。
以上説明したように、本実施例のナビゲーションシステム1においては、ユーザが例えば経路案内のための目的地を施設名称で音声入力することができる。しかし、単に施設名称をトークバックするだけでは、ナビゲーションシステム1側が認識している施設とユーザが認識している施設とが一致しない場合もあり得る。そのような認識の不一致が生じているにもかかわらずそのまま経路が設定されてしまうと、ユーザは、設定された経路が表示部14に表示されたものを見て初めて自分が意図していたのとは異なる目的地が設定されていたことに気付き、再度目的地設定からやり直さなくてはならないこととなる。
【0047】
そこで本実施例のナビゲーションシステム1によれば、施設用のトークバックとして、音声認識した施設名称の前に「目印用施設の名称」+「地理的関係を示す言い回し」を加えてトークバックする。これにより、ユーザは自分が意図している施設が正しく認識されているのか否かを判断することができる。例えば「刈谷市刈谷駅前交差点角の□□□書店ですか?」というトークバックがなされた場合、ユーザは自分が考えていた□□□書店が実は別の地域に存在する別のチェーン店であることに気付くことができる。例えば、このような複数のチェーン店が存在する場合、ユーザが今度は支店名等も合わせて音声入力することによって、ユーザの意図する施設が認識されることとなる。
【0048】
なお、候補となるチェーン店が複数抽出される場合には、例えば「目印用施設の名称」+「地理的関係を示す言い回し」を加えたトークバックを順番にしていき、ユーザが例えば「違う」といった音声入力した場合には次の候補をトークバックし、ユーザが例えば「はい」といった音声入力した場合には、図2のS110にて肯定判断となり、認識結果を確定(S120)するようにしてもよい。
【0049】
[別実施例]
(1)上記実施例においては、認識した施設の周辺に存在する所定の目印用施設との地理的関係を示す情報をトークバックしたが、例えば認識した施設の住所を地理的情報としてトークバックしてもよい。例えば「○○市△△町□□番地の□□□書店ですか?」といったトークバックである。施設の存在する住所をユーザが知っている場合にはこのようなトークバックも有効である。しかし、必ずしもユーザが施設の存在する住所を知っているとは限らない。たとえその施設に過去行ったことがあったとしても、その住所を覚えているとは限らないため、上記実施例のような目印用施設との地理的関係をトークバックした方が有効な場合が多いと考えられる。
【0050】
(2)上記実施例では、車載用のナビゲーションシステム1に適用した例を挙げて説明したが、その用途に限定されることなく、例えば人間が携帯する端末装置などであっても適用可能である。なお、上記実施例では、S80に関する説明において、取得した地理的情報が所定数以上存在する場合に「種別」に基づいて選択することも考えられる旨を述べた。そして、車載用のナビゲーションシステムへの適用の場合には、運転者から見て認識し易く、一般的によく知られている施設の優先度を高くするようにした。したがって、人間が携帯する端末装置などに適用する場合には、今度は歩く人にとって認識し易いという観点で優先度を決めればよい。
【0051】
また、ナビゲーションシステムに限定されず、ユーザが発話した音声の認識結果としての施設の名称に基づいて所定の機器を動作させる制御システムであれば同様に適用できる。
(3)上述した音声認識・トークバックに係る処理をコンピュータシステムにて実現する機能は、例えば、コンピュータシステム側で起動するプログラムとして備えることができる。このようなプログラムの場合、例えば、フレキシブルディスク、光磁気ディスク、CD−ROM、ハードディスク等のコンピュータ読み取り可能な記録媒体に記録し、必要に応じてコンピュータシステムにロードして起動することにより用いることができる。この他、ROMやバックアップRAMをコンピュータ読み取り可能な記録媒体として前記プログラムを記録しておき、このROMあるいはバックアップRAMをコンピュータシステムに組み込んで用いても良い。
【図面の簡単な説明】
【図1】実施例としてのナビゲーションシステムの全体構成を示すブロック図である。
【図2】音声認識に係る処理を示すフローチャートである。
【符号の説明】
1…ナビゲーションシステム、11…位置検出部、12…地図データ格納部、13…スイッチ情報入力部、14…表示部、15…メモリ部、16…音声出力部、17…音声入力部、20…制御部、21…地図データ取得部、22…マップマッチング部、23…経路計算部、24…経路案内部、25…描画部、26…画面制御管理部、27…音声認識・トークバック制御部。
Claims (8)
- 使用者が発話した音声を入力する音声入力手段と、
その音声入力手段を介して入力した音声を認識する音声認識手段とを備え、
その音声認識手段にて認識した結果としての施設の名称に基づいて所定の機器を動作させる制御システムであって、
地図データを記憶しておく地図データ記憶手段と、
前記音声認識手段にて認識した施設の存在位置が把握可能な地理的情報を前記地図データ記憶手段に記憶された地図データを用いて取得し、その地理的情報を、前記音声認識手段にて認識した施設の名称と共にトークバックするトークバック手段とを備え、
前記地理的情報は、前記認識した施設の周辺に存在する所定の目印用施設との地理的関係を示す情報であり、
前記トークバック手段は、前記認識した施設との関係で前記目印用施設が複数存在する場合は、両者の距離に基づいて所定数の目印用施設のみとの地理的関係を示す情報をトークバックすることを特徴とする制御システム。 - 請求項1に記載の制御システムにおいて、
前記トークバック手段は、前記音声認識手段にて認識した施設から所定範囲内に目印用施設がある場合に限り、その目印用施設との地理的関係を示す情報を、前記音声認識手段にて認識した施設の名称と共にトークバックすることを特徴とする制御システム。 - 請求項1に記載の制御システムにおいて、
前記トークバック手段は、前記音声認識手段にて認識した施設から所定範囲に目印用施設がない場合、その施設の住所を、前記音声認識手段にて認識した施設の名称と共にトークバックすることを特徴とする制御システム。 - 請求項1〜3の何れかに記載の制御システムにおいて、
前記目印用施設との地理的関係を示す情報は、前記認識した施設と前記目印用施設との距離が相対的に近い場合と遠い場合とでその表現方法が異なっていることを特徴とする制御システム。 - 当該制御システムは移動体に搭載されており、
請求項1〜4の何れかに記載の制御システムにおいて、
前記トークバック手段は、前記認識した施設との関係で前記目印用施設が複数存在する
場合は、前記移動体の性質に応じた目印としての機能を加味した優先度の高さに基づいて所定数の目印用施設のみとの地理的関係を示す情報をトークバックすることを特徴とする制御システム。 - 請求項1〜5の何れかに記載の制御システムにおいて、
前記音声認識手段にて認識した結果としての施設を、経路案内のための目的地として設定する制御システム。 - 請求項1〜5の何れかに記載の制御システムにおいて、
前記音声認識手段にて認識した結果としての施設を含む地図を表示する制御システム。 - 請求項1〜5の何れかに記載の制御システムにおいて、
前記音声認識手段にて認識した結果としての施設に関する情報を報知する制御システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002271701A JP3925368B2 (ja) | 2002-09-18 | 2002-09-18 | 制御システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002271701A JP3925368B2 (ja) | 2002-09-18 | 2002-09-18 | 制御システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004109468A JP2004109468A (ja) | 2004-04-08 |
JP3925368B2 true JP3925368B2 (ja) | 2007-06-06 |
Family
ID=32268939
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002271701A Expired - Fee Related JP3925368B2 (ja) | 2002-09-18 | 2002-09-18 | 制御システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3925368B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007069372A1 (ja) * | 2005-12-14 | 2007-06-21 | Mitsubishi Electric Corporation | 音声認識装置 |
JP4755556B2 (ja) * | 2006-09-04 | 2011-08-24 | クラリオン株式会社 | 車載装置 |
US7912637B2 (en) * | 2007-06-25 | 2011-03-22 | Microsoft Corporation | Landmark-based routing |
JP2009169139A (ja) * | 2008-01-17 | 2009-07-30 | Alpine Electronics Inc | 音声認識装置 |
JP5218894B2 (ja) * | 2008-04-18 | 2013-06-26 | アイシン・エィ・ダブリュ株式会社 | 検索装置及びプログラム |
-
2002
- 2002-09-18 JP JP2002271701A patent/JP3925368B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004109468A (ja) | 2004-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6480786B2 (en) | Method and system for route guiding | |
EP0703432B1 (en) | Navigation system | |
JP3468824B2 (ja) | 車両誘導装置 | |
JP4622676B2 (ja) | 車載ナビゲーション装置 | |
US6064323A (en) | Navigation apparatus, navigation method and automotive vehicles | |
US20070021907A1 (en) | Navigation system | |
US20070156331A1 (en) | Navigation device | |
JP3797405B2 (ja) | 車両用ナビゲーション装置及び記憶媒体 | |
JP3308044B2 (ja) | ナビゲーション装置 | |
JP3925368B2 (ja) | 制御システム | |
JP2007033209A (ja) | ナビゲーション装置 | |
JP2000338993A (ja) | 音声認識装置、その装置を用いたナビゲーションシステム | |
JP2006308554A (ja) | 施設検索装置、及びナビゲーション装置 | |
JP3890774B2 (ja) | ナビゲーションシステム | |
JP4182490B2 (ja) | 車両用ナビゲーション装置及び記憶媒体 | |
US8560226B2 (en) | Navigation device and navigation method | |
JP3818352B2 (ja) | ナビゲーション装置及び記憶媒体 | |
JP2007065206A (ja) | 施設検索装置 | |
JP4274913B2 (ja) | 目的地検索装置 | |
JP3760958B2 (ja) | ナビゲーション装置 | |
JP3579971B2 (ja) | 車載用地図表示装置 | |
JP4822575B2 (ja) | ナビゲーション装置 | |
WO2006028171A1 (ja) | データ提示装置、データ提示方法、データ提示プログラムおよびそのプログラムを記録した記録媒体 | |
JP2000074685A (ja) | 車載装置における検索方法と車載ナビゲーション装置 | |
JP3656730B2 (ja) | 電話番号による地点検索出力装置及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060718 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060915 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070219 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100309 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110309 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120309 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120309 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130309 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140309 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |