WO2014188512A1

WO2014188512A1 - 音声認識装置、認識結果表示装置および表示方法

Info

Publication number: WO2014188512A1
Application number: PCT/JP2013/064072
Authority: WO
Inventors: 友紀古本; 裕生山下; 井上　譲; 政信大沢
Original assignee: 三菱電機株式会社
Priority date: 2013-05-21
Filing date: 2013-05-21
Publication date: 2014-11-27
Also published as: US20160035352A1; CN105246743A; CN105246743B; JP5762660B2; US9767799B2; JPWO2014188512A1; DE112013007103T5

Abstract

　この発明の音声認識装置によれば、常時、発話された音声を認識している場合において、ユーザが画面に表示された音声認識結果を選択しようとしていると判断される場合には、表示部における認識結果の表示更新が行われないようにしたことにより、ユーザが認識結果を選択しようとした瞬間に当該認識結果が消えたり、他の認識結果に変わってしまったりすることがないので、ユーザが所望しない動作を招くことを防ぐことができ、ユーザの利便性が向上する。

Description

音声認識装置、認識結果表示装置および表示方法

　この発明は、ユーザにより発話された音声を認識して認識結果を表示する音声認識装置、音声認識された認識結果を表示する認識結果表示装置およびその認識結果を表示装置に表示させる表示方法に関するものである。

　音声認識の方法として、ユーザにより発話された音声を認識してその認識結果を表示する方法が知られている。
　例えば特許文献１には、ユーザが発話した音声を認識し、その認識結果を表示する音声認識装置であって、ユーザが発話するとその音声の認識結果であるショートカットボタンが表示画面の左下付近に表示され、当該ショートカットボタンをユーザが押下することで、ショートカット機能が実行されることが記載されている。

特開２００８－１４８１８号公報

　しかしながら、例えば特許文献１のような従来の音声認識装置では、ショートカットボタンが表示されている際に、ユーザにより新たな発話があると、その新たな認識結果を表示する場合に、先に表示されていたショートカットボタンを消去してから新しいボタンを表示するため、ユーザが所望の認識結果を選択しようとした瞬間にそのボタンが移動したり、消えて別の認識結果のボタンに変わってしまい、ユーザが所望しない動作を招いてしまう、という課題があった。

　この発明は、上記のような課題を解決するためになされたものであり、ユーザが画面に表示された認識結果を選択しようとしている場合には、認識結果が更新されてしまうことなく、所望の認識結果を選択できる音声認識装置、認識結果表示装置およびその認識結果を表示装置に表示させる表示方法を提供することを目的とする。

　上記目的を達成するため、この発明は、ユーザにより発話された音声を認識して認識結果を表示する音声認識装置において、前記ユーザにより発話された音声を検知して取得する音声取得部と、前記音声認識装置が起動している間は常時、音声認識辞書を参照して、前記音声取得部により取得された音声データを認識し、認識結果を出力する音声認識部と、前記音声認識部により出力された認識結果に対応する機能を有する操作ボタンを生成する操作ボタン生成部と、前記操作ボタン生成部により生成された操作ボタンを表示する表示部と、前記表示部における前記操作ボタンの表示内容を制御する表示制御部と、前記表示部に表示されている操作ボタンを前記ユーザが操作しようとしているか否かに基づいて、前記表示制御部に対して前記操作ボタンの表示内容の更新停止および再開を指示する指示信号を出力する操作ボタン表示更新停止／再開部とを備え、前記操作ボタン表示更新停止／再開部は、前記表示部に表示されている操作ボタンを前記ユーザが操作しようとしていると判断した場合に、前記操作ボタンの表示内容の更新停止を指示する指示信号を出力し、前記表示制御部は、前記操作ボタン表示更新停止／再開部から前記操作ボタンの表示内容の更新停止の指示信号を受けた場合に、前記表示部に表示されている操作ボタンの表示更新を停止するよう前記表示部に対して指示を行うことを特徴とする。

　この発明によれば、ユーザが画面に表示された認識結果を選択しようとしていると判断される場合には、表示部における認識結果の表示更新が行われないようにしたことにより、ユーザが認識結果を選択しようとした瞬間に当該認識結果が消えたり、他の認識結果に変わってしまったりすることがないので、ユーザが所望しない動作を招くことを防ぐことができ、ユーザの利便性が向上する。

実施の形態１における音声認識装置の一例を示すブロック図である。表示部の操作ボタン表示領域に操作ボタンが表示された画面例を示す図である。操作ボタン表示領域の中に操作ボタンが１つしか表示できない場合の操作ボタンの表示更新方法を示す図である。操作ボタン表示領域に２個の操作ボタンが表示できる場合の操作ボタンの表示更新方法を示す図である。操作ボタン表示領域の中に操作ボタンが１つしか表示できない場合の操作ボタンの生成および表示の処理を示すフローチャートである。操作ボタン表示領域に操作ボタンが複数表示できる場合の操作ボタンの生成および表示の処理を示すフローチャートである。操作ボタンが生成されない場合であっても、既に表示されている操作ボタンを消去する処理を示すフローチャートである。操作ボタン表示更新停止／再開部が操作ボタンの表示更新停止／再開の指示出力を行う処理を示すフローチャートである。実施の形態２における音声認識装置の一例を示すブロック図である。操作ボタン表示更新停止／再開部が音声認識により操作ボタンの表示更新停止／再開の指示出力を行う処理を示すフローチャートである。操作ボタン表示領域から消去された操作ボタンをスクロールにより表示させた場合の画面例を示す図である。表示履歴として記憶されている操作ボタンを表示更新停止中に一覧表示させた画面例を示す図である。実施の形態３におけるナビゲーションシステムの概要を示す図である。

　以下、この発明の実施の形態について、図面を参照しながら詳細に説明する。
　この発明は、ユーザにより発話された音声を認識する音声認識装置であり、当該音声認識装置が起動されている場合は常時、音声を認識するものである。なお、以下の実施の形態では、この発明の音声認識装置を車両等の移動体に搭載されるナビゲーション装置に適用した場合を例に挙げて説明するが、車両以外の他の移動体用のナビゲーション装置であってもよいし、ナビゲーションシステムのサーバに適用してもよい。また、スマートフォン、タブレットＰＣ、携帯電話等の携帯情報端末等にインストールされるナビゲーションシステムのアプリケーション等に適用してもよい。

実施の形態１．
　図１は、この発明の実施の形態１における音声認識装置の一例を示すブロック図である。この音声認識装置は、制御部１、マイク２、音声取得部３、音声認識辞書４、音声認識部５、操作ボタン生成部６、表示制御部７、表示部８、操作ボタン表示更新停止／再開部９、指示入力部１０、カメラ１１、視線検出部１２、姿勢検出部１３を備えている。

　マイク２は、ユーザが発話した音声を取得（集音）する。マイク２には、例えば、全指向性（または無指向性）のマイクや、複数の全指向性（または無指向性）のマイクをアレイ状に配列して指向特性を調整可能としたアレイマイクや、一方向のみに指向性を有しており、指向特性を調整できない単一指向性マイクなどがある。

　音声取得部３は、マイク２により取得されたユーザ発話、すなわち、入力された音声を取り込み、例えば例えばＰＣＭ（Ｐｕｌｓｅ　Ｃｏｄｅ　Ｍｏｄｕｌａｔｉｏｎ）によりＡ／Ｄ（Ａｎａｌｏｇ／Ｄｉｇｉｔａｌ）変換する。

　音声認識部５は、音声取得部３によりデジタル化された音声信号から、ユーザが発話した内容に該当する音声区間を検出し、該音声区間の音声データの特徴量を抽出し、その特徴量に基づいて音声認識辞書４を用いて認識処理を行い、認識結果を出力する。なお、認識処理としては、例えばＨＭＭ（Ｈｉｄｄｅｎ　Ｍａｒｋｏｖ　Ｍｏｄｅｌ）法のような一般的な方法を用いて行えばよい。

　ところで、カーナビゲーションシステム等に搭載されている音声認識機能においては、ユーザが発話の開始をシステムに対して明示（指示）するのが一般的である。そのために、音声認識開始を指示するボタン（以下、「音声認識開始指示部」と呼ぶ）が、タッチパネルに表示されたりハンドルに設置されたりしている。そして、ユーザにより音声認識開始指示部が押下された後に発話された音声を認識する。すなわち、音声認識開始指示部は音声認識開始信号を出力し、音声認識部は当該信号を受けると、当該信号を受けた後に音声取得部により取得された音声データから、ユーザが発話した内容に該当する音声区間を検出し、上述した認識処理を行う。

　しかし、この実施の形態１における音声認識部５は、上述したようなユーザによる音声認識開始指示がなくても、常に、ユーザが発話した内容を認識する。すなわち、音声認識部５は、音声認識開始信号を受けなくても、この音声認識装置が組み込まれたナビゲーション装置が起動されている場合は常時、音声取得部３により取得された音声データから、ユーザが発話した内容に該当する音声区間を検出し、該音声区間の音声データの特徴量を抽出し、その特徴量に基づいて音声認識辞書４を用いて認識処理を行い、音声認識結果を出力する処理を繰り返し行う。以下の実施の形態においても同様である。

　指示入力部１０は、ユーザの手動による指示を入力するもの、すなわち、ユーザによる各種操作の指示を受け付けるものである。当該指示は、ナビゲーション装置に設けられたハードウエアのスイッチ、表示部８に設定され表示されるタッチスイッチ（後述する操作ボタンを含む）、あるいはハンドル等に設置されたリモコンもしくは別体のリモコンによる指示を認識する認識装置によるものが挙げられる。

　操作ボタン生成部６は、音声認識部５により出力された認識結果に対応する機能を有する操作ボタンを生成する。
　表示制御部７は、操作ボタン生成部６により生成された操作ボタンの表示部８への表示、操作ボタンの表示位置変更、所定時間表示された操作ボタンの削除等の指示出力を行うことで、操作ボタンの表示更新を制御するとともに、表示部８における操作ボタンの表示更新が停止中であるか否かを判定する。また、表示部８に表示されている操作ボタンに関する情報、例えば操作ボタン名称や操作ボタンの表示部８における表示位置などを管理する。

　表示部８は、表示一体型のタッチパネルであり、例えばＬＣＤ（Ｌｉｑｕｉｄ　Ｃｒｙｓｔａｌ　Ｄｉｓｐｌａｙ）とタッチセンサから構成されており、表示制御部７の指示に基づき画面上に描画を行う。なお、タッチパネルには、感圧方式、電磁誘導方式、静電容量方式、あるいはこれらを組み合わせた方式などのうち、何れを用いてもよい。また、ＬＣＤの代わりに有機ＥＬディスプレイを用いてもよい。

　制御部１は、音声認識装置全体の動作を制御する。また、指示入力部１０から入力されたユーザからの指示や、音声認識部５により出力された認識結果に基づいて、様々な機能を実行する。例えば、表示部８に表示された操作ボタン（認識結果）がユーザにより手動または音声で選択されると、当該選択された操作ボタンに割り当てられている機能を実行する。

　以下の説明においては、音声認識部５は、常時、ユーザ発話から例えば「ガソリンスタンド」「コンビニ」のような、施設が属するジャンル名（以下、施設ジャンル名）を認識して認識結果を出力し、操作ボタン生成部６は、当該認識結果のジャンルに属する施設を検索する機能（以下、「ジャンル検索機能」と呼ぶ）を有する操作ボタンを生成する。

　当該操作ボタンは表示制御部７によって表示部８の所定の領域（以下、「操作ボタン表示領域」と呼ぶ）に、例えば図２の操作ボタン６１，６２のように表示される。
　図２は、地図等が表示された表示画面（表示部８）の操作ボタン表示領域６０に、操作ボタン６１，６２が表示された画面例を示す図である。そして、ユーザによって当該操作ボタン６１または６２が選択されると、制御部１は当該選択された操作ボタンに対応するジャンル検索を実行する。なお、音声認識部５では、周知技術であるキーワードスポッティングによって施設ジャンル名の認識が行われるものとする。

　なお、キーワードスポッティングによる施設ジャンル名の認識ではなく、認識すべてを大語彙連続音声認識により認識し、認識結果を形態素解析して施設ジャンル名を抽出する方法を用いてもよい。

　また、音声認識部５は、例えば、アーティスト名、アルバム名、曲タイトル名、カーナビゲーションシステムを操作するためのコマンドなどを認識するようにしてもよい。この場合、操作ボタンに割り当てられる機能は、例えば、アーティスト名、アルバム名、曲タイトル名で曲を検索する機能であってもよいし、コマンドに対応する機能であってもよい。

　ここで、表示制御部７による表示部８への操作ボタンの表示更新方法の一例について、具体例を挙げて説明する。
　図３は操作ボタン表示領域６０が小さく、その中に操作ボタンは１つしか表示できない場合の操作ボタンの表示更新方法を示す図である。

　図３（ａ）は、操作ボタン表示領域６０に操作ボタンが表示されていない状態を示しており、この状態で例えば「コンビニ行きたいね」という発話が認識され、「コンビニ」に対応する操作ボタンが生成されると、表示制御部７は、操作ボタン６１を表示するよう表示部８に対して指示出力する（図３（ｂ））。

　その後、「銀行にもよらないと」という発話が認識され、「銀行」に対応する操作ボタンが生成されると、表示制御部７は、先に表示されていた「コンビニ」操作ボタン６１を消去した後、「銀行」操作ボタン６２を表示するよう表示部８に対して指示出力する（図３（ｃ））。また、新たな操作ボタンが生成されていなくても、表示されている操作ボタンに対する操作がないまま、表示開始から所定時間が経過した操作ボタンを消去するよう指示出力する。

　また、別の表示更新方法として、操作ボタン表示領域６０に複数の操作ボタン（図４を用いた以下の説明では、２個の操作ボタンとする）を表示できる場合について説明する。
　図４は、操作ボタン表示領域６０に、２個の操作ボタンが表示できる場合の操作ボタンの表示更新方法を示す図である。

　操作ボタンが表示されていない状態（図４（ａ））で、先ほどの例と同様に「コンビニ行きたいね」という発話が認識され、「コンビニ」に対応する操作ボタンが生成されると、表示制御部７は、操作ボタン６１を表示するよう表示部８に対して指示出力する（図４（ｂ））。

　その後、「銀行にもよらないと」という発話が認識され、「銀行」に対応する操作ボタンが生成されると、操作ボタン６２を追加表示するよう表示部８に対して指示出力する（図４（ｃ））。ここでさらに、「近くに駐車場ないかな」という発話が認識され、「駐車場」に対応する操作ボタンが生成されると、最も表示されている時間が長い操作ボタン、ここでは、「コンビニ」操作ボタン６１を削除し、「銀行」操作ボタン６２を「コンビニ」操作ボタン６１が表示されていた場所に移動させ、「駐車場」操作ボタン６３を追加表示するよう表示部８に対して指示出力する（図４（ｄ））。

　また、新たな操作ボタンが生成されていなくても、表示されている操作ボタンに対する操作がないまま、表示開始から所定時間が経過した操作ボタンを消去するよう指示出力する。図４（ｅ）は、「銀行」操作ボタン６２が表示されてから当該「銀行」操作ボタン６２に対する操作がないまま所定時間が経過した場合に、「銀行」操作ボタン６２が削除され、「駐車場」操作ボタン６３が「銀行」操作ボタン６２が表示されていた場所に移動した状態を示している。

　なお、上記の表示更新方法は一例であってその他の表示更新方法であってもよいことは言うまでもない。
　例えば、図４では、操作ボタン表示領域６０に操作ボタンが表示される際に、１つ目の操作ボタンが操作ボタン表示領域６０の中の下の位置に表示されるようにしているが、上から表示されるようにしてもよい。

　また、図４では、表示できる操作ボタンの数を超えるまでは、すなわち、１つ目の操作ボタンが表示された後に２つ目の操作ボタンが表示される際には、図４（ｃ）に示すように、１つ目の操作ボタン６１の位置は変わらず下のまま、２つ目の操作ボタン６２が上に追加表示されているが、新たに表示される操作ボタンが必ず下に表示されるようにしてもよい。この場合には、図４（ｂ）から図４（ｃ）に移行する際に、１つ目の「コンビニ」操作ボタン６１が上に移動され、２つ目の「銀行」操作ボタン６２が新たに下に表示される。

　ここで、表示されている操作ボタンに対する操作がないままかどうか、すなわち、ユーザが操作ボタンを押下しようとしているか否かを判断する手法について説明する。この判断は、操作ボタン表示更新停止／再開部９により行われる。
　ユーザが操作ボタンを押下しようとしているか否かを判断する手法としては、様々なものが考えられるが、ここでは、視線検出部１２を用いてユーザの視線を検出して判断するもの、姿勢検出部１３を用いてユーザの所定の姿勢を検出して判断するもの、および、指示入力部１０を用いてユーザにより所定の操作が行われたことにより判断するもののいずれかを用いることとする。

　視線検出部１２は、カメラ１１により取得された画像を解析して表示部８に向けられるユーザの視線を検出する。ここで、視線検出部１２は表示部８の特定の領域、例えば、図２～図４に示した画面例の操作ボタン表示領域６０に向けられている視線を検出するとしてもよい。なお、視線を検出する方法については、公知の技術を用いればよいためここでは説明を省略する。

　姿勢検出部１３は、カメラ１１により取得された画像を解析して、表示部８に表示された操作ボタンを押下しようとしているユーザの所定の姿勢を検出する。ここで、操作ボタンを押下しようとしている所定の姿勢には、例えば、ユーザの腕が表示部８の方向を向いている、ユーザの上半身が表示部８の方向を向いている、ユーザの体が前かがみになっているなどの姿勢が含まれる。なお、姿勢を検出する方法についても、公知の技術を用いればよいためここでは説明を省略する。

　そして、操作ボタン表示更新停止／再開部９は、所定の条件を満たす場合、すなわち、上記の視線検出部１２、姿勢検出部１３、指示入力部１０による検出結果に基づいてユーザが操作ボタンを押下しようとしているか否かを判断し、ユーザが操作ボタンを押下しようとしていると判断した場合に、表示制御部７に対して、操作ボタンの表示更新を停止する指示出力を行う。

　ここで、所定の条件を満たす場合、すなわち、ユーザが操作ボタンを押下しようとしていると判断した場合とは、具体的には、視線検出部１２により表示部８に対するユーザの視線が検出された場合、姿勢検出部１３により操作ボタンを押下しようとしているユーザの所定の姿勢が検出された場合、指示入力部１０によりユーザが操作ボタンを押下しようとしている所定の操作が受け付けられた場合、のいずれかである場合のことであり、この場合に、操作ボタン表示更新停止／再開部９は、表示制御部７に対して、操作ボタンの表示内容の更新停止を指示する指示信号を出力する。

　指示入力部１０により所定の操作がなされた場合とは、例えば、リモコンの所定のボタンやステアリングスイッチ等（表示停止のボタンやスイッチ等）が押下された場合、また、タッチセンサが、ユーザの指やその他の物体の接近を検出できる方式、例えば、静電容量方式等のような近接センサである場合は、ユーザの指等の物体がタッチセンサに所定値以下の距離まで近づいた場合のことである。

　また、タッチセンサによる場合（近接センサを備える場合）には、操作ボタン表示更新停止／再開部９は、タッチセンサから物体の接近情報を取得し、ユーザの指等の物体とタッチセンサ（近接センサ）との距離を算出し、当該算出された距離が所定値以下の場合（または所定値より小さい場合）に表示更新を停止する指示出力を行うようにすればよい。

　ここで、接近する物体のタッチパネル上の位置情報をタッチセンサから取得し、当該位置が、例えば図２の操作ボタン表示領域６０内であり、かつ、物体とタッチパネルの距離が所定値以下の場合（または所定値より小さい場合）に、表示更新を停止する指示出力を行うとしてもよい。

　なお、ここでは物体の接近を検出するためにタッチセンサからの情報を用いたが、例えば、赤外線センサを備える構成とし、当該センサを用いて表示部８から物体までの距離を算出してもよい。
　さらに、操作ボタン表示更新停止／再開部９は、所定の条件を満たさない場合（すなわち、ユーザが操作ボタンを押下しようとしていないと判断された場合）に、表示制御部７に対して、操作ボタンの表示更新を再開する指示出力を行う。

　この場合の所定の条件を満たさない場合とは、具体的には、視線検出部１２により表示部８に向けられるユーザの視線が検出されなくなった場合、姿勢検出部１３により操作ボタンを押下しようとしているユーザの所定の姿勢が検出されなくなった場合、指示入力部１０により所定の操作、例えば、リモコンの所定のボタンやステアリングスイッチ等（表示再開のボタンやスイッチ等）の押下がなされた場合、ユーザの指等の物体とタッチパネルとの距離が所定値より大きくなった場合（または所定値以上に場合）のいずれかの場合のことである。

　すなわち、操作ボタン表示更新停止／再開部９は、上記の所定の条件を満たさない場合（ユーザが操作ボタンを押下していないと判断された場合）には、表示制御部７に対して操作ボタンの表示更新を再開する指示出力を行う。

　また、表示制御部７に対して操作ボタンの表示更新を停止する指示出力を行ってから、表示されている操作ボタンに対する操作がないまま（操作が検出されないまま）所定時間経過した場合に、表示更新を再開する指示出力を行うとしてもよい。
　さらに、当該所定時間は、この音声認識装置が搭載されている移動体の走行状態、例えば、走行速度や走行している道路等に応じて変化させてもよい。

　例えば、移動体の走行速度が速い場合や走行している道路状況が悪い場合には、ユーザが運転に集中する必要があるため、操作ボタンに対する操作ができないこともあると考え、所定時間を長く設定し、逆に、移動体の走行速度が遅い場合や走行している道路状況が良好である場合には、ユーザは比較的操作ボタンに対する操作がしやすい状況にあると考え、所定時間を短く設定する。

　次に図５～図８に示すフローチャートを用いて、実施の形態１における音声認識装置の処理を説明する。
　図５は、例えば図３に示すように、操作ボタン表示領域の中に操作ボタンが１つしか表示できない場合の操作ボタンの生成および表示の処理を示したフローチャートである。

　まず初めに、音声取得部３は、マイク２により集音されたユーザ発話、すなわち、入力された音声を取込み、例えばＰＣＭによりＡ／Ｄ変換する（ステップＳＴ０１）。
　次に、音声認識部５は、音声取得部３によりデジタル化された音声信号から、ユーザが発話した内容に該当する音声区間を検出し、該音声区間の音声データの特徴量を抽出し、その特徴量に基づいて音声認識辞書４を参照して認識処理を行い、認識結果を出力する（ステップＳＴ０２）。

　そして、操作ボタン生成部６は、音声認識部５により出力された認識結果に対応する機能を有する操作ボタンを生成する（ステップＳＴ０３）。
　その後、表示制御部７は、表示部８に既に表示されている操作ボタンがあるか否かを判定する（ステップＳＴ０４）。

　既に表示されている操作ボタンがある場合（ステップＳＴ０４のＹＥＳの場合）は、操作ボタンの表示更新が停止中か否かの判定を行う（ステップＳＴ０５）。そして、表示更新停止中でない場合（ステップＳＴ０５のＮＯの場合）、既に表示されている操作ボタンを消去し、ステップＳＴ０３において操作ボタン生成部６により生成された操作ボタンを表示する指示出力を表示部８に対して行う（ステップＳＴ０６）。

　一方、表示更新停止中の場合（ステップＳＴ０５のＹＥＳの場合）は、生成された操作ボタンを表示することなく、ステップＳＴ０１の処理へ戻る。
　また、ステップＳＴ０４において、表示されている操作ボタンがない場合（ステップＳＴ０４のＮＯの場合）は、ステップＳＴ０３において操作ボタン生成部６により生成された操作ボタンを表示する指示出力を表示部８に対して行う（ステップＳＴ０７）。

　次に、表示部８の操作ボタン表示領域６０に複数の操作ボタンが表示可能な場合について、図６のフローチャートに沿って説明する。
　図６は、例えば図４に示すように、操作ボタン表示領域６０に操作ボタンが複数（図４の場合には２個）表示できる場合の操作ボタンの生成および表示の処理を示したフローチャートである。

　ステップＳＴ１１～ＳＴ１３の処理については、図５に示すフローチャートのステップＳＴ０１～ＳＴ０３と同じであるので、説明を省略する。
　ステップＳＴ１３において操作ボタンを生成した後、表示制御部７は、表示部８の操作ボタン表示領域６０に既に表示されている操作ボタンの個数を判定する（ステップＳＴ１４）。

　そして、既に所定個数（操作ボタン表示領域６０に表示できる最大個数）の操作ボタンが表示されている場合（ステップＳＴ１５のＹＥＳの場合、例えば図４（ｃ）の場合）、操作ボタンの表示更新が停止中か否かの判定を行う（ステップＳＴ１６）。

　表示更新停止中でない場合（ステップＳＴ１６のＮＯの場合）、操作ボタン表示領域６０に表示中の操作ボタンのうち、最初に表示された１つ目の操作ボタン（図４（ｃ）の場合の操作ボタン６１）を消去し、残りの操作ボタン（図４（ｃ）の場合の操作ボタン６２）の場所を１つずつ移動させ（図４（ｄ））、ステップＳＴ１３において操作ボタン生成部６により生成された操作ボタン（図４（ｄ）の場合の操作ボタン６３）を表示する指示出力を表示部８に対して行う（ステップＳＴ１７）。

　一方、表示更新停止中の場合（ステップＳＴ１６のＹＥＳの場合）は、生成された操作ボタンを表示することなく、ステップＳＴ１１の処理へ戻る。
　また、ステップＳＴ１５において、表示されている操作ボタンが所定個数（操作ボタン表示領域６０に表示できる最大個数）より少ない場合（ステップＳＴ１５のＮＯの場合、例えば図４（ｂ）の場合）には、操作ボタン表示更新停止／再開部９による操作ボタンの表示内容の更新を停止する指示信号にかかわらず、操作ボタン生成部６により生成された操作ボタン（図４（ｃ）の操作ボタン６２）を表示する指示出力を表示部８に対して行う（ステップＳＴ１８）。

　なお、図５，図６のフローチャートにおいて、ステップＳＴ０４、ステップＳＴ１４～ＳＴ１５の判断を行わないようにしてもよい。すなわち、表示制御部７は、表示されている操作ボタンの有無や個数にかかわらず、表示更新停止中である場合は、ステップＳＴ０１、ステップＳＴ１１の処理へ戻るようにしてもよい。

　図７は、操作ボタンが生成されない場合であっても、既に表示されている操作ボタンを消去する処理を示したフローチャートである。
　まず、表示制御部７は、表示部８の操作ボタン表示領域６０に表示されている操作ボタンについて、表示開始から所定時間が経過した操作ボタンがあるか否かを判定する（ステップＳＴ２１）。表示後、所定時間が経過している操作ボタンがない場合（ステップＳＴ２１のＮＯの場合）は、ステップＳＴ２１の処理へ戻る。

　一方、所定時間が経過している操作ボタンがある場合（ステップＳＴ２１のＹＥＳの場合）は、操作ボタンの表示更新が停止中か否かの判定を行う（ステップＳＴ２２）。表示更新停止中の場合（ステップＳＴ２２のＹＥＳの場合）は、ステップＳＴ２１の処理へ戻る。表示更新停止中でない場合（ステップＳＴ２２のＮＯの場合）は、表示開始から所定時間が経過した操作ボタンを表示部８から消去する指示出力を行い（ステップＳＴ２３）、ステップＳＴ２１の処理へ戻る。

　また、図８は、操作ボタン表示更新停止／再開部９が操作ボタンの表示更新停止／再開の指示出力を行う処理を示すフローチャートである。
　まず、操作ボタン表示更新停止／再開部９は、視線検出部１２、姿勢検出部１３、指示入力部１０から、各種情報を取得する（ステップＳＴ３１）。各種情報とは、具体的には、視線検出部１２からの視線情報、姿勢検出部１３からの姿勢情報、指示入力部１０からの操作情報、タッチパネルへの物体の接近／接触情報、表示更新が停止されている時間の少なくとも１つ以上のことである。

　そして、取得した情報が、前述の所定の条件（表示更新停止の条件）を満たした場合（ステップＳＴ３２のＹＥＳの場合）は、表示制御部７に対して表示更新停止の指示出力を行う（ステップＳＴ３３）。
　一方、所定の条件（表示更新停止の条件）を満たさなくなった場合（ステップＳＴ３２のＮＯの場合）は、表示更新再開の指示出力を行う（ステップＳＴ３４）。

　次に動作の一例を、具体例を挙げて説明する。
　例えば、図３に示すように、操作ボタン表示領域６０の中に操作ボタンが１つしか表示できない場合に、操作ボタンが表示されていない状態（図３（ａ）の状態）において、ユーザＡが「コンビニ行きたいね」と発話すると、音声認識部５によって認識処理が行われ認識結果として「コンビニ」を出力する（図５のステップＳＴ０１～ＳＴ０２）。

　そして、操作ボタン生成部６は、認識結果「コンビニ」に対応する機能、すなわち施設ジャンル「コンビニ」に属する施設を検索する機能を有する「コンビニ」という操作ボタン６１を生成する（ステップＳＴ０３）。
　ここで、表示部８の操作ボタン表示領域６０には操作ボタンが表示されていないので（ステップＳＴ０４のＮＯの場合）、表示制御部７は、操作ボタン６１を表示するよう表示部８に対して指示出力する（ステップＳＴ０７）。その結果、図３（ｂ）に示すように操作ボタン６１が表示される。

　続いて、ユーザＢが「銀行にもよらないと」と発話すると、操作ボタン生成部６は、認識結果「銀行」に対応する機能、すなわち施設ジャンル「銀行」に属する施設を検索する機能を有する「銀行」という操作ボタン６２を生成する（ステップＳＴ０１～ＳＴ０３）。

　このとき、表示部８の操作ボタン表示領域６０には、既に「コンビニ」という操作ボタン６１が表示されているため（ステップＳＴ０４のＹＥＳの場合）、例えばユーザＡが、その「コンビニ」という操作ボタン６１を押下しようとしており、指が表示部８に接近しているとすると、操作ボタン表示更新停止／再開部９は、表示制御部７に対して表示更新停止の指示出力を行い、表示更新が停止される。
　この結果、操作ボタンの表示更新が停止中であると判定されるので（ステップＳＴ０５のＹＥＳの場合）、「銀行」という操作ボタン６２は表示部８に表示されない。

　一方、ユーザＡが「コンビニ」という操作ボタン６１を押そうとしていない場合、例えば、ユーザＡの指が表示部８に接近していないときは、操作ボタン表示更新停止／再開部９は、表示制御部７に対して、表示更新停止の指示出力を行わない。
　この結果、操作ボタンの表示更新が停止中ではないと判断されるので（ステップＳＴ０５のＮＯの場合）、表示制御部７は、「コンビニ」という操作ボタン６１を消去して「銀行」という操作ボタン６２を表示するよう表示部８に指示出力する（ステップＳＴ０６、図３（ｃ））。

　次に、操作ボタン表示領域６０に複数、例えば図４に示すように、２つの操作ボタンを表示可能な場合の動作について説明する。すなわち、この場合の操作ボタン表示領域６０に表示可能な操作ボタンの最大個数（所定個数）は２個である。
　そして、図４（ｂ）に示すように、既に「コンビニ」という操作ボタン６１が１つだけ表示されている場合を例に説明する。この状態で、ユーザＢが「銀行にもよらないと」と発話すると、「銀行」という操作ボタン６２が生成される（図６のステップＳＴ１１～ＳＴ１３）。

　このとき、例えばユーザＡが「コンビニ」という操作ボタン６１を押下しようとしており、指が表示部８に接近していると、操作ボタン表示更新停止／再開部９は、表示制御部７に対して表示更新停止の指示出力を行う。
　しかし、表示部８に表示されている操作ボタンの個数が１つであるため（ステップＳＴ１４、ステップＳＴ１５のＮＯの場合）、表示更新停止中であるか否かにかかわらず、「銀行」という操作ボタン６２を表示する指示信号を出力する（ステップＳＴ１８）。
　その結果、図４（ｃ）のように、「銀行」という操作ボタン６２が表示される。

　次に、この状態において、例えばユーザＢが「銀行」という操作ボタン６２を押下しようとしており、指が表示部８に接近していると、操作ボタン表示更新停止／再開部９は、表示制御部７に対して表示更新停止の指示出力を行う。
　このとき、例えばユーザＡが「近くに駐車場ないかな」と発話すると、「駐車場」という操作ボタン６３が生成される（ステップＳＴ１１～ＳＴ１３）。

　しかし、図４（ｃ）に示すように、操作ボタンが２つ（最大個数（所定個数））表示されており、かつ、表示更新停止中であるので（ステップＳＴ１５のＹＥＳ、ステップＳＴ１６のＹＥＳの場合）、表示制御部７は、「駐車場」という操作ボタン６３を表示する指示信号を出力しない（表示は図４（ｃ）のまま）。

　一方、図４（ｃ）に示す状態において、ユーザの指が表示部８に接近していない場合には、操作ボタン表示更新停止／再開部９は、表示制御部７に対して表示更新再開の指示出力を行うので、この場合の表示更新停止中か否かの判定（ステップＳＴ１６）はＮＯになる。
　このとき、例えばユーザＡが「近くに駐車場ないかな」と発話すると、「駐車場」という操作ボタン６３が生成されるところまでは、前述の場合と同様である（ステップＳＴ１１～ＳＴ１３）。

　しかし、この場合には、操作ボタンが２つ（最大個数（所定個数））表示されており、かつ、表示更新停止中ではないので（ステップＳＴ１５のＹＥＳ、ステップＳＴ１６のＮＯの場合）、表示制御部７は、表示中の操作ボタン６１，６２のうち、１つ目の操作ボタン６１を消去して残りの操作ボタン６２を移動させ、ステップＳＴ１３において生成した操作ボタン６３を表示する指示出力を行う（ステップＳＴ１７）。
　その結果、図４（ｄ）のように、「駐車場」という操作ボタン６３が表示される。

　これにより、従来では、例えば図４（ｃ）において、ユーザがコンビニを検索したいため、「コンビニ」という操作ボタン６１を押下しようとした瞬間に、他のユーザの発話により当該「コンビニ」という操作ボタン６１が「銀行」操作ボタン６２に変わってしまい、意図しない操作ボタン６２を押下してしまう、すなわち、所望しない「銀行」を検索する機能を実行してしまう、ということを防ぐことができる。

　以上のように、この実施の形態１によれば、ユーザの視線や姿勢や所定の操作により、ユーザが操作ボタンを選択（押下）しようとしていると判断される場合は、操作ボタンの表示更新を停止するようにし、表示更新停止中には、新たに認識された音声により生成された操作ボタンを表示しないようにしたので、ユーザが所望の操作ボタンを選択しようとしたタイミングで、当該操作ボタンの位置が変更されたり、他の操作ボタンに変わったり、消滅したりすることがなくなるため、ユーザが所望しない操作ボタンを選択して誤動作を招くことを防ぐことができ、ユーザの利便性が向上する。

実施の形態２．
　図９は、この発明の実施の形態２における音声認識装置の一例を示すブロック図である。なお、実施の形態１で説明したものと同様の構成には、同一の符号を付して重複した説明を省略する。以下に示す実施の形態２では、実施の形態１と比べると、表示更新停止表現記憶部１４と表示更新再開表現記憶部１５を備え、操作ボタン表示更新停止／再開部９が、音声認識部５の音声認識により表示更新の停止／再開を行う点が異なる。

　音声認識部５は、実施の形態１に比べ、さらに「ストップ」「停止」「更新停止」「再開」「更新再開」等、操作ボタンの表示更新の停止／再開を意味する単語を認識して認識結果を出力する。
　表示更新停止表現記憶部１４には、「ストップ」「停止」「更新停止」等、操作ボタンの表示更新停止を意味する単語が記憶されている。
　表示更新再開表現記憶部１５には、「再開」「更新再開」等、操作ボタンの表示更新再開を意味する単語が記憶されている。

　操作ボタン表示更新停止／再開部９は、表示更新停止表現記憶部１４および表示更新再開表現記憶部１５を参照して、音声認識部５により出力された認識結果が、表示更新停止表現記憶部１４に記憶されている表示更新停止を表すものであるか否かを判断する。そして、音声認識部５により出力された認識結果が表示更新停止表現記憶部１４に存在すると判断した場合は、表示制御部７に対して操作ボタンの表示更新を停止する指示信号を出力し、表示更新再開表現記憶部１５に記憶されている表示更新再開を表すものであると判断した場合は、表示制御部７に対して操作ボタンの表示更新を再開する指示信号を出力する。

　次に、図１０に示すフローチャートを用いて、実施の形態２における音声認識装置の処理を説明する。
　図１０は、操作ボタン表示更新停止／再開部９が音声認識により操作ボタンの表示更新停止／再開の指示出力を行う処理を示すフローチャートである。

　まず、操作ボタン表示更新停止／再開部９は、音声認識部５により出力された認識結果を取得する（ステップＳＴ４１）。
　次に、操作ボタン表示更新停止／再開判定部９は、当該認識結果が表示更新停止表現記憶部１４に存在するか否かを判定する（ステップＳＴ４２）。存在する場合（ステップＳＴ４２のＹＥＳの場合）には、表示制御部７に対して表示更新停止の指示出力を行う（ステップＳＴ４３）。

　一方、ステップＳＴ４１で取得した認識結果が表示更新停止表現記憶部１４に存在しない場合（ステップＳＴ４２のＮＯの場合）は、当該認識結果が表示更新再開表現記憶部１５に存在するか否かを判定する（ステップＳＴ４４）。存在する場合（ステップＳＴ４４のＹＥＳの場合）は、表示制御部７に対して表示更新再開の指示出力を行う（ステップＳＴ４６）。
　また、ステップＳＴ４１で取得した認識結果が表示更新再開表現記憶部１５にも存在しない場合（ステップＳＴ４４のＮＯの場合）は、処理を終了する。

　このように、この実施の形態２では、操作ボタン表示更新停止／再開部９が、操作ボタンの表示更新停止／再開の指示を行うための条件が、ユーザの視線、姿勢、操作入力によるものではなく、ユーザの発話によるものとした点が実施の形態１とは異なるが、その他の動作処理および画面遷移例については、実施の形態１と同様であるので、図示および説明を省略する。

　以上のように、この実施の形態２によれば、ユーザが操作ボタンの表示更新を停止する発話をした場合、操作ボタンの表示更新を停止するようにし、表示更新停止中には、新たに認識された音声により生成されたボタンを表示しないので、ユーザが所望の操作ボタンを選択しようとしたタイミングで、当該操作ボタンの位置が変更されたり、他の操作ボタンに変わったり、消滅したりすることがなくなるため、ユーザが所望しない操作ボタンを選択して誤動作を招くことを防ぐことができ、ユーザの利便性が向上する。

　なお、上述した実施の形態１，２において、表示制御部７が、操作ボタン表示更新停止／再開部９から表示更新停止の指示信号を受けた場合は、表示部８に対して、既に表示されている操作ボタンの表示態様を変更するよう指示出力し、操作ボタン表示更新停止／再開部９から表示更新再開の指示信号を受けた場合は、変更された操作ボタンを元に戻す指示出力をするとしてもよい。ここで、表示態様とは、例えば操作ボタンの大きさ、色、文字のフォント等のことである。

　すなわち、表示制御部７が、操作ボタン表示更新停止／再開部９から表示更新停止の指示信号を受けた場合は、表示部８に対して、既に表示されている操作ボタンの大きさ、色、文字のフォントの少なくとも１つ以上を変更するよう指示出力し、操作ボタン表示更新停止／再開部９から表示更新再開の指示信号を受けた場合は、変更された操作ボタンを元に戻す指示出力をするとしてもよい。
　これにより、ユーザは操作ボタンの表示更新が停止中か否かを視覚的に判断することができる。また、操作ボタンを目立たせることで選択し易くなる。

　また、上述した実施の形態１，２において、さらに、表示部８に表示された操作ボタンの表示履歴を記憶する操作ボタン表示履歴記憶部（図示せず）を備えるようにしてもよい。この場合、表示制御部７は、表示更新により操作ボタンが表示部８から消去される度に、操作ボタン表示履歴記憶部に当該操作ボタンに関する情報を記憶する。
　そして、表示更新停止中に、ユーザにより操作ボタン表示領域に対してスクロール操作がなされると、操作ボタン表示履歴記憶部に記憶された情報に基づいて、過去に表示された操作ボタンを消去された順に表示するような制御を行う。

　具体的には、例えば図４（ａ）の状態から、ユーザが「コンビニ行きたいね」「銀行によらないと」と発話した場合、図４（ｃ）のように、「コンビニ」「銀行」の操作ボタン６１，６２が表示される。ここで、操作ボタンの最大表示個数が「２」であるとすると、次にユーザが「近くに駐車場ないかな」と発話した場合、表示されたのが最も古い１つ目の操作ボタンである「コンビニ」の操作ボタン６１が消去され、「駐車場」の操作ボタン６３が表示される（図４（ｄ））。

　このとき、表示制御部７は、消去された「コンビニ」の操作ボタン６１に関する情報を操作ボタン表示履歴記憶部に記憶する。そして、表示更新停止中にユーザによる操作ボタン表示領域に対するスクロール操作が行われると、表示制御部７は例えばタッチセンサからの信号に基づいて、表示中の操作ボタンを移動させるとともに、操作ボタン表示履歴記憶部に記憶された情報に基づいて、過去に表示された「コンビニ」の操作ボタン６１を表示するよう表示部８に対して指示出力する。

　図１１は、操作ボタン表示領域６０から消去された操作ボタンをスクロールにより表示させた場合の画面例を示す図である。
　ここでは、操作ボタン表示領域６０に表示可能な操作ボタンの最大個数は「３」とする。図１１（ａ）は、「コンビニ」の操作ボタン６１、「銀行」の操作ボタン６２、「スーパー」の操作ボタン６３が表示された後、さらに「駐車場」の操作ボタン６４が表示されたことにより、最初に表示された「コンビニ」の操作ボタン６１が消去された状態を示している。

　この際、表示制御部７は、消去された「コンビニ」の操作ボタン６１に関する情報を、操作ボタン表示履歴記憶部に記憶する。そして、表示更新停止中に、例えば図１１（ａ）の中の上向きの矢印のように、ユーザにより上向きにスクロール操作が行われると、表示制御部７は、表示中の操作ボタン６２～６４を上向きに移動させるとともに、操作ボタン表示履歴記憶部に記憶されていた「コンビニ」の操作ボタン６１を表示するよう、表示部８に対して指示出力する。その結果、図１１（ｂ）に示すように、操作ボタンがスクロールされて表示される。

　なお、操作ボタンのスクロールは、例えば、表示一体型のタッチパネル上（表示部８上）をなぞるようなタッチ操作によるものや、ステアリングスイッチ、リモコンの所定のボタン、その他の手動操作用のデバイス等、いずれの操作により行うことができるようにしてもよい。

　また、表示制御部７は、表示更新停止の指示信号を受けると、例えば、図１２に示すように、その時点で表示している操作ボタンに加えて、表示履歴として記憶されている操作ボタンを一覧表示するよう指示出力するとしてもよい。すなわち、例えば図１１（ａ）に示す状態になった後、表示更新停止中になると、スクロール操作を行うことなく、図１２に示すように、操作ボタン表示履歴記憶部に記憶されていた「コンビニ」の操作ボタン６１も合わせて表示される。この場合には、操作ボタン表示領域６０とは関係なく、表示中だった操作ボタンおよび記憶されていた操作ボタンがすべて表示される。

　さらに、表示制御部７は、操作ボタン表示履歴記憶部に操作ボタンに関する情報を記憶する際、既に記憶されているものと同一の情報である場合は、記憶しない（先の情報にマージする）としてもよい。
　例えば、操作ボタン表示履歴記憶部に「コンビニ」「銀行」の順で操作ボタンに関する情報が記憶されている場合において、さらに、「コンビニ」の操作ボタンに関する情報が取得されたとしても、これについては既に記憶部に記憶されているので記憶しない。
　これにより、同一の操作ボタンが複数表示されることを防止することができる。

　また、上述した実施の形態１，２において、さらに、操作ボタン生成部６により生成された操作ボタンに関する情報を記憶する操作ボタン生成履歴記憶部（図示せず）を備えるようにしてもよい。この場合、表示制御部７は、音声認識部５から出力された認識結果に基づいて操作ボタン生成部６により生成された操作ボタンであって、表示更新停止中であるために、表示部８へ表示されなかった操作ボタンに関する情報を、操作ボタン生成履歴記憶部に記憶する。

　そして、表示制御部７は、表示更新再開の指示信号を受けると、表示部８に表示中の操作ボタンに代えて、操作ボタン生成履歴記憶部に記憶されている情報に基づく操作ボタンを、表示部８に表示する指示出力を行う。
　このとき、操作ボタン表示領域６０には関係なく、表示部８に表示可能な最大個数分の操作ボタンを表示するように指示出力してもよいし、最大個数を超えない所定の個数分を表示するように指示出力してもよい。

　具体的には、例えば、図４（ｃ）のように操作ボタンが表示されており、表示更新が停止中である場合に、「スーパーにも行かないと」と発話されると、操作ボタン生成部６により、「スーパー」の操作ボタンが生成される。ここで、表示更新が停止中であるため、表示制御部７は、「スーパー」操作ボタンを表示部８に表示する指示出力を行わず、当該操作ボタンに関する情報を操作ボタン生成履歴記憶部に記憶する。

　同様に、さらに「近くに駐車場ないかな」と発話されると、表示制御部７は、「駐車場」の操作ボタンに関する情報を操作ボタン生成履歴記憶部に記憶する。その後、表示制御部７は、表示更新再開の指示信号を受けると、操作ボタン生成履歴記憶部に記憶された情報に基づいて、「銀行」の操作ボタンと「コンビニ」の操作ボタンに代えて、表示部８に、「スーパー」の操作ボタンと「駐車場」の操作ボタンを表示するよう指示信号を出力する。

　また、上述した実施の形態１，２においては、表示更新停止中に、操作ボタンがユーザにより押下されたら選択されるものとして説明したが、表示更新停止中は、その操作ボタンの名称をユーザが発話することにより、当該操作ボタンを選択できるようにしてもよい。

　また、上述した実施の形態１，２において、表示更新停止中に、表示部８に表示されている操作ボタンの名称が読み上げられ、所望の操作ボタンが読み上げられている際に決定することにより、選択できるようにしてもよい。この場合、操作ボタン名称の読み上げ途中または読み上げ後所定時間内に、ユーザによりステアリングスイッチなどの指示入力部によって手動で決定操作が行われたり、「決定」「選択」などの発話音声が認識されたりした場合は、読み上げ対象となっている操作ボタンに対応する機能を実行するとしてもよい。

　この場合、文字列から音声を生成する音声合成部（図示せず）と、スピーカなどの音声出力部に対して音声合成部により生成された音声を出力する指示信号を出力する音声制御部（図示せず）を備える。そして、音声制御部は、操作ボタン表示更新停止／再開部９から表示更新停止の信号を受けると、表示制御部７から、表示部８に表示されている操作ボタンの名称を取得し、当該名称に基づいて音声を合成するよう音声合成部に指示出力を行う。音声合成部は、当該指示を受けて音声を合成する。そして、音声制御部は、音声合成部により生成された音声データを出力するよう、音声出力部に指示出力を行う。

　なお、読み上げ中または読み上げ後所定時間内に、ユーザによって手動または音声による操作ボタンの決定操作が行われた場合の動作については、公知の技術を利用すればよいため、ここでは説明を省略する。

実施の形態３．
　以上の実施の形態１，２では、この発明における音声認識装置を、車両等の移動体に搭載されるナビゲーション装置に適用した場合を例に説明したが、適用するのは車載用のナビゲーション装置に限らず、人、車両、鉄道、船舶または航空機等を含む移動体用のナビゲーション装置であってもよいし、音声認識システムのサーバやナビゲーションシステムのサーバに適用してもよい。また、スマートフォン、タブレットＰＣ、携帯電話等の携帯情報端末等にインストールされる音声認識システムのアプリケーションやナビゲーションシステムのアプリケーション等、どのような形態のものにも適用することができる。

　図１３は、この発明の実施の形態３におけるナビゲーションシステムの概要を示す図である。このナビゲーションシステムは、車載装置１００が、スマートフォンなどの携帯情報端末１０１およびサーバ１０２の少なくとも一方と連携して音声認識処理およびナビゲーション処理を行ったり、スマートフォンなどの携帯情報端末１０１およびサーバ１０２の少なくとも一方が音声認識処理およびナビゲーション処理を行い、車載装置１００に認識結果や地図情報を表示させる等、様々な形態をとることができる。以下、当該ナビゲーションシステムの構成態様について説明する。

　実施の形態１，２では、この発明の音声認識装置の機能を、図１３に示す車載装置１００がすべて備えるものとして説明したが、この実施の形態３におけるナビゲーションシステムでは、サーバ１０２が音声認識処理を行い、その認識結果を車載装置１００に表示させることによりユーザに提供する場合、および、携帯情報端末１０１がサーバ１０２と連携して音声認識処理を行い、その認識結果を車載装置１００に表示させることによりユーザに提供する場合について説明する。

　まず、サーバ１０２が音声認識処理を行い、その認識結果を車載装置１００に表示させる場合、すなわち、音声認識機能を有するサーバ１０２と連携して、車載装置１００が表示装置として機能する場合について説明する。
　この構成においては、車載装置１００がサーバ１０２と直接通信するか、または、車載装置１００が携帯情報端末１０１を経由してサーバ１０２と通信する場合が考えられる。サーバ１０２は、上記実施の形態１，２で説明した音声認識装置として機能する。また、車載装置１００は、サーバ１０２による認識結果をユーザに提供するための表示部８を少なくとも備える表示装置として機能する。

　このとき、（１）サーバ１０２が音声認識機能のみを有し、その他の構成については車載装置１００が備える場合、すなわち、車載装置１００が認識結果を取得して表示部に表示させる認識結果表示装置として機能する場合と、（２）車載装置１００が音声取得機能、通信機能および表示機能のみを有し、その他の構成についてはサーバ１０２が備える場合、すなわち、車載装置１００は取得した認識結果を表示する表示装置としてのみ機能する場合が考えられる。

　まず、（１）サーバ１０２が音声認識機能のみを有し、その他の構成については車載装置１００が備える場合、すなわち、車載装置１００が認識結果を取得して表示部に表示させる認識結果表示装置として機能する場合について説明する。
　この場合、サーバ１０２が音声認識辞書４と音声認識部５を備える音声認識サーバであり、認識結果表示装置である車載装置１００は、制御部１、音声取得部３、操作ボタン生成部６、表示制御部７、表示部８、操作ボタン表示更新停止／再開部９および通信機能（音声データ送信部、認識結果取得部）を備えている。

　そして、通信機能のうちの音声データ送信部（図示せず）が音声取得部３により取得された音声データをサーバ１０２へ送信し、当該サーバ１０２において音声認識された認識結果を認識結果取得部（図示せず）がサーバ１０２から取得する。また、操作ボタン生成部６は、認識結果取得部がサーバ１０２から取得した認識結果に対応する機能を有する操作ボタンを生成する。その他の機能については、実施の形態１，２における音声認識装置と同様のため、説明を省略する。

　次に、（２）車載装置１００が音声取得機能、通信機能および表示機能のみを有し、その他の構成についてはサーバ１０２が備える場合、すなわち、車載装置１００は取得した認識結果を表示する表示装置としてのみ機能する場合について説明する。
　この場合、車載装置１００は基本的に音声取得機能、通信機能および表示機能のみを有し、サーバ１０２による音声認識結果を受信してユーザに提供する。
　すなわち、サーバ１０２が表示部８以外を備える音声認識装置であり、この音声認識装置であるサーバ１０２が、ユーザにより発話された音声を認識して認識結果を表示装置である車載装置１００に表示させる。
　このように構成しても、実施の形態１，２と同様な効果を得ることができる。

　また、携帯情報端末１０１がサーバ１０２と連携して音声認識処理を行い、その認識結果を車載装置１００がユーザに提供する場合について説明する。
　この構成においては、車載装置１００が携帯情報端末１０１を経由してサーバ１０２と通信する場合が考えられ、携帯情報端末１０１のアプリケーションが、サーバ１０２と連携して音声認識処理を行う。また、車載装置１００は、携帯情報端末１０１とサーバ１０２による認識結果をユーザに提供するための表示部８を少なくとも備える表示装置として機能する。

　この場合にも、車載装置１００は基本的に音声取得機能、通信機能および表示機能のみを有し、携帯情報端末１０１とサーバ１０２との連携による音声認識結果を受信してユーザに提供する。
　すなわち、携帯情報端末１０１のアプリケーションにより、ユーザにより発話された音声を認識した認識結果を表示装置である車載装置１００に表示させる。
　このように構成しても、実施の形態１，２と同様な効果を得ることができる。

　なお、本願発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。

　この発明の音声認識装置は、車載用のナビゲーション装置に限らず、人、車両、鉄道、船舶または航空機等を含む移動体用のナビゲーション装置、携帯型のナビゲーション装置、携帯型の情報処理装置等、また、車載情報提供システムのサーバや、スマートフォン、タブレットＰＣ、携帯電話等の携帯情報端末等にインストールされるナビゲーションシステムのアプリケーション等に適用することができる。

　１　制御部、２　マイク、３　音声取得部、４　音声認識辞書、５　音声認識部、６　操作ボタン生成部、７　表示制御部、８　表示部、９　操作ボタン表示更新停止／再開部、１０　指示入力部、１１　カメラ、１２　視線検出部、１３　姿勢検出部、１４　表示更新停止表現記憶部、１５　表示更新再開表現記憶部、１６　自車マーク、６０　操作ボタン表示領域、６１，６２，６３，６４　操作ボタン、１００　車載装置、１０１　携帯情報端末、１０２　サーバ。

Claims

　ユーザにより発話された音声を認識して認識結果を表示する音声認識装置において、
　前記ユーザにより発話された音声を検知して取得する音声取得部と、
　前記音声認識装置が起動している間は常時、音声認識辞書を参照して、前記音声取得部により取得された音声データを認識し、認識結果を出力する音声認識部と、
　前記音声認識部により出力された認識結果に対応する機能を有する操作ボタンを生成する操作ボタン生成部と、
　前記操作ボタン生成部により生成された操作ボタンを表示する表示部と、
　前記表示部における前記操作ボタンの表示内容を制御する表示制御部と、
　前記表示部に表示されている操作ボタンを前記ユーザが操作しようとしているか否かに基づいて、前記表示制御部に対して前記操作ボタンの表示内容の更新停止および再開を指示する指示信号を出力する操作ボタン表示更新停止／再開部とを備え、
　前記操作ボタン表示更新停止／再開部は、前記表示部に表示されている操作ボタンを前記ユーザが操作しようとしていると判断した場合に、前記操作ボタンの表示内容の更新停止を指示する指示信号を出力し、
　前記表示制御部は、前記操作ボタン表示更新停止／再開部から前記操作ボタンの表示内容の更新停止の指示信号を受けた場合に、前記表示部に表示されている操作ボタンの表示更新を停止するよう前記表示部に対して指示を行う
　ことを特徴とする音声認識装置。
　前記ユーザによる各種操作の指示を受け付ける指示入力部をさらに備え、
　前記操作ボタン表示更新停止／再開部は、前記指示入力部により所定の操作が受け付けられた場合に、前記ユーザが前記操作ボタンを押下しようとしていると判断して前記操作ボタンの表示内容の更新停止を指示する指示信号を出力する
　ことを特徴とする請求項１記載の音声認識装置。
　前記指示入力部は、物体の接近を検知する近接センサを備えるものであり、
　前記所定の操作が受け付けられた場合とは、前記近接センサからの信号に基づいて、前記近接センサと前記物体との距離を算出し、当該算出された距離が所定値以下または所定値より小さい場合のことである
　ことを特徴とする請求項２記載の音声認識装置。
　前記ユーザの視線を検出する視線検出部をさらに備え、
　前記操作ボタン表示更新停止／再開部は、前記視線検出部により前記表示部に対する前記ユーザの視線が検出された場合に、前記ユーザが前記操作ボタンを操作しようとしていると判断して前記操作ボタンの表示内容の更新停止を指示する指示信号を出力する
　ことを特徴とする請求項１記載の音声認識装置。
　前記ユーザの姿勢を検出する姿勢検出部をさらに備え、
　前記操作ボタン表示更新停止／再開部は、前記姿勢検出部により所定の姿勢が検出された場合に、前記ユーザが前記操作ボタンを押下しようとしていると判断して前記操作ボタンの表示内容の更新停止を指示する指示信号を出力する
　ことを特徴とする請求項１記載の音声認識装置。
　前記表示部に表示されている操作ボタンが所定個数より少ない場合は、
前記操作ボタン表示更新停止／再開部は、前記ユーザが前記操作ボタンを操作しようとしていると判断した場合であっても、前記操作ボタンの表示内容の更新停止を指示しない
ことを特徴とする請求項１記載の音声認識装置。
　前記操作ボタンの表示更新停止を意味する単語が記憶されている表示更新停止表現記憶部をさらに備え、
　前記操作ボタン表示更新停止／再開部は、前記音声認識部により出力された認識結果が前記表示更新停止表現記憶部に存在すると判断した場合に、前記操作ボタンの表示内容の更新停止を指示する指示信号を出力する
　ことを特徴とする請求項１記載の音声認識装置。
　前記操作ボタン表示更新停止／再開部は、前記操作ボタンを前記ユーザが操作しようとしていると判断しなかった場合には、前記操作ボタンの表示内容の更新再開を指示する指示信号を出力し、
　前記表示制御部は、前記表示部における前記操作ボタンの更新が停止中であって、かつ、前記操作ボタン表示更新停止／再開部から前記操作ボタンの表示内容の更新再開の指示信号を受けた場合は、前記表示部に表示されている操作ボタンの表示更新を再開するよう前記表示部に対して指示を行う
　ことを特徴とする請求項１記載の音声認識装置。
　前記操作ボタン表示更新停止／再開部は、前記操作ボタンの表示内容の更新を停止する指示信号を出力してから、当該操作ボタンに対する操作がされないまま所定時間経過した場合に、前記操作ボタンの表示内容の更新を再開する
　ことを特徴とする請求項１記載の音声認識装置。
　前記音声認識装置は、移動体に搭載されるものであり、
　前記操作ボタン表示更新停止／再開部は、前記移動体の走行状態に応じて、前記所定時間を変更する
　ことを特徴とする請求項９記載の音声認識装置。
　前記表示制御部は、前記操作ボタン表示更新停止／再開部から前記操作ボタンの表示内容の更新停止の指示信号を受けた場合に、前記表示部に表示されている操作ボタンの表示態様を変更する
　ことを特徴とする請求項１記載の音声認識装置。
　前記表示態様とは、前記操作ボタンの大きさ、色、文字フォントの少なくとも１つ以上のことである
　ことを特徴とする請求項１１記載の音声認識装置。
　前記表示部に表示された操作ボタンの表示履歴を記憶する操作ボタン表示履歴記憶部をさらに備え、
　前記表示制御部は、前記操作ボタンの表示更新によって前記表示部から前記操作ボタンが消去される度に、当該消去された操作ボタンに関する情報を前記操作ボタン表示履歴記憶部に記憶するとともに、前記操作ボタンの表示更新停止中に、前記操作ボタンに対するスクロール操作が行われると、前記操作ボタン表示履歴記憶部に記憶されている操作ボタンを表示するよう前記表示部に対して指示を行う
　ことを特徴とする請求項１記載の音声認識装置。
　前記表示部に表示された操作ボタンの表示履歴を記憶する操作ボタン表示履歴記憶部をさらに備え、
　前記表示制御部は、前記操作ボタンの表示更新によって前記表示部から前記操作ボタンが消去される度に、当該消去された操作ボタンに関する情報を前記操作ボタン表示履歴記憶部に記憶するとともに、前記操作ボタンの表示更新停止中に、前記操作ボタン表示履歴記憶部に記憶されている操作ボタンを一覧表示するよう前記表示部に対して指示を行う
　ことを特徴とする請求項１記載の音声認識装置。
　前記操作ボタン生成部により生成された操作ボタンに関する情報を記憶する操作ボタン生成履歴記憶部をさらに備え、
　前記表示制御部は、前記操作ボタン生成部により生成された操作ボタンが、前記操作ボタンの表示更新停止中であったために前記表示部に表示されなかった操作ボタンに関する情報を、前記操作ボタン生成履歴記憶部に記憶させるよう指示を行うとともに、前記操作ボタンの表示更新再開の指示信号を受けると、前記表示部に表示中の操作ボタンに代えて、前記操作ボタン生成履歴記憶部に記憶されている情報に基づく操作ボタンを、前記表示部に表示するよう指示出力を行う
　ことを特徴とする請求項１記載の音声認識装置。
　ユーザにより発話された音声の認識結果を表示する認識結果表示装置において、
　前記ユーザにより発話された音声を検知して取得する音声取得部と、
　前記認識結果表示装置が起動している間は常時、前記音声取得部により取得された音声データを音声認識サーバへ送信し、当該サーバにおいて音声認識された認識結果を取得する認識結果取得部と、
　前記認識結果取得部により取得された認識結果に対応する機能を有する操作ボタンを生成する操作ボタン生成部と、
　前記操作ボタン生成部により生成された操作ボタンを表示する表示部と、
　前記表示部における前記操作ボタンの表示内容を制御する表示制御部と、
　前記表示部に表示されている操作ボタンを前記ユーザが操作しようとしているか否かに基づいて、前記表示制御部に対して前記操作ボタンの表示内容の更新停止および再開を指示する指示信号を出力する操作ボタン表示更新停止／再開部とを備え、
　前記操作ボタン表示更新停止／再開部は、前記表示部に表示されている操作ボタンを前記ユーザが操作しようとしていると判断した場合に、前記操作ボタンの表示内容の更新停止を指示する指示信号を出力し、
　前記表示制御部は、前記操作ボタン表示更新停止／再開部から前記操作ボタンの表示内容の更新停止の指示信号を受けた場合に、前記表示部に表示されている操作ボタンの表示更新を停止するよう前記表示部に対して指示を行う
　ことを特徴とする認識結果表示装置。
　ユーザにより発話された音声を認識して認識結果を表示装置に表示させる音声認識装置であって、
　前記音声認識装置が起動している間は常時、音声認識辞書を参照して、前記ユーザにより発話された音声を認識し、認識結果を出力する音声認識部と、
　前記音声認識部により出力された認識結果に対応する機能を有する操作ボタンを生成する操作ボタン生成部と、
　前記操作ボタン生成部により生成された操作ボタンを前記表示装置に表示する際の表示内容を制御する表示制御部と、
　前記表示装置に表示されている操作ボタンを前記ユーザが操作しようとしているか否かに基づいて、前記表示制御部に対して前記操作ボタンの表示内容の更新停止および再開を指示する指示信号を出力する操作ボタン表示更新停止／再開部とを備え、
　前記操作ボタン表示更新停止／再開部は、前記操作ボタンを前記ユーザが操作しようとしていると判断した場合に、前記操作ボタンの表示内容の更新停止を指示する指示信号を出力し、
　前記表示制御部は、前記操作ボタン表示更新停止／再開部から前記操作ボタンの表示内容の更新停止の指示信号を受けた場合に、前記表示装置に表示されている操作ボタンの表示更新を停止するよう前記表示装置に対して指示を行う
　ことを特徴とする音声認識装置。
　音声認識装置が、ユーザにより発話された音声を認識して認識結果を表示装置に表示させる表示方法であって、
　音声認識部が、前記音声認識装置が起動している間は常時、音声認識辞書を参照して、前記ユーザにより発話された音声を認識し、認識結果を出力するステップと、
　ボタン生成部が、前記音声認識部により出力された認識結果に対応する機能を有する操作ボタンを生成するステップと、
　操作ボタン表示更新停止／再開部が、前記表示装置に表示されている操作ボタンを前記ユーザが操作しようとしていると判断した場合に、前記操作ボタンの表示内容の更新停止を指示する指示信号を出力するステップと、
　表示制御部が、前記操作ボタン表示更新停止／再開部から前記操作ボタンの表示内容の更新停止の指示信号を受けた場合に、前記表示装置に表示されている操作ボタンの表示更新を停止するよう前記表示装置に対して指示を行うステップと
　を備えたことを特徴とする表示方法。