JP6109373B2

JP6109373B2 - サーバー装置および検索方法

Info

Publication number: JP6109373B2
Application number: JP2016075003A
Authority: JP
Inventors: 本間　健; 健本間; 福永　功一郎; 功一郎福永; 則男度會; 将敬本橋; 康成大淵
Original assignee: Clarion Co Ltd
Current assignee: Faurecia Clarion Electronics Co Ltd
Priority date: 2016-04-04
Filing date: 2016-04-04
Publication date: 2017-04-05
Anticipated expiration: 2031-09-22
Also published as: JP2016164791A

Description

本発明は、情報端末の技術に関するものである。

従来、ナビゲーション装置等の情報端末では、マイク等により音声入力を受け付けて、目的地や経由地等となりうる地理的名称を検索する技術が用いられている。特許文献１には、このようなナビゲーション装置についての技術が記載されている。

特開２００６−３４９４２７号公報

上記のようなナビゲーション装置では、ナビゲーション装置において音声を認識し、候補となる施設等を辞書検索する処理を実施しており、より高い検索機能を提供するためには、ナビゲーション装置の処理負荷を考慮して非常に高性能なデバイスを用いる必要がある。

本発明の目的は、より手軽に高い検索機能を利用できる情報端末の技術を提供することにある。

上記課題を解決すべく、本発明に係るサーバー装置は、ネットワークを介して所定の情報端末から音声情報を受信する音声情報受信手段と、複数の雑音除去アルゴリズムを適用して上記音声情報から雑音情報を除去し、適用された上記雑音除去アルゴリズムに応じて、雑音を除去された音声情報を複数生成する雑音除去手段と、雑音を除去された上記音声情報を、所定の音声認識装置へ上記ネットワークを介して送信する音声送信手段と、上記音声認識装置による上記音声情報の認識結果である複数の文字列候補を、上記ネットワークを介して受信する文字列受信手段と、適用された雑音除去のアルゴリズムに応じて重み付けが行われた一又は複数の上記文字列候補を、ＰＯＩ（ＰｏｉｎｔＯｆＩｎｔｅｒｅｓｔ）の情報を提供する所定のＰＯＩ提供装置へ上記ネットワークを介して送信する文字列送信手段と、上記文字列候補に関連するＰＯＩの情報を、上記ネットワークを介して受信するＰＯＩ情報受信手段と、上記ＰＯＩの情報を上記情報端末へ送信するＰＯＩ情報送信手段と、を備えることを特徴とする。

本願発明によれば、より手軽に高い検索機能を利用できる情報端末の技術を提供することが可能となる。

検索システムの概要図である。中継サーバー装置のハードウェア構成図である。ナビゲーション装置の概略構成図である。リンクテーブルの構成を示す図である。演算処理部の機能構成図である。情報検索処理の流れを示す図である。情報検索処理におけるシーケンス図である。ＰＯＩ検索結果統合処理のフロー図である。マイク選択処理のフロー図である。マイク発話時選択処理のフロー図である。情報検索処理の変形例の流れを示す図である。情報検索処理の別の変形例におけるシーケンス図である。

以下に、本発明の第一の実施形態を適用したナビゲーション装置および検索システムについて、図面を参照して説明する。

図１に、検索システム１０００の全体構成図を示す。検索システム１０００は、インターネット等の広域ネットワークやＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）、携帯電話網等のネットワーク３０を介して、車両に搭載されるナビゲーション装置１００と、中継サーバー装置５００と、音声特定サーバー装置９００と、ＰＯＩ提供サーバー装置９５０と、が接続可能に構成されている。

ここで、音声特定サーバー装置９００は、所定の事業者等がネットワーク３０を介して提供する音声認識サービスを実現する装置である。本実施形態においては、音声特定サーバー装置９００は、送信された音声情報（音声の特性を特定する波形情報）を受信すると、音声認識を行い、認識した言葉を文字列として送信する。なお、認識した言葉は通常曖昧性を有するため、Ｎ−ｂｅｓｔ検索等の曖昧さを許容する認識を行い、認識の確度に応じて、該当する可能性のある一または複数の文字列を送信する。

また、ＰＯＩ提供サーバー装置９５０は、所定の事業者等がネットワーク３０を介して提供するＰＯＩ（ＰｏｉｎｔＯｆＩｎｔｅｒｅｓｔ）の検索サービスを実現する装置である。本実施形態においては、ＰＯＩ提供サーバー装置９５０は、送信された文字列を受信すると、当該文字列に該当するＰＯＩ、すなわち当該文字列を含むか、または当該文字列に類似する文字列を含む一または複数のＰＯＩ、を検索して特定し、その該当の確からしさに応じて、ＰＯＩのリストを送信する。なお、ＰＯＩのリストには、送信された文字列ごとに、確度の高い順に一または複数のＰＯＩが対応付けられ、各ＰＯＩは、ＰＯＩの名称、ＰＯＩの位置を特定する緯度経度等の座標情報、ＰＯＩの住所、ＰＯＩについての電話番号等を含んでいる。

ナビゲーション装置１００は、地図情報を表示して、ナビゲーション装置１００の現在地を示す地点と、設定された目的地までの経路を誘導する情報とを示すことが可能ないわゆるナビゲーション装置である。

中継サーバー装置５００は、ナビゲーション装置１００からＰＯＩの検索要求と、音声情報とを受け付けると、音声情報について雑音除去を行い、音声特定サーバー装置９００へ送信し、音声特定サーバー装置９００から送信された文字列をＰＯＩ提供サーバー装置９５０へ送信し、受信したＰＯＩリストをナビゲーション装置１００へ送信する。

ここで、中継サーバー装置５００の構成について、さらに詳細に説明する。中継サーバー装置５００は、記憶部５１０と、制御部５２０と、送受信部５３０と、を備えている。記憶部５１０には、サーバ情報テーブル５１１が格納されており、音声特定を行うための音声特定サーバー装置９００と、ＰＯＩ提供を行うためのＰＯＩ提供サーバー装置９５０と、を特定するための設定情報が格納されている。

制御部５２０には、雑音除去処理部５２１と、ＰＯＩ提示部５２２と、が含まれている。雑音除去処理部５２１は、ナビゲーション装置１００から受信した音声情報に対して、一または複数の雑音除去アルゴリズムを用いて、各アルゴリズムに応じた雑音除去を行う。すなわち、雑音除去処理部５２１が、例えば４種類の雑音除去アルゴリズムを実行可能とする場合、ナビゲーション装置１００から受信した音声情報に対し、それぞれのアルゴリズムを適用して、４種類の雑音除去済みの音声情報を出力する。なお、このようなアルゴリズムには、適応フィルタリングにより雑音を取り除くアルゴリズムや、周波数領域で雑音のスペクトルを取り除くスペクトルサブトラクション、周波数領域で時間的に変化する短時間スペクトル(ＲｕｎｎｉｎｇＳｐｅｃｔｒｕｍ)に対して、各周波数毎に時間軸方向にディジタルフィルタを通過させる事で雑音を除去するＲｕｎｎｉｎｇＳｐｅｃｔｒｕｍＦｉｌｔｅｒ等のアルゴリズムがある。

ＰＯＩ提示部５２２は、ナビゲーション装置１００から音声情報を受け付けて、雑音除去処理部５２１に雑音除去を実施させ、雑音が除去された一または複数の音声情報を、サーバ情報テーブル５１１に格納された設定情報に基づき音声特定サーバー装置９００へ送信する。そして、音声特定サーバー装置９００から送信された一または複数の認識文字列を受信すると、ＰＯＩ提示部５２２は、受信した認識文字列をナビゲーション装置１００へ送信し、ナビゲーション装置１００の使用者から選択された文字列を受け付けると、ＰＯＩ提供サーバー装置９５０へ当該文字列を含むＰＯＩ検索要求を送信する。そして、ＰＯＩ提供サーバー装置９５０から送信されたＰＯＩリストを、ナビゲーション装置１００へ送信する。

送受信部５３０は、ネットワーク３０を介して、他の装置へ情報を送信し、他の装置から情報を受信する。本実施形態においては、送受信部５３０は、ナビゲーション装置１００と、音声特定サーバー装置９００と、ＰＯＩ提供サーバー装置９５０と、の間で通信を行う。

図２は、中継サーバー装置５００のハードウェア構成図である。中継サーバー装置５００は、入力装置５５１と、出力装置５５２と、通信装置５５３と、演算装置５５４と、主記憶装置５５５と、外部記憶装置５５６と、を有する。それぞれの装置は、バス５５７により接続されている。なお、入力装置５５１と、出力装置５５２と、は必須の構成ではなく、必要に応じて設けられるものであってよい。

入力装置５５１は、キーボードやマウス、あるいはタッチペン、その他ポインティングデバイスなどの入力を受け付ける装置である。出力装置５５２は、ディスプレイなどの表示を行う装置である。通信装置５５３は、ネットワーク３０などのネットワークを介して他の装置と通信を行う装置である。中継サーバー装置５００の通信装置５５３は、ネットワーク３０を通じて、音声特定サーバー装置９００と、ＰＯＩ提供サーバー装置９５０およびナビゲーション装置１００の通信装置１２等と通信を行うことができる。演算装置５５４は、例えばＣＰＵ（Central Processing Unit）などの演算装置である。主記憶装置５５５は、例えばＲＡＭ（Random Access Memory）などのメモリ装置である。外部記憶装置５５６は、例えばハードディスク装置やＳＳＤ（Solid State Drive）などの不揮発性記憶装置である。

なお、主記憶装置５５５に展開される命令コードは、外部記憶装置５５６に記憶されたものでもよく、また、通信装置５５３を介して、ネットワーク３０上の図示しない他の装置あるいはインターネット等のネットワーク上の装置から取得されたものでもよい。主記憶装置５５５は、演算装置５５４が実行する命令コードの展開を行う領域を有する。外部記憶装置５５６は、いわゆる通常の記憶装置であり、中継サーバー装置５００を動作させるソフトウェアや、当該ソフトウェアが必要とするデータの初期値、その他のデータなどを予め記録している。

上記した中継サーバー装置５００の制御部５２０の雑音除去処理部５２１、ＰＯＩ提示部５２２は、演算装置５５４が所定のプログラムを読み込み実行することにより構築される。そのため、主記憶装置５５５には、各機能部の処理を実現するためのプログラムが記憶されている。

なお、上記した中継サーバー装置５００の構成要素は、構成の理解を容易にするために、主な処理内容に応じて分類したものである。そのため、構成要素の分類の仕方やその名称によって、本願発明が制限されることはない。中継サーバー装置５００の構成は、処理内容に応じて、さらに多くの構成要素に分類することもできる。また、１つの構成要素がさらに多くの処理を実行するように分類することもできる。

また、中継サーバー装置５００の制御部５２０は、ハードウェア（ＡＳＩＣ、ＧＰＵなど）により構築されてもよい。また、各機能部の処理が一つのハードウェアで実行されてもよいし、複数のハードウェアで実行されてもよい。

図３に、ナビゲーション装置１００の全体構成図を示す。ナビゲーション装置１００は、演算処理部１と、ディスプレイ２と、記憶装置３と、音声入出力装置４（音声入力装置としてマイクロフォン４１、音声出力装置としてスピーカ４２を備える）と、入力装置５と、ＲＯＭ装置６と、車速センサ７と、ジャイロセンサ８と、ＧＰＳ(Global Positioning System)受信装置９と、ＦＭ多重放送受信装置１０と、ビーコン受信装置１１と、通信装置１２と、を備えている。

演算処理部１は、様々な処理を行う中心的ユニットである。例えば各種センサ７,８やＧＰＳ受信装置９、ＦＭ多重放送受信装置１０等から出力される情報に基づいて現在地を算出する。また、得られた現在地情報に基づいて、表示に必要な地図データを記憶装置３あるいはＲＯＭ装置６から読み出す。

また、演算処理部１は、読み出した地図データをグラフィックス展開し、そこに現在地を示すマークを重ねてディスプレイ２へ表示する。また、記憶装置３あるいはＲＯＭ装置６に記憶されている地図データ等を用いて、ユーザから指示された出発地又は現在地と、目的地（または、経由地や立ち寄り地）とを結ぶ最適な経路（推奨経路）を探索する。また、スピーカ４２やディスプレイ２を用いてユーザを誘導する。

ナビゲーション装置１００の演算処理部１は、各デバイス間をバス２５で接続した構成である。演算処理部１は、数値演算及び各デバイスを制御するといった様々な処理を実行するＣＰＵ(Central Processing Unit)２１と、記憶装置３から読み出した地図データ、演算データなどを格納するＲＡＭ(Random Access Memory)２２と、プログラムやデータを格納するＲＯＭ(Read Only Memory)２３と、各種ハードウェアを演算処理部１と接続するためのＩ／Ｆ（インターフェイス）２４と、を有する。

ディスプレイ２は、演算処理部１等で生成されたグラフィックス情報を表示するユニットである。ディスプレイ２は、液晶ディスプレイ、有機ＥＬディスプレイなどで構成される。

記憶装置３は、ＨＤＤ（Hard Disk Drive）や不揮発性メモリカードといった、少なくとも読み書きが可能な記憶媒体で構成される。

この記憶媒体には、通常の経路探索装置に必要な地図データ（地図上の道路を構成するリンクのリンクデータを含む）であるリンクテーブル２００が記憶されている。

図４は、リンクテーブル２００の構成を示す図である。リンクテーブル２００は、地図上の区画された領域であるメッシュの識別コード（メッシュＩＤ）２０１ごとに、そのメッシュ領域に含まれる道路を構成する各リンクのリンクデータ２０２を含んでいる。

リンクデータ２０２は、リンクの識別子であるリンクＩＤ２１１ごとに、リンクを構成する２つのノード（開始ノード、終了ノード）の座標情報２２２、リンクを含む道路の種別を示す道路種別２２３、リンクの長さを示すリンク長２２４、予め記憶されたリンク旅行時間２２５、当該リンクの開始ノードに接続するリンクである開始接続リンクと、当該リンクの終了ノードに接続するリンクである終了接続リンクと、を特定する開始接続リンク、終了接続リンク２２６、リンクを含む道路の制限速度を示す制限速度２２７などを含んでいる。

なお、ここでは、リンクを構成する２つのノードについて開始ノードと終了ノードとを区別することで、同じ道路の上り方向と下り方向とを、それぞれ別のリンクとして管理するようにしている。

図３に戻って説明する。音声入出力装置４は、音声入力装置として内蔵のマイクロフォン４１と、音声出力装置としてスピーカ４２と、を備える。マイクロフォン４１は、ユーザやその他の搭乗者が発した声などのナビゲーション装置１００の外部の音声を取得する。

また、音声入出力装置４は、拡張マイクロフォン４３の接続を受け付ける接続部を有する。すなわち、音声入出力装置４は、一般的により性能の高い集音性能を有するヘッドセット等の拡張マイクロフォン４３の接続を受け付けることができるため、より精度高く音声情報を受け付けることができる。

スピーカ４２は、演算処理部１で生成されたユーザへのメッセージを音声として出力する。マイクロフォン４１とスピーカ４２は、車両の所定の部位に、別個に配されている。ただし、一体の筐体に収納されていても良い。ナビゲーション装置１００は、マイクロフォン４１及びスピーカ４２を、それぞれ複数備えることができる。

入力装置５は、ユーザからの指示をユーザによる操作を介して受け付ける装置である。入力装置５は、タッチパネル５１と、ダイヤルスイッチ５２と、その他のハードスイッチ（図示しない）であるスクロールキー、縮尺変更キーなどで構成される。また、入力装置５には、ナビゲーション装置１００に対して遠隔で操作指示を行うことができるリモートコントローラが含まれる。リモートコントローラは、ダイヤルスイッチやスクロールキー、縮尺変更キーなどを備え、各キーやスイッチが操作された情報をナビゲーション装置１００に送出することができる。

タッチパネル５１は、ディスプレイ２の表示面側に搭載され、表示画面を透視可能である。タッチパネル５１は、ディスプレイ２に表示された画像のＸＹ座標と対応したタッチ位置を特定し、タッチ位置を座標に変換して出力する。タッチパネル５１は、感圧式または静電式の入力検出素子などにより構成される。

ダイヤルスイッチ５２は、時計回り及び反時計回りに回転可能に構成され、所定の角度の回転ごとにパルス信号を発生し、演算処理部１に出力する。演算処理部１では、パルス信号の数から、回転角度を求める。

ＲＯＭ装置６は、ＣＤ-ＲＯＭやＤＶＤ-ＲＯＭ等のＲＯＭ（Read Only Memory）や、ＩＣ（Integrated Circuit）カードといった、少なくとも読み取りが可能な記憶媒体で構成されている。この記憶媒体には、例えば、動画データや、音声データなどが記憶されている。

車速センサ７,ジャイロセンサ８およびＧＰＳ受信装置９は、ナビゲーション装置１００で現在地（自車位置）を検出するために使用されるものである。車速センサ７は、車速を算出するのに用いる値を出力するセンサである。ジャイロセンサ８は、光ファイバジャイロや振動ジャイロ等で構成され、移動体の回転による角速度を検出するものである。ＧＰＳ受信装置９は、ＧＰＳ衛星からの信号を受信し移動体とＧＰＳ衛星間の距離と距離の変化率とを３個以上の衛星に対して測定することで移動体の現在地、進行速度および進行方位を測定するものである。

ＦＭ多重放送受信装置１０は、ＦＭ放送局から送られてくるＦＭ多重放送信号を受信する。ＦＭ多重放送には、ＶＩＣＳ（Vehicle Information Communication System：登録商標）情報の概略現況交通情報、規制情報、ＳＡ／ＰＡ（サービスエリア／パーキングエリア）情報、駐車場情報、天気情報などやＦＭ多重一般情報としてラジオ局が提供する文字情報などがある。

ビーコン受信装置１１は、ＶＩＣＳ情報などの概略現況交通情報、規制情報、ＳＡ／ＰＡ（サービスエリア／パーキングエリア）情報、駐車場情報、天気情報や緊急警報などを受信する。例えば、光により通信する光ビーコン、電波により通信する電波ビーコン等の受信装置である。

通信装置１２は、ナビゲーション装置１００を、ネットワーク３０等に接続させ、ネットワークに接続された中継サーバー装置５００等の他の装置と通信を行う装置である。なお、通信装置１２は、ナビゲーション装置１００に内蔵されるものであってもよいし、例えば携帯電話網を利用する通信モジュールや携帯電話等、外部機器として取り付け可能に搭載されるものであってもよい。また、ナビゲーション装置１００と通信装置１２との間は、ＵＳＢ（Universal Serial Bus）やＢｌｕｅｔｏｏｔｈ（登録商標）等の所定の通信規格により情報の送受信を行うものである。

図５は、演算処理部１の機能ブロック図である。図示するように、演算処理部１は、基本制御部１０１と、入力受付部１０２と、出力処理部１０３と、雑音レベル判定部１０４と、中継サーバー通信部１０５と、ＰＯＩ提示情報作成部１０６と、マイク認識部１０７と、を有する。

基本制御部１０１は、様々な処理を行う中心的な機能部であり、処理内容に応じて、他の処理部を制御する。また、各種センサ、ＧＰＳ受信装置９等の情報を取得し、マップマッチング処理等を行って現在地を特定する。また、随時、走行した日付および時刻と、位置と、を対応付けて、リンクごとに走行履歴を記憶装置３に記憶する。さらに、各処理部からの要求に応じて、現在時刻を出力する。

入力受付部１０２は、入力装置５またはマイクロフォン４１を介して入力された使用者からの指示を受け付け、その要求内容に対応する処理を実行するように演算処理部１の各部を制御する。例えば、使用者が推奨経路の探索を要求したときは、目的地を設定するため、地図をディスプレイ２に表示する処理を出力処理部１０３に要求する。

出力処理部１０３は、例えばポリゴン情報等の表示させる画面情報を受け取り、ディスプレイ２に描画するための信号に変換してディスプレイ２に対して描画する指示を行う。

雑音レベル判定部１０４は、音声入出力装置４のマイクロフォン４１または拡張マイクロフォン４３から入力される音声情報について、雑音レベルを判定する。具体的には雑音レベル判定部１０４は、受け付けた音声情報の所定の無音部分の波形、望ましくは音声情報の最初の１００ｍｓに相当する無音部分の波形に含まれるノイズ成分を抽出し、当該ノイズ量の多寡に応じて雑音レベルを所定のレベル以上であるか否かを判定する。

中継サーバー通信部１０５は、入力された音声情報を、中継サーバー装置５００へ送信する。また、中継サーバー通信部１０５は、音声認識の結果得られた文字列を中継サーバー装置５００から受信する。また、中継サーバー通信部１０５は、選択されたＰＯＩの情報を中継サーバー装置５００へ送信し、ＰＯＩリスト情報を受信する。

ＰＯＩ提示情報作成部１０６は、受信したＰＯＩリスト情報を統合して、ＰＯＩリストとして選択可能に使用者へ提示するための画面情報等を作成し、出力処理部１０３へ出力を依頼する。

マイク認識部１０７は、ナビゲーション装置１００に接続されたマイクロフォンの認識を行う。具体的には、マイク認識部１０７は、拡張マイクロフォン４３が接続されたことを検知して、内蔵のマイクロフォン４１との間でいずれのマイクを使用するかについての使用者の選択に応じて使用するマイクロフォンを特定する。

上記した演算処理部１の各機能部、すなわち基本制御部１０１、入力受付部１０２、出力処理部１０３、雑音レベル判定部１０４、中継サーバー通信部１０５、ＰＯＩ提示情報作成部１０６、マイク認識部１０７は、ＣＰＵ２１が所定のプログラムを読み込み実行することにより構築される。そのため、ＲＡＭ２２には、各機能部の処理を実現するためのプログラムが記憶されている。

なお、上記した各構成要素は、ナビゲーション装置１００の構成を、理解を容易にするために、主な処理内容に応じて分類したものである。そのため、構成要素の分類の仕方やその名称によって、本願発明が制限されることはない。ナビゲーション装置１００の構成は、処理内容に応じて、さらに多くの構成要素に分類することもできる。また、１つの構成要素がさらに多くの処理を実行するように分類することもできる。

また、各機能部は、ハードウェア（ＡＳＩＣ、ＧＰＵなど）により構築されてもよい。また、各機能部の処理が一つのハードウェアで実行されてもよいし、複数のハードウェアで実行されてもよい。

［動作の説明］次に、ナビゲーション装置１００、中継サーバー装置５００、音声特定サーバー装置９００およびＰＯＩ提供サーバー装置９５０を含む検索システム１０００において実施されるＰＯＩ検索処理の動作について説明する。図６は、ＰＯＩ検索処理を示すフロー図である。このフローは、ナビゲーション装置１００が起動している状態において、所定のＰＴＴ（ＰｕｓｈＴｏＴａｌｋ）ボタン等による音声入力の開始指示を受け付けることで開始される。

まず、入力受付部１０２は、音声入力の待ち受けを開始する（ステップＳ００１）。そして、入力受付部１０２は、ＰＴＴボタンの開放等により音声待ち受けを終了する（ステップＳ００３）まで、音声区間を検出し、入力された音声情報を圧縮して音声情報を作成する（ステップＳ００２）。なお、ここで、雑音レベル判定部１０４が、入力された音声情報の雑音レベルを判定する。そして、雑音レベルが所定よりも高い場合、すなわち雑音が多い環境では、入力受付部１０２は、圧縮率を低く設定して圧縮することとし、圧縮による音質劣化を最小限に留めるようにしてもよい。また、雑音レベルがさらに高く所定の閾値を超える場合、すなわち雑音が大きすぎて到底正常に音声認識を行うことができない程度に大きい環境においては、入力受付部１０２は、音声情報の作成を行わず、以降の処理を実施しないようにしてもよい。

そして、入力受付部１０２は、中継サーバー通信部１０５を介して、中継サーバー装置５００へ音声情報を送信する。そして、中継サーバー装置５００の雑音除去処理部５２１は受信した音声情報に対して、所定のアルゴリズムを実現する雑音除去処理を実施する（ステップＳ００４）。具体的には、雑音除去処理部５２１は、雑音除去処理時に適用することをあらかじめ定められた一または複数のアルゴリズムにより、受信した音声情報に対して雑音除去処理を実施して、雑音を除去された一または複数の音声情報を生成する。

そして、ＰＯＩ提示部５２２は、雑音を除去された一または複数の音声情報を音声特定サーバー装置９００へ送信する。そして、音声特定サーバー装置９００は、各音声情報に所定の音声認識処理を実施して認識した結果である候補の一または複数の文字列情報を中継サーバー装置５００へ送信する（ステップＳ００５）。なお、当該音声認識処理においては、既存の音声認識等の処理が行われ、Ｎ−ｂｅｓｔ検索等により一または複数の認識結果の候補となる文字列がその確度とともに出力される。例えば、使用者が発話した音声情報が「ピザ」に該当するものである場合、「ピザ」、「Pizza」、「膝」、「いか」等の候補となる文字列が音声情報ごとに出力される。

そして、ＰＯＩ提示部５２２は、出力された認識結果の文字列情報を受け取ると、認識結果に対して重みづけを行う（ステップＳ００６）。具体的には、出力された認識結果の文字列情報は、雑音除去のアルゴリズムに応じて一または複数の候補が挙げられており、その中で重複する候補があれば一つに統合し、統合された候補についてはその確度をより高いもの（例えば、確度に所定の割合を上乗せする）として補正し、確度の順に候補の文字列を順位付けする。なお、ＰＯＩ提示部５２２は、当該重みづけ処理において、音声情報に適用された雑音除去のアルゴリズムに応じて重みづけを行うようにしてもよい。すなわち、適切な雑音除去のアルゴリズムが適用された音声情報は認識精度が高いものと考えられるため、認識精度が高いと考えられる候補を重視するようにしてもよい。また、施設に該当しない可能性が高いＰＯＩについての候補があれば、これを除去してもよい。

ＰＯＩ提示部５２２は、順位付けした候補の文字列をナビゲーション装置１００へ送信する。そして、ナビゲーション装置１００のＰＯＩ提示情報作成部１０６は、受信した順位付けされた認識結果の候補の文字列を、選択可能にリスト出力する画面情報を作成し、出力処理部１０３へ指示してディスプレイ２へ表示させる（ステップＳ００７）。なお、ここで、順位付けした文字列の候補の数が所定の数に満たない場合、あるいは、ステップＳ００２にて受け付けた音声情報に含まれる雑音のレベルが所定よりも低い場合、すなわち音声の認識結果にあいまいさが少ない場合には、後述するステップＳ００８の処理を省略して、ステップＳ００９のＰＯＩの検索依頼を送信する処理を実施するようにしてもよい。

そして、入力受付部１０２は、表示された画面において使用者が指定した候補の選択入力を受け付けて、中継サーバー通信部１０５を介して中継サーバー装置５００へ送信する（ステップＳ００８）。

ＰＯＩ提示部５２２は、送信された候補の文字列について、ＰＯＩ提供サーバー装置９５０へ送信し、ＰＯＩの検索依頼を送信する（Ｓ００９）。

ＰＯＩ提供サーバー装置９５０は、送信された候補の文字列をその施設名あるいは住所等に含むか、送信された候補の文字列に類似する文字列をその施設名あるいは住所等に含むＰＯＩをゆらぎ検索し、複数のＰＯＩの候補を確度別に検索し、当該ＰＯＩの名称、座標、電話番号、住所等を含む情報を含むＰＯＩリストを中継サーバー装置５００へ送信する（ステップＳ０１０）。

ＰＯＩ提示部５２２は、送信されたＰＯＩリストに対して、後述するＰＯＩ検索結果統合処理を実施して統合する（ステップＳ０１１）。そして、ＰＯＩ提示部５２２は、ナビゲーション装置１００に対して、統合したＰＯＩ検索結果を送信する。

ＰＯＩ提示情報作成部１０６は、受信したＰＯＩ検索結果を用いて、各ＰＯＩを選択可能に表示する表示画面を作成し、出力処理部１０３に対してディスプレイ２に表示するよう指示する（ステップＳ０１２）。例えば、ＰＯＩ提示情報作成部１０６は、選択された候補が「ピザ」である場合には、ピザ食を提供するレストランのリスト等を選択可能に表示するとともに、当該レストランの座標位置に応じて、地図上の該当する位置に当該レストランのアイコンを表示する画面を作成する。

そして、基本制御部１０１は、表示したＰＯＩの選択を入力受付部１０２を介して受け付け、選択されたＰＯＩを目的地あるいは経由地とする経路探索を行う（ステップＳ０１３）。当該経路探索時には、基本制御部１０１は、選択されたＰＯＩの名称を含むルート探索メッセージを表示する。例えば、基本制御部１０１は、選択されたＰＯＩの名称が「東京ピザ」であれば、「東京ピザへのルートを探索します」というメッセージを表示して、当該ＰＯＩへの経路探索を実施する。

以上が、ＰＯＩ検索処理のフローである。ＰＯＩ検索処理によると、より手軽に高い検索機能を利用できる。具体的には、ナビゲーション装置の処理能力は特別に高くなくとも、精度の高い音声認識および高機能なＰＯＩの検索機能を利用することができるといえる。

図７は、図６に示したＰＯＩ検索処理におけるステップＳ００２〜ステップＳ００７におけるプロセス間の関連を表したシーケンス図である。

まず、ナビゲーション装置１００の中継サーバー通信部１０５は、中継サーバー装置５００の送受信プロセス（ＰＯＩ提示部５２２により制御される）に対して音声情報の送信を開始する（ステップＳ１０１）。

そして、中継サーバー通信部１０５は、音声情報の送信をすべて終える（ステップＳ１０２）まで、音声情報の送信を継続する。

中継サーバー通信部１０５からの音声情報の送信が終わるのを待って、中継サーバー装置５００の送受信プロセスでは、雑音除去処理部５２１により制御される雑音除去プロセスへ音声情報の送信が開始される（ステップＳ１０３）。そして、すべての音声情報の送信が終わると、中継サーバー装置５００の送受信プロセスでは、雑音除去プロセスへの音声情報の送信が終了する（ステップＳ１０４）。

雑音除去プロセスでは、雑音除去処理部５２１により、送信された音声情報に対して所定の雑音除去処理が行われる（ステップＳ１０５）。中継サーバー装置５００の雑音除去処理部５２１は、雑音が除去された音声情報を、ＰＯＩ提示部５２２により制御されるサーバ通信プロセスへ送信開始する（ステップＳ１０６）。そして、雑音が除去された音声情報の送信が終わると、中継サーバー装置５００の雑音除去プロセスでは、サーバ通信プロセスへの音声情報の送信が終了する（ステップＳ１０７）。

雑音が除去された音声情報をすべて受信すると、サーバ通信プロセスでは、ＰＯＩ提示部５２２により、雑音除去プロセスから送られた雑音が除去された音声情報について、音声特定サーバー装置９００への送信が開始される（ステップＳ１０８）。なお、ここでは、雑音除去のアルゴリズム別に音声情報が存在する場合には、複数の音声情報がすべて送信される。

そして、雑音が除去された音声情報の送信が終わると、中継サーバー装置５００のサーバ通信プロセスでは、音声特定サーバー装置９００への音声情報の送信が終了する（ステップＳ１０９）。

そして、音声特定サーバー装置９００は、受信した雑音除去された音声情報に対して、所定の音声認識処理を行い、認識した結果得られた候補となる文字列をＮ−ｂｅｓｔ検索により一または複数特定する（ステップＳ１１０）。

そして、中継サーバー装置５００のサーバ通信プロセスでは、ＰＯＩ提示部５２２が、音声特定サーバー装置９００から送信された候補となる文字列をすべて受信する（ステップＳ１１１）。

中継サーバー装置５００のサーバ通信プロセスでは、ＰＯＩ提示部５２２が、送受信プロセスにおいて受信した文字列をすべて送受信プロセスに送る（ステップＳ１１２）。

中継サーバー装置５００の送受信プロセスでは、ＰＯＩ提示部５２２により、ナビゲーション装置１００の中継サーバー通信部１０５へ認識結果の文字列が送信される（ステップＳ１１３）。

以上が、図６に示したＰＯＩ検索処理におけるステップＳ００２〜ステップＳ００７におけるプロセス間の関連である。なお、雑音除去（ステップＳ００４）や認識結果の重みづけ（ステップＳ００６）等の処理については、当該プロセス間の関係の説明では詳細な説明を省略している。

図８は、ＰＯＩ検索結果統合処理のフローを示す図である。ＰＯＩ検索結果統合処理は、図６のＰＯＩ検索処理のステップＳ０１１において、中継サーバー装置５００によって実施される処理である。

まず、ＰＯＩ提示部５２２は、認識文字列間でＰＯＩリストが同一のものがあれば、確度の低い認識文字列とＰＯＩリストとを削除する（ステップＳ２０１）。具体的には、ＰＯＩ提示部５２２は、ＰＯＩ提供サーバー装置９５０から受信した一または複数の認識文字列とその確度、および対応するＰＯＩリストについて、各ＰＯＩリスト同士を比較して、ＰＯＩリストを構成するＰＯＩが完全に一致するＰＯＩリストがある場合には、確度の低い認識文字列についてのＰＯＩリストを削除し、合わせてその認識文字列と確度の情報も削除する。これをすべてのＰＯＩリスト間の重複がなくなるまで繰り返す。

そして、ＰＯＩ提示部５２２は、ＰＯＩリスト内で重複するＰＯＩがある場合には、確度の低いＰＯＩを当該リスト内から削除する（ステップＳ２０２）。ここで、ＰＯＩリストには、ＰＯＩの情報と、認識文字列に対する当該ＰＯＩの確度の情報が含まれているものとする。ＰＯＩ提示部５２２は、一の認識文字列についてのＰＯＩリスト内に、同一のＰＯＩ名称を有するＰＯＩが複数含まれる場合には、確度の低いＰＯＩをＰＯＩリストから削除し、重複を排除する。

そして、ＰＯＩ提示部５２２は、認識文字列間で共通するＰＯＩがあれば、確度の低い認識文字列のＰＯＩを削除する（ステップＳ２０３）。具体的には、ＰＯＩ提示部５２２は、認識文字列に対応するＰＯＩリストを認識文字列間で比較し、互いのＰＯＩリストに同一のＰＯＩ名称を有するＰＯＩが含まれる場合には、確度の低い認識文字列に対応付けられたＰＯＩリストに含まれるＰＯＩをＰＯＩリストから削除して、重複を排除する。

次に、ＰＯＩ提示部５２２は、類似する認識文字列間において、確度の低い認識文字列のＰＯＩを確度の高い認識文字列のＰＯＩリストに移動させる（ステップＳ２０４）。具体的には、ＰＯＩ提示部５２２は、認識文字列間において、文字列同士の類似する度合いが所定以上となる組み合わせを特定し、当該組み合わせにおいて、確度の低い認識文字列に対応付けられたＰＯＩリストに含まれるＰＯＩの情報を、確度の高い認識文字列に対応付けられたＰＯＩリストの下位に移動させて、ＰＯＩリストを統合する。

以上が、ＰＯＩ検索結果統合処理のフローである。ＰＯＩ検索結果統合処理によると、認識された文字列が類似する関係にある検索文字列により検索されたＰＯＩリストを統合しつつ、重複を排除したＰＯＩリストを得ることができる。

図９は、ナビゲーション装置１００にて実施される、マイク選択処理の処理フローである。マイク選択処理は、ナビゲーション装置１００において、基本制御部１０１等が拡張マイクロフォン４３の接続を新たに検知した場合に実施される

まず、マイク認識部１０７は、新たに接続されたマイクロフォン（以降、新規マイクと称呼）は既接続のマイクよりも近接するか否かを判定する（ステップＳ３０１）。具体的には、マイク認識部１０７は、新規マイクが発話者の口元付近に位置することが想定されるヘッドセットマイクであれば、当該新規マイクを最も「近接する」と判定する。新規マイクが外付けマイクであれば、内蔵のマイクロフォン４１より「近接する」と判定する。ただし、マイク認識部１０７は、ヘッドセットマイクが既接続であり、新規マイクが外付けマイクである場合には、新規マイクを「近接する」とは判定しない。

新規マイクが既接続のマイクよりも近接しない場合（ステップＳ３０１にて「Ｎｏ」の場合）には、マイク認識部１０７は、マイク選択処理を終了させる。

新規マイクが既接続のマイクよりも近接する場合（ステップＳ３０１にて「Ｙｅｓ」の場合）には、マイク認識部１０７は、使用するマイクの変更を問い合わせる表示を行う（ステップＳ３０２）。具体的には、マイク認識部１０７は、「新しいマイクを通常使用するマイクに設定しますか？」等のメッセージとともに、メッセージに対する肯定／否定等の応答となる変更指示を受け付けるダイアログボックス等を出力するよう出力処理部１０３に指示する。

マイク認識部１０７は、表示させた問い合わせに対する肯定／否定等の応答となる変更指示を受け付けると、受け付けた指示が肯定の内容であるか否かを判定する（ステップＳ３０３）。肯定する内容ではない場合には、マイク認識部１０７は、マイク選択処理を終了させる。

肯定する内容を受け付けた場合（ステップＳ３０３にて「Ｙｅｓ」の場合）には、マイク認識部１０７は、音声認識に使用するマイクを新規マイクへと変更する（ステップＳ３０４）。具体的には、マイク認識部１０７は、音声認識処理時に入力を受け付けるマイクロフォンの設定を、新規マイクに関連付ける。

以上が、マイク選択処理のフローである。マイク選択処理によると、新規マイクが認識されると、当該マイクが既接続のマイクよりも近接するものである場合には、当該マイクを音声認識に使用するか否か、使用者の指示に応じて設定することができる。なお、上記マイク選択処理は、使用者によりあらかじめ指定を受け付けたマイクがある場合には、当該マイクを優先して設定するようにしてもよい。

なお、マイク選択処理において新規マイクとして認識されるマイクは、ヘッドセットマイク等のマイクロフォンに限らず、例えば携帯電話等とブルートゥース（Ｂｌｕｅｔｏｏｔｈ：登録商標）接続されるマイクロフォンや、ＦＭトランスミッタ等によりナビゲーション装置１００と通信を行うマイクロフォン等、音声入力を受け付けることができるデバイスであればよい。

次に、使用者が発話する際にマイク認識部１０７が実施するマイク発話時選択処理について、図１０を用いて説明する。マイク発話時選択処理は、複数のマイクにより入力を受け付けることができる場合に、音質の良好なマイクからの入力を選択的に採用して入力音質を高く維持する処理である。

まず、基本制御部１０１は、入力されているすべてのマイクにおいて音声を受け付ける（ステップＳ４０１）。なお、音声を受け付けるマイクは、すべてのマイクではなく、あらかじめ指定された複数のマイク、あるいはゲインの大きい順に選択された所定数のマイクであってもよい。

次に、マイク認識部１０７は、マイクごとのノイズレベルを特定し、低レベルのマイクで受け付けた音声を採用する（ステップＳ４０２）。具体的には、マイク認識部１０７は、マイクごとに、入力された音声情報について、雑音レベル判定部１０４を介してノイズのレベル（Ｓ／Ｎ比）を特定し、ノイズ比が最も低い音声情報を採用して入力された音声として特定する。

以上が、マイク発話時選択処理の処理フローである。マイク発話時選択処理によると、実際に発話された音声情報のうち、音質が良い音声情報を採用することができるため、車両等音響環境が随時変化する場合等において、発話ごとに最も良い音質で音声入力を行うことができるといえる。

以上、本発明の第一の実施形態について説明した。本発明の第一の実施形態によると、ナビゲーション装置１００は、より手軽に高い検索機能を利用することができる。なお、上記マイク発話時選択処理は、使用者による指定を受け付けたマイクがある場合には、当該マイクを優先して採用するようにしてもよい。

本発明は、上記の実施形態に制限されない。上記の実施形態は、本発明の技術的思想の範囲内で様々な変形が可能である。例えば、図１１に示すように、音声認識された結果の文字列について、使用者の指示を待たずにＰＯＩ探索を行うよう、ＰＯＩ検索処理のフローを変更した第二の実施形態としてもよい。

第二の実施形態について、以下に説明する。第二の実施形態は、基本的に第一の実施形態とほぼ同様の構成を備える検索システムであり、ＰＯＩ検索処理に相違がある。当該相違を中心に、以下に説明する。

まず、入力受付部１０２は、音声入力の待ち受けを開始する（ステップＳ５０１）。そして、入力受付部１０２は、ＰＴＴボタンの開放等により音声待ち受けを終了する（ステップＳ５０３）まで、音声区間を検出し、入力された音声情報を圧縮して音声情報を作成する（ステップＳ５０２）。なお、ここで、雑音レベル判定部１０４が、入力された音声情報の雑音レベルを判定する。そして、雑音レベルが所定よりも高い場合、すなわち雑音が多い環境では、入力受付部１０２は、圧縮率を低く設定して圧縮することとし、圧縮による音質劣化を最小限に留めるようにしてもよい。また、雑音レベルがさらに高く所定の閾値を超える場合、すなわち雑音が大きすぎて到底正常に音声認識を行うことができない程度に大きい環境においては、入力受付部１０２は、音声情報の作成を行わず、以降の処理を実施しないようにしてもよい。

そして、入力受付部１０２は、中継サーバー通信部１０５を介して、中継サーバー装置５００へ音声情報を送信する。そして、中継サーバー装置５００の雑音除去処理部５２１は、受信した音声情報に対して、所定のアルゴリズムを実現する雑音除去処理を実施する（ステップＳ５０４）。具体的には、雑音除去処理部５２１は、雑音除去処理時に適用することをあらかじめ定められた一または複数のアルゴリズムにより、受信した音声情報に対して雑音除去処理を実施して、雑音を除去された一または複数の音声情報を生成する。

そして、ＰＯＩ提示部５２２は、雑音を除去された一または複数の音声情報を音声特定サーバー装置９００へ送信する。音声特定サーバー装置９００は、各音声情報に所定の音声認識処理を実施して認識した結果である候補である一または複数の文字列情報を中継サーバー装置５００へ送信する（ステップＳ５０５）。なお、当該音声認識処理においては、既存の音声認識等の処理が行われ、Ｎ−ｂｅｓｔ検索等により一または複数の認識結果の候補となる文字列がその確度とともに出力される。例えば、使用者が発話した音声情報が「ピザ」に該当するものである場合、「ピザ」、「Pizza」、「膝」、「いか」等の候補となる文字列が音声情報ごとに出力される。

そして、ＰＯＩ提示部５２２は、出力された認識結果の文字列情報を受け取り、認識結果に対して重みづけを行う（ステップＳ５０６）。具体的には、出力された認識結果の文字列情報は、雑音除去のアルゴリズムに応じて一または複数の候補が挙げられており、ＰＯＩ提示部５２２は、その中で重複する候補があれば一つに統合し、統合された候補についてはその確度をより高いもの（例えば、確度に所定の割合を上乗せする）として補正し、確度の順に候補の文字列を順位付けする。

ＰＯＩ提示部５２２は、順位付けした候補の文字列（複数）を、ＰＯＩ提供サーバー装置９５０へ送信し、ＰＯＩの検索依頼を送信する（Ｓ０５０７）。

ＰＯＩ提供サーバー装置９５０は、送信された候補の文字列のそれぞれについて、施設名あるいは住所等に含むか、送信された候補の文字列のそれぞれに類似する文字列をその施設名あるいは住所等に含むＰＯＩをゆらぎ検索し、一または複数のＰＯＩの候補を確度別に検索し、当該ＰＯＩの名称、座標、電話番号、住所等を含む情報を含むＰＯＩリストを候補の文字列に対応付けて中継サーバー装置５００へ送信する（ステップＳ５０８）。

ＰＯＩ提示部５２２は、送信された候補の文字列ごとのＰＯＩリストを、ナビゲーション装置１００に対して送信する（ステップＳ５０９）。

ＰＯＩ提示情報作成部１０６は、受信したＰＯＩ検索結果を用いて、候補の文字列ごとに、各ＰＯＩを選択可能に表示する表示画面を作成し、出力処理部１０３に対してディスプレイ２に表示するよう指示する（ステップＳ５１０）。例えば、ＰＯＩ提示情報作成部１０６は、候補の文字列が「ピザ」、「Pizza」、「膝」である場合には、ピザ食を提供するレストランのリスト等を、候補の文字列ごとに選択可能に表示するとともに、当該レストランの座標位置に応じて、地図上の該当する位置に当該レストランのアイコンを表示する画面を作成する。

そして、基本制御部１０１は、表示したＰＯＩの選択を、入力受付部１０２を介して受け付け、選択されたＰＯＩを目的地あるいは経由地とする経路探索を行う（ステップＳ５１１）。当該経路探索時には、基本制御部１０１は、選択されたＰＯＩの名称を含むルート探索メッセージを表示する。例えば、基本制御部１０１は、選択されたＰＯＩの名称が「東京ピザ」であれば、「東京ピザへのルートを探索します」というメッセージを表示して、当該ＰＯＩへの経路探索を実施する。

以上が、第二の実施形態に係るＰＯＩ検索処理のフローである。第二の実施形態に係るＰＯＩ検索処理によると、音声情報にもとづき認識された文字列の一または複数の候補それぞれについてＰＯＩを検索し提示することができるため、使用者の入力操作をより減らし、手軽に高い検索機能を利用できる。具体的には、ナビゲーション装置の処理能力は特別に高くなくとも、精度の高い音声認識および高機能なＰＯＩの検索機能を利用することができるといえる。

また、例えば、第一の実施形態においては、図７においてプロセス間の関連を表したように、音声情報を発話終了後にまとめてナビゲーション装置１００から中継サーバー装置５００等へ送信しているが、これに限られない。すなわち、音声情報を発話中にナビゲーション装置１００から中継サーバー装置５００等へ送信して、雑音除去を順次実施するようにしてもよい。このような変形処理について、図１２を用いて説明する。

まず、ナビゲーション装置１００の中継サーバー通信部１０５は、中継サーバー装置５００の送受信プロセス（ＰＯＩ提示部５２２により制御される）に対して音声情報の送信を開始する（ステップＳ６０１）。

なお、中継サーバー通信部１０５は、音声情報の送信をすべて終える（ステップＳ６０７）まで、音声情報の送信を継続する。

中継サーバー装置５００の送受信プロセスでは、ＰＯＩ提示部５２２は、音声情報の送信が開始されると、中継サーバー通信部１０５からの音声情報の送信が終わるのを待たずに、雑音除去処理部５２１により制御される雑音除去プロセスへ音声情報の送信を開始する（ステップＳ６０２）。なお、すべての音声情報の送信を終えると、中継サーバー装置５００の送受信プロセスでは、雑音除去プロセスへの音声情報の送信が終了する（ステップＳ６０８）。

雑音除去プロセスでは、雑音除去処理部５２１により、送信された音声情報に対して所定の雑音除去処理が行われる。中継サーバー装置５００の雑音除去処理部５２１は、まず、受け取った音声情報の先頭の所定の時間（例えば、１００ミリ秒間）の無音部分について、雑音レベルの判定を行い、雑音レベルに応じて適切な雑音除去アルゴリズムを一つまたは複数決定する（ステップＳ６０３）。そして、中継サーバー装置５００の雑音除去処理部５２１は、決定した雑音除去アルゴリズムを適用して、受信している音声情報に対して雑音除去を行い（ステップＳ６０４）、雑音が除去された部分から順次、ＰＯＩ提示部５２２により制御されるサーバ通信プロセスへ送信開始する（ステップＳ６０５）。なお、雑音が除去されたすべての音声情報の送信が終わると、中継サーバー装置５００の雑音除去プロセスでは、サーバ通信プロセスへの音声情報の送信が終了する（ステップＳ６０９）。

雑音が除去された音声情報を受信すると、サーバ通信プロセスでは、ＰＯＩ提示部５２２は、雑音除去プロセスから送られた雑音が除去された音声情報を順次、音声特定サーバー装置９００へ送信開始する（ステップＳ６０６）。なお、ここでは、雑音除去のアルゴリズム別に音声情報が存在する場合には、ＰＯＩ提示部５２２は、異なる雑音除去のアルゴリズムが適用された複数の音声情報をすべて送信する。

そして、雑音が除去された音声情報の送信が終わると、中継サーバー装置５００のサーバ通信プロセスでは、音声特定サーバー装置９００への音声情報の送信が終了する（ステップＳ６１０）。

そして、音声特定サーバー装置９００は、受信した雑音除去された一または複数の音声情報に対して、所定の音声認識処理を行い、認識した結果得られた候補となる文字列をＮ−ｂｅｓｔ検索により一または複数特定する（ステップＳ６１１）。

そして、中継サーバー装置５００のサーバ通信プロセスでは、ＰＯＩ提示部５２２は、音声特定サーバー装置９００から送信された候補となる文字列をすべて受信する（ステップＳ６１２）。

中継サーバー装置５００のサーバ通信プロセスでは、ＰＯＩ提示部５２２は、送受信プロセスに対して、受信した文字列をすべて送る（ステップＳ６１３）。

中継サーバー装置５００の送受信プロセスでは、ＰＯＩ提示部５２２により、ナビゲーション装置１００の中継サーバー通信部１０５に認識結果の文字列が送信される（ステップＳ６１４）。

以上が、ＰＯＩ検索処理におけるステップＳ００２〜ステップＳ００７におけるプロセス間の関連の変形例である。なお、雑音除去（ステップＳ００４）や認識結果の重みづけ（ステップＳ００６）等の処理については、当該プロセス間の関係の説明では詳細な説明を省略している。

このように変形することで、音声情報の発話から音声認識の開始までをリアルタイムに行うことができるため、音声認識処理の開始タイミングを早めることができ、応答性を高くすることができる。

以上、本発明について、実施形態を中心に説明した。なお、上記の各実施形態では、本発明をナビゲーション装置等に適用した例について説明したが、本発明はナビゲーション装置に限らず、情報端末全般に適用することができる。また、各実施形態においてナビゲーション装置１００で実施する処理および当該処理を実施するのに用いられる処理部は、他の端末装置（例えば、通信装置１２を介した携帯電話、スマートフォン等）に設けられ、当該処理の一部をナビゲーション装置１００と他の端末装置との間で分散させて処理するようにしてもよい。

１・・・演算処理部、２・・・ディスプレイ、３・・・記憶装置、４・・・音声出入力装置、５・・・入力装置、６・・・ＲＯＭ装置、７・・・車速センサ、８・・・ジャイロセンサ、９・・・ＧＰＳ受信装置、１０・・・ＦＭ多重放送受信装置、１１・・・ビーコン受信装置、１２・・・通信装置、２１・・・ＣＰＵ、２２・・・ＲＡＭ、２３・・・ＲＯＭ、２４・・・Ｉ／Ｆ、２５・・・バス、３０・・・ネットワーク、４１・・・マイクロフォン、４２・・・スピーカ、４３・・・拡張マイクロフォン、５１・・・タッチパネル、５２・・・ダイヤルスイッチ、１００・・・ナビゲーション装置、１０１・・・基本制御部、１０２・・・入力受付部、１０３・・・出力処理部、１０４・・・雑音レベル判定部、１０５・・・中継サーバー通信部、１０６・・・ＰＯＩ提示情報作成部、１０７・・・マイク認識部、２００・・・リンクテーブル、５００・・・中継サーバー装置、５１０・・・記憶部、５２０・・・制御部、５３０・・・送受信部、１０００・・・検索システム

Claims

ネットワークを介して所定の情報端末から音声情報を受信する音声情報受信手段と、
複数の雑音除去アルゴリズムを適用して前記音声情報から雑音情報を除去し、適用された前記雑音除去アルゴリズムに応じて、雑音を除去された音声情報を複数生成する雑音除去手段と、
雑音を除去された前記音声情報を、所定の音声認識装置へ前記ネットワークを介して送信する音声送信手段と、
前記音声認識装置による前記音声情報の認識結果である複数の文字列候補を、前記ネットワークを介して受信する文字列受信手段と、
適用された雑音除去のアルゴリズムに応じて重み付けが行われた一又は複数の前記文字列候補を、ＰＯＩ（ＰｏｉｎｔＯｆＩｎｔｅｒｅｓｔ）の情報を提供する所定のＰＯＩ提供装置へ前記ネットワークを介して送信する文字列送信手段と、
前記文字列候補に関連するＰＯＩの情報を、前記ネットワークを介して受信するＰＯＩ情報受信手段と、
前記ＰＯＩの情報を前記情報端末へ送信するＰＯＩ情報送信手段と、
を備えることを特徴とするサーバー装置。
適切な雑音除去のアルゴリズムが適用された音声情報を重視する重み付けが行われることを特徴とする請求項１に記載のサーバー装置。
前記文字列受信手段により受信した複数の文字列候補を、前記情報端末へ前記ネットワークを介して送信する文字列候補送信手段と、
前記情報端末で選択された一の文字列候補を、前記情報端末から前記ネットワークを介して受信する選択文字列受信手段と、を備え、
前記文字列送信手段は、
前記選択文字列受信手段により受信された一の文字列候補を、前記ＰＯＩ提供装置へ前記ネットワークを介して送信することを特徴とする請求項１又は２に記載のサーバー装置。
前記ＰＯＩ情報受信手段は、
前記複数の文字列候補ごとにＰＯＩの情報を受信することを特徴とする請求項１又は２に記載のサーバー装置。
前記ＰＯＩ情報受信手段により受信したＰＯＩの情報に複数のＰＯＩが含まれる場合には、重複を排除するＰＯＩ重複排除手段、
を備えることを特徴とする請求項１〜３のいずれか一項に記載のサーバー装置。
前記雑音除去手段は、前記音声情報受信手段が音声情報を受信し始めると、受信した音声情報から雑音情報を順次除去し、
前記音声送信手段は、前記雑音除去手段により雑音を除去された音声情報を順次所定の音声認識装置へ前記ネットワークを介して送信する、
ことを特徴とする請求項１〜５のいずれか一項に記載のサーバー装置。
サーバー装置を用いた検索方法であって、
前記サーバー装置は、音声情報受信手段と、雑音除去手段と、音声送信手段と、文字列受信手段と、文字列送信手段と、ＰＯＩ情報受信手段と、ＰＯＩ情報送信手段と、を備える制御手段を備え、
前記音声情報受信手段は、ネットワークを介して所定の情報端末から音声情報を受信する音声情報受信ステップを行い、
前記雑音除去手段は、複数の雑音除去アルゴリズムを適用して前記音声情報から雑音情報を除去し、適用された前記雑音除去アルゴリズムに応じて、雑音を除去された音声情報を複数生成する雑音除去ステップを行い、
前記音声送信手段は、雑音を除去された前記音声情報を、所定の音声認識装置へ前記ネットワークを介して送信する音声送信ステップを行い、
前記文字列受信手段は、前記音声認識装置による前記音声情報の認識結果である複数の文字列候補を、前記ネットワークを介して受信する文字列受信ステップを行い、
前記文字列送信手段は、適用された雑音除去のアルゴリズムに応じて重み付けが行われた一又は複数の前記文字列候補を、ＰＯＩ（ＰｏｉｎｔＯｆＩｎｔｅｒｅｓｔ）の情報を提供する所定のＰＯＩ提供装置へ前記ネットワークを介して送信する文字列送信ステップを行い、
前記ＰＯＩ情報受信手段は、前記文字列候補に関連するＰＯＩの情報を、前記ネットワークを介して受信するＰＯＩ情報受信ステップを行い、
前記ＰＯＩ情報送信手段は、前記ＰＯＩの情報を前記情報端末へ送信するＰＯＩ情報送信ステップを行う、
ことを特徴とする検索方法。
前記音声送信ステップでは、適切な雑音除去のアルゴリズムが適用された音声情報を重視する重み付けが行われることを特徴とする請求項７に記載の検索方法。
前記サーバー装置は、
前記文字列受信手段により受信した複数の文字列候補を、前記情報端末へ前記ネットワークを介して送信する文字列候補送信手段と、
前記情報端末で選択された一の文字列候補を、前記情報端末から前記ネットワークを介して受信する選択文字列受信手段と、を備え、
前記文字列送信ステップにおいて、
前記選択文字列受信ステップにおいて受信された一の文字列候補を、前記ＰＯＩ提供装置へ前記ネットワークを介して送信する、
ことを特徴とする請求項７又は８に記載の検索方法。
前記ＰＯＩ情報受信ステップにおいて、
前記複数の文字列候補ごとにＰＯＩの情報を受信することを特徴とする請求項７又は８に記載の検索方法。
前記サーバー装置は、ＰＯＩ重複排除手段を備え、
前記ＰＯＩ重複排除手段は、前記ＰＯＩ情報受信ステップにおいて受信したＰＯＩの情報に複数のＰＯＩが含まれる場合には、重複を排除するＰＯＩ重複排除ステップを行う、
ことを特徴とする請求項７〜９のいずれか一項に記載の検索方法。
前記雑音除去ステップでは、前記音声情報受信手段が音声情報を受信し始めると、受信した音声情報から雑音情報を順次除去し、
前記音声送信ステップでは、前記雑音除去ステップにおいて雑音を除去された音声情報を順次所定の音声認識装置へ前記ネットワークを介して送信する、
ことを特徴とする請求項７〜１１のいずれか一項に記載の検索方法。