JP2005122042A - 音声認識装置、音声認識方法、音声合成装置、音声合成方法、音声認識システム、音声合成システム、音声認識合成装置、およびナビゲーションシステム、ならびに移動体 - Google Patents

音声認識装置、音声認識方法、音声合成装置、音声合成方法、音声認識システム、音声合成システム、音声認識合成装置、およびナビゲーションシステム、ならびに移動体 Download PDF

Info

Publication number
JP2005122042A
JP2005122042A JP2003359434A JP2003359434A JP2005122042A JP 2005122042 A JP2005122042 A JP 2005122042A JP 2003359434 A JP2003359434 A JP 2003359434A JP 2003359434 A JP2003359434 A JP 2003359434A JP 2005122042 A JP2005122042 A JP 2005122042A
Authority
JP
Japan
Prior art keywords
speech
acoustic model
information
position information
control switching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003359434A
Other languages
English (en)
Inventor
Kazuaki Minami
見並  一明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Toyota InfoTechnology Center Co Ltd
Original Assignee
Toyota Motor Corp
Toyota InfoTechnology Center Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp, Toyota InfoTechnology Center Co Ltd filed Critical Toyota Motor Corp
Priority to JP2003359434A priority Critical patent/JP2005122042A/ja
Publication of JP2005122042A publication Critical patent/JP2005122042A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Navigation (AREA)

Abstract

【課題】騒音や雑音などの発生前に雑音の発生を想定して、状況およびタイミングに合わせて音声合成の音声出力音量/音質を変更でき、音声認識で使用する音響モデルの変更を変更して、利用するユーザにスムーズで効果的な音声認識合成サービスを提供する。
【解決手段】 位置情報を取得可能で、音声認識部7と音声合成部6とを制御する制御切替部101により音声認識及び音声合成を実行する。制御切替部101が取得した位置情報および場所状況データに基づき、音声認識部7により複数の音響モデルから、場所状況データおよび位置情報に適した音響モデルを選択して音声認識処理を実行する。また、制御切替部101が取得した位置情報および場所状況データに基づき、音声合成部6および発話音量/発話音質切替部107により、合成音声の発話音量の調節および/または発話音質の切替を実行する。
【選択図】 図2

Description

この発明は、音声認識装置、音声認識方法、音声合成装置、音声合成方法、音声認識システム、音声合成システム、音声認識合成装置およびナビゲーションシステム、ならびに移動体に関し、特に、音声対話型カーナビゲーションシステムや、音声対話型の通信型ナビゲーションシステムに適用して好適なものである。
従来、車載の音声合成および音声認識においては、特許文献1および特許文献2に記載されているものが知られている。
まず、特許文献1には、自動車に搭載されたオーディオ装置において、車室内の音量を走行中の車室内の騒音レベルに対応して聴取しやすいように自動調整する音量調節システムを提供することを目的として、車室内に設置され、音響信号発生源からの音響信号に音場制御処理を施す音場処理手段を有するオーディオ装置において、車室内に設置され、車室内の室内音を検出するマイクロホンと、前記マイクロホンにより検出された室内音から、前記音場処理手段により処理された音響信号を減算処理し、車室内における騒音信号を摘出する騒音信号摘出手段と、前記騒音信号摘出手段により摘出された騒音信号に応じて音響信号の音量を制御する音量制御手段とを有する音量調節システムが記載されている。
また、特許文献2には、ノイズ成分の推定を高精度で行なって認識率の向上を図るとともに、ユーザにとって使い易いものにすることを目的として、ユーザが音声入力すべくトークスイッチをオン操作すると、カーオーディオ装置を消音すると共に、一定時間のノイズ推定区間を設け、定常ノイズを推定する音声認識装置が記載されている。
この特許文献2における音声認識装置は、具体的には、ノイズ推定区間の終了時に「ピッ」という報知音を出力して音声検出区間を開始し、ここでユーザがコマンドや目的地を音声入力する。この音声検出区間の音声入力信号から、推定したノイズ成分を除去し、音声信号を得る。音声検出区間の終了時にも報知を行うことにより音声認識処理を行って、その後トークバックを実行して、カーオーディオ装置のミュートを解除するように構成されている。
特開平10−303669号公報 特開2000−322098号公報 特開平9−90963号公報
しかしながら、上述の従来の音声合成および音声認識においては、次のような問題があった。
すなわち、特許文献1に記載された音量調整システムにおいては、車室内騒音レベルに対して音量を調整するものであるので、音量の調整を実行することができるのは、騒音を検出した後である。そのため、音量調整を行うタイミングが騒音の発生よりも遅れてしまい、大幅なタイムラグが発生してしまうという問題があった。
また、特許文献2に記載された音声認識装置においては、ノイズ成分の推定を高精度に
行うことができる装置であるが、実際には、一定時間のノイズ推定区間を設けて、定常ノイズを推定している。そのため、どうしても、ノイズ成分の推定は、騒音や雑音を検出した後に行われてしまうという問題がある。
本発明者の知見によれば、これらの従来技術における問題点は、雑音を未知の要素と扱っていることに起因する。
したがって、この発明の目的は、騒音や雑音の発生を予見することにより、事前に、騒音や雑音の発生状況を想定することができ、さらに、状況に対して、音声合成の音声出力音量や音声認識における認識実行の準備を行うことができ、利用するユーザに対して、スムーズで効果的なサービスを提供することができる音声認識装置、音声認識方法、音声合成装置および音声合成方法、音声合成認識装置、およびナビゲーションシステム、ならびに移動体を提供することにある。
上記目的を達成するために、この発明の第1の発明は、
音声認識可能に構成された音声認識手段と、
位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段と、
複数の音響モデルを有して構成される切替用音響モデルデータベースと、
複数の音響モデルから1つの音響モデルを選択する音響モデル制御切替手段とを有し、
取得された位置情報と、位置情報に含まれる場所状況データとに基づいて、音響モデル制御切替手段により複数の音響モデルから、場所状況データおよび位置情報に適合した音響モデルを選択し、選択された音響モデルを用いて音声認識処理を実行能可能に構成されている
ことを特徴とする音声認識装置である。
この第1の発明において、典型的には、複数の稼動部から出力される出力信号を入力可能に構成され、稼動部ごとの出力信号に基づいた、それぞれの稼動部に固有の雑音情報に対する雑音抑圧特性データを格納した、雑音抑圧特性データベースをさらに有し、稼動している稼動部からの出力信号に基づいて、複数の音響モデルから選択された音響モデルに対して、雑音抑圧特性データベースの情報を加算して、音声認識処理を実行するように構成されている。
この発明の第2の発明は、
音声を認識可能に構成された音声認識手段と、
位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段と、
複数の音響モデルを有して構成される切替用音響モデルデータベースと、
複数の音響モデルから1つの音響モデルを選択する音響モデル制御切替手段とが、相互にデータを送受信可能に構成され、
取得された位置情報と、位置情報に含まれる場所状況データとに基づいて、音響モデル制御切替手段により複数の音響モデルから、場所状況データおよび位置情報に適した音響モデルを選択するように構成されている
ことを特徴とする音声認識システムである。
この第2の発明において、典型的には、複数の稼動部からの出力信号を入力可能に構成され、稼動部ごとの出力信号に基づいた、それぞれの稼動部に固有の雑音情報に対する雑音抑圧特性データを格納した、雑音抑圧特性データベースをさらに有し、稼動している稼動部からの出力信号に基づいて、複数の音響モデルから選択された音響モデルに対して、
雑音抑圧特性データベースの情報を加算して、音声認識処理を実行するように構成されている。
この発明の第3の発明は、
音声を認識可能に構成された音声認識手段と、
複数の音響モデルを有して構成される切替用音響モデルデータベースと、
切替用音響モデルデータベースから1つの音響モデルを選択する音響モデル制御切替手段と、
場所状況データを含む位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段とを用いて、
場所状況データに基づき、音響モデル制御切替手段により複数の音響モデルから、場所状況データに適合する音響モデルを選択する
ことを特徴とする音声認識方法である。
この第3の発明において、典型的には、複数の稼動部からの出力信号を入力可能に構成され、稼動部ごとの出力信号に基づいた、それぞれの稼動部に固有の雑音情報に対する雑音抑圧特性データを格納した雑音抑圧特性データベースをさらに有し、稼動している稼動部からの出力信号に基づいて、複数の音響モデルから選択された音響モデルに対して、雑音抑圧特性データベースの情報を加算して、音声認識処理が実行される。
この発明の第4の発明は、
音素を合成して、音声データとして出力可能に構成された音声合成手段と、
発話音量の調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、
位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段とを有し、
現在の位置情報と、位置情報に含まれる場所状況データに基づいて、発話音量の調節および/または発話音質の切替を実行可能に構成されている
ことを特徴とする音声合成装置である。
この発明の第5の発明は、
音素を合成して、音声データとして出力可能に構成された音声合成手段と、発話音量の調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、場所状況データを含む位置情報を取得可能に構成されているとともに制御の切替を実行可能に構成された制御切替手段とが、相互にデータを送受信可能に構成され、
取得された現在の位置情報と場所状況データとに基づいて、発話音量の調節および/または発話音質の切替を実行可能に構成されている
ことを特徴とする音声合成システムである。
この発明の第6の発明は、
音素を合成して、音声として出力可能に構成された音声合成手段と、発話音量の調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、場所状況データを含む位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段とを用いて、
音声を出力する際に、現在の位置情報と場所状況データとに基づき、発話音量の調節および/または発話音質の切替を実行する
ことを特徴とする音声合成方法である。
この発明の第7の発明は、
音声を認識可能に構成された音声認識手段と、
複数の音響モデルを有して構成される切替用音響モデルデータベースと、
複数の音響モデルから1つの音響モデルを選択する音響モデル制御切替手段と、
音素を合成して、音声として出力可能に構成された音声合成手段と、
発話音量の調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、
位置情報を取得可能に構成されているとともに、音声認識手段と音声合成手段との制御の切替を実行可能に構成された制御切替手段とを有し、
制御切替手段により音声認識手段が選択された場合に、取得された位置情報と、位置情報に含まれる場所状況データとに基づいて、音響モデル制御切替手段により複数の音響モデルから、場所状況データおよび位置情報に適した音響モデルを選択して、音声認識処理を実行可能に構成されているとともに、
制御切替手段により音声合成手段が選択された場合に、取得された位置情報と、位置情報に含まれる場所状況データとに基づいて、発話音量の調節および/または発話音質の切替を実行し、合成音声を出力可能に構成されている
ことを特徴とする音声認識合成装置である。
この発明の第8の発明は、
移動体の移動する経路に関する位置情報を所定の通信システムを利用して提供する経路情報提供手段と、移動体に搭載されているとともに経路情報提供手段により提供された前記情報に基づく経路を所定の道路地図情報に基づいて出力可能に構成されたナビゲーション手段と、音声を認識可能に構成された音声認識手段と、位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段と、複数の音響モデルを有して構成される切替用音響モデルデータベースと、複数の音響モデルから1つの音響モデルを選択する音響モデル制御切替手段との相互間において、データを入出力可能に構成され、
取得された現在の位置情報と、位置情報に含まれる場所状況データとに基づいて、音響モデル制御切替手段により複数の音響モデルから、場所状況データおよび位置情報に適した音響モデルを選択するように構成されている
ことを特徴とするナビゲーションシステムである。
この発明の第9の発明は、
移動体に備えられた複数の稼動部から出力される出力信号を入力可能に構成され、稼動部ごとの出力信号に基づいた、それぞれの稼動部に固有の雑音情報に対する雑音抑圧特性データを格納した、雑音抑圧特性データベースとの間においてさらにデータを入出力可能に構成され、
稼動部からの出力信号に基づいて、複数の音響モデルから選択された音響モデルに対して、雑音抑圧特性データベースの情報を加算して、音声認識処理を実行するように構成されている
ことを特徴とするナビゲーションシステムである。
この発明の第10の発明は、
移動体の移動する経路に関する位置情報を所定の通信システムを利用して提供する経路情報提供手段と、移動体に搭載されているとともに経路情報提供手段により提供された前記情報に基づく経路を所定の道路地図情報に基づいて出力可能に構成されたナビゲーション手段と、音素を合成して音声として出力可能に構成された音声合成手段と、発話音量の調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段との相互において、データを入出力可能に構成され、
現在の位置情報と、位置情報に含まれる場所状況データに基づいて、発話音量の調節および/または発話音質の切替を実行可能に構成されている
ことを特徴とするナビゲーションシステムである。
この発明の第11の発明は、
移動体の移動する経路に関する位置情報を所定の通信システムを利用して提供する経路情報提供手段と、
移動体に搭載されているとともに経路情報提供手段により提供された前記情報に基づく経路を所定の道路地図情報に基づいて出力可能に構成されたナビゲーション手段と、
音声を認識可能に構成された音声認識手段と、
複数の音響モデルを有して構成される切替用音響モデルデータベースと、
複数の音響モデルから1つの音響モデルを選択する音響モデル制御切替手段と、
音素を合成して、音声として出力可能に構成された音声合成手段と、
発話音量の調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、
位置情報を取得可能に構成されているとともに、音声認識手段と音声合成手段とにおける制御の切替を実行可能に構成された制御切替手段とが、相互にデータを入出力可能に構成され、
制御切替手段により音声認識手段が選択された場合に、取得された位置情報と、位置情報に含まれる場所状況データとに基づいて、音響モデル制御切替手段により複数の音響モデルから、場所状況データおよび位置情報に適した音響モデルを選択して、音声認識処理を実行するように構成されているとともに、
制御切替手段により音声合成手段が選択された場合に、取得された位置情報と、位置情報に含まれる場所状況データとに基づいて、発話音量の調節および/または発話音質の切替を実行して、合成された音声を出力するように構成されている
ことを特徴とするナビゲーションシステムである。
この発明の第12の発明は、
移動する経路に関する位置情報を所定の通信システムを利用して提供する経路情報提供手段と、経路情報提供手段により提供された前記情報に基づく経路を所定の道路地図情報に基づいて出力可能に構成されたナビゲーション手段と、音声を認識可能に構成された音声認識手段と、位置情報を取得可能に構成されているとともに制御の切替を実行可能に構成された制御切替手段と、複数の音響モデルを有して構成される切替用音響モデルデータベースと、複数の音響モデルから1つの音響モデルを選択する音響モデル制御切替手段との相互でデータを入出力可能に構成され、取得された位置情報と、位置情報に含まれる場所状況データとに基づいて、音響モデル制御切替手段により複数の音響モデルから、場所状況データおよび位置情報に適した音響モデルを選択するように構成されたナビゲーションシステムを備えた
ことを特徴とする移動体である。
この第12の発明において、典型的には、移動体は、複数の稼動部を有し、複数の稼動部から出力される出力信号を入力可能に構成され、稼動部ごとの出力信号に基づく、複数の稼動部の各稼動部に固有の雑音情報に対する雑音抑圧特性データを格納した雑音抑圧特性データベースとの間においてさらにデータを入出力可能に構成され、稼動部からの出力信号に基づいて、複数の音響モデルから選択された音響モデルに対して、雑音抑圧特性データベースの情報を加算して、音声認識処理を実行するように構成されている。
この発明の第13の発明は、
移動体の移動する経路に関する位置情報を所定の通信システムを利用して提供する経路情報提供手段と、移動体に搭載されているとともに経路情報提供手段により提供された前記情報に基づく経路を所定の道路地図情報に基づいて出力可能に構成されたナビゲーション手段と、音素を合成して音声として出力可能に構成された音声合成手段と、発話音量の
調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段との相互間において、データの入出力可能に構成され、
現在の位置情報と、位置情報に含まれる場所状況データに基づいて、発話音量の調節および/または発話音質の切替を実行可能に構成されたナビゲーションシステムを備えている
ことを特徴とする移動体である。
この発明の第14の発明は、
経路に関する位置情報を所定の通信システムを利用して提供する経路情報提供手段と、
経路情報提供手段により提供された前記情報に基づく経路を所定の道路地図情報に基づいて出力可能に構成されたナビゲーション手段と、
音声を認識可能に構成された音声認識手段と、
複数の音響モデルを有して構成される切替用音響モデルデータベースと、
複数の音響モデルから1つの音響モデルを選択する音響モデル制御切替手段と、
音素を合成して、音声として出力可能に構成された音声合成手段と、
発話音量の調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、
位置情報を取得可能に構成されているとともに、音声認識手段と音声合成手段とにおける制御の切替を実行可能に構成された制御切替手段とを有し、
制御切替手段により音声認識手段が選択された場合に、取得された位置情報と、位置情報に含まれる場所状況データとに基づいて、音響モデル制御切替手段により複数の音響モデルから、場所状況データおよび位置情報に適した音響モデルを選択して、音声認識処理を実行可能に構成されているとともに、
制御切替手段により音声合成手段が選択された場合に、取得された位置情報と、位置情報に含まれる場所状況データとに基づいて、発話音量の調節および/または発話音質の切替を実行して、合成された音声を出力可能に構成されたナビゲーションシステムを備えている
ことを特徴とする移動体である。
この発明において、音声合成処理を実行する場合と音声認識処理を実行する場合とは、互いに独立させて実行させることも可能であり、同時に並行処理させるようにすることも可能である。すなわち、制御切替手段により、音声認識手段による音声認識処理と音声合成手段による音声合成処理とを択一的に実行させたり、同時に実行させたりすることが可能である。
上述のように構成されたこの発明によれば、取得された位置情報と場所状況データとに基づいて、複数の音響モデルから、場所状況データに適合した音響モデルを選択して音声認識処理や音声合成処理を実行していることにより、時間的な誤差を生じることなく、場所に応じて、正確な音声認識処理やユーザに聞きやすい合成音声の出力を実行することが可能である。
以上説明したように、この発明によれば、取得した位置情報と、この位置情報に含まれる場所状況データとに基づいて、音響モデル制御切替手段により複数の音響モデルから、場所状況データおよび位置情報に適合した音響モデルを選択するように構成していることにより、騒音や雑音などが発生する前に、これらの騒音や雑音の発生を想定して、状況に応じた音声合成の音声出力音量の変更や音声認識において使用する音響モデルの変更を準備することができ、利用するユーザに対して、スムーズで効果的な音声合成サービスや音声認識サービスを提供することができる。
以下、この発明の一実施形態について図面を参照しながら説明する。なお、以下の一実施形態の全図においては、同一または対応する部分には同一の符号を付す。図1に、この一実施形態による車両に設置されたカーナビゲーション装置のシステムの全体構成を示す。
(ナビゲーションシステム)
図1に示すように、この一実施形態による車両搭載型のナビゲーション装置1においては、音声を入力可能なマイク2と、音声を出力可能なスピーカ3と、ナビゲーション装置1に所望の指示を入力可能な入力手段としての入力部4と、データを出力する出力手段としての表示部5と接続されて構成されている。
このナビゲーション装置1は、内部に音声認識可能な音声認識手段および音響モデルの選択および切替を行う音響モデル制御切替部としての音声認識部7と音声合成可能な音声合成手段としての音声合成部6とを有している。また、入力部4から入力されたデータを処理したり表示部5に所望のデータを表示したり、そのほかのさまざまなナビゲーションを実行したりするための、ナビゲーション手段の制御部としてのナビECU8が設けられている。また、位置測定を行うセンサを備えたGPS9と接続されて、現在位置測定部10により車両の現在位置のデータを一意に測定可能に構成されている。
また、サーバ20とナビゲーションのための有益な情報を提供する情報提供サービスプロバイダ(以下、ASP)30は、ネットワーク網31を介して互いに接続されており、種々の交通情報のデータを送受信可能に構成されている。
サーバ20は、音声通信処理部21とデータ通信処理部22とを有して構成されている。また、音声通信処理部21は、音声合成処理部21aおよび音声認識処理部21bを有して構成されている。なお、これらの処理部以外にも、たとえば音声・データ同期制御部などの、その他機能を実現するための種々の処理部(図示せず)が設けられている。
また、情報提供ASP群である交通情報サーバ30は、たとえば地図に関するデータベースである地図情報データベース30aに基づいて経路情報を提供可能な地図情報ASPや、交通に関するデータベースである交通情報データベース30bに基づいて道路の混雑状況や事故状況を提供可能な交通情報ASPや、各種イベントの情報を提供可能なイベント情報データベース30cを有するイベント情報ASPなどを有して構成されている。
なお、この一実施形態においては、これらの情報のうちの地図情報データベース30aおよび交通情報データベース30bから供給される位置情報データや、この位置情報データに含まれる場所状況データを用いて、ナビゲーション装置により走行経路のナビゲートが行われる。
また、ナビゲーション装置1は通信部11を用いて通信回路網12を経由してサーバ20と接続し、音声やデータの送受信を実行可能に構成されている。なお、この通信部11を車両から脱着可能に構成して、乗車時においてはナビゲーション装置1の周辺に設置し、それ以外は利用者が携帯して利用可能に構成することも可能である。
(音声認識合成装置)
次に、以上のように構成されたこの一実施形態によるカーナビゲーションシステムに設けられた音声認識部および音声合成部について説明する。図2に、この一実施形態による音声認識部および音声合成部を有するカーナビゲーションシステムおよび車両との接続関
係を示す。
図2に示すように、この一実施形態による音声対話型のカーナビゲーションシステムにおいては、音声認識合成装置100を有して構成されている。なお、図2に示すカーナビゲーションシステムにおける音声認識合成装置以外の構成については、情報処理を実行するナビECU8のみを示す。
また、車両(図示せず)には、エアコンを制御可能に構成されたエアコンECU102、ワイパの駆動およびこの駆動の際にワイパ駆動信号を出力するワイパ駆動部103、エンジンの少なくとも回転数を検知可能に構成されたエンジンECU104、車両におけるパワーウィンドウの開閉駆動およびこの際に、開閉のための制御信号を出力するパワーウィンドウ駆動部105、および方向指示器であるウィンカの点滅駆動の際の制御信号を出力するウィンカ駆動部106が設けられている。
また、音声認識合成装置100においては、制御切替手段としての音声関係の音声制御切替部101、音声認識部7および音声合成部6が設けられている。
音声制御切替部101は、ナビECU8、エアコンECU102、ワイパ駆動部103、エンジンECU104、パワーウィンドウ駆動部105、ウィンカ駆動部106に接続されている。なお、必要に応じて、これら以外の稼動部や駆動に接続させることも可能である。
また、音声認識合成装置100において、音声制御切替部101は、音声認識部7および音声合成部6に接続されている。
そして、このカーナビゲーションに対する指示などのために、ユーザが発した音声が入力された場合、音声制御切替部101により音声認識部7に切り換えられて音声認識処理が実行される。他方、ユーザに対する経路案内などのために、ユーザに向けて音声が出力される場合には、音声制御切替部101により音声合成部6に切り換えられ、音声合成処理が実行される。
音声認識部7は、記録手段としてのたとえばハードディスクなどに記憶されて格納された音響モデルデータベース121との間で、データを入出力可能に構成されている。この音響モデルデータベース121は、音響モデル切替データベース(音響モデル切替DB)22および音響モデル加算データベース(音響モデル加算DB)23を有して構成されている。
また、音響モデル切替DB122は、音声認識処理における種々の状況に対応した複数の音響モデルのデータが格納されて構成されている。この一実施形態において、複数の音響モデルとしては、高速道路を走行する状況に対応した高速道音響モデル122a、一般道路を走行する状況に対応した一般道音響モデル122b、上り坂を走行する状況に対応した上り坂音響モデル122c、山岳路を走行する状況に対応した山岳路音響モデル122dを有して構成されている。
なお、音響モデルとして対応する状況としては、必ずしもこれらの状況に限られるものではなく、可能な限り種々の状況を想定した音響モデルを構築して、音響モデル切替DB122に格納しておくことが望ましい。
具体的にたとえば、道路工事が行われている道路を走行する状況に対応した道路工事音響モデル、降雨中での走行状況に対応した降雨音響モデル、降雪中での走行状況に対応し
た降雪音響モデル、タイヤチェーンを装着して走行する状況に対応したタイヤチェーン装着音響モデル、非舗装路を走行する状況に対応した非舗装路音響モデル、砂浜を走行する状況に対応した砂浜走行音響モデル、商店街を走行する状況に対応した商店街音響モデルなどを挙げることができる。
そして、この一実施形態においては、音声認識部7により、音響モデル切替DB122に格納されている複数の音響モデルから、音声認識処理が実行される状況に最も適合した音響モデルが1つ選択されて、音声認識処理における音響モデルとして用いられる。
また、音響モデル加算DB123は、音声認識部7により、音響モデル切替DB122に格納された複数の音響モデルのうちの1つの音響モデルが選択されて利用されるときに、選択された音響モデルに、雑音抑圧特性として加算されるデータが格納されたデータベースである。
この音響モデル加算データベース123は、車両に搭載された種々の機構における駆動時に発生する雑音を低減可能に構成された、複数の雑音抑圧特性のデータから構築されている。すなわち、車両に搭載されたたとえばエンジンやエアコンの稼動においては特定の雑音が生じ、これらの雑音特性は、あらかじめ認知可能な雑音である。
たとえば、エンジンの駆動により発生する雑音は、エンジンの回転数に応じて雑音の周波数も変わるが、この周波数の変化は回転数に依存する程度の雑音であり、あらかじめ測定してその特性を認識しておくことが可能な雑音である。
また、エアコンを稼動させたときに生じる雑音は、エアコンから出される風量などの種々の要素によって変化するが、この雑音も、あらかじめ測定してその特性を認識可能な、いわゆる既知の雑音である。
同様に、ワイパを駆動させたときに生じる雑音や、パワーウィンドウを稼動させて窓を開閉する際に発生する雑音、またはウィンカの稼働時の雑音についても、既知の雑音である。
これらの機構による雑音抑圧特性は、駆動により発生する雑音の特性であるため、エアコンECU102、ワイパ駆動部103、エンジンECU104、パワーウィンドウ駆動部105およびウィンカ駆動部106から出力される駆動信号が入力されることにより、その稼動状態を検知することが可能である。
この一実施形態においては、これらのエアコンECU102、ワイパ駆動部103、エンジンECU104、パワーウィンドウ駆動部105およびウィンカ駆動部106から出力される駆動信号は、音声制御切替部101に供給される。そして、この駆動信号に応じて、音声認識部7により、音響モデル加算DB123から該当する雑音抑圧特性のデータが抽出され、そのとき使用されている音響モデルに加算されて、既知の雑音に関する雑音を抑圧することが可能となるので、雑音抑圧をより効果的に行うことが可能となる。
(音声認識処理)
次に、以上のように構成されたこの一実施形態による音声認識装置を搭載したカーナビゲーションシステムにおける、音声認識処理方法について説明する。図3に、この一実施形態による音声認識処理方法を示す。
図3に示すように、この一実施形態による音声認識方法においては、まず、ステップST1において、車載LAN(ローカルエリアネットワーク)を介して、現在の車両の位置
情報および走行路情報が音声制御切替部101に供給される。
すなわち、ナビゲーションシステムの現在位置測定部10により、車両の現在位置が取得されるとともに、交通情報サーバ30の交通情報データベース30bから通信部11を通じて、交通情報データに含まれる現在位置以降に走行する走行路の情報、いわゆる道路状況データが取得される。これにより、音響モデル切替DB122に格納された音響モデルの選択、索出に必要な情報を得ることが可能となる。
次に、ステップST2に移行して、同様に車載LANを介して、現在の車両において駆動している機器の動作情報が、音声制御切替部101に供給される。すなわち、エアコンECU102、ワイパ駆動部103、エンジンECU104、パワーウィンドウ駆動部105、ウィンカ駆動部106などから駆動信号が音声制御切替部101に供給される。
すなわち、たとえば車両が走行中の場合には、エンジンECU104からエンジン各部に、回転数のデータを含む制御信号が供給されている。この場合においては、音声制御切替部101にも同様に、回転数データを含む制御信号が供給されている。さらに、たとえば走行中に降雨に遭遇した場合、通常、ワイパが駆動される。そのため、ワイパ駆動部103からワイパ(図示せず)および音声制御切替部101に駆動信号が供給される。
以上のステップST1およびステップST2により、車両の現在位置が認識され、車両が直後に走行する走行路情報を取得することができる。なお、ステップST1およびステップST2の処理は、逆順に実行することも可能である。
次に、ステップST3に移行して、車両の走行において、直後の走行路や走行状態、すなわち走行状況に変更が生じるか否かの判定が行われる。ここで、直後に走行路の変更がされない場合には、後述するステップST5に移行する。他方、直後に走行路が変更される場合には、ステップST4に移行する。
ステップST4においては、ステップST1において取得した走行路情報に基づいて、発生すると予測される雑音下におけるもっとも適した音響モデルが索出されて、音声認識部7により音響モデルの切替が行われる。
具体的に、たとえば、ステップST1において車両が一般道を走行している状態から、直後に高速道を走行する走行路情報が取得された場合、このステップST3において、音声認識処理において使用される音響モデルが、一般道音響モデル122bから高速道音響モデル122aに切り替えられる。そして、この音響モデルの切替は、車両が一般道から高速道に進入するタイミングに合わせて、実行される。
その後、ステップST5に移行して、ステップST2において音声認識部7が取得した駆動信号によって、音響モデル加算DB123における雑音抑圧特性のデータ(図2においては、エンジン音雑音抑圧特性データ123a、エアコン雑音抑圧特性データ123b、ワイパ雑音抑圧特性データ123c、窓開閉雑音抑圧特性データ123d、ウィンカ雑音抑圧特性データ123e)から、該当する雑音抑圧特性データ(たとえば、エンジン音雑音抑圧特性データ123a、ワイパ雑音抑圧特性データ123c)が索出される。
このようにして索出された雑音抑圧特性データは、その段階で使用されている所定の音響モデルに、エンジン音雑音抑圧特性データ123aなどが加算されて、音声認識処理の実行が継続される。具体的に、たとえば、一般道音響モデル122bから切り換えられた場合には、高速道音響モデル122aが用いられている場合に、このエンジンの回転数に応じた雑音を抑圧するためのエンジン音雑音抑圧特性が、高速道音響モデル122aに加
算されて、音声認識処理の実行が継続される。
以上のようにして、現在の位置情報と、その後に走行する走行路の情報とに基づいて、走行路情報に基づいた雑音の発生状況を事前に想定して、この雑音に対して最も適切な音響モデルが索出され、音声認識部7により適切な音響モデルが選択されて音声認識処理が実行される。
(音声合成処理)
次に、音声合成処理について説明する。図4に、この一実施形態による音声合成処理のフローチャートを示す。
図4に示すように、この一実施形態においては、音声認識処理におけると同様に、ステップST11において車載LANを通じて、現在位置情報および走行路情報を取得するとともに、ステップST12において、エアコンECU102、ワイパ駆動部103、エンジンECU104、パワーウィンドウ駆動部105、ウィンカ駆動部106などから音声制御切替部101に駆動信号が供給される。
次に、ステップST13に移行して、走行状況の変更が生じるか、駆動部の動作のオン/オフが変化するかうちの、少なくとも一方の状況が生じるか否かの判定が行われる。
判定の結果、走行路の変更もなく、駆動部の動作に変化が生じない場合には、そのときの設定状況のままで音声合成処理が実行される。他方、音声認識処理時における場合と同様に、直後に走行状況が変更されるか、各種駆動部の動作に変化が生じた場合には、ステップST14に移行する。
ステップST14においては、場所状況データにおける変更路の変更および/または、駆動信号に基づいたそれぞれの駆動部の動作に応じて、発話音量および/または発話音質の調整が実行される。
すなわち、一般道を走行している車両における走行経路が直後に山岳道に変わる状況を含む位置情報および場所状況データが音声制御切替部101に供給された場合、一般道から山岳道に走行経路が変わると、雑音が増加する場合が多い。そこで、音声制御切替部101からの信号が音声合成部6に供給され、音声合成部6からの制御信号に基づいて、発話音量/発話音質切替部107によりスピーカ3から出力される音量の増減が行われる。なお、この音量の増減の代わりに、音質の切替を行うことも可能であり、たとえば、男性の音声から女性の音声に切り換えるようにすることも可能である。
また、たとえば、走行中に降雨に遭遇し、ワイパを駆動させる場合においても、ワイパ駆動部103からワイパの駆動信号が出力され、音声制御切替部101に供給される。音声制御切替部101に供給された駆動信号は、音声合成処理時において、音声合成部6に供給される。この駆動信号を取得した音声合成部6により、発話音量/発話音質切替部107に制御信号が供給される。そして、発話音量/発話音質切替部107により発話音量の調整が行われる。なお、これらの駆動部の変化に伴う発話音量の調整の代わりに発話音質の切り換えを行うことも可能であるが、それぞれの駆動部の状況の変化は、短時間で生じるものであるため、発話音量の調整を採用するのが望ましい。
以上のようにして、この発明による音声認識処理および音声合成処理が実行される。これらの音声認識処理や音声合成処理は、並行して実行することも可能であり、適時切り換えて実行することも可能である。
以上、この発明の一実施形態について具体的に説明したが、この発明は、上述の一実施形態に限定されるものではなく、この発明の技術的思想に基づく各種の変形が可能である。
たとえば、上述の一実施形態において挙げた音響モデルや雑音抑圧特性データはあくまでも例に過ぎず、必要に応じてこれと異なる音響モデルや雑音抑圧特性データを用いてもよい。
たとえば、上述の一実施形態においては、車両に搭載する音声認識合成装置100に音声合成部6および音声認識部7を設けて、それぞれ音声合成処理および音声認識処理を実行するようにした、いわゆるローカル型の音声認識合成装置を採用しているが、図5に示すように、サーバ20における音声合成処理部21aおよび音声認識処理部21bにおいて、それぞれ本発明による音声合成処理および音声認識処理を実行することが可能である。
すなわち、上述の一実施形態における車両に搭載されたナビゲーションの音声認識合成装置に格納された音響モデル切替データベースおよび音響モデル加算データベースを、サーバ20の音声認識処理部21bにおける所定の記憶部(図示せず)に格納しておき、図2に示す音声認識部7による音声認識処理を、サーバ20における音声認識処理部21bに実行させるようにし、音声合成部6による音声合成処理を音声合成処理部21aに実行させるようにする。
そして、マイク2から入力された音声認識処理に用いられる入力データや、スピーカ3から出力される音声合成処理が施された出力データは、通信部11および通信回路網12を介して、サーバ20において、送受信するように構成することが可能である。
このような、分散型で構成した場合、車両には、通常のナビゲーション装置および外部と通信可能な携帯端末や携帯電話が設置されているのみであり、実際の処理は、サーバ20において実行される。そのため、通常の携帯電話を用いた通話や、ナビゲーション装置の操作を大きく変更することなく、音声認識処理による操作を導入したり、合成音声による走行案内やイベント案内などを採用したりすることが可能となる。
また、上述の一実施形態においては、1つの装置内に、音声合成部および音声認識部を設けているが、これらの音声合成部と音声認識部とを別々のハードウェアによって構成することも可能であり、この場合には、音声認識装置と音声合成装置を別体で車両に設置したり、一方の装置のみを車両に設置したりする。
この発明の一実施形態による通信型ナビゲーションシステムの構成を示す図である。 この発明の一実施形態による音声認識合成装置を示すブロック図である。 この発明の一実施形態による音声認識処理方法を示すフローチャートである。 この発明の一実施形態による音声合成処理方法を示すフローチャートである。 この発明の一実施形態の他の例による通信型ナビゲーションシステムの構成を示す図である。
符号の説明
1 ナビゲーション装置
2 マイク
3 スピーカ
4 入力部
5 表示部
6 音声合成部
7 音声認識部
8 ナビECU
9 GPS
10 現在位置測定部
11 通信部
12 通信回路網
20 サーバ
21 音声通信処理部
21a 音声合成処理部
21b 音声認識処理部
22 データ通信処理部
30 交通情報サーバ
30a 地図情報データベース
30b 交通情報データベース
30c イベント情報データベース
31 ネットワーク網
100 音声認識合成装置
101 音声制御切替部
102 エアコンECU
103 ワイパ駆動部
104 エンジンECU
105 パワーウィンドウ駆動部
106 ウィンカ駆動部
107 発話音質切替部
121 音響モデルデータベース
122 音響モデル切替データベース(音響モデル切替DB)
122a 高速道音響モデル
122b 一般道音響モデル
122c 上り坂音響モデル
122d 山岳路音響モデル
123 音響モデル加算データベース(音響モデル加算DB)
123a エンジン音雑音抑圧特性データ
123b エアコン雑音抑圧特性データ
123c 雑音抑圧特性データ
123d 窓開閉雑音抑圧特性データ
123e ウィンカ雑音抑圧特性データ

Claims (18)

  1. 音声認識可能に構成された音声認識手段と、
    位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段と、
    複数の音響モデルを有して構成される切替用音響モデルデータベースと、
    上記複数の音響モデルから1つの音響モデルを選択する音響モデル制御切替手段とを有し、
    上記取得された位置情報と、上記位置情報に含まれる場所状況データとに基づいて、上記音響モデル制御切替手段により上記複数の音響モデルから、上記場所状況データおよび上記位置情報に適合した音響モデルを選択し、上記選択された音響モデルを用いて音声認識処理を実行能可能に構成されている
    ことを特徴とする音声認識装置。
  2. 複数の稼動部から出力される出力信号を入力可能に構成され、
    上記稼動部ごとの出力信号に基づいた、それぞれの上記稼動部に固有の雑音情報に対する雑音抑圧特性データを格納した、雑音抑圧特性データベースをさらに有し、
    稼動している上記稼動部からの出力信号に基づいて、上記複数の音響モデルから選択された音響モデルに対して、雑音抑圧特性データベースの情報を加算して、音声認識処理を実行するように構成されている
    ことを特徴とする請求項1記載の音声認識装置。
  3. 音声を認識可能に構成された音声認識手段と、
    位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段と、
    複数の音響モデルを有して構成される切替用音響モデルデータベースと、
    上記複数の音響モデルから1つの音響モデルを選択する音響モデル制御切替手段とが、相互にデータを送受信可能に構成され、
    上記取得された位置情報と、上記位置情報に含まれる場所状況データとに基づいて、上記音響モデル制御切替手段により上記複数の音響モデルから、上記場所状況データおよび上記位置情報に適した音響モデルを選択するように構成されている
    ことを特徴とする音声認識システム。
  4. 複数の稼動部からの出力信号を入力可能に構成され、
    上記稼動部ごとの出力信号に基づいた、それぞれの上記稼動部に固有の雑音情報に対する雑音抑圧特性データを格納した、雑音抑圧特性データベースをさらに有し、
    稼動している上記稼動部からの出力信号に基づいて、上記複数の音響モデルから選択された音響モデルに対して、雑音抑圧特性データベースの情報を加算して、上記音声認識処理を実行するように構成されている
    ことを特徴とする請求項3記載の音声認識システム。
  5. 音声を認識可能に構成された音声認識手段と、
    複数の音響モデルを有して構成される切替用音響モデルデータベースと、
    上記切替用音響モデルデータベースから1つの音響モデルを選択する音響モデル制御切替手段と、
    場所状況データを含む位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段とを用いて、
    上記場所状況データに基づき、上記音響モデル制御切替手段により上記複数の音響モデルから、上記場所状況データに適合する音響モデルを選択する
    ことを特徴とする音声認識方法。
  6. 複数の稼動部からの出力信号を入力可能に構成され、
    上記稼動部ごとの出力信号に基づいた、それぞれの上記稼動部に固有の雑音情報に対する雑音抑圧特性データを格納した雑音抑圧特性データベースをさらに有し、
    稼動している上記稼動部からの出力信号に基づいて、上記複数の音響モデルから選択された音響モデルに対して、雑音抑圧特性データベースの情報を加算して、上記音声認識処理を実行する
    ことを特徴とする請求項5記載の音声認識方法。
  7. 音素を合成して、音声データとして出力可能に構成された音声合成手段と、
    発話音量の調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、
    位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段とを有し、
    現在の位置情報と、上記位置情報に含まれる場所状況データに基づいて、上記発話音量の調節および/または発話音質の切替を実行可能に構成されている
    ことを特徴とする音声合成装置。
  8. 音素を合成して、音声データとして出力可能に構成された音声合成手段と、発話音量の調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、場所状況データを含む位置情報を取得可能に構成されているとともに制御の切替を実行可能に構成された制御切替手段とが、相互にデータを送受信可能に構成され、
    取得された現在の位置情報と上記場所状況データとに基づいて、上記発話音量の調節および/または発話音質の切替を実行可能に構成されている
    ことを特徴とする音声合成システム。
  9. 音素を合成して、音声として出力可能に構成された音声合成手段と、発話音量の調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、場所状況データを含む位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段とを用いて、
    音声を出力する際に、現在の位置情報と上記場所状況データとに基づき、上記発話音量の調節および/または発話音質の切替を実行する
    ことを特徴とする音声合成方法。
  10. 音声を認識可能に構成された音声認識手段と、
    複数の音響モデルを有して構成される切替用音響モデルデータベースと、
    上記複数の音響モデルから1つの音響モデルを選択する音響モデル制御切替手段と、
    音素を合成して、音声として出力可能に構成された音声合成手段と、
    発話音量の調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、
    位置情報を取得可能に構成されているとともに、上記音声認識手段と上記音声合成手段との制御の切替を実行可能に構成された制御切替手段とを有し、
    上記制御切替手段により音声認識手段が選択された場合に、上記取得された位置情報と、上記位置情報に含まれる場所状況データとに基づいて、上記音響モデル制御切替手段により上記複数の音響モデルから、上記場所状況データおよび上記位置情報に適した音響モデルを選択して、音声認識処理を実行可能に構成されているとともに、
    上記制御切替手段により音声合成手段が選択された場合に、上記取得された位置情報と、上記位置情報に含まれる場所状況データとに基づいて、上記発話音量の調節および/または発話音質の切替を実行し、合成音声を出力可能に構成されている
    ことを特徴とする音声認識合成装置。
  11. 移動体の移動する経路に関する位置情報を所定の通信システムを利用して提供する経路情報提供手段と、上記移動体に搭載されているとともに上記経路情報提供手段により提供された前記情報に基づく上記経路を所定の道路地図情報に基づいて出力可能に構成されたナビゲーション手段と、音声を認識可能に構成された音声認識手段と、上記位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段と、複数の音響モデルを有して構成される切替用音響モデルデータベースと、上記複数の音響モデルから1つの音響モデルを選択する音響モデル制御切替手段との相互間において、データを入出力可能に構成され、
    上記取得された現在の位置情報と、上記位置情報に含まれる場所状況データとに基づいて、上記音響モデル制御切替手段により上記複数の音響モデルから、上記場所状況データおよび上記位置情報に適した音響モデルを選択するように構成されている
    ことを特徴とするナビゲーションシステム。
  12. 上記移動体に備えられた複数の稼動部から出力される出力信号を入力可能に構成され、上記稼動部ごとの出力信号に基づいた、それぞれの上記稼動部に固有の雑音情報に対する雑音抑圧特性データを格納した、雑音抑圧特性データベースとからさらに雑音抑圧特性データを索出可能に構成され、
    上記稼動部からの出力信号に基づいて、上記複数の音響モデルから選択された音響モデルに対して、上記索出された雑音抑圧特性データベースの情報を加算して、上記音声認識処理を実行するように構成されている
    ことを特徴とする請求項11記載のナビゲーションシステム。
  13. 移動体の移動する経路に関する位置情報を所定の通信システムを利用して提供する経路情報提供手段と、上記移動体に搭載されているとともに上記経路情報提供手段により提供された前記情報に基づく上記経路を所定の道路地図情報に基づいて出力可能に構成されたナビゲーション手段と、音素を合成して音声として出力可能に構成された音声合成手段と、発話音量の調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段との相互において、データを入出力可能に構成され、
    現在の位置情報と、上記位置情報に含まれる場所状況データに基づいて、上記発話音量の調節および/または発話音質の切替を実行可能に構成されている
    ことを特徴とするナビゲーションシステム。
  14. 移動体の移動する経路に関する位置情報を所定の通信システムを利用して提供する経路情報提供手段と、
    上記移動体に搭載されているとともに上記経路情報提供手段により提供された前記情報に基づく上記経路を所定の道路地図情報に基づいて出力可能に構成されたナビゲーション手段と、
    音声を認識可能に構成された音声認識手段と、
    複数の音響モデルを有して構成される切替用音響モデルデータベースと、
    上記複数の音響モデルから1つの音響モデルを選択する音響モデル制御切替手段と、
    音素を合成して、音声として出力可能に構成された音声合成手段と、
    発話音量の調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、
    位置情報を取得可能に構成されているとともに、上記音声認識手段と上記音声合成手段とにおける制御の切替を実行可能に構成された制御切替手段とが、相互にデータを入出力可能に構成され、
    上記制御切替手段により音声認識手段が選択された場合に、上記取得された位置情報と、上記位置情報に含まれる場所状況データとに基づいて、上記音響モデル制御切替手段に
    より上記複数の音響モデルから、上記場所状況データおよび上記位置情報に適した音響モデルを選択して、上記音声認識処理を実行するように構成されているとともに、
    上記制御切替手段により音声合成手段が選択された場合に、上記取得された位置情報と、上記位置情報に含まれる場所状況データとに基づいて、上記発話音量の調節および/または発話音質の切替を実行して、合成された音声を出力するように構成されている
    ことを特徴とするナビゲーションシステム。
  15. 移動する経路に関する位置情報を所定の通信システムを利用して提供する経路情報提供手段と、上記経路情報提供手段により提供された前記情報に基づく上記経路を所定の道路地図情報に基づいて出力可能に構成されたナビゲーション手段と、音声を認識可能に構成された音声認識手段と、上記位置情報を取得可能に構成されているとともに制御の切替を実行可能に構成された制御切替手段と、複数の音響モデルを有して構成される切替用音響モデルデータベースと、上記複数の音響モデルから1つの音響モデルを選択する音響モデル制御切替手段との相互でデータを入出力可能に構成され、上記取得された位置情報と、上記位置情報に含まれる場所状況データとに基づいて、上記音響モデル制御切替手段により上記複数の音響モデルから、上記場所状況データおよび上記位置情報に適した音響モデルを選択するように構成されたナビゲーションシステムを備えた
    ことを特徴とする移動体。
  16. 複数の稼動部を有し、
    上記複数の稼動部から出力される出力信号を入力可能に構成され、上記稼動部ごとの出力信号に基づく、上記複数の稼動部の各稼動部に固有の雑音情報に対する雑音抑圧特性データを格納した雑音抑圧特性データベースとの間においてさらにデータを入出力可能に構成され、
    上記稼動部からの出力信号に基づいて、上記複数の音響モデルから選択された音響モデルに対して、上記雑音抑圧特性データベースの情報を加算して、音声認識処理を実行可能に構成された
    ことを特徴とする請求項15記載の移動体。
  17. 移動体の移動する経路に関する位置情報を所定の通信システムを利用して提供する経路情報提供手段と、上記移動体に搭載されているとともに上記経路情報提供手段により提供された前記情報に基づく上記経路を所定の道路地図情報に基づいて出力可能に構成されたナビゲーション手段と、音素を合成して音声として出力可能に構成された音声合成手段と、発話音量の調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、位置情報を取得可能に構成されているとともに、制御の切替を実行可能に構成された制御切替手段との相互間において、データの入出力可能に構成され、
    現在の位置情報と、上記位置情報に含まれる場所状況データに基づいて、上記発話音量の調節および/または発話音質の切替を実行可能に構成されたナビゲーションシステムを備えている
    ことを特徴とする移動体。
  18. 経路に関する位置情報を所定の通信システムを利用して提供する経路情報提供手段と、
    上記経路情報提供手段により提供された前記情報に基づく上記経路を所定の道路地図情報に基づいて出力可能に構成されたナビゲーション手段と、
    音声を認識可能に構成された音声認識手段と、
    複数の音響モデルを有して構成される切替用音響モデルデータベースと、
    上記複数の音響モデルから1つの音響モデルを選択する音響モデル制御切替手段と、
    音素を合成して、音声として出力可能に構成された音声合成手段と、
    発話音量の調節および/または発話音質の切替を実行可能に構成された発話音量音質切替手段と、
    位置情報を取得可能に構成されているとともに、上記音声認識手段と上記音声合成手段とにおける制御の切替を実行可能に構成された制御切替手段とを有し、
    上記制御切替手段により音声認識手段が選択された場合に、上記取得された位置情報と、上記位置情報に含まれる場所状況データとに基づいて、上記音響モデル制御切替手段により上記複数の音響モデルから、上記場所状況データおよび上記位置情報に適した音響モデルを選択して、音声認識処理を実行可能に構成されているとともに、
    上記制御切替手段により音声合成手段が選択された場合に、上記取得された位置情報と、上記位置情報に含まれる場所状況データとに基づいて、上記発話音量の調節および/または発話音質の切替を実行して、合成された音声を出力可能に構成されたナビゲーションシステムを備えている
    ことを特徴とする移動体。
JP2003359434A 2003-10-20 2003-10-20 音声認識装置、音声認識方法、音声合成装置、音声合成方法、音声認識システム、音声合成システム、音声認識合成装置、およびナビゲーションシステム、ならびに移動体 Withdrawn JP2005122042A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003359434A JP2005122042A (ja) 2003-10-20 2003-10-20 音声認識装置、音声認識方法、音声合成装置、音声合成方法、音声認識システム、音声合成システム、音声認識合成装置、およびナビゲーションシステム、ならびに移動体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003359434A JP2005122042A (ja) 2003-10-20 2003-10-20 音声認識装置、音声認識方法、音声合成装置、音声合成方法、音声認識システム、音声合成システム、音声認識合成装置、およびナビゲーションシステム、ならびに移動体

Publications (1)

Publication Number Publication Date
JP2005122042A true JP2005122042A (ja) 2005-05-12

Family

ID=34615664

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003359434A Withdrawn JP2005122042A (ja) 2003-10-20 2003-10-20 音声認識装置、音声認識方法、音声合成装置、音声合成方法、音声認識システム、音声合成システム、音声認識合成装置、およびナビゲーションシステム、ならびに移動体

Country Status (1)

Country Link
JP (1) JP2005122042A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8023666B2 (en) 2006-10-20 2011-09-20 Fujitsu Limited Voice input support program, voice input support device, and voice input support method
WO2012001730A1 (ja) * 2010-06-28 2012-01-05 三菱電機株式会社 音声認識装置
KR101696595B1 (ko) * 2015-07-22 2017-01-16 현대자동차주식회사 차량, 및 그 제어방법
KR20170082063A (ko) * 2016-01-05 2017-07-13 한국전자통신연구원 음성 인식 장치 및 음성 인식 방법
EP3852098A4 (en) * 2018-09-11 2022-06-15 Kawasaki Motors, Ltd. AUDIO SYSTEM FOR VEHICLE AND AUDIO OUTPUT METHOD
US12027163B2 (en) 2020-07-27 2024-07-02 Samsung Electronics Co., Ltd. Electronic device and operation method thereof

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8023666B2 (en) 2006-10-20 2011-09-20 Fujitsu Limited Voice input support program, voice input support device, and voice input support method
WO2012001730A1 (ja) * 2010-06-28 2012-01-05 三菱電機株式会社 音声認識装置
US8990092B2 (en) 2010-06-28 2015-03-24 Mitsubishi Electric Corporation Voice recognition device
KR101696595B1 (ko) * 2015-07-22 2017-01-16 현대자동차주식회사 차량, 및 그 제어방법
US9975505B2 (en) 2015-07-22 2018-05-22 Hyundai Motor Company Vehicle and control method thereof
US10160413B2 (en) 2015-07-22 2018-12-25 Hyundai Motor Company Vehicle and control method thereof
KR20170082063A (ko) * 2016-01-05 2017-07-13 한국전자통신연구원 음성 인식 장치 및 음성 인식 방법
KR102417511B1 (ko) * 2016-01-05 2022-07-07 한국전자통신연구원 음성 인식 장치 및 음성 인식 방법
EP3852098A4 (en) * 2018-09-11 2022-06-15 Kawasaki Motors, Ltd. AUDIO SYSTEM FOR VEHICLE AND AUDIO OUTPUT METHOD
US11557275B2 (en) 2018-09-11 2023-01-17 Kawasaki Motors, Ltd. Voice system and voice output method of moving machine
US12027163B2 (en) 2020-07-27 2024-07-02 Samsung Electronics Co., Ltd. Electronic device and operation method thereof

Similar Documents

Publication Publication Date Title
US8903651B2 (en) Information terminal, server device, searching system, and searching method thereof
US9157759B2 (en) Route preview
CN107850455B (zh) 提供具有可通航路线的导航***
US10060754B2 (en) Navigation device and method
WO2009156425A1 (en) Navigation device & method
WO2010040385A1 (en) Navigation apparatus and method for use therein
KR20160053971A (ko) 대안 경로를 생성하기 위한 방법 및 시스템
JP2002314637A (ja) 雑音低減装置
KR20170046340A (ko) 운전자 보조 시스템 및 이를 포함하는 차량, 운전자 보조 시스템의 제어방법
EP1471501A2 (en) Speech recognition apparatus, speech recognition method, and recording medium on which speech recognition program is computer-readable recorded
JP4297186B2 (ja) 通信型ロードノイズ制御システム、車載ロードノイズ制御装置及びサーバ
JP2005122042A (ja) 音声認識装置、音声認識方法、音声合成装置、音声合成方法、音声認識システム、音声合成システム、音声認識合成装置、およびナビゲーションシステム、ならびに移動体
EP1531605B1 (en) Method and system for noise reduction of a sound signal
JP2001075595A (ja) 車載用音声認識装置
CN111739525A (zh) 智能体装置、智能体装置的控制方法及存储介质
JP2002091488A (ja) 車載ナビゲーション装置
JP2005191668A (ja) 発音制御装置、その方法、そのプログラム、および、そのプログラムを記録した記録媒体
JP2003344083A (ja) 車載ノイズ制御装置
JP4300596B2 (ja) 車載用ナビゲーションシステム
WO2023286827A1 (ja) コンテンツ出力装置、コンテンツ出力方法、プログラム及び記憶媒体
JP4190735B2 (ja) 音声認識方法および装置とナビゲーション装置
WO2023073912A1 (ja) 音声出力装置、音声出力方法、プログラム及び記憶媒体
JP2009086132A (ja) 音声認識装置、音声認識装置を備えたナビゲーション装置、音声認識装置を備えた電子機器、音声認識方法、音声認識プログラム、および記録媒体
WO2023112147A1 (ja) 音声出力装置、音声出力方法、プログラム及び記憶媒体
WO2023112148A1 (ja) 音声出力装置、音声出力方法、プログラム及び記憶媒体

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070109