JP3700533B2 - 音声認識装置及び処理システム - Google Patents

音声認識装置及び処理システム Download PDF

Info

Publication number
JP3700533B2
JP3700533B2 JP2000117910A JP2000117910A JP3700533B2 JP 3700533 B2 JP3700533 B2 JP 3700533B2 JP 2000117910 A JP2000117910 A JP 2000117910A JP 2000117910 A JP2000117910 A JP 2000117910A JP 3700533 B2 JP3700533 B2 JP 3700533B2
Authority
JP
Japan
Prior art keywords
prefecture
template data
recognition
name
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000117910A
Other languages
English (en)
Other versions
JP2001306088A (ja
Inventor
英夫 宮内
義隆 尾崎
一郎 赤堀
教英 北岡
徹 名田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2000117910A priority Critical patent/JP3700533B2/ja
Publication of JP2001306088A publication Critical patent/JP2001306088A/ja
Application granted granted Critical
Publication of JP3700533B2 publication Critical patent/JP3700533B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Navigation (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、例えばナビゲーションシステムにおける目的地の設定などを音声によって入力する場合などに有効な音声認識装置及びその音声認識装置を備えた処理システムに関する。
【0002】
【従来の技術及び発明が解決しようとする課題】
従来より、入力された音声を予め記憶されている複数の比較対象パターン候補と比較し、一致度合の高いものを認識結果とする音声認識装置が既に実用化されており、例えばナビゲーションシステムにおいて設定すべき目的地を利用者が地名を音声で入力するためなどに用いられている。特に車両用のナビゲーションシステムを運転手自身が利用する場合、音声入力であればボタン操作や画面注視が伴わないため、車両の走行中に行っても安全性が高いため有効である。
【0003】
このような機能を満たすためには、十分詳細な地点の指定が容易にできることが望まれる。具体的には、県や市のレベルではなく、市の下の町名のレベルや、町村における大字あるいは小字といったレベルまで入力できるようにすることが好ましい。さらに、利用者が例えば「愛知県刈谷市昭和町」と設定したい場合に、「愛知県」「刈谷市」「昭和町」というように県市町というレベル毎に区切って発音しなくてはならないとすると煩わしいので、ひと続きで入力(一括入力)できるようにすることが好ましい。
【0004】
しかしながら、このように一括入力ができることを前提とし、さらに十分詳細な地点の指定ができるようにするためには、認識できる語数を増やすことが必要であり、辞書のデータ量を増加させてしまう。例えば住所の認識についていえば、現在では大字程度のレベルまでしか辞書を用意していないのが一般的である。それを小字までの辞書を用意することでより詳細な地点の指定はできるが、辞書データが増大することにより、その辞書データを格納しておくための例えばRAMなどのメモリが非常に大型化し、コストアップにもつながることとなる。
【0005】
本発明は、このような音声認識技術において辞書に準備する単語を増やすことで認識可能な対象を増加させるという利点を追求した場合に生じ得るデメリットを極力抑制し、上記利点をより現実的に享受し易くする技術を提案することを目的とする。
【0006】
【課題を解決するための手段及び発明の効果】
まず、請求項1に記載した県名テンプレートデータ、県別テンプレートデータ、第1の記憶手段及び第2の記憶手段について説明する。
県名テンプレートデータは、最終的な認識対象が複数の地名を階層的につなぎ合わせた住所である場合の都道府県名に対応しており、入力音声に基づいて得たマッチング用データと比較するためのデータである。また、県別テンプレートデータは、各都道府県単位で準備され、都道府県名に加えて市町村名あるいはさらに市町村よりも下位レベルの地名までを含んだ語群を格納したものである。例えば日本の場合であれば県名テンプレートデータ47都道府県名をテンプレートデータとして持ち、47に分割された県別テンプレートデータ準備されることとなる。
【0007】
県名又は県別のテンプレートデータは、請求項2に示すように、辞書データ(上位階層辞書あるいは下位階層辞書)であってもよいし、請求項3に示すように、音声データであってもよい。例えば予め人がその語又は語群を発音し、それを入力して音声データとして記憶しておいてもよい。つまり、辞書を用いた認識ではなくても、利用者の発声した音声データに基づき、何らかのデータとマッチングすることで認識できるようなデータであればよい。
【0008】
また、第1の記憶手段は音声認識処理に際して高速アクセス性が相対的に低く、第2の記憶手段は音声認識処理に際して高速アクセス性が相対的に高いものであるが、具体例としては、第1の記憶手段としてDVDやCD−ROMが挙げられ、第2の記憶手段としてRAMなどが挙げられる。つまり、実際の音声認識処理を実行する上では、その処理時間を短くしてレスポンスを向上させる観点から通常はRAMなどの第2の記憶手段に辞書を読み込むこととなる。
【0009】
請求項1に記載の音声認識装置によれば、少なくとも県別テンプレートデータは第1の記憶手段に記憶されており、ひと続きで入力できる音声入力手段を介して入力された音声を認識する際には、まず、入力音声に基づいて得たマッチング用データと県名テンプレートデータとを比較することで、どの都道府県名が含まれているかを判定する。そして、その予備判定にて含まれているとされた都道府県名に対応する県別テンプレートデータを第2の記憶手段に読み込み、その県別テンプレートデータを用いて最終的な認識結果を得る。つまり、例えば予備判定で「愛知県」という都道府県名が含まれていることが判った場合は、愛知県用に準備された県別テンプレートデータのみを第2の記憶手段に読み込んで認識を行うことができる。
【0010】
このようにすれば、全テンプレートデータを第2の記憶手段に読み込んでおかなくてもよい。つまり、都道府県別に準備された県別テンプレートデータを最低限1つ(場合によっては複数)読み込むだけでよく、それに対応するだけの記憶容量が第2の記憶手段にあればよい。つまり本発明は、複数の地名を階層的につなぎ合わせた住所に対して都道府県単位に県別テンプレートデータを準備するという、いわばテンプレートデータの「分割」を行い、予備判定にてどの県別テンプレートデータを用いればよいかを判定して、「真に必要な」テンプレートデータに絞ってから第2の記憶手段に読み込むようにした。したがって、テンプレートデータに準備する単語を増やすことで認識可能な対象を増加させるという利点を追求した場合であっても、その認識可能語彙をすべて第2の記憶手段に格納しておく必要がない。そのため、第2の記憶手段は相対的に容量が小さくても、一括入力に対応した適切な音声認識が実現できる。
【0011】
なお、複数の地名を階層的につなぎ合わせた住所についての上位階層と下位の切り分けについては弾力的な適用が可能であるため、請求項4に示すようにしてもよい。つまり、住所が3階層以上の地名で構成されている場合には、県名テンプレートデータと、県別テンプレートデータとを備えるとともに、当該県別テンプレートデータを上位階層とみなして市町村よりも下位の地名レベルも区別するようにした、市町村単位で準備された市別テンプレートデータ備えるのである。このようにすることで、必要なテンプレートデータだけを読み込めばよくなり、第2の記憶手段がより小容量でも対応可能となる。
【0012】
ところで、最終的には県別テンプレートデータまたは請求項4における市別テンプレートデータを用いて認識するために、その県別テンプレートデータ又は請求項4における市別テンプレートデータを選択する予備判定を行う。この予備判定は、県名テンプレートデータ又は請求項4における県別テンプレートデータを用いて行うのであるが、このテンプレートデータの構成には次のような工夫をしてもよい。つまり、請求項5に示すように、テンプレートデータを構成する複数種類の語または語群の後にそれ以外の語又は語群が付属した音声入力に対してもマッチング可能なワイルドカードモデルとするのである。
【0013】
例えば、県名テンプレートデータ場合、県名の後にどのような音声にもマッチングするようにする。単に県名しか辞書データとして持たない場合には、実際の認識対象(都道府県以下の市町村や大字なども含む語群)の内の一部分しか県名がないため、全体としてのマッチング度合いが低下する。それに対して、ワイルドカードモデルの場合には、マッチング自体は認識対象全体として行えるのでそのような問題が生じない。ワイルドカードモデルとしては、後述するガーベージモデルや音節連接モデルなどがある。
【0014】
一方、このようなワイルドカードモデルを用いるのではなく、請求項6に示すように、県名テンプレートデータは、都道府県名の後に市町村名あるいはさらに市町村よりも下位レベルの地名が付属したものであり、請求項4における県別テンプレートデータは、市町村名の後に市町村よりも下位レベルの地名が付属したし冗長なテンプレートデータを用いてもよい。
【0015】
ワイルドカードを使うと上述のような利点があるが、このワイルドカードはどのようなものにも緩やかにマッチングしてしまうので、誤認識の可能性を増やす原因ともなる。そこで、例えば県名テンプレートデータとして、県名だけでなく市町村名まで付加した冗長な状態でテンプレートデータを準備する。認識時には市町村名までマッチングするが、結果としてはいずれの県名とマッチングしたかを判定する。より長い音声でマッチングをし、またワイルドカードモデルのように緩やかにどのようなものにもマッチングするものではないため、認識率の向上が期待できる。但し、準備するテンプレートデータ量は相対的には増加する。
【0016】
ところで、このような音声認識装置と、その音声認識装置にて認識された結果に基づいて所定の処理を実行する処理装置とを備え、処理装置が処理をする上で指定される必要のある所定のコマンドを利用者が音声にて入力できるようにした処理システムを構築することができる。この際、請求項7に示すように、コマンドを認識するためのテンプレートデータであるコマンド用テンプレートデータを第1の記憶手段から第2の記憶手段に読み込んでおくか、あるいは第2の記憶手段同様に高速アクセス性が相対的に高い読み取り専用の第3の記憶手段(例えばROM)に予め記憶しておく。そして、次の(1)〜(4)の手順で認識を行う。
【0017】
(1)県名テンプレートデータ又は請求項4における県別テンプレートデータを用いた認識を行って予備判定をする。
(2)コマンド用テンプレートデータを用いた認識を行うと共に、この認識と並行して予備判定の結果に対応する県別テンプレートデータ又は請求項4における市別テンプレートデータを第2の記憶手段に読み込む。
【0018】
(3)その読み込んだ県別テンプレートデータ又は請求項4における市別テンプレートデータを用いて認識を行う。
(4)上記(2)の認識結果と(3)の認識結果の内でより確からしさが上位のものを最終的な認識結果とする。
例えば処理装置がナビゲーション装置であれば、目的地などの設定のために階層的な構成を持つ地名(住所)を音声入力することがあり、また、当然ながらナビゲーション装置の各種機能を使うためのコマンドを指示することがある。そして、このナビゲーション用のシステムを想定した場合には、上述の認識処理を実行することで、地名(住所)の入力だけでなくコマンドが入力された場合にも即座に対応でき、コマンド用テンプレートデータを用いた認識処理を別途行わなくてもよい。つまりレスポンスが向上し、利用者にとっての使い勝手が向上することとなる。
【0019】
なお、請求項7に示した処理システムは、ナビゲーション用のシステム以外にも当然適用できるが、特にナビゲーション用のシステムに限定して考えた場合には、次のような工夫もできる。つまり、請求項8に示すように、現在地を検出する機能を持つことを前提として、次の(1)〜(4)の手順で認識を行う。
【0020】
(1)県名テンプレートデータ又は請求項4における県別テンプレートデータを用いた認識を行って予備判定を行う。
(2)現在地検出手段にて検出された現在地に対応する県別テンプレートデータ又は請求項4における市別テンプレートデータを第2の記憶手段に読み込み、その県別テンプレートデータ又は請求項4における市別テンプレートデータを用いた認識を行うと共に、この認識と並行して予備判定の結果に対応する県別テンプレートデータ又は請求項4における市別テンプレートデータを第2の記憶手段に読み込む。
【0021】
(3)その読み込んだ県別テンプレートデータ又は請求項4における市別テンプレートデータを用いて認識を行う。
(4)上記(2)の認識結果と(3)の認識結果の内でより確からしさが上位のものを最終的な認識結果とする。
この手法によって解決したい状況は次の通りである。つまり、ナビゲーションシステムを搭載した車両が例えば愛知県内を走行しており、同じ愛知県内である「愛知県刈谷市昭和町」を目的地として設定する場合には、「愛知県刈谷市昭和町」と音声入力するのではなく、「愛知県」を省略して「刈谷市昭和町」と音声入力する方が自然である。本手法であれば、2回目の認識において現在地に対応する下位階層辞書を用いた認識を行うため、都道府県名を省略した音声入力であっても対応できる。
【0022】
一方、同様に現在地を検出する機能を持つことを前提としながら、相対的に認識速度の向上を図りたい場合には請求項9に示すようにしてもよい。この場合には、認識処理に先立って現在地検出手段にて検出された現在地に対応する県別テンプレートデータ又は請求項4における市別テンプレートデータを第2の記憶手段に予め読み込んでおく。そして、次の(1)、(2)の手順で認識を行う。
【0023】
(1)県名テンプレートデータ又は請求項4における県別テンプレートデータ及び予め読み込んでおいた県別テンプレートデータ又は請求項4における市別テンプレートデータを用いた認識を行う。そして、その認識結果が、予め読み込んでおいた県別テンプレートデータ又は請求項4における市別テンプレートデータを用いて得られたものである場合には、それを最終的な認識結果として認識処理を終了する。
【0024】
(2)一方、上記(1)の認識結果が、県名テンプレートデータ又は請求項4における県別テンプレートデータを用いたものである場合には、その認識結果に対応する県別テンプレートデータ又は請求項4における市別テンプレートデータを第2の記憶手段に読み込み、その県別テンプレートデータ又は請求項4における市別テンプレートデータを用いて得た認識結果を最終的な認識結果とする。
【0025】
このようにすれば、使用頻度が高いと考えられる現在地を含む所定地域内の地名を認識する際には、それを認識するための県別テンプレートデータ又は請求項4における市別テンプレートデータが予め読み込んであるため、相対的に認識処理が素早くできることとなる。
【0026】
【発明の実施の形態】
以下、本発明が適用された実施例について図面を用いて説明する。なお、本発明の実施の形態は、下記の実施例に何ら限定されることなく、本発明の技術的範囲に属する限り、種々の形態を採り得ることは言うまでもない。
【0027】
図1は音声認識機能を持たせたナビゲーションシステム2の概略構成を示すブロック図である。本ナビゲーションシステム2は、車両に搭載されて用いられるいわゆるカーナビゲーションシステムであり、位置検出器4、データ入力器6、操作スイッチ群8、これらに接続された制御回路10、制御回路10に接続された外部メモリ12、表示装置14及びリモコンセンサ15及び音声認識装置30を備えている。なお制御回路10は通常のコンピュータとして構成されており、内部には、周知のCPU、ROM、RAM、I/O及びこれらの構成を接続するバスラインが備えられている。
【0028】
位置検出器4は、周知の地磁気センサ16、ジャイロスコープ18、距離センサ20及び衛星からの電波に基づいて車両の位置を検出するためのGPS受信機22を有している。これらのセンサ等16,18,20,22は各々が性質の異なる誤差を持っているため、複数のセンサにより、各々補間しながら使用するように構成されている。なお、精度によっては上述した内の一部で構成してもよく、更に、ステアリングの回転センサ、各転動輪の車輪センサ等を用いてもよい。
【0029】
データ入力器6は、位置検出の精度向上のためのいわゆるマップマッチング用データ、地図データ及び目印データを含むナビゲーション用の各種データに加えて、音声認識装置30において認識処理を行う際に用いる辞書データを入力するための装置である。記憶媒体としては、そのデータ量からDVDを用いるのが一般的であると考えられるが、CD−ROM等の他の媒体を用いても良い。データ記憶媒体としてDVDを用いた場合には、このデータ入力器6はDVDプレーヤとなる。
【0030】
表示装置14はカラー表示装置であり、表示装置14の画面には、位置検出器4から入力された車両現在位置マークと、地図データ入力器6より入力された地図データと、更に地図上に表示する誘導経路や設定地点の目印等の付加データとを重ねて表示することができる。また、複数の選択肢を表示するメニュー画面やその中の選択肢を選んだ場合に、さらに複数の選択肢を表示するコマンド入力画面なども表示することができる。
【0031】
また、本ナビゲーションシステム2は、リモートコントロール端末(以下、リモコンと称する。)15aを介してリモコンセンサ15から、あるいは操作スイッチ群8により目的地の位置を入力すると、現在位置からその目的地までの最適な経路を自動的に選択して誘導経路を形成し表示する、いわゆる経路案内機能も備えている。このような自動的に最適な経路を設定する手法は、ダイクストラ法等の手法が知られている。操作スイッチ群8は、例えば、表示装置14と一体になったタッチスイッチもしくはメカニカルなスイッチ等が用いられ、各種コマンドの入力に利用される。
【0032】
そして、音声認識装置30は、上記操作スイッチ群8あるいはリモコン15aが手動操作により各種コマンド入力のために用いられるのに対して、利用者が音声で入力することによっても同様に各種コマンドを入力できるようにするための装置である。
【0033】
この音声認識装置30は、音声認識部31と、対話制御部32と、音声合成部33と、音声抽出部34と、マイク35と、スイッチ36と、スピーカ37と、制御部38とを備えている。
音声認識部31は、音声抽出部34から入力された音声データを、対話制御部32からの指示により入力音声の認識処理を行い、その認識結果を対話制御部32に返す。すなわち、音声抽出部34から取得した音声データに対し、記憶している辞書データを用いて照合を行ない、複数の比較対象パターン候補と比較して一致度の高い上位比較対象パターンを対話制御部32へ出力する。入力音声中の単語系列の認識は、音声抽出部34から入力された音声データを順次音響分析して音響的特徴量(例えばケプストラム)を抽出し、この音響分析によって得られた音響的特徴量時系列データを得る。そして、周知のHMM(隠れマルコフモデル)、DPマッチング法あるいはニューラルネットなどによって、この時系列データをいくつかの区間に分け、各区間が辞書データとして格納されたどの単語に対応しているかを求める。
【0034】
対話制御部32は、音声認識部31における認識結果や制御部38からの指示に基づき、音声合成部33への応答音声の出力指示、あるいは、ナビゲーションシステム自体の処理を実行する制御回路10に対して例えばナビゲート処理のために必要な目的地やコマンドを通知して目的地の設定やコマンドを実行させるよう指示する処理を行う。このような処理の結果として、この音声認識装置30を利用すれば、上記操作スイッチ群8あるいはリモコン15aを手動しなくても、音声入力によりナビゲーションシステムに対する目的地の指示などが可能となるのである。
【0035】
なお、音声合成部33は、波形データベース内に格納されている音声波形を用い、対話制御部32からの応答音声の出力指示に基づく音声を合成する。この合成音声がスピーカ37から出力されることとなる。
音声抽出部34は、マイク35にて取り込んだ周囲の音声をデジタルデータに変換して音声認識部31に出力するものである。詳しくは、入力した音声の特徴量を分析するため、例えば数10ms程度の区間のフレーム信号を一定間隔で切り出し、その入力信号が、音声の含まれている音声区間であるのか音声の含まれていない雑音区間であるのか判定する。マイク35から入力される信号は、認識対象の音声だけでなく雑音も混在したものであるため、音声区間と雑音区間の判定を行なう。この判定方法としては従来より多くの手法が提案されており、例えば入力信号の短時間パワーを一定時間毎に抽出していき、所定の閾値以上の短時間パワーが一定以上継続したか否かによって音声区間であるか雑音区間であるかを判定する手法がよく採用されている。そして、音声区間であると判定された場合には、その入力信号が音声認識部31に出力されることとなる。
【0036】
また、本実施形態においては、利用者がスイッチ36を押しながらマイク35を介して音声を入力するという利用方法である。具体的には、制御部38がスイッチ36が押されたタイミングや戻されたタイミング及び押された状態が継続した時間を監視しており、スイッチ36が押された場合には音声抽出部34及び音声認識部31に対して処理の実行を指示する。一方、スイッチ36が押されていない場合にはその処理を実行させないようにしている。したがって、スイッチ36が押されている間にマイク35を介して入力された音声データが音声認識部31へ出力されることとなる。
【0037】
このような構成を有することによって、本実施例の車載ナビゲーションシステム2では、ユーザがコマンドを入力することによって、経路設定や経路案内あるいは施設検索や施設表示など各種の処理を実行することができる。
ここで、音声認識部31と対話制御部32についてさらに説明する。図2に示すように、音声認識部31は照合部311と辞書部312と抽出結果記憶部313とを有しており、対話制御部32は処理部321と入力部322と辞書制御部323とを有している。
【0038】
音声認識部31においては、抽出結果記憶部313が音声抽出部34から出力された抽出結果を記憶しておき、照合部31aがその記憶された抽出結果に対し、辞書部312内に記憶されている辞書データを用いて照合を行う。この辞書部312内の辞書データは固定ではなく、適宜設定・更新されるのであるが、この点は後述する。そして、照合部311にて辞書データと比較されて一致度が高いとされた上位の認識結果は、対話制御部32の処理部321へ出力され、対話制御部32の処理部321が、制御回路10へその認識結果を出力する。
【0039】
一方、処理部321は、制御回路10に対して辞書データをDVDから読み出して音声認識装置30側へ出力する依頼(辞書読込依頼)を出すことができ、その依頼の結果として制御回路10から送られた辞書データは、対話制御部32の入力部322を介して入力される。そして、辞書制御部323がその辞書データを音声認識部31の辞書部312に対して設定(書込)・更新する。
【0040】
ここで辞書データについて説明する。辞書データとしては、語彙そのもののデータだけでなく、その語彙が複数の語を階層的につなぎ合わせたものである場合には、次のように分割されて準備されている。ここでは、そのように分割されて準備されている辞書データの例として地名辞書を説明する。
【0041】
まず、上位階層辞書は、都道府県名の辞書データである。つまり、47の都道府県(愛知県、青森県……、和歌山県)の名称に対応したキーワードを辞書データとして持つものである。そして、下位階層辞書は、都道府県別に分割して準備された県別辞書である。つまり、愛知県の県別辞書、青森県の県別辞書……、和歌山県の県別辞書というように47の県別辞書が準備されている。この下位階層辞書は、上位階層のキーワードに下位階層のキーワードを付加した辞書データであり、例えば愛知県の県別辞書であれば、愛知県○○市××町、……、愛知県刈谷市昭和町、愛知県△△市▽▽町、……というように、必ず愛知県から始まるようにしている。他の都道府県の県別辞書も同様である。
【0042】
なお、必要に応じて、さらに下位階層の辞書を準備してもよい。つまり、全国に存在する市町村別に市別辞書を準備してもよい。例えば愛知県刈谷市の市別辞書、愛知県大府市の市別辞書……といった具合である。日本の場合には約4000の市町村があるといわれているので、約4000の市別辞書が準備されることとなる。この考え方を進めれば、当然ながらさらに下位階層の辞書を準備することも可能である。例えば名古屋市には16の区があるが、その区別に16分割した辞書を準備してもよい。もちろん、区に限らず市町村の下位にくる大字レベルに分割した辞書を準備することも可能である。
【0043】
そして、このように分割された辞書も含め、基本的に辞書はすべて、データ入力器6にセットされるDVDなどの記録媒体に記録されている。なお、「基本的には」としたのは、音声認識部31の辞書部312に常駐させておく辞書データがあってもよいからである。但し、上述した下位階層の辞書については、原則通りDVDなどのデータ記憶媒体に記憶させておき、必要なときに辞書部312に読み込むようにする。
【0044】
次に、本実施例のナビゲーションシステム2の動作について説明する。なお、音声認識装置30に関係する部分が特徴であるので、ナビゲーションシステムとしての一般的な動作を簡単に説明した後、音声認識装置30に関係する部分の動作について詳しく説明することとする。
【0045】
ナビゲーションシステム2の電源オン後に、表示装置14上に表示されるメニューから、ドライバーがリモコン15a(操作スイッチ群8でも同様に操作できる。以後の説明においても同じ)により、案内経路を表示装置14に表示させるために経路情報表示処理を選択した場合、あるいは、音声認識装置30を介して希望するメニューをマイク35を介して音声入力することで、対話制御部32から制御回路10へ、リモコン15aを介して選択されるのを同様の指示がなされた場合、次のような処理を実施する。
【0046】
すなわち、ドライバーが表示装置14上の地図に基づいて、音声あるいはリモコンなどの操作によって目的地を入力すると、GPS受信機22から得られる衛星のデータに基づき車両の現在地が求められ、目的地と現在地との間に、ダイクストラ法によりコスト計算して、現在地から目的地までの最も短距離の経路を誘導経路として求める処理が行われる。そして、表示装置14上の道路地図に重ねて誘導経路を表示して、ドライバーに適切なルートを案内する。このような誘導経路を求める計算処理や案内処理は一般的に良く知られた処理であるので説明は省略する。
【0047】
次に、音声認識装置30における動作について説明する。ここでは、いくつかの動作例を挙げる。
[動作例1]
図4は、動作例1の場合の音声認識部31及び対話制御部32における処理を示すフローチャートである。
【0048】
最初のステップS10においては、最上位階層の辞書を設定する。具体的には、上述した県名辞書であり、データ入力器6によってDVDから読み出し、それを制御回路10、対話制御部32を介して音声認識部31の辞書部312に設定する。なお、上述したように、この県名辞書については辞書部312に常駐させておくことも考えられる。
【0049】
このように音声認識の準備ができたら、続いて音声認識処理を行う(S20)。上述したように、スイッチ36が押されている間にマイク35を介して入力された音声データが音声抽出部34にて抽出されて音声認識部31へ出力されるため、この抽出結果に対して認識処理を実行することとなる。
【0050】
この音声認識処理がなされた後、その認識に用いたのが最下位階層の辞書であるかどうかを判断する(S30)。S10にて設定した県名辞書を用いた認識であれば最下位階層の辞書ではないので(S30:NO)、S20での認識処理の結果から選択された下位階層の辞書を設定する(S40)。例えば、県名辞書を用いた認識で「愛知県」が選択された場合には、愛知県の県別辞書を設定する。この設定に際しては、図3に例示するように、対話制御部32が制御回路10へ県別辞書の読み込みを依頼する。制御部10はその依頼に応じ、データ入力器6によってDVDから該当する県別辞書を読み出し、対話制御部32へ送る。そして、上述したように、対話制御部32内の辞書制御部323(図2参照)によってその県別辞書が音声認識部31の辞書部312に設定される。
【0051】
その後S20へ戻り、抽出結果記憶部313に記憶されている抽出結果を再度用いて音声認識処理を行う。県別辞書が最下位階層の辞書であれば(S30:YES)、その辞書を用いて得た認識結果を制御回路10へ出力する(S50)。
なお、上述したように、県別辞書のさらに下位階層の辞書として市別辞書や区別辞書、大字辞書などが準備されている場合には、S20〜S40のループ処理を繰り返して、最下位階層の辞書が設定された状態で認識された結果を出力すればよい。
【0052】
このようにすれば、音声入力された地名を認識する場合に、地名に関する全辞書を辞書部312に読み込んでおかなくてもよく、県名辞書及び選択された都道府県に対応する県別辞書を読み込むだけでよい。このような階層的に構成される語群に対して辞書の「分割」を行い、予備判定にてどの下位階層辞書(県別辞書)を用いればよいかを判定して、「真に必要な」辞書に絞ってから辞書部312に読み込むようにした。したがって、辞書に準備する語彙を増やすことで認識可能な対象を増加させるという利点を追求した場合であっても、その認識可能語彙をすべて辞書部312に格納しておく必要がない。そのため、辞書部312は相対的に容量が小さくても、一括入力に対応した適切な音声認識が実現できる。
【0053】
[動作例2]
図5は、動作例2の場合の音声認識部31及び対話制御部32における処理を示すフローチャートである。ここでは、実際の認識処理を開始する前に、県名辞書及びコマンド辞書が辞書部312に記憶されていることを前提とする。
【0054】
最初のステップS110においては、県名辞書を設定する。予め記憶されているため、ここでは音声認識に用いる辞書として設定する。つまり、辞書部312にはコマンド辞書も記憶されているが、それは設定しない。そして、続くS120ではその県名辞書を用いて第1回目の音声認識処理を行い、その第1回目の認識結果から選択された県別辞書の読込を依頼する(S130)。
【0055】
この辞書の読込依頼は、上記動作例1でも説明したように対話制御部32が制御回路10に対して行う。この依頼を受けた制御部10はその依頼に応じ、データ入力器6によってDVDから該当する県別辞書を読み出し、対話制御部32へ送る、そして、対話制御部32はその県別辞書を読み込み(S190)、その県別辞書を音声認識部31の辞書部312に設定する(S160)。
【0056】
しかし、制御部10へ依頼をしてから県別辞書が送られてくるまでの時間がある程度必要であるので、ここでは、その間を利用して2回目の認識処理を行う。つまり、今度はコマンド辞書を音声認識に用いる辞書として設定し(S140)、そのコマンド辞書を用いて第2回目の音声認識処理を行うのである(S150)。この第2回目の認識処理が終了したら、上述したDVDから読み込んだ県別辞書を音声認識に用いる辞書として設定し(S160)、その県別辞書を用いて第3回目の音声認識処理を行う(S170)。
【0057】
このようにして得た第2回目の認識結果と第3回目の認識結果の確からしさを比較し、上位の候補(認識結果)を出力する(S180)。
ナビゲーションシステムを利用する際に利用者が音声入力する語彙としては、目的地などの設定のために地名(住所)があるが、当然ながらナビゲーションの各種機能を使うためのコマンドを指示することがある。したがって、本動作例のようにすれば、第2回目の音声認識処理をコマンド辞書を用いて行っているので、地名(住所)の入力だけでなくコマンドが入力された場合にも即座に対応できる。そして、この認識処理は、県名辞書を用いた予備判定にて選択された県別辞書の読み込みを行う間に実行するため、時間のロスが少なくて済む。つまり全体としてレスポンスが向上し、利用者にとっての使い勝手が向上する。
【0058】
[動作例3]
図6は、動作例3の場合の音声認識部31及び対話制御部32における処理を示すフローチャートである。ここでは、実際の認識処理を開始する前に、県名辞書及び現在地の県別辞書が辞書部312に記憶されていることを前提とする。つまり、位置検出器4によって現在地を検出できるため、例えば本ナビゲーションシステムを搭載した車両が愛知県内を走行している場合には、愛知県の県別辞書を予めDVDから読み込んで辞書部312に記憶させておく。
【0059】
最初のステップS210においては、県名辞書を設定する。予め記憶されているため、ここでは音声認識に用いる辞書として設定する。つまり、辞書部312には現在地に対応する県別辞書も記憶されているが、それは設定しない。そして、続くS220ではその県名辞書を用いて第1回目の音声認識処理を行い、その第1回目の認識結果から選択された県別辞書の読込を依頼する(S230)。
【0060】
このS230での辞書の読込依頼の結果、DVDから該当する県別辞書を読み込み(S290)、その県別辞書を音声認識部31の辞書部312に設定する(S260)点については、上述の動作例2のS130,S160,S190の処理内容を同じである。そして、動作例2ではこの間を利用してコマンド辞書を用いた認識処理を行ったが、本動作例3では、予め読み込んであった現在地に対応する県別辞書を音声認識に用いる辞書として設定し(S240)、その県別辞書を用いて第2回目の音声認識処理を行う(S250)。この第2回目の認識処理が終了したら、上述したDVDから読み込んだ県別辞書を音声認識に用いる辞書として設定し(S260)、その県別辞書を用いて第3回目の音声認識処理を行う(S270)。
【0061】
このようにして得た第2回目の認識結果と第3回目の認識結果の確からしさを比較し、上位の候補(認識結果)を出力する(S180)。
ナビゲーションシステムを搭載した車両が例えば愛知県内を走行しており、同じ愛知県内である「愛知県刈谷市昭和町」を目的地として設定する場合には、「愛知県刈谷市昭和町」と音声入力するのではなく、「愛知県」を省略して「刈谷市昭和町」と音声入力する方が自然である。本手法であれば、2回目の認識において現在地に対応する下位階層辞書を用いた認識を行うため、都道府県名を省略した音声入力であっても対応できる。
【0062】
[動作例4]
図7は、動作例4の場合の音声認識部31及び対話制御部32における処理を示すフローチャートである。動作例3の場合と同様に、実際の認識処理を開始する前に、県名辞書及び現在地の県別辞書が辞書部312に記憶されていることを前提とする。
【0063】
最初のステップ310においては、県名辞書及び現在地に対応する県別辞書を音声認識に用いる辞書として設定する。そして、続くS320ではその県名辞書及び現在地対応の県別辞書を用いて第1回目の音声認識処理を行う。その第1回目の認識結果が、現在地対応の県別辞書を用いて得られたものである場合には(S330:YES)、この第1回目の認識結果を出力する(S340)。
【0064】
一方、現在地対応の県別辞書ではなく、県名辞書を用いて第1回目の認識結果が得られたものである場合には(S330:NO)、その認識結果から選択された県別辞書の読込を依頼し(S350)、DVDから該当する県別辞書を読み込む(S355)。この場合は、上述した動作例2,3とは異なり、辞書の読込依頼から実際に読み込むまでに別に音声認識処理は実行しない。
【0065】
そして、S355で読み込んだ県別辞書を音声認識に用いる辞書として設定し(S360)、その県別辞書を用いて第2回目の音声認識処理を行い(S370)、その認識結果を出力する(S380)。
このようにすれば、使用頻度が高いと考えられる現在地を含む県内の地名を認識する際には、それを認識するための県別辞書を用いて第1回目の音声認識処理で認識できるため、相対的に認識処理が素早くできることとなる。
【0066】
音声認識装置30における動作について4例挙げ、それぞれの動作例による効果などを説明したが、上位階層辞書の構成を工夫することでも以下に示すような効果を得ることができる。
[辞書構成例1]
ここでは上位階層辞書として県名辞書を例にとって考える。県名辞書は、上述したように都道府県(愛知県、青森県……、和歌山県)の名称に対応したキーワードを辞書データとして持つものであるが、これを愛知県*、青森県*……、和歌山県*というように記述し、*の部分がどのような音声入力に対してもマッチング可能なワイルドカードモデルとする。例えば、「愛知県刈谷市」という音声入力の内「刈谷市」が*にマッチングする。単に都道府県名のキーワードしか辞書データとして持たない場合には、実際の認識対象(都道府県以下の市町村や大字なども含む語群)の内の一部分しか県名がないため、全体としてのマッチング度合いが低下する。それに対して、ワイルドカードモデルの場合には、マッチング自体は認識対象全体として行えるのでそのような問題が生じない。
【0067】
ここで、ワイルドカードモデルについて少し補足説明する。
まず、音声認識で一般的に用いられるHMM(隠れマルコフモデル)手法について簡単に説明する。本手法は、音声を状態と遷移で表現されたマルコフモデルから生成されるものであると仮定して、生成モデルを事前に作成しておき、それと音声とを突き合わせ(マッチング)、最もよくマッチングするものを認識結果とするものである。このモデルの例としては図8に示す表現が一般的である。各状態には出力確率分布が対応しており、音声を分析した結果の特徴量(図8では簡単のために2次元で表現した)の時系列を図8(a)に対応する順(a1→a2→a3)に、図8(b)の確率分布から確からしさを突き合わせていく。最終的には音声の終端までの確からしさの積(尤度と呼ばれるスコア)が最も良いものを認識結果とする。この手法では、認識対象語彙のHMMを準備しておいてそれを比較することが基本となるが、大語彙の認識では事実上不可能であるので、音素や音節(これは単語の部分という意味でサブワードと呼ばれる)といった単位を設定し、それらのHMMを作成しておいて、それを接続することで単語のモデルを作成する。
【0068】
次に、ワイルドカードモデルの一例であるガーベージモデルについて説明する。図9(A)に、/a/,/i/,/u/のHMMの各状態に対応している確率分布の例を示した。ここでは特徴空間を2次元としている。ガーベージモデルと呼ばれる音声モデルは、特定の音節のある特徴を表現するのではなく、多くの音声をカバーできるように、大きな分散を有する分布を持つものである。こうすると、ガーベージモデルはさまざまな音声パターンに対して「広く浅く」マッチングするため、広範囲の音声に対してある程度のスコア(=確率)を出力するが、正しい分布に比べると小さい値を出力する傾向がある。例えば図9(A)中の「×」で示した音声パターンに対して、/a/,/i/のスコアは非常に小さくなり、/u/のスコアは大きくなる。一方、ガーベージモデルの場合のスコアは、/a/,/i/のスコアと比べると大きいが、/u/のスコアと比べると小さい。
【0069】
したがって、「あいちけんG」(Gはガーベージモデル)及び「あいちけんかりやし」のテンプレートと「あいちけんかりやし」の音声をマッチングすれば、そのスコアは「あいちけんG」<「あいちけんかりやし」となる可能性が高い(但し保証されているわけではない)。しかし、「あいちけんG(ガーベージモデル)」及び「あいちけんかすがいし」のテンプレートと「あいちけんかりやし」の音声をマッチングすれば、そのスコアは「あいちけんG」<「あいちけんかすがいし」となるとは限らず、かなりの確率で逆転する。
【0070】
続いて、ワイルドカードモデルの他の例である音節連接モデルについて説明する。
音節のHMMは単語を構成する単位となるが、これを任意に接続可能としていおくと、あらゆる語の発声が認識できることになる。つまり、図9(B)に示すような音声連接モデルはそのようなものである。なお、ここでは日本語の認識を前提としている。
【0071】
これを「あいちけんSCM」(SCMは音節連接モデル)のようにワイルドカードとしておくと「愛知県刈谷市昭和町」のような発声に対してもマッチング可能である。この場合、「あいちけんSCM」のモデルは「あいちけんかりやししょうわちょう」というモデルの表現を内包しているので、スコアとしては後者以上の値を得ることができる。
【0072】
[辞書構成例2]
上述したワイルドカードモデルを使うと上述のような利点があるが、このワイルドカードはどのようなものにも緩やかにマッチングしてしまうので、誤認識の可能性を増やす原因ともなる。そこで、例えば県名辞書を構成する場合に、県名だけでなく市町村名まで付加した冗長な状態で辞書を準備する。そして、認識時には市町村名までマッチングするが、結果としてはいずれの県名とマッチングしたかを判定する。より長い音声でマッチングをし、またワイルドカードモデルのように緩やかにどのようなものにもマッチングするものではないため、認識率の向上が期待できる。
【0073】
以上、本発明はこのような実施例に何等限定されるものではなく、本発明の主旨を逸脱しない範囲において種々なる形態で実施し得る。
例えば、上述した実施形態では、音声認識装置30を車両に搭載したナビゲーションシステム2に適用した例として説明したが、車載機器として用いられる場合だけではなく、例えば携帯型ナビゲーション装置として実現してもよい。
【0074】
また、ナビゲーションではない他の処理を実行する装置に対して音声入力で各種データの設定や指示などを与える場合にでも適用はできる。
【図面の簡単な説明】
【図1】 実施例としてのナビゲーションシステムの概略構成を示すブロック図である。
【図2】 音声認識装置における音声認識部と対話制御部の構成を示すブロック図である。
【図3】 辞書の読込依頼及びそれに対応した辞書読込の説明図である。
【図4】 音声認識装置における動作例1に係る処理を示すフローチャートである。
【図5】 音声認識装置における動作例2に係る処理を示すフローチャートである。
【図6】 音声認識装置における動作例3に係る処理を示すフローチャートである。
【図7】 音声認識装置における動作例4に係る処理を示すフローチャートである。
【図8】 HMM(隠れマルコフモデル)の説明図である。
【図9】 ワイルドカードモデルの例としてのガーベージモデル及び音節連接モデルの説明図である。
【符号の説明】
2…ナビゲーションシステム 4…位置検出器
6…データ入力器 8…操作スイッチ群
10…制御回路 12…外部メモリ
14…表示装置 15…リモコンセンサ
15a…リモコン 16…地磁気センサ
18…ジャイロスコープ 20…距離センサ
22…GPS受信機 30…音声認識装置
31…音声認識部 32…対話制御部
33…音声合成部 34…音声入力部
35…マイク 36…スイッチ
37…スピーカ 38…制御部
311…照合部 312…辞書部
313…抽出結果記憶部 321…処理部
322…入力部 323…辞書制御部

Claims (9)

  1. 音声をひと続きで入力できる音声入力手段と、
    最終的な認識対象が複数の地名を階層的につなぎ合わせた住所である場合の都道府県名に対応した県名テンプレートデータと、
    各都道府県単位で準備され、都道府県名に加えて市町村名あるいはさらに市町村よりも下位レベルの地名までを含んだ語群に対応した県別テンプレートデータと、
    音声認識処理に際して高速アクセス性が相対的に低い第1の記憶手段と、
    音声認識処理に際して高速アクセス性が相対的に高い第2の記憶手段と
    を備えており、
    少なくとも前記県別テンプレートデータは前記第1の記憶手段に記憶されており、
    前記音声入力手段を介してひと続きで入力された音声を認識する際には、まず、前記入力音声に基づいて得たマッチング用データと前記県名テンプレートデータとを比較することで、どの都道府県名が含まれているかを予備的に判定し、
    その予備判定にて含まれているとされた1の都道府県名に対応する県別テンプレートデータを前記第2の記憶手段に読み込み、その県別テンプレートデータを用いて最終的な認識結果を得ることを特徴とする音声認識装置。
  2. 請求項1記載の音声認識装置において、
    前記県名又は県別のテンプレートデータの少なくとも一方は辞書データであること
    を特徴とする音声認識装置。
  3. 請求項1記載の音声認識装置において、
    前記県名又は県別のテンプレートデータの少なくとも一方は音声データであること
    を特徴とする音声認識装置。
  4. 請求項1〜3のいずれか記載の音声認識装置において、
    住所が3階層以上の地名で構成されている場合には、県名テンプレートデータと、県別テンプレートデータとを備えるとともに、当該県別テンプレートデータを上位階層とみなして市町村よりも下位の地名レベルも区別するようにした、市町村単位で準備された市別テンプレートデータ備えること
    を特徴とする音声認識装置。
  5. 請求項1〜4のいずれか記載の音声認識装置において、
    前記県名テンプレートデータ及び請求項4における県別テンプレートデータは、テンプレートデータを構成する複数種類の語または語群の後にそれ以外の語又は語群が付属した音声入力に対してもマッチング可能なワイルドカードモデルであること
  6. 請求項1〜4のいずれか記載の音声認識装置において、
    前記県名テンプレートデータは、都道府県名の後に市町村名あるいはさらに市町村よりも下位レベルの地名が付属したものであり、請求項4における県別テンプレートデータは、市町村名の後に市町村よりも下位レベルの地名が付属したものであること
    を特徴とする音声認識装置。
  7. 請求項1〜6のいずれか記載の音声認識装置と、その音声認識装置にて認識された結果に基づいて所定の処理を実行する処理装置とを備え、
    前記音声入力手段は、前記処理装置が処理をする上で指定される必要のある所定のコマンドを利用者が音声にて入力するためにも用いられるものである処理システムであって、
    前記音声認識装置は、
    前記コマンドを認識するためのテンプレートデータであるコマンド用テンプレートデータを実際の音声認識処理を行う前に前記第2の記憶手段に読み込んでおくか、あるいは当該第2の記憶手段同様に高速アクセス性が相対的に高い読み取り専用の第3の記憶手段に予め記憶しておき、
    前記県名テンプレートデータ又は請求項4における県別テンプレートデータを用いた認識を行って前記予備判定をし、
    その後に前記コマンド用テンプレートデータを用いた認識を行うと共に、この認識と並行して前記予備判定の結果に対応する県別テンプレートデータ又は請求項4における市別テンプレートデータを前記第2の記憶手段に読み込み、その読み込んだ県別テンプレートデータ又は請求項4における市別テンプレートデータを用いて認識を行い、
    前記コマンド用テンプレートデータを用いて得た認識結果と前記県別テンプレートデータ又は請求項4における市別テンプレートデータを用いて得た認識結果の内でより確からしさが上位のものを最終的な認識結果とすること
    を特徴とする処理システム。
  8. 請求項1〜6のいずれか記載の音声認識装置と、その音声認識装置にて認識された結果に基づいて所定の処理を実行するナビゲーション装置とを備え、
    前記音声入力手段は、少なくとも前記ナビゲーション装置がナビゲート処理をする上で指定される必要のある所定の地名関連データの指示を利用者が音声にて入力するために用いられる処理システムであって、
    前記ナビゲーション装置は、現在地を検出する現在地検出手段を備え、
    前記音声認識装置は、
    前記県名テンプレートデータ又は請求項4における県別テンプレートデータを用いた認識を行って前記予備判定をし、
    前記現在地検出手段にて検出された現在地に対応する前記県別テンプレートデータ又は請求項4における市別テンプレートデータを前記第2の記憶手段に読み込み、その県別テンプレートデータ又は請求項4における市別テンプレートデータを用いた認識を行うと共に、この認識と並行して前記予備判定の結果に対応する県別テンプレートデータ又は請求項4における市別テンプレートデータを前記第2の記憶手段に読み込み、その読み込んだ県別テンプレートデータ又は請求項4における市別テンプレートデータを用いて認識を行い、
    前記現在地に対応する前記県別テンプレートデータ又は請求項4における市別テンプレートデータを用いて得た認識結果と、前記予備判定の結果に対応する県別テンプレートデータ又は請求項4における市別テンプレートデータを用いて得た認識結果の内でより確からしさが上位のものを最終的な認識結果とすること
    を特徴とする処理システム。
  9. 請求項1〜6のいずれか記載の音声認識装置と、その音声認識装置にて認識された結果に基づいて所定の処理を実行するナビゲーション装置とを備え、
    前記音声入力手段は、少なくとも前記ナビゲーション装置がナビゲート処理をする上で指定される必要のある所定の地名関連データの指示を利用者が音声にて入力するために用いられる処理システムであって、
    前記ナビゲーション装置は、現在地を検出する現在地検出手段を備え、
    前記音声認識装置は、
    前記現在地検出手段にて検出された現在地に対応する前記県別テンプレートデータ又は請求項4における市別テンプレートデータを前記第2の記憶手段に予め読み込んでおき、
    前記県名テンプレートデータ又は請求項4における県別テンプレートデータ及び前記予め読み込んでおいた県別テンプレートデータ又は請求項4における市別テンプレートデータを用いて認識を行い、その認識結果が、前記予め読み込んでおいた県別テンプレートデータ又は請求項4における市別テンプレートデータを用いて得られたものである場合には、それを最終的な認識結果とし、一方、その認識結果が、前記県名テンプレートデータ又 は請求項4における県別テンプレートデータを用いたものである場合には、その認識結果に対応する県別テンプレートデータ又は請求項4における市別テンプレートデータを前記第2の記憶手段に読み込み、その読み込んだ県別テンプレートデータ又は請求項4における市別下位階層テンプレートデータを用いて得た認識結果を最終的な認識結果とすること
    を特徴とする処理システム。
JP2000117910A 2000-04-19 2000-04-19 音声認識装置及び処理システム Expired - Fee Related JP3700533B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000117910A JP3700533B2 (ja) 2000-04-19 2000-04-19 音声認識装置及び処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000117910A JP3700533B2 (ja) 2000-04-19 2000-04-19 音声認識装置及び処理システム

Publications (2)

Publication Number Publication Date
JP2001306088A JP2001306088A (ja) 2001-11-02
JP3700533B2 true JP3700533B2 (ja) 2005-09-28

Family

ID=18629151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000117910A Expired - Fee Related JP3700533B2 (ja) 2000-04-19 2000-04-19 音声認識装置及び処理システム

Country Status (1)

Country Link
JP (1) JP3700533B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2006083020A1 (ja) * 2005-02-04 2008-06-26 株式会社日立製作所 抽出された音声データを用いて応答音声を生成する音声認識システム
JP4867622B2 (ja) 2006-11-29 2012-02-01 日産自動車株式会社 音声認識装置、および音声認識方法
JP4867654B2 (ja) 2006-12-28 2012-02-01 日産自動車株式会社 音声認識装置、および音声認識方法
JP4772164B2 (ja) 2009-01-30 2011-09-14 三菱電機株式会社 音声認識装置
JP5637131B2 (ja) 2011-12-26 2014-12-10 株式会社デンソー 音声認識装置
JP6912985B2 (ja) * 2017-09-13 2021-08-04 アルパイン株式会社 音声認識システム及びコンピュータプログラム

Also Published As

Publication number Publication date
JP2001306088A (ja) 2001-11-02

Similar Documents

Publication Publication Date Title
US9123327B2 (en) Voice recognition apparatus for recognizing a command portion and a data portion of a voice input
JP4466379B2 (ja) 車載音声認識装置
JP2002041085A (ja) 音声認識装置及び記録媒体
JP2003114696A (ja) 音声認識装置、プログラム及びナビゲーションシステム
KR101063607B1 (ko) 음성인식을 이용한 명칭 검색 기능을 가지는 네비게이션시스템 및 그 방법
JP4914632B2 (ja) ナビゲーション装置
JP3700533B2 (ja) 音声認識装置及び処理システム
JP4770374B2 (ja) 音声認識装置
JP3890774B2 (ja) ナビゲーションシステム
JP2002350146A (ja) ナビゲーション装置
JP3624698B2 (ja) 音声認識装置、その装置を用いたナビゲーションシステム及び自動販売システム
JP2011232668A (ja) 音声認識機能を備えたナビゲーション装置およびその検出結果提示方法
JP3296783B2 (ja) 車載用ナビゲーション装置および音声認識方法
JP4938719B2 (ja) 車載情報システム
JP4453377B2 (ja) 音声認識装置、プログラム及びナビゲーション装置
JPH0926799A (ja) 音声認識装置
JP2007025076A (ja) 車載用音声認識装置
JPH09114487A (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
JP4004885B2 (ja) 音声制御装置
JPH09114491A (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
JP3911835B2 (ja) 音声認識装置及びナビゲーションシステム
JPH11231892A (ja) 音声認識装置
JP2005114964A (ja) 音声認識方法および音声認識処理装置
JP2006039954A (ja) データベース検索装置、プログラム及びナビゲーション装置
JP4093394B2 (ja) 音声認識装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050704

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110722

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120722

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120722

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130722

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees