JP2001242887A

JP2001242887A - 音声認識装置および音声認識ナビゲーション装置

Info

Publication number: JP2001242887A
Application number: JP2000053257A
Authority: JP
Inventors: Zenichi Hirayama; 善一平山
Original assignee: Xanavi Informatics Corp
Current assignee: Faurecia Clarion Electronics Co Ltd
Priority date: 2000-02-29
Filing date: 2000-02-29
Publication date: 2001-09-07
Anticipated expiration: 2020-02-29
Also published as: JP4550207B2

Abstract

(57)【要約】【課題】ユーザが同じ意味内容の言葉を発話した場合
に、その言葉の一部の読みが微妙に異なったり、あるい
は、他の読みであったりしても、確実に音声認識を成功
させることが可能な音声認識装置等を提供すること。【解決手段】正規の読みの認識辞書３０１の認識語に所
定のキーワード３０４が含まれる場合、そのキーワード
３０４の読みをより実際の発音に近い読みとした認識語
を生成して新たな認識辞書３０２を作成する。マイクか
ら得られた音データとこの新たに作成された認識辞書の
認識語に基づき生成された音声認識用データとを比較し
て音声認識処理を行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声認識および音
声認識ナビゲーション装置に関する。

【０００２】

【従来の技術】自動車の現在地を表示し、地図の広域・
詳細表示を行い、目的地までの進行方向および残距離を
誘導する車載用ナビゲーション装置（以下、ナビゲーシ
ョン装置と言う）が知られている。また、ナビゲーショ
ン装置の一機能として、運転中のドライバからの操作指
示を音声で行い、ドライバの安全性を高めるいわゆる音
声認識ナビゲーション装置も知られている（例えば特開
平０９−２９２２５５号公報）。

【０００３】音声認識ナビゲーション装置で使用する音
声認識ソフトは、一般的に、発話スイッチ等を押し、そ
の後、ユーザが発話した音データと認識辞書内の認識語
との相関値を算出する。その結果、相関値が最大になっ
た認識語を認識結果と判断する。

【０００４】

【発明が解決しようとする課題】しかし、ユーザが同じ
意味内容の言葉を発話しても、その言葉の一部の読みが
微妙に異なったり、あるいは、他の読みであったりする
場合には、誤認識とされると言う問題があった。

【０００５】本発明の目的は、ユーザが同じ意味内容の
言葉を発話した場合に、その言葉の一部の読みが微妙に
異なったり、あるいは、他の読みであったりしても、確
実に音声認識を成功させることが可能な音声認識装置、
音声認識ナビゲーション装置、およびそのための認識語
生成方法を提供することにある。また、生成されたデー
タあるいは生成のためのプログラムを記録した記録媒体
および伝送する伝送媒体を提供することにある。

【０００６】

【課題を解決するための手段】実施の形態を示す図１を
使用して、括弧内にその対応する要素の符号をつけて本
発明を以下に説明する。上記目的を達成するために、請
求項１の発明は、音声入力手段（２０１）と、音声認識
対象の言葉に対応しその言葉の読みを表す認識語を格納
する格納手段（２０９、２１０）と、音声入力手段（２
０１）により得られた音データと認識語に基づき生成さ
れた音声認識用データとを比較して音声認識処理を行う
音声認識処理手段（２０８）とを備えた音声認識装置に
適用され、格納手段（２０９、２１０）には、一つの音
声認識対象の言葉の一部に予め定めた所定の言葉を含む
場合、その所定の言葉の読みをその所定の言葉の正規の
読みとは異なる読みとした第１の認識語が格納されてい
るようにしたものである。請求項２の発明は、請求項１
記載の音声認識装置において、所定の言葉は複数の音声
認識対象の言葉の一部に共通に含まれる言葉であり、所
定の言葉の正規の読みと異なる読みを、その言葉の通常
発音される読みであるようにしたものである。請求項３
の発明は、請求項１または２記載の音声認識装置におい
て、所定の言葉の正規の読みと異なる読みを、所定の言
葉の正規の読みにおいてのみ五十音のえ段の音節の後に
「い」の音節が並ぶ場合、この「い」の音節を「え」の
音節に置き換えた読みとしたものである。請求項４の発
明は、請求項１または２記載の音声認識装置において、
所定の言葉の正規の読みと異なる読みを、所定の言葉の
正規の読みにおいてのみ五十音のお段の音節の後に
「う」の音節が並ぶ場合、この「う」の音節を「お」の
音節に置き換えた読みとしたものである。請求項５の発
明は、請求項３または４記載の音声認識装置において、
認識語は長音符号「ー」を含む仮名により指定されるも
のであり、所定の言葉の正規の読みとは異なる読みにお
いて、置き換える音節を長音符号「ー」により置き換え
るようにしたものである。請求項６の発明は、請求項１
記載の音声認識装置において、格納手段（２０９、２１
０）に、一つの音声認識対象の言葉に対して、所定の言
葉の正規の読みを含む正規の認識語と第１の認識語とが
共に格納されているようにしたものである。請求項７の
発明は、請求項６記載の音声認識装置において、第１の
認識語において、所定の言葉の正規の読みと異なる読み
を、その言葉の読みをなしとしたものである。請求項８
の発明は、請求項６記載の音声認識装置において、第１
の認識語において、所定の言葉の正規の読みと異なる読
みを、その言葉が漢字で表されるときその漢字の異なる
読みとしたものである。請求項９の発明は、請求項６記
載の音声認識装置において、第１の認識語において、所
定の言葉の正規の読みと異なる読みを、その言葉が有す
る別称あるいは略称としたものである。請求項１０の発
明は、請求項１から９のいずれか１項記載の音声認識装
置において、音声認識処理手段（２０８）が、所定の言
葉を一部に含む一つの音声認識対象の言葉に関連して音
声認識処理を行うときに、第１の認識語を生成して格納
手段（２０９）に格納ずる生成手段をさらに備えるよう
にしたものである。請求項１１の発明は、音声入力手段
（２０１）と、音声認識対象の言葉に対応しその言葉の
読みを表す認識語を格納する格納手段（２０９、２１
０）と、音声入力手段（２０１）により得られた音デー
タと認識語に基づき生成された音声認識用データとを比
較して音声認識処理を行う音声認識処理手段（２０８）
とを備えた音声認識装置に適用され、格納手段（２０
９、２１０）には、音声認識対象の言葉に予め定めた所
定の言葉が含まれない場合、所定の言葉の読みを付加し
た認識語が格納されているようにしたものである。請求
項１２の音声認識ナビゲーション装置は、請求項１から
１１のいずれか１項記載の音声認識装置（２００）と、
地図情報を格納する地図情報格納手段（１０８）と、少
なくとも音声認識装置（２００）の認識結果と地図情報
とに基づき、道案内のための制御を行う制御手段（１０
５）とを備えるようにしたものである。請求項１３の発
明は、音声認識処理における、音声入力手段（２０１）
により得られた音データと比較する音声認識用データを
生成するための音声認識対象の言葉の読みを表した認識
語を生成する認識語生成方法に適用され、一つの音声認
識対象の言葉の一部に予め定めた所定の言葉を含む場
合、その所定の言葉の読みをその所定の言葉の正規の読
みとは異なる読みとした認識語を生成するようにしたも
のである。請求項１４の記録媒体は、音声認識処理にお
ける、音声入力手段（２０１）により得られた音データ
と比較する音声認識用データを生成するための音声認識
対象の言葉の読みを表した認識語を生成する認識語生成
プログラムであって、一つの音声認識対象の言葉の一部
に予め定めた所定の言葉を含む場合、その所定の言葉の
読みをその所定の言葉の正規の読みとは異なる読みとし
た認識語を生成する認識語生成プログラムを記録したも
のである。請求項１５の記録媒体は、音声認識処理にお
ける、音声入力手段（２０１）により得られた音データ
と比較する音声認識用データを生成するための音声認識
対象の言葉の読みを表した認識語に関するデータであっ
て、一つの音声認識対象の言葉の一部に予め定めた所定
の言葉を含む場合、その所定の言葉の読みをその所定の
言葉の正規の読みとは異なる読みとした認識語に関する
データを記録したものである。請求項１６の伝送媒体
は、音声認識処理における、音声入力手段（２０１）に
より得られた音データと比較する音声認識用データを生
成するための音声認識対象の言葉の読みを表した認識語
を生成する認識語生成プログラムであって、一つの音声
認識対象の言葉の一部に予め定めた所定の言葉を含む場
合、その所定の言葉の読みをその所定の言葉の正規の読
みとは異なる読みとした認識語を生成する認識語生成プ
ログラム伝送するものである。請求項１７の伝送媒体
は、音声認識処理における、音声入力手段（２０１）に
より得られた音データと比較する音声認識用データを生
成するための音声認識対象の言葉の読みを表した認識語
に関するデータであって、一つの音声認識対象の言葉の
一部に予め定めた所定の言葉を含む場合、その所定の言
葉の読みをその所定の言葉の正規の読みとは異なる読み
とした認識語に関するデータを伝送するものである。

【０００７】なお、上記課題を解決するための手段の項
では、分かりやすく説明するため実施の形態の図と対応
づけたが、これにより本発明が実施の形態に限定される
ものではない。

【０００８】

【発明の実施の形態】−第１の実施の形態− 図１は、本発明の車載用ナビゲーションシステムの第１
の実施の形態の構成を示す図である。車載用ナビゲーシ
ョンシステムは、ナビゲーション装置１００および音声
ユニット２００により構成される。第１の実施の形態の
ナビゲーションシステムは、認識語の一部に所定の言葉
が含まれる場合に、その所定の言葉の読みを最も音声認
識に成功する読みに置き換えるようにし、確実に音声認
識に成功させるようにしたものである。

【０００９】ナビゲーション装置１００は、ＧＰＳ受信
機１０１と、ジャイロセンサ１０２と、車速センサ１０
３と、ドライバ１０４と、ＣＰＵ１０５と、ＲＡＭ１０
６と、ＲＯＭ１０７と、ＣＤ−ＲＯＭドライブ１０８
と、表示装置１０９と、バスライン１１０等から構成さ
れる。

【００１０】音声ユニット２００は、マイク２０１と、
Ａ／Ｄ変換部２０２と、Ｄ／Ａ変換部２０３と、アンプ
２０４と、スピーカ２０５と、発話スイッチ２０６と、
ドライバ２０７と、ＣＰＵ２０８と、ＲＡＭ２０９と、
ＲＯＭ２１０と、バスライン２１２等から構成される。
ナビゲーション装置１００と音声ユニット２００は、通
信ライン２１１を介して接続される。

【００１１】ＧＰＳ受信機１０１は、ＧＰＳ（Global P
ositioning System）衛星からの信号を受信し、自車の
絶対位置、絶対方位を検出する。ジャイロセンサ１０２
は、例えば振動ジャイロで構成され、車のヨー角速度を
検出する。車速センサ１０３は、車が所定距離走行毎に
出すパルス数に基づき、車の移動距離を検出する。ジャ
イロセンサ１０２と車速センサ１０３により、車の２次
元的な移動が検出できる。ドライバ１０４は、ＧＰＳ受
信機１０１、ジャイロセンサ１０２、車速センサ１０３
からの信号をバスライン１１０に接続するためのドライ
バである。すなわち、それぞれのセンサ出力をＣＰＵ１
０５が読むことができるデータに変換する。

【００１２】ＣＰＵ１０５は、ＲＯＭ１０７に格納され
たプログラムを実行することによりナビゲーション装置
１００全体を制御する。ＲＡＭ１０６は揮発性メモリで
あり、ワークデータ領域を確保する。ＲＯＭ１０７は、
不揮発性メモリで、上述した制御プログラム等を格納す
る。ＣＤ−ＲＯＭドライブ１０８は、ＣＤ−ＲＯＭを記
録媒体とし、ベクトル道路データ等の道路地図情報を格
納する。ＣＤ−ＲＯＭドライブは、ＤＶＤを記録媒体と
するＤＶＤドライブやその他の記録装置であってもよ
い。表示装置１０９は、車の現在地および周辺の道路地
図、目的地までのルート情報、次の誘導交差点情報等を
表示する。例えば、液晶表示装置あるいはＣＲＴで構成
される。バスライン１１０は、ナビゲーション装置１０
０のＣＰＵ１０５等の構成要素をバス接続するラインで
ある。

【００１３】音声ユニット２００は、音声認識、音声合
成等、音声に関する処理を行う。発話スイッチ２０６
は、ユーザが押すことにより音声認識の開始を指示する
スイッチである。発話スイッチ２０６が押された後所定
時間、音データの入力がマイク２０１を介して行われ
る。入力された音は、Ａ／Ｄ変換部２０２およびドライ
バ２０７により、デジタル音声データに変換される。

【００１４】音声ユニット２００のＲＯＭ２１０には、
音声認識ソフト（プログラム）、音声合成ソフト（プロ
グラム）、音声認識辞書（以下、単に認識辞書と言
う）、音声合成辞書（以下、単に合成辞書と言う）等が
格納されている。音声認識ソフトは、デジタル音声デー
タと、認識辞書内の全認識語との相関値を算出し、最も
相関値の高い認識語を認識結果として求める。音声合成
ソフトは、指定した文章をスピーカから発声させるため
のデータを算出する。両ソフトウェアについては、公知
な内容であるので詳細な説明は省略する。

【００１５】認識辞書は、音声認識の対象となる言葉
（語）を複数集めたひとかたまりのデータである。具体
的には、ひらがなやカタカナやローマ字（実際にはその
文字コード）で指定されたそれぞれの言葉の読みデータ
が格納されている。認識辞書に格納された言葉を認識語
という。各認識語には、読みデータの他その言葉の表示
文字データや、施設名であれば座標情報などの情報が付
帯している。認識辞書の詳細については後述する。合成
辞書は、音声合成のために必要な音源データ等が格納さ
れている。

【００１６】発話終了時、ＣＰＵ２０８は、ＲＡＭ２０
９、ＲＯＭ２１０等を使い音声認識ソフトを実行し、デ
ジタル音声データの音声認識を行う。音声認識ソフト
は、認識辞書内の認識語の読みデータ（ひらがなやカタ
カナやローマ字で指定されたデータ）を参照しながらそ
の言葉の音声認識用データを生成し、デジタル音声デー
タとの相関値を算出する。すべての認識語についてデジ
タル音声データとの相関値を算出し、相関値が最も高く
かつ所定の値以上の認識語を決定して音声認識を完了す
る。その認識語にリンクしたエコーバック語を音声合成
ソフトを使い、発声用のデータに変換する。その後、Ｄ
／Ａ変換部２０３、アンプ２０４、スピーカ２０５を用
い、認識結果をエコーバック出力させる。

【００１７】もし、算出したどの相関値も所定の値以下
である場合は、音声認識できなかったとしてナビの操作
を行わないようにする。具体的には、「プップー」等の
認識失敗を意味するビープ音を鳴らすことや、「認識で
きません」と応答（エコーバック）させる。バスライン
２１２は、音声ユニット２００のバスラインである。

【００１８】次に、認識辞書について詳細に説明する。
図２は、８件の病院名に関する認識語を格納した従来の
病院名認識辞書を示す図である。認識語は、その施設名
（図２では病院名）に関する読みデータである。図２で
は、「読み」はカタカナで記載されているが、ひらがな
あるいはローマ字であってもよい。認識辞書には指定さ
れた文字に対応する文字コードが格納される。各認識語
には、「表示用文字データ」および「付帯情報」がつい
ている。表示用文字データは、表示装置１０９等でその
施設名の表示すべき文字コードが格納される。図２の例
では、「表示」の欄に示された施設名の漢字コードが格
納される。付帯情報は、その施設の地図上の座標情報、
次に読み込む認識辞書の番号、施設の諸属性情報等の各
種の情報が格納されている。図２では、代表して座標情
報のみを示している。

【００１９】図３は、図２の従来の病院名認識辞書に対
応する本発明を適用した病院名認識辞書を示す図であ
る。図３の「表示」および「付帯情報」の内容は、図２
の「表示」および「付帯情報」の内容と同じであり、
「読み」のみが異なる。例えば「王子総合病院」を例に
説明する。図２では、「王子総合病院」の読みは「オウ
ジソウゴウビョウイン」となっているが、図３では「オ
ウジソーゴービョーイン」となっている。すなわち「ソ
ウゴウビョウイン」が「ソーゴービョーイン」に変更さ
れている。次の「小樽病院国立療養所」の読みは、図２
では「オタルビョウインコクリツリョウヨウショ」であ
るが、図３では「オタルビョウインコクリツリョーヨー
ショ」となっている。すなわち「コクリツリョウヨウシ
ョ」が「コクリツリョーヨーショ」に変更されている。

【００２０】上記の「総合病院」の正規の読みは「ソウ
ゴウビョウイン」である。ここで言う正規の読みとは、
辞書などに書かれているその言葉の本来の読みである。
しかし、実際に日常会話などで発音する読みは微妙に異
なり、例えば長音符号「ー」を使用した「ソーゴービョ
ーイン」の方がより実際の発音に近い読みと言える。そ
こで、第１の実施の形態では、そのジャンルで良く出て
くる言葉（キーワード）のより実際の発音に近い読みを
前もって調査しておき、認識辞書の中にそのキーワード
を含む言葉があった場合は、そのキーワードの読みをそ
の実際の発音に近い読みに置き換えた認識語を準備する
ものである。

【００２１】図３において置き換えているキーワードを
列記すると図４（ａ）の通りである。なお、図４（ｂ）
に示すような読みに置き換えてもよい。

【００２２】図５は、図２の従来から使用されている正
規の読みの認識語が格納された認識辞書３０１から図３
の新たな認識辞書３０２をパーソナルコンピュータ（以
下ＰＣと言う）３０３により生成する構成を示す図であ
る。認識辞書３０１はＣＤ−ＲＯＭ等の記録媒体に格納
され、認識辞書３０２はハードディスク（不図示）上に
生成される。キーワード３０４は予め調査されてファイ
ルとしてＰＣ３０３のハードディスクに格納されてい
る。図６は、ＰＣ３０３で実行される処理のフローチャ
ートを示す。キーワード３０４はキーボード（不図示）
から入力するようにしてもよい。生成された認識辞書３
０２はＲＯＭに書き込まれて図１の音声ユニット２００
のＲＯＭ２１０に搭載される。

【００２３】以下、図６の処理について説明する。ステ
ップＳ１では、図２の正規の読みの認識語が格納された
認識辞書ファイルから一つの認識語を読み込む。該当ジ
ャンルで良く出てくる言葉（キーワード）のより実際の
発音に近い読みは前もって調査され、予めパーソナルコ
ンピュータに格納されている。ステップＳ２では、読み
込んだ認識語に所定のキーワードが含まれているかどう
か判断し、所定のキーワードが含まれていると判断する
とステップＳ３に進む。ステップＳ３では、認識語のそ
のキーワードに該当する読みを前もって調査されたより
実際の発音に近い読みに置き換える。一方、ステップＳ
２でいずれのキーワードも含まれていないと判断すると
ステップＳ３をスキップしてステップＳ４に進む。ステ
ップＳ４では、すべての認識語について処理が終了した
かを判断し、まだ終了していない場合はステップＳ１に
戻り処理を繰り返す。終了している場合は処理を終了す
る。

【００２４】なお、ステップＳ３において、正規の読み
の認識語はそのままにして、そのキーワードに該当する
読みを前もって調査されたより実際の発音に近い読みに
置き換えた新たな認識語を追加するようにしてもよい。
これにより、正規の読みの認識語と新たな認識語の双方
を使用して音声認識をすることが可能となる。

【００２５】図７は、音声ユニット２００において、音
声認識を行う制御のフローチャートを示す図である。制
御プログラムはＲＯＭ２１０に格納され、ＣＰＵ２０８
がその制御プログラムを実行する。ナビゲーション装置
１００および音声ユニット２００の電源オンにより本ル
ーチンはスタートする。

【００２６】本ルーチンでは、例えば、「施設ジャンル
名」を音声入力し、次に「施設名」を音声入力して該当
施設付近の地図を表示装置１０９に表示する場合を想定
する。ステップＳ１１では、初期認識辞書を準備する。
初期認識辞書には「病院」「警察署」「郵便局」などの
施設ジャンル名に関する認識語が格納されている。ステ
ップＳ１２では、発話スイッチ２０６が押されたかどう
かを判断し、押されている場合はステップＳ１３へ進
む。押されていない場合は本ステップを繰り返す。ユー
ザは発話スイッチ２０６を押した後、一定時間内に施設
ジャンル名、例えば「病院」と発話する。ステップＳ１
３では、マイク２０１からの音声信号をデジタル音声デ
ータに変換する。ステップＳ１４では、発話が終了した
かどうかを判断する。発話の終了は、一定時間音声信号
が途切れた場合を発話の終了と判断する。発話が終了し
たと判断した場合はステップＳ１５に進み、発話がまだ
終了していないと判断した場合はステップＳ１３に戻
る。

【００２７】ステップＳ１５では、ステップＳ１３で取
得したデジタル音声データとステップＳ１１で準備した
初期認識辞書内の全認識語について相関値を算出し、ス
テップＳ１６に進む。ステップＳ１６では、算出された
相関値のうち最も高い相関値が所定の値以上かどうかを
判断する。所定の値以上であれば、その語が認識できた
としてステップＳ１７に進む。ステップＳ１７では、相
関値の最も高かった認識語を「施設ジャンル名」として
認識して該当ジャンルの施設名辞書を準備し、「施設名
称をどうぞ」とエコーバック出力する。該当ジャンルが
「病院」の場合は、図６のルーチンで予め生成された図
３の病院名認識辞書を準備する。

【００２８】一方、ステップＳ１６において、最も高い
相関値が所定の値未満であれば発話された言葉が認識で
きなかったとしてステップＳ２３に進む。ステップＳ２
３では、「認識できません」と音声によりエコーバック
し、ステップＳ１２に戻る。

【００２９】ステップＳ１７で「施設名称をどうぞ」と
エコーバック出力されると、ユーザは、例えば図３に示
された病院名を発話する。ステップＳ１８では、マイク
２０１からの音声信号をデジタル音声データに変換す
る。ステップＳ１９では、発話が終了したかどうかを判
断する。発話の終了は、一定時間音声信号が途切れた場
合を発話の終了と判断する。発話が終了したと判断した
場合はステップＳ２０に進み、発話がまだ終了していな
いと判断した場合はステップＳ１８に戻る。

【００３０】ステップＳ２０では、ステップＳ１８で取
得したデジタル音声データと図３の認識辞書内の全認識
語について相関値を算出し、ステップＳ２１に進む。認
識辞書は、図２の認識辞書においてキーワードの読みが
置き換えられた図３の認識辞書を使用する。ステップＳ
２１では、算出された相関値のうち最も高い相関値が所
定の値以上かどうかを判断する。所定の値以上であれ
ば、その語が認識できたとしてステップＳ２２に進む。
ステップＳ２２では、相関値の最も高かった認識語を音
声によりエコーバックする。

【００３１】さらに、ステップＳ２２では該当病院名
（施設名称）が認識できたことをナビゲーション装置１
００に知らせた後、処理を終了する。ナビゲーション装
置１００に知らせるときは、表示文字データや付帯情報
の地図上の座標を知らせる。ナビゲーション装置１００
は、通信ライン２１１を介して送信されてきた該当病院
（施設）の地図上の座標データとＣＤ−ＲＯＭドライブ
１０８の地図情報等に基づき、該当施設近辺の道路地図
を表示装置１０９に表示する。

【００３２】一方、ステップＳ２１において、最も高い
相関値が所定の値未満であれば発話された言葉が認識で
きなかったとしてステップＳ２４に進む。ステップＳ２
４では、「認識できません」と音声によりエコーバック
し、ステップＳ１８に戻る。

【００３３】以上のようにして、音声認識を行うとき
に、該当ジャンルでよく使用されるキーワードを正規の
読みとは異なる実際の発音に近い読みに置き換えた認識
語を格納した認識辞書を使用するようにしている。これ
により、音声認識に確実に成功することができる。特
に、従来から使用していた認識辞書を使用して、キーワ
ード部分の読みのみを置き換えた認識辞書を作成してい
るので、音声認識のヒット率の向上した新たな認識辞書
の作成が容易かつ短時間かつ低コストで行うことができ
る。また、市販されている正規の読みが格納された認識
辞書を購入し、その購入した認識辞書に基づき、より音
声認識のヒット率を向上させた認識辞書を容易かつ短時
間かつ低コストで作成することもできる。

【００３４】−第２の実施の形態− 第１の実施の形態では、図５、６に示したとおり、図３
の認識辞書の生成は、パーソナルコンピュータ３０３で
予め生成し、生成された認識辞書を図１の音声ユニット
２００のＲＯＭ２１０に搭載する例を示した。第２の実
施の形態では、音声ユニットにおいて、図３の該当認識
辞書を使用する場合に、その時点でその該当認識辞書
（図３）を生成するようにしたものである。第２の実施
の形態の車載用ナビゲーションシステムの構成は、第１
の実施の形態の図１の構成と同様であるのでその説明を
省略する。

【００３５】図８は、第２の実施の形態の音声ユニット
２００において、音声認識を行う制御のフローチャート
を示す図である。第１の実施の形態の図７とは、ステッ
プＳ１７がステップＳ３１に置き換えられ、ステップＳ
２０がステップＳ３２に置き換えられている点のみが異
なるので、ステップＳ３１とＳ３２の処理を中心に以下
説明する。

【００３６】第２の実施の形態では、音声ユニット２０
０のＲＯＭ２１０が、図２の従来の認識辞書と該当ジャ
ンルのキーワードの読みデータ（正規の読みデータと置
き換え読みデータ、例えば図４（ａ））を持つようにす
る。そして、図６の認識辞書の生成と同じ内容を、ステ
ップＳ３１において実行する。すなわち、図８のステッ
プＳ３１では、まず、相関値の最も高かった認識語を
「施設ジャンル名」として認識すると、該当ジャンルの
施設名辞書（図２の認識辞書）を準備する。次に、準備
した施設名辞書とキーワードの正規の読みデータおよび
置き換え読みデータ（図４）に基づき、図６と同様の処
理を行ってキーワードの読みの置き換えを行い新たな施
設名辞書（図３の認識辞書）を生成する。その後、「施
設名称をどうぞ」とエコーバック出力する。ステップＳ
３２では、ステップＳ１８で取得したデジタル音声デー
タとステップＳ３１で生成した新たな認識辞書（図３）
内の全認識語について相関値を算出する。その他の処理
は、第１の実施の形態と同様であるので説明を省略す
る。

【００３７】第２の実施の形態では、正規の読みの認識
辞書はＲＯＭ２１０に格納されており、新たな認識辞書
はＲＡＭ２０９に格納される。この場合、ＲＡＭ２０９
では認識辞書をそっくり新たに作り替えるのではなく、
キーワードが含まれる認識語のみ追加認識語として生成
するようにしてもよい。このようにすることにより、正
規の認識語と追加認識語の両方において相関値を算出す
ることが可能となり、より精度の高い音声認識が可能と
なる。

【００３８】以上のようにして、第２の実施の形態にお
いても、第１の実施の形態と同様に、音声認識に確実に
成功することができる。特に、ＲＯＭ２１０には、従来
の認識語に加えてキーワードのデータのみを格納してお
けばよいので、少ない記憶容量でより精度の高い音声認
識が可能となる。

【００３９】−第３の実施の形態− 第２の実施の形態では、そのジャンルで良く出てくる言
葉（キーワード）のより実際の発音に近い読みを前もっ
て調査してその読みデータをＲＯＭ２１０に格納してお
くものであった。しかし、図４に示されたキーワードの
読みデータの置き換えには一定の法則を見いだすことが
できる。第３の実施の形態では、その法則を利用して新
たな認識語を生成するものである。第３の実施の形態の
車載用ナビゲーションシステムの構成は、第１の実施の
形態の図１の構成と同様であるのでその説明を省略す
る。

【００４０】まず、図４（ｂ）の「厚生病院」を例にそ
の法則について説明する。なお、仮名１字で示される音
を１音節という。「厚生病院」の正規の読みは「コウセ
イビョウイン」であり、その置き換えの読みとして「コ
オセエビョオイン」が示されている。これは、正規の読
み「コウセイビョウイン」を、実際には「コオセエビョ
オイン」と発話（発音）する人が多いからである。これ
により、次のような法則が見いだされる。「エ」「ケ」
「セ」「テ」「ネ」等の五十音のえ段の語（音節）の後
に「イ」が並ぶ読みの言葉の場合、その「イ」を「エ」
に置き換えたように発話する人が多い。また、「オ」
「コ」「ソ」「ト」「ノ」等のお段の語（音節）の後に
「ウ」が並ぶ読みの言葉の場合、その「ウ」を「オ」に
置き換えたように発話する人が多い。なお、この法則に
ついては、本出願の発明者が発明者として出願された特
願平１１−２５５９８３号に開示されている。

【００４１】図９は、第３の実施の形態の音声ユニット
２００において、音声認識を行う制御のフローチャート
を示す図である。第２の実施の形態の図８とは、ステッ
プＳ３１がステップＳ４１に置き換えられている点のみ
が異なるので、ステップＳ４１の処理を中心に以下説明
する。

【００４２】図９のステップＳ４１では、まず、相関値
の最も高かった認識語を「施設ジャンル名」として認識
すると、該当ジャンルの施設名辞書（図２の認識辞書）
を準備する。次に、準備した施設名辞書について後述す
る図１０の処理を行って新たな施設名辞書（例えば図３
の認識辞書）を生成する。その後、「施設名称をどう
ぞ」とエコーバック出力する。その他の処理は、第２の
実施の形態と同様であるので説明を省略する。

【００４３】次に、図１０の処理を説明する。図１０
は、図６と同様に、従来から使用されている正規の読み
の認識語が格納された認識辞書から新たな認識辞書を生
成する制御を示すフローチャートである。図６と異なる
のは、上述した法則を利用するところである。

【００４４】ステップＳ５１では、図２の正規の読みの
認識語格納された認識辞書ファイルから一つの認識語を
読み込む。該当ジャンルで良く出てくる言葉（キーワー
ド）は前もって調査され、ＲＯＭ２１０に格納されてい
る。この場合、キーワードの正規の読みのデータのみが
格納されている。ステップＳ５２では、読み込んだ認識
語に所定のキーワードが含まれているかどうかを判断
し、所定のキーワードが含まれていると判断するとステ
ップＳ５３に進む。

【００４５】ステップＳ５３では、キーワードに五十音
のえ段の語（音節）の後に「イ」が並ぶ読み（これを
「え段の法則」と言う）があるかどうかを判断する。ス
テップＳ５３で。え段の法則があると判断するとステッ
プＳ５４に進む。ステップＳ５４では、読み「イ」を
「エ」に置き換える。ステップＳ５３で。え段の法則が
ないと判断するとステップＳ５４をスキップしてステッ
プＳ５５に進む。

【００４６】ステップＳ５５では、キーワードに五十音
のお段の語（音節）の後に「ウ」が並ぶ読み（これを
「お段の法則」と言う）があるかどうかを判断する。ス
テップＳ５５で。お段の法則があると判断するとステッ
プＳ５６に進む。ステップＳ５６では、読み「ウ」を
「オ」に置き換える。ステップＳ５５でお段の法則がな
いと判断するとステップＳ５６をスキップしてステップ
Ｓ５７に進む。ステップＳ５７では、すべての認識語に
ついて処理が終了したかを判断し、まだ終了していない
場合はステップＳ５１に戻り処理を繰り返す。終了して
いる場合は処理を終了する。

【００４７】なお、図１０の処理において、正規の読み
の認識語はそのままにして、え段の法則あるいはお段の
法則によって置き換えられた読みの認識語を新たな認識
語として追加するようにしてもよい。また、「エ」ある
いは「オ」に置き換える代わりに、長音符号「ー」に置
き換えるようにしてもよい。さらには、「エ」または
「オ」に置き換えた認識語と、長音符号「ー」に置き換
えた認識語の両方を追加するようにしてもよい。

【００４８】上記は、読みの指定をひらがなやカタカナ
で行う音声認識システムの場合である。しかし、ローマ
字で指定する場合も、同様に考えればよい。例えば、
「厚生病院」は、ローマ字では正規の認識語として「ko
useibyouin」と指定される。「o」に続く「u」を「o」
に置き換え「e」に続く「i」を「e」に置き換えると「k
ooseebyooin」という新たな認識語が生成される。

【００４９】以上のようにして、正規の読みのキーワー
ドにおいて母音が「エイ」と続く場合は「エエ」あるい
は「エー」と置き換え、母音が「オウ」と続く場合は
「オオ」あるいは「オー」と置き換える読みとした。こ
れにより、実際の発話に近い認識語が準備されるため、
音声認識に成功する確率が高くなる。

【００５０】なお、第３の実施の形態では、お段の法
則、え段の法則を認識語全体に適用せず、所定のキーワ
ードにのみ適用している。この理由について説明する。
例えば、地名「若江岩田」に「若江岩田中央病院」とい
う病院名があったとする。この場合の正規の読みは「ワ
カエイワタチュウオウビョウイン」である。この認識語
全体にお段の法則、え段の法則を適用して読み替える
と、「ワカエエワタチュウオオビョオイン」となる。長
音符号を適用した場合は「ワカエーワタチュウオービョ
ーイン」となる。しかし、「若江岩田」の部分は「ワカ
エエワタ」あるいは「ワカエーワタ」と発音することは
ない。

【００５１】このように、認識語全体にお段の法則、え
段の法則を適用すると、本来置き換えるべきでない読み
まで置き換えてしまい、逆に精度の低い音声認識になっ
てしまう。第３の実施の形態では、このような問題を避
けるために、所定のキーワードがある場合にそのキーワ
ードのみ置き換えるようにしたものである。これによ
り、お段の法則、え段の法則を適用して自動的に読みの
置き換え語（言い替え語、新たな認識語）が生成できる
とともに、置き換えたくない読みは確実に置き換えない
ようにすることができる。その結果、精度の高い置き換
え語を自動で生成することができる。

【００５２】なお、第３の実施の形態では、第２の実施
の形態と同様に、該当ジャンルの音声認識をする時点で
新たな認識辞書を生成するようにした例で説明した。し
かし、第１の実施の形態と同様に、お段の法則、え段の
法則を適用した新たな認識辞書をパーソナルコンピュー
タ３０３（図５）で予め生成するようにしてもよい。こ
れにより、第１の実施の形態と同様な効果を奏すると同
時に、本来置き換えるべきでない読みの置き換えを回避
することも可能となる。

【００５３】−第４の実施の形態− 第１の実施の形態では、所定のキーワードについて、実
際の発音により近い読みに置き換えた新たな認識語を生
成する例を示した。第４の実施の形態では、所定のキー
ワードの読みをいくつか準備し、キーワードのそれぞれ
の読みを含む新たな認識語を認識辞書に追加するように
したものである。第４の実施の形態の車載用ナビゲーシ
ョンシステムの構成は、第１の実施の形態の図１の構成
と同様であるのでその説明を省略する。

【００５４】第４の実施の形態の認識辞書について説明
する。図１１は、ジャンルが郵便局、役場、インターラ
ンプに関する認識語を格納した従来の認識辞書を示す図
である。図１２は、第４の実施の形態において、本発明
を適用した図１１に対応する認識辞書を示す図である。

【００５５】図１１（ａ）のジャンルが「郵便局」のと
きに、施設名称「座間郵便局」を指定する場合について
説明する。ナビゲーションシステムより「ジャンル名を
どうぞ」と促されて「ゆうびんきょく」と発話する。そ
の後「施設名称をどうぞ」と促された場合に、「ざまゆ
うびんきょく」と発話すべきか「ざま」とだけ発話すべ
きか迷うときがある。図１２（ａ）の認識辞書には、
「座間郵便局」に対して「ざまゆうびんきょく」と「ざ
ま」の２つの読みの認識語が格納されている。従って
「ざまゆうびんきょく」と発話しても「ざま」とだけ発
話してもどちらも音声認識に成功する。

【００５６】次に、図１１（ｂ）のジャンルが「役場」
のときに、施設名称「愛川町役場」を指定する場合につ
いて説明する。ナビゲーションシステムより「施設名称
をどうぞ」と促されたときに、上記と同様に「あいかわ
まちやくば」と発話すべきか、「あいかわまち」とだけ
発話すべきかに加えて、「あいかわちょうやくば」と発
話すべきか迷うことがある。これは、地方によって
「町」という漢字を「まち」と呼ぶ場合もあれば「ちょ
う」と呼ぶ場合もあるからである。図１２（ｂ）の認識
辞書には、「あいかわまちやくば」「あいかわまち」
「あいかわちょうやくば」の３つの認識語が準備されて
いるので、どのように発話されても音声認識に成功す
る。「村役場」の場合も同様である。

【００５７】すなわち、図１２は、認識語の最後の言葉
の読みが所定のキーワードである場合に、所定のキーワ
ードの複数の読みで置き換えられた新たな認識語が追加
されたものである。図１３は、図１２におけるキーワー
ドと置き換えられる読みを整理した図である。例えば、
認識語が「あいかわまちやくば」という読みの場合に、
その読みの中に図１３のキーワードがあるかどうかを検
索し、「まちやくば」というキーワードを見つけると、
そのキーワードの置き換え読みに置き換えた認識語、す
なわち「あいかわまち」「あいかわちょうやくば」を追
加したものである。

【００５８】なお、置き換える読みには、図１３の「ゆ
うびんきょく」や「いんたーちぇんじ」等にも示す通
り、そのキーワードの読みを省略する場合も含む。ま
た、「いんたーちぇんじ」を「あいしー」とか「いんた
ー」とかの読みに置き換えるのは、「インターチェン
ジ」の別称として通常使用されるものであるからであ
る。「さーびすえりあ」を「ぱーきんぐ」と置き換える
のも別称と言えるからである。「ぱーきんぐえりあ」を
「ぱーきんぐ」とするのは略称と言える。また、図１１
に示される各ジャンルの各施設名称は、地理的名称と施
設名からなる名称である。従って、キーワードはそのジ
ャンルの施設名とすることも可能である。

【００５９】図１４は、図１１の従来から使用されてい
る正規の読みの認識語が格納された認識辞書から図１２
の認識辞書を生成する制御のフローチャートを示す。図
１２の認識辞書の生成は、図５と同様にパーソナルコン
ピュータ３０３で実行され、生成された認識辞書はＲＯ
Ｍに書き込まれて図１の音声ユニット２００のＲＯＭ２
１０に搭載される。

【００６０】ステップＳ６１では、図１１の正規の読み
の認識語が格納された認識辞書ファイルから一つの認識
語を読み込む。該当ジャンルで良く出てくる言葉（キー
ワード）の置き換え読みは、図１３に示すとおり、前も
って調査され予めパーソナルコンピュータ３０３に格納
されている。ステップＳ６２では、読み込んだ認識語に
所定のキーワードが含まれているかどうかを判断し、所
定のキーワードが含まれていると判断するとステップＳ
６３に進む。ステップＳ６３では、認識語のそのキーワ
ードに該当する読みに置き換えた新たな認識語を生成す
る。一方、ステップＳ６２でいずれのキーワードも含ま
れていないと判断するとステップＳ６３をスキップして
ステップＳ６４に進む。ステップＳ６４では、すべての
認識語について処理が終了したかを判断し、まだ終了し
ていない場合はステップＳ６１に戻り処理を繰り返す。
終了している場合は処理を終了する。

【００６１】第４の実施の形態では、図１２の認識辞書
の生成は、図５のパーソナルコンピュータ３０３で予め
生成し、生成された認識辞書を図１の音声ユニット２０
０のＲＯＭ２１０に搭載する例を示した。しかし、第２
の実施の形態と同様に、音声ユニットにおいて、該当認
識辞書を使用する時点でその該当認識辞書をＲＡＭ２０
９上に生成するようにしてもよい。この場合は、図１１
の認識辞書と図１３のキーワードの置き換えデータのみ
をＲＯＭ２１０に持てばよいので、ＲＯＭ２１０の容量
が小さくなり、コスト低減につながる。

【００６２】以上の第４の実施の形態では、認識語が予
め定めたあるキーワードを含む場合、そのキーワードの
読みのバリエーションが考慮された認識語が追加される
ので、音声認識に確実に成功することができる。

【００６３】なお、第４の実施の形態の内容と第１〜第
３の実施の形態の内容を組み合わせることも可能であ
る。例えば、第１の実施の形態と第４の実施の形態を組
み合わせる場合を考えてみる。図１１の「地理的名称」
＋「施設名」からなる言葉のうち、地理的名称を第１の
実施の形態の対象キーワードとし、施設名を第４の実施
の形態の対象キーワードとする。例えば、第１の実施の
形態の対象キーワードに「だんごうざか→だんごーざ
か」を追加する。その結果、図１１（ｃ）の「談合坂Ｓ
Ａ」は、正規の読みは「だんごうざかさーびすえりあ」
であるが、新たに「だんごーざかさーびすえりあ」「だ
んごーざかえすえー」「だんごーざかぱーきんぐ」「だ
んごーざか」の認識語が生成される。

【００６４】−第５の実施の形態− 第４の実施の形態では、例えば図１２（ａ）に示すよう
に、認識語の中に所定のキーワードがある場合、それを
削除した認識語を追加する例を説明した。第５の実施の
形態では、認識語にないキーワード（ジャンル名等）を
追加するものである。例えば、ジャンルが「駅」の場
合、駅の認識辞書にある認識語には通常最後に「えき」
という読みがついているものである。しかし、その「え
き」が認識語に含まれていない場合は、「えき」を追加
した認識語を追加する。第５の実施の形態の車載用ナビ
ゲーションシステムの構成は、第１の実施の形態の図１
の構成と同様であるのでその説明を省略する。

【００６５】例えば、ジャンルが「駅」の認識辞書に、
「とうきょう」という認識語があった場合、新たに「と
うきょうえき」という認識語を追加する。具体的には、
ＲＯＭ２１０に、あるジャンルに対応して付加すべきキ
ーワードデータを有し、認識語を検索しそのキーワード
が含まれていない場合は、そのキーワードを含む認識語
を追加する。このキーワードは複数であってもよい。キ
ーワードが複数の場合は、含まれていないキーワードそ
れぞれを付加した認識語を追加するようにすればよい。
このようにすることによって、ジャンルが「駅」の場合
に「とうきょう」と発話しても「とうきょうえき」と発
話しても音声認識に成功することになる。

【００６６】上記第１〜５の実施の形態では、車載用ナ
ビゲーションシステムについて説明をしたがこの内容に
限定する必要はない。車載用に限らず携帯用のナビゲー
ション装置にも適用できる。さらには、ナビゲーション
装置に限らず音声認識を行うすべての装置に適用でき
る。

【００６７】上記第１〜５の実施の形態では、ナビゲー
ション装置１００と音声ユニット２００を分離した構成
で説明をしたが、この内容に限定する必要はない。音声
ユニットを内部に含んだ一つのナビゲーション装置とし
て構成してもよい。また、上記制御プログラムや認識辞
書などをＣＤ−ＲＯＭなどの記録媒体で提供することも
可能である。さらには、制御プログラムや認識辞書など
をＣＤ−ＲＯＭなどの記録媒体で提供し、パーソナルコ
ンピュータやワークステーションなどのコンピュータ上
で上記システムを実現することも可能である。また、制
御プログラムや認識辞書などをインターネットに代表さ
れる電気通信回線（伝送媒体）を通じて提供することも
可能である。

【００６８】上記第１〜５の実施の形態では、音声ユニ
ット２００で施設名の検索に成功した場合、その内容を
ナビゲーション装置１００に知らせ、ナビゲーション装
置１００では道案内等のナビゲーション処理の一つとし
てその施設近辺の地図を表示する例で説明をしたが、こ
の内容に限定する必要はない。ナビゲーション装置１０
０では、音声ユニット２００で検索に成功した結果に基
づき、経路探索や経路誘導その他の各種のナビゲーショ
ン処理が考えられる。

【００６９】

【発明の効果】本発明は、以上説明したように構成して
いるので、次のような効果を奏する。請求項１〜１０の
発明は、音声認識を行うときに、例えば、該当ジャンル
でよく使用されるキーワードを正規の読みとは異なる読
みに置き換えた認識語を格納した認識辞書を使用するこ
とができるので、音声認識に確実に成功することができ
る。特に、従来から使用していた認識辞書や市販の認識
辞書を使用して、キーワード部分の読みのみを置き換え
た認識辞書を作成することが可能となるので、音声認識
のヒット率の向上した新たな認識辞書が容易かつ短時間
かつ低コストで作成ができ、音声認識率の向上した装置
の低コスト化が実現できる。特に、請求項２の発明は、
置き換える読みを通常の発音の読みとしているので、音
声認識率がより向上する。請求項３〜５の発明は、読み
の置き換えを一定の法則に基づいて自動で行うようにし
ているので、置き換える読みのデータを予め格納してお
く必要がなく、メモリ容量の削減につながる。また、予
め定めた所定の言葉（キーワード）の読みのみを置き換
えているので、置き換えるべきでない読みは確実に置き
換えないようにできる。すなわち、一定の法則に基づい
て自動で置き換えるために生じる本来置き換えたくない
読みを置き換えてしまうと言う問題が、確実に回避でき
る。請求項６〜９の発明は、予め定めた所定の言葉（キ
ーワード）の読みを、正規の読みに加えて、その言葉の
漢字の異なる読みや、別称、略称に置き換えたものも共
に認識語として格納しているので、ユーザがいろいろな
バリエーションで発話しても確実に音声認識に成功す
る。請求項１０の発明は、音声認識処理を実際に行う時
点で第１の認識語を生成しているので、例えば、正規の
読みの認識語や所定の言葉（キーワード）のデータのみ
をＲＯＭに予め格納しておき、それらの内容に基づいて
新たな認識語をＲＡＭ上に展開することができる。これ
により、ＲＯＭの記憶容量を削減できる。これに反し、
ＲＡＭの記憶容量は大きくなるが、作業エリアとして随
時上書きされて使用されるので問題にはならない。請求
項１１の発明は、所定の言葉（キーワード）を付加して
発話した場合にも確実に音声認識に成功することができ
る。請求項１２の発明は、音声認識ナビゲーション装置
において、上述の効果を奏することができる。請求項１
３の発明は、従来から使用していた認識辞書や市販の認
識辞書を使用して、キーワード部分の読みのみを置き換
えた認識辞書を作成することができるので、音声認識の
ヒット率の向上した新たな認識辞書が容易かつ短時間か
つ低コストで作成ができる。

【図面の簡単な説明】

【図１】本発明の車載用ナビゲーションシステムの構成
を示す図である。

【図２】第１の実施の形態における正規の読みの認識辞
書を示す図である。

【図３】第１の実施の形態における新たな認識辞書を示
す図である。

【図４】第１の実施の形態におけるキーワードと置き換
えの読みの一覧を示す図である。

【図５】第１の実施の形態における正規の読みの認識辞
書から新たな認識辞書を生成する構成を示す図である。

【図６】第１の実施の形態における正規の読みの認識辞
書から新たな認識辞書を生成する処理のフローチャート
を示す図である。

【図７】第１の実施の形態における音声認識を行う制御
のフローチャートを示す図である。

【図８】第２の実施の形態における音声認識を行う制御
のフローチャートを示す図である。

【図９】第３の実施の形態における音声認識を行う制御
のフローチャートを示す図である。

【図１０】第３の実施の形態における正規の読みの認識
辞書から新たな認識辞書を生成する処理のフローチャー
トを示す図である。

【図１１】第４の実施の形態における正規の読みの認識
辞書を示す図である。

【図１２】第４の実施の形態における新たな認識辞書を
示す図である。

【図１３】第４の実施の形態におけるキーワードと置き
換えの読みの一覧を示す図である。

【図１４】第４の実施の形態における正規の読みの認識
辞書から新たな認識辞書を生成する処理のフローチャー
トを示す図である。

【符号の説明】

１００ナビゲーション装置１０１ＧＰＳ受信機１０２ジャイロセンサ１０３車速センサ１０４ドライバ１０５ＣＰＵ１０６ＲＡＭ１０７ＲＯＭ１０８ＣＤ−ＲＯＭドライブ１０９表示装置１１０バスライン２００音声ユニット２０１マイク２０２Ａ／Ｄ変換部２０３Ｄ／Ａ変換部２０４アンプ２０５スピーカ２０６発話スイッチ２０７ドライバ２０８ＣＰＵ２０９ＲＡＭ２１０ＲＯＭ２１１通信ライン２１２バスライン３０１正規の読みの認識辞書３０２新たな認識辞書３０３パーソナルコンピュータ３０４キーワード

フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 15/28 Ｇ１０Ｌ 3/00 ５６１Ｈ

Claims

【特許請求の範囲】

【請求項１】音声入力手段と、音声認識対象の言葉に対応しその言葉の読みを表す認識
語を格納する格納手段と、前記音声入力手段により得られた音データと前記認識語
に基づき生成された音声認識用データとを比較して音声
認識処理を行う音声認識処理手段とを備えた音声認識装
置において、前記格納手段には、一つの音声認識対象の言葉の一部に
予め定めた所定の言葉を含む場合、その所定の言葉の読
みをその所定の言葉の正規の読みとは異なる読みとした
第１の認識語が格納されていることを特徴とする音声認
識装置。
【請求項２】請求項１記載の音声認識装置において、前記所定の言葉は、複数の音声認識対象の言葉の一部に
共通に含まれる言葉であり、前記所定の言葉の正規の読みと異なる読みは、その言葉
の通常発音される読みであることを特徴とする音声認識
装置。
【請求項３】請求項１または２記載の音声認識装置にお
いて、前記所定の言葉の正規の読みと異なる読みは、前記所定
の言葉の正規の読みにおいてのみ五十音のえ段の音節の
後に「い」の音節が並ぶ場合、この「い」の音節を
「え」の音節に置き換えた読みとしたことを特徴とする
音声認識装置。
【請求項４】請求項１または２記載の音声認識装置にお
いて、前記所定の言葉の正規の読みと異なる読みは、前記所定
の言葉の正規の読みにおいてのみ五十音のお段の音節の
後に「う」の音節が並ぶ場合、この「う」の音節を
「お」の音節に置き換えた読みとしたことを特徴とする
音声認識装置。
【請求項５】請求項３または４記載の音声認識装置にお
いて、前記認識語は長音符号「ー」を含む仮名により指定さ
れ、前記所定の言葉の正規の読みとは異なる読みにおいて、
前記置き換える音節を長音符号「ー」により置き換える
ことを特徴とする音声認識装置。
【請求項６】請求項１記載の音声認識装置において、前記格納手段には、前記一つの音声認識対象の言葉に対
して、前記所定の言葉の正規の読みを含む正規の認識語
と前記第１の認識語とが共に格納されていることを特徴
とする音声認識装置。
【請求項７】請求項６記載の音声認識装置において、前記第１の認識語において、前記所定の言葉の正規の読
みと異なる読みは、その言葉の読みをなしとするもので
あることを特徴とする音声認識装置。
【請求項８】請求項６記載の音声認識装置において、前記第１の認識語において、前記所定の言葉の正規の読
みと異なる読みは、その言葉が漢字で表されるときその
漢字の異なる読みであることを特徴とする音声認識装
置。
【請求項９】請求項６記載の音声認識装置において、前記第１の認識語において、前記所定の言葉の正規の読
みと異なる読みは、その言葉が有する別称あるいは略称
であることを特徴とする音声認識装置。
【請求項１０】請求項１から９のいずれか１項記載の音
声認識装置において、前記音声認識処理手段が、前記所定の言葉を一部に含む
前記一つの音声認識対象の言葉に関連して音声認識処理
を行うときに、前記第１の認識語を生成して前記格納手
段に格納ずる生成手段をさらに備えることを特徴とする
音声認識装置。
【請求項１１】音声入力手段と、音声認識対象の言葉に対応しその言葉の読みを表す認識
語を格納する格納手段と、前記音声入力手段により得られた音データと前記認識語
に基づき生成された音声認識用データとを比較して音声
認識処理を行う音声認識処理手段とを備えた音声認識装
置において、前記格納手段には、前記音声認識対象の言葉に予め定め
た所定の言葉が含まれない場合、前記所定の言葉の読み
を付加した認識語が格納されていることを特徴とする音
声認識装置。
【請求項１２】請求項１から１１のいずれか１項記載の
音声認識装置と、地図情報を格納する地図情報格納手段と、少なくとも前記音声認識装置の認識結果と前記地図情報
とに基づき、道案内のための制御を行う制御手段とを備
えることを特徴とする音声認識ナビゲーション装置。
【請求項１３】音声認識処理における、音声入力手段に
より得られた音データと比較する音声認識用データを生
成するための音声認識対象の言葉の読みを表した認識語
を生成する認識語生成方法であって、一つの音声認識対象の言葉の一部に予め定めた所定の言
葉を含む場合、その所定の言葉の読みをその所定の言葉
の正規の読みとは異なる読みとした認識語を生成するこ
とを特徴とする認識語生成方法。
【請求項１４】音声認識処理における、音声入力手段に
より得られた音データと比較する音声認識用データを生
成するための音声認識対象の言葉の読みを表した認識語
を生成する認識語生成プログラムであって、一つの音声
認識対象の言葉の一部に予め定めた所定の言葉を含む場
合、その所定の言葉の読みをその所定の言葉の正規の読
みとは異なる読みとした認識語を生成する認識語生成プ
ログラム記録したことを特徴とする記録媒体。
【請求項１５】音声認識処理における、音声入力手段に
より得られた音データと比較する音声認識用データを生
成するための音声認識対象の言葉の読みを表した認識語
に関するデータであって、一つの音声認識対象の言葉の
一部に予め定めた所定の言葉を含む場合、その所定の言
葉の読みをその所定の言葉の正規の読みとは異なる読み
とした認識語に関するデータを記録したことを特徴とす
る記録媒体。
【請求項１６】音声認識処理における、音声入力手段に
より得られた音データと比較する音声認識用データを生
成するための音声認識対象の言葉の読みを表した認識語
を生成する認識語生成プログラムであって、一つの音声
認識対象の言葉の一部に予め定めた所定の言葉を含む場
合、その所定の言葉の読みをその所定の言葉の正規の読
みとは異なる読みとした認識語を生成する認識語生成プ
ログラム伝送することを特徴とする伝送媒体。
【請求項１７】音声認識処理における、音声入力手段に
より得られた音データと比較する音声認識用データを生
成するための音声認識対象の言葉の読みを表した認識語
に関するデータであって、一つの音声認識対象の言葉の
一部に予め定めた所定の言葉を含む場合、その所定の言
葉の読みをその所定の言葉の正規の読みとは異なる読み
とした認識語に関するデータを伝送することを特徴とす
る伝送媒体。