JP2001242887A - 音声認識装置および音声認識ナビゲーション装置 - Google Patents

音声認識装置および音声認識ナビゲーション装置

Info

Publication number
JP2001242887A
JP2001242887A JP2000053257A JP2000053257A JP2001242887A JP 2001242887 A JP2001242887 A JP 2001242887A JP 2000053257 A JP2000053257 A JP 2000053257A JP 2000053257 A JP2000053257 A JP 2000053257A JP 2001242887 A JP2001242887 A JP 2001242887A
Authority
JP
Japan
Prior art keywords
word
recognition
reading
voice
predetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000053257A
Other languages
English (en)
Other versions
JP4550207B2 (ja
Inventor
Zenichi Hirayama
善一 平山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Faurecia Clarion Electronics Co Ltd
Original Assignee
Xanavi Informatics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xanavi Informatics Corp filed Critical Xanavi Informatics Corp
Priority to JP2000053257A priority Critical patent/JP4550207B2/ja
Priority to EP00307745A priority patent/EP1083545A3/en
Priority to US09/659,679 priority patent/US6708150B1/en
Publication of JP2001242887A publication Critical patent/JP2001242887A/ja
Application granted granted Critical
Publication of JP4550207B2 publication Critical patent/JP4550207B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Traffic Control Systems (AREA)
  • Navigation (AREA)

Abstract

(57)【要約】 【課題】 ユーザが同じ意味内容の言葉を発話した場合
に、その言葉の一部の読みが微妙に異なったり、あるい
は、他の読みであったりしても、確実に音声認識を成功
させることが可能な音声認識装置等を提供すること。 【解決手段】正規の読みの認識辞書301の認識語に所
定のキーワード304が含まれる場合、そのキーワード
304の読みをより実際の発音に近い読みとした認識語
を生成して新たな認識辞書302を作成する。マイクか
ら得られた音データとこの新たに作成された認識辞書の
認識語に基づき生成された音声認識用データとを比較し
て音声認識処理を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識および音
声認識ナビゲーション装置に関する。
【0002】
【従来の技術】自動車の現在地を表示し、地図の広域・
詳細表示を行い、目的地までの進行方向および残距離を
誘導する車載用ナビゲーション装置(以下、ナビゲーシ
ョン装置と言う)が知られている。また、ナビゲーショ
ン装置の一機能として、運転中のドライバからの操作指
示を音声で行い、ドライバの安全性を高めるいわゆる音
声認識ナビゲーション装置も知られている(例えば特開
平09−292255号公報)。
【0003】音声認識ナビゲーション装置で使用する音
声認識ソフトは、一般的に、発話スイッチ等を押し、そ
の後、ユーザが発話した音データと認識辞書内の認識語
との相関値を算出する。その結果、相関値が最大になっ
た認識語を認識結果と判断する。
【0004】
【発明が解決しようとする課題】しかし、ユーザが同じ
意味内容の言葉を発話しても、その言葉の一部の読みが
微妙に異なったり、あるいは、他の読みであったりする
場合には、誤認識とされると言う問題があった。
【0005】本発明の目的は、ユーザが同じ意味内容の
言葉を発話した場合に、その言葉の一部の読みが微妙に
異なったり、あるいは、他の読みであったりしても、確
実に音声認識を成功させることが可能な音声認識装置、
音声認識ナビゲーション装置、およびそのための認識語
生成方法を提供することにある。また、生成されたデー
タあるいは生成のためのプログラムを記録した記録媒体
および伝送する伝送媒体を提供することにある。
【0006】
【課題を解決するための手段】実施の形態を示す図1を
使用して、括弧内にその対応する要素の符号をつけて本
発明を以下に説明する。上記目的を達成するために、請
求項1の発明は、音声入力手段(201)と、音声認識
対象の言葉に対応しその言葉の読みを表す認識語を格納
する格納手段(209、210)と、音声入力手段(2
01)により得られた音データと認識語に基づき生成さ
れた音声認識用データとを比較して音声認識処理を行う
音声認識処理手段(208)とを備えた音声認識装置に
適用され、格納手段(209、210)には、一つの音
声認識対象の言葉の一部に予め定めた所定の言葉を含む
場合、その所定の言葉の読みをその所定の言葉の正規の
読みとは異なる読みとした第1の認識語が格納されてい
るようにしたものである。請求項2の発明は、請求項1
記載の音声認識装置において、所定の言葉は複数の音声
認識対象の言葉の一部に共通に含まれる言葉であり、所
定の言葉の正規の読みと異なる読みを、その言葉の通常
発音される読みであるようにしたものである。請求項3
の発明は、請求項1または2記載の音声認識装置におい
て、所定の言葉の正規の読みと異なる読みを、所定の言
葉の正規の読みにおいてのみ五十音のえ段の音節の後に
「い」の音節が並ぶ場合、この「い」の音節を「え」の
音節に置き換えた読みとしたものである。請求項4の発
明は、請求項1または2記載の音声認識装置において、
所定の言葉の正規の読みと異なる読みを、所定の言葉の
正規の読みにおいてのみ五十音のお段の音節の後に
「う」の音節が並ぶ場合、この「う」の音節を「お」の
音節に置き換えた読みとしたものである。請求項5の発
明は、請求項3または4記載の音声認識装置において、
認識語は長音符号「ー」を含む仮名により指定されるも
のであり、所定の言葉の正規の読みとは異なる読みにお
いて、置き換える音節を長音符号「ー」により置き換え
るようにしたものである。請求項6の発明は、請求項1
記載の音声認識装置において、格納手段(209、21
0)に、一つの音声認識対象の言葉に対して、所定の言
葉の正規の読みを含む正規の認識語と第1の認識語とが
共に格納されているようにしたものである。請求項7の
発明は、請求項6記載の音声認識装置において、第1の
認識語において、所定の言葉の正規の読みと異なる読み
を、その言葉の読みをなしとしたものである。請求項8
の発明は、請求項6記載の音声認識装置において、第1
の認識語において、所定の言葉の正規の読みと異なる読
みを、その言葉が漢字で表されるときその漢字の異なる
読みとしたものである。請求項9の発明は、請求項6記
載の音声認識装置において、第1の認識語において、所
定の言葉の正規の読みと異なる読みを、その言葉が有す
る別称あるいは略称としたものである。請求項10の発
明は、請求項1から9のいずれか1項記載の音声認識装
置において、音声認識処理手段(208)が、所定の言
葉を一部に含む一つの音声認識対象の言葉に関連して音
声認識処理を行うときに、第1の認識語を生成して格納
手段(209)に格納ずる生成手段をさらに備えるよう
にしたものである。請求項11の発明は、音声入力手段
(201)と、音声認識対象の言葉に対応しその言葉の
読みを表す認識語を格納する格納手段(209、21
0)と、音声入力手段(201)により得られた音デー
タと認識語に基づき生成された音声認識用データとを比
較して音声認識処理を行う音声認識処理手段(208)
とを備えた音声認識装置に適用され、格納手段(20
9、210)には、音声認識対象の言葉に予め定めた所
定の言葉が含まれない場合、所定の言葉の読みを付加し
た認識語が格納されているようにしたものである。請求
項12の音声認識ナビゲーション装置は、請求項1から
11のいずれか1項記載の音声認識装置(200)と、
地図情報を格納する地図情報格納手段(108)と、少
なくとも音声認識装置(200)の認識結果と地図情報
とに基づき、道案内のための制御を行う制御手段(10
5)とを備えるようにしたものである。請求項13の発
明は、音声認識処理における、音声入力手段(201)
により得られた音データと比較する音声認識用データを
生成するための音声認識対象の言葉の読みを表した認識
語を生成する認識語生成方法に適用され、一つの音声認
識対象の言葉の一部に予め定めた所定の言葉を含む場
合、その所定の言葉の読みをその所定の言葉の正規の読
みとは異なる読みとした認識語を生成するようにしたも
のである。請求項14の記録媒体は、音声認識処理にお
ける、音声入力手段(201)により得られた音データ
と比較する音声認識用データを生成するための音声認識
対象の言葉の読みを表した認識語を生成する認識語生成
プログラムであって、一つの音声認識対象の言葉の一部
に予め定めた所定の言葉を含む場合、その所定の言葉の
読みをその所定の言葉の正規の読みとは異なる読みとし
た認識語を生成する認識語生成プログラムを記録したも
のである。請求項15の記録媒体は、音声認識処理にお
ける、音声入力手段(201)により得られた音データ
と比較する音声認識用データを生成するための音声認識
対象の言葉の読みを表した認識語に関するデータであっ
て、一つの音声認識対象の言葉の一部に予め定めた所定
の言葉を含む場合、その所定の言葉の読みをその所定の
言葉の正規の読みとは異なる読みとした認識語に関する
データを記録したものである。請求項16の伝送媒体
は、音声認識処理における、音声入力手段(201)に
より得られた音データと比較する音声認識用データを生
成するための音声認識対象の言葉の読みを表した認識語
を生成する認識語生成プログラムであって、一つの音声
認識対象の言葉の一部に予め定めた所定の言葉を含む場
合、その所定の言葉の読みをその所定の言葉の正規の読
みとは異なる読みとした認識語を生成する認識語生成プ
ログラム伝送するものである。請求項17の伝送媒体
は、音声認識処理における、音声入力手段(201)に
より得られた音データと比較する音声認識用データを生
成するための音声認識対象の言葉の読みを表した認識語
に関するデータであって、一つの音声認識対象の言葉の
一部に予め定めた所定の言葉を含む場合、その所定の言
葉の読みをその所定の言葉の正規の読みとは異なる読み
とした認識語に関するデータを伝送するものである。
【0007】なお、上記課題を解決するための手段の項
では、分かりやすく説明するため実施の形態の図と対応
づけたが、これにより本発明が実施の形態に限定される
ものではない。
【0008】
【発明の実施の形態】−第1の実施の形態− 図1は、本発明の車載用ナビゲーションシステムの第1
の実施の形態の構成を示す図である。車載用ナビゲーシ
ョンシステムは、ナビゲーション装置100および音声
ユニット200により構成される。第1の実施の形態の
ナビゲーションシステムは、認識語の一部に所定の言葉
が含まれる場合に、その所定の言葉の読みを最も音声認
識に成功する読みに置き換えるようにし、確実に音声認
識に成功させるようにしたものである。
【0009】ナビゲーション装置100は、GPS受信
機101と、ジャイロセンサ102と、車速センサ10
3と、ドライバ104と、CPU105と、RAM10
6と、ROM107と、CD−ROMドライブ108
と、表示装置109と、バスライン110等から構成さ
れる。
【0010】音声ユニット200は、マイク201と、
A/D変換部202と、D/A変換部203と、アンプ
204と、スピーカ205と、発話スイッチ206と、
ドライバ207と、CPU208と、RAM209と、
ROM210と、バスライン212等から構成される。
ナビゲーション装置100と音声ユニット200は、通
信ライン211を介して接続される。
【0011】GPS受信機101は、GPS(Global P
ositioning System)衛星からの信号を受信し、自車の
絶対位置、絶対方位を検出する。ジャイロセンサ102
は、例えば振動ジャイロで構成され、車のヨー角速度を
検出する。車速センサ103は、車が所定距離走行毎に
出すパルス数に基づき、車の移動距離を検出する。ジャ
イロセンサ102と車速センサ103により、車の2次
元的な移動が検出できる。ドライバ104は、GPS受
信機101、ジャイロセンサ102、車速センサ103
からの信号をバスライン110に接続するためのドライ
バである。すなわち、それぞれのセンサ出力をCPU1
05が読むことができるデータに変換する。
【0012】CPU105は、ROM107に格納され
たプログラムを実行することによりナビゲーション装置
100全体を制御する。RAM106は揮発性メモリで
あり、ワークデータ領域を確保する。ROM107は、
不揮発性メモリで、上述した制御プログラム等を格納す
る。CD−ROMドライブ108は、CD−ROMを記
録媒体とし、ベクトル道路データ等の道路地図情報を格
納する。CD−ROMドライブは、DVDを記録媒体と
するDVDドライブやその他の記録装置であってもよ
い。表示装置109は、車の現在地および周辺の道路地
図、目的地までのルート情報、次の誘導交差点情報等を
表示する。例えば、液晶表示装置あるいはCRTで構成
される。バスライン110は、ナビゲーション装置10
0のCPU105等の構成要素をバス接続するラインで
ある。
【0013】音声ユニット200は、音声認識、音声合
成等、音声に関する処理を行う。発話スイッチ206
は、ユーザが押すことにより音声認識の開始を指示する
スイッチである。発話スイッチ206が押された後所定
時間、音データの入力がマイク201を介して行われ
る。入力された音は、A/D変換部202およびドライ
バ207により、デジタル音声データに変換される。
【0014】音声ユニット200のROM210には、
音声認識ソフト(プログラム)、音声合成ソフト(プロ
グラム)、音声認識辞書(以下、単に認識辞書と言
う)、音声合成辞書(以下、単に合成辞書と言う)等が
格納されている。音声認識ソフトは、デジタル音声デー
タと、認識辞書内の全認識語との相関値を算出し、最も
相関値の高い認識語を認識結果として求める。音声合成
ソフトは、指定した文章をスピーカから発声させるため
のデータを算出する。両ソフトウェアについては、公知
な内容であるので詳細な説明は省略する。
【0015】認識辞書は、音声認識の対象となる言葉
(語)を複数集めたひとかたまりのデータである。具体
的には、ひらがなやカタカナやローマ字(実際にはその
文字コード)で指定されたそれぞれの言葉の読みデータ
が格納されている。認識辞書に格納された言葉を認識語
という。各認識語には、読みデータの他その言葉の表示
文字データや、施設名であれば座標情報などの情報が付
帯している。認識辞書の詳細については後述する。合成
辞書は、音声合成のために必要な音源データ等が格納さ
れている。
【0016】発話終了時、CPU208は、RAM20
9、ROM210等を使い音声認識ソフトを実行し、デ
ジタル音声データの音声認識を行う。音声認識ソフト
は、認識辞書内の認識語の読みデータ(ひらがなやカタ
カナやローマ字で指定されたデータ)を参照しながらそ
の言葉の音声認識用データを生成し、デジタル音声デー
タとの相関値を算出する。すべての認識語についてデジ
タル音声データとの相関値を算出し、相関値が最も高く
かつ所定の値以上の認識語を決定して音声認識を完了す
る。その認識語にリンクしたエコーバック語を音声合成
ソフトを使い、発声用のデータに変換する。その後、D
/A変換部203、アンプ204、スピーカ205を用
い、認識結果をエコーバック出力させる。
【0017】もし、算出したどの相関値も所定の値以下
である場合は、音声認識できなかったとしてナビの操作
を行わないようにする。具体的には、「プップー」等の
認識失敗を意味するビープ音を鳴らすことや、「認識で
きません」と応答(エコーバック)させる。バスライン
212は、音声ユニット200のバスラインである。
【0018】次に、認識辞書について詳細に説明する。
図2は、8件の病院名に関する認識語を格納した従来の
病院名認識辞書を示す図である。認識語は、その施設名
(図2では病院名)に関する読みデータである。図2で
は、「読み」はカタカナで記載されているが、ひらがな
あるいはローマ字であってもよい。認識辞書には指定さ
れた文字に対応する文字コードが格納される。各認識語
には、「表示用文字データ」および「付帯情報」がつい
ている。表示用文字データは、表示装置109等でその
施設名の表示すべき文字コードが格納される。図2の例
では、「表示」の欄に示された施設名の漢字コードが格
納される。付帯情報は、その施設の地図上の座標情報、
次に読み込む認識辞書の番号、施設の諸属性情報等の各
種の情報が格納されている。図2では、代表して座標情
報のみを示している。
【0019】図3は、図2の従来の病院名認識辞書に対
応する本発明を適用した病院名認識辞書を示す図であ
る。図3の「表示」および「付帯情報」の内容は、図2
の「表示」および「付帯情報」の内容と同じであり、
「読み」のみが異なる。例えば「王子総合病院」を例に
説明する。図2では、「王子総合病院」の読みは「オウ
ジソウゴウビョウイン」となっているが、図3では「オ
ウジソーゴービョーイン」となっている。すなわち「ソ
ウゴウビョウイン」が「ソーゴービョーイン」に変更さ
れている。次の「小樽病院国立療養所」の読みは、図2
では「オタルビョウインコクリツリョウヨウショ」であ
るが、図3では「オタルビョウインコクリツリョーヨー
ショ」となっている。すなわち「コクリツリョウヨウシ
ョ」が「コクリツリョーヨーショ」に変更されている。
【0020】上記の「総合病院」の正規の読みは「ソウ
ゴウビョウイン」である。ここで言う正規の読みとは、
辞書などに書かれているその言葉の本来の読みである。
しかし、実際に日常会話などで発音する読みは微妙に異
なり、例えば長音符号「ー」を使用した「ソーゴービョ
ーイン」の方がより実際の発音に近い読みと言える。そ
こで、第1の実施の形態では、そのジャンルで良く出て
くる言葉(キーワード)のより実際の発音に近い読みを
前もって調査しておき、認識辞書の中にそのキーワード
を含む言葉があった場合は、そのキーワードの読みをそ
の実際の発音に近い読みに置き換えた認識語を準備する
ものである。
【0021】図3において置き換えているキーワードを
列記すると図4(a)の通りである。なお、図4(b)
に示すような読みに置き換えてもよい。
【0022】図5は、図2の従来から使用されている正
規の読みの認識語が格納された認識辞書301から図3
の新たな認識辞書302をパーソナルコンピュータ(以
下PCと言う)303により生成する構成を示す図であ
る。認識辞書301はCD−ROM等の記録媒体に格納
され、認識辞書302はハードディスク(不図示)上に
生成される。キーワード304は予め調査されてファイ
ルとしてPC303のハードディスクに格納されてい
る。図6は、PC303で実行される処理のフローチャ
ートを示す。キーワード304はキーボード(不図示)
から入力するようにしてもよい。生成された認識辞書3
02はROMに書き込まれて図1の音声ユニット200
のROM210に搭載される。
【0023】以下、図6の処理について説明する。ステ
ップS1では、図2の正規の読みの認識語が格納された
認識辞書ファイルから一つの認識語を読み込む。該当ジ
ャンルで良く出てくる言葉(キーワード)のより実際の
発音に近い読みは前もって調査され、予めパーソナルコ
ンピュータに格納されている。ステップS2では、読み
込んだ認識語に所定のキーワードが含まれているかどう
か判断し、所定のキーワードが含まれていると判断する
とステップS3に進む。ステップS3では、認識語のそ
のキーワードに該当する読みを前もって調査されたより
実際の発音に近い読みに置き換える。一方、ステップS
2でいずれのキーワードも含まれていないと判断すると
ステップS3をスキップしてステップS4に進む。ステ
ップS4では、すべての認識語について処理が終了した
かを判断し、まだ終了していない場合はステップS1に
戻り処理を繰り返す。終了している場合は処理を終了す
る。
【0024】なお、ステップS3において、正規の読み
の認識語はそのままにして、そのキーワードに該当する
読みを前もって調査されたより実際の発音に近い読みに
置き換えた新たな認識語を追加するようにしてもよい。
これにより、正規の読みの認識語と新たな認識語の双方
を使用して音声認識をすることが可能となる。
【0025】図7は、音声ユニット200において、音
声認識を行う制御のフローチャートを示す図である。制
御プログラムはROM210に格納され、CPU208
がその制御プログラムを実行する。ナビゲーション装置
100および音声ユニット200の電源オンにより本ル
ーチンはスタートする。
【0026】本ルーチンでは、例えば、「施設ジャンル
名」を音声入力し、次に「施設名」を音声入力して該当
施設付近の地図を表示装置109に表示する場合を想定
する。ステップS11では、初期認識辞書を準備する。
初期認識辞書には「病院」「警察署」「郵便局」などの
施設ジャンル名に関する認識語が格納されている。ステ
ップS12では、発話スイッチ206が押されたかどう
かを判断し、押されている場合はステップS13へ進
む。押されていない場合は本ステップを繰り返す。ユー
ザは発話スイッチ206を押した後、一定時間内に施設
ジャンル名、例えば「病院」と発話する。ステップS1
3では、マイク201からの音声信号をデジタル音声デ
ータに変換する。ステップS14では、発話が終了した
かどうかを判断する。発話の終了は、一定時間音声信号
が途切れた場合を発話の終了と判断する。発話が終了し
たと判断した場合はステップS15に進み、発話がまだ
終了していないと判断した場合はステップS13に戻
る。
【0027】ステップS15では、ステップS13で取
得したデジタル音声データとステップS11で準備した
初期認識辞書内の全認識語について相関値を算出し、ス
テップS16に進む。ステップS16では、算出された
相関値のうち最も高い相関値が所定の値以上かどうかを
判断する。所定の値以上であれば、その語が認識できた
としてステップS17に進む。ステップS17では、相
関値の最も高かった認識語を「施設ジャンル名」として
認識して該当ジャンルの施設名辞書を準備し、「施設名
称をどうぞ」とエコーバック出力する。該当ジャンルが
「病院」の場合は、図6のルーチンで予め生成された図
3の病院名認識辞書を準備する。
【0028】一方、ステップS16において、最も高い
相関値が所定の値未満であれば発話された言葉が認識で
きなかったとしてステップS23に進む。ステップS2
3では、「認識できません」と音声によりエコーバック
し、ステップS12に戻る。
【0029】ステップS17で「施設名称をどうぞ」と
エコーバック出力されると、ユーザは、例えば図3に示
された病院名を発話する。ステップS18では、マイク
201からの音声信号をデジタル音声データに変換す
る。ステップS19では、発話が終了したかどうかを判
断する。発話の終了は、一定時間音声信号が途切れた場
合を発話の終了と判断する。発話が終了したと判断した
場合はステップS20に進み、発話がまだ終了していな
いと判断した場合はステップS18に戻る。
【0030】ステップS20では、ステップS18で取
得したデジタル音声データと図3の認識辞書内の全認識
語について相関値を算出し、ステップS21に進む。認
識辞書は、図2の認識辞書においてキーワードの読みが
置き換えられた図3の認識辞書を使用する。ステップS
21では、算出された相関値のうち最も高い相関値が所
定の値以上かどうかを判断する。所定の値以上であれ
ば、その語が認識できたとしてステップS22に進む。
ステップS22では、相関値の最も高かった認識語を音
声によりエコーバックする。
【0031】さらに、ステップS22では該当病院名
(施設名称)が認識できたことをナビゲーション装置1
00に知らせた後、処理を終了する。ナビゲーション装
置100に知らせるときは、表示文字データや付帯情報
の地図上の座標を知らせる。ナビゲーション装置100
は、通信ライン211を介して送信されてきた該当病院
(施設)の地図上の座標データとCD−ROMドライブ
108の地図情報等に基づき、該当施設近辺の道路地図
を表示装置109に表示する。
【0032】一方、ステップS21において、最も高い
相関値が所定の値未満であれば発話された言葉が認識で
きなかったとしてステップS24に進む。ステップS2
4では、「認識できません」と音声によりエコーバック
し、ステップS18に戻る。
【0033】以上のようにして、音声認識を行うとき
に、該当ジャンルでよく使用されるキーワードを正規の
読みとは異なる実際の発音に近い読みに置き換えた認識
語を格納した認識辞書を使用するようにしている。これ
により、音声認識に確実に成功することができる。特
に、従来から使用していた認識辞書を使用して、キーワ
ード部分の読みのみを置き換えた認識辞書を作成してい
るので、音声認識のヒット率の向上した新たな認識辞書
の作成が容易かつ短時間かつ低コストで行うことができ
る。また、市販されている正規の読みが格納された認識
辞書を購入し、その購入した認識辞書に基づき、より音
声認識のヒット率を向上させた認識辞書を容易かつ短時
間かつ低コストで作成することもできる。
【0034】−第2の実施の形態− 第1の実施の形態では、図5、6に示したとおり、図3
の認識辞書の生成は、パーソナルコンピュータ303で
予め生成し、生成された認識辞書を図1の音声ユニット
200のROM210に搭載する例を示した。第2の実
施の形態では、音声ユニットにおいて、図3の該当認識
辞書を使用する場合に、その時点でその該当認識辞書
(図3)を生成するようにしたものである。第2の実施
の形態の車載用ナビゲーションシステムの構成は、第1
の実施の形態の図1の構成と同様であるのでその説明を
省略する。
【0035】図8は、第2の実施の形態の音声ユニット
200において、音声認識を行う制御のフローチャート
を示す図である。第1の実施の形態の図7とは、ステッ
プS17がステップS31に置き換えられ、ステップS
20がステップS32に置き換えられている点のみが異
なるので、ステップS31とS32の処理を中心に以下
説明する。
【0036】第2の実施の形態では、音声ユニット20
0のROM210が、図2の従来の認識辞書と該当ジャ
ンルのキーワードの読みデータ(正規の読みデータと置
き換え読みデータ、例えば図4(a))を持つようにす
る。そして、図6の認識辞書の生成と同じ内容を、ステ
ップS31において実行する。すなわち、図8のステッ
プS31では、まず、相関値の最も高かった認識語を
「施設ジャンル名」として認識すると、該当ジャンルの
施設名辞書(図2の認識辞書)を準備する。次に、準備
した施設名辞書とキーワードの正規の読みデータおよび
置き換え読みデータ(図4)に基づき、図6と同様の処
理を行ってキーワードの読みの置き換えを行い新たな施
設名辞書(図3の認識辞書)を生成する。その後、「施
設名称をどうぞ」とエコーバック出力する。ステップS
32では、ステップS18で取得したデジタル音声デー
タとステップS31で生成した新たな認識辞書(図3)
内の全認識語について相関値を算出する。その他の処理
は、第1の実施の形態と同様であるので説明を省略す
る。
【0037】第2の実施の形態では、正規の読みの認識
辞書はROM210に格納されており、新たな認識辞書
はRAM209に格納される。この場合、RAM209
では認識辞書をそっくり新たに作り替えるのではなく、
キーワードが含まれる認識語のみ追加認識語として生成
するようにしてもよい。このようにすることにより、正
規の認識語と追加認識語の両方において相関値を算出す
ることが可能となり、より精度の高い音声認識が可能と
なる。
【0038】以上のようにして、第2の実施の形態にお
いても、第1の実施の形態と同様に、音声認識に確実に
成功することができる。特に、ROM210には、従来
の認識語に加えてキーワードのデータのみを格納してお
けばよいので、少ない記憶容量でより精度の高い音声認
識が可能となる。
【0039】−第3の実施の形態− 第2の実施の形態では、そのジャンルで良く出てくる言
葉(キーワード)のより実際の発音に近い読みを前もっ
て調査してその読みデータをROM210に格納してお
くものであった。しかし、図4に示されたキーワードの
読みデータの置き換えには一定の法則を見いだすことが
できる。第3の実施の形態では、その法則を利用して新
たな認識語を生成するものである。第3の実施の形態の
車載用ナビゲーションシステムの構成は、第1の実施の
形態の図1の構成と同様であるのでその説明を省略す
る。
【0040】まず、図4(b)の「厚生病院」を例にそ
の法則について説明する。なお、仮名1字で示される音
を1音節という。「厚生病院」の正規の読みは「コウセ
イビョウイン」であり、その置き換えの読みとして「コ
オセエビョオイン」が示されている。これは、正規の読
み「コウセイビョウイン」を、実際には「コオセエビョ
オイン」と発話(発音)する人が多いからである。これ
により、次のような法則が見いだされる。「エ」「ケ」
「セ」「テ」「ネ」等の五十音のえ段の語(音節)の後
に「イ」が並ぶ読みの言葉の場合、その「イ」を「エ」
に置き換えたように発話する人が多い。また、「オ」
「コ」「ソ」「ト」「ノ」等のお段の語(音節)の後に
「ウ」が並ぶ読みの言葉の場合、その「ウ」を「オ」に
置き換えたように発話する人が多い。なお、この法則に
ついては、本出願の発明者が発明者として出願された特
願平11−255983号に開示されている。
【0041】図9は、第3の実施の形態の音声ユニット
200において、音声認識を行う制御のフローチャート
を示す図である。第2の実施の形態の図8とは、ステッ
プS31がステップS41に置き換えられている点のみ
が異なるので、ステップS41の処理を中心に以下説明
する。
【0042】図9のステップS41では、まず、相関値
の最も高かった認識語を「施設ジャンル名」として認識
すると、該当ジャンルの施設名辞書(図2の認識辞書)
を準備する。次に、準備した施設名辞書について後述す
る図10の処理を行って新たな施設名辞書(例えば図3
の認識辞書)を生成する。その後、「施設名称をどう
ぞ」とエコーバック出力する。その他の処理は、第2の
実施の形態と同様であるので説明を省略する。
【0043】次に、図10の処理を説明する。図10
は、図6と同様に、従来から使用されている正規の読み
の認識語が格納された認識辞書から新たな認識辞書を生
成する制御を示すフローチャートである。図6と異なる
のは、上述した法則を利用するところである。
【0044】ステップS51では、図2の正規の読みの
認識語格納された認識辞書ファイルから一つの認識語を
読み込む。該当ジャンルで良く出てくる言葉(キーワー
ド)は前もって調査され、ROM210に格納されてい
る。この場合、キーワードの正規の読みのデータのみが
格納されている。ステップS52では、読み込んだ認識
語に所定のキーワードが含まれているかどうかを判断
し、所定のキーワードが含まれていると判断するとステ
ップS53に進む。
【0045】ステップS53では、キーワードに五十音
のえ段の語(音節)の後に「イ」が並ぶ読み(これを
「え段の法則」と言う)があるかどうかを判断する。ス
テップS53で。え段の法則があると判断するとステッ
プS54に進む。ステップS54では、読み「イ」を
「エ」に置き換える。ステップS53で。え段の法則が
ないと判断するとステップS54をスキップしてステッ
プS55に進む。
【0046】ステップS55では、キーワードに五十音
のお段の語(音節)の後に「ウ」が並ぶ読み(これを
「お段の法則」と言う)があるかどうかを判断する。ス
テップS55で。お段の法則があると判断するとステッ
プS56に進む。ステップS56では、読み「ウ」を
「オ」に置き換える。ステップS55でお段の法則がな
いと判断するとステップS56をスキップしてステップ
S57に進む。ステップS57では、すべての認識語に
ついて処理が終了したかを判断し、まだ終了していない
場合はステップS51に戻り処理を繰り返す。終了して
いる場合は処理を終了する。
【0047】なお、図10の処理において、正規の読み
の認識語はそのままにして、え段の法則あるいはお段の
法則によって置き換えられた読みの認識語を新たな認識
語として追加するようにしてもよい。また、「エ」ある
いは「オ」に置き換える代わりに、長音符号「ー」に置
き換えるようにしてもよい。さらには、「エ」または
「オ」に置き換えた認識語と、長音符号「ー」に置き換
えた認識語の両方を追加するようにしてもよい。
【0048】上記は、読みの指定をひらがなやカタカナ
で行う音声認識システムの場合である。しかし、ローマ
字で指定する場合も、同様に考えればよい。例えば、
「厚生病院」は、ローマ字では正規の認識語として「ko
useibyouin」と指定される。「o」に続く「u」を「o」
に置き換え「e」に続く「i」を「e」に置き換えると「k
ooseebyooin」という新たな認識語が生成される。
【0049】以上のようにして、正規の読みのキーワー
ドにおいて母音が「エイ」と続く場合は「エエ」あるい
は「エー」と置き換え、母音が「オウ」と続く場合は
「オオ」あるいは「オー」と置き換える読みとした。こ
れにより、実際の発話に近い認識語が準備されるため、
音声認識に成功する確率が高くなる。
【0050】なお、第3の実施の形態では、お段の法
則、え段の法則を認識語全体に適用せず、所定のキーワ
ードにのみ適用している。この理由について説明する。
例えば、地名「若江岩田」に「若江岩田中央病院」とい
う病院名があったとする。この場合の正規の読みは「ワ
カエイワタチュウオウビョウイン」である。この認識語
全体にお段の法則、え段の法則を適用して読み替える
と、「ワカエエワタチュウオオビョオイン」となる。長
音符号を適用した場合は「ワカエーワタチュウオービョ
ーイン」となる。しかし、「若江岩田」の部分は「ワカ
エエワタ」あるいは「ワカエーワタ」と発音することは
ない。
【0051】このように、認識語全体にお段の法則、え
段の法則を適用すると、本来置き換えるべきでない読み
まで置き換えてしまい、逆に精度の低い音声認識になっ
てしまう。第3の実施の形態では、このような問題を避
けるために、所定のキーワードがある場合にそのキーワ
ードのみ置き換えるようにしたものである。これによ
り、お段の法則、え段の法則を適用して自動的に読みの
置き換え語(言い替え語、新たな認識語)が生成できる
とともに、置き換えたくない読みは確実に置き換えない
ようにすることができる。その結果、精度の高い置き換
え語を自動で生成することができる。
【0052】なお、第3の実施の形態では、第2の実施
の形態と同様に、該当ジャンルの音声認識をする時点で
新たな認識辞書を生成するようにした例で説明した。し
かし、第1の実施の形態と同様に、お段の法則、え段の
法則を適用した新たな認識辞書をパーソナルコンピュー
タ303(図5)で予め生成するようにしてもよい。こ
れにより、第1の実施の形態と同様な効果を奏すると同
時に、本来置き換えるべきでない読みの置き換えを回避
することも可能となる。
【0053】−第4の実施の形態− 第1の実施の形態では、所定のキーワードについて、実
際の発音により近い読みに置き換えた新たな認識語を生
成する例を示した。第4の実施の形態では、所定のキー
ワードの読みをいくつか準備し、キーワードのそれぞれ
の読みを含む新たな認識語を認識辞書に追加するように
したものである。第4の実施の形態の車載用ナビゲーシ
ョンシステムの構成は、第1の実施の形態の図1の構成
と同様であるのでその説明を省略する。
【0054】第4の実施の形態の認識辞書について説明
する。図11は、ジャンルが郵便局、役場、インターラ
ンプに関する認識語を格納した従来の認識辞書を示す図
である。図12は、第4の実施の形態において、本発明
を適用した図11に対応する認識辞書を示す図である。
【0055】図11(a)のジャンルが「郵便局」のと
きに、施設名称「座間郵便局」を指定する場合について
説明する。ナビゲーションシステムより「ジャンル名を
どうぞ」と促されて「ゆうびんきょく」と発話する。そ
の後「施設名称をどうぞ」と促された場合に、「ざまゆ
うびんきょく」と発話すべきか「ざま」とだけ発話すべ
きか迷うときがある。図12(a)の認識辞書には、
「座間郵便局」に対して「ざまゆうびんきょく」と「ざ
ま」の2つの読みの認識語が格納されている。従って
「ざまゆうびんきょく」と発話しても「ざま」とだけ発
話してもどちらも音声認識に成功する。
【0056】次に、図11(b)のジャンルが「役場」
のときに、施設名称「愛川町役場」を指定する場合につ
いて説明する。ナビゲーションシステムより「施設名称
をどうぞ」と促されたときに、上記と同様に「あいかわ
まちやくば」と発話すべきか、「あいかわまち」とだけ
発話すべきかに加えて、「あいかわちょうやくば」と発
話すべきか迷うことがある。これは、地方によって
「町」という漢字を「まち」と呼ぶ場合もあれば「ちょ
う」と呼ぶ場合もあるからである。図12(b)の認識
辞書には、「あいかわまちやくば」「あいかわまち」
「あいかわちょうやくば」の3つの認識語が準備されて
いるので、どのように発話されても音声認識に成功す
る。「村役場」の場合も同様である。
【0057】すなわち、図12は、認識語の最後の言葉
の読みが所定のキーワードである場合に、所定のキーワ
ードの複数の読みで置き換えられた新たな認識語が追加
されたものである。図13は、図12におけるキーワー
ドと置き換えられる読みを整理した図である。例えば、
認識語が「あいかわまちやくば」という読みの場合に、
その読みの中に図13のキーワードがあるかどうかを検
索し、「まちやくば」というキーワードを見つけると、
そのキーワードの置き換え読みに置き換えた認識語、す
なわち「あいかわまち」「あいかわちょうやくば」を追
加したものである。
【0058】なお、置き換える読みには、図13の「ゆ
うびんきょく」や「いんたーちぇんじ」等にも示す通
り、そのキーワードの読みを省略する場合も含む。ま
た、「いんたーちぇんじ」を「あいしー」とか「いんた
ー」とかの読みに置き換えるのは、「インターチェン
ジ」の別称として通常使用されるものであるからであ
る。「さーびすえりあ」を「ぱーきんぐ」と置き換える
のも別称と言えるからである。「ぱーきんぐえりあ」を
「ぱーきんぐ」とするのは略称と言える。また、図11
に示される各ジャンルの各施設名称は、地理的名称と施
設名からなる名称である。従って、キーワードはそのジ
ャンルの施設名とすることも可能である。
【0059】図14は、図11の従来から使用されてい
る正規の読みの認識語が格納された認識辞書から図12
の認識辞書を生成する制御のフローチャートを示す。図
12の認識辞書の生成は、図5と同様にパーソナルコン
ピュータ303で実行され、生成された認識辞書はRO
Mに書き込まれて図1の音声ユニット200のROM2
10に搭載される。
【0060】ステップS61では、図11の正規の読み
の認識語が格納された認識辞書ファイルから一つの認識
語を読み込む。該当ジャンルで良く出てくる言葉(キー
ワード)の置き換え読みは、図13に示すとおり、前も
って調査され予めパーソナルコンピュータ303に格納
されている。ステップS62では、読み込んだ認識語に
所定のキーワードが含まれているかどうかを判断し、所
定のキーワードが含まれていると判断するとステップS
63に進む。ステップS63では、認識語のそのキーワ
ードに該当する読みに置き換えた新たな認識語を生成す
る。一方、ステップS62でいずれのキーワードも含ま
れていないと判断するとステップS63をスキップして
ステップS64に進む。ステップS64では、すべての
認識語について処理が終了したかを判断し、まだ終了し
ていない場合はステップS61に戻り処理を繰り返す。
終了している場合は処理を終了する。
【0061】第4の実施の形態では、図12の認識辞書
の生成は、図5のパーソナルコンピュータ303で予め
生成し、生成された認識辞書を図1の音声ユニット20
0のROM210に搭載する例を示した。しかし、第2
の実施の形態と同様に、音声ユニットにおいて、該当認
識辞書を使用する時点でその該当認識辞書をRAM20
9上に生成するようにしてもよい。この場合は、図11
の認識辞書と図13のキーワードの置き換えデータのみ
をROM210に持てばよいので、ROM210の容量
が小さくなり、コスト低減につながる。
【0062】以上の第4の実施の形態では、認識語が予
め定めたあるキーワードを含む場合、そのキーワードの
読みのバリエーションが考慮された認識語が追加される
ので、音声認識に確実に成功することができる。
【0063】なお、第4の実施の形態の内容と第1〜第
3の実施の形態の内容を組み合わせることも可能であ
る。例えば、第1の実施の形態と第4の実施の形態を組
み合わせる場合を考えてみる。図11の「地理的名称」
+「施設名」からなる言葉のうち、地理的名称を第1の
実施の形態の対象キーワードとし、施設名を第4の実施
の形態の対象キーワードとする。例えば、第1の実施の
形態の対象キーワードに「だんごうざか→だんごーざ
か」を追加する。その結果、図11(c)の「談合坂S
A」は、正規の読みは「だんごうざかさーびすえりあ」
であるが、新たに「だんごーざかさーびすえりあ」「だ
んごーざかえすえー」「だんごーざかぱーきんぐ」「だ
んごーざか」の認識語が生成される。
【0064】−第5の実施の形態− 第4の実施の形態では、例えば図12(a)に示すよう
に、認識語の中に所定のキーワードがある場合、それを
削除した認識語を追加する例を説明した。第5の実施の
形態では、認識語にないキーワード(ジャンル名等)を
追加するものである。例えば、ジャンルが「駅」の場
合、駅の認識辞書にある認識語には通常最後に「えき」
という読みがついているものである。しかし、その「え
き」が認識語に含まれていない場合は、「えき」を追加
した認識語を追加する。第5の実施の形態の車載用ナビ
ゲーションシステムの構成は、第1の実施の形態の図1
の構成と同様であるのでその説明を省略する。
【0065】例えば、ジャンルが「駅」の認識辞書に、
「とうきょう」という認識語があった場合、新たに「と
うきょうえき」という認識語を追加する。具体的には、
ROM210に、あるジャンルに対応して付加すべきキ
ーワードデータを有し、認識語を検索しそのキーワード
が含まれていない場合は、そのキーワードを含む認識語
を追加する。このキーワードは複数であってもよい。キ
ーワードが複数の場合は、含まれていないキーワードそ
れぞれを付加した認識語を追加するようにすればよい。
このようにすることによって、ジャンルが「駅」の場合
に「とうきょう」と発話しても「とうきょうえき」と発
話しても音声認識に成功することになる。
【0066】上記第1〜5の実施の形態では、車載用ナ
ビゲーションシステムについて説明をしたがこの内容に
限定する必要はない。車載用に限らず携帯用のナビゲー
ション装置にも適用できる。さらには、ナビゲーション
装置に限らず音声認識を行うすべての装置に適用でき
る。
【0067】上記第1〜5の実施の形態では、ナビゲー
ション装置100と音声ユニット200を分離した構成
で説明をしたが、この内容に限定する必要はない。音声
ユニットを内部に含んだ一つのナビゲーション装置とし
て構成してもよい。また、上記制御プログラムや認識辞
書などをCD−ROMなどの記録媒体で提供することも
可能である。さらには、制御プログラムや認識辞書など
をCD−ROMなどの記録媒体で提供し、パーソナルコ
ンピュータやワークステーションなどのコンピュータ上
で上記システムを実現することも可能である。また、制
御プログラムや認識辞書などをインターネットに代表さ
れる電気通信回線(伝送媒体)を通じて提供することも
可能である。
【0068】上記第1〜5の実施の形態では、音声ユニ
ット200で施設名の検索に成功した場合、その内容を
ナビゲーション装置100に知らせ、ナビゲーション装
置100では道案内等のナビゲーション処理の一つとし
てその施設近辺の地図を表示する例で説明をしたが、こ
の内容に限定する必要はない。ナビゲーション装置10
0では、音声ユニット200で検索に成功した結果に基
づき、経路探索や経路誘導その他の各種のナビゲーショ
ン処理が考えられる。
【0069】
【発明の効果】本発明は、以上説明したように構成して
いるので、次のような効果を奏する。請求項1〜10の
発明は、音声認識を行うときに、例えば、該当ジャンル
でよく使用されるキーワードを正規の読みとは異なる読
みに置き換えた認識語を格納した認識辞書を使用するこ
とができるので、音声認識に確実に成功することができ
る。特に、従来から使用していた認識辞書や市販の認識
辞書を使用して、キーワード部分の読みのみを置き換え
た認識辞書を作成することが可能となるので、音声認識
のヒット率の向上した新たな認識辞書が容易かつ短時間
かつ低コストで作成ができ、音声認識率の向上した装置
の低コスト化が実現できる。特に、請求項2の発明は、
置き換える読みを通常の発音の読みとしているので、音
声認識率がより向上する。請求項3〜5の発明は、読み
の置き換えを一定の法則に基づいて自動で行うようにし
ているので、置き換える読みのデータを予め格納してお
く必要がなく、メモリ容量の削減につながる。また、予
め定めた所定の言葉(キーワード)の読みのみを置き換
えているので、置き換えるべきでない読みは確実に置き
換えないようにできる。すなわち、一定の法則に基づい
て自動で置き換えるために生じる本来置き換えたくない
読みを置き換えてしまうと言う問題が、確実に回避でき
る。請求項6〜9の発明は、予め定めた所定の言葉(キ
ーワード)の読みを、正規の読みに加えて、その言葉の
漢字の異なる読みや、別称、略称に置き換えたものも共
に認識語として格納しているので、ユーザがいろいろな
バリエーションで発話しても確実に音声認識に成功す
る。請求項10の発明は、音声認識処理を実際に行う時
点で第1の認識語を生成しているので、例えば、正規の
読みの認識語や所定の言葉(キーワード)のデータのみ
をROMに予め格納しておき、それらの内容に基づいて
新たな認識語をRAM上に展開することができる。これ
により、ROMの記憶容量を削減できる。これに反し、
RAMの記憶容量は大きくなるが、作業エリアとして随
時上書きされて使用されるので問題にはならない。請求
項11の発明は、所定の言葉(キーワード)を付加して
発話した場合にも確実に音声認識に成功することができ
る。請求項12の発明は、音声認識ナビゲーション装置
において、上述の効果を奏することができる。請求項1
3の発明は、従来から使用していた認識辞書や市販の認
識辞書を使用して、キーワード部分の読みのみを置き換
えた認識辞書を作成することができるので、音声認識の
ヒット率の向上した新たな認識辞書が容易かつ短時間か
つ低コストで作成ができる。
【図面の簡単な説明】
【図1】本発明の車載用ナビゲーションシステムの構成
を示す図である。
【図2】第1の実施の形態における正規の読みの認識辞
書を示す図である。
【図3】第1の実施の形態における新たな認識辞書を示
す図である。
【図4】第1の実施の形態におけるキーワードと置き換
えの読みの一覧を示す図である。
【図5】第1の実施の形態における正規の読みの認識辞
書から新たな認識辞書を生成する構成を示す図である。
【図6】第1の実施の形態における正規の読みの認識辞
書から新たな認識辞書を生成する処理のフローチャート
を示す図である。
【図7】第1の実施の形態における音声認識を行う制御
のフローチャートを示す図である。
【図8】第2の実施の形態における音声認識を行う制御
のフローチャートを示す図である。
【図9】第3の実施の形態における音声認識を行う制御
のフローチャートを示す図である。
【図10】第3の実施の形態における正規の読みの認識
辞書から新たな認識辞書を生成する処理のフローチャー
トを示す図である。
【図11】第4の実施の形態における正規の読みの認識
辞書を示す図である。
【図12】第4の実施の形態における新たな認識辞書を
示す図である。
【図13】第4の実施の形態におけるキーワードと置き
換えの読みの一覧を示す図である。
【図14】第4の実施の形態における正規の読みの認識
辞書から新たな認識辞書を生成する処理のフローチャー
トを示す図である。
【符号の説明】
100 ナビゲーション装置 101 GPS受信機 102 ジャイロセンサ 103 車速センサ 104 ドライバ 105 CPU 106 RAM 107 ROM 108 CD−ROMドライブ 109 表示装置 110 バスライン 200 音声ユニット 201 マイク 202 A/D変換部 203 D/A変換部 204 アンプ 205 スピーカ 206 発話スイッチ 207 ドライバ 208 CPU 209 RAM 210 ROM 211 通信ライン 212 バスライン 301 正規の読みの認識辞書 302 新たな認識辞書 303 パーソナルコンピュータ 304 キーワード
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/28 G10L 3/00 561H

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】音声入力手段と、 音声認識対象の言葉に対応しその言葉の読みを表す認識
    語を格納する格納手段と、 前記音声入力手段により得られた音データと前記認識語
    に基づき生成された音声認識用データとを比較して音声
    認識処理を行う音声認識処理手段とを備えた音声認識装
    置において、 前記格納手段には、一つの音声認識対象の言葉の一部に
    予め定めた所定の言葉を含む場合、その所定の言葉の読
    みをその所定の言葉の正規の読みとは異なる読みとした
    第1の認識語が格納されていることを特徴とする音声認
    識装置。
  2. 【請求項2】請求項1記載の音声認識装置において、 前記所定の言葉は、複数の音声認識対象の言葉の一部に
    共通に含まれる言葉であり、 前記所定の言葉の正規の読みと異なる読みは、その言葉
    の通常発音される読みであることを特徴とする音声認識
    装置。
  3. 【請求項3】請求項1または2記載の音声認識装置にお
    いて、 前記所定の言葉の正規の読みと異なる読みは、前記所定
    の言葉の正規の読みにおいてのみ五十音のえ段の音節の
    後に「い」の音節が並ぶ場合、この「い」の音節を
    「え」の音節に置き換えた読みとしたことを特徴とする
    音声認識装置。
  4. 【請求項4】請求項1または2記載の音声認識装置にお
    いて、 前記所定の言葉の正規の読みと異なる読みは、前記所定
    の言葉の正規の読みにおいてのみ五十音のお段の音節の
    後に「う」の音節が並ぶ場合、この「う」の音節を
    「お」の音節に置き換えた読みとしたことを特徴とする
    音声認識装置。
  5. 【請求項5】請求項3または4記載の音声認識装置にお
    いて、 前記認識語は長音符号「ー」を含む仮名により指定さ
    れ、 前記所定の言葉の正規の読みとは異なる読みにおいて、
    前記置き換える音節を長音符号「ー」により置き換える
    ことを特徴とする音声認識装置。
  6. 【請求項6】請求項1記載の音声認識装置において、 前記格納手段には、前記一つの音声認識対象の言葉に対
    して、前記所定の言葉の正規の読みを含む正規の認識語
    と前記第1の認識語とが共に格納されていることを特徴
    とする音声認識装置。
  7. 【請求項7】請求項6記載の音声認識装置において、 前記第1の認識語において、前記所定の言葉の正規の読
    みと異なる読みは、その言葉の読みをなしとするもので
    あることを特徴とする音声認識装置。
  8. 【請求項8】請求項6記載の音声認識装置において、 前記第1の認識語において、前記所定の言葉の正規の読
    みと異なる読みは、その言葉が漢字で表されるときその
    漢字の異なる読みであることを特徴とする音声認識装
    置。
  9. 【請求項9】請求項6記載の音声認識装置において、 前記第1の認識語において、前記所定の言葉の正規の読
    みと異なる読みは、その言葉が有する別称あるいは略称
    であることを特徴とする音声認識装置。
  10. 【請求項10】請求項1から9のいずれか1項記載の音
    声認識装置において、 前記音声認識処理手段が、前記所定の言葉を一部に含む
    前記一つの音声認識対象の言葉に関連して音声認識処理
    を行うときに、前記第1の認識語を生成して前記格納手
    段に格納ずる生成手段をさらに備えることを特徴とする
    音声認識装置。
  11. 【請求項11】音声入力手段と、 音声認識対象の言葉に対応しその言葉の読みを表す認識
    語を格納する格納手段と、 前記音声入力手段により得られた音データと前記認識語
    に基づき生成された音声認識用データとを比較して音声
    認識処理を行う音声認識処理手段とを備えた音声認識装
    置において、 前記格納手段には、前記音声認識対象の言葉に予め定め
    た所定の言葉が含まれない場合、前記所定の言葉の読み
    を付加した認識語が格納されていることを特徴とする音
    声認識装置。
  12. 【請求項12】請求項1から11のいずれか1項記載の
    音声認識装置と、 地図情報を格納する地図情報格納手段と、 少なくとも前記音声認識装置の認識結果と前記地図情報
    とに基づき、道案内のための制御を行う制御手段とを備
    えることを特徴とする音声認識ナビゲーション装置。
  13. 【請求項13】音声認識処理における、音声入力手段に
    より得られた音データと比較する音声認識用データを生
    成するための音声認識対象の言葉の読みを表した認識語
    を生成する認識語生成方法であって、 一つの音声認識対象の言葉の一部に予め定めた所定の言
    葉を含む場合、その所定の言葉の読みをその所定の言葉
    の正規の読みとは異なる読みとした認識語を生成するこ
    とを特徴とする認識語生成方法。
  14. 【請求項14】音声認識処理における、音声入力手段に
    より得られた音データと比較する音声認識用データを生
    成するための音声認識対象の言葉の読みを表した認識語
    を生成する認識語生成プログラムであって、一つの音声
    認識対象の言葉の一部に予め定めた所定の言葉を含む場
    合、その所定の言葉の読みをその所定の言葉の正規の読
    みとは異なる読みとした認識語を生成する認識語生成プ
    ログラム記録したことを特徴とする記録媒体。
  15. 【請求項15】音声認識処理における、音声入力手段に
    より得られた音データと比較する音声認識用データを生
    成するための音声認識対象の言葉の読みを表した認識語
    に関するデータであって、一つの音声認識対象の言葉の
    一部に予め定めた所定の言葉を含む場合、その所定の言
    葉の読みをその所定の言葉の正規の読みとは異なる読み
    とした認識語に関するデータを記録したことを特徴とす
    る記録媒体。
  16. 【請求項16】音声認識処理における、音声入力手段に
    より得られた音データと比較する音声認識用データを生
    成するための音声認識対象の言葉の読みを表した認識語
    を生成する認識語生成プログラムであって、一つの音声
    認識対象の言葉の一部に予め定めた所定の言葉を含む場
    合、その所定の言葉の読みをその所定の言葉の正規の読
    みとは異なる読みとした認識語を生成する認識語生成プ
    ログラム伝送することを特徴とする伝送媒体。
  17. 【請求項17】音声認識処理における、音声入力手段に
    より得られた音データと比較する音声認識用データを生
    成するための音声認識対象の言葉の読みを表した認識語
    に関するデータであって、一つの音声認識対象の言葉の
    一部に予め定めた所定の言葉を含む場合、その所定の言
    葉の読みをその所定の言葉の正規の読みとは異なる読み
    とした認識語に関するデータを伝送することを特徴とす
    る伝送媒体。
JP2000053257A 1999-09-09 2000-02-29 音声認識装置および音声認識ナビゲーション装置 Expired - Fee Related JP4550207B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2000053257A JP4550207B2 (ja) 2000-02-29 2000-02-29 音声認識装置および音声認識ナビゲーション装置
EP00307745A EP1083545A3 (en) 1999-09-09 2000-09-07 Voice recognition of proper names in a navigation apparatus
US09/659,679 US6708150B1 (en) 1999-09-09 2000-09-11 Speech recognition apparatus and speech recognition navigation apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000053257A JP4550207B2 (ja) 2000-02-29 2000-02-29 音声認識装置および音声認識ナビゲーション装置

Publications (2)

Publication Number Publication Date
JP2001242887A true JP2001242887A (ja) 2001-09-07
JP4550207B2 JP4550207B2 (ja) 2010-09-22

Family

ID=18574667

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000053257A Expired - Fee Related JP4550207B2 (ja) 1999-09-09 2000-02-29 音声認識装置および音声認識ナビゲーション装置

Country Status (1)

Country Link
JP (1) JP4550207B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002041081A (ja) * 2000-07-28 2002-02-08 Sharp Corp 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体
JP2003323192A (ja) * 2002-05-08 2003-11-14 Matsushita Electric Ind Co Ltd 単語辞書登録装置および単語辞書登録方法
JP2020155976A (ja) * 2019-03-20 2020-09-24 東芝映像ソリューション株式会社 番組名検索支援装置、及び、番組名検索支援方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61128364A (ja) * 1984-11-28 1986-06-16 Matsushita Electric Ind Co Ltd 辞書検索装置
JPH0358099A (ja) * 1989-07-27 1991-03-13 Nec Corp 発声変形検出装置
JPH10274996A (ja) * 1997-03-31 1998-10-13 Toshiba Corp 音声認識装置
JPH11311991A (ja) * 1998-04-30 1999-11-09 Nec Corp 音声認識辞書作成装置および方法、およびそのプログラムを記録した記録媒体
JP2000010583A (ja) * 1998-06-19 2000-01-14 Fujitsu Ltd 音声認識方法及び装置
JP2000029490A (ja) * 1998-07-15 2000-01-28 Denso Corp 音声認識装置用の単語辞書データ構築方法、音声認識装置及びナビゲーションシステム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61128364A (ja) * 1984-11-28 1986-06-16 Matsushita Electric Ind Co Ltd 辞書検索装置
JPH0358099A (ja) * 1989-07-27 1991-03-13 Nec Corp 発声変形検出装置
JPH10274996A (ja) * 1997-03-31 1998-10-13 Toshiba Corp 音声認識装置
JPH11311991A (ja) * 1998-04-30 1999-11-09 Nec Corp 音声認識辞書作成装置および方法、およびそのプログラムを記録した記録媒体
JP2000010583A (ja) * 1998-06-19 2000-01-14 Fujitsu Ltd 音声認識方法及び装置
JP2000029490A (ja) * 1998-07-15 2000-01-28 Denso Corp 音声認識装置用の単語辞書データ構築方法、音声認識装置及びナビゲーションシステム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002041081A (ja) * 2000-07-28 2002-02-08 Sharp Corp 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体
JP2003323192A (ja) * 2002-05-08 2003-11-14 Matsushita Electric Ind Co Ltd 単語辞書登録装置および単語辞書登録方法
JP2020155976A (ja) * 2019-03-20 2020-09-24 東芝映像ソリューション株式会社 番組名検索支援装置、及び、番組名検索支援方法
JP7202938B2 (ja) 2019-03-20 2023-01-12 Tvs Regza株式会社 番組名検索支援装置、及び、番組名検索支援方法

Also Published As

Publication number Publication date
JP4550207B2 (ja) 2010-09-22

Similar Documents

Publication Publication Date Title
US6708150B1 (en) Speech recognition apparatus and speech recognition navigation apparatus
US8548806B2 (en) Voice recognition device, voice recognition method, and voice recognition program
US6012028A (en) Text to speech conversion system and method that distinguishes geographical names based upon the present position
KR100679042B1 (ko) 음성인식 방법 및 장치, 이를 이용한 네비게이션 시스템
US20080177541A1 (en) Voice recognition device, voice recognition method, and voice recognition program
JP3278222B2 (ja) 情報処理方法及び装置
JP5189874B2 (ja) 多言語の非ネイティブ音声の認識
KR20070113665A (ko) 네비게이션 단말의 목적지 설정 방법 및 장치
JP2003114696A (ja) 音声認識装置、プログラム及びナビゲーションシステム
JP4642953B2 (ja) 音声検索装置、および、音声認識ナビゲーション装置
JP2008234427A (ja) ユーザ間の対話を支援する装置、方法およびプログラム
JP2008089625A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP4520555B2 (ja) 音声認識装置および音声認識ナビゲーション装置
JP3645104B2 (ja) 辞書検索装置及び辞書検索プログラムを記録した記録媒体
JP3911178B2 (ja) 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体
JP4639990B2 (ja) 音声対話装置及び音声理解結果生成方法
JP4550207B2 (ja) 音声認識装置および音声認識ナビゲーション装置
JPH07319383A (ja) 地図表示装置
JP2011180416A (ja) 音声合成装置、音声合成方法およびカーナビゲーションシステム
JP2005114964A (ja) 音声認識方法および音声認識処理装置
JPH11184495A (ja) 音声認識装置
JP2005157166A (ja) 音声認識装置、音声認識方法及びプログラム
JP4652504B2 (ja) 音声認識装置および音声認識ナビゲーション装置
JP2001083982A (ja) 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置
KR20060098673A (ko) 음성 인식 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100125

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20100212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100615

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100708

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees