JPH07311591A - 音声認識装置およびナビゲーションシステム - Google Patents

音声認識装置およびナビゲーションシステム

Info

Publication number
JPH07311591A
JPH07311591A JP6103130A JP10313094A JPH07311591A JP H07311591 A JPH07311591 A JP H07311591A JP 6103130 A JP6103130 A JP 6103130A JP 10313094 A JP10313094 A JP 10313094A JP H07311591 A JPH07311591 A JP H07311591A
Authority
JP
Japan
Prior art keywords
vocabulary
voice recognition
voice
recognition
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6103130A
Other languages
English (en)
Inventor
Masao Watari
雅男 渡
Kazuo Ishii
和夫 石井
Yasuhiko Kato
靖彦 加藤
Hiroaki Ogawa
浩明 小川
Masanori Omote
雅則 表
Kazuo Watanabe
一夫 渡辺
Katsuki Minamino
活樹 南野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP6103130A priority Critical patent/JPH07311591A/ja
Publication of JPH07311591A publication Critical patent/JPH07311591A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Instructional Devices (AREA)

Abstract

(57)【要約】 【目的】 辞書に膨大な数の語彙が登録されていても、
所定の速度および精度で音声認識を行うことができるよ
うにする。 【構成】 語彙選択部22が操作されることにより、大
規模辞書21に登録されている語彙が選択され、その選
択された語彙が、認識対象語辞書メモリ6に供給されて
記憶される。音声認識部2では、マイク1からの音声の
認識が、認識対象語辞書メモリ6に記憶されている語彙
を対象として行われる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば大規模な辞書を
用いて音声認識を行う場合に用いて好適な音声認識装
置、並びにナビゲーションシステムに関する。
【0002】
【従来の技術】従来の音声認識装置において、大規摸な
語彙(例えば、数万以上の語彙)を、同時に音声認識対
象語彙として音声認識を行うことは、認識性能や演算量
の点から極めて困難である。そこで、大規模な辞書を用
いる場合には、例えばその大規模な辞書に登録されてい
る語彙をあらかじめ階層化し、1発話に対する音声認識
対象語彙を、所定の階層に属するものに限定すること
で、その語彙数を少なくすることが考えられる。
【0003】即ち、例えばナビゲーションシステムなど
に、音声認識装置を組み込み、音声で町または村名を入
力し、これを音声認識して、その認識結果である町また
は村を含む地図を表示する場合においては、全国の町名
すべてを、同時に音声認識対象語彙とすると、その数
は、10万語以上になり、これにより認識処理に膨大な
時間がかかるとともに、認識率も劣化する。
【0004】そこで、例えば次のようにして音声認識を
行うことが考えられる。即ち、まず、例えば47都道府
県名のみを、音声認識対象語彙とし、使用者が発した音
声を音声認識する。使用者が、47都道府県名のうちの
いずれかを発話した場合には、その音声が認識されるの
で、次の段階では、その認識結果、即ち47都道府県名
のうちのいずれかにおける市または区名のみを、音声認
識対象語彙とする。
【0005】この場合、使用者が、いま音声認識対象語
彙になっている市または区名のうちのいずれかを発話す
ると、その音声が認識されるので、さらに次の段階で
は、その認識結果、即ち使用者が発話した市または区名
における町または村名のみを、音声認識対象語彙とす
る。そして、使用者が、いま音声認識対象語彙になって
いる町または村名のうちのいずれかを発話すると、その
音声が認識されるので、これにより目的とする町または
村名の音声認識結果が得られるようになる。
【0006】以上のようにして町または村名の音声認識
結果が得られた後は、その町または村を含む地図データ
を検索して表示するようにする。
【0007】図4は、以上のような方法で音声認識を行
う場合に用いる、全国の地名が階層化されて登録されて
いる全国地名階層化辞書の構成例を示している。このよ
うな全国地名階層化辞書を用い、上述したようにして音
声認識を行う場合には、1発話(1段階)における音声
認識対象語彙数は、多くとも数百語程度になり、これに
より現在実現されている、それほど規模の大きくない音
声認識装置によって実用的な処理速度および認識精度を
得ることが可能となる。
【0008】
【発明が解決しようとする課題】しなしながら、この場
合、どのような町または村名(以下、適宜、町村名とい
う)を含む地図を表示しようとするときでも、常に、都
道府県名、市または区名(以下、適宜、市区名とい
う)、および町村名の3回の発話を、使用者に強いるこ
とになる。さらに、使用者は、目的とする町村が存在す
る市区、およびその市区が存在する都道府県を把握して
いなければならず、従って使用者に大きな負担をかける
課題があった。
【0009】具体的には、上述したようなナビゲーショ
ンシステムを自動車に取り付け、例えば「下高井戸」付
近の地図を表示させる場合には、そのたびに、使用者
は、「東京都」、「杉並区」、「下高井戸」と発声しな
ければならない。
【0010】さらに、ナビゲーションシステムが、いわ
ゆる目的地の設定を、音声によって行うことができるも
のである場合、このナビゲーションシステムを取り付け
た自動車で、使用者が、例えば「東京都杉並区下高井
戸」の友人の新居を訪ねるときにおいては、使用者は、
例えば友人から送られてきた新居移転案内などを見なが
ら、上述したように「東京都」、「杉並区」、「下高井
戸」と順次発声して、目的地設定を行うことになるが、
それからしばらくして、再びその友人を訪ねる場合に、
その住所を覚えていないときには、例えば住所録などを
見て調べることが必要となる。
【0011】また、例えば道路地図に記載された交差点
名、あるいは東京タワーや富士急ハイランドのような、
いわゆるランドマークなどに対応する場所付近の住所は
あまり認知されいないので、このような交差点名などを
音声認識対象語彙とし、目的地設定時などに、これらを
音声で入力することができるようにすることにより、装
置のマンマシンインターフェイスを向上させることがで
きる。
【0012】しなしながら、交差点、あるいは東京タワ
ーや富士急ハイランドなどの観光(著名)地は、全国に
数多く存在し、また交差点名、あるいは「東京タワー」
や「富士急ハイランド」などのような語彙は、上述した
都道府県名、市区名、および町村名などと異なり階層化
が難しく、従って装置のマンマシンインターフェイスを
向上させることが困難な課題があった。
【0013】本発明は、このような状況に鑑みてなされ
たものであり、使用者に負担をかけることなく、大規模
な辞書を用いた、実用的な音声認識を行うことができる
ようにするものである。
【0014】
【課題を解決するための手段】本発明の音声認識装置
は、音声を認識する音声認識手段(例えば、図1や図3
に示す音声認識部2など)と、語彙を記憶している辞書
(例えば、図1に示す大規模辞書21や図3に示すCD
−ROM4など)と、辞書に記憶されている語彙を選択
する第1の選択手段(例えば、図1に示す語彙選択部2
2や図3に示すリモコン3など)とを備え、音声認識手
段が、第1の選択手段により選択された語彙を、音声認
識対象語彙として、音声の認識を行うことを特徴とす
る。
【0015】この音声認識装置は、音声認識対象語彙と
された語彙を選択する第2の選択手段(例えば、図1に
示す語彙選択部22や図3に示すリモコン3など)をさ
らに備え、音声認識手段が、第2の選択手段により選択
された語彙を、音声認識対象語彙から除外して、音声の
認識を行うようにすることができる。
【0016】また、この音声認識装置は、第1の選択手
段により選択された語彙を記憶する認識対象語彙記憶手
段(例えば、図1および図3に示す認識対象語辞書メモ
リ6や図2に示すメモリ12など)をさらに備え、音声
認識手段が、認識対象語彙記憶手段に記憶された語彙
を、音声認識対象語彙として、音声の認識を行うように
することができる。
【0017】さらに、この音声認識装置は、語彙が、認
識対象語彙記憶手段に記憶された記憶順を管理し、認識
対象語彙記憶手段に所定数の語彙が記憶された後、第1
の選択手段により語彙が新たに選択された場合には、認
識対象語彙記憶手段から記憶順の最も早い語彙を削除
し、新たに選択された語彙を、認識対象語彙記憶手段に
記憶させる記憶管理手段(例えば、図2に示すメモリ書
き換えコントローラ11など)をさらに備えるようにす
ることができる。
【0018】また、この音声認識装置は、認識対象語彙
記憶手段が、先入れ先出し方式のメモリでなるようにす
ることができる。
【0019】本発明のナビゲーションシステムは、音声
を入力する入力手段(例えば、図3に示すマイク1な
ど)と、入力手段に入力された音声を認識する、請求項
1乃至5のいずれかに記載の音声認識装置と、地図デー
タを記憶している地図データ記憶手段(例えば、図3に
示すCD−ROM4など)と、音声認識装置の音声認識
結果に基づいて、地図データ記憶手段に記憶されている
地図データを検索する検索手段(例えば、図3に示すシ
ステムコントローラ5など)と、検索手段により検索さ
れた地図データを表示する表示手段(例えば、図3に示
す液晶ディスプレイ8など)とを備えることを特徴とす
る。
【0020】
【作用】本発明の音声認識装置においては、音声認識手
段が、第1の選択手段によって辞書から選択された語彙
を、音声認識対象語彙として、音声の認識を行う。従っ
て、辞書に登録されている語彙が、膨大な数であって
も、その中から必要なものだけを選択して、音声認識対
象語彙とするようにすることができるので、音声認識手
段がそれほど規模の大きなものでなくても、充分実用的
な音声認識を行うことができる。
【0021】本発明のナビゲーションシステムにおいて
は、請求項1乃至5のいずれかに記載の音声認識装置に
よって音声が認識され、その音声認識結果に基づいて、
地図データ記憶手段に記憶されている地図データが検索
されて表示される。従って、地図データ記憶手段に記憶
されている地図データが膨大な量であっても、そのうち
の所望するものを検索するのに必要な語彙だけを選択し
て、音声認識対象語彙とするようにすることができるの
で、音声によって必要な地図データを表示することが可
能となる。
【0022】
【実施例】図1は、本発明を適用した音声認識装置の一
実施例の構成を示すブロック図である。マイク1は、入
力された音声を、電気信号としての音声信号に変換し、
音声認識部2に出力するようになされている。音声認識
部2は、マイク1からの音声信号を、A/D変換し、そ
の結果得られるディジタルの音声信号を音響分析して、
音声の特徴パラメータを抽出するようになされている。
さらに、音声認識部2は、音声の特徴パラメータを入力
パターンとするとともに、認識対象語辞書メモリ6に記
憶された語彙を標準パターンとし、所定の音声認識アル
ゴリズムにしたがって音声認識を行うようになされてい
る。
【0023】大規模辞書21には、音声認識の対象とす
る語彙が、あらかじめ登録されている。語彙選択部22
は、例えばカーソルキー(あるいはスイッチやジョイス
ティックなど)およびモニタ(いずれも図示せず)など
で構成されている。語彙選択部22においては、モニタ
に、大規模辞書21に登録されている語彙が表示され、
発話者(使用者)が、そのモニタの表示を見ながら、カ
ーソルキーを操作することにより、大規模辞書21に登
録されている語彙を選択することができるようになされ
ている。語彙選択部22により選択された語彙は、認識
対象語辞書メモリ6に供給されるようになされている。
認識対象語辞書メモリ6は、語彙選択部22から供給さ
れる語彙を記憶するようになされている。
【0024】なお、語彙選択部22においては、モニタ
に、認識対象語辞書メモリ6に記憶された語彙も表示さ
れ、発話者が、そのモニタの表示を見ながら、カーソル
キーを操作することにより、認識対象語辞書メモリ6に
記憶された語彙を選択することができるようになされて
いる。認識対象語辞書メモリ6に記憶された語彙のう
ち、語彙選択部22により選択されたものは、認識対象
語辞書メモリ6から削除されるようになされている。
【0025】次に、その動作について説明する。まず発
話者により語彙選択部22が操作され、大規模辞書21
に登録されている語彙のうち、いま音声認識の対象とす
る語彙のみが選択され、認識対象語辞書メモリ6に出力
されて記憶される。
【0026】その後、マイク1に音声が入力されると、
その音声は、電気信号としての音声信号にされ、音声認
識部2に出力される。音声認識部2では、認識対象語辞
書メモリ6に記憶された語彙を、音声認識対象語彙とし
て、マイク1からの音声信号の音声認識が行われる。
【0027】即ち、音声認識部2においては、認識対象
語辞書メモリ6にいま記憶されている語彙のみを対象と
して、音声認識が行われる。
【0028】認識対象語辞書メモリ6に記憶されている
語彙を変える場合には、必要に応じて語彙選択部22が
操作され、認識対象語辞書メモリ6に記憶されている語
彙のうち、音声認識の対象から除外するものが選択され
て削除される。さらに、必要に応じて語彙選択部22が
操作され、大規模辞書21に登録されている語彙のう
ち、新たに音声認識の対象とする語彙が選択され、認識
対象語辞書メモリ6に出力されて記憶される。
【0029】その後、音声認識部2では、記憶内容が変
更された認識対象語辞書メモリ6に記憶されている語彙
を、音声認識対象語彙として、音声認識が行われる。
【0030】従って、大規模辞書21に登録されている
語彙数が、膨大な数であっても、認識対象語辞書メモリ
6に記憶させる語彙を変えることにより、いわば仮想的
に、大規模辞書21に登録されている語彙すべてを対象
とする、実用的な音声認識を行うことができる。また、
大規模辞書21に登録されている語彙が、階層化するこ
とが困難で、膨大な数のものであっても、認識対象語辞
書メモリ6に記憶させる語彙を変え、一時に音声認識の
対象とする語彙を制限することにより、容易に音声認識
を行うことができるようになり、その結果装置のマンマ
シンインターフェイスを向上させることができる。
【0031】なお、認識対象語辞書メモリ6は、音声認
識部2が、所定の認識処理速度および認識精度を維持す
ることができるだけの数までの語彙を記憶するようにな
されている。即ち、認識対象語辞書メモリ6は、所定数
(例えば、1000語程度)の語彙しか記憶することが
できないようになされている。
【0032】従って、この音声認識装置によれば、大規
模辞書21に登録されている語彙すべてを仮想的に音声
認識対象語彙とした音声認識を、所定の認識処理速度お
よび認識精度で行うことができる。即ち、言い換えれ
ば、装置が、それほど性能(能力)の高い音声認識部2
を有していなくても、仮想的に多くの語彙を対象とした
音声認識を行うことができる。また、音声認識部2を性
能の高いものとした場合には、一時的に音声認識の対象
とする語彙が、使用者が選択したものに制限されるの
で、認識処理速度および認識精度を向上させることがで
きる。
【0033】さらに、通常、発話者が使用する語彙の種
類の数は、それほど多くなく、また一度使用した語彙は
繰り返し使用されることが多いので、認識対象語辞書メ
モリ6の記憶内容の変更は、それほど頻繁に行う必要は
ないと考えられ、従って使用者に負担をかけることなく
音声認識を行うことができる。
【0034】また、発話者が変わった場合には、その発
話者が、語彙選択部22を操作することにより、認識対
象語辞書メモリ6に記憶させる語彙を変更するようにす
れば良いので、発話者が変わることにより装置が実際上
使用不可になることを防止することができる。
【0035】次に、認識対象語辞書メモリ6に所定数の
語彙が記憶された後、さらに語彙選択部22が操作さ
れ、大規模辞書21から語彙が選択された場合において
は、その語彙を、認識対象語辞書メモリ6に記憶させな
いようにしても良いが、この他、例えば認識対象語辞書
メモリ6を、FIFO(First In First Out)(先入れ
先出し方式)のメモリで構成し、そこに記憶されている
語彙のうち、最も早く記憶されたもの(最も早く語彙選
択部22で選択されたもの)を削除して、新たに選択さ
れた語彙を記憶するようにすることができる。
【0036】即ち、認識対象語辞書メモリ6から記憶順
の最も早い語彙を削除し、語彙選択部22により新たに
選択された語彙を、認識対象語辞書メモリ6に記憶させ
るようにすることができる。
【0037】具体的には、認識対象語辞書メモリ6を、
例えば図2に示すように、メモリ書き換えコントローラ
11およびメモリ12で構成するようにする。この場
合、メモリ書き換えコントローラ11では、語彙選択部
22から、語彙が供給されると、メモリ12の先頭アド
レスが発生され、語彙選択部22からの語彙とともに、
メモリ12に供給される。メモリ12においては、メモ
リ書き換えコントローラ11から供給されたアドレス
に、同じくメモリ書き換えコントローラ11から供給さ
れた語彙が記憶される。
【0038】そして、語彙選択部22から、さらに語彙
が供給されると、メモリ書き換えコントローラ11で
は、メモリ12の先頭アドレスの次のアドレスが発生さ
れ、語彙選択部22からの語彙とともに、メモリ12に
供給される。メモリ12においては、メモリ書き換えコ
ントローラ11から供給されたアドレスに、同じくメモ
リ書き換えコントローラ11から供給された語彙が記憶
される。
【0039】以下、同様にして、語彙選択部22から語
彙が供給されるごとに、メモリ書き換えコントローラ1
1が発生するアドレスが変更(更新)され、メモリ12
では、そのアドレスに、語彙が記憶される。
【0040】以上のようにして、認識対象語辞書メモリ
6に所定数の語彙が記憶された後、即ちメモリ書き換え
コントローラ11が発生するアドレスが、メモリ12の
最終アドレスに等しくなった後、語彙選択部22から、
さらに語彙が供給されると、メモリ書き換えコントロー
ラ11では、メモリ12の先頭アドレスが発生され、語
彙選択部22からの語彙とともに、メモリ12に供給さ
れる。
【0041】従って、この場合、メモリ12において、
その先頭アドレスに記憶されていた語彙、即ち記憶順の
最も早い語彙に代えて、新たに供給された語彙が記憶さ
れることになる。
【0042】なお、図1においては、認識対象語辞書メ
モリ6を設けて音声認識装置を構成するようにしたが、
この音声認識装置は、認識対象語辞書メモリ6を設けず
に構成することができる。
【0043】この場合においては、例えば大規模辞書2
1に登録されている語彙にフラグを付しておき、語彙選
択部22によって選択された語彙のフラグをON/OF
Fさせるようにする。
【0044】そして、音声認識時には、音声認識部2
に、大規模辞書21に登録されている語彙のうち、例え
ばフラグがON状態のもののみを対象に、音声認識させ
るようにする。
【0045】この場合も、上述した場合と同様に、大規
模辞書21に登録されている語彙が、膨大な数であって
も、大規模辞書21に登録されている語彙に付していあ
るフラグの状態を変えることにより、仮想的に、大規模
辞書21に登録されている語彙すべてを対象とする、実
用的な(所定の認識速度かつ認識精度での)音声認識を
行うことができる。
【0046】但し、この場合、音声認識部2の性能に基
づいて、ON状態にすることのできるフラグの数、即ち
一時に音声認識の対象にする語彙の数を制限するように
しておくことが好ましい。
【0047】また、上述の他、例えば大規模辞書21に
登録されている語彙に、シリアルに番号を付しておき、
語彙選択部22による語彙の選択に基づいて、その語彙
に付された番号を変更するようにすることも可能であ
る。
【0048】この場合、音声認識時には、音声認識部2
に、大規模辞書21に登録されている語彙のうち、例え
ば付された番号の小さい順に、所定数の語彙のみを対象
に、音声認識させるようにする。
【0049】このようにした場合も、上述した場合と同
様に、大規模辞書21に登録されている語彙が、膨大な
数であっても、大規模辞書21に登録されている語彙に
付していある番号を変えることにより、仮想的に、大規
模辞書21に登録されている語彙すべてを対象とする、
実用的な音声認識を行うことができる。
【0050】但し、上述の所定数、即ち一時に音声認識
の対象にする語彙の数は、音声認識部2の性能に基づい
て設定するようにすることが好ましい。
【0051】以上のようにして、認識対象語辞書メモリ
6を設けずに装置を構成する場合には、装置の小型化、
低コスト化を図ることができる。
【0052】さらに、図1の音声認識装置では、大規模
辞書21に登録されている語彙を、語彙選択部22を構
成するカーソルキーなどで選択するようにしたが、この
他、例えば大規模辞書21に登録されている語彙すべて
を対象とした音声認識を行うことにより、その選択を行
うようにすることも可能である。この場合、語彙の選択
のための音声認識には、時間がかかるが、選択後は、上
述した場合と同様に、実用的な音声認識を行うことがで
きる。
【0053】次に、図3は、本発明を適用したナビゲー
ションシステム(カーナビゲーションシステム)の一実
施例の構成を示している。なお、図中、図1の音声認識
装置と対応する部分については、同一の符号を付してあ
る。また、このナビゲーションシステムを構成するリモ
コン3またはCD−ROM4は、図1の音声認識装置に
おける語彙選択部22または大規模辞書21にそれぞれ
相当するものである。
【0054】リモコン3は、システムコントローラ5に
所定の処理を行わせるときに操作されるようになされて
いる。システムコントローラ5は、リモコン3の操作に
対応して所定の処理を行う他、音声認識部2の認識結果
に基づいて、CD−ROM4から情報を読み出し、液晶
表示コントローラ7を介して液晶ディスプレイ8に供給
して表示させるようになされている。また、システムコ
ントローラ5は、CD−ROM4から読み出した情報
を、必要に応じて認識対象語辞書メモリ6に出力して記
憶させるようになされている。
【0055】液晶表示コントローラ7は、システムコン
トローラ5の出力に対応して、液晶ディスプレイ8を駆
動するようになされている。液晶ディスプレイ8は、液
晶表示コントローラ7により制御され、システムコント
ローラ5によってCD−ROM4から読み出された情報
を表示するようになされている。
【0056】CD−ROM4は、地図の画像データ(以
下、適宜、地図データという)とともに、地名を、その
地図上の位置と対応付けて記憶している。さらに、CD
−ROM4は、例えば交差点名、あるいは「東京タワ
ー」や「富士急ハイランド」などの地図上のランドマー
クに対応する観光(著名)地の名前(これらも、以下、
適宜、地名という)も、その地図上の位置と対応付けて
記憶している。CD−ROM4に記憶されている地名
は、音声認識部2による音声認識の対象語彙とすること
ができるようになされている。
【0057】なお、CD−ROM4は、図示せぬCD−
ROMドライブに装着されており、CD−ROM4に記
憶されている情報は、システムコントローラ5がCD−
ROMドライブを駆動することにより、CD−ROM4
から読み出されるようになされている。
【0058】また、CD−ROM4は、CD−ROMド
ライブに着脱可能になされており、これにより将来、地
図などに変更があっても、その変更後の地図の情報が記
憶されたCD−ROMを、CD−ROM4に代えてCD
−ROMドライブに装着することによって、CD−RO
M4に記憶されている情報の陳腐化により、装置が実質
的に使用不可になることを防止することができるように
なされている。
【0059】さらに、CD−ROM4は、記憶している
地名のうち、階層化をすることができるものは、階層化
して記憶している。即ち、CD−ROM4は、例えば都
道府県名および市町村区名などは、図4に示したように
階層化して記憶している。
【0060】次に、その動作について説明する。まずリ
モコン3が、CD−ROM4に記憶されている地名を表
示するように操作されると、リモコン3からは、その操
作に対応した信号(以下、リモコン信号という)が、シ
ステムコントローラ5に出力される。システムコントロ
ーラ5では、リモコン3からのリモコン信号にしたがっ
て、CD−ROM4から地名が順次読み出される。この
地名は、液晶表示コントローラ7を介して液晶ディスプ
レイ8に出力されて表示される。
【0061】使用者は、液晶ディスプレイ8の表示を見
ながら、自身が必要とする地図の範囲に位置する地名、
即ち例えば目的地とする地名などを、リモコン3を操作
することにより選択する。すると、システムコントロー
ラ5では、選択された地名が、CD−ROM4から読み
出され、認識対象語辞書メモリ6に出力されて記憶され
る。
【0062】その後、マイク1に、地名が音声で入力さ
れると、その音声は、電気信号としての音声信号にさ
れ、音声認識部2に出力される。音声認識部2では、認
識対象語辞書メモリ6に記憶されている地名を、音声認
識対象語彙として、マイク1からの音声信号の音声認識
が行われる。
【0063】即ち、音声認識部2においては、認識対象
語辞書メモリ6にいま記憶されている地名のみを対象と
して、音声認識が行われる。
【0064】音声認識部2における音声認識結果として
の地名は、システムコントローラ5に供給される。シス
テムコントローラ5は、音声認識部2から地名を受信す
ると、その地名を含む範囲の地図に対応する地図データ
が、CD−ROM4から読み出す。この地図データは、
液晶表示コントローラ7を介して、液晶ディスプレイ8
に供給されて表示される。即ち、使用者が所望する地名
を含む範囲の地図が表示される。なお、この場合、地図
は、適切な縮尺で表示されるようになされている。
【0065】一般的に、使用者が目的地とする地名のう
ちの、例えば町名や村名の数は、全国に存在するものの
数(例えば、10万以上)の1%にも満たないと考えら
れ、またそのうちの交差点名や観光地名の数も、それほ
ど多くないと考えられる。
【0066】従って、CD−ROM4に記憶されている
地名すべてを、一時に音声認識対象語彙とする必要はな
く、認識対象語辞書メモリ6に記憶することのできる数
(本実施例においては、上述したように1000語程
度)の地名を、一時に音声認識対象語彙とすることによ
り、音声認識部2を、それほど性能の高いものとしなく
ても、所定の認識処理速度および認識精度で、使用者が
音声で発する地名を音声認識することが可能となる。
【0067】その結果、使用者が発声した地名が、階層
化の容易な住所である場合の他、階層化が困難な交差点
名や観光地名である場合であっても、その付近の地図
を、液晶ディスプレイ8に表示することができる。
【0068】なお、認識対象語辞書メモリ6に記憶され
ている語彙の変更は、図1で説明した語彙選択部22に
相当するリモコン3を操作することにより行うことがで
きるようになされている。
【0069】次に、例えば、このナビゲーションシステ
ムを取り付けた自動車で、使用者が、例えば「東京都杉
並区下高井戸」の友人の新居を訪ねる場合において、い
わゆる目的地設定を行うときには、使用者は、目的地設
定を行うようにリモコン3を操作する。リモコン3から
は、使用者の操作に対応した信号が、システムコントロ
ーラ5に出力される。システムコントローラ5では、リ
モコン3からのリモコン信号に対応して、CD−ROM
4に記憶されている地名のうちの、例えば47都道府県
名が読み出される。この都道府県名は、システムコント
ローラ5から、液晶表示コントローラ7を介して液晶デ
ィスプレイ8に供給されて表示される。
【0070】使用者は、液晶ディスプレイ8の表示を見
ながら、目的地の都道府県である「東京都」を選択する
ようにリモコン3を操作する。これにより、その操作に
対応したリモコン信号が、リモコン3からシステムコン
トローラ5に出力される。すると、システムコントロー
ラ5では、リモコン3の操作により選択された地名「東
京都」が、CD−ROM4から読み出される。この地名
「東京都」は、認識対象語辞書メモリ6に供給されて記
憶され、これにより音声認識部2による音声認識の対象
語彙とされる。
【0071】さらに、システムコントローラ5において
は、選択された「東京都」の階層下に属する地名(「東
京都」の直後の階層に属する地名)である23区名およ
び市名(東京都内に存在する市および区名)が、CD−
ROM4から読み出される。この23区名および市名
(以下、適宜、市区名という)は、上述した都道府県名
と同様にして、液晶ディスプレイ8に表示される。
【0072】使用者は、液晶ディスプレイ8の表示を見
ながら、目的地の市または区である「杉並区」を選択す
るようにリモコン3を操作する。すると、システムコン
トローラ5では、リモコン3の操作により選択された地
名「杉並区」が、CD−ROM4から読み出される。こ
の地名「杉並区」は、認識対象語辞書メモリ6に供給さ
れて記憶され、これにより音声認識部2による音声認識
の対象語彙とされる。
【0073】ここで、認識対象語辞書メモリ6に、既に
記憶されている語彙と、新たに記憶された語彙とが、C
D−ROM4で階層化されて記憶されているものである
場合には、認識対象語辞書メモリ6においても階層化さ
れて記憶されるようになされている。即ち、上述の場
合、「杉並区」は、「東京都」の階層下に属するものと
して、認識対象語辞書メモリ6に記憶される。
【0074】その後、システムコントローラ5において
は、選択された「杉並区」の階層下に属する地名(「杉
並区」の直後の階層に属する地名)である町名および村
名(杉並区内に存在する町および村名)が、CD−RO
M4から読み出される。この町名および村名(以下、適
宜、町村名という)は、上述した都道府県名と同様にし
て、液晶ディスプレイ8に表示される。
【0075】使用者は、液晶ディスプレイ8の表示を見
ながら、目的地の町または村である「下高井戸」を選択
するようにリモコン3を操作する。すると、システムコ
ントローラ5では、リモコン3の操作により選択された
地名「下高井戸」が、CD−ROM4から読み出され、
認識対象語辞書メモリ6に供給されて記憶される。これ
により、地名「下高井戸」は、音声認識部2による音声
認識の対象語彙とされる。
【0076】なお、この場合、上述したように、「下高
井戸」は、「杉並区」の階層下に属するものとして、認
識対象語辞書メモリ6に記憶される。従って、いまの場
合、認識対象語辞書メモリ6には、「下高井戸」が、
「杉並区」の階層下に属し、さらに「杉並区」が、「東
京都」の階層下に属するように、「東京都」、「杉並
区」、および「下高井戸」が記憶される。
【0077】システムコントローラ5は、地名「下高井
戸」を、認識対象語辞書メモリ6に記憶させると、現在
地から「下高井戸」付近まで地図に対応する地図データ
を、CD−ROM4から順次読み出し、液晶表示コント
ローラ7を介して液晶ディスプレイ8に供給して表示さ
せる。
【0078】以下、同様にして、目的地設定が行われる
ごとに、認識対象語辞書メモリ6に、地名が、必要に応
じて階層化されて記憶される。なお、この場合には、認
識対象語辞書メモリ6は、例えば図2に示した構成とさ
れており、所定数(上述したように、例えば1000
語)の地名を記憶した後、さらに新たに地名を記憶する
場合には、最も早く記憶された地名を削除して、新たな
地名を記憶するようになされている。
【0079】その後、一度設定した地名を目的地とした
目的地設定は、上述したようにしてリモコン3を操作す
ることにより行うことができる他、目的地とする地名を
発声することによっても行うことができるようになる。
【0080】即ち、マイク1に、目的地とする地名が音
声で入力されると、その音声は、電気信号としての音声
信号にされ、音声認識部2に出力される。音声認識部2
では、認識対象語辞書メモリ6に記憶されている地名
を、音声認識対象語彙として、マイク1からの音声信号
の音声認識が行われる。
【0081】音声認識部2における音声認識結果として
の地名は、システムコントローラ5に供給される。シス
テムコントローラ5は、音声認識部2から地名を受信す
ると、現在地から、その地名までの地図に対応する地図
データを、CD−ROM4から順次検索して読み出し、
液晶表示コントローラ7を介して、液晶ディスプレイ8
に供給して表示させる。即ち、現在地から目的地までの
地図が表示される。
【0082】具体的には、いまの場合、認識対象語辞書
メモリ6に「下高井戸」が音声認識対象語彙として記憶
されているから、例えば「下高井戸」と発声があったと
きには、その音声は、「下高井戸」と音声認識され、こ
れにより上述したようにして現在地から「下高井戸」ま
での地図が表示される。
【0083】なお、いまの場合、認識対象語辞書メモリ
6に、「東京都」、「杉並区」、および「下高井戸」が
階層化されて記憶されているから、例えば「東京都」と
発声があり、音声認識部2において、音声認識結果とし
て「東京都」が得られたときには、これをそのままシス
テムコントローラ5に出力するのではなく、「東京都」
の階層下に属する「杉並区」または「下高井戸」を音声
認識結果として、システムコントローラ5に出力するよ
うにすることができる。
【0084】この場合には、「東京都」と発声するだけ
で、現在地から「杉並区」または「下高井戸」までの地
図を表示することができる。
【0085】さらに、同様にして、「杉並区」の発声に
対し、現在地から「杉並区」の階層下に属する「下高井
戸」までの地図を表示するようにすることもできる。
【0086】以上から、「下高井戸」を目的地とする目
的地設定を、再度行う場合、「東京都」、「杉並区」、
「下高井戸」と3回地名を発声せずに済み、さらに目的
地の町村名までを正確に覚えていなくても、例えば都道
府県名あるいは市区名(「東京都」あるいは「杉並
区」)などを覚えておくだけで、目的地までの地図を表
示することができるので、使用者に煩わしさを感じさせ
ることを防止することができる。
【0087】なお、認識対象語辞書メモリ6において、
例えば「東京都」の階層下に属する市区名が、「杉並
区」だけでなく、他にも記憶されている場合(あるい
は、「杉並区」の階層下に属する町村名が、「下高井
戸」だけでなく、他にも記憶されている場合)、音声認
識結果として「東京都」が得られたときに、「東京都」
の階層下に属する市区名すべてを、音声認識結果とし
て、音声認識部2からシステムコントローラ5に出力す
るようにすることができる。
【0088】この場合、システムコントローラ5では、
音声認識部2からの音声認識結果としての市区名すべて
が、液晶表示コントローラ7を介して液晶ディスプレイ
8に供給されて表示される。その後、使用者が、液晶デ
ィスプレイ8の表示を見ながら、目的地とする市区名を
発声すると、音声認識部2では、その音声が認識され、
その音声認識結果が、システムコントローラ5に出力さ
れる。これにより、上述したようにして、音声認識部2
からの音声認識結果である市区名までの地図が、液晶デ
ィスプレイ8に表示される。
【0089】以上、本発明をナビゲーションシステムに
適用した場合について説明したが、本発明は、ナビゲー
ションシステムの他、音声を認識するブロックを有する
あらゆる装置に適用することが可能である。
【0090】なお、本実施例においては、音声認識部2
における音声認識アルゴリズムについて言及しなかった
が、これは特定のものに限定されるものではない。即
ち、音声認識部2では、例えばHMM(Hidden Markov
Models)法や、DP(DynamicProgramming)法など、あ
らゆる手法に基づいた音声認識アルゴリズムを用いるこ
とが可能である。
【0091】
【発明の効果】以上の如く、本発明の音声認識装置によ
れば、辞書に登録されている語彙が、膨大な数であって
も、その中から必要なものだけを選択して、音声認識対
象語彙とするようにすることができるので、音声認識手
段がそれほど規模の大きなものでなくても、所定の認識
処理速度および認識精度で音声認識を行うことができ
る。
【0092】本発明のナビゲーションシステムによれ
ば、地図データ記憶手段に記憶されている地図データが
膨大であっても、そのうちの所望するものを検索するの
に必要な語彙だけを選択して、音声認識対象語彙とする
ようにすることができるので、音声により必要な地図デ
ータを表示することが可能となる。
【図面の簡単な説明】
【図1】本発明を適用した音声認識装置の一実施例の構
成を示すブロック図である。
【図2】図1の実施例における認識対象語辞書メモリ6
を、先入れ先出し方式のメモリとした場合の、詳細構成
を示すブロック図である。
【図3】本発明を適用したナビゲーションシステムの一
実施例の構成を示すブロック図である。
【図4】全国の地名が階層化されて登録されている辞書
の構成例を示す図である。
【符号の説明】
1 マイク 2 音声認識部 3 リモコン 4 CD−ROM 5 システムコントローラ 6 認識対象語辞書メモリ 7 液晶表示コントローラ 8 液晶ディスプレイ 11 メモリ書き換えコントローラ 12 メモリ 21 大規模辞書 22 語彙選択部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小川 浩明 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 表 雅則 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 渡辺 一夫 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 南野 活樹 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 音声を認識する音声認識手段と、 語彙を記憶している辞書と、 前記辞書に記憶されている語彙を選択する第1の選択手
    段とを備え、 前記音声認識手段は、前記第1の選択手段により選択さ
    れた語彙を、音声認識対象語彙として、前記音声の認識
    を行うことを特徴とする音声認識装置。
  2. 【請求項2】 前記音声認識対象語彙とされた語彙を選
    択する第2の選択手段をさらに備え、 前記音声認識手段は、前記第2の選択手段により選択さ
    れた語彙を、前記音声認識対象語彙から除外して、前記
    音声の認識を行うことを特徴とする請求項1に記載の音
    声認識装置。
  3. 【請求項3】 前記第1の選択手段により選択された語
    彙を記憶する認識対象語彙記憶手段をさらに備え、 前記音声認識手段は、前記認識対象語彙記憶手段に記憶
    された語彙を、前記音声認識対象語彙として、前記音声
    の認識を行うことを特徴とする請求項1または2に記載
    の音声認識装置。
  4. 【請求項4】 前記語彙が、前記認識対象語彙記憶手段
    に記憶された記憶順を管理し、前記認識対象語彙記憶手
    段に所定数の語彙が記憶された後、前記第1の選択手段
    により語彙が新たに選択された場合には、前記認識対象
    語彙記憶手段から記憶順の最も早い語彙を削除し、新た
    に選択された語彙を、前記認識対象語彙記憶手段に記憶
    させる記憶管理手段をさらに備えることを特徴とする請
    求項3に記載の音声認識装置。
  5. 【請求項5】 前記認識対象語彙記憶手段は、先入れ先
    出し方式のメモリでなることを特徴とする請求項3に記
    載の音声認識装置。
  6. 【請求項6】 音声を入力する入力手段と、 前記入力手段に入力された音声を認識する、請求項1乃
    至5のいずれかに記載の音声認識装置と、 地図データを記憶している地図データ記憶手段と、 前記音声認識装置の音声認識結果に基づいて、前記地図
    データ記憶手段に記憶されている地図データを検索する
    検索手段と、 前記検索手段により検索された地図データを表示する表
    示手段とを備えることを特徴とするナビゲーションシス
    テム。
JP6103130A 1994-05-18 1994-05-18 音声認識装置およびナビゲーションシステム Pending JPH07311591A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6103130A JPH07311591A (ja) 1994-05-18 1994-05-18 音声認識装置およびナビゲーションシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6103130A JPH07311591A (ja) 1994-05-18 1994-05-18 音声認識装置およびナビゲーションシステム

Publications (1)

Publication Number Publication Date
JPH07311591A true JPH07311591A (ja) 1995-11-28

Family

ID=14345972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6103130A Pending JPH07311591A (ja) 1994-05-18 1994-05-18 音声認識装置およびナビゲーションシステム

Country Status (1)

Country Link
JP (1) JPH07311591A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1138994A (ja) * 1997-07-17 1999-02-12 Denso Corp 音声認識装置及びナビゲーションシステム
JP2002372986A (ja) * 2002-05-09 2002-12-26 Denso Corp 音声認識装置及びナビゲーションシステム
JP2003015687A (ja) * 2001-06-29 2003-01-17 Clarion Co Ltd ナビゲーション装置及び方法並びにナビゲーション用ソフトウェア

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1138994A (ja) * 1997-07-17 1999-02-12 Denso Corp 音声認識装置及びナビゲーションシステム
JP2003015687A (ja) * 2001-06-29 2003-01-17 Clarion Co Ltd ナビゲーション装置及び方法並びにナビゲーション用ソフトウェア
JP4727852B2 (ja) * 2001-06-29 2011-07-20 クラリオン株式会社 ナビゲーション装置及び方法並びにナビゲーション用ソフトウェア
JP2002372986A (ja) * 2002-05-09 2002-12-26 Denso Corp 音声認識装置及びナビゲーションシステム

Similar Documents

Publication Publication Date Title
JP5334178B2 (ja) 音声認識装置およびデータ更新方法
US20100286984A1 (en) Method for speech rocognition
US9805722B2 (en) Interactive speech recognition system
KR100998566B1 (ko) 음성인식을 이용한 언어 번역 방법 및 장치
JP4116233B2 (ja) 音声認識装置ならびにその方法
US20080177541A1 (en) Voice recognition device, voice recognition method, and voice recognition program
JP3278222B2 (ja) 情報処理方法及び装置
WO2011121649A1 (ja) 音声認識装置
JP5335165B2 (ja) 発音情報生成装置、車載情報装置およびデータベース生成方法
US7809563B2 (en) Speech recognition based on initial sound extraction for navigation and name search
JP2007286358A (ja) ナビゲーション装置及びその住所入力方法
JPH07319383A (ja) 地図表示装置
JP2001027540A (ja) 音声認識機能を用いたナビゲーション方法
JP2003162293A (ja) 音声認識装置及び方法
JP3911178B2 (ja) 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体
JPH08202386A (ja) 音声認識方法、音声認識装置、およびナビゲーション装置
JP3726783B2 (ja) 音声認識装置
JPH07311591A (ja) 音声認識装置およびナビゲーションシステム
JPH0926799A (ja) 音声認識装置
JP3296783B2 (ja) 車載用ナビゲーション装置および音声認識方法
JP4655268B2 (ja) 音声出力システム
JP3759313B2 (ja) 車載用ナビゲーション装置
JP4004885B2 (ja) 音声制御装置
JP4550207B2 (ja) 音声認識装置および音声認識ナビゲーション装置
JP5522679B2 (ja) 検索装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040507