JPH11250078A - 音声認識機能付案内装置 - Google Patents

音声認識機能付案内装置

Info

Publication number
JPH11250078A
JPH11250078A JP10047772A JP4777298A JPH11250078A JP H11250078 A JPH11250078 A JP H11250078A JP 10047772 A JP10047772 A JP 10047772A JP 4777298 A JP4777298 A JP 4777298A JP H11250078 A JPH11250078 A JP H11250078A
Authority
JP
Japan
Prior art keywords
information
name
voice
dictionary
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10047772A
Other languages
English (en)
Inventor
Shinichi Iwamoto
真一 岩本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP10047772A priority Critical patent/JPH11250078A/ja
Publication of JPH11250078A publication Critical patent/JPH11250078A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Navigation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Traffic Control Systems (AREA)

Abstract

(57)【要約】 【課題】 音声認識の性能を向上し、音声認識のための
発声の回数を減少させて使い勝手を向上させる。 【解決手段】 音声信号は、音声処理部2で音声認識処
理され、認識結果はCPU1に数値として与えられる。
CPU1は、認識結果に基づいて、単語辞書遷移テーブ
ル4を検索し、単語辞書格納部3から次に使用する辞書
を選択して音声処理部2に送る。また必要となる音声信
号の入力のための発声を促すための案内も出力する。使
用者は、案内出力に応じて次の音声入力を行うので、必
要な音声信号が入力され、同一の単語が単語辞書に複数
存在しても、容易に識別することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を入力
し、音声信号中に含まれる単語を認識して、単語につい
て予め記憶されている情報を案内する音声認識機能付情
報案内装置に関する。
【0002】
【従来の技術】従来から、各種情報処理の際に、入力を
音声信号で行うことが試みられている。音声信号を使用
すると、たとえばキーボードを使用するような繁雑な操
作は不要となり、誰でも容易に情報処理を行うことが可
能となる。
【0003】また、音声信号を用いて情報処理装置と人
とのインタフェイスを行うことは、キーボードとディス
プレイ装置との組合せのように、人がディスプレイ画面
を見なければならないという必要もなくなり、たとえば
ナビゲーション装置など、人が車両を運転しながらでも
情報処理装置を利用することができるようになる。
【0004】音声信号に含まれる単語を認識する音声認
識機能では、一般に、単語について予め作成してある辞
書を照合し、照合結果にしたがって単語を特定する。辞
書には、たとえば音素の組合せとして単語が記憶されて
おり、入力された音声信号中から抽出する音素の組合せ
に対して、辞書に記憶されている音素の組合せの中で、
最も類似性の高い音素の組合せが選択され、その音素の
組合せに対応する単語が入力される音声信号中に含まれ
る単語であると認識される。
【0005】ナビゲーション装置では、たとえば目的地
や経由地などの入力を音声信号で行うことが期待され
る。そのような地点の入力は、単に必要最小限の短い単
語で行うことができる方が好ましい。ナビゲーション装
置では、ある程度、広い範囲にわたって移動しても案内
が可能なように、辞書には膨大な地点に対応する音素の
組合せ(単語)が記憶される。照合する音素の組合せの
長さが大きくなると(単語数が多くなると)、辞書に必
要な容量も大きくなってしまい、多くの単語に対応する
音素の組合せを記憶することができなくなってしまうか
らである。しかしながら、対象とする範囲が広くなる
と、たとえば同じ名称の施設や地名などが複数存在する
ことも有り得る。同じ名称の施設等を区別するために
は、その上位階層の、たとえば都道府県名などを付加し
て区別するか、あるいは都道府県毎に辞書を分けておく
必要がある。これらの場合には、音声信号で上位の階層
から、順番に最終的な施設名称までの入力を行わなけれ
ばならない。辞書を分けて多くもつ必要があるのは、単
語数が多いカテゴリである施設名称、電話番号あるいは
住所等である。
【0006】
【発明が解決しようとする課題】従来の音声認識では、
辞書に入っている単語のみが認識可能であるので、人間
が音声を発声する可能性のある単語すべてを1つの辞書
に備えておく必要がある。この結果、施設名称等、単語
が無数にあるカテゴリでは、以下のような問題点が生じ
てくる。
【0007】音声認識用の辞書1つあたりの辞書サイ
ズが拡大する。 音声認識用の辞書内の単語数増加によって、単語照合
に要する時間が増加する。 音声認識用の辞書内の単語数増加によって、たとえ
ば「しが」と「さが」のように、類似の単語が増加して
認識率が低下する。 単語数が多いカテゴリについて辞書をわけると、音声
認識に用いる辞書をいくつも持つことになって、装置の
使用者が発声しなければならない回数が増加し、不快感
を与える。
【0008】本発明の目的は、音声認識に用いる辞書の
大きさを縮小し、単語照合に要する時間を短縮して、し
かも認識率を向上し、使用者が発声する回数を減少させ
ることができる音声認識機能付案内装置を提供すること
である。
【0009】
【課題を解決するための手段】本発明は、複数の名称に
ついての情報が各名称毎に1または複数種類ずつ予め記
憶され、使用者から指定される指定名称について記憶さ
れている情報を用いる案内を行う装置であって、音声信
号が入力され、音声信号中に含まれる名称を認識する音
声認識手段と、音声認識手段によって認識される指定名
称について、予め記憶されている情報を検索する情報検
索手段と、情報検索手段によって検索される情報が複数
種類あるとき、複数種類から1種類を選択するための追
加名称の音声による入力を促す出力を行い、音声認識手
段によって認識される追加名称に従って情報を1種類だ
け選択する情報選択手段と、音声信号で入力された指定
名称について、情報検索手段によって1種類だけ検索さ
れる情報、または情報選択手段によって1種類だけ選択
される情報を案内する情報案内手段とを含むことを特徴
とする音声認識機能付案内装置である。
【0010】本発明に従えば、音声認識手段に指定名称
を含む音声信号を入力すると、音声認識手段によって認
識された指定名称について、情報検索手段は、予め記憶
されている情報を検索する。情報検索手段によって検索
される情報が複数種類あるときには、情報選択手段によ
って追加名称の音声による入力が促される。追加名称に
ついて音声認識手段による認識が行われると、複数種類
の情報から1種類だけの情報が選択される。情報検索手
段によって1種類だけ検索される情報または情報選択手
段によって1種類だけ選択される情報は、情報案内手段
によって案内される。使用者は、まず目的の指定名称に
ついて発声し、対応する情報が1種類のときには直ちに
案内を受けることができる。複数種類の情報が記憶され
ているときには、情報選択手段によって促される追加情
報の入力のための発声を行えばよい。したがって、発声
の回数を最小限度にとどめて快適に情報の案内を受ける
ことができる。情報認識のために使用する辞書は、同一
の指定名称について複数種類の情報を記憶してもよいの
で、音素の組合せを短くして(単語の数を少なくし
て)、辞書サイズの縮小を図り、単語照合に要する時間
の短縮を図ることができる。同一の指定名称について複
数種類の情報が記憶されているときには、追加名称を入
力して選択するので、最終的な単語認識率の向上を図る
ことができる。
【0011】さらに本発明は、複数の名称についての情
報が各名称毎に1または複数種類ずつ予め記憶され、使
用者から指定される指定名称について記憶されている情
報を用いる案内を行う装置であって、音声信号が入力さ
れ、音声信号中に含まれる名称を認識する音声認識手段
と、音声認識手段に音声信号で指定名称を入力する際
に、指定名称を限定する追加名称の音声信号による入力
を促す音声処理手段と、音声認識手段によって認識され
る指定名称について、予め記憶されている情報を検索す
る情報検索手段と、情報検索手段によって検索される情
報が複数種類あるとき、音声認識手段によって認識され
る追加名称に従って情報を1種類だけ選択する情報選択
手段と、音声信号で入力された指定名称について、情報
検索手段によって1種類だけ検索される情報、または情
報選択手段によって1種類だけ選択される情報を案内す
る情報案内手段とを含むことを特徴とする音声認識機能
付案内装置である。
【0012】本発明に従えば、音声認識手段に音声信号
を入力して指定名称に基づく情報の検索および案内を指
示する際に、音声処理手段は指定名称を限定する追加名
称の音声信号による入力を促すので、必要な追加名称も
併せて入力することができる。同一指定名称について複
数種類の情報が記憶されていても、追加名称が入力され
ているので、1種類のみを選択することができる。音声
認識に使用する辞書は、同一の指定名称に複数種類の情
報が対応してもよいので、音素の組合せとしては短くす
ることができ、辞書サイズの低減を図ることができると
ともに、単語照合時間の短縮も図ることができる。追加
名称によって複数種類の情報から1種類の情報を選択す
ることができるので、最終的な音声認識率を向上させ、
必要な追加名称の入力のみを行えばよいので、発声の回
数を減少させて装置を使いやすくすることができる。
【0013】さらにまた本発明は、複数の名称について
の情報が各名称毎に1または複数種類ずつ予め記憶さ
れ、使用者から指定される指定名称について記憶されて
いる情報を用いる案内を行う装置であって、音声信号が
入力され、音声信号中に含まれる名称を認識する音声認
識手段と、指定名称についての音声信号を一時的に保管
する一時保管手段と、指定名称に続いて、指定名称を限
定する追加名称についての音声信号が音声認識手段に入
力されるとき、追加名称が認識された後で一時保管手段
に保管されている指定名称についての音声信号を音声認
識手段によって認識させる音声処理手段と、音声認識手
段によって認識される指定名称について、予め記憶され
ている情報を検索手段と、情報検索手段によって検索さ
れる情報が複数種類あるとき、音声認識手段によって認
識されている追加名称に従って情報を1種類だけ選択す
る情報選択手段と、音声信号で入力された指定名称につ
いて、情報検索手段によって1種類だけ検索される情
報、または情報選択手段によって1種類だけ選択される
情報を案内する情報案内手段とを含むことを特徴とする
音声認識機能付案内装置である。
【0014】本発明に従えば、音声処理手段は、先に入
力される指定名称を一時保管手段に一時的に保管してお
き、追加名称が入力されて認識された後で、一時保管手
段に保管されている指定名称を音声認識手段に認識させ
るので、複数の辞書を用いたり、1つの辞書中で同一の
指定名称について複数種類の情報が対応していたりする
場合でも、辞書の選択あるいは複数種類の情報の選択で
追加名称および指定名称で特定される単語に対応する情
報の案内を容易に行うことができる。同一の指定名称に
ついて複数種類の情報が、同一の辞書内あるいは他の辞
書内に含まれていても、追加情報によって容易に選択す
ることができるので、単語当たりの音素の組合せの長さ
および単語が短くなり、単語数が減少するので、辞書サ
イズの縮小を図ることができる。追加名称および指定名
称に基づいて、辞書の選択あるいは単語の照合を行うの
で、単語照合に要する時間を短縮し、認識率を向上させ
ることができる。使用者は、指定名称について先に発声
し、後から追加名称を発声すればよいので、快適に音声
入力を行うことができる。
【0015】また本発明は、前記指定名称および追加名
称に対応する単語について、基準となる音声信号を予め
記憶する辞書手段を備え、前記音声認識手段は、音声信
号に含まれる単語と辞書手段に記憶される基準となる音
声信号とを比較し、不一致の程度を表す数値を照合結果
として出力し、前記一時保管手段は、音声認識手段から
の照合結果を表す数値が予め定める基準値を超えると
き、前記音声信号の一時保管を行うことを特徴とする。
【0016】本発明に従えば、辞書手段には指定名称お
よび追加名称について基準となる音声信号を予め記憶し
ておき、音声認識手段は、音声信号に含まれる単語と辞
書手段とを照合して、不一致の程度を表す数値を照合結
果として記憶する。一時保管手段は音声認識手段からの
照合結果を表す数値に予め定める基準値を超えるときに
音声信号の一時保管を行うので、照合結果を表す数値が
基準値を超えるような一致性が低い単語について、誤認
識を行う可能性を低減し、追加名称の入力によって認識
率の向上を図ることができる。一旦入力された名称は一
時保管されているので、改めて入力する必要はなく、辞
書手段の照合に有効に利用することができる。
【0017】また本発明で、前記辞書手段は、前記指定
名称または前記追加名称に対応する複数種類の辞書を有
し、前記音声認識手段は、前記単語と1つの辞書を選択
した辞書手段との照合結果を表す数値に従って、次に使
用すべき辞書の選択を行うことを特徴とする。
【0018】本発明に従えば、辞書手段には指定名称ま
たは追加名称に対応する複数種類の辞書が設けられ、音
声認識手段は単語と1つの辞書を選択した辞書手段との
照合結果を表す数値に従って、次に使用すべき辞書の選
択を行うので、複数の辞書から適切な辞書の選択を容易
に行うことができる。
【0019】また本発明で、前記音声認識手段は、前記
単語の照合結果を表す数値に従って、該単語を含む音声
信号の前記一時保管手段による一時保管と、前記辞書手
段での辞書の選択とを行い、一時保管された音声信号に
含まれる単語に対して、選択された辞書を用いて照合を
行うことを特徴とする。
【0020】本発明に従えば、音声認識手段では、単語
の照合結果を表す数値に従って、単語を含む音声信号の
一時保管と、辞書手段での辞書の選択とを行う。選択さ
れた辞書は、一時保管された音声信号に含まれる単語を
用いて照合するので、改めて同じ単語を音声入力する必
要がなく、一旦入力された単語を用いて複数の辞書を用
いる音声認識を効率的に行うことができる。
【0021】また本発明で、前記音声認識手段は、音声
信号が予め定める回数入力された後で、前記一時保管さ
れた音声信号に含まれる単語に対して、選択された辞書
を用いて照合を行うことを特徴とする。
【0022】本発明に従えば、一旦一時保管された音声
信号を、複数回の音声入力の後で辞書と照合するので、
複数回の音声入力の後で改めて音声信号で入力する必要
がなく、複数回にわけて入力された単語も追加名称とし
て利用して確実な音声認識を行うことができる。
【0023】本発明は、前記指定名称についての音声認
識手段の認識結果の適否を時系列的に記憶する結果記憶
手段と、結果記憶手段に記憶されている認識結果の適否
に基づいて、前記基準値を減少あるいは増加させるよう
にそれぞれ更新する更新手段とをさらに含むことを特徴
とする。
【0024】本発明に従えば、指定名称について音声認
識手段の認識結果の適否を結果記憶手段に時系列的に記
憶しておいて、記憶されている認識結果の適否に基づい
て更新手段が基準値を減少あるいは増加させるようにそ
れぞれ更新するので、的中率が高く誤認識のないときに
は基準値を低くし、また的中率が低いときには基準値を
大きくして、正確で確実な認識結果が得られるように調
整することができる。
【0025】また本発明は、前記基準値を設定する設定
手段をさらに含むことを特徴とする。
【0026】本発明に従えば、設定手段によって基準値
を設定することができるので、使用者が音声認識の結果
の的中率などに基づいてより適切な基準値を設定するこ
とができる。
【0027】また本発明で、前記指定名称は、施設名称
であり、前記追加名称は都道府県名称であり、前記情報
案内手段は、地図情報の案内を行うことを特徴とする。
【0028】本発明に従えば、地図情報の案内を行う場
合に、施設名称を指定名称として音声入力し、追加名称
として都道府県名称を付け加えて、複数の都道府県に同
一の施設名称が存在しても、容易に区別することができ
る。
【0029】
【発明の実施の形態】図1は、本発明の実施の第1形態
として音声認識機能付ナビゲーション装置の概略的な電
気的構成を示す。CPU1は、予め定めるプログラムに
したがって音声機能付ナビゲーション装置としての動作
を全体的に制御する。音声認識処理は、音声処理部2が
単語辞書格納部3に格納されている単語辞書を用いて行
う。音声認識処理に使用する単語辞書は、単語辞書遷移
テーブル4に従って選択する。音声処理部2に対する音
声信号の入力は、アナログ/デジタル変換(以下、「A
/D」と略称する)回路5にマイクロホン6からの音声
信号を与え、デジタルデータに変換して行う。音声処理
部2は、本装置の使用者に対して、発声を促す案内を音
声で行うため、音声合成機能を有する。音声処理部2か
ら音声合成されたデジタルデータは、デジタル/アナロ
グ変換(以下、「D/A」と略称する)回路7でアナロ
グの音声信号に変換され、スピーカ8から音響出力され
る。
【0030】CPU1は、ナビゲーション装置として道
路データなどの地図情報が予め記憶されるCD/ROM
やDVDなどの記録媒体9を参照し、音声処理部2で認
識された地名などの単語に従って関連する地図情報を読
出すことができる。また、位置検出部10は、車両など
の現在位置を検出し、CPU1は、検出された現在位置
に基づいて記録媒体9に記録されている現在位置周辺の
地図情報の読出しも行うことができる。音声機能付ナビ
ゲーション装置が車両に搭載されているときには、位置
検出部10として速度センサや方位センサなどからの信
号に基づいて推測工法に基づく現在位置の推測値や、G
PSを利用した現在位置の検出結果などを利用すること
ができる。CPU1が、位置検出部10で検出される現
在位置や、記録媒体9から読出される地図情報などを、
表示部11に画像として表示する。また、ナビゲーショ
ン装置として、予め出発地から目的地までの経路を探索
したり設定することもでき、車両に搭載されて移動中
に、表示部11を使用しての画像や、スピーカ8を用い
ての音声による経路案内を行うこともできる。本実施形
態の音声認識機能付ナビゲーション装置では、たとえば
経路設定の際に入力する必要がある目的地や出発地、あ
るいは途中の経由地などの入力に音声信号を用いること
ができる。
【0031】図2は、図1の音声認識機能付ナビゲーシ
ョン装置の音声認識処理手順を示す。ステップa1でマ
イクロホン6に音声信号が入力されると、音声処理部2
では予めCPU1から与えられるか、デフォルトとして
予め備えられている単語辞書に基づいて入力された音声
信号中に含まれる単語の認識を行う。ステップa2で、
CPU1は音声処理部2より認識単語結果を受信する。
このとき一致の程度を表す数値も併せて受信する。ステ
ップa3では、CPU1が単語辞書遷移テーブル4を検
索し、ステップa4で次に選択する単語辞書である次選
択辞書があるか否かを判断する。たとえば音声処理部で
使用した単語辞書が1つの施設名称についての単語辞書
であり、他の都道府県についても同一施設名称がある場
合には、単語辞書遷移テーブル検索の結果、次選択辞書
有りと判断される。このときにはステップa5に移り、
CPU1は次に選択される単語辞書を単語辞書格納部3
から読出して音声処理部2へ送信する。
【0032】さらにステップa6で音声処理部2を介し
て、次の発声を促すための案内出力を行わせる。ステッ
プa6での出力が行われた後、またはステップa4で次
の選択辞書がないと判断されるとき、ステップa7で1
つの音声信号に含まれる単語の認識処理を終了する。ス
テップa6の案内出力に使用者が応答してさらに次の発
声による音声入力が行われると、再びステップa1から
の処理を行う。なお、単語辞書内に次に選択する辞書の
有無を示すフラグを設けておき、単語辞書遷移テーブル
の代わりに用いることもできる。
【0033】図3は、本発明の実施の第2形態としての
音声認識機能付ナビゲーション装置の概略的な電気的構
成を示す。本実施形態では、図1の実施形態に対応する
部分には同一の参照符を付し、重複した説明を省略す
る。本実施形態では、音声処理部2に内部RAMやバッ
ファ等のメモリ12で実現される一時保管メモリ13お
よびカウンタ14を備える。カウンタ14には、予め設
定される回数Nが設定され、音声入力回数がNに達した
ら、入力される音声信号に含まれる発声音素を一時保管
メモリ13に一時的に保管する。また、回数などは、キ
ーボードなどの入力部15から入力することもできる。
【0034】図4は、図3の実施形態の音声認識手順を
示す。カウンタ14に示されるN回目の発声が入力され
ると、ステップb1から認識処理を開始する。ステップ
b2では、音声処理部2が発声単語の発声音素を一時保
管メモリ13に一時的に保管する。ステップb3では、
CPU1が辞書遷移テーブル4を参照し、次選択辞書の
選択およびその音声処理部2への送信を行う。ステップ
b4では、N+1回目の発声音素が入力されるのを待
ち、入力されるとステップb5で辞書遷移テーブル4を
参照して、N+1回目で認識された単語に対応した次選
択辞書の選択および音声処理部2への送信を行う。ステ
ップb6で、音声処理部2は一時保管メモリ13に一時
保管した発声音素を呼出す。ステップb7で音声処理部
2は、呼出した発声音素を単語照合部で単語辞書と照合
し、認識結果と不一致の程度を表す数値を結果として出
力し、ステップb8で認識処理を終了する。本実施形態
の処理では、どの発声単語にこの方法を適用するか、ま
たNの値は予めCPU1のプログラムで決めておいてカ
ウンタ14に設定しておく必要がある。
【0035】図5は、本発明の実施の第3形態として、
たとえば図3と同様な電気的構成の音声認識機能付ナビ
ゲーション装置で、音声処理部2での単語照合結果に基
づいて、照合結果の認識単語を用いるか否かを判断する
処理手順を示す。ステップc1で音声信号が入力される
と、ステップc2ではCPU1が音声処理部2から発声
単語の照合結果を受信する。このとき、発声単語と単語
辞書中の単語との一致の程度を表す数値も受信する。ス
テップc3では、照合結果として受信する数値が、予め
設定される値より大きいか否かを判断する。この数値は
不一致の要素の数を表し、数値が大きい程、一致の程度
は下がる。照合結果が設定値より大きくないと判断され
るときには、ステップc4で音声処理部2に対する結果
送信必要信号を送信する。照合結果が設定値より大きい
と判断されるときには、ステップc5で音声処理部2へ
送信結果不必要信号を送信する。ステップc4またはス
テップc5の後、ステップc6で判断の処理を終了す
る。このような判断の処理で、一致の程度が小さい単語
に基づいて案内を行ったり、選択辞書を選択したりする
ことを防ぐことができる。
【0036】図6は、本発明の実施の第4形態として、
図3に示すような電気的構成の音声認識機能付ナビゲー
ション装置で、発声単語に対する単語照合を行った結果
を示す数値が設定値より大きい場合には、他の単語辞書
を自動的に選択する。ステップd1で音声信号が入力さ
れると、ステップd2でCPU1は、音声処理部2より
発声単語の照合結果を受信する。ステップd5では、処
理結果に伴う数値が設定値より大きいか否かを判断す
る。大きくないと判断されるときには、ステップd5で
認識された単語に基づく辞書遷移テーブル4の検索を行
い、ステップd5で次選択辞書としてAを選択し、音声
処理部2へ辞書Aを送信する。ステップd3で、照合結
果が設定値より大きいと判断されるときには、ステップ
d6で辞書遷移テーブル4を検索し、ステップd7で次
選択辞書としてステップd5で選択した次選択辞書Aと
は異なる次選択辞書Bを選択し、音声処理部2へ送信す
る。ステップd5またはステップd7の処理が終了する
と、ステップd8で次選択辞書の選択処理を終了する。
【0037】図7は、本発明の実施の第5形態として、
図3と同様な音声認識機能付ナビゲーション装置で、音
声処理部2内で発声単語に対する単語照合を行った結果
を表した数値が設定値より大きい場合のみ、発声音素を
一時保管し、また次に使用する辞書を自動的に選択し、
発声音素を使用して次の単語照合を行う手順を示す。ス
テップe1で発声による音声入力が行われると、ステッ
プe2では、CPU1が音声処理部2より発声単語の照
合結果を受信する。ステップe3では、照合結果に伴う
数値が設定値より大きいか否かを判断する。大きくない
と判断されるときには、ステップe4で、音声処理部2
へ結果送信必要信号を送信し、ステップe5で辞書遷移
テーブル4の検索を行う。ステップe6で、次選択辞書
Aの選択および音声処理部2への辞書A送信を行う。
【0038】ステップe3で、照合結果が設定値より大
きいと判断されるときには、ステップe7で、音声処理
部2へ送信結果不必要信号を送信する。ステップe8で
辞書遷移テーブルを検索し、ステップe9でステップe
6で選択される次選択辞書Aとは異なる次選択辞書Bの
選択および音声処理部2への辞書Bの送信を行う。
【0039】ステップe9の処理が終了すると、ステッ
プe10で一時保管メモリ12に一時的に保管しておい
た発声音素を呼出す。ステップe11で呼出した発声音
素を、音声処理部2の単語照合部で単語辞書と照合し、
ステップe12で手順を終了する。またステップe6の
後も、ステップe12で手順を終了する。
【0040】図8は、本発明の実施の第6形態として、
図3に示すような音声認識機能付ナビゲーション装置
で、予め設定されるM回目の音声信号の入力後に、さら
にJ回の音声信号の入力を行い、その後で一時保管され
た音声信号を用いて単語照合を行う手順を示す。ステッ
プf1からステップf9までは、図7の実施の第5形態
のステップe1からステップe9までと実質的に同等で
あるので、説明を省略する。ステップf10では、CP
U1は、音声処理部2からM+J回目の認識単語結果を
受信しているか否かを判断する。受信していないと判断
されるときには、単語辞書遷移テーブル4から次選択辞
書の選択および音声処理部2への送信を行い、ステップ
f10に戻る。ステップf10で、M+J回目の認識単
語結果を受信したと判断されるときには、ステップf1
2で、認識単語に対応した辞書遷移テーブルから次選択
辞書の選択および音声処理部2への送信を行う。音声処
理部2は、ステップf13で、一時保管メモリ12に一
時保管した発声音素を呼出し、ステップf14で呼出し
た発声音素を単語照合部で単語辞書と照合し、ステップ
f16で照合手順を終了する。MおよびNの値は、たと
えば入力部15から使用者によって入力される。
【0041】図9は、本発明の実施の第7形態として、
図3に示すような音声認識機能付ナビゲーション装置を
用いて、音声処理部2内で音声認識に用いる閾値の更新
を行う手順を示す。ステップg1で音声信号が入力され
ると、ステップg2で呼出した発声音素を単語辞書と照
合する。ステップg3では、認識された単語について使
用者が認識結果を修正しているか否かを判断する。修正
していると判断されるときには、ステップg4で、その
修正が初めての修正であるか否かを判断する。初めての
修正であると判断されるときには、ステップg5でその
ときに修正された単語認識の閾値をメモリに記憶する。
ステップg4で、初めての修正でないと判断されるとき
には、ステップg6で、そのときまでに修正された単語
の閾値を平均して記憶する。ステップg5またはステッ
プg6が終了すると、ステップg7に移り、予め設定さ
れる期間が経過しているか否かを判断する。期間経過と
判断されると、ステップg8に移り、照合に用いる閾値
をメモリに記憶された閾値に書換えを行う。ステップg
3で単語の修正がないと判断されるとき、またはステッ
プg7で設定期間が経過していないと判断されるとき、
あるいはステップg8で書換えを実行した後、ステップ
g9で手順を終了する。
【0042】図10は、本発明の実施の第8形態とし
て、音声認識処理の閾値を使用者から設定可能なナビゲ
ーション装置の部分的な電気的構成を示す。入力装置1
5は、ナビゲーション装置に通常用いられるリモコン装
置であり、ジョイスティックとテンキーなどを備える。
車載用のナビゲーション装置では、リモコンなどの入力
装置15には限られた機能を備えるのみであるので、C
PU1は表示部11で設定画面を表示させながら、閾値
設定部16での閾値の設定を行う。
【0043】図11は、図10に示すナビゲーション装
置での閾値の変更手順を示す。ステップh1からステッ
プh8までは、図9に示したステップg1からステップ
g8までと同等であるので、説明を省略する。本実施形
態では、ステップh7で設定期間が経過したと判断され
ないときに、ステップh9で使用者から入力装置15を
用いるマニュアル変更が行われているか否かを判断す
る。行われていると判断されるときには、ステップh1
0で、メモリされている閾値の内容をクリアし、マニュ
アル変更された閾値をそのまま使用する。ステップh3
で修正されていないと判断されるとき、ステップh9で
変更がないと判断されるとき、あるいはステップh8ま
たはステップh10の手順が終了すると、ステップh1
1で処理手順を終了する。
【0044】以上説明した各実施形態では、音声認識機
能付ナビゲーション装置に本発明を適用した場合につい
て説明しているけれども、音声入力に従って各種情報を
案内する装置に同様に適用することができる。特に情報
検索のキーとなる名称が多階層で指定されるときに、必
要最小限の発声で音声入力を行い、効率的に情報の案内
を受けることができる。
【0045】
【発明の効果】以上のように本発明によれば、指定名称
のみの発声で関連する情報のみの検索が行われ、複数種
類の情報が予め記憶されているときには、追加名称の発
声を行えば、1種類だけの情報が選択されるので、発声
の回数を減少させて装置の使い勝手を向上させることが
できる。指定名称として認識する単語の音素の組合せの
長さを短くして単語数を少なくし、同一の単語に複数種
類の情報が記憶されても、追加名称で選択することがで
きるので、辞書サイズを縮小し、単語照合時間の短縮を
図るとともに認識率を向上させることができる。
【0046】さらに本発明によれば、指定名称を音声信
号で入力する際に、指定名称を限定する追加名称の音声
信号による入力が促されるので、促された追加名称を入
力して指定名称に対応する情報の検索および選択を行う
ことができ、必要な単語のみを入力し、発声回数の減少
による使い勝手の向上を図ることができる。また、単語
を照合する音素の長さを短くして、辞書サイズの縮小
と、照合時間の短縮を図り、しかも認識率の向上を図る
ことができる。
【0047】さらに本発明によれば、先に指定名称を発
声し、追加名称について発声して音声入力を行うと、音
声認識は追加名称について先に行われて、一時保管され
た指定名称について音声認識されて対応する情報の案内
が行われるので、追加名称の入力の後で改めて指定名称
を入力する必要はなく、発声回数の減少と使い勝手の向
上を図ることができる。また、同一の単語について複数
種類の情報が記憶されていても、追加名称で複数種類か
ら1種類を選択することができるので、辞書サイズの縮
小および単語照合時間の短縮、ならびに認識率を向上を
図ることができる。
【0048】また本発明によれば、音声信号に含まれる
単語の辞書手段との照合結果が予め定める基準値を超え
るときに単語を一時保管するので、一致の程度が低い段
階で誤認識することを避け、一時保管された音声信号を
利用するので、音声信号入力を繰返して行う必要もな
く、認識率および使い勝手の向上を図ることができる。
【0049】また本発明によれば、複数種類の辞書を適
切に選択することができるので、1つの辞書当たりのサ
イズを小さくし、照合時間の短縮を図ることができると
ともに、単語の認識率の向上も図ることができる。
【0050】また本発明によれば、照合結果を表す数値
に従って、音声信号の一時保管と単語を照合する辞書の
選択とを行い、選択された辞書について一時保管された
音声信号に含まれる単語を用いて照合を行うので、単語
の入力を繰り返す必要はなく、複数の辞書のうちの適切
な辞書を用いて照合の認識率を向上させることができ
る。
【0051】また本発明によれば、辞書との照合結果に
基づいて一時保管される音声信号は、予め定める回数の
音声信号入力後に改めて辞書との照合を行うので、一時
保管されている間に行われた音声信号の入力結果を利用
して、認識率の向上を図ることができる。
【0052】また本発明によれば、音声信号を一時保管
するか否かを判断する基準値を、音声認識結果の適否に
ついての時系列的な記憶に基づいて更新するので、より
適切な基準となるように自動的に調整することができ
る。
【0053】また本発明によれば、音声入力された信号
を一時的に保管するか否かを判断する基準値を、設定手
段から設定することができるので、装置の使用者がより
適切な認識結果を得られるように基準値を設定すること
ができる。
【0054】また本発明によれば、地図情報の案内を施
設名称で解りやすく行い、同一の施設名称が異なる都道
府県などに存在するときには、各都道府県名称を追加名
称として入力して確実に目的とする施設名称についての
地図情報の案内を行わせることができる。
【図面の簡単な説明】
【図1】本発明の実施の第1形態としての音声認識機能
付ナビゲーション装置の概略的な電気的構成を示すブロ
ック図である。
【図2】図1の実施形態の音声認識処理手順を示すフロ
ーチャートである。
【図3】本発明の実施の第2形態としての音声認識機能
付ナビゲーション装置の概略的な電気的構成を示すブロ
ック図である。
【図4】図3の実施形態の音声認識処理手順を示すフロ
ーチャートである。
【図5】本発明の実施の第3形態としての音声認識処理
手順を示すフローチャートである。
【図6】本発明の実施の第4形態としての音声認識処理
手順を示すフローチャートである。
【図7】本発明の実施の第5形態としての音声認識処理
手順を示すフローチャートである。
【図8】本発明の実施の第6形態としての音声認識処理
手順を示すフローチャートである。
【図9】本発明の実施の第7形態としての音声認識の際
の閾値を自動的に修正する手順を示すフローチャートで
ある。
【図10】本発明の実施の第8形態としての音声認識機
能付ナビゲーション装置の概略的な電気的構成を示すブ
ロック図である。
【図11】図10の実施形態の処理手順を示すフローチ
ャートである。
【符号の説明】
1 CPU 2 音声処理部 3 単語辞書格納部 4 単語辞書遷移テーブル 6 マイクロホン 8 スピーカ 11 表示部 12 メモリ 13 一時保管メモリ 14 カウンタ 15 入力装置 16 閾値設定部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI G06F 15/403 350C

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 複数の名称についての情報が各名称毎に
    1または複数種類ずつ予め記憶され、使用者から指定さ
    れる指定名称について記憶されている情報を用いる案内
    を行う装置であって、 音声信号が入力され、音声信号中に含まれる名称を認識
    する音声認識手段と、音声認識手段によって認識される
    指定名称について、予め記憶されている情報を検索する
    情報検索手段と、 情報検索手段によって検索される情報が複数種類あると
    き、複数種類から1種類を選択するための追加名称の音
    声による入力を促す出力を行い、音声認識手段によって
    認識される追加名称に従って情報を1種類だけ選択する
    情報選択手段と、 音声信号で入力された指定名称について、情報検索手段
    によって1種類だけ検索される情報、または情報選択手
    段によって1種類だけ選択される情報を案内する情報案
    内手段とを含むことを特徴とする音声認識機能付案内装
    置。
  2. 【請求項2】 複数の名称についての情報が各名称毎に
    1または複数種類ずつ予め記憶され、使用者から指定さ
    れる指定名称について記憶されている情報を用いる案内
    を行う装置であって、 音声信号が入力され、音声信号中に含まれる名称を認識
    する音声認識手段と、音声認識手段に音声信号で指定名
    称を入力する際に、指定名称を限定する追加名称の音声
    信号による入力を促す音声処理手段と、 音声認識手段によって認識される指定名称について、予
    め記憶されている情報を検索する情報検索手段と、 情報検索手段によって検索される情報が複数種類あると
    き、音声認識手段によって認識される追加名称に従って
    情報を1種類だけ選択する情報選択手段と、 音声信号で入力された指定名称について、情報検索手段
    によって1種類だけ検索される情報、または情報選択手
    段によって1種類だけ選択される情報を案内する情報案
    内手段とを含むことを特徴とする音声認識機能付案内装
    置。
  3. 【請求項3】 複数の名称についての情報が各名称毎に
    1または複数種類ずつ予め記憶され、使用者から指定さ
    れる指定名称について記憶されている情報を用いる案内
    を行う装置であって、 音声信号が入力され、音声信号中に含まれる名称を認識
    する音声認識手段と、指定名称についての音声信号を一
    時的に保管する一時保管手段と、 指定名称に続いて、指定名称を限定する追加名称につい
    ての音声信号が音声認識手段に入力されるとき、追加名
    称が認識された後で一時保管手段に保管されている指定
    名称についての音声信号を音声認識手段によって認識さ
    せる音声処理手段と、 音声認識手段によって認識される指定名称について、予
    め記憶されている情報を検索手段と、 情報検索手段によって検索される情報が複数種類あると
    き、音声認識手段によって認識されている追加名称に従
    って情報を1種類だけ選択する情報選択手段と、 音声信号で入力された指定名称について、情報検索手段
    によって1種類だけ検索される情報、または情報選択手
    段によって1種類だけ選択される情報を案内する情報案
    内手段とを含むことを特徴とする音声認識機能付案内装
    置。
  4. 【請求項4】 前記指定名称および追加名称に対応する
    単語について、基準となる音声信号を予め記憶する辞書
    手段を備え、 前記音声認識手段は、音声信号に含まれる単語と辞書手
    段に記憶される基準となる音声信号とを比較し、不一致
    の程度を表す数値を照合結果として出力し、 前記一時保管手段は、音声認識手段からの照合結果を表
    す数値が予め定める基準値を超えるとき、前記音声信号
    の一時保管を行うことを特徴とする請求項3記載の音声
    認識機能付案内装置。
  5. 【請求項5】 前記辞書手段は、前記指定名称または前
    記追加名称に対応する複数種類の辞書を有し、 前記音声認識手段は、前記単語と1つの辞書を選択した
    辞書手段との照合結果を表す数値に従って、次に使用す
    べき辞書の選択を行うことを特徴とする請求項4記載の
    音声認識機能付き案内装置。
  6. 【請求項6】 前記音声認識手段は、前記単語の照合結
    果を表す数値に従って、該単語を含む音声信号の前記一
    時保管手段による一時保管と、前記辞書手段での辞書の
    選択とを行い、一時保管された音声信号に含まれる単語
    に対して、選択された辞書を用いて照合を行うことを特
    徴とする請求項5記載の音声認識機能付案内装置。
  7. 【請求項7】 前記音声認識手段は、音声信号が予め定
    める回数入力された後で、前記一時保管された音声信号
    に含まれる単語に対して、選択された辞書を用いて照合
    を行うことを特徴とする請求項6記載の音声認識機能付
    案内装置。
  8. 【請求項8】 前記指定名称についての音声認識手段の
    認識結果の適否を時系列的に記憶する結果記憶手段と、 結果記憶手段に記憶されている認識結果の適否に基づい
    て、前記基準値を減少あるいは増加させるようにそれぞ
    れ更新する更新手段とをさらに含むことを特徴とする請
    求項4〜7のいずれかに記載の音声認識機能付案内装
    置。
  9. 【請求項9】 前記基準値を設定する設定手段をさらに
    含むことを特徴とする請求項4〜8のいずれかに記載の
    音声認識機能付案内装置。
  10. 【請求項10】 前記指定名称は、施設名称であり、 前記追加名称は都道府県名称であり、 前記情報案内手段は、地図情報の案内を行うことを特徴
    とする請求項1〜9のいずれかに記載の音声認識機能付
    案内装置。
JP10047772A 1998-02-27 1998-02-27 音声認識機能付案内装置 Pending JPH11250078A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10047772A JPH11250078A (ja) 1998-02-27 1998-02-27 音声認識機能付案内装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10047772A JPH11250078A (ja) 1998-02-27 1998-02-27 音声認識機能付案内装置

Publications (1)

Publication Number Publication Date
JPH11250078A true JPH11250078A (ja) 1999-09-17

Family

ID=12784684

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10047772A Pending JPH11250078A (ja) 1998-02-27 1998-02-27 音声認識機能付案内装置

Country Status (1)

Country Link
JP (1) JPH11250078A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003527631A (ja) * 2000-03-15 2003-09-16 バイエリッシェ モートーレン ウエルケ アクチエンゲゼルシャフト 目的案内システム内に定義されている入力ダイアログを使って目的地を言語入力するための装置及び方法
JP2016191739A (ja) * 2015-03-30 2016-11-10 株式会社エヌ・ティ・ティ・データ 発音誤り検出装置、方法およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003527631A (ja) * 2000-03-15 2003-09-16 バイエリッシェ モートーレン ウエルケ アクチエンゲゼルシャフト 目的案内システム内に定義されている入力ダイアログを使って目的地を言語入力するための装置及び方法
JP4928701B2 (ja) * 2000-03-15 2012-05-09 バイエリッシェ モートーレン ウエルケ アクチエンゲゼルシャフト 目的案内システム内に定義されている入力ダイアログを使って目的地を言語入力するための方法
JP2016191739A (ja) * 2015-03-30 2016-11-10 株式会社エヌ・ティ・ティ・データ 発音誤り検出装置、方法およびプログラム

Similar Documents

Publication Publication Date Title
US5797116A (en) Method and apparatus for recognizing previously unrecognized speech by requesting a predicted-category-related domain-dictionary-linking word
US6385582B1 (en) Man-machine system equipped with speech recognition device
US7826945B2 (en) Automobile speech-recognition interface
US7027985B2 (en) Speech recognition method with a replace command
US8380505B2 (en) System for recognizing speech for searching a database
US8195461B2 (en) Voice recognition system
US20050273337A1 (en) Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition
US6961706B2 (en) Speech recognition method and apparatus
US20080162137A1 (en) Speech recognition apparatus and method
KR101526918B1 (ko) 다언어 이국 음성 인식
US20050033575A1 (en) Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer
JPH11505037A (ja) 言語認識装置の信頼性向上方法
US9123327B2 (en) Voice recognition apparatus for recognizing a command portion and a data portion of a voice input
JP2002511154A (ja) ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム
US7240008B2 (en) Speech recognition system, program and navigation system
US6963834B2 (en) Method of speech recognition using empirically determined word candidates
JP2002123290A (ja) 音声認識装置ならびに音声認識方法
JP4661239B2 (ja) 音声対話装置及び音声対話方法
JP5396426B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP4639990B2 (ja) 音声対話装置及び音声理解結果生成方法
JP4684583B2 (ja) 対話装置
JPH11250078A (ja) 音声認識機能付案内装置
JPH07319383A (ja) 地図表示装置
JP3296783B2 (ja) 車載用ナビゲーション装置および音声認識方法
JP3790038B2 (ja) サブワード型不特定話者音声認識装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050224

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080422

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080620

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080918

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20081030

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20090123