JPH09230889A - 音声認識応答装置 - Google Patents

音声認識応答装置

Info

Publication number
JPH09230889A
JPH09230889A JP8036033A JP3603396A JPH09230889A JP H09230889 A JPH09230889 A JP H09230889A JP 8036033 A JP8036033 A JP 8036033A JP 3603396 A JP3603396 A JP 3603396A JP H09230889 A JPH09230889 A JP H09230889A
Authority
JP
Japan
Prior art keywords
vocabulary
recognition
holding means
dictionary
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8036033A
Other languages
English (en)
Inventor
Toshiyuki Odaka
俊之 小高
Zuhaeru Toraberushi
トラベルシ・ズハエル
Akio Amano
明雄 天野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP8036033A priority Critical patent/JPH09230889A/ja
Publication of JPH09230889A publication Critical patent/JPH09230889A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 (修正有) 【課題】従来の登録単語に相当する単語を保持する内部
辞書保持手段の他に、外部辞書保持手段を設け、利用者
が誤って知らずに発声した登録外単語の入力に対して、
入力された単語が登録外単語であるというような利用者
にとって有効な応答をして対処が可能な音声認識応答装
置。 【解決手段】アプリケーションに依存した登録語彙を保
持する内部辞書保持手段104と、登録語彙と同じ種類
の語彙でありアプリケーションとは独立な登録外の語彙
を保持する外部辞書保持手段105とを備え、アプリケ
ーション制御手段101は、内部辞書保持手段104の
保持する語彙と、外部辞書保持手段105の保持する語
彙とを合わせて認識対象語彙として音声認識手段102
に渡し、かつアプリケーション制御手段101は、該音
声認識手段102から得る認識結果が外部辞書保持手段
101の保持する語彙に含まれる場合にその旨の内容を
応答出力手段102を介し利用者に示す。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報処理装置に係
り、特に、マンマシンインタフェース部分のデータ入力
手段として音声認識を利用する場合に、利用者と装置と
の対話操作を向上させるための音声認識利用技術に関す
るものである。
【0002】
【従来の技術】音声認識応答装置は、情報検索など何ら
かのタスクが想定されており、利用者が音声で問い合わ
せると、結果を音声で、場合によっては、文字や画像で
示す装置である。
【0003】従来の音声応答装置は、ある場面で音声認
識できる対象語彙は予め登録された範囲内での1通りの
語彙であり、例え同じ種類(例えば人名)の単語であっ
ても、予め登録されていない単語は決して正しく認識で
きない。この場合、音声応答装置は登録された単語内で
類似の単語に誤認識した結果を示したり、あるいは登録
単語内で該当なし(リジェクション)という結果を示
す。利用者が繰り返し発声しても結果は同じことの繰り
返しである。
【0004】一方、利用者側からみると、誤認識された
りリジェクトされる単語が、単に装置の性能が低くて認
識できない単語であるのか、利用者の発声が悪いのか、
または他の要因なのかを知る術はなく、システムの不便
さを感じながらも、何度も発声を繰り返して、恐らくし
ばらくして諦めて利用を中断することになる。
【0005】
【発明が解決しようとする課題】上記のような従来の音
声認識応答装置において、登録外の単語が入力された場
合に対処することが課題となる。
【0006】本発明の目的は、従来の登録単語に相当す
る単語を保持する内部辞書保持手段の他に、外部辞書保
持手段を設けることにより、利用者が誤ってあるいは知
らずに発声した登録外単語の入力に対して、入力された
単語が登録外単語であるというような利用者にとって有
効な応答をして対処することが可能な音声認識応答装置
を提供することにある。
【0007】
【課題を解決するための手段】本発明によれば、アプリ
ケーションに依存した登録語彙からなる内部辞書保持手
段の保持する語彙と、前記登録語彙と同じ種類の語彙で
あってアプリケーションとは独立な登録外の語彙からな
る外部辞書保持手段の保持する語彙とを合わせて認識対
象語彙とし、該認識対象語彙を音声認識手段に渡し、あ
るいは、該音声認識手段から得られる認識結果が前記外
部辞書に含まれる単語である場合にその旨の内容を応答
出力手段に伝えるアプリケーション制御手段を設けた音
声認識応答装置が提供される。
【0008】
【発明の実施の形態】図1は、本発明の音声認識応答装
置の一実施例を示すブロック図である。アプリケーショ
ン制御手段101は、内部辞書保持手段104に保持さ
れた語彙(以後、内部辞書と呼ぶ)と外部辞書保持手段
105に保持された語彙(以後、外部辞書と呼ぶ)を合
わせて、認識対象語彙として音声認識手段102に送
る。内部辞書と外部辞書は対になっており、この対を複
数備えても良い。アプリケーションが場面設定可能な場
合には、1つの場面毎に内部辞書と外部辞書の対を用意
し、場面毎に異なる内部辞書と外部辞書を音声認識手段
102に送る。ここで、アプリケーション制御手段10
1は、内部辞書と外部辞書を単純に組み合わ、音声認識
手段102へは1つの辞書(認識対象語彙201)とし
て送れば良い。辞書の中身は、例えば図2に示すような
単語の平仮名表記で良い。本発明は、この表記を限定す
るものではなく、音声認識手段102の入力としてその
まま使えるか、あるいは認識語彙の形に変換可能なもの
であれば良い。
【0009】利用者の音声202は、音声認識手段10
2で認識される。本発明における音声認識手段102
は、利用者の音声202と認識させたい単語のリスト
(認識対象語彙201)を入力とし、そのリストの中で
尤もらしい単語を1つあるいは上位複数個を認識結果2
03として出力する。音声認識処理は、認識語彙を平仮
名で表記した場合、例えば、音節を単位モデルとするH
MM(Hidden Markov Model)により実現可能である。
音節を単位モデルとした場合、音節1つを平仮名1文字
に対応付けることができる。ただし、本発明は、単位モ
デルの決め方は限定しない。HMMによる音声認識処理
は公知であり、詳細は省略する。例えば、”中川著:確
立モデルによる音声認識、電子情報通信学会”に詳しく
説明されている。
【0010】音声認識手段102は、認識対象語彙20
1として前記内部辞書と外部辞書を特に区別して扱う必
要はない。すなわち、音声認識手段102から出力され
る認識結果203も、内部辞書と外部辞書を特に区別し
て扱われる必要はない。認識結果203は、アプリケー
ション制御手段101に渡される。アプリケーション制
御手段101において、認識結果203が内部辞書と外
部辞書のどちらに含まれているかを調べる。認識結果2
03が内部辞書に含まれる場合は、アプリケーションの
次の処理に進む。例えば従来の音声認識応答装置でも可
能なように、認識した内容を利用者に確認する応答(例
えば「さいとうですか」)を応答出力手段103を介し
て行う。一方、認識結果203が内部辞書には含まれず
外部辞書に含まれる場合は、登録外の期待していない間
違った入力であったことを伝えるような応答を応答出力
手段103を介して行う。例えば、アプリケーション制
御手段101で、入力された音声に対して図2における
内部辞書保持手段104に登録された名前が期待されて
いる際に、外部辞書保持手段105に登録された名前
「すずき」が認識結果として得られた場合には、装置は
利用者にに対して「こちらには”すずき”さんは登録さ
れていません」というような応答を応答出力手段103
を介して出力する。利用者は、このメッセージを参照す
ることにより、自分の発声した音声に不備はないことを
知ると共に、システムに対する信頼性が増し、スムーズ
な対話操作が行える。
【0011】更に別な場合として、利用者の発声した単
語が内部辞書及び外部辞書のいずれにも登録されていな
い場合には、アプリケーション制御手段101中に含ま
れる図示しないプログラムによって、その認識結果を外
部辞書に新たに登録する。利用者の発声した単語が内部
辞書及び外部辞書のいずれにも登録されていないこと
は、連続した誤認識の一定回数以上の繰り返し(特開昭
62-39899)や、認識結果なしが一定回数以上の繰り返し
た場合、あるいは内部辞書及び外部辞書の登録語を順番
に提示して利用者に選択させようとした際に利用者がい
ずれも選択しなかった場合などにより決定できる。
【0012】新たに外部辞書へ登録する際の利用者と装
置との対話操作の手順を、名前の登録を例にして、図3
のフローチャートに示す。図3において、利用者の発声
した単語が内部辞書及び外部辞書のいずれにも登録され
ていない場合、本装置の応答出力手段103から「その
ような名前の者はこちらにはおりません」というメッセ
ージを出力する(ステップ301)。続いて、未登録の
名前を新規に外部辞書に登録するために、装置は認識で
きなかった名前を1文字ずつ入力するようメッセージを
出力する。対話操作を重視し、利用者が対応可能か否か
を確認するため、例えば「辞書に名前を新規登録します
ので、先程入力した名前を1文字ずつ入力して下さい。
時間はありますか?」というようなメッセージを出力す
る(ステップ302)。このメッセージに対し、利用者
から「はい」などの同意の入力があれば(ステップ30
3)、利用者から単音節認識あるいは、装置からの提示
に対して選択的に一文字ずつ新規単語を獲得し(ステッ
プ304)、外部辞書に新規に追加登録する(ステップ
305)。また、利用者から「いいえ」などの拒否の入
力があれば(ステップ303)、利用者に対して、「よ
ろしければ、次の機会に新規登録にご協力下さい」とい
うようなメッセージを出力し(ステップ306)、新規
登録時の対話操作を終了する。応答出力手段103は、
入力される応答内容を、音声合成処理により音声に変換
して利用者に伝えたり、文字として表示して利用者に伝
える。以上により、本発明の音声認識応答装置は実現で
きる。
【0013】図2では、本発明における外部辞書と内部
辞書の一例を示している。具体的には、内部辞書が人名
であるときに、外部辞書として出現頻度が多い人名のリ
ストを用いることができることを示している。
【0014】また、内部辞書が人名であるときの別な例
として、外部辞書として内部辞書含まれる人名の読み間
違いしやすい読み方のリストを用いることができる。
【0015】さらにまた、内部辞書が人名であるときの
別な例として、外部辞書として過去のいづれかの時期に
内部辞書含まれ、ある更新の時点で削除された人名のリ
ストを用いることができる。例えば、異動に伴い発生し
うる状況である。
【0016】人名以外にも会社名や部署名等に対して
も、同様なリストを用意することができる。
【0017】内部辞書がある鉄道会社の路線名/駅名で
あるときに、外部辞書として別な鉄道会社の路線名/駅
名リストを用いることができる。
【0018】以上のような組み合わせにより、様々な登
録外の単語の音声入力に対して、柔軟な対応ができるよ
うになる。
【0019】
【発明の効果】本発明によれば、音声認識応答装置が、
利用者による登録外の単語の音声入力に対して、その入
力を認識し、間違いを指摘するなどの対処ができるよう
になる。また、利用者は、間違えに気付いて正しく言い
直したり、別な表現で言い直すことができるようにな
り、装置の利用効率が向上する効果(利用完了までの時
間の短縮など)が得られる。
【図面の簡単な説明】
【図1】本発明による音声認識応答装置の一実施例を示
すブロック図である。
【図2】本発明における内部辞書と外部辞書の一実施例
を示す図である。
【図3】本発明における外部辞書登録時の対話操作手順
を示す図である。
【符号の説明】
101…アプリケーション制御手段、102…音声認識
手段、103…応答出力手段、104…内部辞書保持手
段、105…外部辞書保持手段、106…音響モデル保
持手段、201…認識対象語彙、202…音声、203
…認識結果、204…応答内容、205…文字、206
…音声。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】音声を取り込み、与えられた認識対象語彙
    と音響モデルを組み合わせて得られる認識対象語彙の標
    準パターンと前記取り込んだ音声とを比較して、一つあ
    るいは複数の認識結果を出力する音声認識手段と、上記
    認識対象語彙を前記音声認識手段へ伝達し、上記認識対
    象語彙の認識結果に対して応答すべき内容を生成するア
    プリケーション制御手段と、該アプリケーション制御手
    段から生成された応答内容を音声あるいは文字情報とし
    て出力する応答出力手段からなる音声認識応答装置にお
    いて、 アプリケーションに依存した登録語彙を保持する内部辞
    書保持手段と、登録語彙と同じ種類の語彙であってアプ
    リケーションとは独立な登録外の語彙を保持する外部辞
    書保持手段とを備え、前記アプリケーション制御手段
    は、内部辞書保持手段の保持する語彙と、外部辞書保持
    手段の保持する語彙とを合わせて認識対象語彙として前
    記音声認識手段に渡し、かつ前記アプリケーション制御
    手段は、該音声認識手段から得られる認識結果が前記外
    部辞書保持手段の保持する語彙に含まれる場合にその旨
    の内容を応答出力手段に伝えることを特徴とする音声認
    識応答装置。
  2. 【請求項2】前記内部辞書保持手段と外部辞書保持手段
    の対を複数備え、アプリケーション制御手段はアプリケ
    ーションの場面に応じて前記複数の対のいずれかを選択
    して用いることを特徴とする前記請求項1記載の音声認
    識応答装置。
  3. 【請求項3】前記外部辞書保持手段の保持する語彙は、
    音声認識応答装置が利用されている間でも更新可能であ
    ることを特徴とする前記請求項1および2記載の音声認
    識応答装置。
JP8036033A 1996-02-23 1996-02-23 音声認識応答装置 Pending JPH09230889A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8036033A JPH09230889A (ja) 1996-02-23 1996-02-23 音声認識応答装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8036033A JPH09230889A (ja) 1996-02-23 1996-02-23 音声認識応答装置

Publications (1)

Publication Number Publication Date
JPH09230889A true JPH09230889A (ja) 1997-09-05

Family

ID=12458412

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8036033A Pending JPH09230889A (ja) 1996-02-23 1996-02-23 音声認識応答装置

Country Status (1)

Country Link
JP (1) JPH09230889A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004252121A (ja) * 2003-02-20 2004-09-09 Sony Corp 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体
JP2010044240A (ja) * 2008-08-13 2010-02-25 Kddi Corp 音声認識装置およびプログラム
US7813928B2 (en) 2004-06-10 2010-10-12 Panasonic Corporation Speech recognition device, speech recognition method, and program
US8195461B2 (en) 2006-12-15 2012-06-05 Mitsubishi Electric Corporation Voice recognition system
JP2014145842A (ja) * 2013-01-28 2014-08-14 Fujitsu Ltd 発話解析装置、音声対話制御装置、方法、及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004252121A (ja) * 2003-02-20 2004-09-09 Sony Corp 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体
US7813928B2 (en) 2004-06-10 2010-10-12 Panasonic Corporation Speech recognition device, speech recognition method, and program
US8195461B2 (en) 2006-12-15 2012-06-05 Mitsubishi Electric Corporation Voice recognition system
JP2010044240A (ja) * 2008-08-13 2010-02-25 Kddi Corp 音声認識装置およびプログラム
JP2014145842A (ja) * 2013-01-28 2014-08-14 Fujitsu Ltd 発話解析装置、音声対話制御装置、方法、及びプログラム

Similar Documents

Publication Publication Date Title
JP3542026B2 (ja) 音声認識システム、音声認識方法およびコンピュータ可読な記録媒体
US5794204A (en) Interactive speech recognition combining speaker-independent and speaker-specific word recognition, and having a response-creation capability
US5832063A (en) Methods and apparatus for performing speaker independent recognition of commands in parallel with speaker dependent recognition of names, words or phrases
JP3284832B2 (ja) 音声認識対話処理方法および音声認識対話装置
JP6540414B2 (ja) 音声処理装置および音声処理方法
JP2000122691A (ja) 綴り字読み式音声発話の自動認識方法
JPH09230889A (ja) 音声認識応答装置
JP3468572B2 (ja) 対話処理装置
JP4220151B2 (ja) 音声対話装置
JP7414078B2 (ja) 変換テーブル生成装置、音声対話システム、変換テーブル生成方法、およびコンピュータプログラム
JP4347716B2 (ja) 音声認識サーバ、音声入力システム、及び、音声入力方法
JPH0863185A (ja) 音声認識装置
JP2001013992A (ja) 音声理解装置
JPH11175093A (ja) 音声認識確認応答方法
JP2000242642A (ja) 翻訳処理方法及び翻訳処理装置
JPS59144946A (ja) 音声タイプライタ制御方式
JPH09288495A (ja) ボタン指定・音声認識併用型入力方法及び装置
JPH1195792A (ja) 音声処理装置および文字入力方法
JPH08110790A (ja) 音声認識装置
JPH11237894A (ja) 言語理解方法及び言語理解装置
JPH0667688A (ja) 入力装置
JP2000132184A (ja) 音声認識装置、音声認識方法および音声認識プログラムを記録した記録媒体
JPWO2017191710A1 (ja) 対話装置、対話装置の制御方法、および制御プログラム
JPH04344930A (ja) 音声ガイダンス出力方式
JP2005148764A (ja) 音声認識対話処理方法および音声認識対話装置