JPS59214899A - 連続音声認識応答方法 - Google Patents

連続音声認識応答方法

Info

Publication number
JPS59214899A
JPS59214899A JP58089109A JP8910983A JPS59214899A JP S59214899 A JPS59214899 A JP S59214899A JP 58089109 A JP58089109 A JP 58089109A JP 8910983 A JP8910983 A JP 8910983A JP S59214899 A JPS59214899 A JP S59214899A
Authority
JP
Japan
Prior art keywords
recognition
digit
incorrect
voice
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58089109A
Other languages
English (en)
Other versions
JPH0552518B2 (ja
Inventor
畑岡 信夫
浅川 吉章
小松 昭男
市川 熹
梅村 和裕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP58089109A priority Critical patent/JPS59214899A/ja
Publication of JPS59214899A publication Critical patent/JPS59214899A/ja
Publication of JPH0552518B2 publication Critical patent/JPH0552518B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、連続音声認識装置において、認識結果の訂正
に要する時間を低減するに好適な連続音声認識応答方式
に関する。
〔発明の背景〕
従来の音声認識装置における連続音声認識の認識結果の
訂正方法は(例えば銀行テレフォンサービスの数字gQ
を取りあげれば)、利用者の確認で認識結果が誤ってい
る場合、1桁ずつ認識結果を出力しては利用者の確認を
待ち、その桁が誤っていない場合は次の桁へ行き、誤っ
ている場合はもう一度その桁の内容を入力してもらい、
認@結果を確認、訂正しで行くという方法をとっている
従って、例えば1桁しか誤っていない場合などは確認・
訂正の仕方に無駄があり、かつ桁数が多い場合は訂正に
かなりの時間を要するといった問題があった。
〔発明の実施例〕
第1図は連続4桁数字の認識実験において、4桁数字の
誤りの中で、誤っている桁数の内訳を示しだものである
。4桁数字の誤りとは連続4桁数字で1桁でも誤ったも
のを言う。この図から、4桁数字の誤りのうち約70%
近くが4術中1桁のエラーで誤りとなっていることがわ
かる。従って最初から1桁ずつ確認して訂正する従来の
連続数字認識装置の訂正方法では、訂正のうち約2/3
強が正しい残りの3桁に関しでも確認を行うという無駄
が生じ、結果として訂正に要する時間が必要以上にかか
っていた。第2図は入力音声を連続5桁数字として、2
桁目の「1」のみが誤っていた場合の従来の訂正手順の
フローチャートを表わしたものである。システム側(認
識装置側応答)と利用者側(入力)のやシとりにおいて
、正しい桁までも確認しているのがわかる。
〔発明の目的〕
本発明の目的は上記の問題を解決し、効率が良く、かつ
所要時間を低減した連続音声認識装置の訂正方法を提供
することにある。
〔発明の概要〕
この目的を達成するために、本発明ではまず第1の方法
として、認識結果のあやしい音声あるいは桁のみを訂正
して再出力することを、第2の方法として、利用者から
の誤った桁の指定と本来の内容の再入力を行うことを特
徴としている。
〔発明の実施例〕
まず、本発明の原理について説明する。
第3図は本発明の第1の方法による訂正の手順を表わす
フローチャートである。第1の方法は、システム側が自
動的に誤っていると思われる桁の内容を訂正して出力し
、再確認するというものである。例えば、5桁連続数字
「01234Jが入力され、2桁目の「1」が誤って認
識された場合、利用者からの確認「いいえ」により、シ
ステム側は本発明の訂正処理に入り、間違ったと思われ
る桁を訂匿して出力し、再確認を行う。その結果、再び
誤っている場合は、従来の1個ずつの訂正処理を行う。
1個ずつの訂正処理を行う場合とじては、本発明による
訂正がうまく行かなかった(例えば訂正する桁や訂正し
た音声内容が再び誤った)時とそもそも2個以上の音声
が誤っていた場合などが考えられる。誤っていると思わ
れる桁の選び方は、認識処理実行の結果得られる第1位
と第2位の候補音声間の距離差(あるいは類似度差)が
前もって定めたしきい値よりも小さい桁がある場合、そ
の桁の第2位候補を新しい認識結果とすることや、誤認
識のおきやすい音声間の取り換えなどが考えられる。
第4図は本発明の第2の方法による訂正の手順を表わす
フローチャートである。第2の方法は、利用者から間違
っている桁と本来の音声内容とを組にして入力してもら
うものである。第4図の例では入力[01234Jの2
桁目が誤っている場合、利用者からr2 、IJと間違
っている桁と数字を組合せて入力してもらい、訂正を行
っている。
再確認の結果、再び誤った場合は従来の1桁ずつの訂正
処理を行う。
以上で述べた本発明の訂正処理による、時間短縮に関し
て詳細に説明する。
まず、システム側の応答(例えば、「o1234デスネ
?jなど)に費す時間をtout、利用者の入力(例え
ば「ハイ」など)に費す時間をtin入力と応答との間
の時間をtmとして、従来の訂正処理にかかわる時間は
、第2図の処理フローから、 T=8t   +7t   +14t     (1)
In            ff+ となり、本発明による訂正処理にかかる時間は第3図と
第4図に示したフローチャートから第1の方法;T1=
t。l+tl。+2t、   (2+第2の方法; T
2=2 tou、+3t、n+4 tm  (3)とな
る。1.、u、1.1  の値は応答が文章でl   
   In      m あり、入力が単語、間はシステム側の処理時間などを考
慮すると概算的に t、、、、t=2秒’kin″′:
0.3秒、t さ0.5秒となる0 従って(1)〜(
3)式T=25.1秒 T1=3.3秒 T2=6.9秒 となり、従来の方法と比較して、本発明の第1の方法で
は約1/8.第2の方法では約1/4の時間短縮が可能
になる。
以下、本発明の具体的実施例を詳細に説明する。
第5図は、本発明を用いた音声認識応答装置の一実施例
のブロック図である。電話器5oによる入力音声51が
公知のリレ一部52を1経で、音声入力部(AIN)5
3にて折9返し雑音を除去された後サンプリングされ、
アナログ値からディジタル値に変換される。音声入力部
53は低域沖波器とA/[)変換器などで構成される。
その後、公知のリンク部(LNK)54にて入力回線が
減らされ、公知の音声認識部(SRU)55にて入力音
声の特徴パラメータ抽出、認識処理が行われ、候補音声
の選択がされる。主制御部(MCP)56はリンク部5
4、音声認識部55の制御、回線の管理、上位処理装置
(音声認識応答制御部57)との間のデータ送信部を担
当するもので、マイクロプロセッサにより構成される。
音声認識応答制御部(SRUC)57は音声認識部55
と音声応答部(ARU)58との間のデータ送受信のだ
めのインタフェースで、訂正に使われるシステム側の応
答(例えば「1桁ずつ確認します」など)をリレ一部5
2を経て出力させる制御も担当しでいる。公知の音声応
答部58は上位の応答(例えば「こちらは(−)○銀行
テレフォンサービスセンタです」など)をリレ一部52
を経て、音声応答59を出力させる。本実施例では音声
応答の応答速度を求める目的で、音声応答の制御を音声
認識応答制御部57と音声応答部58とに分担さぜたが
、音声応答部58のみに担当さぜることも可能であるこ
とはいうまでもない。
〔発明の効果〕
本発明によれば連続音声認識装置での認識結果の訂正に
要する時間が従来よりも大幅に短縮されるので、効率の
良い音声認識応答装置の実現が可能となる。ちなみに、
従来の訂正に要する時間を字の誤シの中で、誤っている
桁数の内訳を示す図、第2図は従来の訂正処理の内容を
示すフローチャー4、第3図と第4図は本発明による訂
正処理のフローチャート、第5図は本発明の一実施例を
表わす音声認識応答装置のブロック構成図である。
47・・・・・・音声認識応答制御部 48・・・・・・音声応答部 あ  /  l /   2  .3  4(液7n憤)$ 2 17 入力 ’012.34ヨ 83 図 メ1

Claims (1)

  1. 【特許請求の範囲】 1、話者により連続して発声された複数の単語からなる
    音声を認識する連続音声認識装置において、認識結果を
    確認する第1のステップと、認識結果が誤りと確認され
    た場合には誤認識された単語を選定する第2のステップ
    と、選定された単語を訂正した後の認識結果を再確認す
    る第3のステップとからなることを特徴とする連続音声
    認識応答方式。 2、上記第2のステップは各単語と類似した単語との類
    似性にもとづきおこなわれることを特徴とする特許請求
    の範囲第1項の連続音声認識応答方式。 3、上記第2のステップは話者の指示にもとづきおこな
    われることを特徴とする特許請求の範囲第1項の連続音
    声認識応答方式。 4、上記第3のステップは再確認の結果が誤りであった
    ときに各単語の認識結果を順次確認しで誤りの訂正をお
    こなう処理を含むことを特徴とする特許請求の範囲第1
    項の連続音声認識応答方式。
JP58089109A 1983-05-23 1983-05-23 連続音声認識応答方法 Granted JPS59214899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58089109A JPS59214899A (ja) 1983-05-23 1983-05-23 連続音声認識応答方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58089109A JPS59214899A (ja) 1983-05-23 1983-05-23 連続音声認識応答方法

Publications (2)

Publication Number Publication Date
JPS59214899A true JPS59214899A (ja) 1984-12-04
JPH0552518B2 JPH0552518B2 (ja) 1993-08-05

Family

ID=13961720

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58089109A Granted JPS59214899A (ja) 1983-05-23 1983-05-23 連続音声認識応答方法

Country Status (1)

Country Link
JP (1) JPS59214899A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003316386A (ja) * 2002-04-24 2003-11-07 Toshiba Corp 音声認識方法および音声認識装置および音声認識プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58186836A (ja) * 1982-04-26 1983-10-31 Nec Corp 音声入力デ−タ処理装置
JPS59121400A (ja) * 1982-12-28 1984-07-13 富士通株式会社 音声処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58186836A (ja) * 1982-04-26 1983-10-31 Nec Corp 音声入力デ−タ処理装置
JPS59121400A (ja) * 1982-12-28 1984-07-13 富士通株式会社 音声処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003316386A (ja) * 2002-04-24 2003-11-07 Toshiba Corp 音声認識方法および音声認識装置および音声認識プログラム

Also Published As

Publication number Publication date
JPH0552518B2 (ja) 1993-08-05

Similar Documents

Publication Publication Date Title
US5212821A (en) Machine-based learning system
JP2527168B2 (ja) 音響信号から導かれた電気信号を区分する方法及び装置
EP3444819B1 (en) Voice signal cascade processing method and terminal, and computer readable storage medium
US5751902A (en) Adaptive prediction filter using block floating point format and minimal recursive recomputations
US4589131A (en) Voiced/unvoiced decision using sequential decisions
US5495553A (en) Recognizer for recognizing voice messages in pulse code modulated format
JPH0819008A (ja) トーン検出確認方法
JPS59214899A (ja) 連続音声認識応答方法
CN112233679B (zh) 一种人工智能语音识别***
JP2585547B2 (ja) 音声入出力装置における入力音声の修正方法
CN111199725A (zh) 基于人工智能的电子设备多语音控制***
CN210091712U (zh) 智能语音互动***
JPH068999B2 (ja) 音声入力方法
JPS59144946A (ja) 音声タイプライタ制御方式
JPS58111999A (ja) 音声分析合成方式
JPH0540496A (ja) 話者適応化方法
JPS59214900A (ja) 音声認識装置
JPS61140999A (ja) 音声区間検出方式
JPS6147994A (ja) 音声認識方式
JPS61105597A (ja) 連続音声認識装置
JPS59195299A (ja) 特定話者音声認識装置
JPH0443600B2 (ja)
JPS61235900A (ja) 音声認識方法
JPH09198077A (ja) 音声認識システム
JPS59111698A (ja) 音声認識方式