JP2656234B2 - 会話音声理解方法 - Google Patents

会話音声理解方法

Info

Publication number
JP2656234B2
JP2656234B2 JP60178615A JP17861585A JP2656234B2 JP 2656234 B2 JP2656234 B2 JP 2656234B2 JP 60178615 A JP60178615 A JP 60178615A JP 17861585 A JP17861585 A JP 17861585A JP 2656234 B2 JP2656234 B2 JP 2656234B2
Authority
JP
Japan
Prior art keywords
conversation
voice
question
mode
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60178615A
Other languages
English (en)
Other versions
JPS6239899A (ja
Inventor
浩之 千本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60178615A priority Critical patent/JP2656234B2/ja
Publication of JPS6239899A publication Critical patent/JPS6239899A/ja
Application granted granted Critical
Publication of JP2656234B2 publication Critical patent/JP2656234B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、音声入力による情報システムに用いられる
会話音声理解方法に関する。
〔発明の技術的背景とその問題点〕
近年、音声認識・合成技術の発展は目覚しく、例えば
連続音声認識や不特定話者を対象とした音声認識が可能
となり、また一方、精度の高い音声合成が可能となって
いる。
この様な技術を用いて電話公衆回線による各種のサー
ビスを行なう電話音声応答サービスなどが開発されてお
り、現在ではこれを一歩すすめた会話音声理解システム
が開発されている。しかしこの種のシステムのユーザー
は不特定であり、例えば老人、子供、女性のようにシス
テムに不慣れな人を多く、システムが誤認識したり、会
話の内容が理解できなくなる事も多く、特に従来のシス
テムでは、誤認識した場合等では再入力する場合も同じ
単語を発声させる為、1度ひっかかるとなかなか認識が
できない場合が多くスムーズに会話が行なわれないとい
う欠点があった。
〔発明の目的〕
本発明の目的は、人間と機械の会話において会話をス
ムーズにかつ正確に行なう事が可能となる会話音声理解
方法を提供することにある。
〔発明の概要〕
本発明は、話者が発声する会話音声を認識し、認識さ
れた結果に基づき応答あるいは質問を行い、前記により
行われる会話中に誤認識あるいは認識不能の状態になっ
た場合に、前記話者の指定により前記質問を選択方式に
変更し、該選択方式に変更した後は該方式を続けること
を特徴とするものである。
〔発明の効果〕
本発明によれば、誤認識が多い場合等、システムが理
解しにくい時、質問を選択方式にする事で再入力を何度
もする必要がなく会話がスムーズに行なう事が可能とな
り、ユーザーにとって実用性が向上する。
〔発明の実施例〕
以下、図面を参照しながら本発明の実施例について説
明する。
第1図は本発明の第1の実施例のブロック図であり、
第2図は第1の実施例のフローチャートである。第1の
実施例はシステムとの会話中に、誤認識が多発したり、
会話内容が理解できない場合、自動的にシステムとの会
話が選択方式となるものである。
まずシステムと会話をする前にシステム内のカウンタ
ー(N)を0にクリアーし(ステップ10)、次にカウン
ター(N)に1を加える(ステップ11)。カウンターを
セットした後に会話or選択モードを会話モードにし(ス
テップ12)、カウンターのカウント番号にしたがってシ
ステムからの質問内容を会話生成部A(第1図4)で生
成し、応答部8、音声出力部9をへて、外部へ出力され
る(ステップ13)。この質問に対して話者が返答した音
声を音声入力部1でA/D変換等の音響処理し、処理した
音声データを用いて音声認識部3で辞書2と比較しなが
ら音声認識を行なう(ステップ15)。この認識した結果
を会話生成部A4で判断し、誤認識と判断された場合は、
会話生成部4の内にあるミスカウンターmに1を加え
(ステップ16,17)、カウンターmの値と閾値Mとの比
較を行なう(ステップ18)。もしここでミスカウンター
のカウントmがMより小さい場合は、再度質問を行ない
音声を入力してもらう。もしこの時の入力は、正常に認
識されたとすると、会話生成部A4で発話内容をチェック
し(ステップ22,23)、モードが会話モードなら、前記
ステップ23,24で会話内容に合っていると判断されたこ
ととなり、会話中の次の単語を誤認識するか否かを判断
する(ステップ16)ために、会話中の単語をカウントす
るカウンターNのカウントを1つ増し、次の会話中の単
語に関しての質問を行なう(ステップ24,13−1,13)。
このようなサイクルにより会話をつづけていく。一方上
記会話中に生じた誤認識の回数がミスカウンターのカウ
ントmにたしこまれていく。もし会話中にこのミスカウ
ンターのカウントmが閾値Mより大きくなった場合(ス
テップ18)もしくは、システムがまったく予期していな
い答えが使用者から返ってきた場合(ステップ23)、選
択部6により会話生成部B5にスイッチ7がスイッチング
され、モードが会話モードから選択モードへ変更される
(ステップ19)。こうして選択モードへ変更された後、
会話生成部B5で現在までの会話内容から質問等を決定し
(ステップ20)、応答部8、音声出力部9を通して質問
を出力する(ステップ21)。この質問に対して再び話者
が答えるというサイクルを最後まで選択モードで行なっ
ていく。
上記実施例によれば、システムが会話中に誤認識を多
々起こす場合、選択モードに自動的に変更される事によ
り、選択方式に対話が進むので、むだな誤認識による再
入力を必要とせず、会話がスムーズに進むことが可能で
ある。
次に本発明の第2の実施例について図面を参照して説
明する。
第3図は本発明の第2の実施例のブロック図であり、
第4図は第2の実施例のフローチャートである。第2の
実施例は、システムとの会話中に、誤認識が多発した
り、会話内容が理解できない場合、自動的にシステムと
の会話が選択方式となるだけではなく、話者(使用者)
が必要に応じて選択方式をいつでも取り入れることがで
きるものである。
まずシステムと会話が始まる前にシステム内のカウン
ター(N)を0にクリアーし(ステップ34)、次にカウ
ンター(N)に1を加える(ステップ35)。この後にま
ず会話モードor選択モードを会話モードにし(ステップ
36)、この時点でシステムとの会話に対する初期設定が
終了する。初期設定終了後、カウンターのカウント番号
Nにしたがって質問を会話生成部A(第3図28)で決定
し、応答部32、音声出力部33を通して質問を出力する
(ステップ37)。またここで質問の内容、意味等がよく
わからないなどの問題が生じた時、外部選択部31よりス
イッチ等の入力により、モード変更を行ない(ステップ
38)、選択モード側の会話生成部B29より、現在までの
会話内容から質問の内容を決定しなおし、応答部32、音
声出力部33を通して出力される。こで会話モードで会話
が進んでいるとした場合、上記の質問に対して話者が返
答した音声を音声入力部25でA/D変換等の音響処理し、
処理した音声データを用いて音声認識部27で辞書26と比
較しながら音声認識を行なう(ステップ41)。この認識
結果を会話生成部A28で判断し、誤認識と判断された場
合は、会話生成部A28の中にあるミスカウンターmに1
を加え(ステップ42,43)、カウンターmの値と閾値M
との比較を行ない(ステップ44)、もしここでミスカウ
ンターのカウントmがMより小さい場合は、再度入力を
行なってもらう。もしこの入力が正常に認識されたとす
ると、会話生成部A28で発話内容をチェックし(ステッ
プ48,48)、モードが会話モードなら、前記ステップ49,
50で会話内容に合っていると判断されたこととなり、会
話中の次の単語を誤認識するか否かを判断する(ステッ
プ42)ために、会話中の単語をカウントするカウンター
Nのカウントを1つ増し、次の会話中の単語に関しての
質問を行なう(ステップ50,37−1,37)。上記サイクル
により会話をつづけていく。一方、上記会話中に生じた
誤認識の回数がミスカウンターのカウントmにたしこま
れていくが、もし会話中にこのミスカウントmが閾値M
より大きくなった場合(ステップ44)もしくは、システ
ムがまったく予期しない答えが使用者から返ってきた場
合(ステップ49)、選択部30が自動的に選択モード用会
話生成部B29の方にスイッチ34がスイッチングされ、モ
ードが会話モードから選択モードへ変更される(ステッ
プ45)。こうして選択モードに変更された後、会話生成
部B29で現在までの会話内容から質問を決定し(ステッ
プ46)、応答部32、音声出力部9を通じて質問を出力す
る(ステップ47)。この質問に対して再び話者が答える
というサイクルを続けていくものである。
上記実施例によれば、システムが会話中に誤認識を多
々起こす場合、選択モードに自動的に変更されるだけで
なく、使用者が会話に対して不慣れな場合等でも、使用
者自身の判断でいつでも好きな時に選択方式の会話がで
きる事により、むだな誤認識による再入力が減り、かつ
使用者に対して不安な気持ちを取り除く事ができ、会話
がスムーズに行なわれることが可能である。
尚、本発明は上記実施例に限定されるものではない。
たとえば、第2の実施例で外部よりモード変更する際、
外部選択部としてスイッチを設けるのではなく、会話中
に音声入力によって行なってもよい。入力音声の認識処
理や合成の方法、内容判断の方法は従来より知られた種
々の方式を適宜採用すればよい。要するに本発明は、そ
の要旨を逸脱しない範囲で種々変形して実施することが
できる。
【図面の簡単な説明】
第1図は本発明の第1の実施例のブロック図、第2図は
本発明の第1の実施例のフローチャート、第3図は本発
明の第2の実施例のブロック図、第4図は本発明の第2
の実施例のフローチャートである。 1……音声入力部 2……辞書 3……音声認識部 4……会話生成部A 5……会話生成部B 6……選択部 7……スイッチ 8……応答部 9……音声出力部 25……音声入力部 26……辞書 27……音声認識部 28……会話生成部A 29……会話生成部B 30……選択部 31……外部選択部 32……応答部 33……音声出力部 34……スイッチ

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】話者が発声する会話音声を認識し、 認識された結果に基づき応答あるいは質問を行い、 前記により行われる会話中に誤認識あるいは認識不能の
    状態になった場合に、前記話者の指定により前記質問を
    選択方式に変更し、 該選択方式に変更した後は該方式を続けることを特徴と
    する会話音声理解方法。
  2. 【請求項2】前記選択方式への変更は、前記会話中のキ
    ーワード抽出を行うことにより自動的に選択方式に変更
    することを特徴とする特許請求の範囲第1項記載の会話
    音声理解方法。
JP60178615A 1985-08-15 1985-08-15 会話音声理解方法 Expired - Lifetime JP2656234B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60178615A JP2656234B2 (ja) 1985-08-15 1985-08-15 会話音声理解方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60178615A JP2656234B2 (ja) 1985-08-15 1985-08-15 会話音声理解方法

Publications (2)

Publication Number Publication Date
JPS6239899A JPS6239899A (ja) 1987-02-20
JP2656234B2 true JP2656234B2 (ja) 1997-09-24

Family

ID=16051538

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60178615A Expired - Lifetime JP2656234B2 (ja) 1985-08-15 1985-08-15 会話音声理解方法

Country Status (1)

Country Link
JP (1) JP2656234B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010107614A (ja) * 2008-10-29 2010-05-13 Mitsubishi Motors Corp 音声案内応答方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4832097B2 (ja) * 2006-02-13 2011-12-07 富士通テン株式会社 音声対話システム
JP7388006B2 (ja) * 2019-06-03 2023-11-29 コニカミノルタ株式会社 画像処理装置及びプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59144945A (ja) * 1983-02-07 1984-08-20 Hitachi Ltd 音声認識制御方式
JPS602997A (ja) * 1983-06-20 1985-01-09 富士通株式会社 話者識別音声入力方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
日本音響学会講演論文集 昭和60年9〜10月 2−4−12 P.73〜74

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010107614A (ja) * 2008-10-29 2010-05-13 Mitsubishi Motors Corp 音声案内応答方法

Also Published As

Publication number Publication date
JPS6239899A (ja) 1987-02-20

Similar Documents

Publication Publication Date Title
US6651043B2 (en) User barge-in enablement in large vocabulary speech recognition systems
JP3968133B2 (ja) 音声認識対話処理方法および音声認識対話装置
JP3674990B2 (ja) 音声認識対話装置および音声認識対話処理方法
EP0757342B1 (en) User selectable multiple threshold criteria for voice recognition
JP3284832B2 (ja) 音声認識対話処理方法および音声認識対話装置
US3742143A (en) Limited vocabulary speech recognition circuit for machine and telephone control
JPH0394299A (ja) 音声認識方法と音声認識装置訓練方法
EP0655732A2 (en) Soft decision speech recognition
JP2002536691A (ja) 音声認識除去方式
JP2004053742A (ja) 音声認識装置
US20010056345A1 (en) Method and system for speech recognition of the alphabet
CN110602334A (zh) 一种基于人机协同的智能外呼方法及***
US7177806B2 (en) Sound signal recognition system and sound signal recognition method, and dialog control system and dialog control method using sound signal recognition system
JP2656234B2 (ja) 会話音声理解方法
JP2003029776A (ja) 音声認識装置
JP2003177788A (ja) 音声対話システムおよびその方法
JP2000122678A (ja) 音声認識機器制御装置
JP4449380B2 (ja) 話者正規化方法及びそれを用いた音声認識装置
JP3114757B2 (ja) 音声認識装置
JPH11175093A (ja) 音声認識確認応答方法
JPH0863185A (ja) 音声認識装置
KR100281582B1 (ko) 인식기 자원을 효율적으로 사용하는 음성인식 방법
JP2002196789A (ja) 音声対話装置
JPH0194398A (ja) 音声標準パターンの作成方法
JPH01293397A (ja) 音声応答方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term