JPH0527790A - 音声入出力装置 - Google Patents

音声入出力装置

Info

Publication number
JPH0527790A
JPH0527790A JP3202267A JP20226791A JPH0527790A JP H0527790 A JPH0527790 A JP H0527790A JP 3202267 A JP3202267 A JP 3202267A JP 20226791 A JP20226791 A JP 20226791A JP H0527790 A JPH0527790 A JP H0527790A
Authority
JP
Japan
Prior art keywords
user
voice
type
response
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3202267A
Other languages
English (en)
Inventor
Yuji Honda
裕司 本多
Tetsuya Sato
哲也 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3202267A priority Critical patent/JPH0527790A/ja
Publication of JPH0527790A publication Critical patent/JPH0527790A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音声から利用者のタイプを判定して、応答メ
ッセージを利用者のタイプに合ったものに変更する。 【要約】 利用者の性別を判定する周波数分析装置2と、利用者の
急ぎ具合を判定する音声認識装置3と、使用者の操作に
対する慣れ具合を判定する応答時間測定装置4と、基準
データメモリ6に記憶されている過去の利用者の傾向を
示すデータと判定結果データとを比較して利用者のタイ
プを判断する総合判定装置5と、音声データメモリ7に
記憶されている音声データから、特定された利用者のタ
イプに対応した応答メッセージを合成して出力させる音
声合成装置8とを設ける。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声を用いて対象の装
置を操作することを目的とする音声入出力装置に関す
る。
【0002】
【従来の技術】近年、現金入出金装置等の情報処理端末
装置は、利用者自身による操作の案内をするために、デ
ィスプレイ装置に文字を表示するだけでなく、図形を表
示したり音声による操作指示等のマルチメディア化が進
んでいる。特に、音声による操作案内は、装置に不慣れ
な利用者に対して、機械の操作を間違いなく行わせるた
めには非常に有効である。また、音声認識技術は単純な
応答ならかなりの精度で認識可能となっており、このこ
とから、音声により情報処理端末装置と対話を行いなが
ら、音声により操作を行うことができる情報処理端末装
置に対する期待が高まっている。
【0003】ところで、従来の装置との応答を行いなが
ら操作を進めていく情報処理端末装置においては、装置
側からは1つの操作に対して1種類の応答メッセージが
出力されるようになっている。そして、その内容は、あ
らゆるタイプの利用者に対応するために、詳細でゆっく
りした丁寧なものであり、むしろ冗長であることが多か
った。
【0004】
【発明が解決しようとする課題】このように、従来の画
一的かつ冗長な応答メッセージは、操作に慣れており迅
速な操作を行いたいと思っている利用者にとっては不要
なものであり、かえって負担を増加させるという問題点
があった。また、操作に不慣れな利用者にとっては、逆
に説明不足な面もあり、操作の際に、迷ったり誤操作を
引き起こすという問題点があった。
【0005】本発明はこのような問題を解決するために
なされたもので、利用者の音声から該利用者のタイプを
判定して、応答メッセージを利用者のタイプに合った最
適なものに変更し、利用者に対するきめ細かい対応を行
う音声入出力装置を提供することを目的とする。
【0006】
【課題を解決するための手段】この目的を達成するた
め、本発明は、利用者との応答を行いながら、音声によ
り情報処理装置を操作させる音声入出力装置において、
利用者の性別を判定するために、入力した利用者の音声
の周波数を測定し、その平均値を算出して判断の基準と
なる周波数と比較する手段と、利用者の急ぎ具合を判定
するために、単語間の時間間隔から言葉の速度を測定す
る手段と、利用者の操作に対する慣れを判定するため
に、応答に要する時間、単語間の時間間隔の均一さを測
定するとともに、単語の種類を判別する手段と、利用者
のタイプを判断する基準となる、音声から分析した過去
の利用者の傾向を示すデータが予め記憶されている手段
と、前記各判定結果のデータと基準となるデータを比較
して、利用者のタイプを判断する手段と、前記判断され
る利用者のタイプにそれぞれ対応する、1つの操作に対
して複数の応答メッセージを有し、その中から特定され
た利用者のタイプに対応した応答メッセージを出力させ
る手段とを備えるものである。
【0007】
【作用】上述した構成を有する本発明は、利用者に対し
て適当な質問を発する等して利用者に応答を求め、その
応答を分析することで利用者の目的と同時にそのタイプ
を過去の傾向と比較して統計的に推定する。その結果に
よって、応答メッセージの内容および速度を最適化す
る。
【0008】つまり、利用者の音声の平均周波数から性
別を判定でき、例えば400ヘルツより平均周波数が大
きければ女性である確率が高く、400ヘルツ以下であ
れば男性である確率が高いと判断する。また、言葉の速
度から利用者が急いでいるのかどうかを判定でき、例え
ば、「現金を引き出したい」と言う文章を認識するとき
に、「現金を」と「引き出したい」との間に時間的な間
隔がほとんどなければ、[急いでいる]と判断できる。
逆に間隔が0.5秒以上開いていれば、[あまり急いで
いない]と判断できる。
【0009】さらに、応答に要する時間の長さや、言葉
と言葉の時間間隔および使用した言葉の種類から流暢さ
を求め、利用者が当該装置の利用に慣れているかどうか
を判定でき、例えば、利用者が応答を発するまでに1秒
以上の時間を有し、しかも「えーと」等の間投詞が存在
すれば、この顧客はどの様に応答したら良いかを一瞬迷
ったと判断できる。逆に即座に的確な応答が返されれ
ば、この顧客はどの様に応答すれば良いかを熟知してい
ると判断できる。これらのデータを元に、利用者をいく
つかのタイプに分類し、利用者がどのタイプに属するか
を判断することによって、最適な応答メッセージを発す
ることができる。
【0010】
【実施例】図1は本発明の一実施例を示す音声入力装置
の制御ブロック図で、以下、本実施例では、現金支払機
に組み込まれているものを例にとって説明する。図にお
いて、1は赤外線探知装置で、現金支払機の前に人がい
るか否かを検知する。2は周波数分析装置で、マイクM
から入力される利用者の音声の周波数を測定してその平
均周波数を算出し、予め決めておいた周波数とを比較し
て、利用者の性別の判断の基準とする。例えば、400
ヘルツより平均周波数が大きければ女性、400ヘルツ
以下であれば男性である確率が高いと判断できる。
【0011】3は音声認識装置で、応答内容を認識する
とともに、単語間の時間間隔から言葉の速度が「早
口」,「普通」もしくは「ゆっくり」のいずれであるか
を判定して、利用者が急いでいるかどうかの判断の基準
とする。例えば、「現金を引き出したい」という文章を
認識するときに、「現金を」と引き出したい」との間に
時間的な間隔がほとんどなければ、この利用者は[急い
でいる]と判断できる。逆に間隔が0.5秒以上開いて
いれば、この利用者は[あまり急いでいない]と判断で
きる。
【0012】4は応答時間測定装置で、利用者が応答に
要する時間が長いか短いか、応答に現れる単語間の時間
間隔が均一か否か、および言葉の種類から、利用者の応
答が「流暢」,「普通」もしくは「どもりどもり」のい
ずれであるかを判定して、利用者が装置の利用に慣れて
いるかどうかの判断の基準とする。例えば、利用者が応
答を発するまでに1秒以上の時間を要し、しかも「えー
と」等の間投詞が存在すれば、この利用者は装置に利用
に慣れてなく、どの様に応答したら良いかを一瞬迷った
と判断できる。逆に即座に的確な応答が返されれば、こ
の利用者は装置の使用になれており、どのように応答す
れば良いかを熟知していると判断できる。
【0013】5は前記周波数分析装置2,音声認識装置
3および応答時間測定装置4による判定結果を元に、利
用者のタイプを判断する総合判定装置、6は前記総合判
定装置5が利用者のタイプを判断する際の基準となる、
音声から分析した過去の利用者の傾向を示すデータが予
め記録されている基準データメモリである。
【0014】7は音声データメモリ、8は前記音声デー
タメモリ7に記憶されている音声データから所定の応答
メッセージを合成し、所定のスピードでスピーカSPを
介して出力させる音声合成装置であり、前記音声データ
メモリ7には、総合判定装置5で判断される利用者のタ
イプに対応した応答メッセージを出力するために、1つ
の操作に対して複数種の応答メッセージを出力できるよ
うに音声データが記憶されている。ここで、前記基準デ
ータメモリ6に記憶されている音声から分析した過去の
利用者の傾向としては、例えば早口で流暢な男性の利用
者は、何度も同じ装置を利用したことがあって操作に慣
れており、かつ急いでいる場合が多く、迅速な対応が望
ましいというデータが保存されている。
【0015】このように過去に装置を利用したことがあ
って装置の操作に慣れており、かつ急いでいる利用者を
Aタイプとし、このタイプAの利用者に対応して、簡潔
な応答をする応答メッセージを出力させるための音声デ
ータが、音声データメモリ7に記憶されている。また、
過去に利用したことはあるが、急いでいるわけではない
利用者はBタイプとし、このタイプBの利用者に対応し
て、通常の応答をする応答メッセージを出力させるため
の音声データが、音声データメモリ7に記憶されてい
る。さらに、装置を初めて操作するかもしくはそれに近
い状態の利用者はCタイプとし、このタイプCの利用者
に対応して、より詳細な応答をする応答メッセージを出
力させるための音声データが、音声データメモリ7に記
憶されている。
【0016】図2は上述したように、総合判定装置5が
利用者のタイプを判断する基準となるタイプ判定テーブ
ルである。まず、周波数分析装置2で男性の確率が高い
と判定された利用者の内、タイプAの利用者と判断され
るのは、音声認識装置3で早口であると判定され、さら
に応答時間測定装置4で流暢もしくは普通の応答を行っ
ていると判定される場合である。
【0017】また、周波数分析装置2で男性の確率が高
いと判定された利用者の内、タイプBの利用者と判断さ
れるのは、音声認識装置3で普通もしくはゆっくり話し
ていると判定され、さらに応答時間測定装置4で流暢も
しくは普通の応答を行っていると判定される場合であ
る。さらに、周波数分析装置2で男性の確率が高いと判
定された利用者の内、タイプCの利用者と判断されるの
は、音声認識装置3で早口、普通もしくはゆっくり話し
ていると判定され、さらに応答時間測定装置4でどもり
どもりの応答を行っていると判定される場合である。
【0018】周波数分析装置2で女性の確率が高いと判
定された利用者の内、タイプAの利用者と判断されるの
は、音声認識装置3で早口であると判定され、さらに応
答時間測定装置4で流暢に応答を行っていると判定され
る場合である。また、周波数分析装置2で女性の確率が
高いと判定された利用者の内、タイプBの利用者と判断
されるのは、音声認識装置3で早口であると判定され、
応答時間測定装置4で普通に応答していると判定された
場合、音声認識装置3で普通であると判定され、応答時
間測定装置4で流暢もしくは普通に応答していると判定
された場合、さらには、音声認識装置3でゆっくりであ
ると判定され、応答時間測定装置4で流暢に応答してい
ると判定された場合である。
【0019】さらに、周波数分析装置2で女性の確率が
高いと判定された利用者の内、タイプCの利用者と判断
されるのは、音声認識装置3で早口であると判定され、
応答時間測定装置4でどもりどもりに応答していると判
定された場合、音声認識装置3で普通であると判定さ
れ、応答時間測定装置4でどもりどもりに応答している
と判定された場合、さらには、音声認識装置3でゆっく
りであると判定され、応答時間測定装置4で普通もしく
はどもりどもりに応答していると判定された場合であ
る。
【0020】図3は本実施例における誘導音声の内容を
示す説明図で、(a)は利用者がAタイプの場合、
(b)は利用者がCタイプの場合を示す。タイプAの利
用者の場合は、操作方法を熟知していると判断している
ので、全体としてただ操作を促すだけの応答メッセージ
が出力される。また、タイプCの利用者の場合は、装置
を初めて操作するかもしくはそれに近い状態であると判
断しているので、各種情報の入力手段として何を使う
か、それが装置の何処にあるのか等を説明しながら操作
を促す応答メッセージが出力される。
【0021】図4は本実施例のフローチャートで、以下
に本実施例の作用を説明する。まず、利用者が現金支払
機の前に立つ。すると、装置は赤外線探知装置1によっ
て利用者が現れたことを認識し、利用者に操作の実行を
促すとともに、利用者のタイプを判断するため、図3
(1)のような応答メッセージを出力して、利用者との
応答を開始させる(S1,S2)。この時、利用者の応
答がやや早口の男性の声で、しかも図3(2)に示すよ
うに的確で流暢な応答であったとする。利用者からの音
声の入力があると(S3)、装置内では音声認識装置3
で入力された音声の認識がなされるとともに、利用者の
タイプを判断するために、周波数分析装置2,音声認識
装置3および応答時間測定装置4で、上述したような手
順で音声の判定がなされ、周波数分析装置2で利用者の
性別は男性である確率が高いことを示され(S4)、音
声認識装置3でやや早口であることを認識され(S
5)、応答時間測定装置4で流暢な応答であることを示
される(S6)。
【0022】一方、上述したように、音声から分析した
過去の利用者の傾向を示すデータが基準データメモリ6
に記憶されており、その傾向として、例えば早口で流暢
な男性の利用者は、何度も同じ処理装置を利用したこと
があり操作に慣れた利用者であり、かつ急いでいる場合
が多く迅速な対応が望ましいというデータが記憶されて
いる。この時、前記周波数分析装置2,音声認識装置3
および応答時間測定装置4で判定した現在対応している
利用者の各判定結果データと、前記基準データメモリ6
に記憶されている、過去の利用者の傾向を分析した基準
データとを比較することによって、総合判定装置5がこ
の利用者のタイプは本装置を過去に利用したことがあっ
て操作に慣れており、かつ急いでいるAのタイプの利用
者であると判断する(S7)。
【0023】これにより、音声合成装置8は音声データ
メモリ7に記憶されている音声データから、図3(3)
〜(7)のような簡潔な応答をする応答メッセージを合
成し、通常よりやや早い速度でスピーカSPから出力し
て行く(S8)。図3(3)〜(7)に示すような簡潔
な応答メッセージであっても、操作に慣れている利用者
であるので、応答メッセージの内容,速度に即座に対応
して、迅速に現金を引き出す処理を終えることができ
る。一方、図3(1)の応答メッセージに対する応答
が、(8)のように不規則な女性の声で、的確とは言い
がたい応答であったとする。この時は、前述の場合と同
様に、周波数分析装置2,音声識別装置3,応答時間測
定装置4の判定結果から、総合判断装置5は、この利用
者は初めてこの装置を利用するかもしくはそれに近い状
態のCのタイプの利用者であると判断する。
【0024】これにより、音声合成装置8は音声データ
メモリ7に記憶されている音声データから、図3(9)
〜(13)のようなより詳細な応答を行う応答メッセー
ジを合成し、通常よりややゆっくりした速度でスピーカ
SPから出力して行く(S10)。このように、図3
(9)〜(13)に示すようなより詳細な応答メッセー
ジを、ややゆっくりした速度で出力することで、操作に
不慣れな利用者であっても、確実に目的を達成できるよ
うに誘導することができる。
【0025】
【発明の効果】以上説明したように、本発明は、利用者
との応答を行いながら、音声により情報処理装置を操作
させる音声入出力装置において、利用者の性別を判定す
るために、入力した利用者の音声の周波数を測定し、そ
の平均値を算出して判断の基準となる周波数と比較する
手段と、利用者の急ぎ具合を判定するために、単語間の
時間間隔から言葉の速度を測定する手段と、利用者の操
作に対する慣れを判定するために、応答に要する時間、
単語間の時間間隔の均一さを測定するとともに、単語の
種類を判別する手段と、利用者のタイプを判断する基準
となる、音声から分析した過去の利用者の傾向を示すデ
ータが予め記憶されている手段と、前記各判定結果のデ
ータと基準となるデータを比較して、利用者のタイプを
判断する手段と、前記判断される利用者のタイプにそれ
ぞれ対応する、1つの操作に対して複数の応答メッセー
ジを有し、その中から特定された利用者のタイプに対応
した応答メッセージを出力させる手段とを備えたもので
ある。
【0026】これにより、音声を利用して操作する情報
処理装置において、音声入出力装置は、音声による応答
から利用者の操作に対する熟練度や急ぎであるかそうで
ないかを判断し、利用者のタイプによって異なる操作誘
導音声を出力することができる。したがって、装置側か
らの誘導音声が一律であることに起因する、操作に不慣
れな利用者が操作方法に迷ったり、操作に熟練した利用
者がまどろっこしい思いを抱くことが少なくなることが
期待できる。さらに、本発明をキャッシュディスペンサ
ー等の多くの不特定利用者を対象とする装置に応用した
場合、操作者によっては不必要な冗長なメッセージを発
する時間を節約することができ、全体として効率的な運
用が可能となり、その結果、利用者の待ち時間を短縮す
ることができる。
【図面の簡単な説明】
【図1】本発明の一実施例を示す音声入出力装置の制御
ブロック図である。
【図2】利用者のタイプを判定するタイプ判定テーブル
である。
【図3】タイプ別の応答メッセージの出力例を示す説明
図である。
【図4】本実施例の作用を示すフローチャートである。
【符号の説明】
2 周波数分析装置 3 音声認識装置 4 応答時間測定装置 5 総合判定装置 6 基準データメモリ 7 音声データメモリ 8 音声合成装置

Claims (1)

  1. 【特許請求の範囲】 【請求項1】 利用者との応答を行いながら、音声によ
    り情報処理装置を操作させる音声入出力装置において、 利用者の性別を判定するために、入力した利用者の音声
    の周波数を測定し、その平均値を算出して判断の基準と
    なる周波数と比較する手段と、 利用者の急ぎ具合を判定するために、単語間の時間間隔
    から言葉の速度を測定する手段と、 利用者の操作に対する慣れを判定するために、応答に要
    する時間、単語間の時間間隔の均一さを測定するととも
    に、単語の種類を判別する手段と、 利用者のタイプを判断する基準となる、音声から分析し
    た過去の利用者の傾向を示すデータが予め記憶されてい
    る手段と、 前記各判定結果のデータと基準となるデータを比較し
    て、利用者のタイプを判断する手段と、 前記判断される利用者のタイプにそれぞれ対応する、1
    つの操作に対して複数の応答メッセージを有し、その中
    から特定された利用者のタイプに対応した応答メッセー
    ジを出力させる手段とを備えたことを特徴とする音声入
    出力装置。
JP3202267A 1991-07-18 1991-07-18 音声入出力装置 Pending JPH0527790A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3202267A JPH0527790A (ja) 1991-07-18 1991-07-18 音声入出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3202267A JPH0527790A (ja) 1991-07-18 1991-07-18 音声入出力装置

Publications (1)

Publication Number Publication Date
JPH0527790A true JPH0527790A (ja) 1993-02-05

Family

ID=16454712

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3202267A Pending JPH0527790A (ja) 1991-07-18 1991-07-18 音声入出力装置

Country Status (1)

Country Link
JP (1) JPH0527790A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219582A (ja) * 1994-01-28 1995-08-18 Fujitsu Ten Ltd 車載用音声認識装置
JPH0822459A (ja) * 1994-07-08 1996-01-23 Fujitsu Ltd 会話制御装置及び情報処理装置
JP2000347690A (ja) * 1999-06-04 2000-12-15 Nec Corp マルチモーダル対話装置
JP2007334251A (ja) * 2006-06-19 2007-12-27 Kenwood Corp エージェント装置、プログラム、及び音声供給方法
JP2010163100A (ja) * 2009-01-16 2010-07-29 Mitsubishi Motors Corp 車載機器用制御装置
WO2010084881A1 (ja) * 2009-01-20 2010-07-29 旭化成株式会社 音声対話装置、対話制御方法及び対話制御プログラム
CN102259240A (zh) * 2011-07-13 2011-11-30 吴振泉 一种输送链或输送带式激光切割平台
US10062376B2 (en) 2009-04-20 2018-08-28 Samsung Electronics Co., Ltd. Electronic apparatus and voice recognition method for the same
JP2018136710A (ja) * 2017-02-21 2018-08-30 沖電気工業株式会社 音声取引システムおよび連携制御装置
JP2019057092A (ja) * 2017-09-20 2019-04-11 富士ゼロックス株式会社 情報処理装置及びプログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219582A (ja) * 1994-01-28 1995-08-18 Fujitsu Ten Ltd 車載用音声認識装置
JPH0822459A (ja) * 1994-07-08 1996-01-23 Fujitsu Ltd 会話制御装置及び情報処理装置
JP2000347690A (ja) * 1999-06-04 2000-12-15 Nec Corp マルチモーダル対話装置
JP2007334251A (ja) * 2006-06-19 2007-12-27 Kenwood Corp エージェント装置、プログラム、及び音声供給方法
JP2010163100A (ja) * 2009-01-16 2010-07-29 Mitsubishi Motors Corp 車載機器用制御装置
WO2010084881A1 (ja) * 2009-01-20 2010-07-29 旭化成株式会社 音声対話装置、対話制御方法及び対話制御プログラム
JP5281659B2 (ja) * 2009-01-20 2013-09-04 旭化成株式会社 音声対話装置、対話制御方法及び対話制御プログラム
US10062376B2 (en) 2009-04-20 2018-08-28 Samsung Electronics Co., Ltd. Electronic apparatus and voice recognition method for the same
CN102259240A (zh) * 2011-07-13 2011-11-30 吴振泉 一种输送链或输送带式激光切割平台
JP2018136710A (ja) * 2017-02-21 2018-08-30 沖電気工業株式会社 音声取引システムおよび連携制御装置
JP2019057092A (ja) * 2017-09-20 2019-04-11 富士ゼロックス株式会社 情報処理装置及びプログラム

Similar Documents

Publication Publication Date Title
JP3674990B2 (ja) 音声認識対話装置および音声認識対話処理方法
US6839667B2 (en) Method of speech recognition by presenting N-best word candidates
US7603279B2 (en) Grammar update system and method for speech recognition
KR20190002891A (ko) 화행 정보를 이용한 대화 처리 방법 및 그 장치
CN111508474B (zh) 一种语音打断方法、电子设备及存储装置
US20110276329A1 (en) Speech dialogue apparatus, dialogue control method, and dialogue control program
US20090313019A1 (en) Emotion recognition apparatus
JPH0527790A (ja) 音声入出力装置
US6963834B2 (en) Method of speech recognition using empirically determined word candidates
CN110581927A (zh) 通话内容的处理及提示方法、装置
US6879953B1 (en) Speech recognition with request level determination
US20040148165A1 (en) Pattern processing system specific to a user group
US20010056345A1 (en) Method and system for speech recognition of the alphabet
JP2004053825A (ja) 言語識別装置、言語識別方法および言語識別プログラム
CN109616116B (zh) 通话***及其通话方法
JP7287006B2 (ja) 話者決定装置、話者決定方法、および話者決定装置の制御プログラム
US20030101053A1 (en) Sound signal recognition system and sound signal recogniton method, and dialog control system and dialog control method using soung signal recognition system
CN110136725B (zh) 一种通过语音录入的体征监控***
JP2017211610A (ja) 出力制御装置、電子機器、出力制御装置の制御方法、および出力制御装置の制御プログラム
US11582174B1 (en) Messaging content data storage
JP3273620B2 (ja) 音声対話装置
JPH11352995A (ja) 音声認識装置
JPH1055194A (ja) 音声制御装置と音声制御方法
JPH0719239B2 (ja) 音声認識応答システム
GB2596141A (en) Driving companion