JPH10301755A - 操作誘導装置 - Google Patents

操作誘導装置

Info

Publication number
JPH10301755A
JPH10301755A JP11074297A JP11074297A JPH10301755A JP H10301755 A JPH10301755 A JP H10301755A JP 11074297 A JP11074297 A JP 11074297A JP 11074297 A JP11074297 A JP 11074297A JP H10301755 A JPH10301755 A JP H10301755A
Authority
JP
Japan
Prior art keywords
voice
speaker
unit
recognition
personal identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11074297A
Other languages
English (en)
Inventor
Tatsuya Nakamura
達哉 中村
Satoru Handa
悟 半田
Yoshio Maekawa
誉雄 前川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP11074297A priority Critical patent/JPH10301755A/ja
Publication of JPH10301755A publication Critical patent/JPH10301755A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

(57)【要約】 【課題】個人識別データの本人と他人とで誘導内容を変
え、不正操作を防止する操作誘導装置を提供することを
目的とする。 【解決手段】音声入力部4で入力した話者音声信号5と
特定話者辞書11内の比較音声データ12とを特定話者
音声比較部7で比較し、類似度13が低い場合に複雑な
操作を要求することにより不正操作を防止できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はマンマシンインター
フェースの一種である人間の操作を誘導する操作誘導装
置に関するものであり、例えば、金融機関における現金
自動預け払い機での来店客に対する誘導や、入室管理シ
ステムにおける操作誘導に用いられる操作誘導装置に関
するものである。
【0002】
【従来の技術】従来の操作誘導装置は、キーボード、タ
ッチパネル、マウスなどを入力装置とし、これら入力装
置を用いて操作者が入力した内容に応じて、1種類の操
作誘導がCRTやLCDなどの表示装置に表示されるよ
うになっていた。近年では入力装置としては、音声認識
装置が用いられるようになってきており、また誘導内容
出力装置として表示装置に代わるか連動する音声発生装
置も用いられるようになってきた。
【0003】図9は従来の操作誘導装置の音声出力のス
テップと操作者の入力動作のステップを併記した図であ
る。図で明らかなように、従来の操作誘導装置は、例え
ば「出金」という操作者の発声音に対して「出金です
ね。はい、いいえでお答え下さい。」の音声出力という
ように、操作者の発声音あるいはその他の操作という何
らかの操作誘導装置への入力行動に応じて、1種類の操
作誘導が行われるようになっていた。また音声認識装置
には、話者を特定しない不特定話者認識装置と特定の話
者の音声だけを認識する特定話者認識装置があり、不特
定話者認識装置と特定話者認識装置を組み合わせて使用
する技術は、特開昭59−193500号公報、特開平
3−157696号公報で示されるように音声認識性能
を向上させることを目的としており、これらの技術を用
いたとしても図9に示したような誘導例になる。
【0004】
【発明が解決しようとする課題】上記従来の操作誘導装
置においては、音声認識装置を使用するか否かに関わら
ず、何らかの操作誘導装置への入力行動に応じて、1種
類の操作誘導が行われるようになっていたので、現金自
動預け払い機や入室管理システムでの個人認証に関し
て、本人、代理人、別人の区別なく同じ操作誘導が行わ
れるようになっているという問題があった。
【0005】また、個人認証の方法として、磁気カード
と本人のみが知っている4桁の数字を入力する方法が一
般的であるが、カードが盗難に遭ったり、紛失して別人
の手に渡ってしまうことも考えられる。そのときのため
に4桁の暗証番号の入力が必要になるわけであるが、暗
証番号を忘れてしまうことを恐れ、誕生日であるとか自
宅の電話番号であるとかを用いる場合が多く、カードの
不正取得者に知られてしまう可能性があるという問題が
あった。
【0006】さらに、カードの不正使用を防ぐには、通
常の暗証番号に加えて、誕生日などとは全く関係のない
第2の暗証番号を設けることは有効な手段であるが、こ
のようにするとカード所有者本人が使用する際にも第2
の暗証番号を入力せねばならず、このような手段はカー
ド所有者本人には受け入れられないという問題点があっ
た。
【0007】本発明は、これら従来の問題点を解決する
ものであり、従来からの暗証番号の桁数以上の暗証番号
を使用しなくとも、本人以外の不正操作を防止すること
のできる操作誘導装置を提供することを目的とする。
【0008】
【課題を解決するための手段】上記目的を達成するため
に、本発明の第1の操作誘導装置は、実際の操作者の音
声データとあらかじめ記憶された個人の音声データとを
比較するとともに前記二つの音声データの類似度を判定
する音声比較手段と、前記音声比較手段によって判定さ
れた類似度に基づいて誘導内容を決定する誘導内容決定
手段とを備えたものである。
【0009】また、本発明の第2の操作誘導装置は、実
際の操作者の音声データからこの音声データに対応した
1つもしくは複数の単語を認識する不特定話者認識手段
と、個人を認識する1つもしくは複数の単語を記憶する
個人識別データ記憶手段とを備え、音声比較手段は前記
不特定話者認識手段により認識された前記単語が前記個
人を特定する前記単語と同じである場合に、前記不特定
話者認識手段により認識された前記単語の音声データと
あらかじめ記憶された前記個人が発生した前記単語の音
声データとを比較するものである。
【0010】また、本発明の第3の操作誘導装置は、話
者の音声を入力する音声入力部と、非登録式の不特定話
者辞書と、前記音声入力部が出力する話者音声信号を前
記不特定話者辞書を用いて認識する不特定話者認識部
と、個人識別データを入力する個人識別データ入力部
と、登録式の特定話者辞書と、前記個人識別データ入力
部で入力した個人識別データと前記不特定話者認識部で
認識した認識単語を用い前記特定話者辞書から比較音声
データを選択する比較音声データ選択部および前記話者
音声信号と前記比較音声データ選択部で選択した比較音
声データとを比較し類似度を出力する特定話者音声比較
部とからなる音声比較手段と、前記認識単語と前記特定
話者音声比較部が出力した前記類似度から話者への誘導
内容を決定する誘導内容決定手段と、前記誘導内容決定
手段が決定した誘導内容を出力する誘導内容出力部とを
備えたものである。
【0011】また、本発明の第4の操作誘導装置は、話
者の音声を入力する音声入力部と、非登録式の不特定話
者辞書と、前記音声入力部が出力する話者音声信号を前
記不特定話者辞書を用いて認識する不特定話者認識部
と、前記話者音声信号が個人を識別する1つもしくは複
数の単語であるとき前記不特定話者認識部で認識した前
記単語をあらかじめ個人識別データとして記憶する個人
識別データ記憶手段と、登録式の特定話者辞書と、前記
個人識別データ記憶手段内の個人識別データと前記不特
定話者認識部で認識した認識単語を用い前記特定話者辞
書から比較音声データを選択する比較音声データ選択部
および前記話者音声信号と前記比較音声データ選択部で
選択した比較音声データとを比較し類似度を出力する特
定話者音声比較部とからなる音声比較手段と、前記認識
単語と前記特定話者音声比較部が出力した前記類似度か
ら話者への誘導内容を決定する誘導内容決定手段と、前
記誘導内容決定手段が決定した誘導内容を出力する誘導
内容出力部とを備えたものである。
【0012】また、本発明の第5の操作誘導装置は、話
者の音声を入力する音声入力部と、個人識別データを入
力する個人識別データ入力部と、登録式の特定話者辞書
と、前記個人識別データ入力部で入力した個人識別デー
タに対応する前記特定話者辞書を用い前記音声入力部が
出力する話者音声信号の音声認識を行い認識単語を出力
するとともに前記話者音声信号と前記特定話者辞書に登
録された音声データとの類似度を出力する特定話者認識
部を備えた音声比較手段と、前記特定話者認識部が出力
した認識単語と前記類似度から話者への誘導内容を決定
する誘導内容決定手段と、前記誘導内容決定手段が決定
した誘導内容を出力する誘導内容出力部とを備えたもの
である。
【0013】また、本発明の第6の操作誘導装置は、話
者の音声を入力する音声入力部と、非登録式の不特定話
者辞書と、前記音声入力部が出力する話者音声信号を前
記不特定話者辞書を用いて認識する不特定話者認識部
と、前記話者音声信号が個人を識別する1つもしくは複
数の単語であるとき前記不特定話者認識部で認識される
前記単語をあらかじめ個人識別データとして記憶する個
人識別データ記憶部と、登録式の特定話者辞書と、前記
個人識別データ記憶部内の個人識別データに対応する前
記特定話者辞書を用い前記音声入力部が出力する話者音
声信号の音声認識を行い認識単語を出力するとともに前
記話者音声信号と前記特定話者辞書に登録された音声デ
ータとの類似度を出力する特定話者認識部を備えた音声
比較手段と、前記特定話者認識部が出力した認識単語と
前記類似度から話者への誘導内容を決定する誘導内容決
定手段と、前記誘導内容決定手段が決定した誘導内容を
出力する誘導内容出力部とを備えたものである。
【0014】また、本発明の第7の操作誘導装置は、キ
ー入力部を備えたものである。また、本発明の第8の操
作誘導装置は、音声入力部で入力した音声と認識単語を
用い特定話者辞書を書換える特定話者辞書書換部を備え
たものである。
【0015】また、本発明の第9の操作誘導装置は、誘
導内容出力部が音声出力機能を有するものである。
【0016】また、本発明の第10の操作誘導装置は、
誘導内容決定手段が、類似度が高いほど実際の操作者の
走査回数を少なくするとともに、前記類似度が低いほど
前記操作回数を多くするものである。
【0017】また、本発明の第11の操作誘導装置は、
音声比較手段が実際の操作者の複数の音声データについ
て類似度を判定するとともに、誘導内容決定手段はすべ
ての前記類似度に基づいて誘導内容を決定するものであ
る。
【0018】
【発明の実施の形態】上記構成により本発明の第1の操
作誘導装置は、類似度に基づいて誘導内容を決定するの
で、本人以外の不正操作を防止することができる。
【0019】また、本発明の第2の操作誘導装置は、不
特定話者認識手段により認識された単語の音声データと
あらかじめ記憶された個人が発生した単語の音声データ
とを比較するので、個人を特定するためのデータの入力
装置を別途設ける必要がなく、また、特別な入力作業が
不要であるので、低コストでかつ操作性が向上する。
【0020】また、本発明の第3の操作誘導装置は、個
人識別データ入力部で入力した個人識別データと不特定
話者認識部で認識した認識単語を用い特定話者辞書から
比較音声データを選択し、話者音声信号と比較音声デー
タとを比較し類似度を出力するので、類似度が高いと
き、即ち話者が個人識別データに対応する人物である確
率が高いときには後の操作を簡単にし、類似度が低いと
き、即ち話者が個人識別データに対応する人物である確
率が低いときには後の操作を複雑にして不正操作を防止
することができる。
【0021】また、本発明の第4の操作誘導装置は、話
者音声信号が個人を識別する1つもしくは複数の単語で
あるとき不特定話者認識部で認識される前記単語を個人
識別データとして使用することができ、上記第3の操作
誘導装置の作用に加えて、個人識別データ入力部を省略
できるとともに個人識別データ入力作業(例えば磁気カ
ードの挿入)を省略できる。
【0022】また、本発明の第5の操作誘導装置は、個
人識別データ入力部で入力した個人識別データに対応す
る特定話者辞書を用い音声入力部が出力する話者音声信
号の音声認識を行い、認識単語を出力するとともに前記
話者音声信号と前記特定話者辞書に登録された音声デー
タとの類似度を出力する特定話者認識部を具備すること
により、上記第3の操作誘導装置の作用に加えて、不特
定話者辞書ならびに不特定話者認識部を省略することが
できるとともに、個人識別データに対応する人物以外が
操作をした場合には音声の認識そのものが困難になるた
め、個人識別データに対応する人物以外の操作を実質上
不可能にすることができる。
【0023】また、本発明の第6の操作誘導装置は、話
者音声信号が個人を識別する1つまたは複数の単語であ
るとき不特定話者認識部で認識される前記単語をあらか
じめ個人識別データとして記憶する個人識別データ記憶
部と、前記個人識別データ記憶部内の個人識別データに
対応する特定話者辞書を用い音声入力部が出力する話者
音声信号の音声認識を行い認識単語を出力するとともに
前記話者音声信号と前記特定話者辞書に登録された音声
データとの類似度を出力する特定話者認識部を具備する
ことにより、上記第3の操作誘導装置の作用に加えて、
個人識別データ入力部を省略できるとともに個人識別デ
ータ入力作業(例えば磁気カードの挿入)を省略できる
いうことと、個人識別データに対応する人物以外が操作
をした場合には音声の認識そのものが困難になるため、
個人識別データに対応する人物以外の操作を実質上不可
能にすることができる。
【0024】また、本発明の第7の操作誘導装置は、キ
ー入力部を具備することにより、本発明の第3から第6
の操作誘導装置の作用に加えて、音声によって入力する
と不都合の生じるデータ入力(例えば暗証番号の入力)
も可能となり、応用範囲が広がる。
【0025】また、本発明の第8の操作誘導装置は、音
声入力部で入力した音声と認識単語を用い特定話者辞書
を書換える特定話者辞書書換部を具備することにより、
本発明の第3から第6の操作誘導装置の作用に加えて、
年を経ることにより変化する話者の発声音を更新するこ
とができる。
【0026】また、本発明の第9の操作誘導装置は、誘
導内容出力部が音声出力機能を有することにより、本発
明の第3から第6の操作誘導装置の作用に加えて、従来
の誘導内容出力部(例えば14インチ以上のCRTや1
0インチ以上のLCD)の代わりに小さな誘導内容出力
部(例えば1〜2ラインのLCD)にすることができ、
操作誘導装置全体も小さくすることができ、その結果、
手にとって操作することも可能となり、車椅子からの操
作や、自動車の内部からの操作も可能にすることができ
る。
【0027】また、本発明の第10の操作誘導装置は、
誘導内容決定手段が、類似度が高いほど実際の操作者の
操作回数を少なくするとともに、前記類似度が低いほど
前記操作回数を多くするので、操作者が本人であるとき
の操作性の低下を防止するとともに、操作者が本人以外
の場合の不正操作を防止することができる。
【0028】また、本発明の第11の操作誘導装置は、
音声比較手段が実際の操作者の複数の音声データについ
て類似度を判定するとともに、誘導内容決定手段はすべ
ての前記類似度に基づいて誘導内容を決定するので、誘
導内容の決定の正確さが向上する。
【0029】以下、本発明の実施の形態について説明す
る。 (実施の形態1)まず本発明の第1の実施の形態につい
て図1を用いて説明する。図1は本発明の第1の実施の
形態における操作誘導装置のブロック図である。図1に
おいて、個人識別データ入力部1は個人識別データ2を
入力する部分であって、個人の識別に用いる媒体に応じ
て、例えば媒体が磁気カードの場合には磁気カードリー
ダ、接触式ICカードの場合には接触式ICカードリー
ダ、非接触式ICカード(データキャリア)の場合には
非接触式ICカードリーダが用いられる。個人識別デー
タ入力部1で入力された個人識別データ2は、比較音声
データ選択部3に送られる。
【0030】音声入力部4は操作者の音声を入力する部
分であって、マイクロフォンによる音声の入力、あるい
は通信回線を通じて送られてきた操作者の音声の入力を
行う。音声入力部4で入力した音声は、話者音声信号5
という電気信号の形式で不特定話者認識部6と特定話者
音声比較部7に出力される。不特定話者認識部6は話者
音声信号5と不特定話者辞書8とから操作者の発声した
音声を認識し、認識結果の認識単語9を比較音声データ
選択部3と誘導内容決定部10に出力する。なお、不特
定話者辞書8は非登録式であり、話者を選ばずに音声を
認識する際に参照する辞書であり、本実施の形態の操作
誘導装置にあらかじめ装備されているものである。
【0031】比較音声データ選択部3は、個人識別デー
タ入力部1が出力した個人識別データ2と不特定話者認
識部6が出力した認識単語9と特定話者辞書11とから
比較音声データ12を選択し、これを特定話者音声比較
部7に出力する。特定話者辞書11は操作者の発声音を
単語ごとに比較音声データ12としてあらかじめ登録し
たものである。特定話者音声比較部7は、音声入力部4
が出力した話者音声信号5と比較音声データ選択部3が
出力した比較音声データ12とを比較し、両者の類似度
13を誘導内容決定部10に出力する。
【0032】例えば、個人識別データ入力部1にA氏の
個人識別データ2が入力されるとともに、不特定話者認
識部6で「はい」という単語が認識されると、比較音声
データ選択部3では特定話者辞書11の内、A氏の「は
い」という音声データを選択し、これを比較音声データ
12として特定話者音声比較部7へ出力する。特定話者
音声比較部7では、不特定話者認識部6が認識した「は
い」という単語の話者音声信号5とA氏の「はい」とい
う音声データである比較音声データ12とを比較して、
この二つの音声データの類似度13を判定し、誘導内容
決定部10へ出力するのである。
【0033】誘導内容決定部10は、不特定話者認識部
6が出力した認識単語9と特定話者音声比較部7が出力
した類似度13をもとに話者への誘導内容(質問内容)
14を決定し、誘導内容出力部15に誘導内容14を出
力する。誘導内容14を決定する要素に認識単語9があ
るのは、例えば操作者の音声が「はい」と「いいえ」と
では誘導内容14が異なってくるのは当然であるためで
ある。
【0034】多くの場面(操作ステップ)では認識単語
9だけで誘導内容14が決定される。しかし特定の場
面、例えば現金自動預け払い機で現金を支払う場面やセ
キュリティ管理の厳しい部屋への入室を許可するなどの
場面においては、特定話者音声比較部7が出力した類似
度13が関与する。すなわち個人識別データ2を記憶し
た媒体を所持しており、簡単な暗証番号などでのチェッ
クにも合格した人物による操作であっても、特定話者音
声比較部7が出力した類似度13が低い場合、現金自動
預け払い機での現金の支払いやセキュリティ管理の厳し
い部屋への入室などのチェックをさらに厳しくするよう
な誘導内容14にするものである。
【0035】類似度13が高いか低いかのしきい値は要
求されるセキュリティレベルに応じて設定する。類似度
13が低い場合には、以降の操作を拒否することも一つ
の方法であるが、人間の発声する音声は体調あるいは時
間経過により変化することがあり、また現金自動預け払
い機での現金の支払いの場合には本人の依頼を受けた別
人(例えば家族)が操作することもあるので、たとえ類
似度13が低く操作者が本人と異なると判定されても、
厳しいチェックを受ければ現金自動預け払い機での現金
の支払いとかセキュリティ管理の厳しい部屋への入室な
どの目的が達せられるようにしておく方が望ましい。
【0036】誘導内容出力部15は、CRTあるいはL
CDなどによる表示、音声出力、表示と音声出力の両
方、電話回線への音声信号の出力などがあるが、いずれ
にしても誘導内容決定部10が決定した誘導内容14を
出力することができるものであればよい。
【0037】なお1回の音声入力のたびに類似度13を
算出できるが、類似度13が低いか高いかを判定し誘導
内容14を決定する際には、判定するとき以前に入力さ
れた音声の類似度13すべてをもとに判断した方が好ま
しい。
【0038】以上に説明してきたように本実施の形態
は、操作者が本人である確率が高い場合には、簡単な操
作で現金自動預け払い機での現金の支払いやセキュリテ
ィ管理の厳しい部屋への入室などの目的が達せられ、本
人である確率が低い場合には複雑な操作を要求すること
により不正操作を防止することができる。
【0039】(実施の形態2)次に本発明の第2の実施
の形態について図2を用いて説明する。図2は本発明の
第2の実施の形態における操作誘導装置のブロック図で
ある。
【0040】本実施の形態は個人識別データ2の入力に
ついても音声により行うようにしたものである。このた
めに、個人識別データ2を音声で入力する操作ステップ
の際に不特定話者認識部6で認識される単語あるいは複
数の単語を、あらかじめ個人識別データ2として個人識
別データ記憶部16に記憶している。
【0041】これは、暗証番号等を音声で入力し、同時
にこの音声データを個人の特定に用いるものであり、例
えば、B氏を認識する単語としてB氏の暗証番号である
「1234」を用いたとする場合、個人識別データ記憶
部16には「1234」がB氏の暗証番号であることが
記憶されており、不特定話者認識部6にて「1234」
という単語を認識したときに、個人識別データ記憶部1
6からB氏の個人識別データ2(暗証番号「123
4」)が比較音声データ選択部3に出力され、この比較
音声データ選択部3にて、特定話者辞書11内のB氏の
「1234」の音声データを検索し、これを比較音声デ
ータ12として特定話者音声比較部7に出力する。特定
話者音声比較部7では、音声入力部4から出力された
「1234」の音声データと、B氏の「1234」の音
声データである比較音声データ12とを比較し、この二
つの音声データの類似度を判定するのである。
【0042】このように、本実施の形態の個人識別デー
タ記憶部16の個人識別データ2の出力は第1の実施の
形態の個人識別データ入力部1の個人識別データ2の出
力と対応しており、個人識別データ2の出力以降につい
ては、第1の実施の形態と同様である。
【0043】本実施の形態によると、個人識別データ入
力部1を省略することができ、また個人識別データ入力
作業(例えば磁気カードを取り出し、磁気カードリーダ
に読み取らせ、その後磁気カードを所定の場所に戻した
りすること)を省略できることから、低コストで操作性
の良い操作誘導装置を構築できる。
【0044】(実施の形態3)次に本発明の第3の実施
の形態について図3を用いて説明する。図3は本発明の
第3の実施の形態における操作誘導装置のブロック図で
ある。図3において、音声入力部4で入力した音声は、
話者音声信号5という電気信号の形式で特定話者認識部
17に出力される。特定話者認識部17は、個人識別デ
ータ入力部1で入力した個人識別データ2に対応する特
定話者辞書11を用い音声入力部4が出力する話者音声
信号5の音声認識を行い、認識結果の認識単語9を誘導
内容決定部10に出力すると同時に、話者音声信号5と
認識単語9を決定するに用いた特定話者辞書11内の音
声データとを比較し、両者の類似度13を誘導内容決定
部10に出力する。誘導内容決定部10以降は第1の実
施の形態あるいは第2の実施の形態と同じである。
【0045】第1の実施の形態と比較すると不特定話者
辞書8ならびに不特定話者認識部6を省略することがで
きることから低コストにすることができる。なお、音声
の認識に不特定話者認識部6を用いていないことから、
個人識別データ2に対応する人物以外が操作をした場合
には音声の認識そのものが困難になるため、個人識別デ
ータ2に対応する人物以外の操作を実質上不可能にす
る。
【0046】(実施の形態4)次に本発明の第4の実施
の形態について図4を用いて説明する。図4は本発明の
第4の実施の形態における操作誘導装置のブロック図で
ある。
【0047】本実施の形態は個人識別データ2の入力を
音声により行うようにしたものである。このために、個
人識別データ2を音声で入力する操作ステップの際に不
特定話者認識部6で認識される単語あるいは複数の単語
を、あらかじめ個人識別データ2として個人識別データ
記憶部16に記憶しており、本実施の形態は第2の実施
の形態で用いた音声による個人識別データ入力を第3の
実施の形態に適用したものである。
【0048】個人識別データ記憶部16の個人識別デー
タ2の出力は第3の実施の形態の個人識別データ入力部
1の個人識別データ2の出力と対応しており、その他の
部分については、第3の実施の形態と同様である。本実
施の形態によると、個人識別データ入力作業を省略でき
ることから、第3の実施の形態よりも操作性の良い操作
誘導装置を構築できる。
【0049】(実施の形態5)次に本発明の第5の実施
の形態について図5を用いて説明する。図5は本発明の
第5の実施の形態の操作誘導装置のブロック図である。
図5と図4を比較すると明らかなように、図5は図4に
キー入力部18を追加したものである。第1から第3の
実施の形態にキー入力部18を追加した実施の形態も考
えられるが、本実施の形態は第4の実施の形態に基づい
ている。
【0050】第1から第4の実施の形態においては、キ
ー入力部18が無くとも操作誘導装置を構成することが
可能であるが、キー入力部18があった方が好ましい場
合がある。例えば暗証番号を入力する際、密室での入力
あるいは通信回線を介しての入力であれば音声によって
入力しても問題にはならないが、他人が聞けるような環
境で暗証番号を音声で入力することは危険であり、キー
入力部18を用いて入力したほうが良い。
【0051】さらに第4の実施の形態に基づいた本実施
の形態の場合には、誘導内容決定部10に出力する認識
単語9を特定話者認識部17が生成するので、現金自動
預け払い機などを代理人が操作できるようにしたいとい
う要求がある場合にはキー入力部18が不可欠である。
【0052】(実施の形態6)次に本発明の第6の実施
の形態について図6を用いて説明する。図6は本発明の
第6の実施の形態における操作誘導装置のブロック図で
ある。図6と図1を比較すると明らかなように、図6は
図1に特定話者辞書11を書き換える特定話者辞書書換
部19を追加したものであり、本実施の形態は第1の実
施の形態に基づいている。第2から第5の実施の形態に
特定話者辞書書換部19を追加した実施の形態も考えら
れるが、ここでは第1の実施の形態に基づいた実施の形
態について説明する。
【0053】図6において、音声入力部4が出力する話
者音声信号5と不特定話者認識部6が出力する認識単語
9と個人識別データ入力部1が出力する個人識別データ
2が特定話者辞書書換部19に入力され、特定話者辞書
書換部19は個人識別データ2と認識単語9とから書き
換えるべき特定話者辞書11の領域を特定し、その領域
を話者音声信号5で書き換えることによって、特定話者
辞書11の書き換えが行われる。
【0054】一般に、同一人であっても数週間単位で発
声音は微妙に変化するが、特定話者辞書11の書き換え
機能を有することにより、操作者の発声音が時の経過と
ともに変化したとしても更新することができる。すなわ
ち、特定話者辞書11の内容が、当初に設定されたまま
変わらないとすると、同一人であっても発生音が徐々に
変化していった場合には、当初設定された音声データと
の類似度が徐々に低下することとなり、本人を特定する
ことが困難となってしまう。しかしながら、発生音の変
化を都度更新することにより、この様な問題は解決され
るのである。
【0055】また常に代理人(例えば配偶者)によって
操作される場合に、代理人の発声音を登録することによ
って本人が操作するのと同様に代理人が操作することが
でき、代理人の操作を簡単にすることができる(ただ
し、今度は反対に本人が操作する場合には複雑な操作を
要す)。
【0056】この特定話者辞書11を書き換える場合と
して、類似度13が高く操作者が本人である確率が高
いが、登録された特定話者辞書11の内容と若干の差異
がある場合、類似度13が高く操作者が本人である確
率が高く、操作者によって特定話者辞書11の更新を依
頼された場合、類似度13が低いが、他の手段(例え
ば本人以外に知ることのできない複雑な暗証番号が入力
された)により本人または本人の依頼を受けた代理人で
あることが確認された場合、その他様々な場合が考えら
れるが、操作誘導装置の要求仕様に応じてどの場合に書
き換えを行うかを決定すればよい。
【0057】次に、本実施の形態において、誘導内容出
力部15が音声出力機能を有している場合の処理の流れ
について説明する。
【0058】図9は操作誘導装置の音声出力のステップ
と操作者の入力動作のステップを併記した図である。操
作誘導装置の音声出力のステップS001に対して操作
者の入力動作のステップS101のように操作誘導装置
の音声出力と操作者の入力動作は1対1に対応してい
る。S006とS106の対までは従来の操作誘導装置
のステップと表面上は同じであるが、S101で個人識
別データ2を取得し、個人識別データ2に対応する人物
の特定話者辞書11とS102、S103、S106に
おける発声音とを比較し、類似度13の算出を行う。
【0059】この例では類似度13が低いためS007
とS107の対からS011とS111の対までのステ
ップを経由することになっている。S007とS107
の対は、操作者が本人あるいは本人の代理人であること
を確認する為のステップである。この例では第2暗証番
号を4桁にしているが、更に安全性を確保するためには
桁数を増やしても良い。S008は、特定話者辞書11
の書き換えを確認するステップであり、この例ではS1
08のステップで特定話者辞書11の書き換えが選択さ
れている。S009とS109の対からS011とS1
11のステップは特定話者辞書11に格納する音声デー
タを入力するステップである。
【0060】以上、類似度13が低い場合について説明
してきたが、類似度13が高い場合は、S006とS1
06の対のステップから直接S012とS112の対の
ステップに移行し、その場合には表面上は従来と全く同
じステップを踏むことになる。
【0061】したがって、この説明から明らかなよう
に、操作者が個人識別データ2に対応する本人である確
率が高い場合には、何ら従来と操作は変わらず、操作者
に操作の煩わしさを感じさせることはない。
【0062】図8は第6の実施の形態の操作誘導装置の
正面図である。LCD20とスピーカ21を備えている
ことから、誘導内容出力部15には、表示機能と音声出
力機能があることがわかる。なお図8には音声入力部4
の一部であるマイクロフォン22とキー入力部18の一
部であるキー23も併記している。図8から明らかなよ
うに、音声出力機能を備えることによって、表示機能を
1ラインのLCD20にすることができ、操作誘導装置
を小さくすることができる。その結果、手にとって操作
することも可能となり、車椅子からの操作や、自動車の
内部からの操作も可能になる。
【0063】
【発明の効果】以上の説明から明らかなように本発明の
第1の操作誘導装置は、類似度に基づいて誘導内容を決
定するので、本人以外の不正操作を防止することができ
る。
【0064】また、本発明の第2の操作誘導装置は、特
定話者認識手段により認識された単語の音声データとあ
らかじめ記憶された個人が発生した単語の音声データと
を比較するので、個人を特定するためのデータの入力装
置を別途設ける必要がなく、また、特別な入力作業が不
要であるので、低コストでかつ操作性が向上する。
【0065】また、本発明の第3の操作誘導装置は、操
作者が本人であるときの操作性の低下を防止し、かつ操
作者が本人以外の場合の不正操作を防止することができ
るという効果がある。
【0066】また、本発明の第4の操作誘導装置は、本
発明の第3の操作誘導装置の効果に加えて、個人識別デ
ータ入力部を省略することができ、また個人識別データ
入力作業を省略できることから、本発明の第3の操作誘
導装置よりも低コストで操作性の良い操作誘導装置を構
築できるという効果がある。
【0067】また、本発明の第5の操作誘導装置は、本
発明の第3の操作誘導装置の効果に加えて、不特定話者
辞書ならびに不特定話者認識部を省略することができる
ことから低コストにすることができ、また個人識別デー
タに対応する人物以外が操作をした場合には音声の認識
そのものが困難になるため、個人識別データに対応する
人物以外の操作を実質上不可能にするという効果があ
る。
【0068】また、本発明の第6の操作誘導装置は、本
発明の第5の操作誘導装置の効果に加えて、個人識別デ
ータ入力作業を省略できることから、本発明の第5の操
作誘導装置よりも操作性の良い操作誘導装置を構築でき
るという効果がある。
【0069】また、本発明の第7の操作誘導装置は、本
発明の第3ないし第5の操作誘導装置の効果に加えて、
音声によって入力すると不都合の生じるデータ入力も可
能となり、応用範囲が広がるという効果がある。
【0070】また、本発明の第8の操作誘導装置は、本
発明の第3ないし第5の操作誘導装置の効果に加えて、
操作者の発声音が時間の経過とともに微妙に変化したと
しても更新することができるという効果と、常に代理人
によって操作される場合に、代理人の操作を簡単にする
ことができるという効果がある。
【0071】また、本発明の第9の操作誘導装置は、本
発明の第3ないし第5の操作誘導装置の効果に加えて、
操作誘導装置を小さくすることができ、その結果手にと
って操作することも可能となり、車椅子からの操作や、
自動車の内部からの操作も可能になるという効果があ
る。
【0072】また、本発明の第10の操作誘導装置は、
誘導内容決定手段が、類似度が高いほど実際の操作者の
操作回数を少なくするとともに、前記類似度が低いほど
前記操作回数を多くするので、操作者本人であるときの
操作性の低下を防止するとともに、操作者が本人以外の
場合の不正操作を防止することができる。
【0073】また、本発明の第11の操作誘導装置は、
音声比較手段が実際の操作者の複数の音声データについ
て類似度を判定するとともに、誘導内容決定手段はすべ
ての前記類似度に基づいて誘導内容を決定するので、誘
導内容の決定の正確さが向上する。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態における操作誘導装
置のブロック図
【図2】本発明の第2の実施の形態における操作誘導装
置のブロック図
【図3】本発明の第3の実施の形態における操作誘導装
置のブロック図
【図4】本発明の第4の実施の形態における操作誘導装
置のブロック図
【図5】本発明の第5の実施の形態における操作誘導装
置のブロック図
【図6】本発明の第6の実施の形態における操作誘導装
置のブロック図
【図7】同操作誘導装置の音声出力のステップと操作者
の入力動作のステップを併記した図
【図8】同操作誘導装置の正面図
【図9】従来の操作誘導装置の音声出力のステップと操
作者の入力動作のステップを併記した図
【符合の説明】
1 個人識別データ入力部 2 個人識別データ 3 比較音声データ選択部 4 音声入力部 5 話者音声信号 6 不特定話者認識部 7 特定話者音声比較部 8 不特定話者辞書 9 認識単語 10 誘導内容決定部 11 特定話者辞書 12 比較音声データ 13 類似度 14 誘導内容 15 誘導内容出力部 16 個人識別データ記憶部 17 特定話者認識部 18 キー入力部 19 特定話者辞書書換部 20 LCD 21 スピーカ 22 マイクロフォン 23 キー
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI G06F 15/30 340

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】実際の操作者の音声データとあらかじめ記
    憶された個人の音声データとを比較するとともに前記二
    つの音声データの類似度を判定する音声比較手段と、前
    記音声比較手段によって判定された類似度に基づいて誘
    導内容を決定する誘電内容決定手段とを備えた操作誘導
    装置。
  2. 【請求項2】実際の操作者の音声データからこの音声デ
    ータに対応した1つもしくは複数の単語を認識する不特
    定話者認識手段と、個人を認識する1つもしくは複数の
    単語を記憶する個人識別データ記憶手段とを備え、音声
    比較手段は前記不特定話者認識手段により認識された前
    記単語が前記個人を特定する前記単語と同じである場合
    に、前記不特定話者認識手段により認識された前記単語
    の音声データとあらかじめ記憶された前記個人が発声し
    た前記単語の音声データとを比較する請求項1記載の操
    作誘導装置。
  3. 【請求項3】話者の音声を入力する音声入力部と、非登
    録式の不特定話者辞書と、前記音声入力部が出力する話
    者音声信号を前記不特定話者辞書を用いて認識する不特
    定話者認識部と、個人識別データを入力する個人識別デ
    ータ入力部と、登録式の特定話者辞書と、前記個人識別
    データ入力部で入力した個人識別データと前記不特定話
    者認識部で認識した認識単語を用い前記特定話者辞書か
    ら比較音声データを選択する比較音声データ選択部およ
    び前記話者音声信号と前記比較音声データ選択部で選択
    した比較音声データとを比較し類似度を出力する特定話
    者音声比較部とからなる音声比較手段と、前記認識単語
    と前記特定話者音声比較部が出力した前記類似度から話
    者への誘導内容を決定する誘導内容決定手段と、前記誘
    導内容決定手段が決定した誘導内容を出力する誘導内容
    出力部とを備えた操作誘導装置。
  4. 【請求項4】話者の音声を入力する音声入力部と、非登
    録式の不特定話者辞書と、前記音声入力部が出力する話
    者音声信号を前記不特定話者辞書を用いて認識する不特
    定話者認識部と、前記話者音声信号が個人を識別する1
    つもしくは複数の単語であるとき前記不特定話者認識部
    で認識される前記単語をあらかじめ個人識別データとし
    て記憶する個人識別データ記憶手段と、登録式の特定話
    者辞書と、前記個人識別データ記憶手段内の個人識別デ
    ータと前記不特定話者認識部で認識した認識単語を用い
    前記特定話者辞書から比較音声データを選択する比較音
    声データ選択部および前記話者音声信号と前記比較音声
    データ選択部で選択した比較音声データとを比較し類似
    度を出力する特定話者音声比較部とからなる音声比較手
    段と、前記認識単語と前記特定話者音声比較部が出力し
    た前記類似度から話者への誘導内容を決定する誘導内容
    決定手段と、前記誘導内容決定手段が決定した誘導内容
    を出力する誘導内容出力部とを備えた操作誘導装置。
  5. 【請求項5】話者の音声を入力する音声入力部と、個人
    識別データを入力する個人識別データ入力部と、登録式
    の特定話者辞書と、前記個人識別データ入力部で入力し
    た個人識別データに対応する前記特定話者辞書を用い前
    記音声入力部が出力する話者音声信号の音声認識を行い
    認識単語を出力するとともに前記話者音声信号と前記特
    定話者辞書に登録された音声データとの類似度を出力す
    る特定話者認識部を備えた音声比較手段と、前記特定話
    者認識部が出力した認識単語と前記類似度から話者への
    誘導内容を決定する誘導内容決定手段と、前記誘導内容
    決定手段が決定した誘導内容を出力する誘導内容出力部
    とを備えた操作誘導装置。
  6. 【請求項6】話者の音声を入力する音声入力部と、非登
    録式の不特定話者辞書と、前記音声入力部が出力する話
    者音声信号を前記不特定話者辞書を用いて認識する不特
    定話者認識部と、前記話者音声信号が個人を識別する1
    つもしくは複数の単語であるとき前記不特定話者認識部
    で認識される前記単語をあらかじめ個人識別データとし
    て記憶する個人識別データ記憶部と、登録式の特定話者
    辞書と、前記個人識別データ記憶部内の個人識別データ
    に対応する前記特定話者辞書を用い前記音声入力部が出
    力する話者音声信号の音声認識を行い認識単語を出力す
    るとともに前記話者音声信号と前記特定話者辞書に登録
    された音声データとの類似度を出力する特定話者認識部
    を備えた音声比較手段と、前記特定話者認識部が出力し
    た認識単語と前記類似度から話者への誘導内容を決定す
    る誘導内容決定手段と、前記誘導内容決定手段が決定し
    た誘導内容を出力する誘導内容出力部とを備えた操作誘
    導装置。
  7. 【請求項7】キー入力部を具備した請求項3から6のい
    ずれかに記載の操作誘導装置。
  8. 【請求項8】音声入力部で入力した音声と認識単語を用
    い特定話者辞書を書換える特定話者辞書書換部を具備し
    た請求項3から6のいずれかに記載の操作誘導装置。
  9. 【請求項9】誘導内容出力部が音声出力機能を有する請
    求項3から6のいずれかに記載の操作誘導装置。
  10. 【請求項10】誘導内容決定手段は、類似度が高いほど
    実際の操作者の走査回数を少なくするとともに、前記類
    似度が低いほど前記操作回数を多くする請求項1から6
    のいずれかに記載の操作誘導装置。
  11. 【請求項11】音声比較手段は実際の操作者の複数の音
    声データについて類似度を判定するとともに、誘導内容
    決定手段はすべての前記類似度に基づいて誘導内容を決
    定する請求項1から6のいずれかに記載の操作誘導装
    置。
JP11074297A 1997-04-28 1997-04-28 操作誘導装置 Pending JPH10301755A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11074297A JPH10301755A (ja) 1997-04-28 1997-04-28 操作誘導装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11074297A JPH10301755A (ja) 1997-04-28 1997-04-28 操作誘導装置

Publications (1)

Publication Number Publication Date
JPH10301755A true JPH10301755A (ja) 1998-11-13

Family

ID=14543387

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11074297A Pending JPH10301755A (ja) 1997-04-28 1997-04-28 操作誘導装置

Country Status (1)

Country Link
JP (1) JPH10301755A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6690260B1 (en) 1999-08-25 2004-02-10 Honda Giken Kabushiki Kaisha Driver authentication apparatus and method for identifying automatically-extracted driver's operation feature data with already-registered feature data
KR100423495B1 (ko) * 2001-06-21 2004-03-18 삼성전자주식회사 음성인식에 의한 휴대용 기기의 동작제어 장치 및 방법
KR100485864B1 (ko) * 2001-12-28 2005-04-28 최중인 벨소리 겸용 음향바코드를 이용한 인증시스템
JP2006259836A (ja) * 2005-03-15 2006-09-28 Oki Consulting Solutions Co Ltd 不正利用監視システムおよび不正利用監視方法
CN103236261A (zh) * 2013-04-02 2013-08-07 四川长虹电器股份有限公司 一种特定人语音识别的方法
JP2021184282A (ja) * 2017-07-26 2021-12-02 日本電気株式会社 音声操作装置及びその制御方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6690260B1 (en) 1999-08-25 2004-02-10 Honda Giken Kabushiki Kaisha Driver authentication apparatus and method for identifying automatically-extracted driver's operation feature data with already-registered feature data
KR100423495B1 (ko) * 2001-06-21 2004-03-18 삼성전자주식회사 음성인식에 의한 휴대용 기기의 동작제어 장치 및 방법
KR100485864B1 (ko) * 2001-12-28 2005-04-28 최중인 벨소리 겸용 음향바코드를 이용한 인증시스템
JP2006259836A (ja) * 2005-03-15 2006-09-28 Oki Consulting Solutions Co Ltd 不正利用監視システムおよび不正利用監視方法
CN103236261A (zh) * 2013-04-02 2013-08-07 四川长虹电器股份有限公司 一种特定人语音识别的方法
JP2021184282A (ja) * 2017-07-26 2021-12-02 日本電気株式会社 音声操作装置及びその制御方法
US11961534B2 (en) 2017-07-26 2024-04-16 Nec Corporation Identifying user of voice operation based on voice information, voice quality model, and auxiliary information

Similar Documents

Publication Publication Date Title
US6700998B1 (en) Iris registration unit
US4827518A (en) Speaker verification system using integrated circuit cards
EP0686297B1 (en) Voice command control and verification system and method
US20080208580A1 (en) Method and Dialog System for User Authentication
US5677989A (en) Speaker verification system and process
US20080059805A1 (en) Biometrics authentication apparatus
US5752231A (en) Method and system for performing speaker verification on a spoken utterance
CN102201055A (zh) 信息处理设备、信息处理方法以及程序
JP2002358576A (ja) Pos拡張マネージャ/オペレータ・オーバライド・システム
JP2002527836A (ja) 人物の生物測定学的な識別装置および方法
JPH10312459A (ja) 携帯電子装置及び生体情報を用いた個人認証方法
JP4318475B2 (ja) 話者認証装置及び話者認証プログラム
JPH10301755A (ja) 操作誘導装置
JP6100467B2 (ja) 出入管理システム及び認証装置
JP2001005836A (ja) アイリス登録システム
KR20010009136A (ko) 지문인식 도어-락(Lock) 구동 제어 방법
US6349279B1 (en) Method for the voice recognition of a speaker using a predictive model, particularly for access control applications
JP2007072777A (ja) 取引処理システム
JP2002229959A (ja) パスワード入力装置
KR20040025004A (ko) 지문이 조합된 비밀번호 인증시스템
KR20010098561A (ko) 생체정보를 이용한 신용카드 결제 시스템 및 그 방법
JP4521116B2 (ja) 個人識別装置
KR20110012270A (ko) 음성과 랜덤하게 가변되는 자판 배열을 이용한 비밀 번호 처리 방법과 그 시스템
KR20070020477A (ko) 사용자 인증 방법 및 대화 시스템
KR100484210B1 (ko) 예측모델을사용한,특히억세스제어응용을위한발성자음성인식방법