JPH09244684A - 本人認証装置 - Google Patents

本人認証装置

Info

Publication number
JPH09244684A
JPH09244684A JP8080745A JP8074596A JPH09244684A JP H09244684 A JPH09244684 A JP H09244684A JP 8080745 A JP8080745 A JP 8080745A JP 8074596 A JP8074596 A JP 8074596A JP H09244684 A JPH09244684 A JP H09244684A
Authority
JP
Japan
Prior art keywords
speaker
voice
result
personal
person
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8080745A
Other languages
English (en)
Inventor
Fumiaki Sugaya
史昭 菅谷
Toshiaki Uchibe
利明 内部
Seiichi Yamamoto
誠一 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
Kokusai Denshin Denwa KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Denshin Denwa KK filed Critical Kokusai Denshin Denwa KK
Priority to JP8080745A priority Critical patent/JPH09244684A/ja
Publication of JPH09244684A publication Critical patent/JPH09244684A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 簡単なシステムで、高性能な本人認証装置を
提供することにある。 【解決手段】 本人認証をする人が予め発話した音声か
ら特徴を抽出する特徴抽出器2と、該特徴を登録する音
声特徴情報蓄積器4と、本人認証を要求する人の音声か
ら特徴を抽出し、音声特徴情報蓄積器4に登録されてい
る特徴量と比較し、発話者が既登録であるか未登録であ
るかを判定する話者判定器5と、個人ID、パスワード
等の連続数字等を認識できる音声個人ID認識器6と、
前記話者判定器5と音声個人ID認識器6との論理和を
計算する論理和回路7とから構成されている。前記話者
判定器5と音声個人ID認識器6との論理和を計算し、
最終話者判定結果So を得るようにしたことにより、正
解率を大幅に向上させることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は本人認証装置に関
し、特に音声により本人であることを明らかにする本人
認証装置に関する。
【0002】
【従来の技術】図6は従来の話者認識系の基本構成を示
すブロック図である。学習をする時には、スイッチ41
は学習側に接続され、特徴抽出器40によって抽出され
た音声波の特徴が、標準パターン記憶部42に、話者別
に登録される。一方、話者認識を行う時には、前記スイ
ッチ41は認識側に接続される。そこで、話者からの音
声入力があると、特徴抽出器40は音声波から特徴抽出
を行う。抽出された特徴は、類似度判定器43に送られ
る。類似度判定器43では、前記標準パターン記憶部4
2に登録されている各話者の標準パターンと、該抽出さ
れた特徴との比較を行い、その距離あるいは類似度を調
べ、その度合いにより認識の判定を行う。すなわち、話
者照合の場合は、入力音声と標準パターンの距離と、予
め定められた判定基準(しきい値)との大小関係によっ
てその照合を行う。
【0003】
【発明が解決しようとする課題】上記した話者認識装置
によれば、かなりの精度で、話者照合を行うことができ
るが、その精度はまだ十分ではないという問題があっ
た。また、話者認識技術だけを用いて、長時間に渡って
高い認識率を保証するためには、周波数特性の広いマイ
クロフォンが必要になったり、話者認識のシステムが複
雑になったりして、利用者が簡単に準備することができ
ないという問題があった。また、標準パターン記憶部4
2への登録音声の録音時間あるいは話者照合使用時の音
声が長くなり、利用者に不便であるという問題もあっ
た。
【0004】この発明の目的は、前記した従来技術の問
題点を除去し、簡単なシステムで、高性能な本人認証装
置を提供することにある。
【0005】
【課題を解決するための手段】前記した目的を達成する
ために、この発明は、発話者の入力音声に基づいて本人
の認証を行う本人認証装置において、予め登録されてい
る特徴量と該入力音声から抽出した特徴量とから、発話
者が既登録であるか未登録であるかを判定する第1の手
段と、発話者の入力音声の認識結果から、本人であるか
否かを判定する第2の手段と、前記第1、第2の手段の
判定結果が入力する論理和手段とを具備した点に特徴が
ある。
【0006】この発明によれば、前記第1、第2の手段
の判定結果を論理和して、最終の話者判定を行うように
しているので、第1、第2の手段のいずれかで本人認証
が確認されれば、最終的に話者の判定が成立したことに
なり、本人認証の正解率を向上させることができる。
【0007】
【発明の実施の形態】以下に、図面を参照して、本発明
を詳細に説明する。図1は、本発明の本人認証装置の一
実施形態の概略の構成を示すブロック図である。図1に
おいて、本人認証装置1の入出力信号はディジタル信号
であり、本人認証装置1はディジタル処理により実現さ
れることを前提に説明する。したがって、入出力がアナ
ログ音声信号の場合には、アナログ・ディジタル変換器
(AD変換器)により信号変換されて、本実施形態の本
人認証装置1と接続されるものとする。
【0008】以下の説明では、個人に付与された番号
(以下、個人IDと呼ぶ)とそれを確認するパスワード
を入力音声とする場合について説明する。本人認証装置
1の利用者は個人IDを発声し、続いてパスワードを発
声するものとする。該個人IDやパスワードには、認証
システムで一般的に使われる数字や氏名を用いることが
できる。
【0009】本人認証装置1は、入力音声信号Si から
特徴量を抽出する特徴抽出器2と、学習時と認識時とで
切換えられるスイッチ3と、前記抽出された特徴量を記
憶する音声特徴情報蓄積器4と、話者判定器5と、音声
個人ID認識器6と、論理和(OR)回路7と、後述す
る閾値演算時にオフとなり、本人認証時にオンとなるス
イッチ8とから構成されている。論理和回路7からは、
最終話者判定結果Soが出力される。
【0010】次に、前記話者判定器5の一具体例を、図
2を参照して説明する。話者判定器5は、話者類似度計
算器11と、閾値情報演算器12と、閾値情報蓄積器1
3と、話者類似度判定器14と、スイッチ15から構成
されている。話者類似度計算器11では、スイッチ3を
通って入力される音声波と、前記音声特徴情報蓄積器4
とから入力される予め登録された話者との特徴量との類
似度を計算し、閾値情報演算器12または話者類似度判
定器14へ出力する。話者類似度判定器14では、閾値
情報蓄積器13に予め蓄積されている閾値と話者類似度
計算器11で計算された類似度とを比較し、話者が既登
録であるか未登録であるかの判定結果aを出力する。
【0011】ここで、前記閾値情報蓄積器13に蓄積さ
れている閾値を求める方法の一例を説明する。ここで
は、閾値を話者毎に計算し、N人が認証システムを使用
する場合について説明する。該閾値を求める時には、ス
イッチ15は閾値情報演算器12側に接続される。この
時には、前記スイッチ3は認識時側に接続される。i番
目(i=1,2,...,i,...,N )の話者の閾値を計算するため
には、まずi番目の話者本人の類似度を話者類似度計算
器11で計算し、閾値情報演算器12へ出力する。次
に、i番目の話者と該i番目の話者を除く他人との類似
度を話者類似度計算器11で計算し、該閾値情報演算器
12へ出力する。該閾値情報演算器12では、前記他人
との類似度の平均値を計算し、該平均値と前記本人の類
似度との平均値を演算し、話者iの閾値とする。この閾
値は閾値情報蓄積器13に格納する。以上の処理をN人
の話者に対して行うことにより、全話者の閾値が閾値情
報蓄積器13に設定される。
【0012】次に、前記音声個人ID認識器6の一具体
例を、図3を参照して説明する。該音声個人ID認識器
6は不特定話者音声認識器21と、話者IDデータベー
ス22と、話者ID判定器23とから構成されている。
該話者IDデータベース22には、予め、個人IDとパ
スワードの組み合わせのデータが蓄積されているものと
する。
【0013】前記不特定話者音声認識器21は、前記ス
イッチ3、8を通って入力してくる特徴量から、不特定
話者の音声認識を行う。具体的には、図1の入力音声信
号が、個人IDとパスワードの音声であるから、不特定
話者音声認識器21からは、個人IDとパスワードの認
識結果が出力される。話者ID判定器23は、該認識さ
れた個人IDとパスワードが前記話者IDデータベース
22に含まれているか否かを検査し、含まれている場合
には、肯定の話者判定結果bを出力する。
【0014】次に、図1の本人認証装置1の動作を説明
する。本人認証装置1の利用者は、予め音声を登録する
必要がある。まず、該音声を登録する動作について説明
する。スイッチ3は学習時側に接続される。利用者が個
人IDとパスワードを発声すると、その音声は特徴抽出
器2に入力され、該特徴抽出器2にて話者認識あるいは
音声認識に必要な特徴量に変換される。次いで、該特徴
量は前記スイッチ3を経て音声特徴情報蓄積器4に入力
する。該音声特徴情報蓄積器4は、該特徴量を話者毎に
蓄積する。
【0015】次に、前記閾値情報蓄積器13に蓄積する
閾値情報の演算が行われる。この時には、スイッチ3は
認識時側、スイッチ8はオフ、スイッチ15は閾値情報
演算器12側に接続される。利用者が再度個人IDとパ
スワードを発声し、あるいは発声済みの個人IDとパス
ワードを録音・再生すると、話者本人の類似度と、話者
本人と他人との類似度は話者類似度計算器11で計算さ
れ、閾値情報演算器12に送られる。この時、閾値情報
演算器12では、前記他人との類似度の平均値を演算
し、該平均値と前記本人の類似度との平均値を演算し、
前記利用者の閾値として閾値情報蓄積器13に格納す
る。なお、この閾値情報の演算の仕方は一例であり、本
発明はこれに限定されるものではない。
【0016】次に、本人認証の動作に移ると、前記スイ
ッチ3は認識時側、スイッチ8はオン、スイッチ15は
話者類似度判定器14側に接続される。これにより、話
者判定器5と音声個人ID認識器6とに特徴抽出器2の
出力である特徴量が入力する。話者判定器5は前記のよ
うにして予め蓄積されている登録話者の特徴量を音声特
徴情報蓄積器4から取り出し、両特徴量を比較し、話者
本人の類似度を計算する。次いで、該類似度と前記閾値
情報蓄積器13に蓄積されている本人の閾値とを比較
し、正当な話者であるか否かの判定をする。そして、こ
の正否結果を論理和回路7に出力する。
【0017】一方、音声個人ID認識器6は話者判定器
5の入力と同じ特徴量を入力し、個人IDとパスワード
認識を行い、認識結果を基に判断された話者の正否を論
理和回路7に出力する。論理和回路7では、話者判定器
5と音声個人ID認識器6の認識結果の論理和の結果を
出力する。したがって、話者判定器5あるいは音声個人
ID認識器6のどちらかが正解を出力すれば、話者が判
定されることになり、どちらかが不正解を出力しても片
方が補うことが可能であり、本発明による本人認証装置
1の認識率が向上することになる。認識率の向上を一例
を挙げて具体的に説明する。
【0018】話者判定器5の正解率を90%、音声個人
ID認識器6の正解率を95%とすると論理和回路7の
出力の誤りは2つの入力が両方誤りの場合であり、(1
−0.9)×(1−0.95)=0.005=0.5%
の誤り率となる。すなわち、正解率は99.5%となり
格段に性能が向上することになる。現状の音声による本
人認証では、完全な認識を行うことは不可能であるの
で、本実施形態は有効である。
【0019】以上は、利用者の発話内容は、個人IDと
パスワードであったが、さらに話者認識精度を向上させ
るためには、前記音声特徴情報蓄積器4と話者判定器5
にテキスト音声を追加するようにしてもよい。すなわ
ち、該音声特徴情報蓄積器4に、個人IDとパスワード
に続いてテキスト音声を追加登録する。そして、本人認
証をする場合には、話者判定器5が、個人IDとパスワ
ードに加えて、テキスト音声で話者認識をすることによ
り、高い話者認識率を得ることができるようになる。
【0020】次に、本発明の第2の実施形態について、
図4を参照して説明する。図において、図1と同符号は
同等または同一物を示す。前記第1の実施形態では、特
徴抽出器2を話者判定器5と音声個人ID認識器6とで
共通に使用する場合であったが、図4に示すように別々
の特徴抽出器2と31を設けることも可能である。この
実施形態では、入力音声信号に対して特徴抽出器2を介
した話者判定器5による話者判定と、特徴抽出器31を
介した音声個人ID認識器6による話者判定とを個別に
最適化することが可能になる。
【0021】一般に、話者判定器5の話者類似度計算器
11に適した特徴抽出器2の最適設計、音声個人ID認
識器6の不特定話者音声認識器21に適した特徴抽出器
31の最適設計が可能になる。そのため、計算規模は拡
大するものの、共通な特徴抽出器2を使用する第1の実
施形態の場合よりも、認識性能を向上させることができ
るようになる。なお、スイッチ32は図1のスイッチ8
と同等の作用をするスイッチである。
【0022】次に、本発明の第3の実施形態を、図5を
参照して説明する。図において、図1と同符号は同等ま
たは同一物を示す。この実施形態は、音声個人ID認識
器33の構成を、外部から個人IDを入力可能なように
した点に特徴がある。例えば、電話回線を介した音声に
よる本人認証システムでは、発信電話機の電話番号を本
人認証装置の個人ID(Qi )として利用することがで
きる。このため、前記第1の実施形態に比べて、個人I
Dを音声認識する必要がなくなり、計算量を軽減するこ
とができるようになる。なお、移動電話等のシステムで
は、電話機が盗難されるか、あるいは故意に不正利用さ
れる場合もあるので、この個人IDだけでは、本人認証
として不十分である。したがって、本人認証のために、
前記パスワードは必要である。
【0023】前記第2、第3の実施形態は、第1の実施
形態と同様に、話者判定器の判定結果と、音声個人ID
認識器の判定結果とを論理和して、最終判定結果を得る
ようにしているので、第1の実施形態と同様に、正解率
は格段に向上する。
【0024】
【発明の効果】以上の説明から明らかなように、本発明
によれば、発話者が既登録であるか未登録であるかの判
定結果と、発話者が本人であるか否かの判定結果との論
理和から最終の判定結果を得るようにしているので、正
解率が大幅に向上するという効果がある。
【0025】また、それぞれの認識に適応した特徴抽出
器を別個に設けるようにしたので、該正解率の信頼性が
向上するという効果がある。また、外部からの個人ID
を利用することにより、音声認識の計算量を減らすこと
ができ、装置の負担を軽減できると共に、処理時間を短
縮化することができる効果がある。
【図面の簡単な説明】
【図1】 本発明の一実施形態の概略の構成を示すブロ
ック図である。
【図2】 図1の話者判定器の一具体例を示すブロック
図である。
【図3】 図1の音声個人ID認識器の一具体例を示す
ブロック図である。
【図4】 本発明の第2の実施形態の概略の構成を示す
ブロック図である。
【図5】 本発明の第3の実施形態の概略の構成を示す
ブロック図である。
【図6】 従来の本人認証装置の一例を示すブロック図
である。
【符号の説明】
1…本人認証装置、2…特徴抽出器、3…スイッチ、4
…音声特徴情報蓄積器、5…話者判定器、6…音声個人
ID認識器、7論理和回路、8…スイッチ、11…話者
類似度計算器、12…閾値情報演算器、13…閾値情報
蓄積器、14…話者類似度判定器、15…スイッチ、2
1…不特定話者音声認識器、22…話者IDデータベー
ス、23…話者ID判定器、31…特徴抽出器、32…
スイッチ。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 発話者の入力音声に基づいて本人の認証
    を行う本人認証装置において、 予め登録されている特徴量と該入力音声から抽出した特
    徴量とから、発話者が既登録であるか未登録であるかを
    判定する第1の手段と、 発話者の入力音声の認識結果から、本人であるか否かを
    判定する第2の手段と、 前記第1、第2の手段の判定
    結果が入力する論理和手段とを具備し、 該論理和手段の出力から、最終の話者判定を行うように
    したことを特徴とする本人認証装置。
  2. 【請求項2】 請求項1の本人認証装置において、 前記発話者の入力音声が、発話者のIDとパスワードで
    あることを特徴とする本人認証装置。
  3. 【請求項3】 請求項1の本人認証装置において、 前記第1の手段および第2の手段に適応した第1の特徴
    抽出器と第2の特徴抽出器とを設けたことを特徴とする
    本人認証装置。
  4. 【請求項4】 請求項1の本人認証装置において、 前記第2の手段は、外部から入力する個人IDと、音声
    認識されたパスワードとから本人であるか否かを判定す
    ることを特徴とする本人認証装置。
JP8080745A 1996-03-08 1996-03-08 本人認証装置 Pending JPH09244684A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8080745A JPH09244684A (ja) 1996-03-08 1996-03-08 本人認証装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8080745A JPH09244684A (ja) 1996-03-08 1996-03-08 本人認証装置

Publications (1)

Publication Number Publication Date
JPH09244684A true JPH09244684A (ja) 1997-09-19

Family

ID=13726948

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8080745A Pending JPH09244684A (ja) 1996-03-08 1996-03-08 本人認証装置

Country Status (1)

Country Link
JP (1) JPH09244684A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010069650A (ko) * 2001-04-25 2001-07-25 백종관 숫자로 구성된 어휘를 인식하고 동시에 발성화자를인증하는 방법 및 그 시스템
JP2005513682A (ja) * 2001-12-22 2005-05-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ユーザ識別方法及び装置
JP2021113902A (ja) * 2020-01-20 2021-08-05 株式会社白紙とロック 認証方法、認証システム、スマートスピーカ及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010069650A (ko) * 2001-04-25 2001-07-25 백종관 숫자로 구성된 어휘를 인식하고 동시에 발성화자를인증하는 방법 및 그 시스템
JP2005513682A (ja) * 2001-12-22 2005-05-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ユーザ識別方法及び装置
JP2021113902A (ja) * 2020-01-20 2021-08-05 株式会社白紙とロック 認証方法、認証システム、スマートスピーカ及びプログラム

Similar Documents

Publication Publication Date Title
EP1019904B1 (en) Model enrollment method for speech or speaker recognition
US6076055A (en) Speaker verification method
US5127043A (en) Simultaneous speaker-independent voice recognition and verification over a telephone network
EP0647344B1 (en) Method for recognizing alphanumeric strings spoken over a telephone network
US5517558A (en) Voice-controlled account access over a telephone network
US5125022A (en) Method for recognizing alphanumeric strings spoken over a telephone network
US8032380B2 (en) Method of accessing a dial-up service
WO1996027185A1 (en) Method for reducing database requirements for speech recognition systems
US7050973B2 (en) Speaker recognition using dynamic time warp template spotting
US7630895B2 (en) Speaker verification method
JPH09244684A (ja) 本人認証装置
JP3849841B2 (ja) 話者認識装置
JPS6126079B2 (ja)
JP2989231B2 (ja) 音声認識装置
JPS63106798A (ja) 個人認証装置
US9978373B2 (en) Method of accessing a dial-up service
JP3631020B2 (ja) 話者認識方法
KR19980045013A (ko) 암호 입력을 통한 화자 인식기의 성능 개선 방법
KR19980040752A (ko) 화자 인식 시스템에서 개선된 문턱값 설정 방법을 이용한 화자 인식 방법
JPH1049186A (ja) 数字列音声認識方法およびこの方法を実施する装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040423

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040803