JPH09244684A

JPH09244684A - 本人認証装置

Info

Publication number: JPH09244684A
Application number: JP8080745A
Authority: JP
Inventors: Fumiaki Sugaya; 史昭菅谷; Toshiaki Uchibe; 利明内部; Seiichi Yamamoto; 誠一山本
Original assignee: Kokusai Denshin Denwa KK
Current assignee: KDDI Corp
Priority date: 1996-03-08
Filing date: 1996-03-08
Publication date: 1997-09-19

Abstract

(57)【要約】【課題】簡単なシステムで、高性能な本人認証装置を
提供することにある。【解決手段】本人認証をする人が予め発話した音声か
ら特徴を抽出する特徴抽出器２と、該特徴を登録する音
声特徴情報蓄積器４と、本人認証を要求する人の音声か
ら特徴を抽出し、音声特徴情報蓄積器４に登録されてい
る特徴量と比較し、発話者が既登録であるか未登録であ
るかを判定する話者判定器５と、個人ＩＤ、パスワード
等の連続数字等を認識できる音声個人ＩＤ認識器６と、
前記話者判定器５と音声個人ＩＤ認識器６との論理和を
計算する論理和回路７とから構成されている。前記話者
判定器５と音声個人ＩＤ認識器６との論理和を計算し、
最終話者判定結果Ｓo を得るようにしたことにより、正
解率を大幅に向上させることができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は本人認証装置に関
し、特に音声により本人であることを明らかにする本人
認証装置に関する。

【０００２】

【従来の技術】図６は従来の話者認識系の基本構成を示
すブロック図である。学習をする時には、スイッチ４１
は学習側に接続され、特徴抽出器４０によって抽出され
た音声波の特徴が、標準パターン記憶部４２に、話者別
に登録される。一方、話者認識を行う時には、前記スイ
ッチ４１は認識側に接続される。そこで、話者からの音
声入力があると、特徴抽出器４０は音声波から特徴抽出
を行う。抽出された特徴は、類似度判定器４３に送られ
る。類似度判定器４３では、前記標準パターン記憶部４
２に登録されている各話者の標準パターンと、該抽出さ
れた特徴との比較を行い、その距離あるいは類似度を調
べ、その度合いにより認識の判定を行う。すなわち、話
者照合の場合は、入力音声と標準パターンの距離と、予
め定められた判定基準（しきい値）との大小関係によっ
てその照合を行う。

【０００３】

【発明が解決しようとする課題】上記した話者認識装置
によれば、かなりの精度で、話者照合を行うことができ
るが、その精度はまだ十分ではないという問題があっ
た。また、話者認識技術だけを用いて、長時間に渡って
高い認識率を保証するためには、周波数特性の広いマイ
クロフォンが必要になったり、話者認識のシステムが複
雑になったりして、利用者が簡単に準備することができ
ないという問題があった。また、標準パターン記憶部４
２への登録音声の録音時間あるいは話者照合使用時の音
声が長くなり、利用者に不便であるという問題もあっ
た。

【０００４】この発明の目的は、前記した従来技術の問
題点を除去し、簡単なシステムで、高性能な本人認証装
置を提供することにある。

【０００５】

【課題を解決するための手段】前記した目的を達成する
ために、この発明は、発話者の入力音声に基づいて本人
の認証を行う本人認証装置において、予め登録されてい
る特徴量と該入力音声から抽出した特徴量とから、発話
者が既登録であるか未登録であるかを判定する第１の手
段と、発話者の入力音声の認識結果から、本人であるか
否かを判定する第２の手段と、前記第１、第２の手段の
判定結果が入力する論理和手段とを具備した点に特徴が
ある。

【０００６】この発明によれば、前記第１、第２の手段
の判定結果を論理和して、最終の話者判定を行うように
しているので、第１、第２の手段のいずれかで本人認証
が確認されれば、最終的に話者の判定が成立したことに
なり、本人認証の正解率を向上させることができる。

【０００７】

【発明の実施の形態】以下に、図面を参照して、本発明
を詳細に説明する。図１は、本発明の本人認証装置の一
実施形態の概略の構成を示すブロック図である。図１に
おいて、本人認証装置１の入出力信号はディジタル信号
であり、本人認証装置１はディジタル処理により実現さ
れることを前提に説明する。したがって、入出力がアナ
ログ音声信号の場合には、アナログ・ディジタル変換器
（ＡＤ変換器）により信号変換されて、本実施形態の本
人認証装置１と接続されるものとする。

【０００８】以下の説明では、個人に付与された番号
（以下、個人ＩＤと呼ぶ）とそれを確認するパスワード
を入力音声とする場合について説明する。本人認証装置
１の利用者は個人ＩＤを発声し、続いてパスワードを発
声するものとする。該個人ＩＤやパスワードには、認証
システムで一般的に使われる数字や氏名を用いることが
できる。

【０００９】本人認証装置１は、入力音声信号Ｓi から
特徴量を抽出する特徴抽出器２と、学習時と認識時とで
切換えられるスイッチ３と、前記抽出された特徴量を記
憶する音声特徴情報蓄積器４と、話者判定器５と、音声
個人ＩＤ認識器６と、論理和（ＯＲ）回路７と、後述す
る閾値演算時にオフとなり、本人認証時にオンとなるス
イッチ８とから構成されている。論理和回路７からは、
最終話者判定結果Ｓoが出力される。

【００１０】次に、前記話者判定器５の一具体例を、図
２を参照して説明する。話者判定器５は、話者類似度計
算器１１と、閾値情報演算器１２と、閾値情報蓄積器１
３と、話者類似度判定器１４と、スイッチ１５から構成
されている。話者類似度計算器１１では、スイッチ３を
通って入力される音声波と、前記音声特徴情報蓄積器４
とから入力される予め登録された話者との特徴量との類
似度を計算し、閾値情報演算器１２または話者類似度判
定器１４へ出力する。話者類似度判定器１４では、閾値
情報蓄積器１３に予め蓄積されている閾値と話者類似度
計算器１１で計算された類似度とを比較し、話者が既登
録であるか未登録であるかの判定結果ａを出力する。

【００１１】ここで、前記閾値情報蓄積器１３に蓄積さ
れている閾値を求める方法の一例を説明する。ここで
は、閾値を話者毎に計算し、Ｎ人が認証システムを使用
する場合について説明する。該閾値を求める時には、ス
イッチ１５は閾値情報演算器１２側に接続される。この
時には、前記スイッチ３は認識時側に接続される。ｉ番
目（i=1,2,...,i,...,N ）の話者の閾値を計算するため
には、まずｉ番目の話者本人の類似度を話者類似度計算
器１１で計算し、閾値情報演算器１２へ出力する。次
に、ｉ番目の話者と該ｉ番目の話者を除く他人との類似
度を話者類似度計算器１１で計算し、該閾値情報演算器
１２へ出力する。該閾値情報演算器１２では、前記他人
との類似度の平均値を計算し、該平均値と前記本人の類
似度との平均値を演算し、話者ｉの閾値とする。この閾
値は閾値情報蓄積器１３に格納する。以上の処理をＮ人
の話者に対して行うことにより、全話者の閾値が閾値情
報蓄積器１３に設定される。

【００１２】次に、前記音声個人ＩＤ認識器６の一具体
例を、図３を参照して説明する。該音声個人ＩＤ認識器
６は不特定話者音声認識器２１と、話者ＩＤデータベー
ス２２と、話者ＩＤ判定器２３とから構成されている。
該話者ＩＤデータベース２２には、予め、個人ＩＤとパ
スワードの組み合わせのデータが蓄積されているものと
する。

【００１３】前記不特定話者音声認識器２１は、前記ス
イッチ３、８を通って入力してくる特徴量から、不特定
話者の音声認識を行う。具体的には、図１の入力音声信
号が、個人ＩＤとパスワードの音声であるから、不特定
話者音声認識器２１からは、個人ＩＤとパスワードの認
識結果が出力される。話者ＩＤ判定器２３は、該認識さ
れた個人ＩＤとパスワードが前記話者ＩＤデータベース
２２に含まれているか否かを検査し、含まれている場合
には、肯定の話者判定結果ｂを出力する。

【００１４】次に、図１の本人認証装置１の動作を説明
する。本人認証装置１の利用者は、予め音声を登録する
必要がある。まず、該音声を登録する動作について説明
する。スイッチ３は学習時側に接続される。利用者が個
人ＩＤとパスワードを発声すると、その音声は特徴抽出
器２に入力され、該特徴抽出器２にて話者認識あるいは
音声認識に必要な特徴量に変換される。次いで、該特徴
量は前記スイッチ３を経て音声特徴情報蓄積器４に入力
する。該音声特徴情報蓄積器４は、該特徴量を話者毎に
蓄積する。

【００１５】次に、前記閾値情報蓄積器１３に蓄積する
閾値情報の演算が行われる。この時には、スイッチ３は
認識時側、スイッチ８はオフ、スイッチ１５は閾値情報
演算器１２側に接続される。利用者が再度個人ＩＤとパ
スワードを発声し、あるいは発声済みの個人ＩＤとパス
ワードを録音・再生すると、話者本人の類似度と、話者
本人と他人との類似度は話者類似度計算器１１で計算さ
れ、閾値情報演算器１２に送られる。この時、閾値情報
演算器１２では、前記他人との類似度の平均値を演算
し、該平均値と前記本人の類似度との平均値を演算し、
前記利用者の閾値として閾値情報蓄積器１３に格納す
る。なお、この閾値情報の演算の仕方は一例であり、本
発明はこれに限定されるものではない。

【００１６】次に、本人認証の動作に移ると、前記スイ
ッチ３は認識時側、スイッチ８はオン、スイッチ１５は
話者類似度判定器１４側に接続される。これにより、話
者判定器５と音声個人ＩＤ認識器６とに特徴抽出器２の
出力である特徴量が入力する。話者判定器５は前記のよ
うにして予め蓄積されている登録話者の特徴量を音声特
徴情報蓄積器４から取り出し、両特徴量を比較し、話者
本人の類似度を計算する。次いで、該類似度と前記閾値
情報蓄積器１３に蓄積されている本人の閾値とを比較
し、正当な話者であるか否かの判定をする。そして、こ
の正否結果を論理和回路７に出力する。

【００１７】一方、音声個人ＩＤ認識器６は話者判定器
５の入力と同じ特徴量を入力し、個人ＩＤとパスワード
認識を行い、認識結果を基に判断された話者の正否を論
理和回路７に出力する。論理和回路７では、話者判定器
５と音声個人ＩＤ認識器６の認識結果の論理和の結果を
出力する。したがって、話者判定器５あるいは音声個人
ＩＤ認識器６のどちらかが正解を出力すれば、話者が判
定されることになり、どちらかが不正解を出力しても片
方が補うことが可能であり、本発明による本人認証装置
１の認識率が向上することになる。認識率の向上を一例
を挙げて具体的に説明する。

【００１８】話者判定器５の正解率を９０％、音声個人
ＩＤ認識器６の正解率を９５％とすると論理和回路７の
出力の誤りは２つの入力が両方誤りの場合であり、（１
−０．９）×（１−０．９５）＝０．００５＝０．５％
の誤り率となる。すなわち、正解率は９９．５％となり
格段に性能が向上することになる。現状の音声による本
人認証では、完全な認識を行うことは不可能であるの
で、本実施形態は有効である。

【００１９】以上は、利用者の発話内容は、個人ＩＤと
パスワードであったが、さらに話者認識精度を向上させ
るためには、前記音声特徴情報蓄積器４と話者判定器５
にテキスト音声を追加するようにしてもよい。すなわ
ち、該音声特徴情報蓄積器４に、個人ＩＤとパスワード
に続いてテキスト音声を追加登録する。そして、本人認
証をする場合には、話者判定器５が、個人ＩＤとパスワ
ードに加えて、テキスト音声で話者認識をすることによ
り、高い話者認識率を得ることができるようになる。

【００２０】次に、本発明の第２の実施形態について、
図４を参照して説明する。図において、図１と同符号は
同等または同一物を示す。前記第１の実施形態では、特
徴抽出器２を話者判定器５と音声個人ＩＤ認識器６とで
共通に使用する場合であったが、図４に示すように別々
の特徴抽出器２と３１を設けることも可能である。この
実施形態では、入力音声信号に対して特徴抽出器２を介
した話者判定器５による話者判定と、特徴抽出器３１を
介した音声個人ＩＤ認識器６による話者判定とを個別に
最適化することが可能になる。

【００２１】一般に、話者判定器５の話者類似度計算器
１１に適した特徴抽出器２の最適設計、音声個人ＩＤ認
識器６の不特定話者音声認識器２１に適した特徴抽出器
３１の最適設計が可能になる。そのため、計算規模は拡
大するものの、共通な特徴抽出器２を使用する第１の実
施形態の場合よりも、認識性能を向上させることができ
るようになる。なお、スイッチ３２は図１のスイッチ８
と同等の作用をするスイッチである。

【００２２】次に、本発明の第３の実施形態を、図５を
参照して説明する。図において、図１と同符号は同等ま
たは同一物を示す。この実施形態は、音声個人ＩＤ認識
器３３の構成を、外部から個人ＩＤを入力可能なように
した点に特徴がある。例えば、電話回線を介した音声に
よる本人認証システムでは、発信電話機の電話番号を本
人認証装置の個人ＩＤ（Ｑi ）として利用することがで
きる。このため、前記第１の実施形態に比べて、個人Ｉ
Ｄを音声認識する必要がなくなり、計算量を軽減するこ
とができるようになる。なお、移動電話等のシステムで
は、電話機が盗難されるか、あるいは故意に不正利用さ
れる場合もあるので、この個人ＩＤだけでは、本人認証
として不十分である。したがって、本人認証のために、
前記パスワードは必要である。

【００２３】前記第２、第３の実施形態は、第１の実施
形態と同様に、話者判定器の判定結果と、音声個人ＩＤ
認識器の判定結果とを論理和して、最終判定結果を得る
ようにしているので、第１の実施形態と同様に、正解率
は格段に向上する。

【００２４】

【発明の効果】以上の説明から明らかなように、本発明
によれば、発話者が既登録であるか未登録であるかの判
定結果と、発話者が本人であるか否かの判定結果との論
理和から最終の判定結果を得るようにしているので、正
解率が大幅に向上するという効果がある。

【００２５】また、それぞれの認識に適応した特徴抽出
器を別個に設けるようにしたので、該正解率の信頼性が
向上するという効果がある。また、外部からの個人ＩＤ
を利用することにより、音声認識の計算量を減らすこと
ができ、装置の負担を軽減できると共に、処理時間を短
縮化することができる効果がある。

【図面の簡単な説明】

【図１】本発明の一実施形態の概略の構成を示すブロ
ック図である。

【図２】図１の話者判定器の一具体例を示すブロック
図である。

【図３】図１の音声個人ＩＤ認識器の一具体例を示す
ブロック図である。

【図４】本発明の第２の実施形態の概略の構成を示す
ブロック図である。

【図５】本発明の第３の実施形態の概略の構成を示す
ブロック図である。

【図６】従来の本人認証装置の一例を示すブロック図
である。

【符号の説明】

１…本人認証装置、２…特徴抽出器、３…スイッチ、４
…音声特徴情報蓄積器、５…話者判定器、６…音声個人
ＩＤ認識器、７論理和回路、８…スイッチ、１１…話者
類似度計算器、１２…閾値情報演算器、１３…閾値情報
蓄積器、１４…話者類似度判定器、１５…スイッチ、２
１…不特定話者音声認識器、２２…話者ＩＤデータベー
ス、２３…話者ＩＤ判定器、３１…特徴抽出器、３２…
スイッチ。

Claims

【特許請求の範囲】

【請求項１】発話者の入力音声に基づいて本人の認証
を行う本人認証装置において、予め登録されている特徴量と該入力音声から抽出した特
徴量とから、発話者が既登録であるか未登録であるかを
判定する第１の手段と、発話者の入力音声の認識結果から、本人であるか否かを
判定する第２の手段と、前記第１、第２の手段の判定
結果が入力する論理和手段とを具備し、該論理和手段の出力から、最終の話者判定を行うように
したことを特徴とする本人認証装置。
【請求項２】請求項１の本人認証装置において、前記発話者の入力音声が、発話者のＩＤとパスワードで
あることを特徴とする本人認証装置。
【請求項３】請求項１の本人認証装置において、前記第１の手段および第２の手段に適応した第１の特徴
抽出器と第２の特徴抽出器とを設けたことを特徴とする
本人認証装置。
【請求項４】請求項１の本人認証装置において、前記第２の手段は、外部から入力する個人ＩＤと、音声
認識されたパスワードとから本人であるか否かを判定す
ることを特徴とする本人認証装置。