JPH0441837B2 - - Google Patents

Info

Publication number
JPH0441837B2
JPH0441837B2 JP59235070A JP23507084A JPH0441837B2 JP H0441837 B2 JPH0441837 B2 JP H0441837B2 JP 59235070 A JP59235070 A JP 59235070A JP 23507084 A JP23507084 A JP 23507084A JP H0441837 B2 JPH0441837 B2 JP H0441837B2
Authority
JP
Japan
Prior art keywords
speaker
voice
parameters
verification
collation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59235070A
Other languages
English (en)
Other versions
JPS61114298A (ja
Inventor
Hiroyuki Senbon
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP59235070A priority Critical patent/JPS61114298A/ja
Publication of JPS61114298A publication Critical patent/JPS61114298A/ja
Publication of JPH0441837B2 publication Critical patent/JPH0441837B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は音声入力による情報処理システムに用
いられる話者照合方式に関する。
〔発明の技術的背景とその問題点〕
近年、音声認識、合成技術の発達が目覚しく、
例えば連続音声認識や不特定話者を対象とした音
声認識が可能となり、また一方話者照合などもい
ろいろとその方式が考え出されている。
このような話者照合技術を用いて、電話による
買物やバンキングサービス、個人情報へのアクセ
ス、機密保管場所等への入出管理などが開発され
ており、その有用性が注目されている。ここで、
これらのシステムは、本人か否かということが問
題となることからセキユリテイーが一番の問題で
ある。しかし、現在の話者照合方式はまだ誤認識
が生じたりしている。この誤認識の原因の1つに
は、システムが照合に用いる各話者のID(暗唱単
語音声)を統一してしまい、この結果ある人にと
つては、そのIDの単語もしくは単語列に個人性
が含まれている割合いが少なく、照合装置が照合
しきれないということがあつた。例えばシステム
がIDを「0(ゼロ)」と指定すると、ある人にと
つては常に「ゼロ」を安定した口調で発声する為
に個人性(安定性)が良く含まれており、個人識
別し易いものとなるが、別の人にとつては「ゼ
ロ」を毎回不安定な口調で発声する為、余り個人
性が含まれず、個人識別し難いものとなる。又、
各話者がジステムに対して自由にIDを指定でき
るものもあるが、この方法では各話者が自分の好
きなIDを発声するので、その中に個人性が含ま
れているとしても、照合装置は様々なIDを照合
(単語認識、音声特徴照合)しなければならない
為、全ての話者に対応出来ないという欠点があつ
た。
〔発明の目的〕
本発明の目的は、話者照合において、装置が照
合しやすいIDを自ら作り出し、照合率の向上が
可能となる話者照合方式を提供することにある。
〔発明の概要〕
本発明は、話者照合の辞書作成に際して、登録
者の発声した複数の単語に対して個人の音声特徴
を分析、登録する手段と、この音声特徴を登録す
る段階で、一旦各単語ごとに話者照合を行なう手
段を備え、この照合結果の良い単語の音声特徴を
利用して各個人の照合用のIDを決定する手段を
有した話者照合方式で、照合を行なう際には、前
記IDを用い、このIDの単語認識と発声者の発声
による話者認識の2つの手段より照合をすること
を特徴とするものである。
〔発明の効果〕
本発明によれば、各登録者に応じて個人性の高
い(安定性の良い)音声特徴を有したIDを与え
ることにより、照合による誤りを減らすことが可
能となり、セキユリテイの面から見ても実用性が
向上する。
〔発明の実施例〕
以下、図面を参照しながら本発明の実施例につ
いて説明する。第1図は本発明の第1の実施例の
フローチヤートであり、第2図は第1の実施例の
ブロツク図である。第1の実施例は、登録者が辞
書を作成する際に予めシステムの指定した複数の
単語を順々に発声してもらいその音声特徴を検出
して仮辞書に登録し、ある回数になつたら(少な
くとも1通りの発声が終わつたら)仮辞書への登
録を止め、登録者に再び複数の単語を順々に発声
してもらうことにより各々の音声特徴を検出し、
これらと仮辞書へ登録された音声特徴とを照合す
ることによりIDを決定し、本辞書登録する方式
である。
先ず、使用者が話者照合を行なうのか、登録を
希望する為辞書を作成するのかを機能選択する
(第1図ステツプ11,12)。つまり第2図の機
能選択部102で、話者照合Aを行うが、辞書登
録Bを行うかがスイツチにより選択される。この
時、登録が選択された場合は辞書作成を行う為カ
ウンタ103が初期設定される(第1図ステツプ
13)と共にスイツチCが選択される。第2図に
は示されていないが、初期設定では、仮辞書登録
と照合の為に繰り返し発声をするので、その回数
をカウントするカウンターをクリアし(N=0)、
全音声入力回数Mをセツトする。例えば数字「0
(ゼロ)」「1(イチ)」,「2(ニ)」……「9(キ

ウ)」を2回発声してもらうならM=20となる。
このような初期設定を行つた後、第2図のシステ
ムでは図示しないデイススプレイ等を介して使用
者に対し単語音声の入力要求を1単語ごとに順々
に行なう。(例えば最初に「ゼロ」を入力要求す
る。第1図ステツプ14)使用者が単語の入力要
求に従つて音声(「ゼロ」)を発声すると(第1図
ステツプ15)、この入力音声は分析部101に
おいてA/D変換、スペクトル分析処理等されて
特徴パラメータの系列に変換される(第1図ステ
ツプ16)。この分析部101は、例えば入力音
声が「ゼロ」であれば(/ゼ//ロ/)という全
体の特徴パラメータ及びその母音の部分(/
エ/)の特徴パラメータの両方を検出する。この
検出された全体の特徴パラメータ及び母音の特徴
パラメータはスイツチB,Cを介して仮辞書メモ
リー104に登録される(第1図ステツプ18)。
又、分析部101の指示によりカウンタ103の
音声入力回数が1つ歩進されて(第1図ステツプ
19)、次の単語音声の入力要求(例えば「イ
チ」)が行われる(第1図ステツプ20)。こうし
てカウンター103がM/2(全音声入力回数の
半分)になるまで仮辞書メモリー104に登録を
行い(第1図ステツプ17)、M/2以上になつ
たらスイツチがD側になり、今まで登録を行なつ
てきた仮辞書メモリーを用いて話者照合部105
で新たに入力された音声に対して照合を行なう
(第1図ステツプ21)。この新たに入力された音
声に対し、分析部101は、M/2以上になつた
カウンタ103の指示により母音部分のパラメー
タのみ検出する。例えば10回目迄は使用者に「0
(ゼロ)」,「1(イチ)」,……「9(キユウ)」を

声させてその母音パラメータ(及び全体パラメー
タ)を登録し、11回目から20回目までは再び使用
者に「0(ゼロ)」,「1(イチ)」,……「9(キユ
ウ)」を発声させて各々の母音部分パラメータ
(「ゼロ」ならば/エ/,「イチ」ならば/イ/)
と既に登録してある母音部分パラメータとの照合
を順次行う。この話者照合は例えば類似度計算や
距離計算を用いて行う。これらの照合結果は照合
に使用された(仮辞書に登録された)母音部分パ
ラメータ及び全体特徴パラメータと共に判別部1
06へ送られる。
(第1図ステツプ22)。こような仮辞書登録
中における話者照合及び判別部106への転送を
N=Mになるまで行う(第1図ステツプ23,2
4,25)。もし音声入力の回数NがN=Mにな
つたら、カウンター103の指示により判別部1
06では、話者照合を行つた結果の中でも最も照
合結果の正しかつた(類似度の大きかつた)単語
の音声特徴(母音及び全体のパラメータ)を選ん
で(つまり「ゼロ」〜「キユウ」の中で「ゼロ」
が最も類似度が大きかつたとすれば「ゼロ」に含
まれる母音部分及び全体の特徴パラメータ)を
ID作成部107へ出力する(第1図ステツプ2
6)。ID作成部107ではこの結果を受けてIDを
作成し(第1図ステツプ27、例えば送られてき
た全体の特徴パラメータからIDを「ゼロ」とす
る)、本辞書メモリー108へ登録する(第1図
ステツプ28)と共に、使用者にデイスプレイ等
を介してIDを出力する(第1図ステツプ29)。
ここで本辞書メモリー108へ登録されるIDの
形式として、例えばIDが「0(ゼロ)」であると
すると前述したようにID作成部107へ送られ
た「ゼロ」という全体の特徴パラメータと母音部
分のパラメータを対として格納される。
一方、上記方式によつて作成されたIDを使用
して話者照合を行なう場合、使用者の指示により
機能選択部102のスイツチがA側にされる(第
1図ステツプ11,12)。次に使用者が暗記し
ているIDを発声すると(第1図ステツプ30)、
この入力音声は上述した様に分析部101で全体
及び母音部分の特徴パラメータに変換される(第
1図ステツプ31)。単語認識部110は使用者
がIDとして発声した単語全体の特徴パラメータ
を入力し、これが本辞書メモリー104に予め登
録されているIDの全体の特徴パラメータと一致
しているか否かを認識する(照合する)ものであ
り(第1図ステツプ32)、話者照合部109は
入力音声の母音部分の特徴パラメータがIDとし
て登録されている母音部分の特徴パラメータと一
致しているか否かを照合するものである(第1図
ステツプ33)。照合部111ではこれらの認識
結果及び照合結果を用いて最終的な話者(ID登
録者)照合を行い(第1図ステツプ34)、その
結果を出力する(第1図ステツプ35)。
上記実施例によれば、話者照合システムが予め
システム自身にとつて照合(認識)し易い複数の
単語の中から、各話者に対して一番個人性(安定
性)のある照合しやすいIDを作るので、照合の
正解率の向上を図ることが可能である。
次に本発明の第2の実施例について図面を参照
して説明する。第3図は第2の実施例のスローチ
ヤート、第4図は第2の実施例のブロツク図であ
る。この実施例は話者のIDを作成する際に上述
と同様に辞書登録の段階では入力音声の全体の特
徴パラメータ及び母音部分パラメータを仮辞書に
登録し、入力音声を繰り返す時に単語認識(全体
の特徴パラメータ照合)と話者照合(母音部分の
特徴パラメータ照合)を行ない、この2つの結果
からIDを作成して本辞書へ登録する方式である。
第3図、第4図において、第1図、第2図と異
る点は単語認識部112、単語の認識(第1図ス
テツプ36)が付加された箇所である。
上述した様に辞書登録が選択された場合には、
話者より入力された音声は分析部101で全体の
特徴パラメータ及び母音部分の特徴パラメータに
変換されてこの対が仮辞書メモリ104へ登録さ
れる。この登録がM/2回迄繰り返されると(全
ての単語について音声入力が終わると)カウンタ
103の指示によりスイツチがD側に切り換わ
り、以下の入力音声(全ての単語について繰り返
された音声)に対して話者照合部105及び単語
認識部112で照合が行われる。つまり分析部1
01では再度入力された単語音声に対して、全体
の特パラメータ及び母音部分の特徴パラメータを
検出して前者を単語認識部112へ、後者を話者
照合部105へ送る。単語認識部112では、送
られた全体の特徴パラメータと予め仮辞書メモリ
ー104に登録された全体の特徴パラメータとを
照合し、その照合結果を全体のパラメータと共に
半別部106へ送る(第3図ステツプ36)。話
者照合部105では送られた母音部分パラメータ
と仮辞書メモリー104に登録された母音部分パ
ラメータとお照合し、その照合結果を母音部分パ
ラメータと共に判別部106へ送る(第3図ステ
ツプ21)。この処理がM回迄繰り返された後、
カウンター103の指示により、判別部106は
両方の照合結果が共に良かつた全体パラメータ及
び母音部分パラメータを選んでID作成部107
へ送る(第3図ステツプ22,26)。ここで場
合によつては2つの照合結果に重み付けをして判
別し、パラメータを選ぶことも可能である。こう
してID作成部107は選ばれた全体パラメータ
及びその母音パラメータを用いてIDを作成しこ
の2つのパラメータをIDとして本辞書メモリー
108へ登録する。(第3図ステツプ27,28、
例えば選ばれたパラメータが(/ゼ//ロ/)及
び(/エ/)であればIDは「ゼロ」と決定され、
この2つのパラメータがIDのパラメータととな
る) 上記第2の実施例によれば、話者照合システム
が話者の入力音声に対して個人性(母音パラメー
タの照合率)が一番有り、且つ単語認識(全体パ
ラメータの照合)の認識率が最も良いIDを作る
ことから、話者照合率がより一層向上することが
でき、セキユリテイに対しても問題が少なくな
る。
尚、本発明は上記実施例に限定されるものでは
ない。例えばID作成の際、IDの中で照合に必要
な部分以外の部分が有る場合は、これを登録者に
作成してもらつてもよい。又、入力音声の特徴パ
ラメータ検出や、照合(認識)処理の方法は従来
より知られた種々の方法を適宜採用すればよい。
要するに本発明はその要旨を逸脱しない範囲で
種々変形して実施することができる。
【図面の簡単な説明】
第1図は本発明の第1の実施例のフロー図、第
2図は本発明の第1のブロツク図、第3図は本発
明の第2の実施例のフロー図、第4図は本発明の
第2の実施例のブロツク図である。 101…分析部、102…機能選択部、103
…カウンター、104…仮辞書メモリー、105
…話者照合部、106…判別部、107…ID作
成部、108…本辞書メモリー、109…話者照
合部、110…単語認識部、111…照合部、1
12…単語認識部。

Claims (1)

  1. 【特許請求の範囲】 1 話者の発声した複数の単語音声に対して各々
    の音声特徴を検出する検出手段と、この検出手段
    より検出された各々の音声特徴を記憶する記憶手
    段と、前記話者が再度発声した前記複数の単語音
    声に対して前記検出手段が再度検出した各々の音
    声特徴と前記記憶手段により記憶された各々の音
    声特徴とを各々照合する照合手段と、この照合手
    段による照合結果に基いて前記話者のIDを決定
    する決定手段とを具備したことを特徴とする話者
    照合方式。 2 照合手段は前記話者が再度発声した前記複数
    の単語音声を認識するとともに各々の音声特徴を
    照合し、前記決定手段は前記照合手段による認識
    結果及び照合結果に基いてIDを決定することを
    特徴とする特許請求の範囲第1項記載の話者照合
    方式。 3 検出手段は話者の発声した単語音声に対して
    音声特徴を検出し、照合手段は前記音声特徴が前
    記決定手段により決定されたIDの音声特徴と一
    致しているか否かにより話者照合を行うことを特
    徴とする特許請求の範囲第1項記載の話者照合方
    式。
JP59235070A 1984-11-09 1984-11-09 話者照合方式 Granted JPS61114298A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59235070A JPS61114298A (ja) 1984-11-09 1984-11-09 話者照合方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59235070A JPS61114298A (ja) 1984-11-09 1984-11-09 話者照合方式

Publications (2)

Publication Number Publication Date
JPS61114298A JPS61114298A (ja) 1986-05-31
JPH0441837B2 true JPH0441837B2 (ja) 1992-07-09

Family

ID=16980618

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59235070A Granted JPS61114298A (ja) 1984-11-09 1984-11-09 話者照合方式

Country Status (1)

Country Link
JP (1) JPS61114298A (ja)

Also Published As

Publication number Publication date
JPS61114298A (ja) 1986-05-31

Similar Documents

Publication Publication Date Title
US7447632B2 (en) Voice authentication system
WO2017162053A1 (zh) 一种身份认证的方法和装置
JPH1173195A (ja) 話者の申し出識別を認証する方法
JP4318475B2 (ja) 話者認証装置及び話者認証プログラム
KR20230156145A (ko) 하이브리드 다국어 텍스트 의존형 및 텍스트 독립형 화자 검증
JP6682007B2 (ja) 電子機器、電子機器の制御方法及び電子機器の制御プログラム
JPH10173644A (ja) 本人認証方法
JP7339116B2 (ja) 音声認証装置、音声認証システム、および音声認証方法
JPH1173196A (ja) 話者の申し出識別を認証する方法
JP4440414B2 (ja) 話者照合装置及び方法
Bouziane et al. An open and free speech corpus for speaker recognition: The fscsr speech corpus
JP4245948B2 (ja) 音声認証装置、音声認証方法及び音声認証プログラム
JPH0441837B2 (ja)
WO2006027844A1 (ja) 話者照合装置
JP2001350494A (ja) 照合装置及び照合方法
Laskar et al. Complementing the DTW based speaker verification systems with knowledge of specific regions of interest
US8688452B2 (en) Automatic generation of distractors for special-purpose speech recognition grammars
JP2980382B2 (ja) 話者適応音声認識方法および装置
JP4236502B2 (ja) 音声認識装置
JP3515143B2 (ja) パターン追加登録装置
JPH06337700A (ja) 音声合成装置
Mut et al. Improved Weighted Matching for Speaker Recognition.
Pol et al. USE OF MEL FREQUENCY CEPSTRAL COEFFICIENTS FOR THE IMPLEMENTATION OF A SPEAKER RECOGNITION SYSTEM
JP2000250594A (ja) 話者認識装置
JPH11249684A (ja) 話者照合における閾値決定方法及び装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees