JPS61114298A

JPS61114298A - 話者照合方式

Info

Publication number: JPS61114298A
Application number: JP59235070A
Authority: JP
Inventors: 千本　浩之
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1984-11-09
Filing date: 1984-11-09
Publication date: 1986-05-31
Also published as: JPH0441837B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は音声人力による情報処理システムに用いられる
話者照合方式に関する。

〔発明の技術的背景とその問題点〕

近年、音声認識、合成技術の発達が目覚しく１例えば連
続音声認識や不特定話者を対象とした音声認識が可能と
なり、また一方話者照合などもいろいろとその方式が考
え出されている。

このような話者照合技術を用いて、電話による買物やバ
ンキングサービス、個人情報へのアクセス、機密保管場
所等への人出管理などが開発されており、その有用性が
注目されている。ここで、これらのシステムは１本人か
否かということが問題となることからセキュリティーが
一番の問題である。しかし、現在の話者照合方式はまだ
誤認識が生じたりしている。この誤認識の原因の１つＩ
：は、システムが照合に用いる各話者のＩＤ（暗唱単語
音声）を統一してしまい、この結果ある人にとっては、
そのＩＤの単語もしくは単語列に個人性が含まれている
割合いが少な（、照合装置が照合しきれないということ
があった。例えばシステムがＩＤを「Ｏ（ゼロ）」と指
定すると、ある人Ｃ二とっては常に「ゼロ」を安定した
口調で発声する為に個人性（安定性）が良く含まれてお
り、個人識別し昌いものとなるが、別の人にとっては「
ゼロ」を毎回不安定な口調で発声する為、余り個人性が
含まれず、個人識別し難いものとなる。

の好きなＩＤを発声するので、その中に個人性が含まれ
ているとしても、照合装置は様々なＩＤを照合（単語認
識、音声特徴照合）しなければならない為、全ての話者
に対応出来ないという欠点があった。

〔発明の目的〕

本発明の目的は、話者照合において、装置が照合しやす
いＩＤを自ら作り出し、照合率の向上が可能となる話者
照合方式を提供することＣ二ある。

〔発明の概要〕

本発明は１話者照合の辞書作成（２際して、登録者の発
声した複数の単語に対して個人の音声特徴を分析１発録
する手段と、この音声特徴を登録する段階で、一旦各単
語ごと（二話者照合を行なう手段を備え、この照合結果
の良い単語の音声特徴を利用して各個人の照合用のＩＤ
を決定する手段を有した話者照合方式で、照合を行なう
際１；は、前記ＩＤを用い、このＩＤの単語認識と発声
者の発声による話者認識の２つの手段より照合をするこ
とを特徴とするものである。

〔発明の効果〕

本発明によれば、各登録者ζ２応じて個人性の高い（安
定性の良い）音声特徴を有したＩＤを与えること（二よ
り、照合（二よる誤りを減らすことが可能となり、セキ
ュリティの面から見ても実用性が向上する。

〔発明の実施例〕

以下、図面を参照しながら本発明の実施例について説明
する。第１図は本発明の第１の実施例のフローチャート
であり、第２図は第１の実施例のブロック図である。第
ｌの実施例は、登録者が辞書を作成する際【二予めシス
テムの指定した複数の単語を順々に発声してもらいその
音声特徴を検出７して仮辞書に登録し、ある回数になっ
たら（少なくとも１通りの発声が終わったら）仮辞書へ
の登録を止め、登録者に再び複数の単語を順々に発声し
てもらうことにより各々の音声特徴を検出し。

これらと仮辞書へ登録された音声特徴とを照合すること
によりＩＤ−Ｑ決定し、本辞誉登録する方式先ず、使用
者が話者照合を行なうのか、登録を希望する為辞書を作
成するのが全機能選択するｔ（第１Ｎステツプ１１　、
１２　）。つまり第２図の機能選択部１０２で、話者照
合囚を行うか、辞薔登録四を行うかがスイッチにより選
択される。この時。

登録が選択された場合は辞書作成を行う為カウンタ１０
３が初期設定される（第１図ステップ１３）と共にスイ
ッチＣが選択される。第２図には示されていないが、初
期設定でに、仮辞１登録と照合の為Ｃ二線り返し発声を
するので、その回数をカウントするカウンターをクリア
しくＮ＝０）、全音声入力回数Ｍをセットする。例えば
数字「Ｏ（ゼロ）」「ｌ（イチ）ｊ、ｒ２（ニ）」・・
・・・・　「９（キュウ）」を２回発声してもらうなら
Ｍ＝２０となる。このような初期設定を行った後、第２
図のシステムでに図示しないディスプレイ等を介して使
用者に対し単語音声の入力要求を１単語ごと（二膚順々
（２行なう。（例えば最初に「ゼロ」を入力要求する。

第１図ステップ１４）使用者が単語の入力要求に従って
音声（「ゼロ」）を発声すると（第１図ステップ１５）
、この入力音声は分析部１０１１ユおいて■変換、スペ
クトル分析処理等されて特徴パラメータの系列に変換さ
れる（第１図ステップ１６）。この分析部ｌｏｔは１例
えば入力音声が「ゼロ」であれば（／ゼ／／ロ／）とい
う全体の特徴ノ（ラメータ及びその母音の部分（／ｘｌ
）の特徴パラメータの両方を検出する。この検出された
全体の特徴ノ（ラメータ及び母音の特徴パラメータはス
イッチＢ、Ｃを介して仮辞薔メモリー１０４に登録され
る（第１図ステップ１８）。又１分析部１０１の指示に
よりカウンタ１０３の音声入力回数が１つ歩進されて（
第１図ステップ１９）１次の単語音声の入力要求（例え
ば「イチ」）が行われる（第１図ステップ２０）。

こうしてカウンター１０３がＭ／２（全音声入力回数の
半分）になるまで仮辞書メモリー１０４に登録ビ行い（
ｍ１図ステップ１７　）　、　Ｍ／２１上（−なったら
スイッチがＤ側になり、今まで登録奪行なってきた仮辞
畜メモリーを用いて話者照合部１０５で新たに入力され
た音声Ｃ二対して照合を行なう（ｓｉ図スステップ２１
゜この新たに入力された音声Ｃ二対し、分析部ｌＯ１は
、　Ｖ２以上（二なったカウンタ１０３の指示（二より
母音部分のパラメータのみ検出する。

例えば１０回目迄は使用者に「０（ゼロ）　Ｊ　−，４
・ｌ（イチ）」、・・・・・・「９（ギュッ）」　を発
声させてその母音パラメータ（及び全体パラメータ）を
登録し、１１回目から２０回目までは再び使用者（二「
０（ゼロ）Ｊ、ｒｌ（イチ）」、・・・・・・　「９（
キュウ）」を発声させて各々の母音部分パラメータ（ｒ
！／口文らば／工／、「イテ」ならば／イ／）と既に登
録しである母音部分パラメータとの照合を順次行う。こ
の話者照合は例えば類似度計算や距離計算を用いて行う
。これらの照合結果は照合（二側用された（仮辞書に登
録された）母音部分パラメータ及び全体特徴パラメータ
と共Ｃ二判別部１０６へ送られる。

ｔｔｓ１図ステラステップ２２のような辞蕾登録中Ｃ二
おける話者照合及び判別部１０６への転送なＮ＝Ｍにな
るまで行う（第１図ステップ２３　、２４　、２５　）
。

もし音声入力の回数ＮがＮ−Ｍζニなったら、カウンタ
ー１０３の指示ζ二より判別部１０６でｔ′！、、話者
照合を行った結果の中で最も照合結果の正しかった（類
似度の大きかった）単語の音声特徴（母音及び全体のパ
ラメータ）を選んで（つまり「ゼロ」〜「キュウ」の中
で「ゼロ」が最も類似度が大きかったとすれば［ゼロＪ
＋二含まれる母音部分及び全体の特徴パラメータ）をＩ
Ｄ作成部１０７へ出力する【第１図ステップ２６）。Ｉ
Ｄ作成部１０７ではこの結果を受けてＩＤを作成しく第
１図ステップ２７、例えば送られてきた全体の特徴パラ
メータからＩＤを「ゼロ」とする）、本辞書メモリー１
０８へ登録する（第１図ステップ２８）と共に、使用者
にディスプレイ等を介してＩＤを出力する（ｍ１図ステ
ップ２９）。ここで本辞書メモリー　１０８へ登録され
るＩＤの形式として１例えばＩＤが「Ｏ（ゼロ）」であ
るとすると前述したよう（二ＩＤ作成部１０７へ送られ
た「ゼロ」という全体の特徴パラメータと母音部分のパ
ラメータを対として格納される。

一方、上記方式ζ二よって作成されたＩＤを使用して話
者照合を行なう場合、使用者の指示Ｃ二より機能選択部
１０２のスイッチが入側にされる【第１図ステップ１１
　、１２　）。次（二側用者が暗記しているＩＤを発声
すると（第１図ステップ３０）、この入力音声は上述し
た様（ユ分析部１０１で全体及び母音部分の特徴パラメ
ータに度換される（第１図ステップ３１）。単語認識部
１１０は使用者がＩＤとして発声した単語全体の特徴パ
ラメータを入力し、これが本辞書メモ９−１０４　に予
め登録されているよりの全体の特徴パラメータと一致し
ているか否かを認識する（照合する）ものであり（第１
図ステップ３２）、話者照合部１０９は入力音声の母音
部分の特徴パラメータがＩＤとして登録されている母音
部分の特徴パラメータと一致しているか否かを照合する
ものである（第１図ステップ３３）。照合部ｉｌｌでは
これらの認識結果及び照合結果を用いて最終的な話者（
ＩＤ登録者）照合を行い（第１図ステップ３４）、その
結果を出力する（第１図ステップ３５）。

上記実施例Ｃ二よれば１話者照合システムが予めシステ
ム自身にとって照合（認識）し易い複数の単語の中から
、各話者書二対して一番個人性（安定性）のある照合し
やすいＩＤを作るので、照合の正解率の向上を図ること
が可能である。

次Ｃ二本発明の第２の実施例について図面を参照して説
萌する。第３図に第２の実施例のフａ−テヤード、第４
図は第２の実施例のブロック図である。この実施例は話
者のＩＤを作成する際（二上述と同様に辞書登録の段階
では入力音声の全体の特徴パラメータ及び母音部分パラ
メータを仮辞書に登録し、入力音声を繰り返す時に単語
認識（全体の特徴パラメータ照合）と話者照合（母音部
分の特徴パラメータ照合）を行ない、この２つの結果か
らＩＤを作成して本辞書へ登録する方式である。

＠３１Ｊ、第４図において、第１図、第２図と異る点は
単語認識部１１２．単語の認識（第１図ステップ３６）
が付謔された箇所である。

上述した様に辞書登録が選択された場合には、話者より
入力された音声は分析部１０１で全体の特徴パラメータ
及び母音部分の特徴パラメータ（二変換されてこの対が
仮辞書メモ！Ｊ　１０４へ登録される。

この登録がＭ／２回迄繰り返されると（全ての単語につ
いて音声入力が終わると）カウンタ１０３の指示により
スイッチがＤ側に切り換わり、以下の入力音声（全ての
単語（ユついて繰り返された音声）に対して話者照合部
１０５及び単語認識部１１２で照合が行われる。つまり
分析ｆｌｂｔ旧では再度へカされた単語音声（二対して
、全体の特徴パラメータ及び母音部分の特徴パラメータ
を検出してＦｌｉ」者を単語認識部１１２へ、後者を話
者照合部［０５へ送る。

単語認識部１１２では、送られた全体の特徴パラメータ
と予め仮辞書メモ９−１０４に登録された全体の特徴パ
ラメータとを照合し、その照合結果を全体のパラメータ
と共に半別部１０６へ送る（第３図ステップ３６〕。話
者照合部１０５では送られた母音部分パラメータと仮辞
書メモ！Ｊ　−１０４に登録された母音部分パラメータ
とを照合し、その照合結果を母音部分パラメータと共に
判別部１０６へ送る（第３図ステップ２１）。この処理
がＭ回迄繰り返された後、カウンター１０３の指示によ
り、判別部１０６は両方の照合結果が共に良カ１つに全
体パラメータ及び母音部分パラメータを選んでＩＤ作成
部１０７へ送る（＠３図ステップ２２　、２６　）。こ
こで場合によっては２つの照合結果に重み付けをして判
別し、パラメータを選ぶことも可能である。こうしてＬ
Ｄ作成都１０７は選ばれた全体パラメータ及びその母音
パラメータを用いてＩＤを作成しこの２つのパラメータ
をＩＤとして本辞書メモリー１０８へ登録する。（第３
図ステップ２７．２８．例えば選ばれたパラメータが（
／ゼ／／ロ／）及び（／工／）であればＩＤは「ゼロ」
と決定され、この２つのパラメータがＩＤのパラメータ
となる）上記第２の実施例によれば、話者照合システムが話者の
入力音ｙＨ！二対して個人性（母音パラメータの照合率
）が一番有り、且つ単語認識（全体パラメータの照合）
の認識率が最も良いＩＤを作ることから、話者照合率が
より一層同上することができ、セキュリティｉ二対して
も問題が少なくなる。

尚１本発明は上記実施例に限定されるものではない。例
えばＩＤ作成の際、ＩＤの中で照合Ｃ二必要な部分以外
の部分が有る場合は、これを登録者に作成してもらって
もよい。又、入力音′声の特徴パラメータ検出や、照合
（認識）処理の方法は従−米より知られた種々の方法を
適宜採用すればよい。

要するに本発明はその要旨を逸脱しない範囲で種々変形
して実施することができる。

【図面の簡単な説明】

第１図は本発明の＠ｌの実施例のフロー丙、第２図は本
発明の第１のブロック図、第３図は本発明の第２の実施
例のフロー図、第４図は本発明の第２の実施例のブロッ
ク図である。１０１・・・分析部　　　　　１０２・・・機能選択部
１０３・・・カウンター　　　１０４・・・仮辞誓メモ
リー１０５・・・話者照合部　　　１０６・・・判別部
１０７・・・ＩＤ作成都　　　１０８・・・本辞也メモ
リー１０９・・・話者照合部　　　１１０・・・単語認
識部１１１・・・照合部　　　　　１１２・・・”単語
誌織部代理人　弁理士　則　近　慝　佑（ほか１名）

Claims

【特許請求の範囲】

（１）話者の発声した複数の単語音声に対して各々の音
声特徴を検出する検出手段と、この検出手段より検出さ
れた各々の音声特徴を記憶する記憶手段と、前記話者が
再度発声した前記複数の単語音声に対して前記検出手段
が再度検出した各々の音声特徴と前記記憶手段により記
憶された各々の音声特徴とを各々照合する照合手段と、
この照合手段による照合結果に基いて前記話者のＩＤを
決定する決定手段とを具備したことを特徴とする話者照
合方式。
（２）照合手段は前記話者が再度発声した前記複数の単
語音声を認識するとともに各々の音声特徴を照合し、前
記決定手段は前記照合手段による認識結果及び照合結果
に基いてＩＤを決定することを特徴とする特許請求の範
囲第１項記載の話者照合方式。
（３）検出手段は話者の発声した単語音声に対して音声
特徴を検出し、照合手段は前記音声特徴が前記決定手段
により決定されたＩＤの音声特徴と一致しているか否か
により話者照合を行うことを特徴とする特許請求の範囲
第１項記載の話者照合方式。