JPS63305397A - 不特定話者音声認識装置 - Google Patents

不特定話者音声認識装置

Info

Publication number
JPS63305397A
JPS63305397A JP62141753A JP14175387A JPS63305397A JP S63305397 A JPS63305397 A JP S63305397A JP 62141753 A JP62141753 A JP 62141753A JP 14175387 A JP14175387 A JP 14175387A JP S63305397 A JPS63305397 A JP S63305397A
Authority
JP
Japan
Prior art keywords
recognition
pattern
standard
matching
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62141753A
Other languages
English (en)
Inventor
石塚 久夫
土居 晃二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62141753A priority Critical patent/JPS63305397A/ja
Publication of JPS63305397A publication Critical patent/JPS63305397A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 本発明は各カテゴリに対して複数の標準パタンを用いる
マルチテンプレート方式の不特定話者音声認識装置に関
する。
〈従来の技術〉 不特定話者音声認識装置では、予め各単語の標準パタン
を用意し、未知音声が入力されると各標準パタンとマツ
チング処理を行い、マツチング距離の最小値を与える標
準パタンを求めこれを認識結果とする方式が採られてい
る。
一般に音声は同一単語の発声でも、周波数方向。
振幅方向9時間方向に複雑に変化する。ところが同一発
声者の場合、時間方向の歪は大きいが振幅および周波数
の方向は比較的安定している。そのため、時間方向の歪
を整合するだけでパタンはよく一致するようKなる。し
かし時間方向の歪は発声者の発声速度の変動によるもの
で、変動は子音では小さく母音では大きいため歪は複雑
な非線形なものとなる。この非線形な歪を最適に整合す
る方法として考え出されたアルゴリズムKDP(ダイナ
ミック・プログラミング)マツチング法があシ、大きな
効果を得ている。これによシ時間方向の非睨形歪は解決
された。
一方、話者が複数の場合は、同一単語の発声でも歪は時
間方向に限らず周波数方向にも及び、非常に複雑なもの
となるため同一単語の標準パタンか一つでは話者に対応
できなく表ってしまう。そこで不特定話者用の音声認識
装置では話者によるバラツキを吸収するため、同一単語
に対して稼準パタンを複数個持つマルチテンプレート方
式が一般的に用いられている。従って、不特定話者用の
音声認識装置では良い標準パタンを作成することが重要
になっている。標準パクンは、数十人から数千人におよ
ぶ話者の発声データを収集してそこからクラスタリング
の技術を用いてカテゴリ(この場合単語が一般的)毎に
数個から数十個求められている。
しかし、話者によっては単語Aの発声が、別の単語例え
ばBのひとつの標準パタンと最も距離が小さいこと釦な
る場合もあシ、この場合その話者(X)が単語Aを発声
するとBと認識されることになる。その原因がその話者
の発声に近い標準パタンかAになく、むしろBのひとつ
の標準パタンに近いことだとすると、この誤認識はしば
しば起こってしまうことになる。標準パタンを作成する
際に、話者Xの単語A、  Bの発声に近いものがなか
った場合にこの誤認識は起きやすい。誰が使うかわから
ない不特定話者音声認識装置では従来の方式では避けら
れない問題である。
〈発明が解決しようとする問題点〉 以上説明l、たよりに、従来のマルチテンプレート方式
の不特定話者音声認識装置では、話者に対して適合性が
なく、特定の話者には認識率が向上しないという欠点を
有している。
上述した従来のマルチテンプレート方式の不特定話者音
声認識装置に対し、本発明はマルチテンプレート方式の
記憶装置において、標準パタン毎に認識対象であるか否
かを指定するレジスタを設け、認識結果が正しいか否か
に従ってこのレジスタを設定することによって誤認識し
た標準パタンを認識対象からはずすようにし、これによ
って認識率の低下を防ぐという独創的内容を有する。
従来に本認識対象であるか否かを指定するレジスタを設
けた音声認識装置はあるが、これはシンタックス制御の
ために用いられ、同一カテゴリに対しては同一値となる
ものであった。これでは話者のバラツキによる認識率の
低下を防ぐことに用いることはできない。
〈問題点を解決するための手段〉 本発明の不特定話者音声認識装置は、同一カテゴリーに
対してあらかじめ複数の標準パタンを用意し、前記標準
パタンと未知入力パタンとのパタンマツチング処理を実
行し各カテゴリーの標準パタンととのマツチングによシ
得られるマツチング距離によって前記未知入力パタンの
カテゴリーを推定するマルチテンプレート方式の不特定
話者音声認識装置において、標準パタン毎に認識対象で
あるか否かを指定する記憶手段と、認識結果が正しいか
否かを入力する手段と、前記入力手段によって前記レジ
スタの書込制御を行々う制御回路とを有することを特徴
とする。
〈実施例1〉 次に本発明について図面を参照して説明する。
第1図は、本発明の一実施例のブロック図である。第1
図に於いて、1は標準パタンを格納する標準パタンメモ
リ、2は未知入力パタンと標準パタンとのマツチング処
理を行なうマツチング処理部、3は各標準パタンに対し
て認識対象であるか否かを指定するメモリ、4は外部か
ら認識結果が正しいか否かを入力する手段、5は外部入
力手段4に従りてメモリ3に書込制御を行なう制御回路
である。第2図に、メモリ1,3の構成例を示す。
例として、認識対象の単語(カテゴリ)として、A、 
B、 C・・・・・・、標準パタンの数として各単語に
つき4ケという場合を挙げる。第2図(b)は標準パタ
ンメモリの構成を示し、PAI、PA2.PA3.PA
4は単語Aの標準パタンを、PBl、 PH2,PH1
,PH4は単語Bの標準パタンを表している。以下同様
である。第2図(a)は認識対象指定メモリの構成を示
し、几Al、RA2.RA3.RA4.RBI、RB2
.・・・・・・・・・は各標準パタンに対応し認識対象
であるか否かを表している。例えばパタンPAIは、R
Al=Qでは認識対象となl:>、RA1=1では認識
対象とならないとする。このとき、制御回路5は次のよ
うに制御する。即ち、パタンマツチング処理終了後、そ
の認識結果(この場合どの標準パタンか最短距離を与え
たか)を保持し、これに対して認識結果が正しくないと
入力手段5から入力された場合は認識対象指定メモリの
認識結果に対応する番地内容を%11に、認識結果が正
しかった場合は何も処理しないのである。但し、本装置
を起動するとき認識対象指定メモリの内容をすべて%Q
lにするものとする。
この実施例において、認識処理全体の処理フローは以下
のようKなる。
(1)認識対象指定メモリの内容をすべて%Qlとする
(2)音声入力部から音声を入力し、音声の発声区間を
検出して入力パタンを生成する。
(3)入力パタンと認識対象指定メモリの値d1%QI
である標準パタンとのマツチング処理を行ない、最短距
離を与える標準パタンを求める。これを認識候補とする
(4)認識候補を外部に出力する。
(5)外部よシ認識結果についての評価が入力されるま
で待つ。
(6)評価が正しければ(2)へ移行し、正しくなけれ
ば(力へ移行する。
(7)  (3)で求まった認識候補に対応する認識指
定メモリの内容を111にし、(2)へ移行する。
この実施例の動作をさらに具体的に説明する。
本装置起動直後、(1)の処理によシ認識対象指定メモ
リの内容はすべて%QIKなっているので、マツチング
処理の対象になるのはすべての標準パタンである。さて
、いま未知音声が入力されてすべての標準パタンとマツ
チング処理を行ないその結果標準パタンPB2が最短距
離を与えたとする。
制御回路5はこれを保持する。認識装置はこの結果から
PH1の属するカテゴリすなわちBを認識候補として外
部に対し出力する。ところが外部入力手段4からこの結
果が間違っていると入力されたとしよう。すると、制御
回路5はマツチング結果PB2に対応する認識対象指定
メモリの番地内容RB2を111にセットする。このよ
うになった後はRB2=%11であるから、PH1はパ
タンマツチングの対象にはならず、PH1がマツチング
結果になることはな(なる。同様に、また別の誤認識が
入力されたならその標準パタンに対応する認識対象指定
メモリの内容が%11にセットされる。
これを続けるととくよシ、誤認識を与える標準パタンを
削ることができるのである。
〈実施例2〉 次に本発明の第二の実施例について述べる0本例におい
ても構成は同じであるが、認識対象指定メモリのとシ得
る値と制御回路の動作が異なる。
認識対象指定メモリのとり得る値は例えば101゜%1
1.%21で、121になると初めて認識対象から除外
するものである。また、制御回路は誤認識を与えた標準
パタンにたいしてその認識対象指定値を+1するものと
する。例えばマツチング結果ではFBIが最も小さいマ
ツチング距離を与えてBという認識結果を出力したが、
入力手段から誤認識であると入力された場合RB1の値
を+1し、%QIを111にする。%11ではまだ認識
対象になっている。その後マツチング結果でPBlが最
も小さいマツチング距離を与えてしかも誤認識だった場
合RB1を+1すると%21になる。以降はFBIさす
、2回の誤認識ではじめて外すのである。これによって
不用意に認識対象を減らすことを防ぐことができる。
尚、認識対象指定メモリのとシ得る値を0〜n(3以上
の整数)とし、nになったら認識対象から除外するよう
に変更できることは明白である。
この場合も制御回路は誤認識を与えた標準パタンに対す
る認識対象指定値を+1する制御となる。
また、以上の例では認識対象指定メモリの内容の初期値
を%Olとしたが、逆にm (mは自然数)として%O
lになったら認識対象から除外するようにも容易に変更
できる。この場合制御回路は誤認識を与えた標準パタン
に対する認識対象指定値を−1する制御となる。
〈発明の効果〉 以上説明したように、本発明ではマルチテンプレート方
式の不特定話者音声認識装置において誤認識を与える標
準パタンを削除していくので、特定の話者に対しての認
識率の劣化を防ぐことができる。
【図面の簡単な説明】
第1図は、本発明の実施例のブロック図、第2図は本発
明の第1の実施例に於ける標準パタンメモリ及び認識対
象指定メモリの構成図である。 1・・・・・・標準パタンメモリ、2・・・・・・マツ
チング処理部、3・・・・・・認識対象指定メモリ、4
・・・・・・外部入力手段、5・・・・・・制御回路。 茅 /I!r 滞 2 門

Claims (1)

    【特許請求の範囲】
  1. 同一カテゴリーに対してあらかじめ複数の標準パタンを
    用意し、前記標準パタンと未知入力パタンとのパタンマ
    ッチング処理を実行し各カテゴリーの標準パタンごとの
    マッチングにより得られるマッチング距離によって前記
    未知入力パタンのカテゴリーを推定するマルチテンプレ
    ート方式の不特定話者音声認識装置において、標準パタ
    ン毎に認識対象であるか否かを指定する記憶手段と、認
    識結果が正しいか否かを入力する手段と、前記入力手段
    によって前記レジスタの書込制御を行なう制御回路とを
    有することを特徴とする不特定話者音声認識装置。
JP62141753A 1987-06-05 1987-06-05 不特定話者音声認識装置 Pending JPS63305397A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62141753A JPS63305397A (ja) 1987-06-05 1987-06-05 不特定話者音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62141753A JPS63305397A (ja) 1987-06-05 1987-06-05 不特定話者音声認識装置

Publications (1)

Publication Number Publication Date
JPS63305397A true JPS63305397A (ja) 1988-12-13

Family

ID=15299393

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62141753A Pending JPS63305397A (ja) 1987-06-05 1987-06-05 不特定話者音声認識装置

Country Status (1)

Country Link
JP (1) JPS63305397A (ja)

Similar Documents

Publication Publication Date Title
US4513435A (en) System operable as an automaton for recognizing continuously spoken words with reference to demi-word pair reference patterns
JPH03501657A (ja) パターン認識エラー低減装置
JPH0159600B2 (ja)
JPS60211498A (ja) 連続音声認識装置
JPS63305397A (ja) 不特定話者音声認識装置
JPS6312312B2 (ja)
JPS6073592A (ja) 特定話者用音声認識装置
JPH0570838B2 (ja)
JPS60115993A (ja) 単音節音声認識装置
JPS60113298A (ja) 特定話者音声認識装置
JPS6039692A (ja) 単語音声認識方法
JPS60212799A (ja) 音声認識装置
JPS59176791A (ja) 音声登録方式
JPS5915990A (ja) 音声認識方式
JPH01138596A (ja) 音声認識装置
JPS59195299A (ja) 特定話者音声認識装置
JPS58224394A (ja) 連続単語音声認識装置
JPS60147797A (ja) 音声認識装置
JPS63239499A (ja) 単語音声入力装置
JPS62209598A (ja) 単語音声認識処理方式
JPS62121499A (ja) 音声認識装置
JPS5816296A (ja) 音声認識方式
JPS60130797A (ja) 音声認識装置
JPS61254994A (ja) 連続単語認識装置
JPS5917597A (ja) 音声認識方式