JPS59216284A - パタ−ン認識装置 - Google Patents

パタ−ン認識装置

Info

Publication number
JPS59216284A
JPS59216284A JP58091122A JP9112283A JPS59216284A JP S59216284 A JPS59216284 A JP S59216284A JP 58091122 A JP58091122 A JP 58091122A JP 9112283 A JP9112283 A JP 9112283A JP S59216284 A JPS59216284 A JP S59216284A
Authority
JP
Japan
Prior art keywords
pattern
standard
standard pattern
category
representative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58091122A
Other languages
English (en)
Other versions
JPH0449717B2 (ja
Inventor
Satoru Kabasawa
樺澤 哲
Meikun Shiya
謝 明勲
Tokiaki Cho
世明 張
Toshihiro Hayashi
俊宏 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP58091122A priority Critical patent/JPS59216284A/ja
Priority to US06/611,734 priority patent/US4715004A/en
Publication of JPS59216284A publication Critical patent/JPS59216284A/ja
Publication of JPH0449717B2 publication Critical patent/JPH0449717B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、入力信号から得られる特徴パターン系列と標
準パターンとを比較して、特徴パターン系列に最も近い
標準パターンを識別して該当するカテゴリコードを出力
するパターン認識装置に関するものである。
従来例の構成とその問題点 近年、人間−機械系の入力手段を目的としたパターン認
識装置の開発か盛んである。例えば、人間にとって最も
自然な情報発生手段である音声に関して、音声のパター
ンを識別することにより、人間−機械系の入力手段を実
現することへの期待は非常に犬さく、従来から種々な提
案がなされている。
以下に従来の音声パターン認識装置について説明する。
第1図は、従来の音声パターン認識装置の構成図を示す
ものであり、1は特徴抽出部、2は標準パターン記憶部
、3は計算部、4は平均部、5は識別部である。
以上の様に構成された従来の音声パターン認識装置につ
いて、以下その動作を説明する。
入力信号は、特徴抽出部1において慣゛徴パターンの時
系列に変換され、計算部3において標準パターン記憶部
2で記憶さ7tている各カテゴ’) frr複数個の標
準パタ−ンとマツチング計算される。平均部4では、各
カテゴリ毎に得られる前記マツチング計算結果のうち、
前記特徴パターンとの距離の近いものに個の平均値を計
算する。識別部5では、前記平均部4aの結果のうち、
距離の平均値が最も近い前記標準パターン群に対応する
カテゴリコー ドを識別結果として出力する。
しかしなから、前記の様な構成では、各カテゴリ毎の標
準パターン数Nの増加及び、前記平均部4aで平均する
距離の個数にの増加に伴ない、前記特徴パターンに対す
る識別率は改善されるが、識別に要する時間がががりす
ぎるという問題を有していた。fなわち、各カテゴリ毎
に1つの標準パターンしか持たない場合(N=1.に=
1)に比べて、N倍のマツチング割算と、1回の平均8
−1算を行う必要があった。
更に、カテゴυaMが増加すると、識別に要する時間は
、前記の更にM倍に増加するという問題も有していた。
発明の目的 本発明は、上記の様な従来の問題点を解決するもので、
各カテゴリ毎に複数個の標準パターンと照合することで
得られる識別率の改善効果を失うことなく、また、標準
パターンの記憶容量を増すことなく、識別に要する時間
を短縮することを目的モするものである。
発明の構成 本発明は、各カテゴリ毎の複数個の標準パターンを代表
する代表標準パターンを記憶する代表標準パターン記憶
手段と、入力信号の特徴パターンと代表標準パターンと
のマツチング計算を行う前照合計算手段と、前照合計算
手段の結果のうち距離の近いもの1個の代表標準パター
ンに対応するカテゴリコード及び付帯する距離を出力す
る前照合手段を備えたパターン認識装置であり、カテゴ
リ毎の複数個の標準パターンのうち代表標準パターンと
入力信号の特徴パターンとの照合を予め行って、複数個
の標準パターンとのマツチング3」算を行うカテゴリの
数を減少させることしこより、各カテゴリ毎に複数個の
標準パターンと照合−することで得られる識別率の改善
効果を維持しつつ、寸だ、標準パターンの記憶容量をj
7ずことなく、識別に要する時間を短縮できるものであ
る。
また本発明は、各カテゴリ毎の複数個の標準パターンを
代表する代表標準パターンを記憶する代表標準パターン
記憶手段と、入力信号の特徴パターンと代表標準パター
ンとのマツチング計算を行う前照合計算手段と、前照合
計算手段の結果のうち最小距離が予め定めた閾値よりも
小さい時1j、最小距離を与える代表標準パターンに対
応するカテゴリコードを識別結果として出力し、前記最
小距離が前記閾値よりも大きい場合は距離の近いもの1
個の代表標準パターンに対応するカテゴリコード及び細
帯する距離を出力する前照合手段と、前照合手段の出力
か1つのカテゴリコードのみの場合はカテゴリコードを
そのまま識別結果として出力し、複数個のカテゴリコー
ドと付帯する距離の場合は該当するカテゴリ毎に代表標
準パターン以外の標準パターン群と入力信号の特徴パタ
ーンのマツチング計算を行わぜる為の信号を出力するゲ
ート手段を備えたパターン認識装置であり、カテゴリ毎
の複数個の標準パターンのうち代表標準パターンと入力
信号の特徴パターンとの照合を予め行って、複数個の標
準パターンとのマツチング計算を行うカテゴリの数を減
少させることにより、各カテゴリ毎に複数個の標準パタ
ーンと照合することで得られる識別率の改善効果を維持
しつつ、また、標準パターンの記憶容量を増すことなく
、識別に要する時間を短縮できるものである。
実施例の説明 第2図は、本発明における音声パターン8識装置の第1
の実施例の構成図を示すものである。
第2図において、11は特徴抽出部、12は代表標準パ
ターン記憶部、13は標準パターン記憶部、14は前照
合計算部、15は前照合部、16は計算部、17は平均
部、18は識別部である。
以上のように構成された本実施例の音声パターン認識装
置について、以下その動作を説明する。
入力信号(音声)は特徴抽出部11において、周波数分
析され、4ooH2がら6KHziでを対数軸上で等分
割された16ケの周波数帯域のそ八ぞれの電力を表わす
16次元ベクトルの時系列Ai−(dt1+ ai2+
 di31  ””””’ + ai16)に変換され
、前照合計算部14で、代表標準パターン記憶部12で
記憶されている代表標準パターンとマツチング割算され
る。ところで、代表標準パターン記憶部12で記憶され
ている代表標準パターンとは、各カテゴリ毎の複数個の
標準パターン(16次元ベクトルの時系列)を代表する
標準パターン(16次元ベクトルの時系列ンであって、
例えば10ケのカテゴリについて、各カテゴリ毎に7ケ
の標準パターン(16次元ベクトルの時系列)を持つ場
合には7ケの標準パターン(16次元ベクトルの時系列
)の中で残りの6ケの標準パターンとの距罎りが最も平
均的な1つの標準パターン(16次元ベクトルの時系列
)(例えば、各標準パターンについて、1標準パターン
がもつ他の標準パターンとの距離の最大値のうち、それ
らの最小値を与える標準パターンを選ぶ(ミニ−マツ−
−・−・−、n=6) (m=1 、2 、・・・・・
’、 10 iカテゴリ番号)となる。代表標準パター
ン記憶部12では、カテゴリ数だけ、すなわち10ケの
前記代表標準パターンB” (m=1 、2 、・・・
・・・、10)が記憶されている。前照合計算部14で
は、代表標準パターン記憶部で記憶されている前記代表
標準バター:yBrn(m=1 、2 、・−−−−−
、1o)ト、特徴抽出部11で得られた特徴パターン(
16次元ベクトルの時系列)Aiについて、動的計画法
を用いて市街距離を計算する。前照合部15では、10
個の代表標準パターンBm(m=1.2 、・・・°・
、10)に対して前照合計算部14で得られた市街距離
(11,12,・・・・・、41oについて、距離の近
いもの5ケについて、それらを与える代表標準パターン
に対応したカテゴリコード及び付帯する市街距離を出力
する。計算部16では、10ケのカテゴリについて、標
準)くターン記憶部12で記憶されている各カテゴリ6
ケずつの標準・くターン(16次元ベクトルの時系列)
のうち、前照合部15で得られた5ケのカテゴリコード
に対応したそれぞれ3ケの標準ノくターン(16次元ベ
クトルの時系列)と、特徴抽出部11で得られた重機・
ζターン(16次元ベクトルの時系列)A、について、
動的計画法を用いて市街距離を計算する。ところで、標
準パターン記憶部12で記憶されている標準パターンと
は、各カテゴリ毎の複数個の標準パターン(16次元ベ
クトルの時系列)のうち、前記代表標準パターン(16
次元ベクトルの時系列)を除いた残りの6ケの標準ノく
ターン(16次元ベクトルの時系列)B〒 BEE、・
・・・・・ B胃(rn=1,2.・・・・・・、1o
)である。すなわち、各カテゴリについて、標準パター
ンは、1つの代表標準パターンBmと6ケの標準・(タ
ーンBIT (n=1.2.・・・・・・、6)の合計
7個の標準・ζターンが存在する。標準パターン記憶部
12では、各カテゴリについて、すなわち10ケのカテ
コ゛りについて、6ケの前記標準パターン(16次元ベ
クトルの時系列) B: (n=1 、2、−=−・・
、 6 ;m=1゜2.10)が記憶されている。平均
部17では、前照合部15でイ()られた5ケのカテゴ
リについて、各カテゴリの代表標準パターン(16次元
ベクトルの時系列)と前記特徴パターン(16次元ベク
トルの時系列)A□との市街距離(前照合部15より入
力されたもの)と、同一カテゴリについてJ1算部16
で得られた6ケの市街距離のうち、距離の小さいもの3
ケの相加平均Lmを求めて、各カテゴリに対応した標準
パターン群と前記特徴パターン(16次元ベクトルの時
系列)との平均距離とする。識別部18では、前照合部
16で得られた5ケのカテゴリに対応した標準パターン
群について、平均部17で求めた5ケの平均距離の最も
近い標準パターン群に対応するカテゴリコードを識別し
て、識別結果として出力する。
以上の第1の実施例の動作をフローチャートに表わすと
第3図の様になる。同図において、20は第4図の入力
信号を表し、21は第2図の特徴抽出部11の動作、2
2は第2図の前照合計算部14の動作、24は第2図の
前照合部16の動作、26は第2図の計算部16の動作
、27は第2図の平均部17の動作、28〜29は第2
図の識別部18の動作、30は第2図のゲート部19の
動作を表している。同図において、例えば、カテゴリと
して”0”〜”9”までの数字音声が割当てられている
J場合に、入力音声として”ゼロ”が入力されると、2
1で特徴抽出して入力特徴パターンが生成され、入力特
徴パターンとカテゴリ”0”〜”9”に対応した代表標
準パターン(例えば、前記ミニ−マックス法で選択され
る)とのマツチング計算が22でな・され、24で距離
の近いもの5ケについて、それぞれ対応するカテゴリ例
えば”0”、“3”、“6”、”7″、”9”、を識別
する。そして、30において、第2図のゲート部19へ
の入力であるカテゴリコードが1つか又はそれよりも多
い(6ケ)かを判断し、1つだけの場合はその一!ま識
別結果として29で出力するが、6ケの場合には、26
で6ケのカテゴリ″0゛。
“3”、”6°“、”、“9”、に対応した標7 準パターン群とのマツチング計算を行い、5ケのカテゴ
リ゛o“、”3゛、”6°+ 、 I+ 7”、”9”
の各々について、距離の近いもの3ケずつを平均して、
5ケの各カテゴリが対応する標準パターン群と入力特徴
パターンとの平均距離を27で求める。28では、前記
平均距離の最小値を与えるカテゴリ例えば”0”を識別
し、カテゴリコード”0″゛を出力する。以上の様な手
順で入力音声が識別される。
以上のように、本実施例によれば、代表標準パターン記
憶部12、前照合計算部14、前照合部15を設けて、
各カテゴリ毎7ケの標準バク〜ンのうち、先ず、それら
を代表する各カテゴリ毎1つの代表標準パターンと入力
信号の特徴パターンとのマツチング計算を行い、入力信
号の特徴パターンとの距離が近いもの5ケの代表標準パ
ターンがそれぞれ該当するカテゴリを、10ケのカテゴ
リの中から5ケ選択し、標準パターン群とのマツチング
計算の量を半減することにより、各カテゴリ毎に複数個
の標準パターンと照合することで得られる識別率の改善
効果を維持しつつ、丑だ、標準パターンの記憶容量を増
すことなく、識別に要する時間を短縮することができる
。。
なお、本実施例においては、入力信号は音声であるとし
たが、入力信号は音声に限らず、例えば、手書文字入力
であっても良い。また、入力信号の特徴パタ−ンとして
、400H2〜5 K Hz 帯域について周波数分析
して16次元ベクトル表現を用いだが、周波数帯域幅、
ベクトルの次数は任意で良く、更に、周波数分析以外の
方法として、自己相関係数、零交叉数など入力信号の特
徴を表現しうるパラメータであれば良い。更VCは、入
力信号の特徴パターンと標準パターンのマツチング計算
に動的計画法を用いたが、線形マツチ・ングを用いても
良くまた、距離尺度としては、市街距離以外の、ユーク
リッド距離、マ・・ラノビスの距離等、両者の距離を表
現するあらゆる距離尺度を適用しうる。
第4図は、本発明における音声パターン認識装置の第2
の実施例構成図を示すものである。
第4図において、11は特徴抽出部、12は代表標準パ
ターン記憶部、13は標準パターン記憶部、14は前照
合割算部、15は前照合部、16は計算部、17は平均
部、18は識別部、19はゲート部である。
以上のように構成された本実施例の音声パターン認識装
置について、以下その動作を説明する。
入力信号(音声)は、特徴抽出部11において、周波数
分析され、400 Hzからs K Hzまでを対数軸
上で等分割された16ケの周波数帯域のそれぞれの電力
を表わす16次元ベクトルの時系列Ai=(ai1,a
i2,ai3,・・・・・・・・・,ai16)に変換
され、前照合計算部14で、代表標準パターン記憶部1
2で記憶されている代表標準パターンとマツチング計算
される。ところで、代表標準パターン記憶部12で記憶
されている代表標準パターンとは、各カテゴリ毎の複数
個の標準パターン(16次元ベクトルの時系列)を代表
する標準パターン(16次元ベクトルの時系列)であり
て、例えば10ケのカテゴリについて、各カテゴリ毎に
7ケの標準パターン(16次元ベクトルの時系列)を持
つ場合には、7ケの標準パターン(16次)1ベクトル
の時系列)の中で、残りの6ケの標準パターンとの距離
が最も平均的な1つの標準パターン(16次元ベクトル
の時系列)(例えば、前記ミニ−マックス法により選択
される)が代表標準パターンB”=(bm bm−旧、
brn6)(m= 1゜12 2ツ 2、・・・−・・、1Q;カテゴリ番号)となる。代表
標準パターン記憶)τl512では、カテゴリ数だけ、
すなわち10ケの前記代表標準バター0ンB”(m=1
.2.・・・・・・、10)が記憶されている。前照合
計算部14では、代表標準パターン記憶部で記憶されて
いる前記代表標準パターンBm(m=1 。
2、・・・・・・、10)と、特徴抽出部11で得られ
た特徴パターン(16次元ベクトルの時系列)A□につ
いて、動的計画法を用いて市街距離を計算する。前照合
部15では、10個の代表標準パター7 Bm(m= 
1 、2 、・・・・・・、10ンに対して前照合計算
部14で得られた市街距離n1 + (12+・・・・
・・。
l10 について、それらの最小値1m1n ”’予め
定められた閾値しよりも小さければ、最小距離を与える
代表標準パターンに対応したカテコ゛リコードのみを出
力し、市街距離1m(m=1.2 、・・・・・・。
10)の最小値 ’min が閾値りよりも大きい力1
等しい場合には、距離の近いもの6ケについて、それら
を与える代表標準ノぐターンに対応したカテゴリコード
及び付帯する市街距離を出力する。ゲート部19では、
前照合部15の出力が、1つのカテゴリコードのみの場
合は、そのit力テコ゛リコードを識別結果として出力
し、5ケのカテコ゛リコードと付帯する距離の場合は、
計算部17において、標準パターン記憶部12で記憶さ
れている標準パター、ンのうち、5ケのカテコ゛リコー
ドに対応した標準パターン(16次元ベクl−/しの時
系列)とのマツチング計算を行わせる為の信号を出ノj
する。ところで、標準ノくターン記憶部12で記1Mさ
れている標準パターンとは、各カテコ゛り毎の複数個の
標準パターン(16次元ベクトルの時系夕1])のうち
、前記代表標準ノくターン(16次元ベクトルの時系列
)を除いた残りの6ケの標準ノ(ターン(16次元ベク
トルの時系列) Bll’l 、 Brn、・・・・・
・。
B″”(m=1 .2 、===、10)である7、−
J−な1+ち、各カテゴリについて、標準・ぐターンd
、1つの代表標準パターン評と6ケの標準/%ターンB
”(n=1.2.−−=、6)の合計7個の標準パター
ンが存在する。標準ノ(ターン記憶部12では、各カテ
ゴリについて、すなわち10ケのカテゴリについて、6
ケの前記標準)qターン(16次元ベクトルの1■山系
列)Bm (n==1.2.・・・・・・。
10)が記憶されている。割算部16では、ケート部1
9より、計算駆動信号が入力された場合のみ、10ケの
カテコ゛りについて標準/Cターンd己1.Q部12で
記憶されている各カテコ゛す6ケずつの標準パターン(
16次元ベクトルの時系列)のうち、前照合部16で得
られた5ケのカテコ゛リコードに対応したそれぞれ6ケ
の標準ノくターン(16次5cベクトルの時系列)と、
特徴抽出部11で得られた特徴パターン(16次元ベク
トルの時系夕1)Aiについて、動的別画法を用いて市
街距離f i’i−1算1−る。平均部17では、前照
合部16で得られた5ケのカテゴリについて、各カテゴ
リの代表標準パターン(16次元ベクトルの時系列)と
前記特徴パターン(16次元ベクトルの時系列)Aiと
の市街距離(前照合部16より入力されたもの)と、同
一カテゴリについて、計算部16で得られた6ケの市街
距崗11のうち、距離の小さいもの3ケの相加平均Lf
l′1を求めて、各カテゴリに対応した標準パターン群
と前記特徴パターン(16次元ベクトルの時系列)との
平均距離とする。識別部18では、前照合部月5で得ら
れた5ケのカテゴリに対応した標準パターン群について
、平均部17で求めた5ケの平均距離の最も近い標準パ
ターン群に対応するカテゴリコードを識別して、識別結
果として出力する。
以上の第2の実施例の動作をフローチャートに表わすと
第5図の様になる。同図において、20は第4図の入力
信号を表し、21は第4図の特徴抽出部11の動作、2
2は第4図の前照合計算部14の動作、23〜26は第
4図の前照合部16の動作、26は第4図の割算部16
の動作、2γは第4図の平均部17の動作、28〜29
は第4図の識別部18の動作、30は第4図のゲート部
19の動作を表している。同図において、例えばカテゴ
リとして°′0″〜” 9 ”−4での数字音1!・が
割当てられている場合に、入力音声として°゛ゼ1コ″
′入力されると、21で特徴抽出して入力重機パターン
が生成され、入力特徴パターンとカテゴリ” o ”〜
” 9 ”に対応した代表標準パターン(例えば、前記
ミニ−マックス法て選択される)とのマツチング割算が
22でなされ、23で最小距離と閾値との比較を行い、
最小距離が閾値よりも小さい時には、26で最小距離を
与えるカテゴリを識別し、最小距離が閾値よりも大きい
か又は等しい時には、24で距離の近いもの5ケについ
て、それぞれ対応するカテゴリ、例えば、°′0″′。
°゛3” It 677 、 It了′″、“9″、を
識別する。
そして、30において、第4図のゲート部19への入力
であるカテゴリコードが1つか又はそれよりも多い(6
ケ)かを判断し、1つだけの場合はそのまま識別結果と
して29で出力するが、5ケの場合には、26で5ケの
カテゴリ10″′、a3”。
t−6n 、 tt 7II 、 l“9″、に対応し
た標準パターン群とのマツチング計算を行い、5ケのカ
テゴリ“O”  ” 3 ” 、”’ 6 ” 、 ’
“7″2′’9”、の各々について、距離の近いもの3
ケずつを平均して、5ケの各カテゴリが対応する標準パ
ターン群と入力特徴パターンとの平均距離を27で求め
る。28では、前記平均距離の最小値を与えるカテゴリ
例えば“0″を識別し、カテゴリコード” o ”を出
力する。以上の様な手順で入力音声が識別される。
以上のように、本実施例によれば、代表標準パターン記
憶部12、前照合計算部14、前照合部16、ゲート部
19を設けて、各カテゴリ毎7ケの標準パターンのうち
、先ず、それらを代表する各カテゴリ毎1つの代表標準
パターンと入力信号の特徴パターンとのマツチング計算
を行い、得られた最小の市街距離が予め定めた閾値よシ
も小さければ、最小の市街距離を与える代表標準パター
ンに対応するカテゴリを識別して以降の計算を打切り、
得られた最小の市街距離が前記閾値よりも大きいか等し
い場合には、入力信号の重機)パターンとの距離が近い
もの5ケの代表標準・々ターンがそれぞれ該当するカテ
ゴリを、10ケのカテコ゛りの中から5ケ選択し、標準
パターン群とのマ・ソチング計算の量を半減することに
より、各カテゴリ毎に複数個の標準パターンと照合する
ことで得られる識別率の改善効果を維持しつつ、捷た、
標準パターンの記憶容量を増すことなく、識別に要する
時間を短縮することができる。
なお、本実施例においては、入力信号は名声であるとし
たが、入力信号は音声に限らず、例えば、手書文字人力
であっても良い。また、入力信号の特徴パターンとして
、400Hz〜5KHzイ;;・域について周波数分析
して16次元ベクトル表現を用いたが、周波数帯域幅、
ベクトルの次数は任意で良く、更に、周波数分析以外の
方法として、自己相関係数、零交叉数など入力信号の特
徴を表現しうるパラメータであれば良い。更には、入力
信号の特徴パターンのマ・フチング計算に動的泪画法を
用いたが、線形マツチングを用いても良くまた、距離尺
度としては、市街距離以外の、ユークリッド距離、マハ
ラノビスの距離等、両者の距離を表現するあらゆる距n
[#尺度を適用しうる。
発明の効果 本発明のパターン認識装置は、代表標準パターン記1.
ω部、前照合計算部、前照合部、を設けることによシ、
各カテゴリ毎の複数個の標準パターンのうち、先ず、そ
れらを代表する各カテゴリ毎1つの代表標準パターンと
入力信号の特徴パターンとのマツチング計算を行い、入
力信号の特徴パターンと代表標準パターンとの距離の近
いもの数ケについて、それぞれ該当する候補カテゴリを
予め選択し、それらに対応する標準パターン群とのマツ
チング割算を行うこ′χにより、前記特徴パターンと標
準パターン群とのマツチング計算を減少させて、各カテ
ゴリ毎に複数個の標準パターンと照合することで得られ
る識別率の改善効果を維持しつつ、また、標準パターン
の記憶容量を増すことなく、識別に要する時間を短縮す
ることができ、その実用的効果は大きい。
丑だ、本発明のパターン認識装置は、代表標準パターン
記1足部、前照合計算部、前照合部、ゲート部を設ける
ことにより、各カテゴリ毎の複数個の標準パターンのう
ち、先ず、それらを代表する各カテゴリ毎1つの代表標
準パターンと入力信号の特徴パターンとのマツチング刷
算を行い、?Uられた結果(両者間の距離)の最小値が
予め定めた閾値よりも小さければ、最小値を与える代表
標準パターンに対応するカテゴリを識別して以降の計算
を打切り、得られた最小値が前記閾値よりも太きいか等
しい場合には、入力信号の特徴パターンと代表標準パタ
ーンとの距離が近いもの数個について、それぞれ該当す
る候補カテゴリを予め選択し、そノ′シらに対応する標
準パターン群とのマツチング計算を行うことにより、前
記特徴パターンと標準パターン群とのマツチング計算量
を減少させて、各カテゴリ毎に複数個の標準パターンと
照合することで得られる識別率の改善効果を維持しつつ
、また、標準パターンの記憶容量を増すことなく、識別
に要する時間を短縮することができ、その実用的効果は
大きい。
【図面の簡単な説明】
第1図+d従来の音声パターン認識装置の構成を示すブ
ロック図、第2図、第3図はそれぞれ本発明のパターン
認識装置の一実施例の構成を示すブロック図及びフロー
チャート、第4図、第5図はそれぞれ本発明のパターン
認識装置の他の実施例の構成を示すブロック図及びフロ
ーチャートである0 11・・・・・14′ii徴抽出物、12・・・・・・
代表標準パターン記憶部、13・・・・−・標準パター
ン記憶部、14・・・・・・前照合計算部、15・・・
・・・前照合部、16・・・・・・計算部、17・・・
・・・平均部、18・・・・・・識別部、19・・・−
・・ゲート部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第3
図 憾鉢考− <eH諭9

Claims (1)

    【特許請求の範囲】
  1. (1)入力信号を特徴パターンの時系列Ai(i =1
    .2.・・・・・・t’)に変換する特徴抽出手段と、
    1力テゴリm(m=1 、2 、・・・・・・、M)に
    対する複数個の標準パターンのうち代表値となる標準パ
    ターンB” (m=1 、2 、・・・・・・、M)を
    記憶する代表標準パターン記憶手段と、各カテゴリ毎の
    複数個の標準パターンのうち前記代表標準パターンを記
    憶する標準パターン記憶手段と、前記特徴パターンA、
    と前記代表標準パターンBm(m= 1゜2、・・・・
    ・・、M)とのマツチング計算を行う前照合計算手段と
    、前照合計算の結果得られる前記特徴パターンA、と前
    記代表標準パターンBm(m−11,2,・・・・・、
    M)との距離の小さいものから順次1個(i〉2)の該
    当するカテゴリコードと付帯する距離を出力する前照合
    手段と、前記標準パターン記憶手段で記憶されている標
    準ノ(ターン群のうち、前記前照合手段から出力された
    複数個のカテゴリコードに対応した標準・くターン群の
    みと前記特徴パターン八〇とのマツチング計算を行う計
    算手段と、前記前照合手段で得られた複数個のカテゴリ
    コードについて、各カテコ゛り毎に、前記計算手段で得
    られた前記標準・くターン群B、’: (n−1,2,
    ・・・・・・、N)と前記特徴パターンAiとの距離及
    び前記前照合計算手段で得られた代表標準パターンデと
    前記特徴パターンAiとの距離のうち距離の小さいもの
    に個の平均を求める平均手段と、前記平均手段で得られ
    た結果に基づいて前記特徴パターンに最も近い代表標準
    ノくターン及び標準パターン群に該当するカテゴリコー
    ドを出力する#l##4識別手1を備えたことを特、徴
    とするパターン認識装置。 (功 入力信号を特徴パターン時系列A、(i=12、
    ・・・−・、I)に変換する特徴抽出手段と、1力テゴ
    lJm (m==1 、2 、・・・・・・、M)に対
    する複数個の標準パターンのうち代表値となる標準ノく
    ター7Bm(m=1.2 、・・・・・・、M)を記憶
    する代表標準パターン記憶手段と、各カテゴリ毎の複数
    個の標準パターンのうち前記代表標準パターンB0憶す
    る標準パターン記憶手段と、前記特徴パタ一ンへと前ム
    己代表標準パターンB” (m= 1 、2゜9.、、
    、M)とのマツチング計算を行う前照合計算手段と、前
    照合計算の結果得られる前記特徴パターンA□と前記代
    表標準パターンBm(m==1 。 2、・・・・・、M)との距離のうち最小のものと予め
    定められた距離の閾値を比較し、最小距離が閾値よりも
    小さい場合は最小距離を与える代表標準パターンの該当
    するカテゴリコードのみを出力し、最小距離が閾値より
    も大きい場合は、距離の小さいものから順次j個(j>
    2)の該当するカテゴリコ・−ドと付帯する距離を出力
    する前照合手段と、前記前照合手段の出力が1つのカテ
    ゴリコードのみの場合はカテゴリコードをそのまま識別
    結果として出力し、複数個のカテゴリコードと付帯する
    距離の場合は前記標準パターン記憶手段に記憶されてい
    る標準パターン群と前記特徴パターンとのマツチング計
    算を行わビる為の信号を出力するゲート手段と、前記ゲ
    ート手段より信号が入力された場合のみ、前記標準パタ
    ーン記憶手段で記憶されている標準パターン群のうち、
    前記前照合手段から出力された複数個のカテゴリコード
    に対応した標準パターン群のみと前記特徴パターン八□
    とのマツチング計算を行う計算手段と、前記前照合手段
    で得られた複数個のカテゴリコー ドについて、各カテ
    ゴリ毎に、前記計算手段で得られた前記標準パターン群
    Bm (n= 1 、2.・・・・・、N)と前記特徴
    パターンA、との距離及び前記前照合計算手段で得られ
    た代表標準パターンBmと前記特徴パターン八〇との距
    離のうち距離の小さいもの1(個の平均を求める平均手
    段と、前記平均手段で得られた結果に基づいて前記特徴
    パターンに最も近い代表標準パターン及び標準パターン
    群に該当すし るカテゴリコードを出力する撫捌#j識別手段を備えた
    ことを特徴とするパターン認識装置。
JP58091122A 1983-05-23 1983-05-23 パタ−ン認識装置 Granted JPS59216284A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP58091122A JPS59216284A (ja) 1983-05-23 1983-05-23 パタ−ン認識装置
US06/611,734 US4715004A (en) 1983-05-23 1984-05-18 Pattern recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58091122A JPS59216284A (ja) 1983-05-23 1983-05-23 パタ−ン認識装置

Publications (2)

Publication Number Publication Date
JPS59216284A true JPS59216284A (ja) 1984-12-06
JPH0449717B2 JPH0449717B2 (ja) 1992-08-12

Family

ID=14017718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58091122A Granted JPS59216284A (ja) 1983-05-23 1983-05-23 パタ−ン認識装置

Country Status (2)

Country Link
US (1) US4715004A (ja)
JP (1) JPS59216284A (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1245363A (en) * 1985-03-20 1988-11-22 Tetsu Taguchi Pattern matching vocoder
JPH0738114B2 (ja) * 1985-07-03 1995-04-26 日本電気株式会社 フオルマント型パタンマツチングボコ−ダ
US5774851A (en) * 1985-08-15 1998-06-30 Canon Kabushiki Kaisha Speech recognition apparatus utilizing utterance length information
US4941178A (en) * 1986-04-01 1990-07-10 Gte Laboratories Incorporated Speech recognition using preclassification and spectral normalization
JPH0760318B2 (ja) * 1986-09-29 1995-06-28 株式会社東芝 連続音声認識方式
JPS6391699A (ja) * 1986-10-03 1988-04-22 株式会社リコー 音声認識方式
US4998280A (en) * 1986-12-12 1991-03-05 Hitachi, Ltd. Speech recognition apparatus capable of discriminating between similar acoustic features of speech
JP2815579B2 (ja) * 1987-03-10 1998-10-27 富士通株式会社 音声認識における単語候補削減装置
US5027408A (en) * 1987-04-09 1991-06-25 Kroeker John P Speech-recognition circuitry employing phoneme estimation
US5146503A (en) * 1987-08-28 1992-09-08 British Telecommunications Public Limited Company Speech recognition
US5140668A (en) * 1987-11-10 1992-08-18 Nec Corporation Phoneme recognition utilizing relative positions of reference phoneme patterns and input vectors in a feature space
US5159637A (en) * 1988-07-27 1992-10-27 Fujitsu Limited Speech word recognizing apparatus using information indicative of the relative significance of speech features
US5179624A (en) * 1988-09-07 1993-01-12 Hitachi, Ltd. Speech recognition apparatus using neural network and fuzzy logic
JP2764277B2 (ja) * 1988-09-07 1998-06-11 株式会社日立製作所 音声認識装置
JPH02232696A (ja) * 1989-03-06 1990-09-14 Toshiba Corp 音声認識装置
US5168524A (en) * 1989-08-17 1992-12-01 Eliza Corporation Speech-recognition circuitry employing nonlinear processing, speech element modeling and phoneme estimation
US5136654A (en) * 1989-10-19 1992-08-04 Kurzweil Applied Intelligence, Inc. Vocabulary partitioned speech recognition apparatus
US5369727A (en) * 1991-05-16 1994-11-29 Matsushita Electric Industrial Co., Ltd. Method of speech recognition with correlation of similarities
FR2689292A1 (fr) * 1992-03-27 1993-10-01 Lorraine Laminage Procédé et système de reconnaissance vocale à réseau neuronal.
US5386492A (en) * 1992-06-29 1995-01-31 Kurzweil Applied Intelligence, Inc. Speech recognition system utilizing vocabulary model preselection
US5682464A (en) * 1992-06-29 1997-10-28 Kurzweil Applied Intelligence, Inc. Word model candidate preselection for speech recognition using precomputed matrix of thresholded distance values
US5522011A (en) * 1993-09-27 1996-05-28 International Business Machines Corporation Speech coding apparatus and method using classification rules
US6208959B1 (en) 1997-12-15 2001-03-27 Telefonaktibolaget Lm Ericsson (Publ) Mapping of digital data symbols onto one or more formant frequencies for transmission over a coded voice channel
US20040166936A1 (en) * 2003-02-26 2004-08-26 Rothschild Wayne H. Gaming machine system having an acoustic-sensing mechanism
US7618323B2 (en) * 2003-02-26 2009-11-17 Wms Gaming Inc. Gaming machine system having a gesture-sensing mechanism
US8280169B2 (en) 2005-12-21 2012-10-02 Michael Linderman Recordation of handwriting and hand movement using electromyography
US8062115B2 (en) 2006-04-27 2011-11-22 Wms Gaming Inc. Wagering game with multi-point gesture sensing device
US8959459B2 (en) 2011-06-15 2015-02-17 Wms Gaming Inc. Gesture sensing enhancement system for a wagering game
US9086732B2 (en) 2012-05-03 2015-07-21 Wms Gaming Inc. Gesture fusion

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU7529981A (en) * 1980-09-19 1982-03-25 Hitachi Limited Language analysis by pattern recognition
JPS5844500A (ja) * 1981-09-11 1983-03-15 シャープ株式会社 音声認識方式

Also Published As

Publication number Publication date
JPH0449717B2 (ja) 1992-08-12
US4715004A (en) 1987-12-22

Similar Documents

Publication Publication Date Title
JPS59216284A (ja) パタ−ン認識装置
Das et al. Urban sound classification using convolutional neural network and long short term memory based on multiple features
EP0504485A2 (en) A speaker-independent label coding apparatus
US5794190A (en) Speech pattern recognition using pattern recognizers and classifiers
JPS59121100A (ja) 連続音声認識装置
CA2304747C (en) Pattern recognition using multiple reference models
CN111400540A (zh) 一种基于挤压和激励残差网络的歌声检测方法
Boelders et al. Detection of mild dyspnea from pairs of speech recordings
Karthikeyan et al. Hybrid machine learning classification scheme for speaker identification
Mansour et al. Voice recognition Using back propagation algorithm in neural networks
Zhu et al. Emotion recognition from speech to improve human-robot interaction
JPH02165388A (ja) パターン認識方式
Hussain et al. An improved acoustic scene classification method using convolutional neural networks (CNNs)
Choi et al. Short-utterance embedding enhancement method based on time series forecasting technique for text-independent speaker verification
Sas et al. Gender recognition using neural networks and ASR techniques
KR101233296B1 (ko) 가중치 합을 이용한 거리 함수 생성 방법 및 시스템
JP3098157B2 (ja) 話者照合方法及び装置
JP2991288B2 (ja) 話者認識装置
Patel et al. A Performance Study: Convolutional Deep Belief Networks and Convolutional Neural Networks for Audio Classification
JPH08123460A (ja) 探索方法および音声認識装置
Upadhyay et al. Analysis of different classifier using feature extraction in speaker identification and verification under adverse acoustic condition for different scenario
JPH01185599A (ja) 音声認識装置
JPS6336678B2 (ja)
JP2602271B2 (ja) 連続音声中の子音識別方式
JPS6093579A (ja) パタ−ン認識装置