JPS6024994B2 - パタ−ン類似度計算方式 - Google Patents

パタ−ン類似度計算方式

Info

Publication number
JPS6024994B2
JPS6024994B2 JP55053322A JP5332280A JPS6024994B2 JP S6024994 B2 JPS6024994 B2 JP S6024994B2 JP 55053322 A JP55053322 A JP 55053322A JP 5332280 A JP5332280 A JP 5332280A JP S6024994 B2 JPS6024994 B2 JP S6024994B2
Authority
JP
Japan
Prior art keywords
vector
pattern
stage
similarity
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55053322A
Other languages
English (en)
Other versions
JPS56149677A (en
Inventor
厚夫 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP55053322A priority Critical patent/JPS6024994B2/ja
Priority to US06/255,497 priority patent/US4446531A/en
Publication of JPS56149677A publication Critical patent/JPS56149677A/ja
Publication of JPS6024994B2 publication Critical patent/JPS6024994B2/ja
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Acoustics & Sound (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 本発明は特徴ベクトルの系列で表わされる2個のパター
ンを比較して、これ等パターン間の類似度を計算する計
算方式に関する。
最近音声に関する合成或いは認識等の技術が著しい進歩
をとげ、各種の電子機器に音声機能を付加することが試
みられている。
特にこのような音声分野の技術では、入力された音声信
号を認識する際に、入力音声から形成される特徴ベクト
ルのパターンと、予め登録されている標準パターンとの
間でパターン間の比較が実行され、その比較結果に基い
て入力信号の認識が行われる。この種のパターン間の比
較は、従来から動的計画法を用いた時間軸伸縮マッチン
グによる方法が探られている。このような時間麹伸縮を
行なって類似度を最大にするようなパターンマッチング
では、類似度を尺度として特徴ベクトルの付加或いは除
去を行なってパターンを変更しながらマッチングをとっ
ていると看倣することができる。しかしながら、特徴ベ
クトルの並べ変えによって対応づけられたパターン間の
特徴ベクトル同志には、依然として各々が抽出された時
間位置のばらつきや発声毎の変動による特徴ベクトルの
変動がある。
このような変動は同じカテゴリのパターン同志のマッチ
ングでも大きくなることがあり、誤認議の原因になって
いた。本発明は上記従来のパターン類似度の比較方式に
おける問題点に鑑みてなされたもので、入力パターンの
ベクトルの代りに推定ベクトルを用いることによって従
来方式の変動成分を軽減した計算方式を提供する。
2個のパターンを比較する例として、標準パターンとし
て与えられる特徴ベクトルの時系列a,,a2,・・・
・・・an(以下肉太の文字はベクトルを表わす)から
なるパターンAと、特徴ベクトルの時系列q,b2・・
・・・・bmからなる入力パターンBとの間の対応づけ
を選んで類似度を計算するものとする。
今第i十1段階の特徴ベクトルal+,は、対角行列r
iを用いると1段階前の特徴ベクトルaiを用いてal
+,=riai と表わすことができる。
即ち特徴ベクトルal十,の各要素を特徴ベクトルai
の各要素で割った値がriの対角要素になっている。一
方パターンBについて、第i段階で得られた推定ベクト
ルbの各要素に、上記特徴ベクトルa…を求める際に得
られた対角行列riを乗じて得られるベクトルをbとす
ると、ベクトルbはribで表わすことができる。
ここで推定ベクトルbとして上記ベクトルbを用いた場
合、後述する本発明の計算方式でパターンBの特徴ベク
トルbj(パターンAの特徴ベクトルaMと対応づけら
れたもの)に掛ける係数値を全て“0”にし、ベクトル
bに掛ける係数値を全て“1”にした場合に相当するが
、この場合には、推定ベクトルbはbの初期値とパター
ンAのベクトル系列の変化の仕方のみに依存し、推定ベ
クトルbにはパターンBが反映されない。
そのため推定ベクトルbを求める際の初期値によっては
、同じカテゴリのパターン間の場合でも推定ベクトルb
は両パターンA及びBの特徴ベクトルとは大変異なった
ものになる幌れがある。このような不都合を避けるため
には、推定ベクトルbとしてベクトルbのみならず、パ
ターンBも参照する必要がある。処で、パターンBを参
照する際には、推定ベクトルbを求める場合のベクトル
bと特徴ベクトルbjの重み付けに大きく影響され、重
み付けの仕方が問題になる。
重み付けの係数を各要素に依らず一定とした場合には、
推定ベクトルbはベクトルbと特徴ベクトルbjの単な
る線形結合となり、本発明を単純化した場合になる。尚
、実際の計算過程では、ベクトルbに対する重み付け係
数と特徴ベクトルbjに対する重み付け係数は互いに関
連があるとして、一方から他方を求めることができる。
ベクトルbと特徴ベクトルbjに掛けられる重み付け係
数を与える方法としては、次のような2通りがある。
第1は、マッチングを行なう一方のパターンに関する予
め重み付け係数を求めて記憶させておき、パターン内の
各段階で対応する係数を読み出してくる方法であり、第
2はパ夕−ン内の各段階で重み付け係数を求めてゆく方
法である。次にまず前者の方法に依った実施例を挙げて
本発明を詳細に説明し、続いて後者の方法によった本発
明を説明する。
本発明では全てベクトルの各要素毎に行なうことができ
、演算では各要素を並列に処理することができる。
第1図は、予め記憶された重み付け係数を各段階毎に読
み出して推定ベクトルbを求めてゆく方法での実施例を
示す。
図に於て制御部19は、パターンAとパターンBの間の
特徴ベクトルの対応づけに従ってパターン記憶部1及び
2からベクトル保持部3,4及び5への夫々特徴ベクト
ルを送り出す指令を出し、各処理のタイミングを制御し
て信号の入出力を効果的に行わせる。
標準ベクトルAを記憶する記憶部1は、第i+1段階の
計算処理にあたって制御部19から指定された特徴ベク
トルaiを読み出してベクトル保持部3へ、特徴ベクト
ルaMを読み出してベクトル保持部4へ夫々転送する。
同様に入力パターン記憶部2は制御部19からの指定に
より、特徴ベクトルbjが読み出されて入力ベクトル保
持部5へ転送する。該特徴ベクトルbjは、入力パター
ンBを標準パターンAに例えば比例関係や、類似度を尺
度に非線形な時間軸伸縮により予め対応づけることによ
って、特徴ベクトルai十,に対応づけて得られるベク
トルである。除算部11は読み出された特徴ベクトルa
iとa…の各要素毎の比を求め、その演算結果ri=a
…/aiは保持部12へ送られて保持される。重み付け
係数記憶部6はパターンBの特徴ベクトルbjに対する
重み付け係数の値を記憶しており、制御部19の指示に
従って各段階で重み付け係数値の絹を係数値保持部8へ
送り出す。同様に重み付け係数記憶部7はベクトルbに
対する重み付け係数値の組を係数値保持部9に送り出す
。乗算部1川まベクトル保持部5に収納されている特徴
ベクトルbjの各要素の値に係数値保持部8の重み付け
係数値を要素毎に菜算して、その乗算結果を演算レジス
ター8に与える。ベクトル記憶部22はパターンBの推
定ベクトルbを得るための初期値を記憶しており、該記
憶された値は初期段階において制御部19の指示に従っ
てベクトル保持部23へ読み出される。初期段階でない
場合には、後述する加算部17から出力された推定ベク
トルbが演算レジスタ24を介してベクトル保持部23
へ読み出される。乗算部13は保持部12と保持部23
で保持されている各値を秦算して結果を保持部14へ送
る。従って、該保持部14の内容は、第i段階で得られ
た推定ベクトルbの各要素に、特徴ベクトルaMの各要
素をaiの各要素で割った対角列「iを乗算器13で演
算したb(=rib)が収納されていることになる。該
ベクトルbは係数値保持部9に保持されている重み付け
係数値と乗算部15で乗算され、その結果は演算レジス
タ16へ送られる。該演算レジスタ16にはベクトルb
が重み付けられた値として収納される。一方上記演算レ
ジスター8には特徴ベクトルbjが重み付けられた値と
して収納されており、両演算レジスター6及び18の内
容は加算部17で加算され、第i十1段階の推定ベクト
ルbとして演算レジスタ24で保持される。即ち、類似
度を計算する際の入力パターンのベクトルの代りになる
推定ベクトルbが得られる。距離計算部20は保持部2
3で保持されている入力パターンBの推定ベクトルbと
保持部4で保持されている標準パターンAの特徴ベクト
ルai十,を用いて距離を計算し、その計算結果を類似
度計算部21へ出力する。
距離としては、例えばlb−ai十.lやlb−ai十
,l2等が用いられる。
類似度計算部21は各段階で得られた距離に基いて類似
度を計算し、パターンAとパターンBの間の類似度とし
て、計算結果が次段に設けられた判定部へ制御部19の
指示により出力される。即ち、標準パターンAの特徴ベ
クトルaMに対して、入力パターンBから得られる特徴
ベクトルbjを直ちに利用して類似度を求めることなく
推定ベクトルを用いて類似度を計算する。
その結果特徴ベクトルの変動成分は著しく軽減され、マ
ッチング特性の良好な類似度計算を行うことができる。
次に第2図を用いてパターン内の各段階毎に重み付け係
数値を求めてゆく方式での本発明の実施例を説明する。
本実施例では推定ベクトルbを求めてアルゴリズムをゥ
ィナー型フィル夕のアルゴリズを応用して構成する場合
を説明する。制御部39は、標準パターンAと入力パタ
ーンBの間の特徴ベクトルの対応づけに従って、パター
ンAの各特徴ベクトルに対してパターンBの特徴ベクト
ルを送り出す指令を出し、各処理のタイミングを制御す
る。
標準パターンAを記憶する記憶部21は制御部39から
の指令により、指定された特徴ベクトルa:をベクトル
保持部23へ、特徴ベクトルai+,をベクトル保持部
24へ送る。同様に入力パターン記憶部22は制御部3
9により指定された特徴ベクトルbjを入力ベクトル保
持部25へ出力する。除算部31はパターンAにおける
特徴ベクトルa,とa…の各要素毎の比ri(=ai+
./ai)を求め、その結果を保持部32へ送る。
該保持部32で保持されている値は次段の乗算部33に
与えられ、保持部43で既に保持されている前段階で得
られた推定ベクトルbと乗算されてrib=bが求めら
れ、保持部34で保持される。保持部34に収納されて
いる内容bは制御部39の指令により減算部35及び加
算部45に出力される。ここで入力パターンBのベクト
ルには誤差による変動があるものとし、第i十1段階の
特徴ベクトルbjの第k要素における変動の分散をok
,i+,と表わし、上記対角行列riの第k対角要素y
k,iと表わすとき、減算器35に収納されているbj
−bに対する重み付け係数の第k要素に対する値Qk,
Mはy毒,i。k,iQk,iを8k,iと置き換える
と8k,i/(3刈十。k,i+,)により求められる
。従って重み付け係数。k,i+,の値は、。k,,,
。k,…,yk,i及び前段階で得られた値。k,iを
用いて計算することができる。演算部29は上記計算原
理に基づいて、制御部39からの指令で重み付け係数の
値を演算し、その演算結果を保持部30へ転送する。
重み付け係数の演算において、記憶部26は標準パター
ン毎の設けたパターンのばらつきにより分散の値を記憶
し、その値は制御部39の指令により保持部27を介し
て演算部29に与えられる。一方記憶部28は重み付け
係数の初期値を記憶しており、初期段階では設定されて
いる重み付け係数の初期値が上記演算部29へ読み出さ
れる。切期段階でない場合には、保持部30で保持され
ている前段階での演算結果が演算部29へ読み出される
。推定ベクトルの演算過程において、保持部32の内容
riは制御部39の指令により演算部29又は乗算部3
3へ与えられ、ベクトルb(=「ib)が求められて保
持部34で保持される。該保持部34に収納されたベク
トルbは減算部38に与えられ、ベクトル保持部から読
み出された特徴ベクトルbjとの間でbj−bが計算さ
れ、その計算結果が演算レジスタ36に出力される。続
いて演算レジスタ36に保持されているbj−bは乗算
部37に与えられ、上記係数保持部30で保持されてい
る重み付け係数値との間で乗算これ、重み付けされたベ
クトルが演算レジスタ38で保持される。演算レジスタ
38で保持されている値は加算部45で保持部34の内
容bと加算され、第i+1段階の推定ベクトルbとして
演算レジスタ44で保持される。保持部43は初期段階
では記憶部42で記憶されている推定ベクトルbの初期
値を績み込み、初期段階でなければ保持部44で保持さ
れている推定ベクトルbを読み込むように制御部39に
より指示される。前記実施例と同様に距離計算部40で
は、保持部43で保持されているパターンBの推定ベク
トルbと、保持部24で保持されているパターンAの特
徴ベクトルai+,を用いて距離が計算され、制御部3
9の指令に従って計算結果は類似度計算部41へ出力さ
れる。
該類似度計算部21は各段階で得られた距離に基いて類
似度を計算し、計算結果をパターンAとパターンBの間
の類似度として判定部へ制御部39の指示により出力す
る。以上本発明によれば、特徴ベクトルの系列a,,a
2……anからなるパターンAと特徴ベクトルの系刃岬
,,ら・・・・・・bmからなるパターンBの間で類似
度を計算する方式において、両パターンの対応づけられ
た特徴ベクトルを直ちに比較するものではなく、予めパ
ターンAの第i+1段階と第i段階の各特徴ベクトルに
おける要素から求められる係数を利用してパターンBの
特徴ベクトルを重み付けて推定ベクトルを計算し、該推
定ベクトルを入力ベクトルの代りに用いて類似度を計算
することにより、従来方式に比べてマッチングをとる際
の特徴ベクトルの変動成分を著しく軽減することができ
、効率のよいパターンマッチングを行わせることができ
る。
【図面の簡単な説明】
第1図及び第2図は本発明による計算方式を適用した装
置のブロック図である。 第1図 第2図

Claims (1)

    【特許請求の範囲】
  1. 1 特徴ベクトルの系列a1,a2……anから成るパ
    ターンAと、特徴ベクトルの系列b1,b2……bnか
    ら成るパターンBの間の類似度の計算に於いて、第i+
    1段階において、特徴ベクトルai(i=1,2……n
    −1)とai+1の各要素毎の比を求め、この求めた比
    と前回の第i段階で得られた推定ベクトルbの各要素と
    を乗じてベクトルbを求め、該ベクトルbと特徴ベクト
    ルai+1と対応づけられたパターンBの特徴ベクトル
    bjとで第i+1段階の推定ベクトルbを算出し、該算
    出された上記第i+1段階の推定ベクトルbと特徴ベク
    トルa1+1との間の距離を各段階毎に順次計算し、該
    計算された距離に基いて類似度を計算することを特徴と
    するパターン類似度計算方式。
JP55053322A 1980-04-21 1980-04-21 パタ−ン類似度計算方式 Expired JPS6024994B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP55053322A JPS6024994B2 (ja) 1980-04-21 1980-04-21 パタ−ン類似度計算方式
US06/255,497 US4446531A (en) 1980-04-21 1981-04-20 Computer for calculating the similarity between patterns

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55053322A JPS6024994B2 (ja) 1980-04-21 1980-04-21 パタ−ン類似度計算方式

Publications (2)

Publication Number Publication Date
JPS56149677A JPS56149677A (en) 1981-11-19
JPS6024994B2 true JPS6024994B2 (ja) 1985-06-15

Family

ID=12939476

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55053322A Expired JPS6024994B2 (ja) 1980-04-21 1980-04-21 パタ−ン類似度計算方式

Country Status (2)

Country Link
US (1) US4446531A (ja)
JP (1) JPS6024994B2 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58115490A (ja) * 1981-12-29 1983-07-09 日本電気株式会社 パタン間距離計算装置
JPS58132298A (ja) * 1982-02-01 1983-08-06 日本電気株式会社 窓制限付パタンマツチング装置
JPS5997200A (ja) * 1982-11-26 1984-06-04 株式会社日立製作所 音声認識方式
US4712242A (en) * 1983-04-13 1987-12-08 Texas Instruments Incorporated Speaker-independent word recognizer
US4723290A (en) * 1983-05-16 1988-02-02 Kabushiki Kaisha Toshiba Speech recognition apparatus
US4545025A (en) * 1983-08-16 1985-10-01 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Auto covariance computer
US5131043A (en) * 1983-09-05 1992-07-14 Matsushita Electric Industrial Co., Ltd. Method of and apparatus for speech recognition wherein decisions are made based on phonemes
US4718093A (en) * 1984-03-27 1988-01-05 Exxon Research And Engineering Company Speech recognition method including biased principal components
US4998286A (en) * 1987-02-13 1991-03-05 Olympus Optical Co., Ltd. Correlation operational apparatus for multi-dimensional images
US4905162A (en) * 1987-03-30 1990-02-27 Digital Equipment Corporation Evaluation system for determining analogy and symmetric comparison among objects in model-based computation systems
EP0529744B1 (en) * 1988-05-13 1996-11-06 Canon Kabushiki Kaisha Image processing apparatus
US5321470A (en) * 1988-05-13 1994-06-14 Canon Kabushiki Kaisha Apparatus with anti-forgery provision
JP2991779B2 (ja) * 1990-06-11 1999-12-20 株式会社リコー 文字認識方法及び装置
JPH04194999A (ja) * 1990-11-27 1992-07-14 Sharp Corp 学習を用いた動的計画法
GB2253296B (en) * 1991-02-28 1995-05-24 Toshiba Kk Pattern recognition apparatus
JP3050934B2 (ja) * 1991-03-22 2000-06-12 株式会社東芝 音声認識方式
US5189709A (en) * 1991-08-26 1993-02-23 The United States Of America As Represented By The United States National Aeronautics And Space Administration Dynamic pattern matcher using incomplete data
BE1007355A3 (nl) * 1993-07-26 1995-05-23 Philips Electronics Nv Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling.
US5638465A (en) * 1994-06-14 1997-06-10 Nippon Telegraph And Telephone Corporation Image inspection/recognition method, method of generating reference data for use therein, and apparatuses therefor
US8348736B2 (en) * 2008-04-23 2013-01-08 Aristocrat Technologies Australia Pty Limited Gaming system and method of gaming
US10923111B1 (en) * 2019-03-28 2021-02-16 Amazon Technologies, Inc. Speech detection and speech recognition

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3521235A (en) * 1965-07-08 1970-07-21 Gen Electric Pattern recognition system
US3700815A (en) * 1971-04-20 1972-10-24 Bell Telephone Labor Inc Automatic speaker verification by non-linear time alignment of acoustic parameters
JPS50155105A (ja) * 1974-06-04 1975-12-15
US4059725A (en) * 1975-03-12 1977-11-22 Nippon Electric Company, Ltd. Automatic continuous speech recognition system employing dynamic programming
JPS5529803A (en) * 1978-07-18 1980-03-03 Nippon Electric Co Continuous voice discriminating device
JPS5569880A (en) * 1978-11-22 1980-05-26 Nec Corp Pattern recognition unit

Also Published As

Publication number Publication date
US4446531A (en) 1984-05-01
JPS56149677A (en) 1981-11-19

Similar Documents

Publication Publication Date Title
JPS6024994B2 (ja) パタ−ン類似度計算方式
US5216748A (en) Integrated dynamic programming circuit
US5008941A (en) Method and apparatus for automatically updating estimates of undesirable components of the speech signal in a speech recognition system
JPS5885499A (ja) 連続音声認識装置
US4882756A (en) Pattern matching system using dynamic programming
US4571697A (en) Apparatus for calculating pattern dissimilarity between patterns
JPH067345B2 (ja) ベクトル量子化を用いた音声認識方式
JPS58132298A (ja) 窓制限付パタンマツチング装置
US4901352A (en) Pattern matching method using restricted matching paths and apparatus therefor
WO2022179360A1 (zh) 一种声纹识别方法、装置及计算机可读存储介质
US4608708A (en) Pattern matching system
JPS58115497A (ja) 音声認識方法
JPH01138597A (ja) 連続音声認識方式
EP0749647B1 (en) Method and apparatus for determining a masked threshold
US4750190A (en) Apparatus for using a Leroux-Gueguen algorithm for coding a signal by linear prediction
EP0290190B1 (en) Pattern matching system
GB2059726A (en) Sound synthesizer
CN112036088A (zh) 一种基于多新息随机梯度优化的过热汽温预测方法
JPS63205786A (ja) 複合類似度法によるパタ−ン認識装置
JPH0552517B2 (ja)
JPS638797A (ja) パタン認識方法
JPS58105294A (ja) 信号波形認識方式
JP2518871B2 (ja) パタン比較器
JPH0574836B2 (ja)
JPH01283599A (ja) パタンマツチング装置