JPH0223876B2 - - Google Patents

Info

Publication number
JPH0223876B2
JPH0223876B2 JP54045728A JP4572879A JPH0223876B2 JP H0223876 B2 JPH0223876 B2 JP H0223876B2 JP 54045728 A JP54045728 A JP 54045728A JP 4572879 A JP4572879 A JP 4572879A JP H0223876 B2 JPH0223876 B2 JP H0223876B2
Authority
JP
Japan
Prior art keywords
similarity
calculates
calculation
pattern
change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP54045728A
Other languages
English (en)
Other versions
JPS55138181A (en
Inventor
Kazunaga Yoshida
Shigemi Chiba
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP4572879A priority Critical patent/JPS55138181A/ja
Publication of JPS55138181A publication Critical patent/JPS55138181A/ja
Publication of JPH0223876B2 publication Critical patent/JPH0223876B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は音声のように特徴ベクトルの時系列と
して表現される2個のパタンを比較し、その類似
性を評価する尺度(以下類似度という)を計算す
る装置の改良に関する。
本発明の適用範囲は音声パタンの認識に限定さ
れるものではないが、以下では代表的な場合とし
て音声パタンの認識を例に挙げて説明する。
単語単位で音声パタン認識を行なう方法は比較
的簡単でしかも調音結合等の問題が回避できるの
で、音声認識の実用的な一手段と考えられてい
る。しかし同一単語が同一人によつて発声されて
もその発声速度は一様でなく、その単語を構成す
る各音韻はそれぞれ伸縮し全体としての時間軸は
非線形で複雑な変動を示す。このため、このよう
な非線形な伸縮を正規化して比較処理を行なう必
要があり各種の方式が考案されている。
これらの中で動的計画法を利用した時間正規化
マツチング法(以下DPマツチング法と称す)は
比較的簡単でありながら非常に有効な方法となつ
ている(参照日本音響学会誌1971年9月号Vol.27
No.9P483〜487、以下引用文献(1)と称す)。この方
法は時間軸の変動を単調増加で連続な非線形関数
(以下時間正規化関数と称す)で近似することに
よつてモデル化し、入力パタンと標準パタンを最
大に相似させる非線形関数を求めて正規化し、発
声速度に関して正規化された類似度を得るもので
ある。
しかし、このようなDPマツチング法では、各
時間点の特徴ごとの類似度によつて時間正規化関
数が決定されるため、相当に非現実的な時間軸の
変形をも許してしまつている。これを防ぐ方法と
しては時間軸整合窓を設ける方法(引用文献(1))、
傾斜制限を設ける方法(特願昭49−2418、号明細
書以下引用文献(2)と称す)などが提案されてい
る。一般に、発声される単語中においては、子音
部における時間軸の伸縮量は小さく、母音部にお
いては大きい。また、子音部においては、時間軸
伸縮の絶対量は小さいが、特徴の時間フレーム間
の変化量は大きい。時間軸の非現実的な変形の防
止を時間軸の変形量を限定することによつて実現
するのでは音韻間の対応を正しく行なうことは困
難であり、DPマツチング法による時間軸正規化
能力を十分に発揮できないおそれがある。一方、
特徴の変化速度によつて区別される音韻対がある
が、DPマツチング法ではこの変化速度の違いに
よるそれら音韻間を区別することはむずかしい。
本発明は時間軸正規化精度を高めて精密な音韻
間対応を実現すること、一般のDPマツチング法
では困難である変化速度によつて区別される音韻
対間の区別を可能とすること、などにより紛らわ
しい2単語間の区別を容易にすることを目的とす
る。
次に本発明によるパタン間類似度計算装置の構
成を述べるに先だつてその動作原理を説明する。
一般に、音声パタンは特徴ベクトルの時系列とし
て表現される。
いま、 入力パタン A=〓1、〓2、…、〓i、…、〓I 標準パタン B=〓1、〓2…、〓j、…、〓J
………(1) なる2個の音声パタンを考える。
ここに、 〓i=(a1i、a2i、…、aoi、…aNi) ………(2) は音声の時間点iにおける特徴を示すベクトルで
あり、aoiとしては、一例としてNチヤネルの周
波数分析器の出力を考えることができる。
この2パターンA,Bの間の類似度を計算する
問題を考える。一般に、時間軸は非線形で複雑な
変動を示しているので、両パタン間の時間軸変動
を整合して比較する必要がある。文献(1)で述べら
れているようなDPマツチング法を用いることに
より、時間点i,jの対応を与える時間正規化関
数を最適に決定することができる。特徴ベクトル
i、〓j間の類似度として、文献(2)では d1(i,j)=〓〓〓〔aoi−boj〕 ………(3) なる値を用いている。本発明においては特徴ベク
トルの変化量間の類似度 d2(i,j)=〓〓〓〔aoi/aoi-1−boj/boj-1〕………(4) と前記(3)の式d1との荷重和 d(i,j)=kd1(i,j)+d2(i,j) ………(5) なる値をベクトル間類似度のかわりに用いること
を特徴としている。
(5)式中の荷重kの値を変化することにより特徴
ベクトル間の類似度と変化量間の類似度の間の荷
重比を変化させることができる。
このd(i,j)を用いてDPマツチングを行なう。す
なわち、初期値 g(1,1)=d(1,1) ………(6) のもとに、積分量g(i,j)に関する漸化式 g(i,j)=min〔g(i,j-1)+d(i,j) g(i-1,j-1)+2・d(i,j) g(i-1,j)+d(i,j)〕 …………(7) を、 1iI1jJj-rij+r ………(8) なる条件のもとで解き、その結果得られる積分量
g(i,j)によつてパタン間類似度 S(A,B)=g(i,j)I+J ………(9) を求める。
一例として、パタンA,Bがともに数字“1”
(/it∫i/)の音声である場合を考える。第1図
において横軸は入力パタンAの時間軸i、縦軸は
標準パタンBの時間軸jを示す。第1図に示すご
とく各音韻、特に母音/i/の部分の時間軸の伸
縮量は大きい。この伸縮を考慮して、パタンA,
Bの時間点i,j間を最適に整合させる時間正規
化関数10を決定する。パタンA,Bの各変化量
は、第1図に参照数字11,12で示すごとき曲
線となる。このように一般に音韻の変化する点に
おいて変化量は極大、極小点をとる。それゆえ
に、この近傍における変化量を考慮することによ
り、音韻が変化する部分どうしを正確に整合させ
ることができる。また、特徴ベクトル間変化量の
値も類似度評価に加えられるので特徴量の変化速
度により区別される音韻間を区別することができ
る。このように本発明は、DPマツチング法の時
間正規化アルゴリズムに、特徴ベクトルの変化量
を評価する機能を付加することにより、パタン間
類似度の計算精度を高めたものである。
(3)式では類似度の評価尺度として距離を用いた
が、その他の評価尺度(たとえば内積)を用いて
もよい。また(4)式では変化量として比の値を用い
たが、差分(aoi−aoi-1)を用いてもよい。また、
(6)、(7)、(8)式に示した漸化式はこの他のもの、た
とえば文献(2)に示されているような式を用いるこ
ともできる。
本発明によるパタン間類似度計算装置の構成
は、特徴ベクトル〓iの時系列として表現される
入力パタンAを保持するための入力パタンバツフ
アと、特徴量〓jの時系列として表現される標準
パタンBを記憶するための標準パタンメモリー
と、あらかじめ定められた順序により時系列上で
相となる特徴量〓iと〓i-1および〓jと〓j-1の間の
変化量を計算する変化量計算部と、該変化量間の
距離の尺度による類似度d2(i,j)を計算する類似度計
算部1と、該順序により指定された特徴量〓i
j間の類似度d1(i,j)を計算する類似度計算部2と、
該類似度の荷重和を計算し類似度d(i,j)を求める類
似度加算部と、類似度d(i,j)をもとに計算した積分
量g(i,j)を少なくとも必要個数保持するための演算
レジスタと、類似度加算部よりの出力d(i,j)と、演
算レジスタ内の積分量g(n,o)〔m≦i、n≦j〕等
の荷重和を複数個計算しその最小値(または最大
値)を積分量g(i,j)として求める漸化式計算部より
成る。
本発明について図面を用いて説明する。
第2図は本発明のパターン間類似度計算装置の
一実施例を示すブロツク図である。図において2
1は入力パタンバツフアであり、入力パタンAを
保持する。22は標準パタンメモリであり、標準
パタンBがあらかじめ記憶されている。23は類
似度計算部であり、式(5)で示された〓i、〓j間の
類似度d(i,j)を計算する。24は漸化式計算部であ
り、類似度計算部23の出力dとあらかじめ計算
された積分量gより式(7)で示されたような漸化式
を計算する。25はレジスタ部であり、漸化式の
計算に必要なgの値を保持する。26は正規化部
であり、求められたg(I,J)をフレーム数により正規
化してパタン間類似度S(A、B)を求める。2
7は制御部であり、各部に動作タイミングを与え
る。
第3図は類似度計算部23の回路構成を示すブ
ロツク図。30,31はシフトレジスタであり、
特徴ベクトル〓、〓の次元数Nに等しい段数を持
ち、ベクトルの値を1つ保持する。32,33は
除算回路であり、2入力間の比の値を計算する。
34,35は距離計算回路であり、2入力間の差
の絶対値を計算する。36は定数回路であり、入
力に定数kをかける。37は、加算回路であり、
3入力の和を計算する。38は積分レジスタ回路
であり、距離の値の合計を求めるための中間値を
保持する。また32,33の除算回路、34,3
5の距離計算回路、36の定数回路、37の加算
回路の各演算回路は出力結果を保持する付属ラツ
チ回路をそれぞれ持つ。
次に上記構成をもとに動作を説明する。
まず入力パタンバツフア21にパタンAが入力
され保持される。標準パタンメモリ22にはあら
かじめ標準パタンBが記憶されている。制御部2
7よりの制御信号i,jにしたがつて、パタンA,B
の特徴ベクトル〓i、〓jが順次出力される。類似
度計算部23では〓i、〓j間の類似度d(i,j)が計算
される。この動作を第3図および第4図のタイミ
ングチヤートにしたがつて説明する。なお、第4
図において、斜線部分は計算時間を示す。最初
に、タイミングT0により積分レジスタ38がリ
セツトされる。つづいて、タイミングT1におい
て入力パタンバツフア21から式(2)に示されるベ
クトル〓iの一要素aoiが出力される。これにつづ
くタイミングL1においてシフトレジスタ30が
一段シフトされることにより前記ao,iがシフトレ
ジスタ30の最前段に書きこまれ、N段まえの
値、すなわちao,i-1が最後段より出力される。そ
れゆえ、この時点では除算回路32にはベクトル
iの一要素aoiとベクトル〓i-1の一要素ao,i-1が与
えられることになる。これらの値により除算回路
32では変化量ao,1/ao,i-1がタイミングT2にて計
算され、結果がタイミングL2にて付属ラツチ回
路に保持される。同様にベクトル〓jの一要素bo,j
に関してもaoiと同じタイミングでシフトレジス
タ31と除算回路33によつて変化量boj/boj-1
が計算される。距離計算回路32ではタイミング
T3において前記の2変化量aoi/aoi-1とboj/boj-1
の距離が計算されタイミングL3にて付属ラツチ
回路に保持される。また距離計算回路35におい
ては信号線aとbからそれぞれ与えられる前記
aoiとbojの距離がタイミングT4にて計算され、タ
イミングL4で付属ラツチ回路に保持される。さ
らに定数回路36においてタイミングT5にて距
離計算回路35からの出力に定数kがかけられタ
イミングL5で結果が保持される。加算回路37
ではタイミングT6にて積分レジスタ38の出力
と、距離計算回路34の出力と、定数回路36の
出力が加算され結果がタイミングL6で付属ラツ
チ回路に保持される。この出力結果は積分レジス
タ38にタイミングL7で保持される。このよう
な動作を順次、式(2)におけるnの値をn=1、
2、…、Nと変化させ行なうことにより、結果と
して積分レジスタには式5に示す〓i、〓j間の類
似度d(i,j)が保持される。ベクトル〓iと〓j間の類
似度d(i,j)の計算がおわると、第2図における類似
度計算部23より漸化式計算部24に類似度d(i,j)
が出力される。
漸化式計算部24では、前記類似度d(i,j)と、レ
ジスタ部25に保持されている積分量g(i,j-1)
g(i-1,j-1)、g(i-1,j)とを入力して式(7)の漸化式が計

され、その計算結果g(i,j)がレジスタ部25に保持
される。レジスタ部25には少なくとも漸近式計
算に必要なだけのgの値が保持される。この漸化
式計算は制御部27よりの制御信号tw、trにし
たがつて行なわれるが、これらの動作に関しては
一般のDPマツチング法によるパタンマツチング
装置と共通であるので詳しい説明は省略する。一
例として時間点(i,j)の値を(1、1)、(2、1)、
…、(i、1)、…、(I、1)、(1、2)、(2、
2)、…、(I、2)、…、(1、j)、(2、j)、
…、(I、j)、…、(I、j)と変化させること
によりg(I、J)を求めることができる。
漸化式計算部24により求められたg(I、J)
に対して正規化部26では(9)式のごとくフレーム
数の和で除することにより正規化してパタン間類
似度Sが求められる。
以上本発明の原理を簡単な実施例を用いて説明
したが、式および回路形態はこの例に限定される
ものではない。
又、音声パターンの認識を例に今迄説明したが
これに限ることなく、文字、図形、あるいは指紋
等のパターン認識にも適用できることは云うまで
もない。
【図面の簡単な説明】
第1図は音声パタンの時間軸正規化の原理図、
第2図は本発明の一実施例を示すブロツク図、第
3図は第2図の類似度計算部の一実施例を示すブ
ロツク図、第4図は第3図に示す回路を動作させ
る信号の発生時刻の例を示す波形図である。 図において、10はパターンAとパターンBの
時間軸正規化関数、11,12はパターンA,B
の変化量を示す曲線、13は音韻の変化点を示
す、21は入力パターンバツフア、22は標準パ
タンメモリ、23は類似度計算部、24は漸化式
計算部、25はレジスタ部、26は正規化部、3
0,31はシフトレジスタ、32,33は除算回
路、34,35は距離計算回路、36は定数回
路、37は加算回路、38は積分レジスタをそれ
ぞれ示す。

Claims (1)

  1. 【特許請求の範囲】 1 特徴量〓iの時系列として表現される入力パ
    タンAを保持するための入力パタンバツフアと、
    特徴量〓jの系列として表現される標準パタンB
    を記憶するための標準パタンメモリと、あらかじ
    め定められた順序により、時系列上で相隣る特徴
    量〓iと〓i-1および〓jと〓j-1の間の変化量を計算
    する変化量計算部と、該変化量間の距離等の尺度
    による類似度d2(i,j)を計算する類似度計算部1と、
    該順序により指定された特徴量〓iと〓j間の類似
    度d1(i,j)を計算する類似度計算部2と、該類似度の
    荷重和を計算し2特徴量〓i、〓j間の類似度d(i,j)
    を求める類似度加算部と、類似度dをもとに計算
    した積分量g(i,j)を少なくとも必要個数保持するた
    めの演算レジスタと、該類似度加算部よりの出力
    d(i,j)と該演算レジスタ内の積分量g(n,o)〔m≦i、
    n≦j〕等の荷重和を複数個計算しその最小値
    (または最大値)を積分量g(i,j)として求める漸化
    式計算部とを有して成ることを特徴とするパタン
    間類似度計算装置。
JP4572879A 1979-04-13 1979-04-13 Inter-pattern similarity calculator Granted JPS55138181A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4572879A JPS55138181A (en) 1979-04-13 1979-04-13 Inter-pattern similarity calculator

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4572879A JPS55138181A (en) 1979-04-13 1979-04-13 Inter-pattern similarity calculator

Publications (2)

Publication Number Publication Date
JPS55138181A JPS55138181A (en) 1980-10-28
JPH0223876B2 true JPH0223876B2 (ja) 1990-05-25

Family

ID=12727373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4572879A Granted JPS55138181A (en) 1979-04-13 1979-04-13 Inter-pattern similarity calculator

Country Status (1)

Country Link
JP (1) JPS55138181A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0316112A3 (en) * 1987-11-05 1989-05-31 AT&T Corp. Use of instantaneous and transitional spectral information in speech recognizers
JP5903912B2 (ja) * 2012-02-02 2016-04-13 富士通株式会社 算出装置、算出方法、および算出プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5242006A (en) * 1975-09-29 1977-04-01 Fujitsu Ltd Recognition system with non-linear matching

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5242006A (en) * 1975-09-29 1977-04-01 Fujitsu Ltd Recognition system with non-linear matching

Also Published As

Publication number Publication date
JPS55138181A (en) 1980-10-28

Similar Documents

Publication Publication Date Title
JPH0159600B2 (ja)
JPH0157358B2 (ja)
US4901352A (en) Pattern matching method using restricted matching paths and apparatus therefor
US4802226A (en) Pattern matching apparatus
JPH0223876B2 (ja)
JP2964881B2 (ja) 音声認識装置
US4794645A (en) Continuous speech recognition apparatus
JP3348735B2 (ja) パターン照合方式
JPS59161782A (ja) パタ−ン・マツチング方法
JP2002244697A (ja) 音声認証装置、音声認証方法、及びプログラム
JPH0436400B2 (ja)
JPS60164800A (ja) 音声認識装置
JPH0320759B2 (ja)
JPS58224394A (ja) 連続単語音声認識装置
JPH03201027A (ja) 学習を用いた動的計画法
JPS592954B2 (ja) パタンルイジドケイサンソウチ
JPH0638198B2 (ja) 連続音声認識装置
JPS60160489A (ja) パタン認識における標準パタン作成方式
JPS61107398A (ja) 音声認識装置
JPH0199098A (ja) パターン比較装置
JPH03253900A (ja) 音声認識装置
JPH0594198A (ja) 音声認識方法及び装置
JPS62247399A (ja) 音声認識方式
JPS63236094A (ja) 音声認識方法
JPS6283798A (ja) 連続音声認識装置