JP3348735B2 - パターン照合方式 - Google Patents

パターン照合方式

Info

Publication number
JP3348735B2
JP3348735B2 JP00345093A JP345093A JP3348735B2 JP 3348735 B2 JP3348735 B2 JP 3348735B2 JP 00345093 A JP00345093 A JP 00345093A JP 345093 A JP345093 A JP 345093A JP 3348735 B2 JP3348735 B2 JP 3348735B2
Authority
JP
Japan
Prior art keywords
pattern
sequence
component
feature vector
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP00345093A
Other languages
English (en)
Other versions
JPH06208391A (ja
Inventor
雅秋 田辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP00345093A priority Critical patent/JP3348735B2/ja
Publication of JPH06208391A publication Critical patent/JPH06208391A/ja
Application granted granted Critical
Publication of JP3348735B2 publication Critical patent/JP3348735B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声認識を始めとする
各種認識技術の核となるパターン認識方式に関する。
【0002】
【従来の技術】複数のパターン間の類似度を算出するパ
ターン照合技術では、その利用分野に固有な種々の特異
性の内、パターン照合の弊害となる要素を排除する技術
的な対処を行って、パターン間の類似度を精度良く算出
している。例えば、音声認識に利用されるパターン照合
技術では、発声速度が一定しないという音声固有の問題
に対処している。すなわち、発声速度が一定でないと、
同一の単語であってもその単語を構成する音声パターン
の時系列的な推移や構造が変動し、単純なパターン照合
では高精度な認識結果が得られないことになる。
【0003】ここでは、単語音声認識を例にパターン照
合技術の概念を簡単に説明する。提案されている単語音
声認識の大多数のものが、認識するときに、認識したい
入力音声のパターン(入力パターン)と、前以て作成し
登録されている複数の単語の音声パターン(標準パター
ン)を、順次パターン照合して入力パターンと最も類似
していると判定される単語の標準パターンを見つけ出
し、その標準パターンの単語を認識結果とするものであ
る。
【0004】今、仮に「田辺」と「高部」という姓名を
対象とした単語音声認識で、認識したい入力音声が「田
辺」であるとしよう。図5に示すように、入力パターン
の時系列的な構造が、標準パターン「高部(/takabe
/)」と同等な構造であれば、2番目の子音/n/と/
k/が異なるだけである。一方、標準パターン「田辺
(/tanabe/)」では、始めの/ta/の部分が入力パタ
ーンよりも長くなっているので、2番目の子音/n/以
降は、時系列での位置が入力パターンと標準パターンと
でずれてくることになり、単純なパターン照合によって
判定したパターンの一致度は低下してしまう。その結
果、入力音声は「田辺」であるにも係わらず、認識結果
は「高部」となり、誤認識が生じると予測される。
【0005】図5のように音声パターンの時系列的な内
部構造が明確であり、/tanabe/あるいは/takabe/と
いった子音や母音の位置が正確に分れば、このような誤
認識は容易に解決できるであろう。しかし、実際の音声
パターンは、スペクトラム等の音響的特性の時間的変化
であり、曖昧なものである。従って、このような入力パ
ターンと標準パターンの時系列的変動に対処することが
必要になるわけである。このため、パターン照合時に入
力パターンと標準パターンの時間軸を動的計画法を適用
して正規化するDPマッチングといった手法が提案され
ている。
【0006】音声のような時系列データに限らず、パタ
ーンが特徴ベクトルの系列で表現されるもので、かつそ
の特徴ベクトルの系列が何等かの影響で歪むような場合
には、パターン照合技術の最有力な手法のひとつとして
DPマッチングを挙げることができる。例えば、文字認
識にDPマッチングを応用するには、文字線の方向角と
いった特徴量を系列化して一種の時系列と見做す手法な
どが考えられる。なお、DPマッチングの詳細について
は、例えば刊行物「ディジタル音声処理」(東海大学出
版会、古井貞煕著、1985年)に解説されている。
【0007】一般に、DPマッチングに代表されるパタ
ーン照合技術では、特徴ベクトルの系列で表現されるパ
ターン間の類似度を、パターンを構成する個々の特徴ベ
クトル間の類似度を基本単位として算出している。すな
わち、パターンを構成する特徴ベクトルの系列から、各
々パターンでの系列順を保持しながらパターン間で特徴
ベクトルの対を複数取り出し、これらの対を成す特徴ベ
クトル間の類似度を算出し統合することによって、パタ
ーン間の類似度を算出するのである。これを単純化して
説明すれば、以下のようになる。I個の特徴ベクトルの
系列で表現される標準パターン A={a1 ,a2 ,・・・,ai ,・・・,aI } とJ個の特徴ベクトルの系列で表現される入力パターン B={b1 ,b2 ,・・・,bj ,・・・,bJ } に対して、例えば図6に示すように各パターンを特徴ベ
クトルの個数が同数となるように2つのパターンA’と
B’に変換して、まず変換されたパターンA’とB’の
類似度を算出する。パターンA’とB’の類似度は、各
々のパターンを構成する特徴ベクトルの系列で同位置に
存在する特徴ベクトル間の距離の総和等から求める。標
準パターンAと入力パターンBの類似度は、この変換後
のパターンA’とB’との類似度にそれぞれのパターン
の変換の度合い、言い換えるならば変換に費やしたコス
トを加えたものとして算出する。例え変換後のパターン
A’とB’の類似度が非常に高いものであったとして
も、もとの標準パターンA、入力パターンBからパター
ンA’、パターンB’への変換量が大きければ、標準パ
ターンAと入力パターンBの類似度は低いものとして扱
われることになる。
【0008】しかし、この変換という操作があるので、
上述した「田辺」と「高部」のような問題はある程度解
決することができる。つまり、特徴ベクトルの系列から
一部の特徴ベクトルを間引きすれば、時系列的な継続長
を短めにすること(時間軸の伸張)ができるし、逆に一
部の特徴ベクトルを重複して使用すれば、時系列的な継
続長を長めにすること(時間軸の短縮)ができることに
なる。なお、DPマッチングでは、このパターン変換と
変換後の特徴ベクトル間の距離計算を同時にかつパター
ン間の類似度が最も高くなるような仕方を効率良く探り
ながらパターン照合している。
【0009】
【発明が解決しようとする課題】ところで、このような
従来のパターン照合技術では、上述したようにパターン
間の照合をそのパターンを構成する特徴ベクトル間での
類似度を基本単位として行っているため、パターン照合
に悪影響を及ぼす要因のうち、特徴ベクトルの系列上に
生じた歪にしか対処できない。
【0010】音響分析に帯域通過フィルタ群の各フィル
タ出力をそのまま特徴ベクトルの成分とする音声パター
ンを用いた単純な単語音声認識では、発声速度の相違に
よって生じるパターンの歪は、入力パターンと標準パタ
ーンの特徴ベクトルの各成分に同等に影響を与えてお
り、特徴ベクトルの系列上での伸縮のみに現れていると
考えることができるので、従来の特徴ベクトルを基本単
位としたパターン照合技術で充分対処可能であろう。
【0011】一方、いわゆる連続音声認識では、個々の
音素が常にその前後の音素の影響を受けて歪む調音結合
という現象のため、パターンの歪み方が音声パターンを
構成する特徴ベクトルの各成分に不均一に出現するの
で、このような歪への対処が必須となる。簡単に説明す
るために、連続発声しているときの発声機構の動作を考
える。連続発声中では、舌の形状は後続音素の発声の準
備に入っているが、***の形状は現在の音素の発声を保
持しているといった現象がある。これは音声パターンを
構成する特徴ベクトルでみると、舌の形状との関連性の
高いベクトル成分と***の形状との関連性の高いベクト
ル成分とで、その歪み方に時間的相違が出てくることに
相当する。特徴ベクトル間での類似度を基本とする従来
のパターン照合技術で、このようなパターンの歪に対処
するには、ある一つの音素に対する標準パターンとし
て、各々の特徴ベクトル成分に個別に現れる歪に対応し
た複数のパターンを用意することが考えられる。しか
し、後続音素の可能性を考慮しただけでも、その用意す
べき標準パターンの数は莫大なものとなり、更にパター
ンの歪み方の新たな形態が発見されたりあるいは発生す
ると、その都度、新規標準パターンを追加する必要があ
り、現実的であるとは言えない。
【0012】次に、例えば、複数のマイクロホンを配置
して、それらの出力をモニタすることにより、ある特定
な音が発生したときの時刻と位置を検出するようなシス
テムを想定しよう。この場合、各マイクロホンの出力を
そのまま特徴ベクトルとすると、検出すべき音が既知で
あっても、特徴ベクトルの時系列として表現されたパタ
ーンは、音の発生した位置によって、多種多様に歪んだ
ものになる。すなわち、音が発生してからマイクロホン
でキャッチするまでの遅延が、そのまま特徴ベクトルの
成分毎の遅延に反映されるため、本来同一の音を表現し
ているパターンが音の発生位置によって特徴ベクトルの
成分にまで影響を及ぼした歪となって現れることにな
る。特徴ベクトル間での類似度を基本とする従来のパタ
ーン照合技術で、このようなパターンの歪に対処するに
は、検出対象の音に対して、想定される音の発生位置毎
に可能な限りの標準パターンを用意することになろう。
しかし、音の発生位置が不定であれば、用意すべき標準
パターンの数は莫大なものとなり、更に個々の標準パタ
ーンが不明瞭で理解しにくいものとなって、現実的であ
るとは言えない。
【0013】本発明は、上記に鑑みてなされたもので、
その目的とするところは、明確で分かりやすい標準パタ
ーンを用いて、複雑な歪現象を伴う領域にも適用できる
ようにDPマッチングに代表されるパターン照合技術、
すなわち特徴ベクトルの系列で表現されるパターン間の
照合をそれらのパターンを構成する特徴ベクトル間での
照合を基本単位に算出するパターン照合技術の適用領域
を拡大させるパターン照合方式を提供することにある。
【0014】
【課題を解決するための手段】上記目的を達成するた
め、本発明のパターン照合方式は、成分数が等しい特徴
ベクトルの系列で表現される入力パターンと該入力パ
ターンと同成分数の特徴ベクトルの系列で表現され予め
登録してある標準パターンとのパターン照合方式であ
り、前記入力パターンおよび標準パターンを形成する個
々の特徴ベクトル間で算出した類似度を統合して算定す
るパターン照合方式であって、前記標準パターンを形成
する特徴ベクトル系列の系列順位が第i番目の特徴ベク
トルaiと前記入力パターンを形成する特徴ベクトル系
列の系列順位が第j番目の特徴ベクトルbjとの特徴ベ
クトル間の類似度を算出する際に、特徴ベクトルbjに
対して合成ベクトルbj(下線付き)を求める手段を有
し、該手段は、前記入力パターンを形成する特徴ベクト
ルの系列から該系列順に従って前記特徴ベクトルbjと
該特徴ベクトルbjに後続する複数の特徴ベクトルbj+1
,bj+2 ,・・・bj+nを順次読み込んで記憶蓄積さ
せ、この記憶蓄積させた複数の特徴ベクトルbj,bj+1
,bj+2 ,・・・bj+nから成分位置を保持して任意の
成分を取り出す手段と、この成分位置を保持して取り出
した特徴ベクトルの各成分を、標準パターンの前記特徴
ベクトルaiの同じ成分位置の成分と成分間の類似度を
算出し、最も類似する成分を該成分位置の成分として定
め、他の成分位置についても同じように成分を求め、各
成分位置の最も類似する成分からなる合成ベクトルbj
(下線付き)を求める手段と、該合成ベクトルを特徴ベ
クトル系列に含む合成パターンを作成し、該合成パター
ンと標準パターンとのパターン照合を行う手段と、を具
備することを要旨とする。
【0015】
【作用】本発明のパターン照合方式では、標準パターン
を形成する特徴ベクトルai と入力パターンを形成する
特徴ベクトルbj との特徴ベクトル間の類似度を算出す
る際に、入力パターンを形成する特徴ベクトルの系列か
ら該系列順に従って特徴ベクトルbj と該特徴ベクトル
bj に後続する複数の特徴ベクトルbj+1 ,bj+2 ,・
・・bj+n を順次読み込んで記憶蓄積させ、この複数の
特徴ベクトルbj,bj+1 ,bj+2 ,・・・bj+n から
成分位置を保持して任意の成分を取り出し、この各成分
を保持しておいた成分位置に基づき特徴ベクトルの形式
に再構成することにより複数のベクトルを合成し、該複
数の合成されたベクトルを用いて、特徴ベクトルai と
の特徴ベクトル間の類似度を算出し、最も高い類似度を
算出した合成ベクトルを特徴ベクトルbj の代わりに採
用して特徴ベクトル間の類似度を算出する。
【0016】
【実施例】以下、図面を用いて本発明の実施例を説明す
る。
【0017】図1は、本発明の一実施例に係わるパター
ン照合方式の基本的な原理を示す説明図であり、入力パ
ターンB={b1 ,b2 ,・・・,bj ,・・・,bJ
}を構成する特徴ベクトル系列の一部分(図1では、
bj からbj+n までの部分)の特徴ベクトルの各成分を
組合せて、新たに特徴ベクトルbj として再構成してい
る。この特徴ベクトルの再構成手順を、入力パターンB
を構成する特徴ベクトルの系列順位で、最初から最後ま
で(j=1〜Jの区間で)実施することにより元の入力
パターンBと同数の特徴ベクトルを再構成する。再構成
された特徴ベクトルを系列順にならべることにより、合
成後の入力パターンとしてパターンを再合成する。
【0018】合成後の入力パターンは、図1に示すよ
うな従来の特徴ベクトルを処理単位としたパターン照合
方式によって、標準パターンA={a1 ,a2 ,・・
・,ai ,・・・,aI }との照合を行なう。このよう
な原理によって、パターンを構成する特徴ベクトルの系
列順位に沿って現れるパターンの歪のうち、特徴ベクト
ルの成分毎に現れる歪に対しては特徴ベクトルの再合成
過程で、特徴ベクトル単位で現れる歪に対しては従来の
パターン照合過程で対処可能となる。
【0019】なお、上述した説明から明らかであるよう
に、標準パターンAはI個の特徴ベクトルai (i=1
〜I)から構成され、その特徴ベクトルai はQ個の成
分からなる。また、入力パターンBはJ個の特徴ベクト
ルbj (j=1〜J)から構成され、その特徴ベクトル
bj もQ個の成分からなる。合成後の入力パターンBは
J個の特徴ベクトルbj (j=1〜J)から構成され、
その特徴ベクトルbjもQ個の成分からなる。
【0020】図2は本発明の一実施例であって、図1に
示された本発明の基本的な原理を実現するための処理手
順を示したものである。標準パターンAの第i番目の特
徴ベクトルai を基準ベクトルとし、入力パターンBの
第j番目から第j+n番目の特徴ベクトル(bj 〜bj+
n )から、合成後の入力パターンの第j番目の特徴ベ
クトルbj を合成する過程での処理手順である。処理開
始にあたっての設定条件として、基準ベクトルとしての
標準パターンAの特徴ベクトルai 、パターンを合成す
る上で利用される入力パターンBの特徴ベクトルbj 〜
bj+n が設定されている。
【0021】図2では、特徴ベクトルbj をベクトル成
分順に合成する手順を示しており、q=1〜Qと繰り返
すことにより全ベクトル成分が決定される。特徴ベクト
ルbj 〜bj+n の各第q成分と基準ベクトルであるai
の第q成分を比較し、最も類似度の高いものを特徴ベク
トルbj の第q成分に設定している。その結果、特徴ベ
クトルbj 〜bj+n の各成分を用いて、特徴ベクトルの
形式に組み立てる過程が実施され、特徴ベクトルbj
合成が実現される。なお、特徴ベクトルbjの第q成分
を設定するにあたり、基準ベクトルであるai との類似
度として、図2では単純なユークリッド距離計算を用い
る例となっており、dq,k が最小となるものが一番類似
度が高い場合を示している。
【0022】図3は、図2の処理手順を実行する装置構
成例であって、特徴ベクトルの系列で構成される入力パ
ターンBを特徴ベクトル毎にシフトレジスタに格納し
て、格納した特徴ベクトルから同一位置の成分対応に特
徴ベクトルの成分を取り出して、新たに入力パターン
として再合成するための具体的な構成例を示している。
ここで、合成後の特徴ベクトルbj の各成分は、標準パ
ターンAを構成する特徴ベクトルai とのベクトル間距
離に基づいて設定される。すなわち、特徴ベクトルbj
の第q番目の成分は、特徴ベクトルbj からbj+n の各
第q番目の成分を標準パターンの特徴ベクトルai の第
q番目の成分と順次比較し、そのなかで最も類似してい
るもの、つまり絶対値差の小さなものを選択して、それ
bj の第q番目の成分として設定している。このよう
にして、特徴ベクトルの全成分を設定して合成後の特徴
ベクトルbj を得る。
【0023】以上の手順を繰り返すことにより、標準パ
ターンAと合成後の入力パターンとのパターン照合を
特徴ベクトルを照合の単位として行なうときに、特徴ベ
クトルai との比較照合において、最適な合成後の入力
パターンの特徴ベクトルbj が確定されることにもな
る。また、このようにすることにより、特徴ベクトルで
の照合を基本単位とする従来のパターン照合方式の最初
の段階、つまりベクトル間での照合を、入力パターンの
再合成のための処理を同時に実施することが可能とな
る。合成後の入力パターンの特徴ベクトルbj の確定
は、適当な評価尺度に基づいて、特徴ベクトルの再合成
に必要な成分を取捨選択すれば良いのであって、上記の
手法に限られるわけではない。
【0024】図2と図3によって説明された実施例にお
いて、合成後の特徴ベクトルbj の第q成分を確定する
ときに、特徴ベクトルbj からbj+n のどの特徴ベクト
ルの第q成分を選択したかを記憶させておき、次の特徴
ベクトルbj+1 の第q成分を確定するときには、記憶さ
せておいた特徴ベクトルから特徴ベクトルbj+n+1 まで
の第q成分を対象にするようにすることにより、合成後
のパターンでの特徴ベクトルの各成分での系列順位の
逆転現象を阻止することができる。このようにして、図
2と図3で説明した実施例をもとに、特徴ベクトルの各
成分での系列順位の逆転を許さないパターンの照合、例
えば音声のような時系列の制約が厳しいパターンの照合
に対応する実施例も説明されることになる。
【0025】図4は、上記実施例を更にDPマッチング
に基づくパターン照合に組込んで、実現するための処理
手順である。従来のDPマッチングによるパターン照合
の処理手順に、本発明の処理手順であるパターンの再合
成手順を包含させて表現したもので、特徴ベクトルbj
の合成と確定の過程で計算したベクトル成分間の差分
(絶対値)を、特徴ベクトル間距離の計算においても再
利用したものとなっており、合成後の特徴ベクトルの確
定とパターン間の類似度計算の一部を同時に実施したも
のとなっている。なお、図4においては、DPマッチン
グの漸化式は例であって、何もこの形式に限るものでは
ない。
【0026】上述したように、本発明では、特徴ベクト
ルの系列で構成されるパターンに対して、各特徴ベクト
ルの成分と系列順を手がかりに特徴ベクトルを組み直し
てパターンを合成しながらパターン照合を行うようにし
た。具体的には、特徴ベクトルを一時的に記憶蓄積する
バッファを複数段設け、各段のバッファには特徴ベクト
ルの系列順で連続する複数の特徴ベクトルを系列順に記
憶させ、更にこれらのバッファの内容を特徴ベクトルの
成分毎に個別に読み出す手段と、個別に読み出された特
徴ベクトルの各成分を特徴ベクトルの形式に再構成する
手段を設け、この再構成された特徴ベクトルを系列順に
並べて合成したパターンを用いてパターン照合を行うよ
うにした。パターンの合成にあたって必要となるバッフ
ァの段数、すなわち、複数段のバッファに一時記憶させ
る特徴ベクトルの範囲は、特徴ベクトルの各成分が、元
の特徴ベクトルの系列順でどの程度まで歪む可能性があ
るかにより決定される。
【0027】また、例えば時系列データ等のパターンで
時系列順位の制約が厳しく、パターンがどのように歪ん
だとしても、特徴ベクトルの各成分が特徴ベクトルの系
列順で順位の逆転を生じることがない場合には、各特徴
ベクトルの成分と系列順を手がかりに特徴ベクトルを組
み直してパターンを合成する際に、合成後のパターンに
おける特徴ベクトルの各成分の系列順位が、合成前のパ
ターンの特徴ベクトルの系列順位で逆転を生じないよう
にするものとした。すなわち、特徴ベクトルを一時的に
記憶蓄積する複数段のバッファの各段にどの系列順位の
特徴ベクトルを一時記憶させているのか、その系列順位
を記憶し更に記憶した系列順位を参照する手段を設け
て、各段のバッファから特徴ベクトルの各成分を個別に
読み出して特徴ベクトルの形式に再構成してパターンを
合成する際に、合成後のパターンにおいても特徴ベクト
ルの各成分が系列順で順位の逆転を生じないように、特
徴ベクトルの各成分のどの系列順位までを用いているか
検査し、条件を満足しないものは排除するようにした。
【0028】以上述べたような手段を講じることによ
り、特徴ベクトルの系列で表現されるパターン間の照合
において、パターン照合に不都合を生じさせるパターン
の歪を特徴ベクトルの成分対応の処理で吸収でき、特徴
ベクトルの各成分に対応した細かな歪補正が可能となっ
た。その結果、従来のDPマッチングに代表される特徴
ベクトルを基本単位にパターンの歪補正を行なうパター
ン照合技術では対応できなかった領域、例えば音素レベ
ルでの処理に基づく連続音声認識などの領域にも、従来
手法と同等の手法でパターン照合技術を適用することが
できるようになった。また、特徴ベクトルよりも一段細
かな特徴ベクトルの成分対応での歪補正を行なっている
ので、より高精度なパターン照合が期待できる。
【0029】
【発明の効果】以上説明したように、本発明によれば、
パターン照合において不都合を生じさせるパターンの歪
を簡便な手段で補正でき、高精度なパターン照合ができ
るようになる。また、基本的な処理形態を従来のDPマ
ッチングに代表されるパターン照合技術と同等な形態で
実現できるために、ハードウェアの機能を損ねることな
く、ソフトウェアの追加変更のみで従来から開発されて
いるパターン照合装置に導入可能である。更に、その際
のソフトウェアの追加変更分も、従来からの基本機能を
流用できるので容易に実現できる。
【0030】一方、一般にパターン照合技術を用いたパ
ターン認識装置では、認識の対象となるパターンを標準
パターンとして登録する必要があるが、本発明を利用し
たパターン認識装置では、この登録すべき標準パターン
の数量を少なくすることができる。一般に認識の対象と
して登録すべき標準パターンは、同一カテゴリのパター
ンであっても複数個を用意することになるが、これはパ
ターンの歪み得る可能性と照合時にその歪に対処し得る
いわば歪補正の能力との関係によって決められる。従っ
て、特徴ベクトルを処理単位とした歪補正から特徴ベク
トルの各成分対応という細かな歪補正まで可能な本発明
のパターン照合方式では、パターン補正能力がより向上
しておりその結果、登録しておくべき標準パターンの数
量が少なくなるのである。更に、登録すべき標準パター
ンの数量が少なくなれば、装置化するときに標準パター
ンを登録するためのメモリなどの記憶エリアの容量を少
なくすることが可能となり装置コストの低減が図れる。
逆に言えば、同一装置規模で、認識対象のパターン数を
増大することができるということである。また、登録す
べき標準パターンとしては、代表的な典型例を主体にす
ることができるので、その標準パターンの作成が容易に
なるという効果もある。すなわち、パターンに生じ得る
歪のうちパターン照合時に対処できない要素が限定され
るので、登録すべき標準パターンの生成が簡略化できる
と考えられる。しかも、同一カテゴリのパターンを示す
標準パターンが少ない個数で良いということは、同一カ
テゴリを表現する複数のパターンすなわちパターン群を
把握することが容易になるということで、パターン照合
を利用するときの感覚的な理解が促進されるという効果
も期待できる。
【0031】パターンの生じ得る歪を補正する能力が強
化されているという面で考えるならば、従来は標準パタ
ーンを作成あるいは用意することもできなかったような
領域でも、標準パターンを設定できるという可能性があ
り、パターン照合技術の適用領域の質的な拡大が期待で
きる。例えば、記述の説明の繰り返しになるが、複数の
マイクロホンを配置して、それらの出力をモニタするこ
とにより、ある特定な音が発生したときの時刻と位置を
検出するようなシステムも本発明のパターン照合方式を
利用すれば容易に実現可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例に係わるパターン照合方式の
基本的な原理を示す説明図である。
【図2】図1に示すパターン照合方式の基本原理を実現
するための処理手順を示すフローチャートである。
【図3】図2の処理手順を実行する装置構成例を示す図
である。
【図4】図1に示す実施例をDPマッチングに基づくパ
ターン照合に組み込んだときの処理手順を示すフローチ
ャートである。
【図5】従来技術におけるパターンの歪を説明するため
の図である。
【図6】DPマッチングに代表される従来のパターン照
合の原理を示す説明図である。
【符号の説明】
A 標準パターン a,b, 特徴ベクトル B 入力パターン 合成後の入力パターン

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 成分数が等しい特徴ベクトルの系列で表
    現される入力パターンと該入力パターンと同成分数の
    特徴ベクトルの系列で表現され予め登録してある標準パ
    ターンとのパターン照合方式であり、前記入力パターン
    および標準パターンを形成する個々の特徴ベクトル間で
    算出した類似度を統合して算定するパターン照合方式で
    あって、 前記標準パターンを形成する特徴ベクトル系列の系列順
    位が第i番目の特徴ベクトルaiと前記入力パターンを
    形成する特徴ベクトル系列の系列順位が第j番目の特徴
    ベクトルbjとの特徴ベクトル間の類似度を算出する際
    に、特徴ベクトルbjに対して合成ベクトルbj(下線付
    き)を求める手段を有し、 該手段は、 前記入力パターンを形成する特徴ベクトルの系列から該
    系列順に従って前記特徴ベクトルbjと該特徴ベクトル
    bjに後続する複数の特徴ベクトルbj+1 ,bj+2 ,・
    ・・bj+n を順次読み込んで記憶蓄積させ、 この記憶蓄積させた複数の特徴ベクトルbj ,bj+1 ,
    bj+2 ,・・・bj+nから成分位置を保持して任意の成
    分を取り出す手段と、 この成分位置を保持して取り出した特徴ベクトルの各成
    分を、標準パターンの前記特徴ベクトルaiの同じ成分
    位置の成分と成分間の類似度を算出し、最も類似する成
    分を該成分位置の成分として定め、他の成分位置につい
    ても同じように成分を求め、各成分位置の最も類似する
    成分からなる合成ベクトルbj(下線付き)を求める手
    段と、 該合成ベクトルを特徴ベクトル系列に含む合成パターン
    を作成し、該合成パターンと標準パターンとのパターン
    照合を行う手段と、 を具備することを特徴とするパターン照合方式。
  2. 【請求項2】 成分数が等しい特徴ベクトルの系列で表
    現される入力パターンと該入力パターンと同成分数の
    特徴ベクトルの系列で表現され予め登録してある標準パ
    ターンとのパターン照合方式であり、前記入力パターン
    および標準パターンを形成する個々の特徴ベクトル間で
    算出した類似度を統合して算定するパターン照合方式で
    あって、 前記標準パターンを形成する特徴ベクトル系列の系列順
    位が第i番目の特徴ベクトルaiと前記入力パターンを
    形成する特徴ベクトル系列の系列順位が第j番目の特徴
    ベクトルbjとの特徴ベクトル間の類似度を算出する際
    に、特徴ベクトルbjに対して合成ベクトルbj(下線付
    き)を求める手段を有し、 該手段は、前記入力パターンを形成する特徴ベクトルの
    系列から該系列順に従って前記特徴ベクトルbj と該特
    徴ベクトルbj に後続する複数の特徴ベクトルbj+1 ,
    bj+2 ,・・・bj+n を順次読み込んで記憶蓄積させ、 この記憶蓄積させた複数の特徴ベクトルbj ,bj+1 ,
    bj+2 ,・・・bj+nから成分位置と特徴ベクトル系列
    での系列位置を保持して任意の成分を取り出す手段と、 この成分位置を保持して取り出した特徴ベクトルの各成
    分を、標準パターンの前記特徴ベクトルaiの同じ成分
    位置の成分と成分間の類似度を算出し、かつ、該成分を
    もつ特徴ベクトルの入力パターンでの系列位置x(j
    ≦ x ≦ j+n)を記憶し、 他の入力パターンの系列位置j’で求められた合成ベク
    トルbj’(下線付き)を参照し、同じ成分位置の成分
    となった特徴ベクトルの入力パターンでの系列位置x’
    を求め、系列位置jと系列位置j’の系列関係に対し
    て、系列位置xと系列位置x’で逆転しないような系列
    位置xに限定し、該限定された系列位置xの中で、最も
    類似する成分を該成分位置の成分として定め、他の成分
    位置についても同じように成分を求め、各成分位置の最
    も類似する成分からなる合成ベクトルbj(下線付き)
    を求め、かつ、該合成ベクトルbj(下線付き)の各成
    分につき、前記系列位置xを保持する手段と、 該合成ベクトルを特徴ベクトル系列に含む合成パターン
    を作成し、該合成パターンと標準パターンとのパターン
    照合を行う手段と、 を具備することを特徴とするパターン照合方式。
JP00345093A 1993-01-12 1993-01-12 パターン照合方式 Expired - Fee Related JP3348735B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00345093A JP3348735B2 (ja) 1993-01-12 1993-01-12 パターン照合方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00345093A JP3348735B2 (ja) 1993-01-12 1993-01-12 パターン照合方式

Publications (2)

Publication Number Publication Date
JPH06208391A JPH06208391A (ja) 1994-07-26
JP3348735B2 true JP3348735B2 (ja) 2002-11-20

Family

ID=11557676

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00345093A Expired - Fee Related JP3348735B2 (ja) 1993-01-12 1993-01-12 パターン照合方式

Country Status (1)

Country Link
JP (1) JP3348735B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6713681B1 (ja) * 2019-07-01 2020-06-24 アケハナ株式会社 社会人基礎力評価システム

Also Published As

Publication number Publication date
JPH06208391A (ja) 1994-07-26

Similar Documents

Publication Publication Date Title
EP0686965B1 (en) Speech recognition apparatus with speaker adaptation using acoustic category mean value calculus
US6523005B2 (en) Method and configuration for determining a descriptive feature of a speech signal
JP3114975B2 (ja) 音素推定を用いた音声認識回路
US8271282B2 (en) Voice recognition apparatus, voice recognition method and recording medium
JPS6131477B2 (ja)
CN112750445B (zh) 语音转换方法、装置和***及存储介质
US4901352A (en) Pattern matching method using restricted matching paths and apparatus therefor
JP2980026B2 (ja) 音声認識装置
EP0482395A2 (en) Method and apparatus for generating models of spoken words based on a small number of utterances
JPH0437996B2 (ja)
JP3348735B2 (ja) パターン照合方式
JP3428058B2 (ja) 音声認識装置
JP2964881B2 (ja) 音声認識装置
JP3440840B2 (ja) 音声認識方法及びその装置
US5774848A (en) Reference pattern training system and speech recognition system using the same
JP3226716B2 (ja) 音声認識装置
US20240144934A1 (en) Voice Data Generation Method, Voice Data Generation Apparatus And Computer-Readable Recording Medium
US7818172B2 (en) Voice recognition method and system based on the contexual modeling of voice units
JP2886474B2 (ja) 規則音声合成装置
US20230037541A1 (en) Method and system for synthesizing speeches by scoring speeches
US5956677A (en) Speech recognizer having a speech data memory storing speech data and a reference pattern memory storing partial symbol trains of words for recognition
JPS6118760B2 (ja)
JPH0223876B2 (ja)
JPS62111293A (ja) 音声認識方法
JPH01185599A (ja) 音声認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees