JPH0574836B2 - - Google Patents

Info

Publication number
JPH0574836B2
JPH0574836B2 JP60117135A JP11713585A JPH0574836B2 JP H0574836 B2 JPH0574836 B2 JP H0574836B2 JP 60117135 A JP60117135 A JP 60117135A JP 11713585 A JP11713585 A JP 11713585A JP H0574836 B2 JPH0574836 B2 JP H0574836B2
Authority
JP
Japan
Prior art keywords
pattern
compression
vector
sequence
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60117135A
Other languages
English (en)
Other versions
JPS61275800A (ja
Inventor
Shichiro Tsuruta
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP60117135A priority Critical patent/JPS61275800A/ja
Publication of JPS61275800A publication Critical patent/JPS61275800A/ja
Publication of JPH0574836B2 publication Critical patent/JPH0574836B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、パタン認識装置に関する。
(従来技術とその問題点) パタン認識装置は、例えば音声のように特徴ベ
クトルの時系列として表現されるパタンを標準パ
タンとの比較操作(マツチング)により類似性を
算出し、パタン間の認識を行なう装置である。例
えば、音声認識装置は認識すべき音声パタンを標
準パタンとして予め装置に登録しておき、認識動
作時には、入力される未知音声パタンに対して、
各標準パタンとの間で比較操作を行い、両者の一
致の度合を調べ、最もよく一致する標準パタンを
決定し、認識判定を行う方法に基づいている。こ
のパタンマツチング法では、パタンに固有な変動
現象、例えば、音声パタンにおける発声速度の変
動に起因する時間軸の不均一な伸縮といつた現象
に対して安定な尺度を用いることが重要である。
これに関しては日本音響学会の音声研究会資料
S73−22(昭和48年12月発行)「音声認識における
各種DPマツチング法の比較」(以下文献(1)と呼
ぶ)に詳しく述べられている。また、この方法を
能率的にかつ高精度で実現する方法として動的計
画法(以下DP法と略す)を利用し、時間軸の変
動を正規化したパタン間距離を算出するDPマツ
チング法が有効であると提案されている。このマ
ツチング法では、マツチングの対象となるパタン
は、一定の周期でサンプリングされた時系列ベク
トルを前提としている。このために、各パタンを
記憶するための記憶容量は、各パタンの長さ分だ
け必要となる。例えば、単語音声認識装置の場合
では、単語数分の容量が必要となり、膨大な記憶
容量を必要とする。また、演算時間もパタン長に
比例して増大するために高速演算が要求される。
一方、音声パタンは、母音定常部等においては、
周波数構造の時間的変化は小さく、母音から子音
といつた過渡部分などでは、その変化が大きい。
この性質を利用して、各パタンを情報圧縮し、記
憶容量を削減する装置が知られている(文献(2)特
開昭58−137899号公報)。以下、文献(2)のパタン
圧縮法の概要を説明する。
音声パタンは、音声信号の周波数分析器等の出
力を一定の周期でサンプリングすることで、特徴
ベクトルの時系列として B=〓1、〓2、……〓j、〓J (1) と示される。〓jは時刻jにおける特徴ベクトル
である。(1)式のパタンBを第1図aに示すように
K+1個の区切り点l1〜lK+1によつてK区間に区
切り、各区分内における中央ベク〓′1、〓′2
……、〓′Kの列を圧縮パタンCとする。中央ベク
トル〓′kはk番目の区間(lk、lk+1)の中央位置
のベクトルを該区間の代表ベクトルとして抽出し
たものである。すなわち 〓′k=〓(lk+lk+1)/2である。
区切り点列{lk}は、代表ベクトル〓′kが区間
(lk、lk++1)に含まれる〓jに対するベクトル誤差
の大きさを‖〓′k−〓j‖と表わしたとき、各区
間でのベクトル誤差が最小となるような最適に決
定する。すなわち T= Min {lkK+1k=1 lk+1j=lk+1 ‖〓′k−〓j‖ (2) (2)式の最小化問題を解くことで最適区切り点列
{lk}が求まる。(2)式の具体的計算法として、動
的計画法を用いて、次のように行う。
初期値 T(0、0)=0 (3) のもとに、 漸化式 T(m、k)= Min m−δ≦l<m〔T(l−1、k−1)+nj=l ‖〓(l+n)/2−〓j‖〕 (4) なる漸化式を m−δ≦l≦m−1 (5) なる条件の範囲で、m=l〜J、k=1〜K+1
に関して逐次計算することで、区切り点列{lk
でK分割した場合に、各分割区分間(lk、lk+1
で発声する中央ベクトル〓′kと割愛される各ベク
トル〓jとの誤差 d(〓′k、〓j)=lk+1j=lk+1 ‖〓′k−〓j‖ が全区間について最小となるような区切り点列
{lk}を最適区切り点列として求めることができ
る。この最適区切り点列{lk}が求まると、各区
切り点間の中央ベクトル〓k=〓(lk+lk+1)/2が求ま
り、最適に圧縮された圧縮パタン C=〓1、〓2、……、〓k、……、〓K が求められる。該圧縮パタンCの各ベクトル〓k
は、それぞれの区間内における代表ベクトルとさ
れ、後で入力される入力パタンとの間でパタンマ
ツチング法が実行され認識が行われる。すなわ
ち、代表ベクトルの系列により表現される圧縮パ
タンにおいて、間引かれた冗長なベクトルを、抽
出された代表ベクトルにより補間して、圧縮され
る前の時間軸上に再現し、DPマツチング法を適
用して認識処理を行う。
以上述べた方法は、圧縮パタンが圧縮前のパタ
ンに最も近似したパタンとなるため、認識率の低
下をまねくことなくパタン圧縮を可能としてい
る。
しかしながら、このパタン圧縮法では、圧縮パ
タンを得るために(3)式〜(5)式で示される漸化式を
計算する必要があり、例えば入力パタンと標準パ
タンの両パタンとも圧縮し、認識処理する場合に
は、高速演算回路が要求される。従つて、圧縮処
理を実行する回路は必ずしも安価なものではな
い。
(発明の目的) 本発明は、このような従来の欠点を除去せしめ
て、極めて少ない演算量で、パタン圧縮を実現
し、かつ記憶容量、演算量とも大幅に削減したパ
タン認識装置を提供することにある。
(発明の構成) 本発明によれば、特徴ベクトルの系列{bj}、
(j=1、2、……、J)として表現される標準
パタンを保持するパタンメモリと、該パタンメモ
リに格納された前記ベクトル列{bj}のパタン変
化量Dj、(j=1、……J)をパタン全体にわた
り算出し、パタン長Jから決定される分割数Kに
より前記パタン変化量Djの総変化量DJをK等分
するように前記ベクトル列{bj}をK区分に分割
し、上記演算によつて得られる区分点列{lk}を
決定し、該{lk}により定まる各区間の中央位置
のベクトルb′kを前記パタンメモリから読みだし
各区間の代表ベクトルとして圧縮パタンC=c1
c2、……cKを出力する圧縮処理部と、前記圧縮パ
タンCを格納する圧縮パタンメモリと、任意の入
力パタンと前記圧縮パタンとの比較を行う認識処
理部とを備えたことを特徴とするパタン認識装置
が得られる。
更に本発明によれば、特徴ベクトルの系列
{bj}、(j=1、2、……、J)として表現され
る標準パタンを保持するパタンメモリと該パタン
メモリに格納された前記ベクトル列{bj}のパタ
ン変化量Dj、(j=1、2、……、J)をパタン
全体にわたり算出し、前記パタン変化量Djの総
変化量DJから決定される分割数Kにより、前記
パタン総変化量DJをK等分するように前記ベク
トル列{bj}をK区分に分割し、上記演算によつ
て得られる区分点列{lk}を決定し、該{lk}に
より定まる各区間の中央位置のベクトルb′kを前
記パタンメモリから読み出し各区間の代表ベクト
ルとして圧縮パタンC=c1、c2、……cKを出力す
る圧縮処理部と、前記圧縮パタンCを格納する圧
縮パタンメモリと、任意の入力パタンと前記圧縮
パタンとの比較を行う認識処理部とを備えたこと
を特徴とするパタン認識装置が得られる。
(構成の詳細な説明) 本発明について、図面を参照して詳細に説明す
る。入力パタンAは入力の周波数構造を表わす特
徴ベクトルの系列 A=a1、a2、……、ai、……、aI (6) で表現される。また比較すべき標準パタンBを B=b1、b2、……、bj、……、bJ (7) と表わす。本発明においては、標準パタンBを第
1図に示すようにK+1個の区切り点l1,l2,…
…,lk,……,lK+1によつてK区間に区切り、各
区分(lk、lk+1)内におけるベクトルb′1、b′2、…
…、b′Kの列を圧縮パタンCとする。各区分(lk
lk+1)の中央のベクトルb′kは、区切り点lkとlk+1
の中央位置のベクトルb(lk+lk+1)/2を該区間の代表
ベクトルb′kとして抽出したものである。区切り
点列{lk}は、次の様にして決定される。第1図
bに示すように標準パタンBのパタン変化量Dj
を、ベクトル間距離dj=‖bj−bj-1‖と表わした
とき、このベクトル間距離djのパタン区間にわた
る総和 Djjm=1 dn (8) として表わす。前記区切り点l1,……lK+1は、パ
タン変化量Djのパタン全体にわたる総変化量DJ
をK等分するように、標準パタンBをK区間に分
割することで決定する。すなわち、等分された変
化量をΔDとすると、第1図bに示すように、ベ
クトル列{bj}の先頭からベクトル列{bj}の変
化量Djが、等分された変化量ΔDを越えた点をl2
l3,……,lk,……,lk+1として決定する。区切り
点列{lk}は、 {lk}=l1、l2、……、lk、……、lk+1 (9) で表わされる。この区切り点間の中央のベクトル
b′kを改めてckと表わすことにすると、圧縮パタ
ンCは C=c1、c2、……、ck、……、ck (10) で表わされる。KをJより小さい値に設定するこ
とで圧縮パタンCは標準パタンBより小容量のメ
モリに格納することが可能となる。以上が本発明
の原理である。
(実施例) 以上の原理に基づいて動作する本発明の第1の
実施例のブロツク図を第2図に示す。また、圧縮
処理部40の詳細図を第3図にする。マイクロホ
ン等10から入力される音声信号は、音声分析部
20で周波数構造を表わす(6)および(7)式の特徴ベ
クトルの時系列パタンに変換される。該パタンは
音声パタンメモリ30に記憶される。ここで、入
力音声から標準パタンを作成する場合、音声パタ
ンメモリ30には標準パタンBが格納されてい
る。圧縮処理部40は、音声パタンメモリ30か
らベクトル値bj、とbj-1を読み出し距離計算部4
1によりベクトル間距離dj=‖bj−bj-1‖を計算
し、順次、累算部42により(8)式のパタン変化量
Djを算出する。この処理をjを1からJまで変
化させることで、パタン全体にわたるパタン変化
量Dj、(j=1、……J)が算出され、パタン変
化量メモリ43に記憶される。一方、制御部70
では、標準パタン長Jに基づいて圧縮率を決定す
る。
次に第3図に示した圧縮処理部においては、定
数CJにより、圧縮ベクトル数Kが圧縮率決定回路
71により決定される。圧縮ベクトル数Kの決定
により、区分変化量決定回路72では、パタン全
体にわたる総変化量DJをK等分することで、等
分された変化量ΔDを算出する。この等分された
変化量ΔDを基準とし、kを1から順次Kまで変
化させkΔDを乗算回路73により算出し、圧縮
処理部の比較部47に出力する。比較部47で
は、Jを1から順次変化させて全体にわたるパタ
ン変化量DjとkΔDを比較し、DjがkΔDを越えた
点をj=lkとして区切り点を決定する。区切り点
の決定により、kを1づつ増加させ、k=Kまで
処理することで、区切り点列{lkk=1〜Kが決定さ
れる。この区切り点列から、標準パターに対し
て、区切り点間の中央のベクトルを代表ベクトル
bkとして決定し、圧縮パタンメモリ50に{Ck
として格納する。該圧縮パタンの各ベクトルCk
は、それぞれ区間内における代表ベクトルとさ
れ、後に入力される入力パタンAとの間で認識処
理部60により周知のパタンマツチング法が実行
される。
第1の実施例における圧縮ベクトルの決定方で
は、圧縮の対象であるパタンのパタン長Jを基準
に圧縮ベクトル数を決定した。この方法ではパタ
ンの総変化量にかかわらず一律に圧縮ベクトル数
Kがパタン長Jにより決定される。従つてパタン
の総変化量が少ない、いわゆる平坦なパタンに対
する圧縮効果が少ない。この点を改良した第2の
実施例の原理を第4図を用いて説明する。
第4図のa,bは第1の実施例によるパタン圧
縮方法を図示したもので、c,dは第2の実施例
による方法を図示したものである。第1の発明で
は、区切り点数Kは圧縮率を定める定数CJでパタ
ン長Jを除してK=J/CJとして決定される。従
つて、区切り点数Kはパタン長Jから一律に決定
される。第4図aではK=6の場合が示してあ
る。一方、第4図cは、第4図aのパタンB1
同じ長さJのパタンB2に対する圧縮方法を示し
た物で、……線は第一の実施例による圧縮結果を
示している。第4図b,dはパタンB1、パタン
B2の総変化量D1J,D2Jを示したもので、圧縮率CJ
が同じな場合、等分された変化量ΔD1,ΔD2は、
パタンの変動量に依存する。この場合パタンB2
の方がパタンB1より変動量が多いため、ΔD2
ΔD1となる。このことから、第一の実施例による
圧縮法では、圧縮されたパタンと元のパタンとの
近似度が、パタン内の変動量により大きく左右さ
れることになる。第2の実施例はパタン内の変動
量に左右されない圧縮法を実現する。いま、第4
図のc,dにおいて、等分される変化量ΔDを一
定な値CDとして与え、圧縮ベクトル数KをK=
D2J/CDとして決定すると、等分される変化量ΔD
は、パタン長Jに無関係となる。すなわち、等分
される変化量ΔD(=DJ/K)を一定な値CDとし
て、第1の発明の方法により区切り点列{lk}を
決定すれば、パタン変動量に左右されることなく
近似度一定の圧縮パタンが得られる。
以下、第2の実施例を説明する。第5図は本発
明による圧縮処理部40と制御部70の詳細図で
ある。他の部分は第1の発明による第2図と同じ
機能である。今、音声パタンメモリ30には標準
パタンBが格納されている。第1の実施例と同様
に、(8)式のパタン変化量Djを算出し、パタン変
化量メモリ43に記憶される。制御部70では、
等分される変化量を決定する定数CDにより、圧
縮ベクトル数Kが圧縮ベクトル数決定回路74よ
りパタン総変化量DJをCDで除すことで決定され
る。この圧縮ベクトル数Kの決定により、以後の
処理は第1の実施例とまつたく同様に行なわれ、
区切り点列{lkk=1〜K及び圧縮パタン{Ck}が圧
縮パタンメモリ50に格納され、認識処理部60
によりパタンマツチング法が実行される。
(発明の効果) 本実施例では標準パタンを、極めて少ない演算
量により代表ベクトルによつて圧縮することが可
能であり、従来方法に較べ、メモリ量・演算量と
もに大幅な削減を可能とする。上記圧縮による誤
差は小であり、認識率を低下させることはない。
なお、音声パタン以外の特徴ベクトル列に対して
も、同様な構成によつて、同様に認識率を低下さ
せることなく、メモリ量・演算量を大幅に低減さ
せることが可能となる。
【図面の簡単な説明】
第1図は本発明における圧縮処理の原理の説明
する原理説明図、第2図は本発明の第1実施例を
示すブロツク図、第3図は圧縮処理部及び制御部
の構成図、第4図は本発明の第2の実施例の原理
を説明するための図、第5図は本発明の第2の実
施例における圧縮処理部および制御部の構成例を
示す図である。 図において、10……入力端子、20……音声
分析部、50……音声パタンメモリ、40……圧
縮処理部、50……圧縮パタンメモリ、60……
認識処理部、70……制御部、41……距離計算
部、42……累算部、43……パタン変化量メモ
リ、44……比較部、71……圧縮率決定回路、
72……区分変化量決定回路、73……乗算回
路、74……圧縮ベクトル数決定回路である。

Claims (1)

  1. 【特許請求の範囲】 1 特徴ベクトルの系列{bj}、(j=1、2、…
    …、J)として表現される標準パタンを保持する
    パタンメモリと、該パタンメモリーに格納された
    前記ベクトル列{bj}のパタン変化量Dj、(j=
    1、……J)をパタン全体にわたり算出し、パタ
    ン長Jから決定される分割数Kにより前記パタン
    変化量Djの総変化量DJをK等分するように前記
    ベクトル列{bj}をK区間に分割し、上記演算に
    よつて得られる区分点列{lk}を決定し、該{lk
    により定まる各区間の中央位置のベクトルb′k
    前記パタンメモリから読みだし各区間の代表ベク
    トルとして圧縮パタンC=c1、c2、……cKを出力
    する圧縮処理部と、前記圧縮パタンCを格納する
    圧縮パタンメモリと、任意の入力パタンと前記圧
    縮パタンとの比較を行う認識処理部とを備えたこ
    とを特徴とするパタン認識装置。 2 特徴ベクトルの系列{bj}、(j=1、2、…
    …、J)として表現される標準パタンを保持する
    パタンメモリと該パタンメモリに格納された前記
    ベクトル列{bj}のパタン変化量Dj、(j=1、
    2、……、J)をパタン全体にわたり算出し、前
    記パタン変化量Djの総変化量DJから決定される
    分割数Kにより、前記パタン総変化量DJをK等
    分するように前記ベクトル列{bj}をK区分に分
    割し、上記演算によつて得られる区分点列{lk
    を決定し、該{lk}により定まる各区間の中央位
    置のベクトルb′kを前記パタンメモリから読み出
    し各区間の代表ベクトルとして圧縮パタンC=
    c1、c2、……cKを出力する圧縮処理部と、前記圧
    縮パタンCを格納する圧縮パタンメモリと、任意
    の入力パタンと前記圧縮パタンとの比較を行う認
    識処理部とを備えたことを特徴とするパタン認識
    装置。
JP60117135A 1985-05-30 1985-05-30 パタン認識装置 Granted JPS61275800A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60117135A JPS61275800A (ja) 1985-05-30 1985-05-30 パタン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60117135A JPS61275800A (ja) 1985-05-30 1985-05-30 パタン認識装置

Publications (2)

Publication Number Publication Date
JPS61275800A JPS61275800A (ja) 1986-12-05
JPH0574836B2 true JPH0574836B2 (ja) 1993-10-19

Family

ID=14704316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60117135A Granted JPS61275800A (ja) 1985-05-30 1985-05-30 パタン認識装置

Country Status (1)

Country Link
JP (1) JPS61275800A (ja)

Also Published As

Publication number Publication date
JPS61275800A (ja) 1986-12-05

Similar Documents

Publication Publication Date Title
JP2692581B2 (ja) 音響カテゴリ平均値計算装置及び適応化装置
JPH0361959B2 (ja)
US4426551A (en) Speech recognition method and device
JPH0159600B2 (ja)
JPS5885499A (ja) 連続音声認識装置
JPS6254297A (ja) 音声認識装置
JP2980026B2 (ja) 音声認識装置
EP0162255B1 (en) Pattern matching method and apparatus therefor
US4802226A (en) Pattern matching apparatus
JPH0574836B2 (ja)
JP2964881B2 (ja) 音声認識装置
US4794645A (en) Continuous speech recognition apparatus
JPH04369698A (ja) 音声認識方式
JPS59131999A (ja) 音声認識装置
JP3352144B2 (ja) 音声認識装置
JP3226716B2 (ja) 音声認識装置
JPS6118200B2 (ja)
JPS58149099A (ja) パタ−ン認識方式
JPS6097400A (ja) 音声認識装置
JPH0436400B2 (ja)
KR100298118B1 (ko) Hmm모델의유사성을이용한음성인식장치및방법
JP2577891B2 (ja) 単語音声予備選択装置
JP2707577B2 (ja) ホルマント抽出装置
JPH049319B2 (ja)
JPS63234299A (ja) 音声分析合成方式