JPH0577080B2 - - Google Patents

Info

Publication number
JPH0577080B2
JPH0577080B2 JP62298594A JP29859487A JPH0577080B2 JP H0577080 B2 JPH0577080 B2 JP H0577080B2 JP 62298594 A JP62298594 A JP 62298594A JP 29859487 A JP29859487 A JP 29859487A JP H0577080 B2 JPH0577080 B2 JP H0577080B2
Authority
JP
Japan
Prior art keywords
time
distance
storage unit
standard pattern
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62298594A
Other languages
English (en)
Other versions
JPH01138596A (ja
Inventor
Hiromi Fujii
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP62298594A priority Critical patent/JPH01138596A/ja
Publication of JPH01138596A publication Critical patent/JPH01138596A/ja
Publication of JPH0577080B2 publication Critical patent/JPH0577080B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、発声された音声を高速で認識する音
声認識装置の改良に関する。
(従来の技術) 音声認識は、優れたマンマシンインターフエー
スを実現する技術として重要であり、すでにさま
ざまな分野で音声認識装置が使われている。現在
の装置のほとんどは、パターンマツチング法によ
る認識方式を採用している。この方式は、発声さ
れた認識対象単語nの特徴ベクトルの時系列Bn
=bn 1…bn j…bn Jをあらかじめ標準パターンとして
保持しておき、入力された発声のパターンA=a1
…ai…aI(以下、入力パターンとする)と保持さ
れた標準パターンとの比較を行い、最も類似した
標準パターンの単語名を認識結果とするものであ
る。この時、標準パターンと入力パターンの時間
軸i,jをそれぞれ対応つけてパターン間距離を
求める方法としては、動的計画法により非線形な
対応付けを行うDPマツチング法が使用されてい
る。DPマツチングは、例えば(1)式のような漸化
式計算を用いてaiとbjのベクトル間距離dn(i,
j)の総和を最小にする最適化問題を解くもので
ある。
gn(i,j)=dn(i,j)+ min P=0,1,2[gn(i−1,j−p)] (1) ここで、gn(i,j)は(1,1)から(i,
j)までのdn(i,j)の累積値である。DPマツ
チングについての詳細は、「連続発声した単語音
声を効率的に認識する2段DPマツチング」、日経
エレクトロニクス、1983年11月7日号の171頁よ
り208頁(以下、文献1とする)に記述されてい
る。
このDPマツチングを原理とする認識アルゴリ
ズムは、現在最も一般的に用いられているが、計
算量の多さが問題であつた。計算量の低減法とし
ては、特開昭58−98796号明細書に記載されてい
るクロツクワイズDP法である。この方法は、(1)
式のような漸化式計算を入力パターンの時間軸i
に同期して処理することにより実時間性を高める
ものである。時間軸に同期した処理は、入力パタ
ーンの時刻iにおいて、全ての単語nとその時刻
jに対して累積距離gn(i,j)を求めることに
よつて実現される。また、さらに高速化を狙つた
ものとしては、このクロツクワイズDP法に枝刈
の考えを導入することで処理を高速化したものが
特願昭62−61732号に述べられている。以下、こ
の方法について簡単に説明する。
この方法は、漸化式計算を進める際に、ある条
件を満足する(n,j)に対しては漸化式計算を
行い、満足しない(n,j)に対しては漸化式計
算を省略するという枝刈処理を取り入れることに
より、漸化式計算回路を削減するものである。枝
刈の条件としては、例えば、時刻iにおけるgn
(i,j)の最小値gminに余裕分α(ビーム幅フ
アクタ)を加えたものをiにおけるしきい値θ
(i)として用いる方法がある。この場合、θ
(i)>gn(i,j)となる(n,j)のみを漸化
式計算の対象として残し、それ以外の(n,j)
は漸化式計算の対象から外す。
入力パターンaiが入力されると、枝刈を行いな
がらクロツクワイズ法によつて漸化式計算を行
う。第2図はそのアルごリズムを示している。第
2図では、求められたgn(i,j)としきい値θ
(i)を比較し、gn(i,j)>θ(i)であればj
=j+1として漸化式計算を省略する。以上のよ
うにして、処理は入力パターンの入力と同期して
i=1からI−1まで処理される。入力パターン
の最後の特徴ベクトルaIが入力されると、i=I
において、マツチング部では、(2)式の処理が行わ
れ、各単語nごとに入力パターンとの距離D(A,
Bn)を得る。
D(A,Bn)=gn(I,J)=gn(J)+dn(I,J)
(2) 但し、gn(J)=mingo(I−1,J) gn(I−1,J−1) gn(I−1,J−2) 次に、求められたD(A,Bn)を順次比較し、
最小値を求め、これに対応するnを認識結果とし
て出力する。
(発明が解決しようとする問題点) 従来方式における枝刈を伴う認識処理では、語
中のある時刻iにおける枝刈で残された(n,
j)のnが1種類になることもありうる。この場
合、i+1以降の漸化式計算を行つてもn以外の
単語が認識結果となることはない。しかしなが
ら、従来方式による音声認識装置では、認識結果
を得るために入力パターンの開始から終了時刻ま
でのパターンに対して標準パターンとのパターン
間距離D(A,Bn)を求める必要があつた。しか
し、上記のように、枝刈によつてnが1種類にな
つたその時点で認識結果が1意に定まつてしま
う。そのため、認識結果を得るという意味では、
i+1以降Iまで計算は余分な処理であり、認識
速度を低下させる原因となつていた。
本発明の目的は、上記に述べた計算の無駄を省
き、より速く認識結果を得ることのできる音声認
識装置を提供することにある。
(問題点を解決するための手段) 本発明による音声認識装置は次の各部を必要と
する。すなわち各単語nの音声の特徴ベクトル時
系列Bn=bn 1…bn j…bn Jを標準パターンとして保持
する標準パターン格納部と、枝刈のしきい値を格
納するしきい値格納部と、時刻iの入力音声の特
徴ベクトルaiを逐次読み込み、各時刻iにおいて
入力音声の特徴aiと前記標準パターン格納部の標
準パターンとの距離dn(i,j)の累積距離gn
(i,j)を前記しきい値格納部のしきい値によ
つて定められる条件を満足する(n,j)の値に
対して求め、またそのとき条件を満足する(n,
j)のnの値が1種類である場合には単語nを認
識結果として出力するマツチング部と、このマツ
チング部にて求められた累積距離を格納する累積
距離格納部と、前記マツチング部にて時刻Iに求
められた累積距離gn(I,J)の最小値を与える
単語nを認識結果として出力する判定部の各部で
ある。
(作用) 本発明による音声認識装置は、漸化式計算を進
める際、枝刈されない(n,j)のnが1種類し
か存在しない場合には、入力パターンの入力終了
を持たずに単語nを認識結果として出力する点を
特徴とする。枝刈されない(n,j)のnが1種
類になつたということは、これ以上漸化式計算を
行つてもn以外の単語が認識結果になることはな
いことを意味する。従つて、nが1種類になつた
時点で、nを認識結果として出力することにより
それ以降の漸化式計算を省略することができ、認
識処理を高速化することができる。
以上の機能を持つ音声認識装置は、枝刈されな
い(n,j)のnが1種類かどうかの判定機能を
持ち、そのようなnが1種類であればその時点で
nを結果として出力し、2種類以上ある場合には
i+1における漸化式処理を続ける処理により実
現できる。
(実施例) 以下に、本発明の実施例について図面を参照し
ながら詳細に説明する。第1図は、本発明の一実
施例を示すブロツク図である。
第1図における標準パターン格納部1には、あ
らかじめ発声された認識対象単語n(1≦n≦N)
の各時系列データが標準パターンBo=bn 1…bn j
bn Jとして格納されており、しきい値格納部2に
は、時刻iにおける枝刈のしきい値θ(i)があ
らかじめ格納されているとする。発声された入力
パターンAは実時間で分析され、特徴ベクトルai
の時系列のデータとして逐次マツチング部3に入
力される。
マツチング部3では、入力されたaiごとに、
n,jに対して枝刈を伴う漸化式計算を行いgn
(i,j)を求める。この処理には従来方式にお
けるクロツクワイズDP法に枝刈の考えを導入し
た方式(前記文献、特願昭62−61732号)を用い
る。マツチング部3では、しきい値格納部2のし
きい値θ(i)を読み込み、gn(i,j)<θ(i)
を満足する(n,j)に対して漸化式計算を行
う。マツチング部3における枝刈を伴う漸化式計
算の処理としては、第2図に示した従来方式にお
ける処理を用いることができる。マツチング部3
における処理において、時刻iで求められた累積
距離gn(i,j)は、累積距離格納部4に保持さ
れる。それらの累積距離は、i+1の漸化式計算
時にマツチング部3より読み出され使用される。
ここで、マツチング部3では、上記の処理の他に
(n,j)のnが1種類かどうか判定を行い、1
種類であればnを認識結果として出力する。この
処理を含めたマツチング部3のアルゴリズムを第
3図に示す。2重枠内がnが1種類かどうかの判
定処理である。n′は単語nに対して、枝仮されな
いjがあるかどうかのフラグであり、そのような
jがあればn′は単語番号nの値となる。また、nn
はiにおいて枝刈されない(n,j)のnの個数
である。iの処理が終了した後、nn<2なる判
定処理を満足した場合にn′を認識結果として出力
する。
このアルゴリズムにより枝刈されない(n,
j)のnが常に2種類以上ある場合は、従来方式
と同様に時刻I−1までの漸化式計算とIにおけ
る(2)式の処理を行い、入力パターンAと全ての標
準パターンBnとのパターン間距離を求める。判
定部5では、マツチング部4にて得られた入力パ
ターンAと全ての標準パターンBn,n=1…N
とのパターン間距離のうち最小距離を与えた標準
パターンを結果として出力する。
(発明の効果) 以上に述べたように、本発明によれば、枝刈さ
れない(n,j)のnが1種類である場合、直ち
にnを結果として出力することにより、計算量を
低減し、認識処理速度を高めた音声認識装置の実
現が可能になる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロツク図、
第2図は従来方式のマツチング部における処理の
アルゴリズムを示す流れ図、第3図は第1図のマ
ツチング部における処理のアルゴリズムを示す流
れ図である。 1……標準パターン格納部、2……しきい値格
納部、3……マツチング部、4……累積距離格納
部、5……判定部。

Claims (1)

    【特許請求の範囲】
  1. 1 各単語nの音声の特徴ベクトル時系列Bn
    bn 1…bn j…bn Jを標準パターンとして保持する標準
    パターン格納部と、枝刈のしきい値を格納するし
    きい値格納部と、時刻iの入力音声の特徴ベクト
    ルaiを逐次読み込み、各時刻iにおいて入力音声
    の特徴aiと前記標準パターン格納部の標準パター
    ンとの距離dn(i,j)の累積距離gn(i,j)を
    前記しきい値格納部のしきい値によつて定められ
    る条件を満足する(n,j)の値に対して求め、
    またそのとき条件を満足する(n,j)のnの値
    が1種類である場合には単語nを認識結果として
    出力するマツチング部と、このマツチング部にて
    求められた累積距離を格納する累積距離格納部
    と、前記マツチング部にて時刻Iに求められた累
    積距離gn(I,J)の最小値を与える単語nを認
    識結果として出力する判定部とを有することを特
    徴とする音声認識装置。
JP62298594A 1987-11-25 1987-11-25 音声認識装置 Granted JPH01138596A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62298594A JPH01138596A (ja) 1987-11-25 1987-11-25 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62298594A JPH01138596A (ja) 1987-11-25 1987-11-25 音声認識装置

Publications (2)

Publication Number Publication Date
JPH01138596A JPH01138596A (ja) 1989-05-31
JPH0577080B2 true JPH0577080B2 (ja) 1993-10-25

Family

ID=17861755

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62298594A Granted JPH01138596A (ja) 1987-11-25 1987-11-25 音声認識装置

Country Status (1)

Country Link
JP (1) JPH01138596A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009146245A (ja) * 2007-12-17 2009-07-02 Nec Corp 画像照合方法及び画像照合装置並びに画像照合プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005096271A1 (ja) * 2004-03-30 2005-10-13 Pioneer Corporation 音声認識装置及び音声認識方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009146245A (ja) * 2007-12-17 2009-07-02 Nec Corp 画像照合方法及び画像照合装置並びに画像照合プログラム

Also Published As

Publication number Publication date
JPH01138596A (ja) 1989-05-31

Similar Documents

Publication Publication Date Title
JP2692581B2 (ja) 音響カテゴリ平均値計算装置及び適応化装置
US5621849A (en) Voice recognizing method and apparatus
JPH02186398A (ja) 連続音声認識装置
US20030220792A1 (en) Speech recognition apparatus, speech recognition method, and computer-readable recording medium in which speech recognition program is recorded
JPH029359B2 (ja)
JPH0296800A (ja) 連続音声認識装置
JPH0577080B2 (ja)
JP3315565B2 (ja) 音声認識装置
JP2864775B2 (ja) 音声認識装置
JPH0554678B2 (ja)
JP2862306B2 (ja) 音声認識装置
JP3357752B2 (ja) パターンマッチング装置
JPS63236094A (ja) 音声認識方法
JP2000267691A (ja) 音声認識システムにおける認識辞書選択方法
JPH08248984A (ja) 音声認識方法
JPH03149598A (ja) 音声認識装置
JPH0577079B2 (ja)
JPS62161200A (ja) 連続音声認識装置
JPH0668678B2 (ja) 音声認識装置
JPS60147798A (ja) 音声認識方法
Sudirman et al. NN with DTW-FF Coefficients and Pitch Feature for Speaker Recognition Rubita Sudirman1, Sh-Hussain Salleh1, Shaharuddin Salleh2
JPH01253799A (ja) 音声の認識方法
JPH0484196A (ja) 連続音声認識用登録パターン作成方法
JPH11237893A (ja) 音声認識システムにおける音素認識方法
JPH04128800A (ja) パターンマッチング制御回路

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees