JPH029359B2 - - Google Patents

Info

Publication number
JPH029359B2
JPH029359B2 JP59068015A JP6801584A JPH029359B2 JP H029359 B2 JPH029359 B2 JP H029359B2 JP 59068015 A JP59068015 A JP 59068015A JP 6801584 A JP6801584 A JP 6801584A JP H029359 B2 JPH029359 B2 JP H029359B2
Authority
JP
Japan
Prior art keywords
word
state
value
time
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP59068015A
Other languages
English (en)
Other versions
JPS60211498A (ja
Inventor
Masao Watari
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP59068015A priority Critical patent/JPS60211498A/ja
Priority to US06/719,603 priority patent/US4901352A/en
Priority to CA000478383A priority patent/CA1226945A/en
Priority to DE8585104177T priority patent/DE3572058D1/de
Priority to EP85104177A priority patent/EP0162255B1/en
Publication of JPS60211498A publication Critical patent/JPS60211498A/ja
Publication of JPH029359B2 publication Critical patent/JPH029359B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は連続音声認識装置に関し、特に文法に
従つて連続発声された文音声を高速認識する高認
識率の連続音声認識装置に関する。
(先行技術) 音声認識装置の中でも文法に従つて発声された
文音声を認識する装置は、計算機プログラムや限
定業務用文章あるいは航空管制や各種機器の制御
用指令などの認識ができ広範囲な応用分野を有し
ている。文法の拘束が与えられている場合には、
その文法規則を利用することによつて誤認識を防
止できることが原理的に知られている。特に連続
数字認識において入力音声に桁数の制約がある場
合、その制約を規制化することにより認識率を改
善することができる。
このような文法に従つて連続に発声された文音
声を認識する手法が同一出願人による特願昭58−
239303「連続音声認識装置」に記載されている。
この原理は大略次のようである。文法をオートマ
トンαで表現し、そのオートマトンαを次のよう
に定義する。
α=<K、Σ、Δ、P0、F> ……(1) ここで、 K: 状態pの集合{p|p=1、2、…π} Σ: 入力単語nの集合{n|n=1、2、…
N} Δ: 状態遷移規則{(p、q、n)} ここで、(p、q、n)はpn → q なる状態遷移を意味する。
P0:初期状態、以後はp=0で示す。
F:最終状態集合F⊂K 次に前記オートマトンαに従つて単語n∈Σを
連続して発声して得られる音声パタンAを A=a1、a2、…ai、…aI ……(2) で示し、これを(未知)入力パタンと呼ぶ。各単
語n∈Σに対して標準的なパタン Bn=bn 1、bn 2、…bn j、…bn j ……(3) を用意し、これを単語標準パタンと呼ぶ。この単
語標準パタンBnをオートマトンαに従つて接続
することによつて得られる連続音声標準パタンC
=Bn1、Bn2、…BnXと入力パタンAとのDPマツ
チングを行い、2つのパタンの相互に異なる度合
を表わす量(以下相異度と称する)を算出し、最
小の相違度を与える単語系列を認識結果とする。
ここで最小の相異度を次のような動的計画の手
法で求める。この手法では、入力パタン時刻m、
状態qにおける最少単語累積相違度T(m、q)、
この最少を与えた単語名をN(m、q)、その単語
の始点時刻(経路値)L(m、q)、単語始点の状
態P(m、q)が計算される。また、単語n、状
態p、標準パタン時刻jにて定まる前ブロツクと
の境界上における累積相違度G(p、n、j)、そ
の累積相違度が得られた経路値すなわち単語始点
時刻H(p、n、j)が計算される。
まず、初期条件を T(0、0)=0 T(m、q)=∞、m≠0、q≠0 G(p、n、j)=∞ ……(4) とし、i=1よりI/IL(ここでI/ILは説明の
簡単のため割り切れるものとする。)まで順次(5)、
(6)式の境界条件を基に(7)式の漸化式を(p、q、
n)∈Δなるすべての対(p、n)について計算
する。すなわち境界条件を g(m−1、0)=T(m−1、p)
m=ms、…me h(m−1、0)=m−1 m=ms、me ただしms=(i−1)・IL+1、me=i・IL ……(5) g(ms−1、j)=G(p、n、j)
j=1、…Jn g(ms−1、j)=G(p、n、j)
j=1、…Jn h(ms−1、j)=H(p、n、j) j=1、…jn
…(6) とし、漸化式 g(m、j)=d(m、j)+g(m−1、j^) h(m、j)=h(m−1、j^)
……(7) ただし を時刻m=msよりmeまで計算し、その後標準パ
タン時刻j=1よりJnまで計算する。
1ブロツクの計算終了後g(me、j)、h(me
j)をそれぞれテーブル記憶G(p、n、j)、H
(p、n、j)へ格納する。ここでargmin yは
x∈Xの条件のもとでyを最小とするxx∈X を意味している。
次に単語の境界における最小化として if T(m、q)>g(m、Jn) thenT=(m、q)=g(m、Jn) N(m、q)=n P(m、q)=p L(m、q)=h(m、Jn) ただしm=ms、…me ……(8) を計算する。
すなわち、第1図(説明図)に示すように(7)式
の漸化式を入力パタンILフレーム分各対(p、
n)について算出し、この縦1ブロツクの計算を
入力パタン軸に沿つて移動させ、終端m=Iまで
求める。
入力パタンの認識結果は判定処理として次のよ
うな手続きにより求められる。
初期条件 q^= argmin q∈F〔T(I、q)〕 ……(9) とし、 q=q^、m=I ……(10) として 認識単語 n^=N(m、q) 単語始点 l^=L(m、q) 状態遷移 q^=P(m、q) ……(11) を求める。
もしl^>0ならばq=q^、m=l^として(11)式を繰
り返す。l^=0ならば終了。
(先行技術の問題) 前記特願昭58−239303記載の方法では、縦1ブ
ロツクの漸化式計算をI/IL回繰り返せばよい。
これによつて同一出願人による特開昭58−100195
「連続音声認識装置」に述べている縦1列の漸化
式計算をI回繰り返す方法に比較してテーブル記
憶G(p、n、j)とH(p、n、j)の読出し、
書込み回数が1/ILとなり、メモリアクセス時
間を少なくすることができている。しかしなが
ら、オートマトンの状態遷移にループが含まれる
場合は、状態pにおける縦1ブロツクの漸化式計
算の単語終端での結果T(m、q)=g(m、Jn)、
m=ms、…me−1を自分自身の状態pにおける
漸化式計算の初期値g(m−1、0)=T(m−1、
p)、m=ms+1、…meとするという不都合が生
じるので正しい計算結果は得られない。さらに、
境界条件であるテーブル記憶T(m、q)、N(m、
q)、P(m、q)、L(m、q)を時刻m=i・
IL=meのみの点だけで計算する方法が前記特願
昭58−239303号明細書に述べられている。しかし
この方法ではオートマトンの状態遷移にループが
含まれてもよいが、境界条件の計算を荒い間隔で
行うので、単語と単語の境界決定の精度が悪いた
め誤認識の原因となつていた。
このように先行技術による方法にはオートマト
ンの状態遷移にループを含めることができない
か、またはループが含まれている場合には単語の
境界決定の時間精度が悪く誤認識が多くなるとい
う欠点があつた。
(発明の目的) 本発明の目的は、入力パタン時刻mと標準パタ
ン時刻jで定められる領域内で斜めブロツク単位
に計算を実行することにより上記欠点を解決し、
多様な文法によつて発声された文音声を高い認識
率で高速に認識できるようにした連続音声認識装
置を提供することにある。
(発明の構成) 本発明によれば、入力音声を特徴の時系列A=
a1、a2、…ai、…aIに変換する入力部と;単語セ
ツトΣ={n}の中の各単語nに対して標準パタ
ンBn=b1 n、b2 n、…bj n、…bn Jnを記憶する標準
パタン記憶部と;単語nの入力によつて状態遷移
p→qが生じることを意味する規則(p、q、
n)の群である状態遷移テーブルΔと最終状態の
群Fとを記憶するオートマトン記憶部と;入力パ
タン時刻mと状態qとによつて番地指定されるテ
ーブル記憶T(m、q)、P(m、q)、N(m、q)
およびL(m、q)と;状態pと単語指定nおよ
び標準パタン時刻jとによつて番地指定されるテ
ーブル記憶G(p、n、j)およびH(p、n、
j)と;入力パタン時刻mと標準パタン時刻jで
定められる領域内で入力パタンILフレームの幅
を持ち標準パタン軸へ対して傾斜している平行四
辺形で区切られた第i番目の斜めブロツクの各点
(m、j)において、順次指定される単語指定番
号nに対応した標準パタンの各特徴ベクトルbn j
入力パタンの特徴ベクトルanとの距離d(m、
j)を算出する距離計算部と;単語指定nに対し
て生起し得る状態対(p、q)に対して、状態p
と単語指定nと標準パタン時刻jによつて指定さ
れる前記テーブル記憶G(p、n、j)およびH
(p、n、j)を参照し、テーブル記憶T(m−
1、p)の値を漸化式境界条件としてDPマツチ
ング漸化式値g(m、j)と経路値h(m、j)を
前記第i番目の斜めブロツク内の各点(m、j)
について求めて、第i+1番目の斜めブロツクと
の境界における漸化式値g(mej、j)と経路値
h(mej、j)を前記テーブル記憶G(p、n、
j)とH(p、n、j)とに格納するDPマツチン
グ部と;前記DPマツチング部で算出された漸化
式値g(m、Jn)を状態qに関して最小値を求め
前記テーブル記憶T(m、q)に書き込み、この
最小を与えた単語名n、状態指定p、経路値h
(m、Jn)を前記テーブル記憶N(m、q)、P
(m、q)、L(m、q)にそれぞれ書き込む比較
回路と;前記入力パタン時刻m、入力パタンブロ
ツク番号i、単語指定n、状態指定p、qおよび
標準パタン時刻j等の信号を発生するための制御
部と;最終時刻m=Iにおいて、前記最終状態群
Fに含まれる状態qで前記テーブル記憶T(p、
q)が最小なるものを定め、この最小を与えた状
態qおよび時刻mをもとにして前記テーブル記憶
P(m、q)、N(m、q)およびL(m、q)を参
照して認識結果を定める判定部とを備えることを
特徴とする連続音声認識装置が得られる。
(発明の原理) 次に本発明の原理について第2図、第10図を
参照しながら説明する。
第2図、第10図は本発明の連続音声認識装置
の原理を説明するための図である。
本発明の連続音声認識装置による方法は、第2
図に示すように前記(7)式の漸化式計算を入力パタ
ンのILフレーム分をブロツク化し、さらに斜め
に傾斜させた斜めブロツクごとに算出する。すな
わち次に示す動的計画の手法で求める。初期条件
を T(0、0)=0 T(m、q)=∞、m≠0、q≠0 G(p、n、j)=∞ ……(12) とし、i=1よりI/IL(ここでI/ILは説明の
簡単のため割り切れるものとする。)まで順次
(13)、(14)式の境界条件を基に(15)式の漸化
式を(p、q、n)∈Δなるすべての対(p、
n)について計算する。すなわち境界条件を g(m−1、0)=T(m−1、p)
m=msp、…mep h(m−1、0)=m−1 m=msp、…mep ただしmsp=(i−1)・IL+1、mep=i・IL……(13) とし、j=1、…jnなる各標準パタン時刻jにつ
いて msj=msp+〔j・a〕 mej=msj+IL−1 ただし〔x〕はxより小さな最大の整数とし、
境界条件 g(msj−1、j)=G(p、n、j) h(msj−1、j)=H(p、n、j) ……(14) とし、漸化式 g(m、j)=d(m、j)+g(m
−1、j^) h(m、j)=h(m−1、j^) ただし d(m、j)=Dis(an、bn j j^=argmin g(m−1、j′) j−2j′j ……(15) を時刻m=msjよりmejまで計算し、境界値である
g(mej、j)、h(mej、j)をそれぞれテーブル
記憶G(p、n、j)、H(p、n、j)へ格納す
る。
(15)式の計算が標準パタン時刻j=Jnまで終
了した後、単語境界における最小化として if T(m、q)>g(m、Jn) thenT=(m、q)=g(m、Jn) N(m、q)=n P(m、q)=p L(m、q)=h(m、Jn) ただしm=ms、…me ms=msp+〔Jn・a〕 me=ms+IL−1 ……(16) を計算する。
入力パタンの認識結果は前記(9)、(10)、(11)式によ
り前述の従来方法と同様にして求める。
本発明では漸化式計算を斜めブロツクごとに実
行している。この斜めに実行できる理由を次に説
明する。
DPマツチングの経路として第10図に示した
3通りしか許していないため、標準パタン軸(縦
軸)に対するブロツクの斜めの度合をaとする
と、aを 0<a≦1/2 ……(17) に限定すれば、経路が斜めブロツクの内から外へ
出て再び内へ入ることや、外から内へ入り再び外
へ出ることはない。すなわち、DPマツチングの
漸化式計算を斜めブロツクごとに積み重ねること
ができる。
一方、オートマトンの状態遷移にループがある
場合には斜めブロツクの終端区間(第2図のeの
部分)が始端区間(第2図のsの部分)と重なる
と、斜めブロツクの漸化式計算の初期値を結果で
書き換えるという矛盾が生じる。このため終端区
間と始端区間が入力パタン時間軸で重ならないよ
うにする必要がある。
すなわち、 〔a・min(Jn)〕+1>IL ……(18) とする必要がある。ここで、標準パタンの最小フ
レーム数を10とした場合a=1/2、IL=5とする ことができる。
(実施例) 次に第3図〜第9図を参照して本発明について
説明する。
第3図は本発明の連続音声認識装置の一実施例
を示すブロツク図、第4図、第5図、第6図はそ
れぞれ第3図の実施例の一部詳細構成を示す部分
ブロツク図、第7図は第3図における動作の時間
関係を示すタイムチヤート、第8図a、〜dは第
3図〜第6図における動作の一連の流れを示すフ
ローチヤート、第9図は第3図におけるオートマ
トン記憶部のメモリ構成例を示す図である。
標準パタン記憶部130には単語セツトΣに含
まれる単語nの標準パタンBnが記憶されている。
オートマトン記憶部230には状態遷移規則と最
終状態の指定情報とが記憶されている。本実施例
では状態遷移規則は第9図aおよびbに示すよう
に記憶されている。第9図aは状態指定テーブル
と呼ばれ単語nによる状態遷移p→qとして許さ
れる状態pの集合を指定している。同図には単語
nに対する状態pとしてp1…p…peが生じ得るこ
とが例示されている。第9図bは遷移テーブルと
呼ばれ単語nによつて状態pから遷移し得る状態
qの集合を記憶している。
マイクロホン100より未知入力音声が入力さ
れると入力部110によつて周波数分析がなされ
特徴を示すベクトルa1に変換され順次入力パタン
バツフア120に送られる。また、入力部110
には音声レベルを検知することによつて音声区間
を決定する機能が与えられており、音声区間中で
は「1」その他では「0」なる音声区間信号Sを
発生する。制御部240は、この音声区間信号S
の立上りの時刻において初期化パルスSET1を
発生する。これによつて第8図aのブロツク10
に対応する初期化がGメモリ150とTメモリ2
00に対してなされる。
以上の初期化が終了すると、以後のILフレー
ム分の入力特徴aiの入力に同期して入力パタンブ
ロツク信号iが1、2…と計数される。この入力
パタンブロツクiにおいて制御部240よりの単
語指定信号nは1からNまで変化する。各単語n
においてオートマトン記憶部230中の状態テー
ブルが参照され、状態指定信号pがp1からpeまで
変化される。またその単語nと状態pにて規定さ
れる状態指定信号qも出力される。
次に単語n、状態pなる1サイクル内の動作を
説明する。この1サイクルによつて第2図に図示
した斜め1ブロツク部分の計算が実行される。す
なわち前記(13)、(14)式の境界条件のもとで前
記(15)、(16)式を計算する。初めに制御部24
0よりの信号SET2によつて、第8図aのブロ
ツク11に対応する値のセツトがDPマツチング
部140内のGメモリ143とhメモリ144に
対して行われる。続いて制御部240よりの標準
パタン時刻信号jは1からJnまで変化する。各標
準パタン時刻jにおいて、まず第8図bのブロツ
ク12に示す第i−1番目の斜めブロツクとの境
界値のセツトが制御部240よりの信号SET3
によつて行われる。続いて入力パタン時刻信号m
がmsj(msj=(i−1)・IL+1+〔j・a〕)から
mej(mej=msj+IL−1)まで変化する。各入力
パタン時刻mにおいて第8図bのブロツク13に
示した計算がDPマツチング部140で行われる。
DPマツチング部140では初めに入力パタンの
mフレームと第n番目の単語の標準パタンのjフ
レームが読み出されて前記(71)式に示すR次元
ベクトル間の距離を距離計算部141で求める。
すなわち、入力パタンバツフア120と標準パタ
ン記憶部130とからの信号に従つてR個のデー
タを順次読み出し、絶対値回路1411で差の絶
対値を求め、加算器1412とアキユムレータ1
413によつてその和が求められ、Dis(an、bn j
が得られる。一方、距離計算と並列して3つの相
異度の最小値が求められる。すなわち、gメモリ
143より(m−1、j)、g(m−1、j−1)、
g(m−1、j−2)とhメモリ114よりh(m
−1、j)、h(m−1、j−1)、h(m−1、j
−2)を読み出し、レジスタG1,G2,G3と
H1,H2,H3へそれぞれ格納する。比較回路
1422は3つのレジスタG1,G2,G3から
最小値を検出し、その最小値が得られたレジスタ
Gn^(n^は1、2、3のどれか)に対応したレジス
タHn^を選択するゲート信号n^を発する。前記ゲー
ト信号n^により選択されたレジスタHn^の内容がh
メモリ144のh(m、j)へ書き込まれる。ま
た、比較回路1422より出力された最小値g
(m−1、j^)は前記距離計算部141で求められ
た距離d(m、j)と加算器1421によつて加
算され、gメモリ143のg(m、j)へ書き込
まれる。
入力パタン時刻mがmsjよりmejまで変化した
後、制御部240よりの信号SET4に従つて第
8図bのブロツク14に示した第i+1番目の斜
めブロツクとの境界値g(mej、j)、h(mej
j)をテーブル記憶G(p、n、j)150、H
(p、n、j)160へ格納する 以上説明した標準パタン時刻jが終端Jnとなる
まで実行することによつて第i番目の斜めブロツ
クの漸化式計算が行われる。次いで制御部240
より発せられた信号m2(ms=msp+〔Jn・a〕
からme=ms+IL−1まで変化する)に従つて第
8図cのブロツク15に示した比較が行われる。
すなわち、第5図に示すように、信号m2と状態
qに従つてTメモリ200よりT(m、q)とg
メモリ143よりg(m、Jn)が読み出され、比
較回路170により比較しT(m、q)>g(m、
Jn)の場合wp信号が発せられ、g(m、Jn)、n、
p、h(m、Jn)がテーブル記憶T(m、q)、2
00、N(m、q)190、P(m、q)180、
L(m、q)210へそれぞれ書き込まれる。
以上の動作によつて状態p、単語n、入力パタ
ンブロツクiの処理が終了する。さらに状態指定
信号pがp1からpeと変化されることにより単語指
定信号nに対する処理が終了する。さらに単語指
定信号nが1からNまで変化されることにより第
i番目の斜めブロツクに対する処理が終了する。
入力パタンブロツク信号がI/ILとなつた後
に前記(9)、(10)、(11)式に示した判定処理が開始され
る。判定部220は第6図に示すように構成さ
れ、まず第8図dのブロツク16の処理として、
オートマトン記憶部230から最終状態集合Fに
含まれる状態qを信号q3に従つて順次指定さ
れ、Tメモリ200よりT(I、q)を読み出し、
比較回路221、最小値レジスタ222、状態レ
ジスタ223を用いて最小のT(I、q)が与え
られる状態q^を得る。続いて第8図dのブロツク
17の処理として判定制御部227はq=q^、m
=Iとしてアドレス信号m3、qをNメモリ19
0、Lメモリ210、Pメモリ180へ発しN
(m、q)、L(m、q)、P(m、q)を読み出す。
このL(m、q)とP(m、q)は次の時刻mと状
態qとなり、N(m、q)は認識結果として出力
される。この処理をl^が零になるまで繰り返すこ
とにより順次認識結果が得られる。
以上、本発明の構成を実施例にもとづいて説明
したが、これらの記載は本発明の権利範囲を限定
するものではない。特に本実施例ではDPマツチ
ングの漸化式として最も簡単な(7)式を用いたが、
他のより高性能なものを用いる方法も考えられ
る。例えば g(m、j)=ming(m−2、j−
1)+d(m−1、j)+d(m、j) g(m−1、j−1)+d(m、j) g(m−1、j−2)+d(m、j) なるものを用いる方法が考えられる。ただし、こ
の場合には漸化式値は時刻(m−2)まで、距離
も時刻(m−1)まで保存しなくてはならないの
でテーブル記憶G(p、n、j)と同様なものを
増設する必要がある。また、本説明では距離を基
本として認識を行つたが、相関を基本として認識
する方法も考えられる。この場合には、大小関係
が逆になるので本説明の最小値検出機能を、すべ
て最大値検出機能に置換する必要がある。また、
本説明ではテーブル記憶G(p、n、j)および
H(p、n、j)はフオートランで用いられる三
次元配列としてあるが、状態指定信号p、単語指
定信号n、標準パタン時刻jによつて指定される
メモリとしてもよい。すなわち、テーブル記憶は
前記p、n、jのすべての範囲(テーブルサイズ
=pnax×nnax×jnax)を持つのではなく、 使用される範囲(テーブルサイズ Σ (p,n) Jn ∈Δ) のみを持つているものとしてもよい。これらの自
明な変更は本発明の権利範囲に属するものであ
る。
(発明の効果) 以上説明したように本発明の連続音声認識装置
では、入力パタン時刻mと標準パタン時刻jで定
められる領域内で入力パタンILフレームの幅を
持ち標準パタン軸に対して傾斜している平行四辺
形で区切られる斜めブロツクごとに計算を進めて
いるので、前記特願昭58−239303に記載されてい
る方法によるメモリアクセス時間の削減という利
点を保持するとともに、オートマトンの状態遷移
にループが許されないという欠点を解消した。す
なわち、本発明の連続音声認識装置によれば斜め
ブロツク単位に計算を実行することにより多様な
文法によつて発声された文音声を高い認識率で高
速に認識することが可能となるという効果が生じ
る。
【図面の簡単な説明】
第1図は従来の連続音声認識技術を説明するた
めの図、第2図、第10図はいずれも本発明の連
続音声認識装置の原理を説明するための図、第3
図は本発明の連続音声認識装置の一実施例を示す
ブロツク図、第4図、第5図、第6図はそれぞれ
第3図の実施例の一部詳細構成を示す部分ブロツ
ク図、第7図は第3図における動作の時間関係を
示すタイムチヤート、第8図a、〜dは第3図〜
第6図における動作の一連の流れを示すフローチ
ヤートおよび第9図は第3図におけるオートマト
ン記憶部のメモリ構成例を示す図である。 図において、100……マイクロホン、110
……入力部、120……入力パタンバツフア、1
30……標準パタン記憶部、140……DPマツ
チング部、141……距離計算部、143……g
メモリ、144……hメモリ、150……Gメモ
リ、160……Hメモリ、170,221……比
較回路、180……Pメモリ、190……Nメモ
リ、200……Tメモリ、210……Lメモリ、
220……判定部、222……最小値レジスタ、
223……状態レジスタ、227……判定制御
部、230……オートマトン記憶部、240……
制御部。

Claims (1)

  1. 【特許請求の範囲】 1 入力音声を特徴の時系列A=a1、a2、…ai
    …aIに変換する入力部と;単語セツトΣ={n}
    の中の各単語nに対し標準パタンBn=b1 n、b2 n
    …、bj n、…bn Jnを記憶する標準パタン記憶部
    と;単語nの入力によつて状態遷移p→qが生じ
    ることを意味する規則(p、q、n)の群である
    状態遷移テーブルΔと最終状態の群Fとを記憶す
    るオートマトン記憶部と; 入力パタン時刻m、状態qにおける最小単語累
    積相違度T(m、q)、その最小累積相違度を与え
    た単語名N(m、q)、その単語の経路値L(m、
    q)、単語始点の状態P(m、q)を記憶するテー
    ブル記憶T(m、q)、N(m、q)、L(m、q)
    およびP(m、q)と; 単語n、状態p、標準パタン時刻jにて定まる
    前ブロツクとの境界上における累積相違度G(p、
    n、j)、その累積相違度が得られた経路値H
    (p、n、j)を記憶するテーブル記憶G(p、
    n、j)およびH(p、n、j)と;入力パタン
    時刻mと標準パタン時刻jで定められる領域内で
    入力パタンILフレームの幅を持ち、標準パタン
    軸に対して傾きの度合がaで傾斜し、 かつ[a・ min n(Jn)]+1>IL>1 を満たす平行四辺形で区切られた第i番目の斜め
    ブロツクの各点(m、j)において、順次指定さ
    れる単語指定信号nに対応した標準パタンの各特
    徴ベクトルbj nと入力パタンの特徴ベクトルan
    の距離d(m、j)を算出する距離計算部と;単
    語指定nに対して生起し得る状態対(p、q)に
    対して、状態pと単語指定nと標準パタン時刻j
    によつて指定される前記テーブル記憶G(p、n、
    j)およびH(p、n、j)を参照し、テーブル
    記憶T(m−1、p)の値を漸化式境界条件とし
    てDPマツチング漸化式値g(m、j)と経路値h
    (m、j)を前記第i番目の斜めプロツク内の各
    点(m、j)について求めて、第i+1番目の斜
    めブロツクとの境界における漸化式値g(mej
    j)と経路値h(mej、j)を前記テーブル記憶
    G(p、n、j)とH(p、n、j)とに格納する
    DPマツチング部と;前記DPマツチング部で算出
    された漸化式値g(m、Jn)を状態qに関して最
    小値を求め前記テーブル記憶T(m、q)に書き
    込み、この最小を与えた単語名n、状態指定P、
    経路値h(m、Jn)を前記テーブル記憶N(m、
    q)、P(m、q)、L(m、q)にそれぞれ書き込
    む比較回路と;前記入力パタン時刻m、入力パタ
    ンブロツク番号i、単語指定n、状態指定p、q
    および標準パタン時刻j等の信号を発生するため
    の制御部と;最終時刻m=Iにおいて、前記最終
    状態群Fに含まれる状態qで前記テーブル記憶T
    (m、q)が最小なるものを定め、この最小を与
    えた状態qおよび時刻mをもとにして前記テーブ
    ル記憶P(m、q)、N(m、q)およびL(m、
    q)を参照して認識結果を定める判定部とを備え
    ることを特徴とする連続音声認識装置。
JP59068015A 1984-04-05 1984-04-05 連続音声認識装置 Granted JPS60211498A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP59068015A JPS60211498A (ja) 1984-04-05 1984-04-05 連続音声認識装置
US06/719,603 US4901352A (en) 1984-04-05 1985-04-03 Pattern matching method using restricted matching paths and apparatus therefor
CA000478383A CA1226945A (en) 1984-04-05 1985-04-04 Pattern matching method and apparatus therefor
DE8585104177T DE3572058D1 (en) 1984-04-05 1985-04-04 Pattern matching method and apparatus therefor
EP85104177A EP0162255B1 (en) 1984-04-05 1985-04-04 Pattern matching method and apparatus therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59068015A JPS60211498A (ja) 1984-04-05 1984-04-05 連続音声認識装置

Publications (2)

Publication Number Publication Date
JPS60211498A JPS60211498A (ja) 1985-10-23
JPH029359B2 true JPH029359B2 (ja) 1990-03-01

Family

ID=13361577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59068015A Granted JPS60211498A (ja) 1984-04-05 1984-04-05 連続音声認識装置

Country Status (5)

Country Link
US (1) US4901352A (ja)
EP (1) EP0162255B1 (ja)
JP (1) JPS60211498A (ja)
CA (1) CA1226945A (ja)
DE (1) DE3572058D1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022230100A1 (ja) 2021-04-28 2022-11-03 三菱電機株式会社 制御装置、駆動装置、および電動パワーステアリング装置

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH067354B2 (ja) * 1984-10-25 1994-01-26 松下電器産業株式会社 パタ−ン比較装置
JPS61145599A (ja) * 1984-12-19 1986-07-03 日本電気株式会社 連続音声認識装置
US5450598A (en) * 1985-12-27 1995-09-12 Xerox Corporation Finite state machine data storage where data transition is accomplished without the use of pointers
US5228110A (en) * 1989-09-15 1993-07-13 U.S. Philips Corporation Method for recognizing N different word strings in a speech signal
JPH04194999A (ja) * 1990-11-27 1992-07-14 Sharp Corp 学習を用いた動的計画法
DE4433366A1 (de) * 1994-09-20 1996-03-21 Sel Alcatel Ag Verfahren und Einrichtung zur Bestimmung eines Maßes der Übereinstimmung zwischen zwei Mustern sowie Spracherkennungseinrichtung damit und Programm-Modul dafür
JP2964881B2 (ja) * 1994-09-20 1999-10-18 日本電気株式会社 音声認識装置
JP3576272B2 (ja) * 1995-06-22 2004-10-13 シャープ株式会社 音声認識装置および方法
JP3006507B2 (ja) * 1996-10-03 2000-02-07 日本電気株式会社 パターン間距離計算装置
US6122757A (en) * 1997-06-27 2000-09-19 Agilent Technologies, Inc Code generating system for improved pattern matching in a protocol analyzer
WO2004072797A2 (en) * 2003-02-07 2004-08-26 Safenet, Inc. System and method for determining the start of a match of a regular expression
US7366352B2 (en) * 2003-03-20 2008-04-29 International Business Machines Corporation Method and apparatus for performing fast closest match in pattern recognition
US7227994B2 (en) * 2003-03-20 2007-06-05 International Business Machines Corporation Method and apparatus for imbedded pattern recognition using dual alternating pointers

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4059725A (en) * 1975-03-12 1977-11-22 Nippon Electric Company, Ltd. Automatic continuous speech recognition system employing dynamic programming
JPS55157799A (en) * 1979-05-29 1980-12-08 Nippon Electric Co High efficiency pattern matching unit
JPS5629292A (en) * 1979-08-17 1981-03-24 Nippon Electric Co Continuous voice identifier
US4349700A (en) * 1980-04-08 1982-09-14 Bell Telephone Laboratories, Incorporated Continuous speech recognition system
US4513436A (en) * 1980-09-16 1985-04-23 Oki Electric Industry, Co., Ltd. Speech recognition system
US4400788A (en) * 1981-03-27 1983-08-23 Bell Telephone Laboratories, Incorporated Continuous speech pattern recognizer
JPS5885499A (ja) * 1981-11-18 1983-05-21 株式会社デンソー 連続音声認識装置
US4592086A (en) * 1981-12-09 1986-05-27 Nippon Electric Co., Ltd. Continuous speech recognition system
JPS58100195A (ja) * 1981-12-10 1983-06-14 日本電気株式会社 連続音声認識装置
US4570232A (en) * 1981-12-21 1986-02-11 Nippon Telegraph & Telephone Public Corporation Speech recognition apparatus
JPS58132298A (ja) * 1982-02-01 1983-08-06 日本電気株式会社 窓制限付パタンマツチング装置
JPS60179797A (ja) * 1983-10-27 1985-09-13 日本電気株式会社 パタンマツチング装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022230100A1 (ja) 2021-04-28 2022-11-03 三菱電機株式会社 制御装置、駆動装置、および電動パワーステアリング装置

Also Published As

Publication number Publication date
DE3572058D1 (en) 1989-09-07
EP0162255B1 (en) 1989-08-02
CA1226945A (en) 1987-09-15
JPS60211498A (ja) 1985-10-23
US4901352A (en) 1990-02-13
EP0162255A1 (en) 1985-11-27

Similar Documents

Publication Publication Date Title
JPH029359B2 (ja)
JPH0159600B2 (ja)
JPS58102299A (ja) 部分単位音声パタン発生装置
JP2980026B2 (ja) 音声認識装置
JPS592040B2 (ja) 音声認織装置
JPH02186398A (ja) 連続音声認識装置
JPS61219099A (ja) 音声認識装置
JPH0346839B2 (ja)
JPH0296800A (ja) 連続音声認識装置
JPH08123469A (ja) 句境界確率計算装置および句境界確率利用連続音声認識装置
JPH0887294A (ja) 音声認識装置
JPH0355836B2 (ja)
JP3652753B2 (ja) 発声変形音声認識装置及び音声認識方法
JP3532248B2 (ja) 学習音声パタンモデル使用音声認識装置
JPH0575117B2 (ja)
JPH08248975A (ja) 標準パターン学習装置およびこの装置を使用した音声認識装置
JPH0449954B2 (ja)
JPH0552516B2 (ja)
JPS60164800A (ja) 音声認識装置
JPS61102698A (ja) 標準パタ−ン適応方式
An et al. A Study on Speech Recognition using DMS Model
JPH0223876B2 (ja)
JPS62294298A (ja) 音声入力装置
JPH0134399B2 (ja)
JPH0534680B2 (ja)