JP2841404B2

JP2841404B2 - 連続音声認識装置

Info

Publication number: JP2841404B2
Application number: JP1006185A
Authority: JP
Inventors: 和永吉田
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1989-01-12
Filing date: 1989-01-12
Publication date: 1998-12-24
Anticipated expiration: 2013-12-24
Also published as: EP0378212A3; EP0378212A2; JPH02186398A; US5086472A; DE69028021T2; DE69028021D1; EP0378212B1

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、連続的に発声した連続音声を認識する連続
音声認識装置の改良に関するものである。

（従来の技術）従来、連続的に発生した音声を予め定められた文法に
しがたって認識する方法として、例えば電子情報通信学
会論文誌DVo1.J71−DNo.9の第1650頁から1659頁に「フ
レーム同期化、ビームサーチ、ベクトル量子化の統合に
よるDPマッチングの高速化」と題して発表された論文
（以下引用文献１と称す）に示されているような文法が
ある。これは、単語単位の標準パターンを正規文法を表
す有限状態オートマトンに従って結合したものを基にDP
マッチングにより連続音声を認識する方法である。この
方法によれば適度な計算量により連続音声を認識するこ
とが可能である。このような、有限状態オートマトンに
従って連続音声を認識する方法には、ここに示した方法
の他にも、例えば（社）電子情報通信学会編、中川聖一
著「確率モデルによる音声認識」（以下文献２と称す）
の第29頁に述べられているような「隠れマルコフモデ
ル」（以下HMMと呼ぶ）を用いた方法もある。連続音声
の認識には、文献２の第46頁に述べられているようにビ
タビアルゴリズムを用いることにより実現できる。

以下、文献１の述べられている、有限状態オートマト
ンで表現された文法を用いてフレーム同期DPマッチング
により連続音声を認識する場合について述べる。文献２
に述べられているようなHMMを用いる方法も、連続音声
を認識するための基本的な処理法は同じであるので同様
に扱えることは言うまでもない。また、以下認識単位と
して単語を用いる場合について説明するが、例えば音素
など単語以外の単位を用いることができることも言うま
でもない。

入力された音声パターン（入力パターン）は特徴の時
系列、Ａ＝a₁，a₂，……a_i，……ａ_Ｉ（１）として表現できる。認識する単語をｎとすると、標準パ
ターンは、 B_n＝B_n1，B_n2，……B_nj，……B_nJn （２）と表せる。入力パターンの特徴a_iと標準パターン特徴B
_njの間の距離を、ｄ（n;i,j）とする。単語レベル処理
として、以下に示す累積値ｇに対するDP漸化式を解くこ
とにより単語間距離を求めることができる。同時に経路
値Ｌを計算することにより連続音声認識を行った場合の
認識結果をバックトレースすることができる。

初期値:g（n;i,0）＝０Ｌ（n;i,0）＝ｉ（３）ｇ（n;i,j）＝ｄ（n;i,j）＋min［ｇ（n;i−1,j）,g
（n;i−1,j−１）,g（n;i−1,j−２）］（４）［１］Ｌ（n;i,j）＝Ｌ（n;i−1,j）［２］Ｌ（n;i−1,j−１）［３］Ｌ（n;i−1,j−２）（５）（５）式における［ｘ］は（４）式のmin［］の処理
においてｘ番目のものが最小であった場合選択されるこ
とを示す。入力パターンのフレームｉにおける単語間距
離はｇ（n;i,j,n）として求められる。また、そのとき
の標準パターンに対する入力パターンの始端のフレーム
は経路値Ｌ（n;i,jn）として求められる。（３）式では
累積値の初期値として０を与えたが、文レベル処理とし
て有限状態オートマトンに従って直前の単語の累積値を
与え、かつ単語レベルの認識結果を保存することにより
連続音声認識が可能となる。

一方、正規文法は自然言語の複雑さを扱うためには不
十分であり、より表現力の高い文脈自由文法を使えるこ
とが望ましい。文脈自由文法は、たとえば共立出版
（株）刊「人工知能ハンドブック第１巻」（以下文献３
と称す）の第303頁に述べられているように、生成規則
の左辺が１個の非終端記号からなる文法である。たとえ
ば、ある文を生成する文脈自由文法の例を以下に示す。

Ｓ→N VP VP→V N Ｎ→“boys" Ｎ→“apples" Ｖ→“eat" これにより、“boys eat apples"なる文が生成でき
る。文脈自由文法は、正規文法と比較して再帰的な生成
規則を扱えるという特徴を持っている。

このような文脈自由文法を用いて連続音声を認識する
方法も既にある。このような方法として、たとえば文献
２の第128頁以降に、CYK法やアーリー（Earley）法が示
されている。

（発明が解決しようとする問題点）連続音声を認識する場合、文献１に述べられているよ
うな有限状態オートマトンを用いた方法では、表現でき
る文法が正規文法に限定されてしまう。文脈自由文法を
有限状態オートマトンに展開する場合、生成規則中に、
たとえば、Ｓ→aSb Ｓ→ab のような再帰表現があると、ネットワークが無限に生成
されてしまうため扱うことができない。このような、従
来の有限状態オートマトンを用いた方法では自然言語を
表現するために高い表現力を有する文脈自由文法を扱う
ことはできないとう欠点があった。

また、文献２に述べられているようなCYK法やアーリ
ー法によれば文脈自由文法を扱うことができるが、計算
量がきわめて多いという欠点があった。

本発明は、有限状態オートマトンを用いた方法と同等
の処理量で文脈自由文法が扱える高性能な連続音声認識
装置を提供することを目的とする。

（問題点を解決するための手段）本願の第１の発明による連続音声認識装置は、予め定
められた認識単位の標準パターンを、予め定められたネ
ットワークに従って結合して連続音声認識装置におい
て、前記ネットワークは、ネットワーク中の予め定めら
れた呼び出し点と戻り点の間に挿入されるサブネットワ
ークを含み、標準パターンを記憶しておく標準パターン
メモリと、入力された音声パターンと標準パターンの各
フレーム間の距離を求める距離計算部と、前記音声パタ
ーンと標準パターンのフレームを対応付けるマッチング
パス上の前記距離の累積値を求める累積値計算部と、前
記累積値を記憶しておく累積値メモリと、サブネットワ
ークの戻り点のアドレスを前記累積値メモリと同一のア
ドレスに対応付けて記憶しておく戻り点メモリと、サブ
ネットワークに対する複数の呼び出し点における累積値
の最小値を前記サブネットワークの累積値の初期値とし
て累積値メモリに書き込み、前記最小値を与える呼び出
し点に対応する戻り点のアドレスを初期値として戻り点
メモリに書き込む呼び出し処理部と、サブネットワーク
の終端における戻り点メモリ中に保持されている戻り点
のアドレスによりアドレスされる累積値メモリ中に前記
サブネットワークの終端における累積値を書き込む戻り
処理部とを有する。

本願の第２の発明による連続音声認識装置は、前記本
願の第１の発明に加え、サブネットワークに対応する複
数の呼び出し点における累積値の小さい法から上位Ｎ位
（Ｎは１以上の任意の数）の候補に対して累積値および
戻り点のアドレスを、累積値メモリおよび戻り点のメモ
リの中にＮ位分用意されたサブネットワークの領域の初
期値として書き込む呼び出し処理部とを有する。

本願の第３の発明による連続音声認識装置は、前記本
願の第２の発明に加え、累積値の候補として残す数Ｎを
サブネットワーク毎に指定するための補数数テーブルを
有する。

本願の第４の発明による連続音声認識装置は、前記本
願の第１の発明に加え、サブネットワークに対する複数
の呼び出し点における累積値の最小値および前記最小値
との差があらかじめ定められた値以下の候補に対する累
積値および戻り点のアドレスを、累積値メモリおよび戻
り点メモリの中のそれぞれ用意されたサブネットワーク
の領域の初期値として書き込む呼び出し処理部とを有す
る。

本願の第５の発明による連続音声認識装置は、前記本
願の第1,2,3,4の発明に加え、サブネットワークおよび
呼び出し点と戻り点で区切られた部分ネットワークに対
する累積地メモリ中の領域内に処理すべき累積値が存在
しない場合、そのネットワークに対する全ての処理を中
止する処理制御部とを有する。

本願の第６の発明による連続音声認識装置は、前記本
願の第1,2,3,4,5の発明に加え、累積値メモリと同一の
アドレスに対してマッチングパス上のサブネットワーク
の始端に対応付けられた音声パターンに対するフレーム
を記憶しておく経路値メモリと、呼び出し処理部におい
てサブネットワークの始端における戻り点のアドレスを
フレームに書き込み、戻り処理部においてサブネットワ
ークの終端における前記経路値メモリ中に保持されてい
るフレームによりアドレスされるフレームから戻り点の
アドレスが読みだされる、戻り点のアドレスを保持する
戻り点テーブルとを有する。

（作用）本発明による連続音声認識装置の作用について説明す
る。本発明では、文献１に述べられているような有限状
態オートマトンを用いた連続音声認識方法にザブネット
ワークに対する呼び出し、戻り処理を加えることにより
文脈自由文法を扱えるようにしたものである。

まず、有限状態オートマトン中にサブネットワークに
対する呼び出し・戻り処理を導入しプッシュダウン・オ
ートマトンに拡張する。第５図はブッシュダウン・オー
トマトンの動作を説明する図である。呼び出し枝におい
てサブネットワーク呼び出され、戻り枝においてサブネ
ットワークからもとのネットワークへ処理が戻される。
このようなプッシュダウン・オートマトンは、例えば、
共立出版（株）刊の新美著「音声認識」の第157頁に述
べられているように、文脈自由文法とは全く等価であ
る。しかし、このプッシュダウン・オートマトンを、そ
のまま有限状態オートマトンを用いた連続音声認識方法
に適用しようとしても、サブネットワークの再帰呼び出
しがある場合、ネットワークが無限に生成されるため適
用は不可能である。

そこで、本願の第１の発明では、あるサブネットワー
クを呼び出す全ての呼び出し枝の元（呼び出し点）にお
ける距離の累積値の最小値を（３）式におけるサブネッ
トワークの累積値ｇの初期値ｇ（n;i,0）とする。それ
と共に、この最小値をあたえる呼び出し枝の先（戻り
点）のアドレスを、戻り点のアドレスｍの初期値ｍ（n;
i,0）に代入する。この戻り点のアドレスｍは、入力パ
ターンの始端フレームを伝播させる（５）式における経
路値Ｌと同様、（４）式の漸化式計算結果に従って以下
のように計算する。

［１］ｍ（n;i,j）＝ｍ（n;i−1,j）［２］ｍ（n;i−1,j−１）［３］ｍ（n;i−1,j−２）（６）サブネットワークの終端では、始端において最小値を
与えた戻り点のアドレスｍ（n;i,Jn）を読みだし、その
アドレスに対するネットワークｋの累積値ｇの初期値ｇ
（k,i,0）として累積値ｇ（n,i,Jn）を代入する。

このような方法によると、無限にネットワークが生成
されることなく、有限状態オートマトンを用いた場合と
ほとんど同じ計算量でプッシュダウン・オートマトンに
よる処理を実現することができる。しかし、サブネット
ワークの初期値を求めるための最小値の決定が終端にお
けるパスの選択に影響をあたえるため、厳密にはDPの原
理が成立せず、得られる解は準最適なものとなる。サブ
ネットワークの始端において、全体を最適化するパス以
外のパスが選択されるという誤りが生じたとしても、直
接誤認識に結び付くとは限らないが、この誤りによる影
響はできるだけ小さくする必要がある。

この点を考慮し、本願の第２の発明ではサブネットワ
ークを呼び出す全ての呼び出し点における距離の累積値
の中で最小値から上位Ｎ位（Ｎは１以上の任意の数）の
複数個の候補を求め、それぞれ候補毎にサブネットワー
クにおける（４）式（５）式（６）式の漸化式計算を独
立して行う。

また、一般にサブネットワークによって呼び出される
回数は異なるが、呼び出される回数が多いサブネットワ
ークほど始端におけるバスの選択誤りが生じやすいとい
える。呼び出される回数以外にも、呼び出されるまでに
類似した単語があるか否か等さまざまな要因で誤りやす
さが決まる。そこで、本願の第３の発明では、それぞれ
のサブネットワークに対して候補の数Ｎをあらかじめ定
めるためのテーブルを用意する。これにより、誤りが生
じやすそうなサブネットワークに対してはＮを大きく、
誤る可能性の少ないサブネットワークについてはＮを少
なくするという調整が可能になり、最小限の計算量の増
加で選択誤りに対処することができる。

本願の第４の発明では、サブネットワークを呼び出す
場合、候補の数として予めＮ位というように数を定めず
に、累積値を最小値をとる呼び出し点、および、累積値
と求められた最小値との差があらかじめ定められた値Ｔ
以下の呼び出し点の累積値を候補とする。これにより、
実際の音声パターンに即した数の候補を残すことができ
る。距離による基準に加えて、候補数の最大値を予め決
めておくこともできる。

このように、サブネツトワークの候補の数を累積値に
従って変えられるようにすると、予め用意されたサブネ
ツトワークの複数の候補のための領域に累積値ｇの初期
値が与えられないこともある。また、サブネツトワーク
を呼び出す場合、ある呼び出し点が選択されないなら
ば、その呼び出し点に対する戻り点に初期値が与えられ
ることはない。初期値が与えられなければ、サブネツト
ワークおよび戻り点以降の部分ネツトワークに対する
（４）式（５）式（６）式の漸化式計算を行う必要はな
い。

さらに、漸化式が標準パターン方向に対しても傾斜制
限を行っている場合、たとえば以下のような漸化式を用
いる場合、ｇ（n;i,j）＝ｄ（n;i,j）＋min［ｇ（n;i−2,j−１）,
g（n;i−1,j−１）,g（n;i−1,j−２）］（７）最初に初期値が与えられてから一定のフレーム数の間連
続して初期値が与えられないならば、漸化式の計算を行
う必要はなくなる。この一定のフレーム数とは、たとえ
ば（７）式の漸化式の場合、２×Jnフレームとなる。

そこで、本願の第５の発明では、漸化式計算を行う必
要のない場合は部分ネツトワーク（サブネツトワークも
含む）中に漸化式の計算および下位のサブネツトワーク
を呼び出す処理を行わないようにする。すなわち、ある
部分ネツトワークに対して初期値が設定される前か、ま
たは最後に初期値が設定されてから定められた一定のフ
レーム数が経過した場合は漸化式の計算をふくめた部分
ネツトワークに対する全ての処理を中止できるようにし
て、無駄な計算を行わないようにする。

さらに、これまでの説明では、戻り点のアドレスｍを
（６）式のように漸化式と共に計算していた。しかし、
漸化式計算は計算回数が多いため、（６）式の計算量も
無視できない。そこで、本願の第６の発明では、入力パ
ターンのフレームｉ（１≦ｉ≦Ｉ）に対応して、戻り点
のアドレスを保持するための戻り点テーブルＭ（ｉ）を
用意する。まず、サブネツトワークの始端において、戻
り点のアドレスを戻り点テーブルＭ（ｉ）に代入する。
漸化式計算を行うときは、（５）式に示す経路値Ｌの計
算だけを行う。サブネツトワークの終端では、経路値Ｌ
から、始端に対応付けられたフレームis＝Ｌ（n;i,Jn）
を読みだし、このisを用いて戻り点テーブルＭ（is）か
ら戻り点のアドレスを読みだし、さらに、そのアドレス
に対するネツトワークｋの初期値ｇ（k;i,0）として累
積値ｇ（n;i,Jn）を代入する。これにより、漸化式計算
時の処理は、従来の有限状態オートマトンを用いた連続
音声認識方法の場合と同じになる。また、文レベル処理
は単語レベル処理に比べて全体の処理量が少なく、かつ
今回の方法の処理量も従来のものとほとんど変わらない
ので計算量が増えるとはない。

（実施例）本発明による連続音声認識装置の実施例について図面
を参照して説明する。

第１図は本願の第１〜５の発明による一実施例を示す
構成図である。

標準パターンメモリ１には、予め標準パターンＢが保
持されている。距離計算部２では、入力パターンＡのｉ
番目のフレームの特徴a_iと、単語ｎの標準パターンB_nの
ｊ番目のフレームの特徴量b_njが読みだされ特徴量間の
距離ｄ（n;i,j）が計算された出力される。また、累積
値計算部３では、入力された距離ｄを用いて、（４）式
に示した漸化式計算が行われる。漸化式計算に必要な累
積値ｇは、累積値メモリ４の中に保持されており、必要
に応じて累積値計算部３より、読みだし、書き込みの処
理が行われる。同様に戻り点メモリ５には戻り点のアド
レスｍが保持れており、これを用いて累積値計算部３で
は漸化式計算と共に（６）式の計算が行われる。以上が
単語レベル処理であり、これまでは従来の文献１に述べ
られているようなフレーム同期DPマッチングによる連続
音声認識方法と同じである。

続いて文レベル処理について説明する。入力パターン
Ａのｉ番目のフレームに対して単語レベルの処理が終了
すると、まず呼び出し処理部６では、累積値メモリ４か
ら呼び出し点における累積値ｇの値が読みだされる。そ
れらの値が比較され、求められた累積値ｇがサブネツト
ワークの初期値といて累積値メモリ４に書き込まれる。
また、求められた累積値に対する戻り点のアドレスｍが
戻り点メモリ５に書き込まれる。

戻り処理部７では、累積値メモリ４からからサブネツ
トワークの終端における累積値ｇが読みだされ、戻り点
メモリ５から戻り点のアドレスｍが読みだされる。続い
て、読みだした累積値ｇをアドレスｍによりアドレスさ
れる累積値メモリ４の中に書き込む。

以下、文レベル処理について例を用いて詳しく説明す
る。ここで、文法の例として、以下に示す生成規則Ｕを
用いる。

Ｕ→m P n P k （８）Ｐ→ｓ（９）ここで、m,n,k,sは終端記号すなわち単語の標準パタ
ーンを表し、Ｐは非終端記号を表す。この例では再帰呼
び出しはないが、再帰呼び出しがある場合でも同様に処
理を行うことができる。

まず、本願の第１の発明による一実施例の文レベル処
理について説明する。第２図は本願の第１の発明におけ
る文レベル処理を説明する模式図である。累積値メモリ
４は（４）式における累積値ｇの値を保持するメモリで
あり、戻り点メモリ５は（６）式の戻り点のアドレスｍ
を保持するメモリである。これらは、第１図における累
積値メモリ４および戻り点メモリ５と同じものである。
また図に示すように、単語m,n,k,sに対する累積値ｇの
領域が用意されている。それぞれの単語始端点、終端点
に対する累積値メモリ４および戻り点メモリ５上のアド
レスをm:m1,mJm, n:n1,nJn, k:k1,kJk, s:s1,sJsとす
る。これより、サブネツトワークＰに対する呼び出し点
のアドレスはmJmとnJnとなる。また、戻り点のアドレス
は、累積値メモリ４に初期値を代入するアドレスであ
り、始端の一つ前のアドレスのn0,k0となる。

まず、呼び出し処理部６では、累積値メモリ４より呼
び出し点mJmにおける累積値ｇ（m;i,mJm）と、呼び出し
点nJnにおける累積値ｇ（n;i,nJn）が読みだされ比較さ
れる。これらの中の最小値、すなわち小さい方の累積値
mingが、サブネツトワークＰの累積値の初期値ｇ（s;i,
s0）として、アドレスs0の累積値メモリ４に書き込まれ
る。また、このときmingを与える呼び出し点に対する戻
り点アドレスmin0（n0またはk0）が、サブネツトワーク
Ｐの戻り点アドレスの初期値ｍ（s;i,s0）として、アド
レスs0の戻り点メモリ５に書き込まれる。

戻り処理部７では、最初に全ての戻り点n0,k0に対す
る累積値メモリ４に大きな値を書き込んで初期化してお
く。続いて、戻り点メモリ５よりサブネツトワークＰの
終端sJsにおける戻り点アドレスｍ（s:i,sJs）＝min0′
が読みだされる。また累積値メモリ４より終端の累積値
ｇ（s:i,sJs）が読みだされ、累積値メモリ４中のすで
に読みだされた戻り点アドレスmin0′の位置に書き込ま
れる。以上で文レベル処理は終了する。

次に本願の第２の発明による一実施例の文レベル処理
について説明する。第３図は本願の第2,3,4,5の発明に
おける文レベル処理を説明する模式図である。本願の第
２の発明では、一つのサブパターンに対して、累積地メ
モリ４と戻り点メモリ５の中に複数個の領域を用意して
いる。例えば、上位２位までのパスを保存するとすれ
ば、サブパターンＰに対しP1,P2の２つの領域を用意す
る。領域P1,P2の単語ｓの始端点、終端点に対する累積
値メモリ４および戻り点メモリ５上のアドレスをs10,s1
Jsおよびs20,s2Jsとする。

呼び出し処理部６では、累積値メモリ４より呼び出し
点mJmにおける累積値ｇ（m;i,mJm）と、呼び出し点nJn
における累積値ｇ（n;i,nJn）が読みだされ比較により
候補が選択される。ここでは、候補として小さい方から
Ｎ位の累積値をming（Ｎ）とすると、２位までの累積値
ming（１）、ming（２）が選ばれる。これらの値は領域
P1,P2の累積値の初期値ｇ（s;i,s10），（s;i,s20）と
して、アドレスs10、s20の累積値メモリ４に書き込まれ
る。また、このときming（１）、ming（２）に与える呼
び出し点に対する戻り点アドレスmin10,min20（n0また
はk0）が領域P1、P2の戻り点アドレスの初期値ｍ（s;i,
s10）,m（s;i,s20）として、戻り点メモリ５に書き込ま
れる。戻り処理部７での処理は本願の第１の発明の場合
と全く同じである。

次に本願の第３の発明による一実施例の文レベル処理
について説明する。本願の第３の発明では、本願の第２
の発明に加えて候補数テーブル８を有している。呼び出
し処理部６において、累積メモリ値４より読みだされた
呼び出し点の累積値ｇのうち、小さい方からＮ位の累積
値ming（Ｎ）を選び出す場合、このＮの値としてサブネ
ツトワーク毎に候補数テーブル８中にあらかじめ保持さ
れている値を読みだして用いる。他の処理は本願の第２
の発明と全く同じである。

次に本願の第４の発明による一実施例の文レベル処理
について説明する。本願の第４の発明では、呼び出し処
理部６において、累積メモリ値４より読みだされた呼び
出し点における累積値ｇの中から複数の候補をつぎのよ
うに選択する。まず、呼び出し点における累積値ｇの中
から最小値mingを選び出す。つづいて、呼び出し点にお
ける累積値ｇの中から、最小値mingとの差が予め定めら
れた閾値Ｔ以下のもの、すなわち、ｇ−ming＜Ｔ（10）を満たすｇが選択される。選択された累積値ｇおよび戻
り点のアドレスの値は、累積値メモリ４と戻り点メモリ
５の中に、複数個用意されたサブネツトワークの領域の
初期値として書き込まれる。他の処理は本願の第２の発
明と全く同じである。

次に本願の第５の発明による一実施例の文レベル処理
について説明する。本願の第５の発明では、累積値メモ
リ４と戻り点メモリ５の中の部分ネツトワークの始端s1
0,s20,n0,k0に初期値が書き込まれると、書き込み情報
ｗが処理制御部９に出力される。処理制御部９では、書
き込み情報ｗに入力されると、書き込み情報ｗに対する
部分ネツトワークを示す制御信号ｃが、累積値計算部
３、呼び出し処理部６、戻り処理部７に出力され処理の
開始が指示される。この制御信号ｃが入力されると、そ
の部分ネツトワークに対する単語レベル処理および文レ
ベル処理が行われるようになる。制御信号ｃによる処理
の開始が指示がなければ、そのサブネツトワークに関す
るこれらの処理は行われない。

処理制御部９では、初期値が設定されると、部分ネツ
トワーク毎に入力フレーム数のカウントを開始する。定
められたカウント数の間初期値が設定されない場合は、
制御信号ｃにより部分ネツトワークに対する処理の中止
が指示される。他の処理は本願の第1,2,3,4の発明と全
く同じである。

次に本願の第６の発明による一実施例について説明す
る。第４図は本願の第６の発明による一実施例を示す構
成図である。入力パターンのフレームｉに対応して、戻
り点のアドレスＭ（ｉ）を保持するための戻り点テーブ
ル10を用意する。まず、フレームｉにおいて、呼び出し
処理部６によりサブネツトワークＰに対する戻り点のア
ドレスが戻り点のテーブル10のフレームｉに書き込まれ
る。単語レベル処理では、累積値計算部３において
（４）式の漸化式計算と共に経路値メモリ11を用いて
（５）式に示す経路値Ｌの計算が行われる。この計算
は、本願の第１〜５の発明においても文献１に示されて
いる従来法と同様、認識結果を得るために行う必要があ
るものである。戻り処理部７によって、サブネツトワー
クの始端に対応付けられたフレームｉ′がサブネツトワ
ークの終端における経路値Ｌ（s;i,sJs）として、経路
値メモリ11から読みだされる。このフレームｉ′の値を
アドレスとして戻り点テーブル10から戻り点のアドレス
Ｍ（ｉ′）が読みだされる。さらに、累積値メモリ４中
の戻り点アドレスＭ（ｉ′）に、サブネツトワークの終
端における累積値ｇ（s;i,sJs）が書き込まれる。その
他の処理については、本願の第１〜５の発明と全く同じ
である。

（発明の効果）本発明によれば、文脈自由文法が扱えてかつ計算量が
少ない高性能な連続音声認識装置を実現することができ
る。

【図面の簡単な説明】

第１図は、本願の第１〜５の発明による一実施例を示す
構成図。第２図は、本願の第１の発明における文レベル処理を説
明する模式図。第３図は、本願の第2,3,4,5の発明における文レベル処
理を説明する模式図。第４図は、本願の第６の発明による一実施例を示す構成
図。第５図は、プッシュダウン・オートマトンの動作を説明
する図である。図において、１…標準パターンメモリ、２…距離計算
部、３…累積値計算部、４…累積メモリ、５…戻り点メ
モリ、６…呼び出し処理部、７…戻り処理部、10…戻り
点テーブル、11…経路値メモリ。

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁶，ＤＢ名) G10L 3/00 533 G10L 3/00 561 G10L 5/06 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】予め定められた認識単位の標準パターン
を、予め定められたネットワークに従って結合して連続
音声を認識する連続音声認識装置において、前記ネット
ワークは、ネットワーク中の予め定められた呼び出し点
と戻り点の間に挿入されるサブネットワークを含み、標
準パターンを記憶しておく標準パターンメモリと、入力
された音声パターンと標準パターンの各フレーム間の距
離を求める距離計算部と、前記音声パターンと標準パタ
ーンのフレームを対応付けるマッチングパス上の前記距
離の累積値を求める累積値計算部と、前記累積値を記憶
しておく累積値メモリと、サブネットワークの戻り点の
アドレスを前記累積値メモリと同一のアドレスに対応付
けて記憶しておく戻り点メモリと、サブネットワークに
対する複数の呼び出し点における累積値の最小値を前記
サブネットワークの累積値の初期値として累積値メモリ
に書き込み、前記最小値を与える呼び出し点に対応する
戻り点のアドレスを初期値として戻り点メモリに書き込
む呼び出し処理部と、サブネットワークの終端における
戻り点メモリ中に保持されている戻り点のアドレスによ
りアドレスされる累積値メモリ中に前記サブネットワー
クの終端における累積値を書き込む戻り処理部とを有し
て成ることを特徴とする連続音声認識装置。
【請求項２】サブネットワークに対する複数の呼び出し
点における累積値の小さい方から上位Ｎ位（Ｎは１以上
の任意の数）の候補に対して累積値および戻り点のアド
レスを、累積値メモリおよび戻り点のメモリの中にＮ位
分用意されたサブネットワークの領域の初期値として書
き込む呼び出し処理部とを有する請求項１記載の連続音
声認識装置。
【請求項３】累積値の候補として残す数Ｎをサブネット
ワーク毎に指定するための候補数テーブルを有する請求
項２記載の連続音声認識装置。
【請求項４】サブネットワークに対する複数の呼び出し
点における累積値の最小値および前記最小値との差があ
らかじめ定められた値以下の候補に対する累積値および
戻り点のアドレスを、累積値メモリおよび戻り点メモリ
の中のそれぞれ用意されたサブネットワークの領域の初
期値として書き込む呼び出し処理部とを有する請求項１
記載の連続音声認識装置。
【請求項５】サブネットワークおよび呼び出し点と戻り
点で区切られた部分ネットワークに対する累積値メモリ
中の領域内に処理すべき累積値が存在しない場合、その
ネットワークに対する全ての処理を中止する処理制御部
とを有する請求項1,2,3,4記載の連続音声認識装置。
【請求項６】累積値メモリと同一のアドレスに対してマ
ッチングパス上のサブネットワークの始端に対応付けら
れた音声パターンに対するフレームを記憶しておく経路
値メモリと、呼び出し処理部においてサブネットワーク
の始端における戻り点のアドレスをフレームに書き込
み、戻り処置部においてサブネットワークの終端におけ
る前記経路値メモリ中に保持されているフレームにより
アドレスされるフレームから戻り点のアドレスが読みだ
される、戻り点のアドレスを保持する戻り点テーブルと
を有する請求項1,2,3,4,5記載の連続音声認識装置。