JP2712856B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2712856B2
JP2712856B2 JP3043582A JP4358291A JP2712856B2 JP 2712856 B2 JP2712856 B2 JP 2712856B2 JP 3043582 A JP3043582 A JP 3043582A JP 4358291 A JP4358291 A JP 4358291A JP 2712856 B2 JP2712856 B2 JP 2712856B2
Authority
JP
Japan
Prior art keywords
frame
distance value
standard pattern
pattern
pattern matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3043582A
Other languages
English (en)
Other versions
JPH04298798A (ja
Inventor
知弘 岩崎
邦男 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP3043582A priority Critical patent/JP2712856B2/ja
Publication of JPH04298798A publication Critical patent/JPH04298798A/ja
Application granted granted Critical
Publication of JP2712856B2 publication Critical patent/JP2712856B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声信号の認識を行う音
声認識装置に関するものである。
【0002】
【従来の技術】図7は例えば古井貞▲おき▼著「大語▲
い▼単語音声認識のためのスペクトル動特性を用いた予
備選択」(昭和61年10月、日本音響学会講演論文
集、1−3−17)に予備選択として示された認識手法
とDTWとして示された認識手法の双方を用いる音声認
識手法に、迫江博昭、藤井浩美共著「ビームサーチとベ
クトル量子化によるDPマッチングの高速化」(昭和6
2年6月、情報電子通信学会音声研究会資料、SP87
−26)に示されたビームサーチ技術を組み合わせた従
来の音声認識装置の内容を表すブロック図である。
【0003】図において21は音声信号を一定区間であ
るフレーム毎に周期的に音響分析し音響パラメータベク
トルの時系列に変換する音響分析手段、22は第一のパ
ターン照合法の標準パターンである第一標準パターンを
記憶する第一標準パターン記憶手段、23はこの第一標
準パターン記憶手段22に記憶された第一標準パターン
に対する第一のパターン照合法に基づく演算を行い音響
分析手段21から出力される音響パラメータベクトル時
系列の全区間に対する距離値である第一距離値を出力す
る第一パターン照合手段、25は第二のパターン照合法
の標準パターンである第二標準パターンとこの第二標準
パターンを用いた演算を行なうか否かを示す演算範囲と
記憶する第二標準パターン記憶手段、26はこの第二
標準パターン記憶手段25に記憶された演算範囲に基づ
いて第二標準パターンを選択し、この選択した第二標準
パターンと、先頭フレームから特定のフレームまでの部
分区間における音響分析手段21から出力される音響パ
ラメータベクトルの時系列とを用いて、第二のパターン
照合法に基づく演算を行い、かつ、この演算の結果を累
積した第二距離値を出力する第二パターン照合手段、2
4は第一パターン照合手段23より出力される第一距離
値に基づき第二パターン照合手段26において演算する
第二標準パターンの演算範囲を限定し、第二標準パター
ン記憶手段25の演算範囲を書き換える予備選択手段、
27は第二パターン照合手段26から出力される先頭フ
レームから前記特定のフレームまでの部分区間に対する
第二距離値を用いて次のフレームの音響パラメータベク
トルに対し第二パターン照合手段26において演算する
第二標準パターンの演算範囲を限定し、第二標準パター
ン記憶手段25の演算範囲を書き換えるビームサーチ手
段、28は第二パターン照合手段26から最終フレーム
の処理後に出力される音響パラメータベクトル時系列の
全区間に対する第二距離値を用いて認識結果を決定する
認識結果決定手段、29は音声信号、30a、30bは
音響パラメータベクトル、31は第一標準パターン、3
2は第一距離値、33は第二標準パターン、34は第二
距離値、35a、35bは演算範囲、36は認識結果、
37は音響パラメータベクトルの時系列の全区間に対す
る第二距離値(全体距離値)である。
【0004】次に従来の音声認識装置の動作について説
明する。以下、第一パターン照合法としてはVQ歪に基
づくパターン照合法を用い、第二パターン照合法として
はフレーム間距離をユークリッド距離としDTWに基づ
くパターン照合法を用い、第二標準パターンの演算範囲
は単語単位で選択する認識装置を例として説明する。図
8〜13は従来の音声認識装置の動作を示す流れ図であ
る。まず記号について説明する。 Nは認識しようとする単語数、 nは単語番号であり、最小値は1、最大値はNである。 Iは音響パラメータベクトルの時系列のフレーム長、 iは音響パラメータベクトルの時系列のフレーム番号で
あり、最小値は1、最大値はIであり、 x(i)は音響パラメータベクトルの時系列の第iフレー
ムのベクトルである。 J(n)は単語nの第二標準パターンのフレーム長、 jは第二標準パターンのフレーム番号であり、最小値は
1、最大値はJ(n)であり、 y(n,j)は単語nの第二標準パターンの第jフレーム
のベクトルである。 T1は予備選択のための▲しきい▼値、 θ1は予備選択のためのパラメータ、 T2はビームサーチのための▲しきい▼値、 d1(n,i)はベクトルx(i)の単語nの第一標準パター
ンに対するVQ歪み、 D1(n)は全フレームにおける音響パラメータベクトル
の時系列と単語nの第 一標準パターンとの間の第一距離
値、 θ2はビームサーチのためのパラメータ、 d2(n,i,j)はベクトルx(i)とベクトルy(n,j)の
間のユークリッド距離に基づくフレーム間距離値、 g(n,i,j)はDTWに基づくフレーム間距離の累積値
である第二距離値、 D2(n)はビームサーチのための第二距離値の評価値、 m(n)は第二標準パターン記憶手段25の単語nの第二
標準パターンの演算範囲を単語単位で指定するマーク、 D4(n)は音響パラメータベクトルの時系列の全区間に
対する単語nの第二距 離値(全体距離値)である。 また、図10において
【0005】
【数1】
【0006】はD1(n)のnに関する最小値、図11、
図12において
【0007】
【数2】
【0008】はg(n,i,j)のjに関する最小値、図1
2において
【0009】
【数3】
【0010】はg(n,i−1,1)とg(n,i−1,2)の
小さい方の値、
【0011】
【数4】
【0012】はg(n,i−1,j)、g(n,i−1,j−
1)、g(n,i−1,j−2)の最も小さな値、図13に
おいて
【0013】
【数5】
【0014】はD2(n)に関する最小値を意味する演算
記号である。流れ図において処理は図8のstart4
1から始まり図9のend53で終了する。認識に先立
ち、第一標準パターン記憶手段22には第一標準パター
ンが既に記憶され、第二標準パターン記憶手段25には
第二標準パターンが入っているものとする。音声区間の
音声信号が入力され音響分析手段21において音響分析
され、第iフレームをベクトルx(i)とする音響パラメ
ータベクトルの時系列に変換される。第一パターン照合
手段23ではベクトルx(i)に対し単語nの第一標準パ
ターンとの演算が行われVQ歪、 d1(n,i) が求められる。上記の演算を音響パラメータベクトルの
全フレームにわたって行い、単語nの第一距離値
【0015】
【数6】
【0016】が求められ出力される。予備選択手段24
では第一距離値D1(n)の大小により第二パターン照合
手段26において演算する単語を決定し第二標準パター
ン記憶手段の演算範囲を書き換える。第二パターン照合
手段ではベクトルx(i)と単語番号nの第二標準パター
ンの第jフレームのベクトルy(n,j)に関するユーク
リッド距離に基づくフレーム間距離値d2(n,i,j)が
演算され、DTWに基づきフレーム間距離値の累積が行
われ第二距離値g(n,i,j)が求められる。
【0017】まず、42〜44において第二標準パター
ン記憶手段25のマークm(n)の初期化を行う。第一パ
ターン照合手段23では45〜47において第一距離値
D1(n)の演算が行われる。48〜52において音響パ
ラメータベクトルx(i)に対する処理がiに関して順々
に繰り返される。i=0つまり第二パターン照合手段2
6での処理に先立ち55〜60において予備選択が行わ
れ、i=1の場合には61〜70において第二パターン
照合演算の初期化と第1フレームに対するビームサーチ
が行われ、i>=2の場合には71〜80において第2
フレーム以降の第二パターン照合演算とビームサーチが
行われる。予備選択手段24では第一距離値D1(n)を
用い、55において▲しきい▼値T1が計算され、57
においてD1(n)が▲しきい▼値より小さい単語のみ選
択し、58において第二標準パターン記憶手段25の選
択されなかった単語のマークm(n)を消去する。
【0018】続いて第二パターン照合演算が開始され
る。第1フレームの場合は第二パターン照合手段26で
は62において第二標準パターン記憶手段25にマーク
された単語のみ選択し、63〜66において第二パター
ン照合演算の初期化を行い第二距離値g(n,1,j)を出
力する。ビームサーチ手段27では68においてビーム
サーチのための評価値であるD2(n)が求めら、62に
おいて選択されなかった単語のD2(n)は67において
無限大の値がいれられ、82においてビームサーチのた
めの▲しきい▼値T2が求められ、84においてD2(n)
がT2より小さい単語のみ選択し、85において第二標
準パターン記憶手段25の選択されなかった単語のマー
クm(n)を消去する。
【0019】第2フレーム以降の場合は第二パターン照
合手段26では72において第二標準パターン記憶手段
25にマークされた単語のみ選択し、73〜76におい
てDTWに基づくフレーム間距離値d2(n,i,j)の累
積を行い第二距離値g(n,i,j)を出力する。ビームサ
ーチ手段27では78において第二距離値のビームサー
チのための評価値D2(n)を求め、72において選択さ
れなかった単語のD2(n)は77において無限大の値が
いれられ、次に82においてビームサーチのための▲し
きい▼値T2が求められ、84においてD2(n)がT2よ
り小さい単語のみ選択し、85において第二標準パター
ン記憶手段25に選択されなかった単語のマークm(n)
を消去する。上記の処理をIフレームまで繰り返し、最
終的に認識結果決定手段28においてビーム内に残留し
ている(第二標準パターン記憶手段のマークが1であ
る)単語の全体距離値D4(n) D4(n)=g(n,I,J(n)) のうちnに関して最も値の小さな単語を認識結果36と
して出力する。
【0020】
【発明が解決しようとする課題】従来の音声認識装置は
以上のように構成されているため、ビームサーチは第二
距離値34のみを用いて行わなければならず、ビームサ
ーチにより認識性能を劣化させることなく十分な演算量
削減ができないという問題点があった。また、菅原一秀
著「双方向予測による予備選択」(昭和63年10月、
日本音響学会昭和63年秋季発表会講演論文集3−3−
10)には、第一のパターン照合法としてポーリングを
用い、第二のパターン照合法としてHMMを用い、それ
ぞれの距離値によって第二のパターン照合法の演算範囲
を制限する(ビームサーチ)手法が示されている。しか
し、この手法では、第一のパターン照合法として、どの
フレームの音響パラメータベクトルに対してもそのフレ
ームに続く一定フレーム数(10フレーム固定)の演算
結果を用いているため、この文献の表1に示されている
ように、CPU時間において話者1が17.9%、話者
2が7.8%の演算量削減効果しか得られない結果が報
告されている。このように、第一のパターン照合法とし
て、どのフレームの音響パラメータベクトルに対しても
一定数のフレームの部分空間を用いるこの手法では、大
きな演算量削減ができないという問題点があった。
【0021】この発明は上記のような問題点を解決する
ためになされたもので、ビームサーチを有効に行える構
成とすることにより第二パターン照合手段での演算量を
低価格の演算器でも演算可能な範囲まで削減し、その結
果安価な音声認識装置を得ることを目的とする。
【0022】
【課題を解決するための手段】この発明に係る音声認識
装置は、前記音声信号をフレーム毎に音響分析し音響パ
ラメータベクトルの時系列に変換する音響分析手段と、
前記第一標準パターンを記憶する第一標準パターン記憶
手段と、演算開始フレームを先頭フレームから所定フレ
ーム毎に順次繰り下げてそれぞれ最終フレームまで、前
記音響分析手段より出力される前記音響パラメータベク
トル時系列と前記第一標準パターン記憶手段に記憶され
た前記第一標準パターンとを用いて第一のパターン照合
法に基づく演算を行ない、この演算の結果をそれぞれ累
積した第一距離値を出力する第一パターン照合手段と、
この第一パターン照合手段より出力される前記第一距離
値を記憶する距離値記憶手段と、前記第二標準パターン
とこの第二標準パターンを用いた演算を行なうか否かを
示す演算範囲とを記憶する第二標準パターン記憶手段
と、先頭フレームから特定フレームまでの前記音響分析
手段より出力される前記音響パラメータベクトル時系列
と前記第二標準パターン記憶手段に記憶された前記演算
範囲により演算を行うことを示されている前記第二標準
パターンとを用いて第二のパターン照合法に基づく演算
を行ない、この演算の結果を先頭フレームから前記特定
フレームまで累積した第二距離値を出力する第二パター
ン照合手段と、この第二パターン照合手段より出力され
る前記第二距離値と前記距離値記憶手段に記憶された前
記特定フレームから最終フレームまでの前記第一距離値
との双方を用いて前記第二パターン照合手段において次
に演算する前記第二標準パターンの前記演算範囲を決定
し前記第二標準パターン記憶手段の前記演算範囲を書き
換え、前記第二パターン照合手段において次に処理すべ
き前記特定フレームを次の所定フレームに変更するビー
ムサーチ手段と、前記第二パターン照合手段より最終フ
レームの処理後に出力される前記第二距離値を用いて認
識結果を決定する認識結果決定手段とを備えたものであ
る。
【0023】
【作用】この発明における第一パターン照合手段は、演
算開始フレームを先頭フレームから所定フレーム毎に順
次繰り下げてそれぞれ最終フレームまで、前記音響分析
手段より出力される前記音響パラメータベクトル時系列
と前記第一標準パターン記憶手段に記憶された前記第一
標準パターンとを用いて第一のパターン照合法に基づく
演算を行ない、この演算の結果をそれぞれ累積した第一
距離値を距離値記憶手段に出力し、第二パターン照合手
段は、先頭フレームから特定フレームまでの前記音響分
析手段より出力される前記音響パラメータベクトル時系
列と前記第二標準パターン記憶手段に記憶された前記演
算範囲により演算を行うことを示されている前記第二標
準パターンとを用いて第二のパターン照合法に基づく演
算を行ない、この演算の結果を先頭フレームから前記特
定フレームまで累積した第二距離値を出力し、ビームサ
ーチ手段は、前記第二パターン照合手段より出力される
前記第二距離値と前記距離値記憶手段に記憶された前記
特定フレームから最終フレームまでの前記第一距離値と
の双方を用いて前記第二パターン照合手段において次に
演算する前記第二楳準パターンの前記演算範囲を決定し
前記第二標準パターン記憶手段の前記演算範囲を書き換
え、前記第二パターン照合手段において次に処理すべき
前記特定フレームを次の所定フレームに変更する。
【0024】
【実施例】実施例1. 以下、この発明の一実施例を図1について説明する。図
1において、01は音声信号を一定区間毎に音響分析し
音響パラメータベクトルの時系列に変換する音響分析手
段、02は第一のパターン照合法の標準パターンである
第一標準パターンを記憶する第一標準パターン記憶手
段、03は演算開始フレームを先頭フレームから1フレ
ーム毎に順次繰り下げてそれぞれ最終フレームまでを演
算対象とし、ある特定フレームから最終フレームまでの
部分区間においては、この部分区間における音響分析手
段01から出力される音響パラメータベクトルの時系列
と、第一標準パターン記憶手段02に記憶された第一標
準パターンとを用いて、第一のパターン照合法に基づく
演算を行い、この演算の結果を前記特定フレームから最
終フレームまで累積した第一距離値を出力する第一パタ
ーン照合手段、04はこの第一パターン照合手段03
り出力される第一距離値を記憶する距離値記憶手段、0
5は第二のパターン照合法の標準パターンである第二標
準パターンとこの第二標準パターンを用いた演算を行な
うか否かを示す演算範囲とを記憶する第二標準パターン
記憶手段、06はこの第二標準パターン記憶手段05に
記憶された演算範囲に基づいて第二標準パターンを選択
し、この選択した第二標準パターンと、先頭フレームか
ら特定のフレームまでの部分区間における音響分析手段
01から出力される音響パラメータベクトルの時系列と
を用いて、第二のパターン照合法に基づく演算を行い、
かつ、この演算の結果を累積した第二距離値を出力する
第二パターン照合手段、07は第二パターン照合手段0
より出力される先頭フレームから前記特定のフレーム
までの前部分区間に対する第二距離値と距離値記憶手段
04に記憶され前記前部分区間と重複しない後部分区間
に対する第一距離値との双方を用いて次のフレームの音
響パラメータベクトルに対し第二パターン照合手段06
において演算する第二標準パターンの演算範囲を決定
し、第二標準パターン記憶手段05の演算範囲を書き換
えるビームサーチ手段、08は第二パターン照合手段0
6から最終フレームの処理後に出力される音響パラメー
タベクトル時系列の全区間に対する第二距離値を用いて
認識結果を決定する認識結果決定手段、09は音声信
号、10a、10bは音響パラメータベクトル、11は
第一標準パターン、12a、12bは第一距離値、13
は第二標準パターン、14は第二距離値、15は演算範
囲、16は認識結果、17は音響パラメータベクトルの
時系列の全区間に対する第二距離値(全体距離値)であ
る。
【0025】次に本発明による音声認識装置の動作につ
いて説明する。以下、従来の音声認識装置と同じく第一
パターン照合法としてはVQ歪に基づく方法を用い、第
二パターン照合法としてはDTWに基づく方法を用いて
単語の認識を行い、第二標準パターンの演算範囲は単語
単位で選択する認識装置を例として説明する。図2〜7
は本発明による音声認識装置の動作を示す流れ図であ
る。まず記号について説明する。 Nは認識しようとする単語数、 nは単語番号であり、最小値は1、最大値はNである。 Iは音響パラメータベクトルの時系列のフレーム長、 iは音響パラメータベクトルの時系列のフレーム番号で
あり、最小値は1、最大値はIであり、 x(i)は音響パラメータベクトルの時系列の第iフレー
ムのベクトルである。 J(n)は単語nの第二標準パターンのフレーム長、 jは第二標準パターンのフレーム番号であり、最小値は
1、最大値はJ(n)であり、 y(n,j)は単語nの第二標準パターンの第jフレーム
のベクトルである。 d1(n,i)はベクトルx(i)の単語nの第一標準パター
ンに対するVQ歪み、 D1(n,i)は音響パラメータベクトルの時系列の第iフ
レームから最終フレームまでの部分区間における音響パ
ラメータベクトルの時系列と単語nの第一標準パターン
との間の第一距離値、 d2(n,i,j)はベクトルx(i)とベクトルy(n,j)の
間のユークリッド距離に基づくフレーム間距離値、 g(n,i,j)はDTWに基づくフレーム間距離の累積値
である第二距離値、 D2(n)はビームサーチのための第二距離値の評価値、 m(n)は第二標準パターン記憶手段05の単語nの第二
標準パターンの演算範囲を単語単位で指定するマーク、 D3(n)は第二距離値と第一距離値を用いた本方式のビ
ームサーチのための評価値、 θ3は第二距離値と第一距離値を用いた本方式のビーム
サーチのためのパラメータ、 T3は第二距離値と第一距離値を用いた本方式のビーム
サーチのための▲しきい▼値 D4(n)は音響パラメータベクトルの時系列の全区間に
対する単語nの第二距離値(全体距離値) である。 また、図4、図5において前記数2と同一の式はg(n,
i,j)のjに関する最小値、図5において前記数3と同
一の式はg(n,i−1,1)とg(n,i−1,2)の小さい
方の値、前記数4と同一の式はg(n,i−1,j)、g
(n,i−1,j−1)、g(n,i−1,j−2)の最も小さ
な値、図6において
【0026】
【数7】
【0027】はD3(n)のnに関する最小値を意味する
演算記号である。
【0028】流れ図において処理は図2のstart1
01から始まり図3のend116で終了する。認識に
先立ち、第一標準パターン記憶手段02には第一標準パ
ターンが既に記憶され、第二標準パターン記憶手段05
には第二標準パターンとその演算範囲が入っているもの
とする。音声区間の音声信号が入力され音響分析手段0
1において音響分析され、第iフレームをベクトルx
(i)とする音響パラメータベクトルの時系列に変換され
る。第一パターン照合手段03ではベクトルx(i)
語nの第一標準パターンとの演算が行われVQ歪、 d1(n,i) が求められる。上記の演算を音響パラメータベクトルの
全フレームにわたって行い、音響パラメータベクトルの
時系列の第iフレームから最終フレームまでの部分区間
における音響パラメータベクトルの時系列と単語nの第
一標準パターンとの間の第一距離値
【0029】
【数8】
【0030】が求められ、距離値記憶手段04に収めら
れる。但し、演算の都合上、全てのnについて D1(n,I+1)=0 とする。 第二パターン照合手段06ではベクトルx(i)と単語n
の第二標準パターンの第jフレームのベクトルy(n,
j)との間のユークリッド距離に基づくフレーム間距離
値d2(n,i,j)が演算され、DTWに基づきフレーム
間距離値の累積が行われ第二距離値g(n,i,j)が求め
られる。
【0031】まず、102〜104において第二標準パ
ターン記憶手段05のマークの初期化を行う。第一パタ
ーン照合手段03では105〜110において第一距離
値D1(n,i)の演算が行われた後、第2パターン照合手
段06、ビームサーチ手段07では111〜115にお
いて音響パラメータベクトルx(i)に対する処理がiに
関して順々に繰り返される。i=0の場合、第二パター
ン照合手段06では121〜124においてD2(n)に
0を入れ、ビームサーチ手段07では151〜160に
おいて本方式によるビームサーチが行われるが、D2
(n)が0であり、第一距離値として音響パラメータベク
トルの時系列の第1フレームから最終フレームまでの部
分空間、即ち全区間に対する距離値D1(n,1)を用いて
いるため従来の音声認識装置における予備選択と全く同
様に働く。i=1の場合には第二パターン照合手段06
では131〜140において第二パターン照合演算の初
期化が行われ、ビームサーチ手段07では151〜16
0において第1フレームに対する本方式によるビームサ
ーチが行わる。i>=2の場合には第二パターン照合手
段06では141〜150において第2フレーム以降の
第二パターン照合演算が行われ、ビームサーチ手段07
では151〜160において本方式によるビームサーチ
が行われる。
【0032】ビームサーチ手段07では、151〜15
4において本方式によるビームサーチの評価値D3(n)
が求められ、155において▲しきい▼値が計算され、
157においてD3(n)が▲しきい▼値より小さい単語
のみ選択し、158において第二標準パターン記憶手段
05の選択されなかった単語のマークを消去する。13
1〜140の第二パターン照合手段06での処理は従来
の音声認識装置における61〜70の第二パターン照合
手段26での処理と同一であり、同じく141〜150
の処理は従来の音声認識装置における71〜80の処理
と同一であるため、ここでは説明を省略する。
【0033】
【発明の効果】この発明に係る音声認織装置は、演算開
始フレームを先頭フレームから所定フレーム毎に順次繰
り下げてそれぞれ最終フレームまで、音響分析手段より
出力される音響パラメータベクトル時系列と第一標準パ
ターン記憶手段に記憶された第一標準パターンとを用い
て第一のパターン照合法に基づく演算を行ない、この演
算の結果をそれぞれ累積した第一距離値を距離値記憶手
段に出力する第一パターン照合手段と、先頭フレームか
ら特定フレームまでの前記音響分析手段より出力される
前記音響パラメータベクトル時系列と第二標準パターン
記憶手段に記憶された演算範囲により演算を行うことを
示されている第二標準パターンとを用いて第二のパター
ン照合法に基づく演算を行ない、この演算の結果を先頭
フレームがら前記特定フレームまで累積した第二距離値
を出力する第二パターン照合手段と、この第二パターン
照合手段より出力される前記第二距離値と前記距離値記
憶手段に記憶された前記特定フレームから最終フレーム
までの前記第一距離値との双方を用いて前記第二パター
ン照合手段において次に演算する前記第二標準パターン
の前記演算範囲を決定し前記第二標準パターン記憶手段
の前記演算範囲を書き換え、前記第二パターン照合手段
において次に処理すべき前記特定フレームを次の所定フ
レームに変更するビームサーチ手段とを備える構成とし
たため、この発明におけるビームサーチ手段は、従来と
同じ第二距離値に加え、第二距離値の演算には用いてい
ない後半の音響パラメータベクトル時系列の部分区間に
対する第一距離値を用いてビームサーチを行えるため、
ビームサーチが有効に行え、第二パターン照合の演算量
を少なくすることが可能となり、低価格の演算器を用い
て演算を行うことができ、その結果安価な音声認織装置
を得られる効果がある。さらに、前記の菅原一秀著文献
に示されている従来例とは異なり、この発明の第一パタ
ーン照合手段では、第一のパターン照合法に用いる音響
パラメータベクトルの時系列を最終フレームまで用いて
おり、しかも、時間的に第二のパターン照合法で用いて
いない部分区間を用いているため、演算量の削減効果が
極めて大きい音声認識装置を得られる効果がある。
【0034】
【発明の効果】この発明に係る音声認識装置は、演算開
始フレームを先頭フレームから所定フレーム毎に順次繰
り下げてそれぞれ最終フレームまで、音響分析手段より
出力される音響パラメータベクトル時系列と第一標準パ
ターン記憶手段に記憶された第一標準パターンとを用い
て第一のパターン照合法に基づく演算を行ない、この演
算の結果をそれぞれ累積した第一距離値を距離値記憶手
段に出力する第一パターン照合手段と、先頭フレームか
ら特定フレームまでの前記音響分析手段より出力される
前記音響パラメータベクトル時系列と第二標準パターン
記憶手段に記憶された演算範囲が演算を行なうを示す第
二標準パターンとを用いて第二のパターン照合法に基づ
く演算を行ない、この演算の結果を先頭フレームから前
記特定フレームまで累積した第二距離値を出力する第二
パターン照合手段と、この第二パターン照合手段より出
力される前記第二距離値と前記距離値記憶手段に記憶さ
れた前記特定フレームから最終フレームまでの前記第一
距離値との双方を用いて前記第二パターン照合手段にお
いて次に演算する前記第二標準パターンの前記演算範囲
を決定し前記第二標準パターン記憶手段の前記演算範囲
を書き換え、前記第二パターン照合手段において次に処
理すべき前記特定フレームを次の所定フレームに変更す
るビームサーチ手段とを備える構成としたため、この発
明におけるビームサーチ手段は、従来と同じ第二距離値
に加え、第二距離値の演算には用いていない後半の音響
パラメータベクトル時系列の部分区間に対する第一距離
値を用いてビームサーチを行えるため、ビームサーチが
有効に行え、第二パターン照合の演算量を少なくするこ
とが可能となり、低価格の演算器を用いて演算を行うこ
とができ、その結果安価な音声認識装置を得られる効果
がある。さらに、前記の菅原一秀著文献に示されている
従来例とは異なり、この発明の第一パターン照合手段で
は、第一のパターン照合法に用いる音響パラメータベク
トルの時系列を最終フレームまで用いており、しかも、
時間的に第二のパターン照合法で用いていない部分区間
を用いているため、演算量の削減効果が極めて大きい音
声認識装置を得られる効果がある。
【図面の簡単な説明】
【図1】この発明の実施例1の音声認識装置を示す構成
図である。
【図2】この発明の実施例1の音声認識装置の動作を説
明する流れ図である。
【図3】この発明の実施例1の音声認識装置の動作を説
明する流れ図である。
【図4】この発明の実施例1の音声認識装置の動作を説
明する流れ図である。
【図5】この発明の実施例1の音声認識装置の動作を説
明する流れ図である。
【図6】この発明の実施例1の音声認識装置の動作を説
明する流れ図である。
【図7】従来の音声認識装置を示す構成図である。
【図8】従来の音声認識装置の動作を説明する流れ図で
ある。
【図9】従来の音声認識装置の動作を説明する流れ図で
ある。
【図10】従来の音声認識装置の動作を説明する流れ図
である。
【図11】従来の音声認識装置の動作を説明する流れ図
である。
【図12】従来の音声認識装置の動作を説明する流れ図
である。
【図13】従来の音声認識装置の動作を説明する流れ図
である。
【符号の説明】
01 音響分析手段 02 第一標準パターン記憶手段 03 第一パターン照合手段 04 距離値記憶手段 05 第二標準パターン記憶手段 06 第二パターン照合手段 07 ビームサーチ手段 08 認識結果決定手段 09 音声信号 10a,10b 音響パラメータベクトル 11 第一標準パターン 12a,12b 第一距離値 13 第二標準パターン 14 第二距離値 15 演算範囲 16 認識結果 17 全体距離値 21 音響分析手段 22 第一標準パターン記憶手段 23 第一パターン照合手段 24 予備選択手段 25 第二標準パターン記憶手段 26 第二パターン照合手段 27 ビームサーチ手段 28 認識結果決定手段 29 音声信号 30a,30b 音響パラメータベクトル 31 第一標準パターン 32 第一距離値 33 第二標準パターン 34 第二距離値 35a,35b 演算範囲 36 認識結果 37 全体距離値

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 第一標準パターンと第二標準パターンの
    二種類の標準パターンをそれぞれ異なるパターン照合法
    を用いて音声信号の認識を行う音声認識装置において、 前記音声信号をフレーム毎に音響分析し音響パラメータ
    ベクトルの時系列に変換する音響分析手段と、 前記第一標準パターンを記憶する第一標準パターン記憶
    手段と、 演算開始フレームを先頭フレームから所定フレーム毎に
    順次繰り下げてそれぞれ最終フレームまで、前記音響分
    析手段より出力される前記音響パラメータベクトル時系
    列と前記第一標準パターン記憶手段に記憶された前記第
    一標準パターンとを用いて第一のパターン照合法に基づ
    く演算を行ない、この演算の結果をそれぞれ累積した第
    一距離値を出力する第一パターン照合手段と、 この第一パターン照合手段より出力される前記第一距離
    値を記憶する距離値記憶手段と、 前記第二標準パターンとこの第二標準パターンを用いた
    演算を行なうか否かを示す演算範囲とを記憶する第二標
    準パターン記憶手段と、 先頭フレームから特定フレームまでの前記音響分析手段
    より出力される前記音響パラメータベクトル時系列と前
    記第二標準パターン記憶手段に記憶された前記演算範囲
    により演算を行うことを示されている前記第二標準パタ
    ーンとを用いて第二のパターン照合法に基づく演算を行
    ない、この演算の結果を先頭フレームから前記特定フレ
    ームまで累積した第二距離値を出力する第二パターン照
    合手段と、 この第二パターン照合手段より出力される前記第二距離
    値と前記距離値記憶手段に記憶された前記特定フレーム
    から最終フレームまでの前記第一距離値との双方を用い
    て前記第二パターン照合手段において次に演算する前記
    第二標準パターンの前記演算範囲を決定し前記第二標準
    パターン記憶手段の前記演算範囲を書き換え、前記第二
    パターン照合手段において次に処理すべき前記特定フレ
    ームを次の所定フレームに変更するビームサーチ手段
    と、 前記第二パターン照合手段より最終フレームの処理後に
    出力される前記第二距離値を用いて認識結果を決定する
    認識結果決定手段とを備えることを特徴とする音声認識
    装置。
JP3043582A 1991-03-08 1991-03-08 音声認識装置 Expired - Fee Related JP2712856B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3043582A JP2712856B2 (ja) 1991-03-08 1991-03-08 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3043582A JP2712856B2 (ja) 1991-03-08 1991-03-08 音声認識装置

Publications (2)

Publication Number Publication Date
JPH04298798A JPH04298798A (ja) 1992-10-22
JP2712856B2 true JP2712856B2 (ja) 1998-02-16

Family

ID=12667768

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3043582A Expired - Fee Related JP2712856B2 (ja) 1991-03-08 1991-03-08 音声認識装置

Country Status (1)

Country Link
JP (1) JP2712856B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005096271A1 (ja) * 2004-03-30 2005-10-13 Pioneer Corporation 音声認識装置及び音声認識方法
JP4541781B2 (ja) * 2004-06-29 2010-09-08 キヤノン株式会社 音声認識装置および方法

Also Published As

Publication number Publication date
JPH04298798A (ja) 1992-10-22

Similar Documents

Publication Publication Date Title
EP0081390B1 (en) Continuous speech recognition system
EP0686965B1 (en) Speech recognition apparatus with speaker adaptation using acoustic category mean value calculus
JP2980026B2 (ja) 音声認識装置
EP1376537B1 (en) Apparatus, method, and computer-readable recording medium for recognition of keywords from spontaneous speech
EP0525640B1 (en) Dynamic programming matching system for speech recognition
US5164990A (en) Method and apparatus for recognizing unknown spoken words and by feature extraction and comparison with reference words
JPS6360919B2 (ja)
JP2712856B2 (ja) 音声認識装置
US5295190A (en) Method and apparatus for speech recognition using both low-order and high-order parameter analyzation
JP2964881B2 (ja) 音声認識装置
US20030110032A1 (en) Fast search in speech recognition
JP3914709B2 (ja) 音声認識方法およびシステム
JP3477751B2 (ja) 連続単語音声認識装置
JP2003044078A (ja) 発声速度正規化分析を用いた音声認識装置
US7912715B2 (en) Determining distortion measures in a pattern recognition process
JP3583299B2 (ja) 連続音声認識用の探索装置および連続音声認識用の探索方法
JP3458285B2 (ja) 音声認識装置
JP3148322B2 (ja) 音声認識装置
JP2543584B2 (ja) 音声標準パタン登録方式
JP2010211122A (ja) 音声認識装置及び方法
JP2000267691A (ja) 音声認識システムにおける認識辞書選択方法
JPH0997095A (ja) 音声認識装置
JP2845019B2 (ja) 類似度演算装置
JP3063856B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JPH10143190A (ja) 音声認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees