JP2003099097A - 音響処理装置、音響処理方法、音響処理プログラム、照合処理装置、照合処理方法及び照合処理プログラム - Google Patents

音響処理装置、音響処理方法、音響処理プログラム、照合処理装置、照合処理方法及び照合処理プログラム

Info

Publication number
JP2003099097A
JP2003099097A JP2001294532A JP2001294532A JP2003099097A JP 2003099097 A JP2003099097 A JP 2003099097A JP 2001294532 A JP2001294532 A JP 2001294532A JP 2001294532 A JP2001294532 A JP 2001294532A JP 2003099097 A JP2003099097 A JP 2003099097A
Authority
JP
Japan
Prior art keywords
acoustic feature
feature amount
quantization
acoustic
processing procedure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001294532A
Other languages
English (en)
Inventor
Yohei Okato
洋平 岡登
Jun Ishii
純 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001294532A priority Critical patent/JP2003099097A/ja
Publication of JP2003099097A publication Critical patent/JP2003099097A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声認識精度の劣化を招くことなく、音響特
徴量を圧縮することができる。しかし、音声の局所的な
性質,音声の種類,符号伝達の際の伝送状況や認識タス
クの困難さを考慮することなく、常に同一の方式にした
がって音響特徴量の信号圧縮を行っているので、音響特
徴量を必ずしも十分に圧縮することができないなどの課
題があった。 【解決手段】 音響特徴量算出部22により抽出された
音響特徴量の情報圧縮方式と量子化・符号化方式を決定
する方式決定部23を設けるように構成した。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、入力音声を音響
処理して伝送する音響処理装置、音響処理方法及び音響
処理プログラムと、符号化信号を照合処理して音声認識
結果を出力する照合処理装置、照合処理方法及び照合処
理プログラムに関するものである。
【0002】
【従来の技術】図15は例えば“Compressio
n of Acoustic Features fo
r Speech Recognition in N
etwork Environments”,G.N.
Ramaswamy,P.S.Gopalakrish
nan(International Confere
nce of Acoustics,Speech a
nd Signal Processing,ICAS
SP−98),PP.977−980,1998に示さ
れた従来の音響処理装置及び照合処理装置を示す構成図
であり、図において、1は認識対象の音声信号を入力
し、その音声信号をA/D変換する音声入力部、2は音
声入力部1から出力されたディジタルの音声信号を一定
時間周期毎にフレームに区切って分析し、その音声信号
の音声的な特徴を表す音響特徴量を算出する音響特徴量
算出部である。
【0003】3は所定の情報圧縮方式にしたがって当該
音響特徴量を信号圧縮する音響特徴量圧縮部、4は量子
化テーブル、5は量子化テーブル4を参照しながら、所
定の量子化・符号化方式にしたがって当該音響特徴量の
量子化及び符号化を行う量子化・符号化部、6は量子化
・符号化部5により符号化された音響特徴量を照合処理
装置に送信する符号出力部である。
【0004】11は音響処理装置から送信された符号化
信号である音響特徴量を入力する符号入力部、12は量
子化テーブル、13は量子化テーブル12を参照しなが
ら、所定の復号化・逆量子化方式にしたがって当該音響
特徴量の復号化及び逆量子化を行う復号化・逆量子化
部、14は所定の情報復元方式にしたがって当該音響特
徴量の信号圧縮を解除し、元の音響特徴量を復元する音
響特徴量復元部、15は認識対象を構成する単位の音響
特徴量の性質を示す標準パタン、16は言語辞書、17
は音響特徴量復元部14により復元された音響特徴量を
標準パタン15及び言語辞書16と照合する照合部、1
8は照合部17による音声の認識結果を出力する認識結
果出力部である。なお、図16は音響処理装置の処理内
容を示すフローチャート、図17は照合処理装置の処理
内容を示すフローチャートである。
【0005】次に動作について説明する。まず、音響処
理装置の音声入力部1は、認識対象の音声信号Sを入力
すると、その音声信号SをA/D変換する(ステップS
T1)。 S=[s(1),・・・,s(N)] (1)
【0006】音響特徴量算出部2は、音声入力部1がデ
ィジタルの音声信号Sを出力すると、その音声信号Sを
一定時間周期毎にフレームに区切って分析し、その音声
信号Sの音声的な特徴を表す音響特徴量を算出する(ス
テップST2)。即ち、分析周期をTサンプルとする場
合、標本数Nの音声信号Sを、n=N=Tであるnフレ
ームの音響特徴量ベクトルの時系列Cに変換する。 C=[c(1),・・・,c(n)] (2)
【0007】ここで、音声認識に用いる音響特徴量の詳
細は、“「音声認識の基礎(上,下)」L.R.Rab
iner,B.H.Juang(古井監訳),1995
年11月,NTTアドバンステクノロジ(文献1)”の
上巻で詳細に説明されている。例えば、音響特徴量とし
て、メルFFTケプストラムを用いることができる。メ
ルFFTケプストラムとは、音声の短時間対数スペクト
ルをメル尺度と呼ばれる人間の聴覚特性に合わせた周波
数スケールに置き換えて、逆フーリエ変換したものであ
る。
【0008】音響特徴量圧縮部3は、音響特徴量算出部
2が音響特徴量を算出すると、所定の情報圧縮方式にし
たがって音響特徴量を信号圧縮する(ステップST
3)。即ち、予め設定したK次の線形予測係数A=[a
(1),・・・,a(k)]を用いて、音響特徴量ベク
トル時系列Cから予測残差ベクトル時系列Vを求める。
ここで、予測残差ベクトル時系列Vは式(3)のように
表すことができる。 V=[v(1),・・・,v(n)] (3)
【0009】また、時刻tにおける予測残差の算出は、
式(4)のように表すことができる(tが1未満のと
き、c(t)=0と仮定する)。
【数1】 例えば、単純な隣接フレーム間の差分をとる場合、K=
1であり、A=[−1]と表せる。この処理により得ら
れる予測残差ベクトル時系列V(t)は、音声特徴量の
変化が連続的であることから元のc(t)よりも分散を
小さくすることができる。その結果、後段のベクトル量
子化・符号化処理において符号長を短くすることが可能
となる。
【0010】量子化・符号化部5は、音響特徴量圧縮部
3が音響特徴量を信号圧縮すると、量子化テーブル4を
参照しながら、所定の量子化・符号化方式にしたがって
当該音響特徴量の量子化及び符号化を行う(ステップS
T4)。なお、量子化テーブル4は、ベクトル量子化あ
るいはスカラ量子化のために量子化・符号化部5が参照
するテーブルであり、以降の説明では、ベクトル量子化
はスカラ量子化を含むものとする。
【0011】具体的には、量子化・符号化部5は、量子
化テーブル4を参照して、予測残差ベクトル時系列Vを
ベクトル量子化および符号化した符号Q[q(1),・
・・,q(n)]に変換する。ベクトル量子化およびス
カラ量子化の方法は、例えば、上記文献1の上巻に詳述
されている。符号出力部6は、量子化・符号化部5によ
り符号化された音響特徴量を照合処理装置に送信する
(ステップST5)。
【0012】次に、照合処理装置の符号入力部11は、
音響処理装置から送信された符号化信号である音響特徴
量を入力する(ステップST11)。即ち、音響処理装
置から符号Q[q(1),・・・,q(n)]を受信す
る。復号化・逆量子化部13は、符号入力部11が音響
特徴量を入力すると、量子化テーブル12を参照しなが
ら、所定の復号化・逆量子化方式にしたがって音響特徴
量の復号化及び逆量子化を行う(ステップST12)。
即ち、量子化テーブル12を参照して、符号Qを復号化
及び逆量子化して、信号圧縮された音響特徴量V’を求
める。音響特徴量V’は一般に元の信号Vに対して量子
化による量子化誤差を含む。 V’=[v’(1),・・・,v’(n)] (5)
【0013】音響特徴量復元部14は、復号化・逆量子
化部13が信号圧縮された音響特徴量V’を求めると、
所定の情報復元方式にしたがって音響特徴量V’の信号
圧縮を解除し、元の音響特徴量を復元する(ステップS
T13)。即ち、信号圧縮された音響特徴量V’に対し
て、音響特徴量圧縮部3による変換と逆の変換を施し
て、音響特徴量C’を復元する。 C’=[c’(1),・・・,c’(n)] (6) なお、式(6)に対応する逆変換は式(7)となる。
【数2】
【0014】照合部17は、音響特徴量復元部14が音
響特徴量C’を復元すると、その音響特徴量C’を標準
パタン15及び言語辞書16と照合して、入力音声に対
する認識結果を取得する(ステップST14,ST1
5)。照合手順は次の通りである。ただし、標準パタン
15は、認識対象を構成する単位の音響特徴量の性質を
示し、標準パタンの単位として、例えば、言語的な単位
である音素を用いる。また、標準パタンの認識単位と音
響特徴量の対応付けは、例えばHMM(隠れマルコフモ
デル)を用いて表現する。言語辞書16は、標準パタン
が示す認識単位と認識対象全体の言語表現の対応を示す
ものである。
【0015】図18は単語音声認識における言語辞書の
記述例である。この例では、認識対象は「赤」「青」
「黄色」の3単語であり、それぞれについて標準パタン
との対応及び単語の出現確率を記している。ここでは、
標準パタンに示された認識単位を音素(日本語では概ね
ローマ字書きした場合の一文字に対応)としている。出
現確率は、事前に分かっている認識対象単語の出現確率
である。
【0016】照合部17の照合手順 (1)音響特徴量C’と認識候補を構成する標準パタン
15のエントリを照合して照合スコアを求める。 (2)それぞれの認識候補について、部分あるいは終端
に到達するまでの累積スコアを求める。 (3)音響特徴量C’の終端フレームに到達したら、最
終的に最も高い累積スコアを持つ単語を音声認識結果と
する。
【0017】認識結果出力部18は、照合部17が上記
のようにして音声認識結果を得ると、その音声認識結果
を出力する(ステップST16)。
【0018】
【発明が解決しようとする課題】従来の音響処理装置は
以上のように構成されているので、音声認識精度の劣化
を招くことなく、音響特徴量を圧縮することができる。
しかし、音声の局所的な性質,音声の種類,符号伝達の
際の伝送状況や認識タスクの困難さを考慮することな
く、常に同一の方式にしたがって音響特徴量の信号圧縮
を行っているので、音響特徴量を必ずしも十分に圧縮す
ることができないなどの課題があった。
【0019】この発明は上記のような課題を解決するた
めになされたもので、音声認識精度の劣化を招くことな
く、音響特徴量の圧縮度を高めることができる音響処理
装置、音響処理方法及び音響処理プログラムを得ること
を目的とする。また、この発明は、圧縮度の高い音響特
徴量から音声認識結果を得ることができる照合処理装
置、照合処理方法及び照合処理プログラムを得ることを
目的とする。
【0020】
【課題を解決するための手段】この発明に係る音響処理
装置は、特徴量抽出手段により抽出された音響特徴量の
情報圧縮方式と量子化・符号化方式を決定する方式決定
手段を設けたものである。
【0021】この発明に係る音響処理装置は、方式決定
手段が特徴量抽出手段により抽出された音響特徴量を参
照して、その音響特徴量の情報圧縮方式と量子化・符号
化方式を決定するようにしたものである。
【0022】この発明に係る音響処理装置は、方式決定
手段が出力伝送路の回線状況を考慮して、音響特徴量の
情報圧縮方式と量子化・符号化方式を決定するようにし
たものである。
【0023】この発明に係る音響処理装置は、方式決定
手段が入力音声の認識困難度を考慮して、音響特徴量の
情報圧縮方式と量子化・符号化方式を決定するようにし
たものである。
【0024】この発明に係る照合処理装置は、符号化さ
れた音響特徴量の情報圧縮方式と量子化・符号化方式を
判別する方式判別手段を設けたものである。
【0025】この発明に係る音響処理装置は、特徴量抽
出手段により抽出された音響特徴量を出力対象に含める
か否かを判定する出力対象判定手段を設けたものであ
る。
【0026】この発明に係る音響処理装置は、出力対象
判定手段が、特徴量抽出手段により抽出された音響特徴
量の変動量が基準変動量より小さい場合、その音響特徴
量を出力対象に含めず、その音響特徴量の変動量が基準
変動量より大きい場合、その音響特徴量を出力対象に含
める旨の判定を行うようにしたものである。
【0027】この発明に係る音響処理装置は、出力対象
判定手段が、特徴量抽出手段により抽出された音響特徴
量が無音状態であるとき、その音響特徴量を出力対象に
含めず、その音響特徴量が有音状態であるとき、その音
響特徴量を出力対象に含める旨の判定を行うようにした
ものである。
【0028】この発明に係る照合処理装置は、符号化信
号に音響特徴量が含まれているか否かを判定する包含判
定手段を設けたものである。
【0029】この発明に係る音響処理方法は、音響特徴
量の情報圧縮方式と量子化・符号化方式を決定するよう
にしたものである。
【0030】この発明に係る照合処理方法は、符号化さ
れた音響特徴量の情報圧縮方式と量子化・符号化方式を
判別するようにしたものである。
【0031】この発明に係る音響処理方法は、音響特徴
量を出力対象に含めるか否かを判定するようにしたもの
である。
【0032】この発明に係る照合処理方法は、符号化信
号に音響特徴量が含まれているか否かを判定するように
したものである。
【0033】この発明に係る音響処理プログラムは、特
徴量抽出処理手順により抽出された音響特徴量の情報圧
縮方式と量子化・符号化方式を決定する方式決定処理手
順を設けたものである。
【0034】この発明に係る照合処理プログラムは、符
号化された音響特徴量の情報圧縮方式と量子化・符号化
方式を判別する方式判別処理手順を設けたものである。
【0035】この発明に係る音響処理プログラムは、特
徴量抽出処理手順により抽出された音響特徴量を出力対
象に含めるか否かを判定する出力対象判定処理手順を設
けたものである。
【0036】この発明に係る照合処理プログラムは、符
号化信号に音響特徴量が含まれているか否かを判定する
包含判定処理手順を設けたものである。
【0037】
【発明の実施の形態】以下、この発明の実施の一形態を
説明する。 実施の形態1.図1はこの発明の実施の形態1による音
響処理装置及び照合処理装置を示す構成図であり、図に
おいて、21は認識対象の音声信号を入力し、その音声
信号をA/D変換する音声入力部、22は音声入力部2
1から出力されたディジタルの音声信号を一定時間周期
毎にフレームに区切って分析し、その音声信号の音声的
な特徴を表す音響特徴量を算出する音響特徴量算出部
(特徴量抽出手段)、23は音響特徴量算出部22によ
り算出された音響特徴量の情報圧縮方式と量子化・符号
化方式を決定する方式決定部(方式決定手段)、24は
方式決定部23により決定された情報圧縮方式にしたが
って音響特徴量を信号圧縮する音響特徴量圧縮部(信号
圧縮手段)、25は量子化テーブル、26は量子化テー
ブル25を参照しながら、方式決定部23により決定さ
れた量子化・符号化方式にしたがって音響特徴量の量子
化及び符号化を行う量子化・符号化部(量子化・符号化
手段)、27は量子化・符号化部26により符号化され
た音響特徴量を照合処理装置に送信する符号出力部であ
る。
【0038】31は音響処理装置から送信された符号化
信号である音響特徴量を入力する符号入力部、32は符
号入力部31により入力された音響特徴量の情報圧縮方
式と量子化・符号化方式を判別する方式判定部(方式判
別手段)、33は量子化テーブル、34は量子化テーブ
ル33を参照しながら、方式判定部32により判別され
た量子化・符号化方式に対応する復号化・逆量子化方式
にしたがって音響特徴量の復号化及び逆量子化を行う復
号化・逆量子化部(復号化・逆量子化手段)、35は方
式判定部32により判別された情報圧縮方式に対応する
情報復元方式にしたがって音響特徴量の信号圧縮を解除
して、元の音響特徴量を復元する音響特徴量復元部(圧
縮解除手段)、36は認識対象を構成する単位の音響特
徴量の性質を示す標準パタン、37は言語辞書、38は
音響特徴量復元部35により復元された音響特徴量を標
準パタン36及び言語辞書37と照合する照合部(照合
手段)、39は照合部38による音声の認識結果を出力
する認識結果出力部である。
【0039】図2はこの発明の実施の形態1による音響
処理方法を示すフローチャート、図3はこの発明の実施
の形態1による照合処理方法を示すフローチャートであ
る。因みに、図1における音響処理装置及び照合処理装
置の各構成要素をハードウエアを用いて構成してもよい
が、各構成要素の処理内容が記述されたプログラムを用
意して、図示せぬコンピュータが当該プログラムを実行
するようにしてもよい。なお、以下に示す他の実施の形
態においても同様である。
【0040】次に動作について説明する。まず、音響処
理装置の音声入力部21は、従来の音声入力部1と同様
に、認識対象の音声信号Sを入力すると、その音声信号
SをA/D変換する(ステップST21)。音響特徴量
算出部22は、音声入力部21がディジタルの音声信号
Sを出力すると、従来の音響特徴量算出部2と同様に、
その音声信号Sを一定時間周期毎にフレームに区切って
分析し、その音声信号Sの音声的な特徴を表す音響特徴
量を算出する(ステップST22)。
【0041】方式決定部23は、音響特徴量算出部22
が音響特徴量を算出すると、現在及び過去の音響特徴量
を参照して、現在の音響特徴量の情報圧縮方式と量子化
・符号化方式を決定する(ステップST23)。例え
ば、時刻tのフレームにおける音響特徴量c(t)の情
報圧縮方式を決定する場合(ただし、この例では、音響
特徴量c(t)の情報圧縮方式が決定されれば、一義的
に量子化・符号化方式が決定されるものとする)、K時
刻前のフレームまでの音響特徴量による線形予測残差v
(t)の2乗値|v(t)|2 を計算し(Kについて
は、式(4)を参照)、その2乗値|v(t)|2 と適
当に設定された閾値thとを比較する。
【0042】そして、|v(t)|2 ≧thである場
合、線形予測により音響特徴量c(t)を効率的に信号
圧縮できないと判定し、音響特徴量c(t)を信号圧縮
しないで、量子化及び符号化を行う方式を採用する。一
方、|v(t)|2 <thである場合、線形予測により
音響特徴量c(t)を効率的に信号圧縮することが可能
であると判定し、線形予測残差v(t)のみを量子化及
び符号化を行う方式を採用する。
【0043】音響特徴量圧縮部24は、方式決定部23
が情報圧縮方式を決定すると、その情報圧縮方式にした
がって音響特徴量算出部22により算出された音響特徴
量を信号圧縮する(ステップST24)。方式決定部2
3により決定された情報圧縮方式を用いること以外は、
従来の音響特徴量圧縮部3と同様である。量子化・符号
化部26は、音響特徴量圧縮部24が音響特徴量を信号
圧縮すると、量子化テーブル25を参照しながら、方式
決定部23により決定された量子化・符号化方式にした
がって音響特徴量の量子化及び符号化を行う(ステップ
ST25)。方式決定部23により決定された量子化・
符号化方式を用いること以外は、従来の量子化・符号化
部5と同様である。
【0044】符号出力部27は、量子化・符号化部26
により符号化された音響特徴量を照合処理装置に送信す
る(ステップST26)。ただし、符号化された音響特
徴量を送信する際、図4に示すように、方式決定部23
により決定された情報圧縮方式を示すヘッダ情報を付加
して送信する。上述したように、音響特徴量c(t)の
情報圧縮方式が決定されれば、一義的に量子化・符号化
方式が決定される場合には、情報圧縮方式を示すヘッダ
情報を送信すれば、照合側では音響特徴量c(t)の量
子化・符号化方式を特定することができる。なお、音響
特徴量の変動が線形予測される値から小さな変動範囲で
あれば、線形予測残差は音響特徴量の符号より短い符号
長に変換することができる。
【0045】次に、照合処理装置の符号入力部31は、
従来の符号入力部11と同様に、音響処理装置から送信
された符号化信号である音響特徴量を入力する(ステッ
プST31)。方式判定部32は、符号入力部31が音
響特徴量を入力すると、その音響特徴量に付加されたヘ
ッダ情報を参照して、その音響特徴量の情報圧縮方式と
量子化・符号化方式を判別する(ステップST32)。
【0046】復号化・逆量子化部34は、方式判定部3
2が量子化・符号化方式を判別すると、量子化テーブル
33を参照しながら、その量子化・符号化方式に対応す
る復号化・逆量子化方式にしたがって符号入力部31に
より入力された音響特徴量の復号化及び逆量子化を行う
(ステップST33)。方式判定部32により判別され
た量子化・符号化方式に対応する復号化・逆量子化方式
を用いること以外は、従来の復号化・逆量子化部13と
同様である。
【0047】音響特徴量復元部35は、復号化・逆量子
化部34が音響特徴量の復号化及び逆量子化を行うと、
方式判定部32により判別された情報圧縮方式に対応す
る情報復元方式にしたがって音響特徴量の信号圧縮を解
除し、元の音響特徴量を復元する(ステップST3
4)。方式判定部32により判別された情報圧縮方式に
対応する情報復元方式を用いること以外は、従来の音響
特徴量復元部14と同様である。
【0048】照合部38は、音響特徴量復元部35が元
の音響特徴量を復元すると、従来の照合部17と同様
に、その音響特徴量を標準パタン36及び言語辞書37
と照合して、入力音声に対する認識結果を取得する(ス
テップST35,ST36)。認識結果出力部39は、
照合部38が音声認識結果を得ると、その音声認識結果
を出力する(ステップST37)。
【0049】以上で明らかなように、この実施の形態1
によれば、音響特徴量算出部22により抽出された音響
特徴量の情報圧縮方式と量子化・符号化方式を決定する
ように構成したので、音声認識精度の劣化を招くことな
く、音響特徴量の圧縮度を高めることができる効果を奏
する。
【0050】実施の形態2.図5はこの発明の実施の形
態2による音響処理装置及び照合処理装置を示す構成図
であり、図において、図1と同一符号は同一または相当
部分を示すので説明を省略する。41は出力伝送路の回
線状況を考慮して、音響特徴量の情報圧縮方式と量子化
・符号化方式を決定する伝送回線状況判定部(方式決定
手段)である。図6はこの発明の実施の形態2による音
響処理方法を示すフローチャートである。
【0051】次に動作について説明する。上記実施の形
態1では、方式決定部23が現在及び過去の音響特徴量
を参照して、現在の音響特徴量の情報圧縮方式と量子化
・符号化方式を決定するものについて示したが、伝送回
線状況判定部41が出力伝送路の回線状況や音響特徴量
の変動を考慮して、音響特徴量の情報圧縮方式と量子化
・符号化方式を決定するようにしてもよい(ステップS
T41,ST42)。
【0052】具体的には、伝送回線状況判定部41が出
力伝送回線の符号誤り率と実質的な伝送容量を計測す
る。そして、伝送回線状況判定部41が当該計測結果に
応じて音響特徴量の情報圧縮方式と量子化・符号化方式
を決定する。
【0053】例えば、符号誤り率が基準値より大きい場
合、単一の時間フレームの内容のみから音響特徴量フレ
ームを復元可能な情報圧縮方式と量子化・符号化方式を
採用する。また、伝送容量が基準容量より小さい場合、
隣接フレーム間の音響特徴量から線形予測残差を計算
し、圧縮効率の高い情報圧縮方式と量子化・符号化方式
を採用する。なお、伝送回線状況判定部41は、伝送回
線の誤り率や伝達容量の判定を時刻フレーム毎に判定す
る必要はない。例えば、一回の音声に対して誤り率と伝
達容量を1度判定し、後は同一の状態であるとする。
【0054】実施の形態3.図7はこの発明の実施の形
態3による音響処理装置及び照合処理装置を示す構成図
であり、図において、図1と同一符号は同一または相当
部分を示すので説明を省略する。42は入力音声の認識
困難度を考慮して、音響特徴量の情報圧縮方式と量子化
・符号化方式を決定するタスク困難度判定部(方式決定
手段)である。図8はこの発明の実施の形態3による音
響処理方法を示すフローチャートである。
【0055】次に動作について説明する。上記実施の形
態1では、方式決定部23が現在及び過去の音響特徴量
を参照して、現在の音響特徴量の情報圧縮方式と量子化
・符号化方式を決定するものについて示したが、タスク
困難度判定部42が入力音声の認識困難度を考慮して、
音響特徴量の情報圧縮方式と量子化・符号化方式を決定
するようにしてもよい(ステップST43,ST4
4)。
【0056】具体的には、タスク困難度判定部42が入
力音声の認識困難度を示す指標を求め、その指標に応じ
て音響特徴量の情報圧縮方式と量子化・符号化方式を決
定する。音声認識対象の難しさを測る代表的な指標とし
ては、音声入力時の背景騒音レベルや同時認識単語数に
相当する単語パープレキシティの大きさを用いることが
できる。
【0057】その指標に対応する情報圧縮方式と量子化
・符号化方式の決定は、認識対象が容易であれば、大き
な情報圧縮が可能な情報圧縮方式と量子化・符号化方式
を採用する。一方、認識対象が困難な場合は、情報圧縮
による歪みが小さい情報圧縮方式と量子化・符号化方式
を採用する。次に、これらを考慮して、適当な信号圧縮
方式と量子化ビット数を確定する。情報圧縮方式と量子
化・符号化方式の決定は、時刻フレーム毎に行う必要は
なく、一回の発話あるいは認識タスクを通して決めてお
いてもよい。適当な信号圧縮方式と量子化ビット数の決
定は、認識条件毎に、あらかじめ調査しておくようにす
る。
【0058】実施の形態4.図9はこの発明の実施の形
態4による音響処理装置及び照合処理装置を示す構成図
であり、図において、図1と同一符号は同一または相当
部分を示すので説明を省略する。43は音響特徴量算出
部22により算出された音響特徴量を出力対象に含める
か否かを判定する時間フレーム間引き部(出力対象判定
手段)、44は対象フレームの音響特徴量が省略されて
いるか否かを判定するフレーム周期判定部(包含判定手
段)、45はフレーム周期判定部44の判定結果が省略
されていない旨を示す場合、音響特徴量復元部35から
出力された音響特徴量を標準パタン36及び言語辞書3
7と照合し、その判定結果が省略されている旨を示す場
合、他の音響特徴量に係る照合結果を流用する照合部
(照合手段)である。図10はこの発明の実施の形態4
による音響処理方法を示すフローチャート、図11はこ
の発明の実施の形態4による照合処理方法を示すフロー
チャートである。
【0059】次に動作について説明する。時間フレーム
間引き部43は、上記実施の形態1と同様にして、音響
特徴量算出部22が音響特徴量を算出すると、その音響
特徴量を出力対象に含めるか否かを判定する。即ち、時
間フレーム間引き部43は、前後の時刻と比較した対象
時刻の音響特徴量の性質を調べて、対象時刻のフレーム
の音響特徴量を省略した場合に、照合側での音声認識精
度へ与える影響が小さいか否かを判定するため、まず、
省略せず出力した最後の音響特徴量c(τ)と現時刻の
音響特徴量c(t)の変動量dを求める(ステップST
51)。
【0060】時間フレーム間引き部43は、音響特徴量
の変動量d(t)が閾値thhを上回る場合、音声認識
精度へ与える影響が大きいため間引きフラグを“0”に
して、その音響特徴量を省略しない旨を明示する(ステ
ップST52,ST53)。この場合、音響特徴量圧縮
部24は、所定の情報圧縮方式にしたがって音響特徴量
算出部22により算出された音響特徴量を信号圧縮し
(ステップST54)、量子化・符号化部26は、量子
化テーブル25を参照しながら、所定の量子化・符号化
方式にしたがって音響特徴量の量子化及び符号化を行う
(ステップST55)。そして、符号出力部27は、量
子化・符号化部26により符号化された音響特徴量と上
記間引きフラグを照合処理装置に送信する(ステップS
T56)。
【0061】時間フレーム間引き部43は、音響特徴量
の変動量d(t)が閾値thhを下回る場合、音声認識
精度へ与える影響が小さいため間引きフラグを“1”に
して、その音響特徴量を省略する旨を明示する(ステッ
プST52,ST57)。この場合、音響特徴量圧縮部
24は、当該音響特徴量に対する信号圧縮処理を実施せ
ず、量子化・符号化部26は、当該音響特徴量に対する
量子化及び符号化処理を実施しない。そして、符号出力
部27は、上記間引きフラグを照合処理装置に送信す
る。
【0062】ここで、音響特徴量の変動量d(t)とし
ては、例えば、式(8)で定義した音響パラメータベク
トル間の分散重み付きユークリッド距離を用いる。
【数3】 ただし、式(8)において、cI (t)は時刻tのi次
元目の音響特徴量,Mは音響特徴量ベクトルの次元数,
var[i]はi次元目の音響特徴量の分散を表す。こ
の結果、音響特徴量の変化が小さい部分では音響特徴量
の出力がなくなるため、音響特徴量を表すための情報量
を削減することができる。
【0063】照合処理装置のフレーム周期判定部44
は、符号入力部31が間引きフラグを入力すると、その
間引きフラグを参照して、対象フレームの音響特徴量が
省略されているか否かを判定する(ステップST61,
ST62)。
【0064】対象フレームの音響特徴量が省略されてい
ない場合、即ち、間引きフラグが“0”の場合、復号化
・逆量子化部34は、量子化テーブル33を参照しなが
ら、所定の復号化・逆量子化方式にしたがって符号入力
部31により入力された音響特徴量の復号化及び逆量子
化を実行し(ステップST63)、音響特徴量復元部3
5は、所定の情報復元方式にしたがって音響特徴量の信
号圧縮を解除し、元の音響特徴量を復元する(ステップ
ST64)。
【0065】そして、照合部45は、上記実施の形態1
における照合部17と同様の手順により照合処理を実施
する(ステップST65,ST66)。 照合部45の照合手順 (1)音響特徴量C’と認識候補を構成する標準パタン
36のエントリを照合して照合スコアを求める。 (2)それぞれの認識候補について、部分あるいは終端
に到達するまでの累積スコアを求める。 (3)音響特徴量C’の終端フレームに到達したら、最
終的に最も高い累積スコアを持つ単語を音声認識結果と
する。
【0066】一方、対象フレームの音響特徴量が省略さ
れている場合、即ち、間引きフラグが“1”の場合、復
号化・逆量子化部34は、音響特徴量の復号化及び逆量
子化処理を実施せず、音響特徴量復元部35は、音響特
徴量の信号圧縮の解除処理を実施しない。
【0067】そして、照合部45は、他の音響特徴量に
係る照合結果を流用する。即ち、省略されたフレームの
照合スコアを補間して、累積スコアを更新する。補間さ
れた照合のスコアは、例えば、最後に入力された音響特
徴量に対する照合スコアとする。この処理を音響特徴量
の終端フレームまで続け、最終的に最も高い累積照合ス
コアを持つ単語を音声認識結果とする。
【0068】以上で明らかなように、この実施の形態4
によれば、音響特徴量算出部22により算出された音響
特徴量を出力対象に含めるか否かを判定するように構成
したので、変化が小さい部分の音響特徴量を出力対象か
ら除外できるようになり、その結果、効率よく伝送情報
を削減することができる効果を奏する。
【0069】実施の形態5.図12はこの発明の実施の
形態5による音響処理装置及び照合処理装置を示す構成
図であり、図において、図9と同一符号は同一または相
当部分を示すので説明を省略する。46は音響特徴量算
出部22により算出された音響特徴量が無音状態である
か否かを判別して、その音響特徴量を出力対象に含める
か否かを判定する無音判定部(出力対象判定手段)、4
7は対象フレームの音響特徴量が省略されているか否か
を判定する無音フレーム判定部(包含判定手段)であ
る。図13はこの発明の実施の形態5による音響処理方
法を示すフローチャート、図14はこの発明の実施の形
態5による照合処理方法を示すフローチャートである。
【0070】次に動作について説明する。上記実施の形
態4では、時間フレーム間引き部43が音響特徴量の変
動量d(t)と閾値thhを比較して、その音響特徴量
を出力対象に含めるか否かを判定するものについて示し
たが、無音判定部46が、音響特徴量が無音状態である
か否かを判別して、その音響特徴量を出力対象に含める
か否かを判定するようにしてもよい。
【0071】即ち、無音判定部46は、例えば、対象音
声フレームの音声の短時間パワーやゼロ交差回数を計測
することにより、対象音声フレームが有音区間である
か、無音区間であるかを判定する(ステップST7
1)。そして、対象音声フレームが有音区間である場合
は、無音フラグを“0”にして、その音響特徴量を省略
しない旨を明示する(ステップST72)。以下、上記
実施の形態4と同様に、ステップST54〜ST56の
処理を実行する。
【0072】一方、対象音声フレームが無音区間である
場合は、無音フラグを“1”にして、その音響特徴量を
省略する旨を明示する(ステップST73)。これによ
り、符号出力部27から無音フラグが照合処理装置に送
信される。
【0073】照合処理装置の無音フレーム判定部47
は、符号入力部31が無音フラグを入力すると、その無
音フラグを参照して、対象フレームの音響特徴量が省略
されているか否かを判定する(ステップST81,ST
82)。
【0074】対象フレームの音響特徴量が省略されてい
ない場合、即ち、無音フラグが“0”の場合、上記実施
の形態4と同様に、ステップST63,ST64の処理
を実行し、対象フレームの音響特徴量が省略されている
場合、即ち、無音フラグが“1”の場合、上記実施の形
態4と同様に、ステップST63,ST64の処理を実
行しない。以下、上記実施の形態4と同様のため説明を
省略する。
【0075】
【発明の効果】以上のように、この発明によれば、特徴
量抽出手段により抽出された音響特徴量の情報圧縮方式
と量子化・符号化方式を決定する方式決定手段を設ける
ように構成したので、音声認識精度の劣化を招くことな
く、音響特徴量の圧縮度を高めることができる効果があ
る。
【0076】この発明によれば、方式決定手段が特徴量
抽出手段により抽出された音響特徴量を参照して、その
音響特徴量の情報圧縮方式と量子化・符号化方式を決定
するように構成したので、構成の複雑化を招くことな
く、音響特徴量の情報圧縮方式と量子化・符号化方式を
決定することができる効果がある。
【0077】この発明によれば、方式決定手段が出力伝
送路の回線状況を考慮して、音響特徴量の情報圧縮方式
と量子化・符号化方式を決定するように構成したので、
構成の複雑化を招くことなく、音響特徴量の情報圧縮方
式と量子化・符号化方式を決定することができる効果が
ある。
【0078】この発明によれば、方式決定手段が入力音
声の認識困難度を考慮して、音響特徴量の情報圧縮方式
と量子化・符号化方式を決定するように構成したので、
構成の複雑化を招くことなく、音響特徴量の情報圧縮方
式と量子化・符号化方式を決定することができる効果が
ある。
【0079】この発明によれば、符号化された音響特徴
量の情報圧縮方式と量子化・符号化方式を判別する方式
判別手段を設けるように構成したので、圧縮度の高い音
響特徴量から音声認識結果を得ることができる効果があ
る。
【0080】この発明によれば、特徴量抽出手段により
抽出された音響特徴量を出力対象に含めるか否かを判定
する出力対象判定手段を設けるように構成したので、変
化が小さい部分の音響特徴量を出力対象から除外できる
ようになり、その結果、効率よく伝送情報を削減するこ
とができる効果がある。
【0081】この発明によれば、出力対象判定手段が、
特徴量抽出手段により抽出された音響特徴量の変動量が
基準変動量より小さい場合、その音響特徴量を出力対象
に含めず、その音響特徴量の変動量が基準変動量より大
きい場合、その音響特徴量を出力対象に含める旨の判定
を行うように構成したので、構成の複雑化を招くことな
く、音響特徴量を出力対象に含める旨の判定を行うこと
ができる効果がある。
【0082】この発明によれば、出力対象判定手段が、
特徴量抽出手段により抽出された音響特徴量が無音状態
であるとき、その音響特徴量を出力対象に含めず、その
音響特徴量が有音状態であるとき、その音響特徴量を出
力対象に含める旨の判定を行うように構成したので、構
成の複雑化を招くことなく、音響特徴量を出力対象に含
める旨の判定を行うことができる効果がある。
【0083】この発明によれば、符号化信号に音響特徴
量が含まれているか否かを判定する包含判定手段を設け
るように構成したので、圧縮度の高い音響特徴量から音
声認識結果を得ることができる効果がある。
【0084】この発明によれば、音響特徴量の情報圧縮
方式と量子化・符号化方式を決定するように構成したの
で、音声認識精度の劣化を招くことなく、音響特徴量の
圧縮度を高めることができる効果がある。
【0085】この発明によれば、符号化された音響特徴
量の情報圧縮方式と量子化・符号化方式を判別するよう
に構成したので、圧縮度の高い音響特徴量から音声認識
結果を得ることができる効果がある。
【0086】この発明によれば、音響特徴量を出力対象
に含めるか否かを判定するように構成したので、変化が
小さい部分の音響特徴量を出力対象から除外できる結
果、効率よく伝送情報を削減することができる効果があ
る。
【0087】この発明によれば、符号化信号に音響特徴
量が含まれているか否かを判定するように構成したの
で、圧縮度の高い音響特徴量から音声認識結果を得るこ
とができる効果がある。
【0088】この発明によれば、特徴量抽出処理手順に
より抽出された音響特徴量の情報圧縮方式と量子化・符
号化方式を決定する方式決定処理手順を設けるように構
成したので、音声認識精度の劣化を招くことなく、音響
特徴量の圧縮度を高めることができる効果がある。
【0089】この発明によれば、符号化された音響特徴
量の情報圧縮方式と量子化・符号化方式を判別する方式
判別処理手順を設けるように構成したので、圧縮度の高
い音響特徴量から音声認識結果を得ることができる効果
がある。
【0090】この発明によれば、特徴量抽出処理手順に
より抽出された音響特徴量を出力対象に含めるか否かを
判定する出力対象判定処理手順を設けるように構成した
ので、変化が小さい部分の音響特徴量を出力対象から除
外できる結果、効率よく伝送情報を削減することができ
る効果がある。
【0091】この発明によれば、符号化信号に音響特徴
量が含まれているか否かを判定する包含判定処理手順を
設けるように構成したので、圧縮度の高い音響特徴量か
ら音声認識結果を得ることができる効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による音響処理装置
及び照合処理装置を示す構成図である。
【図2】 この発明の実施の形態1による音響処理方法
を示すフローチャートである。
【図3】 この発明の実施の形態1による照合処理方法
を示すフローチャートである。
【図4】 音響特徴量の符号化例を示す説明図である。
【図5】 この発明の実施の形態2による音響処理装置
及び照合処理装置を示す構成図である。
【図6】 この発明の実施の形態2による音響処理方法
を示すフローチャートである。
【図7】 この発明の実施の形態3による音響処理装置
及び照合処理装置を示す構成図である。
【図8】 この発明の実施の形態3による音響処理方法
を示すフローチャートである。
【図9】 この発明の実施の形態4による音響処理装置
及び照合処理装置を示す構成図である。
【図10】 この発明の実施の形態4による音響処理方
法を示すフローチャートである。
【図11】 この発明の実施の形態4による照合処理方
法を示すフローチャートである。
【図12】 この発明の実施の形態5による音響処理装
置及び照合処理装置を示す構成図である。
【図13】 この発明の実施の形態5による音響処理方
法を示すフローチャートである。
【図14】 この発明の実施の形態5による照合処理方
法を示すフローチャートである。
【図15】 従来の音響処理装置及び照合処理装置を示
す構成図である。
【図16】 音響処理装置の処理内容を示すフローチャ
ートである。
【図17】 照合処理装置の処理内容を示すフローチャ
ートである。
【図18】 言語辞書の記述例を示す説明図である。
【符号の説明】
1 音声入力部、2 音響特徴量算出部、3 音響特徴
量圧縮部、4 量子化テーブル、5 量子化・符号化
部、6 符号出力部、11 符号入力部、12量子化テ
ーブル、13 復号化・逆量子化部、14 音響特徴量
復元部、15標準パタン、16 言語辞書、17 照合
部、18 認識結果出力部、21 音声入力部、22
音響特徴量算出部(特徴量抽出手段)、23 方式決定
部(方式決定手段)、24 音響特徴量圧縮部(信号圧
縮手段)、25 量子化テーブル、26 量子化・符号
化部(量子化・符号化手段)、27 符号出力部、31
符号入力部、32 方式判定部(方式判別手段)、33
量子化テーブル、34 復号化・逆量子化部(復号化
・逆量子化手段)、35 音響特徴量復元部(圧縮解除
手段)、36 標準パタン、37 言語辞書、38 照
合部(照合手段)、39 認識結果出力部、41 伝送
回線状況判定部(方式決定手段)、42タスク困難度判
定部(方式決定手段)、43 時間フレーム間引き部
(出力対象判定手段)、44 フレーム周期判定部(包
含判定手段)、45 照合部(照合手段)、46 無音
判定部(出力対象判定手段)、47 無音フレーム判定
部(包含判定手段)。

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 入力音声を分析して音響特徴量を抽出す
    る特徴量抽出手段と、上記特徴量抽出手段により抽出さ
    れた音響特徴量の情報圧縮方式と量子化・符号化方式を
    決定する方式決定手段と、上記方式決定手段により決定
    された情報圧縮方式にしたがって当該音響特徴量を信号
    圧縮する信号圧縮手段と、上記方式決定手段により決定
    された量子化・符号化方式にしたがって当該音響特徴量
    の量子化及び符号化を行う量子化・符号化手段とを備え
    た音響処理装置。
  2. 【請求項2】 方式決定手段は、特徴量抽出手段により
    抽出された音響特徴量を参照して、その音響特徴量の情
    報圧縮方式と量子化・符号化方式を決定することを特徴
    とする請求項1記載の音響処理装置。
  3. 【請求項3】 方式決定手段は、出力伝送路の回線状況
    を考慮して、音響特徴量の情報圧縮方式と量子化・符号
    化方式を決定することを特徴とする請求項1記載の音響
    処理装置。
  4. 【請求項4】 方式決定手段は、入力音声の認識困難度
    を考慮して、音響特徴量の情報圧縮方式と量子化・符号
    化方式を決定することを特徴とする請求項1記載の音響
    処理装置。
  5. 【請求項5】 符号化された音響特徴量の情報圧縮方式
    と量子化・符号化方式を判別する方式判別手段と、上記
    方式判別手段により判別された量子化・符号化方式に対
    応する復号化・逆量子化方式にしたがって当該音響特徴
    量の復号化及び逆量子化を行う復号化・逆量子化手段
    と、上記方式判別手段により判別された情報圧縮方式に
    対応する情報復元方式にしたがって当該音響特徴量の信
    号圧縮を解除する圧縮解除手段と、上記圧縮解除手段か
    ら出力された音響特徴量を標準パタンと照合する照合手
    段とを備えた照合処理装置。
  6. 【請求項6】 入力音声を分析して音響特徴量を抽出す
    る特徴量抽出手段と、上記特徴量抽出手段により抽出さ
    れた音響特徴量を出力対象に含めるか否かを判定する出
    力対象判定手段と、上記出力対象判定手段の判定結果が
    当該音響特徴量を出力対象に含める旨を示す場合、所定
    の情報圧縮方式にしたがって当該音響特徴量を信号圧縮
    する信号圧縮手段と、上記出力対象判定手段の判定結果
    が当該音響特徴量を出力対象に含める旨を示す場合、所
    定の量子化・符号化方式にしたがって当該音響特徴量の
    量子化及び符号化を行う量子化・符号化手段とを備えた
    音響処理装置。
  7. 【請求項7】 出力対象判定手段は、特徴量抽出手段に
    より抽出された音響特徴量の変動量が基準変動量より小
    さい場合、その音響特徴量を出力対象に含めず、その音
    響特徴量の変動量が基準変動量より大きい場合、その音
    響特徴量を出力対象に含める旨の判定を行うことを特徴
    とする請求項6記載の音響処理装置。
  8. 【請求項8】 出力対象判定手段は、特徴量抽出手段に
    より抽出された音響特徴量が無音状態であるとき、その
    音響特徴量を出力対象に含めず、その音響特徴量が有音
    状態であるとき、その音響特徴量を出力対象に含める旨
    の判定を行うことを特徴とする請求項6記載の音響処理
    装置。
  9. 【請求項9】 符号化信号に音響特徴量が含まれている
    か否かを判定する包含判定手段と、上記包含判定手段の
    判定結果が含まれている旨を示す場合、所定の復号化・
    逆量子化方式にしたがって当該音響特徴量の復号化及び
    逆量子化を行う復号化・逆量子化手段と、上記包含判定
    手段の判定結果が含まれている旨を示す場合、所定の情
    報復元方式にしたがって当該音響特徴量の信号圧縮を解
    除する圧縮解除手段と、上記包含判定手段の判定結果が
    含まれている旨を示す場合、上記圧縮解除手段から出力
    された音響特徴量を標準パタンと照合し、上記包含判定
    手段の判定結果が含まれていない旨を示す場合、他の音
    響特徴量に係る照合結果を流用する照合手段とを備えた
    照合処理装置。
  10. 【請求項10】 入力音声を分析して音響特徴量を抽出
    すると、その音響特徴量の情報圧縮方式と量子化・符号
    化方式を決定し、その情報圧縮方式にしたがって当該音
    響特徴量を信号圧縮するとともに、その量子化・符号化
    方式にしたがって当該音響特徴量の量子化及び符号化を
    行う音響処理方法。
  11. 【請求項11】 符号化された音響特徴量の情報圧縮方
    式と量子化・符号化方式を判別すると、その量子化・符
    号化方式に対応する復号化・逆量子化方式にしたがって
    当該音響特徴量の復号化及び逆量子化を行うとともに、
    その情報圧縮方式に対応する情報復元方式にしたがって
    当該音響特徴量の信号圧縮を解除し、その音響特徴量を
    標準パタンと照合する照合処理方法。
  12. 【請求項12】 入力音声を分析して音響特徴量を抽出
    すると、その音響特徴量を出力対象に含めるか否かを判
    定し、その判定結果が当該音響特徴量を出力対象に含め
    る旨を示す場合、所定の情報圧縮方式にしたがって当該
    音響特徴量を信号圧縮するとともに、所定の量子化・符
    号化方式にしたがって当該音響特徴量の量子化及び符号
    化を行う音響処理方法。
  13. 【請求項13】 符号化信号に音響特徴量が含まれてい
    るか否かを判定し、その判定結果が含まれている旨を示
    す場合、所定の復号化・逆量子化方式にしたがって当該
    音響特徴量の復号化及び逆量子化を行うとともに、所定
    の情報復元方式にしたがって当該音響特徴量の信号圧縮
    を解除して、その音響特徴量を標準パタンと照合し、そ
    の判定結果が含まれていない旨を示す場合、他の音響特
    徴量に係る照合結果を流用する照合処理方法。
  14. 【請求項14】 入力音声を分析して音響特徴量を抽出
    する特徴量抽出処理手順と、上記特徴量抽出処理手順に
    より抽出された音響特徴量の情報圧縮方式と量子化・符
    号化方式を決定する方式決定処理手順と、上記方式決定
    処理手順により決定された情報圧縮方式にしたがって当
    該音響特徴量を信号圧縮する信号圧縮処理手順と、上記
    方式決定処理手順により決定された量子化・符号化方式
    にしたがって当該音響特徴量の量子化及び符号化を行う
    量子化・符号化処理手順とをコンピュータに実行させる
    ための音響処理プログラム。
  15. 【請求項15】 符号化された音響特徴量の情報圧縮方
    式と量子化・符号化方式を判別する方式判別処理手順
    と、上記方式判別処理手順により判別された量子化・符
    号化方式に対応する復号化・逆量子化方式にしたがって
    当該音響特徴量の復号化及び逆量子化を行う復号化・逆
    量子化処理手順と、上記方式判別処理手順により判別さ
    れた情報圧縮方式に対応する情報復元方式にしたがって
    当該音響特徴量の信号圧縮を解除する圧縮解除処理手順
    と、上記圧縮解除処理手順から出力された音響特徴量を
    標準パタンと照合する照合処理手順とをコンピュータに
    実行させるための照合処理プログラム。
  16. 【請求項16】 入力音声を分析して音響特徴量を抽出
    する特徴量抽出処理手順と、上記特徴量抽出処理手順に
    より抽出された音響特徴量を出力対象に含めるか否かを
    判定する出力対象判定処理手順と、上記出力対象判定処
    理手順の判定結果が当該音響特徴量を出力対象に含める
    旨を示す場合、所定の情報圧縮方式にしたがって当該音
    響特徴量を信号圧縮する信号圧縮処理手順と、上記出力
    対象判定処理手順の判定結果が当該音響特徴量を出力対
    象に含める旨を示す場合、所定の量子化・符号化方式に
    したがって当該音響特徴量の量子化及び符号化を行う量
    子化・符号化処理手順とをコンピュータに実行させるた
    めの音響処理プログラム。
  17. 【請求項17】 符号化信号に音響特徴量が含まれてい
    るか否かを判定する包含判定処理手順と、上記包含判定
    処理手順の判定結果が含まれている旨を示す場合、所定
    の復号化・逆量子化方式にしたがって当該音響特徴量の
    復号化及び逆量子化を行う復号化・逆量子化処理手順
    と、上記包含判定処理手順の判定結果が含まれている旨
    を示す場合、所定の情報復元方式にしたがって当該音響
    特徴量の信号圧縮を解除する圧縮解除処理手順と、上記
    包含判定処理手順の判定結果が含まれている旨を示す場
    合、上記圧縮解除処理手順から出力された音響特徴量を
    標準パタンと照合し、上記包含判定処理手順の判定結果
    が含まれていない旨を示す場合、他の音響特徴量に係る
    照合結果を流用する照合処理手順とをコンピュータに実
    行させるための照合処理プログラム。
JP2001294532A 2001-09-26 2001-09-26 音響処理装置、音響処理方法、音響処理プログラム、照合処理装置、照合処理方法及び照合処理プログラム Pending JP2003099097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001294532A JP2003099097A (ja) 2001-09-26 2001-09-26 音響処理装置、音響処理方法、音響処理プログラム、照合処理装置、照合処理方法及び照合処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001294532A JP2003099097A (ja) 2001-09-26 2001-09-26 音響処理装置、音響処理方法、音響処理プログラム、照合処理装置、照合処理方法及び照合処理プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007044081A Division JP4932530B2 (ja) 2007-02-23 2007-02-23 音響処理装置、音響処理方法、音響処理プログラム、照合処理装置、照合処理方法及び照合処理プログラム

Publications (1)

Publication Number Publication Date
JP2003099097A true JP2003099097A (ja) 2003-04-04

Family

ID=19116115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001294532A Pending JP2003099097A (ja) 2001-09-26 2001-09-26 音響処理装置、音響処理方法、音響処理プログラム、照合処理装置、照合処理方法及び照合処理プログラム

Country Status (1)

Country Link
JP (1) JP2003099097A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009019783A1 (ja) * 2007-08-09 2009-02-12 Panasonic Corporation 音声認識装置及び音声認識方法
JP2016001221A (ja) * 2014-06-11 2016-01-07 日本電信電話株式会社 音声データ送信装置およびその動作方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009019783A1 (ja) * 2007-08-09 2009-02-12 Panasonic Corporation 音声認識装置及び音声認識方法
JP2016001221A (ja) * 2014-06-11 2016-01-07 日本電信電話株式会社 音声データ送信装置およびその動作方法

Similar Documents

Publication Publication Date Title
FI118909B (fi) Hajautettu äänentunnistusjärjestelmä
CN103247293B (zh) 一种语音数据的编码及解码方法
TWI396184B (zh) 一種語音辨認所有語言及用語音輸入單字的方法
CN101510424B (zh) 基于语音基元的语音编码与合成方法及***
RU2636685C2 (ru) Решение относительно наличия/отсутствия вокализации для обработки речи
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
KR20040028784A (ko) 분산형 음성 인식 시스템에서 음성 활성을 송신하는 방법및 장치
US20080040104A1 (en) Speech coding apparatus, speech decoding apparatus, speech coding method, speech decoding method, and computer readable recording medium
US7315819B2 (en) Apparatus for performing speaker identification and speaker searching in speech or sound image data, and method thereof
KR101350285B1 (ko) 신호를 부호화 및 복호화하는 방법, 장치 및 시스템
KR20190112682A (ko) 데이터 마이닝 장치, 이를 이용하는 음성인식 방법 및 시스템
US7050969B2 (en) Distributed speech recognition with codec parameters
JP4696418B2 (ja) 情報検出装置及び方法
JP4932530B2 (ja) 音響処理装置、音響処理方法、音響処理プログラム、照合処理装置、照合処理方法及び照合処理プログラム
JP2003099097A (ja) 音響処理装置、音響処理方法、音響処理プログラム、照合処理装置、照合処理方法及び照合処理プログラム
JP3531342B2 (ja) 音声処理装置および音声処理方法
JPH0990989A (ja) 変換符号化方法および変換復号化方法
KR100701253B1 (ko) 이동통신 환경 하에서의 서버 기반 음성 인식을 위한음성부호화 방법 및 장치
JP2002215192A (ja) オーディオ情報処理装置及び処理方法
Lee et al. Entropy coding of compressed feature parameters for distributed speech recognition
JP5136621B2 (ja) 情報検索装置及び方法
JP3700310B2 (ja) ベクトル量子化装置及びベクトル量子化方法
TWI460718B (zh) 一個辨認所有語言句子方法
KR100984094B1 (ko) 가우시안 혼합 모델을 이용한 3세대 파트너십 프로젝트2의 선택 모드 보코더를 위한 실시간 유무성음 분류 방법
JP2001290494A (ja) 登録単語辞書作成方法及びその装置、並びに音声認識方法及びその装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070223

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20071105

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071105

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071105

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080715