JP2000259190A - オーディオ信号圧縮方法及びオーディオ信号復号方法とオーディオ信号圧縮装置 - Google Patents

オーディオ信号圧縮方法及びオーディオ信号復号方法とオーディオ信号圧縮装置

Info

Publication number
JP2000259190A
JP2000259190A JP11061761A JP6176199A JP2000259190A JP 2000259190 A JP2000259190 A JP 2000259190A JP 11061761 A JP11061761 A JP 11061761A JP 6176199 A JP6176199 A JP 6176199A JP 2000259190 A JP2000259190 A JP 2000259190A
Authority
JP
Japan
Prior art keywords
audio signal
frequency
signal
band
bands
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11061761A
Other languages
English (en)
Other versions
JP4274614B2 (ja
Inventor
Yoshihisa Nakato
良久 中藤
Dairo Katayama
大朗 片山
Mitsuhiko Serikawa
光彦 芹川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP06176199A priority Critical patent/JP4274614B2/ja
Publication of JP2000259190A publication Critical patent/JP2000259190A/ja
Application granted granted Critical
Publication of JP4274614B2 publication Critical patent/JP4274614B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 人間の聴覚感度特性を取り入れることによ
り、従来よりも効率よく信号を圧縮できるオーディオ信
号圧縮方法および装置を提供すること。 【解決手段】 スペクトル包絡変換手段3はメル線形予
測分析手段2で得られたメル線形予測係数を、直線周波
数軸のスペクトル包絡に変換する。次にスペクトル包絡
正規化手段4は時間周波数変換手段1から得られた周波
数領域信号をスペクトル包絡で正規化することで、残差
信号を生成する。帯域分割手段6はパワー正規化手段5
で得られた正規化残差信号を、人間の聴覚的な性質であ
る聴覚感度特性に対応した周波数分解能で複数の部分帯
域に分割する。ベクトル量子化手段8は代表値算出手段
7で得られた全ての部分帯域の代表値を周波数領域信号
と見なし、量子化データに変換することにより、高能率
に圧縮を行なう。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音楽や音声のオー
ディオ信号を小容量の伝送路での情報伝送、記録メディ
アへの効率的な蓄積をするために、特に人間の聴覚的な
性質である聴覚感度特性に基づいてオーディオ信号を圧
縮するに際し、従来よりも効率よく、高音質を保ったま
ま情報を圧縮するオーディオ信号圧縮方法及びオーディ
オ信号圧縮装置と、量子化データからオーディオ信号を
復号するオーディオ信号復号方法とに関するものであ
る。
【0002】
【従来の技術】オーディオ信号圧縮方法の従来例につい
て説明する。まず入力されたオーディオ信号の時系列
は、例えばMDCT(modified discrete cosine trans
form:変形離散コサイン変換)、あるいはFFT(高速
フーリエ変換)等により、一定周期の長さ(フレーム)
毎に周波数領域信号に変換される。さらに入力オーディ
オ信号をフレーム毎に線形予測分析(LPC分析)する
ことにより、LPC係数(線形予測係数)やLSP係数
(line spectrum pair coefficeent)、あるいはPAR
COR係数(偏自己相関係数)等を抽出するとともに、
これらの係数からLPCスペクトル包絡を求める。次
に、算出された周波数領域信号を、求めたLPCスペク
トル包絡で割り算して正規化する。そして、正規化され
た周波数特性を平坦化し、さらにパワーの最大値、ある
いは平均値等に基づいてパワーの正規化を行ない、パワ
ー正規化された残差信号を求める。さらにこのパワー正
規化された残差信号を、スペクトル包絡を重み付けとし
てベクトル量子化する。このベクトル量子化方法とし
て、正規化された残差信号をまず第1段の量子化部で量
子化し、さらに第1段の量子化部での量子化誤差成分
を、第2段の量子化部で量子化する多段構成にする場合
もある。このようなオーディオ信号圧縮方法の例として
は、TwinVQ(岩上、守谷、三樹:「周波数重み付
けインターリーブベクトル量子化(TwinVQ)によるオー
ディオ符号化」音講論、1-P-1,pp.339-340,(1994) )が
ある。
【0003】
【発明が解決しようとする課題】オーディオ信号圧縮方
法の従来例では、MDCTあるいはFFT等により算出
された周波数領域信号に変換し、さらにLPC分析等で
得られたスペクトル包絡で割り算して正規化された周波
数領域信号を求めている。そして、この周波数領域信号
をベクトル量子化により量子化データに変換したり、あ
るいは適応ビット割り当てにより最適な量子化データに
変換することでオーディオ信号の圧縮を実現している。
【0004】ところで一般に人間の聴覚では、低い周波
数帯域の周波数分解能は高く、反対に高い周波数帯域の
周波数分解能は低いという性質がある。これに対して従
来のオーディオ信号圧縮方法では、周波数領域信号を圧
縮する際に、この人間の聴覚の性質が十分取り入れられ
ているとは言えず、効率的な圧縮が行われているとは言
えなかった。
【0005】本発明は、このような従来の問題点に鑑み
てなされたものであって、MDCT係数あるいはFFT
スペクトル等の周波数領域信号を、人間の聴覚的な性質
である聴覚感度特性に対応した周波数分解能で複数の部
分帯域に分割し、各部分帯域内に含まれる要素の平均値
をそれぞれ求めて各部分帯域の代表値とし、全ての部分
帯域の代表値を周波数領域信号と見なして圧縮すること
により、従来よりも効率よく、高音質を保ったまま圧縮
するオーディオ信号圧縮方法およびオーディオ信号圧縮
装置と、量子化データからオーディオ信号を復号するオ
ーディオ信号復号方法とを実現することを目的とする。
【0006】
【課題を解決するための手段】本願の請求項1の発明
は、入力されたオーディオ信号を周波数領域信号に変換
し、前記周波数領域信号を人間の聴覚的な性質である聴
覚感度特性に対応した周波数分解能で複数の部分帯域に
分割し、前記複数の部分帯域について各部分帯域内に含
まれる要素の平均値を各部分帯域毎にそれぞれ求め、前
記平均値を対応する部分帯域の代表値として出力し、全
ての部分帯域の前記代表値を周波数領域信号と見なし、
ベクトル量子化により量子化データに変換することによ
り、オーディオ信号の圧縮を行うことを特徴とするもの
である。
【0007】本願の請求項2の発明は、入力されたオー
ディオ信号を周波数領域信号に変換し、前記周波数領域
信号を人間の聴覚的な性質である聴覚感度特性に対応し
た周波数分解能で複数の部分帯域に分割し、前記複数の
部分帯域について各部分帯域内に含まれる要素の平均値
を各部分帯域毎にそれぞれ求め、前記平均値を対応する
部分帯域の代表値として出力し、全ての部分帯域の前記
代表値を周波数領域信号と見なし、適応ビット割り当て
により最適な量子化データに変換することにより、オー
ディオ信号の圧縮を行うことを特徴とするものである。
【0008】本願の請求項3の発明は、入力されたオー
ディオ信号から人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能を持つメル線形予測係数を算出
し、前記メル線形予測係数を直線周波数軸のスペクトル
包絡に変換し、前記入力オーディオ信号を周波数領域信
号に変換し、前記周波数領域信号を前記スペクトル包絡
で正規化することで残差信号を求め、前記残差信号をパ
ワーの最大値あるいは平均値により正規化することでパ
ワー正規化残差信号を求め、前記パワー正規化残差信号
を人間の聴覚的な性質である聴覚感度特性に対応した周
波数分解能で複数の部分帯域に分割し、前記複数の部分
帯域について各部分帯域内に含まれる要素の平均値を各
部分帯域毎にそれぞれ求めて前記平均値を対応する部分
帯域の代表値として出力し、全ての部分帯域の前記代表
値を周波数領域信号と見なし、ベクトル量子化により量
子化データに変換することにより、オーディオ信号の圧
縮を行うことを特徴とするものである。
【0009】本願の請求項4の発明は、入力されたオー
ディオ信号から人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能を持つメル線形予測係数を算出
し、前記メル線形予測係数を直線周波数軸のスペクトル
包絡に変換し、前記入力オーディオ信号を周波数領域信
号に変換し、前記周波数領域信号を前記スペクトル包絡
で正規化することで残差信号を求め、前記残差信号をパ
ワーの最大値あるいは平均値により正規化することでパ
ワー正規化残差信号を求め、前記パワー正規化残差信号
を人間の聴覚的な性質である聴覚感度特性に対応した周
波数分解能で複数の部分帯域に分割し、前記複数の部分
帯域について各部分帯域内に含まれる要素の平均値を各
部分帯域毎にそれぞれ求めて前記平均値を対応する部分
帯域の代表値として出力し、全ての部分帯域の前記代表
値を周波数領域信号と見なし、適応ビット割り当てによ
り最適な量子化データに変換することにより、オーディ
オ信号の圧縮を行うことを特徴とするものである。
【0010】本願の請求項5の発明は、入力されたオー
ディオ信号から人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能を持つメル線形予測係数を算出
し、前記メル線形予測係数をスペクトル包絡に変換し、
前記入力オーディオ信号を周波数領域信号に変換し、前
記周波数領域信号を人間の聴覚的な性質である聴覚感度
特性に対応した周波数分解能で複数の部分帯域に分割
し、前記複数の部分帯域について各部分帯域内に含まれ
る要素の平均値を各部分帯域毎にそれぞれ求めて前記平
均値を対応する部分帯域の代表値として出力し、全ての
部分帯域の前記代表値を周波数領域信号と見なして前記
スペクトル包絡で正規化することで残差信号を求め、前
記残差信号をパワーの最大値あるいは平均値により正規
化することでパワー正規化残差信号を求め、前記パワー
正規化残差信号をベクトル量子化により量子化データに
変換することにより、オーディオ信号の圧縮を行うこと
を特徴とするものである。
【0011】本願の請求項6の発明は、入力されたオー
ディオ信号から人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能を持つメル線形予測係数を算出
し、前記メル線形予測係数をスペクトル包絡に変換し、
前記入力オーディオ信号を周波数領域信号に変換し、前
記周波数領域信号を人間の聴覚的な性質である聴覚感度
特性に対応した周波数分解能で複数の部分帯域に分割
し、前記複数の部分帯域について各部分帯域内に含まれ
る要素の平均値を各部分帯域毎にそれぞれ求めて前記平
均値を対応する部分帯域の代表値として出力し、全ての
部分帯域の前記代表値を周波数領域信号と見なして前記
スペクトル包絡で正規化することで残差信号を求め、前
記残差信号をパワーの最大値あるいは平均値等により正
規化することでパワー正規化残差信号を求め、前記パワ
ー正規化残差信号を適応ビット割り当てにより最適な量
子化データに変換することにより、オーディオ信号の圧
縮を行うことを特徴とするものである。
【0012】本願の請求項7の発明は、請求項1〜6の
いずれか1項のオーディオ信号圧縮方法において、人間
の聴覚的な性質である聴覚感度特性に対応した周波数分
解能で複数の部分帯域に分割する方法として、バーク尺
度に対応した周波数分解能で複数の部分帯域に分割する
ことを特徴とするものである。
【0013】本願の請求項8の発明は、請求項1〜6の
いずれか1項のオーディオ信号圧縮方法において、人間
の聴覚的な性質である聴覚感度特性に対応した周波数分
解能で複数の部分帯域に分割する方法として、メル尺度
に対応した周波数分解能で複数の部分帯域に分割するこ
とを特徴とするものである。
【0014】本願の請求項9の発明は、請求項1〜6の
いずれか1項記載のオーディオ信号圧縮方法で生成され
た量子化データから元のオーディオ信号を復元するオー
ディオ信号復号方法であって、各部分帯域毎の代表値か
ら部分帯域内に含まれる各要素を復元する方法として、
元の部分帯域内に含まれる各要素毎の符号をあらかじめ
保存しておき、前記各要素毎の符号と前記代表値とを用
いて部分帯域内に含まれる各要素を復元することを特徴
とするものである。
【0015】本願の請求項10の発明は、請求項1〜6
のいずれか1項記載のオーディオ信号圧縮方法で生成さ
れた量子化データから元のオーディオ信号を復元するオ
ーディオ信号復号方法であって、各部分帯域毎の代表値
から部分帯域内に含まれる各要素を復元する方法とし
て、元の部分帯域内に含まれる全ての要素の総和を求
め、前記総和の符号をあらかじめ保存しておき、前記総
和の符号と前記代表値とを用いて元の部分帯域内に含ま
れる各要素を復元することを特徴とするものである。
【0016】本願の請求項11の発明は、請求項1〜6
のいずれか1項記載のオーディオ信号圧縮方法で生成さ
れた量子化データから元のオーディオ信号を復元するオ
ーディオ信号復号方法であって、各部分帯域毎の代表値
から部分帯域内に含まれる各要素を復元する方法とし
て、ランダムに作成した符号と前記代表値とを用いて元
の部分帯域内に含まれる各要素を復元することを特徴と
するものである。
【0017】本願の請求項12の発明は、入力されたオ
ーディオ信号を周波数領域信号に変換する時間周波数変
換手段と、前記時間周波数変換手段で変換された周波数
領域信号を、人間の聴覚的な性質である聴覚感度特性に
対応した周波数分解能で複数の部分帯域に分割する帯域
分割手段と、前記帯域分割手段で得られた複数の部分帯
域について、各部分帯域内に含まれる要素の平均値を各
部分帯域毎にそれぞれ求め、前記平均値を対応する部分
帯域の代表値として出力する代表値算出手段と、前記代
表値算出手段で得られた全ての部分帯域の代表値を周波
数領域信号と見なし、ベクトル量子化により量子化デー
タに変換するベクトル量子化手段と、を具備することを
特徴とするものである。
【0018】本願の請求項13の発明は、入力されたオ
ーディオ信号を周波数領域信号に変換する時間周波数変
換手段と、前記時間周波数変換手段で変換された周波数
領域信号を、人間の聴覚的な性質である聴覚感度特性に
対応した周波数分解能で複数の部分帯域に分割する帯域
分割手段と、前記帯域分割手段で得られた複数の部分帯
域について、各部分帯域内に含まれる要素の平均値を各
部分帯域毎にそれぞれ求め、前記平均値を対応する部分
帯域の代表値として出力する代表値算出手段と、前記代
表値算出手段で得られた全ての部分帯域の代表値を周波
数領域信号と見なし、適応ビット割り当てにより最適な
量子化データに変換する適応量子化手段と、具備するこ
とを特徴とするものである。
【0019】本願の請求項14の発明は、入力されたオ
ーディオ信号から人間の聴覚的な性質である聴覚感度特
性に対応した周波数分解能を持つメル線形予測係数を算
出するメル線形予測分析手段と、前記メル線形予測分析
手段で得られたメル線形予測係数を直線周波数軸のスペ
クトル包絡に変換するスペクトル包絡変換手段と、前記
入力オーディオ信号を周波数領域信号に変換する時間周
波数変換手段と、前記時間周波数変換手段で変換された
周波数領域信号を前記スペクトル包絡で正規化すること
で残差信号を求めるスペクトル包絡正規化手段と、前記
スペクトル包絡正規化手段で得られた残差信号を、パワ
ーの最大値あるいは平均値により正規化することでパワ
ー正規化残差信号を求めるパワー正規化手段と、前記パ
ワー正規化手段で得られたパワー正規化残差信号を、人
間の聴覚的な性質である聴覚感度特性に対応した周波数
分解能で複数の部分帯域に分割する帯域分割手段と、前
記帯域分割手段で得られた複数の部分帯域について、各
部分帯域内に含まれる要素の平均値を各部分帯域毎にそ
れぞれ求めて前記平均値を対応する部分帯域の代表値と
して出力する代表値算出手段と、前記代表値算出手段で
得られた全ての部分帯域の代表値を周波数領域信号と見
なし、ベクトル量子化により量子化データに変換するベ
クトル量子化手段と、を具備することを特徴とするもの
である。
【0020】本願の請求項15の発明は、入力されたオ
ーディオ信号から人間の聴覚的な性質である聴覚感度特
性に対応した周波数分解能を持つメル線形予測係数を算
出するメル線形予測分析手段と、前記メル線形予測分析
手段で得られたメル線形予測係数を直線周波数軸のスペ
クトル包絡に変換するスペクトル包絡変換手段と、前記
入力オーディオ信号を周波数領域信号に変換する時間周
波数変換手段と、前記時間周波数変換手段で変換された
周波数領域信号を前記スペクトル包絡で正規化すること
で残差信号を求めるスペクトル包絡正規化手段と、前記
スペクトル包絡正規化手段で得られた残差信号を、パワ
ーの最大値あるいは平均値により正規化することでパワ
ー正規化残差信号を求めるパワー正規化手段と、前記パ
ワー正規化手段で得られたパワー正規化残差信号を、人
間の聴覚的な性質である聴覚感度特性に対応した周波数
分解能で複数の部分帯域に分割する帯域分割手段と、前
記帯域分割手段で得られた複数の部分帯域について、各
部分帯域内に含まれる要素の平均値を各部分帯域毎にそ
れぞれ求めて前記平均値を対応する部分帯域の代表値と
して出力する代表値算出手段と、前記代表値算出手段で
得られた全ての部分帯域の代表値を周波数領域信号と見
なし、適応ビット割り当てにより最適な量子化データに
変換する適応量子化手段と、具備することを特徴とする
ものである。
【0021】本願の請求項16の発明は、入力されたオ
ーディオ信号から人間の聴覚的な性質である聴覚感度特
性に対応した周波数分解能を持つメル線形予測係数を算
出するメル線形予測分析手段と、前記メル線形予測分析
手段で得られたメル線形予測係数をスペクトル包絡に変
換するスペクトル包絡変換手段と、前記入力オーディオ
信号を周波数領域信号に変換する時間周波数変換手段
と、前記時間周波数変換手段で変換された周波数領域信
号を、人間の聴覚的な性質である聴覚感度特性に対応し
た周波数分解能で複数の部分帯域に分割する帯域分割手
段と、前記帯域分割手段で得られた複数の部分帯域につ
いて、各部分帯域内に含まれる要素の平均値を各部分帯
域毎にそれぞれ求めて前記平均値を対応する部分帯域の
代表値として出力する代表値算出手段と、前記代表値算
出手段で得られた全ての部分帯域の代表値を周波数領域
信号と見なして前記スペクトル包絡で正規化することで
残差信号を求めるスペクトル包絡正規化手段と、前記ス
ペクトル包絡正規化手段で得られた残差信号をパワーの
最大値あるいは平均値により正規化することでパワー正
規化残差信号を求めるパワー正規化手段と、前記パワー
正規化手段で得られたパワー正規化残差信号をベクトル
量子化により量子化データに変換するベクトル量子化手
段と、具備することを特徴とするものである。
【0022】本願の請求項17の発明は、入力されたオ
ーディオ信号から人間の聴覚的な性質である聴覚感度特
性に対応した周波数分解能を持つメル線形予測係数を算
出するメル線形予測分析手段と、前記メル線形予測分析
手段で得られたメル線形予測係数をスペクトル包絡に変
換するスペクトル包絡変換手段と、前記入力オーディオ
信号を周波数領域信号に変換する時間周波数変換手段
と、前記時間周波数変換手段で変換された周波数領域信
号を、人間の聴覚的な性質である聴覚感度特性に対応し
た周波数分解能で複数の部分帯域に分割する帯域分割手
段と、前記帯域分割手段で得られた複数の部分帯域につ
いて、各部分帯域内に含まれる要素の平均値を各部分帯
域毎にそれぞれ求めて前記平均値を対応する部分帯域の
代表値として出力する代表値算出手段と、前記代表値算
出手段で得られた全ての部分帯域の代表値を周波数領域
信号と見なして前記スペクトル包絡で正規化することで
残差信号を求めるスペクトル包絡正規化手段と、前記ス
ペクトル包絡正規化手段で得られた残差信号をパワーの
最大値あるいは平均値により正規化することでパワー正
規化残差信号を求めるパワー正規化手段と、前記パワー
正規化手段で得られたパワー正規化残差信号を適応ビッ
ト割り当てにより最適な量子化データに変換する適応量
子化手段と、具備することを特徴とするものである。
【0023】本願の請求項18の発明は、請求項12〜
17のいずれか1項のオーディオ信号圧縮装置におい
て、前記帯域分割手段は、バーク尺度に対応した周波数
分解能で複数の部分帯域に分割することを特徴とするも
のである。
【0024】本願の請求項19の発明は、請求項12〜
17のいずれか1項のオーディオ信号圧縮装置におい
て、前記帯域分割手段は、メル尺度に対応した周波数分
解能で複数の部分帯域に分割するすることを特徴とする
ものである。
【0025】
【発明の実施の形態】本発明の実施の形態におけるオー
ディオ信号圧縮方法およびオーディオ信号圧縮装置と、
オーディオ信号復号方法について、図面と数式を用いて
説明する。図1は本実施の形態によるオーディオ信号圧
縮装置の構成を示すブロック図である。同図において、
時間周波数変換手段1は、入力されたディジタルオーデ
ィオ信号や音声信号の時系列を、例えばMDCTあるい
はFFT等により一定周期の長さ(フレーム)毎に周波
数領域信号に変換する変換手段である。メル線形予測分
析手段2は、入力されたオーディオ信号から人間の聴覚
的な性質である聴覚感度特性に対応した周波数分解能を
持つメル線形予測係数を算出する線形予測分析手段であ
る。
【0026】スペクトル包絡変換手段3は、メル線形予
測分析手段2で分析されたメル線形予測係数を、直線周
波数軸のスペクトル包絡に変換する変換手段である。ス
ペクトル包絡正規化手段4は、時間周波数変換手段1で
算出された周波数領域信号を、スペクトル包絡変換手段
3で求めたスペクトル包絡で割り算して正規化すること
により、平坦な周波数特性を持つ残差信号を求める正規
化手段である。パワー正規化手段5は、スペクトル包絡
正規化手段4で平坦化された残差信号をパワーの最大値
あるいは平均値等に基づいてパワーの正規化を行ない、
パワー正規化残差信号を求める正規化手段である。
【0027】帯域分割手段6は、パワー正規化残差信号
を人間の聴覚的な性質である聴覚感度特性に対応した周
波数分解能で複数の部分帯域に分割する分割手段であ
る。代表値算出手段7は、各々の部分帯域内に含まれる
要素の平均値を部分帯域毎に求め、その平均値を各部分
帯域の代表値として出力する算出手段である。ベクトル
量子化手段8は、全ての部分帯域の代表値を周波数領域
信号と見なし、ベクトル量子化により量子化データに変
換する量子化手段である。
【0028】次に、以上の各手段の動作について説明す
る。入力されたディジタルオーディオ信号(以下、入力
信号とも記す)の時系列が時間周波数変換手段1に入力
されると、一定周期の長さ(フレーム)毎にMDCTあ
るいはFFT等により周波数領域信号に変換される。
【0029】次にメル線形予測分析手段2はフレーム毎
にメル線形予測分析を行い、入力信号からメル線形予測
係数を算出する。メル線形予測分析とは、通常の線形予
測分析に人間の聴覚的な性質である聴覚感度特性を盛り
込んだ分析手法であり、特に低域の周波数分解能を向上
させた音声分析手法である。この手法は、中藤, 松
本:" 音声認識におけるメル線形予測分析法の評価",信
学技報,sp98-22(1998.6)に報告されている。
【0030】このメル線形予測係数を用いて直線周波数
軸上のスペクトル包絡を求めるスペクトル包絡変換手段
3の動作について述べる。まずメル線形予測係数をFF
Tすることにより、メル周波数軸上のスペクトル包絡が
求まる。 このメル周波数軸上のスペクトル包絡は、メル
周波数軸上では等間隔に配置されているが、直線周波数
軸上から見ると、その間隔は低域では細かく、高域では
粗くなっている。そこで直線周波数軸上で等間隔になる
よう低域では間引き、高域では補間するような処理を施
す。こうすると、メル周波数軸上のスペクトル包絡か
ら、直線周波数軸上のスペクトル包絡へと簡単に変換す
ることができる。補間の方法としては、0次補間、1次
補間、2次補間など様々なものが考えられるが、スペク
トル包絡を補間する意味では同じであるので、どの方法
を用いても差し支えない。なお、直線周波数軸上のスペ
クトル包絡を求める方法として、以下の方法を用いても
よい。まずメル線形予測分析手段2でメル線形予測分析
の代わりに通常の線形予測分析を行い、入力信号から線
形予測係数を算出する。次にスペクトル包絡変換手段3
で線形予測係数をFFTすることにより、直線周波数軸
上のスペクトル包絡を求める方法である。この方法で
は、分析手法として通常の線形予測分析を用いているた
め、人間の聴覚的な性質である聴覚感度特性を十分取れ
入れられないが、より少ない計算量で直線周波数軸上の
スペクトル包絡を求めることが可能となる。更にスペク
トル包絡を求める係数として、線形予測分析で得られる
PARCOR係数やLSP係数、メル線形予測分析で得
られるメルPARCOR係数やメルLSP係数などを用
いても何ら差し支えない。
【0031】スペクトル包絡正規化手段4は、このよう
にして求めた直線周波数軸上のスペクトル包絡で、時間
周波数変換手段1で求めた周波数領域信号を割ること
で、平坦な周波数特性を持つ周波数領域信号に変換す
る。この周波数領域信号を残差信号とも呼ぶことがあ
る。さらに、パワー正規化手段5は、スペクトル包絡正
規化手段4で平坦化された周波数領域信号を、パワーの
最大値あるいは平均値等に基づいてパワーの正規化す
る。すなわちパワーの最大値あるいは平均値等により周
波数領域信号を割ることで、パワー正規化残差信号を求
める。
【0032】帯域分割手段6は、パワー正規化手段5で
得られたパワー正規化残差信号を、人間の聴覚的な性質
である聴覚感度特性に対応した周波数分解能で複数の部
分帯域に分割する。従来、パワー正規化残差信号Sj
(j=1,・・・,N)は、直線周波数軸上で等間隔に
配置されている。本実施の形態では、パワー正規化残差
信号Sjを、j番目の要素あるいは成分あるいはMDC
T係数という呼び方をしている。ところで人間の聴覚的
な性質では、低い周波数成分は高い周波数成分より重要
視されることが分かっている。そこで、メル尺度あるい
バーク尺度のように低域成分の情報量はそのままで、あ
まり聴覚的に重要でない高域成分を削減してから量子化
すれば、より少ない情報で効率的な量子化が行えると考
えられる。
【0033】そこでこれを実現する方法として、まず帯
域分割手段6により、メルまたはバーク周波数軸上でほ
ぼ等間隔の部分帯域Ωi(i=1,・・・,M)に分割
する。部分帯域Ωiとは、MDCT係数をメルまたはバ
ーク周波数軸上でほぼ等間隔の部分帯域で分割したもの
であり、Mは部分帯域数である。
【0034】次に代表値算出手段7で、各部分帯域の代
表振幅Si(ave) を(1)式で近似することで、各々の
部分帯域内に含まれる要素をその平均スペクトルで代表
させる。
【数1】 すなわち、(1)式で得られた代表振幅Si(ave)は、
i番目の部分帯域の平均スペクトルである。尚、(1)
式の右辺のNiは、ある部分帯域Ωiに含まれるSjの
成分数である。例えば1024ポイントのMDCT係数
の場合は、パワー正規化残差信号Sjの総成分数Nは1
024となる。MDCT係数の表す全帯域が0〜20.
48kHzの場合にN=1024であれば、0〜20.
48kHzの周波数範囲が1024等分に離散化され
る。一例としてj=1番目のSjは、0〜20Hzの周
波数成分を表し、j=1024番目のSjは、20. 4
6〜20. 48kHzの成分を表している。成分数削減
率をM/Nで定義すると、成分数削減率が1/2の場合
は、部分帯域数M=512となる。この成分削減率はビ
ットレートと復号化音の品質との関係で決定される。高
いビットレートで高品質の場合は、MをNの値を超えな
い大きな値に設定し、低いビットレートが必要な場合
は、Mの値を小さくする。M=768であれば、成分数
削減率は3/4となり、M=256であれば、成分数削
減率は1/4となる。Mとしては任意の値が設定可能で
ある。
【0035】これにより、総成分数はNからMに低減す
る。図2は、直線周波数軸上のスペクトル包絡から、メ
ル度あるいバーク周波数軸上のスペクトル包絡へと変換
する際に、成分数を低減する様子を示した説明図であ
る。
【0036】最後に、このように成分低減されたパワー
正規化残差信号、すなわち各々の部分帯域の代表値をメ
ルまたはバーク周波数軸上でのパワー正規化残差信号と
見なし、ベクトル量子化手段8により量子化データへと
変換する。
【0037】以上の処理の流れの中で、帯域分割手段6
および代表値算出手段7が、パワー正規化手段5の前、
あるいはスペクトル包絡正規化手段4の前で処理されて
も一向に構わない。また、圧縮方式によっては、パワー
正規化手段5あるいはスペクトル包絡正規化手段4ある
いはその両者が無い場合もありうる。その場合でも帯域
分割手段6および代表値算出手段7を用いることが可能
である。また、本実施の形態では、成分低減されたパワ
ー正規化残差信号をベクトル量子化手段8により量子化
データへと変換したが、別の量子化アプローチ、例えば
適応ビット割り当てにより、最適な量子化データに変換
する方法を用いても同様の効果を得ることが可能であ
る。更に成分低減されたパワー正規化残差信号をベクト
ル量子化する方法として、成分低減されたパワー正規化
残差信号を直接ベクトル量子化する方法や成分低減され
たパワー正規化残差信号をインターリーブし、複数のベ
クトルに分割した後に行ってもよい。
【0038】ところで、成分低減されたパワー正規化残
差信号を、元のパワー正規化残差信号に復元する方法
(復号化方法)について以下に述べる。復号化後のパワ
ー正規化残差信号をSj(dec) (j=1,・・・,N)
で表す。復号化信号を得るには、各部分帯域Ωi毎の代
表振幅Si(ave) を用いて、まず復号化後のパワー正規
化残差信号Sj(dec) を(2)式を用いて求める必要が
ある。なぜなら、代表振幅Si(ave) は符号(位相)を
持たない平均スペクトルであるため、符号情報が失われ
ているためである。このとき、符号情報(符号あるいは
位相とも呼ぶ)Cjが必要となる。
【数2】 もちろん符号情報すら伝送せずに、代表振幅のみで復号
化信号を得る方法もあるが、その場合は、jに関わらず
Cj=1とすれば良い。
【0039】各部分帯域毎の代表値から部分帯域内に含
まれる各要素を復元する方法として、(2)式における
符号(位相)Cjを次の3つの方法で設定する。 (方法1)(3)式により、元の部分帯域内に含まれる
各要素毎の符号を求め、あらかじめ保存しておき、各要
素毎の符号と代表値とを用いて部分帯域内に含まれる各
要素を復元する。
【数3】
【0040】(方法2)(4)式により、元の部分帯域
内に含まれる全ての要素の総和をとることで総和の符号
を求め、あらかじめ保存しておき、総和の符号と代表値
とを用いて元の部分帯域内に含まれる各要素を復元す
る。
【数4】
【0041】(方法3)(5)式により、ランダムに作
成した符号と代表値とを用いて元の部分帯域内に含まれ
る各要素を復元する。
【数5】
【0042】以上3つの方法により、成分低減されたパ
ワー正規化残差信号を元のパワー正規化残差信号に復元
する。こうして圧縮符号化された量子化データから、オ
ーディオ信号を復号することが可能となる。
【0043】
【発明の効果】以上のように、請求項1記載のオーディ
オ信号圧縮方法によれば、入力されたオーディオ信号を
周波数領域信号に変換し、周波数領域信号を人間の聴覚
的な性質である聴覚感度特性に対応した周波数分解能で
複数の部分帯域に分割し、複数の部分帯域について各部
分帯域内に含まれる要素の平均値を各部分帯域毎にそれ
ぞれ求め、平均値を対応する部分帯域の代表値とし、全
ての部分帯域の代表値を周波数領域信号と見なし、ベク
トル量子化により量子化データに変換するようにしてい
るので、人間の聴覚的な性質を利用して効率の良い量子
化を行なうことができる。
【0044】また、請求項2記載のオーディオ信号圧縮
方法によれば、入力されたオーディオ信号を周波数領域
信号に変換し、周波数領域信号を人間の聴覚的な性質で
ある聴覚感度特性に対応した周波数分解能で複数の部分
帯域に分割し、複数の部分帯域について各部分帯域内に
含まれる要素の平均値を各部分帯域毎にそれぞれ求め、
平均値を対応する部分帯域の代表値とし、全ての部分帯
域の代表値を周波数領域信号と見なし、適応ビット割り
当てにより最適な量子化データに変換するようにしてい
るので、人間の聴覚的な性質を利用して効率の良い量子
化を行なうことができる。
【0045】また、請求項3記載のオーディオ信号圧縮
方法によれば、入力されたオーディオ信号から人間の聴
覚的な性質である聴覚感度特性に対応した周波数分解能
を持つメル線形予測係数を算出し、メル線形予測係数を
直線周波数軸のスペクトル包絡に変換し、入力オーディ
オ信号を周波数領域信号に変換し、周波数領域信号をス
ペクトル包絡で正規化することで残差信号を求め、残差
信号をパワーの最大値あるいは平均値等により正規化す
ることでパワー正規化残差信号を求め、パワー正規化残
差信号を人間の聴覚的な性質である聴覚感度特性に対応
した周波数分解能で複数の部分帯域に分割し、複数の部
分帯域について各部分帯域内に含まれる要素の平均値を
各部分帯域毎にそれぞれ求めて平均値を対応する部分帯
域の代表値とし、全ての部分帯域の代表値を周波数領域
信号と見なし、ベクトル量子化により量子化データに変
換するようにしているので、人間の聴覚的な性質を利用
して効率の良い量子化を行なうことができる。
【0046】また、請求項4記載のオーディオ信号圧縮
方法によれば、入力されたオーディオ信号から人間の聴
覚的な性質である聴覚感度特性に対応した周波数分解能
を持つメル線形予測係数を算出し、メル線形予測係数を
直線周波数軸のスペクトル包絡に変換し、入力オーディ
オ信号を周波数領域信号に変換し、周波数領域信号をス
ペクトル包絡で正規化することで残差信号を求め、残差
信号をパワーの最大値あるいは平均値等により正規化す
ることでパワー正規化残差信号を求め、パワー正規化残
差信号を人間の聴覚的な性質である聴覚感度特性に対応
した周波数分解能で複数の部分帯域に分割し、複数の部
分帯域について各部分帯域内に含まれる要素の平均値を
各部分帯域毎にそれぞれ求めて前記平均値を対応する部
分帯域の代表値とし、全ての部分帯域の代表値を周波数
領域信号と見なし、適応ビット割り当てにより最適な量
子化データに変換するようにしているので、人間の聴覚
的な性質を利用して効率の良い量子化を行なうことがで
きる。
【0047】また、請求項5記載のオーディオ信号圧縮
方法によれば、入力されたオーディオ信号から人間の聴
覚的な性質である聴覚感度特性に対応した周波数分解能
を持つメル線形予測係数を算出し、メル線形予測係数を
スペクトル包絡に変換し、入力オーディオ信号を周波数
領域信号に変換し、周波数領域信号を人間の聴覚的な性
質である聴覚感度特性に対応した周波数分解能で複数の
部分帯域に分割し、複数の部分帯域について各部分帯域
内に含まれる要素の平均値を各部分帯域毎にそれぞれ求
めて平均値を対応する部分帯域の代表値とし、全ての部
分帯域の代表値を周波数領域信号と見なしてスペクトル
包絡で正規化することで残差信号を求め、残差信号をパ
ワーの最大値あるいは平均値等により正規化することで
パワー正規化残差信号を求め、パワー正規化残差信号を
ベクトル量子化により量子化データに変換するようにし
ているので、人間の聴覚的な性質を利用して効率の良い
量子化を行なうことができる。
【0048】また、請求項6記載のオーディオ信号圧縮
方法によれば、入力されたオーディオ信号から人間の聴
覚的な性質である聴覚感度特性に対応した周波数分解能
を持つメル線形予測係数を算出し、メル線形予測係数を
スペクトル包絡に変換し、入力オーディオ信号を周波数
領域信号に変換し、周波数領域信号を人間の聴覚的な性
質である聴覚感度特性に対応した周波数分解能で複数の
部分帯域に分割し、複数の部分帯域について各部分帯域
内に含まれる要素の平均値を各部分帯域毎にそれぞれ求
めて平均値を対応する部分帯域の代表値とし、全ての部
分帯域の代表値を周波数領域信号と見なしてスペクトル
包絡で正規化することで残差信号を求め、残差信号をパ
ワーの最大値あるいは平均値等により正規化することで
パワー正規化残差信号を求め、パワー正規化残差信号を
適応ビット割り当てにより最適な量子化データに変換す
るようにしているので、人間の聴覚的な性質を利用して
効率の良い量子化を行なうことができる。
【0049】また、請求項7記載のオーディオ信号圧縮
方法によれば、請求項1〜6記載のオーディオ信号圧縮
方法において、人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能で複数の部分帯域に分割する方
法として、バーク尺度に対応した周波数分解能で複数の
部分帯域に分割するようにしているので、人間の聴覚的
な性質を利用して効率の良い量子化を行なうことができ
る。
【0050】また、請求項8記載のオーディオ信号圧縮
方法によれば、請求項1〜6記載のオーディオ信号圧縮
方法において、人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能で複数の部分帯域に分割する方
法として、メル尺度に対応した周波数分解能で複数の部
分帯域に分割するようにしているので、人間の聴覚的な
性質を利用して効率の良い量子化を行なうことができ
る。
【0051】また、請求項9記載のオーディオ信号復号
方法によれば、請求項1〜6記載のオーディオ信号圧縮
方法において、圧縮後の量子化データから元のオーディ
オ信号を復元する際に、各部分帯域毎の代表値から部分
帯域内に含まれる各要素を復元する方法として、元の部
分帯域内に含まれる各要素毎の符号をあらかじめ保存し
ておき、各要素毎の符号と代表値とを用いて部分帯域内
に含まれる各要素を復元するようにしているので、人間
の聴覚的な性質を利用して効率の良い復号化を行なうこ
とができる。
【0052】また、請求項10記載のオーディオ信号復
号方法によれば、請求項1〜6記載のオーディオ信号圧
縮方法において、圧縮後の量子化データから元のオーデ
ィオ信号を復元する際に、各部分帯域毎の代表値から部
分帯域内に含まれる各要素を復元する方法として、元の
部分帯域内に含まれる全ての要素の総和を求め、総和の
符号をあらかじめ保存しておき、総和の符号と代表値と
を用いて元の部分帯域内に含まれる各要素を復元するよ
うにしているので、人間の聴覚的な性質を利用して効率
の良い復号化を行なうことができる。
【0053】また、請求項11記載のオーディオ信号復
号方法によれば、圧縮後の量子化データから元のオーデ
ィオ信号を復元する際に、各部分帯域毎の代表値から部
分帯域内に含まれる各要素を復元する方法として、ラン
ダムに作成した符号と代表値とを用いて元の部分帯域内
に含まれる各要素を復元するようにしているので、人間
の聴覚的な性質を利用して効率の良い復号化を行なうこ
とができる。
【0054】また、請求項12記載のオーディオ信号圧
縮装置によれば、入力されたオーディオ信号を周波数領
域信号に変換する時間周波数変換手段と、周波数領域信
号を人間の聴覚的な性質である聴覚感度特性に対応した
周波数分解能で複数の部分帯域に分割する帯域分割手段
と、複数の部分帯域について各部分帯域内に含まれる要
素の平均値を各部分帯域毎にそれぞれ求め、平均値を対
応する部分帯域の代表値とする代表値算出手段と、全て
の部分帯域の代表値を周波数領域信号と見なし、ベクト
ル量子化により量子化データに変換するベクトル量子化
手段とを備えた構成により、人間の聴覚的な性質を有効
に利用して効率の良い量子化を行なうことができる。
【0055】また、請求項13記載のオーディオ信号圧
縮装置によれば、入力されたオーディオ信号を周波数領
域信号に変換する時間周波数変換手段と、周波数領域信
号を人間の聴覚的な性質である聴覚感度特性に対応した
周波数分解能で複数の部分帯域に分割する帯域分割手段
と、複数の部分帯域について各部分帯域内に含まれる要
素の平均値を各部分帯域毎にそれぞれ求め、平均値を対
応する部分帯域の代表値とする代表値算出手段と、全て
の部分帯域の代表値を周波数領域信号と見なし、適応ビ
ット割り当てにより最適な量子化データに変換する適応
量子化手段とを備えた構成により、人間の聴覚的な性質
を有効に利用して効率の良い量子化を行なうことができ
る。
【0056】また、請求項14記載のオーディオ信号圧
縮装置によれば、入力されたオーディオ信号から人間の
聴覚的な性質である聴覚感度特性に対応した周波数分解
能を持つメル線形予測係数を算出するメル線形予測分析
手段と、メル線形予測係数を直線周波数軸のスペクトル
包絡に変換するスペクトル包絡変換手段と、入力オーデ
ィオ信号を周波数領域信号に変換する時間周波数変換手
段と、周波数領域信号をスペクトル包絡で正規化するこ
とで残差信号を求めるスペクトル包絡正規化手段と、残
差信号をパワーの最大値あるいは平均値等により正規化
することでパワー正規化残差信号を求めるパワー正規化
手段と、パワー正規化残差信号を人間の聴覚的な性質で
ある聴覚感度特性に対応した周波数分解能で複数の部分
帯域に分割する帯域分割手段と、複数の部分帯域につい
て各部分帯域内に含まれる要素の平均値を各部分帯域毎
にそれぞれ求めて平均値を対応する部分帯域の代表値と
する代表値算出手段と、全ての部分帯域の代表値を周波
数領域信号と見なし、ベクトル量子化により量子化デー
タに変換するベクトル量子化手段とを備えた構成によ
り、人間の聴覚的な性質を有効に利用して効率の良い量
子化を行なうことができる。
【0057】また、請求項15記載のオーディオ信号圧
縮装置によれば、入力されたオーディオ信号から人間の
聴覚的な性質である聴覚感度特性に対応した周波数分解
能を持つメル線形予測係数を算出するメル線形予測分析
手段と、メル線形予測係数を直線周波数軸のスペクトル
包絡に変換するスペクトル包絡変換手段と、入力オーデ
ィオ信号を周波数領域信号に変換する時間周波数変換手
段と、周波数領域信号をスペクトル包絡で正規化するこ
とで残差信号を求めるスペクトル包絡正規化手段と、残
差信号をパワーの最大値あるいは平均値等により正規化
することでパワー正規化残差信号を求めるパワー正規化
手段と、パワー正規化残差信号を人間の聴覚的な性質で
ある聴覚感度特性に対応した周波数分解能で複数の部分
帯域に分割する帯域分割手段と、複数の部分帯域につい
て各部分帯域内に含まれる要素の平均値を各部分帯域毎
にそれぞれ求めて前記平均値を対応する部分帯域の代表
値とする代表値算出手段と、全ての部分帯域の代表値を
周波数領域信号と見なし、適応ビット割り当てにより最
適な量子化データに変換する適応量子化手段とを備えた
構成により、人間の聴覚的な性質を有効に利用して効率
の良い量子化を行なうことができる。
【0058】また、請求項16記載のオーディオ信号圧
縮装置によれば、入力されたオーディオ信号から人間の
聴覚的な性質である聴覚感度特性に対応した周波数分解
能を持つメル線形予測係数を算出するメル線形予測分析
手段と、メル線形予測係数をスペクトル包絡に変換する
スペクトル包絡変換手段と、入力オーディオ信号を周波
数領域信号に変換する時間周波数変換手段と、周波数領
域信号を人間の聴覚的な性質である聴覚感度特性に対応
した周波数分解能で複数の部分帯域に分割する帯域分割
手段と、複数の部分帯域について各部分帯域内に含まれ
る要素の平均値を各部分帯域毎にそれぞれ求めて前記平
均値を対応する部分帯域の代表値とする代表値算出手段
と、全ての部分帯域の代表値を周波数領域信号と見なし
てスペクトル包絡で正規化することで残差信号を求める
スペクトル包絡正規化手段と、残差信号をパワーの最大
値あるいは平均値等により正規化することでパワー正規
化残差信号を求めるパワー正規化手段と、パワー正規化
残差信号をベクトル量子化により量子化データに変換す
るベクトル量子化手段とを備えた構成により、人間の聴
覚的な性質を有効に利用して効率の良い量子化を行なう
ことができる。
【0059】また、請求項17記載のオーディオ信号圧
縮装置によれば、入力されたオーディオ信号から人間の
聴覚的な性質である聴覚感度特性に対応した周波数分解
能を持つメル線形予測係数を算出するメル線形予測分析
手段と、メル線形予測係数をスペクトル包絡に変換する
スペクトル包絡変換手段と、入力オーディオ信号を周波
数領域信号に変換する時間周波数変換手段と、周波数領
域信号を人間の聴覚的な性質である聴覚感度特性に対応
した周波数分解能で複数の部分帯域に分割する帯域分割
手段と、複数の部分帯域について各部分帯域内に含まれ
る要素の平均値を各部分帯域毎にそれぞれ求めて平均値
を対応する部分帯域の代表値とする代表値算出手段と、
全ての部分帯域の代表値を周波数領域信号と見なしてス
ペクトル包絡で正規化することで残差信号を求めるスペ
クトル包絡正規化手段と、残差信号をパワーの最大値あ
るいは平均値等により正規化することでパワー正規化残
差信号を求めるパワー正規化手段と、パワー正規化残差
信号を適応ビット割り当てにより最適な量子化データに
変換する適応量子化手段とを備えた構成により、人間の
聴覚的な性質を有効に利用して効率の良い量子化を行な
うことができる。
【0060】また、請求項18記載のオーディオ信号圧
縮装置によれば、請求項12〜17記載のオーディオ信
号圧縮装置における人間の聴覚的な性質である聴覚感度
特性に対応した周波数分解能で複数の部分帯域に分割す
る手段として、バーク尺度に対応した周波数分解能で複
数の部分帯域に分割する帯域分割手段を備えた構成によ
り、人間の聴覚的な性質を有効に利用して効率の良い量
子化を行なうことができる。
【0061】また、請求項19のオーディオ信号圧縮装
置によれば、請求項12〜17記載のオーディオ信号圧
縮装置における人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能で複数の部分帯域に分割する手
段として、メル尺度に対応した周波数分解能で複数の部
分帯域に分割する帯域分割手段を備えた構成により、人
間の聴覚的な性質を有効に利用して効率の良い量子化を
行なうことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態によるオーディオ信号圧縮
装置の構成例を示すブロック図である。
【図2】スペクトル成分の平均化周波数帯域を示す説明
図である。
【符号の説明】
1 時間周波数変換手段 2 メル線形予測分析手段 3 スペクトル包絡変換手段 4 スペクトル包絡正規化手段 5 パワー正規化手段 6 帯域分割手段 7 代表値算出手段 8 ベクトル量子化手段
フロントページの続き (72)発明者 芹川 光彦 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 Fターム(参考) 5D045 CC07 DA11

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 入力されたオーディオ信号を周波数領域
    信号に変換し、 前記周波数領域信号を人間の聴覚的な性質である聴覚感
    度特性に対応した周波数分解能で複数の部分帯域に分割
    し、 前記複数の部分帯域について各部分帯域内に含まれる要
    素の平均値を各部分帯域毎にそれぞれ求め、前記平均値
    を対応する部分帯域の代表値として出力し、 全ての部分帯域の前記代表値を周波数領域信号と見な
    し、ベクトル量子化により量子化データに変換すること
    により、オーディオ信号の圧縮を行うことを特徴とする
    オーディオ信号圧縮方法。
  2. 【請求項2】 入力されたオーディオ信号を周波数領域
    信号に変換し、 前記周波数領域信号を人間の聴覚的な性質である聴覚感
    度特性に対応した周波数分解能で複数の部分帯域に分割
    し、 前記複数の部分帯域について各部分帯域内に含まれる要
    素の平均値を各部分帯域毎にそれぞれ求め、前記平均値
    を対応する部分帯域の代表値として出力し、 全ての部分帯域の前記代表値を周波数領域信号と見な
    し、適応ビット割り当てにより最適な量子化データに変
    換することにより、オーディオ信号の圧縮を行うことを
    特徴とするオーディオ信号圧縮方法。
  3. 【請求項3】 入力されたオーディオ信号から人間の聴
    覚的な性質である聴覚感度特性に対応した周波数分解能
    を持つメル線形予測係数を算出し、 前記メル線形予測係数を直線周波数軸のスペクトル包絡
    に変換し、 前記入力オーディオ信号を周波数領域信号に変換し、 前記周波数領域信号を前記スペクトル包絡で正規化する
    ことで残差信号を求め、 前記残差信号をパワーの最大値あるいは平均値により正
    規化することでパワー正規化残差信号を求め、 前記パワー正規化残差信号を人間の聴覚的な性質である
    聴覚感度特性に対応した周波数分解能で複数の部分帯域
    に分割し、 前記複数の部分帯域について各部分帯域内に含まれる要
    素の平均値を各部分帯域毎にそれぞれ求めて前記平均値
    を対応する部分帯域の代表値として出力し、 全ての部分帯域の前記代表値を周波数領域信号と見な
    し、ベクトル量子化により量子化データに変換すること
    により、オーディオ信号の圧縮を行うことを特徴とする
    オーディオ信号圧縮方法。
  4. 【請求項4】 入力されたオーディオ信号から人間の聴
    覚的な性質である聴覚感度特性に対応した周波数分解能
    を持つメル線形予測係数を算出し、 前記メル線形予測係数を直線周波数軸のスペクトル包絡
    に変換し、 前記入力オーディオ信号を周波数領域信号に変換し、 前記周波数領域信号を前記スペクトル包絡で正規化する
    ことで残差信号を求め、 前記残差信号をパワーの最大値あるいは平均値により正
    規化することでパワー正規化残差信号を求め、 前記パワー正規化残差信号を人間の聴覚的な性質である
    聴覚感度特性に対応した周波数分解能で複数の部分帯域
    に分割し、 前記複数の部分帯域について各部分帯域内に含まれる要
    素の平均値を各部分帯域毎にそれぞれ求めて前記平均値
    を対応する部分帯域の代表値として出力し、 全ての部分帯域の前記代表値を周波数領域信号と見な
    し、適応ビット割り当てにより最適な量子化データに変
    換することにより、オーディオ信号の圧縮を行うことを
    特徴とするオーディオ信号圧縮方法。
  5. 【請求項5】 入力されたオーディオ信号から人間の聴
    覚的な性質である聴覚感度特性に対応した周波数分解能
    を持つメル線形予測係数を算出し、 前記メル線形予測係数をスペクトル包絡に変換し、 前記入力オーディオ信号を周波数領域信号に変換し、 前記周波数領域信号を人間の聴覚的な性質である聴覚感
    度特性に対応した周波数分解能で複数の部分帯域に分割
    し、 前記複数の部分帯域について各部分帯域内に含まれる要
    素の平均値を各部分帯域毎にそれぞれ求めて前記平均値
    を対応する部分帯域の代表値として出力し、 全ての部分帯域の前記代表値を周波数領域信号と見なし
    て前記スペクトル包絡で正規化することで残差信号を求
    め、 前記残差信号をパワーの最大値あるいは平均値により正
    規化することでパワー正規化残差信号を求め、 前記パワー正規化残差信号をベクトル量子化により量子
    化データに変換することにより、オーディオ信号の圧縮
    を行うことを特徴とするオーディオ信号圧縮方法。
  6. 【請求項6】 入力されたオーディオ信号から人間の聴
    覚的な性質である聴覚感度特性に対応した周波数分解能
    を持つメル線形予測係数を算出し、 前記メル線形予測係数をスペクトル包絡に変換し、 前記入力オーディオ信号を周波数領域信号に変換し、 前記周波数領域信号を人間の聴覚的な性質である聴覚感
    度特性に対応した周波数分解能で複数の部分帯域に分割
    し、 前記複数の部分帯域について各部分帯域内に含まれる要
    素の平均値を各部分帯域毎にそれぞれ求めて前記平均値
    を対応する部分帯域の代表値として出力し、 全ての部分帯域の前記代表値を周波数領域信号と見なし
    て前記スペクトル包絡で正規化することで残差信号を求
    め、 前記残差信号をパワーの最大値あるいは平均値等により
    正規化することでパワー正規化残差信号を求め、 前記パワー正規化残差信号を適応ビット割り当てにより
    最適な量子化データに変換することにより、オーディオ
    信号の圧縮を行うことを特徴とするオーディオ信号圧縮
    方法。
  7. 【請求項7】 人間の聴覚的な性質である聴覚感度特性
    に対応した周波数分解能で複数の部分帯域に分割する方
    法として、バーク尺度に対応した周波数分解能で複数の
    部分帯域に分割することを特徴とする請求項1〜6のい
    ずれか1項記載のオーディオ信号圧縮方法。
  8. 【請求項8】 人間の聴覚的な性質である聴覚感度特性
    に対応した周波数分解能で複数の部分帯域に分割する方
    法として、メル尺度に対応した周波数分解能で複数の部
    分帯域に分割することを特徴とする請求項1〜6のいず
    れか1項記載のオーディオ信号圧縮方法。
  9. 【請求項9】 請求項1〜6のいずれか1項記載のオー
    ディオ信号圧縮方法で生成された量子化データから元の
    オーディオ信号を復元するオーディオ信号復号方法であ
    って、 各部分帯域毎の代表値から部分帯域内に含まれる各要素
    を復元する方法として、元の部分帯域内に含まれる各要
    素毎の符号をあらかじめ保存しておき、前記各要素毎の
    符号と前記代表値とを用いて部分帯域内に含まれる各要
    素を復元することを特徴とするオーディオ信号復号方
    法。
  10. 【請求項10】 請求項1〜6のいずれか1項記載のオ
    ーディオ信号圧縮方法で生成された量子化データから元
    のオーディオ信号を復元するオーディオ信号復号方法で
    あって、 各部分帯域毎の代表値から部分帯域内に含まれる各要素
    を復元する方法として、元の部分帯域内に含まれる全て
    の要素の総和を求め、前記総和の符号をあらかじめ保存
    しておき、前記総和の符号と前記代表値とを用いて元の
    部分帯域内に含まれる各要素を復元することを特徴とす
    るオーディオ信号復号方法。
  11. 【請求項11】 請求項1〜6のいずれか1項記載のオ
    ーディオ信号圧縮方法で生成された量子化データから元
    のオーディオ信号を復元するオーディオ信号復号方法で
    あって、 各部分帯域毎の代表値から部分帯域内に含まれる各要素
    を復元する方法として、ランダムに作成した符号と前記
    代表値とを用いて元の部分帯域内に含まれる各要素を復
    元することを特徴とするオーディオ信号復号方法。
  12. 【請求項12】 入力されたオーディオ信号を周波数領
    域信号に変換する時間周波数変換手段と、 前記時間周波数変換手段で変換された周波数領域信号
    を、人間の聴覚的な性質である聴覚感度特性に対応した
    周波数分解能で複数の部分帯域に分割する帯域分割手段
    と、 前記帯域分割手段で得られた複数の部分帯域について、
    各部分帯域内に含まれる要素の平均値を各部分帯域毎に
    それぞれ求め、前記平均値を対応する部分帯域の代表値
    として出力する代表値算出手段と、 前記代表値算出手段で得られた全ての部分帯域の代表値
    を周波数領域信号と見なし、ベクトル量子化により量子
    化データに変換するベクトル量子化手段と、を具備する
    ことを特徴とするオーディオ信号圧縮装置。
  13. 【請求項13】 入力されたオーディオ信号を周波数領
    域信号に変換する時間周波数変換手段と、 前記時間周波数変換手段で変換された周波数領域信号
    を、人間の聴覚的な性質である聴覚感度特性に対応した
    周波数分解能で複数の部分帯域に分割する帯域分割手段
    と、 前記帯域分割手段で得られた複数の部分帯域について、
    各部分帯域内に含まれる要素の平均値を各部分帯域毎に
    それぞれ求め、前記平均値を対応する部分帯域の代表値
    として出力する代表値算出手段と、 前記代表値算出手段で得られた全ての部分帯域の代表値
    を周波数領域信号と見なし、適応ビット割り当てにより
    最適な量子化データに変換する適応量子化手段と、具備
    することを特徴とするオーディオ信号圧縮装置。
  14. 【請求項14】 入力されたオーディオ信号から人間の
    聴覚的な性質である聴覚感度特性に対応した周波数分解
    能を持つメル線形予測係数を算出するメル線形予測分析
    手段と、 前記メル線形予測分析手段で得られたメル線形予測係数
    を直線周波数軸のスペクトル包絡に変換するスペクトル
    包絡変換手段と、 前記入力オーディオ信号を周波数領域信号に変換する時
    間周波数変換手段と、 前記時間周波数変換手段で変換された周波数領域信号を
    前記スペクトル包絡で正規化することで残差信号を求め
    るスペクトル包絡正規化手段と、 前記スペクトル包絡正規化手段で得られた残差信号を、
    パワーの最大値あるいは平均値により正規化することで
    パワー正規化残差信号を求めるパワー正規化手段と、 前記パワー正規化手段で得られたパワー正規化残差信号
    を、人間の聴覚的な性質である聴覚感度特性に対応した
    周波数分解能で複数の部分帯域に分割する帯域分割手段
    と、 前記帯域分割手段で得られた複数の部分帯域について、
    各部分帯域内に含まれる要素の平均値を各部分帯域毎に
    それぞれ求めて前記平均値を対応する部分帯域の代表値
    として出力する代表値算出手段と、 前記代表値算出手段で得られた全ての部分帯域の代表値
    を周波数領域信号と見なし、ベクトル量子化により量子
    化データに変換するベクトル量子化手段と、を具備する
    ことを特徴とするオーディオ信号圧縮装置。
  15. 【請求項15】 入力されたオーディオ信号から人間の
    聴覚的な性質である聴覚感度特性に対応した周波数分解
    能を持つメル線形予測係数を算出するメル線形予測分析
    手段と、 前記メル線形予測分析手段で得られたメル線形予測係数
    を直線周波数軸のスペクトル包絡に変換するスペクトル
    包絡変換手段と、 前記入力オーディオ信号を周波数領域信号に変換する時
    間周波数変換手段と、 前記時間周波数変換手段で変換された周波数領域信号を
    前記スペクトル包絡で正規化することで残差信号を求め
    るスペクトル包絡正規化手段と、 前記スペクトル包絡正規化手段で得られた残差信号を、
    パワーの最大値あるいは平均値により正規化することで
    パワー正規化残差信号を求めるパワー正規化手段と、 前記パワー正規化手段で得られたパワー正規化残差信号
    を、人間の聴覚的な性質である聴覚感度特性に対応した
    周波数分解能で複数の部分帯域に分割する帯域分割手段
    と、 前記帯域分割手段で得られた複数の部分帯域について、
    各部分帯域内に含まれる要素の平均値を各部分帯域毎に
    それぞれ求めて前記平均値を対応する部分帯域の代表値
    として出力する代表値算出手段と、 前記代表値算出手段で得られた全ての部分帯域の代表値
    を周波数領域信号と見なし、適応ビット割り当てにより
    最適な量子化データに変換する適応量子化手段と、具備
    することを特徴とするオーディオ信号圧縮装置。
  16. 【請求項16】 入力されたオーディオ信号から人間の
    聴覚的な性質である聴覚感度特性に対応した周波数分解
    能を持つメル線形予測係数を算出するメル線形予測分析
    手段と、 前記メル線形予測分析手段で得られたメル線形予測係数
    をスペクトル包絡に変換するスペクトル包絡変換手段
    と、 前記入力オーディオ信号を周波数領域信号に変換する時
    間周波数変換手段と、 前記時間周波数変換手段で変換された周波数領域信号
    を、人間の聴覚的な性質である聴覚感度特性に対応した
    周波数分解能で複数の部分帯域に分割する帯域分割手段
    と、 前記帯域分割手段で得られた複数の部分帯域について、
    各部分帯域内に含まれる要素の平均値を各部分帯域毎に
    それぞれ求めて前記平均値を対応する部分帯域の代表値
    として出力する代表値算出手段と、 前記代表値算出手段で得られた全ての部分帯域の代表値
    を周波数領域信号と見なして前記スペクトル包絡で正規
    化することで残差信号を求めるスペクトル包絡正規化手
    段と、 前記スペクトル包絡正規化手段で得られた残差信号をパ
    ワーの最大値あるいは平均値により正規化することでパ
    ワー正規化残差信号を求めるパワー正規化手段と、 前記パワー正規化手段で得られたパワー正規化残差信号
    をベクトル量子化により量子化データに変換するベクト
    ル量子化手段と、具備することを特徴とするオーディオ
    信号圧縮装置。
  17. 【請求項17】 入力されたオーディオ信号から人間の
    聴覚的な性質である聴覚感度特性に対応した周波数分解
    能を持つメル線形予測係数を算出するメル線形予測分析
    手段と、 前記メル線形予測分析手段で得られたメル線形予測係数
    をスペクトル包絡に変換するスペクトル包絡変換手段
    と、 前記入力オーディオ信号を周波数領域信号に変換する時
    間周波数変換手段と、 前記時間周波数変換手段で変換された周波数領域信号
    を、人間の聴覚的な性質である聴覚感度特性に対応した
    周波数分解能で複数の部分帯域に分割する帯域分割手段
    と、 前記帯域分割手段で得られた複数の部分帯域について、
    各部分帯域内に含まれる要素の平均値を各部分帯域毎に
    それぞれ求めて前記平均値を対応する部分帯域の代表値
    として出力する代表値算出手段と、 前記代表値算出手段で得られた全ての部分帯域の代表値
    を周波数領域信号と見なして前記スペクトル包絡で正規
    化することで残差信号を求めるスペクトル包絡正規化手
    段と、 前記スペクトル包絡正規化手段で得られた残差信号をパ
    ワーの最大値あるいは平均値により正規化することでパ
    ワー正規化残差信号を求めるパワー正規化手段と、 前記パワー正規化手段で得られたパワー正規化残差信号
    を適応ビット割り当てにより最適な量子化データに変換
    する適応量子化手段と、具備することを特徴とするオー
    ディオ信号圧縮装置。
  18. 【請求項18】 前記帯域分割手段は、 バーク尺度に対応した周波数分解能で複数の部分帯域に
    分割するものであることを特徴とする請求項12〜17
    のいずれか1項記載のオーディオ信号圧縮装置。
  19. 【請求項19】 前記帯域分割手段は、 メル尺度に対応した周波数分解能で複数の部分帯域に分
    割するするものであることを特徴とする請求項12〜1
    7のいずれか1項記載のオーディオ信号圧縮装置。
JP06176199A 1999-03-09 1999-03-09 オーディオ信号復号方法 Expired - Fee Related JP4274614B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06176199A JP4274614B2 (ja) 1999-03-09 1999-03-09 オーディオ信号復号方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06176199A JP4274614B2 (ja) 1999-03-09 1999-03-09 オーディオ信号復号方法

Publications (2)

Publication Number Publication Date
JP2000259190A true JP2000259190A (ja) 2000-09-22
JP4274614B2 JP4274614B2 (ja) 2009-06-10

Family

ID=13180462

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06176199A Expired - Fee Related JP4274614B2 (ja) 1999-03-09 1999-03-09 オーディオ信号復号方法

Country Status (1)

Country Link
JP (1) JP4274614B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100788706B1 (ko) 2006-11-28 2007-12-26 삼성전자주식회사 광대역 음성 신호의 부호화/복호화 방법
KR100941011B1 (ko) 2002-05-07 2010-02-05 소니 주식회사 부호화 방법 및 장치, 및 복호 방법 및 장치
JP5419876B2 (ja) * 2008-08-08 2014-02-19 パナソニック株式会社 スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法
KR101546793B1 (ko) 2008-07-14 2015-08-28 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
CN112444742A (zh) * 2020-11-09 2021-03-05 国网山东省电力公司信息通信公司 一种继电保护通道监视预警***
CN113412630A (zh) * 2019-02-14 2021-09-17 Jvc建伍株式会社 处理装置、处理方法、再现方法和程序

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100941011B1 (ko) 2002-05-07 2010-02-05 소니 주식회사 부호화 방법 및 장치, 및 복호 방법 및 장치
KR100788706B1 (ko) 2006-11-28 2007-12-26 삼성전자주식회사 광대역 음성 신호의 부호화/복호화 방법
KR101546793B1 (ko) 2008-07-14 2015-08-28 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
JP5419876B2 (ja) * 2008-08-08 2014-02-19 パナソニック株式会社 スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法
US8731909B2 (en) 2008-08-08 2014-05-20 Panasonic Corporation Spectral smoothing device, encoding device, decoding device, communication terminal device, base station device, and spectral smoothing method
CN113412630A (zh) * 2019-02-14 2021-09-17 Jvc建伍株式会社 处理装置、处理方法、再现方法和程序
CN113412630B (zh) * 2019-02-14 2024-03-08 Jvc建伍株式会社 处理装置、处理方法、再现方法和程序
US11997468B2 (en) 2019-02-14 2024-05-28 Jvckenwood Corporation Processing device, processing method, reproducing method, and program
CN112444742A (zh) * 2020-11-09 2021-03-05 国网山东省电力公司信息通信公司 一种继电保护通道监视预警***
CN112444742B (zh) * 2020-11-09 2022-05-06 国网山东省电力公司信息通信公司 一种继电保护通道监视预警***

Also Published As

Publication number Publication date
JP4274614B2 (ja) 2009-06-10

Similar Documents

Publication Publication Date Title
KR100958144B1 (ko) 오디오 압축
US6826526B1 (en) Audio signal coding method, decoding method, audio signal coding apparatus, and decoding apparatus where first vector quantization is performed on a signal and second vector quantization is performed on an error component resulting from the first vector quantization
KR100304092B1 (ko) 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
US7243061B2 (en) Multistage inverse quantization having a plurality of frequency bands
EP2490215A2 (en) Method and apparatus to extract important spectral component from audio signal and low bit-rate audio signal coding and/or decoding method and apparatus using the same
JP5314720B2 (ja) 階層的な帯域幅構造を有する音声圧縮および復元装置、ならびにその方法
WO2003091989A1 (en) Coding device, decoding device, coding method, and decoding method
JP3344962B2 (ja) オーディオ信号符号化装置、及びオーディオ信号復号化装置
WO2013027631A1 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
JPH06118995A (ja) 広帯域音声信号復元方法
CN101131820A (zh) 编码设备、解码设备、编码方法和解码方法
GB2357231A (en) Encoding and decoding speech signals
JP3186007B2 (ja) 変換符号化方法、復号化方法
WO2009125588A1 (ja) 符号化装置および符号化方法
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
JPWO2005064594A1 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法
JP3087814B2 (ja) 音響信号変換符号化装置および復号化装置
JP4274614B2 (ja) オーディオ信号復号方法
JP4281131B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3237178B2 (ja) 符号化方法及び復号化方法
JP3353266B2 (ja) 音響信号変換符号化方法
JPH05265499A (ja) 高能率符号化方法
JP3353267B2 (ja) 音響信号変換符号化方法及び復号化方法
JP3698418B2 (ja) オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JP3185748B2 (ja) 信号符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080901

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080909

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090203

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090303

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120313

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees