JP2000259190A

JP2000259190A - オーディオ信号圧縮方法及びオーディオ信号復号方法とオーディオ信号圧縮装置

Info

Publication number: JP2000259190A
Application number: JP11061761A
Authority: JP
Inventors: Yoshihisa Nakato; 良久中藤; Dairo Katayama; 大朗片山; Mitsuhiko Serikawa; 光彦芹川
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1999-03-09
Filing date: 1999-03-09
Publication date: 2000-09-22
Anticipated expiration: 2019-03-09
Also published as: JP4274614B2

Abstract

(57)【要約】【課題】人間の聴覚感度特性を取り入れることによ
り、従来よりも効率よく信号を圧縮できるオーディオ信
号圧縮方法および装置を提供すること。【解決手段】スペクトル包絡変換手段３はメル線形予
測分析手段２で得られたメル線形予測係数を、直線周波
数軸のスペクトル包絡に変換する。次にスペクトル包絡
正規化手段４は時間周波数変換手段１から得られた周波
数領域信号をスペクトル包絡で正規化することで、残差
信号を生成する。帯域分割手段６はパワー正規化手段５
で得られた正規化残差信号を、人間の聴覚的な性質であ
る聴覚感度特性に対応した周波数分解能で複数の部分帯
域に分割する。ベクトル量子化手段８は代表値算出手段
７で得られた全ての部分帯域の代表値を周波数領域信号
と見なし、量子化データに変換することにより、高能率
に圧縮を行なう。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音楽や音声のオー
ディオ信号を小容量の伝送路での情報伝送、記録メディ
アへの効率的な蓄積をするために、特に人間の聴覚的な
性質である聴覚感度特性に基づいてオーディオ信号を圧
縮するに際し、従来よりも効率よく、高音質を保ったま
ま情報を圧縮するオーディオ信号圧縮方法及びオーディ
オ信号圧縮装置と、量子化データからオーディオ信号を
復号するオーディオ信号復号方法とに関するものであ
る。

【０００２】

【従来の技術】オーディオ信号圧縮方法の従来例につい
て説明する。まず入力されたオーディオ信号の時系列
は、例えばＭＤＣＴ（modified discrete cosine trans
form：変形離散コサイン変換）、あるいはＦＦＴ（高速
フーリエ変換）等により、一定周期の長さ（フレーム）
毎に周波数領域信号に変換される。さらに入力オーディ
オ信号をフレーム毎に線形予測分析（ＬＰＣ分析）する
ことにより、ＬＰＣ係数（線形予測係数）やＬＳＰ係数
（line spectrum pair coefficeent）、あるいはＰＡＲ
ＣＯＲ係数（偏自己相関係数）等を抽出するとともに、
これらの係数からＬＰＣスペクトル包絡を求める。次
に、算出された周波数領域信号を、求めたＬＰＣスペク
トル包絡で割り算して正規化する。そして、正規化され
た周波数特性を平坦化し、さらにパワーの最大値、ある
いは平均値等に基づいてパワーの正規化を行ない、パワ
ー正規化された残差信号を求める。さらにこのパワー正
規化された残差信号を、スペクトル包絡を重み付けとし
てベクトル量子化する。このベクトル量子化方法とし
て、正規化された残差信号をまず第１段の量子化部で量
子化し、さらに第１段の量子化部での量子化誤差成分
を、第２段の量子化部で量子化する多段構成にする場合
もある。このようなオーディオ信号圧縮方法の例として
は、ＴｗｉｎＶＱ（岩上、守谷、三樹：「周波数重み付
けインターリーブベクトル量子化（TwinVQ）によるオー
ディオ符号化」音講論、1-P-1,pp.339-340,(1994) ）が
ある。

【０００３】

【発明が解決しようとする課題】オーディオ信号圧縮方
法の従来例では、ＭＤＣＴあるいはＦＦＴ等により算出
された周波数領域信号に変換し、さらにＬＰＣ分析等で
得られたスペクトル包絡で割り算して正規化された周波
数領域信号を求めている。そして、この周波数領域信号
をベクトル量子化により量子化データに変換したり、あ
るいは適応ビット割り当てにより最適な量子化データに
変換することでオーディオ信号の圧縮を実現している。

【０００４】ところで一般に人間の聴覚では、低い周波
数帯域の周波数分解能は高く、反対に高い周波数帯域の
周波数分解能は低いという性質がある。これに対して従
来のオーディオ信号圧縮方法では、周波数領域信号を圧
縮する際に、この人間の聴覚の性質が十分取り入れられ
ているとは言えず、効率的な圧縮が行われているとは言
えなかった。

【０００５】本発明は、このような従来の問題点に鑑み
てなされたものであって、ＭＤＣＴ係数あるいはＦＦＴ
スペクトル等の周波数領域信号を、人間の聴覚的な性質
である聴覚感度特性に対応した周波数分解能で複数の部
分帯域に分割し、各部分帯域内に含まれる要素の平均値
をそれぞれ求めて各部分帯域の代表値とし、全ての部分
帯域の代表値を周波数領域信号と見なして圧縮すること
により、従来よりも効率よく、高音質を保ったまま圧縮
するオーディオ信号圧縮方法およびオーディオ信号圧縮
装置と、量子化データからオーディオ信号を復号するオ
ーディオ信号復号方法とを実現することを目的とする。

【０００６】

【課題を解決するための手段】本願の請求項１の発明
は、入力されたオーディオ信号を周波数領域信号に変換
し、前記周波数領域信号を人間の聴覚的な性質である聴
覚感度特性に対応した周波数分解能で複数の部分帯域に
分割し、前記複数の部分帯域について各部分帯域内に含
まれる要素の平均値を各部分帯域毎にそれぞれ求め、前
記平均値を対応する部分帯域の代表値として出力し、全
ての部分帯域の前記代表値を周波数領域信号と見なし、
ベクトル量子化により量子化データに変換することによ
り、オーディオ信号の圧縮を行うことを特徴とするもの
である。

【０００７】本願の請求項２の発明は、入力されたオー
ディオ信号を周波数領域信号に変換し、前記周波数領域
信号を人間の聴覚的な性質である聴覚感度特性に対応し
た周波数分解能で複数の部分帯域に分割し、前記複数の
部分帯域について各部分帯域内に含まれる要素の平均値
を各部分帯域毎にそれぞれ求め、前記平均値を対応する
部分帯域の代表値として出力し、全ての部分帯域の前記
代表値を周波数領域信号と見なし、適応ビット割り当て
により最適な量子化データに変換することにより、オー
ディオ信号の圧縮を行うことを特徴とするものである。

【０００８】本願の請求項３の発明は、入力されたオー
ディオ信号から人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能を持つメル線形予測係数を算出
し、前記メル線形予測係数を直線周波数軸のスペクトル
包絡に変換し、前記入力オーディオ信号を周波数領域信
号に変換し、前記周波数領域信号を前記スペクトル包絡
で正規化することで残差信号を求め、前記残差信号をパ
ワーの最大値あるいは平均値により正規化することでパ
ワー正規化残差信号を求め、前記パワー正規化残差信号
を人間の聴覚的な性質である聴覚感度特性に対応した周
波数分解能で複数の部分帯域に分割し、前記複数の部分
帯域について各部分帯域内に含まれる要素の平均値を各
部分帯域毎にそれぞれ求めて前記平均値を対応する部分
帯域の代表値として出力し、全ての部分帯域の前記代表
値を周波数領域信号と見なし、ベクトル量子化により量
子化データに変換することにより、オーディオ信号の圧
縮を行うことを特徴とするものである。

【０００９】本願の請求項４の発明は、入力されたオー
ディオ信号から人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能を持つメル線形予測係数を算出
し、前記メル線形予測係数を直線周波数軸のスペクトル
包絡に変換し、前記入力オーディオ信号を周波数領域信
号に変換し、前記周波数領域信号を前記スペクトル包絡
で正規化することで残差信号を求め、前記残差信号をパ
ワーの最大値あるいは平均値により正規化することでパ
ワー正規化残差信号を求め、前記パワー正規化残差信号
を人間の聴覚的な性質である聴覚感度特性に対応した周
波数分解能で複数の部分帯域に分割し、前記複数の部分
帯域について各部分帯域内に含まれる要素の平均値を各
部分帯域毎にそれぞれ求めて前記平均値を対応する部分
帯域の代表値として出力し、全ての部分帯域の前記代表
値を周波数領域信号と見なし、適応ビット割り当てによ
り最適な量子化データに変換することにより、オーディ
オ信号の圧縮を行うことを特徴とするものである。

【００１０】本願の請求項５の発明は、入力されたオー
ディオ信号から人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能を持つメル線形予測係数を算出
し、前記メル線形予測係数をスペクトル包絡に変換し、
前記入力オーディオ信号を周波数領域信号に変換し、前
記周波数領域信号を人間の聴覚的な性質である聴覚感度
特性に対応した周波数分解能で複数の部分帯域に分割
し、前記複数の部分帯域について各部分帯域内に含まれ
る要素の平均値を各部分帯域毎にそれぞれ求めて前記平
均値を対応する部分帯域の代表値として出力し、全ての
部分帯域の前記代表値を周波数領域信号と見なして前記
スペクトル包絡で正規化することで残差信号を求め、前
記残差信号をパワーの最大値あるいは平均値により正規
化することでパワー正規化残差信号を求め、前記パワー
正規化残差信号をベクトル量子化により量子化データに
変換することにより、オーディオ信号の圧縮を行うこと
を特徴とするものである。

【００１１】本願の請求項６の発明は、入力されたオー
ディオ信号から人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能を持つメル線形予測係数を算出
し、前記メル線形予測係数をスペクトル包絡に変換し、
前記入力オーディオ信号を周波数領域信号に変換し、前
記周波数領域信号を人間の聴覚的な性質である聴覚感度
特性に対応した周波数分解能で複数の部分帯域に分割
し、前記複数の部分帯域について各部分帯域内に含まれ
る要素の平均値を各部分帯域毎にそれぞれ求めて前記平
均値を対応する部分帯域の代表値として出力し、全ての
部分帯域の前記代表値を周波数領域信号と見なして前記
スペクトル包絡で正規化することで残差信号を求め、前
記残差信号をパワーの最大値あるいは平均値等により正
規化することでパワー正規化残差信号を求め、前記パワ
ー正規化残差信号を適応ビット割り当てにより最適な量
子化データに変換することにより、オーディオ信号の圧
縮を行うことを特徴とするものである。

【００１２】本願の請求項７の発明は、請求項１〜６の
いずれか１項のオーディオ信号圧縮方法において、人間
の聴覚的な性質である聴覚感度特性に対応した周波数分
解能で複数の部分帯域に分割する方法として、バーク尺
度に対応した周波数分解能で複数の部分帯域に分割する
ことを特徴とするものである。

【００１３】本願の請求項８の発明は、請求項１〜６の
いずれか１項のオーディオ信号圧縮方法において、人間
の聴覚的な性質である聴覚感度特性に対応した周波数分
解能で複数の部分帯域に分割する方法として、メル尺度
に対応した周波数分解能で複数の部分帯域に分割するこ
とを特徴とするものである。

【００１４】本願の請求項９の発明は、請求項１〜６の
いずれか１項記載のオーディオ信号圧縮方法で生成され
た量子化データから元のオーディオ信号を復元するオー
ディオ信号復号方法であって、各部分帯域毎の代表値か
ら部分帯域内に含まれる各要素を復元する方法として、
元の部分帯域内に含まれる各要素毎の符号をあらかじめ
保存しておき、前記各要素毎の符号と前記代表値とを用
いて部分帯域内に含まれる各要素を復元することを特徴
とするものである。

【００１５】本願の請求項１０の発明は、請求項１〜６
のいずれか１項記載のオーディオ信号圧縮方法で生成さ
れた量子化データから元のオーディオ信号を復元するオ
ーディオ信号復号方法であって、各部分帯域毎の代表値
から部分帯域内に含まれる各要素を復元する方法とし
て、元の部分帯域内に含まれる全ての要素の総和を求
め、前記総和の符号をあらかじめ保存しておき、前記総
和の符号と前記代表値とを用いて元の部分帯域内に含ま
れる各要素を復元することを特徴とするものである。

【００１６】本願の請求項１１の発明は、請求項１〜６
のいずれか１項記載のオーディオ信号圧縮方法で生成さ
れた量子化データから元のオーディオ信号を復元するオ
ーディオ信号復号方法であって、各部分帯域毎の代表値
から部分帯域内に含まれる各要素を復元する方法とし
て、ランダムに作成した符号と前記代表値とを用いて元
の部分帯域内に含まれる各要素を復元することを特徴と
するものである。

【００１７】本願の請求項１２の発明は、入力されたオ
ーディオ信号を周波数領域信号に変換する時間周波数変
換手段と、前記時間周波数変換手段で変換された周波数
領域信号を、人間の聴覚的な性質である聴覚感度特性に
対応した周波数分解能で複数の部分帯域に分割する帯域
分割手段と、前記帯域分割手段で得られた複数の部分帯
域について、各部分帯域内に含まれる要素の平均値を各
部分帯域毎にそれぞれ求め、前記平均値を対応する部分
帯域の代表値として出力する代表値算出手段と、前記代
表値算出手段で得られた全ての部分帯域の代表値を周波
数領域信号と見なし、ベクトル量子化により量子化デー
タに変換するベクトル量子化手段と、を具備することを
特徴とするものである。

【００１８】本願の請求項１３の発明は、入力されたオ
ーディオ信号を周波数領域信号に変換する時間周波数変
換手段と、前記時間周波数変換手段で変換された周波数
領域信号を、人間の聴覚的な性質である聴覚感度特性に
対応した周波数分解能で複数の部分帯域に分割する帯域
分割手段と、前記帯域分割手段で得られた複数の部分帯
域について、各部分帯域内に含まれる要素の平均値を各
部分帯域毎にそれぞれ求め、前記平均値を対応する部分
帯域の代表値として出力する代表値算出手段と、前記代
表値算出手段で得られた全ての部分帯域の代表値を周波
数領域信号と見なし、適応ビット割り当てにより最適な
量子化データに変換する適応量子化手段と、具備するこ
とを特徴とするものである。

【００１９】本願の請求項１４の発明は、入力されたオ
ーディオ信号から人間の聴覚的な性質である聴覚感度特
性に対応した周波数分解能を持つメル線形予測係数を算
出するメル線形予測分析手段と、前記メル線形予測分析
手段で得られたメル線形予測係数を直線周波数軸のスペ
クトル包絡に変換するスペクトル包絡変換手段と、前記
入力オーディオ信号を周波数領域信号に変換する時間周
波数変換手段と、前記時間周波数変換手段で変換された
周波数領域信号を前記スペクトル包絡で正規化すること
で残差信号を求めるスペクトル包絡正規化手段と、前記
スペクトル包絡正規化手段で得られた残差信号を、パワ
ーの最大値あるいは平均値により正規化することでパワ
ー正規化残差信号を求めるパワー正規化手段と、前記パ
ワー正規化手段で得られたパワー正規化残差信号を、人
間の聴覚的な性質である聴覚感度特性に対応した周波数
分解能で複数の部分帯域に分割する帯域分割手段と、前
記帯域分割手段で得られた複数の部分帯域について、各
部分帯域内に含まれる要素の平均値を各部分帯域毎にそ
れぞれ求めて前記平均値を対応する部分帯域の代表値と
して出力する代表値算出手段と、前記代表値算出手段で
得られた全ての部分帯域の代表値を周波数領域信号と見
なし、ベクトル量子化により量子化データに変換するベ
クトル量子化手段と、を具備することを特徴とするもの
である。

【００２０】本願の請求項１５の発明は、入力されたオ
ーディオ信号から人間の聴覚的な性質である聴覚感度特
性に対応した周波数分解能を持つメル線形予測係数を算
出するメル線形予測分析手段と、前記メル線形予測分析
手段で得られたメル線形予測係数を直線周波数軸のスペ
クトル包絡に変換するスペクトル包絡変換手段と、前記
入力オーディオ信号を周波数領域信号に変換する時間周
波数変換手段と、前記時間周波数変換手段で変換された
周波数領域信号を前記スペクトル包絡で正規化すること
で残差信号を求めるスペクトル包絡正規化手段と、前記
スペクトル包絡正規化手段で得られた残差信号を、パワ
ーの最大値あるいは平均値により正規化することでパワ
ー正規化残差信号を求めるパワー正規化手段と、前記パ
ワー正規化手段で得られたパワー正規化残差信号を、人
間の聴覚的な性質である聴覚感度特性に対応した周波数
分解能で複数の部分帯域に分割する帯域分割手段と、前
記帯域分割手段で得られた複数の部分帯域について、各
部分帯域内に含まれる要素の平均値を各部分帯域毎にそ
れぞれ求めて前記平均値を対応する部分帯域の代表値と
して出力する代表値算出手段と、前記代表値算出手段で
得られた全ての部分帯域の代表値を周波数領域信号と見
なし、適応ビット割り当てにより最適な量子化データに
変換する適応量子化手段と、具備することを特徴とする
ものである。

【００２１】本願の請求項１６の発明は、入力されたオ
ーディオ信号から人間の聴覚的な性質である聴覚感度特
性に対応した周波数分解能を持つメル線形予測係数を算
出するメル線形予測分析手段と、前記メル線形予測分析
手段で得られたメル線形予測係数をスペクトル包絡に変
換するスペクトル包絡変換手段と、前記入力オーディオ
信号を周波数領域信号に変換する時間周波数変換手段
と、前記時間周波数変換手段で変換された周波数領域信
号を、人間の聴覚的な性質である聴覚感度特性に対応し
た周波数分解能で複数の部分帯域に分割する帯域分割手
段と、前記帯域分割手段で得られた複数の部分帯域につ
いて、各部分帯域内に含まれる要素の平均値を各部分帯
域毎にそれぞれ求めて前記平均値を対応する部分帯域の
代表値として出力する代表値算出手段と、前記代表値算
出手段で得られた全ての部分帯域の代表値を周波数領域
信号と見なして前記スペクトル包絡で正規化することで
残差信号を求めるスペクトル包絡正規化手段と、前記ス
ペクトル包絡正規化手段で得られた残差信号をパワーの
最大値あるいは平均値により正規化することでパワー正
規化残差信号を求めるパワー正規化手段と、前記パワー
正規化手段で得られたパワー正規化残差信号をベクトル
量子化により量子化データに変換するベクトル量子化手
段と、具備することを特徴とするものである。

【００２２】本願の請求項１７の発明は、入力されたオ
ーディオ信号から人間の聴覚的な性質である聴覚感度特
性に対応した周波数分解能を持つメル線形予測係数を算
出するメル線形予測分析手段と、前記メル線形予測分析
手段で得られたメル線形予測係数をスペクトル包絡に変
換するスペクトル包絡変換手段と、前記入力オーディオ
信号を周波数領域信号に変換する時間周波数変換手段
と、前記時間周波数変換手段で変換された周波数領域信
号を、人間の聴覚的な性質である聴覚感度特性に対応し
た周波数分解能で複数の部分帯域に分割する帯域分割手
段と、前記帯域分割手段で得られた複数の部分帯域につ
いて、各部分帯域内に含まれる要素の平均値を各部分帯
域毎にそれぞれ求めて前記平均値を対応する部分帯域の
代表値として出力する代表値算出手段と、前記代表値算
出手段で得られた全ての部分帯域の代表値を周波数領域
信号と見なして前記スペクトル包絡で正規化することで
残差信号を求めるスペクトル包絡正規化手段と、前記ス
ペクトル包絡正規化手段で得られた残差信号をパワーの
最大値あるいは平均値により正規化することでパワー正
規化残差信号を求めるパワー正規化手段と、前記パワー
正規化手段で得られたパワー正規化残差信号を適応ビッ
ト割り当てにより最適な量子化データに変換する適応量
子化手段と、具備することを特徴とするものである。

【００２３】本願の請求項１８の発明は、請求項１２〜
１７のいずれか１項のオーディオ信号圧縮装置におい
て、前記帯域分割手段は、バーク尺度に対応した周波数
分解能で複数の部分帯域に分割することを特徴とするも
のである。

【００２４】本願の請求項１９の発明は、請求項１２〜
１７のいずれか１項のオーディオ信号圧縮装置におい
て、前記帯域分割手段は、メル尺度に対応した周波数分
解能で複数の部分帯域に分割するすることを特徴とする
ものである。

【００２５】

【発明の実施の形態】本発明の実施の形態におけるオー
ディオ信号圧縮方法およびオーディオ信号圧縮装置と、
オーディオ信号復号方法について、図面と数式を用いて
説明する。図１は本実施の形態によるオーディオ信号圧
縮装置の構成を示すブロック図である。同図において、
時間周波数変換手段１は、入力されたディジタルオーデ
ィオ信号や音声信号の時系列を、例えばＭＤＣＴあるい
はＦＦＴ等により一定周期の長さ（フレーム）毎に周波
数領域信号に変換する変換手段である。メル線形予測分
析手段２は、入力されたオーディオ信号から人間の聴覚
的な性質である聴覚感度特性に対応した周波数分解能を
持つメル線形予測係数を算出する線形予測分析手段であ
る。

【００２６】スペクトル包絡変換手段３は、メル線形予
測分析手段２で分析されたメル線形予測係数を、直線周
波数軸のスペクトル包絡に変換する変換手段である。ス
ペクトル包絡正規化手段４は、時間周波数変換手段１で
算出された周波数領域信号を、スペクトル包絡変換手段
３で求めたスペクトル包絡で割り算して正規化すること
により、平坦な周波数特性を持つ残差信号を求める正規
化手段である。パワー正規化手段５は、スペクトル包絡
正規化手段４で平坦化された残差信号をパワーの最大値
あるいは平均値等に基づいてパワーの正規化を行ない、
パワー正規化残差信号を求める正規化手段である。

【００２７】帯域分割手段６は、パワー正規化残差信号
を人間の聴覚的な性質である聴覚感度特性に対応した周
波数分解能で複数の部分帯域に分割する分割手段であ
る。代表値算出手段７は、各々の部分帯域内に含まれる
要素の平均値を部分帯域毎に求め、その平均値を各部分
帯域の代表値として出力する算出手段である。ベクトル
量子化手段８は、全ての部分帯域の代表値を周波数領域
信号と見なし、ベクトル量子化により量子化データに変
換する量子化手段である。

【００２８】次に、以上の各手段の動作について説明す
る。入力されたディジタルオーディオ信号（以下、入力
信号とも記す）の時系列が時間周波数変換手段１に入力
されると、一定周期の長さ（フレーム）毎にＭＤＣＴあ
るいはＦＦＴ等により周波数領域信号に変換される。

【００２９】次にメル線形予測分析手段２はフレーム毎
にメル線形予測分析を行い、入力信号からメル線形予測
係数を算出する。メル線形予測分析とは、通常の線形予
測分析に人間の聴覚的な性質である聴覚感度特性を盛り
込んだ分析手法であり、特に低域の周波数分解能を向上
させた音声分析手法である。この手法は、中藤, 松
本：" 音声認識におけるメル線形予測分析法の評価",信
学技報,sp98-22(1998.6)に報告されている。

【００３０】このメル線形予測係数を用いて直線周波数
軸上のスペクトル包絡を求めるスペクトル包絡変換手段
３の動作について述べる。まずメル線形予測係数をＦＦ
Ｔすることにより、メル周波数軸上のスペクトル包絡が
求まる。このメル周波数軸上のスペクトル包絡は、メル
周波数軸上では等間隔に配置されているが、直線周波数
軸上から見ると、その間隔は低域では細かく、高域では
粗くなっている。そこで直線周波数軸上で等間隔になる
よう低域では間引き、高域では補間するような処理を施
す。こうすると、メル周波数軸上のスペクトル包絡か
ら、直線周波数軸上のスペクトル包絡へと簡単に変換す
ることができる。補間の方法としては、０次補間、１次
補間、２次補間など様々なものが考えられるが、スペク
トル包絡を補間する意味では同じであるので、どの方法
を用いても差し支えない。なお、直線周波数軸上のスペ
クトル包絡を求める方法として、以下の方法を用いても
よい。まずメル線形予測分析手段２でメル線形予測分析
の代わりに通常の線形予測分析を行い、入力信号から線
形予測係数を算出する。次にスペクトル包絡変換手段３
で線形予測係数をＦＦＴすることにより、直線周波数軸
上のスペクトル包絡を求める方法である。この方法で
は、分析手法として通常の線形予測分析を用いているた
め、人間の聴覚的な性質である聴覚感度特性を十分取れ
入れられないが、より少ない計算量で直線周波数軸上の
スペクトル包絡を求めることが可能となる。更にスペク
トル包絡を求める係数として、線形予測分析で得られる
ＰＡＲＣＯＲ係数やＬＳＰ係数、メル線形予測分析で得
られるメルＰＡＲＣＯＲ係数やメルＬＳＰ係数などを用
いても何ら差し支えない。

【００３１】スペクトル包絡正規化手段４は、このよう
にして求めた直線周波数軸上のスペクトル包絡で、時間
周波数変換手段１で求めた周波数領域信号を割ること
で、平坦な周波数特性を持つ周波数領域信号に変換す
る。この周波数領域信号を残差信号とも呼ぶことがあ
る。さらに、パワー正規化手段５は、スペクトル包絡正
規化手段４で平坦化された周波数領域信号を、パワーの
最大値あるいは平均値等に基づいてパワーの正規化す
る。すなわちパワーの最大値あるいは平均値等により周
波数領域信号を割ることで、パワー正規化残差信号を求
める。

【００３２】帯域分割手段６は、パワー正規化手段５で
得られたパワー正規化残差信号を、人間の聴覚的な性質
である聴覚感度特性に対応した周波数分解能で複数の部
分帯域に分割する。従来、パワー正規化残差信号Ｓｊ
（ｊ＝１，・・・，Ｎ）は、直線周波数軸上で等間隔に
配置されている。本実施の形態では、パワー正規化残差
信号Ｓｊを、ｊ番目の要素あるいは成分あるいはＭＤＣ
Ｔ係数という呼び方をしている。ところで人間の聴覚的
な性質では、低い周波数成分は高い周波数成分より重要
視されることが分かっている。そこで、メル尺度あるい
バーク尺度のように低域成分の情報量はそのままで、あ
まり聴覚的に重要でない高域成分を削減してから量子化
すれば、より少ない情報で効率的な量子化が行えると考
えられる。

【００３３】そこでこれを実現する方法として、まず帯
域分割手段６により、メルまたはバーク周波数軸上でほ
ぼ等間隔の部分帯域Ωｉ（ｉ＝１，・・・，Ｍ）に分割
する。部分帯域Ωｉとは、ＭＤＣＴ係数をメルまたはバ
ーク周波数軸上でほぼ等間隔の部分帯域で分割したもの
であり、Ｍは部分帯域数である。

【００３４】次に代表値算出手段７で、各部分帯域の代
表振幅Ｓｉ(ave) を（１）式で近似することで、各々の
部分帯域内に含まれる要素をその平均スペクトルで代表
させる。

【数１】すなわち、（１）式で得られた代表振幅Ｓｉ（ave)は、
ｉ番目の部分帯域の平均スペクトルである。尚、（１）
式の右辺のＮｉは、ある部分帯域Ωｉに含まれるＳｊの
成分数である。例えば１０２４ポイントのＭＤＣＴ係数
の場合は、パワー正規化残差信号Ｓｊの総成分数Ｎは１
０２４となる。ＭＤＣＴ係数の表す全帯域が０〜２０.
４８ｋＨｚの場合にＮ＝１０２４であれば、０〜２０.
４８ｋＨｚの周波数範囲が１０２４等分に離散化され
る。一例としてｊ＝１番目のＳｊは、０〜２０Ｈｚの周
波数成分を表し、ｊ＝１０２４番目のＳｊは、２０. ４
６〜２０. ４８ｋＨｚの成分を表している。成分数削減
率をＭ／Ｎで定義すると、成分数削減率が１／２の場合
は、部分帯域数Ｍ＝５１２となる。この成分削減率はビ
ットレートと復号化音の品質との関係で決定される。高
いビットレートで高品質の場合は、ＭをＮの値を超えな
い大きな値に設定し、低いビットレートが必要な場合
は、Ｍの値を小さくする。Ｍ＝７６８であれば、成分数
削減率は３／４となり、Ｍ＝２５６であれば、成分数削
減率は１／４となる。Ｍとしては任意の値が設定可能で
ある。

【００３５】これにより、総成分数はＮからＭに低減す
る。図２は、直線周波数軸上のスペクトル包絡から、メ
ル度あるいバーク周波数軸上のスペクトル包絡へと変換
する際に、成分数を低減する様子を示した説明図であ
る。

【００３６】最後に、このように成分低減されたパワー
正規化残差信号、すなわち各々の部分帯域の代表値をメ
ルまたはバーク周波数軸上でのパワー正規化残差信号と
見なし、ベクトル量子化手段８により量子化データへと
変換する。

【００３７】以上の処理の流れの中で、帯域分割手段６
および代表値算出手段７が、パワー正規化手段５の前、
あるいはスペクトル包絡正規化手段４の前で処理されて
も一向に構わない。また、圧縮方式によっては、パワー
正規化手段５あるいはスペクトル包絡正規化手段４ある
いはその両者が無い場合もありうる。その場合でも帯域
分割手段６および代表値算出手段７を用いることが可能
である。また、本実施の形態では、成分低減されたパワ
ー正規化残差信号をベクトル量子化手段８により量子化
データへと変換したが、別の量子化アプローチ、例えば
適応ビット割り当てにより、最適な量子化データに変換
する方法を用いても同様の効果を得ることが可能であ
る。更に成分低減されたパワー正規化残差信号をベクト
ル量子化する方法として、成分低減されたパワー正規化
残差信号を直接ベクトル量子化する方法や成分低減され
たパワー正規化残差信号をインターリーブし、複数のベ
クトルに分割した後に行ってもよい。

【００３８】ところで、成分低減されたパワー正規化残
差信号を、元のパワー正規化残差信号に復元する方法
（復号化方法）について以下に述べる。復号化後のパワ
ー正規化残差信号をＳｊ(dec) （ｊ＝１，・・・，Ｎ）
で表す。復号化信号を得るには、各部分帯域Ωｉ毎の代
表振幅Ｓｉ(ave) を用いて、まず復号化後のパワー正規
化残差信号Ｓｊ(dec) を（２）式を用いて求める必要が
ある。なぜなら、代表振幅Ｓｉ(ave) は符号（位相）を
持たない平均スペクトルであるため、符号情報が失われ
ているためである。このとき、符号情報（符号あるいは
位相とも呼ぶ）Ｃｊが必要となる。

【数２】もちろん符号情報すら伝送せずに、代表振幅のみで復号
化信号を得る方法もあるが、その場合は、ｊに関わらず
Ｃｊ＝１とすれば良い。

【００３９】各部分帯域毎の代表値から部分帯域内に含
まれる各要素を復元する方法として、（２）式における
符号（位相）Ｃｊを次の３つの方法で設定する。（方法１）（３）式により、元の部分帯域内に含まれる
各要素毎の符号を求め、あらかじめ保存しておき、各要
素毎の符号と代表値とを用いて部分帯域内に含まれる各
要素を復元する。

【数３】

【００４０】（方法２)（４）式により、元の部分帯域
内に含まれる全ての要素の総和をとることで総和の符号
を求め、あらかじめ保存しておき、総和の符号と代表値
とを用いて元の部分帯域内に含まれる各要素を復元す
る。

【数４】

【００４１】（方法３)（５）式により、ランダムに作
成した符号と代表値とを用いて元の部分帯域内に含まれ
る各要素を復元する。

【数５】

【００４２】以上３つの方法により、成分低減されたパ
ワー正規化残差信号を元のパワー正規化残差信号に復元
する。こうして圧縮符号化された量子化データから、オ
ーディオ信号を復号することが可能となる。

【００４３】

【発明の効果】以上のように、請求項１記載のオーディ
オ信号圧縮方法によれば、入力されたオーディオ信号を
周波数領域信号に変換し、周波数領域信号を人間の聴覚
的な性質である聴覚感度特性に対応した周波数分解能で
複数の部分帯域に分割し、複数の部分帯域について各部
分帯域内に含まれる要素の平均値を各部分帯域毎にそれ
ぞれ求め、平均値を対応する部分帯域の代表値とし、全
ての部分帯域の代表値を周波数領域信号と見なし、ベク
トル量子化により量子化データに変換するようにしてい
るので、人間の聴覚的な性質を利用して効率の良い量子
化を行なうことができる。

【００４４】また、請求項２記載のオーディオ信号圧縮
方法によれば、入力されたオーディオ信号を周波数領域
信号に変換し、周波数領域信号を人間の聴覚的な性質で
ある聴覚感度特性に対応した周波数分解能で複数の部分
帯域に分割し、複数の部分帯域について各部分帯域内に
含まれる要素の平均値を各部分帯域毎にそれぞれ求め、
平均値を対応する部分帯域の代表値とし、全ての部分帯
域の代表値を周波数領域信号と見なし、適応ビット割り
当てにより最適な量子化データに変換するようにしてい
るので、人間の聴覚的な性質を利用して効率の良い量子
化を行なうことができる。

【００４５】また、請求項３記載のオーディオ信号圧縮
方法によれば、入力されたオーディオ信号から人間の聴
覚的な性質である聴覚感度特性に対応した周波数分解能
を持つメル線形予測係数を算出し、メル線形予測係数を
直線周波数軸のスペクトル包絡に変換し、入力オーディ
オ信号を周波数領域信号に変換し、周波数領域信号をス
ペクトル包絡で正規化することで残差信号を求め、残差
信号をパワーの最大値あるいは平均値等により正規化す
ることでパワー正規化残差信号を求め、パワー正規化残
差信号を人間の聴覚的な性質である聴覚感度特性に対応
した周波数分解能で複数の部分帯域に分割し、複数の部
分帯域について各部分帯域内に含まれる要素の平均値を
各部分帯域毎にそれぞれ求めて平均値を対応する部分帯
域の代表値とし、全ての部分帯域の代表値を周波数領域
信号と見なし、ベクトル量子化により量子化データに変
換するようにしているので、人間の聴覚的な性質を利用
して効率の良い量子化を行なうことができる。

【００４６】また、請求項４記載のオーディオ信号圧縮
方法によれば、入力されたオーディオ信号から人間の聴
覚的な性質である聴覚感度特性に対応した周波数分解能
を持つメル線形予測係数を算出し、メル線形予測係数を
直線周波数軸のスペクトル包絡に変換し、入力オーディ
オ信号を周波数領域信号に変換し、周波数領域信号をス
ペクトル包絡で正規化することで残差信号を求め、残差
信号をパワーの最大値あるいは平均値等により正規化す
ることでパワー正規化残差信号を求め、パワー正規化残
差信号を人間の聴覚的な性質である聴覚感度特性に対応
した周波数分解能で複数の部分帯域に分割し、複数の部
分帯域について各部分帯域内に含まれる要素の平均値を
各部分帯域毎にそれぞれ求めて前記平均値を対応する部
分帯域の代表値とし、全ての部分帯域の代表値を周波数
領域信号と見なし、適応ビット割り当てにより最適な量
子化データに変換するようにしているので、人間の聴覚
的な性質を利用して効率の良い量子化を行なうことがで
きる。

【００４７】また、請求項５記載のオーディオ信号圧縮
方法によれば、入力されたオーディオ信号から人間の聴
覚的な性質である聴覚感度特性に対応した周波数分解能
を持つメル線形予測係数を算出し、メル線形予測係数を
スペクトル包絡に変換し、入力オーディオ信号を周波数
領域信号に変換し、周波数領域信号を人間の聴覚的な性
質である聴覚感度特性に対応した周波数分解能で複数の
部分帯域に分割し、複数の部分帯域について各部分帯域
内に含まれる要素の平均値を各部分帯域毎にそれぞれ求
めて平均値を対応する部分帯域の代表値とし、全ての部
分帯域の代表値を周波数領域信号と見なしてスペクトル
包絡で正規化することで残差信号を求め、残差信号をパ
ワーの最大値あるいは平均値等により正規化することで
パワー正規化残差信号を求め、パワー正規化残差信号を
ベクトル量子化により量子化データに変換するようにし
ているので、人間の聴覚的な性質を利用して効率の良い
量子化を行なうことができる。

【００４８】また、請求項６記載のオーディオ信号圧縮
方法によれば、入力されたオーディオ信号から人間の聴
覚的な性質である聴覚感度特性に対応した周波数分解能
を持つメル線形予測係数を算出し、メル線形予測係数を
スペクトル包絡に変換し、入力オーディオ信号を周波数
領域信号に変換し、周波数領域信号を人間の聴覚的な性
質である聴覚感度特性に対応した周波数分解能で複数の
部分帯域に分割し、複数の部分帯域について各部分帯域
内に含まれる要素の平均値を各部分帯域毎にそれぞれ求
めて平均値を対応する部分帯域の代表値とし、全ての部
分帯域の代表値を周波数領域信号と見なしてスペクトル
包絡で正規化することで残差信号を求め、残差信号をパ
ワーの最大値あるいは平均値等により正規化することで
パワー正規化残差信号を求め、パワー正規化残差信号を
適応ビット割り当てにより最適な量子化データに変換す
るようにしているので、人間の聴覚的な性質を利用して
効率の良い量子化を行なうことができる。

【００４９】また、請求項７記載のオーディオ信号圧縮
方法によれば、請求項１〜６記載のオーディオ信号圧縮
方法において、人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能で複数の部分帯域に分割する方
法として、バーク尺度に対応した周波数分解能で複数の
部分帯域に分割するようにしているので、人間の聴覚的
な性質を利用して効率の良い量子化を行なうことができ
る。

【００５０】また、請求項８記載のオーディオ信号圧縮
方法によれば、請求項１〜６記載のオーディオ信号圧縮
方法において、人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能で複数の部分帯域に分割する方
法として、メル尺度に対応した周波数分解能で複数の部
分帯域に分割するようにしているので、人間の聴覚的な
性質を利用して効率の良い量子化を行なうことができ
る。

【００５１】また、請求項９記載のオーディオ信号復号
方法によれば、請求項１〜６記載のオーディオ信号圧縮
方法において、圧縮後の量子化データから元のオーディ
オ信号を復元する際に、各部分帯域毎の代表値から部分
帯域内に含まれる各要素を復元する方法として、元の部
分帯域内に含まれる各要素毎の符号をあらかじめ保存し
ておき、各要素毎の符号と代表値とを用いて部分帯域内
に含まれる各要素を復元するようにしているので、人間
の聴覚的な性質を利用して効率の良い復号化を行なうこ
とができる。

【００５２】また、請求項１０記載のオーディオ信号復
号方法によれば、請求項１〜６記載のオーディオ信号圧
縮方法において、圧縮後の量子化データから元のオーデ
ィオ信号を復元する際に、各部分帯域毎の代表値から部
分帯域内に含まれる各要素を復元する方法として、元の
部分帯域内に含まれる全ての要素の総和を求め、総和の
符号をあらかじめ保存しておき、総和の符号と代表値と
を用いて元の部分帯域内に含まれる各要素を復元するよ
うにしているので、人間の聴覚的な性質を利用して効率
の良い復号化を行なうことができる。

【００５３】また、請求項１１記載のオーディオ信号復
号方法によれば、圧縮後の量子化データから元のオーデ
ィオ信号を復元する際に、各部分帯域毎の代表値から部
分帯域内に含まれる各要素を復元する方法として、ラン
ダムに作成した符号と代表値とを用いて元の部分帯域内
に含まれる各要素を復元するようにしているので、人間
の聴覚的な性質を利用して効率の良い復号化を行なうこ
とができる。

【００５４】また、請求項１２記載のオーディオ信号圧
縮装置によれば、入力されたオーディオ信号を周波数領
域信号に変換する時間周波数変換手段と、周波数領域信
号を人間の聴覚的な性質である聴覚感度特性に対応した
周波数分解能で複数の部分帯域に分割する帯域分割手段
と、複数の部分帯域について各部分帯域内に含まれる要
素の平均値を各部分帯域毎にそれぞれ求め、平均値を対
応する部分帯域の代表値とする代表値算出手段と、全て
の部分帯域の代表値を周波数領域信号と見なし、ベクト
ル量子化により量子化データに変換するベクトル量子化
手段とを備えた構成により、人間の聴覚的な性質を有効
に利用して効率の良い量子化を行なうことができる。

【００５５】また、請求項１３記載のオーディオ信号圧
縮装置によれば、入力されたオーディオ信号を周波数領
域信号に変換する時間周波数変換手段と、周波数領域信
号を人間の聴覚的な性質である聴覚感度特性に対応した
周波数分解能で複数の部分帯域に分割する帯域分割手段
と、複数の部分帯域について各部分帯域内に含まれる要
素の平均値を各部分帯域毎にそれぞれ求め、平均値を対
応する部分帯域の代表値とする代表値算出手段と、全て
の部分帯域の代表値を周波数領域信号と見なし、適応ビ
ット割り当てにより最適な量子化データに変換する適応
量子化手段とを備えた構成により、人間の聴覚的な性質
を有効に利用して効率の良い量子化を行なうことができ
る。

【００５６】また、請求項１４記載のオーディオ信号圧
縮装置によれば、入力されたオーディオ信号から人間の
聴覚的な性質である聴覚感度特性に対応した周波数分解
能を持つメル線形予測係数を算出するメル線形予測分析
手段と、メル線形予測係数を直線周波数軸のスペクトル
包絡に変換するスペクトル包絡変換手段と、入力オーデ
ィオ信号を周波数領域信号に変換する時間周波数変換手
段と、周波数領域信号をスペクトル包絡で正規化するこ
とで残差信号を求めるスペクトル包絡正規化手段と、残
差信号をパワーの最大値あるいは平均値等により正規化
することでパワー正規化残差信号を求めるパワー正規化
手段と、パワー正規化残差信号を人間の聴覚的な性質で
ある聴覚感度特性に対応した周波数分解能で複数の部分
帯域に分割する帯域分割手段と、複数の部分帯域につい
て各部分帯域内に含まれる要素の平均値を各部分帯域毎
にそれぞれ求めて平均値を対応する部分帯域の代表値と
する代表値算出手段と、全ての部分帯域の代表値を周波
数領域信号と見なし、ベクトル量子化により量子化デー
タに変換するベクトル量子化手段とを備えた構成によ
り、人間の聴覚的な性質を有効に利用して効率の良い量
子化を行なうことができる。

【００５７】また、請求項１５記載のオーディオ信号圧
縮装置によれば、入力されたオーディオ信号から人間の
聴覚的な性質である聴覚感度特性に対応した周波数分解
能を持つメル線形予測係数を算出するメル線形予測分析
手段と、メル線形予測係数を直線周波数軸のスペクトル
包絡に変換するスペクトル包絡変換手段と、入力オーデ
ィオ信号を周波数領域信号に変換する時間周波数変換手
段と、周波数領域信号をスペクトル包絡で正規化するこ
とで残差信号を求めるスペクトル包絡正規化手段と、残
差信号をパワーの最大値あるいは平均値等により正規化
することでパワー正規化残差信号を求めるパワー正規化
手段と、パワー正規化残差信号を人間の聴覚的な性質で
ある聴覚感度特性に対応した周波数分解能で複数の部分
帯域に分割する帯域分割手段と、複数の部分帯域につい
て各部分帯域内に含まれる要素の平均値を各部分帯域毎
にそれぞれ求めて前記平均値を対応する部分帯域の代表
値とする代表値算出手段と、全ての部分帯域の代表値を
周波数領域信号と見なし、適応ビット割り当てにより最
適な量子化データに変換する適応量子化手段とを備えた
構成により、人間の聴覚的な性質を有効に利用して効率
の良い量子化を行なうことができる。

【００５８】また、請求項１６記載のオーディオ信号圧
縮装置によれば、入力されたオーディオ信号から人間の
聴覚的な性質である聴覚感度特性に対応した周波数分解
能を持つメル線形予測係数を算出するメル線形予測分析
手段と、メル線形予測係数をスペクトル包絡に変換する
スペクトル包絡変換手段と、入力オーディオ信号を周波
数領域信号に変換する時間周波数変換手段と、周波数領
域信号を人間の聴覚的な性質である聴覚感度特性に対応
した周波数分解能で複数の部分帯域に分割する帯域分割
手段と、複数の部分帯域について各部分帯域内に含まれ
る要素の平均値を各部分帯域毎にそれぞれ求めて前記平
均値を対応する部分帯域の代表値とする代表値算出手段
と、全ての部分帯域の代表値を周波数領域信号と見なし
てスペクトル包絡で正規化することで残差信号を求める
スペクトル包絡正規化手段と、残差信号をパワーの最大
値あるいは平均値等により正規化することでパワー正規
化残差信号を求めるパワー正規化手段と、パワー正規化
残差信号をベクトル量子化により量子化データに変換す
るベクトル量子化手段とを備えた構成により、人間の聴
覚的な性質を有効に利用して効率の良い量子化を行なう
ことができる。

【００５９】また、請求項１７記載のオーディオ信号圧
縮装置によれば、入力されたオーディオ信号から人間の
聴覚的な性質である聴覚感度特性に対応した周波数分解
能を持つメル線形予測係数を算出するメル線形予測分析
手段と、メル線形予測係数をスペクトル包絡に変換する
スペクトル包絡変換手段と、入力オーディオ信号を周波
数領域信号に変換する時間周波数変換手段と、周波数領
域信号を人間の聴覚的な性質である聴覚感度特性に対応
した周波数分解能で複数の部分帯域に分割する帯域分割
手段と、複数の部分帯域について各部分帯域内に含まれ
る要素の平均値を各部分帯域毎にそれぞれ求めて平均値
を対応する部分帯域の代表値とする代表値算出手段と、
全ての部分帯域の代表値を周波数領域信号と見なしてス
ペクトル包絡で正規化することで残差信号を求めるスペ
クトル包絡正規化手段と、残差信号をパワーの最大値あ
るいは平均値等により正規化することでパワー正規化残
差信号を求めるパワー正規化手段と、パワー正規化残差
信号を適応ビット割り当てにより最適な量子化データに
変換する適応量子化手段とを備えた構成により、人間の
聴覚的な性質を有効に利用して効率の良い量子化を行な
うことができる。

【００６０】また、請求項１８記載のオーディオ信号圧
縮装置によれば、請求項１２〜１７記載のオーディオ信
号圧縮装置における人間の聴覚的な性質である聴覚感度
特性に対応した周波数分解能で複数の部分帯域に分割す
る手段として、バーク尺度に対応した周波数分解能で複
数の部分帯域に分割する帯域分割手段を備えた構成によ
り、人間の聴覚的な性質を有効に利用して効率の良い量
子化を行なうことができる。

【００６１】また、請求項１９のオーディオ信号圧縮装
置によれば、請求項１２〜１７記載のオーディオ信号圧
縮装置における人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能で複数の部分帯域に分割する手
段として、メル尺度に対応した周波数分解能で複数の部
分帯域に分割する帯域分割手段を備えた構成により、人
間の聴覚的な性質を有効に利用して効率の良い量子化を
行なうことができる。

【図面の簡単な説明】

【図１】本発明の実施の形態によるオーディオ信号圧縮
装置の構成例を示すブロック図である。

【図２】スペクトル成分の平均化周波数帯域を示す説明
図である。

【符号の説明】

１時間周波数変換手段２メル線形予測分析手段３スペクトル包絡変換手段４スペクトル包絡正規化手段５パワー正規化手段６帯域分割手段７代表値算出手段８ベクトル量子化手段

フロントページの続き (72)発明者芹川光彦大阪府門真市大字門真1006番地松下電器産業株式会社内Ｆターム(参考） 5D045 CC07 DA11

Claims

【特許請求の範囲】

【請求項１】入力されたオーディオ信号を周波数領域
信号に変換し、前記周波数領域信号を人間の聴覚的な性質である聴覚感
度特性に対応した周波数分解能で複数の部分帯域に分割
し、前記複数の部分帯域について各部分帯域内に含まれる要
素の平均値を各部分帯域毎にそれぞれ求め、前記平均値
を対応する部分帯域の代表値として出力し、全ての部分帯域の前記代表値を周波数領域信号と見な
し、ベクトル量子化により量子化データに変換すること
により、オーディオ信号の圧縮を行うことを特徴とする
オーディオ信号圧縮方法。
【請求項２】入力されたオーディオ信号を周波数領域
信号に変換し、前記周波数領域信号を人間の聴覚的な性質である聴覚感
度特性に対応した周波数分解能で複数の部分帯域に分割
し、前記複数の部分帯域について各部分帯域内に含まれる要
素の平均値を各部分帯域毎にそれぞれ求め、前記平均値
を対応する部分帯域の代表値として出力し、全ての部分帯域の前記代表値を周波数領域信号と見な
し、適応ビット割り当てにより最適な量子化データに変
換することにより、オーディオ信号の圧縮を行うことを
特徴とするオーディオ信号圧縮方法。
【請求項３】入力されたオーディオ信号から人間の聴
覚的な性質である聴覚感度特性に対応した周波数分解能
を持つメル線形予測係数を算出し、前記メル線形予測係数を直線周波数軸のスペクトル包絡
に変換し、前記入力オーディオ信号を周波数領域信号に変換し、前記周波数領域信号を前記スペクトル包絡で正規化する
ことで残差信号を求め、前記残差信号をパワーの最大値あるいは平均値により正
規化することでパワー正規化残差信号を求め、前記パワー正規化残差信号を人間の聴覚的な性質である
聴覚感度特性に対応した周波数分解能で複数の部分帯域
に分割し、前記複数の部分帯域について各部分帯域内に含まれる要
素の平均値を各部分帯域毎にそれぞれ求めて前記平均値
を対応する部分帯域の代表値として出力し、全ての部分帯域の前記代表値を周波数領域信号と見な
し、ベクトル量子化により量子化データに変換すること
により、オーディオ信号の圧縮を行うことを特徴とする
オーディオ信号圧縮方法。
【請求項４】入力されたオーディオ信号から人間の聴
覚的な性質である聴覚感度特性に対応した周波数分解能
を持つメル線形予測係数を算出し、前記メル線形予測係数を直線周波数軸のスペクトル包絡
に変換し、前記入力オーディオ信号を周波数領域信号に変換し、前記周波数領域信号を前記スペクトル包絡で正規化する
ことで残差信号を求め、前記残差信号をパワーの最大値あるいは平均値により正
規化することでパワー正規化残差信号を求め、前記パワー正規化残差信号を人間の聴覚的な性質である
聴覚感度特性に対応した周波数分解能で複数の部分帯域
に分割し、前記複数の部分帯域について各部分帯域内に含まれる要
素の平均値を各部分帯域毎にそれぞれ求めて前記平均値
を対応する部分帯域の代表値として出力し、全ての部分帯域の前記代表値を周波数領域信号と見な
し、適応ビット割り当てにより最適な量子化データに変
換することにより、オーディオ信号の圧縮を行うことを
特徴とするオーディオ信号圧縮方法。
【請求項５】入力されたオーディオ信号から人間の聴
覚的な性質である聴覚感度特性に対応した周波数分解能
を持つメル線形予測係数を算出し、前記メル線形予測係数をスペクトル包絡に変換し、前記入力オーディオ信号を周波数領域信号に変換し、前記周波数領域信号を人間の聴覚的な性質である聴覚感
度特性に対応した周波数分解能で複数の部分帯域に分割
し、前記複数の部分帯域について各部分帯域内に含まれる要
素の平均値を各部分帯域毎にそれぞれ求めて前記平均値
を対応する部分帯域の代表値として出力し、全ての部分帯域の前記代表値を周波数領域信号と見なし
て前記スペクトル包絡で正規化することで残差信号を求
め、前記残差信号をパワーの最大値あるいは平均値により正
規化することでパワー正規化残差信号を求め、前記パワー正規化残差信号をベクトル量子化により量子
化データに変換することにより、オーディオ信号の圧縮
を行うことを特徴とするオーディオ信号圧縮方法。
【請求項６】入力されたオーディオ信号から人間の聴
覚的な性質である聴覚感度特性に対応した周波数分解能
を持つメル線形予測係数を算出し、前記メル線形予測係数をスペクトル包絡に変換し、前記入力オーディオ信号を周波数領域信号に変換し、前記周波数領域信号を人間の聴覚的な性質である聴覚感
度特性に対応した周波数分解能で複数の部分帯域に分割
し、前記複数の部分帯域について各部分帯域内に含まれる要
素の平均値を各部分帯域毎にそれぞれ求めて前記平均値
を対応する部分帯域の代表値として出力し、全ての部分帯域の前記代表値を周波数領域信号と見なし
て前記スペクトル包絡で正規化することで残差信号を求
め、前記残差信号をパワーの最大値あるいは平均値等により
正規化することでパワー正規化残差信号を求め、前記パワー正規化残差信号を適応ビット割り当てにより
最適な量子化データに変換することにより、オーディオ
信号の圧縮を行うことを特徴とするオーディオ信号圧縮
方法。
【請求項７】人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能で複数の部分帯域に分割する方
法として、バーク尺度に対応した周波数分解能で複数の
部分帯域に分割することを特徴とする請求項１〜６のい
ずれか１項記載のオーディオ信号圧縮方法。
【請求項８】人間の聴覚的な性質である聴覚感度特性
に対応した周波数分解能で複数の部分帯域に分割する方
法として、メル尺度に対応した周波数分解能で複数の部
分帯域に分割することを特徴とする請求項１〜６のいず
れか１項記載のオーディオ信号圧縮方法。
【請求項９】請求項１〜６のいずれか１項記載のオー
ディオ信号圧縮方法で生成された量子化データから元の
オーディオ信号を復元するオーディオ信号復号方法であ
って、各部分帯域毎の代表値から部分帯域内に含まれる各要素
を復元する方法として、元の部分帯域内に含まれる各要
素毎の符号をあらかじめ保存しておき、前記各要素毎の
符号と前記代表値とを用いて部分帯域内に含まれる各要
素を復元することを特徴とするオーディオ信号復号方
法。
【請求項１０】請求項１〜６のいずれか１項記載のオ
ーディオ信号圧縮方法で生成された量子化データから元
のオーディオ信号を復元するオーディオ信号復号方法で
あって、各部分帯域毎の代表値から部分帯域内に含まれる各要素
を復元する方法として、元の部分帯域内に含まれる全て
の要素の総和を求め、前記総和の符号をあらかじめ保存
しておき、前記総和の符号と前記代表値とを用いて元の
部分帯域内に含まれる各要素を復元することを特徴とす
るオーディオ信号復号方法。
【請求項１１】請求項１〜６のいずれか１項記載のオ
ーディオ信号圧縮方法で生成された量子化データから元
のオーディオ信号を復元するオーディオ信号復号方法で
あって、各部分帯域毎の代表値から部分帯域内に含まれる各要素
を復元する方法として、ランダムに作成した符号と前記
代表値とを用いて元の部分帯域内に含まれる各要素を復
元することを特徴とするオーディオ信号復号方法。
【請求項１２】入力されたオーディオ信号を周波数領
域信号に変換する時間周波数変換手段と、前記時間周波数変換手段で変換された周波数領域信号
を、人間の聴覚的な性質である聴覚感度特性に対応した
周波数分解能で複数の部分帯域に分割する帯域分割手段
と、前記帯域分割手段で得られた複数の部分帯域について、
各部分帯域内に含まれる要素の平均値を各部分帯域毎に
それぞれ求め、前記平均値を対応する部分帯域の代表値
として出力する代表値算出手段と、前記代表値算出手段で得られた全ての部分帯域の代表値
を周波数領域信号と見なし、ベクトル量子化により量子
化データに変換するベクトル量子化手段と、を具備する
ことを特徴とするオーディオ信号圧縮装置。
【請求項１３】入力されたオーディオ信号を周波数領
域信号に変換する時間周波数変換手段と、前記時間周波数変換手段で変換された周波数領域信号
を、人間の聴覚的な性質である聴覚感度特性に対応した
周波数分解能で複数の部分帯域に分割する帯域分割手段
と、前記帯域分割手段で得られた複数の部分帯域について、
各部分帯域内に含まれる要素の平均値を各部分帯域毎に
それぞれ求め、前記平均値を対応する部分帯域の代表値
として出力する代表値算出手段と、前記代表値算出手段で得られた全ての部分帯域の代表値
を周波数領域信号と見なし、適応ビット割り当てにより
最適な量子化データに変換する適応量子化手段と、具備
することを特徴とするオーディオ信号圧縮装置。
【請求項１４】入力されたオーディオ信号から人間の
聴覚的な性質である聴覚感度特性に対応した周波数分解
能を持つメル線形予測係数を算出するメル線形予測分析
手段と、前記メル線形予測分析手段で得られたメル線形予測係数
を直線周波数軸のスペクトル包絡に変換するスペクトル
包絡変換手段と、前記入力オーディオ信号を周波数領域信号に変換する時
間周波数変換手段と、前記時間周波数変換手段で変換された周波数領域信号を
前記スペクトル包絡で正規化することで残差信号を求め
るスペクトル包絡正規化手段と、前記スペクトル包絡正規化手段で得られた残差信号を、
パワーの最大値あるいは平均値により正規化することで
パワー正規化残差信号を求めるパワー正規化手段と、前記パワー正規化手段で得られたパワー正規化残差信号
を、人間の聴覚的な性質である聴覚感度特性に対応した
周波数分解能で複数の部分帯域に分割する帯域分割手段
と、前記帯域分割手段で得られた複数の部分帯域について、
各部分帯域内に含まれる要素の平均値を各部分帯域毎に
それぞれ求めて前記平均値を対応する部分帯域の代表値
として出力する代表値算出手段と、前記代表値算出手段で得られた全ての部分帯域の代表値
を周波数領域信号と見なし、ベクトル量子化により量子
化データに変換するベクトル量子化手段と、を具備する
ことを特徴とするオーディオ信号圧縮装置。
【請求項１５】入力されたオーディオ信号から人間の
聴覚的な性質である聴覚感度特性に対応した周波数分解
能を持つメル線形予測係数を算出するメル線形予測分析
手段と、前記メル線形予測分析手段で得られたメル線形予測係数
を直線周波数軸のスペクトル包絡に変換するスペクトル
包絡変換手段と、前記入力オーディオ信号を周波数領域信号に変換する時
間周波数変換手段と、前記時間周波数変換手段で変換された周波数領域信号を
前記スペクトル包絡で正規化することで残差信号を求め
るスペクトル包絡正規化手段と、前記スペクトル包絡正規化手段で得られた残差信号を、
パワーの最大値あるいは平均値により正規化することで
パワー正規化残差信号を求めるパワー正規化手段と、前記パワー正規化手段で得られたパワー正規化残差信号
を、人間の聴覚的な性質である聴覚感度特性に対応した
周波数分解能で複数の部分帯域に分割する帯域分割手段
と、前記帯域分割手段で得られた複数の部分帯域について、
各部分帯域内に含まれる要素の平均値を各部分帯域毎に
それぞれ求めて前記平均値を対応する部分帯域の代表値
として出力する代表値算出手段と、前記代表値算出手段で得られた全ての部分帯域の代表値
を周波数領域信号と見なし、適応ビット割り当てにより
最適な量子化データに変換する適応量子化手段と、具備
することを特徴とするオーディオ信号圧縮装置。
【請求項１６】入力されたオーディオ信号から人間の
聴覚的な性質である聴覚感度特性に対応した周波数分解
能を持つメル線形予測係数を算出するメル線形予測分析
手段と、前記メル線形予測分析手段で得られたメル線形予測係数
をスペクトル包絡に変換するスペクトル包絡変換手段
と、前記入力オーディオ信号を周波数領域信号に変換する時
間周波数変換手段と、前記時間周波数変換手段で変換された周波数領域信号
を、人間の聴覚的な性質である聴覚感度特性に対応した
周波数分解能で複数の部分帯域に分割する帯域分割手段
と、前記帯域分割手段で得られた複数の部分帯域について、
各部分帯域内に含まれる要素の平均値を各部分帯域毎に
それぞれ求めて前記平均値を対応する部分帯域の代表値
として出力する代表値算出手段と、前記代表値算出手段で得られた全ての部分帯域の代表値
を周波数領域信号と見なして前記スペクトル包絡で正規
化することで残差信号を求めるスペクトル包絡正規化手
段と、前記スペクトル包絡正規化手段で得られた残差信号をパ
ワーの最大値あるいは平均値により正規化することでパ
ワー正規化残差信号を求めるパワー正規化手段と、前記パワー正規化手段で得られたパワー正規化残差信号
をベクトル量子化により量子化データに変換するベクト
ル量子化手段と、具備することを特徴とするオーディオ
信号圧縮装置。
【請求項１７】入力されたオーディオ信号から人間の
聴覚的な性質である聴覚感度特性に対応した周波数分解
能を持つメル線形予測係数を算出するメル線形予測分析
手段と、前記メル線形予測分析手段で得られたメル線形予測係数
をスペクトル包絡に変換するスペクトル包絡変換手段
と、前記入力オーディオ信号を周波数領域信号に変換する時
間周波数変換手段と、前記時間周波数変換手段で変換された周波数領域信号
を、人間の聴覚的な性質である聴覚感度特性に対応した
周波数分解能で複数の部分帯域に分割する帯域分割手段
と、前記帯域分割手段で得られた複数の部分帯域について、
各部分帯域内に含まれる要素の平均値を各部分帯域毎に
それぞれ求めて前記平均値を対応する部分帯域の代表値
として出力する代表値算出手段と、前記代表値算出手段で得られた全ての部分帯域の代表値
を周波数領域信号と見なして前記スペクトル包絡で正規
化することで残差信号を求めるスペクトル包絡正規化手
段と、前記スペクトル包絡正規化手段で得られた残差信号をパ
ワーの最大値あるいは平均値により正規化することでパ
ワー正規化残差信号を求めるパワー正規化手段と、前記パワー正規化手段で得られたパワー正規化残差信号
を適応ビット割り当てにより最適な量子化データに変換
する適応量子化手段と、具備することを特徴とするオー
ディオ信号圧縮装置。
【請求項１８】前記帯域分割手段は、バーク尺度に対応した周波数分解能で複数の部分帯域に
分割するものであることを特徴とする請求項１２〜１７
のいずれか１項記載のオーディオ信号圧縮装置。
【請求項１９】前記帯域分割手段は、メル尺度に対応した周波数分解能で複数の部分帯域に分
割するするものであることを特徴とする請求項１２〜１
７のいずれか１項記載のオーディオ信号圧縮装置。