JP2003271199A - オーディオ信号の符号化方法及び符号化装置 - Google Patents

オーディオ信号の符号化方法及び符号化装置

Info

Publication number
JP2003271199A
JP2003271199A JP2002072667A JP2002072667A JP2003271199A JP 2003271199 A JP2003271199 A JP 2003271199A JP 2002072667 A JP2002072667 A JP 2002072667A JP 2002072667 A JP2002072667 A JP 2002072667A JP 2003271199 A JP2003271199 A JP 2003271199A
Authority
JP
Japan
Prior art keywords
encoding
scale factor
audio signal
value
factor band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002072667A
Other languages
English (en)
Inventor
Tomoyasu Komori
智康 小森
Kaoru Watanabe
馨 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2002072667A priority Critical patent/JP2003271199A/ja
Publication of JP2003271199A publication Critical patent/JP2003271199A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 効率的に符号化を行い、オーディオ符号化に
おいて、使用できるビット数が少ない場合にも検知され
る音質の劣化を軽減することができるオーディオ信号の
符号化方法及び符号化装置を提供することを目的とす
る。 【解決手段】 オーディオ信号の符号化方法において、
時間領域の信号を周波数領域の信号に変換する変換手順
と、前記変換ステップにて変換された周波数係数群を複
数の帯域で分割する分割手順と、ゲインと量子化値の積
で表現される周波数係数の値における前記ゲイン又は前
記量子化値をステップ状に制御する制御手順と、前記量
子化値を符号化する符号化手順とを有することにより上
記課題を解決する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、オーディオ信号の
符号化方法及び符号化装置に係り、特に、効率的にオー
ディオ信号の符号化を行うためのオーディオ信号の符号
化方法及び符号化装置に関する。
【0002】
【従来の技術】一般に、AAC(Advanced Audio Codin
g)符号化等に代表されるオーディオ信号の変換符号化
では、時間領域の信号を周波数領域のDCT(Discrete
Cosine Transform)係数に変換する。また、符号化す
る場合にDCT係数の値をスケールファクターと呼ばれ
る量子化精度を制御する値(以下、スケールファクター
値という)と量子化値の積で表現し、ハフマン符号等の
符号語により符号化が行われる。ここで、量子化値と
は、DCT係数を浮動小数点形式で表現した場合の仮数
値を指し、スケールファクター値は、指数値に対応する
値を表す。また、指数部自体をゲインと呼ぶ。ここで、
上述の関係を簡単な数式で表現すると、DCT係数を
K、量子化値をR、スケールファクター値をS、ゲイン
をGとすると、K=R×Gとなる。
【0003】また、その他のオーディオ符号化方式とし
ては、国際標準機関であるISO/IEC JTC1/
SC29/WG11で標準化されたISO/IEC 1
3818(MPEG−2)がある。この標準方式は、符
号化されたビットストリーム(圧縮データ)の解釈とそ
の復号処理について規定しているだけであるため、符号
化でのビット割当てに関する処理については自由に行う
ことができる。
【0004】ところで、オーディオ信号の符号化におい
て、符号化に使用できるビット数が不足している場合、
聴覚的に許された量子化ノイズよりも大きな量子化ノイ
ズが発生するビット配分が行われるため、周波数領域全
体の量子化歪みが大きくなり、符号化の劣化が検知され
ることがある。
【0005】そこで、従来の技術では、必要な量子化ビ
ット数に足りない場合に各周波数係数群のゲインを決定
するスケールファクター値を1ずつ変化させて最適値を
求め、その値に基づいて符号化を行う符号化方法が提案
されている。
【0006】上述の方法により、符号化に必要な量子化
ビット数を算出して割当てることができる。
【0007】
【発明が解決しようとする課題】しかしながら、上述の
量子化ビットの割当て方法は、スケールファクター値を
1ずつ変化させる度に量子化値、及び必要なビット数を
再計算するため、計算量が膨大になってしまう。また、
符号語に変換際の効率的なビット配分という点に関して
考慮されていないので音質劣化の一因となっている。
【0008】また、これまでは、割当ての決定をフレー
ム全体のビット数で判断し、特に大きな量子化値に割当
てるビット数の効率は考慮されていなかった。そのた
め、帯域によってはビット数の過不足で音質が劣化して
しまうことがあった。
【0009】本発明は、上述した問題に鑑みなされたも
のであり、効率的に符号化を行いオーディオ符号化にお
いて、使用できるビット数が少ない場合にも検知される
音質の劣化を軽減することができるオーディオ信号の符
号化方法及び符号化装置を提供することを目的とする。
【0010】
【課題を解決するための手段】上記課題を解決するため
に、本件発明は、以下の特徴を有する課題を解決するた
めの手段を採用している。
【0011】請求項1に記載された発明は、オーディオ
信号の符号化方法において、時間領域の信号を周波数領
域の信号に変換する変換手順と、前記変換ステップにて
変換された周波数係数群を複数の帯域で分割する分割手
順と、ゲインと量子化値の積で表現される周波数係数の
値における前記ゲイン又は前記量子化値をステップ状に
制御する制御手順と、前記量子化値を符号化する符号化
手順とを有することを特徴とする。
【0012】請求項1記載の発明によれば、ゲイン又は
量子化値をステップ状に制御することにより、ビット数
を削減することができる。また、削減できたビットは、
音質にとって重要な部分に割当てることが可能であるた
め、相対的に聴覚的な音質を向上させることができる。
【0013】請求項2に記載された発明は、前記ゲイン
をスケールファクターバンド毎に設定し、当該スケール
ファクターバンド内で最大の周波数係数の符号語が最大
の量子化値になるように符号化を行うことを特徴とす
る。
【0014】請求項2記載の発明によれば、ゲインの値
をハフマン符号化等の符号語に基づいて量子化値を決定
するため、符号語の長さを短くすることができ、結果と
してビット数を削減することができる。
【0015】請求項3に記載された発明は、前記ゲイン
をスケールファクターバンド毎に設定し、当該スケール
ファクターバンド内で最大の周波数係数の符号語の量子
化値を1又は任意の整数とすることを特徴とする。
【0016】請求項3記載の発明によれば、スケールフ
ァクターバンド毎の音質を判断して必要な量子化値を設
定することで、符号化の制御を容易に行うことができ
る。
【0017】請求項4に記載された発明は、オーディオ
信号にMSステレオを適用した場合、前記スケールファ
クターバンドにおけるM成分とS成分のエナジー、若し
くは最大周波数係数の大きさ、又は聴覚エントロピーを
用いて、スケールファクターバンド内のM成分とS成分
夫々の最大周波数係数として異なる量子化値を用いるこ
とを特徴とする。
【0018】請求項4記載の発明によれば、MSステレ
オを用いて、M成分、S成分毎にビット数を別々に割り
振ることができ、ビット数を減らした符号化を行うこと
ができる。
【0019】請求項5に記載された発明は、オーディオ
信号の符号化装置において、時間領域の信号を周波数領
域の信号に変換する変換手段と、前記変換ステップにて
変換された周波数係数群を複数の帯域で分割する分割手
段と、ゲインと量子化値の積で表現される周波数係数の
値における前記ゲイン又は前記量子化値をステップ状に
制御する制御手段と、前記量子化値を符号化する符号化
手段とを有することを特徴とする。
【0020】請求項5記載の発明によれば、ゲイン又は
量子化値をステップ状に制御することにより、ビット数
を削減することができる。また、削減できたビットは、
音質にとって重要な部分に割当てることが可能であるた
め、相対的に聴覚的な音質を向上させることができる。
【0021】請求項6に記載された発明は、前記制御手
段は、前記ゲインをスケールファクターバンド毎に設定
し、前記符号化手段は、当該スケールファクターバンド
内で最大の周波数係数の符号語が最大の量子化値になる
ように符号化を行うことを特徴とする。
【0022】請求項6記載の発明によれば、ゲインの値
をハフマン符号化等の符号語に基づいて量子化値を決定
するため、符号語の長さを短くすることができ、結果と
してビット数を削減することができる。
【0023】請求項7に記載された発明は、前記制御手
段は、前記ゲインをスケールファクターバンド毎に設定
し、前記符号化手段は、当該スケールファクターバンド
内で最大の周波数係数の符号語の量子化値を1又は任意
の整数とすることを特徴とする。
【0024】請求項7記載の発明によれば、スケールフ
ァクターバンド毎の音質を判断して必要な量子化値を設
定することで、符号化の制御を容易に行うことができ
る。
【0025】請求項8に記載された発明は、オーディオ
信号にMSステレオを適用した場合、前記スケールファ
クターバンドにおけるM成分とS成分のエナジー、若し
くは最大周波数係数の大きさ、又は聴覚エントロピーを
用いて、スケールファクターバンド内のM成分とS成分
夫々の最大周波数係数として異なる量子化値を用いるこ
とを特徴とする。
【0026】請求項8記載の発明によれば、MSステレ
オを用いて、M成分、S成分毎にビット数を別々に割り
振ることができ、ビット数を減らした符号化を行うこと
ができる。
【0027】請求項9に記載された発明は、符号化方法
が異なる複数の符号化手段と、スケールファクターバン
ド毎の必要なビットレート数に基づいて、前記複数の符
号化手段の中から1つの符号化手段を評価・選択する評
価・選択手段を有することを特徴する。
【0028】請求項9記載の発明によれば、ビット数を
最小に減らすことができる符号化手段を用いることで、
効率的に符号化を行うことができる。
【0029】
【発明の実施の形態】本発明は、DCT変換により、4
9個のスケールファクターバンドから出力される周波数
係数の量子化精度を制御してビット数を減らし、効率的
にハフマン符号等による符号化を行い、オーディオ符号
化において使用できるビット数が少ない場合でも検知さ
れる音質の劣化を軽減させることを主眼とする。
【0030】また、各帯域周波数群の量子化値の値をハ
フマン符号に代表される符号語への変換を行う際、その
周波数帯域(バンド)内の最大量子化値によって異なる
符号語のテーブル或いは数式を使用するという特徴を利
用する。例えば、AACの場合は、11のハフマン符号
語テーブルを持っているが、夫々のテーブルの量子化値
の最大値は飛び飛びの値(例えば、16,12,7,
4,2,1)となっている。この最大値を考慮してビッ
ト数を割当てることで、効率的な符号化を行う。
【0031】ここで、上述した11種類のハフマン符号
語テーブルの一例を図1に示す。図1に示すテーブル
は、0から80まで(81種類)の「index」と、
「length」と、「codeword(16進
数)」とで構成されている。「index」に対応する
「length」と「codeword」を用いてステ
ップ毎にビット数を調整することで、ビット数を減少さ
せて伝送効率のよいオーディオ信号を生成することがで
きる。
【0032】例えば、符号化ビットが不足している場合
を考えた場合に、あるスケールファクターでの最大量子
化値が、例えば「12」であったとする。この時スケー
ルファクター値を1ずつ変化させるのでなく、最大量子
化値が「7」となるようにすることにより、量子化誤差
は大きくなるかわりに、符号化される周波数係数を減ら
すことができる。また、最大量子化係数が小さくなった
場合、それぞれのハフマン符号に割当てられる符号語の
長さも短くなることが期待され、結果としてビット数を
削減する効果が期待できる。こうした手法により,削減
できたビットは音質にとって重要な部分に割当てること
も可態であるため相対的に聴覚的な音質を向上させるこ
とができる。
【0033】また、スケールファクター値を1ずつ変化
させる手法と比較すると、スケールファクター値を大き
く変化させる場合が多いことから計算量を減らすことが
できる。上述した内容により、音質を劣化させずにビッ
ト数を削減することができる。
【0034】次に、本発明における実施の形態につい
て、図面に基づいて説明する。なお、実施例では、20
48サンプルを1024本のDCT係数に変換した例で
説明する。
【0035】図2は、本発明における符号化装置の構成
を示すブロック図の一例である。
【0036】図2の符号化装置は、聴覚モデル11と、
フィルターバンク12と、スケールファクター13と、
量子化器14と、ノイズレスコーディング15と、レー
ト/歪みコントローラ16と、ステップ制御コントロー
ラ17と、ビットストリームマルチプレクサ18とを有
するように構成されている。
【0037】図1において、聴覚モデル11は、入力さ
れる音声信号の量子化雑音のマスキングパターンの計算
を行う。つまり、音声信号の聴覚的なマスキングスレシ
ョルドの計算を行う。
【0038】更に具体的に説明すれば、後述するフィル
ターバンクでのDCTの分析位置と一致するように、入
力される音声信号をFFT(Fast Fourier Transform)
を用いて分析し、音声信号がマスキングできる最大のノ
イズ量(スレッシュホールド)を計算して、スケールフ
ァクターバンド毎のSignal to Mask比とスレッシュホー
ルド値を出力する。また、ロング、スタート、ストッ
プ、ショートのどのブロックタイプを選択するかの結果
を出力する。なお、上述した聴覚モデルの詳細は、IS
O/IEC 13817−7ANNEX B2章 ENC
ORDER 2.1Psychoacoustic Mo
delに記載されている。
【0039】フィルターバンク12は、入力される音声
信号の時間領域の信号をFFT変換或いは、DCT変換
等を使用して周波数領域の信号に変換する。
【0040】ここで、変換方法について更に具体的に説
明すると、AACにおける符号化の基本処理は、エンコ
ーダにおいて、時間領域の信号を周波数領域の信号に変
換する。また、逆にデコーダにおいて、周波数領域の信
号を時間領域の信号に変換することである。これをMD
CT(Modified Discrete Cosine Transform)及びIM
DCT(Inverse Modified Discrete Cosine Transfor
m)によって実行している。また、MDCT、IMDC
Tにはブロック歪みを減少させるためにTDAC(時間
領域折り返し歪み除去技術)を利用する。
【0041】なお、詳細は、ISO/IEC 1381
7−7ANNEX B2章 ENCORDER 2.3 F
ilterbank and block switch
ingに記載されている。
【0042】スケールファクター13は、周波数係数を
変換するゲインを表現するスケールファクター値を作成
する。
【0043】ここで、スケールファクター値を示した一
例の数式を式(1)に示す。
【0044】
【数1】 なお、scf[sb]は、sb番目のスケールファクター
バンドのスケールファクター値であり、この値を量子化
器14に出力する。また、QUANT_STEPは、ス
テップ制御コントローラ17から入力される量子化ステ
ップ値である。また、common_scfは補正項で
あり、例えば、100がセットされる。式(1)内のp
ow_spectrum[sb]は、フィルターバンク1
2より入力される値mdct[sb]を用いて、式(2)
のように計算する。
【0045】
【数2】 なお、式(2)のmdct[sb]は、sb番目のスケー
ルファクターバンド内の任意のmdct係数であり、例
えば、最大のmdct値が設定される。
【0046】量子化器14は、周波数係数を量子化値に
変換する。なお、変換手段は、詳細は、ISO/IEC
13817−7ANNEX B2章 ENCORDER
2.7 Quantizationに記載されている。
具体的には、式(3)、式(4)に示すような数式で表
現される。
【0047】
【数3】 ここで、x_quant[i]は、i番目のインデックス
(図1の「index」)を持つ周波数係数の量子化値
であり、ノイズレスコーディング15に出力される。ま
た、mdct_line[i]は、フィルターバンクでD
CT変換されたi番目のインデックスをもつ係数であ
り、スケールファクター13より入力される。また、M
AGIC_NUMBERには、一般値として0.405
4(固定値)がセットされる。
【0048】ノイズレスコーディング15は、ハフマン
符号化等、スケールファクター値、量子化値を符号語に
変換する。詳細は、ISO/IEC 13817−7A
NNEX B2章 ENCORDER 2.8 Noise
less Codingに記載されている。また、参照
までに4つの係数をハフマン符号語に変換する一例の数
式の手順をフローチャートを用いて説明する。なお、こ
こで、使用するハフマンコード表は、図1を用いるが、
ハフマンコード表は、発明の範囲においてこの限りでは
ない。
【0049】図3は、ハフマン符号語に変換する処理の
流れをプログラム的に示す一例の図である。
【0050】図3において、スケールファクターバンド
毎に繰り返し処理を行う(S1)。まず、初期値をセッ
トして(S2)、offset(sb)からtop(sb)
になるまで、以下のS3からS8まで処理を行う(S
3)。また、4つの係数毎に処理を行うので、S3にお
ける増加分は+4となる。また、offset(sb)と
は、各スケールファクターバンドの下限のDCT係数の
インデックス(i)を表し、top(sb)はsbバンド
の上限のDCT係数のインデックスを表す。なお、上述
したsbとoffset(sb)とtop(sb)のDCT
係数のバンド分けの一例を図4に示す。図4に示すよう
に、1つのsbに対して、4つのDCT係数が割り振ら
れている(0〜1023の計1024本)。
【0051】次に、図1を参照するためのインデックス
を計算する(S4)。ここで、x_quant[i]とは
i番目の係数の量子化値であり、量子化器14から入力
される。S4にて計算されたindex値は、図1を参
照して、codeword(ハフマン符号)とtmpを
抽出する(S5、S6)。例えば、S4にてindex
が「10」とすると、codewordには「72」が
セットされtmp「7」がセットされる。また、量子化
値を符号化するのに必要なビット数の計算を行う(S
7)。S7の出力は、レート/歪みコントローラ16へ
出力する。これを、スケールファクターバンド毎(ステ
ップ毎)に分割した全ての帯域で繰り返し行うことによ
り、全ての係数をハフマン符号語に変換することができ
る(S8、S9)。
【0052】次に、レート/歪みコントローラ16と、
ステップ制御コントローラ17の動作について、数式の
フローチャートを用いて説明を行う。
【0053】図5は、レート/歪みコントローラ及びス
テップ制御コントローラの動作の一例を示すフローチャ
ートである。
【0054】図5において、ステップ制御コントローラ
17に設定してある値に基づいて、レート/歪みコント
ローラ16の動作を行う(S11)。なお、ステップ制
御コントローラに設定される値は、量子化値の最大値を
設定することが好ましい。なお、本発明では、設定した
値を{16,12,7,4,2,1}としたが、設定す
る値については、この限りではない。
【0055】まず、フィルターバンクでDCT変換され
たi番目のインデックスをもつ係数(mdct_lin
e[i]と聴覚モデルから入力される許容される量子化ノ
イズの大きさ(allwed_dist(sb))と比較
を行い(S13)、量子化ノイズの方が大きかった場
合、mdct_line[i]に0をセットする(S1
4)。これを、インデックスが最大になるまで、繰り返
し行う(S12、S15)。
【0056】次に、レート/歪みの制御を行う。まず、
S11のSTEP_MATテーブルの添え字jを0(初
期化)にする(S16)。次に、スケールファクターバ
ンド内で使用できるビット数(average_bit
s)を、ビット数のカウント(bit_count())
が超えないで処理ができるかの判断をS17からS23
までの処理を繰り返し行うことで確認する(S17)。
なお、average_bitsは、予め設定してお
き、bit_count()は、ノイズレスコーディング
15で計算されたビット数の総和であり、スケールファ
クター又はハフマンテーブルのコードブック番号等、伝
送のために必要なビット数も含む。
【0057】まず、QUANT_STEPに量子化値の
最大値をセットする(S18)。なお、S11の設定値
の大きい値からセットする。次に、スケールファクター
バンド毎に処理を行う(S19)。まず、スケールファ
クター値(calc_scale())の計算を行う(S
20)。計算されたスケールファクター値はスケールフ
ァクター13に出力される。また、S21では量子化値
(calc_quant())の計算を行い、量子化器1
4に出力される。
【0058】これを、スケールファクターバンド毎に行
い(S22)、ビットカウント(bit_coun
t())がaverage_bitsを超なくなるまで、
繰り返し行う(S23)。
【0059】もし、average_bitsを超える
ことがあれば、必要なビット数を得ることができず、符
号化ができない場合や符号化した際に音質が歪んでしま
う等の問題が発生してしまうため、その場合は、ステッ
プ制御コントローラ内の量子化値の値を低く設定して再
度処理を行う。
【0060】つまり、S17からS23の処理でS17
の条件に満たなければ、次の値(例えば、16がセット
されて条件に合わなければ12)がセットされ、再度S
17からS23までの処理を行う。このようにして、処
理を行い条件が最初にあったQUANT_STEPが最
適値ということになり、この値を用いて符号化すること
で、必要なビット数で最高の音質を得ることができる。
【0061】図5で示したフローチャートにより、ゲイ
ン又は前記量子化値の最適値を求めることができる。
【0062】次に、ビットストリームマルチプレクサ1
8で、入力された符号化データ及びスケールファクター
又はハフマンテーブルのコードブック番号等の制御情報
をビットストリームに変換する。これにより、オーディ
オ信号の符号化を効率よく行うことができる。なお、ビ
ットストリームマルチプレクサ18の詳細については、
ISO/IEC13817−7 1章 syntaxに記
載されている。つまり、符号化装置の各ブロックで出力
されたパラメータをsyntaxで詳解された形式に並
べ変えて出力する。
【0063】また、符号化装置の各ブロックの動作内容
はこの限りではなく、また、同ブロックに関して違う数
式による計算をさせてもよい。
【0064】例えば、式(1)を下記式(5)に変更す
ることにより、1又は複数のスケールファクターバンド
群で最大の周波数係数値に基づいて、スケールファクタ
ー値を導出してもよい。
【0065】
【数4】 なお、max_pow[sbm,sbn]は式(6)で計
算することができる。
【0066】
【数5】 また、max_mdct[sbm,sbn]は、mからn
番目のスケールファクターバンド内で最大のMDCT係
数である(m、n:整数)。
【0067】更に、式(1)を下記式(7)に変更する
ことにより、任意のスケールファクターバンドのスケー
ルファクター値を各スケールファクターバンドで最大の
周波数係数値を用いて、更に分子を1或いは任意の整数
値として導出することもできる。
【0068】
【数6】 なお、式(7)のkの値を1或いは、n<QUANT_
STEPを満たす正の整数とする。また、max_po
w_spectrumは式(8)で計算することができ
る。
【0069】
【数7】 これにより、オーディオ信号の符号化における音質の制
御を行うことができる。
【0070】次に、本発明における符号化装置にMSコ
ントローラが具備された場合の符号化装置の動作例をブ
ロック構成図を用いて説明する。
【0071】図6は、本発明におけるMSコントローラ
を含む符号化装置の構成を示すブロック図の一例であ
る。
【0072】図6の符号化装置は、聴覚モデル11と、
スケールファクター13と、量子化器14と、ノイズレ
スコーディング15と、レート/歪みコントローラ16
と、ステップ制御コントローラ17と、ビットストリー
ムマルチプレクサ18と、MSコントローラ19と、M
/Sステレオツール20とを有するように構成されてい
る。
【0073】ここで、各ブロックの動作について、主に
図2を用いて説明した各ブロック説明とことなる部分の
説明を行う。
【0074】図6において、聴覚モデル11は、量子化
雑音のマスキングパターンの計算を行う。MSコントロ
ーラ19は、M/Sエントロピーの計算を行う。つま
り、時間周波数変換された係数からL成分、R成分、M
成分(L+R成分)、S成分(L−R成分)のエナジー
を計算し、聴覚モデル11から入力されるマスキングパ
ターンの計算結果やエンコードに必要なビット数等の出
力情報に基づいて、MSモード、LRモードの切替えの
判定、又はMSモード時のチャンネル間のビット割当て
のための補助情報を作成する。
【0075】ここで、MSコントローラ19におけるエ
ナジーの計算によるMSモードとLRモードの判定内容
について説明する。まず、下記式(9)〜(12)に夫
々のスケールファクターバンドの係数のM成分、S成
分、L成分、R成分のエナジー(eM(sb)、eS(s
b)、eL(sb)、eR(sb))の計算式を示す。
【0076】
【数8】 また、eM(sb)、eS(sb)、eL(sb)、及びeR
(sb)成分の夫々のエネルギー比を式(13)、(1
4)を用いて計算し、MSモードとLRモードの切替え
を行う判定式を式(15)に示す。
【0077】
【数9】 式(15)におけるkは正の定数であり、例えば、k=
1とする。
【0078】なお、MSモードとLSモードの切替え方
法は、この限りではなく、本出願人にて出願されている
特願2001−70926号「ステレオ信号の符号化方
法及び符号化装置」に記載されているように聴覚的なエ
ントロピーを使ってM/Sエントロピーの計算を行い、
その結果によりLRモードとMSモードの切替えを行う
こともできる。
【0079】次に、MSモードが適用された場合のスケ
ールファクター13におけるM成分とS成分の夫々のス
ケールファクター値(scf_M[sb]、scf_S
[sb])を計算する計算式を式(16)、式(17)に
示す。
【0080】
【数10】 なお、QUANT_M及びQUANT_Sは、M成分、
S成分の夫々の量子化ステップ値であり、レート/歪み
コントローラ16から入力される。
【0081】次に、レート/歪みコントローラ16と、
ステップ制御コントローラ17のプログラム動作をフロ
ーチャートを用いて説明する。
【0082】図7は、MSコントローラを有する場合の
レート/歪みコントローラ及びステップ制御コントロー
ラの動作の一例を示すフローチャートである。なお、M
Sモード以外の場合は、図5と同様の動作を行うため説
明を省略する。
【0083】図7において、ステップ制御コントローラ
17に設定してある値に基づいて、レート/歪みコント
ローラ16の動作を行う(S31)。まず、フィルター
バンク12でDCT変換されたi番目のインデックスを
持つM成分、S成分夫々の係数(dM[i]、dS[i])
と聴覚モデル11(MSコントロール)から入力される
許容されるM成分及びS成分の量子化ノイズの大きさ
(allwed_dist_M(sb)、allwed_
dist_S(sb))とM成分、S成分を対応させて比
較を行い、許容される量子化ノイズの方が大きかった場
合、dM[i]、dS[i]に0をセットする(S33〜S
37)。これを、インデックスが最大になるまで繰り返
し行う(S32、S37)。
【0084】次に、レート/歪みの制御を行う。まず、
S11のSTEP_MATテーブルの添え字jを0(初
期化)にする(S38)。次に、スケールファクターバ
ンド内で使用できるビット数(average_bit
s)を、ビット数のカウント(bit_count())
が超えないで処理ができるかの判断をS39からS45
までの処理を繰り返し行うことで確認する(S39)。
【0085】なお、average_bitsは、予め
設定しておき、bit_count()は、ノイズレスコ
ーディング15で計算されたビット数の総和であり、ス
ケールファクター又はハフマンテーブルのコードブック
番号等、伝送のために必要なビット数(制御情報分)も
含む。
【0086】まず、QUANT_STEP_MとQUA
NT_STEP_SにS31で設定した量子化値の最大
値をセットする(S40)。
【0087】なお、S31の設定値の大きい値をQUA
NT_STEP_Mにセットする。同時に、その次に大
きい値をQUANT_STEP_Sにセットする。次
に、スケールファクターバンド毎に処理を行う(S4
1)。まず、スケールファクター値(calc_sca
le())の計算を行う(S42)。計算されたスケール
ファクター値はスケールファクター13に出力される。
また、S43では量子化値(calc_quant())
の計算を行い量子化器14に出力される。
【0088】これを、スケールファクターバンド毎に行
い(S44)、ビットカウント(bit_coun
t())がaverage_bitsを超なくなるまで繰
り返し行う(S45)。
【0089】もし、average_bitsを超える
ことがあれば、必要なビット数を得ることができず、符
号化ができない場合や符号化した際に符号化音質が歪ん
でしまう等の問題が発生してしまうため、その場合は、
ステップ制御コントローラ内の量子化値の値を低く設定
して再度処理を行う。
【0090】つまり、S39からS45の処理で条件に
満たなければ、次の値(例えば、16がセットされて条
件に合わなければ12)がセットされ、再度S39から
S45までの処理を繰り返し行う。このようにして処理
を行い条件が最初にあったQUANT_STEPが最適
値ということになり、この値を用いて符号化すること
で、必要なビット数で最高の音質を得ることができる。
【0091】図7で示したフローチャートにより、M成
分及びS成分のゲイン又は前記量子化値の最適値を求め
ることができる。
【0092】なお、図7で示したフローチャートは、全
スケールファクターバンドについてMSモードを適用し
た場合であるが、本発明においてはこの限りではなく、
例えば、MSモードとLSモードの判定をスケールファ
クターバンド毎に行うことで、スケールファクターバン
ド毎にモードの切替えを行い、効率的にゲイン及び量子
化値の最適値を求めることができる。
【0093】MSステレオツール20は、周波数帯域の
信号の和信号(L+R)、と差信号(L−R)を作成
し、MSコントローラ19からの制御信号によりMSモ
ード或いはLRモードの切替えを行う。また、MSモー
ドのバンドの係数は、LR成分の夫々のmdct_li
ne[i]をdL(i)、dR(i)として、dM(i)、dS
(i)は夫々式(18)、式(19)で計算することがで
きる。
【0094】
【数11】 なお、その他の各ブロックは、図2のブロック説明と同
様であるため、詳細な説明は省略する。
【0095】上述により、任意のスケールファクターバ
ンドにMSステレオを適用した場合、スケールファクタ
ーバンドにおけるM成分とS成分のエナジー若しくは最
大周波数係数の大きさ、又は聴覚エントロピーに基づい
て、同じインデックス番号を持つスケールファクターバ
ンドのM成分とS成分の夫々の最大周波数係数の量子化
値を異なる大きさにすることができ、ビット数を成分に
より調整することができるため効率的なオーディオ信号
の符号化が可能となる。
【0096】また、スケールファクターバンド毎にMS
モードとLSモードの判定及び切替えを行うことで、更
に効率的なオーディオ信号の符号化を行うことができ
る。
【0097】なお、図2、図6における各ブロックの動
作内容は上述した限りではなく、同一ブロックに関して
違う数式による計算をさせてもよい。
【0098】例えば、スケールファクター13におい
て、スケールファクター値を求める計算式、式(5)と
式(7)とを所定の条件で分けて処理をさせてもよい。
ここで、一例として、条件1とした場合の数式を式(2
0)に、また、条件2とした場合の数式を式(21)に
示す。
【0099】
【数12】
【0100】
【数13】 なお、scf_I[sb]は、条件1の場合のsb番目の
スケールファクター値を示し、scf_II[sb]は、
条件2の場合のsb番目のスケールファクター値を示
す。
【0101】なお、切替える条件としては、量子化器1
4の数式による計算式(式(3)、式(4))におい
て、最初に条件1としてx_quant[i]を計算し
て、全てのスケールファクターバンドにおける量子化値
が0になった場合に、条件2に変更するように制御を行
う。
【0102】次に、条件1及び2を含む符号化装置のレ
ート/歪みコントローラ16と、ステップコントローラ
17の動作について、数式のフローチャートを用いて説
明を行う。
【0103】図8、図9は、切替え条件を有するレート
/歪みコントローラ及びステップ制御コントローラの動
作の一例を示すフローチャートである。ここで、図8に
おいて、S51からS56までの処理は、図5に示した
S11からS16と同様であるため、ここでの説明は省
略する。
【0104】レート/歪みの制御において、スケールフ
ァクターバンド内で使用できるビット数(averag
e_bits)を、ビット数のカウント(bit_co
unt())が超えないで処理ができるかの判断を条件1
と条件2への切替え処理を含めて、S57からS72ま
での処理を繰り返し行うことで確認する(S57)。
【0105】なお、average_bitsは、予め
設定しておき、bit_count()は、ノイズレスコ
ーディング15で計算されたビット数の総和であり、ス
ケールファクター又はハフマンテーブルのコードブック
番号等、伝送のために必要なビット数も含む。
【0106】まず、QUANT_STEPに量子化値の
最大値をセットする(S58)。次に、分割した全ての
スケールファクターバンドについて処理を行う(S5
9)。まず、初期値としてflag[sb]に1をセット
する(S60)。次に、条件1の数式(式(20))に
て、sb番目のスケールファクターバンドのスケールフ
ァクター値(scf[sb])を求め(S61)、量子化
値(calc_quant())の計算を行う(S6
2)。
【0107】次に、flag[sb]に0をセットし(S
63)、S62までに計算された量子化値がoffse
t(sb)からtop(sb)までで全て0か否かを確認を
行う(S64〜S67)。最初に、量子化値が0か否か
を判断し(S65)、0でない量子化値があればfla
g[sb]に1をセットする(S66)。
【0108】次に、flag[sb]が0か否かを判断し
(S68)、0であれば、式(21)を用いてsb番目
のスケールファクターバンドのスケールファクター値を
計算する(S69)。S68にて「NO」の場合、又は
S69の処理が終了後、量子化値の計算を行う(S7
0)。これを、スケールファクターバンド毎に行い(S
71)、ビットカウント(bit_count())がa
verage_bitsを超なくなるまで繰り返し行う
(S72)。
【0109】もし、average_bitsを超える
ことがあれば、必要なビット数を得ることができず、符
号化ができない場合や符号化した際に音質が歪んでしま
う等の問題が発生してしまうため、その場合は、ステッ
プ制御コントローラ内の量子化値の値を低く設定して再
度処理を行う。
【0110】図8、図9で示したフローチャートによ
り、ゲイン又は前記量子化値の最適値を求めることがで
きる。
【0111】更に、符号化装置のその他のブロック構成
例として、上述した式(1)、式(6)、式(20)及
び式(21)の数式による計算を夫々行う量子化器14
を有する各モジュール(スケールファクター13、量子
化器14、ノイズレスコーディング15及びレート/歪
みコントローラ16及びステップ制御コントローラ1
7)を符号化装置内に具備し、その中でビットカウント
数が少ないもので符号化を行うことにより、効率よく符
号化を行うことができる。
【0112】上述したモジュールを有する符号化装置の
各ブロック構成の一例について、図10を用いて説明す
る。
【0113】図10の符号化装置は、聴覚モデル11
と、MSコントローラ19と、フィルターバンク12
と、M/Sステレオツール20と、モジュールA21
と、モジュールB22と、モジュールC23と、評価・
選択部24と、ビットストリームマルチプレクサ18と
を有するよう構成されている。また、モジュールA21
とモジュールB22とモジュールC23の夫々のブロッ
クの構成例を図11に示す。
【0114】ここで、例えば、モジュールA21には、
上述した条件1及び条件2による切替え(式(20)、
式(21)を行って量子化値を計算する上述の図8、図
9を用いて説明した動作を有し、モジュールB22に
は、式(7)及び式(8)の数式により量子化値を計算
する動作を有し、また、モジュールC23には、式
(5)、式(6)の数式により量子化値を計算する処理
を有する。
【0115】評価・選択部24は、モジュールA21、
モジュールB22及びモジュールCの出力に基づいて、
どのモジュールの制御信号とデータ信号をビットストリ
ームマルチプレクサ18に出力するかを評価し選択する
機能を有する。なお、評価は、モジュールA21、モジ
ュールB22及びモジュールC23から夫々出力された
使用ビット数と、各モジュールから出力されるデータを
比較して、使用ビット数とデータ量が最小となるモジュ
ールを用いて符号化を行う。
【0116】図10に示すブロック構成により、多種多
様なオーディオ信号において、効率のよい符号化を選択
して符号化を行うことができる。
【0117】上述したように本発明は、例えば、符号化
ビットが不足している場合等にハフマン符号化等の符号
語の特徴に基づいて量子化値を選定し符号化を行うこと
により、符号語の長さを短くすることができ、同時にビ
ット数を削減することができる。本発明により、削減で
きたビットは、音質にとって重要な部分に割当てられる
ことが可能であるため、相対的に聴覚的な音質を向上さ
せることができる。
【0118】また、スケールファクター値を量子化値の
最大値に基づいて、従来より大きく変化させる場合が多
いことから、計算量を減少させることができる。なお、
こうした変換符号化の規格は、デコーダのsyntax
であるので、本発明でエンコードしたビットストリーム
も既存のデコーダでデコードすることができる。
【0119】なお、本発明にて用いられた動作内容のフ
ローは一例であり、発明の範囲においては上述した限り
ではない。
【0120】
【発明の効果】上述の如く本発明によれば、オーディオ
信号の符号化を効率的に行い、使用できるビット数を削
減することができる。また、オーディオ符号化において
使用できるビット数が少ない場合にも検知される音質の
劣化を軽減することができる。
【図面の簡単な説明】
【図1】ハフマン符号語テーブルの一例を示す図であ
る。
【図2】本発明における符号化装置の構成を示すブロッ
ク図の一例である。
【図3】ハフマン符号語に変換する処理の流れをプログ
ラム的に示す一例の図である。
【図4】DCT係数のバンド分けの一例を示す図であ
る。
【図5】レート/歪みコントローラ及びステップ制御コ
ントローラの動作の一例を示すフローチャートである。
【図6】本発明におけるMSコントローラを含む符号化
装置の構成を示すブロック図の一例である。
【図7】MSコントローラを有する場合のレート/歪み
コントローラ及びステップ制御コントローラの動作の一
例を示すフローチャートである。
【図8】切替え条件を有するレート/歪みコントローラ
及びステップ制御コントローラの動作の一例を示すフロ
ーチャート(1)である。
【図9】切替え条件を有するレート/歪みコントローラ
及びステップ制御コントローラの動作の一例を示すフロ
ーチャート(2)である。
【図10】モジュールを有する符号化装置の各ブロック
構成の一例を示す図である。
【図11】本発明における夫々のモジュールのブロック
構成例を示す図である。
【符号の説明】
11 聴覚モデル 12 フィルターバンク 13 スケールファクター 14 量子化器 15 ノイズレスコーディング 16 レート/歪みコントローラ 17 ステップ制御コントローラ 18 ビットストリームマルチプレクサ 19 MSコントローラ 20 M/Sステレオツール 21 モジュールA 22 モジュールB 23 モジュールC 24 評価・選択部
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D045 DA20 5J064 AA02 BA09 BA16 BB05 BC01 BC08 BC09 BC11 BC16 BC23 BD01

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 オーディオ信号の符号化方法において、 時間領域の信号を周波数領域の信号に変換する変換手順
    と、 前記変換ステップにて変換された周波数係数群を複数の
    帯域で分割する分割手順と、 ゲインと量子化値の積で表現される周波数係数の値にお
    ける前記ゲイン又は前記量子化値をステップ状に制御す
    る制御手順と、 前記量子化値を符号化する符号化手順とを有することを
    特徴とするオーディオ信号の符号化方法。
  2. 【請求項2】 前記ゲインをスケールファクターバンド
    毎に設定し、当該スケールファクターバンド内で最大の
    周波数係数の符号語が最大の量子化値になるように符号
    化を行うことを特徴とする請求項1に記載のオーディオ
    信号の符号化方法。
  3. 【請求項3】 前記ゲインをスケールファクターバンド
    毎に設定し、当該スケールファクターバンド内で最大の
    周波数係数の符号語の量子化値を1又は任意の整数とす
    ることを特徴とする請求項1又は2に記載のオーディオ
    信号の符号化方法。
  4. 【請求項4】 オーディオ信号にMSステレオを適用し
    た場合、 前記スケールファクターバンドにおけるM成分とS成分
    のエナジー、若しくは最大周波数係数の大きさ、又は聴
    覚エントロピーを用いて、スケールファクターバンド内
    のM成分とS成分夫々の最大周波数係数として異なる量
    子化値を用いることを特徴とする請求項2又は3に記載
    のオーディオ信号の符号化方法。
  5. 【請求項5】 オーディオ信号の符号化装置において、 時間領域の信号を周波数領域の信号に変換する変換手段
    と、 前記変換ステップにて変換された周波数係数群を複数の
    帯域で分割する分割手段と、 ゲインと量子化値の積で表現される周波数係数の値にお
    ける前記ゲイン又は前記量子化値をステップ状に制御す
    る制御手段と、 前記量子化値を符号化する符号化手段とを有することを
    特徴とするオーディオ信号の符号化装置。
  6. 【請求項6】 前記制御手段は、前記ゲインをスケール
    ファクターバンド毎に設定し、前記符号化手段は、当該
    スケールファクターバンド内で最大の周波数係数の符号
    語が最大の量子化値になるように符号化を行うことを特
    徴とする請求項5に記載のオーディオ信号の符号化装
    置。
  7. 【請求項7】 前記制御手段は、前記ゲインをスケール
    ファクターバンド毎に設定し、前記符号化手段は、当該
    スケールファクターバンド内で最大の周波数係数の符号
    語の量子化値を1又は任意の整数とすることを特徴とす
    る請求項5又は6に記載のオーディオ信号の符号化装
    置。
  8. 【請求項8】 オーディオ信号にMSステレオを適用し
    た場合、 前記スケールファクターバンドにおけるM成分とS成分
    のエナジー、若しくは最大周波数係数の大きさ、又は聴
    覚エントロピーを用いて、スケールファクターバンド内
    のM成分とS成分夫々の最大周波数係数として異なる量
    子化値を用いることを特徴とする請求項6又は7に記載
    のオーディオ信号の符号化装置。
  9. 【請求項9】 符号化方法が異なる複数の符号化手段
    と、スケールファクターバンド毎の必要なビットレート
    数に基づいて、前記複数の符号化手段の中から1つの符
    号化手段を評価・選択する評価・選択手段を有すること
    を特徴する請求項5乃至8の何れか一項に記載のオーデ
    ィオ信号の符号化装置。
JP2002072667A 2002-03-15 2002-03-15 オーディオ信号の符号化方法及び符号化装置 Pending JP2003271199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002072667A JP2003271199A (ja) 2002-03-15 2002-03-15 オーディオ信号の符号化方法及び符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002072667A JP2003271199A (ja) 2002-03-15 2002-03-15 オーディオ信号の符号化方法及び符号化装置

Publications (1)

Publication Number Publication Date
JP2003271199A true JP2003271199A (ja) 2003-09-25

Family

ID=29202603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002072667A Pending JP2003271199A (ja) 2002-03-15 2002-03-15 オーディオ信号の符号化方法及び符号化装置

Country Status (1)

Country Link
JP (1) JP2003271199A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007183528A (ja) * 2005-12-06 2007-07-19 Fujitsu Ltd 符号化装置、符号化方法、および符号化プログラム
US7613605B2 (en) 2004-11-18 2009-11-03 Canon Kabushiki Kaisha Audio signal encoding apparatus and method
WO2021136344A1 (zh) * 2019-12-31 2021-07-08 华为技术有限公司 音频信号的编解码方法和编解码装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7613605B2 (en) 2004-11-18 2009-11-03 Canon Kabushiki Kaisha Audio signal encoding apparatus and method
JP2007183528A (ja) * 2005-12-06 2007-07-19 Fujitsu Ltd 符号化装置、符号化方法、および符号化プログラム
WO2021136344A1 (zh) * 2019-12-31 2021-07-08 华为技术有限公司 音频信号的编解码方法和编解码装置
CN113129913A (zh) * 2019-12-31 2021-07-16 华为技术有限公司 音频信号的编解码方法和编解码装置
CN113129913B (zh) * 2019-12-31 2024-05-03 华为技术有限公司 音频信号的编解码方法和编解码装置

Similar Documents

Publication Publication Date Title
KR102115358B1 (ko) 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
EP2267698B1 (en) Entropy coding by adapting coding between level and run-length/level modes.
JP4212591B2 (ja) オーディオ符号化装置
JP4168976B2 (ja) オーディオ信号符号化装置及び方法
KR20230110842A (ko) 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법
JP4673882B2 (ja) 推定値を決定するための方法および装置
US8032371B2 (en) Determining scale factor values in encoding audio data with AAC
WO1998000837A1 (fr) Procedes de codage et de decodage de signaux audio, et codeur et decodeur de signaux audio
AU2011361945B2 (en) Filing of non-coded sub-vectors in transform coded audio signals
JP4800379B2 (ja) 最大ビットレートを保証する情報の無損失符号化
EP3175457B1 (en) Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
JP2004309921A (ja) 符号化装置、符号化方法及びプログラム
US6678653B1 (en) Apparatus and method for coding audio data at high speed using precision information
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
JP2004325633A (ja) 信号符号化方法、信号符号化プログラム及びその記録媒体
WO2006008817A1 (ja) オーディオ符号化装置及びオーディオ符号化方法
JP2003233397A (ja) オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置
JP2006003580A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法
JP2003271199A (ja) オーディオ信号の符号化方法及び符号化装置
JP5379871B2 (ja) オーディオ符号化のための量子化
JP4625709B2 (ja) ステレオオーディオ信号符号化装置
JP4409733B2 (ja) 符号化装置、符号化方法、及びその記録媒体
JP2002091498A (ja) オーディオ信号符号化装置
JP4721355B2 (ja) 符号化データの符号化則変換方法および装置
JP4046454B2 (ja) オーディオデータ符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040405

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060110

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061114