JPH10107642A - デジタルオーディオ符号化信号におけるマスキングしきい値を計算する方法 - Google Patents

デジタルオーディオ符号化信号におけるマスキングしきい値を計算する方法

Info

Publication number
JPH10107642A
JPH10107642A JP9157156A JP15715697A JPH10107642A JP H10107642 A JPH10107642 A JP H10107642A JP 9157156 A JP9157156 A JP 9157156A JP 15715697 A JP15715697 A JP 15715697A JP H10107642 A JPH10107642 A JP H10107642A
Authority
JP
Japan
Prior art keywords
filter
masking
signal
iir
digital audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9157156A
Other languages
English (en)
Inventor
Rolanz Jonathan
ローランズ ジョナソン
E Lee Fushiaio
イー リー フシアイオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Instruments Inc
Original Assignee
Texas Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Inc filed Critical Texas Instruments Inc
Publication of JPH10107642A publication Critical patent/JPH10107642A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 マスキングしきい値を効率よく計算する。 【解決手段】 デジタルオーディオ符号化信号における
心理聴覚的なマスキングしきい値を計算するための方法
が提供され、これは、2つの側をもつマスキング関数の
片側を表すために因果性のIIRフィルタが使用され、
第2 の側を表すために非因果性のIIRフィルタが使用
される。信号は、好ましくは、フィルタを因果性にしか
つ安定させるために、逆時間方向において非因果性のフ
ィルタを通して処理される。その結果として、マスキン
グ関数の両側は、安定したフィルタで表すことができ
る。さらに、IIRフィルタを用いた計算の数は、1つ
若しくはそれ以上のFIRフィルタの使用の結果生じる
数よりもかなり小さくなる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般にデジタル通
信分野に関し、特に、デジタルオーディオ符号化信号に
おける心理音響的な全体のマスキングしきい値を効率よ
く計算するための方法に関する。
【0002】
【従来の技術】パルス符号変調(PCM)は、デジタル
オーディオ信号を放送するために典型的に使用されてい
る。デジタルオーディオ信号を効率よく放送したり、あ
るいは記録したりするために、PCM符号化されたサン
プルの再生に必要なデジタル情報量は、デジタル圧縮ア
ルゴリズムを用いて減少され、オリジナル信号のデジタ
ル圧縮された形態が生成される。デジタル圧縮は、バン
ド幅が制限される場合に利用され、通過される情報量を
いつも減少させることによって現実化される経済的利益
を与える。例えば、デジタル圧縮は、典型的に、ビデオ
会議システム、人工衛星や地上のオーディオ放送システ
ム、同軸ケーブルや光ケーブルのオーディオ伝送システ
ムにおける高品質のオーディオ伝送に使用され、かつ、
磁気、光、あるいは半導体の蓄積装置上にオーディオ信
号を蓄積するためにも使用される。標準のデジタルオー
ディオ符号化信号のフォーマットは、動画専門グループ
(Motion Picture Expert Group) によって公表されてき
た(例えば、ISO/IEC 11172-3 及び ISO/IEC 13818-3を
参照)。このフォーマットは、“MPEGオーディオ”
と一般に呼ばれる。
【0003】“心理音響的”の言葉は、人間によって知
覚されるような音の分野に関する。人がオーディオ信号
(例えば、音楽など)を聞くとき、あるトーンが、その
信号の他のトーンを圧倒したり、あるいは“マスク”す
るように知覚される。デジタル信号処理分野において、
周波数領域の“マスキング”は、ある周波数でのトーン
や狭バンドのノイズ信号が、聴覚者の異なる周波数での
トーンやノイズ信号に対する感度に影響を与えることに
よって生じる現象である。より大きなパワー、あるいは
支配的な信号は、典型的に、“マスクするトーン(maski
ng tone)”と呼ばれ、より小さなパワー、あるいは利用
される信号は、典型的に、“マスクされるトーン(maske
d tone) ”と呼ばれる。これらの周波数領域のマスキン
グ特性とそれらの影響は、グラフに示すことができる。
例えば、符号化されたデジタルオーディオ信号を表す周
波数領域のグラフにおいて、“マスキング関数”は、あ
る周波数での孤立した、より大きなパワーのトーン(例
えば、狭バンドのノイズや信号源)が、隣接する周波数
でのより小さなパワー信号についての聴覚者の知覚をマ
スクする範囲を表す曲線として示される。孤立した、よ
り大きなパワーのトーンは、“マスクするトーン”であ
り、より小さなパワーの信号は、“マスクされるトー
ン”である。このような“マスキング関数”は、図1に
示され、これは以下に説明される。
【0004】図1は、代表的な符号化デジタルオーディ
オ信号についての“マスキング関数”を説明する周波数
領域での曲線を示すグラフである。このようなグラフ
は、典型的に、ある特定のマスクするトーンについての
影響領域(すなわち、マスキング関数)を計算したり、
説明するために使用される。全体のオーディオ信号の処
理のため、マスキング関数は、信号の各トーン毎に求め
られる。これらの個々のマスキング関数は、全体のオー
ディオ信号についてのマスキング関数、あるいは曲線を
生成するために、代数学的に加算される。
【0005】特に、図1を参照すると、選択されたマス
クするトーンを示すマスキング関数が、Log(対数)
のパワー−周波数領域において、傾斜S1、S2、S
3、S4を有する断片的な線形曲線として示されてい
る。図1のグラフの垂直軸は、パワー(dB)であり、
水平軸は、臨界バンドレートあるいは“Bark”であ
る。マスキング関数の曲線の下の陰影領域あるいは範囲
は、マスクするトーンの存在によって聞こえないように
されているか、あるいはマスクされているオーディオ信
号の影響領域(境界あるいは限界)を表す。マスキング
関数の曲線の傾斜は、特定のマスクするトーンについて
のマスキング効果を表す。本質的に、マスキング関数の
曲線の下方に入るいかなるトーン(マスクするトーン以
外の異なる周波数のトーン)は、聞くことができない。
マスキング関数の曲線形状は、マスクするトーンについ
ての信号源の周波数、パワー及びバンド幅に依存する。
従来のデジタル信号圧縮技術を用いて、マスクされるト
ーンは感度が減少されるか、あるいは、品位が劣化する
ように処理され、それは全体のビットレートを減少させ
る効果を有する。その結果として、より少ないビットが
伝送され、これによって、処理される信号が圧縮され
る。マスクされるトーンは聞くことができないか、ある
いはノイズレベル以下であるので、それらの感度の減少
は、処理される可聴信号を著しく劣化させない。
【0006】従来のデジタル信号圧縮システムは、典型
的に、処理される信号のスペクトルを形成するためにデ
ジタルフィルタを使用する。このようなデジタルフィル
タは、コンピュータルアルゴリズムで理論的に実現可能
である。そして、アルゴリズムが、典型的に、フィルタ
についてのハードウエア構成を定めるためにソフトウエ
アで実行される。デジタルオーディオ信号圧縮に用いら
れる、このようなコンピュータアルゴリズムの例は、イ
ンターソサイアテイ・コオーデイネイションのジョイン
ト委員会のユナイテッドステイト・アドバンストテレビ
ジョンシステム委員会(ATSC)によって1995年
5月24日に発行された、デジタルオーディオ圧縮スタ
ンダード(AC−3)に説明されている。この標準は、
主にドルビー(登録商標)の音声システムにおいて広め
られてきた。本質的に、“AC−3”標準は、“PCM
表現からのソースオーディオの1ないし5.1チャンネ
ルを32kbpsないし640kbps の範囲であるデータ速度のシ
リアルビットストリームに符号化するために”、コンピ
ュータデジタル圧縮アルゴリズムを使用する。典型的な
応用では、衛星通信トランスミッターは、シリアルビッ
トストリームをRF信号に変換し、これを衛星トランス
ポンダーに伝える。
【0007】デジタル符号化オーディオ信号のためのコ
ンピュータアルゴリズムの開発では、信号上の全体のマ
スキング効果は、オーディオ信号のパワースペクトル密
度曲線をマスキング関数核の周波数領域表現で重畳(co
nvolving)することによって近似することができる。こ
の場合、マスキング関数核は、シフト−不変(インバリ
アント)ではない。デジタル符号化オーディオ信号上の
全体のマスキング効果を近似する場合、従来の方法は、
処理される各周波数でマスキング関数を表すための有限
持続インパルス応答(FIR)フィルタを使用する。こ
のようなFIRフィルタは、多項式の伝達関数によって
特徴付けられる。
【数1】 H(z)=a0 +a1 -1+... +aM -M (1) このようなFIRフィルタの効果は、常に安定している
ということである。
【0008】デジタル符号化オーディオ信号上のマスキ
ング効果を近似する、別の従来の方法は、マスキング関
数の“上部半分”(すなわち、図1の右“半分”)を示
すための無限持続インパルス応答(IIR)フィルタを
使用する。FIRフィルタが、“下半分”(図1の左
“半分”)を示すために使用される。このようなIIR
フィルタは、有理数関数の形態、あるいは多項式の比の
形態での伝達関数によって特徴付けられる。
【数2】 このようなIIRフィルタは、伝達関数H(z)の極
が、z平面内の単位円内に位置される場合にのみ安定し
ている。
【0009】
【発明が解決しようとする課題】デジタル符号化オーデ
ィオ信号上のマスキング関数の全体の効果を近似するた
めに従来のFIRフィルタを使用することは、比較的能
率の良くないデザイン技術である。なぜならば、各出力
サンプル値について実行するために必要とされる計算(
例えば、乗算) は、比較的大きな数となる(例えば、1
つの出力サンプルにつき20ないし80の乗算であ
る)。例えば、マスクするトーンによって影響された信
号の全体の効果を計算するために、個々のマスキング曲
線のすべての効果が合計される。その結果として、全体
のマスキング関数の曲線は、個々の曲線の効果の合計で
あるので、マスクするトーンによって影響され得るマス
クされるトーンの数は、比較的大きな数となる。このよ
うな処理に必要とされる乗算の数は、マスクされる周波
数の数とポテンシャルのマスクするトーンの全数との積
に等しい。だから、100のポテンシャルのマスクする
トーンを持つ信号では、それぞれマスクするトーンは、
平均で約80のマスクされるトーンを覆うと考えられ、
必要とされる全乗算数は、100×80、つまり8,0
00の乗算処理であろう。このような大きな数は、FI
Rフィルタのための計算処理時間を消費させ、能率を悪
くさせる。
【0010】従って、デジタルオーディオ符号化信号に
おける心理聴覚的マスキングしきい値を計算する効率的
な方法が必要である。
【課題を解決するための手段】
【0011】本発明の好適な実施例によれば、因果性の
IIRフィルタは、2つの側を持つマスキング関数の片
側を表すのに使用され、非因果性のIIRフィルタが他
方を表すのに使用される。信号は、好ましくは、フィル
タを因果性にしかつ安定させるために、逆時間方向にお
いて非因果性のフィルタを通して処理される。その結果
として、マスキング関数の両側は、安定したフィルタで
表すことができる。さらに、IIRフィルタを使用した
計算数は、1つ若しくはそれ以上のFIRフィルタの使
用から生じる数よりもかなり少なくなる。
【0012】
【実施例】本発明の好適な実施例及びその利点は、種々
の図面の同様部分や対応部分に同様な参照番号が使用さ
れている図1ないし図3を参照することによって良く理
解される。
【0013】図2は、本発明の好適な実施例による、2
つの実極をもつ因果性のIIRフィルタを使用するマス
キング関数の片側についての対数インパルス応答を示す
グラフである。本実施例では、図2に好適に示されたI
IRフィルタが、以下の伝達関数を有している。
【数3】 ここで、g1 =1、g2 =0.006 、s1 =e-0.35 、お
よびs2 =e-0.025
【0014】好適な実施例によると、2つの実極を有す
る第2のIIRフィルタが、好ましくは、マスキング関
数の第2側を表すために使用される。第2の( 非因果性
の)フィルタは、好ましくは、逆時間方向において適用
され、その結果、2つの極は単位円内にあり、安定性を
確実にする。図3について以下に示されるように、2つ
のIIRフィルタの合成(たたみ込み)は、所望の形状
を持つ核を生成する。
【0015】図3は、本発明の好適な実施例による、2
つのIIRフィルタを使用するマスキング核の対数イン
パルス応答を示す図であり、各々は2つの実極をもつ。
マスキング核とパワースペクトル密度曲線の合成(たた
み込み)は、一方の時間方向において処理される信号を
持つ(例えば、図2について上述されたようなもの)片
側のIIRフィルタと、反対の時間方向において処理さ
れる信号を持つ第2の片側のIIRフィルタとの合成
(たたみ込み)を用いて実施される。結果として生じる
2つの側をもつIIRフィルタ(図3によって例証され
る)は、好ましく以下の伝達関数を持つ。
【数4】 ここで、g1 =1、g2 =0.006 、g3 =1、g4 =0.
01、s1 =e-0.35 、s 2 =e-0.025、s3 =e-0.4
4 =e-0.07
【0016】この時点で、g1 、 g2 等のこれらの特定
の値は、図3に示される2つの側をもつIIRフィルタ
についての特別の伝達関数を説明可能であるけれども、
本発明は、そのような範囲に限定されるべきものではな
いことが理解される。マスキング関数の計算では、周波
数上のマスキング核の形状の依存性、パワー及び信号の
バンド幅は、各出力サンプルでIIR係数を変更するこ
とによって操作可能であり、その時点で核の形状にマッ
チされる。
【0017】一般に、出力値ごとに実行される全体の計
算数は、1つ若しくはそれ以上のFIRフィルタを使用
する20ないし80の乗算から、ここに開示された2つ
の側をもつIIRフィルタによるアプローチを使用する
わずか8の乗算にまで減少することができる。さらに、
上述したように、これらのIIRフィルタの双方は安定
している。
【0018】本発明及びその効果は詳細に説明されてき
たが、種々の変更、交換及び代替は、特許請求の範囲に
よって定められるような発明の範囲及び精神から出発す
ることなく行うことができることを理解されるべきであ
る。
【0019】以上の説明に関し、更に以下の項目を開示
する。 (1) デジタルオーディオ符号化信号におけるマスキ
ング関数を計算する方法であって、パワースペクトル密
度曲線とデジタルオーディオ符号化信号のマスキング関
数の合成は、第1の時間方向において第1のIIRフィ
ルタを通して信号を処理することと、第2の時間方向に
おいて第2のIIRフィルタを通して信号を処理するこ
とによって行われる、前記方法。 (2) (1)において、前記第1 のIIRフィルタ
は、2つの実極をもつ因果性のIIRフィルタである、
前記方法。 (3) (1)において、前記第2のIIRフィルタ
は、非因果性のフィルタである、前記方法。 (4) (1)において、第2のIIRフィルタを通し
て信号を処理するステップは、第2のIIRフィルタを
2つの実極を持つ因果性のフィルタに変換する、前記方
法。
【0020】(5) デジタルオーディオ符号化信号に
おける心理聴覚的なマスキングしきい値を計算するため
の方法が提供され、これは、2つの側をもつマスキング
関数の片側を表すために因果性のIIRフィルタが使用
され、第2の側を表すために非因果性のIIRフィルタ
が使用される。信号は、好ましくは、フィルタを因果性
にしかつ安定させるために、逆時間方向において非因果
性のフィルタを通して処理される。その結果として、マ
スキング関数の両側は、安定したフィルタで表すことが
できる。さらに、IIRフィルタを用いた計算の数は、
1つ若しくはそれ以上のFIRフィルタの使用の結果生
じる数よりもかなり小さくなる。
【図面の簡単な説明】
【図1】代表的な符号化デジタルオーディオ信号につい
ての" マスキング関数“を説明する周波数領域での曲線
のグラフ表示。
【図2】本発明の好適な実施例による、2つの実極を有
する因果性のIIRフィルタを使用するマスキング関数
の片側について対数インパルス応答を示すグラフ。
【図3】本発明の好適な実施例による、各々が2つの実
極をもつ2つのIIRフィルタを使用するマスキング関
数の対数インパルス応答を示すグラフ。
【符号の説明】
S1,S2,S3,S4 傾斜(マスキング関数におけ
る)

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 デジタルオーディオ符号化信号における
    マスキング関数を計算する方法であって、 パワースペクトル密度曲線とデジタルオーディオ符号化
    信号のマスキング関数の合成は、 第1の時間方向において第1のIIRフィルタを通して
    信号を処理することと、 第2の時間方向において第2のIIRフィルタを通して
    信号を処理することによって行われる、前記方法。
JP9157156A 1996-06-14 1997-06-13 デジタルオーディオ符号化信号におけるマスキングしきい値を計算する方法 Pending JPH10107642A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US1990796P 1996-06-14 1996-06-14
US019907 1996-06-14

Publications (1)

Publication Number Publication Date
JPH10107642A true JPH10107642A (ja) 1998-04-24

Family

ID=21795689

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9157156A Pending JPH10107642A (ja) 1996-06-14 1997-06-13 デジタルオーディオ符号化信号におけるマスキングしきい値を計算する方法

Country Status (1)

Country Link
JP (1) JPH10107642A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113574596A (zh) * 2019-02-19 2021-10-29 公立大学法人秋田县立大学 音频信号编码方法、音频信号解码方法、程序、编码装置、音频***及解码装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113574596A (zh) * 2019-02-19 2021-10-29 公立大学法人秋田县立大学 音频信号编码方法、音频信号解码方法、程序、编码装置、音频***及解码装置

Similar Documents

Publication Publication Date Title
US5260980A (en) Digital signal encoder
JP4223679B2 (ja) 低ビットレート多重オーデイオチャンネル符号・復号方法及び装置
JP3178026B2 (ja) ディジタル信号符号化装置及び復号化装置
USRE39080E1 (en) Rate loop processor for perceptual encoder/decoder
JP3153933B2 (ja) データ符号化装置及び方法並びにデータ復号化装置及び方法
EP0559383B1 (en) Method for coding mode selection for stereophonic audio signals utilizing peceptual models
JP3498375B2 (ja) ディジタル・オーディオ信号記録装置
US5592584A (en) Method and apparatus for two-component signal compression
CN101133680B (zh) 用于产生已编码立体声信号的设备及方法
EP0570131B1 (en) Compression encoding and decoding of digital audio signals
Gerzon et al. A high-rate buried-data channel for audio CD
JPH05505298A (ja) 多次元音場のための符号器・復号器
EP0974211A1 (en) Btsc encoder
WO1995013660A1 (fr) Appareil de quantification, procede de quantification, codeur a haute efficacite, procede de codage a haute efficacite, decodeur, supports d'enregistrement et de codage a haute efficacite
KR20070058506A (ko) 텔레비전 오디오 신호를 처리하기 위한 설정가능한 재귀적디지털 필터
JP3557674B2 (ja) 高能率符号化方法及び装置
JPH0846517A (ja) 高能率符号化及び復号化システム
US20010047256A1 (en) Multi-format recording medium
WO1994018762A1 (en) Transmission of digital data words representing a signal waveform
WO1994024666A1 (en) Method and apparatus for transforming signals, and recording medium
USRE40280E1 (en) Rate loop processor for perceptual encoder/decoder
JPH10107642A (ja) デジタルオーディオ符号化信号におけるマスキングしきい値を計算する方法
WO1995016263A1 (fr) Procede, dispositif et support concernant le traitement de l'information
Creusere et al. Efficient audio coding using perfect reconstruction noncausal IIR filter banks
JPH09102742A (ja) 符号化方法および装置、復号化方法および装置、並びに記録媒体