JP3060578B2

JP3060578B2 - ディジタル信号符号化方法

Info

Publication number: JP3060578B2
Application number: JP3091189A
Authority: JP
Inventors: 健三赤桐
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1991-03-29
Filing date: 1991-03-29
Publication date: 2000-07-10
Anticipated expiration: 2015-07-10
Also published as: JPH04302536A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、入力ディジタル信号の
符号化を行うディジタル信号の高能率符号化装置に関す
るものである。

【０００２】

【従来の技術】オーディオ_,音声等の信号の高能率符号
化においては、オーディオ，音声等の入力信号を時間軸
又は周波数軸で複数のチャンネルに分割すると共に、各
チャンネル毎のビット数を適応的に割当てるビットアロ
ケーシヨン（ビット割当て）による符号化技術がある。
例えば、オーディオ信号等の上記ビット割当てによる符
号化技術には、時間軸上のオーディオ信号等を複数の周
波数帯域に分割して符号化する帯域分割符号化（サブ・
バンド・コーディング：ＳＢＣ）や、時間軸の信号を周
波数軸上の信号に変換（直交変換）して複数の周波数帯
域に分割し各帯域毎で適応的に符号化するいわゆる適応
変換符号化（ＡＴＣ）、或いは、上記ＳＢＣといわゆる
適応予測符号化（ＡＰＣ）とを組み合わせ、時間軸の信
号を帯域分割して各帯域信号をベースバンド（低域）に
変換した後複数次の線形予測分析を行って予測符号化す
るいわゆる適応ビット割当て（ＡＰＣ−ＡＢ）等の符号
化技術がある。

【０００３】上記高能率符号化においては、時間軸上の
オーディオ信号等を、所定の単位時間毎に例えば高速フ
ーリエ変換（ＦＦＴ）等の直交変換によって時間軸に直
交する軸（周波数軸）に変換し、その後複数の帯域に分
割して、これら分割された各帯域のＦＦＴ係数データを
適応的なビット割り当てによって符号化している。この
符号化データが伝送される。

【０００４】

【発明が解決しようとする課題】ところで、この各帯域
毎のＦＦＴ係数データを上記適応ビット割り当てにより
符号化する際には、例えば、上記周波数軸上のＦＦＴ係
数データをブロック化し、このブロック毎にいわゆるブ
ロックフローティング処理を施すことで、更にビット圧
縮を行う場合が多い。このため、後の復号化のための構
成には、上記帯域分割されると共に上記ブロック毎にブ
ロックフローティング処理されたＦＦＴ係数データと、
当該各ブロック毎のフローティング係数及び割り当てビ
ット数に応じたワード長情報からなるサブ情報とが伝送
されることになる。

【０００５】しかし、上記高能率符号化においては、更
に圧縮効率を高めることが望まれている。

【０００６】そこで、本発明は、上述のような実情に鑑
みて提案されたものであり、より高いビット圧縮が可能
なディジタル信号符号化方法を提供することを目的とす
るものである。

【０００７】

【課題を解決するための手段】本発明のディジタル信号
符号化方法は、上述の目的を達成するために提案された
ものであり、入力ディジタル信号を直交変換して臨界帯
域に分割し、当該臨界帯域毎のエネルギに基づいて設定
した各臨界帯域毎の許容ノイズレベルと当該各臨界帯域
毎のエネルギとの差分のレベルに応じたビット数で上記
各臨界帯域の信号成分を符号化すると共に、上記直交変
換後の信号成分をブロック化してこのブロック毎にブロ
ックフローティング処理を行い当該ブロック毎のフロー
ティング係数を伝送するディジタル信号符号化方法であ
って、上記ブロックフローティング処理を上記臨界帯域
よりも狭い帯域の小ブロック単位で行う場合には、上記
小ブロック毎に割り当てられるビット数に応じたワード
長の情報を伝送すると共に、上記臨界帯域毎のフローテ
ィング係数の代わりに上記臨界帯域内の信号レベル範囲
から所定レベル分だけ低い方へ指定範囲をずらした許容
ノイズレベルに関する情報を伝送するようにしたもので
ある。ここで、上記割当ビット数決定の際には、例え
ば、各臨界帯域毎のエネルギから人間の聴覚特性を考慮
していわゆるマスキング量を求め、このマスキング量に
基づく許容ノイズレベルを用いて各臨界帯域の割当ビッ
ト数を決定することが望ましい。また、上記所定レベル
としては、上記マスキング量に応じた量とすることが好
ましい。

【０００８】

【作用】本発明によれば、ブロックフローティング処理
が臨界帯域よりも狭い帯域の小ブロックについて行われ
る場合は、１つの臨界帯域内に複数の小ブロックが存在
することになり、この場合、各小ブロック毎のフローテ
ィング係数を伝送せずに、臨界帯域毎の許容ノイズレベ
ルに関する情報及びワード長情報を送るようにすること
で、フローティング係数のためのビット数を減らすこと
ができる。この時、許容ノイズレベルの指定範囲を臨界
帯域内の信号レベル範囲から所定レベル分だけ低い方へ
ずらすことで、この許容ノイズレベルに関する情報を更
に低減することが可能となる。

【０００９】

【実施例】以下、本発明を適用した実施例について図面
を参照しながら説明する。本発明のディジタル信号符号
化方法は、入力ディジタル信号を例えば高速フーリエ変
換（ＦＦＴ）で直交変換して人間の聴覚特性を考慮した
高域ほど帯域幅が広くなるようないわゆる臨界帯域（ク
リティカルバンド）に分割し、当該臨界帯域毎のエネル
ギに基づいて設定した各臨界帯域毎の許容ノイズレベル
と当該各臨界帯域毎のエネルギとの差分のレベルに応じ
たビット数で上記各臨界帯域の信号成分（ＦＦＴ係数デ
ータ）を符号化すると共に、上記直交変換後の信号成分
をブロック化してこのブロック毎にブロックフローティ
ング処理を行い当該ブロック毎のフローティング係数を
伝送するディジタル信号符号化方法である。

【００１０】換言すれば、本実施例では、図１のフロー
チャートに示すような処理を行う。先ず、ステップＳ１
では上記直交変換後の信号成分をブロック化してこのブ
ロック毎にブロックフローティング処理を行い当該ブロ
ック毎のフローティング係数（フローティングレベル）
を決定する。ステップＳ２では後述するような臨界帯域
毎のエネルギに基づいて設定した各臨界帯域毎の許容ノ
イズレベルを決定し、ステップＳ３では上記各臨界帯域
毎の許容ノイズレベルと当該各臨界帯域毎のエネルギと
の差分のレベルに基づいて設定される割り当てビット数
に応じたワード長の情報を決定するようにしている。

【００１１】ここで、本発明実施例において上記ブロッ
クフローティング処理を上記臨界帯域よりも狭い帯域の
小ブロック単位で行う場合には、上記ステップＳ４では
上記小ブロック毎に割り当てられるビット数に応じたワ
ード長の情報を求めて伝送すると共に、ステップＳ５及
びステップＳ６においては上記臨界帯域毎のフローティ
ング係数の代わりに上記臨界帯域内の信号レベル範囲か
ら所定レベル分（後述するマスキング量に基づくレベル
分）だけ低い方へ指定範囲をずらすようになされた許容
ノイズレベルに関する情報を求めて伝送するようにして
いる。具体的にいうと、上記臨界帯域内の信号レベル範
囲から上記所定レベル分だけ低い方に指定範囲をシフト
するような値が格納された量子化テーブルを用い、この
量子化テーブルから上記ステップＳ２で求められた許容
ノイズレベルに対応する値を出力して伝送するようにし
ている。

【００１２】上述のように、許容ノイズレベルの指定範
囲をシフトさせるのは、次のような理由からである。先
ず、上記ステップＳ２で求めた許容ノイズレベルに関す
る情報をそのまま伝送するようにした場合、実際の信号
の取り得るダイナミックレンジと同じ指標を当該許容ノ
イズレベルに対して用いるのはムダが多い。すなわち、
許容ノイズレベルというのは、後述するように、人間の
聴覚特性を考慮したマスキング量に基づいて求められる
ものであるため、上記実際の信号レベルの最大値に対し
て必ずある一定レベル低いものとなるものである。例え
ば、上記許容ノイズレベルは、上記信号レベルに対して
約２６ｄＢ程度低く取られるものである。このように、
上記信号レベルに対して、必ずある一定レベル低く取ら
れる許容ノイズレベルに対して、当該信号レベルの取り
うるダイナミックレンジをそのまま用いることは、非常
にムダであり、ビット数低減の観点からも好ましくな
い。このようなことから、本実施例では、上述したよう
に、上記臨界帯域内の信号レベル範囲から所定レベル分
だけ低い方へ指定範囲をずらすようになされた量子化テ
ーブルを用いるようにしている。これにより、少ないビ
ット数でも許容ノイズレベルを表現することが可能とな
る。換言すれば、少ないビット数でも上記シフトを行わ
ない場合と同じ分解能（精度）で許容ノイズレベルを表
すことができるようになる。したがって、許容ノイズレ
ベルの伝送のためのビット数を低減することが可能とな
る。

【００１３】ところで、上述したように、臨界帯域より
も狭い帯域の小ブロックでフローティング処理を行う場
合とは、例えば図２に示すような場合を想定している。
この図２では、臨界帯域の高域すなわち帯域幅の広い臨
界帯域Ｂを示しており、この臨界帯域Ｂ内に複数の上記
ブロック（例えば４つの上記小ブロックｂ１〜ｂ４）が
存在するような例を示している。

【００１４】通常、このように臨界帯域Ｂ内を小ブロッ
クｂ１〜ｂ４に分割し、この小ブロック毎にブロックフ
ローティング処理を施すようにすると、後の復号化処理
の際には、各小ブロック毎のフローティング処理で得ら
れるフローティング係数と、各小ブロック毎の割り当て
ビット数に応じたワード長の情報とが必要となる。すな
わち、後の復号化のための構成に対しては、上記小ブロ
ック毎のフローティング係数の情報及び、該フローティ
ング係数のレベルと該臨界帯域の許容ノイズレベルとの
レベル差に基づく割り当てビット数に応じた各小ブロッ
ク毎のワード長の情報を伝送することが必要となる。換
言すれば、後の復号化の際には、上記フローティング係
数の情報から、上記ブロックフローティング処理におけ
る最上位ビット（ＭＳＢ）が決まり、上記ワード長の情
報から最下位ビット（ＬＳＢ）が決まって上記許容ノイ
ズレベルが決定される。更に各小ブロックのＦＦＴ係数
データ（メインデータ）から信号の大きさが決まるよう
になる。

【００１５】ここで、通常、上記フローティング係数の
情報は例えば６ビットで表され、上記ワード長の情報は
それぞれ例えば４ビットで表される。なお、直交変換が
ＤＦＴ（離散的フーリエ変換）の場合、上記ワード長情
報は、大きさ（振幅）と位相若しくは実数部と虚数部を
上記４ビットで表すことになる。このため、例えば、１
つの臨界帯域Ｂを複数のフローティングブロック（小ブ
ロックｂ１〜ｂ４）で分割した場合、当該ブロックフロ
ーティング処理の小ブロック数（すなわち帯域の分割
数）に応じた当該臨界帯域の全体の伝送ビット数は、表
１に示すようになる。

【表１】

【００１６】この表１において、臨界帯域を１つのブロ
ックで表した場合（１分割）は、フローティング係数に
６ビットで、ワード長に４ビットの合計１０ビットが伝
送されることになる。また、臨界帯域を２つの小ブロッ
クで表した場合（２分割）は、フローティング係数に６
×２（＝１２ビット）、ワード長に４×２（＝８ビッ
ト）で合計２０ビットが伝送されることになる。以下同
様に、３分割した場合はフローティング係数に６×３
（＝１８ビット）でワード長に４×３（＝１２ビット）
の合計３０ビット、また、４分割の場合はフローティン
グ係数に６×４（＝２４ビット）でワード長に４×４
（＝１６ビット）の合計４０ビットが伝送される。上述
のように、１つの臨界帯域内のブロック数が増加するほ
ど伝送されるビット数も増加することになる。

【００１７】これに対し、本発明実施例の上記図２の例
においては、臨界帯域Ｂ内の上記各小ブロックｂ１〜ｂ
４のフローティング係数Ｆｃ１〜Ｆｃ４の情報を伝送せ
ずに、臨界帯域Ｂに対して１つのみ設定される上記許容
ノイズレベルＮＬの情報と上記割り当てビット数に応じ
たワード長Ｗ１〜Ｗ４の情報を伝送するようにしてい
る。すなわち、後の復号化処理の際には、上記臨界帯域
Ｂの許容ノイズレベルＮＬの情報が伝送されて来れば、
当該許容ノイズレベルＮＬの情報と上記各小ブロックｂ
１〜ｂ４のワード長Ｗ１〜Ｗ４の情報とに基づいて、上
記各小ブロックｂ１〜ｂ４毎のフローティング係数Ｆｃ
１〜Ｆｃ４の情報を求めることができるため、このフロ
ーティング係数Ｆｃ１〜Ｆｃ４の情報を伝送しないよう
にしている。これにより、上記臨界帯域Ｂに対して４つ
必要な上記フローティング係数Ｆｃ１〜Ｆｃ４を伝送す
るためのビット数が低減できるようになる。

【００１８】なお、図２には、上記割り当てビット数を
求めるためのレベル差とワード長Ｗ１〜Ｗ４とが対応す
るものであるため、該ワード長Ｗ１〜Ｗ４を便宜的に図
中に示している。

【００１９】ここで、上記許容ノイズレベルＮＬは、上
述したように、人間の聴覚特性を考慮した臨界帯域毎に
求められており、当該臨界帯域では、１つの臨界帯域内
で許容ノイズレベルが略一定と考えることができるもの
である。したがって、上記図２の臨界帯域Ｂ内の各小ブ
ロックｂ１〜ｂ４においても、許容ノイズレベルＮＬは
同レベルであると考えることができる。ただし、全体の
ダイナミックレンジを例えば１２０ｄＢとし、上記フロ
ーティング係数を上記６ビットで表すと、該フローティ
ング係数は約２ｄＢの精度を持つことになり、また、上
記ワード長情報を上記４ビットで表すと、該ワード長情
報は約６ｄＢの精度となる。このため、上記図２の各小
ブロックｂ１〜ｂ４において、後の復号化の際には、フ
ローティング係数Ｆｃ１〜Ｆｃ４と、上記ワード長Ｗ１
〜Ｗ４の情報とから決まる許容ノイズレベルＮＬは、約
２ｄＢステップのズレを持つようになる。しかし、許容
ノイズレベルＮＬは、通常、略±３ｄＢの範囲内に収ま
る。このようなことから、本実施例では、許容ノイズレ
ベルＮＬを臨界帯域Ｂ内で共通の荒い量子化と、臨界帯
域Ｂ内のフローティング処理の各小ブロックｂ１〜ｂ４
それぞれの持つ細かい量子化との２段階で表して当該許
容ノイズレベルＮＬを精度高く共通値として設定してい
る。すなわち、本実施例では、許容ノイズレベルＮＬが
４ビットｌｏｇレベルであるため、この４ビットｌｏｇ
で表しきれなかった許容ノイズレベルＮＬを２ビットｌ
ｏｇで細かく表すようにしている。したがって本実施例
では、約６ｄＢを４分割して１．５ｄＢ精度とすること
が可能となる。このように、上記許容ノイズレベルＮＬ
が複数の小ブロックｂ１〜ｂ４に渡って略等しいことを
用い、上記高精度のパラメータを上記フローティング係
数と許容ノイズレベルから選択する事でビット数を低減
することがてきることになる。このような図２の例にお
けるビット数低減の様子を上記表１と比較して表２に示
す。

【表２】

【００２０】この表２において、臨界帯域Ｂを１つのブ
ロックで表した場合（１分割）は、上記許容ノイズレベ
ルＮＬを４ビットで、ワード長Ｗを４ビットで伝送す
る。ただし、上記許容ノイズレベルＮＬにおいては、上
述したように、２ｄＢ分のズレを補償するための２ビッ
トを加えて（４＋２ビット）いる。このため、該１分割
では合計１０ビットが伝送されることになる。同じく、
臨界帯域Ｂを２つの小ブロックで表した場合（２分割）
は、許容ノイズレベルＮＬに４＋２×２＝８ビット、ワ
ード長Ｗに４×２＝８ビットで合計１６ビットが伝送さ
れることになる。以下同様に、３分割した場合は許容ノ
イズレベルＮＬに４＋２×３＝１０ビット、ワード長Ｗ
に４×３＝１２ビットの合計２２ビット、４分割（図２
の例）の場合は許容ノイズレベルＮＬに４＋２×４＝１
２ビット、ワード長Ｗに４×４＝１６ビットの合計２８
ビットが伝送されることになる。このため、表１の例の
伝送ビット数を１００％としてこの表２の例と比較する
と、表２の例の場合、１分割では同じく１００％となる
のに対し、２分割では８０％、３分割では７３％、４分
割では７０％のように、分割数（ブロック数）が増加す
る程、ビット低減率が向上するようになる。したがっ
て、本実施例の方法は非常に有効であることが理解でき
る。

【００２１】すなわち、本実施例においては、上述した
図２のような臨界帯域Ｂ毎に上記許容ノイズレベルＮＬ
に関する情報を伝送するようにした場合、上述したよう
に、上記臨界帯域Ｂ内の信号レベル範囲から所定レベル
分だけ低い方へ許容ノイズレベルＮＬの指定範囲をずら
すようにした量子化テーブルの出力を伝送するようにし
ている。このようにすることで、許容ノイズレベルＮＬ
の伝送のためのビット数を低減することが可能となって
いる。

【００２２】なお、この図２の例の場合のように、上記
許容ノイズレベルＮＬに対して例えば４ビットで表すよ
うにした場合には、上記４ビットで表せる範囲を上述の
ように所定レベル分低い方にシフトさせるようにする。
ただし、実際の許容ノイズレベルＮＬに関する情報は、
上記２ｄＢ分のズレを補償するための２ビット分の偏差
が付け加えられたものとなる。また、ワード長のＷ１〜
Ｗ４の情報の量子化は適応的でなく一様な量子化とされ
ている。

【００２３】更に、上記図２の例においては、１つの臨
界帯域Ｂ内の上記各ワード長Ｗ１〜Ｗの情報のうちで伝
送するのをワード長Ｗ１の情報のみとし、他のワード長
Ｗ２〜Ｗ４の情報を伝送しないようにすることも可能で
ある。すなわち、伝送するのは、該臨界帯域Ｂ内の各フ
ローティング係数Ｆｃ１〜Ｆｃ４の情報と、上記ワード
長Ｗ１の情報とする。換言すれば、後の復号化処理の際
には、１つのワード長Ｗ１の情報が伝送されて来れば、
各フローティング係数Ｆｃ１〜Ｆｃ４の情報に基づい
て、残りのワード長Ｗ２〜Ｗ４の情報を求めることがで
きる。具体的には、上記フローティング係数Ｆｃ１とワ
ード長Ｗ１とで許容ノイズレベルＮＬを求めることがで
き、該許容ノイズレベルＮＬを求めることができれば、
該許容ノイズレベルＮＬと上記フローティング係数Ｆｃ
２〜Ｆｃ４とから、上記残りのワード長Ｗ２〜Ｗ４を知
ることができるようになる。このようなことから、上記
残りのワード長Ｗ２〜Ｗ４の情報を伝送しないようにす
ることができ、したがって、臨界帯域Ｂに対して上記３
つのワード長Ｗ２〜Ｗ４の情報の伝送のためのビット数
が低減できるようになる。

【００２４】上述した本実施例のディジタル信号符号化
方法が適用される構成の例を図３に示す。

【００２５】すなわちこの図３において、入力端子１に
供給された時間軸上のディジタルオーディオデータが、
高速フーリエ変換回路１１に伝送される。この高速フー
リエ変換回路１１では、上記時間軸上のオーディオデー
タが単位時間毎（単位ブロック）に周波数軸上のデータ
に変換され、実数成分値Ｒｅと虚数成分値Ｉｍとからな
るＦＦＴ係数データが得られる。これらＦＦＴ係数デー
タは振幅位相情報発生回路１２に伝送され、当該振幅位
相情報発生回路１２では上記実数成分値Ｒｅと虚数成分
値Ｉｍとから振幅情報Ａｍと位相情報Ｐｈとが得られ
て、上記振幅情報Ａｍの情報が出力されるようになる。
すなわち、一般に人間の聴覚は周波数領域の振幅（パワ
ー）には敏感であるが、位相についてはかなり鈍感であ
るため、本実施例では上記振幅情報Ａｍのみを用いて上
記割当ビット数情報を得るようにしている。

【００２６】上記振幅情報Ａｍは、先ず帯域分割回路１
３に伝送される。該帯域分割回路１３では、上記振幅情
報Ａｍで表現された入力ディジタル信号をいわゆる臨界
帯域幅（クリティカルバンド）に分割している。この臨
界帯域幅とは、人間の聴覚特性（周波数分析能力）を考
慮したものであり、例えば０〜２２ｋＨｚを２５帯域に
分け、高い周波数帯域ほど帯域幅を広く選定しているも
のである。すなわち人間の聴覚は、一種のバンドパスフ
ィルタのような特性を有していて、この各フィルタによ
って分けられたバンドを臨界帯域と呼んでいる。

【００２７】上記帯域分割回路１３で臨界帯域に分割さ
れた各帯域毎の上記振幅情報Ａｍは、各々上記総和検出
回路１４に伝送される。この総和検出回路１４では、各
帯域毎のエネルギ（各帯域でのスペクトル強度）が、各
帯域内のそれぞれの振幅情報Ａｍの総和（振幅情報Ａｍ
のピーク又は平均或いはエネルギ総和）をとることによ
り求められる。該総和検出回路１４の出力すなわち各帯
域の総和のスペクトルは、一般にバークスペクトルと呼
ばれ、この各帯域のバークスペクトルＳＢは例えば図４
に示すようになる。ただし、図４では図示を簡略化する
ため、上記クリティカルバンドのバンド数を１２の帯域
（Ｂ₁〜Ｂ₁₂）で表現している。

【００２８】ここで、上記バークスペクトルＳＢのいわ
ゆるマスキングに於ける影響を考慮するため、該バーク
スペクトルＳＢに所定の重みづけの関数を畳込む（コン
ボリューション）。このため、上記総和検出回路１４の
出力すなわち該バークスペクトルＳＢの各値は、フィル
タ回路１５に送られる。該フィルタ回路１５は、例え
ば、入力データを順次遅延させる複数の遅延素子と、こ
れら遅延素子からの出力にフィルタ係数（重みづけの関
数）を乗算する複数の乗算器（例えば各帯域に対応する
２５個の乗算器）と、各乗算器出力の総和をとる総和加
算器とから構成されるものである。このフィルタ回路１
５の各乗算器において、例えば、任意の帯域に対応する
乗算器Ｍでフィルタ係数１を、乗算器Ｍ−１でフィルタ
係数０．１５を、乗算器Ｍ−２でフィルタ係数０．００
１９を、乗算器Ｍ−３でフィルタ係数０．０００００８
６を、乗算器Ｍ＋１でフィルタ係数０．４を、乗算器Ｍ
＋２でフィルタ係数０．０６を、乗算器Ｍ＋３でフィル
タ係数０．００７を各遅延素子の出力に乗算することに
より、上記バークスペクトルＳＢの畳込み処理が行われ
る。ただし、Ｍは１〜２５の任意の整数である。この畳
込み処理により、図４中点線で示す部分の総和がとられ
る。なお、上記マスキングとは、人間の聴覚上の特性に
より、ある信号によって他の信号がマスクされて聞こえ
なくなる現象をいうものであり、このマスキング効果に
は、時間軸上のオーディオ信号に対するマスキング効果
と周波数軸上の信号に対するマスキング効果とがある。
すなわち、該マスキング効果により、マスキングされる
部分にノイズがあったとしても、このノイズは聞こえな
いことになる。このため、実際のオーディオ信号では、
このマスキングされる部分内のノイズは許容可能なノイ
ズとされる。

【００２９】その後、上記フィルタ回路１５の出力は引
算器１６に送られる。該引算器１６は、上記畳込んだ領
域での後述する許容可能なノイズレベルに対応するレベ
ルαを求めるものである。なお、当該許容可能なノイズ
レベル（許容ノイズレベル）に対応するレベルαは、後
述するように、逆コンボリューション処理を行うことに
よって、臨界帯域の各帯域毎の許容ノイズレベルとなる
ようなレベルである。ここで、上記引算器１６には、上
記レベルαを求めるための許容関数（マスキングレベル
を表現する関数）が供給される。この許容関数を増減さ
せることで上記レベルαの制御を行っている。当該許容
関数は、後述する関数発生回路２９から供給されている
ものである。

【００３０】すなわち、許容ノイズレベルに対応するレ
ベルαは、臨界帯域幅の帯域の低域から順に与えられる
番号をｉとすると、次の式で求めることができる。 α＝Ｓ−（ｎ−ａｉ）この式において、ｎ，ａは定数でａ＞０、Ｓは畳込み処
理されたバークスペクトルの強度であり、該式中（ｎ−
ａｉ）が許容関数となる。本実施例ではｎ＝３８，ａ＝
１としており、この時の音質劣化はなく、良好な符号化
が行えた。

【００３１】このようにして、上記レベルαが求めら
れ、このデータは、割算器１７に伝送される。当該割算
器１７では、上記畳込みされた領域での上記レベルαを
逆コンボリューションするためのものである。したがっ
て、この逆コンボリューション処理を行うことにより、
上記レベルαからマスキングスペクトルが得られるよう
になる。すなわち、このマスキングスペクトルが許容ノ
イズスペクトルとなる。なお、上記逆コンボリューショ
ン処理は、複雑な演算を必要とするが、本実施例では簡
略化した割算器１７を用いて逆コンボリューションを行
っている。

【００３２】次に、上記マスキングスペクトルは、合成
回路１８を介して減算器１９に伝送される。ここで、当
該減算器１９には、上記総和検出回路１４の出力すなわ
ち前述した総和検出回路１４からのバークスペクトルＳ
Ｂが、遅延回路２１を介して供給されている。したがっ
て、この減算器１９で上記マスキングスペクトルとバー
クスペクトルＳＢとの減算演算が行われることで、図５
に示すように、上記バークスペクトルＳＢは、該マスキ
ングスペクトルＭＳのレベルで示すレベル以下がマスキ
ングされることになる。

【００３３】当該減算器１９の出力は、上記許容ノイズ
レベル補正回路２０を介してＲＯＭ３０に送られる。該
ＲＯＭ３０には、上記振幅情報Ａｍの量子化に用いる複
数の割当ビット数情報が格納されており、上記減算回路
１９の出力（上記各帯域のエネルギと上記ノイズレベル
設定手段の出力との差分のレベル）に応じた割当ビット
数情報を出力するようになっている。このＲＯＭ３０か
らの割当ビット数情報に基づいて、量子化回路２４で
は、遅延回路２３を介して供給されている振幅情報Ａｍ
の量子化を行う。すなわち、上記ＲＯＭ３０は、前述し
たような量子化テーブルを有するものである。また、出
力端子２からは、振幅情報Ａｍ等の量子化出力と共に、
上述した各小ブロックのワード長情報及び上記シフトさ
れた許容ノイズレベルに関する情報からなるサブ情報も
出力される。なお、遅延回路２１は上記合成回路１８以
前の各回路での遅延量を考慮して上記総和検出回路１４
からのバークスペクトルＳＢを遅延させ、上記遅延回路
２３は上記ＲＯＭ３０以前の各回路での遅延量を考慮し
て上記振幅情報Ａｍを遅延させるために設けられてい
る。

【００３４】また、上述した合成回路１８での合成の際
には、最小可聴カーブ発生回路２２から供給される図６
に示すような人間の聴覚特性であるいわゆる最小可聴カ
ーブＲＣを示すデータと、上記マスキングスペクトルＭ
Ｓとを合成することができる。この最小可聴カーブにお
いて、雑音絶対レベルがこの最小可聴カーブ以下ならば
該雑音は聞こえないことになる。更に、該最小可聴カー
ブは、コーディングが同じであっても例えば再生時の再
生ボリュームの違いで異なるものとなる。ただし、現実
的なディジタルシステムでは、例えば１６ビットダイナ
ミックレンジへの音楽のはいり方にはさほど違いがない
ので、例えば４ｋＨｚ付近の最も耳に聞こえやすい周波
数帯域の量子化雑音が聞こえないとすれば、他の周波数
帯域ではこの最小可聴カーブのレベル以下の量子化雑音
は聞こえないと考えられる。したがって、このように例
えばシステムの持つワードレングスの４ｋＨｚ付近の雑
音が聞こえない使い方をすると仮定し、この最小可聴カ
ーブＲＣとマスキングスペクトルＭＳとを共に合成する
ことで許容ノイズレベルを得るようにすると、この場合
の許容ノイズレベルは、図中斜線で示す部分までとする
ことができるようになる。なお、本実施例では、上記最
小可聴カーブの４ｋＨｚのレベルを、例えば２０ビット
相当の最低レベルに合わせている。また、この図６は、
信号スペクトルＳＳも同時に示している。

【００３５】ここで、上記許容ノイズレベル補正回路２
０では、補正値決定回路２８から送られてくるいわゆる
等ラウドネス曲線の情報に基づいて、上記減算器１９か
らの許容ノイズレベルを補正している。すなわち、上記
補正値決定回路２８からは、上記減算器１９からの許容
ノイズレベルを、いわゆる等ラウドネス曲線の情報デー
タに基づいて補正させるための補正値データが出力さ
れ、この補正値データが上記許容ノイズレベル補正回路
２０に伝送されることで、上記減算器１９からの許容ノ
イズレベルの等ラウドネス曲線を考慮した補正がなされ
るようになる。なお、上記等ラウドネス曲線とは、人間
の聴覚特性に関するものであり、例えば１ｋＨｚの純音
と同じ大きさに聞こえる各周波数での音の音圧を求めて
曲線で結んだもので、ラウドネスの等感度曲線とも呼ば
れる。また、該等ラウドネス曲線は、図６に示した最小
可聴カーブＲＣと略同じ曲線を描くものである。該等ラ
ウドネス曲線においては、例えば４ｋＨｚ付近では１ｋ
Ｈｚのところより音圧が８〜１０ｄＢ下がっても１ｋＨ
ｚと同じ大きさに聞こえ、逆に５０ｋＨｚ付近では１ｋ
Ｈｚでの音圧よりも約１５ｄＢ高くないと同じ大きさに
聞こえない。このため、上記最小可聴カーブのレベルを
越えた雑音（許容ノイズレベル）は、該等ラウドネス曲
線に応じたカーブで与えられる周波数特性を持つように
するのが良いことがわかる。このようなことから、上記
等ラウドネス曲線を考慮して上記許容ノイズレベルを補
正することは、人間の聴覚特性に適合していることがわ
かる。

【００３６】なお、本実施例においては、上述した最小
可聴カーブの合成処理を行わない構成とすることもでき
る。すなわち、この場合には、最小可聴カーブ発生回路
２２，合成回路１８が不要となり、上記引算器１６から
の出力は、割算器１７で逆コンボリューションされた
後、すぐに減算器１９に伝送されることになる。

【００３７】

【発明の効果】本発明のディジタル信号符号化方法にお
いては、入力ディジタル信号を直交変換して臨界帯域に
分割し、各臨界帯域毎の許容ノイズレベルに基づいた適
応的な割り当てビット数で各臨界帯域の信号成分を符号
化すると共に、直交変換後の信号成分をブロックフロー
ティング処理して得たフローティング係数を伝送するも
のであり、フローティング処理を臨界帯域よりも狭い帯
域の小ブロックで行う場合には、小ブロック毎に割り当
てられるビット数に応じたワード長の情報を伝送すると
共に、臨界帯域毎のフローティング係数の代わりに臨界
帯域内の信号レベル範囲から所定レベル分だけ低い方へ
指定範囲をずらした許容ノイズレベルに関する情報を伝
送するようにしたことで、許容ノイズレベルに関する情
報伝送のためのビット数を減らすことができ、したがっ
て、より高いビット圧縮が可能となる。

【図面の簡単な説明】

【図１】本発明実施例のフローチャートである。

【図２】フローティング処理を臨界帯域よりも狭いブロ
ックで行う場合を説明するための図である。

【図３】本発明実施例の具体的構成を示すブロック回路
図である。

【図４】バークスペクトルを示す図である。

【図５】マスキングスペクトルを示す図である。

【図６】最小可聴カーブ，マスキングスペクトルを合成
した図である。

【符号の説明】

Ｂ・・・・・・・・・・帯域ｂ１〜ｂ４・・・・・・ブロックＷ１〜Ｗ４・・・・・・ワード長ＮＬ１〜ＮＬ４・・・・許容ノイズレベル

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) H03M 7/30

Claims

(57)【特許請求の範囲】

【請求項１】入力ディジタル信号を直交変換して臨界
帯域に分割し、当該臨界帯域毎のエネルギに基づいて設
定した各臨界帯域毎の許容ノイズレベルと当該各臨界帯
域毎のエネルギとの差分のレベルに応じたビット数で上
記各臨界帯域の信号成分を符号化すると共に、上記直交
変換後の信号成分をブロック化してこのブロック毎にブ
ロックフローティング処理を行い当該ブロック毎のフロ
ーティング係数を伝送するディジタル信号符号化方法で
あって、上記ブロックフローティング処理を上記臨界帯
域よりも狭い帯域の小ブロック単位で行う場合には、上
記小ブロック毎に割り当てられるビット数に応じたワー
ド長の情報を伝送すると共に、上記臨界帯域毎のフロー
ティング係数の代わりに上記臨界帯域内の信号レベル範
囲から所定レベル分だけ低い方へ指定範囲をずらした許
容ノイズレベルに関する情報を伝送することを特徴とす
るディジタル信号符号化方法。