JP3132031B2 - ディジタル信号の高能率符号化方法 - Google Patents

ディジタル信号の高能率符号化方法

Info

Publication number
JP3132031B2
JP3132031B2 JP03091190A JP9119091A JP3132031B2 JP 3132031 B2 JP3132031 B2 JP 3132031B2 JP 03091190 A JP03091190 A JP 03091190A JP 9119091 A JP9119091 A JP 9119091A JP 3132031 B2 JP3132031 B2 JP 3132031B2
Authority
JP
Japan
Prior art keywords
block
data
signal
encoding
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP03091190A
Other languages
English (en)
Other versions
JPH04302537A (ja
Inventor
健三 赤桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP03091190A priority Critical patent/JP3132031B2/ja
Publication of JPH04302537A publication Critical patent/JPH04302537A/ja
Application granted granted Critical
Publication of JP3132031B2 publication Critical patent/JP3132031B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力ディジタル音声信
号の圧縮符号化を行うディジタル信号の高能率符号化方
法に関するものである。
【0002】
【従来の技術】オーディオ, 音声等の信号の高能率符号
化においては、オーディオ,音声等の入力信号を時間軸
又は周波数軸で複数のチャンネルに分割すると共に、各
チャンネル毎のビット数を適応的に割当てるビットアロ
ケーシヨン(ビット割当て)による符号化技術がある。
例えば、オーディオ信号等の上記ビット割当てによる符
号化技術には、時間軸上のオーディオ信号等を複数の周
波数帯域に分割して符号化する帯域分割符号化(サブ・
バンド・コーディング:SBC)や、時間軸の信号を周
波数軸上の信号に変換(直交変換)して複数の周波数帯
域に分割し各帯域毎で適応的に符号化するいわゆる適応
変換符号化(ATC)、或いは、上記SBCといわゆる
適応予測符号化(APC)とを組み合わせ、時間軸の信
号を帯域分割して各帯域信号をベースバンド(低域)に
変換した後複数次の線形予測分析を行って予測符号化す
るいわゆる適応ビット割当て(APC−AB)等の符号
化技術がある。
【0003】すなわち、上記高能率符号化においては、
例えば、時間軸上のオーディオ信号等を、複数のバンド
パスフィルタ等からなるフィルタアレイを通して周波数
分割し、これら周波数分割された信号を適応的なビット
割り当てで符号化するようなことが行われる。また、例
えば、時間軸上のオーディオ信号等を、所定の単位時間
(直交変換ブロック)毎に例えば高速フーリエ変換(F
FT)等の直交変換によって時間軸に直交する軸(周波
数軸)に変換し、その後複数の帯域に分割して、これら
分割された各帯域のFFT係数データを適応的なビット
割り当てによって符号化したり、或いはフィルタアレイ
で周波数分割した後に直交変換してFFT係数データに
変換した後、適応的なビット割り当てで符号化するよう
なことが行われる。この符号化データが伝送される。
【0004】更に、各帯域毎の上記FFT係数データを
上記適応ビット割り当てにより符号化する際には、例え
ば、上記周波数軸上のFFT係数データをブロック(フ
ローティングブロック)化し、このフローティングブロ
ック毎にいわゆるフローティング処理を施すことで、更
にビット圧縮を行う場合が多い。この場合、後の復号化
のための構成には、上記フローティングブロック毎にフ
ローティング処理されたFFT係数データと、当該各フ
ローティングブロック毎のフローティング係数及び割り
当てビット数に応じたワード長情報からなるサブ情報と
が伝送されることになる。
【0005】
【発明が解決しようとする課題】ところで、上記高能率
符号化においては、更に圧縮効率を高めることが望まれ
ているが、上述した符号化では、例えば直交変換ブロッ
ク或いはフローティングブロック内で一定のビット量が
消費されるため、ブロック毎の伝送ビットレートを下げ
ることができず、圧縮効率を高めることが出来なかっ
た。
【0006】そこで、本発明は、上述のような実情に鑑
みて提案されたものであり、より高いビット圧縮が可能
なディジタル信号の高能率符号化方法を提供することを
目的とするものである。
【0007】
【課題を解決するための手段】本発明のディジタル信号
の高能率符号化方法は、上述の目的を達成するために提
案されたものであり、入力ディジタル音声信号を周波数
軸上の信号に変換すると共にブロック化し、該ブロック
毎のディジタル信号を適応的な割り当てビットで符号化
して伝送するディジタル信号の高能率符号化方法におい
て、上記各ブロックのうちの任意の代表ブロックの上記
符号化に関連するデータと、他のブロックの上記符号化
に関連するデータとの間の偏差を求め、上記偏差算出出
力を伝送するようにしたものである。ここで、代表ブロ
ックと他のブロックは時間的に前後するブロックであ
る。また、ブロックは、入力ディジタル音声信号を所定
サンプル毎に周波数軸上の信号に変換した直交変換ブロ
ック、入力ディジタル音声信号を所定サンプル毎に周波
数軸上の信号に変換した後のフローティングブロックで
あり、代表ブロックと他のブロックは周波数的に前後す
るブロックである。さらに、偏差算出出力のデータ量が
符号化に関するデータのデータ量より少ない場合、偏差
算出出力を符号化に関するデータに代えて伝送する。ま
た、偏差算出出力に代えられる前の符号化データは一定
ビットレートであり、偏差算出出力に代えられた後の符
号化データは可変ビットレートである。すなわち、本発
明のディジタル信号の高能率符号化方法は、入力ディジ
タル音声信号が例えばサイン波等の定常的なディジタル
音声信号が連続するものであるか或いはこの定常的信号
に準ずる準定常的なディジタル音声信号が連続するもの
である場合、任意の代表ブロックと他のブロック間での
偏差(差分)を求めるようにし、この偏差のデータを伝
送するようにしている。また、入力ディジタル音声信号
が定常的,準定常的な信号であるか否かの判断は、偏差
のデータの情報量とブロック毎の符号化に関連するデー
タの情報量とを比較することにより行う。偏差のデータ
の情報量が各ブロックのものよりも少ない場合には、入
力ディジタル音声信号が定常的,準定常的な信号である
と判断すると共に、当該偏差のデータを伝送するように
する。逆に、偏差のデータの情報の方が多い場合には、
各ブロック毎のデータを伝送するようにする。更に、偏
差算出の際において、各ブロック間から得られる偏差の
データとしては、ブロック毎の直交変換による係数デー
タ(スペクトル成分)の差分のデータの場合と、ブロッ
ク毎にいわゆるフローティング処理を行う場合のフロー
ティング係数及びワード長情報の差分(サブ情報の差
分)のデータの場合、若しくは、この両者とする場合を
考えることができる。また更に、フローティング処理を
行う場合、直交変換による係数データの偏差は、該フロ
ーティング処理の前のデータか或いは処理後のデータと
することができる。
【0008】
【作用】本発明によれば、任意の代表ブロックの符号化
に関連するデータと他のブロックの符号化に関連するデ
ータとの偏差すなわち差分を伝送するようにしているた
め、伝送ビットレートが下がるようになる。また、本発
明によれば、偏差算出出力のデータ量が符号化に関する
データのデータ量より少ない場合に、偏差算出出力を符
号化に関するデータに代えて伝送することで、さらに伝
送データ量を少なくしている。
【0009】
【実施例】以下、本発明を適用した実施例について図面
を参照しながら説明する。本発明のディジタル信号の高
能率符号化方法が適用される一実施例のディジタル信号
の高能率符号化装置は、オーディオ或いは音声等の入力
ディジタル信号を、例えば、前述の高能率符号化の帯域
分割符号化(SBC)によって帯域分割すると共に、直
交変換して周波数軸上の信号に変換した後符号化するよ
うにしている。
【0010】すなわち、本実施例の高能率符号化装置で
は、図1に示すように、帯域分割フィルタとしてのいわ
ゆるミラーフィルタのQMF(quadrature mirror filte
r)41,42によって、入力端子1を介して供給される
上記入力ディジタル信号を、いわゆる臨界帯域(クリテ
ィカルバンド)での分割を考慮して高域程帯域幅が広く
なるように複数の帯域に分割(例えば大別して3つの帯
域に分割)し、この分割された帯域毎に複数のサンプル
からなるブロック(直交変換ブロック)を形成して、こ
れら各直交変換ブロック毎に高速フーリエ変換(FF
T)回路43,44,45による直交変換(時間軸を周
波数軸に変換)を行うことで係数データ(FFT係数デ
ータ)を得るようになっている。その後、この3分割さ
れた各帯域のFFT係数データを、後述する許容ノイズ
レベル算出回路60で求められる許容ノイズレベルに基
づいた適応的な割り当てビット数で符号化している。こ
の符号化が符号化回路50によって行われ、当該符号化
後のデータが偏差算出回路70を介して出力端子2から
出力されるようになっている。
【0011】ここで、本実施例装置は、上記各直交変換
ブロックのうちの任意の代表ブロック(代表直交変換ブ
ロック)の上記符号化に関連するデータと、他の直交変
換ブロックの符号化に関連するデータとの間の偏差を求
める上記偏差算出回路70を有し、この偏差算出回路7
0からの出力を伝送するようにしている。すなわち、例
えば、入力ディジタル信号が例えばサイン波等の定常的
なディジタル信号が連続するものであったり或いはこの
定常的信号に準ずる準定常的なディジタル信号が連続す
るものであった場合、任意の代表直交変換ブロックと他
の直交変換ブロック間での偏差を求めるようにし、この
偏差のデータを伝送するようにしている。例えば、図2
に示すように準定常的なディジタル信号が連続して供給
された場合、任意の代表直交変換ブロックBaのデータ
を直交変換して得られた周波数成分(後述する振幅値)
Saと、他の直交変換ブロックBbのデータを直交変換
して得られた周波数成分(振幅値)Sbとは、略同じ周
波数の成分であり、したがって、上記偏差算出回路70
では、それらの差分をとって、図3に示すような差分値
Sdを得て、当該差分値Sdを伝送するようにしてい
る。なお図3にはディジタル信号をアナログ的な信号と
して示している。
【0012】このように入力ディジタル信号が準定常的
信号であるならば、上述したような差分演算処理を連続
して繰り返すようにする。また、この繰り返される該差
分演算は、先ず、代表直交変換ブロックBaとその次の
ブロックBbとの差分を取り、次に、該ブロックBaと
ブロックBbの次のブロックBc(図示は省略)との差
分、該ブロックBaとブロックBcの次のブロックBd
(図示は省略)との差分を取っていくというように順次
繰り返すようにする。更に、この差分演算の繰り返しの
他の方法としては、上述のように代表直交変換ブロック
をブロックBaのみに決めるのではなく、順次代表直交
変換ブロックを更新するような方法とすることも可能で
ある。例えば、ブロックBbと代表のブロックBaとの
差分を取り、次に、代表ブロックをブロックBaからB
bに更新して当該ブロックBcとブロックBbとの差分
を取り、更に代表ブロックをブロックBbからBcに更
新して当該ブロックBdとブロックBcとの差分を取っ
ていくという方法とすることも可能である。
【0013】また、上記入力ディジタル信号は上記定常
的或いは準定常的な信号のみが連続するものであるとは
限らず、例えば図4に示すように、これら準定常的信号
以外の非定常的信号が連続するような場合が多い。この
場合、伝送するデータとしては、上記差分のデータを伝
送するか或いは各ブロック毎のデータをそのまま送るか
の何れかを判断して、伝送情報量の少なくなる方を選ん
で伝送するようにする。例えば、図4に示すような非定
常的信号の場合、代表直交変換ブロックBaとその次の
ブロックBbから得られる各周波数成分は異なり、した
がって、これらの差分を取っても情報量は低減されない
ことが考えられる。このようなことから、上記偏差算出
回路70では、上記ブロックBaとブロックBbとの差
分を取って得た上記差分値のデータを伝送する際の情報
量とブロックBa及びBbのデータを伝送する際の情報
量とを比較して、情報量が少なくなる方を伝送する。た
だし、この場合は、差分値のデータを送ったか或いはブ
ロック毎のデータをそのまま伝送したかの何れかを示す
モード情報も同時に伝送することが必要となる。なお、
この図4もディジタル信号を便宜的にアナログ信号とし
て示している。
【0014】更に、上記偏差算出回路70においては、
上述したように、各ブロック間から得られる偏差のデー
タを、上記直交変換ブロック間のFFT係数データ(ス
ペクトル成分)の差分とする場合と、例えばいわゆるフ
ローティング処理を行う場合のフローティング係数及び
ワード長情報の差分(サブ情報の差分)とする場合、若
しくは、この両者とする場合を考えることができる。な
おワード長情報とは、符号化の際の割り当てビット数に
対応するものである。このように、フローティング処理
を行って得られたフローティング係数及びワード長情報
の差分を伝送するような場合も、上述同様に連続するブ
ロック(フローティングブロック)間での差分を取るよ
うにする。また、上記両者の差分を伝送するようにした
場合、上記FFT係数データの差分演算は、上記フロー
ティング処理の前か或いは処理後のいずれであってもよ
い。
【0015】上述のように、本実施例では、上記差分の
データを伝送するようにしているため、各ブロック毎に
一定のビットレート(固定ビットレート)であったデー
タを、各ブロック毎に異なるビットレート(すなわち可
変ビットレート)で伝送することになり、データ圧縮率
を高めることが可能となっている。
【0016】上記偏差算出回路70の具体的構成を図5
に示す。この図5において、端子71には、上記符号化
回路50からの符号化データが供給される。該符号化デ
ータは、上述したように、直交変換ブロック単位のFF
T係数データや、フローティングブロック単位のフロー
ティング係数及びワード長のデータである。これらデー
タのうち、例えばN番目のブロックのデータが上記代表
ブロック(直交変換ブロック,フローティングブロッ
ク)としてメモリ等のデータ格納手段72に蓄えられ、
更に、該N番目のブロックの次のN+1番目のブロック
(上記他のブロック)のデータがデータ格納手段73に
蓄えられる。これら、格納手段72,73の出力は、共
に、減算手段74に送られ、上述したような差分値が求
められる。この差分値が比較選択手段75に送られる。
また、当該比較選択手段75には上記各格納手段73,
74からのブロック毎のデータも供給されており、した
がって、当該比較選択手段75では上記減算手段74か
らのブロックの差分値の情報量と、各ブロック毎の情報
量とを比較して、伝送情報量の少ない方を選択して出力
するようになっている。また、上記モード情報も出力さ
れるようになっている。この出力が端子76から出力さ
れる。
【0017】再び図1に戻って、入力端子1にはアナロ
グオーディオ信号等をサンプリング(例えば1024サ
ンプル)して得たディジタル信号(0〜20kHz)が
供給されており、該ディジタル信号は上記QMF41,
42により、上記高域程帯域幅が広くなるように大まか
に3つの帯域(0〜5kHz,5kHz〜10kHz,
10kHz〜20kHz)に分割される。上記QMF4
1では、上記0〜20kHzのディジタル信号が2分割
されて10kHz〜20kHzと0〜10kHzの2つ
の出力が得られ、10kHz〜20kHzの出力は高速
フーリエ変換回路43に、0〜10kHzの出力はQM
F42に送られる。QMF42へ送られた0〜10kH
zの出力は、該QMF42で更に2分割されて5kHz
〜10kHzと0〜5kHzの2つの出力が得られる。
上記5kHz〜10kHzの出力は上記高速フーリエ変
換回路44に送られ、上記0〜5kHzの出力は高速フ
ーリエ変換回路45に送られる。
【0018】ここで、上記各高速フーリエ変換回路4
3,44,45における上記3つの帯域の各帯域の直交
変換ブロックのブロック長は、それぞれ異なるブロック
長となされている。例えば、図6に示すように、上記1
0kHz〜20kHzの高域に対応する高速フーリエ変
換回路43では例えば5msec毎の直交変換ブロック
長bH1,bH2,bH3,bH4とされ、上記5kHz〜10
kHzの中域に対応する高速フーリエ変換回路44では
例えば10msec毎の直交変換ブロック長bM1,bM2
とされ、上記0〜5kHzの低域に対応する高速フーリ
エ変換回路45では例えば20msec毎の直交変換ブ
ロック長bL とされる。
【0019】上述したように、高域及び中域の直交変換
ブロック長を低域よりも短くし、低域の直交変換ブロッ
ク長を長くするのは、以下に示すような理由による。す
なわち、人間の聴覚における周波数分析能力(周波数分
解能)は、一般に、高域ではさほど高くないが低域では
高いものであり、したがって、該低域での周波数分解能
を確保する必要性から、現実には上述したように直交変
換ブロック長をあまり短くすることはできないためであ
る。また、一般に、低域信号では定常区間が長く、逆に
高域信号では短いため、高域(及び中域)での直交変換
ブロック長を短くする(時間分解能を高める)ことは有
効となる。上述のようなことから、本実施例では、上記
定常的な信号以外の時に高域及び中域の直交変換ブロッ
ク長を、低域の直交変換ブロック長よりも短いものと
し、低域の直交変換ブロック長を長くしている。
【0020】このように、本実施例においては、聴覚か
ら必要とされる周波数軸上の分解能と時間軸上の分解能
を同時に満足するような構成となっていて、上記低域
(0〜5kHz)では処理のサンプル数を多くして周波
数分解能を上げ、高域(10kHz〜20kHz)では
時間分解能を上げている。また、中域(5kHz〜10
kHz)でも時間分解能を上げている。
【0021】なお、上記直交変換は上述した高速フーリ
エ変換に限らず例えば離散的余弦変換(DCT)、MD
CT等をも適用することができる。
【0022】これら各高速フーリエ変換回路43,4
4,45の出力が、符号化回路50に送られている。こ
こで、本実施例の符号化回路50における上記3つの帯
域のFFT係数データの符号化の際には、人間の聴覚特
性に基づく適応的な割当てビット数で符号化を行うよう
にしているため、上記各FFT係数データを、上記臨界
帯域での帯域(例えば25バンド)に対応させている。
このため、上記高速フーリエ変換回路43の出力は、臨
界帯域の高域の例えば2つの帯域と対応し、高速フーリ
エ変換回路44の出力は臨界帯域の中域の例えば3つの
帯域と対応し、高速フーリエ変換回路45の出力は臨界
帯域の低域の例えば20個の帯域と対応するようになさ
れている。なお、上記臨界帯域幅とは、人間の聴覚特性
(周波数分析能力)を考慮したものであり、例えば0〜
20kHzを25帯域に分け、高い周波数帯域ほど帯域
幅を広く選定しているものである。すなわち人間の聴覚
は、一種のバンドパスフィルタのような特性を有してい
て、この各フィルタによって分けられたバンドを臨界帯
域と呼んでいる。
【0023】上記符号化回路50での符号化は、上記許
容ノイズレベル算出回路60における各臨界帯域毎の許
容ノイズレベルに基づいた割り当てビット数によって適
応的に行われている。
【0024】上述した本実施例のディジタル信号の高能
率符号化装置の許容ノイズレベル算出回路60の具体的
構成を図7に示す。
【0025】すなわちこの図7において、入力端子61
には、各高速フーリエ変換回路43,44,45から上
記臨界帯域毎のFFT係数データのうち振幅情報Amの
情報のみが供給される。すなわち、一般に人間の聴覚は
周波数領域の振幅(パワー)には敏感であるが、位相に
ついてはかなり鈍感であるため、本具体例では上記振幅
情報Amのみを用いて上記許容ノイズレベルを算出する
ようにしている。
【0026】上記臨界帯域毎の上記振幅情報Amは、各
々上記総和検出回路14に伝送される。この総和検出回
路14では、各帯域毎のエネルギ(各帯域でのスペクト
ル強度)が、各帯域内のそれぞれの振幅情報Amの総和
(振幅情報Amのピーク又は平均或いはエネルギ総和)
をとることにより求められる。該総和検出回路14の出
力すなわち各帯域の総和のスペクトルは、一般にバーク
スペクトルと呼ばれ、この各帯域のバークスペクトルS
Bは例えば図8に示すようになる。ただし、図8では図
示を簡略化するため、上記クリティカルバンドのバンド
数を12の帯域(B1 〜B12)で表現している。
【0027】ここで、上記バークスペクトルSBのいわ
ゆるマスキングに於ける影響を考慮するため、該バーク
スペクトルSBに所定の重みづけの関数を畳込む(コン
ボリューション)。このため、上記総和検出回路14の
出力すなわち該バークスペクトルSBの各値は、フィル
タ回路15に送られる。該フィルタ回路15は、例え
ば、入力データを順次遅延させる複数の遅延素子と、こ
れら遅延素子からの出力にフィルタ係数(重みづけの関
数)を乗算する複数の乗算器(例えば各帯域に対応する
25個の乗算器)と、各乗算器出力の総和をとる総和加
算器とから構成されるものである。このフィルタ回路1
5の各乗算器において、例えば、任意の帯域に対応する
乗算器Mでフィルタ係数1を、乗算器M−1でフィルタ
係数0.15を、乗算器M−2でフィルタ係数0.00
19を、乗算器M−3でフィルタ係数0.000008
6を、乗算器M+1でフィルタ係数0.4を、乗算器M
+2でフィルタ係数0.06を、乗算器M+3でフィル
タ係数0.007を各遅延素子の出力に乗算することに
より、上記バークスペクトルSBの畳込み処理が行われ
る。ただし、Mは1〜25の任意の整数である。この畳
込み処理により、図8中点線で示す部分の総和がとられ
る。なお、上記マスキングとは、人間の聴覚上の特性に
より、ある信号によって他の信号がマスクされて聞こえ
なくなる現象をいうものであり、このマスキング効果に
は、時間軸上のオーディオ信号に対するマスキング効果
と周波数軸上の信号に対するマスキング効果とがある。
すなわち、該マスキング効果により、マスキングされる
部分にノイズがあったとしても、このノイズは聞こえな
いことになる。このため、実際のオーディオ信号では、
このマスキングされる部分内のノイズは許容可能なノイ
ズとされる。
【0028】ここで、上記マスキングとは、人間の聴覚
特性に関するものである。すなわち、一般に音に対する
人間の聴覚特性には、マスキング効果と呼ばれるものが
あり、当該マスキング効果には、テンポラルマスキング
効果と同時刻マスキング効果等がある。上記同時刻マス
キング効果とは、ある大きな音と同時刻に発生する小さ
な音(或いはノイズ)が当該大きな音によってマスクさ
れて聞こえなくなるような効果であり、上記テンポラル
マスキング効果とは、大きな音の時間的な前後の小さな
音(ノイズ)が、この大きな音にマスクされて聞こえな
くなるような効果である。このテンポラルマスキング効
果において、上記大きな音の時間的に後方のマスキング
はフォワードマスキングと呼ばれ、また、時間的に前方
のマスキングはバックワードマスキングと呼ばれてい
る。また、テンポラルマスキングにおいては、人間の聴
覚特性から、フォワードマスキングの効果は長時間(例
えば100msec程度)効くようになっているのに対
し、バックワードマスキングの効果の持続時間は短時間
(例えば5msec程度)となっている。更に、上記マ
スキング効果のレベル(マスキング量)は、フォワード
マスキングが20dB程度で、バックワードマスキング
が30dB程度となっている。
【0029】したがって、このマスキング効果を上記ブ
ロック間でのビット割当ての際に考慮すれば、よりビッ
ト圧縮が可能になる。すなわち、マスキングされる部分
の信号に対してはビット数を少なくしても聴感上何ら悪
影響がないため、このマスキングされる部分のビット数
を減らして圧縮効果をより高めることができる。なお、
上記マスキング効果におけるマスキング量は、例えば上
記臨界帯域毎のエネルギの総和を求め、この臨界帯域毎
のエネルギに基づいて求められる。また、ある臨界帯域
の信号による他の臨界帯域(或いは当該ある臨界帯域自
身)の他の時間へのマスキング量を求めるようにするこ
とも可能である。このようなマスキング量に基づいて各
帯域毎の許容可能なノイズレベルが求められ、更に、こ
の各帯域毎の許容可能なノイズレベルに基づいて上記符
号化の際の割当てビット数を決定することができる。
【0030】その後、上記フィルタ回路15の出力は引
算器16に送られる。該引算器16は、上記畳込んだ領
域での後述する許容可能なノイズレベルに対応するレベ
ルαを求めるものである。なお、当該許容可能なノイズ
レベル(許容ノイズレベル)に対応するレベルαは、後
述するように、逆コンボリューション処理を行うことに
よって、臨界帯域の各帯域毎の許容ノイズレベルとなる
ようなレベルである。ここで、上記引算器16には、上
記レベルαを求めるための許容関数(マスキングレベル
を表現する関数)が供給される。この許容関数を増減さ
せることで上記レベルαの制御を行っている。当該許容
関数は、後述する関数発生回路29から供給されている
ものである。
【0031】すなわち、許容ノイズレベルに対応するレ
ベルαは、臨界帯域幅の帯域の低域から順に与えられる
番号をiとすると、次の式で求めることができる。 α=S−(n−ai) この式において、n,aは定数でa>0、Sは畳込み処
理されたバークスペクトルの強度であり、該式中(n−
ai)が許容関数となる。本具体例ではn=38,a=
1としており、この時の音質劣化はなく、良好な符号化
が行えた。
【0032】このようにして、上記レベルαが求めら
れ、このデータは、割算器17に伝送される。当該割算
器17では、上記畳込みされた領域での上記レベルαを
逆コンボリューションするためのものである。したがっ
て、この逆コンボリューション処理を行うことにより、
上記レベルαからマスキングスペクトルが得られるよう
になる。すなわち、このマスキングスペクトルが許容ノ
イズスペクトルとなる。なお、上記逆コンボリューショ
ン処理は、複雑な演算を必要とするが、本具体例では簡
略化した割算器17を用いて逆コンボリューションを行
っている。
【0033】次に、上記マスキングスペクトルは、合成
回路18を介して減算器19に伝送される。ここで、当
該減算器19には、上記総和検出回路14の出力すなわ
ち前述した総和検出回路14からのバークスペクトルS
Bが、遅延回路21を介して供給されている。したがっ
て、この減算器19で上記マスキングスペクトルとバー
クスペクトルSBとの減算演算が行われることで、図9
に示すように、上記バークスペクトルSBは、該マスキ
ングスペクトルMSのレベルで示すレベル以下がマスキ
ングされることになる。
【0034】当該減算器19の出力は、上記許容ノイズ
レベル補正回路20を介してROM30に送られる。該
ROM30には、上記符号化回路50におけるFFT係
数データの符号化に用いる複数の割当ビット数情報が格
納されており、上記減算回路19の出力(上記各帯域の
エネルギと上記ノイズレベル設定手段の出力との差分の
レベル)に応じた割当ビット数情報を出力するようにな
っている。なお、出力端子62からは、FFT係数デー
タの符号化出力と共に、フローティング処理のフローテ
ィングブロック毎のフローティング係数及びワード長情
報からなるサブ情報も出力される。
【0035】また、合成回路18での合成の際には、最
小可聴カーブ発生回路22から供給される図10に示す
ような人間の聴覚特性であるいわゆる最小可聴カーブR
Cを示すデータと、上記マスキングスペクトルMSとを
合成することができる。この最小可聴カーブにおいて、
雑音絶対レベルがこの最小可聴カーブ以下ならば該雑音
は聞こえないことになる。更に、該最小可聴カーブは、
コーディングが同じであっても例えば再生時の再生ボリ
ュームの違いで異なるものとなる。ただし、現実的なデ
ィジタルシステムでは、例えば16ビットダイナミック
レンジへの音楽のはいり方にはさほど違いがないので、
例えば4kHz付近の最も耳に聞こえやすい周波数帯域
の量子化雑音が聞こえないとすれば、他の周波数帯域で
はこの最小可聴カーブのレベル以下の量子化雑音は聞こ
えないと考えられる。したがって、このように例えばシ
ステムの持つワードレングスの4kHz付近の雑音が聞
こえない使い方をすると仮定し、この最小可聴カーブR
CとマスキングスペクトルMSとを共に合成することで
許容ノイズレベルを得るようにすると、この場合の許容
ノイズレベルは、図中斜線で示す部分までとすることが
できるようになる。なお、本具体例では、上記最小可聴
カーブの4kHzのレベルを、例えば20ビット相当の
最低レベルに合わせている。また、この図10は、信号
スペクトルSSも同時に示している。
【0036】ここで、上記許容ノイズレベル補正回路2
0では、補正値決定回路28から送られてくるいわゆる
等ラウドネス曲線の情報に基づいて、上記減算器19か
らの許容ノイズレベルを補正している。すなわち、上記
補正値決定回路28からは、上記減算器19からの許容
ノイズレベルを、いわゆる等ラウドネス曲線の情報デー
タに基づいて補正させるための補正値データが出力さ
れ、この補正値データが上記許容ノイズレベル補正回路
20に伝送されることで、上記減算器19からの許容ノ
イズレベルの等ラウドネス曲線を考慮した補正がなされ
るようになる。なお、上記等ラウドネス曲線とは、人間
の聴覚特性に関するものであり、例えば1kHzの純音
と同じ大きさに聞こえる各周波数での音の音圧を求めて
曲線で結んだもので、ラウドネスの等感度曲線とも呼ば
れる。また、該等ラウドネス曲線は、図10に示した最
小可聴カーブRCと略同じ曲線を描くものである。該等
ラウドネス曲線においては、例えば4kHz付近では1
kHzのところより音圧が8〜10dB下がっても1k
Hzと同じ大きさに聞こえ、逆に50kHz付近では1
kHzでの音圧よりも約15dB高くないと同じ大きさ
に聞こえない。このため、上記最小可聴カーブのレベル
を越えた雑音(許容ノイズレベル)は、該等ラウドネス
曲線に応じたカーブで与えられる周波数特性を持つよう
にするのが良いことがわかる。このようなことから、上
記等ラウドネス曲線を考慮して上記許容ノイズレベルを
補正することは人間の聴覚特性に適合していることがわ
かる。
【0037】なお、本具体例においては、上述した最小
可聴カーブの合成処理を行わない構成とすることもでき
る。すなわち、この場合には、最小可聴カーブ発生回路
22,合成回路18が不要となり、上記引算器16から
の出力は、割算器17で逆コンボリューションされた
後、すぐに減算器19に伝送されることになる。
【0038】ここで、上述した本実施例による可変ビッ
トレートでの圧縮データの伝送は、例えば、一定ビット
レートの記録媒体と可変ビットレートの記録媒体との間
でデータ転送し記録するような場合に特に有効である。
【0039】すなわち、例えば、記録媒体として例えば
いわゆるCD−I(CD−インタラクティブ)、CD−
ROM XA等、或いは、光磁気ディスク等を用い、こ
れらディスクからの上記一定ビットレートのデータを上
述した本実施例での可変ビットレートで更に圧縮して、
例えば半導体メモリ等の記録媒体(例えばいわゆるIC
カード)に対して転送するような場合に特に有効であ
る。
【0040】
【発明の効果】本発明のディジタル信号の高能率符号化
方法においては、入力ディジタル音声信号を周波数軸上
の信号に変換すると共にブロック化し、該ブロック毎の
ディジタル信号を適応的な割り当てビットで符号化して
伝送するに際し、各ブロックのうちの任意の代表ブロッ
クの上記符号化に関連するデータと、他のブロックの上
記符号化に関連するデータとの間の偏差を求め、上記偏
差算出出力を伝送するようにしたことにより、ブロック
毎の伝送ビットレートを下げることが可能となり、圧縮
効率を高めることができるようになった。
【図面の簡単な説明】
【図1】本発明実施例のディジタル信号の高能率符号化
装置の概略構成を示すブロック回路図である。
【図2】準定常的な信号を示す図である。
【図3】差分値を示す図である。
【図4】非定常的な信号を示す図である。
【図5】偏差算出のための具体的構成を示すブロック回
路図である。
【図6】高速フーリエ変換処理のブロック長を示す図で
ある。
【図7】許容ノイズレベル算出のための具体的構成を示
すブロック図である。
【図8】バークスペクトルを示す図である。
【図9】マスキングスペクトルを示す図である。
【図10】最小可聴カーブ,マスキングスペクトルを合
成した図である。
【符号の説明】
41,42・・・・QMF 43,44,45・・・高速フーリエ変換回路 50・・・・・・・・・符号化回路 60・・・・・・・・・許容ノイズレベル算出回路 70・・・・・・・・・偏差算出回路

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力ディジタル音声信号を周波数軸上の
    信号に変換すると共にブロック化し、該ブロック毎のデ
    ィジタル信号を適応的な割り当てビットで符号化して伝
    送するディジタル信号の高能率符号化方法において、 上記各ブロックのうちの任意の代表ブロックの上記符号
    化に関連するデータと、他のブロックの上記符号化に関
    連するデータとの間の偏差を求め、上記 偏差算出出力を伝送することを特徴とするディジタ
    ル信号の高能率符号化方法。
  2. 【請求項2】 上記代表ブロックと他のブロックは時間
    的に前後するブロックであることを特徴とする請求項1
    記載のディジタル信号の高能率符号化方法。
  3. 【請求項3】 上記ブロックは、入力ディジタル音声信
    号を所定サンプル毎に周波数軸上の信号に変換した直交
    変換ブロックであることを特徴とする請求項1記載のデ
    ィジタル信号の高能率符号化方法。
  4. 【請求項4】 上記ブロックは、入力ディジタル音声信
    号を所定サンプル毎に周波数軸上の信号に変換した後の
    フローティングブロックであり、上記代表ブロックと他
    のブロックは周波数的に前後するブロックであることを
    特徴とする請求項1記載のディジタル信号の高能率符号
    化方法。
  5. 【請求項5】 上記偏差算出出力のデータ量が上記符号
    化に関するデータのデータ量より少ない場合、上記偏差
    算出出力を上記符号化に関するデータに代えて伝送する
    ことを特徴とするディジタル信号の高能率符号化方法。
  6. 【請求項6】 上記偏差算出出力に代えられる前の符号
    化データは一定ビットレートであり、上記偏差算出出力
    に代えられた後の符号化データは可変ビットレートであ
    ることを特徴とする請求項5記載のディジタル信号の高
    能率符号化方法。
JP03091190A 1991-03-29 1991-03-29 ディジタル信号の高能率符号化方法 Expired - Lifetime JP3132031B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03091190A JP3132031B2 (ja) 1991-03-29 1991-03-29 ディジタル信号の高能率符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03091190A JP3132031B2 (ja) 1991-03-29 1991-03-29 ディジタル信号の高能率符号化方法

Publications (2)

Publication Number Publication Date
JPH04302537A JPH04302537A (ja) 1992-10-26
JP3132031B2 true JP3132031B2 (ja) 2001-02-05

Family

ID=14019525

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03091190A Expired - Lifetime JP3132031B2 (ja) 1991-03-29 1991-03-29 ディジタル信号の高能率符号化方法

Country Status (1)

Country Link
JP (1) JP3132031B2 (ja)

Also Published As

Publication number Publication date
JPH04302537A (ja) 1992-10-26

Similar Documents

Publication Publication Date Title
US5414795A (en) High efficiency digital data encoding and decoding apparatus
US5260980A (en) Digital signal encoder
US5294925A (en) Data compressing and expanding apparatus with time domain and frequency domain block floating
JP3134337B2 (ja) ディジタル信号符号化方法
JP3278900B2 (ja) データ符号化装置及び方法
US5864800A (en) Methods and apparatus for processing digital signals by allocation of subband signals and recording medium therefor
US5583967A (en) Apparatus for compressing a digital input signal with signal spectrum-dependent and noise spectrum-dependent quantizing bit allocation
JPH0435123A (ja) ディジタル信号符号化装置
JP3765622B2 (ja) オーディオ符号化復号化システム
JP2001142498A (ja) ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体
JPH1065546A (ja) ディジタル信号処理方法、ディジタル信号処理装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JPH06268608A (ja) 圧縮データ記録及び/又は再生若しくは伝送及び/又は受信装置、圧縮データの圧縮データ記録及び/又は再生若しくは伝送及び/又は受信方法、及び記録媒体
JP3041967B2 (ja) ディジタル信号符号化装置
JP3132031B2 (ja) ディジタル信号の高能率符号化方法
JP3334374B2 (ja) ディジタル信号圧縮方法及び装置
JP3089692B2 (ja) ディジタルデータの高能率符号化方法
JP3291948B2 (ja) 高能率符号化方法及び装置、並びに伝送媒体
JPH11330974A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JP3089691B2 (ja) ディジタルデータの高能率符号化方法
JP3060577B2 (ja) ディジタル信号符号化方法
JP3060578B2 (ja) ディジタル信号符号化方法
JP3010663B2 (ja) ノイズシェーピング回路
JP3070123B2 (ja) ディジタル信号符号化装置及び方法
JP3060576B2 (ja) ディジタル信号符号化方法
JPH06324093A (ja) オーディオ信号のスペクトル表示装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20001024

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071124

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081124

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091124

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091124

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101124

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101124

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111124

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111124

Year of fee payment: 11