JPH04304029A - ディジタル音声信号符号化方法 - Google Patents

ディジタル音声信号符号化方法

Info

Publication number
JPH04304029A
JPH04304029A JP3092739A JP9273991A JPH04304029A JP H04304029 A JPH04304029 A JP H04304029A JP 3092739 A JP3092739 A JP 3092739A JP 9273991 A JP9273991 A JP 9273991A JP H04304029 A JPH04304029 A JP H04304029A
Authority
JP
Japan
Prior art keywords
band
circuit
bits
block
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3092739A
Other languages
English (en)
Other versions
JP3134338B2 (ja
Inventor
Yoshihito Fujiwara
藤原 義仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP03092739A priority Critical patent/JP3134338B2/ja
Priority to KR1019920002727A priority patent/KR100241498B1/ko
Priority to US07/859,089 priority patent/US5268685A/en
Publication of JPH04304029A publication Critical patent/JPH04304029A/ja
Application granted granted Critical
Publication of JP3134338B2 publication Critical patent/JP3134338B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力ディジタル信号を
周波数領域及び時間領域で分割された各ブロック毎に直
交変換して得られた信号を各ブロック単位でビット配分
して符号化するようなディジタル信号符号化装置に関す
る。
【0002】
【従来の技術】オーディオ信号等をビット圧縮して符号
化する技術の一つとして、時間軸上の入力ディジタル信
号を周波数軸上の信号に変換(いわゆる直交変換)して
符号化する直交変換符号化が知られている。この直交変
換としては、例えばオーディオPCMデータを時間軸方
向の一定ワード数(サンプル数)単位で高速フーリエ変
換(FFT)処理を行うようなものがある。
【0003】この直交変換に先立って、入力信号を複数
の周波数帯域に分割し、各帯域毎にそれぞれブロック化
して直交変換すると共に、直交変換された信号を各ブロ
ック単位でビット割当するような符号化技術が考えられ
ている。
【発明が解決しようとする課題】
【0004】ところで、エンコーダ側でFFT等の直交
変換が施された信号は、デコーダ側でIFFT(逆高速
フーリエ変換)が施される。このとき、一般に直交変換
の際の周波数分析精度を高くとると時間軸上での精度が
劣化する。これは特に、信号の始まり部分等の過渡部、
あるいは非定常部において、時間的に先立って信号が聞
こえるようないわゆるプリエコーという現象を起こし、
聴感上聞き苦しく、符号化品質に大きな影響を与えてい
る。
【0005】すなわち、図7の時間軸上のブロックB内
においては、無信号(あるいは微小レベル)部分Uに、
例えばカスタネットやトライアングル等の打音時のよう
な急激にレベルが増大する部分Cが存在する信号が示さ
れている。このブロックBの信号に対してFFT処理を
施し、デコーダ側でIFFT処理を施すと、図8に示す
ように上記無信号部分Uにも信号、すなわち量子化ノイ
ズが現れる。
【0006】ところで、一般に音に対する人間の聴覚特
性には、マスキング効果と称されるものがある。このマ
スキング効果には、大別して、テンポラルマスキング効
果と同時刻マスキング効果とがある。同時刻マスキング
効果とは、大きな音と同時に発生した小さな音が大きな
音によってマスクされて聞こえなくなるような効果であ
る。テンポラルマスキング効果とは、大きな音の時間的
に前後の小さな音が大きな音によってマスクされて聞こ
えなくなるような効果である。図9はこのテンポラルマ
スキング効果を説明するためのものであり、大きな音C
の時間的に後方のフォワードマスキングFMは、長時間
(例えば100msec 程度)に亘って効果が及ぶの
に対して、大きな音Cの時間的に前方のバックワードマ
スキングBMの効果は短時間(例えば5msec程度)
しか効かない。
【0007】このため、上記FFTの変換ブロック内の
時間的に後方部分で急激に信号レベルが上昇した場合に
は、IFFT後のブロック内の前方部分に比較的大きな
ノイズが現れ、耳障りになるという欠点がある。
【0008】本発明は、このような実情に鑑みて提案さ
れたものであり、入力信号をいくつかの帯域に分割し各
帯域毎にそれぞれ直交変換して適応的にビット割当して
符号化する符号化装置であって、マスキングによっても
マスクしきれない量子化ノイズを有効に低減し得るよう
なディジタル信号符号化装置の提供を目的とする
【00
09】
【課題を解決するための手段】本発明に係るディジタル
信号符号化装置は、入力ディジタル信号を複数の周波数
帯域に分割し、分割された各帯域毎に時間軸方向でブロ
ック化してそれぞれ直交変換し、これらの直交変換され
たそれぞれのブロック毎に符号化ビット数を割り当てて
符号化を行うディジタル信号符号化装置であって、上記
直交変換前の時間軸上の信号の過渡性を検出し、この検
出された過渡性に応じて上記各ブロック毎の割当ビット
数を変更することにより、上述の課題を解決するもので
ある。
【0010】ここで、上記過渡性(あるいは非定常性)
については、特に、直交変換ブロックの後方でレベルが
急上昇したことを検出することが望ましい。
【0011】
【作用】上記過渡性、あるいは非定常性が検出されたブ
ロックについては、上記割当ビットを増やすことにより
、量子化ノイズを低減し、いわゆるプリエコーの発生を
防止する。
【0012】
【実施例】図1は本発明の一実施例として、直交変換と
ブロックフローティングとを組み合わせたディジタル信
号符号化装置の一部構成を示している。図1に示す実施
例の高能率符号化装置では、入力ディジタル信号を複数
の周波数帯域に分割すると共に、高い周波数帯域ほどバ
ンド幅を広く選定し、各周波数帯域毎に直交変換を行っ
て、得られた周波数軸のスペクトルデータを、後述する
人間の聴覚特性を考慮したいわゆる臨界帯域幅(クリテ
ィカルバンド)毎に適応的にビット割当して符号化して
いる。これは、帯域分割符号化(SBC)、適応変換符
号化(ATC)及び適応ビット割当て(APC−AB)
の各技術を組み合わせた高能率符号化技術である。
【0013】すなわち、図1において、入力端子10に
は例えば0〜20kHzのオーディオPCM信号が供給
されている。この入力信号は、例えばいわゆるQMFフ
ィルタ等の帯域分割フィルタ11により0〜10kHz
帯域と10k〜20kHz帯域とに分割され、0〜10
kHz帯域の信号は同じくいわゆるQMFフィルタ等の
帯域分割フィルタ12により0〜5kHz帯域と5k〜
10kHz帯域とに分割される。帯域分割フィルタ11
からの10k〜20kHz帯域の信号は直交変換回路の
一例である高速フーリエ変換(FFT)回路13に送ら
れ、帯域分割フィルタ12からの5k〜10kHz帯域
の信号はFFT回路14に送られ、帯域分割フィルタ1
2からの0〜5kHz帯域の信号はFFT回路15に送
られることにより、それぞれFFT処理される。
【0014】ここで、各FFT回路13、14、15に
供給する各帯域毎のブロックについての標準的な入力信
号に対する具体例を図2に示す。この図2の具体例にお
いては、高域側ほど周波数帯域を広げると共に時間分解
能を高め(ブロック長を短くし)ている。すなわち、低
域側の0〜5kHz帯域の信号に対しては1ブロックB
LL を例えば1024サンプルとし、また中域の5k
〜10kHz帯域の信号に対しては、上記低域側の長さ
TBLのブロックBLL のそれぞれ半分の長さTBL
/2のブロックBLM1、BLM2でブロック化し、高
域側の10k〜20kHz帯域の信号に対しては、上記
低域側のブロックBLL のそれぞれ1/4の長さTB
L/4のブロックBLH1、BLH2、BLH3及びB
LH4でブロック化している。なお、入力信号として0
〜22kHzの帯域を考慮する場合には、低域が0〜5
.5kHz、中域が5.5k〜11kHz、高域が11
k〜22kHzとなる。
【0015】再び図1において、各帯域分割フィルタ1
1、12から各FFT回路13、14、15に供給され
る各周波数帯域の時間軸上の信号は、過渡部検出回路1
7に送られている。この過渡部検出回路17において、
上記図2に示す各周波数帯域の各ブロック毎に、信号の
過渡部あるいは非定常部の検出が行われる。
【0016】各FFT回路13、14、15にてFFT
処理されて得られた周波数軸上のスペクトルデータある
いはFFT係数データは、いわゆる臨界帯域(クリティ
カルバンド)毎にまとめられて適応ビット割当符号化回
路18に送られている。このクリティカルバンドとは、
人間の聴覚特性を考慮して分割された周波数帯域であり
、ある純音の周波数近傍の同じ強さの狭帯域バンドノイ
ズによって当該純音がマスクされるときのそのノイズの
持つ帯域のことである。このクリティカルバンドは、高
域ほど帯域幅が広くなっており、上記0〜20kHzの
全周波数帯域は例えば25のクリティカルバンドに分割
されている。
【0017】許容雑音算出回路20は、上記クリティカ
ルバンド毎に分割されたスペクトルデータに基づき、い
わゆるマスキング効果等を考慮した各クリティカルバン
ド毎の許容ノイズ量を求め、この許容ノイズ量と各クリ
ティカルバンド毎のエネルギあるいはピーク値等に基づ
いて、各クリティカルバンド毎に割当ビット数を求める
。適応ビット割当符号化回路18により各クリティカル
バンド毎に割り当てられたビット数に応じて各スペクト
ルデータ(あるいはFFT係数データ)を再量子化する
ようにしている。このようにして符号化されたデータは
、出力端子19を介して取り出される。
【0018】ここで、上記許容雑音算出回路20には、
上記過渡部検出回路17からの検出出力が供給されてお
り、この過渡部検出出力に応じて、上記図2に示すブロ
ック毎に許容雑音が補正されることによって、適応ビッ
ト割当符号化回路18での各割当ビット数の増減変更が
行われるようになっている。この過渡部(非定常部)検
出動作及び割当ビット数の変更動作の一具体例について
以下に説明する。
【0019】上記図2の各ブロック毎の時間軸上の信号
データに関する過渡状態は、例えば各ブロックを4分割
し、各分割領域のエネルギ差や比率等に応じて検出する
ようにすればよい。すなわち、例えば1ブロック内のワ
ード数(サンプル数)としてx0 からx63までの6
4ワード(64サンプル)が存在するとき、これを時間
軸方向で4分割して、x0 〜x15、x16〜x31
、x32〜x47、x48〜x63とする。次に、これ
らの各分割領域のサンプルについての2乗和を求め、そ
れぞれP1 、P2 、P3 、P4 とする。例えば
P1 はx0 2 +・・・+x152 である。次に
、以下のような条件式を満足するか否かを順次判別して
、過渡状態のモードを決定する。 すなわち例えば、 (P2 +P3 +P4 )/P1 <k1 のときモ
ード0(P2 +P3 +P4 )/P1 ≧k1 か
つ (P3 +P4 )/P2<k2 のときモード1 (P3 +P4 )/P2 ≧k2 かつP4 / P
3 <k3 のときモード2 P4 / P3 ≧k3 のときモード3ここで、k1
 は例えば9、k2 は例えば6、k3 は例えば3、
とすればよい。
【0020】これらの各モード0〜モード3の内、モー
ド0は略々定常状態であり、モードの番号が増える程、
信号レベルの立ち上がり部分がブロック内の後方に移る
ことになり、量子化ノイズによるプリエコーの影響が大
きくなる。すなわち、ブロック内の後方位置に信号の立
ち上がりがあると、前述したテンポラルマスキング効果
も期待できず、量子化ノイズが聴感上で耳障りとなるわ
けである。このことを考慮して、番号が大きいモードの
ブロック程、割当ビット数を増やすような変更あるいは
補正を施すのが好ましい。
【0021】先ず第1に、周波数軸上のマスキング効果
を考慮した1次ビット割当を行った後の余ったビットに
関して、上記モード1〜3のブロックには優先的にビッ
トを再配分することが挙げられる。この再配分には、モ
ード3、2、1の順に優先順位をつける。
【0022】第2に、上記モード3のような特に問題の
あるブロックについては、1次ビット割当の段階で割当
ビット数を多くとるようにするのも好ましい。すなわち
マスキングを用いた1次ビット割当の代わりに、聴感上
の最大S/Nがとれるような1次ビット割当を優先的に
行う。
【0023】第3に、上述のような1次ビット割当を行
った結果、ビット数が足りない場合には、上記モード0
のブロックの割当ビットを削るようにし、以下必要に応
じてモード1、2、3の順でビットを削るようにする。
【0024】第4に、モード1〜3のブロックに余りビ
ットを再配分する際には、S/Nが良くなるように、エ
ネルギの高いバンドにビットを割り当てるのが好ましい
【0025】以上説明したように、上記図2の各ブロッ
ク毎に信号の過渡状態を検出し、検出された過渡状態の
上記各モードに応じて割当ビット数を変更、補正あるい
は再配分することによって、上記プリエコーの影響が生
じ易いブロックのビット数を増加させてS/Nを改善す
る。
【0026】次に、図3は上記許容雑音算出回路20の
一具体例の概略構成を示すブロック回路図である。この
図3において、入力端子21には、上記各FFT回路1
3、14、15からの周波数軸上のスペクトルデータが
供給されている。このデータとしては、FFT演算をし
て得られるFFT係数データの実数成分と虚数成分とに
基づいて算出された振幅値と位相値との内の振幅値を用
いるようにしている。これは、一般に人間の聴覚は周波
数軸上の振幅(レベル、強度)には敏感であるが位相に
ついてはかなり鈍感であることを考慮したものである。
【0027】この周波数軸上の入力データは、帯域毎の
エネルギ算出回路22に送られて、上記クリティカルバ
ンド(臨界帯域)毎のエネルギが、例えば当該バンド内
での各振幅値の総和を計算すること等により求められる
。この各バンド毎のエネルギの代わりに、振幅値のピー
ク値、平均値等が用いられることもある。このエネルギ
算出回路22からの出力として、例えば各バンドの総和
値のスペクトルは、一般にバークスペクトルと称されて
いる。図4はこのような各クリティカルバンド毎のバー
クスペクトルSBを示している。ただし、この図4では
、図示を簡略化するため、上記クリティカルバンドのバ
ンド数を12バンド(B1 〜B12)で表現している
【0028】ここで、上記バークスペクトルSBのいわ
ゆるマスキングに於ける影響を考慮するために、該バー
クスペクトルSBに所定の重み付け関数を掛けて加算す
るような畳込み(コンボリューション)処理を施す。こ
のため、上記帯域毎のエネルギ算出回路22の出力すな
わち該バークスペクトルSBの各値は、畳込みフィルタ
回路23に送られる。該畳込みフィルタ回路23は、例
えば、入力データを順次遅延させる複数の遅延素子と、
これら遅延素子からの出力にフィルタ係数(重み付け関
数)を乗算する複数の乗算器(例えば各バンドに対応す
る25個の乗算器)と、各乗算器出力の総和をとる総和
加算器とから構成されるものである。この畳込み処理に
より、図4中点線で示す部分の総和がとられる。なお、
上記マスキングとは、人間の聴覚上の特性により、ある
信号によって他の信号がマスクされて聞こえなくなる現
象をいうものであり、このマスキング効果には、時間軸
上のオーディオ信号による時間軸マスキング効果と、周
波数軸上の信号による同時刻マスキング効果とがある。 これらのマスキング効果により、マスキングされる部分
にノイズがあったとしても、このノイズは聞こえないこ
とになる。このため、実際のオーディオ信号では、この
マスキングされる範囲内のノイズは許容可能なノイズと
される。
【0029】ここで、上記畳込みフィルタ回路23の各
乗算器の乗算係数(フィルタ係数)の一具体例を示すと
、任意のバンドに対応する乗算器Mの係数を1とすると
き、乗算器M−1で係数0.15を、乗算器M−2で係
数0.0019を、乗算器M−3で係数0.00000
86を、乗算器M+1で係数0.4を、乗算器M+2で
係数0.06を、乗算器M+3で係数0.007を各遅
延素子の出力に乗算することにより、上記バークスペク
トルSBの畳込み処理が行われる。ただし、Mは1〜2
5の任意の整数である。
【0030】次に、上記畳込みフィルタ回路23の出力
は引算器24に送られる。該引算器24は、上記畳込ん
だ領域での後述する許容可能なノイズレベルに対応する
レベルαを求めるものである。なお、当該許容可能なノ
イズレベル(許容ノイズレベル)に対応するレベルαは
、後述するように、逆コンボリューション処理を行うこ
とによって、クリティカルバンドの各バンド毎の許容ノ
イズレベルとなるようなレベルである。ここで、上記引
算器24には、上記レベルαを求めるための許容関数(
マスキングレベルを表現する関数)が供給される。この
許容関数を増減させることで上記レベルαの制御を行っ
ている。当該許容関数は、次に説明するような(n−a
i)関数発生回路25から供給されているものである。
【0031】すなわち、許容ノイズレベルに対応するレ
ベルαは、クリティカルバンドのバンドの低域から順に
与えられる番号をiとすると、次の(1)式で求めるこ
とができる。 α=S−(n−ai)    ・・・(1)この(1)
式において、n,aは定数でa>0、Sは畳込み処理さ
れたバークスペクトルの強度であり、(1)式中(n−
ai)が許容関数となる。本実施例ではn=38,a=
1としており、この時の音質劣化はなく、良好な符号化
が行えた。
【0032】このようにして、上記レベルαが求められ
、このデータは、割算器26に伝送される。当該割算器
26では、上記畳込みされた領域での上記レベルαを逆
コンボリューションするためのものである。したがって
、この逆コンボリューション処理を行うことにより、上
記レベルαからマスキングスペクトルが得られるように
なる。すなわち、このマスキングスペクトルが許容ノイ
ズスペクトルとなる。なお、上記逆コンボリューション
処理は、複雑な演算を必要とするが、本実施例では簡略
化した割算器26を用いて逆コンボリューションを行っ
ている。
【0033】次に、上記マスキングスペクトルは、合成
回路27を介して減算器28に伝送される。ここで、当
該減算器28には、上記帯域毎のエネルギ検出回路22
からの出力、すなわち前述したバークスペクトルSBが
、遅延回路29を介して供給されている。したがって、
この減算器28で上記マスキングスペクトルとバークス
ペクトルSBとの減算演算が行われることで、図5に示
すように、上記バークスペクトルSBは、該マスキング
スペクトルMSのレベルで示すレベル以下がマスキング
されることになる。
【0034】当該減算器28からの出力は、許容雑音補
正回路30を介し、出力端子31を介して取り出され、
例えば割当てビット数情報が予め記憶されたROM等(
図示せず)に送られる。このROM等は、上記減算回路
28から許容雑音補正回路30を介して得られた出力(
上記各バンドのエネルギと上記ノイズレベル設定手段の
出力との差分のレベル)に応じ、各バンド毎の割当ビッ
ト数情報を出力する。この割当ビット数情報が上記適応
ビット割当符号化回路18に送られることで、FFT回
路13、14、15からの周波数軸上の各スペクトルデ
ータがそれぞれのバンド毎に割り当てられたビット数で
量子化されるわけである。
【0035】すなわち要約すれば、適応ビット割当符号
化回路18では、上記クリティカルバンドの各バンドの
エネルギと上記ノイズレベル設定手段の出力との差分の
レベルに応じて割当てられたビット数で上記各バンド毎
のスペクトルデータを量子化することになる。なお、遅
延回路29は上記合成回路27以前の各回路での遅延量
を考慮してエネルギ検出回路22からのバークスペクト
ルSBを遅延させるために設けられている。
【0036】ところで、上述した合成回路27での合成
の際には、最小可聴カーブ発生回路32から供給される
図6に示すような人間の聴覚特性であるいわゆる最小可
聴カーブRCを示すデータと、上記マスキングスペクト
ルMSとを合成することができる。この最小可聴カーブ
において、雑音絶対レベルがこの最小可聴カーブ以下な
らば該雑音は聞こえないことになる。この最小可聴カー
ブは、コーディングが同じであっても例えば再生時の再
生ボリュームの違いで異なるものとなが、現実的なディ
ジタルシステムでは、例えば16ビットダイナミックレ
ンジへの音楽のはいり方にはさほど違いがないので、例
えば4kHz付近の最も耳に聞こえやすい周波数帯域の
量子化雑音が聞こえないとすれば、他の周波数帯域では
この最小可聴カーブのレベル以下の量子化雑音は聞こえ
ないと考えられる。したがって、このように例えばシス
テムの持つワードレングスの4kHz付近の雑音が聞こ
えない使い方をすると仮定し、この最小可聴カーブRC
とマスキングスペクトルMSとを共に合成することで許
容ノイズレベルを得るようにすると、この場合の許容ノ
イズレベルは、図6中の斜線で示す部分までとすること
ができるようになる。なお、本実施例では、上記最小可
聴カーブの4kHzのレベルを、例えば20ビット相当
の最低レベルに合わせている。また、この図6は、信号
スペクトルSSも同時に示している。
【0037】また、上記許容雑音補正回路30では、補
正情報出力回路33から送られてくる情報に基づいて、
上記減算器28からの出力における許容雑音レベルを補
正している。この補正情報出力回路33は、上記過渡部
検出回路17からの上記図2の各ブロック単位で検出さ
れた過渡状態の上記各モード等に応じて、補正情報を出
力するものであり、上述したようなモードに応じたブロ
ック単位でのビット割当が補正されるように、上記減算
器28からの出力における許容雑音レベルが補正される
わけである。
【0038】すなわち、上記符号化回路18での量子化
の際の出力情報量(データ量)の検出出力と、最終符号
化データのビットレート目標値との間の誤差の情報に基
づいて、上記許容ノイズレベルを補正する。これは、全
てのビット割当単位ブロックに対して予め一時的な適応
ビット割当を行って得られた総ビット数が、最終的な符
号化出力データのビットレートによって定まる一定のビ
ット数(目標値)に対して誤差を持つことがあり、その
誤差分を0とするように再度ビット割当をするものであ
る。すなわち、目標値よりも総割当ビット数が少ないと
きには、差のビット数を各単位ブロックに割り振って付
加するようにし、目標値よりも総割当ビット数が多いと
きには、差のビット数を各単位ブロックに割り振って削
るようにするわけである。
【0039】このようなことを行うため、上記総割当ビ
ット数の上記目標値からの誤差を検出し、この誤差デー
タに応じて補正情報出力回路33が各割当ビット数を補
正するための補正データを出力する。ここで、上記誤差
データがビット数不足を示す場合は、上記単位ブロック
当たり多くのビット数が使われることで上記データ量が
上記目標値よりも多くなっている場合を考えることがで
きる。また、上記誤差データが、ビット数余りを示すデ
ータとなる場合は、上記単位ブロック当たり少ないビッ
ト数で済み、上記データ量が上記目標値よりも少なくな
っている場合を考えることができる。したがって、上記
補正情報出力回路33からは、この誤差データに応じて
、上記減算器28からの出力における許容ノイズレベル
を、例えば上記過渡状態のモード情報に基づいて補正さ
せるための上記補正値のデータが出力されるようになる
。上述のような補正値が、上記許容雑音補正回路30に
伝送されることで、上記減算器28からの許容ノイズレ
ベルが補正される。
【0040】なお、補正情報出力回路33は、いわゆる
等ラウドネスカーブに基づいた補正情報を出力するよう
にもなっており、上記過渡状態の各モード及びこの等ラ
ウドネスカーブを考慮した補正情報により、上記減算器
28からの出力における許容雑音レベルを補正するよう
にしている。ここで、等ラウドネスカーブとは、人間の
聴覚特性に関する特性曲線であり、例えば1kHzの純
音と同じ大きさに聞こえる各周波数での音の音圧を求め
て曲線で結んだもので、ラウドネスの等感度曲線とも呼
ばれる。またこの等ラウドネス曲線は、図6に示した最
小可聴カーブRCと略同じ曲線を描くものである。この
等ラウドネス曲線においては、例えば4kHz付近では
1kHzのところより音圧が8〜10dB下がっても1
kHzと同じ大きさに聞こえ、逆に、50kHz付近で
は1kHzでの音圧よりも約15dB高くないと同じ大
きさに聞こえない。このため、上記最小可聴カーブのレ
ベルを越えた雑音(許容ノイズレベル)は、該等ラウド
ネス曲線に応じたカーブで与えられる周波数特性を持つ
ようにするのが良いことがわかる。このようなことから
、上記等ラウドネス曲線を考慮して上記許容ノイズレベ
ルを補正することは、人間の聴覚特性に適合しているこ
とがわかる。
【0041】なお、本発明は上記実施例のみに限定され
るものではなく、例えば、オーディオPCM信号のみな
らず、ディジタル音声(スピーチ)信号やディジタルビ
デオ信号等の信号処理装置にも適用可能である。また、
上述した最小可聴カーブの合成処理を行わない構成とし
てもよい。この場合には、最小可聴カーブ発生回路32
、合成回路27が不要となり、上記引算器24からの出
力は、割算器26で逆コンボリューションされた後、直
ちに減算器28に伝送されることになる。
【0042】
【発明の効果】本発明のディジタル信号符号化装置によ
れば、時間軸と周波数軸との2次元的に区分されたブロ
ック単位でそれぞれ直交変換してそれぞれのブロック毎
にビット数を割り当てて符号化を行う際に、直交変換前
の時間軸上の信号の過渡性を検出し、この検出された過
渡性に応じて上記各ブロック毎の割当ビット数を変更す
ること、特に過渡性が検出されたブロックの割当ビット
を増やすことにより、量子化ノイズを低減し、いわゆる
プリエコーの発生を防止することができる。
【図面の簡単な説明】
【図1】本発明の一実施例のディジタル信号符号化装置
の概略構成を示すブロック回路図である。
【図2】該実施例装置における分割帯域及び各帯域での
時間軸方向のブロック化の具体例を示す図である。
【図3】図5の装置の許容雑音算出回路20の具体例を
示すブロック回路図である。
【図4】バークスペクトルを示す図である。
【図5】マスキングスペクトルを示す図である。
【図6】最小可聴カーブ、マスキングスペクトルを合成
した図である。
【図7】直交変換の1ブロック内に過渡部が存在する信
号の一例を示す図である。
【図8】図7の信号をFFTし、IFFTした後の信号
を示す図である。
【図9】テンポラルマスキングを説明するための図であ
る。
【符号の説明】
11、12・・・・・・・・帯域分割フィルタ13、1
4、15・・・・・・・・直交変換回路17・・・・・
・・・過渡部検出回路 18・・・・・・・・適応ビット割当符号化回路20・
・・・・・・・許容雑音算出回路22・・・・・・・・
帯域毎のエネルギ検出回路23・・・・・・・・畳込み
フィルタ回路27・・・・・・・・合成回路 28・・・・・・・・減算器

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  入力ディジタル信号を複数の周波数帯
    域に分割し、分割された各帯域毎に時間軸方向でブロッ
    ク化してそれぞれ直交変換し、これらの直交変換された
    それぞれのブロック毎に符号化ビット数を割り当てて符
    号化を行うディジタル信号符号化装置であって、上記直
    交変換前の時間軸上の信号の過渡性を検出し、この検出
    された過渡性に応じて上記各ブロック毎の割当ビット数
    を変更することを特徴とするディジタル信号符号化装置
JP03092739A 1991-03-30 1991-03-30 ディジタル音声信号符号化方法 Expired - Lifetime JP3134338B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP03092739A JP3134338B2 (ja) 1991-03-30 1991-03-30 ディジタル音声信号符号化方法
KR1019920002727A KR100241498B1 (ko) 1991-03-30 1992-02-22 디지털신호 부호화장치
US07/859,089 US5268685A (en) 1991-03-30 1992-03-27 Apparatus with transient-dependent bit allocation for compressing a digital signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03092739A JP3134338B2 (ja) 1991-03-30 1991-03-30 ディジタル音声信号符号化方法

Publications (2)

Publication Number Publication Date
JPH04304029A true JPH04304029A (ja) 1992-10-27
JP3134338B2 JP3134338B2 (ja) 2001-02-13

Family

ID=14062789

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03092739A Expired - Lifetime JP3134338B2 (ja) 1991-03-30 1991-03-30 ディジタル音声信号符号化方法

Country Status (3)

Country Link
US (1) US5268685A (ja)
JP (1) JP3134338B2 (ja)
KR (1) KR100241498B1 (ja)

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
KR100268623B1 (ko) * 1991-06-28 2000-10-16 이데이 노부유끼 압축 데이타 기록 재생 장치 및 신호 처리 방법
DE69232251T2 (de) * 1991-08-02 2002-07-18 Sony Corp Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung
DE69227570T2 (de) * 1991-09-30 1999-04-22 Sony Corp Verfahren und Anordnung zur Audiodatenkompression
JP3141450B2 (ja) * 1991-09-30 2001-03-05 ソニー株式会社 オーディオ信号処理方法
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
JPH0743598B2 (ja) * 1992-06-25 1995-05-15 株式会社エイ・ティ・アール視聴覚機構研究所 音声認識方法
JP3186292B2 (ja) * 1993-02-02 2001-07-11 ソニー株式会社 高能率符号化方法及び装置
JP3186307B2 (ja) * 1993-03-09 2001-07-11 ソニー株式会社 圧縮データ記録装置及び方法
JP3123290B2 (ja) * 1993-03-09 2001-01-09 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
TW232116B (en) * 1993-04-14 1994-10-11 Sony Corp Method or device and recording media for signal conversion
US5479447A (en) * 1993-05-03 1995-12-26 The Board Of Trustees Of The Leland Stanford, Junior University Method and apparatus for adaptive, variable bandwidth, high-speed data transmission of a multicarrier signal over digital subscriber lines
US5581654A (en) * 1993-05-25 1996-12-03 Sony Corporation Method and apparatus for information encoding and decoding
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
US5737720A (en) * 1993-10-26 1998-04-07 Sony Corporation Low bit rate multichannel audio coding methods and apparatus using non-linear adaptive bit allocation
WO1995012920A1 (fr) * 1993-11-04 1995-05-11 Sony Corporation Codeur de signaux, decodeur de signaux, support d'enregistrement et procede de codage de signaux
US5731767A (en) * 1994-02-04 1998-03-24 Sony Corporation Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
JP3186412B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
JP3277699B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 信号符号化方法及び装置並びに信号復号化方法及び装置
JP3250376B2 (ja) * 1994-06-13 2002-01-28 ソニー株式会社 情報符号化方法及び装置並びに情報復号化方法及び装置
JP3277705B2 (ja) 1994-07-27 2002-04-22 ソニー株式会社 情報符号化装置及び方法、並びに情報復号化装置及び方法
JP3341474B2 (ja) * 1994-07-28 2002-11-05 ソニー株式会社 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
JP3557674B2 (ja) * 1994-12-15 2004-08-25 ソニー株式会社 高能率符号化方法及び装置
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
JPH08223049A (ja) * 1995-02-14 1996-08-30 Sony Corp 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法
JP3307138B2 (ja) * 1995-02-27 2002-07-24 ソニー株式会社 信号符号化方法及び装置、並びに信号復号化方法及び装置
JP2809126B2 (ja) * 1995-03-30 1998-10-08 日本電気株式会社 音声信号処理回路および音声信号処理方法
JP3082625B2 (ja) * 1995-07-15 2000-08-28 日本電気株式会社 音声信号処理回路
US5960390A (en) * 1995-10-05 1999-09-28 Sony Corporation Coding method for using multi channel audio signals
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5825320A (en) * 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
JPH1083623A (ja) * 1996-09-10 1998-03-31 Sony Corp 信号記録方法、信号記録装置、記録媒体および信号処理方法
JP3496411B2 (ja) * 1996-10-30 2004-02-09 ソニー株式会社 情報符号化方法及び復号化装置
TW384434B (en) 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
JP2000101439A (ja) 1998-09-24 2000-04-07 Sony Corp 情報処理装置および方法、情報記録装置および方法、記録媒体、並びに提供媒体
US20020009000A1 (en) * 2000-01-18 2002-01-24 Qdesign Usa, Inc. Adding imperceptible noise to audio and other types of signals to cause significant degradation when compressed and decompressed
EP1340317A1 (en) * 2000-11-03 2003-09-03 Koninklijke Philips Electronics N.V. Parametric coding of audio signals
AU2001276588A1 (en) 2001-01-11 2002-07-24 K. P. P. Kalyan Chakravarthy Adaptive-block-length audio coder
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
MXPA03010237A (es) * 2001-05-10 2004-03-16 Dolby Lab Licensing Corp Mejoramiento del funcionamiento de transitorios en sistemas de codificacion de audio de baja tasa de transferencia de bitios mediante la reduccion del pre-ruido.
JP2003110429A (ja) * 2001-09-28 2003-04-11 Sony Corp 符号化方法及び装置、復号方法及び装置、伝送方法及び装置、並びに記録媒体
US20040203476A1 (en) * 2002-10-08 2004-10-14 Jung-Tao Liu Method of feedback for HSDPA system using OFMDA
US7546240B2 (en) * 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
US7796708B2 (en) 2006-03-29 2010-09-14 Provigent Ltd. Adaptive receiver loops with weighted decision-directed error
US7839952B2 (en) 2006-12-05 2010-11-23 Provigent Ltd Data rate coordination in protected variable-rate links
US8315574B2 (en) * 2007-04-13 2012-11-20 Broadcom Corporation Management of variable-rate communication links
US7821938B2 (en) 2007-04-20 2010-10-26 Provigent Ltd. Adaptive coding and modulation for synchronous connections
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8001445B2 (en) 2007-08-13 2011-08-16 Provigent Ltd. Protected communication link with improved protection indication
US8040985B2 (en) 2007-10-09 2011-10-18 Provigent Ltd Decoding of forward error correction codes in the presence of phase noise
WO2013062392A1 (ko) * 2011-10-27 2013-05-02 엘지전자 주식회사 음성 신호 부호화 방법 및 복호화 방법과 이를 이용하는 장치
CN105976824B (zh) 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
US20150025894A1 (en) * 2013-07-16 2015-01-22 Electronics And Telecommunications Research Institute Method for encoding and decoding of multi channel audio signal, encoder and decoder
CN103479224B (zh) * 2013-10-23 2016-01-06 赵凯 一种小型手动压力咖啡壶
CN104934034B (zh) * 2014-03-19 2016-11-16 华为技术有限公司 用于信号处理的方法和装置
CN114822564A (zh) * 2021-01-21 2022-07-29 华为技术有限公司 音频对象的比特分配方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
JPH03117919A (ja) * 1989-09-30 1991-05-20 Sony Corp ディジタル信号符号化装置

Also Published As

Publication number Publication date
JP3134338B2 (ja) 2001-02-13
KR100241498B1 (ko) 2000-02-01
KR920019106A (ko) 1992-10-22
US5268685A (en) 1993-12-07

Similar Documents

Publication Publication Date Title
JPH04304029A (ja) ディジタル音声信号符号化方法
JP3178026B2 (ja) ディジタル信号符号化装置及び復号化装置
KR100331591B1 (ko) 디지탈신호부호화복호화장치,디지탈신호부호화장치및디지탈신호복호화장치
JP3134337B2 (ja) ディジタル信号符号化方法
KR100279096B1 (ko) 디지탈 신호 복호화 장치
US5634082A (en) High efficiency audio coding device and method therefore
US5553193A (en) Bit allocation method and device for digital audio signals using aural characteristics and signal intensities
JP3185413B2 (ja) 直交変換演算並びに逆直交変換演算方法及びその装置、ディジタル信号符号化及び/又は復号化装置
JPH0435123A (ja) ディジタル信号符号化装置
JPH066236A (ja) 高能率符号化及び/又は復号化装置
JP3041967B2 (ja) ディジタル信号符号化装置
JPH03263925A (ja) デイジタルデータの高能率符号化方法
JP3089692B2 (ja) ディジタルデータの高能率符号化方法
JP3070123B2 (ja) ディジタル信号符号化装置及び方法
JP3134335B2 (ja) ディジタル信号符号化方法及びディジタル信号復号化装置
JP3010663B2 (ja) ノイズシェーピング回路
JP3060577B2 (ja) ディジタル信号符号化方法
JP3060578B2 (ja) ディジタル信号符号化方法
JP3089691B2 (ja) ディジタルデータの高能率符号化方法
JP3060576B2 (ja) ディジタル信号符号化方法
JP2913695B2 (ja) ディジタル信号符号化方法
JPH04302538A (ja) ディジタル信号符号化方法
JPH04104618A (ja) ディジタル信号符号化装置
JPH0591062A (ja) オーデイオ信号処理方法
JPH04302537A (ja) ディジタル信号の高能率符号化方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20001031

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071201

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081201

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091201

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091201

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101201

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111201

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111201

Year of fee payment: 11