JPH08125543A - Method/device for compressing digital signal and recording medium - Google Patents

Method/device for compressing digital signal and recording medium

Info

Publication number
JPH08125543A
JPH08125543A JP6265010A JP26501094A JPH08125543A JP H08125543 A JPH08125543 A JP H08125543A JP 6265010 A JP6265010 A JP 6265010A JP 26501094 A JP26501094 A JP 26501094A JP H08125543 A JPH08125543 A JP H08125543A
Authority
JP
Japan
Prior art keywords
digital signal
processing block
input signal
signal
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6265010A
Other languages
Japanese (ja)
Other versions
JP3334374B2 (en
Inventor
Hiroyuki Suzuki
浩之 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP26501094A priority Critical patent/JP3334374B2/en
Publication of JPH08125543A publication Critical patent/JPH08125543A/en
Application granted granted Critical
Publication of JP3334374B2 publication Critical patent/JP3334374B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

PURPOSE: To easily adjust a tone quality change on an auditory sense and noise or distortion by changing the characteristic of an input signal. CONSTITUTION: QMF 201 and 202 output signals independently have plural orthogonal conversion block sizes for respective bands. Circuits 201 to 208 decide the sizes and they are transmitted to MDCT circuits 203 to 205. MDCT coefficient data obtained by an MDCT processing are transmitted to variable filters 219 to 221, the characteristic of the MDCT coefficient is changed based on the coefficient transmitted from a variable filter decision circuit 222 and it is transmitted to adaptive bit allocation encoding circuits 210 to 212 and a bit distribution calculation circuit 209. The circuit 209 obtains the number of allocation bits for the respective bands, transmits it to the circuits 210 to 212 and transmits difference information between quantity which comes into question and a prescribed bit rate to the circuit 222. The circuit 222 calculates the lacking level of an S/N based on difference information, decides the filter coefficient and transmits it to the filters 217 to 221. The feedback operation is executed for plural times if need.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、ディジタルオーディオ
信号等をビット圧縮した圧縮データの記録再生、その圧
縮データが記録される記録媒体、及び、圧縮データの伝
送系に関し、特に、入力信号の時間軸上の波形の振幅変
化に応じて、その処理ブロックの時間的大きさを変化さ
せるような、ディジタル信号を情報圧縮して記録若しく
は伝送するディジタル信号圧縮方法及び装置、並びに記
録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to recording / reproduction of compressed data obtained by bit-compressing a digital audio signal or the like, a recording medium on which the compressed data is recorded, and a transmission system of the compressed data, and more particularly to the time of an input signal. The present invention relates to a digital signal compression method and device for compressing and recording or transmitting a digital signal, which changes the temporal size of a processing block according to the amplitude change of an on-axis waveform, and a recording medium.

【0002】[0002]

【従来の技術】本件出願人は、先に、入力されたディジ
タルオーディオ信号をビット圧縮し、所定のデータ量を
記録単位としてバースト的に記録するような技術を、例
えば特願平2−221364号、特願平2−22136
5号、特願平2−222821号、特願平2−2228
23号の各明細書及び図面等において提案している。
2. Description of the Related Art The applicant of the present application has previously proposed a technique for bit-compressing an input digital audio signal and recording it in bursts with a predetermined data amount as a recording unit, for example, Japanese Patent Application No. Hei 2-221364. , Japanese Patent Application No. 2-22136
No. 5, Japanese Patent Application No. 2-222821, Japanese Patent Application No. 2-2228
No. 23 specification, drawings, etc.

【0003】この技術は、記録媒体として光磁気ディス
クを用い、いわゆるCD−I(CD−インタラクティ
ブ)やCD−ROM XAのオーディオデータフォーマ
ットに規定されているAD(適応差分)PCMオーディ
オデータを記録再生するものであり、このADPCMデ
ータの例えば32セクタ分とインターリーブ処理のため
のリンキング用の数セクタとを記録単位として、光磁気
ディスクにバースト的に記録している。
This technique uses a magneto-optical disk as a recording medium, and records and reproduces AD (adaptive difference) PCM audio data defined in audio data formats of so-called CD-I (CD-interactive) and CD-ROM XA. For example, 32 sectors of this ADPCM data and several sectors for linking for interleave processing are recorded as a recording unit on the magneto-optical disk in a burst manner.

【0004】この光磁気ディスクを用いた記録再生装置
におけるADPCMオーディオにはいくつかのモードが
選択可能になっており、例えば通常のCDの再生時間に
比較して、2倍の圧縮率でサンプリング周波数が37.
8kHzのレベルA、4倍の圧縮率でサンプリング周波
数が37.8kHzのレベルB、8倍の圧縮率でサンプ
リング周波数が18.9kHzのレベルCが規定されて
いる。すなわち、例えば上記レベルBの場合には、ディ
ジタルオーディオデータが略々1/4に圧縮され、この
レベルBのモードで記録されたディスクの再生時間(プ
レイタイム)は、標準的なCDフォーマット(CD−D
Aフォーマット)の場合の4倍となる。これは、より小
型のディスクで標準12cmと同じ程度の記録再生時間
が得られることから、装置の小型化が図れることにな
る。
Several modes can be selected for the ADPCM audio in the recording / reproducing apparatus using this magneto-optical disk. For example, the sampling frequency is doubled as compared with the reproduction time of a normal CD. Is 37.
A level A of 8 kHz, a level B of a sampling frequency of 37.8 kHz at a compression rate of 4 times, and a level C of a sampling frequency of 18.9 kHz at a compression rate of 8 times are specified. That is, for example, in the case of the level B, the digital audio data is compressed to approximately 1/4, and the reproduction time (play time) of the disc recorded in the level B mode is the standard CD format (CD -D
It is four times that of A format). This means that the recording / reproducing time of the standard 12 cm can be obtained with a smaller disc, and the device can be miniaturized.

【0005】ただし、ディスクの回転速度は標準的なC
Dと同じであるため、例えば上記レベルBの場合、所定
時間当たりその4倍の再生時間分の圧縮データが得られ
ることになる。このため、例えばセクタやクラスタ等の
時間単位で同じ圧縮データを重複して4回読み出すよう
にし、そのうちの1回分の圧縮データのみをオーディオ
再生にまわすようにしている。具体的には、スパイラル
状の記録トラックを走査(トラッキング)する際に、1
回転毎に元のトラック位置に戻るようなトラックジャン
プを行って、同じトラックを4回ずつ繰り返しトラッキ
ングするような形態で再生動作を進めることになる。こ
れは、例えば4回の重複読み取りの内、少なくとも1回
だけ正常な圧縮データが得られればよいことになり、外
乱等によるエラーに強く、特に携帯用小型機器に適用し
て好ましいものである。
However, the rotation speed of the disk is standard C
Since it is the same as D, for example, in the case of the above level B, compressed data for a reproduction time that is four times that of the predetermined time is obtained. Therefore, for example, the same compressed data is read four times in a time unit such as a sector or a cluster, and only the compressed data for one time is sent to the audio reproduction. Specifically, when scanning (tracking) a spiral recording track,
A reproduction operation is performed in such a form that a track jump is performed to return to the original track position for each rotation, and the same track is repeatedly tracked four times. This means that normal compressed data only needs to be obtained at least once out of, for example, four times of redundant reading, is resistant to errors due to disturbances, etc., and is particularly preferable when applied to portable small devices.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、前述の
技術を用いた応用例の殆どの場合において、記録媒体や
伝送経路の都合上、使用可能なビットレートの上限が規
定される為、より多くのビットを割当る方が望ましい信
号、例えば、矩形波や多数の正弦波の合成信号の圧縮に
対し、ビット数が不足する場合が生じる。この際は、応
用例の要求される特性に応じた処理が行われることが一
般的である。使用可能なビットレートの上限が規定され
ていると言うことは、即ち、圧縮後の一定時間(処理ブ
ロック)内のエネルギ量の上限が規定されていることに
等しく、一定時間内における周波数幅或いは記録又は伝
送帯域と各周波数におけるS/Nの積が先の上限によっ
て制限されている事を示している。
However, in most cases of application using the above-mentioned technique, the upper limit of the usable bit rate is defined due to the circumstances of the recording medium and the transmission path, so that more There may be a case where the number of bits is insufficient for compression of a signal for which it is desirable to allocate bits, for example, a compression signal of a rectangular wave or a large number of sinusoidal waves. At this time, it is general to perform processing according to the required characteristics of the application example. The upper limit of the usable bit rate is defined, that is, the upper limit of the amount of energy in a fixed time (processing block) after compression is defined, and the frequency width or It shows that the product of the recording or transmission band and the S / N at each frequency is limited by the upper limit.

【0007】従って、上述のビット数が不足した場合の
処理は、通常の処理方法を取る限り、一定時間内におけ
る周波数幅或いは記録又は伝送帯域と各周波数における
S/Nの積が一定以下と言う条件下での処理となるた
め、必然的に、周波数幅を削減するか、各周波数におけ
るS/Nを削減するか、或いは、双方を削減するかに帰
着する。周波数幅を削減した場合、入力信号の音質に与
える影響が問題となり、各周波数におけるS/Nを削減
した場合は、発生したノイズ或いは歪みが聴感上の問題
となる可能性が高まる。以上のような問題を内在してい
るため、先のビット数が不足した場合の処理は、如何に
入力信号に適応させ、音質変化が目立たずに、ノイズ或
いは歪みが聴感上の問題とならない範囲に止めるとい
う、非常に難しい調整を余儀なくされる。この問題は、
使用可能なビットレートが低くなる程、大きな問題とな
り、ある値以下では、事実上、調整が不可能となり、通
常では、その値をもって当該圧縮手法の限界とされてい
る。
Therefore, in the processing when the number of bits is insufficient, the product of the frequency width or recording or transmission band within a certain time and the S / N at each frequency is less than a certain value as long as a normal processing method is adopted. Since the processing is performed under the conditions, it is inevitable that the frequency width is reduced, the S / N at each frequency is reduced, or both are reduced. When the frequency width is reduced, the influence on the sound quality of the input signal becomes a problem, and when the S / N at each frequency is reduced, the generated noise or distortion is more likely to cause a hearing problem. Since the above problems are inherent, the processing when the number of bits is insufficient is adapted to the input signal, the sound quality change is not noticeable, and the noise or distortion does not become a audible problem. It is a very difficult adjustment to stop at. This problem,
The lower the usable bit rate becomes, the larger the problem becomes, and below a certain value, adjustment becomes virtually impossible, and that value is usually regarded as the limit of the compression method.

【0008】本発明はこの様な実情に鑑みてなされたも
のであり、入力信号の特性を変化させることにより、聴
感上の音質変化、並びに、ノイズ或いは歪み問題を容易
に調整することが可能なビットの割当の手法が適用され
るディジタル信号圧縮方法及び装置、並びにその圧縮さ
れたデータが記録された記録媒体の提供を目的とするも
のである。
The present invention has been made in view of the above circumstances, and by changing the characteristics of the input signal, it is possible to easily adjust the sound quality change in hearing and the noise or distortion problem. An object of the present invention is to provide a digital signal compression method and apparatus to which a bit allocation method is applied, and a recording medium in which the compressed data is recorded.

【0009】[0009]

【課題を解決するための手段】本発明のディジタル信号
を情報圧縮するディジタル信号圧縮方法及び装置は、上
述の目的を達成するために提案されたものであり、許容
可能なノイズスペクトルを求め、上記求めた許容可能な
ノイズスペクトルを時間と周波数について細分化した小
ブロックに分配し、圧縮のためのビット割当を行い、規
定されたビット数と上記求めたビット割当数との差から
レベル差を求め、上記求めたレベル差を基にして入力信
号の特性を変化させることによるビット割当数の制御
を、必要に応じて複数回実行し、最適なビット配分を決
定することを特徴とするものである。
DISCLOSURE OF THE INVENTION A digital signal compression method and apparatus for information compression of a digital signal according to the present invention has been proposed in order to achieve the above-mentioned object. The calculated allowable noise spectrum is divided into small blocks that are subdivided in time and frequency, bit allocation is performed for compression, and the level difference is calculated from the difference between the specified number of bits and the calculated number of bit allocation. , The control of the number of bit allocation by changing the characteristics of the input signal based on the level difference obtained above is executed a plurality of times as necessary to determine the optimum bit allocation. .

【0010】また、本発明のディジタル信号圧縮方法及
び装置は、時間軸上のスペクトルデータを得、上記時間
軸上のスペクトルデータから許容可能なノイズスペクト
ルを求め、上記求めた許容可能なノイズスペクトルを時
間と周波数について細分化した小ブロックに分配し、圧
縮のためのビット割当を行い、規定されたビット数と上
記求めたビット割当数との差からレベル差を求め、上記
求めたレベル差を基に入力信号の周波数軸上のスペクト
ルデータの特性を変化させてビット割当数の制御を行う
ことも特徴とする。
The digital signal compression method and apparatus of the present invention obtains spectrum data on the time axis, obtains an allowable noise spectrum from the spectrum data on the time axis, and obtains the obtained acceptable noise spectrum. It is divided into small blocks that are subdivided in time and frequency, bit allocation is performed for compression, the level difference is calculated from the difference between the specified number of bits and the above-mentioned number of bit allocation, and the level difference calculated above is used as the basis. In addition, the characteristic of the spectrum data on the frequency axis of the input signal is changed to control the number of allocated bits.

【0011】さらに、本発明のディジタル信号圧縮方法
及び装置は、許容可能なノイズスペクトルを求め、上記
求めた許容ノイズスペクトルを時間と周波数について細
分化した小ブロックに分配し、圧縮のためのビット割当
を行い、規定されたビット数と上記求めたビット割当数
との差からレベル差を求め、上記レベル差を減少させる
フィルタ係数を求めて、当該フィルタ係数を基に入力信
号を時間軸上でフィルタリングすることによってビット
割当数の制御を行うことも特徴とする。このとき、帯域
分割フィルタにより入力信号を複数個の帯域に分割し、
当該帯域分割フィルタをビット割当数の制御を行うフィ
ルタと共用する。
Furthermore, the digital signal compression method and apparatus of the present invention obtains an allowable noise spectrum, distributes the obtained allowable noise spectrum into small blocks subdivided in time and frequency, and allocates bits for compression. The level difference is calculated from the difference between the specified number of bits and the calculated bit allocation number, the filter coefficient that reduces the level difference is calculated, and the input signal is filtered on the time axis based on the filter coefficient. It is also characterized in that the bit allocation number is controlled by doing so. At this time, the input signal is divided into a plurality of bands by the band division filter,
The band division filter is shared with the filter that controls the number of bit allocations.

【0012】ここで、本発明の各ディジタル信号圧縮方
法及び装置においては、入力信号の特性を変化させる為
の情報を複数処理ブロックに渡って遅延或いは記憶し、
時間的に前の処理ブロックの情報を用いて、上記入力信
号の特性を変化させる処理を行って、ビット割当数の制
御を行う。また、本発明の各ディジタル信号圧縮方法で
は、入力信号に適応してその処理ブロックの長さを可変
としており、このとき、当該処理ブロックの入力信号の
変化及び他の処理ブロックの入力信号の変化、及び/又
はパワー、或いはエネルギ又はピーク情報を基に、当該
処理ブロックの長さを決定すること、及び/又は、当該
処理ブロックの入力信号の変化及び時間的に処理ブロッ
クの最大より長い時間幅の入力信号により得られる入力
信号の変化情報を基に当該処理ブロックの長さを決定し
たり、入力信号に適応してその処理ブロックの長さを可
変とすることを行う。さらに、上記処理ブロック長の決
定の際には、処理ブロックの長さを決定する要素の決定
に関与する割合を、固定或いは入力信号に適応した割
合、及び/又は所定の割合(例えば2倍,4倍,8倍
等)で、併用若しくは単独に使用する。なお、入力信号
はオーディオ信号であり、少なくとも大部分の量子化雑
音の発生をコントロールするブロックの周波数幅を、高
域ほど広くしてゆくようにしている。
In each digital signal compression method and apparatus of the present invention, the information for changing the characteristics of the input signal is delayed or stored over a plurality of processing blocks,
By using the information of the processing block that is temporally previous, processing for changing the characteristics of the input signal is performed to control the number of allocated bits. Further, in each digital signal compression method of the present invention, the length of the processing block is made variable in accordance with the input signal. At this time, the change of the input signal of the processing block and the change of the input signal of the other processing block are changed. And / or determining the length of the processing block based on power or energy or peak information, and / or the change in the input signal of the processing block and the temporal width of the processing block that is longer than the maximum. Of the input signal, the length of the processing block is determined based on the change information of the input signal, and the length of the processing block is made variable according to the input signal. Furthermore, when determining the processing block length, the ratio involved in determining the element that determines the processing block length is fixed or adapted to the input signal, and / or a predetermined ratio (for example, double, 4 times, 8 times, etc.) and used in combination or alone. The input signal is an audio signal, and the frequency width of the block that controls the generation of at least most of the quantization noise is made wider in the higher frequencies.

【0013】また、本発明の各ディジタル信号圧縮方法
及び装置においては、直交変換を用いて、時間軸信号か
ら周波数軸上の複数の帯域への分割を行い、上記直交変
換における直交変換サイズの可変と共に当該直交変換時
に使用する窓関数の形状も変化させるようにしており、
上記時間軸信号から周波数軸上の複数の帯域への分割の
際には、先ず、上記時間軸信号を複数の帯域に分割し、
当該分割された帯域毎に複数のサンプルからなるブロッ
クを形成し、各帯域のブロック毎に直交変換を行い係数
データを得る。さらに、上記直交変換前の時間軸信号か
ら周波数軸上の複数の帯域への分割における分割周波数
幅を、略高域程広くし、上記分割周波数幅を最低域の連
続した2帯域で同一とする。また、上記ビット割当の際
には、略信号通過帯域以上の帯域の信号成分に対する圧
縮符号のメイン情報及び/又はサブ情報の割り当てを行
わないようにする。また、上記複数の帯域への分割には
クワドラチャ・ミラー・フィルタによる分割を行い、上
記直交変換としては変更離散コサイン変換を用いる。ま
たさらに,上記処理ブロックの入力信号の変化を基に処
理ブロックの時間的長さを決定する際には、その時間的
長さ決定のための所定の境界値を入力信号の振幅、周波
数に応じて可変とし、上記境界値は入力信号の振幅、周
波数に応じて複数の階段状の値をとる。また、上記処理
ブロック長の決定の際には、上記他の処理ブロックの信
号が前記処理ブロックの信号に及ぼす聴覚上の特性を、
周波数軸上のスペクトル及び/又は直交変換係数のエネ
ルギ及び/又はパワー又はピーク情報を用いて計算し
て、当該処理ブロックの時間的長さの決定を行うこと、
及び/又は、上記他の処理ブロックの信号が前記処理ブ
ロックの信号に及ぼす聴覚上の特性を計算する際に用い
る周波数軸上のスペクトル及び/又は直交変換係数を、
圧縮のためのビットの割当及び/又はブロックフローテ
ィングに用いる直交変換後の時間軸上のスペクトル及び
/又は直交変換係数と共用するようにしている。またさ
らに、上記処理ブロックの入力信号の変化を基に処理ブ
ロックの時間的長さを決定する際には、入力信号の周期
的変化、及び/又は繰り返しのパルス又は周期的特徴を
基にした判断を行う。
Further, in each digital signal compression method and apparatus of the present invention, orthogonal transform is used to divide the time axis signal into a plurality of bands on the frequency axis, and the orthogonal transform size in the orthogonal transform is changed. At the same time, the shape of the window function used at the time of the orthogonal transformation is also changed,
When dividing the time axis signal into a plurality of bands on the frequency axis, first, divide the time axis signal into a plurality of bands,
A block composed of a plurality of samples is formed for each of the divided bands, and orthogonal transformation is performed for each block of each band to obtain coefficient data. Further, the division frequency width in the division from the time axis signal before the orthogonal transformation into a plurality of bands on the frequency axis is made wider as it becomes higher, and the division frequency width is made the same in two continuous bands in the lowest area. . In addition, at the time of the bit allocation, the main information and / or the sub information of the compression code is not allocated to the signal component in the band substantially equal to or more than the signal pass band. Further, division into a plurality of bands is performed by a quadrature mirror filter, and modified orthogonal cosine transform is used as the orthogonal transformation. Furthermore, when determining the temporal length of the processing block based on the change of the input signal of the processing block, a predetermined boundary value for determining the temporal length is set according to the amplitude and frequency of the input signal. The boundary value takes a plurality of stepwise values according to the amplitude and frequency of the input signal. Further, in determining the processing block length, the auditory characteristics that the signal of the other processing block exerts on the signal of the processing block,
Calculating using the energy and / or power or peak information of the spectrum and / or orthogonal transform coefficients on the frequency axis to determine the temporal length of the processing block;
And / or a spectrum and / or an orthogonal transform coefficient on the frequency axis used when calculating the auditory characteristics that the signal of the other processing block exerts on the signal of the processing block,
Bits for compression and / or shared with the spectrum and / or orthogonal transform coefficient on the time axis after orthogonal transform used for block floating. Furthermore, when determining the temporal length of the processing block based on the change of the input signal of the processing block, the determination based on the periodic change of the input signal and / or the repeating pulse or the periodic characteristic. I do.

【0014】なお、本発明方法及び装置は、上記処理ブ
ロックの入力信号の変化を基にして処理ブロックの時間
的長さを決定する際に、上記境界値を入力信号の振幅、
周波数に応じて可変とする機能と、上記他の処理ブロッ
クの信号が前記処理ブロックの信号に及ぼす聴覚上の特
性を、周波数軸上のスペクトル及び/又は直交変換係数
のエネルギ及び/又はパワー又はピーク情報を用いて計
算して当該処理ブロックの時間的長さの決定を行う機能
を合わせ持つこともできる。
In the method and apparatus of the present invention, when determining the temporal length of the processing block based on the change of the input signal of the processing block, the boundary value is used as the amplitude of the input signal.
The function of making it variable according to the frequency and the auditory characteristic of the signal of the other processing block exerted on the signal of the processing block, the energy and / or power or peak of the spectrum on the frequency axis and / or the orthogonal transform coefficient. It is also possible to have a function of performing calculation using information and determining the temporal length of the processing block.

【0015】次に、本発明の記録媒体は、本発明の各デ
ィジタル信号圧縮方法又は装置によって圧縮した圧縮デ
ータを記録してなるものである。
Next, the recording medium of the present invention records the compressed data compressed by each digital signal compression method or device of the present invention.

【0016】また、本発明のディジタル信号圧縮方法又
は装置によって圧縮した圧縮データは、伝送媒体を介し
て伝送することも可能である。
The compressed data compressed by the digital signal compression method or apparatus of the present invention can be transmitted through a transmission medium.

【0017】すなわち、本発明に係るディジタル信号圧
縮方法及び装置(高能率符号化方法及び装置)は、ビッ
ト割当数の目標値と実際のビット配分数の差から、周波
数別に必要レベルを算出し、このレベルを基に入力信号
の特性を変化させることにより、ビット割当数の目標値
と実際のビット配分数の差を少なくすることで上述の問
題を解決する。
That is, the digital signal compression method and apparatus (high efficiency coding method and apparatus) according to the present invention calculates the required level for each frequency from the difference between the target value of the bit allocation number and the actual bit allocation number, By changing the characteristic of the input signal based on this level, the difference between the target value of the bit allocation number and the actual bit allocation number can be reduced to solve the above-mentioned problem.

【0018】ここで、入力信号の特性変化とビット配分
数の制御を必要に応じて、複数回実施するとより効果的
である。
Here, it is more effective to change the characteristics of the input signal and control the number of allocated bits a plurality of times as necessary.

【0019】さらには、周波数軸上のスペクトルデータ
を算出する手段を有する場合には、入力信号の特性を変
化させる際に、スペクトルデータを直接操作することに
よって、演算量の低減が図れる。また、周波数軸上での
フィルタ、例えば、等バンド分割フィルタ等を有する場
合には、入力信号の特性を変化させる作用を、先のフィ
ルタで実行することにより、演算量の低減を図ることも
可能である。
Further, in the case of having a means for calculating the spectrum data on the frequency axis, the amount of calculation can be reduced by directly operating the spectrum data when changing the characteristics of the input signal. When a filter on the frequency axis, such as an equal band division filter, is provided, it is possible to reduce the amount of calculation by executing the action of changing the characteristics of the input signal with the previous filter. Is.

【0020】[0020]

【作用】本発明のディジタル信号圧縮方法及び装置によ
れば、より多くのビット配分を必要とする入力信号に対
し、最適なエネルギ配分をもたらす特性操作を行うこと
により、ビット配分を行うことで聴覚的にも望ましいビ
ットの配分を実現できる。これにより、圧縮の効率の低
下を防ぐことができ、同一のビットレートにおいてはよ
り良好な音質を得ることができるようになり、又、同一
の音質においてはより低いビットレートでの記録、伝送
等を実現することが可能となる。
According to the digital signal compression method and apparatus of the present invention, the bit allocation is performed by performing the characteristic operation for the optimum energy allocation to the input signal which requires more bit allocation. The desired bit allocation can be realized. As a result, it is possible to prevent a decrease in compression efficiency, obtain better sound quality at the same bit rate, and record or transmit at a lower bit rate at the same sound quality. Can be realized.

【0021】[0021]

【実施例】先ず、図1には、本発明のディジタル信号圧
縮装置としての圧縮データ記録再生装置の一実施例の概
略構成を示す。
DESCRIPTION OF THE PREFERRED EMBODIMENTS First, FIG. 1 shows a schematic configuration of an embodiment of a compressed data recording / reproducing apparatus as a digital signal compressing apparatus of the present invention.

【0022】図1に示す圧縮データ記録再生装置におい
て、先ず記録媒体としては、スピンドルモータ51によ
り回転駆動される光磁気ディスク1が用いられる。光磁
気ディスク1に対するデータの記録時には、例えば光学
ヘッド53によりレーザ光を照射した状態で記録データ
に応じた変調磁界を磁気ヘッド54により印加すること
によって、いわゆる磁界変調記録を行い、光磁気ディス
ク1の記録トラックに沿ってデータを記録する。また再
生時には、光磁気ディススク1の記録トラックを光学ヘ
ッド53によりレーザ光でトレースして磁気光学的に再
生を行う。
In the compressed data recording / reproducing apparatus shown in FIG. 1, the magneto-optical disk 1 which is rotationally driven by the spindle motor 51 is used as the recording medium. When recording data on the magneto-optical disk 1, so-called magnetic field modulation recording is performed by applying a modulation magnetic field according to the recording data with the magnetic head 54 while irradiating the optical head 53 with laser light, for example. Data is recorded along the recording track of. During reproduction, the recording track of the magneto-optical disc 1 is traced with laser light by the optical head 53 to perform magneto-optical reproduction.

【0023】光学ヘッド53は、例えば、レーザダイオ
ード等のレーザ光源、コリメータレンズ、対物レンズ、
偏光ビームスプリッタ、シリンドリカルレンズ等の光学
部品及び所定パターンの受光部を有するフォトディテク
タ等から構成されている。この光学ヘッド53は、光磁
気ディスク1を介して上記磁気ヘッド54と対向する位
置に設けられている。光磁気ディスク1にデータを記録
するときには、後述する記録系のヘッド駆動回路66に
より磁気ヘッド54を駆動して記録データに応じた変調
磁界を印加すると共に、光学ヘッド53により光磁気デ
ィスク1の目的トラックにレーザ光を照射することによ
って、磁界変調方式により熱磁気記録を行う。またこの
光学ヘッド53は、目的トラックに照射したレーザ光の
反射光を検出し、例えばいわゆる非点収差法によりフォ
ーカスエラーを検出し、例えばいわゆるプッシュプル法
によりトラッキングエラーを検出する。光磁気ディスク
1からデータを再生するとき、光学ヘッド53は上記フ
ォーカスエラーやトラッキングエラーを検出すると同時
に、レーザ光の目的トラックからの反射光の偏光角(カ
ー回転角)の違いを検出して再生信号を生成する。
The optical head 53 includes, for example, a laser light source such as a laser diode, a collimator lens, an objective lens,
It is composed of a polarization beam splitter, an optical component such as a cylindrical lens, and a photodetector having a light receiving portion of a predetermined pattern. The optical head 53 is provided at a position facing the magnetic head 54 through the magneto-optical disk 1. When recording data on the magneto-optical disk 1, a magnetic head 54 is driven by a head driving circuit 66 of a recording system to be described later to apply a modulation magnetic field according to the recording data, and the optical head 53 is used for the purpose of the magneto-optical disk 1. By irradiating the track with laser light, thermomagnetic recording is performed by the magnetic field modulation method. The optical head 53 also detects the reflected light of the laser light applied to the target track, detects a focus error by, for example, a so-called astigmatism method, and detects a tracking error by, for example, a so-called push-pull method. When reproducing data from the magneto-optical disk 1, the optical head 53 detects the focus error and the tracking error, and at the same time, detects the difference in the polarization angle (Kerr rotation angle) of the reflected light of the laser light from the target track and reproduces it. Generate a signal.

【0024】光学ヘッド53の出力は、RF回路55に
供給される。このRF回路55は、光学ヘッド53の出
力から上記フォーカスエラー信号やトラッキングエラー
信号を抽出してサーボ制御回路56に供給するととも
に、再生信号を2値化して後述する再生系のデコーダ7
1に供給する。
The output of the optical head 53 is supplied to the RF circuit 55. The RF circuit 55 extracts the focus error signal and the tracking error signal from the output of the optical head 53 and supplies them to the servo control circuit 56, and binarizes the reproduction signal to reproduce the reproduction system decoder 7 described later.
Feed to 1.

【0025】サーボ制御回路56は、例えばフォーカス
サーボ制御回路やトラッキングサーボ制御回路、スピン
ドルモータサーボ制御回路、スレッドサーボ制御回路等
から構成される。上記フォーカスサーボ制御回路は、上
記フォーカスエラー信号がゼロになるように、光学ヘッ
ド53の光学系のフォーカス制御を行う。また上記トラ
ッキングサーボ制御回路は、上記トラッキングエラー信
号がゼロになるように光学ヘッド53の光学系のトラッ
キング制御を行う。さらに上記スピンドルモータサーボ
制御回路は、光磁気ディスク1を所定の回転速度(例え
ば一定線速度)で回転駆動するようにスピンドルモータ
51を制御する。また、上記スレッドサーボ制御回路
は、システムコントローラ57により指定される光磁気
ディスク1の目的トラック位置に光学ヘッド53及び磁
気ヘッド54を移動させる。このような各種制御動作を
行うサーボ制御回路56は、該サーボ制御回路56によ
り制御される各部の動作状態を示す情報をシステムコン
トローラ57に送る。
The servo control circuit 56 is composed of, for example, a focus servo control circuit, a tracking servo control circuit, a spindle motor servo control circuit, a sled servo control circuit, and the like. The focus servo control circuit controls the focus of the optical system of the optical head 53 so that the focus error signal becomes zero. Further, the tracking servo control circuit controls the tracking of the optical system of the optical head 53 so that the tracking error signal becomes zero. Further, the spindle motor servo control circuit controls the spindle motor 51 so as to rotate the magneto-optical disk 1 at a predetermined rotation speed (for example, a constant linear speed). Further, the sled servo control circuit moves the optical head 53 and the magnetic head 54 to the target track position of the magneto-optical disk 1 designated by the system controller 57. The servo control circuit 56 that performs such various control operations sends information indicating the operating state of each unit controlled by the servo control circuit 56 to the system controller 57.

【0026】システムコントローラ57にはキー入力操
作部58や表示部59が接続されている。このシステム
コントローラ57は、キー入力操作部58による操作入
力情報により指定される動作モードで記録系及び再生系
の制御を行う。またシステムコントローラ7は、光磁気
ディスク1の記録トラックからヘッダタイムやサブコー
ドのQデータ等により再生されるセクタ単位のアドレス
情報に基づいて、光学ヘッド53及び磁気ヘッド54が
トレースしている上記記録トラック上の記録位置や再生
位置を管理する。さらにシステムコントローラ57は、
データ圧縮率と上記記録トラック上の再生位置情報とに
基づいて表示部59に再生時間を表示させる制御を行
う。
A key input operation section 58 and a display section 59 are connected to the system controller 57. The system controller 57 controls the recording system and the reproducing system in the operation mode designated by the operation input information from the key input operation unit 58. The system controller 7 also records the above-mentioned recording traced by the optical head 53 and the magnetic head 54 on the basis of address information in sector units reproduced from the recording track of the magneto-optical disc 1 by the header time, sub-code Q data and the like. Manages the recording and playback positions on the track. Further, the system controller 57
Based on the data compression rate and the reproduction position information on the recording track, control is performed to display the reproduction time on the display unit 59.

【0027】この再生時間表示は、光磁気ディスク1の
記録トラックからいわゆるヘッダタイムやいわゆるサブ
コードQデータ等により再生されるセクタ単位のアドレ
ス情報(絶対時間情報)に対し、データ圧縮率の逆数
(例えば1/4圧縮のときには4)を乗算することによ
り、実際の時間情報を求め、これを表示部59に表示さ
せるものである。なお、記録時においても、例えば光磁
気ディスク等の記録トラックに予め絶対時間情報が記録
されている(プリフォーマットされている)場合に、こ
のプリフォーマットされた絶対時間情報を読み取ってデ
ータ圧縮率の逆数を乗算することにより、現在位置を実
際の記録時間で表示させることも可能である。
This reproduction time display is the reciprocal of the data compression rate (absolute time information) with respect to sector-based address information (absolute time information) reproduced from the recording track of the magneto-optical disk 1 by so-called header time or so-called sub-code Q data. For example, in the case of 1/4 compression, by multiplying 4), the actual time information is obtained and displayed on the display unit 59. Even at the time of recording, for example, when absolute time information is previously recorded (pre-formatted) on a recording track of a magneto-optical disk or the like, the pre-formatted absolute time information is read to determine the data compression rate. It is also possible to display the current position at the actual recording time by multiplying by the reciprocal.

【0028】次にこのディスク記録再生装置の記録系に
おいて、入力端子60からのアナログオーディオ入力信
号AINがローパスフィルタ61を介してA/D変換器6
2に供給され、このA/D変換器62は上記アナログオ
ーディオ入力信号AINを量子化する。A/D変換器62
から得られたディジタルオーディオ信号は、ATC(Ad
aptive Transform Coding )PCMエンコーダ63に供
給される。また、入力端子67からのディジタルオーデ
ィオ入力信号DINがディジタル入力インターフェース回
路68を介してATCエンコーダ63に供給される。A
TCエンコーダ63は、上記入力信号AINを上記A/D
変換器62により量子化した所定転送速度のディジタル
オーディオPCMデータについて、ビット圧縮(データ
圧縮)処理を行う。ここではその圧縮率を4倍として説
明するが、本実施例はこの倍率には依存しない構成とな
っており、応用例により任意に選択が可能である。
Next, in the recording system of this disk recording / reproducing apparatus, the analog audio input signal AIN from the input terminal 60 is passed through the low-pass filter 61 to the A / D converter 6
2 and the A / D converter 62 quantizes the analog audio input signal AIN. A / D converter 62
The digital audio signal obtained from the ATC (Ad
aptive Transform Coding) The PCM encoder 63 is supplied. Further, the digital audio input signal DIN from the input terminal 67 is supplied to the ATC encoder 63 via the digital input interface circuit 68. A
The TC encoder 63 sends the input signal AIN to the A / D
Bit compression (data compression) processing is performed on the digital audio PCM data quantized by the converter 62 and having a predetermined transfer rate. Although the compression rate will be described as 4 times here, the present embodiment has a configuration that does not depend on this magnification and can be arbitrarily selected depending on the application example.

【0029】次にメモリ64は、データの書き込み及び
読み出しがシステムコントローラ57により制御され、
ATCエンコーダ63から供給されるATCデータを一
時的に記憶しておき、必要に応じてディスク上に記録す
るためのバッファメモリとして用いられている。すなわ
ち、例えばATCエンコーダ63から供給される圧縮オ
ーディオデータは、そのデータ転送速度が、標準的なC
D−DAフォーマットのデータ転送速度(75セクタ/
秒)の1/4、すなわち18.75セクタ/秒に低減さ
れており、この圧縮データがメモリ14に連続的に書き
込まれる。この圧縮データ(ATCデータ)は、前述し
たように4セクタにつき1セクタの記録を行えば足りる
が、このような4セクタおきの記録は事実上不可能に近
いため、後述するようなセクタ連続の記録を行うように
している。この記録は、休止期間を介して、所定の複数
セクタ(例えば32セクタ+数セクタ)から成るクラス
タを記録単位として、標準的なCD−DAフォーマット
と同じデータ転送速度(75セクタ/秒)でバースト的
に行われる。すなわちメモリ14においては、上記ビッ
ト圧縮レートに応じた18.75(=75/4)セクタ
/秒の低い転送速度で連続的に書き込まれたATCオー
ディオデータが、記録データとして上記75セクタ/秒
の転送速度でバースト的に読み出される。この読み出さ
れて記録されるデータについて、記録休止期間を含む全
体的なデータ転送速度は、上記18.75セクタ/秒の
低い速度となっているが、バースト的に行われる記録動
作の時間内での瞬時的なデータ転送速度は上記標準的な
75セクタ/秒となっている。従って、ディスク回転速
度が標準的なCD−DAフォーマットと同じ速度(一定
線速度)のとき、該CD−DAフォーマットと同じ記録
密度、記憶パターンの記録が行われることになる。
Next, in the memory 64, writing and reading of data are controlled by the system controller 57,
It is used as a buffer memory for temporarily storing ATC data supplied from the ATC encoder 63 and recording the ATC data on a disk as needed. That is, for example, the compressed audio data supplied from the ATC encoder 63 has a standard C data transfer rate.
Data transfer rate of D-DA format (75 sectors /
1/4 of the second), that is, 18.75 sectors / second, and this compressed data is continuously written in the memory 14. As for this compressed data (ATC data), it is sufficient to record one sector for every four sectors as described above. However, since recording every four sectors is practically impossible, the continuous sectors described below will be used. I try to keep a record. This recording bursts at a data transfer rate (75 sectors / second) same as that of the standard CD-DA format by using a cluster composed of a plurality of predetermined sectors (for example, 32 sectors + several sectors) as a recording unit through a pause period. Is done in a regular manner. That is, in the memory 14, ATC audio data continuously written at a low transfer rate of 18.75 (= 75/4) sectors / second corresponding to the bit compression rate is recorded as the recording data of 75 sectors / second. It is read in bursts at the transfer rate. The overall data transfer rate of the read and recorded data, including the recording pause period, is as low as 18.75 sectors / sec, but within the time of the recording operation performed in bursts. The instantaneous data transfer rate in the above is the standard 75 sectors / sec. Therefore, when the disc rotation speed is the same as the standard CD-DA format (constant linear velocity), the same recording density and storage pattern as those of the CD-DA format are recorded.

【0030】メモリ64から上記75セクタ/秒の(瞬
時的な)転送速度でバースト的に読み出されたATCオ
ーディオデータすなわち記録データは、エンコーダ65
に供給される。ここで、メモリ64からエンコーダ65
に供給されるデータ列において、1回の記録で連続記録
される単位は、複数セクタ(例えば32セクタ)から成
るクラスタ及び該クラスタの前後位置に配されたクラス
タ接続用の数セクタとしている。このクラスタ接続用セ
クタは、エンコーダ65でのインターリーブ長より長く
設定しており、インターリーブされても他のクラスタの
データに影響を与えないようにしている。
The ATC audio data, that is, the recording data, which is burst-read out from the memory 64 at the (instantaneous) transfer rate of 75 sectors / second, is encoded by the encoder 65.
Is supplied to. Here, from the memory 64 to the encoder 65
In the data string supplied to the above, the unit to be continuously recorded in one recording is a cluster composed of a plurality of sectors (for example, 32 sectors) and several sectors for cluster connection arranged at the front and rear positions of the cluster. This cluster connection sector is set to be longer than the interleave length in the encoder 65 so that interleaved data will not affect the data of other clusters.

【0031】エンコーダ65は、メモリ64から上述し
たようにバースト的に供給される記録データについて、
エラー訂正のための符号化処理(パリティ付加及びイン
ターリーブ処理)やEFM符号化処理などを施す。この
エンコーダ65による符号化処理の施された記録データ
が磁気ヘッド駆動回路66に供給される。この磁気ヘッ
ド駆動回路66は、磁気ヘッド54が接続されており、
上記記録データに応じた変調磁界を光磁気ディスク1に
印加するように磁気ヘッド54を駆動する。
The encoder 65 uses the recording data supplied from the memory 64 in bursts as described above.
Encoding processing for error correction (parity addition and interleave processing), EFM encoding processing, and the like are performed. The recording data encoded by the encoder 65 is supplied to the magnetic head drive circuit 66. The magnetic head drive circuit 66 is connected to the magnetic head 54,
The magnetic head 54 is driven so as to apply the modulation magnetic field according to the recording data to the magneto-optical disk 1.

【0032】また、システムコントローラ57は、メモ
リ64に対する上述の如きメモリ制御を行うとともに、
このメモリ制御によりメモリ64からバースト的に読み
出される上記記録データを光磁気ディスク2の記録トラ
ックに連続的に記録するように記録位置の制御を行う。
この記録位置の制御は、システムコントローラ57によ
りメモリ64からバースト的に読み出される上記記録デ
ータの記録位置を管理して、光磁気ディスク1の記録ト
ラック上の記録位置を指定する制御信号をサーボ制御回
路56に供給することによって行われる。
Further, the system controller 57 performs the memory control as described above on the memory 64, and
By this memory control, the recording position is controlled so that the recording data read out in burst from the memory 64 is continuously recorded on the recording track of the magneto-optical disk 2.
The recording position is controlled by controlling the recording position of the recording data which is burst-read from the memory 64 by the system controller 57 and outputting a control signal for designating the recording position on the recording track of the magneto-optical disk 1 to the servo control circuit. By feeding 56.

【0033】次に、この光磁気ディスクの記録再生装置
の再生系について説明する。この再生系は、上述の記録
系により光磁気ディスク1の記録トラック上に連続的に
記録された記録データを再生するためのものであり、光
学ヘッド53によって光磁気ディスク1の記録トラック
をレーザ光でトレースすることにより得られる再生出力
がRF回路55により2値化されて供給されるデコーダ
71を備えている。この時光磁気ディスクのみではな
く、コンパクトディクス(CD:COMPACT DISC)と同じ
再生専用光ディスクの読み出しも行うことができる。
Next, the reproducing system of the recording / reproducing apparatus for this magneto-optical disk will be described. This reproducing system is for reproducing the record data continuously recorded on the recording track of the magneto-optical disk 1 by the above-mentioned recording system, and the recording track of the magneto-optical disk 1 is irradiated with the laser beam by the optical head 53. The decoder 71 is provided with which the reproduction output obtained by tracing at (1) is binarized by the RF circuit 55 and supplied. At this time, not only the magneto-optical disk but also the read-only optical disk same as the compact disk (CD: COMPACT DISC) can be read.

【0034】デコーダ71は、上述の記録系におけるエ
ンコーダ65に対応するものであって、RF回路55に
より2値化された再生出力について、エラー訂正のため
の上述の如き復号化処理やEFM復号化処理などの処理
を行いオーディオデータを、正規の転送速度よりも早い
75セクタ/秒の転送速度で再生する。このデコーダ7
1により得られる再生データは、メモリ72に供給され
る。
The decoder 71 corresponds to the encoder 65 in the above-mentioned recording system, and performs the above-mentioned decoding processing for error correction and EFM decoding on the reproduction output binarized by the RF circuit 55. By performing processing such as processing, the audio data is reproduced at a transfer rate of 75 sectors / second, which is faster than the normal transfer rate. This decoder 7
The reproduction data obtained by 1 is supplied to the memory 72.

【0035】メモリ72は、データの書き込み及び読み
出しがシステムコントローラ57により制御され、デコ
ーダ71から75セクタ/秒の転送速度で供給される再
生データがその75セクタ/秒の転送速度でバースト的
に書き込まれる。また、このメモリ72は、上記75セ
クタ/秒の転送速度でバースト的に書き込まれた上記再
生データが正規の75セクタ/秒の転送速度18.75
セクタ/秒で連続的に読み出される。
In the memory 72, writing and reading of data are controlled by the system controller 57, and reproduced data supplied from the decoder 71 at a transfer rate of 75 sectors / second is written in bursts at the transfer rate of 75 sectors / second. Be done. Further, in the memory 72, the reproduction data written in a burst at the transfer rate of 75 sectors / sec is a regular transfer rate of 75 sectors / sec of 18.75.
It is read continuously at sectors / second.

【0036】システムコントローラ57は、再生データ
をメモリ72に75セクタ/秒の転送速度で書き込むと
ともに、メモリ72から上記再生データを上記18.7
5セクタ/秒の転送速度で連続的に読み出すようなメモ
リ制御を行う。また、システムコントローラ57は、メ
モリ72に対する上述の如きメモリ制御を行うととも
に、このメモリ制御によりメモリ72からバースト的に
書き込まれる上記再生データを光磁気ディスク1の記録
トラックから連続的に再生するように再生位置の制御を
行う。この再生位置の制御は、システムコントローラ5
7によりメモリ72からバースト的に読み出される上記
再生データの再生位置を管理して、光磁気ディスク1も
しくは光ディスク1の記録トラック上の再生位置を指定
する制御信号をサーボ制御回路56に供給することによ
って行われる。
The system controller 57 writes the reproduction data in the memory 72 at a transfer rate of 75 sectors / second, and at the same time, reproduces the reproduction data from the memory 72 in the above 18.7.
Memory control is performed so that data is continuously read at a transfer rate of 5 sectors / second. Further, the system controller 57 performs the above-mentioned memory control on the memory 72 and continuously reproduces the above-mentioned reproduction data written in burst from the memory 72 from the recording track of the magneto-optical disc 1 by this memory control. Controls the playback position. This playback position is controlled by the system controller 5
By controlling the reproduction position of the reproduction data read out from the memory 72 in burst by 7 and supplying the servo control circuit 56 with a control signal designating the reproduction position on the recording track of the magneto-optical disk 1 or the optical disk 1. Done.

【0037】メモリ72から18.75セクタ/秒の転
送速度で連続的に読み出された再生データとして得られ
るATCオーディオデータは、ATCデコーダ73に供
給される。このATCデコーダ73は、ATCデータを
4倍にデータ伸張(ビット伸張)することで16ビット
のディジタルオーディオデータを再生する。このATC
デコーダ73からのディジタルオーディオデータは、D
/A変換器74に供給される。
ATC audio data obtained as reproduction data continuously read from the memory 72 at a transfer rate of 18.75 sectors / second is supplied to the ATC decoder 73. The ATC decoder 73 reproduces 16-bit digital audio data by expanding the ATC data four times (bit expanding). This ATC
The digital audio data from the decoder 73 is D
It is supplied to the / A converter 74.

【0038】D/A変換器74は、ATCデコーダ73
から供給されるディジタルオーディオデータをアナログ
信号に変換して、アナログオーディオ出力信号AOUT を
形成する。このD/A変換器74により得られるアナロ
グオーデイオ信号AOUT は、ローパスフィルタ75を介
して出力端子76から出力される。
The D / A converter 74 is the ATC decoder 73.
The digital audio data supplied from the converter is converted into an analog signal to form an analog audio output signal AOUT. The analog audio signal AOUT obtained by the D / A converter 74 is output from the output terminal 76 via the low pass filter 75.

【0039】次に本実施例装置におけるデータ圧縮に使
用される高能率圧縮符号化について詳述する。すなわ
ち、オーディオPCM信号等の入力ディジタル信号を、
帯域分割符号化(SBC)、適応変換符号化(ATC)
及び適応ビット割当ての各技術を用いて高能率符号化す
る技術について、図2以降を参照しながら説明する。
Next, the high-efficiency compression encoding used for data compression in the apparatus of this embodiment will be described in detail. That is, an input digital signal such as an audio PCM signal is
Band division coding (SBC), adaptive transform coding (ATC)
A technique for high-efficiency coding using each technique of adaptive bit allocation and adaptive bit allocation will be described with reference to FIG.

【0040】図2並びに図3に示す具体的な高能率符号
化装置では、入力ディジタル信号を複数の周波数帯域に
分割すると共に、最低域の隣接した2帯域の帯域幅は同
じで、より高い周波数帯域では高い周波数帯域ほどバン
ド幅を広く選定し、各周波数帯域毎に直交変換を行っ
て、得られた周波数軸のスペクトルデータを、低域で
は、後述する人間の聴覚特性を考慮したいわゆる臨界帯
域幅(クリティカルバンド)毎に、中高域ではブロック
フローティング効率を考慮して臨界帯域幅を細分化した
帯域毎に、適応的にビット割当して符号化している。通
常このブロックが量子化雑音発生ブロックとなる。さら
に、本発明実施例においては、直交変換の前に入力信号
に応じて適応的にブロックサイズ(処理ブロック長)を
変化させると共に、該ブロック単位でフローティング処
理を行っている。
In the concrete high-efficiency coding apparatus shown in FIGS. 2 and 3, the input digital signal is divided into a plurality of frequency bands, and the lowest two adjacent bands have the same bandwidth, so that a higher frequency band is obtained. In the band, the higher the frequency band is, the wider the bandwidth is selected, and the orthogonal transform is performed for each frequency band. For each width (critical band), bits are adaptively allocated and coded for each band in which the critical bandwidth is subdivided in consideration of block floating efficiency in the middle and high frequencies. Normally, this block is the quantization noise generation block. Further, in the embodiment of the present invention, the block size (processing block length) is adaptively changed according to the input signal before the orthogonal transformation, and the floating process is performed in the block unit.

【0041】即ち、図2において、入力端子200には
例えばサンプリング周波数が44.1kHzの時、0〜
22kHzのオーディオPCM信号が供給されている。
この入力信号は、例えばいわゆるQMF等のフィルタか
らなる帯域分割フィルタ201により0〜11kHz帯
域と11kHz〜22kHz帯域とに分割され、0〜1
1kHz帯域の信号は同じくいわゆるQMFの帯域分割
フィルタ202により0〜5.5kHz帯域と5.5k
Hz〜11kHz帯域とに分割される。帯域分割フィル
タ201からの11kHz〜22kHz帯域の信号は直
交変換回路の一例であるMDCT回路203に送られ、
帯域分割フィルタ202からの5. 5kHz〜11kH
z帯域の信号はMDCT回路204に送られ、帯域分割
フィルタ202からの0〜5.5kHz域の信号はMD
CT回路205に送られることにより、それぞれMDC
T処理される。
That is, in FIG. 2, for example, when the sampling frequency is 44.1 kHz, 0 to 0 is input to the input terminal 200.
A 22 kHz audio PCM signal is supplied.
This input signal is divided into a band of 0 to 11 kHz and a band of 11 to 22 kHz by a band dividing filter 201 including a filter such as so-called QMF, and 0 to 1 is divided.
A signal in the 1 kHz band is also processed by a so-called QMF band-dividing filter 202 in the 0-5.5 kHz band and the 5.5 kHz band.
Hz to 11 kHz band. The signal of 11 kHz-22 kHz band from the band division filter 201 is sent to the MDCT circuit 203 which is an example of an orthogonal transformation circuit,
5.5 kHz to 11 kHz from the band division filter 202
The z band signal is sent to the MDCT circuit 204, and the 0 to 5.5 kHz band signal from the band division filter 202 is MD.
By being sent to the CT circuit 205, each MDC
T processed.

【0042】ここで、上述した入力ディジタル信号を複
数の周波数帯域に分割する手法の一例としてのQMFの
フィルタは、例えば文献「ディジタル・コーディング・
オブ・スピーチ・イン・サブバンズ」("Digital coding
of speech in subbands" R.E.Crochiere, Bell Syst.
Tech. J., Vol.55,No.8 1976) に述べられている。この
QMFのフィルタは、帯域を等バンド幅に2分割するも
のであり、当該フィルタにおいては上記分割した帯域を
後に合成する際にいわゆるエリアシングが発生しないこ
とが特徴となっている。
Here, a QMF filter as an example of a method of dividing the above-mentioned input digital signal into a plurality of frequency bands is described in, for example, the document "Digital Coding."
Of Speech in Subvans "(" Digital coding
of speech in subbands "RE Crochiere, Bell Syst.
Tech. J., Vol.55, No.8 1976). This QMF filter divides the band into two equal bandwidths, and is characterized in that so-called aliasing does not occur when the divided bands are combined later.

【0043】また、文献「ポリフェイズ・クァドラチュ
ア・フィルターズ −新しい帯域分割符号化技術」("Po
lyphase Quadrature filters -A new subband coding t
echnique", Joseph H. Rothweiler ICASSP 83, BOSTON)
には、等帯域幅のフィルタ分割手法が述べられている。
このポリフェイズ・クァドラチュア・フィルタにおいて
は、信号を等バンド幅の複数の帯域に分割する際に一度
に分割できることが特徴となっている。
In addition, the document "Polyphase Quadrature Filters-New Band Division Coding Technique"("Po
lyphase Quadrature filters -A new subband coding t
echnique ", Joseph H. Rothweiler ICASSP 83, BOSTON)
Describes an equal bandwidth filter partitioning technique.
This polyphase quadrature filter is characterized in that when a signal is divided into a plurality of bands of equal bandwidth, it can be divided at one time.

【0044】さらに、上述した直交変換としては、例え
ば、入力オーディオ信号を所定単位時間(フレーム)で
ブロック化し、当該ブロック毎に高速フーリエ変換(F
FT)、離散コサイン変換(DCT)、モディファイド
DCT変換(MDCT)などを行うことで時間軸を周波
数軸に変換するような直交変換がある。このMDCTに
ついては、文献「時間領域エリアシング・キャンセルを
基礎とするフィルタ・バンク設計を用いたサブバンド/
変換符号化」("Subband/Transform Coding Using Filte
r Bank Designs Based on Time Domain Aliasing Cance
llation," J.P.Princen A.B.Bradley, Univ. of Surrey
Royal Melbourne Inst. of Tech. ICASSP 1987)に述べ
られている。
Further, as the above-mentioned orthogonal transform, for example, the input audio signal is divided into blocks in a predetermined unit time (frame), and the fast Fourier transform (F
FT), Discrete Cosine Transform (DCT), Modified DCT Transform (MDCT), etc. are used to convert the time axis into the frequency axis. For this MDCT, refer to the document "Subbands Using Filter Bank Design Based on Time Domain Aliasing Cancellation".
Transform Coding Using Filte
r Bank Designs Based on Time Domain Aliasing Cance
llation, "JPPrincen ABBradley, Univ. of Surrey
Royal Melbourne Inst. Of Tech. ICASSP 1987).

【0045】ここで、各MDCT回路203〜205に
供給する各帯域毎の処理ブロックについての標準的な入
力信号に対する具体例を図4に示す。この図4の具体例
においては、3つのフィルタ出力信号は、各帯域毎に独
立に各々複数の直交変換ブロックサイズを持ち、信号の
時間特性、周波数分布等により時間分解能を切り換えら
れる様にしている。信号が時間的に準定常的である場合
には、直交変換ブロックサイズを11.6mS、即ち、
図4の(A)に示すロングモード(LongMode)
と大きくし、信号が非定常的である場合には、直交変換
ブロックサイズを更に2分割、4分割とする。図4の
(B)に示すショートモード(Short Mode)
のごとく、全てを4分割で2.9mSとする場合や、図
4の(C)に示すミドルモード A(Middle M
ode A)、図4の(D)に示すミドルモード B
(Middle Mode B)のごとく、一部を2分
割で5.8ms、1部を4分割で2.9msの時間分解
能とすることで、実際の複雑な入力信号に適応するよう
になっている。この直交変換ブロックサイズの分割は処
理装置の規模が許せば、さらに複雑な分割を行うと、よ
り効果的なことは明白である。このブロックサイズの決
定は図2のブロックサイズ決定回路206〜208で決
定され、各MDCT回路203〜205に伝えられると
ともに、該当ブロックのブロックサイズ情報として出力
端子216〜218より出力される。
FIG. 4 shows a specific example of a standard input signal for the processing blocks for each band supplied to the MDCT circuits 203 to 205. In the specific example of FIG. 4, the three filter output signals have a plurality of orthogonal transform block sizes independently for each band, and the time resolution can be switched depending on the time characteristic of the signal, frequency distribution, and the like. .. If the signal is quasi-stationary in time, then the orthogonal transform block size is 11.6 mS, or
Long mode (Long Mode) shown in FIG.
If the signal is non-stationary, the orthogonal transform block size is further divided into two and four. Short mode shown in FIG. 4B.
As shown in FIG. 4C, when all are divided into 4 to obtain 2.9 mS, or when the middle mode A (Middle M
mode A), middle mode B shown in FIG.
As shown in (Middle Mode B), a part of the time division has a time resolution of 5.8 ms and a part has a time resolution of 2.9 ms by four divisions to adapt to an actual complicated input signal. It is apparent that the division of the orthogonal transform block size is more effective if the division is made more complicated if the scale of the processing device permits. The block size is determined by the block size determination circuits 206 to 208 shown in FIG. 2, transmitted to the MDCT circuits 203 to 205, and output from the output terminals 216 to 218 as block size information of the corresponding block.

【0046】次に、ブロックサイズ決定回路の詳細を図
5に示す。ここでは図2のブロック決定回路206を例
に説明する。図2の帯域分割フィルタ201の出力のう
ち、11kHz〜22kHzの出力は図5の入力端子4
01を介してパワー算出回路404に送られる。さら
に、図2の帯域分割フィルタ202の出力のうち、5.
5kHz〜11kHzの出力は図5における入力端子4
02を介してパワー算出回路405へ、0〜5.5kH
zの出力は図5における入力端子403を介してパワー
算出回路406へとそれぞれ送られる。また、図2のブ
ロックサイズ決定回路207、208は図5における入
力端子401〜403へ入力される信号がブロックサイ
ズ決定回路206の場合と異なるだけで、動作は同一で
ある。各ブロックサイズ決定回路206〜208におけ
るそれぞれの入力端子401〜403はマトリクス構成
となっており、即ち、ブロックサイズ決定回路207の
入力端子401には図2の帯域分割フィルタ202の
5.5kHz〜11kHzの出力が接続されており、同
入力端子402には0〜5.5kHzの出力が接続され
ている。ブロックサイズ決定回路208についても、同
様である。
Next, details of the block size determination circuit are shown in FIG. Here, the block determination circuit 206 of FIG. 2 will be described as an example. Of the outputs of the band division filter 201 of FIG. 2, the output of 11 kHz to 22 kHz is the input terminal 4 of FIG.
01 to the power calculation circuit 404. Furthermore, among the outputs of the band division filter 202 of FIG.
The output of 5 kHz to 11 kHz is the input terminal 4 in FIG.
0 to 5.5 kH to the power calculation circuit 405 via 02.
The output of z is sent to the power calculation circuit 406 via the input terminal 403 in FIG. Further, the block size determination circuits 207 and 208 in FIG. 2 are the same in operation except that the signals input to the input terminals 401 to 403 in FIG. 5 are different from those in the block size determination circuit 206. The input terminals 401 to 403 of the block size determination circuits 206 to 208 have a matrix configuration, that is, the input terminal 401 of the block size determination circuit 207 has 5.5 kHz to 11 kHz of the band division filter 202 of FIG. The output of 0 to 5.5 kHz is connected to the input terminal 402. The same applies to the block size determination circuit 208.

【0047】図5において、各パワー算出回路404〜
406は入力された時間波形を一定時間、積分すること
によって、各周波数帯域のパワーを求めている。この
際、積分する時間幅は上述の直交変換ブロックサイズの
うち、最小時間ブロック以下である必要がある。また、
上述の算出法以外、例えば直交変換ブロックサイズの最
小時間幅内の最大振幅の絶対値あるいは振幅の平均値を
代表パワーとして用いても同様の効果が得られる。パワ
ー算出回路404の出力は変化分抽出回路408及びパ
ワー比較回路409に、パワー算出回路405、406
の出力はパワー比較回路409にそれぞれ送られる。変
化分抽出回路408ではパワー算出回路404より送ら
れたパワーの微係数を求めてパワーの変化情報として、
ブロックサイズ1次決定回路410及びメモリ407へ
送る。メモリ407では、変化分抽出回路408より送
られたパワーの変化情報を上述の直交変換ブロックサイ
ズの最大時間以上、蓄積する。これは時間的に隣接する
直交変換ブロックが直交変換の際のウィンドウ処理によ
り、互いに影響を与え合うため、時間的に隣接する1つ
前のブロックのパワー変化情報をブロックサイズ1次決
定回路410において必要とするためである。ブロック
サイズ1次決定回路410では変化分抽出回路408よ
り送られた該当ブロックのパワー変化情報とメモリ40
7より送られた時間的に隣接する該当ブロックの1つ前
のブロックのパワー変化情報をもとに、該当する周波数
帯域内のパワーの時間的変位から該当する周波数帯域の
直交変換ブロックサイズを決定する。この際、一定以上
の変位が認められた場合、より時間的に短い直交変換ブ
ロックイサイズを選択するわけであるが、その変位点
(所定の境界値)は固定でも効果は得られる。さらに周
波数に比例した値、即ち、周波数が高い場合は大きな変
位によって時間的に短いブロックサイズとなり、周波数
が低い場合は、高い場合のそれに比べ小さな変位で時間
的に短いブロックサイズに決定されると、より効果的で
ある。この値(境界値)はなめらかに変化することが望
ましいが、複数段階の階段状の変化であっても、構わな
い。以上のように決定されたブロックサイズはブロック
サイズ修正回路411へ伝送される。
In FIG. 5, each power calculation circuit 404-
406 obtains the power of each frequency band by integrating the input time waveform for a fixed time. At this time, the integration time width needs to be equal to or smaller than the minimum time block of the above orthogonal transform block sizes. Also,
Other than the above calculation method, the same effect can be obtained by using the absolute value of the maximum amplitude or the average value of the amplitudes within the minimum time width of the orthogonal transform block size as the representative power. The output of the power calculation circuit 404 is supplied to the change amount extraction circuit 408 and the power comparison circuit 409, and the power calculation circuits 405 and 406.
The output of each of these is sent to the power comparison circuit 409. In the change extraction circuit 408, the differential coefficient of the power sent from the power calculation circuit 404 is obtained, and as the power change information,
It is sent to the block size primary determination circuit 410 and the memory 407. In the memory 407, the power change information sent from the change extraction circuit 408 is accumulated for the maximum time of the above orthogonal transform block size or more. This is because the orthogonally adjacent orthogonal transform blocks influence each other by the window processing at the time of orthogonal transform, so that the power change information of the immediately preceding block temporally adjacent to each other is obtained in the block size primary determination circuit 410. This is because it is necessary. In the block size primary determination circuit 410, the power variation information of the corresponding block sent from the variation extraction circuit 408 and the memory 40.
Based on the power change information of the block immediately before the corresponding block that is temporally adjacent to the block, the orthogonal transform block size of the corresponding frequency band is determined from the temporal displacement of the power in the corresponding frequency band. To do. At this time, when a displacement equal to or more than a certain amount is recognized, the orthogonal transform block size is selected in a shorter time, but the effect can be obtained even if the displacement point (predetermined boundary value) is fixed. Furthermore, a value proportional to the frequency, that is, when the frequency is high, a large displacement causes a short block size in time, and when the frequency is low, a small displacement causes a small displacement in a block size to be temporally determined. , More effective. It is desirable that this value (boundary value) change smoothly, but it may be a stepwise change in a plurality of steps. The block size determined as described above is transmitted to the block size correction circuit 411.

【0048】一方、パワー比較回路409において、各
パワー算出回路404〜406より送られた各周波数帯
域のパワー情報を同時刻及び時間軸上でマスキング効果
の発生する時間幅で比較を行い、パワー算出回路404
の出力周波数帯域に及ぼす他の周波数帯域の影響を求
め、ブロックサイズ修正回路411へ伝送する。ブロッ
クサイズ修正回路411ではパワー比較回路409より
送られたマスキング情報及びディレイ群のディレイ41
2〜414の各タップから送られた過去のブロックサイ
ズ情報を基に、ブロックサイズ1次決定回路410より
送られたブロックサイズをより時間的に長いブロックサ
イズを選択するよう修正をかけ、ディレイ412及びウ
ィンドウ形状決定回路415へ出力している。ブロック
サイズ修正回路411における作用は、該当周波数帯域
においてプリエコーが問題となる場合でも、他の周波数
帯域、特に該当周波数帯域より低い帯域において、大き
な振幅を持つ信号が存在した場合、そのマスキング効果
により、プリエコーが聴感上問題とならない、或いは問
題が軽減される場合があるという特性を利用している。
なお、上記マスキングとは、人間の聴覚上の特性によ
り、ある信号によって他の信号がマスクされて聞こえな
くなる現象をいうものであり、このマスキング効果に
は、時間軸上のオーデイオ信号による時間軸マスキング
効果と、周波数軸上の信号による同時刻マスキング効果
とがある。これらのマスキング効果により、マスキング
される部分にノイズがあったとしても、このノイズは聞
こえないことになる。このため、実際のオーデイオ信号
では、このマスキングされる範囲内のノイズは許容可能
なノイズとされる。
On the other hand, in the power comparison circuit 409, the power information of each frequency band sent from each of the power calculation circuits 404 to 406 is compared at the same time and on the time axis in the time width in which the masking effect occurs, and the power is calculated. Circuit 404
The effect of another frequency band on the output frequency band of the above is calculated and transmitted to the block size correction circuit 411. In the block size correction circuit 411, the masking information sent from the power comparison circuit 409 and the delay 41 of the delay group are transmitted.
Based on the past block size information sent from each of the taps 2 to 414, the block size sent from the block size primary determination circuit 410 is corrected to select a block size longer in time, and the delay 412 is applied. And to the window shape determination circuit 415. The function of the block size correction circuit 411 is that even if the pre-echo becomes a problem in the corresponding frequency band, if a signal having a large amplitude exists in another frequency band, particularly in a band lower than the corresponding frequency band, the masking effect causes The characteristics that the pre-echo does not cause a problem in hearing or the problem may be alleviated are used.
Note that the masking is a phenomenon in which one signal is masked by another signal due to human auditory characteristics so that the other signal cannot be heard. There are an effect and a simultaneous masking effect by a signal on the frequency axis. Due to these masking effects, even if there is noise in the masked portion, this noise cannot be heard. Therefore, in the actual audio signal, the noise within the masked range is regarded as an acceptable noise.

【0049】次に、ディレイ412〜414では過去の
直交変換ブロックサイズを順に記録しておき、各タッ
プ、即ち、ディレイ412〜414の出力より、ブロッ
クサイズ決定回路411へ出力している。同時に、ディ
レイ412の出力は出力端子417へ、ディレイ41
2、413の出力はウィンドウ形状決定回路415へ接
続している。このディレイ412〜414からの出力は
ブロックサイズ修正回路411においてより長い時間幅
でのブロックサイズの変化を該当ブロックのブロックサ
イズの決定に役立てる働き、例えば、過去頻繁により時
間的に短いブロックサイズが選択されている場合は、時
間的に短いブロックサイズの選択を増やし、過去におい
て時間的に短いブロックサイズの選択がなされてない場
合においては、時間的に長いブロックサイズの選択を増
やす等の判断を可能としている。なお、このディレイ群
はウィンドウ決定回路415及び出力端子417に必要
なディレイ412、413を除けば、そのタップ数は装
置の実際的な構成、規模により増減させて用いられる場
合もある。ウィンドウ形状決定回路415ではブロック
サイズ修正回路411の出力、即ち、該当ブロックの時
間的に隣接する1つ後のブロックサイズととディレイ4
12の出力、即ち、該当ブロックのブロックサイズとデ
ィレイ413の出力、即ち、該当ブロックの時間的隣接
する1つ前のブロックサイズとから、上述の図2の各M
DCT回路203〜205において使用されるウィンド
ウの形状を決定し、出力端子416へ出力する。図5の
出力端子417、即ち、ブロックサイズ情報と出力端子
416、即ち、ウィンドウ形状情報が、図2のブロック
サイズ決定回路206〜208の出力として各部へ接続
される。
Next, in the delays 412 to 414, the past orthogonal transformation block sizes are recorded in order, and are output to the block size determination circuit 411 from each tap, that is, the output of the delays 412 to 414. At the same time, the output of the delay 412 is output to the output terminal 417 and the delay 41
The outputs of 2, 413 are connected to the window shape determining circuit 415. The outputs from the delays 412 to 414 serve in the block size correction circuit 411 to make use of the change in the block size in a longer time width in determining the block size of the corresponding block. If so, increase the selection of the block size that is shorter in time, and if the block size that is shorter in time has not been selected in the past, you can increase the selection of the block size that is longer in time. I am trying. Note that this delay group may be used by increasing or decreasing the number of taps depending on the actual configuration and scale of the device, except for the delays 412 and 413 required for the window determination circuit 415 and the output terminal 417. In the window shape determination circuit 415, the output of the block size correction circuit 411, that is, the block size immediately after the block of interest and the delay 4
2 from the output of 12, that is, the block size of the corresponding block and the output of the delay 413, that is, the size of the immediately preceding block that is adjacent to the corresponding block in time.
The shape of the window used in the DCT circuits 203 to 205 is determined and output to the output terminal 416. The output terminal 417, that is, the block size information and the output terminal 416, that is, the window shape information in FIG. 5 are connected to the respective units as the outputs of the block size determination circuits 206 to 208 in FIG.

【0050】ここでウィンドウ形状決定回路415にお
いて決定されるウィンドウの形状について説明する。図
6に隣接するブロックとウィンドウの形状の様子を示
す。図6の(a)〜(c)より判るように、図中点線及
び実線で示すように直交変換に使用されるウィンドウは
時間的に隣接するブロックとの間で重複する部分があ
り、本実施例では、隣接するブロックの中心まで重複す
る形状を採用しているため、隣接するブロックの直交変
換サイズによりウィンドウの形状が変化する。
The window shape determined by the window shape determination circuit 415 will be described. FIG. 6 shows the shapes of adjacent blocks and windows. As can be seen from (a) to (c) of FIG. 6, the window used for orthogonal transform has a portion overlapping with a temporally adjacent block as shown by a dotted line and a solid line in the figure, and thus the present embodiment In the example, since the shape overlapping the centers of adjacent blocks is adopted, the shape of the window changes depending on the orthogonal transform size of the adjacent blocks.

【0051】図7には上記ウィンドウ形状の詳細を示
す。図7においてウィンドウ関数f(n)、g(n+
N)は次式(1)を満たす関数として与えられる。
FIG. 7 shows details of the window shape. In FIG. 7, window functions f (n) and g (n +
N) is given as a function that satisfies the following equation (1).

【0052】 f(n)×f(L−1−n)=g(n)×g(L−1−n) f(n)×f(n)+g(n)×g(n)=1 ・・・(1) 0≦n≦L−1。F (n) × f (L-1-n) = g (n) × g (L-1-n) f (n) × f (n) + g (n) × g (n) = 1 (1) 0 ≦ n ≦ L−1.

【0053】この式(1)におけるLは、隣接する変換
ブロック長が同一であればそのまま変換ブロック長とな
るが、隣接する変換ブロック長が異なる場合は、より短
いほうの変換ブロック長をLとし、より長い変換ブロッ
ク長をKとすると、ウィンドウが重複しない領域におい
ては、次式(2)として与えられる。
If the adjacent conversion block lengths are the same, L in this equation (1) is the conversion block length as it is. However, if the adjacent conversion block lengths are different, the shorter conversion block length is L. , And a longer transform block length is K, in a region where windows do not overlap, the following formula (2) is given.

【0054】 f(n)=g(n)=1 K≦n≦3K/2−L/2 f(n)=g(n)=0 3K/2+L≦n≦2K ・・・(2) この様にウィンドウの重複部分をできる限り長く取るこ
とにより、直交変換の際のスペクトルの周波数分解能を
良好なものとしている。以上の説明から明らかな様に、
直交変換に使用するウィンドウの形状は時間的に連続す
る3ブロック分の直交変換サイズが確定した後、決定さ
れる。従って、図5の入力端子401〜403から入力
される信号のブロックと出力端子416、417から出
力される信号のブロックは本実施例において1ブロック
分の差異を生じている。
F (n) = g (n) = 1 K ≦ n ≦ 3K / 2−L / 2 f (n) = g (n) = 0 3K / 2 + L ≦ n ≦ 2K (2) By making the overlapping portions of the windows as long as possible, the frequency resolution of the spectrum at the time of orthogonal transformation is made good. As is clear from the above explanation,
The shape of the window used for orthogonal transformation is determined after the orthogonal transformation sizes for three blocks that are temporally consecutive are determined. Therefore, the block of signals input from the input terminals 401 to 403 and the block of signals output from the output terminals 416 and 417 in FIG. 5 have a difference of one block in this embodiment.

【0055】また、図5のパワー算出回路405、40
6及びパワー比較回路409を省略しても図2のブロッ
クサイズ決定回路206〜208を構成することは可能
である。さらにウィンドウの形状を直交変換ブロックの
取りうる時間的に最小のブロックサイズに固定すること
によってその種類を1種類とし、図5のディレイ412
〜414及びブロックサイズ修正回路411並びにウィ
ンドウ形状決定回路415を省略して構成することも可
能である。特に、処理時間の遅延を好まない応用例にお
いては上述の省略により遅延の少ない構成となり、有効
に作用する。
Further, the power calculation circuits 405 and 40 shown in FIG.
6 and the power comparison circuit 409 can be omitted, the block size determination circuits 206 to 208 in FIG. 2 can be configured. Further, the shape of the window is fixed to the smallest block size in time that can be taken by the orthogonal transform block, so that the type is set to one, and the delay 412 in FIG.
˜414, the block size correction circuit 411, and the window shape determination circuit 415 can be omitted. In particular, in the application example in which the processing time delay is not desired, the above-mentioned omission makes the configuration small in delay and works effectively.

【0056】再び図2において、各MDCT回路203
〜205にてMDCT処理されて得られた周波数軸上の
スペクトルデータあるいはMDCT係数データは、可変
フィルタ219〜221に送られている。可変フィルタ
219〜221では可変フィルタ係数決定回路222よ
り送られた係数を基に、上述のMDCT回路203〜2
05にて得られた周波数軸上のスペクトルデータ或いは
MDCT係数データの特性を変化させて、適応ビット割
当符号化回路210、211、213及びビット配分算
出回路209に伝送している。ここで特に適応ビット割
当符号化回路210〜213へ送られているスペクトル
データ或いはMDCT係数データは、低域はいわゆる臨
界帯域(クリティカルバンド)毎にまとめられて、中高
域はブロックフローティングの有効性を考慮して、臨界
帯域幅を細分化されている。このクリティカルバンドと
は、人間の聴覚特性を考慮して分割された周波数帯域で
あり、ある純音の周波数近傍の同じ強さの狭帯域バンド
ノイズによって当該純音がマスクされるときのそのノイ
ズの持つ帯域のことである。このクリティカルバンド
は、高域ほど帯域幅が広くなっており、上記0〜22k
Hzの全周波数帯域は例えば25のクリティカルバンド
に分割されている。
Referring again to FIG. 2, each MDCT circuit 203
˜205, the spectrum data on the frequency axis or the MDCT coefficient data obtained by the MDCT processing are sent to the variable filters 219 to 221. The variable filters 219 to 221 use the MDCT circuits 203 to 2 based on the coefficients sent from the variable filter coefficient determination circuit 222.
The characteristics of the spectrum data or MDCT coefficient data on the frequency axis obtained in 05 are changed and transmitted to the adaptive bit allocation encoding circuits 210, 211, 213 and the bit allocation calculation circuit 209. Here, in particular, the spectrum data or MDCT coefficient data sent to the adaptive bit allocation encoding circuits 210 to 213 are grouped for each so-called critical band (critical band) in the low band, and the effectiveness of the block floating is set in the middle and high bands. In consideration, the critical bandwidth is subdivided. This critical band is a frequency band divided in consideration of human auditory characteristics, and is the band of a pure tone when the pure tone is masked by narrow band noise of the same strength near the frequency of that pure tone. That is. This critical band has a wider bandwidth as it goes to higher frequencies.
The entire frequency band of Hz is divided into, for example, 25 critical bands.

【0057】ビット配分算出回路209は、上記クリテ
ィカルバンド及びブロックフローティングを考慮して分
割されたスペクトルデータに基づき、いわゆるマスキン
グ効果等を考慮してクリティカルバンド及びブロックフ
ローティングを考慮した各分割帯域毎のマスキング量を
求め、このマスキング量とクリティカルバンド及びブロ
ックフローティングを考慮した各分割帯域毎のエネルギ
あるいはピーク値等に基づいて、各帯域毎に割当ビット
数を求め、適応ビット割当符号化回路210〜212へ
伝送している。さらに、ビット配分算出回路209は、
規定ビットレートでは歪みが問題となるような場合に
は、問題となる量と規定ビットレートとの差分情報を可
変フィルタ係数決定回路222に伝送している。適応ビ
ット割当符号化回路210〜212では各帯域毎に割り
当てられたビット数に応じて各スペクトルデータ(ある
いはMDCT係数データ)を量子化している。このよう
にして符号化されたデータは、出力端子213〜215
を介して取り出される。また、可変フィルタ係数決定回
路222ではビット配分算出回路209より伝送された
差分情報を基にS/Nの不足するレベルを算出し、フィ
ルタの係数を決定し、可変フィルタ219〜211に伝
送している。この際、フィルタ係数の決定には、ビット
配分算出回路209の出力が必要なため、該当ブロック
のフィルタ係数を決定した後、可変フィルタにて先の各
スペクトルデータ或いはMDCT係数データの特性を変
更した後、再度、ビット配分の算出を行うことになる。
さらに、必要に応じて、上述の帰還動作を複数回実行す
ることにより、最適なビット配分ならびにスペクトル或
いはMDCT係数データの補正が行えることは明白であ
る。さらには、上述の帰還構造を取らず、時間的に前の
ブロックのフィルタ係数を以て、上述の特性変更を行っ
ても同様の効果が得られる。この場合、図2のビット配
分算出回路209と可変フィルタ222の間に、図中破
線で示したような経路で遅延回路224を挿入し、デー
タの位相を合わせる必要があることは明白である。さら
に、この遅延回路224において遅延する量は、必要に
応じて複数のブロックに渡ってデータを保持するもので
あっても良い。このような構成は、特に、処理時間を短
くする必要のある応用、例えば、放送や通信等において
は有効な手法となり、効率の良い装置或いはシステムの
構築が可能となる。
The bit allocation calculation circuit 209 masks each divided band considering the critical band and the block floating in consideration of the so-called masking effect based on the spectrum data divided in consideration of the critical band and the block floating. The amount of allocated bits is calculated for each band based on the masking amount and the energy or peak value of each divided band in consideration of the critical band and the block floating, and then to the adaptive bit allocation encoding circuits 210 to 212. It is transmitting. Furthermore, the bit allocation calculation circuit 209
If the distortion is a problem at the specified bit rate, the difference information between the problem amount and the specified bit rate is transmitted to the variable filter coefficient determination circuit 222. The adaptive bit allocation coding circuits 210 to 212 quantize each spectrum data (or MDCT coefficient data) according to the number of bits allocated for each band. The data encoded in this way is output to output terminals 213 to 215.
Is taken out through. In addition, the variable filter coefficient determination circuit 222 calculates the level of S / N shortage based on the difference information transmitted from the bit allocation calculation circuit 209, determines the filter coefficient, and transmits it to the variable filters 219 to 211. There is. At this time, since the output of the bit allocation calculation circuit 209 is necessary to determine the filter coefficient, after determining the filter coefficient of the corresponding block, the characteristic of each spectrum data or MDCT coefficient data is changed by the variable filter. After that, the bit allocation will be calculated again.
Furthermore, it is apparent that the above-mentioned feedback operation can be performed a plurality of times as needed to perform optimum bit allocation and correction of spectrum or MDCT coefficient data. Furthermore, the same effect can be obtained even if the above-mentioned characteristic change is performed without using the above-described feedback structure and by using the filter coefficient of the block that is temporally preceding. In this case, it is clear that it is necessary to insert the delay circuit 224 between the bit allocation calculation circuit 209 and the variable filter 222 shown in FIG. Further, the amount of delay in the delay circuit 224 may be one that holds data over a plurality of blocks as necessary. Such a configuration is an effective method particularly in applications requiring a short processing time, such as broadcasting and communication, and enables efficient construction of an apparatus or system.

【0058】ここで、図3を用いて図2とは異なる構成
で同様の効果を得る高能率符号化装置について説明す
る。図2、図3より明らかなように、図2の可変フィル
タ219〜221と図3の可変フィルタ319の配置が
異なっており、図3においてフィルタ係数表格納回路3
23が追加となっている。これ以外の構成については、
図2、図3共に同一であり、説明の便宜上、図中の番号
は異なっているが、同一の名称のブロックは同一の作用
を及ぼす為、ここでは、差異の有る部分について説明す
る。
Now, a high-efficiency coding apparatus which achieves the same effect with a configuration different from that of FIG. 2 will be described with reference to FIG. As is clear from FIGS. 2 and 3, the variable filters 219 to 221 in FIG. 2 and the variable filter 319 in FIG. 3 are arranged differently from each other, and in FIG.
23 has been added. For other configurations,
2 and 3 are the same, and the numbers in the drawings are different for convenience of description, but blocks having the same name have the same action, and therefore, only the difference will be described here.

【0059】図3において、入力端子300には例えば
サンプリング周波数が44.1kHzの時、0〜22k
HzのオーディオPCM信号が供給されている。この入
力信号は、可変フィルタ係数決定回路322によって決
定された係数を基に可変フィルタ319により、特性を
変更されていわゆるQMFからなる帯域分割フィルタ3
01へと伝送される。可変フィルタ係数決定回路322
ではビット配分算出回路309より伝送されたS/Nの
不足するレベルから必要なフィルタの特性を算出し、フ
ィルタ係数表格納回路323に予め用意されている係数
の中から最適の係数を決定し、可変フィルタ319に伝
送している。なお、図3中、破線で示したように可変フ
ィルタ係数決定回路322より、帯域分割フィルタ30
1、302に直接係数を出力することにより、可変フィ
ルタ319を省略して構成することも可能である。この
場合、上述の可変フィルタ319を用いる手法に比べ、
分割フィルタの特質の制約を受ける為、係数の選択範囲
が狭くなる欠点を持っているが、全体の演算量が少なく
なるという利点を持っている。一方、応用例によって、
処理能力や処理時間に余裕の有る場合は、フィルタ係数
表格納回路を省略し、全ての係数を演算で求めると一層
良好な結果が得られることは明白である。また、図2に
おいて説明した事項と同様に、この帰還を複数回処理し
ても良く、さらに、時間的に前のブロックのデータから
求めた係数を使用して、処理時間を短縮しても同様の効
果が得られる。
In FIG. 3, at the input terminal 300, for example, when the sampling frequency is 44.1 kHz, 0 to 22 kHz.
A Hz audio PCM signal is provided. The characteristic of this input signal is changed by the variable filter 319 based on the coefficient determined by the variable filter coefficient determination circuit 322, and the band division filter 3 formed of so-called QMF is used.
01 is transmitted. Variable filter coefficient determination circuit 322
Then, necessary filter characteristics are calculated from the level of insufficient S / N transmitted from the bit allocation calculation circuit 309, and the optimum coefficient is determined from the coefficients prepared in advance in the filter coefficient table storage circuit 323. It is transmitted to the variable filter 319. Note that, as shown by the broken line in FIG. 3, the variable filter coefficient determination circuit 322 causes the band division filter 30 to
It is also possible to omit the variable filter 319 by directly outputting the coefficients to 1 and 302. In this case, compared to the method using the variable filter 319 described above,
It has the drawback of narrowing the selection range of the coefficients because it is restricted by the characteristics of the division filter, but has the advantage of reducing the overall calculation amount. On the other hand, depending on the application,
It is obvious that a better result can be obtained by omitting the filter coefficient table storage circuit and calculating all the coefficients when the processing capacity and the processing time have a margin. Further, similar to the matter described in FIG. 2, this feedback may be processed a plurality of times, and further, even if the processing time is shortened by using the coefficient obtained from the data of the block preceding in time, it is the same. The effect of is obtained.

【0060】図3の構成の高能率符号化装置において
は、図2のそれに比較すると次のような特徴を持ってい
る。
The high-efficiency encoder having the configuration shown in FIG. 3 has the following features as compared with that shown in FIG.

【0061】第1の特徴として、図2に比較して、帰還
利得を大きく設定する事が出来るため、入力信号に対す
る適応能力が高い。
The first feature is that the feedback gain can be set to a large value as compared with FIG. 2, so the adaptability to an input signal is high.

【0062】第2の特徴として、時間軸上の信号に対
し、直交変換前に特性変化を与えるため、特性を変化さ
せたことによる直交変換、逆直交変換への影響が無い。
The second feature is that the characteristics on the signal on the time axis are changed before the orthogonal transformation, so that there is no influence on the orthogonal transformation and the inverse orthogonal transformation due to the variation of the characteristics.

【0063】第3の特徴として、時間軸上の信号に対
し、周波数軸上の特性変化を与えるため、演算量が多く
なり、係数も複雑な物を必要とする。
As a third feature, since a characteristic change on the frequency axis is given to a signal on the time axis, a large amount of calculation is required and a complex coefficient is required.

【0064】従って、図2の構成の高能率符号化装置の
特徴は、上記と相反するものとなる。
Therefore, the features of the high-efficiency encoder having the configuration of FIG. 2 are contrary to the above.

【0065】次に、図8は上記ビット割当算出回路20
9或いは309の一具体例の概略構成を示すブロック回
路図である。この図8を用いてビット割当算出回路の作
用について説明する。この図8において、入力端子70
1には、上記各MDCT回路203〜205或いは30
3〜305からの周波数軸上のスペクトルデータが供給
されている。
Next, FIG. 8 shows the bit allocation calculation circuit 20.
It is a block circuit diagram which shows the schematic structure of one specific example of 9 or 309. The operation of the bit allocation calculation circuit will be described with reference to FIG. In FIG. 8, the input terminal 70
1 indicates each of the MDCT circuits 203 to 205 or 30
The spectrum data on the frequency axis from 3 to 305 are supplied.

【0066】この周波数軸上の入力データは、帯域毎の
エネルギ算出回路702に送られて、上記マスキング量
とクリティカルバンド及びブロックフローティングを考
慮した各分割帯域のエネルギが、例えば当該バンド内で
の各振幅値の総和を計算すること等により求められる。
この各バンド毎のエネルギの代わりに、振幅値のピーク
値、平均値等が用いられることもある。このエネルギ算
出回路702からの出力として、例えば各バンドの総和
値のスペクトルを図9にSBとして示している。ただ
し、この図9では、図示を簡略化するため、上記マスキ
ング量とクリティカルバンド及びブロックフローティン
グを考慮した分割帯域数を12バンド(B1 〜B12)で
表現している。
The input data on the frequency axis is sent to the energy calculation circuit 702 for each band, and the energy of each divided band in consideration of the masking amount, the critical band and the block floating is, for example, each energy in the band. It can be obtained by calculating the sum of amplitude values.
Instead of the energy for each band, a peak value, an average value, etc. of the amplitude value may be used. As an output from the energy calculating circuit 702, for example, the spectrum of the sum total value of each band is shown as SB in FIG. However, in FIG. 9, in order to simplify the illustration, the number of division bands in consideration of the masking amount, the critical band, and the block floating is represented by 12 bands (B1 to B12).

【0067】ここで、上記スペクトルSBのいわゆるマ
スキングに於ける影響を考慮するために、該スペクトル
SBに所定の重み付け関数を掛けて加算するような畳込
み(コンボリユーション)処理を施す。このため、上記
帯域毎のエネルギ算出回路702の出力すなわち該スペ
クトルSBの各値は、畳込みフイルタ回路703に送ら
れる。該畳込みフイルタ回路703は、例えば、入力デ
ータを順次遅延させる複数の遅延素子と、これら遅延素
子からの出力にフイルタ係数(重み付け関数)を乗算す
る複数の乗算器(例えば各バンドに対応する25個の乗
算器)と、各乗算器出力の総和をとる総和加算器とから
構成されるものである。この畳込み処理により、図9中
点線で示す部分の総和がとられる。
Here, in order to take into account the influence of the spectrum SB on so-called masking, a convolution process is performed such that the spectrum SB is multiplied by a predetermined weighting function and added. Therefore, the output of the energy calculation circuit 702 for each band, that is, each value of the spectrum SB is sent to the convolution filter circuit 703. The convolution filter circuit 703 includes, for example, a plurality of delay elements that sequentially delay input data, and a plurality of multipliers that multiply outputs from these delay elements by a filter coefficient (weighting function) (for example, 25 corresponding to each band). Number of multipliers) and a summation adder that sums the outputs of the respective multipliers. By this convolution processing, the sum total of the portion indicated by the dotted line in FIG. 9 is obtained.

【0068】ここで、上記畳込みフイルタ回路703の
各乗算器の乗算係数(フイルタ係数)の一具体例を示す
と、任意のバンドに対応する乗算器Mの係数を1とする
とき、乗算器M−1で係数0.15を、乗算器M−2で
係数0.0019を、乗算器M−3で係数0.0000
086を、乗算器M+1で係数0.4を、乗算器M+2
で係数0.06を、乗算器M+3で係数0.007を各
遅延素子の出力に乗算することにより、上記スペクトル
SBの畳込み処理が行われる。ただし、Mは1〜25の
任意の整数である。
Here, a specific example of the multiplication coefficient (filter coefficient) of each multiplier of the convolution filter circuit 703 will be described. When the coefficient of the multiplier M corresponding to an arbitrary band is 1, the multiplier is M-1 gives a coefficient of 0.15, multiplier M-2 gives a coefficient of 0.0019, and multiplier M-3 gives a coefficient of 0.0000.
086, multiplier M + 1 gives a coefficient of 0.4, multiplier M + 2
By multiplying the output of each delay element by a coefficient of 0.06 with a coefficient of 0.007 by a multiplier M + 3, the convolution processing of the spectrum SB is performed. However, M is an arbitrary integer of 1 to 25.

【0069】次に、上記畳込みフイルタ回路703の出
力は引算器704に送られる。該引算器704は、上記
畳込んだ領域での後述する許容可能なノイズレベルに対
応するレベルαを求めるものである。なお、当該許容可
能なノイズレベル(許容ノイズレベル)に対応するレベ
ルαは、後述するように、逆コンボリユーション処理を
行うことによって、クリテイカルバンドの各バンド毎の
許容ノイズレベルとなるようなレベルである。ここで、
上記引算器704には、上記レベルαを求めるための許
容関数(マスキングレベルを表現する関数)が供給され
る。この許容関数を増減させることで上記レベルαの制
御を行っている。当該許容関数は、次に説明するような
(n−ai)関数発生回路705から供給されているも
のである。
Next, the output of the convolution filter circuit 703 is sent to the subtractor 704. The subtractor 704 obtains a level α corresponding to an allowable noise level described later in the convoluted area. It should be noted that the level α corresponding to the permissible noise level (permissible noise level) becomes the permissible noise level for each band of the critical band by performing the inverse convolution process as described later. It is a level. here,
The subtractor 704 is supplied with an allowance function (function expressing a masking level) for obtaining the level α. The level α is controlled by increasing or decreasing this allowance function. The permissible function is supplied from the (n-ai) function generating circuit 705 described below.

【0070】すなわち、許容ノイズレベルに対応するレ
ベルαは、クリテイカルバンドのバンドの低域から順に
与えられる番号をiとすると、次の(3)式で求めるこ
とができる。
That is, the level α corresponding to the allowable noise level can be obtained by the following equation (3), where i is the number given in order from the lower band of the critical band.

【0071】α=S−(n−ai) ・・・(3) この(3)式において、n,aは定数でa>0、Sは畳
込み処理されたバークスペクトルの強度であり、(3)
式中(n−ai)が許容関数となる。本実施例では n=38,a=1 としており、この時の音質劣化はなく、良好な符号化が
行えた。
Α = S- (n-ai) (3) In this equation (3), n and a are constants, a> 0, and S is the intensity of the convolution-processed Bark spectrum. 3)
In the formula, (n-ai) is the allowable function. In this embodiment, n = 38 and a = 1 are set, and there is no sound quality deterioration at this time, and good coding can be performed.

【0072】このようにして、上記レベルαが求めら
れ、このデータは、割算器706に伝送される。該割算
器706では、上記畳込みされた領域での上記レベルα
を逆コンボリユーションするためのものである。したが
って、この逆コンボリユーション処理を行うことによ
り、上記レベルαからマスキングスペクトルが得られる
ようになる。すなわち、このマスキングスペクトルが許
容ノイズスペクトルとなる。なお、上記逆コンボリユー
ション処理は、複雑な演算を必要とするが、本実施例で
は簡略化した割算器706を用いて逆コンボリユーショ
ンを行っている。
In this way, the level α is obtained, and this data is transmitted to the divider 706. In the divider 706, the level α in the convolved region is
It is for reverse convolution. Therefore, the masking spectrum can be obtained from the level α by performing the inverse convolution process. That is, this masking spectrum becomes the allowable noise spectrum. Although the above-mentioned inverse convolution processing requires a complicated operation, in the present embodiment, the inverse convolution is performed using the simplified divider 706.

【0073】次に、上記マスキングスペクトルは、合成
回路707を介して減算器708に伝送される。ここ
で、当該減算器708には、上記帯域毎のエネルギ検出
回路702からの出力、すなわち前述したスペクトルS
Bが、遅延回路709を介して供給されている。したが
って、この減算器708で上記マスキングスペクトルと
スペクトルSBとの減算演算が行われることで、図10
示すように、上記スペクトルSBは、該マスキングスペ
クトルMSのレベルで示すレベル以下がマスキングされ
ることになる。
Next, the masking spectrum is transmitted to the subtractor 708 via the synthesis circuit 707. Here, the subtracter 708 outputs the output from the energy detection circuit 702 for each band, that is, the spectrum S described above.
B is supplied via the delay circuit 709. Therefore, the subtraction operation of the masking spectrum and the spectrum SB is performed by the subtractor 708, so that FIG.
As shown, the spectrum SB is masked below the level indicated by the level of the masking spectrum MS.

【0074】当該減算器708からの出力は、許容雑音
補正回路710を介し、出力端子711を介して取り出
され、例えば割当てビット数情報が予め記憶されたRO
M等(図示せず)に送られる。このROM等は、上記減
算回路708から許容雑音補正回路710を介して得ら
れた出力(上記各バンドのエネルギと上記ノイズレベル
設定手段の出力との差分のレベル)に応じ、各バンド毎
の割当ビット数情報を出力する。この割当ビット数情報
が図2の適応ビット割当符号化回路210〜212或い
は図3の適応ビット割当符号可回路310〜312に送
られることで、図2のMDCT回路203〜205或い
は図3のMDCT回路303〜305からの周波数軸上
の各スペクトルデータがそれぞれのバンド毎に割り当て
られたビット数で量子化されるわけである。
The output from the subtracter 708 is taken out via the allowable noise correction circuit 710 and the output terminal 711. For example, RO in which the assigned bit number information is stored in advance.
M, etc. (not shown). This ROM or the like is assigned to each band in accordance with the output (the level of the difference between the energy of each band and the output of the noise level setting means) obtained from the subtraction circuit 708 through the allowable noise correction circuit 710. Outputs bit number information. This allocated bit number information is sent to the adaptive bit allocation coding circuits 210 to 212 in FIG. 2 or the adaptive bit allocation coding circuits 310 to 312 in FIG. 3 to cause the MDCT circuits 203 to 205 in FIG. 2 or the MDCT in FIG. Each spectrum data on the frequency axis from the circuits 303 to 305 is quantized by the number of bits assigned to each band.

【0075】すなわち要約すれば、図2の適応ビット割
当符号化回路210〜212或いは図3の適応ビット割
当符号可回路310〜312では、上記マスキング量と
クリティカルバンド及びブロックフローティングを考慮
した各分割帯域のエネルギと上記ノイズレベル設定手段
の出力との差分のレベルに応じて割当てられたビット数
で上記各バンド毎のスペクトルデータを量子化すること
になる。なお、図8の遅延回路709は上記合成回路7
07以前の各回路での遅延量を考慮してエネルギ検出回
路702からのスペクトルSBを遅延させるために設け
られている。
In summary, the adaptive bit allocation coding circuits 210 to 212 in FIG. 2 or the adaptive bit allocation coding circuits 310 to 312 in FIG. That is, the spectrum data for each band is quantized by the number of bits assigned according to the level of the difference between the energy of 1 and the output of the noise level setting means. The delay circuit 709 shown in FIG.
It is provided to delay the spectrum SB from the energy detection circuit 702 in consideration of the delay amount in each circuit before 07.

【0076】ところで、上述した合成回路707での合
成の際には、最小可聴カーブ発生回路712から供給さ
れる図11に示すような人間の聴覚特性であるいわゆる
最小可聴カーブRCを示すデータと、上記マスキングス
ペクトルMSとを合成することができる。この最小可聴
カーブにおいて、雑音絶対レベルがこの最小可聴カーブ
以下ならば該雑音は聞こえないことになる。この最小可
聴カーブは、コーデイングが同じであっても例えば再生
時の再生ボリユームの違いで異なるものとなが、現実的
なディジタルシステムでは、例えば16ビットダイナミ
ツクレンジへの音楽のはいり方にはさほど違いがないの
で、例えば4kHz付近の最も耳に聞こえやすい周波数
帯域の量子化雑音が聞こえないとすれば、他の周波数帯
域ではこの最小可聴カーブのレベル以下の量子化雑音は
聞こえないと考えられる。したがって、このように例え
ばシステムの持つワードレングスの4kHz付近の雑音
が聞こえない使い方をすると仮定し、この最小可聴カー
ブRCとマスキングスペクトルMSとを共に合成するこ
とで許容ノイズレベルを得るようにすると、この場合の
許容ノイズレベルは、図11中の斜線で示す部分までと
することができるようになる。なお、本実施例では、上
記最小可聴カーブの4kHzのレベルを、例えば20ビ
ット相当の最低レベルに合わせている。また、この図1
1は、信号スペクトルSSも同時に示している。
By the way, at the time of synthesizing by the above-mentioned synthesizing circuit 707, data showing a so-called minimum audible curve RC which is the human auditory characteristic as shown in FIG. The masking spectrum MS can be combined. In this minimum audible curve, if the absolute noise level is below this minimum audible curve, the noise will not be heard. Even if the coding is the same, the minimum audible curve is different due to the difference in the playback volume at the time of playback, but in a realistic digital system, for example, how to enter music into the 16-bit dynamic range is Since there is not much difference, if, for example, the quantization noise in the most audible frequency band around 4 kHz is not heard, it is considered that the quantization noise below the level of this minimum audible curve is not heard in other frequency bands. . Therefore, assuming that the system is used in such a manner that noise near the word length of the system of 4 kHz is inaudible, and the minimum noise curve RC and the masking spectrum MS are combined together to obtain an allowable noise level, In this case, the allowable noise level can be up to the shaded portion in FIG. In this embodiment, the level of 4 kHz of the minimum audible curve is set to the minimum level equivalent to 20 bits, for example. Also, this figure 1
1 also shows the signal spectrum SS at the same time.

【0077】また、上記許容雑音補正回路710では、
補正情報出力回路713から送られてくる例えば等ラウ
ドネスカーブの情報に基づいて、上記減算器708から
の出力における許容雑音レベルを補正している。ここ
で、等ラウドネスカーブとは、人間の聴覚特性に関する
特性曲線であり、例えば1kHzの純音と同じ大きさに
聞こえる各周波数での音の音圧を求めて曲線で結んだも
ので、ラウドネスの等感度曲線とも呼ばれる。またこの
等ラウドネス曲線は、図11に示した最小可聴カーブR
Cと略同じ曲線を描くものである。この等ラウドネス曲
線においては、例えば4kHz付近では1kHzのとこ
ろより音圧が8〜10dB下がっても1kHzと同じ大
きさに聞こえ、逆に、50Hz付近では1kHzでの音
圧よりも約15dB高くないと同じ大きさに聞こえな
い。このため、上記最小可聴カーブのレベルを越えた雑
音(許容ノイズレベル)は、該等ラウドネス曲線に応じ
たカーブで与えられる周波数特性を持つようにするのが
良いことがわかる。このようなことから、上記等ラウド
ネス曲線を考慮して上記許容ノイズレベルを補正するこ
とは、人間の聴覚特性に適合していることがわかる。
Further, in the allowable noise correction circuit 710,
The allowable noise level in the output from the subtractor 708 is corrected based on the information on the equal loudness curve sent from the correction information output circuit 713, for example. Here, the equal loudness curve is a characteristic curve relating to human auditory characteristics, for example, a curve obtained by obtaining the sound pressure of sound at each frequency that sounds the same as a pure tone of 1 kHz, and connecting the curves. Also called sensitivity curve. Further, this equal loudness curve is the minimum audible curve R shown in FIG.
It draws a curve substantially the same as C. In this equal loudness curve, for example, at 4 kHz, even if the sound pressure drops by 8 to 10 dB from 1 kHz, it sounds as loud as 1 kHz, and conversely, at around 50 Hz, it must be about 15 dB higher than the sound pressure at 1 kHz. It doesn't sound the same. Therefore, it is understood that the noise exceeding the level of the minimum audible curve (allowable noise level) should have the frequency characteristic given by the curve corresponding to the equal loudness curve. From this, it can be seen that correcting the permissible noise level in consideration of the equal loudness curve is suitable for human hearing characteristics.

【0078】さらに、補正情報出力回路713では、上
記適応ビット割当符号化回路210〜212或いは31
0〜312における量子化の際の出力情報量(データ
量)の検出出力と、最終符号化データのビットレート目
標値との間の誤差の情報に基づいて、上記許容ノイズレ
ベルを補正するようにしいる。これは、全てのビット割
当単位ブロックに対して予め一時的な適応ビット割当を
行って得られた総ビット数が、最終的な符号化出力デー
タのビットレートによって定まる一定のビット数(目標
値)に対して誤差を持つことがあり、その誤差分を0と
するように再度ビット割当をするものである。すなわ
ち、目標値よりも総割当ビット数が少ないときには、差
のビット数を各単位ブロックに割り振って付加するよう
にし、目標値よりも総割当ビット数が多いときには、差
のビット数を各単位ブロックに割り振って削るように作
用する。
Further, in the correction information output circuit 713, the adaptive bit allocation encoding circuit 210 to 212 or 31 is used.
The allowable noise level is corrected based on the error information between the detection output of the output information amount (data amount) at the time of quantization in 0 to 312 and the bit rate target value of the final encoded data. There is. This is because the total number of bits obtained by performing temporary adaptive bit allocation in advance for all bit allocation unit blocks is a fixed number of bits (target value) determined by the bit rate of the final encoded output data. May have an error with respect to, and bit allocation is performed again so that the error may be zero. That is, when the total number of allocated bits is smaller than the target value, the difference bit number is allocated and added to each unit block, and when the total allocated bit number is larger than the target value, the difference bit number is added to each unit block. It works by allocating to and shaving.

【0079】以上のような動作を行うため、上記総割当
ビット数の上記目標値からの誤差を検出し、この誤差デ
ータに応じて補正情報出力回路713が各割当ビット数
を補正するための補正データを出力する。ここで、上記
誤差データがビット数不足を示す場合は、上記単位ブロ
ック当たり多くのビット数が使われることで上記データ
量が上記目標値よりも多くなっている場合を考えること
ができる。また、上記誤差データが、ビット数余りを示
すデータとなる場合は、上記単位ブロック当たり少ない
ビット数で済み、上記データ量が上記目標値よりも少な
くなっている場合を考えることができる。したがって、
上記補正情報出力回路713からは、この誤差データに
応じて、上記減算器708からの出力における許容ノイ
ズレベルを、例えば上記等ラウドネス曲線の情報データ
に基づいて補正させるための上記補正値のデータが出力
されるようになる。上述のような補正値が、上記許容雑
音補正回路710に伝送されることで、上記減算器70
8からの許容ノイズレベルが補正されるようになる。た
だし、上述の誤差が予め定められた範囲以上の場合、上
述の補正を行わずに、出力端子714より、先に算出し
たビット割当が出力され、図2の可変フィルタ係数決定
回路222或いは図3の可変フィルタ係数決定回路32
2に伝送される。以上説明したようなシステムでは、メ
イン情報として直交変換出力スペクトルをサブ情報によ
り処理したデータとサブ情報としてブロックフローティ
ングの状態を示すスケールファクタ、語長を示すワード
レングスが得られ、エンコーダからデコーダに送られ
る。
In order to perform the above operation, an error in detecting the total allocation bit number from the target value is detected, and the correction information output circuit 713 corrects each allocation bit number according to the error data. Output the data. Here, when the error data indicates a bit number shortage, it can be considered that the data amount is larger than the target value because a large number of bits are used per unit block. Further, when the error data is data indicating a surplus of the number of bits, it can be considered that the number of bits per unit block is small and the amount of data is smaller than the target value. Therefore,
From the correction information output circuit 713, in accordance with the error data, the data of the correction value for correcting the allowable noise level in the output from the subtractor 708 based on, for example, the information data of the equal loudness curve is provided. It will be output. By transmitting the correction value as described above to the allowable noise correction circuit 710, the subtractor 70
The allowable noise level from 8 is corrected. However, when the above error is equal to or larger than the predetermined range, the previously calculated bit allocation is output from the output terminal 714 without performing the above correction, and the variable filter coefficient determination circuit 222 of FIG. Variable filter coefficient determination circuit 32
2 is transmitted. In the system as described above, the data obtained by processing the orthogonal transform output spectrum by the sub information as the main information and the scale factor indicating the block floating state and the word length indicating the word length are obtained as the sub information, and are sent from the encoder to the decoder. To be

【0080】次に、図12は図2の可変フィルタ係数決
定回路222或いは図3の可変フィルタ係数決定回路3
22の一具体例の概略構成を示すブロック回路図であ
る。この図12を用いて可変フィルタ係数決定回路の作
用について説明する。なお、図中、破線で囲まれた部分
は、図3の可変フィルタ係数決定回路322の一具体例
の概略構成を示したもである。
Next, FIG. 12 shows the variable filter coefficient determination circuit 222 of FIG. 2 or the variable filter coefficient determination circuit 3 of FIG.
22 is a block circuit diagram showing a schematic configuration of a specific example of No. 22. FIG. The operation of the variable filter coefficient determination circuit will be described with reference to FIG. In addition, in the figure, the part surrounded by the broken line shows a schematic configuration of a specific example of the variable filter coefficient determination circuit 322 in FIG. 3.

【0081】この図12において、入力端子801に
は、図2のビット配分算出回路209或いは図3のビッ
ト配分算出回路309より出力される、帯域毎のビット
割当情報が入力され、総ビット割当数算出回路802に
伝達される。総ビット割当数算出回路802では、帯域
毎のビット割当と帯域毎のスペクトルの数との積をすべ
ての帯域に渡って加算することによって、総ビット割当
数を算出し、減算器803へ伝送している。減算器80
3では、ビット割当目標値出力回路804より、出力さ
れるビット割当の目標値、即ち、ビット割当の上限値と
先の総ビット割当数の減算を行い、帯域毎重み付け回路
805へ伝送する。帯域毎重み付け回路805では、ビ
ット割当の上限値と先の総ビット割当数の差分を帯域毎
に重み付けを替えて割り振り、帯域毎変化量算出回路8
06或いは伝達関数算出回路809へと伝送している。
図2における入力信号の特性を変化させる手法は、周波
数軸上のスペクトルデータであるから、帯域毎変化量算
出回路806では、帯域毎に重み付けされて割り振られ
たビット数をレベルに変換している。その際、遅延回路
807より、図2における入力信号の特性変化とビット
配分算出の帰還を複数回行う場合の為に、時間的に前の
回の帯域毎の変化量を積算して、補正をかけている。こ
れは、帰還系が収束せずに発振してしまうことを防ぐた
めの回路である。例えば、帯域毎重み付け回路805に
おいて、総ビット割当数がビット割当目標値よりも大き
い場合は高域により大きい重み付けを行い、総ビット割
当数がビット割当目標値よりも小さい場合は低域により
大きい重み付けを与えるように構成して、先の帰還系を
複数回処理を行うと、最悪のケースでは、スペクトルデ
ータが直流成分のみとなって、収束する場合が生じる。
この様な状態を回避するために、2回目以降の処理につ
いては、前回の処理において求めた変化量を小さくなる
方向に処理が行われるように修正をかけている。
In FIG. 12, the bit allocation information for each band output from the bit allocation calculation circuit 209 of FIG. 2 or the bit allocation calculation circuit 309 of FIG. 3 is input to the input terminal 801, and the total number of bit allocations is input. It is transmitted to the calculation circuit 802. The total bit allocation number calculation circuit 802 calculates the total bit allocation number by adding the product of the bit allocation for each band and the number of spectra for each band over all bands, and transmits it to the subtractor 803. ing. Subtractor 80
In 3, the bit allocation target value output circuit 804 subtracts the target value of the bit allocation output, that is, the upper limit value of the bit allocation and the previous total bit allocation number, and transmits it to the band weighting circuit 805. The band-by-band weighting circuit 805 allocates the difference between the upper limit value of bit allocation and the previous total bit allocation number by changing weighting for each band, and the band-by-band variation calculation circuit 8
06 or to the transfer function calculation circuit 809.
Since the method of changing the characteristic of the input signal in FIG. 2 is spectrum data on the frequency axis, the band-by-band variation calculation circuit 806 converts the number of bits weighted and allocated for each band into a level. . At that time, in order to perform the characteristic change of the input signal and the feedback of the bit allocation calculation in FIG. I'm hanging. This is a circuit for preventing the feedback system from oscillating without converging. For example, in the band-by-band weighting circuit 805, when the total number of bit allocations is larger than the bit allocation target value, the higher band is weighted more, and when the total bit allocation number is smaller than the bit allocation target value, the lower band is weighted more. When the above feedback system is processed a plurality of times, in the worst case, the spectrum data may be a DC component and converge.
In order to avoid such a state, the second and subsequent processes are modified so that the amount of change obtained in the previous process is reduced.

【0082】一方、図3における入力信号の特性を変化
させる手法は、時間軸上の振幅情報であるから、周波数
領域の特性変化を与えるためには、何らかのフィルタ演
算を行う必要がある。図12の伝達関数算出回路809
は、帯域毎に重み付けされたビット数から、カットオフ
周波数、減衰量及び減衰特性等を求め、伝達関数を算出
し、フィルタ係数決定回路810へ出力している。その
際、遅延回路811からは、上述の図2の場合と同様
に、帰還系の安定のために、時間的に前の回の処理デー
タを入力し、補正をかけている。フィルタ係数決定回路
810では、先の伝達関数を基に図3のフィルタ係数表
格納回路323より入力端子812を介して入力される
フィルタ係数の選定を行う。なお、この構成は実施例の
装置の構成を簡易にするためのものであり、応用例によ
っては、フィルタ係数決定回路810において、伝達関
数よりフィルタ係数を数学的に算出するとより良好な結
果が得られる。以上の様にして決定されたフィルタ係数
は出力端子813を介して図3の可変フィルタ回路31
9に伝達される。
On the other hand, since the method of changing the characteristic of the input signal in FIG. 3 is amplitude information on the time axis, it is necessary to perform some sort of filter calculation in order to change the characteristic in the frequency domain. Transfer function calculation circuit 809 in FIG.
The cutoff frequency, the attenuation amount, the attenuation characteristic, and the like are calculated from the number of bits weighted for each band, the transfer function is calculated, and the result is output to the filter coefficient determination circuit 810. At this time, as in the case of FIG. 2 described above, the processing data of the previous time is input and corrected from the delay circuit 811 for the stability of the feedback system. The filter coefficient determination circuit 810 selects the filter coefficient input from the filter coefficient table storage circuit 323 of FIG. 3 via the input terminal 812 based on the above transfer function. Note that this configuration is for simplifying the configuration of the apparatus of the embodiment, and depending on the application example, a better result can be obtained by mathematically calculating the filter coefficient from the transfer function in the filter coefficient determination circuit 810. To be The filter coefficient determined as described above is output through the output terminal 813 to the variable filter circuit 31 of FIG.
9 is transmitted.

【0083】ここで、図11で示されるような割当ビッ
ト数を実行した場合、前述のビット割当の目標値を大き
く上回る結果となる場合について、先の、可変フィルタ
219〜221或いは319の作用について説明する。
可変フィルタ219〜221或いは319によって特性
変化を行わずにビット配分を実行した結果、ビット割当
の目標値を大きく上回った場合、前述のように通常の調
整機能により、差のビット数を各単位ブロックに割り振
ってビットの配分を削減する。この際、削減量が大きく
なるために、必要なS/Nを得ることが難しくなる場合
が生じる。この様な場合に、図13に示す様な特性のフ
ィルタを使用して、図9に示すスペクトルデータの特性
を変化させて、マスクキングスペクトルを計算すると図
14におけるMSの様になる。このようにして求めたマ
スキングスペクトルMSと前述の最小可聴カーブRCを
合成した許容ノイズレベルを図15に示す。図11との
比較より明らかなように、高域のエネルギが減少するよ
うに特性を変化させた結果、許容ノイズレベルに占める
マスキングスペクトルMSの割合が相対的に減少し、図
15中、B10、B11においては、必要とするS/
N、即ち、割当ビット数が減少しており、B12におい
ては許容ノイズレベルRCが信号スペクトルSSの値を
越えており、ビットの割当を必要としない状態となって
いる。このことから、図11の状態に比較して、ビット
配分の総数が減少していることは明白である。従って、
先のビット配分の目標値との差が減少したことを示して
いる。
Here, in the case where the number of allocated bits as shown in FIG. 11 is executed, the above-mentioned target value of the bit allocation is greatly exceeded, and the above-mentioned operation of the variable filters 219 to 221 or 319. explain.
As a result of executing the bit allocation without changing the characteristics by the variable filters 219 to 221 or 319, if the target value of the bit allocation is greatly exceeded, as described above, the number of difference bits is set to the unit block by the normal adjustment function. To reduce the bit allocation. At this time, since the amount of reduction is large, it may be difficult to obtain the required S / N. In such a case, the filter of the characteristics shown in FIG. 13 is used to change the characteristics of the spectrum data shown in FIG. 9 to calculate the masking spectrum, which results in the MS shown in FIG. FIG. 15 shows an allowable noise level obtained by combining the masking spectrum MS thus obtained and the above-mentioned minimum audible curve RC. As is clear from a comparison with FIG. 11, as a result of changing the characteristics so that the energy in the high frequency band is reduced, the proportion of the masking spectrum MS in the allowable noise level is relatively reduced. In B11, the required S /
N, that is, the number of allocated bits has decreased, and in B12, the allowable noise level RC exceeds the value of the signal spectrum SS, and bit allocation is not required. From this, it is clear that the total number of bit allocations is reduced as compared to the state of FIG. Therefore,
This indicates that the difference from the target value of the previous bit allocation has decreased.

【0084】なお、上記実施例では高域のエネルギが減
少するような特性の変化を以て説明したが、本発明は上
記特性変化のみに限定されるものでなく、入力信号に適
応して様々な特性、例えば、帯域阻止或いは帯域通過特
性等を使用しても同様の効果が得られることは明白であ
る。
Although the above embodiment has been described with respect to the characteristic change such that the energy in the high frequency band is reduced, the present invention is not limited to the above characteristic change, and various characteristics can be adapted to the input signal. It is obvious that the same effect can be obtained by using, for example, band stop or band pass characteristics.

【0085】図16は図1のATCデコーダ73、即
ち、上述のごとく高能率符号化されて記録媒体に記録さ
れた信号を再生して得た再生信号、又は伝送媒体を介し
て伝送されて受信された受信信号を、再び復号化するた
めの復号回路を示している。各帯域の量子化されたMD
CT係数、即ち、図2の出力端子213〜215或いは
図3の出力端子313〜315の出力信号と等価のデー
タは、復号回路入力107に与えられ、使用されたブロ
ックサイズ情報、即ち、図2の出力端子216〜218
或いは図3の出力端子316〜318の出力信号と等価
のデータは、入力端子108に与えられる。適応ビット
割当復号化回路106では適応ビット割当情報を用いて
ビット割当を解除する。次に逆直交変換(IMDCT)
回路103〜105では周波数軸上の信号が時間軸上の
信号に変換される。これらの部分帯域の時間軸上信号
は、帯域合成フィルタ(IQMF)回路102、101
により、全帯域信号に復号化される。
FIG. 16 shows the ATC decoder 73 shown in FIG. 1, that is, a reproduction signal obtained by reproducing a signal which is highly efficient coded and recorded on a recording medium as described above, or is transmitted and received through a transmission medium. The decoding circuit for decoding the received signal which was carried out again is shown. Quantized MD of each band
The CT coefficient, that is, the data equivalent to the output signals of the output terminals 213 to 215 of FIG. 2 or the output terminals 313 to 315 of FIG. 3, is given to the decoding circuit input 107 and used block size information, that is, FIG. Output terminals 216-218
Alternatively, data equivalent to the output signals of the output terminals 316 to 318 of FIG. 3 are given to the input terminal 108. The adaptive bit allocation decoding circuit 106 cancels the bit allocation using the adaptive bit allocation information. Next, inverse orthogonal transform (IMDCT)
In the circuits 103 to 105, the signal on the frequency axis is converted into the signal on the time axis. The signals on the time axis of these partial bands are band synthesis filter (IQMF) circuits 102 and 101.
Is decoded into a full band signal.

【0086】なお、本発明は上記実施例のみに限定され
るものではなく、例えば、上記の記録再生媒体と信号圧
縮装置あるいは伸張装置と、さらには、信号圧縮装置と
伸張装置とは一体化されている必要はなく、記録媒体を
介せずに、その間をデータ転送用回線や光ケーブル,光
或いは電波による通信等で結ぶ事も可能である。更に例
えば、オーデイオPCM信号のみならず、ディジタル音
声(スピーチ)信号やディジタルビデオ信号等の信号処
理装置にも適用可能である。
The present invention is not limited to the above-mentioned embodiment, and for example, the recording / reproducing medium and the signal compressing device or the expanding device, and further the signal compressing device and the expanding device are integrated. It is not necessary to provide such a connection, and it is also possible to connect between them by a data transfer line, an optical cable, communication by light or radio waves, etc. without using a recording medium. Furthermore, for example, the present invention can be applied not only to audio PCM signals, but also to signal processing devices for digital audio (speech) signals, digital video signals, and the like.

【0087】また、本発明の記録媒体は、上記ディジタ
ル信号圧縮装置により圧縮されたデータを記録すること
で、記録容量の有効利用が図れる。また、本発明の記録
媒体としては、上述した光ディスクのみならず、磁気デ
ィスク、ICメモリ及びそのメモリを内蔵するカード
や、磁気テープ等の各種記録媒体とすることもできる。
Further, the recording medium of the present invention records the data compressed by the digital signal compressing device, whereby the recording capacity can be effectively utilized. Further, as the recording medium of the present invention, not only the above-mentioned optical disk but also various recording media such as a magnetic disk, an IC memory and a card having the memory built therein, and a magnetic tape can be used.

【0088】[0088]

【発明の効果】以上の説明からも明らかなように、本発
明のディジタル信号圧縮方法及び装置においては、より
多くのビット配分を必要とする入力信号に対し、最適な
エネルギー配分をもたらす特性操作を行うことによりビ
ット配分を行う手法によれば、周波数帯域とS/Nの調
和を容易に取ることが出来、聴覚的にも望ましいビット
の配分の手法を実現できる。従って、聴感上、音質の勝
れた高能率な圧縮、伸張を行うことができる。
As is apparent from the above description, in the digital signal compression method and apparatus of the present invention, the characteristic operation that brings about the optimum energy distribution for the input signal that requires more bit allocation is performed. According to the method of allocating bits by doing so, it is possible to easily harmonize the frequency band and the S / N, and it is possible to realize a method of allocating bits that is also auditorily desirable. Therefore, it is possible to perform highly efficient compression and decompression with excellent sound quality in terms of hearing.

【0089】また、本発明のディジタル信号圧縮方法及
び装置で圧縮したデータを記録する本発明の記録媒体
は、従来のものよりも記憶容量の有効利用が図れること
になる。さらに、本発明のディジタル信号圧縮方法及び
装置で圧縮したデータを伝送する経路は、従来のものよ
りも回線の利用効率を高めることが出来る。
Further, the recording medium of the present invention for recording the data compressed by the digital signal compression method and apparatus of the present invention can effectively utilize the storage capacity as compared with the conventional recording medium. Further, the path for transmitting the data compressed by the digital signal compression method and apparatus of the present invention can improve the utilization efficiency of the line as compared with the conventional one.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明ディジタル信号圧縮方法が適用される本
発明ディジタル信号圧縮装置の一実施例としての圧縮デ
ータの記録再生装置(ディスク記録再生装置)の構成例
を示すブロック回路図である。
FIG. 1 is a block circuit diagram showing a configuration example of a compressed data recording / reproducing apparatus (disk recording / reproducing apparatus) as an embodiment of the digital signal compressing apparatus of the present invention to which the digital signal compressing method of the present invention is applied.

【図2】本実施例のビットレート圧縮符号化に使用可能
な高能率圧縮符号化エンコーダの一具体例を示すブロッ
ク回路図である。
FIG. 2 is a block circuit diagram showing a specific example of a high-efficiency compression encoding encoder that can be used for bit rate compression encoding according to the present embodiment.

【図3】本実施例のビットレート圧縮符号化に使用可能
な高能率圧縮符号化エンコーダの他の具体例を示すブロ
ック回路図である。
FIG. 3 is a block circuit diagram showing another specific example of the high-efficiency compression encoding encoder that can be used for the bit rate compression encoding of the present embodiment.

【図4】ビット圧縮の際の直交変換ブロックの構造を表
す図である。
FIG. 4 is a diagram showing a structure of an orthogonal transform block at the time of bit compression.

【図5】直交変換ブロックサイズを決定する回路の構成
例を示すブロック回路図である。
FIG. 5 is a block circuit diagram showing a configuration example of a circuit that determines an orthogonal transform block size.

【図6】時間的に隣接する直交変換ブロックの時間的長
さの変化と直交変換時に用いるウィンドウ形状の関係を
示す図である。
FIG. 6 is a diagram showing a relationship between a change in temporal length of orthogonal transform blocks temporally adjacent to each other and a window shape used in orthogonal transform.

【図7】直交変換時に用いるウィンドウの形状の詳細例
を示す図である。
FIG. 7 is a diagram showing a detailed example of the shape of a window used in orthogonal transformation.

【図8】ビット配分演算機能を実現する畳込み演算を利
用したビット配分算出回路の例を示すブロック回路図で
ある。
FIG. 8 is a block circuit diagram showing an example of a bit allocation calculation circuit using a convolution operation that realizes a bit allocation operation function.

【図9】各臨界帯域及びブロックフローティングを考慮
して分割された帯域のスペクトルを示す図である。
FIG. 9 is a diagram showing spectra of bands divided in consideration of each critical band and block floating.

【図10】マスキングスペクトルを示す図である。FIG. 10 is a diagram showing a masking spectrum.

【図11】最小可聴カーブ、マスキングスペクトルを合
成した図である。
FIG. 11 is a diagram in which a minimum audible curve and a masking spectrum are combined.

【図12】可変フィルタ係数決定回路の一具体例を示す
ブロック図である。
FIG. 12 is a block diagram showing a specific example of a variable filter coefficient determination circuit.

【図13】可変フィルタの特性の一例を示す図である。FIG. 13 is a diagram showing an example of characteristics of a variable filter.

【図14】図12で示す特性により、図9に示すスペク
トルの特性を変化させた信号のマスキングスペクトルを
示す図である。
14 is a diagram showing a masking spectrum of a signal in which the characteristic of the spectrum shown in FIG. 9 is changed by the characteristic shown in FIG.

【図15】図13で示すマスキングスペクトルと最小可
聴カーブを合成した図である。
FIG. 15 is a diagram in which the masking spectrum and the minimum audible curve shown in FIG. 13 are combined.

【図16】上記実施例のビットレート圧縮符号化に使用
可能な高能率圧縮符号化デコーダの一具体例を示すブロ
ック回路図である。
FIG. 16 is a block circuit diagram showing a specific example of a high-efficiency compression encoding decoder that can be used for the bit rate compression encoding of the above embodiment.

【符号の説明】[Explanation of symbols]

201、202、301、302 帯域分割フィルタ 203〜205、303〜305 直交変換回路 206〜208、306〜308 ブロック決定回路 209、309 ビット配分算出回路 210〜212、310〜312 適応ビット割当符号
化回路 219〜221、319 可変フィルタ 222、322 可変フィルタ係数決定回路 323 フィルタ係数表格納回路 224、324 遅延回路 404〜406 パワー算出回路 408 変化分抽出回路 409 パワー比較回路 410 ブロックサイズ1次決定回路 411 ブロックサイズ修正回路 415 ウィンドウ形状決定回路
201, 202, 301, 302 Band division filter 203-205, 303-305 Orthogonal transformation circuit 206-208, 306-308 Block determination circuit 209, 309 Bit allocation calculation circuit 210-212, 310-312 Adaptive bit allocation coding circuit 219 to 221, 319 Variable filter 222, 322 Variable filter coefficient determination circuit 323 Filter coefficient table storage circuit 224, 324 Delay circuit 404 to 406 Power calculation circuit 408 Change extraction circuit 409 Power comparison circuit 410 Block size primary determination circuit 411 block Size correction circuit 415 Window shape determination circuit

Claims (49)

【特許請求の範囲】[Claims] 【請求項1】 ディジタル信号を情報圧縮するディジタ
ル信号圧縮方法において、 許容可能なノイズスペクトルを求め、 上記求めた許容可能なノイズスペクトルを時間と周波数
について細分化した小ブロックに分配し、圧縮のための
ビット割当を行い、 規定されたビット数と上記求めたビット割当数との差か
らレベル差を求め、 上記求めたレベル差を基にして入力信号の特性を変化さ
せることによるビット割当数の制御を、必要に応じて複
数回実行し、最適なビット配分を決定することを特徴と
するディジタル信号圧縮方法。
1. A digital signal compression method for compressing information of a digital signal, wherein an acceptable noise spectrum is obtained, and the obtained acceptable noise spectrum is distributed to small blocks subdivided in time and frequency for compression. The bit allocation is controlled by calculating the level difference from the difference between the specified number of bits and the calculated bit allocation number, and changing the characteristics of the input signal based on the calculated level difference. Is executed a plurality of times as necessary to determine the optimum bit allocation, and a digital signal compression method.
【請求項2】 ディジタル信号を情報圧縮するディジタ
ル信号圧縮方法において、 時間軸上のスペクトルデータを得、 上記時間軸上のスペクトルデータから許容可能なノイズ
スペクトルを求め、 上記求めた許容可能なノイズスペクトルを時間と周波数
について細分化した小ブロックに分配し、圧縮のための
ビット割当を行い、 規定されたビット数と上記求めたビット割当数との差か
らレベル差を求め、 上記求めたレベル差を基に入力信号の周波数軸上のスペ
クトルデータの特性を変化させて、ビット割当数の制御
を行うことを特徴とするディジタル信号圧縮方法。
2. A digital signal compression method for compressing information of a digital signal, obtaining spectrum data on a time axis, obtaining an allowable noise spectrum from the spectrum data on the time axis, and obtaining the acceptable noise spectrum. Is divided into small blocks that are subdivided with respect to time and frequency, bit allocation for compression is performed, the level difference is calculated from the difference between the specified number of bits and the number of bit allocation calculated above, and the level difference calculated above is calculated. A method of compressing a digital signal, characterized in that the number of allocated bits is controlled by changing the characteristics of the spectrum data of the input signal on the frequency axis.
【請求項3】 ディジタル信号を情報圧縮するディジタ
ル信号圧縮方法において、 許容可能なノイズスペクトルを求め、 上記求めた許容ノイズスペクトルを時間と周波数につい
て細分化した小ブロックに分配し、圧縮のためのビット
割当を行い、 規定されたビット数と上記求めたビット割当数との差か
らレベル差を求め、 上記レベル差を減少させるフィルタ係数を求めて、当該
フィルタ係数を基に入力信号を時間軸上でフィルタリン
グすることによって、ビット割当数の制御を行うことを
特徴とするディジタル信号圧縮方法。
3. A digital signal compression method for compressing information of a digital signal, wherein an acceptable noise spectrum is obtained, and the obtained acceptable noise spectrum is divided into small blocks subdivided in time and frequency, and bits for compression are obtained. Allocation is performed, the level difference is calculated from the difference between the specified number of bits and the calculated bit allocation number, the filter coefficient that reduces the level difference is calculated, and the input signal is time-based based on the filter coefficient. A digital signal compression method characterized in that the number of allocated bits is controlled by filtering.
【請求項4】 帯域分割フィルタにより入力信号を複数
個の帯域に分割し、 当該帯域分割フィルタをビット割当数の制御を行うフィ
ルタと共用することを特徴とする請求項3記載のディジ
タル信号圧縮方法。
4. The digital signal compression method according to claim 3, wherein the input signal is divided into a plurality of bands by a band division filter, and the band division filter is shared with a filter for controlling the number of bit allocations. .
【請求項5】 入力信号の特性を変化させる為の情報を
複数処理ブロックに渡って遅延或いは記憶し、 時間的に前の処理ブロックの情報を用いて、上記入力信
号の特性を変化させる処理を行って、ビット割当数の制
御を行うことを特徴とする請求項1から請求項4のうち
のいずれか1項に記載のディジタル信号圧縮方法。
5. A process for delaying or storing information for changing a characteristic of an input signal over a plurality of processing blocks and changing the characteristic of the input signal by using information of a processing block preceding in time. The digital signal compression method according to claim 1, wherein the bit allocation number is controlled by performing the control.
【請求項6】 入力信号に適応してその処理ブロックの
長さを可変とし、当該処理ブロックの入力信号の変化及
び他の処理ブロックの入力信号の変化、及び/又はパワ
ー、或いはエネルギ又はピーク情報を基に、当該処理ブ
ロックの長さを決定することを特徴とする請求項1から
請求項5のうちのいずれか1項に記載のディジタル信号
圧縮方法。
6. A length of a processing block is made variable according to an input signal, and a change in an input signal of the processing block and a change in an input signal of another processing block, and / or power, or energy or peak information. The digital signal compression method according to any one of claims 1 to 5, wherein the length of the processing block is determined based on the above.
【請求項7】 入力信号に適応してその処理ブロックの
長さを可変とし、当該処理ブロックの入力信号の変化及
び時間的に処理ブロックの最大より長い時間幅の入力信
号により得られる入力信号の変化情報を基に当該処理ブ
ロックの長さを決定することを特徴とする請求項1から
請求項5のうちのいずれか1項に記載のディジタル信号
圧縮方法。
7. The length of the processing block is made variable according to the input signal, and the change of the input signal of the processing block and the input signal obtained by the input signal having a time width longer than the maximum of the processing block in terms of time The digital signal compression method according to claim 1, wherein the length of the processing block is determined based on the change information.
【請求項8】 入力信号に適応してその処理ブロックの
長さを可変とし、当該処理ブロックの入力信号の変化及
び他の処理ブロックの入力信号の変化、及び/又はパワ
ー、或いはエネルギ又はピーク情報を基に、当該処理ブ
ロックの長さを決定すること、或いは、入力信号に適応
してその処理ブロックの長さを可変とし、当該処理ブロ
ックの入力信号の変化及び時間的に処理ブロックの最大
より長い時間幅の入力信号により得られる入力信号の変
化情報を基に当該処理ブロックの長さを決定することを
行うことを特徴とする請求項1から請求項5のうちのい
ずれか1項に記載のディジタル信号圧縮方法。
8. The length of the processing block is made variable according to the input signal, and the change of the input signal of the processing block and the change of the input signal of another processing block, and / or the power, or energy or peak information. Based on the above, the length of the processing block is determined, or the length of the processing block is made variable by adapting to the input signal, and the change of the input signal of the processing block and the maximum of the processing block in time 6. The length of the processing block is determined based on change information of the input signal obtained by the input signal having a long time width, according to any one of claims 1 to 5. Digital signal compression method.
【請求項9】 上記処理ブロック長の決定の際には、処
理ブロックの長さを決定する要素の決定に関与する割合
を、固定或いは入力信号に適応した割合、及び/又は所
定の割合で、併用若しくは単独に使用することを特徴と
する請求項8記載のディジタル信号圧縮方法。
9. When the processing block length is determined, the ratio involved in determining the element that determines the processing block length is fixed or adapted to the input signal, and / or a predetermined ratio, 9. The digital signal compression method according to claim 8, wherein the digital signal compression method is used in combination or alone.
【請求項10】 入力信号はオーディオ信号であり、少
なくとも大部分の量子化雑音の発生をコントロールする
ブロックの周波数幅を、高域ほど広くしてゆくことを特
徴とする請求項1から請求項9のうちいずれか1項に記
載のディジタル信号圧縮方法。
10. The input signal is an audio signal, and the frequency width of a block for controlling the generation of at least most of the quantization noise is made wider in a higher frequency range. The digital signal compression method according to any one of the above.
【請求項11】 直交変換を用いて、時間軸信号から周
波数軸上の複数の帯域への分割を行い、 上記直交変換における直交変換サイズの可変と共に当該
直交変換時に使用する窓関数の形状も変化させることを
特徴とする請求項10記載のディジタル信号圧縮方法。
11. An orthogonal transform is used to divide a time-axis signal into a plurality of bands on the frequency axis, and the shape of a window function used at the time of the orthogonal transform is changed along with the change of the orthogonal transform size in the orthogonal transform. 11. The digital signal compression method according to claim 10, wherein
【請求項12】 上記時間軸信号から周波数軸上の複数
の帯域への分割の際には、先ず上記時間軸信号を複数の
帯域に分割し、当該分割された帯域毎に複数のサンプル
からなるブロックを形成し、各帯域のブロック毎に直交
変換を行い係数データを得ることを特徴とする請求項1
1記載のディジタル信号圧縮方法。
12. When dividing the time axis signal into a plurality of bands on the frequency axis, the time axis signal is first divided into a plurality of bands, and each divided band is made up of a plurality of samples. A coefficient is obtained by forming a block and performing orthogonal transformation for each block of each band.
1. The digital signal compression method described in 1.
【請求項13】 上記直交変換前の時間軸信号から周波
数軸上の複数の帯域への分割における分割周波数幅を、
略高域程広くすることを特徴とする請求項12記載のデ
ィジタル信号圧縮方法。
13. A divided frequency width in dividing the time-axis signal before the orthogonal transformation into a plurality of bands on the frequency axis,
13. The digital signal compression method according to claim 12, wherein the higher the frequency band is, the wider it is.
【請求項14】 上記分割周波数幅を最低域の連続した
2帯域で同一とすることを特徴とする請求項13記載の
ディジタル信号圧縮方法。
14. The digital signal compression method according to claim 13, wherein the divided frequency widths are the same in two consecutive bands of the lowest band.
【請求項15】 上記ビット割当の際には、略信号通過
帯域以上の帯域の信号成分に対する圧縮符号のメイン情
報及び/又はサブ情報への割り当てを阻止することを特
徴とする請求項14記載のディジタル信号圧縮方法。
15. The bit allocation according to claim 14, wherein the allocation of the compression code to the main information and / or the sub information for the signal component in the band substantially equal to or larger than the signal pass band is blocked. Digital signal compression method.
【請求項16】 上記複数の帯域への分割にはクワドラ
チャ・ミラー・フィルタを用いることを特徴とする請求
項12から請求項15のうちいずれか1項に記載のディ
ジタル信号圧縮方法。
16. The digital signal compression method according to claim 12, wherein a quadrature mirror filter is used for the division into the plurality of bands.
【請求項17】 上記直交変換として変更離散コサイン
変換を用いることを特徴とする請求項11から請求項1
6のうちいずれか1項に記載のディジタル信号圧縮方
法。
17. The method according to claim 11, wherein a modified discrete cosine transform is used as the orthogonal transform.
7. The digital signal compression method according to any one of 6 above.
【請求項18】 上記処理ブロックの入力信号の変化を
基に処理ブロックの時間的長さを決定する際に、その時
間的長さ決定のための所定の境界値を入力信号の振幅、
周波数に応じて可変とすることを特徴とする請求項6か
ら請求項9のうちのいずれか1項に記載のディジタル信
号圧縮方法。
18. When determining a temporal length of a processing block based on a change of an input signal of the processing block, a predetermined boundary value for determining the temporal length is set as an amplitude of the input signal,
10. The digital signal compression method according to claim 6, wherein the digital signal compression method is variable according to the frequency.
【請求項19】 上記境界値は、入力信号の振幅、周波
数に応じて複数の階段状の値をとることを特徴とする請
求項18記載のディジタル信号圧縮方法。
19. The digital signal compression method according to claim 18, wherein the boundary value takes a plurality of stepwise values according to the amplitude and frequency of the input signal.
【請求項20】 上記処理ブロック長の決定の際には、
上記他の処理ブロックの信号が前記処理ブロックの信号
に及ぼす聴覚上の特性を、周波数軸上のスペクトル及び
/又は直交変換係数のエネルギ及び/又はパワー又はピ
ーク情報を用いて計算して、当該処理ブロックの時間的
長さの決定を行うことを特徴とする請求項6又は8記載
のディジタル信号圧縮方法。
20. When determining the processing block length,
The auditory characteristic that the signal of the other processing block exerts on the signal of the processing block is calculated by using the energy and / or power or peak information of the spectrum on the frequency axis and / or the orthogonal transformation coefficient, and the processing concerned. 9. The digital signal compression method according to claim 6, wherein the time length of the block is determined.
【請求項21】 上記他の処理ブロックの信号が前記処
理ブロックの信号に及ぼす聴覚上の特性を計算する際に
用いる周波数軸上のスペクトル及び/又は直交変換係数
を、圧縮のためのビットの割当及び/又はブロックフロ
ーティングに用いる直交変換後の時間軸上のスペクトル
及び/又は直交変換係数と共用することを特徴とする請
求項20記載のディジタル信号圧縮方法。
21. Allocation of bits for compression of spectrum and / or orthogonal transform coefficients on the frequency axis used when calculating the auditory characteristics of the signal of the other processing block on the signal of the processing block. 21. The digital signal compression method according to claim 20, wherein the digital signal compression method is shared with a spectrum on a time axis after orthogonal transformation and / or an orthogonal transformation coefficient used for block floating.
【請求項22】 請求項18記載のディジタル信号圧縮
方法及び請求項20記載のディジタル信号圧縮方法の機
能を合わせもつことを特徴とするディジタル信号圧縮方
法。
22. A digital signal compression method having the functions of the digital signal compression method according to claim 18 and the digital signal compression method according to claim 20.
【請求項23】 上記処理ブロックの入力信号の変化を
基に処理ブロックの時間的長さを決定する際には、入力
信号の周期的変化、及び/又は繰り返しのパルス又は周
期的特徴を基にした判断を行うことを特徴とする請求項
7、8、9、18、19、20、21又は22記載のデ
ィジタル信号圧縮方法。
23. When determining the temporal length of a processing block based on the change of the input signal of the processing block, the periodic change of the input signal and / or the repeating pulse or periodic characteristic is used. 23. The digital signal compression method according to claim 7, 8, 9, 18, 19, 20, 21 or 22, wherein the determination is performed.
【請求項24】 ディジタル信号を情報圧縮するディジ
タル信号圧縮装置において、 許容可能なノイズスペクトルを求める許容ノイズスペク
トル算出手段と、 上記許容ノイズスペクトル算出手段により求めた許容可
能なノイズスペクトルを時間と周波数について細分化し
た小ブロックに分配し、圧縮のためのビット割当を行う
ビット割当手段と、 規定されたビット数と上記ビット割当手段により求めた
ビット割当数との差から、レベル差を求めるレベル差算
出手段と、 上記レベル差算出手段により求めたレベル差を基に入力
信号の特性を変化させて、ビット割当数の制御を行うビ
ット割当数制御手段とを有し、 入力信号の特性を変化させることによるビット割当数の
制御を、必要に応じて複数回実行し、最適なビット配分
を決定することを特徴とするディジタル信号圧縮装置。
24. In a digital signal compressing apparatus for compressing information of a digital signal, an allowable noise spectrum calculating means for obtaining an allowable noise spectrum, and an allowable noise spectrum obtained by the allowable noise spectrum calculating means with respect to time and frequency. A level difference calculation that obtains a level difference from a bit allocation means that allocates bits for compression to subdivided small blocks and the difference between the specified number of bits and the bit allocation number obtained by the bit allocation means. Means and bit allocation number control means for controlling the number of bit allocations by changing the characteristics of the input signal based on the level difference obtained by the level difference calculating means, and changing the characteristics of the input signal. Control the number of bit allocation by executing multiple times as necessary to determine the optimal bit allocation. Digital signal compressor according to symptoms.
【請求項25】 ディジタル信号を情報圧縮するディジ
タル信号圧縮装置において、 時間軸上のスペクトルデータを得る時間軸スペクトルデ
ータ形成手段と、 上記時間軸上のスペクトルデータから許容可能なノイズ
スペクトルを求める許容ノイズスペクトル算出手段と、 上記許容ノイズスペクトル算出手段により求めた許容可
能なノイズスペクトルを時間と周波数について細分化し
た小ブロックに分配し、圧縮のためのビット割当を行う
ビット割当手段と、 規定されたビット数と上記ビット割当手段により求めた
ビット割当数との差から、レベル差を求めるレベル差算
出手段と、 入力信号の周波数軸上のスペクトルデータの特性を変化
させる特性変化手段とを有し、 上記レベル差算出手段により求めたレベル差を基にし
て、上記特性変化手段において入力信号の周波数軸上の
スペクトルデータの特性を変化させて、ビット割当数の
制御を行うことを特徴とするディジタル信号圧縮装置。
25. In a digital signal compression apparatus for compressing information of a digital signal, a time axis spectrum data forming means for obtaining spectrum data on the time axis, and an allowable noise for obtaining an allowable noise spectrum from the spectrum data on the time axis. A spectrum calculation means, a bit allocation means for distributing the allowable noise spectrum obtained by the allowable noise spectrum calculation means into small blocks subdivided in time and frequency, and allocating bits for compression, and defined bits The level difference calculating means for obtaining a level difference from the difference between the number and the bit allocation number obtained by the bit allocating means, and a characteristic changing means for changing the characteristic of the spectrum data on the frequency axis of the input signal. Based on the level difference calculated by the level difference calculating means, A digital signal compression device, characterized in that the characteristics of spectrum data on the frequency axis of an input signal are changed at each stage to control the number of bit allocation.
【請求項26】 ディジタル信号を情報圧縮するディジ
タル信号圧縮装置において、 許容可能なノイズスペクトルを求める許容ノイズスペク
トル算出手段と、 上記許容ノイズスペクトル算出手段により求めた許容可
能なノイズスペクトルを時間と周波数について細分化し
た小ブロックに分配し、圧縮のためのビット割当を行う
ビット割当手段と、 規定されたビット数と上記ビット割当手段により求めた
ビット割当数との差から、レベル差を求めるレベル差算
出手段と、 入力信号を時間軸上でフィルタリングするフィルタ手段
と、 上記レベル差を減少させるフィルタ係数を求めるフィル
タ係数決定手段とを有し、 上記フィルタ係数決定手段により求めたフィルタ係数を
基にして、上記フィルタ手段において入力信号を時間軸
上でフィルタリングすることによって、ビット割当数の
制御を行うことを特徴とするディジタル信号圧縮装置。
26. In a digital signal compression apparatus for compressing information of a digital signal, an allowable noise spectrum calculating means for obtaining an allowable noise spectrum, and an allowable noise spectrum obtained by the allowable noise spectrum calculating means with respect to time and frequency. A level difference calculation for obtaining a level difference from a bit allocation means for distributing bits to subdivided small blocks and allocating bits for compression, and a difference between the specified number of bits and the number of bit allocation obtained by the bit allocation means. Means, a filter means for filtering the input signal on the time axis, and a filter coefficient determination means for determining a filter coefficient for reducing the level difference, based on the filter coefficient determined by the filter coefficient determination means, In the filter means, the input signal is filtered on the time axis. A digital signal compression device characterized in that the number of bits allocated is controlled by controlling the number of bits.
【請求項27】 入力信号を複数個の帯域に分割する帯
域分割フィルタを設け、当該帯域分割フィルタをビット
割当数の制御を行うためのフィルタ手段と共用すること
を特徴とする請求項26記載のディジタル信号圧縮装
置。
27. The band division filter for dividing an input signal into a plurality of bands is provided, and the band division filter is shared with a filter means for controlling the number of bit allocations. Digital signal compression device.
【請求項28】 入力信号の特性を変化させる為の情報
を複数処理ブロックに渡って遅延或いは記憶する遅延手
段を設け、時間的に前の処理ブロックの情報を用いて上
記入力信号の特性を変化させる処理を行って、ビット割
当数の制御を行うことを特徴とする請求項24から請求
項27のうちのいずれか1項に記載のディジタル信号圧
縮装置。
28. A delay means for delaying or storing information for changing the characteristic of an input signal over a plurality of processing blocks is provided, and the characteristic of the input signal is changed by using information of a processing block preceding in time. 28. The digital signal compressing device according to claim 24, wherein the number of allocated bits is controlled by performing the processing.
【請求項29】 入力信号に適応してその処理ブロック
の長さを可変とし、当該処理ブロックの入力信号の変化
及び他の処理ブロックの入力信号の変化、及び/又はパ
ワー、或いはエネルギ又はピーク情報を基に、当該処理
ブロックの長さを決定する処理ブロック長決定手段を設
けることを特徴とする請求項24から請求項28のうち
のいずれか1項に記載のディジタル信号圧縮装置。
29. The length of a processing block is made variable according to an input signal, and a change in the input signal of the processing block and a change in the input signal of another processing block, and / or power, or energy or peak information. 29. The digital signal compression apparatus according to claim 24, further comprising processing block length determining means for determining the length of the processing block based on the above.
【請求項30】 入力信号に適応してその処理ブロック
の長さを可変とし、当該処理ブロックの入力信号の変化
及び時間的に処理ブロックの最大より長い時間幅の入力
信号により得られる入力信号の変化情報を基に当該処理
ブロックの長さを決定する処理ブロック長決定手段を設
けることを特徴とする請求項24から請求項28のうち
のいずれか1項に記載のディジタル信号圧縮装置。
30. The length of the processing block is made variable according to the input signal, and the change of the input signal of the processing block and the input signal obtained by the input signal having a time width longer than the maximum of the processing block in terms of time 29. The digital signal compression apparatus according to claim 24, further comprising processing block length determining means for determining the length of the processing block based on the change information.
【請求項31】 入力信号に適応してその処理ブロック
の長さを可変とし、当該処理ブロックの入力信号の変化
及び他の処理ブロックの入力信号の変化、及び/又はパ
ワー、或いはエネルギ又はピーク情報を基に、当該処理
ブロックの長さを決定する機能、及び、入力信号に適応
してその処理ブロックの長さを可変とし、当該処理ブロ
ックの入力信号の変化及び時間的に処理ブロックの最大
より長い時間幅の入力信号により得られる入力信号の変
化情報を基に当該処理ブロックの長さを決定する機能
を、合わせもつ処理ブロック長決定手段を有することを
特徴とする請求項24から請求項28のうちのいずれか
1項に記載のディジタル信号圧縮装置。
31. A length of a processing block is made variable according to an input signal, and a change in an input signal of the processing block and a change in an input signal of another processing block, and / or power, or energy or peak information. Based on, the function to determine the length of the processing block, and the length of the processing block is made variable by adapting to the input signal, the change of the input signal of the processing block and the maximum of the processing block in time. 29. The processing block length determining means having the function of determining the length of the processing block based on the change information of the input signal obtained by the input signal having a long time width, is provided. The digital signal compression device according to claim 1.
【請求項32】 上記処理ブロック長決定手段は、処理
ブロックの長さを決定する要素の決定に関与する割合
を、固定或いは入力信号に適応した割合、及び/又は所
定の割合で、併用若しくは単独に使用することを特徴と
する請求項31記載のディジタル信号圧縮装置。
32. The processing block length determining means is a combination or a single of the ratios involved in the determination of the element that determines the length of the processing block, fixed or adapted to the input signal, and / or a predetermined ratio. 32. The digital signal compressing device according to claim 31, which is used for.
【請求項33】 入力信号はオーディオ信号であり、少
なくとも大部分の量子化雑音の発生をコントロールする
ブロックの周波数幅を、高域ほど広くしてゆくことを特
徴とする請求項24から請求項32のうちいずれか1項
に記載のディジタル信号圧縮装置。
33. The input signal is an audio signal, and the frequency width of a block for controlling the generation of at least most of the quantization noise is made wider in a higher frequency range. The digital signal compression device according to any one of the above.
【請求項34】 直交変換を用いて、時間軸信号から周
波数軸上の複数の帯域への分割を行う分割直交変換手段
と、 上記直交変換における直交変換サイズの可変と共に当該
直交変換時に使用する窓関数の形状も変化させる直交変
換サイズ及び窓関数形状可変手段とを設けることを特徴
とする請求項33記載のディジタル信号圧縮装置。
34. Split orthogonal transform means for splitting a time axis signal into a plurality of bands on the frequency axis using orthogonal transform, and a window used at the time of the orthogonal transform together with a variable orthogonal transform size in the orthogonal transform. 34. The digital signal compression apparatus according to claim 33, further comprising an orthogonal transformation size and window function shape changing means for changing the shape of the function.
【請求項35】 上記分割直交変換手段は、上記時間軸
信号を複数の帯域に分割し、当該分割された帯域毎に複
数のサンプルからなるブロックを形成し、各帯域のブロ
ック毎に直交変換を行い係数データを得ることを特徴と
する請求項34記載のディジタル信号圧縮装置。
35. The division orthogonal transformation means divides the time axis signal into a plurality of bands, forms a block made up of a plurality of samples for each of the divided bands, and performs an orthogonal transformation for each block of each band. The digital signal compression apparatus according to claim 34, wherein coefficient data is obtained by performing the operation.
【請求項36】 上記直交変換前の時間軸信号から周波
数軸上の複数の帯域への分割における分割周波数幅を、
略高域程広くすることを特徴とする請求項35記載のデ
ィジタル信号圧縮装置。
36. A division frequency width in dividing the time-axis signal before the orthogonal transformation into a plurality of bands on the frequency axis,
36. The digital signal compressing device according to claim 35, wherein the digital signal compressing device has a wider width in a substantially higher region.
【請求項37】 上記分割周波数幅を最低域の連続した
2帯域で同一とすることを特徴とする請求項36記載の
ディジタル信号圧縮装置。
37. The digital signal compressing device according to claim 36, wherein the divided frequency widths are the same in two consecutive bands of the lowest band.
【請求項38】 上記ビット割当の際には、略信号通過
帯域以上の帯域の信号成分に対する圧縮符号のメイン情
報及び/又はサブ情報への割り当てを阻止することを特
徴とする請求項37記載のディジタル信号圧縮装置。
38. The allocation of a compression code to main information and / or sub-information for a signal component in a band substantially equal to or more than a signal pass band is prevented in the bit allocation. Digital signal compression device.
【請求項39】 上記複数の帯域への分割にはクワドラ
チャ・ミラー・フィルタを用いることを特徴とする請求
項35から請求項38のうちいずれか1項に記載のディ
ジタル信号圧縮装置。
39. The digital signal compression apparatus according to claim 35, wherein a quadrature mirror filter is used for the division into the plurality of bands.
【請求項40】 上記直交変換として変更離散コサイン
変換を用いることを特徴とする請求項34から請求項3
9のうちいずれか1項に記載のディジタル信号圧縮装
置。
40. The method according to claim 34, wherein a modified discrete cosine transform is used as the orthogonal transform.
9. The digital signal compression device according to any one of 9.
【請求項41】 上記処理ブロックの入力信号の変化を
基に処理ブロックの時間的長さを決定する際に、その時
間的長さ決定のための所定の境界値を入力信号の振幅、
周波数に応じて可変とすることを特徴とする請求項29
から請求項32のうちのいずれか1項に記載のディジタ
ル信号圧縮装置。
41. When determining a temporal length of a processing block based on a change in an input signal of the processing block, a predetermined boundary value for determining the temporal length is set as an amplitude of the input signal,
30. It is variable according to the frequency.
33. The digital signal compression device according to claim 32.
【請求項42】 上記境界値は、入力信号の振幅、周波
数に応じて複数の階段状の値をとることを特徴とする請
求項41記載のディジタル信号圧縮装置。
42. The digital signal compression apparatus according to claim 41, wherein the boundary value takes a plurality of stepwise values according to the amplitude and frequency of the input signal.
【請求項43】 上記処理ブロック長決定手段は、上記
他の処理ブロックの信号が前記処理ブロックの信号に及
ぼす聴覚上の特性を、周波数軸上のスペクトル及び/又
は直交変換係数のエネルギ及び/又はパワー又はピーク
情報を用いて計算して、当該処理ブロックの時間的長さ
の決定を行うことを特徴とする請求項29又は31記載
のディジタル信号圧縮装置。
43. The processing block length determining means determines an auditory characteristic that a signal of the other processing block exerts on a signal of the processing block, energy of spectrum and / or orthogonal transform coefficient on a frequency axis, and / or 32. The digital signal compressing device according to claim 29, wherein the time length of the processing block is determined by calculation using power or peak information.
【請求項44】 上記他の処理ブロックの信号が前記処
理ブロックの信号に及ぼす聴覚上の特性を計算する際に
用いる周波数軸上のスペクトル及び/又は直交変換係数
を、圧縮のためのビットの割当及び/又はブロックフロ
ーティングに用いる直交変換後の時間軸上のスペクトル
及び/又は直交変換係数と共用することを特徴とする請
求項43記載のディジタル信号圧縮装置。
44. Bit allocation for compression of spectrum and / or orthogonal transform coefficients on the frequency axis used in calculating the auditory characteristics of the signal of the other processing block on the signal of the processing block. 44. The digital signal compression apparatus according to claim 43, wherein the digital signal compression apparatus is also used as a spectrum on a time axis after orthogonal transformation and / or an orthogonal transformation coefficient used for block floating.
【請求項45】 請求項41記載のディジタル信号圧縮
装置及び請求項43記載のディジタル信号圧縮装置の機
能を合わせもつことを特徴とするディジタル信号圧縮装
置。
45. A digital signal compressing apparatus having the functions of the digital signal compressing apparatus according to claim 41 and the digital signal compressing apparatus according to claim 43.
【請求項46】 上記処理ブロックの入力信号の変化を
基に処理ブロックの時間的長さを決定する際には、入力
信号の周期的変化、及び/又は繰り返しのパルス又は周
期的特徴を基にした判断を行うことを特徴とする請求項
30、31、32、41、42、43、44又は45記
載のディジタル信号圧縮装置。
46. When determining the temporal length of a processing block based on the change of the input signal of the processing block, the periodic change of the input signal and / or the repeating pulse or periodic characteristic is used. 46. The digital signal compression device according to claim 30, 31, 32, 41, 42, 43, 44 or 45, wherein the determination is made.
【請求項47】 請求項1から請求項23のうちのいず
れか1項に記載のディジタル信号圧縮方法、又は、請求
項24から請求項46のうちのいずれか1項に記載のデ
ィジタル信号圧縮装置によって圧縮した圧縮データを記
録してなることを特徴とする記録媒体。
47. The digital signal compression method according to any one of claims 1 to 23, or the digital signal compression device according to any one of claims 24 to 46. A recording medium characterized by recording compressed data compressed by.
【請求項48】 圧縮した圧縮データを伝送することを
特徴とする請求項1から請求項23のうちのいずれか1
項に記載のディジタル信号圧縮方法。
48. One of claims 1 to 23, characterized in that compressed compressed data is transmitted.
A method for compressing a digital signal according to item.
【請求項49】 圧縮した圧縮データを伝送することを
特徴とする請求項24から請求項46のうちのいずれか
1項に記載のディジタル信号圧縮装置。
49. The digital signal compressing device according to claim 24, which transmits compressed compressed data.
JP26501094A 1994-10-28 1994-10-28 Digital signal compression method and apparatus Expired - Fee Related JP3334374B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26501094A JP3334374B2 (en) 1994-10-28 1994-10-28 Digital signal compression method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26501094A JP3334374B2 (en) 1994-10-28 1994-10-28 Digital signal compression method and apparatus

Publications (2)

Publication Number Publication Date
JPH08125543A true JPH08125543A (en) 1996-05-17
JP3334374B2 JP3334374B2 (en) 2002-10-15

Family

ID=17411330

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26501094A Expired - Fee Related JP3334374B2 (en) 1994-10-28 1994-10-28 Digital signal compression method and apparatus

Country Status (1)

Country Link
JP (1) JP3334374B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999003096A1 (en) * 1997-07-11 1999-01-21 Sony Corporation Information decoder and decoding method, information encoder and encoding method, and distribution medium
JP2006154629A (en) * 2004-12-01 2006-06-15 Sharp Corp Digital signal encoding device and digital signal recording device
US7343292B2 (en) 2000-10-19 2008-03-11 Nec Corporation Audio encoder utilizing bandwidth-limiting processing based on code amount characteristics
WO2024080723A1 (en) * 2022-10-14 2024-04-18 삼성전자 주식회사 Electronic device and method for processing audio signal

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999003096A1 (en) * 1997-07-11 1999-01-21 Sony Corporation Information decoder and decoding method, information encoder and encoding method, and distribution medium
US6415251B1 (en) 1997-07-11 2002-07-02 Sony Corporation Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one
US7343292B2 (en) 2000-10-19 2008-03-11 Nec Corporation Audio encoder utilizing bandwidth-limiting processing based on code amount characteristics
JP2006154629A (en) * 2004-12-01 2006-06-15 Sharp Corp Digital signal encoding device and digital signal recording device
WO2024080723A1 (en) * 2022-10-14 2024-04-18 삼성전자 주식회사 Electronic device and method for processing audio signal

Also Published As

Publication number Publication date
JP3334374B2 (en) 2002-10-15

Similar Documents

Publication Publication Date Title
JP3123286B2 (en) Digital signal processing device or method, and recording medium
EP2391030B1 (en) Methods and apparatus for recording reproducing, transmitting and/or receiving compressed data and recording medium therefor
US5490130A (en) Apparatus and method for compressing a digital input signal in more than one compression mode
JP3173218B2 (en) Compressed data recording method and apparatus, compressed data reproducing method, and recording medium
JP3186307B2 (en) Compressed data recording apparatus and method
JP3531177B2 (en) Compressed data recording apparatus and method, compressed data reproducing method
US5608713A (en) Bit allocation of digital audio signal blocks by non-linear processing
KR100339325B1 (en) Signal Processing Method, Information Compression Device, Compression Information Extension Device, Compression Information Recording / Transmitter
JPH08162964A (en) Information compression device and method therefor, information elongation device and method therefor and recording medium
JP3334374B2 (en) Digital signal compression method and apparatus
JP3531178B2 (en) Digital signal processing apparatus and method
JP3477735B2 (en) Compressed data conversion apparatus and method
JP3175456B2 (en) Digital signal processor
JP3186489B2 (en) Digital signal processing method and apparatus
JP3334375B2 (en) Digital signal compression method and apparatus
JPH08181619A (en) Digital signal compression method and device therefor and recording medium
JP3552239B2 (en) Compressed data recording apparatus and method, and compressed data reproducing method
JPH06268610A (en) Digital signal processor
JPH07231259A (en) Method and device for processing digital signal and recording medium

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020702

LAPS Cancellation because of no payment of annual fees