JP2971715B2 - Digital audio signal transmission method and digital audio signal encoding method - Google Patents

Digital audio signal transmission method and digital audio signal encoding method

Info

Publication number
JP2971715B2
JP2971715B2 JP27587393A JP27587393A JP2971715B2 JP 2971715 B2 JP2971715 B2 JP 2971715B2 JP 27587393 A JP27587393 A JP 27587393A JP 27587393 A JP27587393 A JP 27587393A JP 2971715 B2 JP2971715 B2 JP 2971715B2
Authority
JP
Japan
Prior art keywords
signal
signal component
maximum value
frequency
frequency band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP27587393A
Other languages
Japanese (ja)
Other versions
JPH07106978A (en
Inventor
肇 小日向
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Abit Corp
Original Assignee
Abit Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Abit Corp filed Critical Abit Corp
Priority to JP27587393A priority Critical patent/JP2971715B2/en
Publication of JPH07106978A publication Critical patent/JPH07106978A/en
Application granted granted Critical
Publication of JP2971715B2 publication Critical patent/JP2971715B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、デジタル音声信
号の伝送方法と符号化方法に関し、特にISDNにあっ
てリアルタイムでデジタル音声信号のデータを圧縮する
符号化方法とこの圧縮符号化信号を伝送する伝送方法に
関する。
TECHNICAL FIELD The present invention relates to a digital audio signal.
The present invention relates to a method of transmitting and encoding a signal , and in particular, compresses digital audio signal data in real time in ISDN.
Encoding method and transmission method for transmitting this compressed encoded signal
Related.

【0002】[0002]

【従来の技術】デジタル音声信号の符号化、およびそれ
に関連する音声信号のデジタル記録・伝送は既に実用に
供されている。例えば、デジタルコンパクトカセットに
よる録音に関して、藤本健文著「フィリップスDCCシ
ステムのキイ・ポイント:サイコ・アクースチックPA
SCコードの特徴と詳細」株式会社アイエー出版、ラジ
オ技術誌、1991年,12月,第156−161頁を
参照されたい。ここでは、高効率音声信号符号化(PA
SC:Precision AdaptiveSubb
and Cording)が使用されている。
2. Description of the Related Art Encoding of digital audio signals and digital recording and transmission of audio signals related thereto have already been put to practical use. For example, regarding recording using a digital compact cassette, see "Key point of Philips DCC system: Psycho Axic PA" by Kenfumi Fujimoto.
Features and Details of SC Code ", IAI Publishing Co., Ltd., Radio Technology Magazine, December 1991, pp. 156-161. Here, high-efficiency speech signal coding (PA
SC: Precision AdaptiveSubb
and Cording) has been used.

【0003】この符号化方法では、音声信号を先ずバン
ドパス・フィルタに導入し、この信号を例えば32の等
間隔の帯域に分割する。DCCシステムでは、通常、標
本化周波数が48kHzであるので750Hzの帯域幅
が採用される。そして、各32の帯域毎に12個の入力
データが得られる毎に1つのユニットとして処理し、3
2*12の384個の入力データを、人間の可聴音声信
号レベルと音声感度に関する周波数依存性を加味して、
音声信号の量子化と符号化を行っている。
In this encoding method, an audio signal is first introduced into a band-pass filter, and this signal is divided into, for example, 32 equally-spaced bands. DCC systems typically employ a 750 Hz bandwidth because the sampling frequency is 48 kHz. Each time 12 input data is obtained for each of the 32 bands, the processing is performed as one unit.
The 384 input data of 2 * 12 are divided into human audible audio signal levels and frequency sensitivity with respect to the audio sensitivity,
Quantizes and encodes audio signals.

【0004】周知のように、音声信号の検知に関して著
しい周波数依存性がある。つまり、周波数が0Hz付近
および約15kHz以上の音響信号(音圧)は人間の耳
に検知できない。そして、特に2〜5kHzで音響信号
の検知感度が高く、この点に着目してPASCで音声の
受信品質を殆ど低下させることなく、音声信号の符号化
を効率化し高品質の音声信号の記録を可能にしている。
[0004] As is well known, there is a significant frequency dependence for the detection of audio signals. That is, an acoustic signal (sound pressure) having a frequency near 0 Hz and about 15 kHz or more cannot be detected by human ears. In particular, the detection sensitivity of the acoustic signal is high at 2 to 5 kHz, and by paying attention to this point, the encoding of the audio signal can be efficiently performed and the recording of the high-quality audio signal can be performed without substantially lowering the reception quality of the audio by the PASC. Making it possible.

【0005】他方、電電公社(NTT)により既に19
86年に提唱されているISDN計画としての高度情報
通信システム(INS:Information Ne
twork System)では、データの伝送速度は
64kbpsが使用されている。このような伝送速度
は、当然デジタル音声信号の伝送量に、上記DCCシス
テムより大きな制約、つまり伝送される単位時間当たり
のデータ量に制限を課すことになる。
[0005] On the other hand, 19
Advanced Information Communication System (INS: Information Ne) as an ISDN project proposed in 1986
work system), a data transmission speed of 64 kbps is used. Such a transmission speed naturally imposes a greater restriction on the transmission amount of the digital audio signal than the DCC system, that is, a limitation on the amount of data transmitted per unit time.

【0006】このようにデータ伝送量に制限のある系に
PASCのような符号化法を用いると、特に小さな実音
声信号には、単位音声信号あたりの符号化に割り当てら
れるビット数が少なくなり、量子化した信号をこの少な
いビット数に効率的に圧縮符号化するために、偶数のス
テップで音声信号を量子化している。
[0006] When a coding method such as PASC is used for a system having a limited data transmission amount, the number of bits allocated to coding per unit voice signal is reduced particularly for a small real voice signal. In order to efficiently compress and encode the quantized signal into this small number of bits, the audio signal is quantized in even steps.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、音声信
号を偶数のステップで量子化すると、「0」に近い値で
あっても、正負いずれかの値に量子化されるので、逆量
子化して再生したときの受信信号は、原信号と異なった
ものとなる。特に、ノイズとなる信号は、「0」に近い
値で頻発するので、ノイズが量子化と逆量子化によって
実音声と認識されることとなり、受信品質が低下する。
However, when an audio signal is quantized in even steps, even if the value is close to "0", it is quantized to either a positive or negative value. The received signal at this time is different from the original signal. In particular, since a signal that becomes noise frequently occurs at a value close to “0”, the noise is recognized as real voice by quantization and inverse quantization, and the reception quality is reduced.

【0008】この問題は、奇数のステップにより音声信
号を量子化することにより解決できるが、上述したよう
に、単位音声信号毎に奇数のステップで表された量子化
信号を整数ビットで符号化すると冗長となり、効率的な
圧縮符号化ができない。
This problem can be solved by quantizing the audio signal by an odd number of steps. As described above, if the quantized signal represented by the odd number of steps is encoded for each unit audio signal by integer bits, It becomes redundant, and efficient compression encoding cannot be performed.

【0009】また、量子化する前に行う音声信号の正規
化は、32の帯域毎にその時間軸方向の12のデータの
内最大値である信号成分で、該帯域内の音声信号の信号
成分を割り算し、絶対値が「1」以下の正規化信号成分
を得ているが、最大値が突出した値であると、他の正規
化信号成分が著しく小さい値となり、量子化歪みが大き
く影響するものとなる。
The normalization of the audio signal performed before quantization is performed by using the signal component which is the maximum value among the 12 data in the time axis direction for each of 32 bands, and the signal component of the audio signal within the band. Is obtained to obtain a normalized signal component whose absolute value is equal to or less than “1”. However, if the maximum value is a prominent value, the other normalized signal components have extremely small values, and the quantization distortion is greatly affected. Will do.

【0010】更に、上述のPASCによるデータ伝送で
は、周波数帯域とこの周波数帯域に割り当てられた量子
化ビット数との関係を示すコーディング情報を圧縮符号
化された入力データとともに伝送しているが、データ伝
送量に制限のある伝送系を用いるときには、このコーデ
ィング情報を含めることによって伝送可能な総ビット数
が減少し、各データに割り当てられるビット数の減少に
より再生した音質が劣化する。
[0010] Further, in the above-mentioned data transmission by PASC, coding information indicating the relationship between a frequency band and the number of quantization bits allocated to this frequency band is transmitted together with the compression-coded input data. When a transmission system with a limited transmission amount is used, the total number of bits that can be transmitted is reduced by including this coding information, and the reproduced sound quality is degraded due to the reduction in the number of bits allocated to each data.

【0011】この発明は、上述の問題に鑑み、奇数のス
テップで表された量子化信号を効率的に圧縮符号化する
ことができ、1つの入力データの信号成分が突出して高
いものとなっても、これにつられて他の信号成分が小さ
い値に正規化されることが無く、また、ISDNのよう
なデータ伝送量にかなり制約がある伝送系を用いても、
各データに割り当てられるビット数が減少することがな
く、高品質の音声信号を保つことができるデジタル音声
信号の伝送方法とデジタル音声信号の符号化方法を提供
する。
According to the present invention, in view of the above-described problems, a quantized signal represented by an odd number of steps can be efficiently compression-encoded, and the signal component of one input data becomes prominently high. However, even if other signal components are not normalized to a small value due to this, and even if a transmission system such as ISDN which has a considerably limited data transmission amount is used,
Digital audio that can maintain a high-quality audio signal without reducing the number of bits allocated to each data
A signal transmission method and a digital audio signal encoding method are provided.

【0012】[0012]

【課題を解決するための手段】請求項1のデジタル音声
信号の伝送方法は、デジタル音声信号を送信する送信装
置側で、 (a) 所定標本化周波数のデジタル音声信号を狭帯域
多重デジタルフィルタに入力し、 (b) 狭帯域多重デジタルフィルタで多重周波数帯域
に分離し、一定時間間隔の順次時間(T)で各周波数帯
域(F)の信号成分(S(F,T))を求め、 (c) 各周波数帯域(F)内で信号成分(S(F,
T))の絶対値の最大値である時間軸最大値(TMAX
(F))を求め、(d) 単位処理時間内に伝送可能な総ビット数と周波
数帯域(F)の時間軸最大値(TMAX(F))から、
各周波数帯域(F)単位で、該周波数帯域(F)の信号
成分S(F,T)を量子化する量子化ビット数を割り当
て、 (e) 各周波数帯域(F)の各信号成分(S(F,
T))を正規化して正規信号成分(NS(F,T))と
し、 (f) 正規信号成分(NS(F,T))を、その正規
信号成分(NS(F,T))が属する周波数帯域(F)
に割り当てられた量子化ビット数の量子化信号(QS
(F,T))に変換し、 (g) 各周波数帯域(F)の時間軸最大値(TMAX
(F))を含むフレーム情報符号と、各周波数帯域
(F)の同一時間軸上の全ての量子化信号(QS(F,
T))を連続させた音声信号データ(DT(F))とか
らなるデータ信号を受信装置側へ送出し、送信装置から
送出されたデータ信号を受信する受信装置側で、 (h) 受信したデータ信号から、フレーム情報符号に
含まれた時間軸最大値(TMAX(F))を復号化し、 (i) 送信装置側の(d)と同一処理過程で、単位処
理時間内に伝送可能な総ビット数と周波数帯域(F)の
時間軸最大値(TMAX(F))から、各周波数帯域
(F)に割り当てられた量子化ビット数を求め、 (j) 音声信号データ(DT(F))を、各周波数帯
域(F)単位で、該周波数帯域(F)に割り当てられた
量子化ビット数毎に、該周波数帯域(F)の信号成分
(S(F,T))数に分割し、各周波数帯域(F)の同
一時間軸上の全ての量子化信号(QS(F,T))を取
り出し、逆量子化により逆正規化音声信号(TNS
(F,T))を形成し、 (k) 逆正規化音声信号(TNS(F,T))を逆正
規化して逆音声信号(TS(F,T))を求め、 (l) 狭帯域多重逆デジタルフィルタにより、逆音声
信号(TS(F,T))から所望の標本化周波数のデジ
タル出力音声信号を求め、信号成分S(F,T)を量子
化する量子化ビット情報を含めずに、送信装置から受信
装置へデータ信号を送出することを特徴とする。
A digital voice according to claim 1 .
The signal transmission method is a transmission device for transmitting a digital audio signal.
In置側, (a) digital audio signal having a predetermined sampling frequency and input to the narrow band multiplex digital filter, (b) narrow in band multiplexer digital filter is separated into multiple frequency bands, sequentially time a predetermined time interval (T) The signal component (S (F, T)) of each frequency band (F) is obtained by: (c) The signal component (S (F, T) within each frequency band (F)
T)), the maximum value of the time axis (TMAX) which is the maximum value of the absolute value of
(F)), and (d) the total number of bits and frequency that can be transmitted within the unit processing time.
From the maximum value of the time axis of several bands (F) (TMAX (F)),
For each frequency band (F), the signal of the frequency band (F)
Allocate the number of quantization bits to quantize the component S (F, T)
Te, (e) the signal components of each frequency band (F) (S (F,
T)) is normalized to obtain a normal signal component (NS (F, T)).
And, (f) is the normal signal component (NS (F, T)) , the normal
Frequency band (F) to which signal component (NS (F, T)) belongs
Quantized signal of the number of quantization bits (QS
(F, T)), and (g) the time axis maximum value (TMAX) of each frequency band (F).
(F) Frame information code including
(F), all the quantized signals (QS (F,
T)) continuous audio signal data (DT (F))
Data signal to the receiving device, and from the transmitting device
On the receiving device side receiving the transmitted data signal, (h) converting the received data signal into a frame information code
The contained time axis maximum value (TMAX (F)) is decoded, and (i) the same processing as (d) on the transmitting device side,
Of the total number of bits that can be transmitted within the processing time and the frequency band (F)
From the time axis maximum value (TMAX (F)), each frequency band
( J) calculating the number of quantization bits assigned to (F), and (j) converting the audio signal data (DT (F)) into each frequency band.
Assigned to the frequency band (F) in units of frequency band (F)
For each quantization bit number, the signal component of the frequency band (F)
(S (F, T)) and divide the frequency band (F)
Take all quantized signals (QS (F, T)) on one time axis
And the inverse normalized audio signal (TNS)
( K) form the inverse normalized speech signal (TNS (F, T))
Normalized to obtain an inverse audio signal (TS (F, T)), (l) inverse audio signal by a narrow band multiplex inverse digital filter
From the signal (TS (F, T)), a digital signal of a desired sampling frequency
Output audio signal and quantize the signal component S (F, T).
Received from the transmitter without including quantization bit information
A data signal is transmitted to the device.

【0013】請求項1の発明は、本発明者が既に提案し
ている狭帯域の多重デジタルフィルタを使用している
(これに関しては特許出願準備中)。このフィルタは高
速デジタル演算が可能であるため、リアルタイムでデジ
タル音声信号(PCM)の伝送処理を行う場合に特に適
している。デジタル音声信号は、この狭帯域多重デジタ
ルフィルタにより、時間軸と周波数軸によってマトリッ
クス状に分割された複数の信号成分S(F,T)が求め
られる。
The invention of claim 1 uses a narrow-band multiplex digital filter which has already been proposed by the present inventor. Since this filter can perform high-speed digital operation, it is particularly suitable for transmitting digital audio signals (PCM) in real time. In the digital audio signal, a plurality of signal components S (F, T) divided in a matrix by the time axis and the frequency axis are obtained by the narrowband multiplex digital filter.

【0014】このマトリックス状の信号成分(S(F,
T))を時間軸に沿って比較し、周波数帯域(F)毎の
時間軸最大値(TMAX(F))を求め、単位処理時間
内に伝送可能な総ビット数とこの時間軸最大値(TMA
X(F))の大きさから、各周波数帯域(F)単位で、
信号成分(S(F,T))を量子化する量子化ビット数
が割り当てられる。
The matrix signal components (S (F,
T)) along the time axis to determine the maximum value of the time axis (TMAX (F)) for each frequency band (F), and calculate the unit processing time
The total number of bits that can be transmitted within a frame and the maximum value of this time axis (TMA
X (F)), from each frequency band (F),
Number of quantization bits for quantizing signal component (S (F, T))
Is assigned.

【0015】時間軸最大値(TMAX(F))の小さい
値である周波数帯域(F)においては、全ての信号成分
(S(F,T))が更に小さい値であるので、少ない量
子化ビット数を割り当てても、音声信号の品質を低下さ
せることがない。時間軸最大値(TMAX(F))が可
聴音声しきい値(TF(F))未満など、極めて小さい
値である周波数帯域(F)については、量子化ビット数
を「0」ビットと割り当てることができる。「0」ビッ
トが割り当てられた信号成分(S(F,N))は、量子
化などの処理を行わないので、全体の処理速度が高速化
し、また、これらの信号成分(S(F,T))を伝送し
ないので、伝送する信号成分(S(F,T))の量子化
に、より多くのビットを割り当てることができる。
The maximum value of the time axis (TMAX (F)) is small.
In the frequency band (F), which is the value, all signal components
Since (S (F, T)) is a smaller value, a smaller amount
Despite assigning the number of bits
I will not let you. Maximum time axis value (TMAX (F))
Extremely small, such as below the audio threshold (TF (F))
For the frequency band (F), which is a value, the number of quantization bits
Can be assigned as a “0” bit. "0" bit
Since the signal components (S (F, N)) to which the signals are assigned are not subjected to processing such as quantization, the overall processing speed is increased, and these signal components (S (F, T)) are Since transmission is not performed, more bits can be allocated to quantization of the signal component (S (F, T)) to be transmitted.

【0016】時間軸最大値(TMAX(F))により、
その周波数帯域(F)の信号成分(S(F,T))を量
子化する量子化ビット数が割り当てられるので、時間軸
最大値(TMAX(F))が比較的大きい周波数帯域
(F)の信号成分(S(F,T))には、多くのビット
を割り当てることができる。
According to the maximum value of the time axis (TMAX (F)),
Since the number of quantization bits for quantizing the signal component (S (F, T)) of the frequency band (F) is allocated, the frequency band (F) in which the maximum value on the time axis (TMAX (F)) is relatively large is assigned. Many bits can be allocated to the signal component (S (F, T)).

【0017】送出するデータ信号には、時間軸最大値
(TMAX(F))と、周波数帯域(F)毎に量子化さ
れた量子化信号(QS(F,T))を連続させた音声信
号データ(DT(F))が含まれるだけで、量子化ビッ
ト数を表す量子化ビット情報は伝送されないので、各正
規信号成分(NS(F,T))の量子化に、より多くの
ビットを配分することができる。受信装置側では、単位
処理時間内に転送可能な総ビット数と復号化した時間軸
最大値(TMAX(F))とから、送信装置側と同様の
処理によって、各周波数帯域(F)に割り当てられた量
子化ビット数を求めることができる。従って、量子化ビ
ット情報を伝送しなくても、符号化されたデジタル音声
信号を復号化することができる。
The data signal to be transmitted has a maximum value on the time axis.
(TMAX (F) ) and audio signal data (DT (F) ) in which a quantized signal (QS (F, T) ) quantized for each frequency band (F) is included. Since the quantization bit information indicating the number of quantization bits is not transmitted , more bits can be allocated to the quantization of each normal signal component (NS (F, T)). On the receiving device side, the unit
Total number of bits that can be transferred within the processing time and decoded time axis
From the maximum value (TMAX (F)), the amount allocated to each frequency band (F) by the same processing as that on the transmitting device side
The number of child bits can be obtained. Therefore, quantization
The encoded digital audio signal can be decoded without transmitting the bit information .

【0018】請求項2のデジタル音声信号の符号化方法
は、所定標本化周波数のデジタル音声信号を狭帯域多重
デジタルフィルタに入力し、狭帯域多重デジタルフィル
タで多重周波数帯域に分離し、一定時間間隔の順次時間
(T)で各周波数帯域(F)の信号成分(S(F,
T))を求め、各信号成分(S(F,T))を正規化し
て正規信号成分(NS(F,T))とし、正規信号成分
(NS(F,T))を圧縮符号化して量子化信号(QS
(F,T))とするデジタル音声信号の符号化方法であ
って、各信号成分(S(F,T))の正規化は、各周波
数帯域(F)内で信号成分(S(F,T))の絶対値の
最大値である時間軸最大値(TMAX(F))と、各時
間(T)内で信号成分(S(F,T))の絶対値の最大
値である周波数軸最大値(FMAX(T))を求め、各
信号成分(S(F,T))毎に該周波数帯域(F)の時
間軸最大値(TMAX(F))と、該時間(T)の周波
数軸最大値(FMAX(T))を比較し、時間軸最大値
(TMAX(F))と周波数軸最大値(FMAX
(T))のいずれか値が小さい方で、該信号成分(S
(F,T))を割り算して正規信号成分(NS(F,
T))とすることを特徴とする。
A digital audio signal encoding method according to claim 2
Input a digital audio signal of a predetermined sampling frequency to a narrow-band multiplex digital filter, separates the digital audio signal into multiple frequency bands by the narrow-band multiplex digital filter, and sets each frequency band (F) at a sequential time (T) at a fixed time interval. The signal component (S (F,
T)), each signal component (S (F, T)) is normalized to a normal signal component (NS (F, T)), and the normal signal component (NS (F, T)) is compression-coded. Quantized signal (QS
(F, T) encoding method der digital audio signal to)
Therefore, the normalization of each signal component (S (F, T)) is performed by the time axis maximum value (the maximum value of the absolute value of the signal component (S (F, T)) in each frequency band (F). TMAX (F)) and the maximum value on the frequency axis (FMAX (T)), which is the maximum value of the absolute value of the signal component (S (F, T)) within each time (T), is calculated. For each (F, T)), the time axis maximum value (TMAX (F)) of the frequency band (F) is compared with the frequency axis maximum value (FMAX (T)) of the time (T), and the time axis maximum value is calculated. Value (TMAX (F)) and the frequency axis maximum value (FMAX
(T)) is smaller, the signal component (S
(F, T)) to divide the normal signal component (NS (F, T,
T)).

【0019】請求項の発明は、各信号成分(S(F,
T))毎に該周波数帯域(F)の時間軸最大値(TMA
X(F))と、該時間(T)の周波数軸最大値(FMA
X(T))を比較し、時間軸最大値(TMAX(F))
と周波数軸最大値(FMAX(T))のいずれか値が小
さい方で、該信号成分(S(F,T))を割り算して正
規信号成分(NS(F,T))とするので、時間軸最大
値(TMAX(F))または周波数軸最大値(FMAX
(T))の一方のみで正規化する場合に比べて、正規信
号成分NS(F,T)は、少なくとも同一若しくはこれ
より大きい値となる。また、いずれかの最大値(TMA
X(F))(FMAX(T))が突出した大きな値とな
っても、他方で正規化するので、正規化信号成分が著し
く小さい値となることがない。
According to a second aspect of the present invention, each signal component (S (F,
T)), the maximum value of the time axis of the frequency band (F) (TMA)
X (F)) and the frequency axis maximum value (FMA) of the time (T).
X (T)) and the maximum value on the time axis (TMAX (F))
And the maximum value of the frequency axis (FMAX (T)), whichever is smaller, divides the signal component (S (F, T)) to obtain a normal signal component (NS (F, T)). Time axis maximum value (TMAX (F)) or frequency axis maximum value (FMAX
(T)), the normal signal component NS (F, T) has at least the same value or a value larger than that in the case of normalizing only one of (T)). In addition, one of the maximum values (TMA
Even if X (F)) (FMAX (T)) becomes a prominent large value, the other side is normalized, so that the normalized signal component does not become a remarkably small value.

【0020】請求項3のデジタル音声信号の符号化方法
は、所定標本化周波数のデジタル音声信号を狭帯域多重
デジタルフィルタに入力し、狭帯域多重デジタルフィル
タで多重周波数帯域に分離し、一定時間間隔の順次時間
(T)で各周波数帯域(F)の信号成分(S(F,
T))を求め、各信号成分(S(F,T))を正規化し
て正規信号成分(NS(F,T))とし、正規信号成分
(NS(F,T))を圧縮符号化して量子化信号(QS
(F,T))とするデジタル音声信号の符号化方法であ
って、各信号成分(S(F,T))の正規化は、多重周
波数帯域を複数の副周波数帯域(FB)に分割し、副周
波数帯域(FB)内で、信号成分(S(F,T))の絶
対値の最大値である時間軸最大値(TMAX(F))
と、各時間(T)内で信号成分(S(F,T))の絶対
値の最大値である副周波数軸最大値(FMAX(FB,
T))を求め、各信号成分(S(F,T))毎に該周波
数帯域(F)の時間軸最大値(TMAX(F))と、該
時間(T)の副周波数軸最大値(FMAX(FB,
T))を比較し、時間軸最大値(TMAX(F))と副
周波数軸最大値(FMAX(FB,T))のいずれか値
が小さい方で、該信号成分(S(F,T))を割り算し
て正規信号成分(NS(F,T))とすることを特徴と
する。
According to a third aspect of the present invention, a digital audio signal having a predetermined sampling frequency is input to a narrow-band multiplex digital filter and separated into multiple frequency bands by the narrow-band multiplex digital filter. , And the signal components (S (F,
T)), each signal component (S (F, T)) is normalized to a normal signal component (NS (F, T)), and the normal signal component (NS (F, T)) is compression-coded. Quantized signal (QS
(F, T) encoding method der digital audio signal to)
Therefore, the normalization of each signal component (S (F, T)) divides the multiplex frequency band into a plurality of sub-frequency bands (FB), and within the sub-frequency band (FB), the signal component (S (F, T)). , T)) is the maximum value of the absolute value of the time axis (TMAX (F))
And the sub-frequency axis maximum value (FMAX (FB, FMAX), which is the maximum value of the absolute value of the signal component (S (F, T)) within each time (T).
T)), and for each signal component (S (F, T)), the time axis maximum value (TMAX (F)) of the frequency band (F) and the sub-frequency axis maximum value (T (T)) of the time band (T) FMAX (FB,
T)) and the signal component (S (F, T)) is determined by the smaller one of the maximum value on the time axis (TMAX (F)) and the maximum value on the sub-frequency axis (FMAX (FB, T)). ) Is divided into a normal signal component (NS (F, T)).

【0021】請求項の発明は、各信号成分(S(F,
T))毎に該周波数帯域(F)の時間軸最大値(TMA
X(F))と、該時間(T)の副周波数軸最大値(FM
AX(FB,T))を比較し、時間軸最大値(TMAX
(F))と副周波数軸最大値(FMAX(FB,T))
のいずれか値が小さい方で、該信号成分(S(F,
T))を割り算して正規信号成分(NS(F,T))と
するので、時間軸最大値(TMAX(F))または副周
波数軸最大値(FMAX(FB,T))の一方のみで正
規化する場合に比べて、正規信号成分NS(F,T)
は、少なくとも同一若しくはこれより大きい値となる。
音声信号は、周波数によって大きく異なる可聴特性を有
するので、時間(T)の信号成分(S(F,T))の最
大値を、周波数帯域(F)を更に数分割した副周波数
(FB)単位で求めることによって、伝送する音質の品
質を更に忠実に再現できる。
According to a third aspect of the present invention, each signal component (S (F,
T)), the maximum value of the time axis of the frequency band (F) (TMA)
X (F)) and the maximum value of the sub-frequency axis at the time (T) (FM
AX (FB, T)) and compares the maximum value on the time axis (TMAX
(F)) and the maximum value of the sub-frequency axis (FMAX (FB, T))
Is smaller, the signal component (S (F,
T)) to obtain a normal signal component (NS (F, T)), so that only one of the maximum value on the time axis (TMAX (F)) or the maximum value on the sub-frequency axis (FMAX (FB, T)) is used. Compared to the case of normalization, the normal signal component NS (F, T)
Are at least the same or larger.
Since the audio signal has audible characteristics that vary greatly depending on the frequency, the maximum value of the signal component (S (F, T)) in time (T) is calculated by dividing the frequency band (F) into several sub-frequency (FB) units. The quality of the transmitted sound quality can be reproduced more faithfully.

【0022】請求項4のデジタル音声信号の符号化方法
は、所定標本化周波数のデジタル音声信号を狭帯域多重
デジタルフィルタに入力し、狭帯域多重デジタルフィル
タで多重周波数帯域に分離し、一定時間間隔の順次時間
(T)で各周波数帯域(F)の信号成分(S(F,
T))を求め、各信号成分(S(F,T))を正規化し
て正規信号成分(NS(F,T))とし、正規信号成分
(NS(F,T))を圧縮符号化して量子化信号とする
デジタル音声信号の符号化方法であって、正規信号成分
(NS(F,T))の圧縮符号化は、正規信号成分(N
S(F,T))を中心を0とした奇数のステップrで表
し、ステップrで表したP個の量子化信号(QS(F,
T))を連続させてP桁のr進で表し、r進を2進に変
換して、P個の量子化信号(QS(F,T)をまとめて
Qビットの量子化信号に圧縮符号化することを特徴とす
る。
According to a fourth aspect of the present invention, a digital audio signal having a predetermined sampling frequency is input to a narrow-band multiplex digital filter and separated into multiple frequency bands by the narrow-band multiplex digital filter. , And the signal components (S (F,
T)), each signal component (S (F, T)) is normalized to a normal signal component (NS (F, T)), and the normal signal component (NS (F, T)) is compression-coded. This is a method for encoding a digital audio signal to be a quantized signal. The compression encoding of the normal signal component (NS (F, T)) is performed by the normal signal component (N
S (F, T) is represented by an odd number of steps r with the center at 0, and the P quantized signals (QS (F,
T)) are continuously represented by a P-digit r-base, the r-base is converted to a binary, and the P quantized signals (QS (F, T) are grouped together to form a Q-bit quantized signal as a compression code. It is characterized in that

【0023】請求項の発明は、正規信号NS(F,
T)を「0」を中心とした奇数のステップで量子化する
ので、「0」に近い値の正規信号NS(F,T)は、量
子化と逆量子化を行っても「0」となり、原信号に近似
した受信信号が得られる。
According to a fourth aspect of the present invention, the normal signal NS (F,
T) is quantized in odd steps centered on “0”, so that the normal signal NS (F, T) having a value close to “0” becomes “0” even if quantization and inverse quantization are performed. , A received signal approximating the original signal is obtained.

【0024】P個の量子化信号QS(F,T)を連続さ
せてP桁のr進で表し、r進を2進に変換してQビット
の量子化信号とするので、1つの正規信号成分(NS
(F,T)))あたりの量子化ビット数をQ/Pビット
とすることができる。この量子化ビット数は、整数ビッ
ト数に限らないので、奇数のステップ数rで量子化して
も、効率的に圧縮符号化することができる。
Since the P quantized signals QS (F, T) are successively represented by a P-digit r-base and the r-base is converted into a binary to form a Q-bit quantized signal, one normal signal Component (NS
The number of quantization bits per (F, T))) can be Q / P bits. Since the number of quantization bits is not limited to the integer number of bits, even if quantization is performed with an odd number of steps r, compression encoding can be performed efficiently.

【0025】[0025]

【発明の実施の形態】以下では、図面に示す好適実施の
形態に基づき、この発明の内容をより詳しく説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, the contents of the present invention will be described in more detail based on preferred embodiments shown in the drawings.

【0026】図1に示すように、送信装置側では、記号
4で示す所定の標本化周波数のデジタル音声入力信号
(PCM信号)をこの発明で使用する極狭帯域多重フィ
ルタ10に導入する。このフィルタにより可聴周波数帯
域をM等分した狭い帯域内の信号成分を取り出せる。こ
の周波数分割処理をN回にわたり実行して、結局、M*
N個の信号成分 S(F,T); 0<F≦M, 0<T≦N をバッファ12に収納する。収納された信号成分S
(F,T)は図示のように周波数帯域の指数Fと時間軸
の指数Tで指定される行列状の配置で表すことができ
る。この実施例では、使用する分割帯域数Mと処理時間
Nは、 M=512 N=10 である。又、信号の処理で使用するビット数は、16ビ
ット以上である。
As shown in FIG. 1, on the transmitting device side, a digital audio input signal (PCM signal) having a predetermined sampling frequency indicated by symbol 4 is introduced into an ultra-narrow band multiplexing filter 10 used in the present invention. With this filter, a signal component in a narrow band obtained by dividing the audible frequency band into M equal parts can be extracted. This frequency division processing is performed N times, and eventually M *
N signal components S (F, T); 0 <F ≦ M, 0 <T ≦ N are stored in the buffer 12. The stored signal component S
(F, T) can be represented by a matrix arrangement specified by an index F on the frequency band and an index T on the time axis as shown in the figure. In this embodiment, the number M of divided bands to be used and the processing time N are as follows: M = 512 N = 10 The number of bits used in signal processing is 16 bits or more.

【0027】次に、これらの周波数分割された信号成分
S(F,T)を処理過程20で正規化するため、先ず信
号成分S(F,T)の絶対値の周波数帯域軸と時間軸に
関する最大値FMAX(T)とTMAX(F)を各処理
時間Tと各周波数帯域Fについて求める。つまり、 FMAX(T)=MAX{|S(F,T)|;F=1〜
M},T=1,2・・・N, TMAX(F)=MAX{|S(F,T)|;T=1〜
N},F=1,2・・・M.
Next, in order to normalize these frequency-divided signal components S (F, T) in the processing step 20, first, the absolute values of the signal components S (F, T) are related to the frequency band axis and the time axis. The maximum values FMAX (T) and TMAX (F) are obtained for each processing time T and each frequency band F. That is, FMAX (T) = MAX {| S (F, T) |; F = 1 to
M}, T = 1, 2,..., N, TMAX (F) = MAX {| S (F, T) |;
N}, F = 1, 2,.

【0028】次いで、周波数帯域Fと時間軸Tで指定さ
れる信号成分S(F,T)に対して、周波数帯域F内の
信号成分の最大値FMAX(T)と時間軸T内の信号成
分の最大値TMAX(F)の小さい方で信号成分S
(F,T)を割り算したものを、正規化された正規信号
成分NS(F,T)とする。つまり、TMAX(F)≦
FMAX(T)のとき、NS(F,T)=S(F,T)
/TMAX(F)、TMAX(F)>FMAX(T)の
とき、NS(F,T)=S(F,T)/FMAX(T)
である。
Next, for the signal component S (F, T) specified by the frequency band F and the time axis T, the maximum value FMAX (T) of the signal component in the frequency band F and the signal component in the time axis T Is smaller than the maximum value TMAX (F) of the signal component S.
A value obtained by dividing (F, T) is defined as a normalized normal signal component NS (F, T). That is, TMAX (F) ≦
When FMAX (T), NS (F, T) = S (F, T)
/ TMAX (F), when TMAX (F)> FMAX (T), NS (F, T) = S (F, T) / FMAX (T)
It is.

【0029】周波数帯域Fと時間軸Tの全ての範囲に対
し、このように正規化した正規信号成分NS(F,T)
を求め、これ等をバッファ22に納める。
The normal signal component NS (F, T) thus normalized for the entire range of the frequency band F and the time axis T
Are stored in the buffer 22.

【0030】ここで、音声信号の可聴周波数特性を加味
して、データの圧縮の準備を行う。これには、先ずビッ
ト配分決定処理部55で、処理装置の所定箇所50に予
め保管されていて、転送路74を介して導入される可聴
音声しきい値の周波数特性の離散値TH(F); F=
1,2・・・Mと、記号70で示す転送路によって導入
される各周波数帯域F内の最大値TMAX(F)とを全
ての周波数帯域Fにわたって比較する。もし、TMAX
(F)が可聴音声しきい値の周波数特性の離散値TH
(F)未満であれば、この帯域Fの音声信号を聴きとる
ことができないとして、後で更に詳しく説明するよう
に、周波数帯域F内の処理時間Tの全ての信号成分S
(F,T)のデータ伝送を行わない処理を指定するた
め、新たな時間軸に関する最大値CTMAX(F)とし
てこの値を0とする。また、そうでない場合、そのまま
の値TMAX(F)を使用する。換言すれば、TMAX
(F)≧TH(F)のとき、CTMAX(F)=TMA
X(F)、TMAX(F)<TH(F)のとき、CTM
AX(F)=0と変換される。これは図2の符号化ビッ
ト配分決定処理ルーチンの前半部(ステップS10)に
示してある。
Here, data compression is prepared in consideration of the audible frequency characteristics of the audio signal. To this end, first, the bit allocation determination processing unit 55 stores the discrete value TH (F) of the frequency characteristic of the audible voice threshold value stored in advance in the predetermined location 50 of the processing device and introduced through the transfer path 74. F =
.., M and the maximum value TMAX (F) in each frequency band F introduced by the transfer path indicated by the symbol 70 are compared over all the frequency bands F. If TMAX
(F) is a discrete value TH of the frequency characteristic of the audible voice threshold.
If it is less than (F), it is determined that the audio signal of the band F cannot be heard, and all the signal components S of the processing time T in the frequency band F will be described later in more detail.
This value is set to 0 as the maximum value CTMAX (F) relating to the new time axis in order to specify the process of not performing (F, T) data transmission. Otherwise, the value TMAX (F) is used as it is. In other words, TMAX
When (F) ≧ TH (F), CTMAX (F) = TMA
When X (F), TMAX (F) <TH (F), CTM
AX (F) = 0 is converted. This is shown in the first half (step S10) of the coded bit allocation determination processing routine of FIG.

【0031】更に、図2の符号化ビット配分決定処理ル
ーチンの後半部(ステップS11〜S15)には、伝送
するデータを圧縮する前の準備処理が示してある。ここ
では、上に述べたように、CTMAX(F)=0での周
波数帯域F内の信号成分S(F,T)は全て伝送されな
いので、それだけ実際に伝送するデータ量に余裕ができ
る。加えて、この発明による実施例では、ビット数16
以上であった初期音声信号S(F,T)またはNS
(F,T)が通常1.6ビットに圧縮されるが、CTM
AX(F)の値が大きいものに関しては、更に配分可能
な総配分ビット数を各信号成分S(F,T)に配分する
ことによって、その周波数帯域F内の全てのデータのビ
ット数を更に大きくして、つまり分解能をもっと高めた
信号の圧縮を行う。この配分方法を決定する為に本実施
の形態では、値が0以外のCTMAX(F)内の信号成
分S(F,T)を互いに異なるビット数が割り当てられ
る3種のビット配分グループに分類する。つまり、CT
MAX(F)の値によって大、中、小のビット配分グル
ープに分類し、データ圧縮時に対応するビット配分グル
ープの信号成分S(F,T)あたり、それぞれ4,2.
4,および1.6ビットを割り当てる。このビット配分
を示す指数として ALOC(F)=0 (1.6ビット配分(3ステッ
プ))、 ALOC(F)=1 (2.4ビット配分(5ステッ
プ))、 ALOC(F)=2 (4ビット配分(15ステッ
プ))を規定する。尚、カッコ内に示すステップは、量
子化のステップ数rを示すものである。
Further, the latter half (steps S11 to S15) of the coded bit allocation determination processing routine of FIG. 2 shows a preparation processing before compressing data to be transmitted. Here, as described above, since all the signal components S (F, T) in the frequency band F at CTMAX (F) = 0 are not transmitted, the amount of data to be actually transmitted can be increased accordingly. In addition, in the embodiment according to the present invention, the number of bits 16
The initial sound signal S (F, T) or NS
(F, T) is usually compressed to 1.6 bits, but CTM
When the value of AX (F) is large, the total number of bits that can be allocated is further allocated to each signal component S (F, T), thereby further increasing the number of bits of all data in the frequency band F. The compression of the signal is made larger, that is, with a higher resolution. In order to determine this allocation method, in the present embodiment, the signal components S (F, T) in CTMAX (F) having a value other than 0 are classified into three types of bit allocation groups to which different numbers of bits are allocated. . That is, CT
MAX (F) is classified into large, medium, and small bit allocation groups, and each of the signal components S (F, T) of the corresponding bit allocation group at the time of data compression is 4, 2,.
Allocate 4, and 1.6 bits. ALOC (F) = 0 (1.6 bit allocation (3 steps)), ALOC (F) = 1 (2.4 bit allocation (5 steps)), ALOC (F) = 2 ( 4 bit allocation (15 steps)). The steps shown in parentheses indicate the number r of quantization steps.

【0032】更に、この発明の実施の形態によれば、4
ビットの圧縮データに対する2.4ビットの圧縮データ
の数を少なくとも2倍以上に配分する。このような規則
を適用すると、最終的に伝送するデータ出力速度、例え
ばこの実施の形態の場合、64kbpsと、入力された
音声信号の特性から伝送しなくても良いデータ量(上に
述べたCTMAX(F)=0での周波数帯域F内の信号
成分S(F,T)に割り当てられるはずであった総ビッ
ト数)によって、ALOC(F)=0,ALOC(F)
=1およびALOC(F)=2に対応するデータ数(正
規信号成分NS(F,T)の数)を計算で求めることが
できる。このビット配分グループ毎の正規信号成分NS
(F,T)の数は、周波数帯域(F)単位で求め、この
算出方法を図2のステップS11、ステップS12で説
明する。
Further, according to the embodiment of the present invention, 4
The number of 2.4-bit compressed data with respect to the bit compressed data is distributed at least twice or more. When such a rule is applied, the data output speed to be finally transmitted, for example, 64 kbps in this embodiment, and the amount of data that does not need to be transmitted due to the characteristics of the input audio signal (CTMAX described above) (F) = 0, the total bits that would have been assigned to the signal component S (F, T) in the frequency band F
Depending on the number of door), ALOC (F) = 0 , ALOC (F)
= 1 and ALOC (F) = 2 (the number of normal signal components NS (F, T)) can be obtained by calculation. This normal signal component NS for each bit distribution group
The number of (F, T) is obtained for each frequency band (F), and this calculation method will be described with reference to steps S11 and S12 in FIG.

【0033】ステップS11では、伝送データ出力速度
から定まるバッハァ22の単位処理時間内の余裕分ビッ
ト数SBITとして SBIT=M*Nバッファに与えられる総ビット数−M*16 が与えられる。ここで、単位処理時間とは、バッファ2
2に記憶された全ての正規信号成分S(F,T)を1単
位として伝送するのに要する時間であり、M*Nバッフ
ァに与えられる総ビット数とは、バッファ22に一時記
憶される総ビット数であって、伝送速度から単位処理時
間に伝送できる総ビット数である。また、右辺の最後の
項はバッファ22に記憶されるM(=512)*N(=
10)個の全ての正規信号成分NS(F,T)が取り合
えず全て1.6ビットであるとみなすものである。つま
り、SBITは、全ての信号成分S(F,T)を伝送す
るものとして、正規化信号成分NS(F,T)あたりに
1.6ビットを割り当てて量子化した場合に、伝送速度
から更に余分に伝送できるビット数を表しているもので
ある。
In step S11, SBIT = the total number of bits-M * 16 given to the M * N buffer is given as the number of bits SBIT in the unit processing time of the buffer 22 determined from the transmission data output speed. Here, the unit processing time refers to the buffer 2
2 is the time required to transmit all the normal signal components S (F, T) stored as one unit, and the total number of bits given to the M * N buffer is the total number of bits temporarily stored in the buffer 22. It is the number of bits, which is the total number of bits that can be transmitted in a unit processing time from the transmission speed. The last term on the right side is stored in the buffer 22 as M (= 512) * N (=
10) All of the normal signal components NS (F, T) are considered to be 1.6 bits because they cannot be combined. That is, the SBIT transmits all the signal components S (F, T), and if 1.6 bits are allocated to the normalized signal component NS (F, T) and quantized, the SBIT is further reduced from the transmission speed. It indicates the number of bits that can be transmitted extra.

【0034】ステップS11に示すように、総配分ビッ
ト数は、このSBITに、伝送されない信号成分S
(F,T)に上記により割り当てられるはずであったビ
ット数(1.6*N*P(PはステップS10で求めた
CTMAX(F)=0の帯域数))を加えたビット数と
なる。つまり、総配分ビット数は、伝送速度から単位処
理時間内に伝送できる総ビット数から、伝送される全て
の正規信号成分NS(F,T)に最小割り当てビット数
である1.6ビットを割り当てたと仮定したときの総ビ
ット数(1.6*N*(M−P))を減じたものとして
求めることもできる。
As shown in step S11, the total number of allocated bits is equal to the number of untransmitted signal components S in this SBIT.
This is the number of bits obtained by adding the number of bits (1.6 * N * P (P is the number of bands of CTMAX (F) = 0 obtained in step S10)) that should have been allocated to (F, T) as described above. . In other words, the total number of allocated bits is based on the total number of bits that can be transmitted within a unit processing time from the transmission speed, and the minimum number of allocated bits of 1.6 bits is allocated to all transmitted normal signal components NS (F, T). Can be obtained as a value obtained by subtracting the total number of bits (1.6 * N * (MP)) when it is assumed that

【0035】ステップS11では、この総配分ビット数
を40で割り算して整数商Qと余りRを求める。ALO
C(F)=2で表される周波数帯域(F)には、正規信
号成分NS(F,T)あたりで(4−1.6)ビットが
配分されるので、1周波数帯域(F)では、(4−1.
6)*Nすなわち、24ビットが配分される。同様にA
LOC(F)=1で表される周波数帯域(F)には、正
規信号成分NS(F,T)あたりで(2.4−1.6)
ビットが配分されるので、1周波数帯域(F)では、
(2.4−1.6)*Nすなわち、8ビットが配分され
る。ビット配分グループは周波数帯域(F)単位で特定
され、また上述のようにALOC(F)=1の周波数帯
域(F)の数は、ALOC(F)=1の少なくとも2倍
以上としているので、一つの周波数帯域(F)をALO
C(F)=2とするのに、ALOC(F)=1の周波数
帯域(F)を少なくとも2つ特定する必要があり、これ
らの3つの周波数に配分される総ビット数は、前記から
24+8*2すなわち40である。つまり、ステップS
12にしめすように、総配分ビット数を40で割り算し
た整数商Qは、4ビットを割り当てる周波数帯域(F)
の数k40を示す。
In step S11, the total number of allocated bits is divided by 40 to obtain an integer quotient Q and a remainder R. ALO
In the frequency band (F) represented by C (F) = 2, (4-1.6) bits are allocated per normal signal component NS (F, T). , (4-1.
6) * N That is, 24 bits are allocated. Similarly A
In the frequency band (F) represented by LOC (F) = 1, (2.4-1.6) per normal signal component NS (F, T)
Since bits are allocated, in one frequency band (F),
(2.4-1.6) * N That is, 8 bits are allocated. The bit allocation group is specified in units of the frequency band (F), and the number of the frequency bands (F) where ALOC (F) = 1 is at least twice as large as ALOC (F) = 1 as described above. One frequency band (F) is ALO
In order to set C (F) = 2, it is necessary to specify at least two frequency bands (F) where ALOC (F) = 1, and the total number of bits allocated to these three frequencies is 24 + 8 * 2, that is, 40. That is, step S
As shown in FIG. 12, the integer quotient Q obtained by dividing the total number of allocated bits by 40 is a frequency band (F) to which 4 bits are allocated.
It indicates the number k 40 of.

【0036】また、2.4ビットを割り当てる周波数帯
域(F)の数k24は、少なくともk40*2すなわち
Q*2であるが、総配分ビット数を40で割り算した余
りRの中から8ビットをとれれば、2.4ビットを割り
当てる周波数帯域(F)とできるので、ステップS12
に示すように、k24は、2*Q+INT(R/8)で
求められる。
The number k 24 of the frequency band (F) to which 2.4 bits are allocated is at least k 40 * 2, that is, Q * 2, but 8 out of the remainder R obtained by dividing the total number of allocated bits by 40. If the bits can be obtained, the frequency band (F) to which 2.4 bits can be allocated can be obtained.
As shown in, k 24 is obtained by the 2 * Q + INT (R / 8).

【0037】次いで、ステップS13、S14およびS
15により最終的に各周波数帯域(F)毎にビット配分
を指示する指数ALOC(F)が指定される。ステップ
S13では、とりあえず全ての周波数帯域(F)をAL
OC(F)=0とする。
Next, steps S13, S14 and S
15 finally designates an index ALOC (F) indicating bit allocation for each frequency band (F). In step S13, all frequency bands (F) are set to AL
OC (F) = 0.

【0038】ステップS14では、各周波数帯域(F)
の時間軸最大値TMAX(F)を比較して、大きい順に
24+k40個の周波数帯域(F)を選び、選択した
周波数帯域(F)をALOC(F)=1とする。すなわ
ち、このときにALOC(F)=1に置き換えられなか
った周波数帯域(F)の正規信号成分NS(F,T)
は、ALOC(F)=0で表されるビット配分グループ
に属する。
In step S14, each frequency band (F)
Are compared with each other, and k 24 + k 40 frequency bands (F) are selected in descending order, and the selected frequency band (F) is set to ALOC (F) = 1. That is, at this time, the normal signal component NS (F, T) of the frequency band (F) not replaced with ALOC (F) = 1.
Belongs to a bit allocation group represented by ALOC (F) = 0.

【0039】更に、ステップS15で、時間軸最大値T
MAX(F)の大きい順にk40個の周波数帯域(F)
を選び、ALOC(F)=2とする。このとき、ALO
C(F)=2に置き換えられなかった周波数帯域(F)
の正規信号成分NS(F,T)は、ALOC(F)=1
で表されるビット配分グループに属する。従って、各周
波数帯域(F)は、時間軸最大値TMAX(F)の大き
い順に3種類のビット配分グループに分けられる。
Further, in step S15, the time axis maximum value T
K 40 frequency bands (F) in descending order of MAX (F)
And ALOC (F) = 2. At this time, ALO
Frequency band (F) not replaced by C (F) = 2
The normal signal component NS (F, T) of ALOC (F) = 1
Belongs to the bit allocation group represented by Therefore, each frequency band (F) is divided into three types of bit allocation groups in descending order of the time axis maximum value TMAX (F).

【0040】図2の符号化ビット配分決定処理の次に
は、第一量子化処理部30(図1)で正規化された正規
信号成分NS(F,T)が先に述べたステップ数rで量
子化される。これは、図3に示す手順で行われる。ビッ
ト配分決定処理部55から転送路76を介して導入され
た各周波数帯域Fのビット配分を指示する指数ALOC
(F)をステップS20で判定し、その指数ALOC
(F)の値に応じて係数PPXの値を指定する。すなわ
ち、ALOC(F)=0で量子化ステップ数rが3であ
るビット配分グループである場合にはPPX=2、AL
OC(F)=1で量子化ステップ数rが5であるビット
配分グループである場合にはPPX=4、ALOC
(F)=2で量子化ステップ数rが15であるビット配
分グループである場合にはPPX=14である。
After the coded bit allocation determination processing of FIG. 2, the normal signal component NS (F, T) normalized by the first quantization processing unit 30 (FIG. 1) is converted into the number of steps r described above. Is quantized by This is performed according to the procedure shown in FIG. An index ALOC indicating the bit allocation of each frequency band F introduced from the bit allocation determination processing unit 55 via the transfer path 76
(F) is determined in step S20, and the index ALOC is determined.
The value of the coefficient PPX is designated according to the value of (F). That is, if the bit allocation group is ALOC (F) = 0 and the number of quantization steps r is 3, PPX = 2 and AL
If the bit allocation group is OC (F) = 1 and the quantization step number r is 5, PPX = 4, ALOC
If (F) = 2 and the bit allocation group has a quantization step number r of 15, PPX = 14.

【0041】ステップS21は、正規信号成分NS
(F,T)を、ビット配分グループ毎に特定された奇数
のステップ数rで「0」を中心とした量子化信号(QS
(F,T))に量子化するものである。
In step S21, the normal signal component NS
(F, T) is converted to a quantized signal (QS) centered on “0” with an odd number of steps r specified for each bit allocation group.
(F, T)).

【0042】この量子化を図4と図5で詳述する。図4
(a)に示すようにALOC(F)=0である場合に
は、正規化により絶対値が1以下とされた正規化信号成
分NS(F,T)は、PPX=2を乗じて1を加えるこ
とによって、−1から+3までの範囲のいずれかの実数
となる。INT(X)は、Xを超えない最大整数値を意
味するので、結局INT[〔NS(F,T)*PPX+
1〕÷2]で表される量子化信号QS(F,T)は、図
5に示すように−1から+1までの「0」を中心とした
3ステップで表される。また、ALOC(F)=1であ
る場合には、正規化信号成分NS(F,T)は、PPX
=4を乗じて1を加えることによって、−3から+5ま
での範囲のいずれかの実数となる。従って、INT
[〔NS(F,T)*PPX+1〕÷2]で表される量
子化信号QS(F,T)は、図5のように−2から+2
までの「0」を中心とした5ステップで表される。同様
に、ALOC(F)=2である場合には、PPXが14
であるから、NS(F,T)*PPX+1は、−13か
ら+15の範囲の実数であり、量子化信号QS(F,
T)は、図5のように−7から+7までの「0」を中心
とした15ステップで表される。
This quantization will be described in detail with reference to FIGS. FIG.
As shown in (a), when ALOC (F) = 0, the normalized signal component NS (F, T) whose absolute value has been set to 1 or less by normalization is multiplied by PPX = 2 to 1 The addition results in any real number in the range from -1 to +3. Since INT (X) means the maximum integer value not exceeding X, INT [[NS (F, T) * PPX +
1] ÷ 2], the quantized signal QS (F, T) is represented by three steps centered on “0” from −1 to +1 as shown in FIG. When ALOC (F) = 1, the normalized signal component NS (F, T) is calculated as PPX
Multiplying by 4 and adding 1 results in any real number in the range from -3 to +5. Therefore, INT
The quantized signal QS (F, T) represented by [[NS (F, T) * PPX + 1] ÷ 2] is, as shown in FIG.
It is expressed in five steps centered on "0" up to. Similarly, if ALOC (F) = 2, PPX is 14
Therefore, NS (F, T) * PPX + 1 is a real number in the range of −13 to +15, and the quantized signal QS (F,
T) is represented by 15 steps centered on "0" from -7 to +7 as shown in FIG.

【0043】このように量子化された量子化信号QS
(F,T)は、バッファ32に収納される。
The quantized signal QS thus quantized
(F, T) is stored in the buffer 32.

【0044】第二量子化処理部60(図1)には、各周
波数帯域中の最大値CTMAX(F)と各時間軸内の最
大値FMAX(T)がそれぞれ転送路78および72を
介して導入され、ここで6ビット対数量子化される(2
dBステップ)。これ等の対数量子化された値をそれぞ
れQTMAX(F)とQFMAX(T)とする。
In the second quantization processing unit 60 (FIG. 1), the maximum value CTMAX (F) in each frequency band and the maximum value FMAX (T) in each time axis are transmitted via transfer paths 78 and 72, respectively. Introduced, where it is log-quantized 6 bits (2
dB step). These log-quantized values are QTMAX (F) and QFMAX (T), respectively.

【0045】最後に、量子化信号QS(F,T),QT
MAX(F)とQFMAX(T)を出力伝送路に送り出
す出力信号8にするには、データ符号化処理部40(図
1)でこれらの量子化信号を符号化し、処理時間毎にブ
ロック化されたフレーム信号(フレーム情報信号と圧縮
された音声信号)にする。
Finally, the quantized signals QS (F, T), QT
In order to make MAX (F) and QFMAX (T) into an output signal 8 to be sent to an output transmission line, the data encoding processing section 40 (FIG. 1) encodes these quantized signals, and blocks them at every processing time. Frame signal (a frame information signal and a compressed audio signal).

【0046】図6に示すように、先ずステップS30に
よりフレームの頭に同期信号SYNC(8ビット)を付
ける。次いでステップS31でQTMAX(F)を送り
出し、ステップS32でQFMAX(T)を送り出す。
更に、巡回符号CRC(7ビット)を付加してフレーム
情報の符号を完成させる。
As shown in FIG. 6, first, in step S30, a synchronization signal SYNC (8 bits) is added to the beginning of the frame. Next, QTMMAX (F) is sent out in step S31, and QFMAX (T) is sent out in step S32.
Further, a cyclic code CRC (7 bits) is added to complete the code of the frame information.

【0047】次に、圧縮された音声信号は、図7に示す
データ処理化処理により、前記のフレーム情報に続くフ
リーフォーマット区間に後置される。この場合、データ
符号化処理部40には、量子化信号QS(F,T)の他
に、転送路77を介してビット配分指数ALOC(F)
も導入されている。これは、ビット配分指数ALOC
(F)で指示されるビット数で量子化信号QS(F,
T)を表すためである。従って、この指数ALOC
(F)を先ずステップS40で判定する。
Next, the compressed audio signal is added to the free format section following the frame information by the data processing shown in FIG. In this case, in addition to the quantized signal QS (F, T), the data encoding processing unit 40 transmits the bit allocation index ALOC (F) via the transfer path 77.
Has also been introduced. This is the bit allocation index ALOC
The quantization signal QS (F,
T). Therefore, this index ALOC
(F) is determined first in step S40.

【0048】1.6ビットの場合(ALOC(F)=0
の時)には、ステップS41とステップS44で、それ
ぞれ3ステップで表した5個の量子化信号QS(F,
T)を連続させて5桁の3進で表し、これを2進に変換
して、5個の量子化信号QS(F,T)を8ビットの量
子化信号に圧縮符号化するものである。すなわち、同図
に示すように時間軸Tが1〜5までの5個の量子化信号
QS(F,T)を一つの3進表示値SD0として、時間
軸Tが6〜10までの5個の量子化信号QS(F,T)
をもう一つの3進表示値SD1としてそれぞれ表し、ス
テップS44でそれぞれ8ビットにして送り出す。各量
子化信号QS(F,T)に1を加えるのは、3ステップ
で−1から+1の整数値で表示される量子化信号QS
(F,T)を0または正の整数値に置き換えて、3進表
示化するためである。このようにして、5個の正規化信
号成分S(F,T)を8ビットの量子化信号とすること
ができるので、量子化ビット数は、ALOC(F)=0
で指示される1.6ビットとなる。
In the case of 1.6 bits (ALOC (F) = 0
), In steps S41 and S44, five quantized signals QS (F,
T) is continuously represented by a 5-digit ternary code, converted to a binary code, and compression-encoded the five quantized signals QS (F, T) into 8-bit quantized signals. . That is, as shown in the figure, five quantized signals QS (F, T) whose time axis T is 1 to 5 are one ternary display value SD0, and five time signals T whose time axis T is 6 to 10 QS (F, T)
Is represented as another ternary display value SD1, and is transmitted in 8 bits in step S44. Adding 1 to each quantized signal QS (F, T) is a quantized signal QS represented by an integer value of -1 to +1 in three steps.
This is because (F, T) is replaced with 0 or a positive integer to display a ternary representation. In this way, since the five normalized signal components S (F, T) can be converted into 8-bit quantized signals, the number of quantized bits is ALOC (F) = 0.
Becomes 1.6 bits indicated by.

【0049】又、2.4ビットの場合(ALOC(F)
=1の時)には、ステップS42で、それぞれ5ステッ
プで表した5個の量子化信号QS(F,T)を連続させ
て5桁の5進で表し、これをステップS45で2進に変
換した12ビットの量子化信号に圧縮符号化するもので
ある。図示のように時間軸の1〜5までのデータを一つ
の5進表示値SD0として、時間軸の6〜10までのデ
ータをもう一つの5進表示値SD0とするもので、各量
子化信号QS(F,T)は、−2から+2までの整数値
であるため、+2を加えて、0または正の整数値に置き
換えて、5進表示化する。従って、5個の正規化信号成
分S(F,T)は、5ステップで量子化された後、12
ビットの量子化信号となるので、量子化ビット数は、A
LOC(F)=1で指示される2.4ビットとなる。
In the case of 2.4 bits (ALOC (F)
= 1), in step S42, the five quantized signals QS (F, T) expressed in five steps are successively represented in five-digit quinary, and are converted to binary in step S45. The compression encoding is performed on the converted 12-bit quantized signal. As shown in the figure, the data from 1 to 5 on the time axis is one quinary display value SD0, and the data from 6 to 10 on the time axis is another quinary display value SD0. Since QS (F, T) is an integer value from -2 to +2, the value is added to +2, replaced with 0 or a positive integer value, and converted into a quinary display. Therefore, after the five normalized signal components S (F, T) are quantized in five steps, 12
Since the signal is a quantized signal of bits, the number of quantization bits is A
This is 2.4 bits indicated by LOC (F) = 1.

【0050】同様に、4ビットの場合(ALOC(F)
=2の時)には、ステップS43で対応する周波数帯域
(F)内の各時間Tの量子化信号QS(F,T)に7を
加算して0または正の整数とし、4ビットの量子化信号
QS(F,T)として送り出す。従って、ALOC
(F)=2のビット配分グループに属する周波数帯域
(F)の各正規信号成分S(F,T)は、15ステップ
で量子化された後、ALOC(F)=2で指示される4
ビットの量子化信号となる。
Similarly, in the case of 4 bits (ALOC (F)
= 2), in step S43, 7 is added to the quantized signal QS (F, T) of each time T in the corresponding frequency band (F) to obtain 0 or a positive integer, and the 4-bit quantum The signal QS (F, T) is sent out. Therefore, ALOC
Each normal signal component S (F, T) of the frequency band (F) belonging to the bit allocation group of (F) = 2 is quantized in 15 steps, and is designated by ALOC (F) = 2.
It becomes a bit quantization signal.

【0051】上の説明した信号符号化処理では、多数の
帯域にわたる演算を行った、特に周波数軸の最大値FM
AX(T)はM=512の範囲で調べた。しかし、音声
は周波数によって大きく異なる可聴特性を有するので、
この最大値も更に数分割した周波数範囲内で求めると、
伝送する音声の品質をより忠実に表現できる。この実施
の形態でM=512を使用する場合、8分割すると実験
的に再生された音声の品質が最も良好であった。このよ
うな分割処理は、正規化処理部20、量子化処理部30
およびデータ符号化処理部40の全ての処理に対して実
行する必要がある。
In the signal encoding process described above, calculations over a large number of bands were performed, and in particular, the maximum value FM on the frequency axis was calculated.
AX (T) was examined in the range of M = 512. However, voice has audible characteristics that vary greatly with frequency,
If this maximum value is also obtained within a frequency range divided into several parts,
The quality of transmitted voice can be expressed more faithfully. When M = 512 is used in this embodiment, the quality of the experimentally reproduced sound is the best when divided into eight. Such division processing is performed by the normalization processing unit 20, the quantization processing unit 30
And it is necessary to execute it for all the processes of the data encoding processing unit 40.

【0052】このようにして作成されたM=512,N
=10および周波数帯域分割数KB=8の場合の圧縮デ
ータを図8(a)に示す。ここでは、CTMAX(F)
がF=3で0になっているため、周波数帯域のデータD
T(F)の内DT(3)は送っていないことに注意され
たい。その外、周波数帯域を8に分割しているため、周
波数軸の最大値はFMAX(FB,T)として表されて
いる。この場合、分割指数FB=1,2,・・・・8で
ある。同図に示すように、この実施の形態では、最大値
CTMAX(F)と各時間軸内の最大値FMAX(F
B,T)は、対数量子化されずに、そのまま各6ビット
の同期信号SYNC(8ビット)に続くフレーム情報の
符号となる。
M = 512, N created in this way
FIG. 8A shows compressed data in the case of = 10 and the number of frequency band divisions KB = 8. Here, CTMAX (F)
Is 0 at F = 3, so that the frequency band data D
Note that DT (3) of T (F) was not sent. In addition, since the frequency band is divided into eight, the maximum value on the frequency axis is represented as FMAX (FB, T). In this case, the division index FB = 1, 2,... As shown in the figure, in this embodiment, the maximum value CTMAX (F) and the maximum value FMAX (F
B, T) are not logarithmically quantized, but are the codes of the frame information immediately following the 6-bit synchronization signal SYNC (8 bits).

【0053】また、フリーフォーマット区間の各データ
DT(F)は同一時間軸上の全ての量子化信号QS
(F,T)を一組にして形成されている。このデータD
T(F)の内1.6,2.4および4ビットのデータ配
置を図8(b)に示す。
Each data DT (F) in the free format section is composed of all the quantized signals QS on the same time axis.
(F, T) is formed as a set. This data D
FIG. 8B shows the data arrangement of 1.6, 2.4 and 4 bits of T (F).

【0054】次に、ある伝送回路を経由して導入され
た、あるいは何らかのデジタル信号読取装置によって検
出された、図8に示すフレーム信号配置を有するデジタ
ル音声信号を復号化して、元の音声信号に変換する処理
方法に付いて説明する。
Next, the digital audio signal having the frame signal arrangement shown in FIG. 8 introduced through a certain transmission circuit or detected by some digital signal reading device is decoded and converted into the original audio signal. The processing method for conversion will be described.

【0055】図9には、上で図1〜8を参照して説明し
送信装置側の符号化方法によって得られたデジタル音
声信号9が、受信装置側のフレーム情報に対する復号化
部41に導入される。この受信装置は、ISDN対応の
モデムであってもい、あるいはデジタルコンパクトカ
セットの読取ヘッドから得られた検出信号を波形整形
し、図8に示すフレーム信号配置を有するデジタル音声
信号に整形したものでもよい。この受信信号を元の音声
信号に近い値にTS(F,T)に戻し、更に狭帯域多重
フィルタ11によって逆フィルタを行い、最終的にデジ
タル音声信号5を求める。この詳細を次に説明する。
In FIG. 9, the digital audio signal 9 obtained by the encoding method on the transmitting device side described above with reference to FIGS. 1 to 8 is introduced into a decoding section 41 for frame information on the receiving device side. Is done. The receiving device, which have good even ISDN compatible modem, or waveform shaping the detection signal obtained from the read head of the digital compact cassette, and shaped into a digital audio signal having a frame signal arrangement shown in FIG. 8 May be. This received signal is returned to a value close to the original audio signal to TS (F, T), and further subjected to an inverse filter by the narrow-band multiplex filter 11 to finally obtain the digital audio signal 5. The details will be described below.

【0056】複合化部41では、まず時間軸最大値QT
MAX(F)と周波数軸最大値QFMAX(T)(図1
0のステップS60)を受信し、図10のステップS6
1に示すように、巡回符号CRCを検出して、受信した
フレーム同期信号、CTMAX(F),FMAX(F
B,T)でCRC符号を作成してCRCRとして、送信
しされたCRC符号がCRCRと一致しているか否かを
判定する。一致している場合には、そのまま次の過程に
進み、一致していない場合、そのフレームのデータを用
いた計算を実質上行わない。CTMAX(F),FMA
X(FB,T)が前述のように対数量子化されて伝送さ
れている場合には、対数量子化された受信時間軸最大値
QTMAX(F)と周波数軸最大値QFMAX(T)は
それぞれ転送路86,85を介して逆量子化処理部61
に転送され、ここで両者の値が逆対数(指数関数)変換
されて、時間軸最大値CTMAX(F)と周波数軸最大
値FMAX(FB,T)が定まる。
In the combining section 41, first, the time axis maximum value QT
MAX (F) and frequency axis maximum value QFMAX (T) (FIG. 1)
0 of step S60), and receives step S6 of FIG.
As shown in FIG. 1, a cyclic code CRC is detected, and a received frame synchronization signal, CTMAX (F), FMAX (F
(B, T) to generate a CRC code and determine whether the transmitted CRC code matches the CRCR as the CRCR. If they match, the process proceeds to the next step, and if they do not match, the calculation using the data of the frame is not substantially performed. CTMAX (F), FMA
When X (FB, T) is log-quantized and transmitted as described above, the log-quantized reception time axis maximum value QTMAX (F) and frequency axis maximum value QFMAX (T) are respectively transferred. Inverse quantization processing section 61 via paths 86 and 85
, Where both values are subjected to antilogarithmic (exponential function) conversion to determine a maximum value on the time axis CTMAX (F) and a maximum value on the frequency axis FMAX (FB, T).

【0057】次いでビット配分決定処理部56で音声デ
ータの転送を必要としないデータ区間の周波数帯域F
(TMAX(F)=0の場合の帯域)と、このような周
波数帯域の総数Pを図11のステップS50で求める。
一方、送信側で設定した余裕分ビット数SBITは、前
述のように伝送系の伝送速度によって定まる定数である
ので、このSBITを予め受信側でも記憶しておくもの
とすれば、送信側で決定した総配分ビット数は、SBI
Tとこの伝送を行わなかった周波数帯域(F)の総数P
から、SBIT+1.6*N*Pで求めることができ
る。従って、図2で説明した符号化の時と全く同じ計算
方法によって、ステップS51とステップS52からビ
ット配分グループのk24とk40の数を求めることが
できる。
Next, the frequency band F of the data section in which the transmission of the audio data is not necessary is
(The band when TMAX (F) = 0) and the total number P of such frequency bands are obtained in step S50 in FIG.
On the other hand, the margin bit number SBIT set on the transmission side is a constant determined by the transmission speed of the transmission system as described above. Therefore, if this SBIT is stored in advance on the reception side, it is determined on the transmission side. The total number of allocated bits is SBI
T and the total number P of frequency bands (F) in which this transmission was not performed
From SBIT + 1.6 * N * P. Therefore, it can be determined by exactly the same calculation method as in the coding described in Figure 2, the number of steps S51 and k 24 of the bit allocation group from the step S52 and k 40.

【0058】この場合、圧縮符号化のところで説明した
ように、同じビット配分、即ち通常の信号強度の周波数
帯域のデータを1.6ビットとして、信号強度のより強
い周波数帯域Fと更に強い周波数帯域Fのデータを1:
2以上の割合の4ビットと、2.4ビットに割り振る。
すなわち、k24とk40の数と各周波数帯域(F)の
時間軸最大値(TMAX(F))とから、ステップS5
3乃至ステップS55により、各周波数帯域(F)のビ
ット配分指数ALOC(F)を求める。
In this case, as described in the compression encoding, the same bit allocation, that is, the data of the frequency band having the normal signal strength is set to 1.6 bits, and the frequency band F having the stronger signal strength and the frequency band having the stronger signal strength are used. The data of F is 1:
Allocate to 2 or more ratios of 4 bits and 2.4 bits.
That is, since the time axis maximum number and each frequency band of the k 24 and k 40 (F) and (TMAX (F)), step S5
In steps 3 to S55, a bit allocation index ALOC (F) of each frequency band (F) is obtained.

【0059】次いで、データ複合化処理部43で、図1
2のように、ビット配分決定処理部56から送られたビ
ット配分指数ALOC(F)に基づき、データフリーフ
ォマット区間の時間軸上のデータDT(F)から量子化
信号QS(F,T)を求める。この処理は、図7の処理
の逆変換に相当する。この場合、 HDATA(0,J)=34−J HDATA(1,J)=54−J である。
Next, the data compounding processing section 43
2, the quantized signal QS (F, T) is converted from the data DT (F) on the time axis of the data free format section based on the bit allocation index ALOC (F) sent from the bit allocation determination processing unit 56. Ask. This processing corresponds to the inverse conversion of the processing in FIG. In this case, HDATA (0, J) = 34 -J HDATA (1, J) = 54 -J .

【0060】ある周波数帯域(F)について、ビット配
分指数ALOC(F)=0であったとすると、V=0と
なり、データDT(F)を8ビット毎に区切り、この8
ビットデータをRとする。CKの初期値は0であり、従
ってR/HDATA(0,CK)は、8ビットのデータ
Rを3で割ることを意味し、その整数商がQ余りがR
とされる。この整数商Qは、図7に示すステップS41
の内の(QS(F,5)+1)を示すものであり、0ま
たは正の整数であるからこの整数商Qから(−V−1)
すなわち1を引くことによって、0を中心とした3ステ
ップのQS(F,5)を求める。同様にして、Jが1の
間にCKは、初期値0から4まで増し、QS(F,5)
からQS(F,1)までが求められる。つまり、R/H
DATA(0,CK)は、2進の8ビットデータSD0
を3進に置き換えるものである。
Assuming that the bit allocation index ALOC (F) = 0 for a certain frequency band (F), V = 0, and the data DT (F) is divided into 8 bits.
Let the bit data be R. The initial value of CK is 0, therefore R / HDATA (0, CK) means that dividing the 8-bit data R 3 4, the integer quotient is too Q R
It is said. This integer quotient Q is calculated in step S41 shown in FIG.
Represents (QS (F, 5) +1), and is 0 or a positive integer. Therefore, from this integer quotient Q, (−V−1)
That is, by subtracting 1, QS (F, 5) of three steps centering on 0 is obtained. Similarly, while J is 1, CK increases from an initial value of 0 to 4, and QS (F, 5)
To QS (F, 1). That is, R / H
DATA (0, CK) is binary 8-bit data SD0
Is replaced by ternary.

【0061】CKが5以上となると、Jは、J+5で6
とされ、同様の処理により次の8ビットデータSD1が
Rとして受信され、R/HDATA(0,CK)で3進
に置き換えられることにより、QS(F,10)からQ
S(F,6)までが求められる。
When CK becomes 5 or more, J becomes 6 by J + 5.
By the same processing, the next 8-bit data SD1 is received as R, and is replaced by R / HDATA (0, CK) in ternary, thereby changing QS (F, 10) to Q
S (F, 6) is required.

【0062】ある周波数帯域(F)について、ビット配
分指数ALOC(F)=1であったとすると、V=1と
なり、データDT(F)を12ビット毎に区切り、この
12ビットデータをRとする。Vが1となるので、R/
HDATA(V,CK)は、12ビットのデータRを5
4−CKで割ることを意味し、2進の12ビットデータ
SD0が5進に置き換えられる。量子化信号QS(F,
T)は、この整数商Qから求められるが、前述と同様
に、(−V−1)すなわち2を引くことによって、0を
中心とした5ステップのQS(F,T)が求められる。
Assuming that the bit allocation index ALOC (F) = 1 for a certain frequency band (F), V = 1, the data DT (F) is divided into 12 bits, and this 12-bit data is defined as R. . Since V becomes 1, R /
HDATA (V, CK) is obtained by converting 12-bit data R to 5 bits.
4-CK means division, and binary 12-bit data SD0 is replaced by quinary. The quantized signal QS (F,
T) is obtained from the integer quotient Q. As described above, by subtracting (−V−1), that is, 2, a 5-step QS (F, T) centered on 0 is obtained.

【0063】周波数帯域(F)のビット配分指数ALO
C(F)が2の場合には、4ビット毎にデータDT
(F)を区切れば、量子化信号QS(F,T)を抜き出
すことができるが、0を中心とした15ステップで表さ
れた量子化信号QS(F,T)とするために、この区切
られた4ビットデータRから7を引く。
Bit allocation index ALO of frequency band (F)
When C (F) is 2, data DT is output every 4 bits.
By dividing (F), the quantized signal QS (F, T) can be extracted. However, in order to obtain the quantized signal QS (F, T) expressed in 15 steps around 0, 7 is subtracted from the delimited 4-bit data R.

【0064】更に、図13に示すように、フレーム内の
量子化信号QS(F,T)から、図3のステップS12
とは逆の処理により、正規化された音声信号TNS
(F,T)を求める。すなわち、上記で求めた量子化信
号QS(F,T)を実数としたときに、絶対値が1以下
となるように、ビット配分指数ALOC(F)によっ
て、割り算を行い、これをバッファ23に納める。
Further, as shown in FIG. 13, the quantized signal QS (F, T) in the frame is used to calculate the step S12 in FIG.
By the reverse process, the normalized audio signal TNS
(F, T) is obtained. That is, when the quantized signal QS (F, T) obtained as described above is a real number, division is performed by the bit allocation index ALOC (F) so that the absolute value is 1 or less, and this is stored in the buffer 23. Put it.

【0065】次に、正規化処理部21で、逆量子化処理
部61で求まり転送路89と90を介して導入された時
間軸最大値CTMAX(F)と周波数軸最大値FMAX
(T)を用いて、正規化された音声信号TNS(F,
T)を初期音声信号TS(F,T)に変換して、バッフ
ァ13に納める。この場合の変換は、図1の正規化の逆
である。即ち、CTMAX(F)≦FMAX(T)のと
き、TS(F,T)=TNS(F,T)*CTMAX
(F)、CTMAX(F)>FMAX(T)のとき、T
S(F,T)=TNS(F,T)*FMAX(T)であ
る。
Next, in the normalization processing section 21, the maximum value of the time axis CTMAX (F) and the maximum value of the frequency axis FMAX obtained by the inverse quantization processing section 61 and introduced via the transfer paths 89 and 90 are obtained.
(T), the normalized audio signal TNS (F,
T) is converted into an initial audio signal TS (F, T) and stored in the buffer 13. The conversion in this case is the reverse of the normalization of FIG. That is, when CTMAX (F) ≦ FMAX (T), TS (F, T) = TNS (F, T) * CTMAX
(F), when CTMAX (F)> FMAX (T), T
S (F, T) = TNS (F, T) * FMAX (T).

【0066】なお、ここで言う正規化音声信号TNS
(F,T)と初期音声信号TS(F,T)は、図1で示
した正規化音声信号NS(F,T)および初期音声信号
S(F,T)とは実質上異なる。何故ならば、図1の量
子化処理30で、音声信号成分の強度がかなり粗いビッ
トの分解能で変換されたからである。この信号レベルの
粗さは、人の可聴能力を加味して決定されているので、
実際に音声に変換した場合、依然として高い品質の音声
として聴くことができる。
The normalized sound signal TNS referred to here
(F, T) and the initial audio signal TS (F, T) are substantially different from the normalized audio signal NS (F, T) and the initial audio signal S (F, T) shown in FIG. This is because the intensity of the audio signal component is converted with a considerably coarse bit resolution in the quantization processing 30 of FIG. Since the roughness of this signal level is determined in consideration of human audibility,
When the voice is actually converted to voice, it can still be heard as high quality voice.

【0067】最後に、バッファ13の行列状の音声信号
TS(F,T)のブロックは、この発明による狭帯域の
多重帯域逆フィルタ11を通過させて、記号5で示すデ
ジタル音声信号(PCM)として取り出せる。この音声
信号を所定の記憶装置で記憶媒体に記憶しておくか、あ
るいは所定の音声変換装置(再生装置)の助けにより音
声として聴くことができる。
Finally, the block of the matrix-shaped audio signal TS (F, T) in the buffer 13 is passed through the narrow-band multi-band inverse filter 11 according to the present invention, and the digital audio signal (PCM) indicated by the symbol 5 is obtained. Can be taken out. This audio signal can be stored in a storage medium by a predetermined storage device, or can be heard as a voice with the aid of a predetermined audio conversion device (reproducing device).

【0068】なお、ISDNで2Bチャンネルにそれぞ
れステレオの左右音声信号を送り出す場合、2Bチャン
ネルのスキューが補償されていないので、予めフレーム
の約半分の周期だけ送出時点をずらすことにより、スキ
ューのずれを吸収する。
When transmitting the stereo left and right audio signals to the 2B channel by the ISDN, the skew of the 2B channel is not compensated. Therefore, the skew is shifted in advance by shifting the transmission time by about a half cycle of the frame. Absorb.

【0069】この発明による圧縮されたデジタル音声信
号の複合化方法を、主としてISDNの場合のついて説
明した。しかし、この発明は単にISDNだけでなく、
デジタルコンパクトカセットや磁気テープ等での再生に
も利用できる。これ等の場合には、単位時間当たりのデ
ータ量にISDNの場合より余裕があるため、ビット配
分を更に増やし、細かいステップによる高音質を保持で
きる信号の符号か圧縮方法およびそれに対する複合化方
法も可能である。
The method of decoding a compressed digital audio signal according to the present invention has been described mainly for the case of ISDN. However, this invention is not just ISDN,
It can also be used for playback on digital compact cassettes and magnetic tapes. In these cases, since the amount of data per unit time has more margin than in the case of ISDN, the bit allocation is further increased, and the code or compression method of a signal capable of maintaining high sound quality by fine steps and the compounding method therefor are also required. It is possible.

【0070】更に、この発明は上記の実施の形態で使用
したパラメータM=512,N=10,KB=8の値、
およびビット配分グループすなわちALOC(F)の種
類を3に限定するものではなく、2.4ビットと4ビッ
トの比率も2以上:1に限定するものではない。これ等
のパラメータは、必要に応じて、適宜選択して変更して
使用できる。3種の中の2種類のビットは、上記のよう
に各周波数帯域のCTMAX(F)の大きさの順で(即
ち相対的に)決めるのでなく、CTMAX(F)の値の
絶対値で評価することもできる。周知のように、分割周
波数FBでの可聴音声しきい値の特性曲線TH(FB)
は周波数範囲に応じて相当異なる特性を示す。その場
合、分割周波数FBでの可聴音声しきい値に特性曲線T
H(FB)に適当に重みを付けて前記絶対値を決定でき
る。このような操作は、実験的に決めるべきである。
Further, according to the present invention, the values of the parameters M = 512, N = 10, KB = 8 used in the above-described embodiment,
Also, the type of the bit allocation group, ie, ALOC (F), is not limited to 3, and the ratio between 2.4 bits and 4 bits is not limited to 2 or more and 1: 1. These parameters can be appropriately selected, changed, and used as needed. The two types of bits among the three types are evaluated by the absolute value of the value of CTMAX (F), instead of being determined in the order of (or relatively) the size of CTMAX (F) of each frequency band as described above. You can also. As is well known, the characteristic curve TH (FB) of the audible sound threshold value at the divided frequency FB
Shows considerably different characteristics depending on the frequency range. In that case, the characteristic curve T
The absolute value can be determined by appropriately weighting H (FB). Such an operation should be determined experimentally.

【0071】[0071]

【発明の効果】以上説明したように、請求項1の発明に
よれば、時間軸最大値(TMAX(F))により、その
周波数帯域(F)の信号成分S(F,N)の量子化ビッ
ト数を割り当てるので、時間軸最大値(TMAX
(F))が比較的大きい周波数帯域(F)の信号成分S
(F,T)には、多くのビットを割り当てることができ
る。
As described above, according to the first aspect of the present invention, the signal component S (F, N) of the frequency band (F ) is quantized by the maximum value on the time axis (TMAX (F)) . Bit
The maximum value of the time axis (TMAX
(F)) is a relatively large signal component S in the frequency band (F).
Many bits can be allocated to (F, T).

【0072】また、送出するデータ信号には、時間軸最
大値(TMAX(F))と、周波数帯域(F)毎に量子
化された量子化信号(QS(F,T))を連続させた音
声信号データ(DT(F))が含まれるだけで、量子化
ビット情報であるビット配分指数ALOC(F)を伝送
しないので、各正規信号成分NS(F,T)の量子化
に、より多くのビットを配分することができる。
In the data signal to be transmitted, a time axis maximum value (TMAX (F)) and a quantized signal (QS (F, T)) quantized for each frequency band (F) are made continuous. The quantization is performed only by including the audio signal data (DT (F)) .
Transmits bit allocation index ALOC (F) as bit information
Therefore, more bits can be allocated to the quantization of each normal signal component NS (F, T).

【0073】請求項の発明によれば、時間軸最大値
(TMAX(F))または周波数軸最大値(FMAX
(T))の一方のみで正規化する場合に比べて、正規信
号成分NS(F,T)は、少なくとも同一若しくはこれ
より大きい値となる。また、いずれかの最大値(TMA
X(F))(FMAX(T))が突出した大きな値とな
っても、他方で正規化するので、正規化信号成分が著し
く小さい値となることがない。
According to the second aspect of the present invention, the time axis maximum value (TMAX (F)) or the frequency axis maximum value (FMAX)
(T)), the normal signal component NS (F, T) has at least the same value or a value larger than that in the case of normalizing only one of (T)). In addition, one of the maximum values (TMA
Even if X (F)) (FMAX (T)) becomes a prominent large value, the other side is normalized, so that the normalized signal component does not become a remarkably small value.

【0074】請求項の発明によれば、音声信号は、周
波数によって大きく異なる可聴特性を有するので、時間
(T)の信号成分(S(F,T))の最大値を、周波数
帯域(F)を更に数分割した副周波数(FB)単位で求
めることによって、伝送する音質の品質を更に忠実に再
現できる。
According to the third aspect of the present invention, since the audio signal has audible characteristics that vary greatly depending on the frequency, the maximum value of the signal component (S (F, T)) in the time (T) is set to the frequency band (F). ) Is obtained in units of sub-frequency (FB), which is further divided into several parts, so that the quality of transmitted sound quality can be reproduced more faithfully.

【0075】請求項の発明によれば、奇数のステップ
により音声信号を量子化するので、量子化と逆量子化に
より「0」に近い小さいノイズが音声として認識される
ことが無い。奇数のステップで表された量子化信号を連
続させて整数ビットで表すので、効率的な圧縮符号化が
できる。
According to the fourth aspect of the present invention, since the audio signal is quantized by the odd number of steps, small noise close to "0" is not recognized as voice by the quantization and the inverse quantization. Since the quantized signal represented by the odd-numbered steps is successively represented by integer bits, efficient compression encoding can be performed.

【0076】[0076]

【図面の簡単な説明】[Brief description of the drawings]

【図1】この発明によるデータ圧縮符号化処理の各過程
とそれに付属する信号を模式的に示す処理図である。
FIG. 1 is a processing diagram schematically showing each process of a data compression encoding process according to the present invention and signals attached thereto.

【図2】周波数帯域(F)毎に、ビット配分グループを
決定するためのサブルーチンのフローチャートである。
FIG. 2 is a flowchart of a subroutine for determining a bit allocation group for each frequency band (F).

【図3】量子化を行うサブルーチンのフローチャートで
ある。
FIG. 3 is a flowchart of a subroutine for performing quantization.

【図4】 (a)は、ALOC(F)=0の (b)は、ALOC(F)=1の (c)は、ALOC(F)=2の量子化の手順を説明す
る説明図である。
FIGS. 4A and 4B are explanatory diagrams illustrating a quantization procedure of ALOC (F) = 0, FIG. 4B is a diagram of ALOC (F) = 1, and FIG. is there.

【図5】量子化により分解能を粗くした信号のビット配
置を示す図である。
FIG. 5 is a diagram illustrating a bit arrangement of a signal whose resolution is coarsened by quantization.

【図6】データフレームの処理・データ情報を与えるた
めにデータ符号化を行うサブルーチンのフローチャート
である。
FIG. 6 is a flowchart of a subroutine for performing data encoding for processing data frames and providing data information.

【図7】複数の量子化信号QS(F,T)を連続させて
2進の量子化信号に変換するサブルーチンである。
FIG. 7 is a subroutine for continuously converting a plurality of quantized signals QS (F, T) into binary quantized signals.

【図8】伝送されるデータのフレーム内配置(a)と圧
縮された音声信号の1データブロックDT(F)内での
配置(b)を示す。
FIG. 8 shows an arrangement (a) of data to be transmitted in a frame and an arrangement (b) of compressed audio signals in one data block DT (F).

【図9】この発明による圧縮符号化音声データを復号化
する各過程とそれに付属する信号を模式的に示す処理図
である。
FIG. 9 is a processing diagram schematically showing each process of decoding the compression-encoded audio data according to the present invention and signals attached thereto.

【図10】受信時の符号誤りの検査と周波数軸最大値F
MAX(FB,T)と時間軸最大値CTMAX(F)の
受信ルーチンの模式フローチャートである。
FIG. 10: Inspection of a code error at the time of reception and the maximum value F on the frequency axis
It is a schematic flowchart of the reception routine of MAX (FB, T) and the time axis maximum value CTMAX (F).

【図11】ビット配分決定ルーチンのフローチャートで
ある。
FIG. 11 is a flowchart of a bit allocation determination routine.

【図12】データ復号化ルーチンのフローチャートであ
る。
FIG. 12 is a flowchart of a data decoding routine.

【図13】正規化音声信号成分を算出するルーチンのフ
ローチャートである。
FIG. 13 is a flowchart of a routine for calculating a normalized audio signal component.

【符号の説明】[Explanation of symbols]

4 入力音声信号(標本化されたPCM信号) 5 出力音声信号 8 圧縮された出力音声符号化信号 9 圧縮された受信音声信号 10 狭帯域多重フィルタ 11 狭帯域逆多重フィルタ 20 正規化処理部 21 逆正規化処理部 30 量子化処理部 40 データ符号化処理部 41 最大値復号化部 43 データ復号化部 50 可聴音声しきい特性曲線の数値用の保管部 55 ビット配分決定処理部 56 ビット配分決定処理部 60 量子化処理部 61 逆量子化処理部 Reference Signs List 4 input audio signal (sampled PCM signal) 5 output audio signal 8 compressed output audio coded signal 9 compressed received audio signal 10 narrowband multiplex filter 11 narrowband demultiplex filter 20 normalization processing unit 21 inverse Normalization processing unit 30 Quantization processing unit 40 Data encoding processing unit 41 Maximum value decoding unit 43 Data decoding unit 50 Storage unit for numerical values of audible voice threshold characteristic curve 55 Bit allocation determination processing unit 56 Bit allocation determination processing Unit 60 quantization processing unit 61 inverse quantization processing unit

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) H03M 7/30 H04B 1/66 ──────────────────────────────────────────────────続 き Continued on front page (58) Field surveyed (Int.Cl. 6 , DB name) H03M 7/30 H04B 1/66

Claims (4)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 デジタル音声信号を送信する送信装置側
で、 (a) 所定標本化周波数のデジタル音声信号を狭帯域
多重デジタルフィルタに入力し、 (b) 狭帯域多重デジタルフィルタで多重周波数帯域
に分離し、一定時間間隔の順次時間(T)で各周波数帯
域(F)の信号成分(S(F,T))を求め、 (c) 各周波数帯域(F)内で信号成分(S(F,
T))の絶対値の最大値である時間軸最大値(TMAX
(F))を求め、(d) 単位処理時間内に伝送可能な総ビット数と周波
数帯域(F)の時間軸最大値(TMAX(F))から、
各周波数帯域(F)単位で、該周波数帯域(F)の信号
成分S(F,T)を量子化する量子化ビット数を割り当
て、 (e) 各周波数帯域(F)の各信号成分(S(F,
T))を正規化して正規信号成分(NS(F,T))と
し、 (f) 正規信号成分(NS(F,T))を、その正規
信号成分(NS(F,T))が属する周波数帯域(F)
に割り当てられた量子化ビット数の量子化信号(QS
(F,T))に変換し、 (g) 各周波数帯域(F)の時間軸最大値(TMAX
(F))を含むフレーム情報符号と、各周波数帯域
(F)の同一時間軸上の全ての量子化信号(QS(F,
T))を連続させた音声信号データ(DT(F))とか
らなるデータ信号を受信装置側へ送出し、 送信装置から送出されたデータ信号を受信する受信装置
側で、 (h) 受信したデータ信号から、フレーム情報符号に
含まれた時間軸最大値(TMAX(F))を復号化し、 (i) 送信装置側の(d)と同一処理過程で、単位処
理時間内に伝送可能な総ビット数と周波数帯域(F)の
時間軸最大値(TMAX(F))から、各周波数帯域
(F)に割り当てられた量子化ビット数を求め、 (j) 音声信号データ(DT(F))を、各周波数帯
域(F)単位で、該周波 数帯域(F)に割り当てられた
量子化ビット数毎に、該周波数帯域(F)の信号成分
(S(F,T))数に分割し、各周波数帯域(F)の同
一時間軸上の全ての量子化信号(QS(F,T))を取
り出し、逆量子化により逆正規化音声信号(TNS
(F,T))を形成し、 (k) 逆正規化音声信号(TNS(F,T))を逆正
規化して逆音声信号(TS(F,T))を求め、 (l) 狭帯域多重逆デジタルフィルタにより、逆音声
信号(TS(F,T))から所望の標本化周波数のデジ
タル出力音声信号を求め、 信号成分S(F,T)を量子化する量子化ビット情報を
含めずに、送信装置から受信装置へデータ信号を送出す
ることを特徴とするデジタル音声信号の伝送方法
A transmitting apparatus for transmitting a digital audio signal.
In each with (a) a digital audio signal of a predetermined sampling frequency and input to the narrow band multiplex digital filter, (b) narrow in band multiplexer digital filter is separated into multiple frequency bands, sequentially time a predetermined time interval (T) The signal component (S (F, T)) of the frequency band (F) is obtained. (C) The signal component (S (F, T) within each frequency band (F)
T)), the maximum value of the time axis (TMAX) which is the maximum value of the absolute value of
(F)), and (d) the total number of bits and frequency that can be transmitted within the unit processing time.
From the maximum value of the time axis of several bands (F) (TMAX (F)),
For each frequency band (F), the signal of the frequency band (F)
Allocate the number of quantization bits to quantize the component S (F, T)
Te, (e) the signal components of each frequency band (F) (S (F,
T)) is normalized to obtain a normal signal component (NS (F, T)).
And, (f) is the normal signal component (NS (F, T)) , the normal
Frequency band (F) to which signal component (NS (F, T)) belongs
Quantized signal of the number of quantization bits (QS
(F, T)), and (g) the time axis maximum value (TMAX) of each frequency band (F).
(F) Frame information code including
(F), all the quantized signals (QS (F,
T)) continuous audio signal data (DT (F))
Receiving a data signal transmitted from the transmitting device to the receiving device, and receiving the data signal transmitted from the transmitting device.
In the side, from the data signals received (h), the frame information code
The contained time axis maximum value (TMAX (F)) is decoded, and (i) the same processing as (d) on the transmitting device side,
Of the total number of bits that can be transmitted within the processing time and the frequency band (F)
From the time axis maximum value (TMAX (F)), each frequency band
( J) calculating the number of quantization bits assigned to (F), and (j) converting the audio signal data (DT (F)) into each frequency band.
In frequency (F) units, assigned to peripheral wave number band (F)
For each quantization bit number, the signal component of the frequency band (F)
(S (F, T)) and divide the frequency band (F)
Take all quantized signals (QS (F, T)) on one time axis
And the inverse normalized audio signal (TNS)
( K) form the inverse normalized speech signal (TNS (F, T))
Normalized to obtain an inverse audio signal (TS (F, T)), (l) inverse audio signal by a narrow band multiplex inverse digital filter
From the signal (TS (F, T)), a digital signal of a desired sampling frequency
Output audio signal, and quantize bit information for quantizing the signal component S (F, T).
Send data signal from transmitting device to receiving device without including
A method for transmitting a digital audio signal .
【請求項2】 所定標本化周波数のデジタル音声信号を
狭帯域多重デジタルフィルタに入力し、 狭帯域多重デジタルフィルタで多重周波数帯域に分離
し、一定時間間隔の順次時間(T)で各周波数帯域
(F)の信号成分(S(F,T))を求め、 各信号成分(S(F,T))を正規化して正規信号成分
(NS(F,T))とし、 正規信号成分(NS(F,T))を圧縮符号化して量子
化信号(QS(F,T))とするデジタル音声信号の符
号化方法であって、 各信号成分(S(F,T))の正規化は、 各周波数帯域(F)内で信号成分(S(F,T))の絶
対値の最大値である時間軸最大値(TMAX(F))
と、各時間(T)内で信号成分(S(F,T))の絶対
値の最大値である周波数軸最大値(FMAX(T))を
求め、 各信号成分(S(F,T))毎に該周波数帯域(F)の
時間軸最大値(TMAX(F))と、該時間(T)の周
波数軸最大値(FMAX(T))を比較し、 時間軸最大値(TMAX(F))と周波数軸最大値(F
MAX(T))のいずれか値が小さい方で、該信号成分
(S(F,T))を割り算して正規信号成分(NS
(F,T))とすることを特徴とするデジタル音声信号
の符号化方法
2. A digital audio signal having a predetermined sampling frequency is input to a narrow band multiplex digital filter, separated into multiple frequency bands by the narrow band multiplex digital filter, and each frequency band (T) at a predetermined time interval (T). F), a signal component (S (F, T)) of each signal component is obtained, and each signal component (S (F, T)) is normalized into a normal signal component (NS (F, T)). F, T)) to form a quantized signal (QS (F, T)) of a digital audio signal.
In the encoding method, the normalization of each signal component (S (F, T)) is performed by the time that is the maximum value of the absolute value of the signal component (S (F, T)) in each frequency band (F). Axis maximum value (TMAX (F))
And the frequency axis maximum value (FMAX (T)) which is the maximum value of the absolute value of the signal component (S (F, T)) within each time (T) is calculated. ), The time axis maximum value (TMAX (F)) of the frequency band (F) is compared with the frequency axis maximum value (FMAX (T)) of the time (T), and the time axis maximum value (TMAX (F )) And the frequency axis maximum value (F
MAX (T)) is divided by the signal component (S (F, T)), whichever is smaller, and the normal signal component (NS
(F, T) digital audio signal, characterized in that a)
Encoding method .
【請求項3】 所定標本化周波数のデジタル音声信号を
狭帯域多重デジタルフィルタに入力し、 狭帯域多重デジタルフィルタで多重周波数帯域に分離
し、一定時間間隔の順次時間(T)で各周波数帯域
(F)の信号成分(S(F,T))を求め、 各信号成分(S(F,T))を正規化して正規信号成分
(NS(F,T))とし、 正規信号成分(NS(F,T))を圧縮符号化して量子
化信号(QS(F,T))とするデジタル音声信号の符
号化方法であって、 各信号成分(S(F,T))の正規化は、 多重周波数帯域を複数の副周波数帯域(FB)に分割
し、副周波数帯域(FB)内で、信号成分(S(F,
T))の絶対値の最大値である時間軸最大値(TMAX
(F))と、各時間(T)内で信号成分(S(F,
T))の絶対値の最大値である副周波数軸最大値(FM
AX(FB,T))を求め、 各信号成分(S(F,T))毎に該周波数帯域(F)の
時間軸最大値(TMAX(F))と、該時間(T)の副
周波数軸最大値(FMAX(FB,T))を比較し、 時間軸最大値(TMAX(F))と副周波数軸最大値
(FMAX(FB,T))のいずれか値が小さい方で、
該信号成分(S(F,T))を割り算して正規信号成分
(NS(F,T))とすることを特徴とするデジタル音
声信号の符号化方法。
3. A digital audio signal having a predetermined sampling frequency is input to a narrow-band multiplex digital filter, separated into multiple frequency bands by the narrow-band multiplex digital filter, and each frequency band (T) at a predetermined time interval (T). F), a signal component (S (F, T)) of each signal component is obtained, and each signal component (S (F, T)) is normalized into a normal signal component (NS (F, T)). F, T)) to form a quantized signal (QS (F, T)) of a digital audio signal.
In the encoding method, each signal component (S (F, T)) is normalized by dividing a multiplexed frequency band into a plurality of sub-frequency bands (FB), and within the sub-frequency band (FB), (S (F,
T)), the maximum value of the time axis (TMAX) which is the maximum value of the absolute value of
(F)) and a signal component (S (F,
T)), which is the maximum value of the absolute value of the sub-frequency axis (FM).
AX (FB, T)), and for each signal component (S (F, T)), the maximum value of the time axis (TMAX (F)) of the frequency band (F) and the sub-frequency of the time (T) The maximum value of the axis (FMAX (FB, T)) is compared, and the maximum value of the time axis (TMAX (F)) or the maximum value of the sub-frequency axis (FMAX (FB, T)) is smaller,
A digital sound characterized by dividing the signal component (S (F, T)) into a normal signal component (NS (F, T)).
A method for encoding voice signals.
【請求項4】 所定標本化周波数のデジタル音声信号を
狭帯域多重デジタルフィルタに入力し、 狭帯域多重デジタルフィルタで多重周波数帯域に分離
し、一定時間間隔の順次時間(T)で各周波数帯域
(F)の信号成分(S(F,T))を求め、 各信号成分(S(F,T))を正規化して正規信号成分
(NS(F,T))とし、 正規信号成分(NS(F,T))を圧縮符号化して量子
化信号とするデジタル音声信号の符号化方法であって、 正規信号成分(NS(F,T))の圧縮符号化は、 正規信号成分(NS(F,T))を中心を0とした奇数
のステップrで表し、ステップrで表したP個の量子化
信号(QS(F,T)を連続させてP桁のr進で表し、
r進を2進に変換して、P個の量子化信号(QS(F,
T)をまとめてQビットの量子化信号に圧縮符号化する
ことを特徴とするデジタル音声信号の符号化方法。
4. A digital audio signal having a predetermined sampling frequency is input to a narrow band multiplex digital filter, separated into multiple frequency bands by the narrow band multiplex digital filter, and each frequency band (T) at a predetermined time interval (T). F), a signal component (S (F, T)) of each signal component is obtained, and each signal component (S (F, T)) is normalized into a normal signal component (NS (F, T)). F, T) is a coding method of a digital audio signal which is compression-encoded into a quantized signal, and the compression encoding of the normal signal component (NS (F, T)) includes the normal signal component (NS (F , T)) are represented by odd-numbered steps r centered at 0, and the P quantized signals (QS (F, T)) represented by the steps r are successively represented by P-digit r-base,
The r-ary is converted to binary, and P quantized signals (QS (F,
A method for encoding a digital audio signal, wherein T) is collectively compression-encoded into a Q-bit quantized signal .
JP27587393A 1993-09-30 1993-09-30 Digital audio signal transmission method and digital audio signal encoding method Expired - Fee Related JP2971715B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27587393A JP2971715B2 (en) 1993-09-30 1993-09-30 Digital audio signal transmission method and digital audio signal encoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27587393A JP2971715B2 (en) 1993-09-30 1993-09-30 Digital audio signal transmission method and digital audio signal encoding method

Publications (2)

Publication Number Publication Date
JPH07106978A JPH07106978A (en) 1995-04-21
JP2971715B2 true JP2971715B2 (en) 1999-11-08

Family

ID=17561630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27587393A Expired - Fee Related JP2971715B2 (en) 1993-09-30 1993-09-30 Digital audio signal transmission method and digital audio signal encoding method

Country Status (1)

Country Link
JP (1) JP2971715B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8036162B2 (en) 2006-04-26 2011-10-11 Mitsubishi Electric Corporation Wireless communication system and wireless communication device

Also Published As

Publication number Publication date
JPH07106978A (en) 1995-04-21

Similar Documents

Publication Publication Date Title
US5687157A (en) Method of recording and reproducing digital audio signal and apparatus thereof
JP2756515B2 (en) Perceptual encoding method of audible signal and audio signal transmission method
EP0738441B1 (en) Encoding and decoding of a wideband digital information signal
JP3336617B2 (en) Signal encoding or decoding apparatus, signal encoding or decoding method, and recording medium
JP3203657B2 (en) Information encoding method and apparatus, information decoding method and apparatus, information transmission method, and information recording medium
JP3277692B2 (en) Information encoding method, information decoding method, and information recording medium
CN1702974B (en) Method and apparatus for encoding/decoding a digital signal
EP0884850A2 (en) Scalable audio coding/decoding method and apparatus
JPH08190764A (en) Method and device for processing digital signal and recording medium
JP2796673B2 (en) Digital coding method
EP1072036B1 (en) Fast frame optimisation in an audio encoder
US5491773A (en) Encoding system comprising a subband coder for subband coding of a wideband digital signal constituted by first and second signal components
US5673289A (en) Method for encoding digital audio signals and apparatus thereof
JP3318931B2 (en) Signal encoding device, signal decoding device, and signal encoding method
EP0665547B1 (en) Encoding and decoding system
JP3277699B2 (en) Signal encoding method and apparatus, and signal decoding method and apparatus
JP2001044845A (en) Sub band coding system
JPH03121633A (en) Audible sound signal coding method
RU2214047C2 (en) Method and device for scalable audio-signal coding/decoding
JPH0846516A (en) Device and method for information coding, device and method for information decoding and recording medium
JP2971715B2 (en) Digital audio signal transmission method and digital audio signal encoding method
EP0773634A2 (en) Audio subband coding method
JP3998281B2 (en) Band division encoding method and decoding method for digital audio signal
JP2637090B2 (en) Sound signal processing circuit
JP3617804B2 (en) PCM signal encoding apparatus and decoding apparatus

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees