JPH09191255A - Band split coder - Google Patents

Band split coder

Info

Publication number
JPH09191255A
JPH09191255A JP8001752A JP175296A JPH09191255A JP H09191255 A JPH09191255 A JP H09191255A JP 8001752 A JP8001752 A JP 8001752A JP 175296 A JP175296 A JP 175296A JP H09191255 A JPH09191255 A JP H09191255A
Authority
JP
Japan
Prior art keywords
band
level information
signal
divided
bit allocation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8001752A
Other languages
Japanese (ja)
Inventor
Koji Nakajima
康志 中嶋
Kiyotaka Nagai
清隆 永井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP8001752A priority Critical patent/JPH09191255A/en
Publication of JPH09191255A publication Critical patent/JPH09191255A/en
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve coding sound quality with a simple configuration. SOLUTION: A sub band filter section 1 splits a frequency band of an input signal S101. A level information calculation section 2 detects a maximum amplitude in a frame for each frequency band based on a band split signal and calculates 1st level information S103 converted into level information for each frequency band. A level information estimate section 7 detects a zero cross number in a frame of th band split signal at a low frequency band of a band split signal S102 and estimates 2nd level information S108 dividing further the frequency band divided by the sub band filter section 1 based on the quantity information of the zero cross number and the 1st level information S103. An adaptive bit allocation calculation section 3 makes adaptive bit allocation based on the 2nd level information. Through the constitution above, the band split coding is conducted where coded sound quality is enhanced.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】この発明は、音声等の信号を
帯域分割してフレーム単位で符号化する帯域分割符号化
装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a band division coding apparatus for band-dividing a signal such as voice and coding it in frame units.

【0002】[0002]

【従来の技術】近年、高能率符号化技術の進歩,発達に
伴い、音声,画像等のデジタル信号を高能率符号化する
技術がその適用分野を拡大しつつある。音声においては
帯域分割符号化の技術を利用して高能率符号化を行い、
この符号化信号を通信によって伝送あるいは蓄積メディ
アを用いて記録再生を行う技術が広く適用されつつあ
る。
2. Description of the Related Art In recent years, with the progress and development of high-efficiency coding technology, the technology of high-efficiency coding of digital signals such as voice and images is expanding its application field. For voice, high-efficiency coding is performed using the band division coding technology,
A technique of transmitting this coded signal by communication or recording / reproducing using a storage medium is being widely applied.

【0003】このような帯域分割符号化装置として、例
えば特表平1−501435号公報に示されるようなも
のがある。以下に、このような技術を用いた従来の帯域
分割符号化装置の一例について説明する。図6は従来の
帯域分割符号化装置の構成を示すブロック図である。図
7は従来の帯域分割符号化装置の動作を説明するための
図である。図6において、1はサブバンドフィルタ部、
2はレベル情報算出部、3は適応ビット割当計算部、4
は正規化部、5は量子化部、6はマルチプレクス部であ
る。
As such a band division encoding device, there is, for example, one disclosed in Japanese Patent Publication No. 1-501435. Hereinafter, an example of a conventional band division encoding device using such a technique will be described. FIG. 6 is a block diagram showing the configuration of a conventional band division encoding device. FIG. 7 is a diagram for explaining the operation of the conventional band division encoding device. In FIG. 6, 1 is a subband filter unit,
2 is a level information calculation unit, 3 is an adaptive bit allocation calculation unit, 4
Is a normalization unit, 5 is a quantization unit, and 6 is a multiplexing unit.

【0004】以上のように構成された帯域分割符号化装
置について、以下、図6と図7を使ってその動作を説明
する。サブバンドフィルタ部1は、入力信号S101を
複数個の、例えば32個の周波数帯域に分割して帯域分
割信号S102を出力する。図7に示すように、1符号
化フレームは、例えば入力信号S101の1152サン
プルで構成される。例えば32個の周波数帯域に分割す
る場合、サブバンドフィルタ部1では入力信号S101
の間引きが行われ、1/32のサンプリングレートに変
換されて、32サンプルに1サンプルの割合で32帯域
の帯域分割信号S102が出力される。したがって、1
符号化フレームには各周波数帯域毎に36サンプル(=
1152÷32)が含まれることになる。図7に36サ
ンプルからなる帯域分割信号S102の第0帯域の波形
の例を示す。
The operation of the band division coding apparatus configured as described above will be described below with reference to FIGS. 6 and 7. The subband filter unit 1 divides the input signal S101 into a plurality of, for example, 32 frequency bands, and outputs a band-divided signal S102. As shown in FIG. 7, one encoded frame is composed of 1152 samples of the input signal S101, for example. For example, when the frequency band is divided into 32 frequency bands, the input signal S101 is
Thinning-out is performed, the sampling rate is converted to 1/32, and the band-divided signal S102 of 32 bands is output at a ratio of 1 sample to 32 samples. Therefore, 1
In the encoded frame, 36 samples (=
1152 ÷ 32) will be included. FIG. 7 shows an example of the waveform of the 0th band of the band-divided signal S102 consisting of 36 samples.

【0005】レベル情報算出部2は、帯域分割信号S1
02を入力して32個の周波数帯域毎のフレーム内の最
大振幅を検出し、これを各周波数帯域毎にレベル情報に
変換してレベル情報S103を出力する。適応ビット割
当計算部3は、レベル情報S103から聴覚特性を利用
して各周波数帯域のビット割当数を決定し、ビット割当
情報S104を出力する。正規化部4は、各周波数帯域
毎に帯域分割信号S102をレベル情報S103の示す
最大振幅で正規化して正規化信号S105を出力する。
量子化部5は、正規化信号S105をビット割当情報S
104の示す量子化ビット数で量子化し、量子化信号S
106を出力する。マルチプレクス部6は、フレーム単
位でビット割当情報S104とレベル情報S103と量
子化信号S106とを多重化して符号化信号S107と
して出力する。
The level information calculation unit 2 includes a band division signal S1.
02 is input to detect the maximum amplitude in the frame for each of the 32 frequency bands, this is converted to level information for each frequency band, and level information S103 is output. The adaptive bit allocation calculation unit 3 determines the bit allocation number of each frequency band from the level information S103 using the auditory characteristics, and outputs the bit allocation information S104. The normalization unit 4 normalizes the band-divided signal S102 for each frequency band with the maximum amplitude indicated by the level information S103, and outputs a normalized signal S105.
The quantization unit 5 converts the normalized signal S105 into the bit allocation information S105.
The quantization signal S is quantized by the number of quantization bits 104
106 is output. The multiplexing unit 6 multiplexes the bit allocation information S104, the level information S103, and the quantized signal S106 on a frame-by-frame basis and outputs the multiplexed signal as a coded signal S107.

【0006】サブバンドフィルタ1には、例えば特表平
1−501435号公報にも使用されいるクワドラチャ
・ミラー・フィルタや、1983年のIEEEのICA
SSPで発表されたジョセフ・エイチ・ロズワイラー氏
による「ポリフェーズ・クワドラチャ・フィルタ−ア・
ニュー・サブバンドコーディング」と題する論文に記載
されているようなポリフェーズ・クワドラチャ・フィル
タと呼ばれる高速演算が可能な等帯域幅のフィルタが用
いられている。
The sub-band filter 1 is, for example, a quadrature mirror filter also used in Japanese Patent Publication No. 1-501435, and 1983 IEEE ICA.
"Polyphase Quadrature Filter-A." By Joseph H. Rosweiler presented at SSP
A polyphase quadrature filter called an equal bandwidth filter capable of high-speed operation is used as described in a paper entitled "New Subband Coding".

【0007】[0007]

【発明が解決しようとする課題】しかしながら、上記従
来の帯域分割符号化装置では、適応ビット割当計算部3
で聴覚特性を利用する際、すなわち隣接周波数のスペク
トルによるマスキング効果を利用して符号化に必要なビ
ット数を決定する際のスペクトル情報としてレベル情報
S103を使用しているが、等帯域幅のサブバンドフィ
ルタを使用すると、低周波数域の分解能が粗くなり、十
分に聴覚特性が利用できず、符号化の際のビット数の適
切な割当が行えず、符号化音質が劣化するという問題点
を有していた。
However, in the above conventional band division coding apparatus, the adaptive bit allocation calculating unit 3 is used.
The level information S103 is used as spectrum information when utilizing the auditory characteristic, that is, when determining the number of bits required for encoding by utilizing the masking effect of the spectrum of adjacent frequencies. If a band filter is used, the resolution in the low frequency range becomes coarse, the auditory characteristics cannot be fully utilized, and the number of bits at the time of encoding cannot be properly allocated, resulting in the deterioration of encoded sound quality. Was.

【0008】図8は従来の帯域分割符号化装置の動作上
の問題点を説明するための音圧レベル−周波数特性図で
ある。図8において、横軸の下側には周波数を示し、同
じく上側は等帯域幅に32分割した場合の帯域境界を示
し、縦軸は入力信号の音圧レベルを示している。ここ
で、聴覚特性の利用を簡単に説明する。曲線L0は最小
可聴閾を示し、この最小可聴閾は静寂時にこれ以下の音
圧レベルの信号は聞こえないというレベルを示してい
る。第1帯域の中にs1,s2という2つのスペクトル
が存在する場合、それらのスペクトルによってそれぞれ
曲線L1,L2のように最小可聴閾が持ち上がることが
知られている。第2帯域に存在するスペクトルs3は、
最小可聴閾が持ち上がったことによって聞こえなくなる
(マスキング効果)。すなわち、符号化する必要が無く
なる。このようにして情報の圧縮を行う。
FIG. 8 is a sound pressure level-frequency characteristic diagram for explaining problems in the operation of the conventional band division encoding device. In FIG. 8, the lower side of the horizontal axis shows the frequency, the upper side shows the band boundary when divided into 32 equal bandwidths, and the vertical axis shows the sound pressure level of the input signal. Here, the use of auditory characteristics will be briefly described. The curve L0 shows the minimum audible threshold, and this minimum audible threshold shows the level at which a signal with a sound pressure level below this level is inaudible in silence. It is known that when two spectra s1 and s2 exist in the first band, those spectra raise the minimum audible thresholds as shown by curves L1 and L2, respectively. The spectrum s3 existing in the second band is
Loss of hearing due to the raised minimum audible threshold (masking effect). That is, there is no need to encode. Information is compressed in this way.

【0009】図8に示すような詳細なスペクトル情報を
得るには入力信号S101を別途フーリエ解析するなど
の必要があるが、それでは演算量が増大してしまう。そ
のために、従来の帯域分割符号化装置のように、スペク
トル情報としてレベル情報S103を使用した場合、第
1帯域のスペクトルは、第1帯域の低周波数側にあるの
か高周波数側にあるのかが判明しない。したがって、レ
ベル情報S103がs1とs2のレベルを示していたと
してもスペクトルがs1のみしかない場合(第1帯域か
ら第2帯域へのマスキング効果が最も小さい場合)を想
定してスペクトルs3は符号化する必要が生じる。した
がって、低周波域における十分な圧縮効果が得られず、
低周波域でビット割当量が多くなり、その結果、それ以
外の帯域でのビット割当量が少なくなって符号化音質が
劣化する。仮に、第1帯域のスペクトルがその帯域の低
域側にあるか高域側にあるかが分かれば、例えばスペク
トルがs1しかないことが分かれば、第2帯域のビット
割当量を削減でき、余った分を他の帯域に割り振ること
ができ、符号化音質が向上するものと考えられる。
In order to obtain the detailed spectrum information as shown in FIG. 8, it is necessary to separately perform Fourier analysis on the input signal S101, but this increases the amount of calculation. Therefore, when the level information S103 is used as the spectrum information as in the conventional band division encoding device, it is determined whether the spectrum of the first band is on the low frequency side or the high frequency side of the first band. do not do. Therefore, even if the level information S103 indicates the levels of s1 and s2, the spectrum s3 is coded assuming that the spectrum is only s1 (the masking effect from the first band to the second band is the smallest). Need to do. Therefore, a sufficient compression effect in the low frequency range cannot be obtained,
The bit allocation amount increases in the low frequency region, and as a result, the bit allocation amount in other bands decreases and the encoded sound quality deteriorates. If it is known whether the spectrum of the first band is on the low band side or the high band side of the band, for example, if it is known that the spectrum is only s1, the bit allocation amount of the second band can be reduced, and It is considered that the allocated amount can be allocated to another band and the encoded sound quality is improved.

【0010】この発明は上記従来の問題点を解決するも
ので、少ない演算量の増加でより詳細なスペクトル情報
を得ることにより符号化音質を向上させた帯域分割符号
化装置を実現することを目的とするものである。
The present invention solves the above-mentioned conventional problems, and an object of the present invention is to realize a band-division coding apparatus with improved coded sound quality by obtaining more detailed spectrum information with a small amount of calculation. It is what

【0011】[0011]

【課題を解決するための手段】この目的を達成するため
に、請求項1記載の帯域分割符号化装置は、音声等の信
号を複数の周波数帯域に分割し、フレーム単位で圧縮符
号化するもので、音声等の信号を入力し、複数の周波数
帯域に分割した帯域分割信号を出力するサブバンドフィ
ルタ手段と、帯域分割信号を入力し、帯域分割信号をも
とに各周波数帯域毎のフレーム内の最大振幅を検出して
各周波数帯域毎のレベル情報に変換した第1のレベル情
報を出力するレベル情報算出手段と、帯域分割信号と第
1のレベル情報とを入力し、低周波数域側の一部の周波
数帯域では、帯域分割信号のフレーム内のゼロクロス数
と第1のレベル情報とを用いて、ゼロクロス数の大小か
ら該当周波数帯域をそれぞれ2つ以上に分割した分割周
波数帯域のレベル情報を推定し、推定した分割周波数帯
域のレベル情報を第2のレベル情報として出力し、残り
の周波数帯域では、第1のレベル情報をそのまま第2の
レベル情報として出力するレベル情報推定手段と、第2
のレベル情報を入力し、第2のレベル情報をもとに聴覚
特性を利用して各周波数帯域のビット割当数を決定し、
各周波数帯域のビット割当数を示すビット割当情報を出
力する適応ビット割当手段と、帯域分割信号と第1のレ
ベル情報とを入力し、第1のレベル情報に従って帯域分
割信号を正規化した正規化信号を出力する正規化手段
と、正規化信号とビット割当情報とを入力し、ビット割
当情報の示すビット数で正規化信号を量子化した量子化
信号を出力する量子化手段と、ビット割当情報と第1の
レベル情報と量子化信号とを入力し、フレーム単位でビ
ット割当情報と第1のレベル情報と量子化信号とを多重
化した符号化信号を出力するマルチプレクス手段とを備
えている。
In order to achieve this object, a band division encoding device according to claim 1 divides a signal such as voice into a plurality of frequency bands and compression-encodes in frame units. , A sub-band filter means for inputting a signal such as voice and outputting a band-divided signal divided into a plurality of frequency bands, and a band-divided signal for inputting a frame-divided signal within a frame for each frequency band. Of the low frequency range side, by inputting the level information calculating means for detecting the maximum amplitude of the signal and outputting the first level information converted into the level information for each frequency band, and the band division signal and the first level information. In some frequency bands, the level of the divided frequency band obtained by dividing the corresponding frequency band into two or more from the magnitude of the zero cross number using the number of zero crosses in the frame of the band-divided signal and the first level information. Level information estimating means for estimating the information, outputting the estimated level information of the divided frequency band as the second level information, and outputting the first level information as it is as the second level information in the remaining frequency bands, Second
Input the level information of, and determine the bit allocation number of each frequency band using the auditory characteristics based on the second level information,
An adaptive bit allocation unit that outputs bit allocation information indicating the number of bit allocation of each frequency band, a band division signal, and first level information are input, and the band division signal is normalized according to the first level information. A normalizing means for outputting a signal, a quantizing means for inputting the normalized signal and the bit allocation information and outputting a quantized signal obtained by quantizing the normalized signal with the number of bits indicated by the bit allocation information, and bit allocation information. And multiplex means for inputting the first level information and the quantized signal and outputting a coded signal in which the bit allocation information, the first level information and the quantized signal are multiplexed in frame units. .

【0012】この構成によれば、レベル情報推定手段に
よって、第1のレベル情報と帯域分割信号のフレーム内
のゼロクロス数の大小から、分割帯域のスペクトルの片
寄りを検出し、低周波数域のバンドを2つ以上に分割し
たスペクトル情報を推定することによって、より細かな
聴覚特性の利用ができ、符号化の際に一層適したビット
割当が可能となり、符号化音質が向上する。
According to this structure, the level information estimating means detects the offset of the spectrum of the divided band from the magnitude of the first level information and the number of zero crossings in the frame of the band-divided signal, and detects the band in the low frequency band. By estimating the spectrum information obtained by dividing into two or more, more detailed auditory characteristics can be utilized, more suitable bit allocation can be performed at the time of encoding, and encoded sound quality is improved.

【0013】請求項2記載の帯域分割符号化装置は、音
声等の信号を複数の周波数帯域に分割し、フレーム単位
で圧縮符号化するもので、音声等の信号を入力し、複数
の周波数帯域に分割した帯域分割信号を出力するサブバ
ンドフィルタ手段と、帯域分割信号を入力し、帯域分割
信号をもとに各周波数帯域毎のフレーム内の最大振幅を
検出して各周波数帯域毎のレベル情報に変換した第1の
レベル情報を出力するレベル情報算出手段と、帯域分割
信号と第1のレベル情報とを入力し、低周波数域側の一
部の周波数帯域では、帯域分割信号のフレーム内のゼロ
クロス数と帯域分割信号のゼロクロスポイントの時間間
隔と第1のレベル情報とを用いて、ゼロクロス数の大小
から該当周波数帯域をそれぞれ2つ以上に分割した分割
周波数帯域のレベル情報を推定するとともに、ゼロクロ
スポイントの時間間隔の変動から該当周波数帯域内のス
ペクトル分布が集中しているかどうかを判断して推定し
た分割周波数帯域のレベル情報を補正し、補正した分割
周波数帯域のレベル情報を第2のレベル情報として出力
し、残りの周波数帯域では、第1のレベル情報をそのま
ま第2のレベル情報として出力するレベル情報推定手段
と、第2のレベル情報を入力し、第2のレベル情報をも
とに聴覚特性を利用して各周波数帯域のビット割当数を
決定し、各周波数帯域のビット割当数を示すビット割当
情報を出力する適応ビット割当手段と、帯域分割信号と
第1のレベル情報とを入力し、第1のレベル情報に従っ
て帯域分割信号を正規化した正規化信号を出力する正規
化手段と、正規化信号とビット割当情報とを入力し、ビ
ット割当情報の示すビット数で正規化信号を量子化した
量子化信号を出力する量子化手段と、ビット割当情報と
第1のレベル情報と量子化信号とを入力し、フレーム単
位でビット割当情報と第1のレベル情報と量子化信号と
を多重化した符号化信号を出力するマルチプレクス手段
とを備えている。
According to a second aspect of the present invention, a band division encoding device divides a signal such as voice into a plurality of frequency bands and compresses and encodes in a frame unit. The sub-band filter means for outputting the band-divided signal divided into two and the band-divided signal are input, and the maximum amplitude in the frame for each frequency band is detected based on the band-divided signal to detect the level information for each frequency band. The level information calculation means for outputting the first level information converted into the above, and the band division signal and the first level information are input, and in a part of the frequency band on the low frequency side, within the frame of the band division signal. Using the number of zero crosses, the time interval of the zero cross points of the band-divided signal, and the first level information, the level of the divided frequency band obtained by dividing the corresponding frequency band into two or more depending on the magnitude of the number of zero crosses. While estimating information, the level information of the divided frequency band estimated by judging whether the spectrum distribution in the relevant frequency band is concentrated based on the fluctuation of the time interval of the zero cross point is corrected, and the level of the corrected divided frequency band is corrected. Information is output as the second level information, and in the remaining frequency band, the level information estimating means for outputting the first level information as it is as the second level information, and the second level information are input. An adaptive bit allocation means for determining the bit allocation number of each frequency band using the auditory characteristics based on the level information and outputting bit allocation information indicating the bit allocation number of each frequency band; Inputting the level information and the normalizing means for normalizing the band-divided signal according to the first level information, and the normalizing signal and bit allocation. And a quantizing means for outputting a quantized signal obtained by quantizing the normalized signal with the number of bits indicated by the bit allocation information, the bit allocation information, the first level information, and the quantized signal, There is provided a multiplexing means for outputting a coded signal obtained by multiplexing the bit allocation information, the first level information and the quantized signal on a frame-by-frame basis.

【0014】この構成によれば、レベル情報推定手段に
よって第1のレベル情報と帯域分割信号のフレーム内の
ゼロクロス数の大小から、分割帯域のスペクトルの片寄
りを検出し、さらにゼロクロスポイントの時間間隔の変
動から帯域内のスペクトル分布が集中しているか分散し
ているかを判断して分割帯域のレベル情報を補正するこ
とで、低周波数域のバンドを2つ以上に分割したスペク
トル情報をより精度良く推定することによって、より細
かな聴覚特性の利用ができ、符号化の際に一層適したビ
ット割当が可能となり、符号化音質が一層向上する。
According to this structure, the level information estimating means detects the offset of the spectrum of the divided band from the magnitude of the first level information and the number of zero crosses in the frame of the band-divided signal, and further, the time interval of the zero-cross point. The level information of the divided band is corrected by determining whether the spectral distribution in the band is concentrated or dispersed based on the fluctuation of the, and more accurately the spectral information obtained by dividing the low frequency band into two or more. By estimating, more detailed auditory characteristics can be used, more suitable bit allocation can be performed at the time of encoding, and encoded sound quality is further improved.

【0015】[0015]

【発明の実施の形態】以下、この発明の実施の形態につ
いて、図面を参照しながら説明する。 〔第1の実施の形態〕図1はこの発明の第1の実施の形
態における帯域分割符号化装置の構成を示すブロック図
である。図1において、1はサブバンドフィルタ部、2
はレベル情報算出部、3は適応ビット割当計算部、4は
正規化部、5は量子化部、6はマルチプレクス部、7は
レベル情報推定部である。
Embodiments of the present invention will be described below with reference to the drawings. [First Embodiment] FIG. 1 is a block diagram showing the configuration of a band division coding apparatus according to the first embodiment of the present invention. In FIG. 1, 1 is a sub-band filter unit, 2
Is a level information calculation unit, 3 is an adaptive bit allocation calculation unit, 4 is a normalization unit, 5 is a quantization unit, 6 is a multiplexing unit, and 7 is a level information estimation unit.

【0016】以上のように構成された第1の実施の形態
の帯域分割符号化装置について、以下、その動作を説明
する。サブバンドフィルタ部1は、入力信号S101を
複数個の、例えば32個の周波数帯域に分割して帯域分
割信号S102を出力する。レベル情報算出部2は帯域
分割信号S102を入力して32個の周波数帯域毎のフ
レーム内の最大振幅を検出し、これを各周波数帯域毎に
レベル情報に変換して第1のレベル情報S103を出力
する。
The operation of the band division coding apparatus of the first embodiment configured as described above will be described below. The subband filter unit 1 divides the input signal S101 into a plurality of, for example, 32 frequency bands, and outputs a band-divided signal S102. The level information calculation unit 2 inputs the band-divided signal S102, detects the maximum amplitude in the frame for each of the 32 frequency bands, converts this into level information for each frequency band, and outputs the first level information S103. Output.

【0017】レベル情報推定部7は、帯域分割信号S1
02と第1のレベル情報S013を入力して低周波数域
側の一部の周波数帯域(この実施の形態では、第0帯域
から第3帯域まで)の帯域分割信号のフレーム内のゼロ
クロス数の大小から周波数帯域内のスペクトルの片寄り
を検出し、第1のレベル情報S103を用いて低周波数
域の周波数分解能の高いレベル情報である第2のレベル
情報S108を推定する。適応ビット割当計算部3は、
第2のレベル情報S108から聴覚特性を利用して各周
波数帯域のビット割当数を決定し、ビット割当情報S1
04を出力する。
The level information estimating unit 7 is arranged to detect the band division signal S1.
02 and the first level information S013 to input the number of zero crosses in the frame of the band-divided signal in a part of the frequency band on the low frequency side (from the 0th band to the 3rd band in this embodiment). Then, the deviation of the spectrum in the frequency band is detected, and the second level information S108, which is the level information with high frequency resolution in the low frequency range, is estimated using the first level information S103. The adaptive bit allocation calculation unit 3
The bit allocation number of each frequency band is determined from the second level information S108 by utilizing the auditory characteristic, and the bit allocation information S1 is determined.
04 is output.

【0018】正規化部4は、各周波数帯域毎に帯域分割
信号S102を第1のレベル情報S103の示す最大振
幅で正規化して正規化信号S105を出力する。量子化
部5は、正規化信号S105をビット割当情報S104
の示す量子化ビット数で量子化し、量子化信号S106
を出力する。マルチプレクス部6は、フレーム単位でビ
ット割当情報S104と第1のレベル情報S103と量
子化信号S106とを多重化して符号化信号S107と
して出力する。
The normalizing section 4 normalizes the band-divided signal S102 for each frequency band with the maximum amplitude indicated by the first level information S103, and outputs a normalized signal S105. The quantizer 5 converts the normalized signal S105 into bit allocation information S104.
Quantized by the quantization bit number indicated by
Is output. The multiplexing unit 6 multiplexes the bit allocation information S104, the first level information S103, and the quantized signal S106 on a frame-by-frame basis and outputs the multiplexed signal as a coded signal S107.

【0019】図2はこの発明の第1の実施の形態の帯域
分割符号化装置におけるレベル情報推定部7の具体的な
構成の一例を示すブロック図である。図3は第1の実施
の形態の帯域分割符号化装置におけるレベル情報推定部
7の動作を説明するタイムチャートである。図2におい
て、21はゼロクロス判定器、22はゼロクロス数カウ
ンタ、23はレベル情報推定器である。音声等の信号を
32個の等周波数帯域に分割した場合、サンプリング周
波数48kHzとすると周波数帯域幅は750Hzとな
る。この例では帯域番号0から3程度までは、隣接周波
数帯域のマスキング効果の影響の及ぶ周波数範囲と比較
して帯域幅が広い(従来例の図8参照)。したがって、
第2のレベル情報S108として第0帯域から第3帯域
までをさらに2つに帯域分割する例を説明する。
FIG. 2 is a block diagram showing an example of a concrete configuration of the level information estimating section 7 in the band division encoding apparatus according to the first embodiment of the present invention. FIG. 3 is a time chart for explaining the operation of the level information estimation unit 7 in the band division encoding device according to the first embodiment. In FIG. 2, reference numeral 21 is a zero-cross judging device, 22 is a zero-cross number counter, and 23 is a level information estimator. When a signal such as voice is divided into 32 equal frequency bands, the frequency bandwidth is 750 Hz when the sampling frequency is 48 kHz. In this example, the band number from 0 to 3 is wider than the frequency range affected by the masking effect of the adjacent frequency band (see FIG. 8 of the conventional example). Therefore,
An example in which the 0th band to the 3rd band are further divided into two bands as the second level information S108 will be described.

【0020】ゼロクロス判定器21は、帯域分割信号S
102の第0帯域から第3帯域までの各周波数帯域のゼ
ロクロス数をそれぞれ検出しゼロクロス信号S201と
して出力する。図3に帯域分割信号S102の第0帯域
の波形例を示す。同図において、S102aは低い周波
数スペクトルを持つ信号が中心の例、S102bは高い
周波数スペクトルを持つ信号が中心の例である。ゼロク
ロス信号S201はS102aの場合a1からa4の4
個が、S102bの場合b1からb13までの13個が
出力される。ゼロクロス数カウンタ22はゼロクロス信
号S201の1フレーム内の数を各周波数帯域毎にカウ
ントする。したがって、S102aの例では4が、S1
02bの例では13が出力される。
The zero-cross judging device 21 determines the band division signal S
The number of zero-crosses in each frequency band from the 0th band to the third band 102 is detected and output as a zero-cross signal S201. FIG. 3 shows a waveform example of the 0th band of the band-divided signal S102. In the figure, S102a is an example in which a signal having a low frequency spectrum is the center, and S102b is an example in which a signal having a high frequency spectrum is the center. The zero-cross signal S201 is 4 from a1 to a4 in the case of S102a.
In the case of S102b, 13 pieces from b1 to b13 are output. The zero-cross number counter 22 counts the number of zero-cross signals S201 in one frame for each frequency band. Therefore, in the example of S102a, 4 is S1.
In the example of 02b, 13 is output.

【0021】レベル情報推定器23は、ゼロクロス数S
202から各周波数帯域毎に一定数以上かどうかでスペ
クトルが高周波数側にあるか低周波数側にあるかを判定
し、スペクトルの主要な成分のある側の第1のレベル情
報をその分割周波数帯域のレベルとし、他方の側を例え
ば12dB下げたレベルとして第2のレベル情報S10
8を出力する。例えば判定値を10とした場合、第0帯
域では約200(=750÷36×10)が新たな帯域
境界となり、S102aでは下の分割周波数帯域が、S
102bの例では上の分割周波数帯域が第1のレベル情
報の第0帯域のレベルとなり、その反対側の分割周波数
帯域は12dB下げたレベルとする。第4帯域以上の周
波数帯域は第1のレベル情報S103をそのまま周波数
に対応させて第2のレベル情報S108とする。
The level information estimator 23 uses the zero-cross number S
From 202, it is determined whether the spectrum is on the high frequency side or the low frequency side depending on whether it is a certain number or more for each frequency band, and the first level information on the side having the main component of the spectrum is divided into the divided frequency bands. Of the second level information S10.
8 is output. For example, when the determination value is 10, about 200 (= 750 ÷ 36 × 10) is the new band boundary in the 0th band, and the lower divided frequency band is S
In the example of 102b, the upper divided frequency band is the level of the 0th band of the first level information, and the divided frequency band on the opposite side is 12 dB lower. In the frequency bands of the fourth band and above, the first level information S103 is directly associated with the frequency to be the second level information S108.

【0022】ここで、第0帯域の帯域境界の算出式の意
味、ならびにその他の帯域の帯域境界に導き方の例につ
いて説明する。符号化の対象となる周波数帯域は、サン
プリング周波数(=ナイキスト周波数)の1/2であ
る。サンプリング周波数が48kHzで32個の周波数
帯域に分割した場合、1帯域の周波数帯域は、750H
z(=48kHz÷2÷32)となる。すなわち、第0
帯域は0〜750Hzである。また、帯域分割された信
号は、1/32のサンプリング周波数に変換されてい
る。また、1符号化フレームは、36サンプルで構成さ
れているので、フレーム内に、例えば36個のゼロクロ
ス(18サイクルの信号)がある場合、この信号の周波
数は帯域分割された信号のサンプリング周波数の1/2
すなわち750Hzとなる。一定時間内のサイクル数は
周波数と比例関係にあるので、フレーム内に10個のゼ
ロクロスがある場合、その周波数は次式で求まる。
Here, the meaning of the equation for calculating the band boundary of the 0th band and an example of how to derive the band boundary of other bands will be described. The frequency band to be encoded is 1/2 of the sampling frequency (= Nyquist frequency). When the sampling frequency is 48 kHz and divided into 32 frequency bands, one frequency band is 750H.
z (= 48 kHz ÷ 2 ÷ 32). That is, the 0th
The band is 0 to 750 Hz. Further, the band-divided signal is converted to a sampling frequency of 1/32. Since one encoded frame is composed of 36 samples, if there are 36 zero crosses (18 cycle signals) in the frame, the frequency of this signal is the sampling frequency of the band-divided signal. 1/2
That is, it becomes 750 Hz. Since the number of cycles in a fixed time is proportional to the frequency, if there are 10 zero crosses in a frame, the frequency is calculated by the following equation.

【0023】750×10/36〔Hz〕 第0ないし3帯域の帯域境界の例を以下に示す。従来の
技術で説明されているサブバンドフィルタでは、分割周
波数帯域の信号周波数と入力信号との周波数関係が奇数
番目の帯域で周波数反転している。したがって、奇数帯
域と偶数帯域では算出式が異なる。各帯域の対数的にほ
ぼ中央の周波数で判定値を以下のように選ぶと、帯域境
界は以下のようになる。
An example of band boundaries of 750 × 10/36 [Hz] 0th to 3rd bands is shown below. In the subband filter described in the related art, the frequency relationship between the signal frequency in the divided frequency band and the input signal is frequency-inverted in the odd-numbered band. Therefore, the calculation formulas are different between the odd band and the even band. If the judgment value is selected as follows at the logarithmically central frequency of each band, the band boundary is as follows.

【0024】 第0帯域:判定値10; 750×10/36= 208〔Hz〕 第1帯域:判定値20;1500−750×20/36=1083〔Hz〕 第2帯域:判定値15;1500+750×15/36=1813〔Hz〕 第3帯域:判定値20;3000−750×20/36=2583〔Hz〕 以上のように、第1の実施の形態によれば、レベル情報
推定部7によって第1のレベル情報S103と帯域分割
信号S102のフレーム内のゼロクロス数の大小から、
低周波数域の一部の周波数帯域(第0帯域から第3帯域
まで)のスペクトルの片寄りを検出し、低周波数域の周
波数帯域を分割した第2のレベル情報S108を推定し
て、このスペクトル情報をもとに適応ビット割当を行う
ことによって、簡単な構成でより細かなスペクトル情報
をもとにした聴覚特性の利用ができ、符号化の際に一層
適したビット割当が可能となり、符号化音質を向上させ
ることができる。
0th band: judgment value 10; 750 × 10/36 = 208 [Hz] 1st band: judgment value 20; 1500−750 × 20/36 = 1083 [Hz] 2nd band: judgment value 15; 1500 + 750 × 15/36 = 1813 [Hz] Third band: judgment value 20; 3000-750 × 20/36 = 2583 [Hz] As described above, according to the first embodiment, the level information estimation unit 7 From the level of the first level information S103 and the number of zero crosses in the frame of the band-divided signal S102,
The deviation of the spectrum of a part of the low frequency band (from the 0th band to the 3rd band) is detected, the second level information S108 obtained by dividing the frequency band of the low frequency band is estimated, and this spectrum is estimated. By performing adaptive bit allocation based on information, it is possible to use auditory characteristics based on finer spectrum information with a simple configuration, and it becomes possible to perform more suitable bit allocation during encoding. The sound quality can be improved.

【0025】〔第2の実施の形態〕この発明の第2の実
施の形態における帯域分割符号化装置について説明す
る。その基本的構成は第1の実施の形態と同様であり、
図1によって示される。第1の実施の形態と第2の実施
の形態とはレベル情報推定部7の構成が異なるだけで、
他の構成要素の動作は全く同一である。
[Second Embodiment] A band division encoding apparatus according to a second embodiment of the present invention will be described. The basic configuration is similar to that of the first embodiment,
Shown by FIG. Only the configuration of the level information estimation unit 7 is different between the first embodiment and the second embodiment,
The operation of the other components is exactly the same.

【0026】したがって以下、レベル情報推定部7につ
いて、図面を参照しながら説明する。図4はこの発明の
第2の実施の形態の帯域分割符号化装置におけるレベル
情報推定部7の具体的な構成を示すブロック図である。
図5は第2の実施の形態の帯域分割符号化装置における
レベル情報推定部7の動作を説明するタイムチャートで
ある。
Therefore, the level information estimating unit 7 will be described below with reference to the drawings. FIG. 4 is a block diagram showing a specific configuration of the level information estimation unit 7 in the band division encoding device according to the second embodiment of the present invention.
FIG. 5 is a time chart for explaining the operation of the level information estimation unit 7 in the band division coding apparatus according to the second embodiment.

【0027】図4において、41はゼロクロス判定器、
42はゼロクロス数カウンタ、43はレベル情報推定
器、44はゼロクロス間隔検出器である。この第2の実
施の形態では、第1の実施の形態と同様に32個の等周
波数帯域に分割した場合で、第2のレベル情報S108
として第0帯域から第3帯域までをさらに2つに帯域分
割する例を説明する。
In FIG. 4, reference numeral 41 is a zero-cross judging device,
42 is a zero-cross number counter, 43 is a level information estimator, and 44 is a zero-cross interval detector. In the second embodiment, as in the case of the first embodiment, the second level information S108 is obtained when the signal is divided into 32 equal frequency bands.
An example will be described in which the 0th band to the 3rd band are further divided into two bands.

【0028】ゼロクロス判定器41は、帯域分割信号S
102の第0帯域から第3帯域までの各周波数帯域のゼ
ロクロス数をそれぞれ検出しゼロクロス信号S201と
して出力する。図5に帯域分割信号S102の第0帯域
の波形例を示す。S102cは波線で示す低い周波数ス
ペクトルを持つ信号にその約6倍の周波数のスペクトル
を持つ信号が重畳された信号の例である。この場合、ゼ
ロクロス信号S201はc1からc4の4個が出力され
る。
The zero-cross discriminator 41 determines the band division signal S
The number of zero-crosses in each frequency band from the 0th band to the third band 102 is detected and output as a zero-cross signal S201. FIG. 5 shows a waveform example of the 0th band of the band-divided signal S102. S102c is an example of a signal in which a signal having a spectrum of a frequency about 6 times that of the signal having a low frequency spectrum shown by a broken line is superimposed. In this case, four zero-cross signals S201 are output from c1 to c4.

【0029】ゼロクロス数カウンタ42は、ゼロクロス
信号S201の1フレーム内の数を各周波数帯域毎にカ
ウントし、ゼロクロス数S202を出力する。帯域分割
信号S102の第0帯域の波形例S102cの場合4が
出力される。ゼロクロス判定器41とゼロクロスカウン
タ42の動作は第1の実施の形態と同一であるので、詳
細な説明は省略する。
The zero-cross number counter 42 counts the number of zero-cross signals S201 in one frame for each frequency band, and outputs a zero-cross number S202. In the case of the waveform example S102c of the 0th band of the band-divided signal S102, 4 is output. The operations of the zero-cross determiner 41 and the zero-cross counter 42 are the same as those in the first embodiment, and detailed description thereof will be omitted.

【0030】ゼロクロス間隔検出器44は、ゼロクロス
信号S201のサンプル間隔を検出し、サンプル間隔の
最大値と最小値をゼロクロス間隔情報S401として出
力する。S102cの波形例ではt1からt5までの最
大値はt1の13であり、t2からt4までの最小値が
t3の2である。このとき、t1とt5はこの値以上大
きな値の可能性がある。この例ではゼロクロス間隔情報
S401として最大値13と最小値2が出力される。
The zero-cross interval detector 44 detects the sample interval of the zero-cross signal S201 and outputs the maximum value and the minimum value of the sample interval as zero-cross interval information S401. In the waveform example of S102c, the maximum value from t1 to t5 is 13 of t1 and the minimum value from t2 to t4 is 2 of t3. At this time, t1 and t5 may be larger than this value. In this example, the maximum value 13 and the minimum value 2 are output as the zero-cross interval information S401.

【0031】レベル情報推定器43は、ゼロクロス数S
202とゼロクロス間隔S401とから第2のレベル情
報S108を出力する。その動作は、まず第1の手順と
して、ゼロクロス数S202が各周波数帯域毎に一定数
以上かどうかでスペクトルが高周波数側にあるか低周波
数側にあるかを判定し、主要なスペクトル成分のある側
の第1のレベル情報をその分割周波数帯域のレベルと
し、主要なスペクトル成分の無い側を例えば12dB下
げたレベルとして第2のレベル情報S108を仮に決定
する。この動作は第1の実施の形態と同一である。
The level information estimator 43 uses the zero-cross number S
The second level information S108 is output from 202 and the zero-cross interval S401. In the operation, as a first procedure, it is determined whether the spectrum is on the high frequency side or the low frequency side depending on whether the number of zero crosses S202 is a certain number or more for each frequency band, and there is a main spectrum component. The first level information on the side is set as the level of the divided frequency band, and the side without a main spectral component is set as the level lowered by, for example, 12 dB, and the second level information S108 is temporarily determined. This operation is the same as in the first embodiment.

【0032】つぎに、第2の手順として、ゼロクロス間
隔情報S401の最大値と最小値の差を調べ、差が大き
い場合にはスペクトルが分散しているためにそれぞれの
分割周波数帯域のレベル情報差を6dBあるいは0dB
と小さくする。差が小さい場合には、第1の手順で決定
したレベル情報のままとする。このようにして決定した
レベル情報を第2のレベル情報S108として出力す
る。第4帯域以上の周波数帯域は第1のレベル情報S1
03をそのまま周波数に対応させて第2のレベル情報S
108とする。
Next, as a second procedure, the difference between the maximum value and the minimum value of the zero-cross interval information S401 is examined. If the difference is large, the spectrum is dispersed, so that the level information difference between the divided frequency bands is different. 6 dB or 0 dB
And make it smaller. If the difference is small, the level information determined in the first procedure remains unchanged. The level information thus determined is output as the second level information S108. For the frequency bands above the fourth band, the first level information S1
The second level information S by making 03 correspond to the frequency as it is
108.

【0033】以上のように、第2の実施の形態によれ
ば、レベル情報推定部7によって第1のレベル情報S1
03と帯域分割信号S102のフレーム内のゼロクロス
数の大小から低周波数域の一部の周波数帯域(第0帯域
から第3帯域まで)のスペクトルの片寄りを検出し、さ
らにゼロクロスポイントの時間間隔の変動を検出して周
波数帯域内のスペクトル分布が集中しているか分散して
いるかを判断して分割周波数帯域のレベル情報を補正す
ることで、低周波数域のバンドを2つ以上に分割したス
ペクトル情報をより精度良く推定することによって、よ
り細かな聴覚特性の利用ができ、符号化の際に一層適し
たビット割当が可能となり、符号化音質を向上すること
ができる。
As described above, according to the second embodiment, the level information estimation unit 7 causes the first level information S1.
03 and the number of zero-crosses in the frame of the band-divided signal S102 to a part of the low-frequency part of the frequency band (from the 0th band to the 3rd band), the deviation of the spectrum is detected, and the time interval of the zero-cross point is further detected. Spectral information obtained by dividing the low frequency band into two or more by detecting fluctuations and determining whether the spectrum distribution in the frequency band is concentrated or dispersed and correcting the level information of the divided frequency band. Can be used more accurately, more appropriate bit allocation can be performed at the time of encoding, and encoded sound quality can be improved.

【0034】[0034]

【発明の効果】請求項1記載の帯域分割符号化装置によ
れば、帯域分割信号のフレーム内のゼロクロス数の大小
から、低周波数域の一部の周波数帯域のスペクトルの片
寄りを検出し、低周波数域の周波数帯域をさらに分割し
たレベル情報を推定して、このスペクトル情報をもとに
適応ビット割当を行うことによって、符号化の際に一層
適したビット割当が可能となり、簡単な構成で符号化音
質を向上させることができる。
According to the band division encoding device of the first aspect, the deviation of the spectrum of a part of the frequency band of the low frequency region is detected from the magnitude of the number of zero crosses in the frame of the band division signal. By estimating level information obtained by further dividing the frequency band of the low frequency range and performing adaptive bit allocation based on this spectrum information, it becomes possible to perform more suitable bit allocation at the time of encoding, and with a simple configuration. The encoded sound quality can be improved.

【0035】請求項2記載の帯域分割符号化装置によれ
ば、帯域分割信号のフレーム内のゼロクロス数の大小か
ら低周波数域の一部の周波数帯域のスペクトルの片寄り
を検出し、さらにゼロクロスポイントの時間間隔の変動
を検出して周波数帯域内のスペクトル分布が集中してい
るか分散しているかを判断して分割周波数帯域のレベル
情報を補正することで、低周波数域の周波数帯域をさら
に分割したスペクトル情報をより精度良く推定すること
によって、符号化の際にさらに一層適したビット割当が
可能となり、簡単な構成でさらに符号化音質を向上する
ことができる。
According to the band division encoding device of the second aspect, the deviation of the spectrum of a part of the frequency band of the low frequency region is detected from the magnitude of the number of zero crosses in the frame of the band division signal, and the zero cross point is further detected. The frequency band of the low frequency band is further divided by correcting the level information of the divided frequency band by detecting the fluctuation of the time interval of the and detecting whether the spectral distribution in the frequency band is concentrated or dispersed. By estimating the spectrum information with higher accuracy, more suitable bit allocation can be performed at the time of encoding, and the encoded sound quality can be further improved with a simple configuration.

【0036】そして、これらの発明の帯域分割符号化装
置を用いることにより安価で小型な信号通信装置や信号
記録再生装置を実現することができる。
By using the band division coding apparatus of these inventions, it is possible to realize an inexpensive and compact signal communication apparatus and signal recording / reproducing apparatus.

【図面の簡単な説明】[Brief description of the drawings]

【図1】この発明の第1の実施の形態における帯域分割
符号化装置の構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a band division encoding device according to a first embodiment of the present invention.

【図2】同第1の実施の形態における帯域分割符号化装
置のレベル情報推定部の具体的な構成を示すブロック図
である。
FIG. 2 is a block diagram showing a specific configuration of a level information estimation unit of the band division encoding apparatus according to the first embodiment.

【図3】同第1の実施の形態における帯域分割符号化装
置のレベル情報推定部の動作を説明するためのタイムチ
ャートである。
FIG. 3 is a time chart for explaining the operation of the level information estimating unit of the band division encoding apparatus according to the first embodiment.

【図4】この発明の第2の実施の形態における帯域分割
符号化装置のレベル情報推定部の具体的な構成を示すブ
ロック図である。
FIG. 4 is a block diagram showing a specific configuration of a level information estimation section of a band division encoding device according to a second embodiment of the present invention.

【図5】同第2の実施の形態におけるレベル情報推定部
の動作を説明するためのタイムチャートである。
FIG. 5 is a time chart for explaining the operation of the level information estimating unit according to the second embodiment.

【図6】従来の帯域分割符号化装置の構成を示すブロッ
ク図である。
FIG. 6 is a block diagram showing a configuration of a conventional band division encoding device.

【図7】従来の帯域分割符号化装置の動作を説明するた
めのタイムチャートである。
FIG. 7 is a time chart for explaining the operation of the conventional band division encoding device.

【図8】従来の帯域分割符号化装置の動作上の問題点を
説明するための音圧レベル−周波数特性図である。
FIG. 8 is a sound pressure level-frequency characteristic diagram for explaining problems in the operation of the conventional band division encoding device.

【符号の説明】[Explanation of symbols]

1 サブバンドフィルタ部 2 レベル情報算出部 3 適応ビット割当計算部 4 正規化部 5 量子化部 6 マルチプレクス部 7 レベル情報推定部 21,41 ゼロクロス判定器 22,42 ゼロクロスカウンタ 23,43 レベル情報推定器 44 ゼロクロス間隔検出器 1 Sub-band Filter Section 2 Level Information Calculation Section 3 Adaptive Bit Allocation Calculation Section 4 Normalization Section 5 Quantization Section 6 Multiplex Section 7 Level Information Estimating Section 21,41 Zero Cross Judgmenter 22,42 Zero Cross Counter 23,43 Level Information Estimation Unit 44 Zero-crossing interval detector

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 H04B 14/04 H04B 14/04 Z ─────────────────────────────────────────────────── ─── Continuation of the front page (51) Int.Cl. 6 Identification code Internal reference number FI technical display location H04B 14/04 H04B 14/04 Z

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 音声等の信号を複数の周波数帯域に分割
し、フレーム単位で圧縮符号化する帯域分割符号化装置
であって、 前記音声等の信号を入力し、複数の周波数帯域に分割し
た帯域分割信号を出力するサブバンドフィルタ手段と、 前記帯域分割信号を入力し、前記帯域分割信号をもとに
各周波数帯域毎のフレーム内の最大振幅を検出して各周
波数帯域毎のレベル情報に変換した第1のレベル情報を
出力するレベル情報算出手段と、 前記帯域分割信号と前記第1のレベル情報とを入力し、
低周波数域側の一部の周波数帯域では、前記帯域分割信
号のフレーム内のゼロクロス数と前記第1のレベル情報
とを用いて、前記ゼロクロス数の大小から該当周波数帯
域をそれぞれ2つ以上に分割した分割周波数帯域のレベ
ル情報を推定し、前記推定した分割周波数帯域のレベル
情報を第2のレベル情報として出力し、残りの周波数帯
域では、前記第1のレベル情報をそのまま前記第2のレ
ベル情報として出力するレベル情報推定手段と、 前記第2のレベル情報を入力し、前記第2のレベル情報
をもとに聴覚特性を利用して各周波数帯域のビット割当
数を決定し、前記各周波数帯域のビット割当数を示すビ
ット割当情報を出力する適応ビット割当手段と、 前記帯域分割信号と前記第1のレベル情報とを入力し、
前記第1のレベル情報に従って前記帯域分割信号を正規
化した正規化信号を出力する正規化手段と、 前記正規化信号と前記ビット割当情報とを入力し、前記
ビット割当情報の示すビット数で前記正規化信号を量子
化した量子化信号を出力する量子化手段と、 前記ビット割当情報と前記第1のレベル情報と前記量子
化信号とを入力し、フレーム単位で前記ビット割当情報
と前記第1のレベル情報と前記量子化信号とを多重化し
た符号化信号を出力するマルチプレクス手段とを備えた
帯域分割符号化装置。
1. A band division encoding device for dividing a signal such as voice into a plurality of frequency bands and compression-coding in frame units, wherein the signal such as the voice is input and divided into a plurality of frequency bands. Sub-band filter means for outputting a band-divided signal, the band-divided signal is input, the maximum amplitude in the frame for each frequency band is detected based on the band-divided signal to obtain level information for each frequency band. Level information calculation means for outputting the converted first level information; and inputting the band division signal and the first level information,
In a part of the frequency band on the low frequency side, the frequency band is divided into two or more from the magnitude of the zero cross number by using the number of zero crosses in the frame of the band division signal and the first level information. The level information of the divided frequency band is estimated, the level information of the estimated divided frequency band is output as second level information, and in the remaining frequency bands, the first level information is directly used as the second level information. Inputting the second level information, determining the bit allocation number of each frequency band based on the auditory characteristics based on the second level information, An adaptive bit allocation unit that outputs bit allocation information indicating the number of bit allocations of, and the band division signal and the first level information,
Normalizing means for outputting a normalized signal obtained by normalizing the band-divided signal in accordance with the first level information, and inputting the normalized signal and the bit allocation information, the number of bits indicated by the bit allocation information Quantizing means for outputting a quantized signal obtained by quantizing a normalized signal, the bit allocation information, the first level information, and the quantized signal are input, and the bit allocation information and the first Band division coding apparatus comprising: multiplexing means for outputting a coded signal obtained by multiplexing the level information of 1. and the quantized signal.
【請求項2】 音声等の信号を複数の周波数帯域に分割
し、フレーム単位で圧縮符号化する帯域分割符号化装置
であって、 前記音声等の信号を入力し、複数の周波数帯域に分割し
た帯域分割信号を出力するサブバンドフィルタ手段と、 前記帯域分割信号を入力し、前記帯域分割信号をもとに
各周波数帯域毎のフレーム内の最大振幅を検出して各周
波数帯域毎のレベル情報に変換した第1のレベル情報を
出力するレベル情報算出手段と、 前記帯域分割信号と前記第1のレベル情報とを入力し、
低周波数域側の一部の周波数帯域では、前記帯域分割信
号のフレーム内のゼロクロス数と前記帯域分割信号のゼ
ロクロスポイントの時間間隔と前記第1のレベル情報と
を用いて、前記ゼロクロス数の大小から該当周波数帯域
をそれぞれ2つ以上に分割した分割周波数帯域のレベル
情報を推定するとともに、前記ゼロクロスポイントの時
間間隔の変動から該当周波数帯域内のスペクトル分布が
集中しているかどうかを判断して前記推定した分割周波
数帯域のレベル情報を補正し、前記補正した分割周波数
帯域のレベル情報を第2のレベル情報として出力し、残
りの周波数帯域では、前記第1のレベル情報をそのまま
前記第2のレベル情報として出力するレベル情報推定手
段と、 前記第2のレベル情報を入力し、前記第2のレベル情報
をもとに聴覚特性を利用して各周波数帯域のビット割当
数を決定し、前記各周波数帯域のビット割当数を示すビ
ット割当情報を出力する適応ビット割当手段と、 前記帯域分割信号と前記第1のレベル情報とを入力し、
前記第1のレベル情報に従って前記帯域分割信号を正規
化した正規化信号を出力する正規化手段と、 前記正規化信号と前記ビット割当情報とを入力し、前記
ビット割当情報の示すビット数で前記正規化信号を量子
化した量子化信号を出力する量子化手段と、 前記ビット割当情報と前記第1のレベル情報と前記量子
化信号とを入力し、フレーム単位で前記ビット割当情報
と前記第1のレベル情報と前記量子化信号とを多重化し
た符号化信号を出力するマルチプレクス手段とを備えた
帯域分割符号化装置。
2. A band division coding apparatus for dividing a signal such as voice into a plurality of frequency bands and compression-coding in frame units, wherein the signal such as the voice is input and divided into a plurality of frequency bands. Sub-band filter means for outputting a band-divided signal, the band-divided signal is input, the maximum amplitude in the frame for each frequency band is detected based on the band-divided signal to obtain level information for each frequency band. Level information calculation means for outputting the converted first level information; and inputting the band division signal and the first level information,
In some frequency bands on the low frequency band side, the number of zero crosses in the frame of the band division signal, the time interval of the zero cross points of the band division signal, and the first level information are used to determine the magnitude of the number of zero crosses. The level information of the divided frequency bands obtained by dividing the corresponding frequency band into two or more is estimated from the above, and it is judged from the fluctuation of the time interval of the zero cross points whether or not the spectrum distribution in the corresponding frequency band is concentrated. The estimated level information of the divided frequency band is corrected, and the corrected level information of the divided frequency band is output as second level information. In the remaining frequency bands, the first level information is directly used as the second level information. Level information estimating means for outputting as information, and inputting the second level information, and listening based on the second level information. Adaptive bit allocation means for determining the bit allocation number of each frequency band by utilizing the sense characteristic and outputting bit allocation information indicating the bit allocation number of each frequency band; the band division signal and the first level information. And type
Normalizing means for outputting a normalized signal obtained by normalizing the band-divided signal in accordance with the first level information, and inputting the normalized signal and the bit allocation information, the number of bits indicated by the bit allocation information Quantizing means for outputting a quantized signal obtained by quantizing a normalized signal, the bit allocation information, the first level information, and the quantized signal are input, and the bit allocation information and the first Band division coding apparatus comprising: multiplexing means for outputting a coded signal obtained by multiplexing the level information of 1. and the quantized signal.
JP8001752A 1996-01-09 1996-01-09 Band split coder Pending JPH09191255A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8001752A JPH09191255A (en) 1996-01-09 1996-01-09 Band split coder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8001752A JPH09191255A (en) 1996-01-09 1996-01-09 Band split coder

Publications (1)

Publication Number Publication Date
JPH09191255A true JPH09191255A (en) 1997-07-22

Family

ID=11510316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8001752A Pending JPH09191255A (en) 1996-01-09 1996-01-09 Band split coder

Country Status (1)

Country Link
JP (1) JPH09191255A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012160602A1 (en) * 2011-05-24 2012-11-29 三菱電機株式会社 Target sound enhancement device and car navigation system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012160602A1 (en) * 2011-05-24 2012-11-29 三菱電機株式会社 Target sound enhancement device and car navigation system
JP5543023B2 (en) * 2011-05-24 2014-07-09 三菱電機株式会社 Object sound enhancement device and car navigation system

Similar Documents

Publication Publication Date Title
JP6592148B2 (en) How to enhance the performance of coding systems that use high-frequency reconstruction methods
KR100242864B1 (en) Digital signal coder and the method
KR100728428B1 (en) Audio decoding apparatus and method
JP2906646B2 (en) Voice band division coding device
EP0709004B1 (en) Hybrid adaptive allocation for audio encoder and decoder
JP5175028B2 (en) Digital signal encoding method and apparatus, and decoding method and apparatus
US20110002266A1 (en) System and Method for Frequency Domain Audio Post-processing Based on Perceptual Masking
JPH05206866A (en) High efficiency encoder
JPH06232761A (en) Method and device for high efficiency coding or decoding
US7613609B2 (en) Apparatus and method for encoding a multi-channel signal and a program pertaining thereto
EP2438591B1 (en) A method and arrangement for estimating the quality degradation of a processed signal
KR20160120713A (en) Decoding device, encoding device, decoding method, encoding method, terminal device, and base station device
US7013266B1 (en) Method for determining speech quality by comparison of signal properties
JP6400590B2 (en) Acoustic signal encoding apparatus, acoustic signal decoding apparatus, terminal apparatus, base station apparatus, acoustic signal encoding method, and decoding method
EP0899892B1 (en) Signal processing apparatus and method, and information recording apparatus
JPH09101799A (en) Signal coding method and device therefor
JPH09191255A (en) Band split coder
JPH08123488A (en) High-efficiency encoding method, high-efficiency code recording method, high-efficiency code transmitting method, high-efficiency encoding device, and high-efficiency code decoding method
JPH09274500A (en) Coding method of digital audio signals
KR100340368B1 (en) High Efficiency Encoder, Decoder and Digital Data Derivation Method
JPH0750589A (en) Sub-band coding device
JP2993324B2 (en) Highly efficient speech coding system
JP2906477B2 (en) Digital signal encoding method
JP3141451B2 (en) Audio signal processing method
KR960003454B1 (en) Adaptable stereo digital audio coder