KR960003454B1 - Adaptable stereo digital audio coder - Google Patents

Adaptable stereo digital audio coder Download PDF

Info

Publication number
KR960003454B1
KR960003454B1 KR1019940000761A KR19940000761A KR960003454B1 KR 960003454 B1 KR960003454 B1 KR 960003454B1 KR 1019940000761 A KR1019940000761 A KR 1019940000761A KR 19940000761 A KR19940000761 A KR 19940000761A KR 960003454 B1 KR960003454 B1 KR 960003454B1
Authority
KR
South Korea
Prior art keywords
digital audio
channel
audio signal
encoder
amount
Prior art date
Application number
KR1019940000761A
Other languages
Korean (ko)
Other versions
KR950024453A (en
Inventor
김종일
Original Assignee
대우전자주식회사
배순훈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대우전자주식회사, 배순훈 filed Critical 대우전자주식회사
Priority to KR1019940000761A priority Critical patent/KR960003454B1/en
Publication of KR950024453A publication Critical patent/KR950024453A/en
Application granted granted Critical
Publication of KR960003454B1 publication Critical patent/KR960003454B1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

내용 없음.No content.

Description

적응적 스테레오 디지탈 오디오 부호화장치Adaptive Stereo Digital Audio Coding Device

제1도는 본 발명에 따른 스테레오 디지탈 오디오 부호화장치를 도시한 블럭도.1 is a block diagram showing a stereo digital audio encoding apparatus according to the present invention.

제2도는 본 발명의 인지 정보량(PE1)(X축)대 프레임 비트 할당 상태(Index)(Y축)를 도시한 그래프.2 is a graph showing the amount of cognitive information PE 1 (X-axis) versus frame bit allocation index (Y-axis) of the present invention.

제3도는 제1도에 도시된 제1부호기를 상세하게 나타내는 블럭도.3 is a block diagram showing in detail the first encoder shown in FIG.

제4도는 제1도에 도시된 제2부호기를 상세하게 나타내는 블럭도.4 is a block diagram showing details of a second encoder shown in FIG.

제5도는 제1도에 도시된 제3부호기를 상세하게 나타내는 블럭도.5 is a block diagram showing details of a third encoder shown in FIG.

* 도면의 주요부분에 대한 부호의 설명* Explanation of symbols for main parts of the drawings

100 : 적응채널 비트 할당부 101 : 기준 채널 판별기100: adaptive channel bit allocation unit 101: reference channel discriminator

110,120,140 : 제1, 제2 및 제3 부호기 130 : 차분신호 발생기110, 120, 140: first, second and third encoder 130: differential signal generator

150 : 비교기 160 : 부호기 선택부150: comparator 160: encoder selector

170 : 다중화부170: multiplexing unit

본 발명은 디지탈 오디오 부호기에 관한 것으로, 특히, 제1 및 제2채널로 구성되는 스테레오 디지탈 오디오 부호화장치에 있어서, 두 채널로 입력되는 디지탈 오디오 신호에 대한 인지 정보량(Perceptual Entropy)을 산출하여 인지정보량이 큰 채널을 기준채널로 결정하고 인지정보량에 대응하는 비트를 설정하여 부호화하며, 나머지 한 채널과 기준채널을 부호화하고 복호화한 오디오 신호간의 차이신호의 인지 정보량을 산출하여 이에 대응하는 비트를 설정하여 부호화 및 복호화함으로써 부호화 효율을 증대시키고 음질을 향상시키는 스테레오 디지탈 오디오 부호화 장치에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a digital audio encoder. In particular, in a stereo digital audio encoding apparatus including first and second channels, a cognitive information amount is calculated by calculating a perceptual information amount for a digital audio signal input through two channels. This large channel is determined as a reference channel, and the bit corresponding to the amount of cognitive information is set and encoded.The amount of cognition information of the difference signal between the other channel and the audio signal encoded and decoded is calculated and the corresponding bit is set. The present invention relates to a stereo digital audio encoding apparatus that increases encoding efficiency and improves sound quality by encoding and decoding.

현재 실용화되어 있는 컴팩트 디스크(Compact Disk : CD) 및 디지탈 오디오 테이프 레코더(Digital Audio Tape Recoder : DAT) 등과 같은 음질 수준의 신호 재생을 목표로 개발중에 있는 고화질 텔레비젼(HDTV) 정보 전송 시스템에서는 비교적 좁은 약 6MHZ의 대역폭을 갖는 전송선로를 통하여 영상 및 오디오 신호를 전송하여야 하기 때문에 영상신호에서와 마찬가지로 오디오 신호에 대해서는 효율적인 신호 압축기법이 요구되어 왔다.It is relatively narrow in high-definition television (HDTV) information transmission system, which is being developed for the purpose of reproducing sound quality signals such as compact discs (CDs) and digital audio tape recorders (DATs) that are currently in use. Since video and audio signals must be transmitted through transmission lines having a bandwidth of 6 MHz, an efficient signal compressor method has been required for audio signals as in video signals.

이를 위하여 HDTV용 고음질 디지탈 오디오 신호처리 기술로써 인간의 청각 특성을 반영하는 적응적 변환 부호화(Adaptive Transform Codng)기법을 이용하여 낮은 전송률에서 비교적 간단한 수신기로도 전술한 디지탈 오디오 기기수준의 음질을 재생할 수 있는 알고리즘 및 하드웨어 구현을 위해 활발히 연구되고 있다.To this end, the high-quality digital audio signal processing technology for HDTV uses adaptive transform coding, which reflects the human auditory characteristics, to reproduce the sound quality of the digital audio device level even with a relatively simple receiver at a low data rate. Active algorithms and hardware implementation are being studied.

전술한 적응적 변환 부호화 기법으로서, 알려진 부호화 방식으로 두채널 스테레오 오디오 신호에 대한 부호화 방법으로는 좌측(L) 및 우측(R)에 대한 제1 및 제2채널, 즉 두 채널로 입력되는 디지탈 오디오 신호에 대한 크기 정보(Scale Factor)의 차가 클 경우 각기 독립적으로 부호화하는 방식, MPEG(Motion Picture Expert Group)에서 제안한 방식으로 두 채널에 대한 크기 정보가 서로 비슷하면 둘중한 채널의 크기 정보를 전송하여 부호화하는 방식등이 있다. 그러나 이러한 부호화 방식들은 각 채널에 대한 신호 특성을 충분히 고려하지 않고, 각 채널에 대해 동일하게 비트를 할당하여 부호화하는 방식을 적용하여 부호화하며, 크기 정보에 대한 정보량이 작으므로 정보압축을 수행하는데 한계가 있으므로 부호화 효율이 떨어지고 고음질을 실현하는데 어려움이 있었다.As the above-described adaptive transform coding scheme, a coding scheme for a two-channel stereo audio signal using a known coding scheme includes first and second channels, i.e., two channels of left and right channels, respectively. If the difference in the scale factor (signal scale) of the signal is large, they are encoded independently. If the size information of the two channels is similar to each other, the size information of the two channels is transmitted. Coding methods. However, these coding methods do not fully consider the signal characteristics of each channel, and encode by applying the same bit allocation method for each channel, and there is a limitation in performing information compression because the amount of information on the size information is small. As a result, coding efficiency is lowered, and it is difficult to realize high sound quality.

따라서, 본 발명은 전술한 문제점을 해결하기 위한 것으로, 본 발명의 목적은 부호화 효율을 증대시키고 음질을 향상시키는 적응적 스테레오 디지탈 오디오 부호화 장치를 제공하는데 있다.Accordingly, an object of the present invention is to provide an adaptive stereo digital audio encoding apparatus which increases coding efficiency and improves sound quality.

전술한 본 발명의 목적을 달성하기 위해 본 발명은 제1 및 제2채널로 입력되는 디지탈 오디오 신호를 적응적으로 부호화하여 전송하는 장치로, 상기 제1 및 제2채널로 입력되는 디지탈 오디오 신호를 인간의 청각특성을 이용하여 인지 정보량을 산출하며, 산출된 인지 정보량에 응답하여 상기 두 채널중 기준 채널을 판별하는 기준 채널 판별기와 ; 상기 기준 채널 판별기에서 제공되는 제1 및 제2채널의 소정의 프레임에 대한 인지정보량에 응답하여 상기 각 채널 및 프레임에 비트를 할당하는 적응 채널 비트 할당부와 ; 상기 기준 채널 판별기로 부터 입력되는 기준채널에 대한 디지탈 오디오 신호를 상기 적응 채널 비트 할당부에서 제공되는 소정의 인지정보량에 의해 부호화하고 복호화하는 제1부호기와 ; 상기 기준채널 판별기로부터 입력되는 기준채널이 아닌 다른 채널에 대한 디지탈 오디오 신호를 상기 적응 채널 비트 할당부에서 제공되는 소정의 인지정보량 에 의해 부호화하고 복호화하며, 상기 다른 채널에 대한 디지탈 오디오 신호와 상기 복호화된 디지탈 오디오 신호를 통해 인지 오차를 계산하는 제2부호기와 ; 상기 제1부호기에서 복호화된 디지탈 오디오 신호와 상기 다른 채널에 대한 디지탈 오디오 신호간에 발생되는 차분신호를 차분신호 발생기와 ; 상기 차분신호와 상기 제1부호기에서 제공되는 복호화된 신호 및 상기 다른 채널로 입력되는 오디오 신호를 입력하여 상기 적응 채널 비트 할당부에서 제공되는 소정의 인지정보량에 의해 부호화하며, 인지 오차를 계산하는 제3부호기와 ; 상기 제2 및 제3부호기에서 제공되는 부호화된 디지탈 오디오 신호를 선택하여 전송하는 부호기 선택부와 ; 상기 부호기 선택부가 상기 제2 및 제3부호기로부터 입력 되는 부호화된 디지탈 오디오 신호를 선택할 수 있도록 상기 제2 및 제3부호기에서 제공되는 인지 오차를 비교하여 이에 대응하는 제어 신호를 생성하여 상기 부호기 선택부로 제공하는 비교기와 ; 상기 기준 채널 판별기로부터 제공되는 채널 선택 정보와 상기 부호기 선택부에서 제공되는 부호화된 오디오 신호와 상기 비교기에서 제공되는 부호기 선택정보를 입력하여 채널 전송 특성에 적합하게 다중화하는 다중화부를 포함한다.In order to achieve the above object of the present invention, the present invention is an apparatus for adaptively encoding and transmitting digital audio signals input to first and second channels, and receiving the digital audio signals input to the first and second channels. A reference channel discriminator for calculating the amount of cognitive information using human auditory characteristics, and determining a reference channel among the two channels in response to the calculated amount of cognitive information; An adaptive channel bit allocator for allocating bits to the respective channels and frames in response to the amount of recognition information for predetermined frames of the first and second channels provided by the reference channel discriminator; A first encoder for encoding and decoding the digital audio signal for the reference channel input from the reference channel discriminator by a predetermined amount of cognitive information provided from the adaptive channel bit allocation unit; A digital audio signal for a channel other than the reference channel input from the reference channel discriminator is encoded and decoded by a predetermined amount of cognitive information provided by the adaptive channel bit allocation unit, and the digital audio signal for the other channel and the A second encoder for calculating a recognition error through the decoded digital audio signal; A difference signal generator for generating a difference signal generated between the digital audio signal decoded by the first encoder and the digital audio signal for the other channel; Inputting the difference signal, the decoded signal provided from the first encoder, and an audio signal input to the other channel, encoding the predetermined signal by a predetermined amount of cognitive information provided by the adaptive channel bit allocation unit, and calculating a cognitive error; 3 encoders; An encoder selection unit for selecting and transmitting the encoded digital audio signals provided by the second and third encoders; The encoder selector compares the recognition errors provided by the second and third encoders to select the encoded digital audio signals inputted from the second and third encoders, and generates a control signal corresponding thereto to generate the control signals corresponding to the encoders. A comparator to provide; And a multiplexer configured to input the channel selection information provided from the reference channel discriminator, the coded audio signal provided from the encoder selector, and the encoder selection information provided from the comparator to multiplex to suit channel transmission characteristics.

이하에서는 첨부된 도면을 참조하여 본 발명의 실시예가 상세히 설명된다.Hereinafter, with reference to the accompanying drawings will be described an embodiment of the present invention;

제1도는 본 발명에 따른 적응적 스테레오 디지탈 오디오 부호화 장치를 도시한 블럭도인데, 이러한 오디오 부호화장치는 기준 채널 판별기(10), 적응 채널 비트 할당부(100), 제1, 제1 및 제3부호기(110,120 및 140), 차분신호 발생기(Differential Signal Generator : DSG)(130), 비교기(Comparator)(150), 부호기 선택부(160) 및 다중화부(MUX)(170)를 포함한다.FIG. 1 is a block diagram showing an adaptive stereo digital audio encoding apparatus according to the present invention. The audio encoding apparatus includes a reference channel discriminator 10, an adaptive channel bit allocation unit 100, first, first and first embodiments. Three encoders 110, 120, and 140, a differential signal generator (DSG) 130, a comparator 150, an encoder selector 160, and a multiplexer (MUX) 170 are included.

기준 채널 판별기(10)는 제1 및 제2채널로 입력되는 L 및 R채널에 대한 디지탈 오디오 신호를 후술하는 방법에 의해 각 채널의 프레임 단위로 인지 정보량을 계산한다. 즉, 제1 및 제2채널로 입력되는 N개(여기서, N은 양의 정수)의 샘플들로 이루어진 한 프레임의 유한 디지탈 오디오 신호원 x(n)의 전력 밀도 스펙트럼(SXX(W))에 의해 인간의 청각 특성을 이용하여 마스킹 문턱치(M(W))를 구하고, 후술하는 다음과 같은 식에 의해 인지 정보량을 측정한다.The reference channel discriminator 10 calculates the amount of cognitive information in units of frames of each channel by a method of describing digital audio signals for L and R channels input to the first and second channels as described below. That is, the power density spectrum (S XX (W)) of a finite digital audio signal source x (n) of one frame consisting of N samples (where N is a positive integer) input to the first and second channels. The masking threshold value M (W) is obtained by using human auditory characteristics, and the amount of cognitive information is measured by the following equation.

예컨대, 한 프레임의 유한 디지탈 오디오 신호원 x(n)에 대한 근사적인 전력 밀도 스펙트럼(Sxx(w))을 다음식(1)에 의해 구한다.For example, an approximate power density spectrum S xx (w) for a finite digital audio signal source x (n) of one frame is obtained by the following equation (1).

즉, In other words,

또한, 전술한 M(w)는 Sxx(w)의전력 밀도 스펙트럼을 갖는 신호에 대하여 소정의 주파수 성분에서 인간의 귀로서는 감지할 수 없는 영역의 전력 값에 해당하므로, 소정의 주파수 성분에 대하여 M(w) 이하의 오차값으로 신호를 재생하면 귀로서는 그 영역을 감지할 수 없게 되므로, 그 영역, 즉, 오차 신호의 전력 밀도 스펙트럼 (See(w)을 구하기 위해, 부호기의 입력 신호를 x(n), 출력 신호를 y(n)이라 하고, 오차 신호 e(n)을 다음식(2)에 의해 구한다.In addition, since M (w) described above corresponds to a power value of a region that cannot be detected by the human ear in a predetermined frequency component for a signal having a power density spectrum of S xx (w), If the signal is reproduced with an error value less than or equal to M (w), the area cannot be detected by the ear. Therefore, in order to obtain the power density spectrum (S ee (w)) of the area, that is, the error signal, the input signal of the encoder is used. Let x (n) and an output signal be y (n), and the error signal e (n) is calculated | required by following Formula (2).

즉, e(n)=x(n)-y(n) (2)E (n) = x (n) -y (n) (2)

그러므로, N개의 유한 신호원에 대한 See(w)를 M(w)로 대치하여 전술한 오차를 인간의 귀로서 감지할 수 없는 신호 x(n)을 전송하기 위한 인지 정보량(RPE)을 다음식(3)에 의해 구한다.Therefore, by replacing S ee (w) for N finite signal sources with M (w), the amount of cognitive information R PE for transmitting the signal x (n), which cannot detect the aforementioned error as the human ear, is obtained. Obtained by the following equation (3).

한편, 마스킹 문턱치 M(w)이 매프레임마다 동일하고 무한개의 주파수 대역을 갖는 대역을 갖는 대역 분할 부호기를 이용하는 경우, 이론적으로 실현가능한 최소 비트 전송률은 전술한 식(3)에 의해 얻어진 값이다. 그러나, 실제의 오디오 데이타에 대하여 부호기를 구성하는 경우, N개의 샘플을 가진 한프레임 시간 영역 신호마다 각각의 청각 파라메터를 분석한 후 이에 맞도록 대역 분할된 각 주파수 구간마다 양자화 수준을 달리 적용하고, N개의 샘플마다 변화하는 청각 파라메터를 전송해야 하므로, 실질적으로 필요한 비트 전송률은 전술한 식(3)에 의해 산출된 인지 정보량 보다 크게 된다.On the other hand, in the case where the masking threshold M (w) uses a band split coder having a band having the same and infinite frequency band every frame, the theoretically feasible minimum bit rate is a value obtained by the above equation (3). However, in the case of configuring the encoder for the actual audio data, each audio parameter is analyzed for each frame-time domain signal having N samples, and then the quantization level is differently applied to each frequency band divided accordingly. Since the auditory parameters vary every N samples, the substantially necessary bit rate is greater than the amount of cognitive information calculated by equation (3) above.

예를 들어, 입력 신호 x(n)을 L개(여기서, L은 양의 정수)의 균일한 대역폭을 갖는 주파수 대역으로 분할하여 부호화하는 경우, ⅰ번째 주파수 대역의 전력 밀도 스펙트럼 Sxx(ⅰ)는 다음과 같은 식(4)에 의해 근사적으로 구할 수 있다.For example, when dividing and encoding the input signal x (n) into frequency bands having L uniform bandwidths, where L is a positive integer, the power density spectrum S xx (m) of the first frequency band Can be approximated by the following equation (4).

R1는 ⅰ번째 분할 대역에 해당하는 주파수 영역하고, Sxx(W1)는 N포인트 이산 퓨리어 변환(discrete Fourier Transform : DFT)에 있어서 j번째 주파수 성분의 전력 밀도 스펙트럼에 해당하는 값이다. 또한, 마스킹 문턱치 (M(ⅰ))는 역시 다음 식(5)에 의해 근사적으로 구할 수 있다.R 1 is a frequency domain corresponding to the n-th division band, and S xx (W1) is a value corresponding to the power density spectrum of the j-th frequency component in an N-point discrete Fourier Transform (DFT). In addition, the masking threshold M (역시) can also be approximated by the following equation (5).

여기서, M(ⅰ)는 ⅰ번째 분할 대역에 속하는 마스킹 문턱치 값 M(w)중 최소값을 나타낸다.Here, M (ⅰ) represents the minimum value of the masking threshold value M (w) belonging to the ith divided band.

예를들어, 1024포인트 DFT(즉, L=1024)를 이용하여 전력 밀도 스펙트럼을 구한 후, 32개의 주파수 대역(즉, L=32)으로 분할하는 경우, 인지 정보량 RPE는 다음과 같은 식(6)에 의해 구할 수 있다.For example, in the case of obtaining a power density spectrum using a 1024-point DFT (that is, L = 1024) and dividing it into 32 frequency bands (that is, L = 32), the cognitive information amount R PE is expressed as follows. 6) can be obtained.

다음으로, 제1 및 제2채널이 가지는 전체 프레임 즉, 1GOF의 인지 정보량을 계산하기 위한 개념을 설명한다. N개의 샘플로 구성된 ⅰ(여기서, ⅰ는 0보다는 크고 프레임 수보다는 작은 양의 정수)번째 프레임의 오디오 데이타에 대하여 전술한 수식에 의해 전력 밀도 스펙트럼 및 마스킹 문턱치를 구한 다음 전술한 식(6)에 의해 ⅰ번째의 프레임의 인지 정보량 PE1를 구하고, 그 다음 제1 및 제2채널에 대한 전체 2M개의 프레임을 갖는 1프레임군에 대한 평균인지 정보량 PEm및 전술한 각 PEm에 대한 ⅰ번째 인지 정보량 PE의 변화량을 나타내는 표준 편차 PEstd를 다음 식(7 및 8)에 의해 구한다.Next, the concept for calculating the amount of cognitive information of the entire frame of the first and second channels, that is, 1GOF, will be described. The power density spectrum and masking threshold are calculated by the above-described formula for the audio data of the n-th frame consisting of N samples, where is a positive integer greater than 0 and less than the number of frames. The recognition information amount PE 1 of the first frame is obtained, and then the average recognition information amount PE m for the first frame group having a total of 2M frames for the first and second channels and the first recognition for each PE m described above. The standard deviation PE std representing the change amount of the information amount PE 한다 is obtained by the following equations (7 and 8).

이와같은 방법으로 제1 및 제2채널에 대한 디지탈 오디오 신호의 인지 정보량을 산출하고, 산출한 제1 및 제2채널에 대한 인지 정보량(PE1,PE2)을 적응 채널 할당부(100)로 전달하여, 인지 정보량이 큰 채널을 기준 채널로 설정하여 후술하는 제1부호기(110)로 전달하며, 인지 정보량이 작은 채널의 오디오 신호는 제2부호기(120), DSG(130) 및 제3부호기(140)로 전달한다.In this way, the amount of cognitive information of the digital audio signal for the first and second channels is calculated, and the calculated amount of cognitive information for the first and second channels (PE 1 , PE 2 ) is transferred to the adaptive channel allocator 100. After transmitting, the channel having a large amount of cognitive information is set as a reference channel and transmitted to the first encoder 110 to be described later. The audio signal of the channel having a small amount of cognitive information is transmitted to the second encoder 120, the DSG 130, and the third encoder. Forward to 140.

그 다음 적응적 채널 비트 할당부(100)는 기준 채널 판별기(10)에서 구한 기준 및 다른 채널, 즉 제1 및 제2채널에 대한 1 GOF내의 각각 프레임에 대응하는 인지 정보량(PE1, PE2)을 제공받아 후술하는 기법에 의해 제1 및 제2채널에 대한 각 프레임의 오디오 신호에 적응적으로 비트량을 할당하여 후술하는 기준 채널에 대한 제1부호기(110), 다른 채널에 대한 제2부호기(120) 제3부호기(140) 및 다중화부(170)로 제공한다.The adaptive channel bit allocation unit 100 then determines the amount of cognitive information PE 1 , PE corresponding to each frame in one GOF for the reference and other channels, that is, the first and second channels, obtained by the reference channel discriminator 10. 2 ) the first encoder 110 for the reference channel to be described later, and the other for the other channel by adaptively allocating a bit amount to the audio signal of each frame for the first and second channels by the technique described below The second encoder 120 is provided to the third encoder 140 and the multiplexer 170.

이하에서는 기준 채널 판별기(10)에서 얻은 기준 및 다른 채널에 대한 인지 정보량에 의해 가변적으로 비트를 할당하는 방법에 대해 상세하게 설명된다.Hereinafter, a method of allocating bits variably according to the reference obtained from the reference channel discriminator 10 and the amount of cognitive information about other channels will be described in detail.

제2도를 참조하면, 전술한 바와같이 제1 및 제2채널에 대한 2M개의 프레임으로 구성된 1 GOF에서 채널의 ⅰ(여기서, ⅰ=1,…, 2M)번째 제1프레임에 대한 인지 정보량을 PE1라 하고, 제2채널의 ⅰ(여기서,ⅰ=1,…, 2M)번째 프레임에 대한 인지 정보량을 PE1라고 하며, 1 GOF의 평균 인지 정보량을 PEm이라할 때, 제1 및 제2채널에 대한 인지 정보량(PE1)에 따른 프레임 비트 할당 상태(Index)를 나타낸 그래프이다. 또한 동도면에서, 수직 축의 Index는 -q와 +q구간의 정수값을 가지는 비트할당 상태를 나타내고, 수평축의 x1는 다음식(9)에 의해 결정되는 제1 및 제2채널내의 각 프레임이 가질 수 있는 소정의 인지 정보량을 나타낸다.Referring to FIG. 2, as described above, the amount of cognitive information for the first frame of the channel (where = 1 = 1, 2M) of the channel is determined in one GOF including 2M frames for the first and second channels. PE 1 is called, and the amount of cognition information for the 프레임 (here, ⅰ = 1, ..., 2M) th frame of the second channel is called PE 1 , and when the average recognition information amount of 1 GOF is PE m , the first and the second A graph showing a frame bit allocation state (Index) according to the amount of recognition information PE 1 for two channels. Also, in the same figure, the index on the vertical axis indicates a bit allocation state having an integer value between -q and + q, and x 1 on the horizontal axis indicates that each frame in the first and second channels is determined by the following equation (9). Represents a predetermined amount of cognition information that may have.

그러므로, 예를들어 M=8인 경우, 즉, 1GOF의 프레임이 8개인 경우에 적용된 가중치(δ)는 전술한 식(7 및 8)을 통해 구한 PEm및 PEstd에 대해 실험결과에 다음 표 1과 .Therefore, for example, when M = 8, that is, the weight (δ) applied to 8 frames of 1GOF is obtained from the following table with respect to PE m and PE std obtained through the above equations (7 and 8). 1 lesson.

[표 1]TABLE 1

즉, PEm이 0~0.315이고, PEstd가 0~0.625인 경우에는 δ는 1000이며, 그 외 다른 값들에서도 전술한 표 1을 참조하면 δ값을 얻을 수 있을 것이다.That is, when PE m is 0 to 0.315 and PE std is 0 to 0.625, δ is 1000. Referring to Table 1, other values may be obtained.

그리고, 전술한 표 1에 의거하여 구한 가중치(δ)와 X1관계를 나타내는 다음식(9)에 의해 X1를 구할 수 있다.And X <1> can be calculated | required by following Formula (9) which shows the weight (delta) calculated | required based on Table 1 mentioned above, and X <1> relationship.

(9) (9)

여기서, ⅰ와 -q 및 q간에는 -q ≤ ⅰ≤ q 관계가 있으며, 다음과 같은 조건을 가정한다.Here, there is a relationship of -q ≤ ⅰ ≤ q between ⅰ, -q and q, and the following conditions are assumed.

sign(ⅰ)=1 if(ⅰ〉 0)sign (ⅰ) = 1 if (ⅰ〉 0)

sign(ⅰ)=-1 if(ⅰ〈 0)sign (ⅰ) =-1 if (ⅰ 〈0)

sign(ⅰ)=0 if(ⅰ=0)sign (ⅰ) = 0 if (ⅰ = 0)

또한, δ값은 1 GOF에서 L 및 R채널에 대한 2M개의 PE1값을 전술한 식(7 및 8)에 의해 구한 PEm및 PEstd값에 따라 결정되는 가중치이다.Further, the δ value is a weight determined according to the PE m and PE std values obtained by the above equations (7 and 8) of 2M PE 1 values for the L and R channels at 1 GOF.

본 발명의 일예로서, q값이 8인 경우, 즉, 전술한 식(9)을 통해 구한 소정의 인지정보량(X1)에 대응하는 각각의 Index에 따른 프레임 비트수는 전술한 식들에 의거하면 다음 표 2와 같이 얻을 수 있다.As an example of the present invention, when q is 8, that is, the number of frame bits corresponding to each index corresponding to the predetermined amount of recognition information X 1 obtained through the above-described equation (9) is based on the above-described equations. It can be obtained as shown in Table 2.

[표 2]TABLE 2

(단위, Frame Bit : Bit/Frame, Bit Rate : K Bit/sec)(Unit, Frame Bit: Bit / Frame, Bit Rate: K Bit / sec)

즉, 표 2를 참조하면, 예를들어 Index가 0인 경우, 즉, 샘플링 주파수가 48KHZ이고, 테이타 전송율이 128KHX이며, 1152샘플로 이루어지는 경우 1프레임에 할당되는 비트수는 3072로서, 전술한 MPEG의 오디오 섹션에서 제안하는 비트수가 할당되고, Index가 증가할수록 프레임 비트수는 평균치를 훨씬 초과하는 반면에, Index가 감소할수록 프레임 비트수는 평균치 보다 훨씬 적게 할당됨을 알 수 있을 것이다.That is, referring to Table 2, for example, when Index is 0, that is, when the sampling frequency is 48KH Z , the data rate is 128KH X , and 1152 samples, the number of bits allocated to one frame is 3072. The number of bits proposed in the audio section of an MPEG is allocated, and as the index increases, the number of frame bits far exceeds the average value, whereas as the index decreases, the number of frame bits is allocated far less than the average value.

전술한 개념을 요약하면, 즉 제1 및 제2채널에 대한 인지정보량의 평균 및 분산 을 이용하여 인지정보량 값이 큰 경우 즉, 기준 채널에는 청각적인 중요도가 큼으로 많이 비트를 할당하고 작은 채널, 즉 다른 채널에는 보다 적은 비트를 할당하는데, 물론 두 채널에 적응적으로 할당되는 비트의 총량은 6144비트(3072×2)로 일정하며, 기준채널의 프레임 비트 할당량 FB1은 나머지 다른 채널의 프레임 비트 할당량 FB2보다 통상 크거나 같게 된다.Summarizing the above-mentioned concept, that is, when the value of the cognitive information amount is large using the average and the variance of the cognitive information amounts for the first and second channels, that is, the reference channel is assigned a lot of bits with a large auditory importance, and the small channel, That is, less bits are allocated to other channels. Of course, the total amount of bits adaptively allocated to the two channels is 6144 bits (3072 × 2), and the frame bit allocation amount FB 1 of the reference channel is the frame bits of the other channels. Usually greater than or equal to quota FB 2 .

제1도를 다시 참조하면, 제1부호기(110)는 도시된 바와 같이 입력되는 제1 및 제2채널중 인지 정보량이 큰 기준 채널의 디지탈 오디오 신호를 전술한 적응 채널 비트 할당부(100)에서 제1채널의 소정의 프레임에 대해 할당된 비트(FB1)로 제3도에 도시된 바와같은 MPEG에서 제안된 부호화 방식에 의해 부호화(310)하고 복호화(220)하며, 부호화된 오디오 신호는 후술하는 다중화부(170)로 제공하며, 복호화한 오디오 신호(y1(n))는 후술하는 DSG(130) 및 제3부호기(140)로 제공한다. 그리고 제2부호기(120)는 기준 채널이 아닌 인지 정보량이 작은 다른 채널에 대한 오디오 신호를 후술하는 방식에 의해 부호화하고 복호화하며, 또한 디지탈 오디오 입력신호를 인간의 청각 특성에 의해 최적화된 마스킹 문턱치를 구하고 이 최적화된 문턱치를 이용하여 오디오 입력신호와 복호화한 오디오 신호간의 차신호에 대한 인지오차를 측정하여 후술하는 비교기(150)로 전달하며, 또한 부호화된 오디오 신호는 후술하는 부호기 선택부(160)로 전달한다.Referring to FIG. 1 again, the first encoder 110 transmits a digital audio signal of a reference channel having a large amount of cognitive information among the first and second channels input from the adaptive channel bit allocation unit 100 as described above. A bit FB 1 allocated to a predetermined frame of the first channel is encoded 310 and decoded 220 by the encoding scheme proposed in MPEG as shown in FIG. 3, and the encoded audio signal is described later. The decoded audio signal y 1 (n) is provided to the DSG 130 and the third encoder 140 to be described later. In addition, the second encoder 120 encodes and decodes an audio signal for another channel having a small amount of cognitive information, not a reference channel, by using a method that will be described later. Furthermore, a masking threshold optimized for a digital audio input signal by human auditory characteristics may be encoded. Using the optimized threshold, the recognition error of the difference signal between the audio input signal and the decoded audio signal is measured and transmitted to the comparator 150 to be described later. The encoded audio signal is also described below. To pass.

제4도를 참조하면, 제4도는 제1도에 도시된 제2부호기(120)의 상세한 블럭도를 나타내는 도면으로써, 이러한 부호기는 인지 정보량이 작은 다른 채널의 오디오 입력신호(x2(n))를 전술한 적응 채널 비트 할당부(100)에서 제2채널, 즉 인지정보량이 작은 소정의 프레임에 할당되는 비트(FB2)에 의해 부호화하는 부호기(410)와, 이러한 부호화 시스템의 부호기(410)와, 이러한 부호화 시스템의 부호기(410)와 신호 전송의 호환이 가능한 디지탈 오디오 복호 시스템에 구성되는 복호기와 동일한 동작을 수행하는 장치로 역시 전술한 할당 되는 비트(FB2)에 의해 장치로 복호화하여 후술하는 인지 오차 측정기(Perceptual Error Measurer : PEM)(440)로 제공하는 복호기(420)를 포함하며, 또한 오디오 입력신호(x2(n))와 전술한 바와같이 복호화된 오디오 신호(y2(n))간의 인지 오차를 측정하기 위해 오디오 입력신호(x2(n))에 대한 전력 밀도 스펙트럼을 산출하고, 이 값으로 인간의 청각 특성을 이용하여 최적화된 문턱치 (M(w))를 계산하는 마스킹 문턱치 계산부(430)와, 오디오 입력신호(x2(n))와 복호화된 오디오 신호(y2(n))간의 차신호의 전력 밀도 스펙트럼을 구하며, 최적화된 문턱치 이상이 되는 오차 스텍트럼 성분을 측정하는 전술하는 PEM(440)을 포함한다.Referring to FIG. 4, FIG. 4 is a detailed block diagram of the second encoder 120 shown in FIG. 1. The encoder is an audio input signal x 2 (n) of another channel having a small amount of recognition information. ) Is encoded by the above-described adaptive channel bit allocation unit 100 by bits FB 2 allocated to a second channel, i.e., a predetermined frame having a small amount of cognitive information, and an encoder 410 of such an encoding system. And a decoder that performs the same operation as that of a decoder configured in a digital audio decoding system compatible with the encoder 410 of the encoding system and the signal transmission. A decoder 420 provided to a perceptual error measurer (PEM) 440, and further comprising an audio input signal x 2 (n) and a decoded audio signal y 2 (n) as described above. Perception error Masking threshold calculator 430 for calculating a power density spectrum for the audio input signal x 2 (n) for measurement and calculating an optimized threshold value M (w) using human auditory characteristics with this value. ) And the power density spectrum of the difference signal between the audio input signal x 2 (n) and the decoded audio signal y 2 (n), and the above-described PEM measuring an error spectrum component that is equal to or more than an optimized threshold. 440.

제1도를 다시 참조하면, DSG(130)는 제1부호기(110)에서 제공되는 복호화된 오디오 신호(y1(n))와 제2채널에 대한 오디오 입력신호(x2(n))간에 발생되는 차신호(d(n))를 다음식(10)과 같이 추출하여 제3부호기(140)로 제공한다.Referring back to FIG. 1, the DSG 130 is generated between the decoded audio signal y1 (n) provided from the first encoder 110 and the audio input signal x2 (n) for the second channel. The difference signal d (n) is extracted as shown in Equation 10 and provided to the third encoder 140.

즉, d(n)=y1(n)-x2(n) (10)That is, d (n) = y 1 (n) -x 2 (n) (10)

제5도를 참조하면, 제5도는 제1도에 도시된 제3부호기(140)의 상세한 블럭도를 나타낸 도면으로써, 부호기(510), 복호기(520), 가산기(530), 마스킹 문턱치 계산부(540) 및 PEM(550)을 포함한다. 부호기(510)는 전술한 차분 신호 발생기(130)에서 제공되는 차신호(d(n))를 입력하여 전술한 적응 채널 비트 할부당(100)에서 제공되는 제2채널의 소정의 프레임에 대한 할당되는 비트(FB2)에 의해 역시 MPEG에서 제안한 부호화 방식에 의해 부호화한다. 복호기(520)는 제3도에 도시된 복호기와 동일한 기능을 갖는 장치로서 부호기(510)를 통해 부호화된 오디오 신호를 전술한 비트(FB2)에 의해 복호화한다. 가산기(430)는 제1부호기의 복호기(320)를 통해 복호화한 오디오 신호(y1(n))와 복호기(520)를 통해 복호화한 오디오신호(yd(n))를 다음식(10)과 같이 가산하여 PEM(550)으로 제공한다.Referring to FIG. 5, FIG. 5 is a detailed block diagram of the third encoder 140 shown in FIG. 1, and includes an encoder 510, a decoder 520, an adder 530, and a masking threshold calculator. 540 and PEM 550. The encoder 510 inputs a difference signal d (n) provided by the difference signal generator 130 described above to allocate a predetermined frame of the second channel provided by the adaptive channel bit allocation allocation 100 described above. The encoded bit FB 2 is also encoded by the encoding scheme proposed by MPEG. The decoder 520 is a device having the same function as the decoder shown in FIG. 3 and decodes the audio signal encoded through the encoder 510 by the above-described bit FB 2 . The adder 430 decodes the audio signal y 1 (n) decoded through the decoder 320 of the first encoder and the audio signal y d (n) decoded through the decoder 520 as follows. Add as shown in the PEM (550).

즉, y3(n)=y1(n)+yd(n) (10)That is, y 3 (n) = y 1 (n) + y d (n) (10)

마스킹 문턱치 계산부(540)는 기준 채널이 아닌 다른 채널에 대한 오디오 입력신호를 전술한 방식과 동일하게 전력 밀도 스펙트럼을 산출한 후, 이 값을 인간의 청각 특성을 이용하여 최적화된 문턱치(M(w))를 산출하여 PEM(550)으로 제공한다. PEM(550)은 전술한 가산기(530)에서 제공되는 오디오 신호(y3(n))와 다른 채널에 대한 오디오 입력신호(x2(n))간에 발생되는 차신호의 전력 밀도 스텍트럼과 마스킹 문턱치 계산부(540)에서 제공되는 문턱치(M(w))를 이용하여 전술한 방식과 동일하게 인지 오차를 측정하여 출력한다.The masking threshold calculator 540 calculates the power density spectrum of the audio input signal for a channel other than the reference channel in the same manner as described above, and then uses this value to optimize the threshold M ( w)) is calculated and provided to the PEM 550. The PEM 550 is a masking threshold and a power density spectrum of the difference signal generated between the audio signal y 3 (n) provided by the adder 530 described above and the audio input signal x 2 (n) for another channel. Using the threshold value M (w) provided by the calculator 540, the recognition error is measured and output in the same manner as described above.

제1도를 다시 참조하면, 인지 정보량이 큰 기준 채널의 오디오 입력신호에 대한 인지 오차를 PE1,기준 채널이 아닌 다른 채널의 오디오 신호에 대한 인지 오차를 PE2라고 하면, 전술한 차신호(d(n))는 기준 채널 오디오 입력신호를 부호화하고 복호화한 오디오 신호(y1(n))와 다른 채널에 대한 오디오 입력신호(x2(n))를 전술한 식(9)을 통해 계산할 수 있고, 이 계산된 차분신호(d(n))를 전술한 바와 같이 부호화하고 복호화한 신호를 (yd(n))라 하면, 전술한 식(10)에 의해 산출된 신호(y3(n))는 실제적으로 제2채널에 대한 오디오 입력신호를 복호화한 신호가 된다. 만일, 제1 및 제2채널에 대한 오디오 입력신호가 상호 상관성(Corelation)이 많다고 하면, 신호(y3(n))가 제2채널 오디오 신호를 부호화하고 복호화한 오디오 신호(yd(n))보다 제2채널 오디오 입력신호와 더 상관성이 있게 된다.Referring to FIG. 1 again, assuming that the recognition error of the audio input signal of the reference channel having a large amount of information is PE 1 , and the recognition error of the audio signal of a channel other than the reference channel is PE 2 , the aforementioned difference signal ( d (n) calculates the audio signal y 1 (n) encoded and decoded from the reference channel audio input signal and the audio input signal x 2 (n) for another channel through Equation (9). If the calculated difference signal d (n) is encoded and decoded as described above, and y (y d (n)), then the signal y 3 ( n)) is actually a signal obtained by decoding the audio input signal for the second channel. If the audio input signals for the first and second channels have a high correlation, the signal y 3 (n) encodes and decodes the second channel audio signal y d (n). ) More correlated with the second channel audio input signal.

그리고 비교기(150)는 전술한 제2 및 제3부호기(120 및 140)에서 제공되는 인지 오차(PE2,PE3)를 비교하여 인지 오차가 적게 발생되는 부호기(120 및 140)를 선택하여 전송할 수 있도록 제어신호를 출력하며, 또한 제어신호에 대응하는 부호기 선택 정보를 출력하는 것으로, 예를들어 제2부호기(120)에서 제공되는 인지 오차(PE2)가 제3부호기(140)에서 제공되는 인지 오차(PE3)보다 큰 경우에는 후술하는 부호기 선택부(160)에서 제3부호기(140)를 통해 부호화된 오디오 신호를 선택할 수 있도록 논리 '1'(또는 0)을 출력하며, 이와 반대인 경우는 논리 '0'(또는 1)을 출력한다. 따라서 부호기 선택부(160)는 비교기(150)에서 제공되는 제어신호에 응답하여 제2 및 제3부호기(120 및 140)에서 출력되는 오디오 신호를 선택하여 다중화부(170)로 제공한다.The comparator 150 compares the recognition errors PE 2 and PE 3 provided by the second and third encoders 120 and 140 and selects and transmits the encoders 120 and 140 that generate less recognition errors. The control signal is output so that the control signal is output, and the encoder selection information corresponding to the control signal is output. For example, a recognition error PE 2 provided by the second encoder 120 is provided by the third encoder 140. If it is larger than the recognition error PE 3 , the encoder selector 160 to be described later outputs a logic '1' (or 0) so that the audio signal encoded through the third encoder 140 can be selected, and vice versa. The case outputs a logic '0' (or 1). Accordingly, the encoder selector 160 selects and outputs audio signals output from the second and third encoders 120 and 140 to the multiplexer 170 in response to a control signal provided from the comparator 150.

그러므로 다중화부(170)는 부호기 선택부(160)에서 제공되는 부호화된 오디오 신호 및 비교기(150)에서 제공되는 부호기 선택 정보를 다중화하여 채널(Channel) 특성에 적합한 비트 스트림으로 변환하여 출력한다.Therefore, the multiplexer 170 multiplexes the encoded audio signal provided from the encoder selector 160 and the encoder selection information provided from the comparator 150 to convert the bitstream suitable for channel characteristics into a bit stream.

이상에서 설명한 바와같이, 본 발명에 따른 적응적 스테레오 디지탈 오디오 부호화 장치에 의하면, 제1 및 제2채널에 대한 오디오 신호 둘 중에서 인지 정보량이 큰 채녈을 기준 채널로 결정하고 인지 정보량에 대응하는 비트를 설정하여 부호화하며, 나머지 한 채널과 기준 채널을 부호화하고 복호화한 오디오 신호간의 차이신호를 인지 정보량에 대응하는 비트를 설정하여 부호화함으로써, 부호화 효율을 증대시키고 음질을 향상시키는 커다란 효과가 있다.As described above, according to the adaptive stereo digital audio encoding apparatus according to the present invention, a channel having a large amount of cognitive information among the audio signals for the first and second channels is determined as a reference channel and a bit corresponding to the amount of cognitive information is determined. By setting and encoding, by encoding the difference signal between the other channel and the reference channel by encoding and decoding the bit by setting the bit corresponding to the amount of recognition information, there is a great effect to increase the coding efficiency and improve the sound quality.

Claims (5)

제1 및 제2채널로 입력되는 디지탈 오디오 신호를 적응적으로 부호화하여 전송하는 장치로, 상기 제1 및 제2채널로 입력되는 디지탈 오디오 신호를 인간의 청각특성을 이용하여 인지 정보량을 산출하며, 산출된 인지 정보량에 응답하여 상기 두 채널중 기준 채널을 판별하는 기준 채널 판별기와 ; 상기 기준 채널 판별기에서 제공되는 제1 및 제2채널의 소정의 프레임에 대한 인지 정보량에 응답하여 상기 각 채널 및 프레임에 비트를 할당하는 적응 채널 비트 할당부와 ; 상기 기준 채널 판별기로부터 입력되는 기준채널에 대한 디지탈 오디오 신호를 상기 적응 채널 비트 할당부에서 제공되는 소정의 인지 정보량에 의해 부호화하고 복호화하는 제1부호기와 ; 상기 기준채널 판별기로부터 입력되는 기준채널에 대한 디지탈 오디오 신호를 상기 적응 채널 비트 할당부에서 제공되는 소정의 인지 정보량에 의해 부호화하고 복호화하는 제1부호기와 ; 상기 기준채널 판별기로부터 입력되는 기준채널이 아닌 다른 채널에 대한 디지탈 오디오 신호를 상기 적응 채널 비트 할당부에서 제공되는 소저의 인지 정보량에 의해 부호화하고 복호화하며, 상기 다른 채널에 대한 디지탈 오디오 신호와 상기 복호화된 디지탈 오디오 신호를 통해 인지 오차를 계산하는 제2부호기와 ; 상기 제1부호기에서 복호화된 디지탈 오디오 신호와 상기 다른 채널에 대한 디지탈 오디오 신호간에 발생되는 차분신호를 생성하는 차분신호발생기와 ; 상기 차분신호와 상기 제1부호기에서 제공되는 복호화된 신호 및 상기 다른 채널로 입력되는 오디오 신호를 입력하여 상기 적응 채널 비트 할당부에서 제공되는 소정의 인지 정보량에 의해 부호화하며, 인지 오차를 계산하는 제3부호기와 ; 상기 제2 및 제3부호기에서 제공되는 부호화된 디지탈 오디오 신호를 선택하여 전송하는 부호기 선태부와 ; 상기 부호기 선택부가 상기 제2 및 제3부호기로부터 입력되는 부호화된 디지탈 오디오 신호를 선택할 수 있도록 상기 제2 및 제3부호기에서 제공되는 인지 오차를 비교하여 이에 대응하는 제어신호를 생성하여 상기 부호기 선택부로 제공하는 비교기와 ; 상기 기준 채널 판별기로부터 제공되는 채널 선택 정보와 상기 부호기 선택부에서 제공되는 부호화된 오디오 신호와 상기 비교기에서 제공되는 부호기 선택 정보를 입력하여 채널 전송 특성에 적합하게 다중화하는 다중화부를 포함하는 적응적 스테레오 디지탈 오디오 부호화장치.An apparatus for adaptively encoding and transmitting digital audio signals input to first and second channels, wherein the amount of cognitive information is calculated using human auditory characteristics of the digital audio signals input to the first and second channels. A reference channel discriminator for discriminating a reference channel among the two channels in response to the calculated amount of recognition information; An adaptive channel bit allocator for allocating bits to the respective channels and frames in response to the amount of acknowledgment information for predetermined frames of the first and second channels provided by the reference channel discriminator; A first encoder for encoding and decoding the digital audio signal for the reference channel input from the reference channel discriminator by a predetermined amount of cognitive information provided from the adaptive channel bit allocation unit; A first encoder for encoding and decoding the digital audio signal for the reference channel input from the reference channel discriminator by a predetermined amount of cognitive information provided from the adaptive channel bit allocation unit; A digital audio signal for a channel other than the reference channel input from the reference channel discriminator is encoded and decoded by the amount of cognitive information provided by the adaptive channel bit allocator, and the digital audio signal for the other channel and the digital audio signal for the other channel are A second encoder for calculating a recognition error through the decoded digital audio signal; A difference signal generator for generating a difference signal generated between the digital audio signal decoded by the first encoder and the digital audio signal for the other channel; Inputting the difference signal, the decoded signal provided from the first encoder, and an audio signal input to the other channel, encoding the predetermined signal by a predetermined amount of cognitive information provided by the adaptive channel bit allocation unit, and calculating a cognitive error; 3 encoders; An encoder selection unit for selecting and transmitting encoded digital audio signals provided from the second and third encoders; The encoder selector compares the recognition errors provided by the second and third encoders so as to select the encoded digital audio signals input from the second and third encoders, and generates a control signal corresponding thereto to generate the control signals. A comparator to provide; Adaptive stereo including a multiplexer for inputting the channel selection information provided from the reference channel discriminator, the coded audio signal provided from the encoder selector and the encoder selection information provided from the comparator and multiplexing to suit channel transmission characteristics. Digital audio coding device. 제1항에 있어서, 상기 적응적 채널 및 프레임 비트 할당부는, M개(여기서, M개 1 GOF 내의 프레임수)의 프레임을 가진 1 프레임군으 ⅰ번째(여기서, ⅰ는 양의 정수로서, 1 GOF의 임의의 프레임을 나타냄)프레임에 대한 인지 정보량을 PE1라 하고, 상기 1 프레임군내의 평균인지 정보량 PEm과, 1프레임군에 대한 표준편차 PEstd를 이용하여 가중치(δ)를 구하고, 그 다음 상기 평균 인지 정보량(PEm)과 상기 가중치를 이용하면 소정의 값을 갖는 인지 정보량(X1)을 다음과 같은 수식에 의해 구할 수 있으며,4. The adaptive channel and frame bit allocation unit according to claim 1, wherein the adaptive channel and frame bit allocation unit is a first GOF group, wherein M is the number of frames in M GOFs, where ⅰ is a positive integer and is 1 GOF. The amount of cognition information for a frame is denoted by PE 1 , the weight δ is obtained by using the average cognitive information amount PE m in the frame group and the standard deviation PE std for the frame group. Next, by using the average recognition information amount PE m and the weight, the recognition information amount X 1 having a predetermined value can be obtained by the following equation, 여기서,here, if(ⅰ>0) sign(ⅰ)=1if (ⅰ> 0) sign (ⅰ) = 1 if(ⅰ<0) sign(ⅰ)=-1if (ⅰ <0) sign (ⅰ) =-1 if(ⅰ=0) sign(ⅰ)=0 이고,if (ⅰ = 0) sign (ⅰ) = 0 ⅰ는 상기 Index 범위내에 존재하면, 그 다음, 상기 소정의 인지 정보량에 대응하는 프레임 비트 할당 상태를 나타내는 Index에 의해 최종 각 프레임에 적응적으로 비트를 할당함을 특징으로 하는 디지탈 오디오 복호화 장치.Is located within the Index range, then, the bit is adaptively allocated to each final frame by an Index indicating a frame bit allocation state corresponding to the predetermined amount of recognition information. 제1항에 있어서, 상기 기준 채널 판별기는 제1 및 제2채널의 디지탈 오디오 신호에 대해 인진 정보량이 큰 채널을 기준 채널로 설정하는 것을 특징으로 하는 적응적 스테레오 디지탈 오디오 부호화장치.The adaptive stereo digital audio encoding apparatus of claim 1, wherein the reference channel discriminator sets a channel having a large amount of human input information as a reference channel with respect to the digital audio signals of the first and second channels. 제1항에 있어서, 상기 제2부호기는 상기 제2채널에 대한 디지탈 오디오 신호를 기설정된 대역폭으로 대역 분할하며, 상기 입력되는 디지탈 오디오 신호에 대한 상기 소정의 인지 정보량에 의해 부호화하는 부호기와 ; 상기 부호화된 디지탈 오디오 신호를 상기 소정의 인지 정보량에 의해 복호화하는 복호기와 ; 상기 입력되는 디지탈 오디오 신호를 인간의 청각 특성에 의해 최적화된 문턱치를 계산하는 마스킹 문턱치 계산부와 ; 상기 복호화된 디지탈 오디오 신호와 입력되는 디지탈 오디오 신호간에 발생되는 차분신호를 상기 계산된 문턱치를 이용하여 인지 오차를 측정하는 인지 오차 측정기를 포함하는 적응적 스테레오 디지탈 오디오 부호화장치.2. The apparatus of claim 1, wherein the second encoder comprises: an encoder for band-dividing the digital audio signal for the second channel into a predetermined bandwidth and encoding the digital audio signal by the predetermined amount of cognition information for the input digital audio signal; A decoder which decodes the encoded digital audio signal by the predetermined amount of recognition information; A masking threshold calculator configured to calculate the threshold optimized by the auditory characteristics of the input digital audio signal; And an cognitive error measurer for measuring cognitive error of the difference signal generated between the decoded digital audio signal and the input digital audio signal using the calculated threshold. 제1항에 있어서, 상기 제3부호기는 , 상기 차분 신호 발생기에서 제공되는 차이신호를 상기 소정의 인지정보량에 의해 부호화하는 부호기와 ; 상기 부호화된 오디오 신호를 상기 소정의 인지정보량에 의해 복호화하는 복호기와 ; 상기 제1부호기의 복호기에서 제공되는 복호화된 디지탈 오디오 신호화 상기 복호기에서 제공되는 디지탈 오디오 신호를 가산하는 가산기와 ; 상기 제2채널로 입력되는 디지탈 오디오 신호를 인간의 청각 특성에 의해 최적화된 문턱치를 산출하는 마스킹 문턱치 계산부 ; 상기 가산된 디지탈 오디오 신호와 제2채널의 디지탈 오디오 신호간에 발생되는 차분신호를 상기 계산된 최적화된 문턱치를 이용하여 오차를 측정하는 인지 오차 측정기를 포함하는 적응적 스테레오 디지탈 오디오 부호화장치.2. The apparatus of claim 1, wherein the third encoder comprises: an encoder for encoding a difference signal provided from the difference signal generator by the predetermined amount of recognition information; A decoder which decodes the encoded audio signal by the predetermined amount of recognition information; A decoded digital audio signal provided by the decoder of the first encoder; an adder for adding a digital audio signal provided by the decoder; A masking threshold calculator for calculating a digital audio signal input through the second channel, the threshold optimized by human auditory characteristics; And an cognitive error measurer for measuring an error of the difference signal generated between the added digital audio signal and the digital audio signal of the second channel using the calculated optimized threshold.
KR1019940000761A 1994-01-18 1994-01-18 Adaptable stereo digital audio coder KR960003454B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019940000761A KR960003454B1 (en) 1994-01-18 1994-01-18 Adaptable stereo digital audio coder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019940000761A KR960003454B1 (en) 1994-01-18 1994-01-18 Adaptable stereo digital audio coder

Publications (2)

Publication Number Publication Date
KR950024453A KR950024453A (en) 1995-08-21
KR960003454B1 true KR960003454B1 (en) 1996-03-13

Family

ID=19375777

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940000761A KR960003454B1 (en) 1994-01-18 1994-01-18 Adaptable stereo digital audio coder

Country Status (1)

Country Link
KR (1) KR960003454B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7663702B2 (en) 2005-01-13 2010-02-16 Samsung Electronics Co., Ltd. Digital video signal processing apparatus and method for adaptive temporal and spatial Y/C separation in multiple directions

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7663702B2 (en) 2005-01-13 2010-02-16 Samsung Electronics Co., Ltd. Digital video signal processing apparatus and method for adaptive temporal and spatial Y/C separation in multiple directions

Also Published As

Publication number Publication date
KR950024453A (en) 1995-08-21

Similar Documents

Publication Publication Date Title
KR960012475B1 (en) Digital audio coder of channel bit
JP2756515B2 (en) Perceptual encoding method of audible signal and audio signal transmission method
RU2197776C2 (en) Method and device for scalable coding/decoding of stereo audio signal (alternatives)
EP0966109B1 (en) Audio coding method and audio coding apparatus
KR100388730B1 (en) High efficiency coding and decryption device
JP3926399B2 (en) How to signal noise substitution during audio signal coding
RU2129336C1 (en) Method for transmission and/or storage of digital signals of more than one channel
US5537510A (en) Adaptive digital audio encoding apparatus and a bit allocation method thereof
EP0563832A1 (en) Stereo audio encoding apparatus and method
KR970005131B1 (en) Digital audio encoding apparatus adaptive to the human audatory characteristic
JP3297240B2 (en) Adaptive coding system
JP3250376B2 (en) Information encoding method and apparatus, and information decoding method and apparatus
KR0134318B1 (en) Bit distributed apparatus and method and decoder apparatus
US5761636A (en) Bit allocation method for improved audio quality perception using psychoacoustic parameters
KR20060082618A (en) Method and apparatus for encoding and decoding multi-channel signals
JPH07336234A (en) Method and device for coding signal, method and device for decoding signal
JPH07123008A (en) High efficiency coder
KR960003454B1 (en) Adaptable stereo digital audio coder
KR960012473B1 (en) Bit divider of stereo digital audio coder
KR960012474B1 (en) Digital audio coder of adaptable stereo
KR960012477B1 (en) Adaptable stereo digital audio coder &amp; decoder
KR960003453B1 (en) Stereo digital audio coder with bit assortment
KR0144297B1 (en) Apparatus for encoding adaptive digital audio signal
JP3528260B2 (en) Encoding device and method, and decoding device and method
JPH08123488A (en) High-efficiency encoding method, high-efficiency code recording method, high-efficiency code transmitting method, high-efficiency encoding device, and high-efficiency code decoding method

Legal Events

Date Code Title Description
A201 Request for examination
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20090302

Year of fee payment: 14

LAPS Lapse due to unpaid annual fee