KR960003454B1 - 적응적 스테레오 디지탈 오디오 부호화장치 - Google Patents

적응적 스테레오 디지탈 오디오 부호화장치 Download PDF

Info

Publication number
KR960003454B1
KR960003454B1 KR1019940000761A KR19940000761A KR960003454B1 KR 960003454 B1 KR960003454 B1 KR 960003454B1 KR 1019940000761 A KR1019940000761 A KR 1019940000761A KR 19940000761 A KR19940000761 A KR 19940000761A KR 960003454 B1 KR960003454 B1 KR 960003454B1
Authority
KR
South Korea
Prior art keywords
digital audio
channel
audio signal
encoder
amount
Prior art date
Application number
KR1019940000761A
Other languages
English (en)
Other versions
KR950024453A (ko
Inventor
김종일
Original Assignee
대우전자주식회사
배순훈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대우전자주식회사, 배순훈 filed Critical 대우전자주식회사
Priority to KR1019940000761A priority Critical patent/KR960003454B1/ko
Publication of KR950024453A publication Critical patent/KR950024453A/ko
Application granted granted Critical
Publication of KR960003454B1 publication Critical patent/KR960003454B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

내용 없음.

Description

적응적 스테레오 디지탈 오디오 부호화장치
제1도는 본 발명에 따른 스테레오 디지탈 오디오 부호화장치를 도시한 블럭도.
제2도는 본 발명의 인지 정보량(PE1)(X축)대 프레임 비트 할당 상태(Index)(Y축)를 도시한 그래프.
제3도는 제1도에 도시된 제1부호기를 상세하게 나타내는 블럭도.
제4도는 제1도에 도시된 제2부호기를 상세하게 나타내는 블럭도.
제5도는 제1도에 도시된 제3부호기를 상세하게 나타내는 블럭도.
* 도면의 주요부분에 대한 부호의 설명
100 : 적응채널 비트 할당부 101 : 기준 채널 판별기
110,120,140 : 제1, 제2 및 제3 부호기 130 : 차분신호 발생기
150 : 비교기 160 : 부호기 선택부
170 : 다중화부
본 발명은 디지탈 오디오 부호기에 관한 것으로, 특히, 제1 및 제2채널로 구성되는 스테레오 디지탈 오디오 부호화장치에 있어서, 두 채널로 입력되는 디지탈 오디오 신호에 대한 인지 정보량(Perceptual Entropy)을 산출하여 인지정보량이 큰 채널을 기준채널로 결정하고 인지정보량에 대응하는 비트를 설정하여 부호화하며, 나머지 한 채널과 기준채널을 부호화하고 복호화한 오디오 신호간의 차이신호의 인지 정보량을 산출하여 이에 대응하는 비트를 설정하여 부호화 및 복호화함으로써 부호화 효율을 증대시키고 음질을 향상시키는 스테레오 디지탈 오디오 부호화 장치에 관한 것이다.
현재 실용화되어 있는 컴팩트 디스크(Compact Disk : CD) 및 디지탈 오디오 테이프 레코더(Digital Audio Tape Recoder : DAT) 등과 같은 음질 수준의 신호 재생을 목표로 개발중에 있는 고화질 텔레비젼(HDTV) 정보 전송 시스템에서는 비교적 좁은 약 6MHZ의 대역폭을 갖는 전송선로를 통하여 영상 및 오디오 신호를 전송하여야 하기 때문에 영상신호에서와 마찬가지로 오디오 신호에 대해서는 효율적인 신호 압축기법이 요구되어 왔다.
이를 위하여 HDTV용 고음질 디지탈 오디오 신호처리 기술로써 인간의 청각 특성을 반영하는 적응적 변환 부호화(Adaptive Transform Codng)기법을 이용하여 낮은 전송률에서 비교적 간단한 수신기로도 전술한 디지탈 오디오 기기수준의 음질을 재생할 수 있는 알고리즘 및 하드웨어 구현을 위해 활발히 연구되고 있다.
전술한 적응적 변환 부호화 기법으로서, 알려진 부호화 방식으로 두채널 스테레오 오디오 신호에 대한 부호화 방법으로는 좌측(L) 및 우측(R)에 대한 제1 및 제2채널, 즉 두 채널로 입력되는 디지탈 오디오 신호에 대한 크기 정보(Scale Factor)의 차가 클 경우 각기 독립적으로 부호화하는 방식, MPEG(Motion Picture Expert Group)에서 제안한 방식으로 두 채널에 대한 크기 정보가 서로 비슷하면 둘중한 채널의 크기 정보를 전송하여 부호화하는 방식등이 있다. 그러나 이러한 부호화 방식들은 각 채널에 대한 신호 특성을 충분히 고려하지 않고, 각 채널에 대해 동일하게 비트를 할당하여 부호화하는 방식을 적용하여 부호화하며, 크기 정보에 대한 정보량이 작으므로 정보압축을 수행하는데 한계가 있으므로 부호화 효율이 떨어지고 고음질을 실현하는데 어려움이 있었다.
따라서, 본 발명은 전술한 문제점을 해결하기 위한 것으로, 본 발명의 목적은 부호화 효율을 증대시키고 음질을 향상시키는 적응적 스테레오 디지탈 오디오 부호화 장치를 제공하는데 있다.
전술한 본 발명의 목적을 달성하기 위해 본 발명은 제1 및 제2채널로 입력되는 디지탈 오디오 신호를 적응적으로 부호화하여 전송하는 장치로, 상기 제1 및 제2채널로 입력되는 디지탈 오디오 신호를 인간의 청각특성을 이용하여 인지 정보량을 산출하며, 산출된 인지 정보량에 응답하여 상기 두 채널중 기준 채널을 판별하는 기준 채널 판별기와 ; 상기 기준 채널 판별기에서 제공되는 제1 및 제2채널의 소정의 프레임에 대한 인지정보량에 응답하여 상기 각 채널 및 프레임에 비트를 할당하는 적응 채널 비트 할당부와 ; 상기 기준 채널 판별기로 부터 입력되는 기준채널에 대한 디지탈 오디오 신호를 상기 적응 채널 비트 할당부에서 제공되는 소정의 인지정보량에 의해 부호화하고 복호화하는 제1부호기와 ; 상기 기준채널 판별기로부터 입력되는 기준채널이 아닌 다른 채널에 대한 디지탈 오디오 신호를 상기 적응 채널 비트 할당부에서 제공되는 소정의 인지정보량 에 의해 부호화하고 복호화하며, 상기 다른 채널에 대한 디지탈 오디오 신호와 상기 복호화된 디지탈 오디오 신호를 통해 인지 오차를 계산하는 제2부호기와 ; 상기 제1부호기에서 복호화된 디지탈 오디오 신호와 상기 다른 채널에 대한 디지탈 오디오 신호간에 발생되는 차분신호를 차분신호 발생기와 ; 상기 차분신호와 상기 제1부호기에서 제공되는 복호화된 신호 및 상기 다른 채널로 입력되는 오디오 신호를 입력하여 상기 적응 채널 비트 할당부에서 제공되는 소정의 인지정보량에 의해 부호화하며, 인지 오차를 계산하는 제3부호기와 ; 상기 제2 및 제3부호기에서 제공되는 부호화된 디지탈 오디오 신호를 선택하여 전송하는 부호기 선택부와 ; 상기 부호기 선택부가 상기 제2 및 제3부호기로부터 입력 되는 부호화된 디지탈 오디오 신호를 선택할 수 있도록 상기 제2 및 제3부호기에서 제공되는 인지 오차를 비교하여 이에 대응하는 제어 신호를 생성하여 상기 부호기 선택부로 제공하는 비교기와 ; 상기 기준 채널 판별기로부터 제공되는 채널 선택 정보와 상기 부호기 선택부에서 제공되는 부호화된 오디오 신호와 상기 비교기에서 제공되는 부호기 선택정보를 입력하여 채널 전송 특성에 적합하게 다중화하는 다중화부를 포함한다.
이하에서는 첨부된 도면을 참조하여 본 발명의 실시예가 상세히 설명된다.
제1도는 본 발명에 따른 적응적 스테레오 디지탈 오디오 부호화 장치를 도시한 블럭도인데, 이러한 오디오 부호화장치는 기준 채널 판별기(10), 적응 채널 비트 할당부(100), 제1, 제1 및 제3부호기(110,120 및 140), 차분신호 발생기(Differential Signal Generator : DSG)(130), 비교기(Comparator)(150), 부호기 선택부(160) 및 다중화부(MUX)(170)를 포함한다.
기준 채널 판별기(10)는 제1 및 제2채널로 입력되는 L 및 R채널에 대한 디지탈 오디오 신호를 후술하는 방법에 의해 각 채널의 프레임 단위로 인지 정보량을 계산한다. 즉, 제1 및 제2채널로 입력되는 N개(여기서, N은 양의 정수)의 샘플들로 이루어진 한 프레임의 유한 디지탈 오디오 신호원 x(n)의 전력 밀도 스펙트럼(SXX(W))에 의해 인간의 청각 특성을 이용하여 마스킹 문턱치(M(W))를 구하고, 후술하는 다음과 같은 식에 의해 인지 정보량을 측정한다.
예컨대, 한 프레임의 유한 디지탈 오디오 신호원 x(n)에 대한 근사적인 전력 밀도 스펙트럼(Sxx(w))을 다음식(1)에 의해 구한다.
즉,
또한, 전술한 M(w)는 Sxx(w)의전력 밀도 스펙트럼을 갖는 신호에 대하여 소정의 주파수 성분에서 인간의 귀로서는 감지할 수 없는 영역의 전력 값에 해당하므로, 소정의 주파수 성분에 대하여 M(w) 이하의 오차값으로 신호를 재생하면 귀로서는 그 영역을 감지할 수 없게 되므로, 그 영역, 즉, 오차 신호의 전력 밀도 스펙트럼 (See(w)을 구하기 위해, 부호기의 입력 신호를 x(n), 출력 신호를 y(n)이라 하고, 오차 신호 e(n)을 다음식(2)에 의해 구한다.
즉, e(n)=x(n)-y(n) (2)
그러므로, N개의 유한 신호원에 대한 See(w)를 M(w)로 대치하여 전술한 오차를 인간의 귀로서 감지할 수 없는 신호 x(n)을 전송하기 위한 인지 정보량(RPE)을 다음식(3)에 의해 구한다.
한편, 마스킹 문턱치 M(w)이 매프레임마다 동일하고 무한개의 주파수 대역을 갖는 대역을 갖는 대역 분할 부호기를 이용하는 경우, 이론적으로 실현가능한 최소 비트 전송률은 전술한 식(3)에 의해 얻어진 값이다. 그러나, 실제의 오디오 데이타에 대하여 부호기를 구성하는 경우, N개의 샘플을 가진 한프레임 시간 영역 신호마다 각각의 청각 파라메터를 분석한 후 이에 맞도록 대역 분할된 각 주파수 구간마다 양자화 수준을 달리 적용하고, N개의 샘플마다 변화하는 청각 파라메터를 전송해야 하므로, 실질적으로 필요한 비트 전송률은 전술한 식(3)에 의해 산출된 인지 정보량 보다 크게 된다.
예를 들어, 입력 신호 x(n)을 L개(여기서, L은 양의 정수)의 균일한 대역폭을 갖는 주파수 대역으로 분할하여 부호화하는 경우, ⅰ번째 주파수 대역의 전력 밀도 스펙트럼 Sxx(ⅰ)는 다음과 같은 식(4)에 의해 근사적으로 구할 수 있다.
R1는 ⅰ번째 분할 대역에 해당하는 주파수 영역하고, Sxx(W1)는 N포인트 이산 퓨리어 변환(discrete Fourier Transform : DFT)에 있어서 j번째 주파수 성분의 전력 밀도 스펙트럼에 해당하는 값이다. 또한, 마스킹 문턱치 (M(ⅰ))는 역시 다음 식(5)에 의해 근사적으로 구할 수 있다.
여기서, M(ⅰ)는 ⅰ번째 분할 대역에 속하는 마스킹 문턱치 값 M(w)중 최소값을 나타낸다.
예를들어, 1024포인트 DFT(즉, L=1024)를 이용하여 전력 밀도 스펙트럼을 구한 후, 32개의 주파수 대역(즉, L=32)으로 분할하는 경우, 인지 정보량 RPE는 다음과 같은 식(6)에 의해 구할 수 있다.
다음으로, 제1 및 제2채널이 가지는 전체 프레임 즉, 1GOF의 인지 정보량을 계산하기 위한 개념을 설명한다. N개의 샘플로 구성된 ⅰ(여기서, ⅰ는 0보다는 크고 프레임 수보다는 작은 양의 정수)번째 프레임의 오디오 데이타에 대하여 전술한 수식에 의해 전력 밀도 스펙트럼 및 마스킹 문턱치를 구한 다음 전술한 식(6)에 의해 ⅰ번째의 프레임의 인지 정보량 PE1를 구하고, 그 다음 제1 및 제2채널에 대한 전체 2M개의 프레임을 갖는 1프레임군에 대한 평균인지 정보량 PEm및 전술한 각 PEm에 대한 ⅰ번째 인지 정보량 PE의 변화량을 나타내는 표준 편차 PEstd를 다음 식(7 및 8)에 의해 구한다.
이와같은 방법으로 제1 및 제2채널에 대한 디지탈 오디오 신호의 인지 정보량을 산출하고, 산출한 제1 및 제2채널에 대한 인지 정보량(PE1,PE2)을 적응 채널 할당부(100)로 전달하여, 인지 정보량이 큰 채널을 기준 채널로 설정하여 후술하는 제1부호기(110)로 전달하며, 인지 정보량이 작은 채널의 오디오 신호는 제2부호기(120), DSG(130) 및 제3부호기(140)로 전달한다.
그 다음 적응적 채널 비트 할당부(100)는 기준 채널 판별기(10)에서 구한 기준 및 다른 채널, 즉 제1 및 제2채널에 대한 1 GOF내의 각각 프레임에 대응하는 인지 정보량(PE1, PE2)을 제공받아 후술하는 기법에 의해 제1 및 제2채널에 대한 각 프레임의 오디오 신호에 적응적으로 비트량을 할당하여 후술하는 기준 채널에 대한 제1부호기(110), 다른 채널에 대한 제2부호기(120) 제3부호기(140) 및 다중화부(170)로 제공한다.
이하에서는 기준 채널 판별기(10)에서 얻은 기준 및 다른 채널에 대한 인지 정보량에 의해 가변적으로 비트를 할당하는 방법에 대해 상세하게 설명된다.
제2도를 참조하면, 전술한 바와같이 제1 및 제2채널에 대한 2M개의 프레임으로 구성된 1 GOF에서 채널의 ⅰ(여기서, ⅰ=1,…, 2M)번째 제1프레임에 대한 인지 정보량을 PE1라 하고, 제2채널의 ⅰ(여기서,ⅰ=1,…, 2M)번째 프레임에 대한 인지 정보량을 PE1라고 하며, 1 GOF의 평균 인지 정보량을 PEm이라할 때, 제1 및 제2채널에 대한 인지 정보량(PE1)에 따른 프레임 비트 할당 상태(Index)를 나타낸 그래프이다. 또한 동도면에서, 수직 축의 Index는 -q와 +q구간의 정수값을 가지는 비트할당 상태를 나타내고, 수평축의 x1는 다음식(9)에 의해 결정되는 제1 및 제2채널내의 각 프레임이 가질 수 있는 소정의 인지 정보량을 나타낸다.
그러므로, 예를들어 M=8인 경우, 즉, 1GOF의 프레임이 8개인 경우에 적용된 가중치(δ)는 전술한 식(7 및 8)을 통해 구한 PEm및 PEstd에 대해 실험결과에 다음 표 1과 .
[표 1]
즉, PEm이 0~0.315이고, PEstd가 0~0.625인 경우에는 δ는 1000이며, 그 외 다른 값들에서도 전술한 표 1을 참조하면 δ값을 얻을 수 있을 것이다.
그리고, 전술한 표 1에 의거하여 구한 가중치(δ)와 X1관계를 나타내는 다음식(9)에 의해 X1를 구할 수 있다.
(9)
여기서, ⅰ와 -q 및 q간에는 -q ≤ ⅰ≤ q 관계가 있으며, 다음과 같은 조건을 가정한다.
sign(ⅰ)=1 if(ⅰ〉 0)
sign(ⅰ)=-1 if(ⅰ〈 0)
sign(ⅰ)=0 if(ⅰ=0)
또한, δ값은 1 GOF에서 L 및 R채널에 대한 2M개의 PE1값을 전술한 식(7 및 8)에 의해 구한 PEm및 PEstd값에 따라 결정되는 가중치이다.
본 발명의 일예로서, q값이 8인 경우, 즉, 전술한 식(9)을 통해 구한 소정의 인지정보량(X1)에 대응하는 각각의 Index에 따른 프레임 비트수는 전술한 식들에 의거하면 다음 표 2와 같이 얻을 수 있다.
[표 2]
(단위, Frame Bit : Bit/Frame, Bit Rate : K Bit/sec)
즉, 표 2를 참조하면, 예를들어 Index가 0인 경우, 즉, 샘플링 주파수가 48KHZ이고, 테이타 전송율이 128KHX이며, 1152샘플로 이루어지는 경우 1프레임에 할당되는 비트수는 3072로서, 전술한 MPEG의 오디오 섹션에서 제안하는 비트수가 할당되고, Index가 증가할수록 프레임 비트수는 평균치를 훨씬 초과하는 반면에, Index가 감소할수록 프레임 비트수는 평균치 보다 훨씬 적게 할당됨을 알 수 있을 것이다.
전술한 개념을 요약하면, 즉 제1 및 제2채널에 대한 인지정보량의 평균 및 분산 을 이용하여 인지정보량 값이 큰 경우 즉, 기준 채널에는 청각적인 중요도가 큼으로 많이 비트를 할당하고 작은 채널, 즉 다른 채널에는 보다 적은 비트를 할당하는데, 물론 두 채널에 적응적으로 할당되는 비트의 총량은 6144비트(3072×2)로 일정하며, 기준채널의 프레임 비트 할당량 FB1은 나머지 다른 채널의 프레임 비트 할당량 FB2보다 통상 크거나 같게 된다.
제1도를 다시 참조하면, 제1부호기(110)는 도시된 바와 같이 입력되는 제1 및 제2채널중 인지 정보량이 큰 기준 채널의 디지탈 오디오 신호를 전술한 적응 채널 비트 할당부(100)에서 제1채널의 소정의 프레임에 대해 할당된 비트(FB1)로 제3도에 도시된 바와같은 MPEG에서 제안된 부호화 방식에 의해 부호화(310)하고 복호화(220)하며, 부호화된 오디오 신호는 후술하는 다중화부(170)로 제공하며, 복호화한 오디오 신호(y1(n))는 후술하는 DSG(130) 및 제3부호기(140)로 제공한다. 그리고 제2부호기(120)는 기준 채널이 아닌 인지 정보량이 작은 다른 채널에 대한 오디오 신호를 후술하는 방식에 의해 부호화하고 복호화하며, 또한 디지탈 오디오 입력신호를 인간의 청각 특성에 의해 최적화된 마스킹 문턱치를 구하고 이 최적화된 문턱치를 이용하여 오디오 입력신호와 복호화한 오디오 신호간의 차신호에 대한 인지오차를 측정하여 후술하는 비교기(150)로 전달하며, 또한 부호화된 오디오 신호는 후술하는 부호기 선택부(160)로 전달한다.
제4도를 참조하면, 제4도는 제1도에 도시된 제2부호기(120)의 상세한 블럭도를 나타내는 도면으로써, 이러한 부호기는 인지 정보량이 작은 다른 채널의 오디오 입력신호(x2(n))를 전술한 적응 채널 비트 할당부(100)에서 제2채널, 즉 인지정보량이 작은 소정의 프레임에 할당되는 비트(FB2)에 의해 부호화하는 부호기(410)와, 이러한 부호화 시스템의 부호기(410)와, 이러한 부호화 시스템의 부호기(410)와 신호 전송의 호환이 가능한 디지탈 오디오 복호 시스템에 구성되는 복호기와 동일한 동작을 수행하는 장치로 역시 전술한 할당 되는 비트(FB2)에 의해 장치로 복호화하여 후술하는 인지 오차 측정기(Perceptual Error Measurer : PEM)(440)로 제공하는 복호기(420)를 포함하며, 또한 오디오 입력신호(x2(n))와 전술한 바와같이 복호화된 오디오 신호(y2(n))간의 인지 오차를 측정하기 위해 오디오 입력신호(x2(n))에 대한 전력 밀도 스펙트럼을 산출하고, 이 값으로 인간의 청각 특성을 이용하여 최적화된 문턱치 (M(w))를 계산하는 마스킹 문턱치 계산부(430)와, 오디오 입력신호(x2(n))와 복호화된 오디오 신호(y2(n))간의 차신호의 전력 밀도 스펙트럼을 구하며, 최적화된 문턱치 이상이 되는 오차 스텍트럼 성분을 측정하는 전술하는 PEM(440)을 포함한다.
제1도를 다시 참조하면, DSG(130)는 제1부호기(110)에서 제공되는 복호화된 오디오 신호(y1(n))와 제2채널에 대한 오디오 입력신호(x2(n))간에 발생되는 차신호(d(n))를 다음식(10)과 같이 추출하여 제3부호기(140)로 제공한다.
즉, d(n)=y1(n)-x2(n) (10)
제5도를 참조하면, 제5도는 제1도에 도시된 제3부호기(140)의 상세한 블럭도를 나타낸 도면으로써, 부호기(510), 복호기(520), 가산기(530), 마스킹 문턱치 계산부(540) 및 PEM(550)을 포함한다. 부호기(510)는 전술한 차분 신호 발생기(130)에서 제공되는 차신호(d(n))를 입력하여 전술한 적응 채널 비트 할부당(100)에서 제공되는 제2채널의 소정의 프레임에 대한 할당되는 비트(FB2)에 의해 역시 MPEG에서 제안한 부호화 방식에 의해 부호화한다. 복호기(520)는 제3도에 도시된 복호기와 동일한 기능을 갖는 장치로서 부호기(510)를 통해 부호화된 오디오 신호를 전술한 비트(FB2)에 의해 복호화한다. 가산기(430)는 제1부호기의 복호기(320)를 통해 복호화한 오디오 신호(y1(n))와 복호기(520)를 통해 복호화한 오디오신호(yd(n))를 다음식(10)과 같이 가산하여 PEM(550)으로 제공한다.
즉, y3(n)=y1(n)+yd(n) (10)
마스킹 문턱치 계산부(540)는 기준 채널이 아닌 다른 채널에 대한 오디오 입력신호를 전술한 방식과 동일하게 전력 밀도 스펙트럼을 산출한 후, 이 값을 인간의 청각 특성을 이용하여 최적화된 문턱치(M(w))를 산출하여 PEM(550)으로 제공한다. PEM(550)은 전술한 가산기(530)에서 제공되는 오디오 신호(y3(n))와 다른 채널에 대한 오디오 입력신호(x2(n))간에 발생되는 차신호의 전력 밀도 스텍트럼과 마스킹 문턱치 계산부(540)에서 제공되는 문턱치(M(w))를 이용하여 전술한 방식과 동일하게 인지 오차를 측정하여 출력한다.
제1도를 다시 참조하면, 인지 정보량이 큰 기준 채널의 오디오 입력신호에 대한 인지 오차를 PE1,기준 채널이 아닌 다른 채널의 오디오 신호에 대한 인지 오차를 PE2라고 하면, 전술한 차신호(d(n))는 기준 채널 오디오 입력신호를 부호화하고 복호화한 오디오 신호(y1(n))와 다른 채널에 대한 오디오 입력신호(x2(n))를 전술한 식(9)을 통해 계산할 수 있고, 이 계산된 차분신호(d(n))를 전술한 바와 같이 부호화하고 복호화한 신호를 (yd(n))라 하면, 전술한 식(10)에 의해 산출된 신호(y3(n))는 실제적으로 제2채널에 대한 오디오 입력신호를 복호화한 신호가 된다. 만일, 제1 및 제2채널에 대한 오디오 입력신호가 상호 상관성(Corelation)이 많다고 하면, 신호(y3(n))가 제2채널 오디오 신호를 부호화하고 복호화한 오디오 신호(yd(n))보다 제2채널 오디오 입력신호와 더 상관성이 있게 된다.
그리고 비교기(150)는 전술한 제2 및 제3부호기(120 및 140)에서 제공되는 인지 오차(PE2,PE3)를 비교하여 인지 오차가 적게 발생되는 부호기(120 및 140)를 선택하여 전송할 수 있도록 제어신호를 출력하며, 또한 제어신호에 대응하는 부호기 선택 정보를 출력하는 것으로, 예를들어 제2부호기(120)에서 제공되는 인지 오차(PE2)가 제3부호기(140)에서 제공되는 인지 오차(PE3)보다 큰 경우에는 후술하는 부호기 선택부(160)에서 제3부호기(140)를 통해 부호화된 오디오 신호를 선택할 수 있도록 논리 '1'(또는 0)을 출력하며, 이와 반대인 경우는 논리 '0'(또는 1)을 출력한다. 따라서 부호기 선택부(160)는 비교기(150)에서 제공되는 제어신호에 응답하여 제2 및 제3부호기(120 및 140)에서 출력되는 오디오 신호를 선택하여 다중화부(170)로 제공한다.
그러므로 다중화부(170)는 부호기 선택부(160)에서 제공되는 부호화된 오디오 신호 및 비교기(150)에서 제공되는 부호기 선택 정보를 다중화하여 채널(Channel) 특성에 적합한 비트 스트림으로 변환하여 출력한다.
이상에서 설명한 바와같이, 본 발명에 따른 적응적 스테레오 디지탈 오디오 부호화 장치에 의하면, 제1 및 제2채널에 대한 오디오 신호 둘 중에서 인지 정보량이 큰 채녈을 기준 채널로 결정하고 인지 정보량에 대응하는 비트를 설정하여 부호화하며, 나머지 한 채널과 기준 채널을 부호화하고 복호화한 오디오 신호간의 차이신호를 인지 정보량에 대응하는 비트를 설정하여 부호화함으로써, 부호화 효율을 증대시키고 음질을 향상시키는 커다란 효과가 있다.

Claims (5)

  1. 제1 및 제2채널로 입력되는 디지탈 오디오 신호를 적응적으로 부호화하여 전송하는 장치로, 상기 제1 및 제2채널로 입력되는 디지탈 오디오 신호를 인간의 청각특성을 이용하여 인지 정보량을 산출하며, 산출된 인지 정보량에 응답하여 상기 두 채널중 기준 채널을 판별하는 기준 채널 판별기와 ; 상기 기준 채널 판별기에서 제공되는 제1 및 제2채널의 소정의 프레임에 대한 인지 정보량에 응답하여 상기 각 채널 및 프레임에 비트를 할당하는 적응 채널 비트 할당부와 ; 상기 기준 채널 판별기로부터 입력되는 기준채널에 대한 디지탈 오디오 신호를 상기 적응 채널 비트 할당부에서 제공되는 소정의 인지 정보량에 의해 부호화하고 복호화하는 제1부호기와 ; 상기 기준채널 판별기로부터 입력되는 기준채널에 대한 디지탈 오디오 신호를 상기 적응 채널 비트 할당부에서 제공되는 소정의 인지 정보량에 의해 부호화하고 복호화하는 제1부호기와 ; 상기 기준채널 판별기로부터 입력되는 기준채널이 아닌 다른 채널에 대한 디지탈 오디오 신호를 상기 적응 채널 비트 할당부에서 제공되는 소저의 인지 정보량에 의해 부호화하고 복호화하며, 상기 다른 채널에 대한 디지탈 오디오 신호와 상기 복호화된 디지탈 오디오 신호를 통해 인지 오차를 계산하는 제2부호기와 ; 상기 제1부호기에서 복호화된 디지탈 오디오 신호와 상기 다른 채널에 대한 디지탈 오디오 신호간에 발생되는 차분신호를 생성하는 차분신호발생기와 ; 상기 차분신호와 상기 제1부호기에서 제공되는 복호화된 신호 및 상기 다른 채널로 입력되는 오디오 신호를 입력하여 상기 적응 채널 비트 할당부에서 제공되는 소정의 인지 정보량에 의해 부호화하며, 인지 오차를 계산하는 제3부호기와 ; 상기 제2 및 제3부호기에서 제공되는 부호화된 디지탈 오디오 신호를 선택하여 전송하는 부호기 선태부와 ; 상기 부호기 선택부가 상기 제2 및 제3부호기로부터 입력되는 부호화된 디지탈 오디오 신호를 선택할 수 있도록 상기 제2 및 제3부호기에서 제공되는 인지 오차를 비교하여 이에 대응하는 제어신호를 생성하여 상기 부호기 선택부로 제공하는 비교기와 ; 상기 기준 채널 판별기로부터 제공되는 채널 선택 정보와 상기 부호기 선택부에서 제공되는 부호화된 오디오 신호와 상기 비교기에서 제공되는 부호기 선택 정보를 입력하여 채널 전송 특성에 적합하게 다중화하는 다중화부를 포함하는 적응적 스테레오 디지탈 오디오 부호화장치.
  2. 제1항에 있어서, 상기 적응적 채널 및 프레임 비트 할당부는, M개(여기서, M개 1 GOF 내의 프레임수)의 프레임을 가진 1 프레임군으 ⅰ번째(여기서, ⅰ는 양의 정수로서, 1 GOF의 임의의 프레임을 나타냄)프레임에 대한 인지 정보량을 PE1라 하고, 상기 1 프레임군내의 평균인지 정보량 PEm과, 1프레임군에 대한 표준편차 PEstd를 이용하여 가중치(δ)를 구하고, 그 다음 상기 평균 인지 정보량(PEm)과 상기 가중치를 이용하면 소정의 값을 갖는 인지 정보량(X1)을 다음과 같은 수식에 의해 구할 수 있으며,
    여기서,
    if(ⅰ>0) sign(ⅰ)=1
    if(ⅰ<0) sign(ⅰ)=-1
    if(ⅰ=0) sign(ⅰ)=0 이고,
    ⅰ는 상기 Index 범위내에 존재하면, 그 다음, 상기 소정의 인지 정보량에 대응하는 프레임 비트 할당 상태를 나타내는 Index에 의해 최종 각 프레임에 적응적으로 비트를 할당함을 특징으로 하는 디지탈 오디오 복호화 장치.
  3. 제1항에 있어서, 상기 기준 채널 판별기는 제1 및 제2채널의 디지탈 오디오 신호에 대해 인진 정보량이 큰 채널을 기준 채널로 설정하는 것을 특징으로 하는 적응적 스테레오 디지탈 오디오 부호화장치.
  4. 제1항에 있어서, 상기 제2부호기는 상기 제2채널에 대한 디지탈 오디오 신호를 기설정된 대역폭으로 대역 분할하며, 상기 입력되는 디지탈 오디오 신호에 대한 상기 소정의 인지 정보량에 의해 부호화하는 부호기와 ; 상기 부호화된 디지탈 오디오 신호를 상기 소정의 인지 정보량에 의해 복호화하는 복호기와 ; 상기 입력되는 디지탈 오디오 신호를 인간의 청각 특성에 의해 최적화된 문턱치를 계산하는 마스킹 문턱치 계산부와 ; 상기 복호화된 디지탈 오디오 신호와 입력되는 디지탈 오디오 신호간에 발생되는 차분신호를 상기 계산된 문턱치를 이용하여 인지 오차를 측정하는 인지 오차 측정기를 포함하는 적응적 스테레오 디지탈 오디오 부호화장치.
  5. 제1항에 있어서, 상기 제3부호기는 , 상기 차분 신호 발생기에서 제공되는 차이신호를 상기 소정의 인지정보량에 의해 부호화하는 부호기와 ; 상기 부호화된 오디오 신호를 상기 소정의 인지정보량에 의해 복호화하는 복호기와 ; 상기 제1부호기의 복호기에서 제공되는 복호화된 디지탈 오디오 신호화 상기 복호기에서 제공되는 디지탈 오디오 신호를 가산하는 가산기와 ; 상기 제2채널로 입력되는 디지탈 오디오 신호를 인간의 청각 특성에 의해 최적화된 문턱치를 산출하는 마스킹 문턱치 계산부 ; 상기 가산된 디지탈 오디오 신호와 제2채널의 디지탈 오디오 신호간에 발생되는 차분신호를 상기 계산된 최적화된 문턱치를 이용하여 오차를 측정하는 인지 오차 측정기를 포함하는 적응적 스테레오 디지탈 오디오 부호화장치.
KR1019940000761A 1994-01-18 1994-01-18 적응적 스테레오 디지탈 오디오 부호화장치 KR960003454B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019940000761A KR960003454B1 (ko) 1994-01-18 1994-01-18 적응적 스테레오 디지탈 오디오 부호화장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019940000761A KR960003454B1 (ko) 1994-01-18 1994-01-18 적응적 스테레오 디지탈 오디오 부호화장치

Publications (2)

Publication Number Publication Date
KR950024453A KR950024453A (ko) 1995-08-21
KR960003454B1 true KR960003454B1 (ko) 1996-03-13

Family

ID=19375777

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940000761A KR960003454B1 (ko) 1994-01-18 1994-01-18 적응적 스테레오 디지탈 오디오 부호화장치

Country Status (1)

Country Link
KR (1) KR960003454B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7663702B2 (en) 2005-01-13 2010-02-16 Samsung Electronics Co., Ltd. Digital video signal processing apparatus and method for adaptive temporal and spatial Y/C separation in multiple directions

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7663702B2 (en) 2005-01-13 2010-02-16 Samsung Electronics Co., Ltd. Digital video signal processing apparatus and method for adaptive temporal and spatial Y/C separation in multiple directions

Also Published As

Publication number Publication date
KR950024453A (ko) 1995-08-21

Similar Documents

Publication Publication Date Title
KR960012475B1 (ko) 디지탈 오디오 부호화장치의 채널별 비트 할당 장치
JP2756515B2 (ja) 可聴信号の知覚符号化方法および音声信号伝送方法
RU2197776C2 (ru) Способ и устройство масштабируемого кодирования-декодирования стереофонического звукового сигнала (варианты)
EP0966109B1 (en) Audio coding method and audio coding apparatus
KR100388730B1 (ko) 고능률부호화및복호화장치
JP3926399B2 (ja) オーディオ信号コーディング中にノイズ置換を信号で知らせる方法
RU2129336C1 (ru) Способ передачи и/или запоминания цифровых сигналов нескольких каналов
US5537510A (en) Adaptive digital audio encoding apparatus and a bit allocation method thereof
EP0563832A1 (en) Stereo audio encoding apparatus and method
KR970005131B1 (ko) 인간의 청각특성에 적응적인 디지탈 오디오 부호화장치
JP3297240B2 (ja) 適応的符号化システム
JP3250376B2 (ja) 情報符号化方法及び装置並びに情報復号化方法及び装置
KR0134318B1 (ko) 채널간의 마스킹특성을 고려한 비트할당장치 및 그 방법과 복호화장치
US5761636A (en) Bit allocation method for improved audio quality perception using psychoacoustic parameters
KR20060082618A (ko) 다채널 신호 부호화/복호화 방법 및 장치
JPH07336234A (ja) 信号符号化方法及び装置並びに信号復号化方法及び装置
JPH07123008A (ja) 高能率符号化装置
KR960003454B1 (ko) 적응적 스테레오 디지탈 오디오 부호화장치
KR960012473B1 (ko) 스테레오 디지탈 오디오 부호화 장치의 비트 할당 장치
KR960012474B1 (ko) 인간의 청각 특성에 적응적인 스테레오 디지탈 오디오 부호화장치
KR960012477B1 (ko) 인지 정보량을 이용한 적응적 스테레오 디지탈 오디오 부호화 및 복호화장치
KR960003453B1 (ko) 채널 및 각 프레임에 적응적으로 비트 할당하여 부호화하는 스테레오 디지탈 오디오 부호화장치
KR0144297B1 (ko) 적응적 디지탈 오디오 부호화 장치
JP3528260B2 (ja) 符号化装置及び方法、並びに復号化装置及び方法
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法

Legal Events

Date Code Title Description
A201 Request for examination
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20090302

Year of fee payment: 14

LAPS Lapse due to unpaid annual fee