KR960012473B1 - 스테레오 디지탈 오디오 부호화 장치의 비트 할당 장치 - Google Patents

스테레오 디지탈 오디오 부호화 장치의 비트 할당 장치 Download PDF

Info

Publication number
KR960012473B1
KR960012473B1 KR1019940000742A KR19940000742A KR960012473B1 KR 960012473 B1 KR960012473 B1 KR 960012473B1 KR 1019940000742 A KR1019940000742 A KR 1019940000742A KR 19940000742 A KR19940000742 A KR 19940000742A KR 960012473 B1 KR960012473 B1 KR 960012473B1
Authority
KR
South Korea
Prior art keywords
channel
frames
channels
frame
amount
Prior art date
Application number
KR1019940000742A
Other languages
English (en)
Other versions
KR950024441A (ko
Inventor
김종일
Original Assignee
대우전자 주식회사
배순훈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대우전자 주식회사, 배순훈 filed Critical 대우전자 주식회사
Priority to KR1019940000742A priority Critical patent/KR960012473B1/ko
Publication of KR950024441A publication Critical patent/KR950024441A/ko
Application granted granted Critical
Publication of KR960012473B1 publication Critical patent/KR960012473B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

요약없슴

Description

스테레오 디지탈 오디오 부호화 장치의 비트 할당 장치
도면 1은 본 발명에 따른 스테레오 디지탈 오디오 부호화 장치의 비트 할당 장치를 도시한 블럭도.
도면 2는 도면 1에 도시된 3개(L, R)의 채널을 갖는 본 발명의 스테레오 디지탈 오디오 부호화 장치의 1 프레임군(GOF)부를 나타내는 구성도.
도면 3은 본 발명의 결정 구간(D1)대 프레임 비트 할당 상태(Index)(Y축)를 도시한 프래프.
* 도면의 주요부분에 대한 부호의 설명
210 : L채널 프레임군부220 : R채널 프레임군부
230 : 센터 채널 프레임군부240 : 인지 정보량 계산부
250 : 적응적 채널 및 프레임 비트 할당부
250,270,280 : 부호기270 : MUX
본 발명은 디지탈 오디오 부호기(Digital Audio Coder)에 관한 것으로, 특히, 세개의 채널로 입력되는 디지탈 오디오 신호를 인간의 특성에 의한 인지 정보량(Perceptual Entropy : PE)에 따라 비트를 할당하여 부호화하므로써 부호화 효율을 증대시키고 음질을 향상시키는 스테레오 디지탈 오디오 부호화 장치를 비트 할당 장치에 관한 것이다.
현재 실용화되어 있는 컴팩트 디스크(Compact Disk : CD) 및 디지탈 오디오 테이프 레코더(Digital Audio Tape Recoder : DAT)등과 같은 음질 수준의 신호 재생을 목표로 개발중에 있는 고화질 텔레비젼(HDTV) 정보 전송 시스템에서는 비교적 좁은 약 6MHz의 전송 선로를 통하여 영상 및 오디오 신호를 전송하여야 하기 때문에 영상 신호에서와 마찬가지로 오디오 신호에 대해서도 효율적인 신호 압축기법이 요구되어 왔다.
이를 위하여 인간의 청각 특성을 반영하는 적응적 변환 부호화(Adaptive Transform Coding) 기법을 이용하여 낮은 전송률에서 비교적 간단한 수신기로도 전술한 디지탈 오디오 기기 수준의 음질을 재생할 수 있는 HDTV용 고음질 디지탈 오디오 기술의 알고리즘 및하드웨어 구현을 위해 활발히 연구되고 있다.
전술한 적응적 변환 부호화 기법으로서, 3채널(L, R 및 중심(센터)채널)을 갖는 스테레오 디지탈 오디오 부호화 장치에서의 데이타 압축 방법은 각 채널을 각기 독립적으로 부호화하는 방식, L채널이나 R채널을 기준채널로 하여 도이도 신호의 크기 정보(scale factor)를 기준 채널과 비교하여 그 차이가 크면 나머지 채널의 크기 정보를 별도로 전송하거나 또는 그 차가 비슷하면 크기 정보를 공유하여 정보를 별도로 전송하거나 또는 그 차가 비슷하면 크기 정보를 공유하여 하나 혹은 두개의 크기 정보만을 송신하여 데이타 압축의 효율을 증대시키는 부호화방식이 있다. 그러나 이러한 부호화 방식들은 단순히 크기 정보에 대한 스테레오 채널의 상관성(Correlation)을 이용하므로 정보압축을 하는데 한계가 있고, 실제적으로 얻는 이득 즉, 크기 정보를 각 채널별로 독립적으로 전송하는 대신, 한개 또는 두개의 크기 정보를 전송하므로 비트감축량이 그다지 크지 않아 부호화 효율의 증대 및 고음질을 실현하는데 어려움이 있었다.
따라서, 본 발명의 주 목적은 부호화 효율을 증대시키고, 음질을 보다 향상시키기 위해 L 및 R 및 센터 채널과 각 채널내의 프레임에 대한 인간의 인지정보량에 응답하여 L 및 R 및 센터 채널과 각 채널의 프레임에 적응적으로 비트를 할당하여 부호화하므로써 압축 효율을 증대시킨 인간의 청각 특성에 적응적인 스테레오 디지탈 외오 부호화 장치를 제공하는데 있다.
전술한 목적을 달성하기 위해 본 발명은 좌측, 우측 및 센터 채널로 입력되는 다수개의 프레임을 가진 프레임군으로 이루어진 디지탈 오디오 신호에 대한 인간의 인지정보량에 응답하여 상기 좌측 및 우측 채널과 각 채널의 프레임에 대해 적응적으로 비트를 할당하여 부호화하는 것으로, 상기 좌측 및 우측 채널로 입력되는 다수개의 프레임을 가진 프레임군을 입력하여 상기 좌측, 우측 및 센터 채널과 채널의 프레임에 대한 인지 정보량(Perceptual Entropy)을 산출하는 인지 정보량 계산부와 ; 상기 인지 정보량 계산부에서 얻은 좌측, 우측 및 센터 채널과, 채널의 각 프레임에 대한 인지 정보량에 응답하여 상기 좌측 및 우측 채널과, 각 채널(좌측 및 우측 채널)의 프레임에 적응적으로 비트를 할당하는 적응적 채널 및 프레임 비트 할당(Adaptive Frame And Channel Bit Allocation)부와 ; 상기 좌측 및 우측 채널로 입력되는 다수개의 프레임으로 이루어진 디지탈 오디오 신호를 싱기 좌측, 우측 및 센터 채널의 가 프레임에 할당된 비트를 적용하여 상기 좌측, 우측 및 센터 채널과 채널의 프레임을 부호화하는 부호기를 포함한다.
본 발명은 L 및 R 채널에 대한 인지 정보량은 통상적으로 각 채널마다 그 크기가 서로 상이하고 또 동일한 채널내의 각 프레임간에도 그 크기가 서로 상이함에 의거하는데, 예를 들어, 인지정보량이 큰 경우에는 인간의 귀로서 가청 레벨에 대한 오차를 느낄 수 있는 확률이 크므로 보다 많은 비트를 할당하여 부호화하며, 인지정보량이 작은 경우에는 비트를 적게 할당하여 부호화한다는 개념에 근거한다. 만일, 전체 3채널 오디오 신호의 평균 정보 전송률은 B라하고 3채널 스테레오 오디오 신호에 대하여 각 채널이 N개의 샘플로 구성되는 M개의 프레임으로 구성된다고 할때, 총 3M개의 프레임으로 구성된 1프레임군에 대한 비트 할당량(FB)은 각 채널에 대한 샘플링 주파수가 fS라고 때 따음과 같은 [수식 1]에 의해 계산된다.
[수식 1]
이때, 각 채널을 동일한 비트로 부호화한다고 가정하면 각 채널의 프레임에 할당되는 비트량은 FB/3값을 갖게 될 것이다.
오디오 신호의 인지정보량이 L 및 R 및 센터 채널과 각 채널의 프레임에 따라 서로 상이하다는 특성을 이용하여 전술한 [수식 1]을 통한 FB값을 각 채널에 적합하게 분리하여 할당한다.
일반적으로, 센터 채널의 오디오 신호는 L 및 R채널에 비해 데이타량이 적을 수도 있으나, 본 발명에서는 동일한 샘플링 주파수로 샘플링하였으므로 각 채널로 입력되는 데이타량은 동일하다고 가정한다. 그러므로, 센터 채널에 대한 인지 정보량을 계산하면 L채널이나 R채널의 인지 정보량에 비해 센터 채널의 인지 정보량이 L 및 R채널에 적은 비트를 할당하는 것은 바람직하지 못한다 할 것이다.
후술하는 바와 같이, 본 발명을 실행하는 순서는 먼저, IGOF의 3M개의 각 프레임에 대한 인지 정보량을 구한 후, 다음 이 인지 정보량의 평균(Average) 및 분산값(Variance Value)을 구하며, 그 다음 이 평균 분산값을 이용하여 각 채널의 인지 정보량에 따른 가중치를 부여하여 비트를 할당하여, 또한 동일 채널내의 각 프레임간에도 인지정보량에 따라 가중치를 부여하여 비트를 할당하는 식으로 이루어진다.
이하에서는 도면을 참조하여 본 발명의 바람직한 실시예가 상세하게 설명된다.
도면 1은 본 발명에 따른 L 및 R 및 센터 채널과 각 채널내의 다수의 프레임에 적응적으로 비트 할당하여 부호화하는 스테레오 디지탈 오디오 부호화 장치의 비트할당 장치를 도시한 블럭도로서, 이러한 부호화 장치는 L,R 및 센터 채널 프레임군부(210,220 및 230), 인지 정보량 계산부(230), 적응적 채널 및 프레임 비트 할당부(240), L, R 및 센터 채널에 대해 통상적인 부호화 동작을 수행하는 부호기(260,270,280) 및 멀티플렉서(MUX)(270)를 포함한다. 이러한 블럭들을 포함하는 비트 할당 장치에서는, 입력되는 L, R 및 센터 채널과 L, R 및 센터 채널의 각 프레임에 대한 인지 정보량에 의해 L, R 및 센터 채널과 상기 채널의 프레임마다 비트를 적응적으로 할당하여 부호화하므로써 부호화 효율을 증대시키고, 음질을 향상시킬 수가 있게 된다.
L,R 및 센터 채널(210,220)및 230부)부는 L, R 및 센터 채널로 각기 입력되는 디지탈 오디오 신호를 각 채널 및 각 채널내의 프레임에 대한 인지 정보량을 산출하기 위해 복수개(예를 들면, 각 채널당 M개, 여기서, M은 각 채널의 프레임군내의 프레임 갯수를 나타냄)의 프레임을 가진 프레임군 단위로 데이타를 분류하여 각 부호기(260,270 및 280)와 인지 정보량 계산부(240)로 각각 제공한다.
도면 2를 참조하면, 도면 2는 전술한 L, R 및 센터 채널의 1GOF 구성을 나타낸 것이다. 도시된 바와 같이, 한 프레임은 N개(여기서, N은 양의 정수)의 샘플(Sample)로 이루어지며, 통상 10msc 내지 약 40msec 단위로 이루어진다. 또한, 도시된 바와 같이 각 채널의 GOF는 M개의 프레임으로 이루어지므로 한 채널의 GOF는 N×3M개의 샘플로 구성된다. 여기서, M값은 비디오 카메라(Camera)(도시안됨)로부터 입력되는 영상 신호의 부호화 및 복호화 과정에서 필연적으로 발생되는 지연(Delat) 시간에 의해 결정된다.
도면 1을 다시 참조하면, 인지 정보량 계산부(240)는 영상신호의 부호화 및 부호화 과정의 지연 시간 동안 오디오 신호를 분석하여 인간의 청각 특성에 부합되는 인지 정보량을 산출하므로써, 후술하는 적응적 채널 및 프레임 비트 할당부(250)에서 L, R 및 센터 채널과, L, R 및 센터 채널과 LMR 및 센터 채널의 프레임마다 비트 할당량을 달리하므로써 부호화 효율을 증가시키며 음질을 향상시킬 수 있다. 이러한 인지 정보량 계산부(240)는 전술한 L, R 및 센터 GOF부(210,220,230)로부터 각기 제공되는 N개의 샘플들로 이루어진 한 프레임의 유한 디지탈 오디오 신호원, 즉, x(n)의 전력 밀도 스펙트럼(Sxx(w))에 의해 인간의 청각 특성을 이용하여 마스킹 뭍턱치(Masking Threshold)(M(w))를 구하고, 그 다음, 다음과 같은 식에 의해 인지 정보량을 얻을 수가 있다. 예컨데, 먼저, 한 프레임의 유한 디지탈 오디오 신호원 x(n)에 대한 근사적인 전력 밀도 스펙트럼(Sxx(w))은 [수식 2]에 의해 구한다.
[수식 2]
또한, 전술한 M(w)는 Sxx(w)의 전력 밀도 스펙트럼을 갖는 신호에 대하여 소정의 주파수 성분에서 인간의 귀로서는 감지할 수 없는 영역의 전력 값에 해당하므로, 소정의 주파수 성분에 대하여 M(w) 이하의 오차값으로 신호를 재생하면 귀로서는 그 영역을 감지할 수 없게 되므로, 그 영역, 즉, 오차 신호의 전력밀도스펙트럼(See(w))을 구하기 위해, 부호기의 입력 신호를 x(n), 출력신호를 u(n)이라 하고, 먼저, 오차 신호 e(n)을 [수식 3]에 의해 구한다.
[수식 3]
e(n)=x(m)-Y(n)
그 다음, N개의 유한 신호원에 대한 See(w)를 M(w)로 대치하여 인간의 귀로서 오차를 감지할 수 없도록 신호 x(n)을 전송하기 위한 인지 정보량(RPE)은 [수식 4]에 의해 구할 수 있다.
[수식 4]
한편 , 마스킹 문턱치 M(w)가 매프레임마다 동일하고 무한개의 주파수 대역을 갖는 대역 분할 부호기를 이용하는 경우, 이론적으로 실현가능한 최소 비트 전송률은 전술한 식(4)에 의해 얻어진 값이다.
그러나, 실제의 오디오 데이타에 대하여 부호기를 구성하는 경우, N개의 샘플을 가진 한 프레임 시간 영역 신호마다 각각의 청각 파라메터를 분석한 후 이에 맞도록 대역 분할된 각 주파수 구간마다 양자화 수준을 달리 이용하여, N개의 샘플마다 변화하는 청각 파라메터를 전송해야 하므로, 실질적으로 필요한 비트 전송률은 전술한 [수식(4)]에 의해 산출된 인지 정보량 보다 크게 될 것이다.
예컨대, 입력 신호 x(n)을 L개(여기서, L은 양의 정수)의 균일한 대역폭을 갖는 주파수 대역으로 분할하여 부호화하는 경우, i번째 주파수 대역의 전력 밀도 스펙트럼 Sxx(i) 및 마스킹 문턱치 M(i)는 다음 같은 수식 (5 및 6)에 의해 근사적으로 구할 수 있다.
[수식 5]
여기서,
Ri는 i번째 분할 대역에 해당하는 주파수 영역이고, Sxx(Wj)는 N포인트 이산 퓨리어 변환(Discrete Fourier Transform : DFT)에 있어서 j번째 주파수 성분의 전력 밀도 스펙트럼에 해당하는 값이다.
[수식 6]
여기서, M()는 i번째 분할 대역에 속하는 마스킹 문턱치값을 나타낸다.
예를 들어, 1024 포인트 DFT(즉, L=1024)를 이용하여 전력 밀도 스펙트럼을 구한 후, 32개의 주파수 대역(즉, L=32)으로 분할하는 경우, 인지 정보량 RPE는 다음과 같은 [수식 7]에 의해 구할 수 있다.
[수식 7]
여기서,
다음으로, 1GOF의 정보량을 계산하기 위한 개념을 설명한다. N개의 샘플로 구성된 i(여기서, i는 0보다 크고 프레임 수 보다는 작은 양의 정수)번째 프레임의 오디오 데이타에 대하여 전력 밀도 스펙트럼 및 마스킹 문턱치를 이용하여 전술한 [수식 7]에 의해 인지 정보량 PE1를 구하고, 그 다음 L, R 및 센터 채널 채널에 대한 전체 3M개의 프레임을 갖는 1프레임군에 대한 평균 인지 정보량 PEm 및 전술한 각 PEm에 대한 PE1의 변화량을 나타내는 표준 편차 PEstd를 [수식 8 및 9]에 의해 구한다.
[수식 8]
[수식 9]
그리고, 적응적 채널 및 프레임 비트 할당부(250)는 인지 정보량 계산부(240)에서 구한 각 채널 및 각 채널내의 각 프레임에 대한 인지 정보량을 제공받아 후술하는기법에 의해 각 채널 및 각 채널의 프레임마다 적응적으로 비트량을 할당하여 L, R 및 센터 채널에 대한 부호기(250,270및 280)로 각각 제공한다.
이하에서는 인지 정보량 게산부(240)에서 얻은 L, R 및 센터 채널 및 각 채널의 프레임에 대한 인지 정보량에 의해 가변적으로 비트를 할당하는 방법에 대해 상세하게 설명된다.
도면을 참조하면, 도면 3은 전술한 바와 같이 L, R 및 센터 채널에 대해 총 3M개의 프레임으로 구성된 1GOF내의 i번째 프레임에 대한 인지 정보량을 PE1라 하고, 1GOF의 평균 인지 정보량을 PEm이라 할 때, PE1에 따른 프레임 비트 할당 상태(Index)를 나타낸 그라프이다. 동도면에서, 수직(Y)축의 Index는 -q와 +q 구간의 정수값을 가지는 비트할당 상태를 나타내고, 수평축의 D1는 다음식[10]에 의해 결정되는 L, R 및 센터 채널과 각 채널의 1프레임이 가질 수 있는 소정의 인지 정보량을 나타낸다. 여기서 δ한 프레임군(GOF)에서 식 8, 9에 의하여 구한 PEm 및 PEstd값의 분포에 따라 결정되는 가중치이다.
그러므로, 예를 들어 M=8인 경우에 적용된 가중치(δ)는 전술한 [수식 8, 9]을 통해 구한 PEm 및 PEstd에 대해 실험 결과에 의하여 다음[표 1]과 같이 얻을 수 있다.
[표 1]
즉, PEm이 0~0.315이고, PEstd가 0~0.625인 경우에는 δ는 1000이며, 그의 캬른 값들에서도 PEm 및 PEstd값을 아는 경우, 상기 [표 1]에 의해 동일 방법으로 δ값을 얻을 수 있을 것이다.
그리고, 전술한 [표 1]에 근거하여 구한 가중치(δ)와 D1관계를 나타내는 [수식 10]에 의해 D1를 구할 수 있다.
[수식 10]
여기서, i와 -q와 p 사이의 정수 값이고 D1는 결정 구간(desion level)값이다.
[수식 10]에서 알 수 있듯이 결정 구간(D1)의 값은 인지 정보량의 평균(PEm)과 표준 편차(PEste)의 함수이며 가중치 값(δ)이 크게되면 결정 구간(D1)의 값이 커지며, 반대의 경우가 작아진다.
[표 1]에서 인지 정보량의 평균(EPm)이 작고 표준 편차(PEste)가 큰 경우에는 GOF내에서 인지 정보량의 변화가 큰 경우이므로 가중치 값(δ)이 매우 작음을 알 수 있다. 반대의 경우에는, 즉, 인지 정보량의 평균(PEm)이 크고 표준 편차(PEstd)가 작은 경우에는 GOF내에서 인지 정보량의 변화가 작은 경우이므로 가중치 값(δ)이 매우 크게 된다.
또한, sign(i)는 다음과 같은 조건을 가정한다.
sign(i)=1if(i>0)
sign(i)=-1if(i<0)
sign(i)=0if(i=0)
또한, δ값은 1GOF에 대한 3M개의 PE1의 값을 전술한 [수식 8,9]에 의해 구한 PEm 및 PEstd값에 따라 결정되는 가중치이다. 인지 정보량에 대한 평균값(PEm)과 표준편차(PEstd)를 이용하여 가중치(δ)의 값을 [표 1]를 통하여 결정한 후 (식 10)를 이용하여 결정 구간(D1)의 값을 계산한다.
결정 구간(D1)의 값은 q의 값에 따라 그 개수가 결정되는데 만일 q의 값인 4인 경우에는 -4에서 4 사이의 정수값(i)에 대하여 9개의 결정 구간(D1)이 (식 10)에 의하여 계산된다.
예를 들어 인지 정보량의 평균값(PEm)이 1이고 표준 편차(PEstd)가 0.15인 경우 GOF가 2개의 프레임으로 구성되어 인지 정보량의 값이 0.8, 1.3인 경우에는 [표 1]에서 가중치의 값이 2값을 갖는다. 이 경우 q의 값이 2라 가정하면 i값은 02와 2 사이의 정수값으로 -2, -1, 0, 1, 2의 값을 갖는다. 이 값에 따라 결정 구간(D1)값을 계산하면 다음과 같다. D-2의 값은 (식 12) 를 이용하면 평균값(PEm)의 값이 1이라 가정하였으므로 1+[2×{-2(1-)}+L(-1)]×2/2=-2이고 D1값은 0값이 된다. 같은 방법으로 모든 i값에 대하여 결정 구간(D1)의 값을 구할 수 있다. 이렇게 구한 결정 구간(D1)의 값을 이용하여 GOF내의 각 프레임에 비트를 할당하는 과정은 다음과 같다.
GOF가 2개의 프레임으로 구성된다면(도면 3에서 M=2인 경우), 상술한 예에서 인지 정보량의 값이 0.8, 1.3인 경우, 평균(PEm)과 표준 편차(PEstd)의 값이 각각 0, 0.15이다. 이와 같은 2개의 프레임에 대하여 표 1)을 이용하여 가중치(δ)를 구하고, 이 가중치(δ)를 이용하여 결정 구간(D1)의 값을 (식 10)를 이용하여 구한다. 이 값은 상술한 예에서 설명한 바와 같다.
상술한 예에서는 q의 값이 2인 경우이므로 결정 구간의 값이 D-2에서 D2까지의 값이 각각 -2, 0, 1, 2, 4로 [수식 12]를 이용하여 계산된다. 이 결정 구간(D1)은 비트 할당을 위한 인덱스 값을 구하는데 이용된다. 이와 같은 결정 구간(D1)을 이용하여 비트를 할당하는 과정은 다음과 같다.
두 프레임에 대한 인지 정보량이 X1, X2라 하면 X1, X2의 값이 위에서 구한 결정 구간(D1)의 어느 부분에 해당하는지를 조사한다. X1의 값이 0.8이면 이 값은 결정 구간(D1)의 0에서 1 사이에 있으므로 인덱스의 값은 01이고, X2의 값이 1.3인 프레임은 결정 인덱스의 값을 구한 후에는 기설정된 비트 할당 값으로부터 인덱스의 값을 이용하여 해당하는 비트 할당을 수행하는 것이다. 이와 같은 과정을 수식으로 표현하면 다음과 같다.
[수식 11]
if(D1+1<Xi<Dj) 인덱스=j
상기 [수식 10]에서 Dj는 [수식 12]에서 구한 결정 구간인 값이고 Xi는 i번째 프레임의 인지 정보량 값에 해당한다. 또한, j는 0q에서 q 사이의 정수값이고 i는 GOF내의 프레임을 지칭하는 값이다. 즉, 위에서 프레임이 2개로 구성되는 GOF의 경우에는 i값이 1과 2값을 갖는다. 이와 같이 구한 인덱스의 값을 이용하여 프레임 비트를 할당하는 과정은 [표 2]에서 기술한 바와 같다.
[표 2]에서는 q의 값이 4인 경우를 예로 든 것이며, 이때, GOF내의 각 인지 정보량에 해당하는 인덱스(index)의 값에 따라 할당되는 비트는 [표 2]에서와 같이 프레임 비트가 결정된다. 이 과정은 본 발명을 실시하는 예를 든것이므로 q의 값이 다른 값이거나 혹은 평균 프레임 비트의 값이 [표 2]와 다른 경우에는 할당되는 비트가 다를 수 있다. 그러나, 본 발명의 요지는 인지 정보량을 프레임 단위로 구한 후 GOF 단위로 분석하여 인지 정보량의 평균(PEm)과 표준 편차(PEstd)를 구한 후 이 값으로부터 상술한 바와 같이 인덱스를 결정하는 과정에 해당한다. 이 과정은 인간의 청각 특성을 이용하여 프레임 단위로 비트를 할당하는 과정인 것이다.
[표 2]
(단위, Frame Bit : Bit/Frame, Bit Rate : K Bit/sec)
즉, [표 2]를 참조하면, 예를 들어 Index가 0인 경우, 프레임 즉, 1152 샘플로 구성되는 프레임 단위로 초당 128kbps의 정보전송률로 부호화되는 경우, 1프레임에 할당하는 비트수는 3072로서, MPEG의 오디오 섹션에서 제안하는 비트수가 할당되고, Index가 증가할수록, 프레임 비트수는 평균치를 훨씬 초과하는 반면에, Index가 감소할수록 프레임 비트수는 평균치보다 훨씬 적게 할당됨을 알 수 있을 것이다.
도면 1을 다시 참조하면, 부호획(260,270,280)는 L, R 및 센터 채널 GOF부(210,220,230)에서 각기 제공되는 각 채널의 샘플링 데이타를 적응적 채널 및 프레임 비트 할당부(250)에서 제공되는 각 채널 및 각 채널의 프레임에 대한 인지 정보량에 의해 통상적인 부호화 방식으로 부호화하는 것으로, 그의 출력들은 MUX(290)에 접속된다. MUX(290)는 전술한 부호기(260,270,280)에서 제공되는 부호화된 데이타와 적응적 프레임 및 채널 비트 할당부(250)에서 제공되는 L, R 및 센터 채널과 각 채널의 프레임에 대해 할당된 비트 정보를 다중화하여 채널(Channel) 특성에 적합하도록 비트 스트림으로 변환하여 출력한다.
즉, 본 발명은 상술한 바와 같이 각각의 프레임에 비트가 할당되면 이 값을 이용하여 해당하는 프레임을 부호화 한다. 이와 같이 할당된 비트를 이용하면 인간의 청각 특성에 부합되는 적응 프레임 비트 할당 과정이 되는 것이다. 이 할당된 비트를 이용하여 기존의 MPEG-1 오디오 부호화기를 적용하면 이후의 과정은 종래의 기술과 동일한 방법을 이용할 수 있게 된다. 단자, 종래의 기술에서는 각 프레임에 동일한 비트를 할당하므로써 프레임 각각의 청각적인 중요도를 고려하지 않았으므로 부호화 효율이 떨어지게 된다. 그러나, 본 발명에서는 인간의 청각적인 중요도를 이용하여 프레임 비트 할당을 수행하므로써 동일한 정보 비트 전송율로 음질이 나온 부호화기를 구현할 수 있는 것이다.
이상에서 설명한 본 발명에 따른 L, R 및 센터 채널과 각 채널의 프레임에 적응적으로 비트 할당하여 부호화하는 스테레오 디지탈 오디오 부호화 장치에 의하면, L, R 및 센터채 널과 각 채널의 프레임에 대한 인지 정보량의 평균 및 분산값(또는 표준 편차)에 응답하여 L, R 및 센터 채널과 각 채널의 프레임에 적응적으로 비트를 할당하여 부호화하므로써, 부호화 효율을 증대시키고 음질을 향상시키는 커다란 장점이 있다.

Claims (1)

  1. 좌측 (L) 및 우측(R) 및 센터 채널 (210), (220), (230)로 입력되는 다수개의 프레임을 가진 프레임군(Group Of Frame : GOF)으로 이루어진 디지탈 오디오 신호에 대한 인간의 인지정보량에 응답하여 상기 L, R 및 센터 채널과 상기 채널 (210), (220), (230)의 프레임에 대해 적응적으로 비트를 할당하여 부호화하는 것으로, 상기 L, R 및 센터 채널로 입력되는 다수개의 프레임을 가진 프레임군을 입력하여 상기 L, R 및 센터 채널 (210), (220), (230)과 상기 채널 (210), (220), (230)의 프레임에 대한 인지 정보랭(Perceptual Entropy)을 산출하는 인지 정보량 계산부(240)와 ; 상기 인지 정보량 계산부(240)에서 얻은 L, R 및 센터 채널 (210), (220), (230)과, 상기 채널 (210), (220), (230)의 프레임에 대한 인지 정보량에 응답하여 상기 L, R 및 센터 채널과, 각 채널 (210), (220), (230)의 프레임에 적응적으로 비트를 할당하는 적응적 채널 및 프레임 비트 할당(Adaptive Frame And Channel Bit Allocation)부(250)와 ; 상기 LMR 및 센터 채널 (210), (220), (230)으로 입력되는 다수개의 프레임으로 이루어진 디지탈 오디오 신호를 상기 L, R 및 센터 채널 (210), (220), (230)과 상기 채널 (210), (220), (230)의 프레임에 할당된 비트를 적용하여 L, R 및 센터 채널 (210), (220), (230)과 상기 채널 (210), (220), (230)의 프레임을 부호화하는 부호화(260), (270), (280)를 포함하는 스테레오 디지탈 오디오 부호화장치의 비트 할당 장치.
KR1019940000742A 1994-01-18 1994-01-18 스테레오 디지탈 오디오 부호화 장치의 비트 할당 장치 KR960012473B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019940000742A KR960012473B1 (ko) 1994-01-18 1994-01-18 스테레오 디지탈 오디오 부호화 장치의 비트 할당 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019940000742A KR960012473B1 (ko) 1994-01-18 1994-01-18 스테레오 디지탈 오디오 부호화 장치의 비트 할당 장치

Publications (2)

Publication Number Publication Date
KR950024441A KR950024441A (ko) 1995-08-21
KR960012473B1 true KR960012473B1 (ko) 1996-09-20

Family

ID=19375754

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940000742A KR960012473B1 (ko) 1994-01-18 1994-01-18 스테레오 디지탈 오디오 부호화 장치의 비트 할당 장치

Country Status (1)

Country Link
KR (1) KR960012473B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112599139B (zh) * 2020-12-24 2023-11-24 维沃移动通信有限公司 编码方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
KR950024441A (ko) 1995-08-21

Similar Documents

Publication Publication Date Title
KR960012475B1 (ko) 디지탈 오디오 부호화장치의 채널별 비트 할당 장치
JP2756515B2 (ja) 可聴信号の知覚符号化方法および音声信号伝送方法
US6393393B1 (en) Audio coding method, audio coding apparatus, and data storage medium
KR100388730B1 (ko) 고능률부호화및복호화장치
US20070150267A1 (en) Signal encoding device and signal encoding method, signal decoding device and signal decoding method, program, and recording medium
JP3297240B2 (ja) 適応的符号化システム
AU2015235133B2 (en) Audio decoding device, audio encoding device, audio decoding method, audio encoding method, audio decoding program, and audio encoding program
JP3900000B2 (ja) 符号化方法及び装置、復号方法及び装置、並びにプログラム
KR0134318B1 (ko) 채널간의 마스킹특성을 고려한 비트할당장치 및 그 방법과 복호화장치
KR100682915B1 (ko) 다채널 신호 부호화/복호화 방법 및 장치
KR960012473B1 (ko) 스테레오 디지탈 오디오 부호화 장치의 비트 할당 장치
KR20030085521A (ko) 디지털 음성 데이터의 부호화 방법 및 복호화 방법
KR960003454B1 (ko) 적응적 스테레오 디지탈 오디오 부호화장치
KR960012474B1 (ko) 인간의 청각 특성에 적응적인 스테레오 디지탈 오디오 부호화장치
KR960003453B1 (ko) 채널 및 각 프레임에 적응적으로 비트 할당하여 부호화하는 스테레오 디지탈 오디오 부호화장치
KR960003455B1 (ko) 적응적으로 각 채널에 비트 할당하여 부호화 및 복호화하는 엠 에스 스테레오 디지탈 오디오 부호화 및 복호화 장치
KR960012476B1 (ko) 디지탈 오디오 부호화 장치의 프레임별 비트 할당장치
KR960012477B1 (ko) 인지 정보량을 이용한 적응적 스테레오 디지탈 오디오 부호화 및 복호화장치
KR0144297B1 (ko) 적응적 디지탈 오디오 부호화 장치
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法
KR0152016B1 (ko) 가변 비트할당을 이용한 부호화 및 복호화시스템
KR0144935B1 (ko) 비트율 조정이 가능한 부호화 및 복호화장치
US5875424A (en) Encoding system and decoding system for audio signals including pulse quantization
KR970005132B1 (ko) 채널간의 상관성을 이용한 인간의 청각특성에 적응적인 스테레오 디지탈 오디오 부호화 및 복호화 장치
KR0134350B1 (ko) 적응적 비트할당을 이용한 부호화 및 복호화시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 19990831

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee