KR100195707B1 - 디지탈 오디오신호 변환장치 - Google Patents

디지탈 오디오신호 변환장치 Download PDF

Info

Publication number
KR100195707B1
KR100195707B1 KR1019950045861A KR19950045861A KR100195707B1 KR 100195707 B1 KR100195707 B1 KR 100195707B1 KR 1019950045861 A KR1019950045861 A KR 1019950045861A KR 19950045861 A KR19950045861 A KR 19950045861A KR 100195707 B1 KR100195707 B1 KR 100195707B1
Authority
KR
South Korea
Prior art keywords
sampling frequency
bit rate
audio signal
mpeg
applicable
Prior art date
Application number
KR1019950045861A
Other languages
English (en)
Other versions
KR970032131A (ko
Inventor
김규석
Original Assignee
전주범
대우전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전주범, 대우전자주식회사 filed Critical 전주범
Priority to KR1019950045861A priority Critical patent/KR100195707B1/ko
Publication of KR970032131A publication Critical patent/KR970032131A/ko
Application granted granted Critical
Publication of KR100195707B1 publication Critical patent/KR100195707B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • H04N21/2335Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 디지탈 오디오신호 변환장치에 관한 것으로, 부호화된 AC-3 오디오신호를 PCM 오디오신호로 복원하여 출력하는 AC-3 오디오복호기(100)와; 상기 PCM 오디오신호의 샘플링 주파수 및 비트 레이트를 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 및 비트 레이트로 변환시켜 출력하는 샘플링 주파수 및 비트 레이트 제어부(200) 및; 상기 샘플링 주파수 및 비트 레이트 제어부(200)에서 출력된 PCM 오디오신호를 MPEG 오디오 부호화하여 출력하는 MPEG 오디오 부호기(300)를 포함하여 구성되어, AC-3 오디오 부호기에 의해 압축된 디지탈 오디오신호를 MPEG 오디오 복호기를 사용하여 복원할 수 있도록 변환시켜 줄 수 있는 것이다.

Description

디지탈 오디오신호 변환장치
제1도는 일반적인 MPEG 오디오 부호기의 블럭도.
제2도는 일반적인 MPEG 오디오 복호기의 블럭도.
제3도는 일반적인 AC-3 오디오 부호기의 블럭도.
제4도는 일반적인 AC-3 오디오 복호기의 블럭도.
제5도는 본 발명에 따른 디지탈 오디오신호 변환장치의 블럭도이다.
* 도면의 주요부분에 대한 부호의 설명
2 : 분석 서브밴드 필터 4 : 심리 음향 모델
6 : 비트 할당 및 양자화기 8 : 비트스트림배열부
10 : 비트할당 디코더 12 : 역양자화기
14 : 스케일팩터 디코더 16 : 합성 서브밴드 필터
20 : 분석 필터 뱅크 22 : 스펙트럼포락선 부호기
24 : 비트 할당부 26 : 양자화기
28 : 프레임 배열부 30 : 프레임 역배열부
32 : 비트 할당부 34 : 역양자화기
36 : 스펙트포락선 부호기 38 : 합성 필터 뱅크
100 : AC-3 오디오 복호기
200 : 샘플링주파수 및 비트레이트 제어부
210 : 입력버퍼 220 : 파라메터 검출부
230 : 파라메터 변환부 300 : MPEG 오디오 부호기
본 발명은 디지탈 오디오신호 변환장치에 관한 것으로, 특히 AC-3 오디오 부호기에 의해 압축된 디지탈 오디오신호를 MPEG 오디오 복호기를 사용하여 복원할 수 있도록 변환하는 디지탈 오디오신호 변환장치에 관한 것이다.
디지탈 오디오는 80년대에 들어서면서 CD나 DAT와 같은 대용량 저장 매체의 개발과 함께 오디오 기기의 표준이 되었다. 그러나, 디지탈 오디오 데이터는 많은 정보량을 가지므로 공중파 방송 등의 제한된 대역폭을 갖는 매체에서 사용하기 위해서는 오디오 데이터를 압축하는 것이 필수적이다.
따라서, 80년대 후반부터 다양한 고음질 오디오 압축 기술이 개발되었으며, 이와 같은 기술은 공통적으로 기존의 데이터 압축 기업에 사람의 청각 특성을 고려하여 결합한 형태를 갖는다.
상기 오디오 압축 기술의 대표적인 것으로는 MPEG 방식과 돌비연구소에서 제한한 AC-3 방식이 있다.
즉, MPEG 방식은 동영상과 그에 부가되는 오디오 압축 방식의 표준안을 결정하는 MPEG/ISO에서 규정한 것으로, MPEG-1은 약 1.5Mbit/s에서 동영상과 오디오를 압축할 수 있는 부호화 방식으로서 MUSICAM(Masking-pattern adapted Universal Subband Integrated Coding And Multiplexing) 방식을 사용하였으며, MPEG-1은 디지탈 방송을 위한 6Mbit/s 이상의 전송율을 갖는 다채널 구조의 MPEG-2로 확장되었다.
상기 MUSICAM방식은 청각 특성을 이용한 서브밴드 부호화 방식으로 96~128Kbit/s에서 주관적으로 원음과 동일한 복원음을 얻을 수 있도록 되어 있다.
한편, AC-3방식은 북미 지역의 HDTV 오디오 압축 기술의 표준안으로, AC-3는 MDCT(Modified Discrete Cosine Transform)을 이용한 적응 변환 부호화 방법을 사용하였으며, 처음 2채널 스테레오 신호만을 대상으로 한 AC-2로부터 AC-2a를 거쳐, 다채널 구조를 갖는 AC-3로 발전하였다.
상기 MUSICAM방식을 사용한 MPEG 오디오 부호기는 제1도에 도시된 바와 같이, 입력신호(PCM data)를 다수개의 서브 밴드 샘플로 변환하여 출력하는 분석 서브밴드 필터(2)와; 입력신호를 고속 푸리에 변환(FFT:Fast Fourier Transform)하여 스펙트럼 정보를 구하고, 이 스펙트럼 정보로부터 마스킹 임계값을 얻은 다음 이 마스킹 임계값과 상기 스펙트럼 정보로부터 결정된 각서브 밴드 샘플의 음압 레벨의 차를 구하여 신호대 마스크 비(SMR:Signal to Mask Ratio)를 계산하여 출력하는 심리 음향 모텔(4); 상기 심리 음향 모텔(4)에서 출력된 신호 대 마스크 비를 사용하여 상기 각 서브 밴드 샘플에 비트를 할당하고, 할당된 비트에 따라 상기 각 서브 밴드 샘플을 양자화시켜 출력하는 비트 할당 및 양자화기(6); 상기 비트할당 및 양자화기(6)에서 양자화되어 출력된 서브 밴드 샘플 및 비트 할당 정보, 크기 정보(scalefactor) 등의 부가 정보를 비트스트림으로 배열(formatting)하여 출력하는 비트 스트림배열부(8)를 포함하여 구성된다.
상기와 같이 구성된 MPEG 오디오 부호기에 있어서, 상기 분석 서브 밴드 필터(2)는 입력된 32개의 새로운 오디오 샘플을 차례로 512 샘플 크기로 갖는 버퍼에 저장하고, 이 버퍼에 분석 윈도우(analysis window)를 곱한 후, 512샘플을 8개의 64샘플 블럭으로 나누고 각 블럭을 더하여 새로운 벡터를 구성한다.
여기에 하기 제1식과 같은 분석 행렬을 곱하여 32개의 서브밴드 샘플을 만든다.
그리고, 심리 음향 모델(4)은 각 서브밴드에서 원음에 의해 마스킹되어 들을 수 없는 최대 잡음 레벨을 결정하고, 이 잡음 레벨(마스킹 임계값)을 사용해서 각 밴드의 실제 양자화기를 결정한느 비트 할당을 할 수 있다.
이때, MPEG 방식에서는 두 가지의 심리 음향 모델을 제공하는데, 심리 음향 모텔 1은 신호의 스펙트럼으로부터 순음과 잡음 성분을 구분하는 과정과, 순음과 잡음의 개별 마스킹 임계값을 계산하는 과정, 절대 가청 한계를 고려하여 전체 마스킹 임계값을 계산하는 과정 및, 각 서브밴드에서의 신호 대 마스크 비를 계산하는 과정을 거쳐 신호 대 마스크 비를 구한다.
즉, 고속 푸리에 변환(FFT)을 통해 스펙트럼을 구하고, 이로부터 각 서브밴드에서의 음압 레벨을 결정한다. 여기에서 마스킹 성분이 순음 또는 잡음인가에 따라 마스킹 곡선이 달라지므로 스펙트럼 정보로부터 순음 성분과 잡음 성분을 찾아내야 한다.
즉, 부분 최대값(local maxima) 중에서 주위 신호보다 7dB이상이 크면 순음으로 간주하여 순음 성분을 찾아낸 후 나머지 스펙트럼에서 하나의 임계 대역 내에서 하나의 잡음 성분을 구한다.
여기에서 실험적으로 구해진 마스킹 함수를 적용하여 순음에 의한 마스킹 임계값을 구하고, 전체 마스킹 임계값을 개별 마스킹 임계값과 가청 한계의 합으로 구해진다.
그리고, 각 서브밴드에서의 음압 레벨과 마스킹 임계값과의 차를 구하여 신호 대 마스크 비(SMR:Signal to Masking Ratio)를 계산한다.
결국, 신호 대 마스크 비(SMR)가 작다면 신호의 음압 레벨이 작거나 마스킹이 많이 된 것이므로 적은 비트를 가지고 효과적인 양자화를 할 수 있다.
그리고, 심리 음향 모델 2에서는, 신호의 임계 대역에 따른 에너지를 계산하는 과정과, 스프레딩 함수와 컨벌루션, 청신경의 여기 정도를 계산하는 과정, 절대 가청 한계를 고려하여 마스킹 임계값을 계산하는 과정 및, 각 서브밴드에서의 신호 대 마스크 비를 계산하는 과정을 거쳐 신호대 마스크 비를 구하는 것이다.
이와 같은 심리 음향 모델 2는 고속 푸리에 변환 스펙트럼을 청신경의 여기 모델인 스프레딩 함수와 컨벌루션하여 마스킹 임계값을 구하므로, 계산량은 많지만 더 정교한 결과를 얻을 수 있는 것이다.
그리고, 상기 비트 할당 및 양자화기(6)는, 상기 심리 음향 모델(4)에서 출력된 신호 대 마스크 비를 사용하여 상기 분석 서브밴드 필터(2)에서 출력된 각 서브 밴드 샘플에 대해 비트를 할당하고, 이 할당된 비트에 따라 크기 정보(scale factor)에 의해 나누어져 정규화된 각 서브밴드 샘플등을 양자화한다.
이때, 각 서브 밴드에 대한 크기 정보(scale factor) 계산은 양자화하기 이전에 행해지며, 상기 크기 정보(scale factor) 계산은 12 샘플마다 이루어지고, 12 샘플의 절대값 중 최대값을 찾아서 0에서 2사이로 정규화시킨다.
그리고, 비트 스트림 배열부(8)는 상기 비트할당 및 양자화기(8)에서 출력된 양자화된 서브 밴드 샘플 및 할당 정보, 크기 정보(scalefactor) 등의 부가 정보를 MPEG 프레임으로 배열하여 비트 스트림으로 전송하는 것이다.
한편, 상기와 같이 압축되어 전송된 비트 스트림을 복원하는 MPEG 오디오 복호기는 상기 MPEG 오디오 부호기를 역으로 구현하면 된다.
즉, 종래의 MPEG 오디오 복호기는 제2도에 도시된 바와 같이, 압축되어 전송된 비트 스트림 중에서 각 서브 밴드 샘플에 대한 비트 할당 정보를 디코딩하여 출력하는 비트 할당 디코더(10)와; 상기 비트 할당 디코더(10)에서 출력된 비트 할당 정보에 따라 상기 비트 스트림의 각 서브 밴드 샘플을 역양자화하여 출력하는 역양자화기(12); 상기 비트 스트림 중에서 스케일 팩터 정보를 검출한 다음 상기 스케일 팩터를 사용하여 상기 역양자화기(12)에서 양자화된 각 서브밴드 샘플을 원래의 서브밴드 샘플로 계산하여 출력하는 스케일팩터 디코더(14) 및; 상기 스케일팩터 디코더(14)에서 출력된 각 서브밴드 샘플을 합성하여 오디오 신호를 복원하는 합성 서브밴드 필터(16)로 이루어져 있다.
상기와 같은 MPEG 오디오 복호기에 있어서, 비트 할당 디코더(10)는 압축되어 전송된 비트 스트림 중에서 각 서브 밴드 샘플에 대한 비트 할당 정보를 디코딩하여 출력하고, 역양자화기(12)는 상기 비트 할당 디코더(10)에서 출력된 비트 할당 정보에 따라 상기 비트 스트림의 각 서브 밴드 샘플을 역양자화하여 출력한다.
그리고, 스케일팩터 디코더(14)는 상기 비트 스트림 중에서 스케일 팩터 정보를 검출한 다음 상기 스케일 팩터를 사용하여 상기 역양자화기(12)에서 양자화된 각 서브밴드 샘플을 원래의 서브밴드 샘플을 계산하여 출력하며, 합성 서브밴드 필터(16)는 상기 스케일팩터 디코더(14)에서 출력된 각 서브밴드 샘플을 합성하여 오디오 신호를 복원하여 출력하는 것이다.
이때, 상기 합성 서브밴드 필터(16)에서 각 서브밴드 샘플을 오디오 신호로 복원하기 위해 사용되는 행렬을 하기 제2식과 같다.
한편, MDCT 변환 부호화 방식을 사용한 AC-3 오디오 부호기는 제3도에 도시된 바와 같이, 입력 신호(PCM 오디오 신호)를 주파수 영역으로 변환하여 주파수 계수를 출력하는 분석 필터 뱅크(20)와; 상기 주파수 계수의 지수부를 스펙트럼 포락선으로 부화하여 출력하는 스펙트럼 포락선 부호기(22); 상기 스펙트럼 포락선에 따라 상기 주파수 계수의 가수부를 양자화하기 위한 비트 할당 정보를 출력하는 비트 할당부(24); 상기 비트 할당 정보에 따라 상기 주파수 계수의 가수부를 양자화하여 출력하는 양자화기(26) 및; 상기 스펙트럼 포락선 및 양자화된 가수부를 AC-3 프레임으로 배열(format)하여 출력하는 프레임 배열부(28)로 이루어져 있다.
상기와 같은 AC-3 오디오 부호기에 있어서, 상기 분석 필터 뱅크(20)는 입력 신호를 주파수 영역으로 변환하며, 이때 각 주파수 계수는 지수부와 가수부로 표현된다.
그리고, 상기 스펙트럼 포락선 부호기(22)는 상기 지수부를 스펙트럼 포락선으로 부호화하여 비트 할당부(24) 및 프레임 배열부(30)로 출력하고, 상기 비트 할당부(24)는 상기 스펙트럼 포락선에 따라 상기 주파수 가수부를 양자화하기 위한 비트 할당 정보를 양자화기(26)로 출력한다.
그리고, 양자화기(26)는 상기 비트 할당 정보에 따라 상기 주파수 계수의 가수부를 양자화하여 프레임 배열부(28)로 출력하며, 프레임 배열부(28)는 상기 스펙트럼 포락선 및 양자화된 가수부를 AC-3 프레임으로 배열하여 출력하고, 이 AC-3 프레임시퀀스가 AC-3 비트 스트림이 되는 것이다.
한편, 상기와 같은 AC-3 오디오 부호기에 의해 압축된 오디오 신호를 복원하기 위한 AC-3 오디오 복호기는 상기 AC-3 오디오 부호기를 역으로 구현하면 된다.
즉, AC-3 오디오 복호기는 제4도에 도시된 바와 같이, 부호화된 AC-3 비트 스트림의 스펙트럼 포락선과 가수부를 분리하는 프레임 역배열부(30); 상기 스펙트럼 포락선에 따라 비트 할당 정보를 출력하는 비트 할당부(32); 상기 비트 할당 정보에 따라 상기 가수부를 역양자화하여 출력하는 역양자화기(34); 상기 스펙트럼 포락선을 디코딩하여 지수부를 출력하는 스펙트럼 포락선 복호기(36) 및; 상기 지수부와 가수부를 타임 영역으로 변환하여 PCM 오디오 신호를 출력하는 합성 필터 뱅크(38)를 포함하여 구성되어 있다.
상기와 같은 AC-3 오디오 복호기에 있어서, 상기 프레임 역배열부(30)는, 부호화된 AC-3 비트 스트림의 스펙트럼 포락선과 가수부를 각각 분리하여 상기 스펙트럼 포락선은 비트 할당부(32) 및 스펙트럼 포락선 디코더(36)로 출력하는 한편, 상기 가수부는 역양자화기(34)로 출력한다.
이때, 상기 프레임 역배열부(30)는 부호화된 AC-3 비트 스트림을 동기시키고, 에러 체크를 해야만 한다.
그리고, 비트 할당부(30)는 상기 스펙트럼 포락선에 따라 비트 할당 정보를 역양자화기(34)로 출력하고, 역양자화기(34)는 상기 비트할당 정보에 따라 상기 가수부를 역양자화하여 합성 필터 뱅크(30)로 출력한다.
그리고, 스펙트럼 포락선 복호기(36)는 상기 엔코딩된 스펙트럼 포락선을 디코딩하여 지수부를 합성 필터 뱅크(38)로 출력하며, 합성 필터 뱅크(38)는 상기 지수부와 가수부를 타임 영역으로 변환하여 PCM 오디오신호를 출력하는 것이다.
이상에서 살펴본 바와 같이 종래의 MPEG 오디오 부호기와 AC-3 오디오 부호기는, 음성 신호를 압축하는 방식이 서로 틀려 호환성이 없다.
즉, MPEG 오디오 부호기에 의해 부호화된 신호는 AC-3 오디오 복호기로 복원할 수 없고, AC-3 오디오 부호기에 의해 부호화된 신호는 MPEG 오디오 복호기로 복원할 수 없는 문제점이 있었다.
따라서, 본 발명은 상기와 같은 종래의 문제점을 해소하기 위한 것으로, AC-3 오디오 부호기에 의해 부호화된 신호를 MPEG 오디오 복호기를 사용하여 복원할 수 있도록 변환하는 디지탈 오디오신호 변환장치를 제공하는데 그 목적이 있다.
이러한 목적을 달성하기 위한 본 발명에 따른 디지탈 오디오 신호 변환신호는, 부호화된 AC-3 오디오신호를 PCM 오디오신호로 복원하여 출력하는 AC-3 오디오 복호기와; 상기 PCM 오디오신호의 샘플링 주파수 및 비트 레이트를 MPEG 부호화 방식에 적용 가능한 샘플링 주파수 및 비트 레이트로 변환시켜 출력하는 샘플링 주파수 및 비트 레이트 제어부 및; 상기 샘플링 주파수 및 비트 레이트 제어부에서 출력된 PCM 오디오신호를 MPEG 오디오 부호화하여 출력하는 MPEG 오디오 부호기를 포함하여 구성된 것을 특징으로 한다.
따라서, AC-3 오디오 부호기에 의해 부호화된 신호를 MPEG 오디오 복호기를 사용하여 복원할 수 있는 것이다.
이하, 첨부된 도면을 참조하여 본 발명을 상세히 설명한다.
제5도는 본 발명에 따른 디지털 오디오신호 변환장치의 블럭도로서, 본 발명에 따른 디자탈 오디오신호 변환장치는, 부호화된 AC-3 오디오신호를 PCM 오디오신호로 복원하여 출력하는 AC-3 오디오 복호기(100)와; 상기 PCM 오디오신호의 샘플링 주파수 및 비트 레이트를 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 및 비트 레이트로 변환시켜 출력하는 샘플링 주파수 및 비트 레이트 제어부(200) 및; 상기 샘플링 주파수 및 비트 레이트 제어부(200)에서 출력된 PCM 오디오신호를 MPEG 오디오 부호화하여 출력하는 MPEG 오디오 부호기(300)를 포함하여 구성되어 있다.
그리고, 상기 AC-3 오디오 복호기(100)는, 부호화된 AC-3 오디오 신호를 역배열하여 스펙트럼 포락선과 가수부 및 헤더 정보를 각각 분리하여 출력하는 프레임 역배열부(30); 상기 스펙트럼 포락선에 따라 비트 할당 정보를 출력하는 비트 할당부(32); 상기 비트 할당 정보에 따라 상기 가수부를 역양자화하여 출력하는 역양자화기(34); 상기 스펙트럼 포락선을 디코딩하여 지수부를 출력하는 스펙트럼 포락선 복호기(36) 및; 상기 지수부와 가수부를 타임 영역으로 변환하여 PCM 오디오신호를 출력하는 합성 필터 뱅크(38)를 포함하여 구성되어 있다.
그리고, 상기 샘플링 주파수 및 비트 레이트 제어부(200)는, 상기 AC-3 오디오 복호기(100)에서 출력된 PCM 오디오신호를 저장하는 입력 버퍼(210)와; 상기 AC-3 오디오 복호기(100)의 프레임 역배열부(30)로부터 헤더 정보를 입력받아 샘플 링 주파수 및 비트 레이트 파라메터를 검출하여 출력하는 파라메터 검출부(220) 및; 상기 샘플링 주파수 및 비트 레이트 파라메터에 따라 상기 입력버퍼(210)에 저장된 PCM 오디오신호의 샘플링 주파수 및 비트 레이트를 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 및 비트레이트로 조정하는 파라메터 변환부(230)를 포함하여 구성되어 있다.
그리고, 상기 파라메터 변환부(230)는, 상기 파라메터 검출부(220)에서 출력된 샘플링 주파수가 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수인지 판단하여 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수이면 상기 입력버퍼(210)에서 저장된 PCM 오디오신호의 샘플링 주파수를 변환시키지 않고, MPEG 오디오 부호화 방식에 적용할 수 없는 샘플링 주파수이면 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 중에서 가장 근접한 샘플링 주파수로 상기 입력버퍼(210)에서 저장된 PCM 오디오신호의 샘플링 주파수를 조정하도록 되어 있는 한편, 상기 파라메터 검출부(220)에서 검출된 비트 레이트가 MPEG 오디오 부호화 방식에 적용 가능한 비트 레이트인지 판단하여 MPEG 오디오 부호화 방식에 적용 가능한 비트 레이트이면 상기 입력버퍼(210)에 저장된 PCM 오디오신호의 비트 레이트를 변환시키지 않고, MPEG 오디오 부호화 방식에 적용할 수 없는 비트 레이트이면 MPEG오디오 부호화 방식에 적용 가능한 비트 레이트로 조정하도록 되어 있다.
이때, 상기 파라메터 변환부(230)는, 상기 파라메터 검출부(220)에서 검출되어 출력된 샘플링 주파수가 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 보다 크면 데시메이션(decimation)을 통해 샘플링 주파수를 작게 하고, 샘플링 주파수가 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 보다 작으면 보간(interpolation)을 통해 샘플링 주파를 크게 하여 MPEG 오디오 부호화 방식의 샘플링 주파수와 일치시키도록 되어 있다.
한편, 상기 MPEG 오디오 부호기(300)는, PCM 오디오신호를 다수개의 서브 밴드 샘플로 변환하여 출력하는 분석 서브밴드 필터(2)와; 입력신호를 고속 푸리에 변환(FFT:Fast Fourier Transform)하여 스펙트럼 정보를 구하고, 이 스펙트럼 정보로부터 마스킹 임계값을 얻은 다음 이 마스킹 임계값과 상기 스펙트럼 정보로부터 결정된 각서브 밴드 샘플의 음악 레벨의 차를 구하여 신호대 마스크 비(SMR:Signal to Mask Ratio)를 계산하여 출력하는 심리 음향 모델(4); 상기 심리 음향 모델(4)에서 출력된 신호 대 마스크 비를 사용하여 상기 각 서브 밴드 샘플에 비트를 할당하고, 할당된 비트에 따라 상기 각 서브 밴드 샘플을 양자화시켜 출력하는 비트할당 및 양자화기(6); 상기 비트할당 및 양자화기(6)에서 양자화되어 출력된 서브 밴드 샘플 및 비트 할당 정보, 크기 정보(scalefactor) 등의 부가 정보를 비트스트림으로 포맷팅(formatting)하여 출력하는 비트스트림포맷부(8)를 포함하여 구성되어 있다.
상기와 같이 구성된 본 발명에 따른 디지탈 오디오신호 변환장치의 작용 및 효과를 상세히 설명하면 다음과 같다.
AC-3 오디오 복호기(100)는 부호화된 AC-3 오디오신호를 PCM 오디오신호로 복원하여 샘플링 주파수 및 비트 레이트 제어부(200)로 출력하고, 샘플링 주파수 및 비트 레이트 제어부(200)는 상기 AC-3 오디오 복호기(100)에서 출력된 PCM 오디오신호의 샘플링 주파수 및 비트 레이트를 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 및 비트 레이트로 변환시켜 MPEG 오디오 부호기(300)로 출력하며, MPEG 오디오 부호기(300)는 상기 샘플링 주파수 및 비트 레이트 제어부(200)에서 출력된 PCM 오디오신호를 MPEG 오디오 부호화하여 출력하는 것이다.
즉, AC-3는 오디오 복호기(100)의 프레임 역배열부(30)는, 부호화된 AC-3 비트 스트림의 스펙트럼 포락선과 가수부 및 헤더 정보를 각각 분리하여 상기 스펙트럼 포락선은 비트 할당부(32) 및 스펙트럼 포락선 디코더(36)로 출력하는 한편, 상기 가수부는 역양자화기(34)로 출력하고, 헤더 정보는 샘플링 주파수 및 비트 레이트 제어부(200)의 파라메터 검출부(210)로 출력한다.
이때, 상기 프레임 역배열부(30)는 부호화된 AC-3 비트 스트림을 동기시키고, 에러 체크를 해야만 한다.
상기 비트 할당부(30)는 상기 스펙트럼 포락선에 따라 비트 할당정보를 역양자화기(34)로 출력하고, 역양자화기(34)는 상기 비트 할당 정보에 따라 상기 가수부를 역양자화하여 합성 필터 뱅크(30)로 출력한다.
그리고, 스펙트럼 포락선 복호기(36)는 상기 엔코딩된 스펙트럼 포락선을 디코딩하여 지수부를 합성 필터 뱅크(38)로 출력하며, 합성 필터 뱅크(38)는 상기 지수부와 가수부를 타임 영역으로 변환하여 PCM 오디오신호를 출력하는 것이다.
상기와 같이 복원된 PCM 오디오신호는 샘플링 주파수 및 비트 레이트 제어부(200)의 입력버퍼(210)에 저장되며, 이때 파라메터 검출부(220)가 상기 AC-3 오디오 복호기(100)의 프레임 역배열부(30)로부터 헤더 정보를 입력받아 샘플링 주파수 및 비트 레이트 파라메터를 검출하여 파라메터 변환부(230)로 출력하고, 파라메터 변환부(230)는 상기 샘플링 주파수 및 비트 레이트 파라메터에 따라 상기 입력버퍼(210)에 저장된 PCM 오디오신호의 샘플링 주파수 및 비트 레이트를 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 및 비트레이트로 조정하는 것이다.
즉, 상기 파라메터 변환부(230)는 상기 파라메터 검출부(220)에서 검출된 샘플링 주파수가 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수인지 판단하여 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수이면 상기 입력버퍼(210)에 저장된 PCM 오디오신호의 샘플링 주파수를 변환시키지 않고, MPEG 오디오 부호화 방식에 적용할 수 없는 샘플링 주파수이면 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 중에서 가장 근접한 샘플링 주파수로 상기 입력버퍼(210)에 저장된 PCM 오디오신호의 샘플링 주파수를 조정하는 한편, 상기 파라메터 검출부(220)에서 검출된 비트 레이트가 MPEG 오디오 부호화 방식에 적용 가능한 비트 레이트인지 판단하여 MPEG 오디오 부호화 방식에 적용 가능한 비트 레이트이면 상기 입력버퍼(210)에 저장된 PCM 오디오신호의 비트 레이트를 변환시키지 않고, MPEG 오디오 부호화 방식에 적용할 수 없는 비트 레이트이면 MPEG 오디오 부호화 방식에 적용 가능한 비트 레이트로 조정한다.
이때, 상기 파라메터 검출부(220)에서 검출된 샘플링 주파수가 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 보다 크면 데시이션(decimation)을 통해 샘플링 주파수를 작게 하고, 샘플링 주파수가 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 보다 작으면 보간(interpolation)을 통해 샘플링 주파수를 크게 하여 MPEG 오디오 부호화 방식의 샘플링 주파수와 일치시킨다.
상기와 같이 AC-3 오디오 복호기(100)에서 출력된 PCM 오디오신호가 상기 샘플링 주파수 및 비트 레이트(200)에서 샘플링 주파수 및 비트 레이트가 조정된 다음 MPEG 오디오 부호기(300)로 입력된다.
그리고, 상기 MPEG 오디오 부호기(300)의 분석 서브밴드 필터(2)는 입력된 32개의 새로운 오디오 샘플을 차례로 512 샘플 크기를 갖는 버퍼에 저장하고, 이 버퍼에 분석 윈도우(analysis window)를 곱한 후, 512샘플을 8개의 64샘플 블럭으로 나누고 각 블럭을 더하여 새로운 벡터를 구성한다.
여기에 하기 제1식과 같은 분석 행렬을 곱하여 32개의 서브밴드 샘플을 만든다.
그리고, 심리 음향 모델(4)은 각 서브밴드에서 원음에 의해 마스킹되어 들을 수 수 없는 최대 잡음 레벨을 결정하고, 이 잡음 레벨(마스킹 임계값)을 사용해서 각 밴드의 실제 양자화기를 결정하는 비트 할당을 할 수 있다.
이때, MPEG 방식에서는 두가지의 심리 음향 모델을 제공하는데, 심리 음향 모델 1은 신호의 스펙트럼으로부터 순음과 잡음 성분을 구분하는 과정과, 순음과 잡음의 개별 마스킹 임계값을 계산하는 과정, 절대 가청 한개를 고려하여 전체 마스킹 임계값을 계산하는 과정 및, 각 서브밴드에서의 신호 대 마스크 비를 계산하는 과정을 거쳐 신호 대 마스크 비를 구한다.
즉, 고속 푸리에 변환(FFT)을 통해 스펙트럼을 구하고, 이로부터 각 서브밴드에서의 음압 레벨을 결정한다. 여기에서 마스킹 성분이 순음 또는 잡음인가에 따라 마스킹 곡선이 달라지므로 스펙트럼 정보로부터 순음 성분과 잡음 성분을 찾아내야 한다.
즉, 부분 최대값(local maxima) 중에서 주위 신호보다 7dB 이상이 크면 순음으로 간주하여 순음 성분을 찾아낸 후 나머지 스펙트럼에서 하나의 임계 대역 내에서 하나의 잡음 성분을 구한다.
여기에서 실험적으로 구해진 마스킹 함수를 적용하여 순음에 의한 마스킹 임계값을 구하고, 전체 마스킹 임계값은 개별 마스킹 임계값과 가청 한계의 합으로 구해진다.
그리고, 각 서브밴드에서의 음압 레벨과 마스킹 임계값과의 차를 구하여 신호 대 마스크 비(SMR:Signal to Masking Ratio)를 계산한다.
결국, 신호 대 마스크 비(SMR)가 작다면 신호의 음압 레벨이 작거나 마스킹이 많이 된 것이므로 적은 비트를 가지고 효과적인 양자화를 할 수 있다.
그리고, 심리 음향 모델 2에서는, 신호의 임계 대역에 따른 에너지를 계산하는 과정과, 스프레딩 함수와 컨벌루션, 청신경의 여기 정도를 계산하는 과정, 절대 가청 한계를 고려하여 마스킹 임계값을 계산하는 과정 및, 각 서브밴드에서의 신호 대 마스크 비를 계산하는 과정을 거쳐 신호대 마스크 비를 구하는 것이다.
이와 같은 심리 음향 모델 2는 고속 푸리에 변환 스펙트럼을 청신경의 여기 모델인 스프레딩 함수와 컨벌루션하여 마스킹 임계값을 구하므로, 계산량은 많지만 더 정교한 결과를 얻을 수 있을 것이다.
그리고, 상기 비트 할당 및 양자화기(6)는, 상기 심리 음향 모델(4)에서 출력된 신호 대 마스크 비를 사용하여 상기 분석 서브밴드 필터(2)에서의 출력된 각 서브 밴드 샘플에 대해 비트를 할당하고, 이 할당 된 비트에 따르 크기 정보(scale factor)에 의해 나누어져 정규화된 각 서브밴드 샘플들을 양자화한다.
이때, 각 서브 밴드에 대한 크기 정보(scale factor) 계산은 양자화하기 이전에 행해지며, 상기 크기 정보(scale factor) 계산은 12샘플마다 이루어지고, 12샘플의 절대값 중 최대값을 찾아서 0에서 2사이로 정규화시킨다.
그리고, 비트 스트림 배열부(8)는 상기 비트할당 및 양자화기(8)에서 출력된 양자화된 서브 밴드 샘플 및 비트 할당 정보, 크기 정보(scalefactor) 등의 부가 정보를 MPEG 프레임으로 배열하여 전송하는 것이다.
이상에서 살펴본 바와 같이 본 발명에 따르면, AC-3 오디오 부호기에 의해 압축된 디지털 오디오신호를 MPEG 오디오 복호기를 사용하여 복원할 수 있도록 변환시켜 줄 수 있는 것이다.

Claims (5)

  1. 부호화된 AC-3 오디오신호를 PCM 오디오신호로 복원하여 출력하는 AC-3 오디오 복호기(100)와; 상기 PCM 오디오신호의 샘플링 주파수 및 비트 레이트를 AC-3 오디오 부호화 방식에 적용 가능한 샘플링 주파수 및 비트 레이트로 변환시켜 출력하는 샘플링 주파수 및 비트 레이트 제어부(200) 및; 상기 샘플링 주파수 및 비트 레이트 제어부(200)에서 출력된 PCM 오디오신호를 MPEG 오디오 부호화하여 출력하는 MPEG 오디오 부호기(300)를 포함하여 구성된 디지털 오디오신호 변환장치.
  2. 제1항에 있어서, 상기 샘플링 주파수 및 비트 레이트 제어부(200)는, 상기 AC-3 오디오 복호기(100)에서 출력된 PCM 오디오신호를 저장하는 입력버퍼(210)와; 상기 AC-3 오디오 복호기(100)로부터 헤더 정보를 입력받아 샘플링 주파수 및 비트 레이트 파라메터를 검출하여 출력하는 파라메터 검출부(220) 및; 상기 샘플링 주파수 및 비트 레이트 파라메터에 따라 상기 입력버퍼(210)에 저장된 PCM 오디오신호의 샘플링 주파수 및 비트 레이트를 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 및 비트레이트로 조정하는 파라메터 변환부(230)를 포함하여 구성된 것을 특징으로 하는 디지털 오디오신호 변환장치.
  3. 제2항에 있어서, 상기 파라메터 변환부(230)는, 상기 파라메터 검출부(220)에 출력된 샘플링 주파수가 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수인지 판단하여 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수이면 상기 입력버퍼(210)에 저장된 PCM 오디오신호의 샘플링 주파수를 변환시키지 않고, MPEG 오디오 부호화 방식에 적용할 수 없는 샘플링 주파수이면 MPEG 오디오 부호화 방식에 적용 할 수 없는 샘플링 주파수 중에서 가장 근접한 샘플링 주파수로 상기 입력버퍼(210) 에 저장된 PCM 오디오신호의 샘플링 주파수를 조정하도록 된 것을 특징으로 하는 디지털 오디오신호 변환장치.
  4. 제2항에 있어서, 상기 파라메터 변환부(230)는, 상기 파라메터 검출부(220)에서 검출된 배트 레이트가 MPEG 오디오 부호화 방식에 적용 가능한 비트 레이트인지 판단하여 MPEG 오디오 부호화 방식에 적용 가능한 비트 레이트이면 상기 입력버퍼(210)에 저장된 PCM 오디오신호의 비트 레이트를 변환시키지 않고, MPEG 오디오 부호화 방식에 적용할 수 없는 비트 레이트이면 MPEG 오디오 부호화 방식에 적용 가능한 비트 레이트로 조정하도록 된 것을 특징으로 하는 디지털 오디오신호 변환장치.
  5. 제3항에 있어서, 상기 파라메터 변환부(230)는, 상기 파라메터 검출부(220)에서 검출되어 출력된 샘플링 주파수가 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 보다 크면 데시메이션을 통해 샘플링 주파수를 작게 하고, 샘플링 주파수 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 보다 작으면 보간을 통해 샘플링 주파수를 크게 하여 MPEG 오디오 부호화 방식의 샘플링 주파수와 일치시키도록 된 것을 특징으로 하는 디지털 오디오신호 변환장치.
KR1019950045861A 1995-11-30 1995-11-30 디지탈 오디오신호 변환장치 KR100195707B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019950045861A KR100195707B1 (ko) 1995-11-30 1995-11-30 디지탈 오디오신호 변환장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019950045861A KR100195707B1 (ko) 1995-11-30 1995-11-30 디지탈 오디오신호 변환장치

Publications (2)

Publication Number Publication Date
KR970032131A KR970032131A (ko) 1997-06-26
KR100195707B1 true KR100195707B1 (ko) 1999-06-15

Family

ID=19437221

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950045861A KR100195707B1 (ko) 1995-11-30 1995-11-30 디지탈 오디오신호 변환장치

Country Status (1)

Country Link
KR (1) KR100195707B1 (ko)

Also Published As

Publication number Publication date
KR970032131A (ko) 1997-06-26

Similar Documents

Publication Publication Date Title
EP1600946B1 (en) Method and apparatus for encoding a digital audio signal
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
EP1914724B1 (en) Dual-transform coding of audio signals
JP3802219B2 (ja) 音声符号化装置
JP3352406B2 (ja) オーディオ信号の符号化及び復号方法及び装置
EP3457400B1 (en) Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method
US20040162720A1 (en) Audio data encoding apparatus and method
KR19990041072A (ko) 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US20080140393A1 (en) Speech coding apparatus and method
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
EP1228506A1 (en) Method of encoding an audio signal using a quality value for bit allocation
US7613609B2 (en) Apparatus and method for encoding a multi-channel signal and a program pertaining thereto
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
KR100195707B1 (ko) 디지탈 오디오신호 변환장치
KR100195709B1 (ko) 디지탈 오디오신호 변환장치
KR100195711B1 (ko) 디지탈 오디오 복호기
KR100204471B1 (ko) 디지탈 오디오 부호화기의 비트 할당 장치
KR100195708B1 (ko) 디지탈 오디오 부호기
KR100195712B1 (ko) 디지탈 오디오 복호화기의 음질 조절 장치
KR0121164B1 (ko) 고음질 오디오 데이타의 압축/복원을 위한 실시간 시스템 및 그의 부호화/복호화 방법
KR0152016B1 (ko) 가변 비트할당을 이용한 부호화 및 복호화시스템
KR0144841B1 (ko) 음향신호의 적응적 부호화 및 복호화장치
JPH08204575A (ja) 適応的符号化システム及びビット割当方法
Boland et al. Hybrid LPC And discrete wavelet transform audio coding with a novel bit allocation algorithm
KR970006827B1 (ko) 오디오신호 부호화장치

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110201

Year of fee payment: 13

LAPS Lapse due to unpaid annual fee