KR100913987B1 - 다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법 - Google Patents

다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법 Download PDF

Info

Publication number
KR100913987B1
KR100913987B1 KR1020067027932A KR20067027932A KR100913987B1 KR 100913987 B1 KR100913987 B1 KR 100913987B1 KR 1020067027932 A KR1020067027932 A KR 1020067027932A KR 20067027932 A KR20067027932 A KR 20067027932A KR 100913987 B1 KR100913987 B1 KR 100913987B1
Authority
KR
South Korea
Prior art keywords
post
channel
quantization
signal
parameter
Prior art date
Application number
KR1020067027932A
Other languages
English (en)
Other versions
KR20070028481A (ko
Inventor
위르겐 헤레
사샤 디쉬
요하네스 힐페르트
크리스티안 에르텔
안드레아스 호엘저
클라우스-크리스티안 스펜저
Original Assignee
프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 filed Critical 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우
Publication of KR20070028481A publication Critical patent/KR20070028481A/ko
Application granted granted Critical
Publication of KR100913987B1 publication Critical patent/KR100913987B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Radio Relay Systems (AREA)
  • Channel Selection Circuits, Automatic Tuning Circuits (AREA)
  • Stereophonic System (AREA)

Abstract

본 발명의 다중-채널 합성장치는, 후처리 복원 파라미터 또는 그 유도된 양의 값이 양자화 간격(quantization step size)에 의해 제한되지 않는다는 점에서, 후처리 복원 파라미터 또는 후처리량이 상응하는 양자화 및 역 양자화 복원 파라미터와 다르도록, 입력 신호의 하나의 현재 시간 부분에 대한 복원 파라미터로부터 유도된 후처리 복원 파라미터들 또는 양을 결정하기 위한, 하나의 후처리 장치(10)를 포함한다. 하나의 다중-채널 복원장치(12)가, 다중-채널 출력 신호를 복원하기 위해 후처리 복원 파라미터를 사용한다. 낮은 비트 레이트(low bit rate) 요건 때문에 선호되는 복원 파라미터에 대한 큰 양자화 간격 때문에 복원된 다중-채널 출력 신호의 강력한 변화가 감소되므로, 다중-채널 인코딩/디코딩과 관련된 후처리 복원 파라미터에 의해 한편으로는 낮은 데이터 레이트와 다른 한편으로는 높은 품질을 가능하게 한다.

Description

다중-채널 출력 신호를 발생시키기 위한 다중-채널 합성장치 및 방법{Multi-channel synthesizer and method for generating a multi-channel output signal}
본 발명은 다중-채널 오디오 처리, 특히, 복수의 채널들을 갖는 하나의 출력 신호를 복원하기(reconstructing) 위해 하나의 베이스 채널과 파라미터 사이드 정보(a base channel and parametric side information)를 사용하는 다중-채널 오디오 복원에 관한 것이다.
최근 들어, 다중-채널 오디오 복원 기술이 더욱 더 중요하게 되어가고 있다. 이것은 잘 알려진 mp3 기술과 같은 오디오 압축/인코딩 기술이 인터넷 또는 제한된 밴드폭을 갖는 다른 송신 채널들(transmission channels)을 통해 오디오 레코드를 배포하는(distribute) 것을 가능하게 만드는 사실에 기인한 것일 수 있다. mp3 코딩 기술은 스테레오 포맷으로, 즉, 제1 또는 좌측 스테레오 채널(a first or left stereo channel) 및 제2 또는 우측 스테레오 채널(a first or right stereo channel)을 포함하는 오디오 레코드의 디지털 표시로(in a digital representation)로 모든 녹음물들의 배포를 가능하게 하는 사실 때문에 매우 유명 하게 되었다.
그럼에도 불구하고, 선행 기술의 2-채널 사운드 시스템에는 근본적인 단점이 있다. 그 결과, 서라운드 기술(surround technique)이 개발되어 왔다. 추천되고 있는 하나의 다중-채널-서라운드 표시는, 두 개의 스테레오 채널(L 및 R)에 더하여, 하나의 중심 채널(C)과 두 개의 서라운드 채널(Ls, Rs)을 추가로 포함한다. 이러한 사운드 포맷은, 세 개의 프론트 채널들(front channels)과 두 개의 서라운드 채널들을 의미하는, 3/2 스테레오(three/two-stereo)로 또한 불리운다. 일반적으로, 다섯개의 송신 채널이 필요하다. 재생 환경에서(in a playback environment), 다섯 개의 알맞은 장소에 설치된 확성기들로부터 특정 거리내에 있는 하나의 최적의 스위트 스팟(sweet spot)을 얻기 위해 5개의 상이한 장소에 적어도 다섯 개의 스피커들이 필요하다.
당업계에는 다중-채널 오디오 신호의 송신에 필요한 데이터의 양을 감소시키기 위한 여러가지 기술들이 알려져 있다. 그러한 기술들은 조인트 스테레오 기술(joint stereo techniques)로 불리운다. 이를 위해, 하나의 조인트 스테레오 장치(60)를 나타낸 도 10을 살펴보자. 이 장치는 예를 들어 인텐시티 스테레오(intensity stereo; IS) 또는 바이노럴 큐 코딩(binaural cue coding: BCC)을 실행하는 장치일 수 있다. 그러한 장치는 -입력으로서- 적어도 두 개의 채널(CH1, CH2, ... CHn)을 수신하고, 하나의 싱글 캐리어 채널과 파라미터 데이터(a single carrier channel and parameter data)를 출력하는 것이 일반적이다. 파라미터 데이터(parametric data)는, 디코더에서, 하나의 오리지널 채널(CH1, CH2, . . . CHn) 의 하나의 근사치(approximation)가 계산될 수 있는 것으로 정의된다.
일반적으로, 이 캐리어 채널은, 기초 신호(underlying signal)의 비교적 정밀한 표시를 제공하는, 부대역 샘플들(subband samples), 스펙트럼 계수들(spectral coefficients), 시간 도메인 샘플들(time domain samples) 등을 포함하는데 대해, 파라미터 데이터는 스펙트럼 계수의 그러한 샘플들을 포함하지 않으나 승법(multiplication), 타임 시프팅(time shifting), 주파수 시프팅(frequency shifting), 위상 시프팅(phase shifting) 등에 의한 가중화(weighting)와 같은 특정 복원 알고리즘(a certain reconstruction algorithm)을 제어하기 위한 제어 파라미터들을 포함한다. 그러므로, 파라미터 데이터는 신호 또는 관련 채널의 비교적 거친 표시(comparatively coarse representation)만을 포함한다. 숫자로 기술하면, 하나의 채널에 대한 파라미터 사이드 정보에 필요한 데이터의 양은 1.5 - 2.5 kbit/s 의 범위에 있을 것인데 대해, 캐리어 채널에 필요한 데이터의 양은 60 - 70 kbit/s 의 범위에 있을 것이다. 파라미터 데이터에 대한 하나의 예는, 잘 알려진 스케일 팩터(scale factors), 인텐시티 스테레오 정보 또는 바이노럴 큐 파라미터들이며, 이에 대하여는 아래에서 설명하기로 한다.
인텐시티 스테레오 코딩은 AES 예비원고(preprint) 3799, "인텐시티 스테레오 코딩(Intensity Stereo Coding)" [J. 헤레(J. Herre), K. H. 브란덴버그(K. H. Brandenburg), D. 리더러(D. Lederer), 1994년 2월, 암스테르담]에 기술되어 있다. 인텐시티 스테레오의 개념은 양쪽의 입체음향 오디오 채널(both stereophonic audio channels)의 데이터에 적용될 메인 축 변형(main axis transform)에 기초하 는 것이 일반적이다. 대부분의 데이터 포인트들(data points)이 제1 프린시플 축(the first principle axis) 주위에 집중되면, 코딩에 앞서 특정 각도만큼 양쪽 신호를 회전시켜(rotating) 하나의 코딩 이득(coding gain)을 얻을 수 있다. 그러나, 실제 입체음향 생성 기술(real stereophonic production techniques)에 있어 항상 그러한 것은 아니다. 따라서, 이 기술은 제2 직교 성분(the second orthogonal component)을 비트 스트림의 송신으로부터 제외시킴에 의해 변형된다. 그러므로, 좌측 및 우측 채널에 대한 복원 신호들(reconstructed signals)은 동일한 송신 신호(transmitted signal)의 차등 가중 또는 체감 버전(differently weighted or scaled versions)으로 구성된다. 그럼에도 불구하고, 복원 신호는 그 크기(amplitude)에서 다르나 그 위상 정보(phase information)에 있어 동일하다. 그러나, 양쪽의 오리지널 오디오 채널의 에너지-시간 엔벨로프(energy-time envelopes)는, 대체로 주파수 선택 방식으로(in a frequency selective manner) 동작하는, 선택적 스케일링 연산(selective scaling operation)에 의해 보존된다(preserved). 이것은, 주공간 정보(dominant spatial cues)가 에너지 엔벨로프(energy envelopes)에 의해 결정되는, 인간의 고주파수에서의 소리 지각 작용(the human perception of sound at high frequencies)과 합치한다.
그에 더하여, 실제 실행에 있어서, 송신된 신호, 즉, 캐리어 채널은 좌측 채널과 우측 채널을 회전시키는 대신 두 성분들의 합계 신호(sum signal)로부터 발생된다. 또한, 이러한 처리, 즉, 스케일링 동작을 실행하기 위한 인센시티 스테레오 파라미터를 발생시키는 것은 주파수 선택적으로, 즉, 각 스케일 팩터 밴드(scale factor band), 즉, 인코더 주파수 파티션encoder frequency partition)과 관계없이 수행된다. 두 채널들은 하나의 조합된(combined) 채널 또는 "캐리어" 채널을 형성하기 위해 조합되는 것, 그리고, 조합된 채널에 더하여, 제1 채널의 에너지, 제2 채널의 에너지 또는 조합 채널의 에너지에 좌우되어, 인텐시티 스테레오 정보가 결정되는 것이 바람직하다.
BCC 기술은 2002년 5월의 AES 총회에서의 C. 팔러(C. Faller), F. 바움가르테(F. Baumgarte)의 발표 논문 5574, "스테레오 및 다중-채널 오디오 압축에 적용되는 바이노럴 큐 코딩(Binaural cue coding applied to stereo and multi-channel audio compression)" [2002년 5월, 뮌헨]에 기술되어 있다. BBC 코딩에 있어서는, 복수의 오디오 입력 채널들이 중첩 윈도우(overlapping windows)를 갖는 하나의 DFT 베이스 변환(DFT based transform)을 사용하여 하나의 스펙트럼 표시(spectral representation)로 변환된다. 그에 따라 나타나는 균일 스펙트럼(the resulting uniform spectrum)은 각기 하나의 인덱스를 갖는 비-중첩 파티션들(non-overlapping partitions)로 분할된다. 각 파티션은 동등한 직사각형 밴드폭(equivalent rectangular bandwidth; ERB)과 비례하는 밴드폭을 갖는다. 채널간 레벨 차이(inter-channel level differences; ICLD)와 채널간 시간 차이(inter-channel time differences; ICTD)는 각 프레임(k) 별로 각 파티션에 대해 평가된다(estimated). ICLD 및 ICTD는 양자화되고 코딩되어 하나의 BCC 비트 스트림이 된다. 채널간 레벨 차이와 채널간 시간 차이는 하나의 참조 채널(reference channel)에 대하여 각 채널마다 주어진다. 그 다음에, 파라미터들은, 처리될 신호의 특정 파티션에 좌우되는 미리 정해진 식(prescribed formulae)에 따라 계산된다.
디코더-측에서, 디코더는 하나의 모노 신호(mono signal) 및 BCC 비트 스트림을 수신한다. 이 모노 신호는 주파수 도메인으로 변환되고, 디코딩된 ICLD 및 ICTD 값들을 또한 수신하는, 하나의 공간 합성 블록(spatial synthesis block)에 입력된다. 공간 합성 블록에 있어서, BCC 파라미터(ICLD 및 ICTD) 값은, 주파수/시간 변환 후에 오리지널 다중-채널 오디오 신호의 복원된 것(a reconstruction)을 나타내는, 다중-채널 신호를 합성하기 위하여 이 모노 신호의 가중화 연산(weighting operation)을 수행하는데 사용된다.
BCC의 경우에, 조인트 스테레오 모듈(60)은, 파라미터 채널 데이터(parametric channel data)가 양자화되고 인코딩된 ICLD 또는 ICTD 파라미터이도록, 채널 사이드 정보(channel side information)를 출력하도록 동작하며, 여기서 오리지널 채널들중의 하나가 채널 사이드 정보를 코딩하기 위한 참조 채널로(as the reference channel) 사용된다.
일반적으로, 캐리어 채널은 관여하는 오리지널 채널들(participating original channels)의 합계(sum)로 형성된다.
물론, 상기 기술은 캐리어 채널을 처리하기만 할 수 있는 하나의 디코더에 대하여 하나의 모노 표시(a mono representation)를 제공하기만 하나, 하나 이상의 입력 채널의 하나 또는 그보다 많은 근사치들(approximations)을 발생시키기 위한 파라미터 데이터(parametric data)를 처리할 수 없다.
바이노럴 큐 코딩(BCC)으로 알려진 오디오 코딩 기술은 미국 특허출원 공개 US 2003/0219130 A1호, 2003/0026441 A1호 및 2003/0035553 A1호에 또한 잘 기술되어 있다. 추가로 "바이노럴 큐 코딩. 파트 II: 체계 및 용도 (Binaural Cue Coding. Part II: Schemes and Applications)" [C. 팔러(Faller) 및 F. 바움가르테(Baumgarte), IEEE Trans. On Audio and Speech Proc., 제11권, 제6호, 1993년 11월]가 또한 참고가 된다. 인용된 미국 특허출원 문헌들과 팔러 및 바움가르테에 의해 저술된 BCC 기술에 대한 두 개의 인용 기술 문헌들은 그 전체가 본 명세서의 참고문헌을 이룬다.
아래에서, 다중-채널 오디오 코딩을 위한 하나의 전형적인 일반 BCC 체계(generic BCC scheme)를 도 11 내지 13를 참조하여 더 상세히 설명하기로 한다. 도 11은, 다중-채널 오디오 신호들의 코딩/송신을 위한 그러한 하나의 일반 바이노럴 큐 코딩 체계(a generic binaural cue coding scheme)를 나타낸다. BCC 인코더(112)의 하나의 입력 부분(110)에서의 다중-채널 오디오 입력 신호는 하나의 다운 믹스 블록(a down mix block)(114)에서 다운 믹스된다(down mixed). 이 예에서, 입력 부분(110)의 오리지널 다중-채널 신호는, 하나의 프론트 좌측 채널(front left channel), 하나의 프론트 우측 채널, 하나의 좌측 서라운드 채널, 하나의 우측 서라운드 채널 및 하나의 중심 채널(center channel)을 갖는 5-채널 서라운드 신호이다. 본 발명의 바람직한 실시예에서, 다운 믹스 블록(114)은, 이들 다섯 채널들을 하나의 모노 신호(mono signal)에 단순히 더함으로써 하나의 합계 신호(sum signal)를 만들어낸다. 다른 다운 믹싱 체계들(down mixing schemes)은, 하나의 다중-채널 입력 신호를 사용하여, 하나의 싱글 채널을 갖는 하나의 다중 믹스 신호가 얻어질 수 있는 것으로, 당업계에서 알려져 있다. 이 싱글 채널은 하나의 합계 신호 라인(sum signal line)(115)에서 출력된다. BCC 분석 블록(116)에 의해 얻어진 하나의 사이드 정보가 하나의 사이드 정보 라인(117)에서 출력된다. BCC 분석 블록에서, 채널간 레벨 차이(inter-channel level differences; ICLD), 그리고 채널간 시간 차이(inter-channel time differences; ICTD)가 위에 개략적으로 설명된 바와 같이 계산된다. 최근에는, BCC 분석 블록(116)이 또한 채널간 상관 값들(inter-channel correlation values; ICC values)을 계산하도록 향상되어 왔다. 이 합계 신호와 사이드 정보는, 바람직하게는 하나의 양자화되고 인코딩된 형태로 하나의 BCC 디코더(120)로 송신된다. BCC 디코더는, 송신된 합계 신호를 복수의 부대역들(subbands)로 분해시키고(decompose), 출력된 다중-채널 오디오 신호들의 부대역들을 발생시키기 위해, 스케일링(scaling), 지연(delays) 및 다른 처리(processing)를 적용한다(apply). 이 처리는, 하나의 출력부(121)의 하나의 복원 다중-채널 신호의 ICLD, ICTD 및 ICC 파라미터들(큐들)이, BCC 인코더(112)에 대한 입력부(110)에서의 오리지널 다중-채널 신호에 대한 각각의 큐들(cues)과 유사하도록 수행된다. 이를 위해, BCC 디코더(120)는, 하나의 BCC 합성 블록(synthesis block)(122)과 하나의 사이드 정보 처리 블록(side information processing block)(123)을 포함한다.
아래에서, BCC 합성 블록(122)의 내부 구성을 도 12를 참고하여 설명한다. 라인(115)의 합계 신호는 하나의 시간/주파수 변환 유닛(time/frequency conversion unit) 또는 필터 뱅크(FB)(125)로 입력된다. 오디오 필터 뱅크(125)가 1:1 변환(transform), 즉, N 개의 시간 도메인 샘플들로부터 N 개의 스펙트럼 계수들을 만들어내는 하나의 변환을 수행할 때, 블록(125)의 출력에 다수(N)의(a number N of) 부대역 신호들 또는, 하나의 극단적인 경우에는, 한 블록의 스펙트럼 계수들이 존재한다.
BCC 합성 블록(122)은, 하나의 지연 단계(delay stage)(126), 하나의 레벨 변경 단계(level modification stage)(127), 하나의 상관 처리 단계(correlation processing stage)(128) 및 하나의 역 필터 뱅크 단계(inverse filter bank stage; IFB)(129)를 더 포함하여 구성된다. 단계(129)의 출력에서, 예를 들어 5-채널 서라운드 시스템의 경우 다섯 채널들을 갖는 복원 다중-채널 오디오 신호가, 도 11에 도시된 한 세트의 확성기들(124)로 출력될 수 있다.
도 12에 나타낸 바와 같이, 입력 신호[s(n)]는, 단계(125)에 의해 주파수 도메인 또는 필터 뱅크 도메인으로 변환된다. 동일한 신호의 여러 버전들이 곱셈 노드(multiplication node)(130)에 의해 도시된 바와 같이 얻어지도록, 단계(125)에 의해 출력된 신호가 곱해진다. 오리지널 신호의 버전들의 수는 복원될 출력 신호의 출력 채널들의 수와 동일하다. 일반적으로, 노드(130)의 오리지널 신호의 각 버전은 하나의 특정 지연(d1, d2, ..., di, ..., dN)에 처해진다. 이 지연 파라미터들은 도 11의 사이드 정보 처리 블록(123)에 의해 컴퓨터계산되고, BCC 분석 블록(116)에 의해 결정된(determined) 바와 같은 채널간 시간 차이들로부터 유도된다(derived).
곱셈 파라미터들(a1, a2, ..., ai, ..., aN)에 있어서도 상기와 같으며, 이들은 또한 BCC 분석 블록(116)에 의해 계산된 채널간 레벨 차이들에 기초한 사이드 정보 처리 블록(123)에 의해 계산된다.
지연되고 레벨-조작된 신호들(delayed and level-manipulated signals) 사이의 특정 상호관계들이 블록(128)의 출력부에 얻어지도록, BCC 분석 블록(116)에 의해 계산된 ICC 파라미터들이 블록(128)의 기능성(functionality)을 제어하기 위해 사용된다. 본 발명에서 단계들(126, 127, 128)의 순서(ordering)가 도 12에 도시된 경우와 상이할 수 있음을 알아야 한다.
오디오 신호의 프레임식 처리(a frame-wise processing)에 있어서, BCC 분석은 프레임식으로, 즉, 시간변동식으로(time-varying) 수행되며, 그리고 주파수식(frequency-wise)으로도 수행된다. 이것은 각 스펙트럼 대역마다, BCC 파라미터들이 얻어짐을 의미한다. 이것은 오디오 필터 뱅크(125)가 입력 신호를 예를 들어 32 대역 통과 신호들(32 band pass signals)로 분해하는 경우에, BCC 분석 블록이 32 대역들의 각각에 대해 한 세트의 BCC 파라미터들을 얻음을 의미한다. 도 12에 상세하게 나타낸, 도 11의 BCC 합성 블록(122)이, 예를 든 32 대역들에 마찬가지로 기초하는 복원을 수행하는 것은 당연하다.
아래에서, 특정 BCC 파라미터들을 결정하기(determine) 위한 하나의 장치(setup)를 나타내는 도 13을 살펴본다. 일반적으로, ICLD, ICTD 및 ICC 파라미터들이 채널 쌍들 사이에서 정의될(defined between pairs of channels) 수 있다. 그 러나, 하나의 참조 채널(reference channel)과 다른 채널 각각의 사이에서 ICLD 및 ICTD 파라미터들을 결정하는 것이 바람직하다. 이것은 도 13A에 도시되어 있다.
ICC 파라미터들은 여러 방식으로 정의될 수 있다. 가장 일반적으로는, 도 13B에 도시된 바와 같이 모든 가능한 채널 쌍들 사이에서 인코더의 ICC 파라미터들을 어림할(estimate) 수 있다. 이 경우에, 모든 가능한 채널 쌍들 사이에서 오리지널 다중-채널 신호와 대체로 동일하도록, 하나의 디코더가 ICC를 합성할 것이다. 그러나, 매번 가장 강한 두 개의 채널들 사이의 ICC 파라미터들만을 어림하도록(estimate) 제안되었다. 도 13C에 이 체계가 도시되어 있는데, 한 번은 하나의 ICC 파라미터가 채널들(1 및 2) 사이에 계산되고, 다른 한 번은 하나의 ICC 파라미터가 채널들(1 및 5)사이에 계산되는 예가 나타나 있다. 디코더는 그 다음에 디코더에서 가장 강한 채널들 사이의 채널간 상관 관계를 합성하고, 나머지 채널 쌍들에 대한 채널간 간섭(inter-channel coherence)을 컴퓨터계산하고 합성하기 위해 휴리스틱 룰(heuristic rule)을 적용한다.
예를 들어, 송신된 ICLD 파라미터들을 기초로 한 곱셈 파라미터들(a1, ..., aN)의 계산에 관하여는, 위에 인용된 AES 컨벤션 논문 5574가 참고가 된다. ICLD 파라미터들은 하나의 오리지널 다중-채널 신호의 에너지 분포(an energy distribution)를 나타낸다. 보편성의 손실없이(without loss of generality), 프론트 좌측 채널과 다른 모든 채널들 사이의 에너지 차이를 나타내는 4 ICLD 파라미터들이 있는 것이 도 13A에 나타나 있다. 사이드 정보 처리 블록(123)에서, 모든 복 원 출력 채널들의 전체 에너지가 송신된 합계 신호의 에너지와 동일하도록(또는 비례하도록) 곱셈 파라미터들(a1, ..., aN)이 ICLD 파라미터들로부터 유도된다. 이 파라미터들을 결정하기 위한 간단한 방법이 2단계 처리인데, 첫 번째 단계에서, 좌측 프론트 채널에 대한 곱셈 팩터(multiplication factor)가 단일하게(set to unity) 설정되는데 대해, 도 13A의 다른 채널들에 대한 곱셈 팩터들이 송신된 ICLD 값들로 설정된다. 그 다음에, 제2 단계에서, 모든 5 채널들의 에너지가 계산되어, 송신된 합계 신호의 에너지와 비교된다. 그 다음에, 모든 채널들에 대해 동일한 하나의 다운스케일링 팩터(downscaling factor)를 사용하여, 모든 채널들이 다운스케일링되며, 여기서, 다운스케일링 팩터는, 다운스케일링 후에 모든 복원 출력 채널들의 전체 에너지가 송신된 합계 신호의 전체 에너지와 동일하도록 선택된다.
2-단계 처리에 의존하지는 않고 1-단계 처리만을 필요로 하는, 곱셈 팩터들을 계산하기 위한 다른 방법들이 있음은 물론이다.
지연 파라미터들과 관련하여, 좌측 프론트 채널에 대한 지연 파라미터(d1)가 0(sero)으로 설정될 때, 하나의 BCC 인코더로부터 송신된 지연 파라미터들(ICTD)이 직접적으로 사용될 수 있음을 알아야 한다. 여기서, 재스케일링(rescaling)이 수행되어야만 하는 것은 아닌데, 이는 하나의 지연이 신호의 에너지를 변경하지 않기 때문이다.
BCC 인코더로부터 BCC 디코더로 송신된 채널간 간섭 값(inter-channel coherence measure ICC)과 관련하여, 하나의 가간섭성 조작(coherence manipulation)은, 모든 부대역들의 가중화 팩터들(weighting factors)에 20log10(-6) 및 20log10(6) 사이의 값들을 갖는 난수(random numbers)를 곱하는 것과 같이, 곱셈 팩터들(a1, ..., aN)을 변경함으로써 행해질 수 있음을 알아야 한다. 베리언스(variance)가 모든 임계 대역들(critical bands)에 대해 거의 일정하고 평균이 각 임계 대역내에서 0(zero)이도록, 의사-랜덤 시퀀스(pseudo-random sequence)가 선택되는 것이 바람직하다. 동일 시퀀스가 각각의 상이한 프레임에 대한 스펙트럼 계수에 적용된다. 따라서, 가청 이미지 폭(auditory image width)이 의사-랜덤 시퀀스의 변이(variance)를 변경함으로써 제어된다. 변이가 클수록 큰 이미지 폭을 만든다. 임계-대역이 넓은(critical-band wide) 개별 대역들에서 변이 변경(variance modification)이 수행될 수 있다. 이것은 각기 하나의 상이한 이미지 폭을 갖는 복수 오브젝트들이 하나의 가청 현장(auditory scene)에 동시에 존재하는 것을 가능하게 한다. 의사-랜덤 시퀀스에 대한 하나의 적절한 진폭 분포(amplitude distribution)는, 미국 특허 공개 2003/0219130 A1호에 개략적으로 설명되어 있는, 로그 눈금상의(on a logarithmic scale) 균일한 분포이다. 그럼에도 불구하고, 모든 BCC 합성 처리는, 도 11에 나타낸 바와 같이 BCC 인코더로부터 BCC 디코더로 합계 신호로서 송신된 하나의 싱글 입력 채널과 관련되어 있다.
파라미터 스테레오(parametric stereo)로 또한 알려진 관련 기술이, J. 브리바르트(Breebaart), S. 판 데 파르(van de Par), A. 콜라우쉬(Kohlrausch), E. 쉬우이저스(Schuijers)의, "낮은 비트 레이트에서의 고품질 파라미터 공간 오디오 코 딩(High-Quality Parametric Spatial Audio Coding at Low Bitrates)" [AES 116차 컨벤션, 베를린, 예비원고(Preprint) 6072, 2004년 5월], 그리고 E. 쉬우이저스(Schuijers), J. 브리바르트(Breebaart), H. 푸른하겐(Purnhagen), J. 엔저가르드(Engdegard)의, "낮은 복잡성 파라미터 스테레오 코딩(Low Complexity Parametric Stereo Coding)" [AES 116차 컨벤션, 베를린, 예비원고 6073, 2004년 5월]에 기술되어 있다.
도 13에 대하여 위에 개략적으로 설명한 바와 같이, 파라미터 사이드 정보, 즉, 채널간 레벨 차이 (ICLD), 채널간 시간 차이 (ICTD) 또는 채널간 간섭 파라미터 (ICC)가 각 다섯 채널들에 대해 계산되고 송신될 수 있다. 이것은, 일반적으로, 5 채널 신호에 대해 5 세트의 채널간 레벨 차이들을 송신함을 의미한다. 채널간 시간 차이에 대해서도 위와 동일하다. 채널간 간섭 파라미터에 있어서, 예를 들어 두 세트의 이 파라미터들을 송신만 하는 것도 충분할 수 있다.
도 12와 관련하여 위에 약술한 바와 같이, 하나의 신호의 하나의 프레임 부분 또는 시간 부분에 대한 하나의 싱글 레벨 차이 파라미터, 시간 차이 파라미터 또는 간섭 파라미터가 없다. 대신에, 하나의 주파수-의존 파라미터화(frequency-dependent parametrization)가 얻어지도록 이 파라미터들이 여러 상이한 주파수 대역에 대해 결정된다. 예를 들어 32 주파수 채널들, 즉, BCC 분석 및 BCC 합성을 위한 32 주파수 대역들을 갖는 하나의 필터 뱅크를 사용하는 것이 선호되기 때문에, 파라미터들이 매우 많은 데이터를 차지할(occupy) 수 있다. -다른 다중-채널 송신과 비교하여-파라미터 표시(parametric representation)는 아주 낮은 데이터 레이 트를 가져오기는 하나, 두 개의 채널들(스테레오 신호)을 갖는 하나의 신호, 또는 하나의 다중-채널 서라운드 신호와 같은 둘보다 많은 채널들을 갖는 하나의 신호와 같은 하나의 다중-채널 신호를 표시하기 위해 필요한 데이터 레이트의 추가 감소가 계속적으로 필요하다.
이를 위해, 인코더-사이드 계산 복원 파라미터들(encoder-side calculated reconstruction parameters)이 하나의 특정 양자화 법칙에 따라 양자화된다. 이것은, 미양자화 복원 파라미터들이, 당업계에서 공지되고 C. 팔러(Faller) 및 F. 바움가르테(Baumgarte)의, "유연한 표현을 갖는 오디오 압축에 적용된 바이노럴 큐 코딩(Binaural cue coding applied to audio compression with flexible rendering)" [AES 113차 컨벤션, 로스 앤젤레스, 예비원고 5686, 2002년 10월]에 상세하게 설명된, 한정된 세트의 양자화 레벨들 또는 양자화 인덱스들(quantization indices)에 맵핑된다는(mapped) 것을 의미한다.
양자화는, 양자화 간격(quantization step size)보다 작은 모든 파라미터 값들이 0(zero)까지 양자화되는 효과를 가진다. 추가적으로, 큰 세트의 역 양자화 값들을 작은 세트의 양자화 값들에 맵핑함으로써 그 자체로 데이터 세이빙(saving)을 가져온다. 이 데이터 레이트 세이빙(data rate savings)은 인코더-사이드에 양자화 복원 파라미터들을 엔트로피-인코딩(entropy-encoding)함으로써 더욱 강화된다. 바람직한 엔트로피-인코딩 방법은, 미리 정해진 코드 테이블에 기초하거나 신호 통계의 실제 결정(actual determination of signal statistics)과 코드북(codebooks)의 신호-적응성 구축(signal-adaptive construction)에 기초하는 후프만 방법(Huffman methods)이다. 이와 달리, 산술 인코딩(arithmetic encoding)과 같은 다른 엔트로피-디코딩 툴이 사용될 수 있다.
일반적으로, 복원 파라미터들에 필요한 데이터 레이트는 양자화 간격(quantizer step size)가 증가함에 따라 감소된다. 달리 말하면, 거친 양자화(coarser quantization)는 낮은 데이터 레이트를 가져오고, 정밀한 양자화(finer quantization)는 높은 데이터 레이트를 가져온다.
파라미터 신호 표시들이 낮은 데이터 레이트 환경에 대해 일반적으로 요구되기 때문에, 베이스 채널에 일정량(a certain amount)의 데이터를 가지며, 또한 양자화되고 엔트로피 인코딩된 복원 파라미터들을 포함하는 사이드 정보에 대한 적당한 소량의 데이터를 가지는 하나의 신호 표시를 얻기 위해, 가능한 한 거친 복원 파라미터들을 양자화하도록 노력한다.
따라서, 선행 기술의 방법들은, 송신될 복원 파라미터들을 인코딩될 다중-채널 신호로부터 직접 유도한다(derive). 위에 논의한 거친 양자화는, 복원 파라미터 왜곡(distortions)을 가져오고, 그것은 다시, 양자화 복원 파라미터가 하나의 디코더에서 역 양자화되고 다중-채널 합성을 위해 사용될 때, 큰 라운딩 오차(large rounding errors)를 일으킨다. 물론, 이 라운딩 오차는 양자화 간격과 함께, 즉, 선택된 "양자화 거침성(quantizer coarseness)"과 함께 증가한다. 그러한 라운딩 오차들은 하나의 양자화 레벨 변화, 즉, 처음 순간의(at a first time instant) 제1 양자화 레벨에서 나중 순간의(at a later time instant) 제2 양자화 레벨로의 변화를 일으킬 수 있으며, 여기서, 하나의 양자화 레벨과 다른 양자화 레벨 사이의 차이는, 거친 양자화를 위해 바람직한 아주 큰 양자화 간격으로 정의된다. 공교롭게도, 양자화 하지 않은 파라미터가 두 개의 양자화 레벨 사이의 중간에 있을 때, 큰 양자화 간격에 달하는 그러한 양자화 레벨 변화는 작은 파라미터 변화에 의해서만 일어날(triggered) 수 있다. 사이드 정보내의 그러한 양자화 인덱스 변화의 발생은 신호 합성 단계에서 동일하게 큰 변화를 일으키는 것이 명백하다. 하나의 예로서 채널간 레벨 차이를 고려할 때, 하나의 특정 확성기 신호의 소리세기의 가파른 감소와 동시에 다른 확성기에 대한 신호의 소리세기의 가파른 증가(accompanying sharp increase)가 일어난다. 양자화 레벨 변화와 거친 양자화에 의해서만 일어나는 이러한 상황은, 하나의 가상 제1 공간(a virtual first place)에서 하나의 (가상) 제2 공간으로의 사운드 소스의 즉각적인 배치전환(relocation)으로 인식될(perceived) 수 있다. 특히, 음조 신호(tonal signals)의 사운드 소스들이 그들의 위치를 매우 빨리 바꾸지 않기 때문에, 한 순간에서 다른 순간으로의 사운드 소스의 그러한 즉각적인 배치전환은 자연스럽지 않게 들리고, 다시 말하면, 하나의 변조 효과(modulation effect)로 인식된다.
또한, 송신 에러가 양자화 인덱스의 가파른 변화를 가져올 수도 있는 것이 일반적인데, 그것은 즉각적으로 다중-채널 신호에서의 가파른 변화를 가져오며, 데이터 레이트 동기(data rate reasons)에 대한 거친 양자화가 채용되는 상황에 대해 더욱 그러하다.
발명의 요약
본 발명의 목적은 한편으로는 낮은 데이터 레이트를 그리고 다른 한편으로는 우수한 주관적 퀄리티(subjective quality)를 가능하게 하는 개량된 신호 합성 컨셉(signal synthesis concept )을 제공하는 것이다.
본 발명의 제1 양상(aspect)에 따라, 이 목적은, 적어도 하나의 입력 채널과, 그리고 하나의 양자화 법칙(quantization rule)에 따라 양자화되며 그 입력 채널의 후행 시간 부분(subsequent time portions)과 연관된 일련의 양자화 복원 파라미터들(quantized reconstruction parameters)을 가지는 하나의 입력 신호로부터, 1 보다 크거나 입력 채널들의 수보다 큰 수의 복수의 합성된 출력 채널들을 갖는 하나의 출력 신호를 발생시키는 것으로서; 처리될 입력 신호의 하나의 시간 부분에 대한 복원 파라미터로부터 유도된 하나의 후처리 복원 파라미터(post processed reconstruction parameter) 또는 하나의 후처리량(post processed quantity)을 결정(determine)하기 위한 것이며, 상기 후처리 복원 파라미터 또는 후처리량의 하나의 값이 양자화 법칙에 따른 재양자화를 사용하여 얻을 수 있는 하나의 값과 상이하도록 상기 후처리 복원 파라미터를 결정하도록(determine) 동작하는 하나의 후처리 장치와; 그리고 입력 채널의 시간 부분 그리고 후처리 복원 파라미터 또는 후처리량(post processed quantity)을 사용하여 복수의 합성된 출력 채널들의 하나의 시간 부분을 복원하기 위한 하나의 다중 채널 복원장치를 포함하여 구성되는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치에 의해 달성된다.
본 발명의 제2 양상에 따라, 이 목적은, 적어도 하나의 입력 채널과, 그리고 하나의 양자화 법칙(quantization rule)에 따라 양자화되며 그 입력 채널의 후행 시간 부분들과 연관된 일련의 양자화 복원 파라미터들(quantized reconstruction parameters)을 가지는 하나의 입력 신호로부터, 1 보다 크거나 입력 채널들의 수보다 큰 수의 복수의 합성된 출력 채널들을 갖는 하나의 출력 신호를 발생시키는 것으로서; 후처리 복원 파라미터 또는 후처리량의 하나의 값이 양자화 법칙에 따른 재양자화(requantization)를 사용하여 얻어질 수 있는 하나의 값과 상이하도록, 처리될 입력 신호의 하나의 시간 부분에 대한 복원 파라미터로부터 유도된 하나의 후처리 복원 파라미터 또는 하나의 후처리량을 결정하는(determine) 단계와; 그리고 입력 채널의 시간 부분 그리고 후처리 복원 파라미터 또는 후처리량을 사용하여 복수의 합성된 출력 채널의 하나의 시간 부분을 복원하는 단계를 포함하여 구성되는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성 방법에 의해 달성된다.
본 발명의 제3 양상에 따라, 이 목적은, 컴퓨터에서 가동될 때, 상기 방법을 실행하는 컴퓨터 프로그램에 의해 달성된다.
본 발명은, 다중-채널 합성장치에 사용되는 양자화 복원 파라미터들에 대한 후처리가, 한편으로는 거친 양자화, 그리고 다른 한편으로는 양자화 레벨 변화와 관련된 문제들을 감소시키거나 심지어 제거하도록 동작한다는 연구 발견 결과를 기초로 한다. 선행 기술의 시스템에서는, 합성장치에서의 재양자화가 제한된 세트의 양자화된 값에 대해서만 용인될 수(admissible) 있기 때문에, 인코더에서의 작은 파라미터 변화가 디코더에서 강력한 파라미터 변화를 일으키는데 대해, 본 발명의 장치는, 입력 신호의 처리될 시간 부분에 대한 후처리 복원 파라미터가 인코더-이용 양자화 래스터(encoder-adopted quantization raster)에 의해 결정되지 않으나, 양자화 법칙에 따른 양자화에 의해 얻어질 수 있는 값과 다른, 복원 파라미터의 값을 가져오도록, 복원 파라미터들의 후처리를 수행한다.
선형 양자화의 경우에, 선행 기술의 방법은 양자화 간격의 정수배(integer multiple)인 역 양자화 값들을 허용하는 반면, 본 발명의 후처리는 역 양자화 값들이 양자화 간격의 비-정수배가 되도록 허용한다. 이것은, 두 개의 인접한 양자화 레벨들 사이에 있는 후처리 복원 파라미터들이 후처리에 의해 얻어질 수 있고, 그리고 후처리된 복원 파라미터를 사용하는 본 발명의 다중-채널 복원장치(reconstructor)에 의해 사용될 수 있기 때문에, 본 발명의 후처리가 양자화 간격 제한을 제거한다는 것을 의미한다.
이 후처리는 다중-채널 합성장치에서 재양자화의 전 또는 후에 수행될 수 있다. 후처리가 양자화된 파라미터들, 즉, 양자화 인덱스들로 수행될 때, 양자화 스텝 배수(quantizer step multiples)를 역 양자화할 뿐만 아니라, 양자화 간격의 배수들 사이의 역 양자화 값들로 역 양자화도 할 수 있는 역 양자화기가 필요하다.
후처리가 역 양자화된 복원 파라미터들을 사용하여 수행되는 경우에, 스트레이트-포워드 역 양자화기(a straight-forward inverse quantizer)가 사용될 수 있고, 역 양자화 값들로 보간/필터링/평활화(interpolation/filtering/smoothing)가 수행된다.
로그 양자화 법칙(logarithmic quantization rule)과 같은, 비-선형 양자화 법칙의 경우에, 재양자화 이전의 양자화 복원 파라미터들의 후처리가 선호되는데, 그 이유는, 로그 양자화가 사운드에 대한 인간 귀의 지각(the human ear's perception of sound)과 유사하기 때문이며, 그것은 낮은-레벨 사운드에 대해 더 정밀하고 높은-레벨 사운드에 대해 덜 정밀하며, 다시 말해서, 일종의 로그 압축(logarithmic compression)을 만들기 때문이다.
양자화된 파라미터로서 비트 스트림에 포함되는 복원 파라미터 자체를 변경시킴으로써만 본 발명의 장점(merits)이 얻어지지 않는다는 것을 알아야 한다. 복원 파라미터로부터 후처리량을 유도함으로써 이러한 장점을 또한 획득할 수 있다. 이것은, 복원 파라미터가 차이 파라미터이고, 스무딩(smoothing)과 같은 조작(manipulation)이 차이 파라미터로부터 유도되는 하나의 절대 파라미터(absolute parameter)에 수행될 때 특히 유용하다.
본 발명의 바람직한 실시예에서, 복원 파라미터들에 대한 후처리는, 어느 신호 특성이 존재하는지를 알아내기 위해 복원 파라미터와 연관된 신호 부분(signal portion)을 분석하는 하나의 신호 분석장치에 의해 제어된다. 바람직한 실시예에서, 본 발명의 후처리는, 입력 신호의 비-음조 부분, 즉, 경과적 부분들(transient portions)에 대해 불활성화되는 반면, (주파수 및/또는 시간에 관하여) 신호의 음조 부분들(tonal portions)에 대해서만 활성화된다. 이것은, 복원 파라미터 변화의 전체 동태(full dynamic)가 오디오 신호의 경과적 섹션들(transient sections)에 대해 송신되도록 확실히 하는 반면, 신호의 음조 부분에 대해서는 그러하지 아니하다.
후처리는, 복원 파라미터들의 스무딩의 형태의 변형(modification)을 수행하는 것이 바람직한데, 이는 비-음조 부분, 즉, 경과적 신호 부분들에 대해 특히 중요한, 중요 공간 검출 큐(important spatial detection cues)에 영향을 주지 않아 음향심리학적 관점(psycho-acoustic point of view)에서 의미가 있다.
본 발명은, 복원 파라미터들의 인코더-사이드 양자화가 거친 양자화일 수 있기 때문에, 데이터 레이트가 낮으며, 그에 따라 시스템 설계자는, 하나의 역 양자화 레벨로부터 다른 역 양자화 레벨로의 하나의 복원 파라미터 변화로 인한 디코더에서의 큰 변화(heavy changes)를 염려할 필요가 없는데, 이러한 변화는 두 재양자화 레벨들 사이의 값에 맵핑하는 본 발명의 처리에 의해 감소된다.
본 발명의 다른 장점은, 하나의 재양자화 레벨로부터 다음의 허용된 재양자화 레벨(next allowed requantization level)로의 변화에 기인한 가청 아티팩트들(audible artefacts)이, 두 개의 허용된 재양자화 레벨들 사이의 하나의 값에 맵핑하도록 동작하는 본 발명의 후처리에 의해 감소되기 때문에, 시스템의 품질이 개선된다는 점이다.
본 발명의 양자화된 복원 파라미터들의 후처리가, 인코더에서의 파라미터화 그리고 복원 파라미터의 뒤이은 양자화에 의해 얻어진 정보 손실에 더하여, 추가 정보 손실을 나타내는 것은 당연하다. 그러나, 이것은, 본 발명의 후처리 장치가, 입력 신호, 즉, 베이스 채널의 현재 시간 부분(actual time portion)의 복원을 위해 사용될 후처리 복원 파라미터들을 결정하기 위해 현재 또는 앞서 양자화된 복원 파라미터들을 사용하는 것이 바람직하기 때문에, 실제로는 나쁘지 않다. 이것은, 인코더-유도 에러(encoder-induced errors)가 상당한 정도로 보상될 수 있기 때문에, 개선된 주관적 품질(improved subjective quality)을 가져오는 것으로 나타났다. 심지어 인코더-사이드 유도 에러가 복원 파라미터들의 후처리에 의해 보상되지 않을 때에도, 복원된 다중-채널 오디오 신호의 공간적 인식(spatial perception)의 큰 변화가 감소되는데, 바람직하게는 음조 신호 부분에 대해서만 그러하며, 추가 정보 손실을 일으키는지 아닌지의 사실과 상관없이, 여하한 경우에도, 주관적 청취 품질(subjective listening quality)이 개선된다.
본 발명의 바람직한 실시예들을 첨부된 도면들을 참조하여 다음에 설명하기로 하는 바, 도면들 중:
도 1은, 본 발명의 다중-채널 합성장치의 바람직한 실시예의 블록도이고;
도 2는, 도 1의 다중-채널 합성장치가 포함된 하나의 인코더/디코더 시스템의 바람직한 실시예의 블록도이며;
도 3은, 도 1의 본 발명의 다중-채널 합성장치에 사용될 후처리 장치/신호 분석장치 조합장치(post processor/signal analyser combination)의 블록도이고;
도 4는, 입력 신호의 시간 부분들과, 그리고 과거 신호 부분들(past signal portions), 처리될 현재 신호 부분들(actual signal portions) 및 미래 신호 부분들(future signal portions)에 대한 연관 양자화 복원 파라미터들의 개략적인 표시이며;
도 5는, 도 1의 후처리 장치의 하나의 실시예이고;
도 6a는, 도 1의 후처리 장치의 다른 실시예이며;
도 6b는, 후처리 장치의 다른 바람직한 실시예이고;
도 7a는, 도 1에 나타낸 후처리 장치의 다른 실시예이며;
도 7b는, 복원 파라미터로부터 유도된 하나의 양(quantity)도 또한 평활화될(smoothed) 수 있음을 보여주는, 본 발명에 따라 후처리될 파라미터들을 개략적으로 나타낸 도면이고;
도 8은, 스트레이트포워드(straightforward) 맵핑 또는 강화된 맵핑을 수행하는 양자화/역 양자화의 개략적인 표시도이며;
도 9a는, 후행 입력 신호 부분과 연관된 양자화 복원 파라미터들의 하나의 예시적인 경시적 과정에 따른 그래프(exemplary time course)이고;
도 9b는, 평활 (로우-패스) 기능[smoothing (low-pass) function)]을 실행하는 후처리 장치에 의해 후-처리되는 후 처리 복원 파라미터들의 경시적 과정에 따른 그래프이며;
도 10은, 선행 기술의 조인트 스테레오 인코더를 나타낸 도면이고;
도 11은, 선행 기술의 BCC 인코더/디코더 체인의 블록도이며;
도 12는, 도 11의 BCC 합성 블록의 선행 기술의 실행의 블록도이고; 그리고
도 13은, ICLD, ICTD 및 ICC 파라미터들을 결정하기 위한 잘 알려진 체계의 표시이다.
도 1은, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 본 발 명의 다중-채널 합성장치의 블록도를 나타낸다. 도 4와 관련하여 다음에 나타내는 바와 같이, 입력 신호는 적어도 하나의 입력 채널과, 하나의 양자화 법칙에 따라 양자화된 일련의 양자화 복원 파라미터들을 가진다. 일련의 시간 부분들이 일련의 양자화된 복원 파라미터들과 연관되도록 각 복원 파라미터가 입력 채널의 하나의 시간 부분과 연관된다. 더욱이, 도 1의 다중-채널 합성장치에 의해 발생되는 출력 신호가, 여하한 경우에도 입력 신호의 입력 채널들의 수보다 더 큰, 복수의 합성된 출력 채널들을 가질 수 있다. 입력 채널들의 수가 1일 때, 다시 말하면, 하나의 싱글 입력 채널이 있을 때, 출력 채널들의 수는 2 또는 그보다 많게 된다. 그러나, 입력 채널들의 수가 2 또는 3일 때, 출력 채널들의 수는 적어도 3 또는 적어도 4일 것이다.
상술한 BCC의 경우에, 입력 채널들의 수는 1 또는 일반적으로 2보다 많지 않을 것인 반면, 출력 채널들의 수는 5 (좌측 서라운드, 좌측, 중심, 우측, 우측 서라운드 채널들) 또는 6 [5 서라운드 채널 더하기 1 서브-우퍼 채널(sub-woofer channel)]이거나, 7.1 또는 9.1 다중-채널 포맷의 경우에 더 많을 것이다.
도 1에 나타낸 바와 같이, 본 발명의 다중-채널 합성장치는, 본질적인 특성으로서, 하나의 복원 파라미터 후처리 장치(10)와 하나의 다중-채널 복원장치(reconstructor)(12)를 포함한다. 복원 파라미터 후처리 장치(10)는, 입력 채널의 후행 시간 부분에 대한(for subsequent time portions of the input channel) 양자화되고, 바람직하게는 인코딩된 복원 파라미터들을 수신하도록 동작한다. 복원 파라미터 후처리 장치(10)는, 입력 신호의 처리될 시간 부분을 위해 그 하나의 출 력부에서 하나의 후처리된 복원 파라미터를 결정하도록(determine) 동작한다. 복원 파라미터 후처리 장치는, 특정한 바람직한 실시예들에서 하나의 로우 패스 필터링 법칙(low pass filtering rule), 하나의 평활화 법칙(smoothing rule) 또는 그 동등물인, 하나의 후처리 법칙에 따라 동작한다. 특히, 후처리된 복원 파라미터의 하나의 값이 양자화 법칙에 따라 여하한 양자화된 복원 파라미터의 재양자화에 의해 얻을 수 있는 하나의 값과 상이하게, 후처리된 복원 파라미터를 결정하도록, 후처리 장치(10)가 동작한다.
다중-채널 복원장치(12)는, 입력 채널의 처리될 시간 부분과 후처리된 복원 파라미터를 사용하여 복수의 합성 출력 채널들 각각의 시간 부분을 복원하기 위해 사용된다.
본 발명의 바람직한 실시예에서, 양자화된 복원 파라미터들은, 채널간 레벨 차이, 채널간 시간 차이, 또는 채널간 간섭 파라미터들(interchannel coherence parameters)과 같은 양자화된 BCC 파라미터들이다. 인텐시티 스테레오 또는 파라미터 스테레오에 대한 스테레오 파라미터들과 같은 다른 모든 복원 파라미터들이 본 발명에 따라 마찬가지로 처리될 수도 있음은 당연하다.
요약하면, 본 발명의 시스템은, 입력 신호의 후행 시간 부분들과 연관된 양자화되고 바람직하게는 인코딩된 복원 파라미터들에 대한 제1 입력부(14a)를 가진다. 입력 신호의 후행 시간 부분들은, 다중-채널 복원장치(12)에 연결되고 바람직하게는 아래에 설명하는 하나의 입력 신호 분석장치(16)에 연결된, 제2 입력부(14b)에 입력된다. 출력부 사이드(on the output side)에서, 도 1의 본 발명의 다중-채널 합성장치는, 여러 출력 채널들을 포함하고, 그 수가 입력 채널들의 수보다 큰, 하나의 다중-채널 출력 신호 출력부(18)를 가지며, 여기서 입력 채널들의 수는 하나의 싱글 입력 채널 또는 둘 또는 그보다 많은 입력 채널들일 수 있다. 여하한 경우에도, 입력 채널들보다 많은 출력 채널들이 있는데, 그 이유는 합성된 출력 채널들이 한편으로는 입력 채널을 사용함으로써 그리고 다른 한편으로는 복원 파라미터들의 형태의 사이드 정보를 사용함으로써 형성되기 때문이다.
아래에서, 하나의 비트 스트림에 대한 하나의 예를 나타내는, 도 4를 참조하기로 한다. 이 비트 스트림은 여러 프레임들(20a, 20b, 20c, ...)을 포함한다. 각 프레임은, 도 4의 하나의 프레임의 상부 직사각형으로 표시된 입력 신호의 하나의 시간 부분을 포함한다. 추가적으로, 각 프레임은, 시간 부분과 연관되고, 각 프레임(20a, 20b, 20c)의 하부 직사각형에 의해 도 4에 도시된, 한 세트의 양자화된 복원 파라미터들을 포함한다. 예시적으로 프레임(20b)은 처리될 입력 신호 부분으로 고려되며, 이 프레임은 선행(preceding) 입력 신호 부분들을 가지는데, 다시 말해서, 처리될 입력 신호 부분의 "과거(past)"를 형성한다. 더욱이, 처리될 입력 신호 부분의 "미래(future)"를 형성하며, 뒤따르는(following) 입력 신호 부분들이 있는데 대해[처리될 입력 부분은 또한 "현재(actual)" 입력 신호 부분으로 불리움], "과거"의 입력 신호 부분들은 종전 입력 신호 부분들(former input signal portions)로 불리우며, 미래의 신호 부분들은 차후(later) 입력 신호 부분들로 불리운다.
아래에서, 본 발명의 다중-채널 합성장치가 설치될 수 있는, 완성된 인코더/ 디코더 장치와 관련하여 도 2를 참조하여 설명하기로 한다.
도 2는, 하나의 인코더부(21)와 하나의 디코더부(22)를 나타낸다. 인코더에서, N 개의 오리지널 입력 채널들이 하나의 다운 믹서 단계(down mixer stage)(23)에 입력된다. 이 다운 믹서 단계는, 채널들의 수를, 예를 들어, 하나의 싱글 모노-채널, 또는 어쩌면, 두 개의 스테레오 채널들로 감소시키도록 동작한다. 그 다음에, 다운 믹서(23)의 출력부에서 다운 믹스된 신호 표시(down mixed signal representation)가, 예를 들어 하나의 출력 비트 스트림을 만들어내는 AAC 인코더 또는 하나의 mp3 디코더로서 실행되는, 하나의 소스 인코더(source encoder)(24)에 입력된다. 인코더부(21)는, 본 발명에 따라 BCC 분석[도 11의 블록(116)]을 수행하고, 그리고 양자화되고 바람직하게는 후프만-인코딩된 채널간 레벨 차이들(ICLD)을 출력하는, 하나의 파라미터 추출장치(extractor)(25)를 더 포함하여 구성된다. 이 파라미터 추출장치(25)에 의해 출력된 양자화된 복원 파라미터들 뿐만 아니라 소스 인코더(24)의 출력부의 비트 스트림은, 하나의 디코더(22)로 송신될 수 있거나 하나의 디코더 등으로의 차후 송신(later transmission)을 위해 저장될 수 있다.
디코더(22)는, [소스 인코더(source decoder)(24)로부터 발생되어] 수신된 비트 스트림으로부터 하나의 신호를 복원하도록 동작하는 하나의 소스 디코더(26)를 포함한다. 이를 위해, 소스 디코더(26)는, 그 출력부에서 입력 신호의 후행 시간 부분들을 하나의 업-믹서(up-mixer)(12)로 공급하며, 이 업-믹서는 도 1의 다중-채널 복원장치(12)와 동일한 기능을 수행한다. 이 기능은 도 11의 블록(122)에 의해 실행되는 BCC 합성인 것이 바람직하다.
도 11과 반대로, 본 발명의 다중-채널 합성장치는, "채널간 레벨 차이(interchannel level difference; ICLD) 스무더(smoother)"로 불리우고, 입력 신호 분석 장치(16)에 의해 제어되는 후처리 장치(10)를 더 포함하여 구성되며, 이 입력 신호 분석 장치는 입력 신호의 음조 분석(tonality analysis)을 수행하는 것이 바람직하다.
도 2에서 알 수 있듯이, ICLD 스무더에 입력되는 채널간 레벨 차이들과 같은 복원 파라미터들이 있는데 대해, 파라미터 추출장치(25)와 업-믹서(12) 사이에 추가적인 연결(connection)이 이루어져 있다. 이 바이-패스 연결을 통해, 후처리될 필요가 없는 다른 복원용 파라미터들이, 파라미터 추출장치(25)로부터 업-믹서(12)로 공급될 수 있다.
도 3은, 신호 분석장치(16)와 ICLD 스무더(10)에 의해 이루어진 신호-적응성(signal-adaptive) 복원 파라미터 처리의 바람직한 실시예를 나타낸다.
신호 분석장치(16)는 하나의 음조 결정 유닛(tonality determination unit)(16a)과 하나의 후행 임계치 설정 장치(a subsequent thresholding device)(16b)로 형성된다. 추가적으로, 도 2의 복원 파라미터 후처리 장치(10)는 하나의 스무딩 필터(smoothing filter)(10a)와 하나의 후처리 장치 스위치(10b)를 포함한다. 후처리 장치 스위치(10b)는, 음조 특성과 같은 입력 신호의 특정 신호 특성이 어떤 특정 임계치(a certain specified threshold)와 미리 정해진 관계가 있는 것으로 임계치 설정 장치(16b)가 결정할 때, 동작하도록, 임계치 설정 장치(16b)에 의해 제어된다. 이 경우에, 그 상황은, 입력 신호의 하나의 신호 부분의 음조(tonality) 그리고, 특히, 입력 신호의 하나의 특정 시간 부분(a certain time portion)의 하나의 특정 주파수 대역이 하나의 음조 임계치(tonality threshold) 보다 높은 음조를 가질 때, 위의 스위치가 (도 3에 나타낸) 상부 위치에 있도록 동작되는 것이다. 이 경우에, 후처리된, 그러나 아직 역 양자화되지 않은 채널간 차이들이 디코더/다중-채널 복원장치/업-믹서(12)로 공급되도록, 위 스위치(10b)가 스무딩 필터(10)의 출력부를 다중-채널 복원장치(12)의 입력부에 연결시키도록 동작된다.
그러나, 입력 신호의 하나의 현재 시간 부분의 하나의 특정 주파수 대역이, 즉, 처리될 하나의 입력 신호 부분의 하나의 특정 주파수 대역이 특정된 임계치(the specified threshold)보다 낮은 음조를 가지는 것으로, 즉, 경과적인(transient) 것으로, 음조 결정 수단이 결정할 때, 위의 스위치는 스무딩 필터(10a)가 바이-패스되도록 동작된다.
후자의 경우에, 스무딩 필터(10a)에 의한 신호-적응성 후처리는, 경과적 신호들에 대한 복원 파라미터 변화들이 변형되지 않은 상태로(unmodified) 후처리 단계를 통과하여, 경과적 신호들에 대한 도가 높은 가능성을 갖는(with a high degree of probability for transient signals) 실제 상황에 상응하는, 공간 이미지(the spatial image)에 대하여 복원된 출력 신호에서의 빠른 변화를 가져오는 것을 보장한다.
도 3의 실시예, 즉, 한편으로는 후처리를 시동하고(activate), 다른 한편으로는 후처리를 완전히 불활동화시키는(deactivate) 것, 즉, 후처리를 할 것인가 아 닌가에 대한 하나의 이분식 결정(a binary decision)이 그 단순하고 효율적인 구조 때문에 하나의 바람직한 실시예일 뿐이라는 것을 알아야 한다. 그럼에도 불구하고, 특히 음조에 관해, 이 신호 특성은, 질적인 파라미터일 뿐만 아니라 일반적으로 0과 1의 사이일 수 있는 양적인 파라미터임을 알아야 한다. 크게 음조적인 신호들에 대해(for heavily tonal signals), 하나의 큰 스무딩(heavy smoothing)이 활성화되는 반면, 과히 음조적이지 않은 신호들에 대해 낮은 스무딩 정도(smoothing degree)를 갖는 스무딩이 시작되도록(initiated), 양적으로 결정된 파라미터에 따라(in accordance with the quantitatively determined parameter), 스무딩 필터의 스무딩 정도 또는, 예를 들어, 하나의 로우 패스 필터(low pass filter)의 컷-오프 주파수(cut-off frequency)가 설정될 수 있다.
크게 경과적인 신호들에 있어서(for heavily transient signals), 복원 파라미터들의 후처리가 다중-채널 신호의 공간 이미지의 훨씬 더 과도한 변화(an even more exaggerated change of the spatial image)를 일으키도록, 경과적인 부분들을 또한 검출할 수 있고, 미리 정해진(predefined) 양자화된 값들 또는 양자화 인덱스들 사이의 값들로 파라미터들에서의 변화를 확대할 수도 있음은 당연하다. 이 경우에, 후행 시간 부분들에 대한 후행 복원 파라미터들에 의해 지시된 바와 같은 양자화 간격 1은, 복원된 다중-채널 신호의 훨씬 더 극적으로 변화하는 공간 이미지를 초래하는, 예를 들어 1.5, 1.4, 1.3 등으로 강화될(enhanced) 수 있다.
하나의 음조 신호 특성, 하나의 경과적 신호 특성 또는 기타 신호 특성들은, 그에 따라 하나의 신호 분석이 하나의 복원 파라미터 후처리 장치를 제어하도록 수 행될 수 있는, 신호 특성들에 대한 예들(examples)일 뿐임을 알아야 한다. 이러한 제어에 대응하여, 복원 파라미터 후처리 장치는, 하나의 미리 결정된 양자화 법칙에 의해 결정되는 바와 같이, 한편으로 양자화 인덱스에 대한 여하한 값들과 또는 다른 한편으로는 재양자화 값들과 상이한 하나의 값을 갖는 하나의 후처리된 복원 파라미터를 결정한다.
본 발명에 있어서, 하나의 신호 특성에 의해, 좌우되는 복원 파라미터들의 후처리, 즉, 신호-적응성 파라미터 후처리가 단지 선택적일 뿐임을 알아야 한다. 신호-무관 후처리(signal-independent post processing)도 또한 여러 신호들에 대해 장점들을 제공한다. 특정 후처리 기능은, 예를 들어, 사용자에 선택될 수 있으며, 그에 따라 [과대화 기능(exaggeration function)의 경우에] 강화된 변화들을 또는 [스무딩 기능(smoothing function)의 경우에] 감쇠된 변화들을 얻는다. 이와 달리, 여하한 사용자의 선택 그리고 신호 특성들과 무관한 후처리는 또한 에러 복원성(error resilience)에 대해 특정한 장점들을 제공할 수 있다. 특히, 큰 양자화 간격의 경우에, 하나의 양자화 인덱스의 하나의 전송 에러(transmission error)가 큰 가청 아티팩트들(heavily audible artefacts)을 초래할 수 있음이 명백해진다. 이를 위해, 신호가 에러-유발 채널들(error-prone channels)로 송신되어야만 할 때, 하나의 순방향 에러 정정(forward error correction) 또는 그와 유사한 것을 실행할 것이다. 본 발명에 따르면, 과거의 복원 파라미터들에 기초한 복원 파라미터들의 후처리가 잘못 전송된 양자화 복원 파라미터들의 검출을 가져올 것이며, 그러한 에러들에 대한 적절한 대책(counter measures)을 가져올 것이기 때문에, 후처 리는 여하한 비트-비효율 에러 정정 코드들(bit-inefficient error correction codes)의 필요성을 미연에 방지할 수 있다. 게다가, 후처리 기능이 스무딩 기능(smoothing function)일 때, 종전 또는 차후의 복원 파라미터들과 아주 상이한 양자화 복원 파라미터들은 다음에 개략적으로 설명하는 바와 같이 자동적으로 조작될(manipulated) 것이다.
도 5는, 도 1의 복원 파라미터 후처리 장치(10)의 하나의 바람직한 실시예를 나타낸다. 특히, 양자화 복원 파라미터들이 인코딩되는 상황이 고려된 것이다. 여기서, 인코딩된 양자화 복원 파라미터들은, 위의 일련의 디코딩된 양자화 복원 파라미터들을 출력하는, 하나의 엔트로피 인코더(10c)로 들어간다. 엔트로피 디코더의 출력부의 복원 파라미터들은 양자화되며, 이것은 그들이 어떤 "유용한(useful)" 값을 가지지 않는다는 것을 의미하나, 그들이 하나의 후행 역 양자화에 의해 실행된 하나의 특정 양자화 법칙의 특정 양자화 인덱스들 또는 양자화 레벨들을 표시한다는 것을 의미한다. 매니풀레이터(manipulator)(10d)는, 필요한 후처리 기능에 의해 결정된 어떤 필터 특성을 갖는, 예를 들어, FIR 필터 또는 (바람직하게는) IIR 필터와 같은 디지털 필터일 수 있다. 스무딩 기능 또는 로우 패스 필터링 후처리 기능(a smoothing or low pass filtering post-processing function)이 바람직하다. 매니풀레이터(10d)의 출력부에서 일련의 조작된(manipulated) 양자화 복원 파라미터들이 얻어지는데, 이들은 정수일 뿐만 아니라 양자화 법칙에 의해 결정된 범위내에 있는 어떤 실수(any real numbers)이다. 그러한 조작된 양자화 복원 파라미터는 단계(10d) 이전의 값들 1, 0, 1 과 비교하여, 1.1, 0.1, 0.5, ... 의 값들을 가질 수 있을 것이다. 블록(10d)의 출력부의 일련의 값들은 그 다음에, 도 1의 블록(12)의 다중-채널 복원(예를 들어, BCC 합성)에 대해 사용될 수 있는, 후처리 복원 파라미터들을 얻기 위해, 하나의 강화된 역 양자화기(an enhanced inverse quantizer)(10e)에 입력된다.
일반적인 역 양자화기가 각 양자화 입력을 하나의 제한된 수의 양자화 인덱스들로부터 하나의 특정된 역 양자화 출력 값으로 맵핑하기만 하기 때문에, 강화된 양자화기(10e)는 일반적인 역 양자화기와 상이함을 알아야 한다. 일반적인 역 양자화기들은 비-정수 양자화 인덱스들을 맵핑할 수 없다. 그러므로, 강화된 역 양자화기(10e)는, 바람직하게는 선형 또는 로그 양자화 법칙과 같은 양자화 법칙을 사용하도록 실행되나, 정수 입력들만을 사용함으로써 얻을 수 있는 값들과 상이한 출력 값들을 제공하기 위해 비-정수 입력들을 받아들일 수 있다.
이 조작이 재양자화 이전에(도 5 참조) 또는 재양자화 이후에(도 6a, 도 6b 참조) 실행되는지의 여부는 본 발명에 있어서 근본적으로 차이가 없다. 후자의 경우에, 역 양자화기는, 위에 개략적으로 설명된 바와 같이, 도 5의 강화된 역 양자화기(10e)와 상이한, 일반적인 스트레이트포워드 역 양자화기가 되어야만 한다. 도 5와 도 6a 사이의 선택이 특정한 실행에 좌우되는 선택의 문제일 것임은 당연하다. 현재의 BCC 실행에 있어서, 도 5의 실시예가 바람직한 바, 그 이유는 기존의 BCC 알고리즘(algorithms)과 더 호환성이 있기 때문이다. 그럼에도 불구하고, 다른 어플리케이션(applications)에 있어서는 다를 수도 있다.
도 6b는, 도 6a의 강화된 역 양자화기(10e)가, 하나의 선형 또는 바람직하게 는 비-선형 곡선에 따라 맵핑하기 위한 하나의 맵퍼(mapper)(10g)와 하나의 스트레이트포워드 역 양자화기로 대체되는 하나의 실시예를 나타낸다. 이 맵퍼는 하나의 수학적 연산(mathematical operation)을 실행하기 위한 하나의 회로 또는 하나의 룩 업 테이블(a look up table)과 같은 하드웨어에서 또는 소프트웨어에서 실행될 수 있다. 예를 들어 스무더(smoother)(10g)를 사용하는 데이터 조작(data manipulation)은 맵퍼(10g) 앞에서 또는 맵퍼(10g) 다음에 또는 두 장소 모두에서(at both places in combination) 실행될 수 있다. 이 실시예는, 후처리가 역 양자화 도메인(inverse quantizer domain)에서 실행될 때 바람직한데, 그 이유는, 모든 요소들(10f, 10h, 10g)이 소프트웨어 루틴들(software routines)의 서킷들(circuits)과 같은 스트레이트포워드 구성요소들(straightforward components)을 사용하여 실행될 수 있기 때문이다.
일반적으로, 후처리 장치(10)는, 현재 양자화된 복원 파라미터들, 미래 복원 파라미터들 또는 과거 양자화된 복원 파라미터들의 모두 또는 그 선택된 하나를 수신하는, 도 7a에 나타나 있는 후처리 장치로서 구현된다(implemented). 이 후처리 장치가 적어도 하나의 과거 복원 파라미터 그리고 현재 복원 파라미터를 수신하기만 하는 경우에, 후처리 장치는 하나의 로우 패스 필터(low pass filter)의 역할을 할 것이다. 그러나, 후처리 장치가 실-시간 어플리케이션에서(in real-time applications) 가능하지 않으나 다른 모든 어플리케이션들에서 가능한, 하나의 미래 양자화 복원 파라미터를 수신할 때, 이 후처리 장치는, 예를 들어 하나의 특정한 주파수 대역을 위해, 복원 파라미터의 하나의 경시적 과정(time-course)을 예를 들어 스무딩 하기 위해, 미래와 현재 또는 미래와 과거의 사이의 양자화 복원 파라미터 사이의 보간(interpolation)을 수행할 수 있다.
위에 개략적으로 설명한 바와 같이, 거친 양자화 환경에서의 양자화 간격들로 인한 아티팩트들을 극복하기 위한 데이터 조작이, 파라미터적으로 인코딩된 다중 채널 신호(parametrically encoded multi channel signal)의 베이스 채널에 부착된 복원 파라미터로부터 유도된 하나의 양(a quantity)에 대해 또한 수행될 수 있다. 예를 들어 양자화 복원 파라미터가 하나의 차이 파라미터(ICLD)일 때, 이 파라미터는 여하한 변형(modification) 없이 역 양자화될 수 있다. 그 다음에 하나의 출력 채널에 대한 하나의 절대 레벨 값이 유도될 수 있고, 본 발명의 데이터 조작이 절대 값에 대해 수행된다. 이 과정은, 후처리 복원 파라미터 또는 후처리량의 하나의 값이 양자화 법칙에 따라, 즉, "간격 제한(step size limitation)"을 극복하기 위한 조작없이, 재양자화를 사용하여 얻을 수 있는 하나의 값과 상이하도록, 양자화 복원 파라미터와 실제 복원물(actual reconstruction) 사이의 처리 경로에서의 하나의 데이터 조작이 수행되는 한, 본 발명의 아티팩트 감소를 얻을 수 있다.
양자화 복원 파라미터로부터 결과적으로 조작된 양(the eventually manipulated quantity)은 얻기 위한 여러 맵핑 기능들을 당업계에서 안출할 수 있고, 사용되는데, 여기서, 이 맵핑 기능들은, 비-후처리 양을 얻기 위해(to obtain a non post processed quantity) 하나의 맵핑 법칙에 따라 하나의 입력 값을 하나의 출력 값에 단일(singly) 맵핑하기 위한 기능들을 포함하는데, 이 비-후처리 양은 그 다음에 다중 채널 복원 (합성) 알고리즘에 사용된 후처리 양을 얻기 위해 후처리된다.
아래에서, 도 5의 하나의 강화된 역 양자화기(10e)와 도 6a의 하나의 스트레이트포워드 역 양자화기(10f) 사이의 차이들을 도시한 도 8을 참조하여 설명하기로 한다. 이를 위해, 도 8은 비-양자화 값들에 대한 출력값 축(an input value axis)을, 하나의 수평 축으로서, 나타낸다. 수직 축은, 바람직하게는 0, 1, 2, 3의 하나의 값을 갖는 정수인, 양자화 레벨들 또는 양자화 인덱스들을 나타낸다. 도 8의 양자화는 0과 1 또는 1과 2 사이의 여하한 값들을 얻을 수 없을 것임을 알아야 한다. 이 양자화 레벨들에 대한 맵핑은, 예를 들어 -10과 10 사이의 값들이 0으로 맵핑되는 반면 10과 20 사이의 값들은 1 로 양자화되도록 하는 등으로 계단-형 함수(stair-shaped function)에 의해 제어된다.
하나의 가능한 역 양자화 기능은, 하나의 양자화 레벨을 0의 역 양자화 값으로 맵핑하는 것이다. 양자화 레벨 1 은 역 양자화 값 10 으로 맵핑될 수도 있다. 유사하게, 양자화 레벨 2 는 예를 들어 역 양자화 값 20 으로 맵핑될 수 있다. 그러므로, 재양자화는, 도면부호 "31"로 표시된 하나의 역 양자화 함수에 의해 제어된다. 하나의 스트레이트포워드 역 양자화를 위해서, 라인(30)과 라인(31)의 교차점들(crossing points)만이 가능함을 알아야 한다. 이것은, 도 8의 하나의 역 양자화 법칙을 갖는 하나의 스트레이트포워드 역 양자화를 위해, 0, 10, 20, 30의 값들만이 재양자화에 의해 얻어질 수 있음을 의미한다.
강화된 역 양자화기가, 값 0.5와 같은 0과 1 또는 1과 2 사이의 값들을, 하 나의 입력으로서, 받기 때문에, 이것은 강화된 역 양자화기(10e)에서는 다르다. 매니풀레이터(10d)에 의해 얻어진 값 0.5의 선행 재양자화(advanced requantization)는 하나의 역 양자화 출력 값 5, 즉, 양자화 법칙에 따른 재양자화에 의해 얻을 수 있는 값과 다른 값을 가지는 후처리 복원 파라미터를 가져올 것이다(will result in a post processed reconstruction parameter). 일반적인 양자화 법칙이 0 또는 10의 값들을 허용하기만 하는 반면, 역 양자화 함수(31)에 따라 동작하는 본 발명의 역 양자화기는 하나의 상이한 값, 즉, 도 8에 도시된 바와 같은 5의 값을 가져온다.
스트레이트포워드 역 양자화기(straight-forward inverse quantizer)가 정수 양자화 레벨들을 양자화 레벨들로만 맵핑하는 반면, 강화된 역 양자화기는 역 양자화 법칙에 의해 결정된 값들 사이의 "역 양자화 값들"로 맵핑하기 위해 비-정수 양자화 "레벨들"을 수신한다.
도 9는, 도 5의 실시예에 대한 본 발명의 후처리 장치의 효과(impact)를 나타낸다. 도 9a는 0과 3 사이에 걸친 일련의 양자화 복원 파라미터들을 나타낸다. 도 9b는, 도 9a의 파형(wave form)이 하나의 로우 패스 (스무딩) 필터로 입력될 때, "변형된 양자화 인덱스들"로 또한 불리우는, 일련의 후처리 복원 파라미터들을 나타낸다. 본 발명에서, 시각(1, 4, 6, 8, 9, 및 10)에서의 증가/감소가 도 9b의 실시예에서 감소됨을 알아야 한다. 강조하거니와, 하나의 아티픽트일 수 있는, 시각(8)와 시각(9) 사이의 피크가 하나의 전체 양자화 단계에 의해 감쇠된다(damped)는 것을 알아야 한다. 그러나, 그러한 극값들(extreme values)의 감쇠는, 위에 개 략적으로 설명한 바와 같이, 하나의 양적 음조값(a quantitative tonality value)에 따른 후처리 정도에 의해(by a degree of post processing) 제어될 수 있다.
본 발명에 의한 후처리가 변동폭(fluctuations) 또는 짧은 극값들(short extreme values)을 스무딩(평활화)하는 점이 본 발명의 장점이다. 하나의 유사한 에너지를 갖는 여러 입력 채널들로부터의 신호 부분들이 하나의 신호의 하나의 주파수 대역, 즉, 베이스 채널 또는 입력 신호 채널에 중첩된(super-positioned) 경우에, 이 상황이 특히 발생한다. 이 주파수 대역은 그 다음에, 크게 변동하여(in a highly fluctuating manner) 각 출력 채널들에, 시간 부분 마다 그리고 순간 상황에 따라, 혼합된다. 그러나, 음향심리학적 관점에서, 이 변동폭들을 평활시키는(to smooth) 것이 좋은데, 그 이유는 이 변동폭들은 하나의 소스의 하나의 위치의 검출에 실질적으로 기여하지 않으나 주관적인 청취감(subjective listening impression)에 나쁘게(in a negative manner) 영향을 주기 때문이다.
본 발명의 바람직한 실시예에 따라, 본 발명의 시스템의 상이한 위치에서 여하한 품질 손실을 초래하지 않고 또는 송신된 복원 파라미터들의 보다 높은 해상도/양자화(resolution/quantization) [그리고, 따라서, 높은 데이터 레이트]를 필요로 함이 없이, 그러한 가청 아티팩트들이 감소되거나 심지어 제거된다. 본 발명은, 중요한 공간적 위치 검출 큐(spatial localization detection cues)에 실질적으로 영향을 줌이 없이, 파라미터들의 신호-적응성 변형(스무딩)을 실행함으로써 이 목적을 달성한다.
복원 출력 신호의 특성에 있어서의 갑자기 발생된 변화(the sudden occurring changes)는, 고도로 일정한 스테이쇼나리 특성(highly constant stationary characteristic)을 갖는 오디오 신호들에 대해 특히 가청 아티팩트를 초래한다. 이것은 음조 신호들을 갖는 경우이다. 따라서, 그러한 신호들에 대한 양자화 복원 파라미터들 사이의 하나의 "더 스무드한(smoother)" 천이(transition)를 제공하는 것이 중요하다. 이것은 예를 들어, 스무딩, 보간(interpolation), 등에 의해 얻을 수 있다.
나아가, 그러한 파라미터 값 변형은 다른 유형의 오디오 신호에 대한 가청 왜곡(audible distortions)을 초래할 수 있다. 이것은, 그 특성에 빠른 변동폭들을 포함하는 신호들에 대한 경우이다. 그러한 특성은 격약기(percussive instrument)의 경과적인 부분 또는 어택(the transient part or attack)에서 찾을 수 있다. 이 경우에, 본 발명은 파라미터 스무딩의 불활성화에 대비한다.
이것은 신호-적응성 방식으로 송신된 양자화 복원 파라미터들을 후처리함으로써 얻어진다.
적응성(adaptivity)은 선형이거나 비-선형일 수 있다. 이 적응성이 비-선형일 때, 도 3에 나타낸 하나의 임계치 설정 과정(thresholding procedure)이 실행된다.
적응성을 제어하기 위한 다른 기준(criterion)은 하나의 신호 특성의 정상성(stationarity)의 결정(determination)이다. 하나의 신호 특성의 정상성을 결정하기(determining) 위한 하나의 특정 형태는 신호 엔벨로프(signal envelope)의 평가 또는, 특히, 신호의 음조의 평가(evaluation)이다. 음조는 전체 주파수 범위에 대해 또는, 바람직하게는, 하나의 오디오 신호의 상이한 주파수 대역들에 대해 개별적으로 결정될(determined) 수 있음을 알아야 한다.
본 발명은, 지금까지, 파라미터 값들을 송신하기 위해 필요한 데이터 레이트의 증가를 발생시키지 않고는, 불가피했던, 아티팩트들을 감소시키거나 심지어 제거 할 수 있다.
도 2 및 3에 대해 위에 개략적으로 설명한 바와 같이, 본 발명의 바람직한 실시예는, 고려 대상인 신호 부분이 음조 특성을 가질 때, 채널간 레벨 차이들의 스무딩을 실행한다. 하나의 인코더에서 계산되고 하나의 인코더에서 양자화된 채널간 레벨 차이들은, 신호-적응성 스무딩 동작(signal-adaptive smoothing operation)을 위해 디코더로 보내진다. 적응성 구성요소(adaptive component)는, 음조 스펙트럼 성분들(tonal spectral components)에 대한 채널간 레벨 차이들의 필터링에 스위치 온 하고(switch on), 노이즈-유사 및 경과적 스펙트럼 성분들에 대한 그러한 후처리에 스위치 오프 하는(switch off), 임계치 결정(a threshold determination)과 관련된 음조 결정(a tonality determination)이다. 이 실시예에서, 적응성 스무딩 알고리즘(adaptive smoothing algorithms)을 수행하기 위해 인코더의 부가적인 사이드 정보가 필요하지 않다.
본 발명의 후처리는 파라미터 스테레오 MP3/AAC, MP3 서라운드에 대한 것과 같은 다중-채널 신호들의 파라미터 인코딩의 다른 개념(concepts), 및 유사한 방법들을 위해 또한 사용될 수 있다.

Claims (26)

  1. 적어도 하나의 입력 채널과, 그리고 양자화 법칙(quantization rule)에 따라 양자화되며 그 입력 채널의 후행 시간 부분들(subsequent time portions)과 연관된 일련의 양자화 복원 파라미터들(quantized reconstruction parameters)을 가지는 입력 신호로부터, 1 보다 크거나 입력 채널들의 수보다 큰 수의 복수의 합성된 출력 채널들을 갖는 출력 신호를 발생시키는 것으로서;
    처리될 입력 신호의 시간 부분에 대한 복원 파라미터로부터 유도된 후처리 복원 파라미터(post processed reconstruction parameter) 또는 후처리량(post processed quantity)의 값을 양자화 법칙에 따른 재양자화를 사용하여 얻을 수 있는 값과 상이하게 결정하도록(determine) 동작하는 후처리 장치(10)와; 그리고
    상기 입력 채널의 시간 부분 그리고 상기 후처리 복원 파라미터 또는 후처리 값(post processed value)을 사용하여 복수의 합성된 출력 채널들의 시간 부분을 복원하기 위한 다중 채널 복원장치(12)를 포함하여 구성되는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  2. 제1항에 있어서, 처리될 입력 신호의 시간 부분의 신호 특성을 결정하기(determine) 위하여 입력 신호를 분석하기 위한 입력 신호 분석장치(16)를 더 포 함하여 구성되고; 상기 신호 특성에 따라 후처리 복원 파라미터를 결정하도록(determine) 상기 후처리 장치(10)가 동작하는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  3. 제2항에 있어서, 미리 정해진 신호 특성이 입력 신호의 시간 부분에 대해 상기 입력 신호 분석장치(16)에 의해 결정될(determined) 때 후처리 복원 파라미터를 결정하고(determine), 미리 정해진 신호 특성이 입력 신호의 시간 부분에 대해 상기 입력 신호 분석장치에 의해 결정되지(determined) 않을 때 후처리를 수행하지 않도록, 상기 후처리 장치(10)가 동작하는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  4. 제3항에 있어서, 신호 특성 값이 임계값의 위 또는 아래에 있을 때, 상기 입력 신호 분석장치(16)가 상기 신호 특성을 미리 정해진 신호 특성으로 결정하도록(determine) 동작하는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  5. 제2항에 있어서, 상기 신호 특성이, 입력 신호의 처리될 부분의 하나의 음조 특성(a tonality characteristic) 또는 하나의 경과적 특성(a transient characteristic)인, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  6. 제1항에 있어서, 일련의 후처리 복원 파라미터들이 일련의 비-후처리 역 양자화 복원 파라미터들(non-post-processed inversely quantized reconstruction parameters)과 비교하여 시간적으로 더 스무드(smoother in time)하도록, 상기 후처리 장치(10)가 스무딩 기능(smoothing function)을 수행하도록 동작하는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  7. 제1항에 있어서, 상기 후처리 장치(10)가 하나의 스무딩 기능을 수행하도록 동작하고, 그리고 상기 후처리 장치(10)가, 로우 패스 특성(low pass characteristic)을 가지며 입력 신호의 선행 시간 부분(a preceding time portion)과 연관된 적어도 하나의 복원 파라미터를 하나의 입력으로 수신하는, 하나의 디지털 필터를 포함하는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  8. 제1항에 있어서, 상기 후처리 장치(10)가, 적어도 하나의 선행 시간 부분(preceding time portion)과 연관된 하나의 복원 파라미터를 사용하거나 적어도 하나의 후행 시간 부분과 연관된 복원 파라미터를 사용하여 보간 기능(interpolating function)을 수행하도록 동작하는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  9. 제1항에 있어서, 상기 후처리 장치(10)가, 양자화 법칙에 의해 정의된 여하한 양자화 레벨과 부합되지 않도록 하나의 피조작 복원 파라미터를 결정하고 하나의 역 양자화기를 사용하여 상기 피조작 복원 파라미터를 역양자화하도록 동작하며, 상기 역 양자화기는 여하한 양자화 레벨을 맵핑함으로써 정의된 역 양자화 값과도 부합되지 않게 상기 피조작 복원 파라미터를 역 양자화 피조작 복원 파라미터로 맵핑하도록 동작할 수 있는, 다중-채널 합성장치.
  10. 제9항에 있어서, 양자화 법칙이 로그 양자화 법칙(a logarithmic quantization rule)인, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  11. 제1항에 있어서, 상기 후처리 장치(10)가,
    양자화된 복원 파라미터들을 양자화 법칙에 따라 역 양자화하고,
    얻어진 역 양자화 복원 파라미터를 조작하며(manipulate), 그리고
    조작된 파라미터를 비선형 또는 선형 함수에 따라 맵핑하도록, 동작하는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  12. 제1항에 있어서, 상기 후처리 장치(10)가,
    양자화된 복원 파라미터들을 양자화 법칙에 따라 역 양자화하고,
    얻어진 역 양자화 파라미터들을 비선형 또는 선형 함수에 의해 맵핑하며, 그리고
    얻어진 맵핑된 복원 파라미터들을 조작하도록, 동작하는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  13. 제1항에 있어서, 상기 후처리 장치(10)가, 양자화 법칙에 따라, 상기 입력 신호의 후행 시간 부분과 연관된 하나의 역 양자화 복원 파라미터에 대해 동작하고(operative), 그리고
    상기 후처리 장치(10)가, 상기 입력 신호의 적어도 하나의 선행 시간 부분에 대한 적어도 하나의 역 양자화 복원 파라미터에 기초하여 후처리 복원 파라미터를 결정하도록(determine), 더 동작하는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  14. 제1항에 있어서, 상기 입력 신호의 시간 부분이, 거기에 결합된, 입력 신호의 상이한 주파수 대역에 대한 복수의 양자화 복원 파라미터들을 가지며, 그리고
    상기 후처리 장치(10)가, 상기 입력 신호의 상이한 주파수 대역에 대한 후처리 복원 파라미터를 결정하도록(determine), 동작하는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  15. 제1항에 있어서, 상기 입력 신호가 다중-채널 오디오 신호의 적어도 두 개의 오리지널 채널들을 결합함으로써 얻어진 하나의 합계 스펙트럼(sum spectrum)이고, 그리고
    상기 양자화 복원 파라미터가 채널간 레벨 차이 파라미터(interchannel level difference parameter), 채널간 시간 차이 파라미터(interchannel time difference parameter), 채널간 위상 차이 파라미터(interchannel phase difference parameter), 또는 채널간 간섭 파라미터(interchannel coherence parameter)인, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  16. 제2항에 있어서, 상기 입력 채널 분석장치(16)가, 얼마나 많은 신호 특성을 상기 입력 신호가 가지는지를 양적으로 나타내는 정도(a degree)를 결정하도록(determine) 동작하고, 그리고
    상기 후처리 장치(10)가 상기 정도에 좌우되는 강도(a strength)로 후처리를 수행하도록 동작하는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  17. 제1항에 있어서, 상기 후처리 장치(10)가, 처리될 시간부분에 대한 후처리 복원 파라미터를 결정할 때, 처리될 시간부분과 관련된 양자화된 복원 파라미터를 사용하여 동작하는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  18. 제1항에 있어서, 상기 양자화 법칙이, 두 개의 인접한 양자화 레벨 사이의 차이가 수치 계산을 수행하기 위한 프로세서의 정확도에 의해 결정된 두 개의 인접한 숫자 사이의 차이보다 더 큰 것인, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  19. 제1항에 있어서, 상기 양자화 복원 파라미터들이, 엔트로피 인코딩되고, 그리고 하나의 엔트로피 인코딩 형태로 시간부분과 연관되며, 그리고
    상기 후처리 장치(10)가 동작하여, 상기 후처리 복원 파라미터들을 결정하기 위해 사용된 엔트로피-인코딩된 양자화 복원 파라미터를 엔트로피-디코딩하는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  20. 제7항에 있어서, 상기 디지털 필터(10a)가 IIR 필터인, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  21. 제1항에 있어서, 후행 시간부분들에 대한 후처리 복원 파라미터들 사이의 차이가, 재양자화(requantization)에 의한 후행 시간부분들과 연관된 양자화 복원 파라미터들로부터 유도된 비-후처리 복원 파라미터들 사이의 차이보다 더 작도록, 상기 후처리 장치(10)가 후처리 법칙을 실행하도록(implement) 동작하는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  22. 제1항에 있어서, 상기 후처리량이, 비 후처리량을 얻기 위해 하나의 맵핑 법칙에 따라 하나의 입력 값을 하나의 출력 값에 단일(singly) 맵핑하는 하나의 맵핑 기능(a mapping function)만을 사용하여, 양자화 복원 파라미터로부터 유도되고, 상기 후처리 장치가, 상기 후처리량을 얻기 위해 비 후처리량을 후처리하도록 동작하는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  23. 제1항에 있어서, 상기 양자화 복원 파라미터가, 상기 입력 채널들과 연관된 두 개의 절대량들(absolute quantities) 사이의 파라미터화된 차이(parameterised difference)를 나타내는 차이 파라미터(a difference parameter)이고, 상기 후처리량이 상기 입력 채널들 중의 하나에 상응하는 하나의 출력 채널을 복원하기 위해 사용된 하나의 절대값인, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  24. 제1항에 있어서,
    상기 양자화 복원 파라미터가 채널간 레벨 차이이고, 상기 후처리량이 출력 채널의 절대 레벨을 나타내거나, 또는
    상기 양자화 복원 파라미터가 채널간 시간 차이이고, 상기 후처리량이 출력 채널의 절대 시간 기준(an absolute time reference)을 나타내거나, 또는
    상기 양자화 복원 파라미터가 채널간 간섭 측정값(inter channel coherence measure)이고, 상기 후처리량이 출력 채널의 절대 간섭 레벨을 나타내거나, 또는
    상기 양자화 복원 파라미터가 채널간 위상 차이이고, 상기 후처리량이 출력 채널의 절대 위상 값을 나타내는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성장치.
  25. 적어도 하나의 입력 채널과, 그리고 양자화 법칙(quantization rule)에 따라 양자화되며 그 입력 채널의 후행 시간 부분들과 연관된 일련의 양자화 복원 파라미터들(quantized reconstruction parameters)을 가지는 하나의 입력 신호로부터, 1 보다 크거나 입력 채널들의 수보다 큰 수의 복수의 합성된 출력 채널들을 갖는 출력 신호를 발생시키는 것으로서;
    후처리 복원 파라미터 또는 후처리량의 값이 양자화 법칙에 따른 재양자화(requantization)를 사용하여 얻어질 수 있는 값과 상이하도록, 처리될 입력 신 호의 시간부분에 대한 복원 파라미터로부터 유도된 후처리 복원 파라미터 또는 후처리량을 결정하는(determine) 단계(10)와; 그리고
    상기 입력 채널의 시간부분 그리고 후처리 복원 파라미터 또는 후처리 값을 사용하여 복수의 합성된 출력 채널의 시간 부분을 복원하는 단계(12)를 포함하여 구성되는, 하나의 입력 신호로부터 하나의 출력 신호를 발생시키기 위한 다중-채널 합성 방법.
  26. 삭제
KR1020067027932A 2004-06-30 2005-06-13 다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법 KR100913987B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/883,538 US8843378B2 (en) 2004-06-30 2004-06-30 Multi-channel synthesizer and method for generating a multi-channel output signal
US10/883,538 2004-06-30

Publications (2)

Publication Number Publication Date
KR20070028481A KR20070028481A (ko) 2007-03-12
KR100913987B1 true KR100913987B1 (ko) 2009-08-25

Family

ID=34971777

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067027932A KR100913987B1 (ko) 2004-06-30 2005-06-13 다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법

Country Status (18)

Country Link
US (1) US8843378B2 (ko)
EP (1) EP1649723B1 (ko)
JP (1) JP4712799B2 (ko)
KR (1) KR100913987B1 (ko)
CN (1) CN1954642B (ko)
AT (1) ATE394901T1 (ko)
AU (1) AU2005259618B2 (ko)
BR (1) BRPI0511362B1 (ko)
CA (1) CA2569666C (ko)
DE (1) DE602005006495D1 (ko)
ES (1) ES2307188T3 (ko)
HK (1) HK1090504A1 (ko)
IL (1) IL178670A (ko)
MX (1) MXPA06014968A (ko)
NO (1) NO338980B1 (ko)
PT (1) PT1649723E (ko)
RU (1) RU2345506C2 (ko)
WO (1) WO2006002748A1 (ko)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4612787B2 (ja) * 2003-03-07 2011-01-12 キヤノン株式会社 画像データの暗号化装置の制御方法及び画像データ変換装置の制御方法、及び、それらの装置、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
ES2373728T3 (es) * 2004-07-14 2012-02-08 Koninklijke Philips Electronics N.V. Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio.
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
ATE521143T1 (de) * 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
JP4887288B2 (ja) * 2005-03-25 2012-02-29 パナソニック株式会社 音声符号化装置および音声符号化方法
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1943642A4 (en) * 2005-09-27 2009-07-01 Lg Electronics Inc METHOD AND DEVICE FOR CODING / DECODING A MULTI-CHANNEL AUDIO SIGNAL
EP1974347B1 (en) * 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
US8560303B2 (en) * 2006-02-03 2013-10-15 Electronics And Telecommunications Research Institute Apparatus and method for visualization of multichannel audio signals
WO2007091850A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
EP1870880B1 (en) * 2006-06-19 2010-04-07 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
DE102006030276A1 (de) 2006-06-30 2008-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines gefilterten Aktivitätsmusters, Quellentrenner, Verfahren zum Erzeugen eines bereinigten Audiosignals und Computerprogramm
KR100763919B1 (ko) * 2006-08-03 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2 채널의 바이노럴 신호로 복호화하는 방법 및 장치
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
JP4769673B2 (ja) * 2006-09-20 2011-09-07 富士通株式会社 オーディオ信号補間方法及びオーディオ信号補間装置
CN101529898B (zh) 2006-10-12 2014-09-17 Lg电子株式会社 用于处理混合信号的装置及其方法
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
JP4838361B2 (ja) 2006-11-15 2011-12-14 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
WO2008069584A2 (en) 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
CA2670864C (en) 2006-12-07 2015-09-29 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2111618A4 (en) * 2007-02-13 2010-04-21 Lg Electronics Inc METHOD AND APPARATUS FOR PROCESSING AUDIO SIGNAL
US9015051B2 (en) * 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
US8908873B2 (en) * 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
EP2296145B1 (en) 2008-03-10 2019-05-22 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Device and method for manipulating an audio signal having a transient event
US20110137661A1 (en) * 2008-08-08 2011-06-09 Panasonic Corporation Quantizing device, encoding device, quantizing method, and encoding method
EP2154910A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for merging spatial audio streams
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2169665B1 (en) * 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
EP2169664A3 (en) * 2008-09-25 2010-04-07 LG Electronics Inc. A method and an apparatus for processing a signal
MX2011011399A (es) 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
KR101499785B1 (ko) 2008-10-23 2015-03-09 삼성전자주식회사 모바일 디바이스를 위한 오디오 처리 장치 및 그 방법
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
ES2644520T3 (es) 2009-09-29 2017-11-29 Dolby International Ab Decodificador de señal de audio MPEG-SAOC, método para proporcionar una representación de señal de mezcla ascendente usando decodificación MPEG-SAOC y programa informático usando un valor de parámetro de correlación inter-objeto común dependiente del tiempo/frecuencia
WO2011047886A1 (en) * 2009-10-21 2011-04-28 Dolby International Ab Apparatus and method for generating a high frequency audio signal using adaptive oversampling
EP2489038B1 (en) * 2009-11-20 2016-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter
RU2683175C2 (ru) 2010-04-09 2019-03-26 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
EP2464145A1 (en) 2010-12-10 2012-06-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decomposing an input signal using a downmixer
US9424852B2 (en) 2011-02-02 2016-08-23 Telefonaktiebolaget Lm Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
JP5775637B2 (ja) 2011-08-04 2015-09-09 ドルビー・インターナショナル・アーベー パラメトリック・ステレオを使った改善されたfmステレオ電波受信機
WO2013149672A1 (en) * 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder
WO2013149670A1 (en) * 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Method for parametric spatial audio coding and decoding, parametric spatial audio coder and parametric spatial audio decoder
US9460723B2 (en) * 2012-06-14 2016-10-04 Dolby International Ab Error concealment strategy in a decoding system
US9319790B2 (en) 2012-12-26 2016-04-19 Dts Llc Systems and methods of frequency response correction for consumer electronic devices
CN103533123B (zh) * 2013-09-23 2018-04-06 陕西烽火电子股份有限公司 一种飞机用多接收通道通话静噪方法
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
US9774974B2 (en) 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
EP3424048A1 (en) * 2016-03-03 2019-01-09 Nokia Technologies OY Audio signal encoder, audio signal decoder, method for encoding and method for decoding
JP6790114B2 (ja) * 2016-03-18 2020-11-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング
CN107452387B (zh) * 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
CN107731238B (zh) 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5307441A (en) 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5675701A (en) 1995-04-28 1997-10-07 Lucent Technologies Inc. Speech coding parameter smoothing method
US6611797B1 (en) 1999-01-22 2003-08-26 Kabushiki Kaisha Toshiba Speech coding/decoding method and apparatus
US20040044527A1 (en) 2002-09-04 2004-03-04 Microsoft Corporation Quantization and inverse quantization for audio

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
US6130949A (en) * 1996-09-18 2000-10-10 Nippon Telegraph And Telephone Corporation Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor
JP3266178B2 (ja) * 1996-12-18 2002-03-18 日本電気株式会社 音声符号化装置
US6307941B1 (en) * 1997-07-15 2001-10-23 Desper Products, Inc. System and method for localization of virtual sound
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
JP3657120B2 (ja) 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
JP3558031B2 (ja) * 2000-11-06 2004-08-25 日本電気株式会社 音声復号化装置
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US20030220801A1 (en) * 2002-05-22 2003-11-27 Spurrier Thomas E. Audio compression method and apparatus
KR101049751B1 (ko) * 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
KR20050116828A (ko) * 2003-03-24 2005-12-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 다채널 신호를 나타내는 주 및 부 신호의 코딩
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5307441A (en) 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5675701A (en) 1995-04-28 1997-10-07 Lucent Technologies Inc. Speech coding parameter smoothing method
US6611797B1 (en) 1999-01-22 2003-08-26 Kabushiki Kaisha Toshiba Speech coding/decoding method and apparatus
US20040044527A1 (en) 2002-09-04 2004-03-04 Microsoft Corporation Quantization and inverse quantization for audio

Also Published As

Publication number Publication date
CA2569666A1 (en) 2006-01-12
HK1090504A1 (en) 2006-12-22
MXPA06014968A (es) 2007-02-08
WO2006002748A1 (en) 2006-01-12
ES2307188T3 (es) 2008-11-16
RU2007103341A (ru) 2008-08-10
PT1649723E (pt) 2008-07-28
JP4712799B2 (ja) 2011-06-29
KR20070028481A (ko) 2007-03-12
US8843378B2 (en) 2014-09-23
AU2005259618A1 (en) 2006-01-12
RU2345506C2 (ru) 2009-01-27
US20060004583A1 (en) 2006-01-05
ATE394901T1 (de) 2008-05-15
IL178670A0 (en) 2007-02-11
IL178670A (en) 2011-10-31
CN1954642A (zh) 2007-04-25
AU2005259618B2 (en) 2008-05-22
EP1649723B1 (en) 2008-05-07
NO338980B1 (no) 2016-11-07
DE602005006495D1 (de) 2008-06-19
CA2569666C (en) 2013-07-16
JP2008504578A (ja) 2008-02-14
BRPI0511362B1 (pt) 2018-12-26
NO20070560L (no) 2007-03-30
EP1649723A1 (en) 2006-04-26
BRPI0511362A (pt) 2007-12-04
CN1954642B (zh) 2010-05-12

Similar Documents

Publication Publication Date Title
KR100913987B1 (ko) 다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법
RU2361288C2 (ru) Устройство и способ для формирования сигнала управления многоканальным синтезатором и устройство и способ многоканального синтеза
RU2555221C2 (ru) Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой
JP4887307B2 (ja) ニアトランスペアレントまたはトランスペアレントなマルチチャネルエンコーダ/デコーダ構成
CN110890101B (zh) 用于基于语音增强元数据进行解码的方法和设备
US20120134511A1 (en) Multichannel audio coder and decoder
EP1782417A1 (en) Multichannel decorrelation in spatial audio coding
KR20060132867A (ko) 멀티채널 출력 신호를 구성하고 다운믹스 신호를 생성하기위한 장치 및 방법
KR20070062502A (ko) 공간적 오디오 파라미터들의 효율적인 부호화를 위한에너지 종속 양자화

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120802

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130730

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140730

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150728

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160801

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170731

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20180801

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190809

Year of fee payment: 11