KR101346120B1 - 오디오 인코딩 및 디코딩 - Google Patents

오디오 인코딩 및 디코딩 Download PDF

Info

Publication number
KR101346120B1
KR101346120B1 KR1020077025145A KR20077025145A KR101346120B1 KR 101346120 B1 KR101346120 B1 KR 101346120B1 KR 1020077025145 A KR1020077025145 A KR 1020077025145A KR 20077025145 A KR20077025145 A KR 20077025145A KR 101346120 B1 KR101346120 B1 KR 101346120B1
Authority
KR
South Korea
Prior art keywords
channel
signal
data
improvement
generating
Prior art date
Application number
KR1020077025145A
Other languages
English (en)
Other versions
KR20070116174A (ko
Inventor
제럴드 에이치. 호토
프란코이스 피. 마이버그
아르놀누스 더블유. 제이. 오멘
Original Assignee
코닌클리케 필립스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36607294&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR101346120(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 코닌클리케 필립스 엔.브이. filed Critical 코닌클리케 필립스 엔.브이.
Publication of KR20070116174A publication Critical patent/KR20070116174A/ko
Application granted granted Critical
Publication of KR101346120B1 publication Critical patent/KR101346120B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

멀티-채널 오디오 인코더(10)가 N-채널 오디오 신호를 인코딩한다. 제1 유닛(110)은 N-채널 신호에 관한 제1 인코딩된 M-채널 신호, 예컨대 공간 스테레오 다운-믹스를 생성한다(N>M). 다운-믹서들(115,116,117)은 N-채널 오디오 신호에 대한 신호에 관한 제1 개선 데이터를 생성한다. N-채널 오디오 신호에 관한 제2 M-채널 신호, 예컨대 예술적인 스테레오 믹스가 생성된다. 프로세서(123)는 제1 M-채널 신호에 대한 제2 M-채널 신호에 관해 제2 개선 데이터를 생성한다. 제2 유닛(120)은 제2 M-채널 신호, 제1 개선 데이터, 및 제2 개선 데이터를 포함하는 출력 신호를 생성한다. 생성기(12)는 제2 개선 데이터를 절대적 개선 데이터로서 또는 제2 M-채널 신호에 대한 상대적 개선 데이터로서 생성하는 것 중에서 동적으로 선택할 수 있다. 디코더(20)는 역으로 동작을 수행할 수 있고, 수신된 비트-스트림 내의 표시에 따라 제2 개선 데이터를 절대적 또는 상대적 개선 데이터로서 적용할 수 있다.
Figure R1020077025145
멀티 채널 오디오, 인코더, 디코더, 프로세서, 다운-믹스, 생성기

Description

오디오 인코딩 및 디코딩{AUDIO ENCODING AND DECODING}
본 발명은 멀티-채널 신호들을 위한 오디오 인코딩 및/또는 디코딩에 대한 것이다.
멀티-채널 오디오 신호는 2 이상의 오디오 채널들을 갖는 오디오 신호이다. 멀티-채널 오디오 신호들의 공지의 예들이 2-채널 스테레오 오디오 신호들, 및 2개의 전방 오디오 채널들, 2개의 후방 오디오 채널들, 하나의 중앙 오디오 신호 및 부가적인 저주파 강화(LFE) 채널을 갖는 5.1 채널 오디오 신호들이다. 이러한 5.1 채널 오디오 신호들이 DVD(Digital Versatile Disc) 및 SACD(Super Audio Compact Disc) 시스템들에서 이용된다. 멀티-채널 자료의 증가하는 인기로 인해, 멀티-채널 자료의 효과적인 코딩이 더욱 중요해지고 있다.
오디오 프로세싱 분야에서, 다수의 오디오 채널들을 다른 개수의 오디오 채널들로 변환하는 것이 주지되어 있다. 그러한 변환은 다양한 이유들로 수행될 수 있다. 예를 들어, 오디오 신호는 향상된 유저 체험을 제공하기 위하여 또 다른 포맷으로 변환될 수 있다. 예를 들어, 전통적인 스테레오 레코딩들이 오직 2개의 채널들을 포함하는 반면, 현대의 향상된 오디오 시스템들은 통상적으로 인기있는 5.1 서라운드 사운드 시스템에서와 같이, 5 또는 6개의 채널들을 이용한다. 따라서, 두개의 스테레오 채널들이 개선된 오디오 시스템의 장점을 충분히 이용하기 위하여 5 또는 6개의 채널들로 변환될 수 있다.
채널 변환의 또 다른 이유는 코딩 효율이다. 예컨대, 서라운드 사운드 오디오 신호들은 오디오 신호의 멀티-채널 공간 특성들을 설명하는 변수 비트 스트림과 조합된 스트레오 채널 오디오 신호들로 인코딩될 수 있다. 디코더들은 매우 만족스런 정확도로 서라운드 사운드 오디오 신호들을 재생할 수 있다. 이 방식으로, 실질적인 비트율 절약들이 얻어질 수 있다.
5.1-5.1 멀티-채널 오디오 코딩 시스템이 공지되어 있다. 이 공지된 오디오 코딩 시스템에서, 5.1 입력 오디오 신호가 2 다운-믹스 채널들 및 연관된 변수들로 인코딩되고 표현된다. 다운-믹스 신호들은 또한 함께 공간 다운-믹스(spatial down mix)로 부른다. 이 공지의 시스템에서, 공간 다운-믹스는 품질적인 면에서 5.1 입력 채널들로부터의 고정된 ITU 다운-믹스에 견줄만한 스트레오 이미지를 갖는 스테레오 오디오 신호를 형성한다. 오직 스트레오 장치를 갖는 유저들은 이 공간 스테레오 다운-믹스를 들을 수 있고, 반면 5.1 채널 장비를 갖는 청취자들은 이 공간 스테레오 다운-믹스 및 연관된 변수들을 이용하여 얻어지는 5.1 채널 재생을 들을 수 있다. 5.1 채널 장비는 공간 스테레오 다운-믹스(즉, 스테레오 오디오 신호) 및 연관된 변수들로부터 5.1 채널 오디오 신호를 디코딩/재구성 한다.
그러나, 공간 스테레오 다운-믹스는 종종 원래의 스테레오 신호 또는 분명하게 생성되는 스테레오 신호와 비교하여 품질이 저하된 것으로 여겨진다. 예를 들어, 전문 스튜디오 엔지니어들은 종종 공간 스테레오 다운-믹스가 다소 분명치 않고(dull) 시시한 것을 발견한다. 이러한 이유로, 공간 스테레오 다운-믹스와 다른 예술적인 스테레오 다운-믹스가 종종 생성된다. 예를 들어, 여분의 반향 또는 소스들이 더해지고, 스테레오 이미지가 더 확대된다. 유저들이 예술적인 스테레오 다운-믹스를 즐길 수 있도록 하기 위하여, 공간 다운-믹스를 대신하여, 이 인공 다운-믹스가 전송 매체를 통해 전송되거나 저장 매체에 저장될 수 있다. 그러나, 스테레오 신호로부터 5.1 신호를 생성하기 위한 변수 데이터가 원래의 다운-믹스 신호에 기초하기 때문에, 이 방법은 5.1 채널 오디오 신호 재생의 품질에 심각한 영향을 준다. 특정적으로, 입력 5.1 채널 오디오 신호는 공간 스테레오 다운-믹스 및 연관된 변수들로 인코딩 되었다. 공간 스테레오 다운-믹스를 예술적인 스테레오 다운-믹스로 대체함으로써, 공간 스테레오 다운-믹스는 더이상 시스템의 디코딩 단에서 이용 가능하지 않을 수 있고, 5.1 채널 오디오 신호의 고품질 재구성이 가능하지 않다.
5.1 채널 오디오 신호의 품질을 향상시키기 위한 가능한 방법은, 공간 스테레오 다운-믹스 신호의 데이터를 더 포함해야만 한다. 예를 들어, 예술적인 스테레오 다운-믹스에 덧붙여, 공간 스테레오 다운-믹스 신호는 동일한 비트스트림에 포함될 수 있고, 또는 병렬로 전송될 수 있다. 그러나, 이는 실질적으로 데이터율을 증가시키고, 따라서 통신 대역폭 또는 저장 요구사항들을 증가시키고, 인코딩된 멀티-채널 신호에 관한 데이터율 비율의 품질을 저하시킬 것이다.
따라서, 멀티-채널 오디오를 위한 향상된 인코딩/디코딩 시스템이 유리할 것이고, 특히 향상된 성능, 품질 및/또는 데이터율 비율의 품질을 허용하는 시스템이 유리할 것이다.
따라서, 본 발명은 전술된, 하나 이상의 단점들을 각각 또는 그 조합들로 경감, 완화 또는 제거하고자 한다.
본 발명의 제1 양상에 따르면, N-채널 오디오 신호를 인코딩하기 위한 멀티-채널 오디오 인코더가 제공되는데, 이 멀티-채널 오디오 인코더는, 상기 N-채널 오디오 신호에 관한 제1 M-채널 신호를 생성하기 위한 수단으로서, M은 N보다 작은 상기 생성 수단; 상기 N-채널 오디오 신호에 대한 상기 제1 M-채널 신호의 제1 개선 데이터를 생성하기 위한 수단; 상기 N-채널 오디오 신호에 관해 제2 M-채널 신호를 생성하기 위한 수단; 상기 제1 M-채널 신호에 대한 상기 제2 M-채널 신호에 관해 제2 개선 데이터를 생성하기 위한 개선 수단; 및 상기 제2 M-채널 신호, 상기 제1 개선 데이터 및 상기 제2 개선 데이터를 포함하는 인코딩된 출력 신호를 생성하기 위한 수단을 포함하고, 상기 개선 수단은 상기 제2 M-채널 신호에 대한 상대적 개선 데이터로서, 또는 절대적 개선 데이터로서 상기 제2 개선 데이터를 생성하는 것 중에서 동적으로 선택하도록 구성된다.
본 발명은 효과적인 멀티-채널 신호의 인코딩을 제공할 수 있다. 특히, 향상된 품질 대 데이터율 비율을 갖는 효율적인 인코딩이 달성될 수 있다. 본 발명은 하나의 M-채널 신호가 제1 M-채널 신호에 대한 개선 데이터에 기초하여 멀티-채널 생성에 관한 충격을 완화하면서 또 다른 M-채널 신호를 대신하도록 할 수 있다. 상세하게는, 공간 다운-믹스와 연관된 개선 데이터에 기초하여 디코더에서 효율적인 멀티-채널 재생성을 허용하면서, 공간 다운-믹스를 대신하여 인공 다운-믹스가 전송될 수 있다. 개선 데이터의 동적인 선택은 매우 감소된 크기의 개선 데이터 및/또는 생성될 수 있는 신호의 개선된 품질이 가능하게 한다.
절대적 개선 데이터는 제2 M-채널 신호를 참조하지 않고 제1 M-채널 신호를 기술하는 반면, 상대적 개선 데이터는 제2 M-채널 신호를 참조하여 제1 M-채널 신호를 기술한다.
제1 및/또는 제2 M-채널 신호를 생성하기 위한 수단은 N-채널 신호를 처리하여 또는 예컨대, 내부 또는 외부 소스들로부터 M-채널 신호(들)를 수신하여 신호들을 생성할 수 있다.
본 발명의 선택적인 특징에 따르면, 개선 수단은 N-채널 신호의 특성에 응답하여 절대적 개선 데이터 및 상대적 개선 데이터 중에서 선택하도록 구성된다.
이것은 효율적인 동작이 가능하도록 하고, 특히 인코딩된 신호에 향상된 품질 대 데이터율 비율을 제공할 수 있다. 이 선택은, 예를 들어, N-채널 신호의 세그먼트의 특성으로부터 유도되는 하나 이상의 변수들을 평가함으로써, 특히 (N-채널 신호로부터 유도될 수 있는) 제1 및/또는 제2 M-채널 신호로부터 유도되는 하나 이상의 변수들에 기초하여 수행될 수 있다.
본 발명의 선택적인 특징에 따르면, 개선 수단은 절대적 개선 데이터 및 상대적 개선 데이터의 상대적 특성에 응답하여 절대적 개선 데이터 및 상대적 개선 데이터 중에서 선택하도록 구성된다.
이것은 효율적인 동작이 가능하도록 하고, 특히 인코딩된 신호에 향상된 품질 대 데이터율 비율을 제공할 수 있다. 대안적으로 또는 부가적으로, 그것은 효율적인 및/또는 낮은 복잡도 구현이 가능하도록 할 수 있다.
본 발명의 선택적인 특징에 따르면, 상대적 특성은 상대적 개선 데이터의 신호 에너지에 대한 절대적 개선 데이터의 신호 에너지이다.
이것은 효율적인 동작이 가능하도록 하고, 특히 인코딩된 신호에 향상된 품질 대 데이터율 비율을 제공할 수 있다. 대안적으로 또는 부가적으로, 그것은 효율적인 및/또는 낮은 복잡도 구현이 가능하도록 할 수 있다. 상세하게, 개선 수단은 가장 낮은 신호 에너지를 갖는 개선 데이터의 유형을 선택할 수 있다.
본 발명의 선택적인 특징에 따르면, 개선 수단은 제2 M-채널 신호를 신호 블록들로 나누고, 각각의 신호 블록에 관해 절대적 개선 데이터 및 상대적 개선 데이터 중에서 개별적으로 선택하도록 구성된다.
이것은 효율적인 동작이 가능하도록 하고, 특히 인코딩된 신호에 향상된 품질 대 데이터율 비율을 제공할 수 있다. 대안적으로 또는 부가적으로, 그것은 효율적인 및/또는 낮은 복잡도 구현이 가능하도록 할 수 있다. 신호 블록들은 시간 및/또는 주파수 영역에서 나뉠 수 있고, 각각의 신호 블록은 시간/주파수 타일들의 그룹을 포함할 수 있다. 신호 블록들로의 분할은 제1 M-채널 신호 및/또는 N-채널 신호에 적용될 수 있다.
본 발명의 선택적인 특징에 따르면, 개선 수단은 신호 블록과 연관된 특성들에만 기초하여 신호 블록에 관해 절대적 개선 데이터 및 상대적 개선 데이터 중에서 선택하도록 구성된다.
이것은 효율적인 동작이 가능하도록 하고, 특히 인코딩된 신호에 향상된 품질 대 데이터율 비율을 제공할 수 있다. 대안적으로 또는 부가적으로, 그것은 효율적인 및/또는 낮은 복잡도 구현이 가능하도록 할 수 있다. 상세하게, 개선 수단은 가장 낮은 신호 에너지를 갖는 개선 데이터의 유형을 선택할 수 있다.
본 발명의 선택적인 특징에 따르면, 상기 개선 수단은 상기 개선 데이터를 절대적 개선 데이터로서 및 상대적 개선 데이터로서 생성하는 것 중에서의 전환의 전환 시간 간격 동안, 상기 절대적 개선 데이터 및 상기 상대적 개선 데이터의 조합으로서 상기 개선 데이터를 생성하도록 구성된다.
이것은 향상된 전환을 제공할 수 있고, 특히 전환과 연관된 결점들을 감소시킬 수 있다. 개선된 음향 품질이 얻어질 수 있다. 전환 시간 간격 동안의 조합이, 절대적으로부터 상대적 개선 데이터로 및/또는 상대적으로부터 절대적 개선 데이터로 전환할 때에 적용될 수 있다. 이 조합은 중첩 및 부가 기술을 이용하여 달성될 수 있다.
본 발명의 선택적인 특징에 따르면, 상기 조합은 상기 절대적 개선 데이터 및 상기 상대적 개선 데이터 사이의 보간(interpolation)을 포함한다.
이것은 높은 품질을 갖는 실제적이고 효율적인 구현을 가능하게 한다. 향상된 음향 품질을 얻을 수 있다.
본 발명의 선택적인 특징에 따르면, 상기 인코딩된 출력 신호를 생성하기 위한 수단은 상대적 개선 데이터 또는 절대적 개선 데이터가 이용되었는지를 나타내는 데이터를 포함하도록 구성된다.
이것은 효율적인 동작이 가능하도록 하고, 특히 인코딩된 신호에 향상된 품질 대 데이터율 비율을 제공할 수 있다. 대안적으로 또는 부가적으로, 그것은 효율적인 및/또는 낮은 복잡도 구현이 가능하도록 할 수 있다. 표시 데이터는 특히 각각의 신호 블록을 위한 선택 표시를 포함할 수 있다.
본 발명의 선택적인 특징에 따르면, 상기 제2 개선 데이터는 개선 데이터의 제1 부분 및 개선 데이터의 제2 부분을 포함하고, 상기 제2 부분은 상기 제1 부분보다 상기 제1 M-채널 신호의 더 높은 품질 표현을 제공한다.
이것은 효율적인 동작이 가능하도록 하고, 특히 인코딩된 신호에 향상된 품질 대 데이터율 비율을 제공할 수 있다. 제1 부분은 제2 부분보다 더 낮은 데이터율을 가질 수 있다. 제2 부분은 디코더가 제1 M-채널 신호를 더욱더 정확하게 재생성하도록 하는 데이터를 포함할 수 있다.
본 발명의 선택적인 특징에 따르면, 상기 개선 수단은 상기 제2 부분을 절대적 개선 데이터로서, 또는 상대적 개선 데이터로서 생성하는 것 중에서만 동적으로 선택하도록 구성된다.
이것은 효율적인 동작이 가능하도록 하고, 특히 인코딩된 신호에 향상된 품질 대 데이터율 비율을 제공할 수 있다.
본 발명의 선택적인 특징에 따르면, 상기 개선 수단은 상기 제1 부분의 개선 데이터를 상기 제1 M-채널 신호에 적용함으로써 생성된 참조 신호에 대한 상기 제2 부분의 상대적 데이터를 생성하도록 구성된다.
이것은 효율적인 동작이 가능하도록 하고, 특히 인코딩된 신호에 향상된 품질 대 데이터율 비율을 제공할 수 있다.
본 발명의 또 다른 양상에 따르면, N-채널 오디오 신호를 디코딩하기 위한 멀티-채널 오디오 디코더가 제공되는데, 이 멀티-채널 오디오 디코더는, 상기 N-채널 오디오 신호에 관한 제1 M-채널 신호로서, M은 N보다 작은 상기 제1 M-채널 신호; 멀티-채널 확장을 위한 제1 개선 데이터로서, 상기 제1 M-채널 신호와 다른 제2 M-채널 신호와 관련되는 상기 제1 개선 데이터; 상기 제2 M-채널 신호에 대한 상기 제1 M-채널 신호에 관한 제2 개선 데이터로서, 상기 제1 M-채널 신호에 대한 상대적 개선 데이터 및 절대적 개선 데이터를 포함하는 상기 제2 개선 데이터; 및 신호 블록에 관하여 상기 제2 개선 데이터가 절대적 개선 데이터인지 상대적 개선 데이터인지를 나타내는 표시 데이터;를 포함하는 인코딩된 오디오 신호를 수신하기 위한 수단, 상기 제1 M-채널 신호 및 상기 제2 개선 데이터에 응답하여 M-채널 멀티-채널 확장 신호를 생성하기 위한 생성 수단, 및 상기 M-채널 멀티-채널 확장 신호 및 상기 제1 개선 데이터에 응답하여 N-채널 디코딩된 신호를 생성하기 위한 수단을 포함하고, 상기 생성 수단은 상기 표시 데이터에 응답하여 상기 제2 개선 데이터를 절대적 개선 데이터 또는 상대적 개선 데이터로 적용하는 것 중에서 선택하도록 구성된다.
본 발명은 효과적이고 높은 성능의, 멀티-채널 신호의 디코딩을 가능하게 할 수 있다. 특히, 주어진 데이터율에 관해 향상된 품질을 갖는 신호의 효과적인 디코딩이 달성될 수 있다. 본 발명은 하나의 M-채널 신호가 제1 M-채널 신호에 대한 개선 데이터에 기초하여 멀티-채널 생성에 관한 충격을 완화하면서 또 다른 M-채널 신호를 대신하도록 할 수 있다. 상세하게는, 공간 다운-믹스와 연관된 개선 데이터에 기초하여 디코더에서 효율적인 멀티-채널 재생성을 허용하면서, 공간 다운-믹스를 대신하여 인공 다운-믹스가 전송될 수 있다.
절대적 개선 데이터는 제1 M-채널 신호를 참조하지 않고 제2 M-채널 신호를 기술하는 반면, 상대적 개선 데이터는 제1 M-채널 신호를 참조하여 제2 M-채널 신호를 기술한다.
본 발명의 선택적인 특징에 따르면, 상기 생성 수단은 상기 시간 영역에서 상기 제2 개선 데이터를 상기 제1 M-채널 신호에 적용하도록 구성된다.
이것은 효율적인 동작을 가능하도록 할 수 있고, 특히 주어진 데이터율에 관해 향상된 품질을 갖는 디코딩된 신호를 제공할 수 있다. 대안적으로 또는 부가적으로, 그것은 효과적이고 및/또는 낮은 복잡도 구현이 가능하도록 할 수 있다.
본 발명의 선택적인 특징에 따르면, 상기 생성 수단은 주파수 영역에서 상기 제2 개선 데이터를 상기 제1 M-채널 신호에 적용하도록 구성된다.
이것은 효율적인 동작을 가능하도록 할 수 있고, 특히 주어진 데이터율에 관해 향상된 품질을 갖는 디코딩된 신호를 제공할 수 있다. 대안적으로 또는 부가적으로, 그것은 효과적이고 및/또는 낮은 복잡도 구현이 가능하도록 할 수 있다.
특히, 많은 실시예들에서, 주파수 영역 어플리케이션은 시간-주파수 변환의 요구되는 횟수를 감소시킬 것이다. 주파수 영역은 예를 들어, QMF(Quadrature Mirror Filterbank) 또는 MDCT(Modified Discrete Cosine Transform) 영역일 수 있다.
본 발명의 선택적인 특징에 따르면, 상기 제2 개선 데이터는 개선 데이터의 제1 부분 및 개선 데이터의 제2 부분을 포함하고, 상기 제2 부분은 상기 제1 부분 보다 상기 제1 M-채널 신호의 더 높은 품질 표현을 제공한다.
이것은 효율적인 동작을 가능하도록 할 수 있고, 특히 주어진 데이터율에 관해 향상된 품질을 갖는 디코딩된 신호를 제공할 수 있다. 대안적으로 또는 부가적으로, 그것은 효과적이고 및/또는 낮은 복잡도 구현이 가능하도록 할 수 있다. 제2 부분은 디코더가 제1 M-채널 신호를 더욱 정확하게 재생성하도록 하는 데이터를 포함할 수 있다.
본 발명의 선택적인 특징에 따르면, 상기 생성 수단은 상기 제2 부분의 제2 개선 데이터를 절대적 개선 데이터 또는 상대적 개선 데이터로서 적용하는 것 중에서 선택하도록 구성된다.
이것은 효율적인 동작을 가능하도록 할 수 있고, 특히 주어진 데이터율에 관해 향상된 품질을 갖는 디코딩된 신호를 제공할 수 있다. 대안적으로 또는 부가적으로, 그것은 효과적이고 및/또는 낮은 복잡도 구현이 가능하도록 할 수 있다.
본 발명의 선택적인 특징에 따르면, 상기 생성 수단은 상기 제1 부분의 개선 데이터를 상기 제1 M-채널 신호에 적용함으로써 생성되는 신호에 상기 제2 부분의 상대적 개선 데이터를 적용하여 상기 M-채널 멀티-채널 확장을 생성하도록 구성된다.
이것은 효율적인 동작을 가능하도록 할 수 있고, 특히 주어진 데이터율에 관해 향상된 품질을 갖는 디코딩된 신호를 제공할 수 있다. 대안적으로 또는 부가적으로, 그것은 효과적이고 및/또는 낮은 복잡도 구현이 가능하도록 할 수 있다.
본 발명의 다른 양상에 따르면, N-채널 오디오 신호를 인코딩하는 방법이 제공되는데, 이 방법은 상기 N-채널 오디오 신호에 관한 제1 M-채널 신호를 생성하는 단계로서, 상기 M은 N보다 작은 상기 생성 단계; 상기 N-채널 오디오 신호에 대한 상기 제1 M-채널 신호의 제1 개선 데이터를 생성하는 단계; 상기 N-채널 오디오 신호에 관해 제2 M-채널 신호를 생성하는 단계; 상기 제1 M-채널 신호에 대한 상기 제2 M-채널 신호에 관해 제2 개선 데이터를 생성하는 단계; 및 상기 제2 M-채널 신호, 상기 제1 개선 데이터 및 상기 제2 개선 데이터를 포함하는 인코딩된 출력 신호를 생성하는 단계를 포함하고, 상기 제2 개선 데이터의 생성은 상기 제2 M-채널 신호에 대한 상대적 개선 데이터로서, 또는 절대적 개선 데이터로서 상기 제2 개선 데이터를 생성하는 것 중에서 동적으로 선택하는 것을 포함한다.
본 발명의 또 다른 양상에 따르면, N-채널 오디오 신호를 디코딩하는 방법이 제공되는데, 이 방법은, 인코딩된 오디오 신호를 수신하는 단계로서, 상기 인코딩된 오디오 신호는, 상기 N-채널 오디오 신호에 관한 제1 M-채널 신호로서, M은 N보다 작은 상기 제1 M-채널 신호, 멀티-채널 확장을 위한 제1 개선 데이터로서, 상기 제1 M-채널 신호와 다른 제2 M-채널 신호와 관련되는 상기 제1 개선 데이터, 상기 제2 M-채널 신호에 대한 상기 제1 M-채널 신호에 관한 제2 개선 데이터로서, 상기 제1 M-채널 신호에 대한 상대적 개선 데이터 및 절대적 개선 데이터를 포함하는 상기 제2 개선 데이터, 및 신호 블록을 위한 상기 제2 개선 데이터가 절대적 개선 데이터인지 또는 상대적 개선 데이터인지를 나타내는 표시 데이터를 포함하는, 상기 인코딩된 오디오 신호를 수신하는 단계; 상기 제1 M-채널 신호 및 상기 제2 개선 데이터에 응답하여 M-채널 멀티-채널 확장 신호를 생성하는 단계; 및 상기 M-채널 멀티-채널 확장 신호 및 상기 제1 개선 데이터에 응답하여 N-채널 디코딩된 신호를 생성하는 단계를 포함하고, 상기 M-채널 멀티-채널 확장 신호의 생성은 상기 표시 데이터에 응답하여 상기 제2 개선 데이터를 절대적 개선 데이터로서 또는 상대적 개선 데이터로서 적용하는 것 중에서 선택하는 것을 포함한다.
본 발명의 또 다른 양상에 따르면, N-채널 오디오 신호에 관한 인코딩된 멀티-채널 오디오 신호가 제공되는데, 이 신호는 상기 N-채널 오디오 신호에 관한 M-채널 신호 데이터로서, M은 N보다 작은 상기 M-채널 신호 데이터; 멀티-채널 확장을 위한 제1 개선 데이터로서, 상기 제1 M-채널 신호와 다른 제2 M-채널 신호와 관련되는 상기 제1 개선 데이터, 상기 제2 M-채널 신호에 대한 상기 제1 M-채널 신호에 관한 제2 개선 데이터로서, 상기 제1 M-채널 신호에 대한 상대적 개선 데이터 및 절대적 개선 데이터를 포함하는 상기 제2 개선 데이터, 및 신호 블록을 위한 상기 제2 개선 데이터가 절대적 개선 데이터인지 또는 상대적 개선 데이터인지를 나타내는 표시 데이터를 포함한다.
본 발명의 또 다른 양상에 따르면, 전술한 신호를 저장하고 있는 저장 매체가 제공된다.
본 발명의 또 다른 양상에 따르면, 인코딩된 멀티-채널 오디오 신호를 송신하는 송신기에 있어서, 전술한 멀티-채널 오디오 인코더를 포함하는 송신기가 제공된다.
본 발명의 또 다른 양상에 따르면, 멀티-채널 오디오 신호를 수신하기 위한 수신기에 있어서, 전술한 멀티-채널 오디오 디코더를 포함하는 수신기가 제공된다.
본 발명의 또 다른 양상에 따르면, 인코딩된 멀티-채널 오디오 신호를 전송 채널을 통해 수신기로 송신하기 위한 송신기를 포함하는 송신 시스템에 있어서, 상기 송신기는 전술한 멀티-채널 오디오 인코더를 포함하고, 상기 수신기는 전술한 멀티-채널 오디오 디코더를 포함하는 송신 시스템이 제공된다.
본 발명의 또 다른 양상에 따르면, 인코딩된 멀티-채널 오디오 신호를 송신하는 방법에 있어서, N-채널 오디오 신호를 인코딩하는 하는 단계를 포함하고, 상기 인코딩은, 상기 N-채널 오디오 신호에 관한 제1 M-채널 신호를 생성하는 단계로서, M은 N보다 작은 상기 생성 단계; 상기 N-채널 오디오 신호에 대한 상기 제1 M-채널 신호에 관한 제1 개선 데이터를 생성하는 단계; 상기 N-채널 오디오 신호에 관한 제2 M-채널 신호를 생성하는 단계; 상기 제1 M-채널 신호에 대한 상기 제2 M-채널 신호에 관해 제2 개선 데이터를 생성하는 단계; 및 상기 제2 M-채널 신호, 상기 제1 개선 데이터 및 상기 제2 개선 데이터를 포함하는 인코딩된 출력 신호를 생성하는 단계를 포함하고, 상기 제2 개선 데이터의 생성은 상기 제2 M-채널 신호에 대한 상대적 개선 데이터로서, 또는 절대적 개선 데이터로서 상기 제2 개선 데이터를 생성하는 것 중에서 동적으로 선택하는 것을 포함하는, 인코딩된 멀티-채널 오디오 신호를 송신하는 방법이 제공된다.
본 발명의 또 다른 양상에 따르면, 인코딩된 멀티-채널 오디오 신호를 수신하는 방법에 있어서, 상기 인코딩된 멀티-채널 오디오 신호를 디코딩하는 단계를 포함하고, 상기 디코딩은, 상기 인코딩된 멀티-채널 오디오 신호를 수신하는 단계로서, 상기 인코딩된 멀티-채널 오디오 신호는, 상기 N-채널 오디오 신호에 관한 제1 M-채널 신호로서, M은 N보다 작은 상기 제1 M-채널 신호, 멀티-채널 확장을 위한 제1 개선 데이터로서, 상기 제1 M-채널 신호와 다른 제2 M-채널 신호와 관련되는 상기 제1 개선 데이터, 상기 제2 M-채널 신호에 대한 상기 제1 M-채널 신호에 관한 제2 개선 데이터로서, 상기 제1 M-채널 신호에 대한 상대적 개선 데이터 및 절대적 개선 데이터를 포함하는 상기 제2 개선 데이터, 및 신호 블록을 위한 상기 제2 개선 데이터가 절대적 개선 데이터인지 또는 상대적 개선 데이터인지를 나타내는 표시 데이터를 포함하는, 상기 인코딩된 오디오 신호를 수신하는 단계; 상기 제1 M-채널 신호 및 상기 제2 개선 데이터에 응답하여 M-채널 멀티-채널 확장 신호를 생성하는 단계; 및 상기 M-채널 멀티-채널 확장 신호 및 상기 제1 개선 데이터에 응답하여 N-채널 디코딩된 신호를 생성하는 단계를 포함하고, 상기 M-채널 멀티-채널 확장 신호의 생성은 상기 표시 데이터에 응답하여 상기 제2 개선 데이터를 절대적 개선 데이터로서 또는 상대적 개선 데이터로서 적용하는 것 중에서 선택하는 것을 포함하는, 인코딩된 멀티-채널 오디오 신호를 수신하는 방법이 제공된다.
본 발명의 또 다른 양상에 따르면, 오디오 신호를 송신 및 수신하는 방법에 있어서, N-채널 오디오 신호를 인코딩하는 단계로서, 상기 인코딩은, 상기 N-채널 오디오 신호에 관한 제1 M-채널 신호를 생성하는 단계로서, M은 N보다 작은 상기 생성 단계; 상기 N-채널 오디오 신호에 대한 상기 제1 M-채널 신호에 관한 제1 개선 데이터를 생성하는 단계; 상기 N-채널 오디오 신호에 관한 제2 M-채널 신호를 생성하는 단계; 상기 제1 M-채널 신호에 대한 상기 제2 M-채널 신호에 관해 제2 개선 데이터를 생성하는 단계로서, 상기 제2 M-채널 신호에 대한 상대적 개선 데이터로서, 또는 절대적 개선 데이터로서 상기 제2 개선 데이터를 생성하는 것 중에서 동적으로 선택하는 것을 포함하는 상기 제2 개선 데이터의 생성 단계; 및 상기 제2 M-채널 신호, 상기 제1 개선 데이터 및 상기 제2 개선 데이터를 포함하는 인코딩된 출력 신호를 생성하는 단계를 포함하는, 상기 인코딩 단계, 상기 인코딩된 출력 신호를 송신기로부터 수신기로 송신하는 단계, 상기 수신기에서 상기 인코딩된 출력 신호를 수신하는 단계, 상기 인코딩된 출력 신호를 디코딩하는 단계로서, 상기 디코딩은, 상기 제2 M-채널 신호 및 제2 개선 데이터에 응답하여 M-채널 멀티-채널 확장 신호를 생성하는 단계로서, 상기 제2 개선 데이터를 절대적 개선 데이터 또는 상대적 개선 데이터로서 적용하는 것 중에서 선택하는 것을 포함하는 상기 M-채널 멀티-채널 확장 신호 생성 단계; 및 상기 M-채널 멀티-채널 확장 신호 및 상기 제1 개선 데이터에 응답하여 N-채널 디코딩된 신호를 생성하는 단계를 포함하는, 상기 디코딩 단계를 포함하는 오디오 신호를 송신 및 수신하는 방법이 제공된다.
본 발명의 또 다른 양상에 따르면, 전술한 방법의 단계들을 수행하도록 동작하는 컴퓨터 프로그램 제품이 제공된다.
본 발명의 또 다른 양상에 따르면, 전술한 멀티-채널 오디오 인코더를 포함하는 멀티-채널 오디오 레코더가 제공된다.
본 발명의 또 다른 양상에 따르면, 전술한 멀티-채널 오디오 디코더를 포함하는 멀티-채널 오디오 플레이어(60)가 제공된다.
본 발명의 이들 및 또 다른 양상들, 특징들 및 장점들이 이하에서 설명되는 실시예(들)를 참조하여 더욱 명확하게 이해될 것이다.
본 발명의 실시예들이 다음 도면들을 참조하여 예시적인 방식으로 설명될 것이다:
도1은 본 발명의 몇몇 실시예들에 따른 멀티-채널 오디오 인코더의 블록도이다;
도2는 본 발명의 몇몇 실시예들에 따른 멀티-채널 오디오 디코더의 블록도이다;
도3은 본 발명의 몇몇 실시예들에 따른 전송 시스템의 블록도이다;
도4는 본 발명의 몇몇 실시예들에 따른 멀티-채널 오디오 플레이어/레코더의 블록도이다;
도5는 본 발명의 몇몇 실시예들에 따른 멀티-채널 오디오 인코더의 블록도이다;
도6은 본 발명의 몇몇 실시예들에 따른 개선(enhancement) 데이터 생성기의 블록도이다;
도7은 본 발명의 몇몇 실시예들에 따른 멀티-채널 오디오 디코더의 블록도이다;
도8은 멀티-채널 오디오 디코더의 구성요소들의 블록도이다;
도9는 본 발명의 몇몇 실시예들에 따른 멀티-채널 오디오 디코더의 구성요소들의 블록도이다;
도10은 본 발명의 몇몇 실시예들에 따른 멀티-채널 오디오 디코더의 구성요소들의 블록도이다;
도11은 본 발명의 몇몇 실시예들에 따른 멀티-채널 오디오 디코더의 구성요소들의 블록도이다.
다음의 설명은 5.1-2 인코더 및/또는 2-5.1 디코더에 적용가능한 본 발명의 실시예들에 집중한다. 그러나, 본 발명은 이 어플리케이션에 한정되지 않는다는 것을 이해할 수 있을 것이다.
도1은 본 발명의 몇몇 실시예들에 따른 멀티-채널 오디오 인코더(10)의 블록도이다. 이 멀티-채널 오디오 인코더(10)는 N 오디오 신호들(101)을 M 오디오 신호들(102) 및 연관된 변수 데이터(104)로 인코딩하도록 구성된다. 여기에서, M 및 N은 정수들이고, N>M 이고 M≥1이다. 멀티-채널 오디오 인코더(10)의 예는 5.1-2 인코더이고, 여기에서 N은 6, 즉 5+1 채널들이고, M은 2이다. 이러한 멀티-채널 오디오 인코더는 5.1 채널 입력 오디오 신호를 2 채널 출력 오디오 신호, 예컨대 스테레오 출력 오디오 신호, 및 연관된 변수들로 인코딩한다. 멀티-채널 오디오 인코더(10)의 다른 예들이 5.1-1, 6.1-2, 6.1-1, 7.1-2, 및 7.1-1 인코더들이다. 물론, N이 M보다 크고 M이 1 이상이라면 N 및 M에 관해 다른 값들을 갖는 인코더들이 가능하다.
인코더(10)는 제1 인코딩 유닛(110) 및 이에 결합된 제2 인코딩 유닛(120)을 포함한다. 제1 인코딩 유닛(110)은 N 입력 오디오 신호들(101)을 수신하고, N 오디오 신호들(101)을 M 오디오 신호들(102) 및 제1 연관된 변수 데이터(104)로 인코딩한다. M 오디오 신호들(102) 및 제1 연관된 변수 데이터(104)는 N 오디오 신호들(101)을 나타낸다. N 오디오 신호들(101)을 M 오디오 신호들(102)로 인코딩하는 것은 또한 공간 다운-믹스(102)로 부를 수 있다. 유닛(110)은 멀티-채널 오디오 신호(101)를 모노 또는 스테레오 다운-믹스 오디오 신호(102) 및 연관된 변수들(104)로 인코딩하는 종래의 변수(parametric) 멀티-채널 오디오 인코더일 수 있다. 연관된 변수들(104)은 디코더가 모노 또는 스테레오 다운-믹스 오디오 신호(102)로부터 멀티-채널 오디오 신호(101)를 재구성할 수 있도록 한다. 다운-믹스(102)가 2 이상의 채널들을 가질 수 있다는 것을 주의한다.
제1 유닛(110)은 공간 다운-믹스(102)를 제2 유닛(120)에 제공한다. 제2 유닛(120)은 공간 다운-믹스(102)로부터 제2 연관된 변수 데이터(N)의 형태로 제2 개선 데이터(enhancement data)를 생성한다. 제2 연관된 변수 데이터(105)는 공간 다운-믹스(102)를 나타낸다. 즉, 이들 변수들(105)은 디코더가 예컨대, 공간 다운-믹스(102)와 닮은 신호를 합성함으로써, 공간 다운-믹스(102)의 적어도 일부를 재구성할 수 있도록 하는 공간 다운-믹스(102)의 특성 또는 속성을 포함한다. 연관된 변수 데이터는 제1 및 제2 연관된 변수 데이터(104,105)를 포함한다.
제2 연관된 변수 데이터(105)는 K(=M)개의 오디오 신호들(103)로부터 공간 다운-믹스(102)의 재구성을 가능하게 하는 변경 파라미터들(modification parameters)을 포함한다. 이 방식으로, 디코더는 공간 다운-믹스(102)의 더 나은 재구성을 수행할 수 있다. 이 재구성은 인공 다운-믹스와 같은 대안적인 다운-믹스(103) 즉, K개의 오디오 신호들(103)에 기초하여 수행될 수 있다. 디코더는 변경 파라미터들을 대안적인 다운-믹스 신호(103)에 적용하여, 그것은 공간 다운-믹스(102)에 더욱 근접하게 닮게 된다.
제2 유닛(120)은 그 입력단에서 대안적인 다운-믹스(103)를 수신할 것이다. 대안적인 다운-믹스(103)는 외부 소스로부터 인코더(10)에 수신될 수 있고(도1에 도시된 바와 같이), 또는 대안적으로, 대안적인 다운-믹스(103)는 인코더(10) 내에서 예컨대, N 오디오 신호들(101)로부터 생성될 수 있다. 제2 유닛(120)은 적어도 일부의 공간 다운-믹스(102)와 대안적인 다운-믹스(103)를 비교하고, 공간 다운-믹스(102)와 대안적인 다운-믹스(103)의 차, 예컨대 공간 다운-믹스(102)의 속성과 대안적인 다운-믹스(103)의 속성간의 차를 나타내는 변경 파라미터들(105)을 생성한다. 예에서, 명확히, 대안적인 다운-믹스(103)는 공간 다운-믹스와 연관된 인공 다운-믹스이다.
예에서, 제2 유닛(120)은 또한 대안적인 다운-믹스(103)를 참조하지 않고 공간 다운-믹스(102)를 직접 나타내는 절대값들로서 변경 파라미터들을 생성할 수 있다. 또한, 제2 유닛(120)은 인코더 출력 신호에 관해 상대적 및 절대적 변경 파라미터들 중에서 선택하는 기능을 포함한다. 분명히, 이 선택은 신호의 특성 및/또는 변수 데이터에 따라 동적으로 수행되고 개개의 신호 블록들에 관해 수행될 수 있다.
덧붙여, 제2 유닛(120)은 인코딩된 신호 중 상이한 섹션들에 관해 이용된 변경 파라미터(절대적 또는 상대적)가 무엇인지에 관한 표시를 포함하는 기능을 포함할 수 있다. 예를 들어, 각각의 신호 블록에 관해, 상대적 또는 절대적 변수 데이터가 신호 블록들에 관해 포함되었는지를 표시하기 위해 데이터 비트가 포함될 수 있다.
변경 파라미터들(105)은 바람직하게는 하나 이상의 통계적 신호 속성들(사이의 차) 예컨대, 분산(variance), 공분산(covariance), 및 상관(correlation), 또는 이들 특성들의 비율, 또는 다운-믹스 신호(들)(사이의 차)의 비율을 포함한다. 신호의 분산은 그 신호의 에너지 또는 전력과 등가라는 것을 주의한다. 이들 통계적 신호 특성들은 공간 다운-믹스의 양호한 재구성을 가능하게 한다.
도2는 본 발명의 몇몇 실시예들에 따른 멀티-채널 오디오 디코더(20)의 블록도이다. 디코더(20)는 K개의 오디오 신호들(103) 및 연관된 변수 데이터(104,105)를 N 오디오 신호들(203)로 디코딩하도록 구성된다. 여기에서, K 및 N은 정수이고, N>K 이고, K≥1이다. K개의 오디오 신호들(103), 즉 대안적인 다운-믹스(103), 및 연관된 변수 데이터(104,105)는 N 오디오 신호들(203), 즉 멀티-채널 오디오 신호(203)를 나타낸다. 멀티-채널 오디오 디코더(20)의 예는 2-5.1 디코더이고, 여기에서 N은 6, 즉 5+1 채널들이고, K는 2이다. 이러한 멀티-채널 오디오 디코더는 2 채널 입력 오디오 신호, 예컨대 스트레오 입력 오디오 신호, 및 연관된 변수들을 5.1 채널 출력 오디오 신호로 디코딩한다. 멀티-채널 오디오 디코더(20)의 다른 예들이 1-5.1, 2-6.1, 1-6.1, 2-7.1, 및 1-7.1 디코더들이다. 또한, N이 K보다 크고 K가 1이상이면 N 및 K에 관해 다른 값들을 갖는 디코더들이 가능하다.
멀티-채널 오디오 디코더(20)는 제1 유닛(210) 및 이에 결합된 제2 유닛(220)을 포함한다. 제1 유닛(210)은 대안적인 다운-믹스(103) 및 변경 파라미터들(105)의 형태인 개선 데이터를 수신하고, 다운-믹스(103) 및 변경 파라미터들로부터 M 오디오 신호들(202) 즉, 공간 다운-믹스(202) 또는 그의 근사치를 재구성한다. 여기에서, M은 1 이상의 정수이다. 변경 파라미터들(105)은 공간 다운-믹스(202)를 나타낸다. 제1 유닛(210)은 변경 파라미터들(105)이 절대적 또는 상대적 변경 파라미터들인지를 결정하고, 따라서 변수들을 적용하도록 구성된다. 분명히, 제1 유닛(210)은 개개의 신호 블록들에 관한 변경 파라미터들(105)이 상대적 또는 절대적 변수들인지를 수신된 비트스트림 내의 명확한 데이터에 기초하여 결정할 수 있다. 예를 들어, 변수들이 상대적 또는 절대적 변경 파라미터들인지를 표시하는 단일 데이터 비트가 각각의 신호 블록에 관해 그 신호 블록 내에 포함될 수 있다.
제2 유닛(220)은 제1 유닛(210)으로부터의 공간 다운-믹스(202) 및 변경 파라미터들(104)을 수신한다. 제2 유닛(220)은 공간 다운-믹스(202) 및 변경 파라미터들(104)을 멀티-채널 오디오 신호(203)로 디코딩한다. 제2 유닛(220)은 모노 또는 스테레오 다운-믹스 오디오 신호(202) 및 연관된 변수들(104)을 멀티-채널 오디오 신호(203)로 디코딩하는 종래의 변수 멀티-채널 오디오 디코더일 수 있다.
제1 유닛(210)은 입력 신호(103)로부터 신호(202)를 재구성하는 것이 필요한지 또는 희망되는 것인지를 결정하도록 구성된다. 이러한 재구성은 공간 다운-믹스 신호(202)가 대안적인 다운-믹스(103)을 대신하여 제1 유닛(210)에 제공될 때 적용되지 않을 것이다. 제1 유닛(210)은 입력 신호(103)로부터 변경 파라미터들 내에 포함되어 있는 것과 유사한 또는 동일한 신호 속성들을 생성하고, 이들 생성된 신호 속성들을 변경 파라미터들(105)과 비교함으로써 이것을 결정할 수 있다. 이 비교가 생성된 신호 속성들이 변경 파라미터들(105)과 동일하거나 거의 동일하다는 것을 보여준다면, 입력 신호(103)는 충분히 공간 다운-믹스 신호(202)와 비슷하고, 제1 유닛(210)은 입력 신호(103)를 제2 유닛(220)에 전달할 수 있다. 비교가 생성된 신호 속성들이 변경 파라미터들(105)과 동일하지 않거나 거의 동일하지 않다는 것을 보여준다면, 입력 신호(103)는 충분히 공간 다운-믹스 신호(202)와 비슷하지 않고, 제1 유닛(210)은 입력 신호(103) 및 변경 파라미터들(105)로부터 공간 다운-믹스 신호(202)를 재구성/근사화할 수 있다.
제1 유닛(210)은 대안적인 다운-믹스로부터, 대안적인 다운-믹스(103)를 나타내는 변경 파라미터들/속성들을 생성할 수 있다. 이 경우, 제1 유닛(210)은 대안적인 다운-믹스(103) 및 변경 파라미터들(105) 및 그 이상의(further) 변경 파라미터들(사이의 차이)로부터 공간 다운-믹스(202)를 재구성할 수 있다.
변경 파라미터들(105) 및 그 이상의 변경 파라미터들은 각각 공간 다운-믹스(202) 및 대안적인 다운-믹스(103)의 통계적 속성들을 각각 포함할 수 있다. 이들 통계적 속성들 예컨대, 분산, 상관관계 및 공분산 등이 그들이 유도될 신호들의 좋은 표현들을 제공한다. 그것들은, 대안적인 다운-믹스를 그것의 연관된 속성들이 변경 파라미터들(105)에 포함된 속성들과 정합하도록 변형함으로써 공간 다운-믹스(202)를 재구성하는데 유용하다.
도3은 본 발명의 몇몇 실시예들에 따른 전송 시스템(70)의 실시예의 블록도를 도시한다. 전송 시스템(70)은 전송 채널(30), 예컨대 무선 또는 유선 통신 링크를 통해 인코딩된 멀티-채널 오디오 신호를 수신기(50)에 제공하기 위한 전송기(40)를 포함한다. 전송기(40)는 전술된 바와 같은, 멀티-채널 오디오 신호(101)를 공간 다운-믹스(102) 및 연관된 변수들(104,105)로 인코딩하기 위한 멀티-채널 오디오 인코더(10)를 포함한다. 전송기(40)는 또한 변수들(104,105) 및 공간 다운-믹스(102) 또는 대안적인 다운-믹스(103)를 포함하는 인코딩된 멀티-채널 오디오 신호를 전송 채널(30)을 통해 수신기(50)로 전송하기 위한 수단(41)을 포함한다. 수신기(50)는 인코딩된 멀티-채널 오디오 신호를 수신하기 위한 수단(51)과, 대안적인 다운-믹스(103) 또는 공간 다운-믹스(102) 및 연관된 변수들(104,105)을 멀티-채널 오디오 신호(203)로 디코딩하기 위한, 전술한 바와 같은, 멀티-채널 오디오 디코더(20)를 포함한다.
도4는 본 발명의 몇몇 실시예들에 따른 멀티-채널 오디오 플레이어/레코더(60)의 실시예의 블록도를 보여준다. 오디오 플레이어/레코더(60)는 본 발명의 몇몇 실시예에 따른 멀티-채널 오디오 디코더(20) 및/또는 멀티-채널 오디오 인코더(10)를 포함한다. 오디오 플레이어/레코더(60)는 예컨대, 솔리드-스테이트 메모리 또는 하드 디스크와 같은 그 자체의 저장수단을 가질 수 있다. 오디오 플레이어/레코더(60)는 또한 착탈가능한 저장 수단 예컨대, (기록가능한) DVD 디스크 또는 (기록가능한) CD 디스크들을 이용할 수 있다. 저장된, 대안적인 다운-믹스(103) 및 변수들(104,105)을 포함하는 인코딩된 멀티-채널 오디오 신호들은 디코더(20)에 의해 디코딩될 수 있고, 오디오 플레이어/레코더(60)에 의해 플레이 또는 재생될 수 있다. 인코더(10)는 저장 수단 상의 저장을 위해 멀티-채널 오디오 신호들을 인코딩할 수 있다.
도5는 본 발명의 몇몇 실시예들에 따른 멀티-채널 오디오 인코더(10)의 블록도를 도시한다. 도5의 인코더는 특히 도1의 인코더(10)일 수 있다. 인코더(10)는 제1 유닛(110) 및 그에 결합된 제2 유닛(120)을 포함한다. 제1 유닛(110)은 좌 전방, 좌 후방, 우 전방, 우 후방, 중앙을 포함하는 5.1 멀티-채널 오디오 신호(101) 및 각각의 낮은 주파수 강화 오디오 신호들(lf, lr, rf, rr, co, lfe)을 수신한다. 제2 유닛(120)은 좌측 예술적인 및 우측 예술적인 오디오 신호들(la, ra)을 포함하는 예술적인 스테레오 다운-믹스(103)를 수신한다. 멀티-채널 오디오 신호(101) 및 인공 다운-믹스(103)는 시간-영역의 오디오 신호들이다. 제1 및 제2 유닛들(110,120)에서, 이들 신호들(101,103)은 분할되고 및 주파수-시간 영역으로 변환된다.
제1 유닛(110)에서, 변수 데이터(104)는 3 단계들에서 유도된다. 제1 단계에서, 오디오 신호들의 3쌍들 즉, lf와 rf, rf와 rr, 및 co와 lfe이 분할되고, 분할된 신호들이 분할 및 변환 유닛들(112,113,114) 각각에서 주파수 영역으로 변환된다. 분할된 신호들의 결과적인 주파수 영역 표현들이 각각의 주파수 영역 신호들(Lf, Lr, Rf, Rr, Co, LFE)로서 보여진다. 제2 단계에서, 이들 주파수 영역 신호들의 3 쌍들 즉, Lf 및 Lr, Rf 및 Rr, Co 및 LFE가 다운-믹서들(115,116,117) 각각에서 다운-믹스되어, 모노 오디오 신호들(L,R,C) 각각 및 연관된 변수들(141,142,143) 각각을 생성한다. 다운-믹서들(115,116,117)은 종래 MPEG4 변수 스테레오 인코더들일 수 있다. 마지막으로 제3 단계에서, 세 모노 오디오 신호들(L,R,C)은 다운-믹서(118)에서 다운-믹스되어 공간 스테레오 다운-믹스(102) 및 연관된 변수들(144)을 얻는다. 공간 다운-믹스(102)는 신호들(Lo, Ro)을 포함한다.
변수 데이터(141,142,143,144)는 제1 개선 데이터에 제1 연관된 변수 데이터(104)의 형태로 포함된다. 변수 데이터(104) 및 공간 다운-믹스(102)는 5.1 입력 신호들(101)을 나타낸다.
제2 유닛에서, 오디오 신호들(la, ra) 각각에 의해 시간 영역에서 표현되는 인공 다운-믹스 신호(103)는 우선 분할 유닛(121)에서 분할된다. 결과적으로 분할된 오디오 신호(127)는 신호들(las,ras)을 포함한다. 다음, 이 분할된 오디오 신호(127)는 변환기(122)에 의해 주파수 영역으로 변환된다. 결과적인 주파수 영역 신호(126)는 신호들(La,Ra)을 포함한다. 마지막으로, 분할된 인공 다운-믹스(103)의 주파수 영역 표현인 주파수 영역 신호(126)와 분할된 공간 다운-믹스(102)의 주파수 영역 표현이, 변경 파라미터들(105)의 형태로 추가의(제2) 개선 데이터를 생성하는 생성기(123)에 제공되며, 이 변수들(105)은 디코더가 인공 다운-믹스(103)를 변경/변형할 수 있도록 하여, 그것이 공간 다운-믹스(102)에 더욱 근접하게 닮게 한다.
특정한 예에서, 분할된 시간-영역 신호(127)는 또한 선택기(124)에 제공된다. 이 선택기(124)로의 또 다른 두 입력들이 공간 스테레오 다운-믹스(102)의 주파수 영역 표현과 제어 신호(128)이다. 제어 신호(128)는 선택기(124)가 인코딩된 멀티-채널 오디오 신호의 일부로서 인공 다운-믹스(103)를 출력할 것인지 또는 공간 다운-믹스(102)를 출력할 것인지를 결정한다. 공간 다운-믹스(102)는 인공 다운-믹스가 이용 가능하지 않을 경우에 선택될 수 있다. 제어 신호(128)는 수동적으로 설정될 수 있고, 또는 인공 다운-믹스(103)의 존재를 감지함으로써 자동으로 생성될 수 있다. 제어 신호(128)는 변수 비트-스트림에 포함될 수 있어, 대응하는 디코더(20)가 그것을 후술하는 바와 같이 이용할 수 있다. 따라서, 특정 예시적인 인코더는 공간 다운-믹스(102) 또는 인공 다운-믹스(103)를 포함하는 신호가 생성되도록 할 수 있다.
선택기(124)의 출력 신호(102,103)가 신호들(lo,ro)로서 보여진다. 예술적인 스테레오 다운-믹스(127)가 선택기(124)에 의해 출력되어지고자 한다면, 분할된 시간 영역 신호들(las,ras)이 신호들(lo,ro)로 중첩-부가하여 선택기(124)에 의해 결합된다. 공간 스테레오 다운-믹스(102)가 제어 신호(128)에 의해 지시되는 대로 출력되고자 한다면, 선택기(124)는 신호들(Lo,Ro)을 다시 시간 영역으로 변환하고, 그것들을 신호들(lo,ro)로의 중첩-부가를 통해 결합한다. 시간-영역 신호들(lo,ro)이 5.1-2 인코더(10)의 스테레오 다운-믹스를 형성한다.
생성기(123)에 관한 더욱 상세한 설명이 이하에서 제공된다. 생성기(123)의 기능은 제2 개선 데이터 및 특히 변경 파라미터들을 결정하는 것이며, 이 변수들은 인공 다운-믹스(103)의 변형을 기술하여, 어떤 의미에서는, 그것이 원래의 공간 다운-믹스(102)에 닮도록 한다.
일반적으로, 이 변형은 다음과 같이 기술될 수 있다:
Figure 112007077958108-pct00001
여기에서, L a R a 는 인공 다운-믹스(103)의 좌측 및 우측 채널의 시간/주파수 타일(tile)의 예들을 포함하는 벡터들이고, L d R d 는 변형된 인공 다운-믹스의 좌측 및 우측 채널의 시간/주파수 타일의 예들을 포함하는 벡터들이고, A 1 ,..., A N 는 선택적인 보조 채널의 시간/주파수 타입의 샘플들을 포함하고, T는 변환 행렬이다. 임의의 벡터 V 는 열 벡터로서 정의된다는 것을 주의한다. 변형된 인공 다운-믹스는 그것이 원래의 공간 다운-믹스(102)와 닮도록 변환에 의해 변환된 인공 다운-믹스(103)다. 보조 채널들( A 1 ,..., A N )은 설명된 시스템에서, 공간 다운-믹스 신호들 또는 그것의 낮은 주파수 콘텐트이다.
(N+2)×2-변환 행렬(T)은 인공 다운-믹스(103) 및 보조 채널들로부터 변경된 인공 다운-믹스로의 변환을 기술한다. 변환 행렬(T) 또는 그의 원소들이 바람직하게 변경 파라미터들(105)에 포함되어, 디코더(20)는 변환 행렬(T)의 적어도 일부를 재구성할 수 있다. 그 후에, 디코더(20)는 변환 행렬(T)을 인공 다운-믹스(103)에 적용하여 공간 다운-믹스(102)를 재구성할 수 있다(이하에서 설명됨).
대안적으로, 변경 파라미터들(105)은 공간 다운-믹스(102)의 신호 속성들 예컨대, 에너지 또는 파워 값들 및/또는 상관관계 값들을 포함한다. 디코더(20)는 인공 다운-믹스(103)로부터 그러한 신호 속성들을 생성할 수 있다. 공간 다운-믹스(102) 및 인공 다운-믹스(103)의 신호 속성들은 디코더(20)가 변환 행렬(T)을 구성할 수 있도록 하고, 및 그것을 인공 다운-믹스(103)에 적용하여 공간 다운-믹스(102)를 재구성할 수 있도록 한다(또한, 이하에서 설명됨).
특히, 생성기(123)는 상대적 및 절대적 변경 데이터 모두를 생성하고, 개별적인 신호 블록들(또는 세그먼트들)에 관해 이 데이터 중에서 선택하도록 구성된다. 따라서, 인코딩된 신호에 관한 변경 파라미터들(105)은 상이한 신호 블록들에 관해 절대적 변경 데이터 및 상대적 변경 데이터를 모두 포함한다. 절대적 변경 데이터와는 대조적으로, 상대적 변경 데이터는 인공 다운-믹스(103)에 상대적으로 공간 다운-믹스(102)를 기술한다. 특히, 상대적 변경 데이터는 인공 다운-믹스 샘플들이 공간 다운-믹스에 (더욱 근접하게) 대응하도록 변경되도록 허용하는 차동 데이터일 수 있고, 반면 절대적 다운-믹스 데이터는 어떠한 참조도 없이 또는 인공 다운-믹스 샘플들에 관한 의존없이 공간 다운-믹스에 직접 대응한다.
다음을 포함하여, 원래의 스테레오 다운-믹스(102)와 닮도록 하기 위하여, 예술적인 스테레오 다운-믹스(103)를 변경하는 여러 방식들이 있다는 것을 이해할 것이다:
I. 파형들의 정합.
II. 통계적 속성들의 정합:
a. 좌측 및 우측 채널의 에너지 또는 파워의 정합
b. 좌측 및 우측 채널의 공분산 행렬의 정합
III. 좌측 및 우측 채널의 에너지 또는 파워 정합의 제약하에서, 파형의 가능한 최선의 정합을 구함.
IV. 전술한 방법들 I~III을 혼합.
명료화를 위해, (I)의 보조 채널들이 우선 고려되지 않아, 변환 행렬(T)은 다음과 같이 쓰여질 수 있다:
Figure 112007077958108-pct00002
및, 상대적 개선 데이터가 예를 들어 다음과 같이 생성될 수 있다.
I. 파형 정합(방법 I)
인공 다운-믹스(103) 및 공간 다운-믹스(102)의 파형들의 정합이, 변형된 인공 다운-믹스의 좌측 및 우측 신호 모두를 예술적인 스테레오 다운-믹스(103)의 좌측 및 우측 신호의 선형 조합으로서 표현함으로써 얻어질 수 있다:
Figure 112007077958108-pct00003
다음, (2)의 행렬(T)은 다음과 같이 쓰여질 수 있다:
Figure 112007077958108-pct00004
변수들(α1212)을 선택하는 방법은, 공간 다운-믹스 신호들(Ls,Rs) 사이의 유클리디안 거리 및 그 평가들(즉, 변경된 인공 다운-믹스 신호들(Ld,Rd))을 최소화하는 것이다. 따라서
Figure 112007077958108-pct00005
Figure 112007077958108-pct00006
II. 통계적 속성들의 정합(방법 II)
방법 II.a: 좌측 및 우측 신호들의 에너지들을 정합하는 것이 이제 논의된다. 각각 Ld 및 Rd로 표시되는, 변경된 좌측 및 우측 인공 다운-믹스 신호가 다음과 같이 산출된다:
Figure 112007077958108-pct00007
여기에서, 실수 변수들의 경우, α 및 β는 다음 식에 의해 주어진다:
Figure 112007077958108-pct00008
이에 의해, 변환 행렬(T)은 다음과 같이 쓰여질 수 있다:
Figure 112007077958108-pct00009
이 선택들로, 신호들(L d R d)은 신호들(L s R s)과 각각 동일한 에너지를 갖는다는 것이 확인될 수 있다.
방법 II.b: 예술적인 스테레오 다운-믹스(103) 및 공간 다운-믹스(102)의 공분산 행렬들을 정합시키기 위하여, 이들 행렬들은 다음과 같은 고유값 분해(eigenvalue decomposition)를 이용하여 분해될 수 있다:
Figure 112007077958108-pct00010
여기에서, 예술적인 스테레오 다운-믹스의 공분산 행렬(Ca)는 다음과 같이 주어진다:
Figure 112007077958108-pct00011
Ua는 단위 행렬이고, S a는 대각선 행렬이다. C 0는 공간 스테레오 다운-믹스(102)의 공분산 행렬이고, U 0는 단위 행렬이고, S0는 대각선 행렬이다. 아래 수식 (11)을 계산하는 경우, 2개의 상호 연관되지 않은 신호들( L aw R aw)이 구해지고, 이 신호들은 단위 에너지를 갖는다(행렬 S a -1/2과의 곱셈에 기인하여):
Figure 112007077958108-pct00012
다음 수식(12)을 계산함으로써, 우선 [ L a R a]의 공분산 행렬이 단위 행렬과 동일한 공분산 행렬 즉, [ L a R a]U a S a -1/2의 공분산 행렬로 변환된다:
Figure 112007077958108-pct00013
임의의 단위 행렬(Ur)을 적용하는 것이 공분산 구조를 변화시키지 않을 것이고, S 0 -1/2 U 0 H 공간 스테레오 다운-믹스(102)의 공분산 구조와 동일한 공분산 구조를 도출한다.
행렬(S 0w) 및 신호들( L 0w R 0w)을 다음과 같이 정의한다:
Figure 112007077958108-pct00014
가장 가능성 있는 파형 정합이, 최소 자승 유클리디안 거리의 관점에서, 신호들( L 0w L aw) 및 신호들( R ow R aw) 사이에 얻어지도록, 행렬(U r)이 선택될 수 있다. 여기에서, L aw R aw는 (11)에 의해 주어진다. U r의 이와 같은 선택으로, 통계적 방법 내에서의 파형 정합이 이용될 수 있다.
(12)로부터, 변환 행렬이 다음과 같이 주어진다는 것을 알 수 있다:
Figure 112007077958108-pct00015
III. 에너지 제약 하에서의 최선의 파형 정합(방법 III)
에너지 제약들 하에서 (4) 및 (5)를 최소화함으로써, (3)을 가정하면, 변수들(α1212)이 얻어질 수 있다.
Figure 112007077958108-pct00016
IV. 혼합 방법(방법 IV)
상이한 방법들을 혼합하는 것에 대하여, 가능한 조합들이 방법들(II.a 및 II.b)을 섞는 것과, 방법들(II.a 및 III)을 섞는 것을 포함한다. 다음과 같이 진행할 수 있다:
a) 방법 II.b/III을 이용하여 얻어지는 L s L d 사이 및 R s R d 사이에서의 파형 정합이 좋다면, 방법 II.b/III을 이용하라.
b) 이 파형 정합이 좋지 않다면, 방법 II.a를 이용하라.
c) 그들의 변환 행렬들을 혼합함으로서, 이 파형 정합의 품질의 함수로서 두 방법들 사이에서의 점진적인 천이를 보장하라.
이것은 다음과 같이 수학적으로 표현될 수 있다:
(3) 및 (2)를 이용하여, 변환 행렬(T)을 다음과 같은 일반적인 형태로 쓸 수 있다:
Figure 112007077958108-pct00017
이 행렬을 두 벡터들(T LT R)을 이용하여 다음과 같이 쓸 수 있다:
Figure 112007077958108-pct00018
방법 II.b 또는 방법 III을 이용하여 구해지는 L sL d 사이의 파형 정합의 품질은 γL로 표현되며, 다음과 같이 정의된다:
Figure 112007077958108-pct00019
방법 II.b 또는 방법 III을 이용하여 구해지는 R sR d 사이의 파형 정합의 품질은 γR로 표현되며, 다음과 같이 정의된다:
Figure 112007077958108-pct00020
γL 및 γR은 모두 0과 1 사이다. 좌측 채널의 혼합 계수(δL) 및 우측 채널의 혼합 계수(δR)는 다음과 같이 정의될 수 있다:
Figure 112007077958108-pct00021
여기에서, μL, min, μL, max, μR, min, μR, mzx는 0과 1 사이의 값이고, μL,minL,max이고 μR, minR, mzx이다. 수식(20)은 혼합 계수들(δLR)이 0과 1 사이라는 것을 보장한다.
방법 II.a, II.b 및 III의 변환 행렬(T)을 (8)에 의해 주어지는 Te, (14)에 의해 주어지는 Ta, 및 Tce로 각각 정의한다. 각각의 변환 행렬은, (17)에서 T의 분할과 유사하게, 다음과 같이 2개의 벡터들로 분할될 수 있다:
Figure 112007077958108-pct00022
방법 II.a 및 방법 II.b을 혼합하기 위한 변환 행렬(T)은 다음과 같이 얻어진다:
Figure 112007077958108-pct00023
방법 II.a 및 방법 III을 혼합하기 위한 변환 행렬(T)은 다음과 같이 얻어진다:
Figure 112007077958108-pct00024
이제, 두개의 향상 층 채널들(enhancement layer channels)에 대응하는 두개의 보조 채널들을 고려하면, 상기 수식(1)은 다음과 같이 쓸 수 있다:
Figure 112007077958108-pct00025
여기에서, L a, R a(전과 같이)은 인공 다운-믹스의 좌측 및 우측 채널의 시간/주파수 타일의 샘플들을 포함하고, L d R d은 변경된 인공 다운-믹스의 좌측 및 우측 채널의 시간/주파수 타일의 샘플들을 포함하고, L enh, R enh은 향상 층 신호들의의 시간/주파수 타일의 샘플들을 포함한다. 4×2 변환 행렬(T')은 따라서, 인공 다운-믹스 및 향상 층 신호들로부터 변경된 인공 다운-믹스로의 변환을 기술한다. 수식(1)과 대하여, 여기에서 이용된 오직 2개의 보조 채널들이 향상 층 신호들(L enh, R enh)이다.
특정의 예시적인 시스템에서, 제2 향상 층이 2개의 다른 유형들의 데이터를 포함할 수 있다:
제1 유형의 데이터는 수식(1)의 행렬(T)에 포함된 변수들을 포함한다. 이들 변수들은 예에서 전체 신호 대역을 위해 산출되고, 예술적인 스테레오 다운-믹스를 변환하여 그것이 어떤 의미에서 공간 다운-믹스를 닮게 한다. 따라서, 이 유형의 변수들은 원래의 공간 다운-믹스와 더욱 근접하게 닮은 변경된 인공 다운-믹스를 제공할 수 있으나, 디코더가 정확히 공간 다운-믹스를 생성하도록 하지는 않는다(반드시 생성하도록 하는 것은 아니다). 각각의 시간/주파수 타일에 관해, 오직 4개의 변수들이 필요한데, 즉 T의 값들이 요구된다(T11,T12,T21,T22). 이들 변수들은 절대적으로 또는 차동적으로(differentially) 코딩될 수 있고, 인코더(10)는 절대적 및 차동적 인코딩 사이에서 특징적으로 전환할 수 있다.
제2 유형의 데이터는 실제의 공간 다운-믹스에 대응하고, 특정 예에서 공간 다운-믹스의 대역-제한된 버전의 표현이다. 상세하게, 이 유형의 데이터는 공간 다운-믹스의 낮은 주파수 부분을 나타낸다(예컨대, 가령 1.7kHz 이하의 주파수). 이것은 동일한 것 예컨대, 통계적, 속성들(행렬 T에서와 같은)을 단지 생성하기 보다는 디코더에서 공간 다운-믹스의 이 부분을 매우 정확하게 재구성하는 것을 가능하게 한다. 이 유형의 데이터는 인공 다운-믹스로 절대적으로 또는 상대적으로 코딩될 수 있다. 특히, 이 유형의 데이터는 차동적으로 인코딩될 수 있다. 예를 들어, 변환 행렬(T)은 인공 다운-믹스에 적용되고(예컨대 수식(26) 참조), 그 신호와 공간 다운-믹스의 차이가 인코딩될 수 있다.
따라서, 어떤 실시예들에서는 제2 개선 데이터가 개선 데이터의 제1 부분 및 제2 부분으로 나누어지며, 여기에서 제1 부분은 제2 부분보다는 덜 정확하게 공간 다운-믹스를 기술한다. 통상적으로, 제1 부분이 제2 개선 데이터에 대응하는 데이터 비율은 제2 부분이 제2 개선 데이터에 대응하는 데이터 비율보다 더 낮다. 제2 개선 데이터의 제2 부분의 개선 데이터는 다운-믹스의 부분에만 관련되고, 특히 낮은 주파수 부분에만 관련될 수 있다.
어떤 실시예들에서, 생성기(123)는 제2 개선 데이터의 제1 부분 및 제2 부분 모두에 관한 절대적 및 상대적 데이터 중에 개별적으로 또는 함께 선택하도록 구성될 수 있다. 다른 실시예들에서, 생성기(123)는 데이터의 부분들 중 하나에 관한 절대적 및 상대적 데이터 중에서 선택만 할 수 있다. 특히, 다음 설명되는 실시예들에서, 제2 개선 데이터의 제1 부분이 T의 변수들을 포함하는 반면, 제2 부분은 공간 다운-믹스의 낮은 주파수 표현을 포함하고, 절대적 및 상대적 데이터 간의 동적인 선택이 제2 개선 데이터의 제2 부분에 적용된다.
제1 부분의 개선 데이터가 적용된 후(즉, 변경된 인공 다운-믹스에 상대적 차동 값들로서), 제2 개선 데이터의 제2 부분에 관한 상대적 데이터는, 이들 실시예들에서, 예컨대 인공 다운-믹스에 상대적 차동 값들로서 생성될 수 있다.
다음에서, 생성기(123)가 제2 개선 데이터의 제2 부분에 관한 상대적 및 절대적 데이터 중에서만 선택하는 실시예들이 설명된다.
제2 개선 데이터의 제1 및 제2 부분의 부분에 관해 절대적 개선 데이터가, 본 예에서, 다음과 같이 설정함으로써, 연관된 시간/주파수 타일들에 관해 유도될 수 있다:
Figure 112007077958108-pct00026
여기에서, L s, R s는 공간 스테레오 다운-믹스의 좌측 및 우측 채널의 시간/주파수 타일의 샘플들을 포함한다. 따라서, 이 특정 예에서, 절대적 개선 데이터는 간단히, 인공 다운-믹스(103)의 대응하는 시간/주파수 타일 샘플들을 대체할 수 있는 공간 다운-믹스(102)의 실제 시간/주파수 타일 샘플들에 대응한다.
또한, 제2 개선 데이터의 제1 및 제2 부분의 부분에 관해, 연관된 시간/주파수 타일들에 관한 상대적 개선 데이터가 다음과 같이 설정함으로써 차동 데이터로서 특정적으로 유도될 수 있다.
Figure 112007077958108-pct00027
여기에서, 변수들(T11,T12,T21,T22)은 수식(2)의 행렬(T)을 구성한다:
Figure 112007077958108-pct00028
이 방법으로, 생성기(123)는 멀티-채널 개선 데이터를 생성하기 위해 이용되는 공간 다운-믹스(102)에 매우 밀접하게 닮은 변경된 인공 다운-믹스를 디코더가 생성할 수 있도록 해주는, 인공 다운-믹스(103)에 관한 절대적 개선 데이터 및 상대적 개선 데이터 모두를 생성할 수 있다.
생성기(123)는 또한, 절대적 개선 데이터 및 상대적 개선 데이터 중에 선택하도록 구성된다. 이 선택은 특정 예에서, 개별적인 신호 블록들(예컨대, 개별적인 세그먼트들)에 관해 수행되고, 이 신호 블록들 내의 신호들의 특성에 기초한다. 특히, 생성기(123)는 주어진 신호 블록에 관한 절대적 개선 데이터 및 상대적 개선 데이터의 특성을 평가할 수 있고, 주어진 신호 블록에 관해 개선 층에 어떤 데이터를 포함할지 결정할 수 있다. 덧붙여, 생성기(123)는 선택된 데이터가 어떤 것인지를 나타내는 표시를 포함할 수 있고, 이에 의해 디코더가 수신된 개선 데이터를 올바르게 적용할 수 있도록 한다.
어떤 실시예들에서, 생성기(123)는 절대적 개선 데이터 또는 상대적 개선 데이터가 가장 효과적으로 (예컨대, 주어진 정확도에 관해 가장 적은 수의 비트들로) 인코딩될 수 있는지를 결정하기 위하여 인코딩을 평가할 수 있다. 억지 기법(brute force approach)이 두가지 형태의 개선 데이터를 실제 인코딩하고, 인코딩된 데이터 크기를 비교하기 위하여 이용될 수 있다. 그러나, 이것은 어떤 실시예들에서 복잡한 기법이고, 예시적인 인코더(10)에서 생성기(123)는 상대적 개선 데이터의 신호 에너지에 대한 절대적 개선 데이터의 신호 에너지를 평가하고, 둘 간의 비교에 기초하여 어떤 유형의 데이터를 포함할지를 선택한다.
특히, 오디오 코더기들에 관해 신호를 가능한 적은 에너지의 신호를 인코딩하는 것이 비트율의 관점에서 유익하다. 따라서, 생성기(123)는 가장 낮은 신호 에너지를 갖는 개선 데이터의 유형을 선택한다. 특히, 상대적 개선 데이터가 다음과 같을 때 선택된다:
Figure 112007077958108-pct00029
그렇지 않다면, 절대적 개선 데이터가 선택된다.
상이한 개선 데이터 간에서 전환하는 것의 문제점은 인지가능한 결점들이 초래될 수 있다는 것이다. 예시적인 인코더(10)에서, 생성기(123)는 또한 상이한 개선 데이터 간에 점진적으로(gradually) 전환하기 위한 기능을 포함한다. 따라서, 하나의 신호 블록 내에서의 일 유형 개선 데이터로부터 다음 신호 블록에서의 또 다른 유형으로 직접적으로 전환하는 대신, 데이터의 일 세트로부터 나머지로의 전환이 점진적으로 수행된다.
따라서, (하나의 신호 블록보다 많거나 더 적은 지속 시간을 가질 수 있는) 시간 간격 동안, 생성기(123)는 절대적 개선 데이터 및 상대적 개선 데이터의 조합으로서 개선 데이터를 생성한다. 조합은 예컨대, 상이한 유형들의 데이터 간의 보간에 의해 달성될 수 있고, 또는 중첩 및 부가 기술을 이용할 수 있다.
특정적인 예로서, 다음과 같은 상이한 유형들의 개선 데이터 간에서 급작스럽게 전환하는 대신:
Figure 112007077958108-pct00030
전송되는 개선 데이터는 다음과 같이 생성될 수 있다:
Figure 112007077958108-pct00031
여기에서, k번째 데이터 프레임에 관한 α의 값은 다음과 같이 결정될 수 있다:
Figure 112007077958108-pct00032
여기에서, αk는 k번째 프레임에서의 α 값이고, δ는 적응 속도다. δ=0.33 의 값은 많은 시나리오들에서 결점-없는 인코딩을 신뢰할 수 있도록 제공할 수 있다. 수식(29)에서 주어진 신호들(L enhR enh)은 중첩 및 부가 기술 또는 변수 보간법을 이용하여 얻어질 수 있고, 비트-스트림으로 인코딩되어 부가될 수 있다. 덧붙여, 차동 또는 절대적 개선 데이터에 대한 결정이 비트-스트림에 포함되고, 이에 의해 디코더가 인코더에서 이용되는 것과 같은 α에 관한 동일한 값을 유도하는 것을 가능하게 한다.
설명이 이들 M-채널들 각각의 (채널내(intra-channel)) 코딩과 함께 차동 및 절대적 모드들을 개별적으로 이용하는 것에 초점을 두고 있으나, 다른 실시예들은 상이한 인코딩 기법을 이용할 수 있다는 것을 이해할 것이다. 예를 들어, M=2에 관해, 스테레오 신호의 (채널간(inter-channel)) 코딩을 수행하는 경우, 다음 단계가 예컨대, M/S 코딩(Mid/Side 코딩, 따라서 삽 및 차이 신호를 코딩함)을 적용하는 것일 수 있다. 많은 실시예들에서, 이것은 개별적인 신호들의 (채널내) 코딩의 절대적 및 차동 모드 모두에 유리할 수 있다.
변환 행렬(T')의 원소들은 실수 또는 복소수일 수 있다. 이 원소들은 다음과 같이 변경 파라미터들로 인코딩될 수 있다: 실수이고 양수인 변환 행렬(T)의 원소들이 MPEG4 변수 스테레오(Parametric Stereo)에서 이용되는 IID 변수들과 같이, 대수적으로(logarithmically) 양자화될 수 있다. 소 신호의 과증폭을 회피하기 위하여, 변수들의 값들에 상한을 설정하는 것이 가능하다. 이 상한은 고정되거나 또는 자동으로 생성된 좌측 채널 및 예술적인 좌측 채널 사이의 상관관계 및 자동으로 생성된 우측 채널 및 예술적인 우측 채널 사이의 상관관계의 함수일 수 있다. 복소수인 T'의 원소들의 크기는 IID 변수들을 이용하여 양자화될 수 있고, 위상은 선형적으로 양자화될 수 있다. 실수이고 음수인 T'의 원소들은, 음수 및 양수의 차이를 확실히 하면서, 원소의 절대값의 대수(로그)를 취하여 코딩될 수 있다.
도6은 도5의 생성기(123)의 예를 더욱 상세히 도시한다. 예에서, 생성기(123)는 신호 블록 프로세서(145)를 포함하고, 이는 주파수 영역 공간 및 인공 다운-믹스들(102,126)을 수신하고 신호들을 신호 블록들로 나눈다. 각각의 신호 블록은 미리결정된 지속 시간의 간격에 대응할 수 있다. 어떤 실시예들에서, 신호 블록들은 대안적으로 또는 부가적으로 주파수 영역에서 분할될 수 있고, 예컨대, 변환 서브채널들은 상이한 신호 블록들에서 함께 그룹지어질 수 있다.
신호 블록 프로세서(145)는 전술된 바와 같이, 개별적인 신호 블록들에 관한 절대적 개선 데이터를 생성하는 절대적 개선 데이터 프로세서(146)에 연결된다. 덧붙여, 신호 블록 프로세서(145)는 전술한 바와 같이, 개별적인 신호 블록들에 관한 상대적 개선 데이터를 생성하는 상대적 개선 데이터 프로세서(147)에 연결된다. 상대적 및 절대적 개선 데이터는 신호 블록 내의 신호 특성에 기초하여 결정되고, 특히 주어진 시간/주파수 타일 그룹에 관한 개선 데이터는 오직 시간/주파수 타일 그룹에 기초하여 결정될 수 있다.
절대적 개선 데이터 프로세서(146)는 전술된 바와 같이, 각각의 신호 블록 내의 절대적 개선 데이터의 신호 에너지를 결정하는 제1 신호 에너지 프로세서(148)에 연결된다. 유사하게, 상대적 개선 데이터 프로세서(147)는 전술된 바와 같이, 각각의 신호 블록 내의 상대적 개선 데이터의 신호 에너지를 결정하는 제2 신호 에너지 프로세서(149)에 연결된다.
제1 및 제2 신호 에너지 프로세서들(148,149)이, 가장 낮은 에너지를 갖는 유형이 무엇인지에 따라 각각의 신호 블록들에 관한 절대적 또는 상대적 개선 데이터를 선택하는 선택 프로세서(150)에 연결된다.
선택 프로세서(150)는 개선 데이터 프로세서(151)에 연결되고, 이 프로세서(151)는 또한 개선 데이터 프로세서(146) 및 상대적 개선 데이터 프로세서(147)에 연결된다. 선택 프로세서(151)는 어느 유형의 개선 데이터가 선택되었는지를 나타내는 제어 신호를 수신하고, 그에 따라 그것은 개선 데이터를 선택된 개선 데이터로서 생성한다. 또한, 선택 프로세서(151)는 전환 시간 간격 동안 절대적 및 상대적 변수들 간의 보간을 포함하는 점진적 전환을 수행하도록 구성된다.
선택 프로세서(151)는 주어진 프로토콜에 따라 개선 데이터를 인코딩하는 인코드 프로세서(152)에 연결된다. 덧붙여, 인코드 프로세서(152)는 예컨대, 각각의 신호 블록에 관해 데이터 유형을 지시하는 비트를 설정함으로써, 각각의 신호 블록에 관해 어떠한 유형의 데이터가 선택되었는지를 알려주는 데이터를 인코드한다. 인코드 프로세서(152)로부터의 인코딩된 데이터는 인코더(10)에 의해 생성되는 인코딩된 비트 스트림에 포함된다.
도7은 특히 도2의 오디오 디코더(20)일 수 있는, 본 발명의 몇몇 실시예들에 따른, 멀티-채널 오디오 디코더의 또 다른 실시예의 블록도이다.
디코더(20)는 제1 유닛(210) 및 이에 연결되는 제2 유닛(220)을 포함한다. 제1 유닛(210)은 다운-믹스 신호들(lo,ro) 및 변경 파라미터들(105)을 입력들로서 수신한다. 입력들은 예컨대, 도1 또는 도5의 인코더(10)로부터의 단일 비트스트림으로서 수신될 수 있다. 다운-믹스 신호들(lo,ro)은 공간 다운-믹스(102) 또는 인공 다운-믹스(103)의 일부일 수 있다.
제1 유닛(210)은 분할 및 변환 유닛(211) 및 다운-믹스 변경 유닛(212)을 포함한다. 분할 및 변환 유닛(211)에서, 다운-믹스 신호들(lo 및 ro)이 각각 분할되고, 분할된 신호들은 주파수 영역으로 변환된다. 분할된 다운-믹스 신호들의 결과적인 주파수 영역 표현들이 주파수 영역 신호들(Lo,Ro)로서 보여진다. 다음, 주파수 영역 신호들(Lo,Ro)이 다운-믹스 변경 유닛(212)에서 처리된다. 이 다운-믹스 변경 유닛(212)의 기능은 입력된 다운-믹스를 변경하여, 그것이 공간 다운-믹스(202)와 닮도록 하는 것이다. 즉, 인공 다운-믹스(103) 및 변경 파라미터들(105)로부터 공간 다운-믹스(202)를 재구성하는 것이다.
공간 다운-믹스(102)가 디코더(20)에 의해 수신된다면, 다운-믹스 변경 유닛(212)은 다운-믹스 신호들(Lo,Ro)을 변경할 필요가 없고, 이들 다운-믹스 신호들(Lo,Ro)은 단지 공간 다운-믹스(202)의 다운-믹스 신호들(Ld,Rd)로서 제2 유닛(220)으로 전달될 수 있다. 제어 신호(127)는 입력 다운-믹스의 변경이 필요한지 여부, 즉, 입력 다운-믹스가 공간 다운-믹스인지 또는 대안적인 다운-믹스인지 여부를 나타낼 수 있다. 제어 신호(217)는 예컨대, 입력된 다운-믹스, 및 희망하는 공간 다운-믹스의 신호 속성들을 기술하는 연관된 변수들(105)을 분석함으로써, 디코더(20)에서 내부적으로 생성될 수 있다. 입력된 다운-믹스가 희망하는 신호 속성들에 정합한다면, 제어 신호(217)는 변경이 필요없다는 것을 지시하도록 설정될 수 있다. 대안적으로, 제어 신호(217)는 수동으로 설정될 수 있고, 또는 그것의 설정이 인코딩된 멀티-채널 오디오 신호의 일부로서 예컨대, 변수 세트(105)로서 수신될 수 있다.
인코더(20)가 인공 다운-믹스(103)를 수신하고, 제어 신호(217)가 수신된 다운-믹스 신호들(Lo,Ro)이 다운-믹스 변경 유닛(212)에 의해 변경되어야 한다는 것을 지시한다면, 디코더는 수신된 변경 파라미터들의 표현에 따라 두 방식들로 동작할 수 있다. 변수들이 인공 다운-믹스로부터 공간 다운-믹스로의 상대적 변환을 나타낸다면(즉, 변수들이 상대적 개선 데이터라면), 인코더에서 수행된 동작과 반대로 변경 파라미터들을 인공 다운-믹스에 적용함으로써 변환 변수들이 직접 얻어진다. 다른 실시예들에서, 이것은 예를 들어 제2 개선 데이터의 제2 부분에 적용될 수 있다.
반면, 전송된 변수들이 공간 다운-믹스의 절대적 속성들을 나타낸다면, 디코더는 직접 인공 다운-믹스 샘플들을 공간 다운-믹스 샘플들로 대체할 수 있다. 예를 들어, 제2 개선 데이터의 제2 부분이 간단히 공간 다운-믹스의 시간/주파수 타일 샘플들로 구성된다면, 디코더는 직접 인공 다운-믹스의 대응하는 시간/주파수 타일 샘플들을 이것들로 대체할 수 있다. 디코더가 실제 전송된 인공 다운-믹스의 대응하는 속성들을 먼저 산출하는 것이 가능하다는 것을 이해할 것이다. 이 정보(전송된 변수들 및 전송된 인공 다운-믹스의 산출된 속성)를 이용하여, 전송된 인공 다운-믹스(의 속성들)로부터 공간 다운-믹스(의 속성들)로의 변환을 기술하는 변환 변수들이 결정된다. 더욱 상세하게는, 변환 행렬(T)은 전술되었던 방법 II.a 또는 (다소 변경된) II.b를 이용하여 결정될 수 있다.
절대적 에너지들이 제2 개선 데이터의 제1 부분으로 전송된다면 방법 II.a가 이용될 수 있다. 전송된 (절대적) 변수들(ELS,ERS)은 공간 다운-믹스의 좌측 및 우측 신호의 에너지를 각각 나타내고, 다음 수식에 의해 주어진다:
Figure 112007077958108-pct00033
전송된 다운-믹스의 에너지들(EDLS,EDRS)은 디코더에서 산출된다. 이들 변수들을 이용하여 우리는 다음과 같이 수식(7)의 변수들(α,β)을 산출할 수 있다:
Figure 112007077958108-pct00034
변환 행렬은 다음에 의해 주어진다:
Figure 112007077958108-pct00035
특히, 다운-믹스 변경 유닛(212)은 수신된 비트스트림으로부터 인공 다운-믹스 및 변경 파라미터들(105)을 추출하는 기능을 포함한다. 인공 다운-믹스는 (디코더에 의해 이용되는 신호 블록들에 대응하는) 신호 블록들로 나뉜다. 각각의 신호 블록에 관해, 다운-믹스 변경 유닛(212)은 이 신호 블록에 관해 제1 및 제2 부분에 관해 상대적 또는 절대적 제2 개선 데이터가 제공되었는지를 결정하기 위하여 수신된 비트스트림의 데이터 표시를 평가한다. 다음, 다운-믹스 변경 유닛(212)은 표시 데이터에 응답하여 제2 개선 데이터의 제1 및 제2 부분을 절대적 개선 데이터 또는 상대적 개선 데이터로서 적용한다.
변환 행렬 원소들(T12,T21)이 0으로 설정될 때, 낮은 복잡도와 높은 성능이 달성될 수 있다는 것아 밝혀졌다. 다음에서는, 이러한 제약 하에서 다운-믹스 변경 유닛(212)의 몇몇 특정 구현예들이 설명된다. 그러나, 구현예들은 T12 및/또는 T21이 0과 다를 때에도 용이하게 확장가능하다는 것을 이해할 수 있을 것이다.
제2 개선 데이터의 제2 부분의 개선 데이터가 인공 다운-믹스 신호에 관해 전송되지 않은 경우, 제1 유닛(210)은 도8에 도시된 바와 같이 구현될 수 있다. 시간 영역 스테레오 다운-믹스 채널들(lo,ro)이 먼저 분할되고, QMF 변환에 의해 주파수 영역으로 변환되어, 예술적인 스테레오 다운-믹스의 시간/주파수 타일을 나타내는 신호들(La,Ra)을 형성한다. 다음, 이들 신호들은 변환 행렬(T)을 이용하여 변환되어, 신호들(T11La,T22Ra)을 형성한다.
개선 데이터는 시간 및/또는 주파수 영역에서 생성되고 적용될 수 있다는 것을 이해할 것이다. 따라서, 코딩된 시간 영역 개선 데이터를 비트-스트림에 포함하는 것이 가능하다. 그러나, 어떤 실시예들에서, 시간 영역 개선 데이터보다는 코딩된 주파수 영역 개선 데이터를 포함하는 것이 유리할 수 있다. 예를 들어, 많은 인코더들에서 개선 데이터는 시간/주파수 타일들에 관해 주파수 영역에서 생성되고, 시간 영역 신호를 생성하기 위하여 주파수-시간 영역 변환이 인코더에서 요구된다. 또한, 그러한 개선 데이터를 적용하기 위하여, 디코더는 시간 영역으로부터 주파수 영역으로 데이터를 변환한다. 영역 변환들은 따라서, 개선 데이터를 주파수 영역으로 포함함으로써 감소될 수 있다.
어떤 실시예들에서, 상이한 시간-주파수 변환들이 인공 다운-믹스 및 개선 데이터를 생성하는데 이용될 수 있다. 예를 들어, 인공 다운-믹스를 인코딩하는것은 QMF 변환을 이용할 수 있는 반면, 개선 데이터는 MDCT 변환을 이용한다. 이 경우, 개선 데이터는 (MDCT) 주파수 영역에 포함될 수 있고, 두 주파수 영역들 간에서의 직접적인 변환이 도9에서 도시된 다운-믹스 변경 유닛(212)에 의해 수행될 수 있다.
이 예에서, 변환 행렬(T*)이 수식(2)의 변환 행렬(T)일 수 있다. 그러나, 전환(전환)을 감소시키기 위하여, T*는 수식(2)의 변환 행렬(T)에 대응할 수 있고, 점진적인 전환을 위해 변경될 수 있다. 특히, 절대적 또는 상대적 개선 데이터에 관한 결정이 비트스트림으로부터 복구되는 경우, 행렬(T*)은 수식(30)에 의해 결정되는 바와 같은 인수(α)를 포함할 수 있다. 제2 개선 데이터의 제2 부분의 개선 층 데이터가 존재하는 경우 그러한 신호 블록들/주파수 대역들에 관해 이용되고, 그렇지 않으면 도8의 방법이 이용될 수 있다.
개선 데이터(Lenh,Renh)가 시간 영역으로 제공된다면, 도9의 것과 유사한 방법이 도10에 도시된 바와 같이 이용될 수 있다. 그러나, 이 경우, 주파수-주파수 변환이 시간-주파수 변환에 의해 대체되고, 이 시간-주파수 변환은 인공 다운-믹스를 인코딩하기 위하여 QMF 변환이 이용될 때 특정적으로 시간-QMF 영역 변환일 수 있다. 따라서, 이 예에서, 개선 데이터는 주파수 영역에서 적용된다.
많은 실시예들에서, 제1 유닛(210)에서 하나의 시간-주파수 영역 변환을 이용하는, 시간 영역 개선 데이터에 관한 디코더 구현예가 이용될 수 있다.
상세하게, 수식(27)에 의해 주어진 행렬(T)이 비특이(non-singular)하다면(따라서 그것의 역행렬이 존재한다면), 다음 차동 개선 데이터 변수들이 이용될 수 있다:
Figure 112007077958108-pct00036
이제 수식(1)은 다음으로 변경될 수 있다:
Figure 112007077958108-pct00037
도11은 수식(34) 및 수식(35)에 기초한 시간 영역 개선 데이터에 관한 다운-믹스 변경 유닛(212)의 효과적인 구현이 제공되는 것을 도시한다. 명확화를 위해, 행렬(T)의 T12 및 T21이 0으로 설정된다. 도10의 구현예와 비교하여, 도11의 구현에서는 하나의 시간-QMF 영역 변환만이 요구된다.
따라서, 전술한 바와 같이, 다운-믹스 변경 유닛(212)은 멀티-채널 개선 데이터에 이용되는 공간 다운-믹스와 매우 근접하게 닮은 신호(202)를 생성한다. 이것은 2 채널 오디오 신호를 완전한 서라운드 멀티-채널 신호로 확장하기 위해 제2 유닛(220)에 의해 효과적으로 이용될 수 있다. 또한, 각각의 신호 블록에 관해 가장 적절한 유형의 개선 데이터(상대적 또는 절대적)를 동적으로 및 유연하게 선택함으로써, 실질적으로 더욱 효과적인 인코딩이 달성되고, 향상된 품질 대 데이터율 비율을 갖는 멀티-채널 인코딩/디코딩이 달성된다.
제2 유닛(220)은 재구성된 공간 다운-믹스(202) 및 연관된 변수 데이터(104)를 5.1 채널 출력 신호(203)로 디코딩하는 종래의 2-5.1 멀티-채널 디코더일 수 있다. 전술된 바와 같이, 변수 데이터(104)는 변수 데이터(141,142,143,144)를 포함한다. 제2 유닛(220)은 인코더(10) 내의 제1 유닛(110)의 역 프로세싱을 수행한다. 제2 유닛(220)은 스테레오 다운-믹스(202) 및 연관된 변수들(144)을 3개의 모노 오디오 신호들(L,R,C)로 변환하는 업-믹서(221)를 포함한다. 다음, 모노 오디오 신호들(L,R,C) 각각은 디코릴레이터들(decorrlators, 222,225,228) 각각에 의해 각각 디코릴레이트(decorrelate)된다. 그 다음, 혼합 행렬(223)이 모노 오디오 신호(L), 그것의 디코릴레이트된 것, 및 연관된 변수들(141)을 신호들(Lf,Lr)로 변환한다. 유사하게, 혼합 행렬(226)은 모노 오디오 신호(R), 그것의 디코릴레이트된 것, 및 연관된 변수들(142)을 신호들(Rf,Rr)로 변환하고, 혼합 행렬(229)은 모노 오디오 신호(C), 그것의 디코릴레이트된 것, 및 연관된 변수들(143)을 신호들(Co,LFE)로 변환한다. 마지막으로, 분할된 주파수-영역 신호들의 세 쌍들(Lf 및 Lr, Rf 및 Rr, Co 및 LFE)이 역변환기들(224,227,230) 각각에서의 중첩-부가에 의해 시간-영역으로 변환되고 결합되어, 출력 신호들의 세 쌍들(lf 및 lr, rf 및 rr, co 및 lfe)을 각각 얻는다. 출력 신호들(lf,lr,rf,rr,co,lfe)이 디코딩된 멀티-채널 오디오 신호(203)를 형성한다.
멀티-채널 오디오 인코더(10) 및 멀티-채널 오디오 디코더(20)는 디지털 하드웨어에 의해, 또는 디지털 신호 프로세서 또는 범용 마이크로프로세서에 의해 실 행되는 소프트웨어에 의해 구현될 수 있다.
전술한 설명은 명료화를 위해 본 발명을 상이한 기능성 유닛들 및 프로세서들을 참조하여 설명하고 있다는 것을 이해할 것이다. 그러나, 상이한 기능성 유닛들 또는 프로세서들 간에 적절한 기능의 분배가 본 발명을 벗어나지 않고 이용될 수 있다는 것은 분명하다. 예를 들어, 개별적인 프로세서들 또는 컨트롤러들에 의해 수행되는 것으로 예시된 기능이 동일한 프로세서 또는 컨트롤러들에 의해 수행될 수 있다. 따라서, 특정 기능성 유닛들을 참조하는 것은, 엄격한 논리적인 또는 물리적인 구조 또는 조직을 나타낸다기 보다는 설명된 기능을 제공하기 위한 적절한 수단에 관한 참조로서 이해되어야 한다.
본 발명은 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 임의의 조합을 포함하는 적절한 임의의 형태로 구현될 수 있다. 본 발명은 선택적으로 하나 이상의 데이터 프로세서들 및/또는 디지털 신호 프로세서들 상에서 동작하는 컴퓨터 소프트웨어로서 적어도 부분적으로 구현될 수 있다. 본 발명의 구성요소들 및 성분들은 물리적으로, 기능적으로, 논리적으로 적절한 방식으로 구현될 수 있다. 기능이 단일 유닛, 복수의 유닛들 또는 다른 기능성 유닛들의 부분에서 구현될 수 있다. 그와 같이, 본 발명은 단일 유닛에서 구현될 수 있고, 또는 상이한 유닛들 및 프로세서들 간에 물리적으로 및 기능적으로 분배될 수 있다.
본 발명이 몇몇 실시예들과 연대하여 설명되었지만, 본 발명은 여기에 설명된 특정한 형태에 한정되는 것은 아니다. 오히려 본 발명의 범위는 첨부된 청구범위에 의해서만 제한된다. 부가적으로, 특징이 특정 실시예들과 연관되어 설명된 것으로 보일 수 있지만, 당업자는 설명된 실시예들의 다양한 특징들이 본 발명에 따라 조합될 수 있다는 것을 이해할 수 있을 것이다. 청구범위에서, 포함한다는 것은 다른 구성요소들 또는 단계들의 존재를 배제하는 것이 아니다.
또한, 개별적으로 리스트되었더라도, 복수의 수단들, 구성요소들 또는 방법 단계들이 예컨대 단일 유닛 또는 프로세서에 의해 구현될 수 있다. 더붙여, 개별적인 특징들이 상이한 청구항들에 포함될 수 있지만, 이들이 유리하게 조합될 수 있고, 다른 청구항들에서의 포함이 특징들의 조합이 실현 가능하지 않다거나 유리하지 않다는 것을 암시하는 것이 아니다. 또한, 청구항들의 하나의 카테고리에 내의 특징의 포함이 적절한 다른 청구항 카테고리들에도 동일하게 적용될 수 있다. 또한, 청구항들 내에서의 특징들의 순서가 특징들이 수행되어야 하는 특정한 순서를 의미하는 것이 아니며, 특히 방법 청구항에서 개별적인 단계들의 순서는 단계들이 이 순서로 수행되어야 한다는 것을 암시하는 것이 아니다. 오히려, 단계들은 적절한 순서들로 수행될 수 있다. 덧붙여, 단수 표현은 복수를 배제하는 것이 아니다. 하나, 제1, 제2 등과 같은 표현은 복수를 배제하지 않는다. 청구항들에서의 명백한 예로서 단지 제공되는 참조 부호들이 청구항들의 범위를 제한하는 것으로 이해되어서는 안 된다.

Claims (31)

  1. N-채널 오디오 신호를 인코딩하기 위한 멀티-채널 오디오 인코더(10)에 있어서,
    상기 N-채널 오디오 신호에 관한 제1 M-채널 신호를 생성하기 위한 수단(110)으로서, 상기 M은 상기 N보다 작은, 상기 제1 M-채널 신호 생성 수단(110);
    상기 N-채널 오디오 신호에 대한 상기 제1 M-채널 신호에 관해 제1 개선 데이터(enhancement data)를 생성하기 위한 수단(115,116,117,118);
    상기 N-채널 오디오 신호에 관한 제2 M-채널 신호를 생성하기 위한 수단(121);
    상기 제1 M-채널 신호에 대한 상기 제2 M-채널 신호에 관해 제2 개선 데이터를 생성하기 위한 개선 수단(123); 및
    상기 제2 M-채널 신호, 상기 제1 개선 데이터, 및 상기 제2 개선 데이터를 포함하는 인코딩된 출력 신호를 생성하는 수단(120)을 포함하고,
    상기 개선 수단(123)은 상기 제2 M-채널 신호에 대하여 상기 제2 개선 데이터를 절대적 개선 데이터로서 또는 상대적 개선 데이터로서 생성하는 것 중에서 동적으로(dynamically) 선택하도록 구성되고, 상기 절대적 개선 데이터는 상기 제2 M-채널 신호를 참조하지 않고 상기 제1 M-채널 신호의 재구성을 가능하게 하는 반면, 상기 상대적 개선 데이터는 상기 제2 M-채널 신호를 참조하여 상기 제1 M-채널 신호의 재구성을 가능하게 하는, 멀티-채널 오디오 인코더(10).
  2. 제1항에 있어서,
    상기 개선 수단(123)은 상기 N-채널 신호의 특성에 응답하여, 상기 절대적 개선 데이터 및 상기 상대적 개선 데이터 중에서 하나를 선택하도록 구성되는, 멀티-채널 오디오 인코더(10).
  3. 제1항에 있어서,
    상기 개선 수단(123)은 상기 절대적 개선 데이터 및 상기 상대적 개선 데이터의 상대적 특성에 응답하여, 상기 절대적 개선 데이터 및 상기 상대적 개선 데이터 중에서 하나를 선택하도록 구성되고,
    상기 상대적 특성은 상기 상대적 개선 데이터의 신호 에너지에 대한 상기 절대적 개선 데이터의 신호 에너지인, 멀티-채널 오디오 인코더(10).
  4. 삭제
  5. 제1항에 있어서,
    상기 개선 수단(123)은 상기 제2 M-채널 신호를 신호 블록들로 분할하고, 각각의 신호 블록에 관해 개별적으로 상기 절대적 개선 데이터 및 상기 상대적 개선 데이터 중에서 하나를 선택하도록 구성된, 멀티-채널 오디오 인코더(10).
  6. 제5항에 있어서,
    상기 개선 수단(123)은 상기 신호 블록에 연관된 특성들에만 기초하여 신호 블록에 관해 상기 상대적 개선 데이터 및 상기 절대적 개선 데이터 중에서 하나를 선택하도록 구성된, 멀티-채널 오디오 인코더(10).
  7. 제1항에 있어서,
    상기 개선 수단(123)은 상기 제2 개선 데이터를 절대적 개선 데이터로서 및 상대적 개선 데이터로서 생성하는 것 사이에서의 전환의 전환 시간 간격 동안, 상기 제2 개선 데이터를 상기 절대적 개선 데이터 및 상기 상대적 개선 데이터의 조합으로서 생성하도록 구성되는, 멀티-채널 오디오 인코더(10).
  8. 제7항에 있어서,
    상기 조합은 상기 절대적 개선 데이터 및 상기 상대적 개선 데이터 간의 보간(interpolation)을 포함하는, 멀티-채널 오디오 인코더(10).
  9. 제1항에 있어서,
    상기 인코딩된 출력 신호를 생성하는 수단(120)은 상대적 개선 데이터 또는 절대적 개선 데이터가 이용되는지를 나타내는 데이터를 포함하도록 구성되는, 멀티-채널 오디오 인코더(10).
  10. 제1항에 있어서,
    상기 제2 개선 데이터는 개선 데이터의 제1 부분 및 개선 데이터의 제2 부분을 포함하고, 상기 제2 부분은 상기 제1 부분보다 상기 제1 M-채널 신호의 더 정확한 표현을 제공하는, 멀티-채널 오디오 인코더(10).
  11. 제10항에 있어서,
    상기 개선 수단(123)은 상기 제2 부분을 절대적 개선 데이터로서 또는 상대적 개선 데이터로서 생성하는 것 중에서만 동적으로 선택하도록 구성되는, 멀티-채널 오디오 인코더(10).
  12. 삭제
  13. N-채널 오디오 신호를 디코딩하기 위한 멀티-채널 오디오 디코더(20)에 있어서,
    상기 N-채널 오디오 신호에 관한 제1 M-채널 신호로서, 상기 M은 상기 N보다 작은, 상기 제1 M-채널 신호; 멀티-채널 확장을 위한 제1 개선 데이터로서, 상기 제1 M-채널 신호와 다른 제2 M-채널 신호와 관련되는, 상기 제1 개선 데이터; 상기 제2 M-채널 신호에 대한 상기 제1 M-채널 신호에 관한 제2 개선 데이터로서, 상기 제1 M-채널 신호에 대한 상대적 개선 데이터 및 절대적 개선 데이터를 포함하는, 상기 제2 개선 데이터; 및 신호 블록을 위한 상기 제2 개선 데이터가 절대적 개선 데이터인지 상대적 개선 데이터인지를 나타내는 표시 데이터를 포함하는, 인코딩된 오디오 신호 수신 수단(210);
    상기 제1 M-채널 신호 및 상기 제2 개선 데이터에 응답하여 M-채널 멀티-채널 확장 신호를 생성하기 위한 생성 수단(212)으로서, 상기 절대적 개선 데이터는 상기 제1 M-채널 신호를 참조하지 않고 상기 M-채널 멀티-채널 확장 신호의 재구성을 가능하게 하는 반면, 상기 상대적 개선 데이터는 상기 제1 M-채널 신호를 참조하여 상기 M-채널 멀티-채널 확장 신호의 재구성을 가능하게 하는, 상기 생성 수단(212); 및
    상기 M-채널 멀티-채널 확장 신호 및 상기 제1 개선 데이터에 응답하여 N-채널 디코딩된 신호를 생성하기 위한 수단(220)을 포함하고,
    상기 생성 수단(212)은 상기 표시 데이터에 응답하여 상기 제2 개선 데이터를 절대적 개선 데이터 또는 상대적 개선 데이터로서 선택하도록 구성되는, 멀티-채널 오디오 디코더(20).
  14. 제13항에 있어서,
    상기 생성 수단(212)은 시간 영역에서 상기 제2 개선 데이터를 상기 제1 M-채널 신호에 적용하도록 구성되는, 멀티-채널 오디오 디코더(20).
  15. 제13항에 있어서,
    상기 생성 수단(212)은 주파수 영역에서 상기 제2 개선 데이터를 상기 제1 M-채널 신호에 적용하도록 구성되는, 멀티-채널 오디오 디코더(20).
  16. 제13항에 있어서,
    상기 제2 개선 데이터는 개선 데이터의 제1 부분 및 개선 데이터의 제2 부분을 포함하고, 상기 제2 부분은 상기 제1 부분 보다 상기 제1 M-채널 신호의 더 정확한 표현을 제공하는, 멀티-채널 오디오 디코더(20).
  17. 제16항에 있어서,
    상기 생성 수단(212)은 상기 제2 부분의 제2 개선 데이터를 절대적 개선 데이터 또는 상대적 개선 데이터로서 선택하도록 구성되는, 멀티-채널 오디오 디코더(20).
  18. 제16항에 있어서
    상기 생성 수단(212)은 상기 제1 부분의 개선 데이터를 상기 제1 M-채널 신호에 이용함으로써 생성된 신호에 상기 제2 부분의 상대적 개선 데이터를 이용하여 상기 M-채널 멀티-채널 확장 신호를 생성하도록 구성되는, 멀티-채널 오디오 디코더(20).
  19. N-채널 오디오 신호를 인코딩하는 방법에 있어서,
    상기 N-채널 오디오 신호에 관한 제1 M-채널 신호를 생성하는 단계로서, 상기 M은 상기 N보다 작은, 상기 제1 M-채널 신호 생성 단계;
    상기 N-채널 오디오 신호에 대한 상기 제1 M-채널 신호에 관해 제1 개선 데이터를 생성하는 단계;
    상기 N-채널 오디오 신호에 관해 제2 M-채널 신호를 생성하는 단계;
    상기 제1 M-채널 신호에 대한 상기 제2 M-채널 신호에 관해 제2 개선 데이터를 생성하는 단계; 및
    상기 제2 M-채널 신호, 상기 제1 개선 데이터 및 상기 제2 개선 데이터를 포함하는 인코딩된 출력 신호를 생성하는 단계를 포함하고,
    상기 제2 개선 데이터의 생성은 상기 제2 M-채널 신호에 대하여 절대적 개선 데이터로서 또는 상대적 개선 데이터로서 상기 제2 개선 데이터를 생성하는 것 중에서 동적으로 선택하는 것을 포함하고, 상기 절대적 개선 데이터는 상기 제2 M-채널 신호를 참조하지 않고 상기 제1 M-채널 신호의 재구성을 가능하게 하는 반면, 상기 상대적 개선 데이터는 상기 제2 M-채널 신호를 참조하여 상기 제1 M-채널 신호의 재구성을 가능하게 하는, N-채널 오디오 신호 인코딩 방법.
  20. N-채널 오디오 신호를 디코딩하는 방법에 있어서,
    상기 N-채널 오디오 신호에 관한 제1 M-채널 신호로서, 상기 M은 상기 N보다 작은, 상기 제1 M-채널 신호; 멀티-채널 확장을 위한 제1 개선 데이터로서, 상기 제1 M-채널 신호와 다른 제2 M-채널 신호와 관련되는, 상기 제1 개선 데이터; 상기 제2 M-채널 신호에 대한 상기 제1 M-채널 신호에 관한 제2 개선 데이터로서, 상기 제1 M-채널 신호에 대한 상대적 개선 데이터 및 절대적 개선 데이터를 포함하는, 상기 제2 개선 데이터; 및 신호 블록을 위한 상기 제2 개선 데이터가 절대적 개선 데이터인지 또는 상대적 개선 데이터인지를 나타내는 표시 데이터로서, 상기 절대적 개선 데이터는 상기 제1 M-채널 신호를 참조하지 않고 상기 제2 M-채널 신호의 재구성을 가능하게 하는 반면, 상기 상대적 개선 데이터는 상기 제1 M-채널 신호를 참조하여 상기 제2 M-채널 신호의 재구성을 가능하게 하는, 상기 표시 데이터를 포함하는, 인코딩된 오디오 신호를 수신하는 단계;
    상기 제1 M-채널 신호 및 상기 제2 개선 데이터에 응답하여 M-채널 멀티-채널 확장 신호를 생성하는 단계; 및
    상기 M-채널 멀티-채널 확장 신호 및 상기 제1 개선 데이터에 응답하여 N-채널 디코딩된 신호를 생성하는 단계를 포함하고,
    상기 M-채널 멀티-채널 확장 신호의 생성은 상기 표시 데이터에 응답하여 상기 제2 개선 데이터를 절대적 개선 데이터로서 또는 상대적 개선 데이터로서 선택하는 것을 포함하는, N-채널 오디오 신호 디코딩 방법.
  21. 삭제
  22. N-채널 오디오 신호에 관한 인코딩된 멀티-채널 오디오 신호를 저장한 저장 매체에 있어서,
    상기 N-채널 오디오 신호에 관한 M-채널 신호 데이터로서, 상기 M은 상기 N보다 작은, 상기 M-채널 신호 데이터;
    멀티-채널 확장을 위한 제1 개선 데이터로서, 상기 제1 M-채널 신호와 다른 제2 M-채널 신호와 관련되는, 상기 제1 개선 데이터;
    상기 제2 M-채널 신호에 대한 상기 제1 M-채널 신호에 관한 제2 개선 데이터로서, 상기 제1 M-채널 신호에 대한 상대적 개선 데이터 또는 절대적 개선 데이터를 포함하고, 상기 절대적 개선 데이터는 상기 제1 M-채널 신호를 참조하지 않고 상기 제2 M-채널 신호의 재구성을 가능하게 하는 반면, 상기 상대적 개선 데이터는 상기 제1 M-채널 신호를 참조하여 상기 제2 M-채널 신호의 재구성을 가능하게 하는, 상기 제2 개선 데이터; 및
    신호 블록을 위한 상기 제2 개선 데이터가 절대적 개선 데이터인지 또는 상대적 개선 데이터인지를 나타내는 표시 데이터를 포함하는, N-채널 오디오 신호에 관한 인코딩된 멀티-채널 오디오 신호를 저장한 저장 매체.
  23. 인코딩된 멀티-채널 오디오 신호를 송신하는 송신기(40)에 있어서,
    상기 송신기(40)는 제1항에 따른 멀티-채널 오디오 인코더(10)를 포함하는, 송신기(40).
  24. 멀티-채널 오디오 신호를 수신하기 위한 수신기(50)에 있어서,
    상기 수신기(50)는 제13항에 따른 멀티-채널 오디오 디코더(20)를 포함하는, 수신기(50).
  25. 인코딩된 멀티-채널 오디오 신호를 전송 채널(30)을 통해 수신기(50)로 송신하기 위한 송신기(40)를 포함하는 송신 시스템(70)에 있어서,
    상기 송신기(40)는 제1항에 따른 멀티-채널 오디오 인코더(10)를 포함하고,
    상기 수신기는 제13항에 따른 멀티-채널 오디오 디코더(20)를 포함하는, 송신 시스템(70).
  26. 인코딩된 멀티-채널 오디오 신호를 송신하는 방법에 있어서,
    N-채널 오디오 신호를 인코딩하는 단계를 포함하고, 상기 인코딩하는 단계는:
    상기 N-채널 오디오 신호에 관한 제1 M-채널 신호를 생성하는 단계로서, 상기 M은 상기 N보다 작은, 상기 제1 M-채널 신호 생성 단계;
    상기 N-채널 오디오 신호에 대한 상기 제1 M-채널 신호에 관한 제1 개선 데이터를 생성하는 단계;
    상기 N-채널 오디오 신호에 관한 제2 M-채널 신호를 생성하는 단계;
    상기 제1 M-채널 신호에 대한 상기 제2 M-채널 신호에 관해 제2 개선 데이터를 생성하는 단계; 및
    상기 제2 M-채널 신호, 상기 제1 개선 데이터 및 상기 제2 개선 데이터를 포함하는 인코딩된 출력 신호를 생성하는 단계를 포함하고,
    상기 제2 개선 데이터의 생성은 상기 제2 개선 데이터를 상기 제2 M-채널 신호에 대하여 상대적 개선 데이터로서 또는 절대적 개선 데이터로서 생성하는 것 중에서 동적으로 선택하는 것을 포함하고, 상기 절대적 개선 데이터는 상기 제2 M-채널 신호를 참조하지 않고 상기 제1 M-채널 신호의 재구성을 가능하게 하는 반면, 상기 상대적 개선 데이터는 상기 제2 M-채널 신호를 참조하여 상기 제1 M-채널 신호의 재구성을 가능하게 하는, 인코딩된 멀티-채널 오디오 신호 송신 방법.
  27. 인코딩된 멀티-채널 오디오 신호를 수신하는 방법에 있어서,
    상기 인코딩된 멀티-채널 오디오 신호를 디코딩하는 단계를 포함하고, 상기 디코딩하는 단계는:
    상기 N-채널 오디오 신호에 관한 제1 M-채널 신호로서, 상기 M은 상기 N보다 작은, 상기 제1 M-채널 신호; 멀티-채널 확장을 위한 제1 개선 데이터로서, 상기 제1 M-채널 신호와 다른 제2 M-채널 신호와 관련되는, 상기 제1 개선 데이터; 상기 제2 M-채널 신호에 대한 상기 제1 M-채널 신호에 관한 제2 개선 데이터로서, 상기 제1 M-채널 신호에 대한 상대적 개선 데이터 및 절대적 개선 데이터를 포함하는, 상기 제2 개선 데이터; 및 신호 블록을 위한 상기 제2 개선 데이터가 절대적 개선 데이터인지 또는 상대적 개선 데이터인지를 나타내는 표시 데이터를 포함하는, 인코딩된 멀티-채널 오디오 신호를 수신하는 단계;
    상기 제1 M-채널 신호 및 상기 제2 개선 데이터에 응답하여 M-채널 멀티-채널 확장 신호를 생성하는 단계로서, 상기 절대적 개선 데이터는 상기 제1 M-채널 신호를 참조하지 않고 상기 M-채널 멀티-채널 확장 신호의 재구성을 가능하게 하는 반면, 상기 상대적 개선 데이터는 상기 제1 M-채널 신호를 참조하여 상기 M-채널 멀티-채널 확장 신호의 재구성을 가능하게 하는, 상기 M-채널 멀티-채널 확장 신호를 생성하는 단계; 및
    상기 M-채널 멀티-채널 확장 신호 및 상기 제1 개선 데이터에 응답하여 N-채널 디코딩된 신호를 생성하는 단계를 포함하고,
    상기 M-채널 멀티-채널 확장 신호의 생성은 상기 표시 데이터에 응답하여 상기 제2 개선 데이터를 절대적 개선 데이터로서 또는 상대적 개선 데이터로서 선택하는 것을 포함하는, 인코딩된 멀티-채널 오디오 신호 수신 방법.
  28. 오디오 신호를 송신 및 수신하는 방법에 있어서,
    N-채널 오디오 신호를 인코딩하는 단계로서, 상기 인코딩하는 단계는: 상기 N-채널 오디오 신호에 관한 제1 M-채널 신호를 생성하는 단계로서, 상기 M은 상기 N보다 작은, 상기 제1 M-채널 신호 생성 단계; 상기 N-채널 오디오 신호에 대한 상기 제1 M-채널 신호에 관한 제1 개선 데이터를 생성하는 단계; 상기 N-채널 오디오 신호에 관한 제2 M-채널 신호를 생성하는 단계; 상기 제1 M-채널 신호에 대한 상기 제2 M-채널 신호에 관해 제2 개선 데이터를 생성하는 단계로서, 상기 제2 개선 데이터의 생성은 상기 제2 M-채널 신호에 대한 상대적 개선 데이터로서 또는 절대적 개선 데이터로서 상기 제2 개선 데이터를 생성하는 것 중에서 동적으로 선택하는 것을 포함하고, 상기 절대적 개선 데이터는 상기 제2 M-채널 신호를 참조하지 않고 상기 제1 M-채널 신호의 재구성을 가능하게 하는 반면, 상기 상대적 개선 데이터는 상기 제2 M-채널 신호를 참조하여 상기 제1 M-채널 신호의 재구성을 가능하게 하는, 상기 제2 개선 데이터 생성 단계; 및 상기 제2 M-채널 신호, 상기 제1 개선 데이터 및 상기 제2 개선 데이터를 포함하는 인코딩된 출력 신호를 생성하는 단계를 포함하는, 상기 N-채널 오디오 신호 인코딩 단계;
    상기 인코딩된 출력 신호를 송신기로부터 수신기로 송신하는 단계;
    상기 수신기에서 상기 인코딩된 출력 신호를 수신하는 단계;
    상기 인코딩된 출력 신호를 디코딩하는 단계로서, 상기 디코딩하는 단계는: 상기 제2 M-채널 신호 및 제2 개선 데이터에 응답하여 M-채널 멀티-채널 확장 신호를 생성하는 단계로서, 상기 M-채널 멀티-채널 확장 신호의 생성은 상기 제2 개선 데이터를 절대적 개선 데이터 또는 상대적 개선 데이터로서 선택하는 것을 포함하는, 상기 M-채널 멀티-채널 확장 신호 생성 단계; 및 상기 M-채널 멀티-채널 확장 신호 및 상기 제1 개선 데이터에 응답하여 N-채널 디코딩된 신호를 생성하는 단계를 포함하는, 상기 인코딩된 출력 신호를 디코딩하는 단계를 포함하는, 오디오 신호 송신 및 수신 방법.
  29. 프로세서가 제19항, 제20항, 제26항, 제27항, 및 제28항 중 어느 한 항에 청구된 방법의 단계들을 수행하도록 동작하는 컴퓨터 프로그램을 저장한 컴퓨터 판독가능한 기록 매체.
  30. 제1항에 따른 멀티-채널 오디오 인코더(10)를 포함하는 멀티-채널 오디오 레코더(60).
  31. 제13항에 따른 멀티-채널 오디오 디코더를 포함하는 멀티-채널 오디오 플레이어(60).
KR1020077025145A 2005-03-30 2006-03-16 오디오 인코딩 및 디코딩 KR101346120B1 (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP05102515.3 2005-03-30
EP05102515 2005-03-30
EP05103085 2005-04-18
EP05103085.6 2005-04-18
EP06100245.7 2006-01-11
EP06100245 2006-01-11
PCT/IB2006/050826 WO2006103586A1 (en) 2005-03-30 2006-03-16 Audio encoding and decoding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020137014310A Division KR20130079627A (ko) 2005-03-30 2006-03-16 오디오 인코딩 및 디코딩

Publications (2)

Publication Number Publication Date
KR20070116174A KR20070116174A (ko) 2007-12-06
KR101346120B1 true KR101346120B1 (ko) 2014-01-02

Family

ID=36607294

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020077025145A KR101346120B1 (ko) 2005-03-30 2006-03-16 오디오 인코딩 및 디코딩
KR1020137014310A KR20130079627A (ko) 2005-03-30 2006-03-16 오디오 인코딩 및 디코딩

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020137014310A KR20130079627A (ko) 2005-03-30 2006-03-16 오디오 인코딩 및 디코딩

Country Status (11)

Country Link
US (1) US7840411B2 (ko)
EP (1) EP1866913B1 (ko)
JP (1) JP5106383B2 (ko)
KR (2) KR101346120B1 (ko)
CN (2) CN101151660B (ko)
AT (1) ATE406651T1 (ko)
BR (1) BRPI0608756B1 (ko)
DE (1) DE602006002501D1 (ko)
ES (1) ES2313646T3 (ko)
MX (1) MX2007011995A (ko)
WO (1) WO2006103586A1 (ko)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070061843A (ko) * 2004-09-28 2007-06-14 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치 및 스케일러블 부호화 방법
JP4907522B2 (ja) * 2005-04-28 2012-03-28 パナソニック株式会社 音声符号化装置および音声符号化方法
JP4850827B2 (ja) * 2005-04-28 2012-01-11 パナソニック株式会社 音声符号化装置および音声符号化方法
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
CN102395033B (zh) 2006-12-12 2014-08-27 弗劳恩霍夫应用研究促进协会 对表示时域数据流的数据段进行编码和解码的编码器、解码器以及方法
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
WO2010013450A1 (ja) 2008-07-29 2010-02-04 パナソニック株式会社 音響符号化装置、音響復号化装置、音響符号化復号化装置および会議システム
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
EP2578000A1 (en) * 2010-06-02 2013-04-10 Koninklijke Philips Electronics N.V. System and method for sound processing
ES2598827T3 (es) 2011-03-28 2017-01-30 Dolby Laboratories Licensing Corp. Transformación de complejidad reducida para un canal de efectos de baja frecuencia
CN102802112B (zh) * 2011-05-24 2014-08-13 鸿富锦精密工业(深圳)有限公司 具有音频文件格式转换功能的电子装置
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830049A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
EP2830333A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
EP2830048A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830052A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
CN103413553B (zh) * 2013-08-20 2016-03-09 腾讯科技(深圳)有限公司 音频编码方法、音频解码方法、编码端、解码端和***
US9067135B2 (en) * 2013-10-07 2015-06-30 Voyetra Turtle Beach, Inc. Method and system for dynamic control of game audio based on audio analysis
EP2879408A1 (en) 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
CN105206278A (zh) * 2014-06-23 2015-12-30 张军 一种基于流水线的三维音频编码加速方法
WO2016035567A1 (ja) * 2014-09-01 2016-03-10 ソニー株式会社 音声処理装置
BR112021025420A2 (pt) * 2019-07-08 2022-02-01 Voiceage Corp Método e sistema para codificar metadados em fluxos de áudio e para adaptação de taxa de bits intraobjeto e interobjeto flexível

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5946352A (en) 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
CN1705980A (zh) * 2002-02-18 2005-12-07 皇家飞利浦电子股份有限公司 参数音频编码
DE60331535D1 (de) * 2002-04-10 2010-04-15 Koninkl Philips Electronics Nv Kodierung und Dekodierung für mehrkanalige Signale
US7447629B2 (en) * 2002-07-12 2008-11-04 Koninklijke Philips Electronics N.V. Audio coding
KR100528325B1 (ko) * 2002-12-18 2005-11-15 삼성전자주식회사 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
PL2175671T3 (pl) * 2004-07-14 2012-10-31 Koninl Philips Electronics Nv Sposób, urządzenie, urządzenie kodujące, urządzenie dekodujące i system audio
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5946352A (en) 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HERRE, J. et al. MP3 SURROUND: EFFICIENT AND COMPATIBLE CODING OF MULTI CHANNEL AUDIO. Audio Engineering Society Convention Paper. 2004.05.08. (제1면 내지 제14면) *

Also Published As

Publication number Publication date
BRPI0608756B1 (pt) 2019-06-04
DE602006002501D1 (de) 2008-10-09
JP5106383B2 (ja) 2012-12-26
ATE406651T1 (de) 2008-09-15
ES2313646T3 (es) 2009-03-01
JP2008535015A (ja) 2008-08-28
US7840411B2 (en) 2010-11-23
EP1866913B1 (en) 2008-08-27
MX2007011995A (es) 2007-12-07
CN101151660A (zh) 2008-03-26
CN101151660B (zh) 2011-10-19
BRPI0608756A2 (pt) 2011-03-15
KR20130079627A (ko) 2013-07-10
CN101151658B (zh) 2011-07-06
KR20070116174A (ko) 2007-12-06
WO2006103586A1 (en) 2006-10-05
US20100153118A1 (en) 2010-06-17
CN101151658A (zh) 2008-03-26
EP1866913A1 (en) 2007-12-19

Similar Documents

Publication Publication Date Title
KR101346120B1 (ko) 오디오 인코딩 및 디코딩
KR101271069B1 (ko) 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법
RU2367033C2 (ru) Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией
JP5455647B2 (ja) オーディオデコーダ
JP5179881B2 (ja) オーディオソースのパラメトリックジョイント符号化
JP4685925B2 (ja) 適応残差オーディオ符号化
US8433583B2 (en) Audio decoding
JP5311597B2 (ja) マルチチャンネル・エンコーダ
JP5539926B2 (ja) マルチチャンネル・エンコーダ
JP5269039B2 (ja) オーディオエンコード及びデコード
CN103765509B (zh) 编码装置及方法、解码装置及方法
CN109448741B (zh) 一种3d音频编码、解码方法及装置
JP2010507115A (ja) 多チャネルダウンミックスされたオブジェクト符号化における強化された符号化及びパラメータ表現
JP2008519301A (ja) ステレオ互換性のあるマルチチャネルオーディオ符号化

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
A107 Divisional application of patent
AMND Amendment
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161215

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20171213

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20191223

Year of fee payment: 7