KR101021079B1 - 파라메트릭 다채널 오디오 표현 - Google Patents

파라메트릭 다채널 오디오 표현 Download PDF

Info

Publication number
KR101021079B1
KR101021079B1 KR1020047017069A KR20047017069A KR101021079B1 KR 101021079 B1 KR101021079 B1 KR 101021079B1 KR 1020047017069 A KR1020047017069 A KR 1020047017069A KR 20047017069 A KR20047017069 A KR 20047017069A KR 101021079 B1 KR101021079 B1 KR 101021079B1
Authority
KR
South Korea
Prior art keywords
audio signal
information
encoded
parameters
multichannel
Prior art date
Application number
KR1020047017069A
Other languages
English (en)
Other versions
KR20040102163A (ko
Inventor
우멘아놀더스더블유.제이.
슈아이저스에릭지.피.
브리바르트더크제이.
반데파르스티븐엘.제이.디.이.
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20040102163A publication Critical patent/KR20040102163A/ko
Application granted granted Critical
Publication of KR101021079B1 publication Critical patent/KR101021079B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

다채널 오디오 신호들은 모노럴 오디오 신호 및 모노럴 오디오 신호와 정보로부터 다채널 오디오 신호를 복원하도록 허용하는 정보로 코딩된다. 정보는 다채널 오디오 신호의 제 1 주파수 영역에 대한 정보의제 1 부분을 결정함으로써, 및 다채널 오디오 신호의 제 2 주파수 영역에 대한 정보의 제 2 부분을 결정함으로써 생성된다. 제 2 주파수 영역은 제 1 주파수 영역의 일부이고, 따라서, 제 2 주파수 영역은 제 1 주파수 영역의 부분-범위이다. 정보는 비트 레이트에 대한 디코딩 품질이 조정 가능한 다층이다.
모노럴, 바이노럴, 다채널 오디오 신호, 인코더, 디코더

Description

파라메트릭 다채널 오디오 표현{Parametric multi-channel audio representation}
본 발명은, 다채널 오디오 신호를 인코딩하는 방법, 다채널 오디오 신호를 인코딩하기 위한 인코더, 및 오디오 신호, 인코딩된 오디오 신호, 인코딩된 신호가 저장되는 저장 매체를 공급하기 위한 장치에 관한 것으로, 인코딩된 오디오 신호를 디코딩하는 방법, 인코딩된 오디오 신호를 디코딩하기 위한 디코더, 및 디코딩된 오디오 신호를 공급하기 위한 장치에 관한 것이다.
제 EP-A-1107232호는 좌채널 신호 및 우채널 신호로 이루어진 스테레오 오디오 신호 표현을 생성하기 위해 파라메트릭 코딩 스킴(parametric coding scheme)을 개시한다. 효율적으로 전송 대역폭을 이용하기 위해, 이러한 표현은 좌채널 신호 또는 우채널 신호 중 하나인 모노럴(monaural) 신호에만 관한 정보, 및 파라메트릭 정보를 구비한다. 다른 스테레오 신호는 파라메트릭 정보와 함께 모노럴 신호를 기초로 복원될 수 있다. 파라메트릭 정보는 좌채널 및 우채널의 진폭 및 위상 특성들을 포함하는 스테레오 오디오 신호의 로컬리제이션 큐들(localization cues)을 포함한다.
본 발명의 목적은 유효한 비트 레이트로 인코딩된 오디오 신호의 품질을 조정(scale), 또는 디코더의 복잡성 또는 유효한 전송 대역폭으로 디코딩된 오디오 신호의 품질을 조정할 수 있는 파라메트릭 다채널 오디오 시스템을 제공하는 것이다.
본 발명의 제 1 양상은 청구항 제 1 항에서 청구된 바와 같이 다채널 오디오 신호를 인코딩하는 방법을 제공한다. 본 발명의 제 2 양상은 청구항 제 2 항에서 청구된 바와 같이 다채널 오디오 신호의 인코딩 방법을 제공한다. 본 발명의 제 3 양상은 청구항 제 14 항에서 청구된 바와 같이 다채널 오디오 신호의 인코딩하기 위한 인코더를 제공한다. 본 발명의 제 4 양상은 청구항 제 15 항에서 청구된 바와 같이 다채널 오디오 신호를 인코딩하기 위한 인코더를 제공한다. 본 발명의 제 5 양상은 청구항 제 16 항에서 청구된 바와 같이 오디오 신호를 공급하기 위한 장치를 제공한다. 본 발명의 제 6 양상은 청구항 제 17 항에서 청구된 바와 같이 인코딩된 오디오 신호를 제공한다. 본 발명의 제 7 양상은 청구항 제 18 항에서 청구된 바와 같이 인코딩된 신호가 저장되는 저장 매체를 제공한다. 본 발명의 제 8 양상은 청구항 제 19 항에서 청구된 바와 같이 디코딩 방법을 제공한다. 본 발명의 제 9 양상은 청구항 제 20 항에서 청구된 바와 같이 인코딩된 오디오 신호를 디코딩하기 위한 디코더를 제공한다. 본 발명의 제 10 양상은 청구항 제 21 항에서 청구된 바와 같이 디코딩된 오디오 신호를 공급하기 위한 장치를 제공한다. 유익한 실시예들이 종속 청구항들에서 규정된다.
본 발명의 제 1 양상에 따라 다채널 오디오 신호를 인코딩하는 방법에서, 단일 채널 오디오 신호가 생성된다. 더욱이, 정보는 단일 채널 오디오 신호 및 상기 정보로부터, 요구된 품질의 레벨로, 다채널 오디오 신호의 복원을 허용하는 다채널 오디오 신호로부터 생성된다. 바람직하게, 상기 정보는 예컨대, 제 EP-A-1107232로부터 알려진 파라미터들의 세트들을 포함한다.
본 발명의 제 1 양상에 따라, 정보는 다채널 오디오 신호의 제 1 주파수 영역에 대한 정보의 제 1 부분을 결정함으로써, 및 다채널 오디오 신호의 제 2 주파수 영역에 대한 정보의 제 2 부분을 결정함으로써 생성된다. 제 2 주파수 영역은 제 1 주파수 영역의 일부이고, 따라서, 제 2 주파수 영역은 제 1 주파수 영역의 부분 범위(sub-range)다. 이제, 2개의 레벨들의 품질의 디코딩이 가능하다. 낮은 품질의 레벨의 디코딩 다채널 오디오 신호를 위해, 디코더는 인코딩된 단일 채널 오디오 신호, 및 정보의 제 1 부분을 사용한다. 높은 품질의 레벨을 위해, 디코더는 인코딩된 단일 채널 오디오 신호, 및 정보의 제 1 및 제 2 부분 양자를 사용한다. 명백하게, 상이한 주파수 영역에서 각각 연관된 정보의 다수의 부분들이 존재하면, 다수의 레벨들로부터 디코딩 품질을 선택하는 것은 가능하다. 예컨대, 제 1 부분은 다채널 오디오 신호의 전체 대역폭을 커버하는 주파수 영역내에서 결정된 파라미터들의 단일 세트를 포함할 수 있다. 그리고, 제 2 부분은 파라미터들의 여러 세트들을 포함할 수 있고, 파라미터들의 각각의 세트는 전체 대역폭의 부분 범위 또는 일부에 대해 결정된다. 부분들은 함께 전체 대역폭을 커버하는 것이 바람직하다. 그러나, 다른 많은 가능성들이 존재한다. 예컨대, 제 1 부분은 파라미터들의 2 개 세트들을 포함할 수 있고, 여기서 제 1 세트는 전체 대역폭의 더 낮은 부분을 커버하는 주파수 영역에 대해 결정되고, 제 2 세트는 전체 대역폭의 다른 부분을 커버하는 주파수 영역에 대해 결정된다. 제 2 부분은 전체 대역폭의 더 낮은 부분내의 2 개의 주파수 영역들에 대해 결정된 파라미터들의 2 개 세트들을 포함할 수 있다. 전체 대역폭의 더 낮은 부분과 더 높은 부분에 대한 파라미터들의 세트들의 수가 동일하도록 요구되지는 않는다.
인코딩된 오디오 신호의 이 표현은 디코딩된 오디오 신호의 품질이 디코더의 복잡성에 의존하도록 허용한다. 예컨대, 단순한 휴대용 디코더에서, 낮은 전력 소비를 갖고, 따라서, 정보의 일부만을 사용할 수 있는 낮은 복잡성의 디코더가 사용될 수 있다. 하이 엔드 애플리케이션에서는, 코딩된 신호내에서 유효한 모든 정보를 사용하는 복잡한 디코더가 사용된다.
디코딩된 오디오의 품질은 또한, 유효한 전송 대역폭에 의존할 수 있다. 전송 대역폭이 크다면, 모두 전송되므로, 디코더는 모든 유효한 층들을 디코딩할 수 있다. 대역폭이 작다면, 송신기는 제한된 수의 층들만을 전송하도록 결정할 수 있다.
본 발명의 제 2 양상에서, 인코더는 디코딩된 다채널 오디오 신호의 최대 허용가능 비트 레이트를 수신한다. 이 최대 허용가능 비트 레이트는, 인터넷과 같은 전송 채널 또는 저장 매체의 유효한 비트 레이트에 의해 규정될 수 있다. 전송 대역폭이 가변이고 따라서 최대 허용가능 비트 레이트가 시간에 따라 변하는 애플리케이션들에서, 너무 낮은 품질의 디코딩된 오디오 신호를 방지하기 위해 전송 대역폭의 이들 감쇠량들(fluctuations)을 적합화시킬 수 있는 것은 중요하다. 일반적으로, 인코더는 모든 유효한 층들을 인코딩한다. 어떤 층들이 전송될 것인지는 유효한 채널 용량에 의존하여 전송 종단(transmitting-end)에서 결정된다. 이는 루프내의 인코더로 가능하지만, 전송 전에 일부 층들을 제거하는 것보다 더 복잡하게 된다.
단일 채널 오디오 신호, 및 정보의 제 1 및 제 2 부분을 포함하는 인코딩된 다채널 오디오 신호의 비트 레이트가 최대 허용가능 비트 레이트보다 높지 않다면, 인코더는 다채널 오디오 신호의 제 2 주파수 영역에 대한, 정보의 제 2 부분만을 인코딩된 오디오 신호에 부가한다. 따라서, 전송 대역폭이 제 2 부분의 전송을 지원하도록 충분히 크지 않다면, 제 2 부분은 코딩된 오디오 신호에 존재하지 않는다.
청구항 제 4 항에서 규정된 바와 같은 실시예에서, 정보는 파라미터들의 세트들을 포함하고, 정보의 부분들 각각은 파라미터들의 하나 이상의 세트들에 의해 표현된다. 주파수 영역들의 수에 의존한 파라미터들의 세트들의 수는 정보의 부분들에 존재한다.
청구항 제 6 항에서 규정된 바와 같은 실시예에서, 파라미터들의 세트들은 적어도 하나의 로컬리제이션 큐들을 포함한다.
청구항 제 7 항에서 규정된 바와 같은 실시예에서, 제 1 주파수 영역은 실질적으로 다채널 오디오 신호의 전체 대역폭을 커버한다. 이 방식에서, 파라미터들의 1개 세트는 단일 채널 오디오 신호를 다채널 오디오 신호로 디코딩하도록 요구된 기본 정보를 제공하기에 충분하다. 이 방식에서, 디코딩된 오디오 신호의 품질의 기본 레벨은 보증된다. 제 2 주파수 범위는 전체 대역폭의 일부를 커버한다. 이 방식에서, 제 2 부분이 코딩된 오디오 신호내에 존재할 때, 제 2 부분은 이 주파수 범위에서 디코딩된 오디오 신호의 품질을 향상시킨다.
청구항 제 8 항에서 규정된 바와 같은 실시예에서, 정보의 제 2 부분은 실질적으로 다채널 오디오 신호의 전체 대역폭을 함께 커버하는 적어도 2 개의 주파수 범위들을 포함한다. 이 방식에서, 제 2 부분에 의해 제공된 품질 향상은 완전한 대역폭에 걸쳐 존재한다.
청구항 제 9 항에서 규정된 바와 같은 실시예에서, 단일 채널 오디오 신호 및 정보의 제 1 부분을 포함하는 기본 층은 인코딩된 오디오 신호내에 항상 존재한다. 정보의 제 2 부분을 포함하는 향상 층은 인코딩된 오디오 신호의 비트 레이트가 최대로 허용가능 비트 레이트를 초과하지 않아야만 인코딩된다. 이 방식에서, 디코딩된 오디오 신호의 품질은 최대로 허용가능 비트 레이트에 의존할 것이다. 최대로 허용가능 비트 레이트가 향상층을 수용하기에 너무 낮다면, 코딩된 오디오의 예측할 수 없는 부분들이 디코더에 도달하지 못할 경우에 비해 더 좋은 품질의 디코딩된 오디오를 제공할 것인 기본층으로부터 디코딩된 오디오 신호를 얻게 될 것이다.
청구항들 제 10 항 내지 제 12 항 중 어느 한 항에서 규정된 바와 같은 실시예들에서, 다음 프레임에서의 정보(파라미터들의 세트들을 통상적으로 구비하고, 각각의 주파수 대역 당 1개 세트로 표현되는)의 부분들은 이전 프레임의 파라미터들에 기초하여 코딩된다. 통상적으로, 이는, 2 개의 연속하는 프레임들내의 정보가 실질적으로 다르지 않을 것인, 상관관계로 인하여, 정보의 인코딩된 부분들의 비트 레이트를 감소시킨다.
청구항 제 13 항에서 규정된 바와 같은 실시예들에서, 2 개의 연속하는 프레임들의 파라미터들의 차는 파라미터들 대신에 코딩된다.
스테레오 프로그램 자료의 비트 레이트를 감소시키기 위해 제안되어온 오디오 코더들의 이전 해결책들은 인텐시티 스테레오 및 M/S 스테레오를 포함한다.
인텐시티 스테레오 알고리즘에서, 고주파수들(통상적으로, 5kHz 이상)은 이들 스테레오 영역들에 대한 원 스테레오 신호를 닮은 디코딩된 오디오 신호를 복원하도록 허용하는 시변 및 주파수 의존 조정 인자들 또는 인텐시티 인자들과 조합된 단일 오디오 신호(즉, 모노)에 의해 표현된다. M/S 알고리즘에서, 신호는 합(또는 중간, 또는 공통) 신호와 차(또는 측면(side), 또는 공통이 아닌) 신호로 분해된다. 상기 분해는 종종 주성분분석(principle component analysis) 또는 시변 조정 인자들과 조합된다. 그 다음에, 이들 신호들은 변환 코더 또는 서브-대역 코더[둘 다 파형 코더들인] 중 하나에 의해 개별적으로 코딩된다. 상기 알고리즘에 의해 달성된 정보 감소량은 소스 신호의 공간적 성질들에 상당히 의존한다. 예컨대, 소스 정보가 모노럴이면, 차 신호는 영이며 폐기될 수 있다. 그러나, 좌측 및 우측 오디오 신호들의 상관관계가 낮다면(고주파수 영역들에서 종종 발생하는 경우인), 상기 스킴은 작은 비트 레이트 감소만을 제공한다. 더 낮은 주파수 영역들에 대해, M/S 코딩은 일반적으로 중요한 장점을 제공한다.
오디오 신호들의 파라메트릭 기술들은 특히 오디오 코딩 분야에서 지난 몇 년 동안 관심을 받아왔다. 오디오 신호들을 기술하는 전송 파라미터들은 수신단에서 지각력의 동일한 신호를 재합성하기 위해 적은 전송 용량만을 요구한다. 그러나, 모노럴 신호들, 및 스테레오 신호들에 초점을 맞추는 현재의 파라메트릭 오디오 코더들은 듀얼 모노 신호들(dual mono signals)로서 처리된다.
본 발명의 이들 및 다른 양상들은 이후에 기술될 실시예들로부터 명료해지고, 하기 실시예들에 관련하여 설명될 것이다.
도 1은 스테레오 오디오를 위한 다채널 인코더의 블록도.
도 2는 스테레오 오디오를 위한 다채널 디코더의 블록도.
도 3은 인코딩된 데이터 스트림의 표현을 도시하는 도면.
도 4는 본 발명에 따라 주파수 범위들의 실시예를 도시하는 도면.
도 5는 본 발명에 따라 주파수 범위들의 다른 실시예를 도시하는 도면.
도 6은 본 발명에 따라 이전 프레임에서의 파라미터들에 기초하여 파라미터들의 세트들의 결정을 도시하는 도면.
도 7은 파라미터들의 세트를 도시하는 도면.
도 8은 기본층의 파라미터들의 상이한 결정을 도시하는 도면.
도 9는 향상층의 주파수 영역에 대응하는 파라미터들의 상이한 결정을 도시하는 도면.
도 1은 다채널 인코더의 블록도를 도시한다. 인코더는 스테레오 신호 RI, LI로서 도시된 다채널 오디오 신호를 수신하고, 인코더는 인코딩된 다채널 오디오 신호 EBS를 공급한다.
다운 믹서(1)는 단일 채널 오디오 신호(모노럴 신호로도 또한 칭해짐) SC에 스테레오 신호 또는 스테레오 채널들 RI, LI를 조합한다. 예컨대, 다운 믹서(1)는 입력 오디오 신호들 RI, LI의 평균을 결정할 수 있다.
인코더(3)는 인코딩된 모노럴 신호 ESC를 얻기 위해 모노럴 신호 SC를 인코딩한다. 인코더(3)는 예컨대, MPEG 코더(MPEG-LⅡ, MPEG-LⅢ(mp3), 또는 MPEG2-AAC)와 같은 알려진 종류로 이루어질 수 있다.
파라미터 결정 회로(2)는 입력 오디오 신호들 RI, LI에 기초하여 정보 INF를 특징 짓는 파라미터들의 세트들 S1, S2, 등등을 결정한다. 선택적으로, 파라미터 결정 회로(2)는, 파라미터 코더(4)에 의해 코딩될 때, 인코딩된 모노럴 신호 ESC와 함께 최대 허용가능 비트 레이트 MBR을 초과하지 않는 파라미터 세트들 S1, S2, 등등만을 결정하기 위해 최대 허용가능 비트 레이트 MBR을 수신한다. 인코딩된 파라미터들은 EIN으로서 표시된다.
포맷기(5)는 인코딩된 다채널 오디오 신호 EBS를 얻기 위해, 요망하는 포맷으로 데이터 스트림에서의 인코딩된 파라미터들 EIN과 인코딩된 모노럴 신호 SC를 조합한다.
인코더의 동작은 실시예에 관련하여 예로서 이후 더 상세히 설명될 것이다. 다채널 오디오 신호 LI, RI는 단일 모노럴 신호 SC(이후 단일 채널 오디오 신호로서도 또한 칭해짐)로 인코딩된다. 다채널 오디오 신호들 LI, RI의 공간적 속성들의 파라미터화(parameterization)는 파라미터 결정 회로(2)에 의해 수행된다. 파라미터들은 어떻게 모노럴 신호 SC로부터 다채널 오디오 신호 LI, RI를 복원하는가에 관한 정보를 구비한다. 파라미터들은 인코딩된 단일 모노럴 신호 ESC와 조합되기 전에 파라미터 인코더(4)에 의해 통상적으로 인코딩된다. 따라서, 일반 오디오 코딩 애플리케이션들을 위해, 1 개의 모노럴 오디오 신호와만 조합된 이들 파라미터들이 전송되거나 또는 저장된다. 조합된 코딩된 신호는 인코딩된 다채널 오디오 신호 EBS다. 인코딩된 다채널 오디오 신호 EBS를 전송 또는 저장하기 위해 필요한 전송 또는 저장 용량은, 독립적으로 다채널들을 처리하는 오디오 코더들에 비해 크게 감소된다. 그럼에도 불구하고, 원 공간적 효과는 파라미터들(의 세트들)을 구비하는 정보 INF에 의해 유지된다.
특히, 다채널 오디오 RI, LI의 파라메트릭 기술(description)은 바이노럴 청각 시스템(binaural auditory system)의 효과적인 신호 처리를 기술하는 것을 겨냥한 바이노럴 처리 모델에 관한 것이다.
상기 모델은 인입 오디오 LI, RI를, 바람직하게 ERB-레이트(ERB-rate) 크기로 직선으로 간격을 띄운 여러 대역-제한 신호들로 분리한다. 이들 신호들의 대역폭은 ERB-레이트에 따른 중심 주파수(center frequency)에 의존한다. 실질적으로, 바람직하게, 모든 주파수 대역에서, 인입 신호들의 하기 성질들이 분석된다:
- 좌측 및 우측 귀들로부터 기인하는 대역-제한 신호의 관련 레벨들에 의해 규정되는 인터로럴(interaural) 레벨차, 또는 ILD,
- 인터로럴 상호 상관 함수의 최대치(peak)에 대응하는 인터로럴 지연(또는 위상 편이)에 의해 규정되는, 인터로럴 시간(또는 위상) 차 ITD(또는 IPD), 및
- 최대 인터로럴 상호 상관 IC(예컨대, 최대 첨두의 위치에서 상호 상관의 값)에 의해 파라미터화될 수 있는, ITD들 또는 ILD들에 의해, 설명될 수 있는 파형들의 동일함(비동일함).
각각의 주파수 대역 FR1, FR2, 등등 당 1개 세트인 이들 파라미터들의 세트들 S1, S2, 등등은 시간에 대해 변한다. 그러나, 바이노럴 청각 시스템은 처리에 있어서 느리므로, 이들 성질들의 업데이트 레이트는 다소 낮을 것이다.
시변 파라미터들이 바이노럴 청각 시스템이 가진 유일한 유효한 공간적 신호 성질들이고, 이들 시간 및 주파수 종속 파라미터들로부터, 감지되는 청각 세계가 청각 시스템의 더 높은 레벨들에 의해 복원된다.
도 2는 다채널 디코더의 블록도를 도시한다. 디코더는 인코딩된 다채널 오디오 신호 EBS를 수신하고 스테레오 신호 RO, LO로서 도시된 복원된 디코딩 다채널 오디오 신호를 공급한다.
디포맷기(deformatter)(6)는 데이터 스트림 EBS로부터 인코딩된 모노럴 신호 ESC' 및 인코딩된 파라미터들 EIN'을 복구한다. 디코더(7)는 인코딩된 모노럴 신호 ESC'를 출력 모노럴 신호 SCO로 디코딩한다. 디코더(7)는, 예컨대, 디코더(7)가 MPEG 디코더일 수 있는, 알려진 종류(물론, 사용되던 인코더에 정합되는)로 이루질 수 있다. 디코더(8)는 인코딩된 파라미터들 EIN'을 출력 파라미터들 INO로 디코딩한다.
역다중화기(9)는 출력 모노럴 신호 SCO에 출력 파라미터들 INO의 파라미터 세트들 S1, S2, 등등을 적용함으로써, 출력 스테레오 오디오 신호들 LO 및 RO를 복원한다.
도 3은 인코딩된 데이터 스트림의 표현을 도시한다. 예컨대, 각각의 프레임 F1, F2, 등등에서, 데이터 패키지는, 이제 A로 표시되는 코딩된 모노럴 신호 ECS, 인코딩된 정보 EIN의 제 1 부분 P1, 인코딩된 정보 EIN의 제 2 부분 P2, 및 인코딩된 정보 EIN의 제 3 부분 P3이 뒤따르는 헤더 H로 시작한다.
프레임 F1, F2, 등등이 헤더 H 및 코딩된 모노럴 신호 ECS만을 포함한다면, 모노럴 신호 SC만이 전송된다.
제EP-A-1107232호에서 개시된 바와 같이, 입력 오디오 신호가 발생하는 전체 주파수 대역은 전체 주파수 대역을 함께 커버하는 복수의 서브-주파수 대역들로 나뉘어진다. 본 발명에 따른 용어(terminology)에서, 다채널 정보 INF는 각각의 서브-주파수 대역 FR1, FR2, 등등 당 1개 세트인 복수의 파라미터 세트들 S1, S2, 등등으로 인코딩된다. 이 복수의 파라미터 세트들 S1, S2, 등등은 인코드 정보 EIN의 제 1 부분 P1로 코딩된다. 따라서, 기본 레벨 품질의 다채널 오디오 신호를 전송하기 위해, 비트 스트림은 헤더 H, 코딩된 모노럴 신호 ECS인 부분 A, 및 제 1 부분 P1을 포함한다.
본 발명의 실시예에 따른 비트 스트림에서, 제 1 부분 P1은 단일 세트 파라미터들 S1로만 이루어진다. 단일 세트는 전체 대역폭 FR1에 대해 결정된다. 헤더 H, 및 부분들 A 및 P1을 포함하는 이 비트 스트림은 도 3에서 BL로 표시된, 품질의 기본층을 제공한다.
향상된 품질을 유지하기 위해, 코딩된 정보 EIN의 다른 부분들 P2, P3이 비트 스트림에 존재한다. 이들 다른 부분들은 향상층 EL을 형성한다. 비트 스트림은 단일 다른 부분 P2 또는 하나 이상의 다른 부분을 포함할 수 있다. 다른 부분 P2는 각각의 서브-주파수 대역 FR2, FR3, 등등 당 1개 세트인, 파라미터들의 복수의 세트들 S2, S3, 등등을 포함하는 것이 바람직하고, 서브-주파수 대역들 FR2, FR3, 등등은 전체 주파수 대역 FR1을 커버하는 것이 바람직하다. 향상된 품질은 또한 단계-방식(step-wise) 수단으로 존재할 수 있고, 제 1 향상 레벨은 제 1 부분을 포함하는 향상층 EL1에 의해 제공된다. 그리고 제 2 향상층 EL은 제 1 향상층 EL1 및 부분 P3을 포함하는 제 2 향상층 EL2를 포함한다.
다른 부분 P2는 전체 주파수 대역 FR1의 서브-대역인 단일 주파수 대역 FR2에 대응하는 파라미터들의 단일 세트 S2를 또한 포함할 수 있다. 다른 부분 P2는, 완전한 전체 주파수 대역 FR1을 함께 커버하지 않는 주파수 대역들 FR2, FR3, 등등에 대응하는 파라미터들 S2, S3, 등등의 다수의 세트들을 또한 포함할 수 있다.
다른 부분 P3은 다른 부분 P2의 서브-대역들 중 적어도 하나를 세분(sub-divide)하는 주파수 대역들에 대한 파라미터 세트들을 구비하는 것이 바람직하다.
본 발명에 따른 비트 스트림의 이 포맷은, 전송 채널에서, 또는 디코더에서 전송 채널의 비트 레이트 또는 디코더의 디코딩 복잡성으로 디코딩된 오디오 신호의 품질을 조정하도록 허용한다. 예컨대, 오디오 디코더가, 휴대용 애플리케이션들에서 중요한, 낮은 전력 소비를 가져야 한다면, 디코더는 낮은 복잡성을 가질 수 있고, 부분들 H, A 및 P1만을 사용한다. 사용자가 디코딩된 오디오의 더 높은 품질을 요망함을 인지한다면, 디코더는 더 높은 전력 소비에서 더 복잡한 동작들을 수행하는 것도 가능하다.
인코더가 전송 채널을 통해 전송될 수 있고 또는 저장 매체에 저장될 수 있는 최대 허용가능 비트 레이트 MBR을 감지하고 있는 것이 또한 가능하다. 이제, 인코더는, 존재한다면, 얼마나 많은 다른 부분들 P1, P2, 등등이 최대 허용가능 비트 레이트 MBR내에 적당한지 결정할 수 있다. 인코더는 비트 스트림에서의 이들 허용가능 부분들 P1, P2만을 코딩한다.
도 4는 본 발명에 따른 주파수 범위들의 실시예를 도시한다. 이 실시예에서, 주파수 대역 FR1은 다채널 오디오 신호 LI, RI의 전체 대역폭 FBW와 동일하고, 주파수 대역 FR2는 전체 대역폭 FBW의 서브-주파수 대역이다.
이들만이 파라미터 세트들 S1, S2, 등등이 결정되는 주파수 범위들이면, 단일 파라미터 세트 S1은 주파수 대역 FR1에 대해 결정되고 부분 P1에 존재하고, 및 단일 파라미터 세트 S2는 주파수 대역 FR2에 대해 결정되고 부분 P2에 존재한다. 품질의 조정은 부분 P2를 사용하거나 또는 사용하지 않음으로써 가능하다.
도 5는 본 발명에 따른 주파수 범위들의 다른 실시예를 도시한다. 이 실시예에서, 주파수 대역 FR1은 다시 전체 대역폭 FBW와 동일하고, 서브-주파수 대역들 FR2 및 FR3은 함께 전체 대역폭 FBW를 커버한다. 다시 말하면, 주파수 대역 FR1은 서브-주파수 대역들 FR2 및 FR3으로 세분화된다.
이들만이 파라미터 세트들 S1, S2, 등등이 결정되는 주파수 범위들이면, 부분 P1은 주파수 대역 FR1에 대해 결정된 단일 파라미터 세트 S1을 포함하고, 부분 P2는 주파수 대역 FR2 및 FR3에 대해 각각 결정된 2개의 파라미터 세트들 S2 및 S3을 포함한다. 품질의 조정은 부분 P2를 사용하거나 또는 사용하지 않음으로써 가능하다.
도 6은 본 발명의 실시예에 따라 이전 프레임의 파라미터들에 기초하여 파라미터들의 세트들의 결정을 도시한다.
도 6은, 기본층 BL의 일부인 부분 P1 및 향상층 EL을 형성하는 부분 P2를 포함하는 코딩된 정보 EIN인, 각각의 프레임 F1, F2, 등등을 포함하는 데이터 스트림을 도시한다.
프레임 F1에서, 부분 P1은 전체 대역폭 FR1에 대해 결정되는 파라미터들의 단일 세트 S1을 포함한다. 부분 P2는, 예로서, 부 대역들 FR2, FR3, FR4 및 FR5에 대해 각각 결정되는, 파라미터들의 4개 세트들 S2, S3, S4 및 S5를 포함한다. 4개의 서브-주파수 대역들 FR2, FR3, FR4 및 FR5는 주파수 대역 FR1을 세분화한다.
프레임 F1의 뒤를 잇는 프레임 F2에서, 부분 P1은, 전체 대역폭 FR1에 대해 결정되고 기본층 BL'의 일부인 파라미터들의 단일 세트 S1'을 포함한다. 부분 P2는, 서브-주파수 대역들 FR2, FR3, FR4 및 FR5에 대해 다시 각각 결정되고, 향상층 EL'를 형성하는, 파라미터들의 4개의 세트들 S2', S3', S4' 및 S5'를 포함한다.
프레임들 F1, F2, 등등에 대한 파라미터들의 세트들 S1, S2, 등등의 각각을 개별적으로 코딩하는 것은 가능하다. 부분 P1의 파라미터들에 관련하여 부분 P2의 파라미터들의 세트들을 코딩하는 것도 가능하다. 이는 프레임 F1의 S1에서 시작하고 S2 내지 S5에서 중단하는 화살표들에 의해 표시된다. 이것은 다른 프레임들 F2, 등등(도시되지 않음)에서도 또한 가능하다. 동일한 수단에서, S1에 관련하여 파라미터들의 세트 S1'를 코딩하는 것은 가능하다. 마지막으로, 파라미터들의 세트들 S2', S3', S4' 및 S5'는 파라미터들의 세트들 S2, S3, S4 및 S5에 관련하여 코딩될 수 있다.
상기 수단에서, 인코딩된 정보 EIN의 비트 레이트는 파라미터들의 세트들 Si간의 덧붙임(redundancy) 또는 상관 관계(correlation)가 사용되므로 감소될 수 있다.
바람직하게, 파라미터들의 새로운 세트들의 새로운 파라미터들 S1', S2', S3', S4' 및 S5'는 그것들의 값과 파라미터들의 이전 세트들 S1, S2, S3, S4 및 S5의 값의 차로서 코딩된다.
정규 시간 간격들에서, 최소한 파라미터 세트 S1은 오류들이 너무 길게 퍼지는 것을 방지하기 위해 완전하고 차이가 없도록 코딩되어야 한다.
도 7은 파라미터들의 세트를 도시한다. 파라미터들의 각각의 세트 Si는 하나 이상의 파라미터들을 포함할 수 있다. 일반적으로, 파라미터들은 오디오 정보에서 사운드 오브젝트들의 로컬리제이션에 관한 정보를 제공하는 로컬리제이션 큐들이다. 일반적으로 로컬리제이션 큐들은 인터로럴 레벨차 ILD, 인터로럴 시간 또는 위상차 ITD 또는 IPD, 및 인터로럴 상호 상관 IC다. 이들 파라미터들에 관한 더욱 상세한 정보는, Christof Faller 등에 의해, 112th Convention 2002 May 10-13 Munich, Germany에서 발표된 Audio Engineering Society Convention Paper 5574 "Binaural Cue Coding Applied to Stereo and Multi-channel Audio Compression"에서 제공된다.
도 8은 기본층의 파라미터의 차등 결정(differencial determination)을 도시한다. 수평축은 연속하는 프레임들 F1 내지 F5를 표시한다. 수직축은 기본층 BL의 파라미터들의 세트 S1의 파라미터의 값 PVG를 도시한다. 이 파라미터는 프레임들 F1 내지 F5에 대해 값들 A1 내지 A5를 각각 갖는다. 파라미터의 실제 값들 A2 내지 A5가 코딩되지 않고, 더 작은 차들 D1, D2, 등등이 코딩된다면, 코딩된 정보 EIN의 비트 레이트에 대한 이 파라미터의 기여는 감소할 것이다.
도 9는 향상층의 주파수 영역에 대응하는 파라미터들의 차등 결정을 도시한다. 수평축은 2 개의 연속하는 프레임들 F1 및 F2를 표시한다. 수직축은 기본층 BL 및 향상층 EL의 특정 파라미터의 값을 표시한다. 예컨대, 기본층 BL은 전체 주파수 범위 FBW에 대해 결정된 파라미터들의 단일 세트를 갖는 정보 INF의 부분 P1을 포함하고, 부분 P1의 특정 파라미터는 프레임 F1에 대한 값 A1 및 프레임 F2에 대한 A2를 갖는다. 향상층 EL은 함께 전체 주파수 범위 FBW를 채우는 3개의 각 주파수 범위들 FR2, FR3 및 FR4에 대해 결정된 파라미터들의 3개의 세트들을 갖는 정보 INF의 부분 P2를 포함한다. 3개의 특정 파라미터들(예컨대, ILD를 나타내는 파라미터)은 프레임 F1의 값 B11, B12 및 B13, 및 프레임 F2의 값 B21, B22 및 B23을 갖는다.
코딩된 정보 EIN의 비트 레이트에 대한 이들 파라미터들의 기여는, 특정 파라미터의 실제 값들 B11 내지 B23이 코딩되지 않고 차들 D11, D12, 등등이 코딩된다면 감소될 것이며, 이는 이들 차들이 실제 값들보다 효율적으로 인코딩될 수 있기 때문이다.
요약하면, 본 발명에 따른 바람직한 실시예에서, 기본층 BL이 다채널 오디오 신호 LI, RI의 전체 대역폭 FBW에 대해 결정된 파라미터들의 1개 세트 S1을 구비하도록 스테레오 파라미터 정보 INF를 체계화(organize)하는 것이 제안된다. 향상층 EL은 전체 대역폭 FBW내의 일련의 주파수 간격들 FR2, FR3, 등등에 대응하는 파라미터들의 다수의 세트들 S2, S3, 등등을 구비한다. 비트 레이트 효율을 위해, 향상층 EL의 파라미터들의 세트들 S2, S3, 등등은 기본층 BL의 파라미터들의 세트 S1에 관련하여 차등으로 인코딩될 수 있다.
정보 INF는 비트 레이트에 대한 디코딩 품질의 조정이 가능하도록 다층 수단(multi-layered manner)으로 인코딩된다.
결과로, 이하에서, 본 발명에 따른 바람직한 실시예는 프로그램 코드 및 설명에 관련하여 설명된다.
먼저, 모든 프레임들 F1, F2 등에서의 서브프레임들(부분 P1, P2, 등등)을 위해, 모노럴 표현 SC에 대한 데이터 ESC, 전체 대역폭 FBW에 대한 스테레오 파라미터들의 세트 S1에 대한 데이터 EIN, 및 주파수 빈들(또는 영역들) FR2, FR3, 등등에 대한 스테레오 파라미터들 S2, S3, 등등이 결정된다.
프로그램 코드는 좌측 끝에 도시되고, 프로그램 코드의 설명은 우측 끝에 설명하에 제공된다.
코드 설명
{
{
for(f=0;f<nrof_frames;f++) 모든 프레임들에 대해
{
example_mono_frame(f) 모노럴 신호 표현을
위한 데이터를 얻는다
(도3의 부분 A)
example_stereo_extension_layer_1(f) 전체 대역폭(부분 P1)
스테레오 파라미터들
데이터를 얻는다
example_stereo_extension_layer_2(f) 주파수 빈들(부분 P2)
스테레오 파라미터들
데이터를 얻는다
}
}
둘째, 비트 refresh_stereo의 값에 의존하여, 전체 대역폭에 대한 스테레오 파라미터들은 완전히(실제 값이 코딩된다) 코딩되거나 또는 이전 값들과의 차가 코딩된다. 하기 코드는 인터로럴 레벨차 ILD에 유효하다.
코드 설명
example_stereo_extension_layer_1(f)
{
refresh_stereo 데이터가 완전히 코딩
되었는지 여부를 표시
하는 1 비트
if(refresh_stereo==1) 데이터가 완전히 코딩
된다면
{
ild_global[f] 전체 주파수 영역(global
)에 대한 실제 인터로럴
인텐시티 차(ild)를 코딩
}
else 그렇지 않다면 리프레시
{
ild_global_diff[f] 이전 프레임에 관련하여
ild 코딩
}
}
제 3 번째, 비트 refresh_stereo의 값에 의존하여, 모든 주파수 빈들에 대한 스테레오 파라미터들은 완전히(실제 값이 코딩된다) 코딩되거나 또는 전체 대역폭에 대한 대응하는 파라미터들과의 차가 코딩된다. 하기 코드는 인터로럴 레벨차 ILD에 유효하다.
코드 설명
example_stereo_extension_layer_2(f)
{
if(refresh_stereo==1) 리프레시된다면
{
for(b=0;b<nrof_bins;b++) 모든 주파수 빈들에 대해
{
ild_bin[f,b] global 값에 관하여 상기
빈 내의 ild를 코딩
}
}
else 리프레시가 아니라면
{
for(b=0;b<nrof_bins;b++) 모든 빈들에 대해
{
ild_bin_diff[f,b] 이전 프레임의 특정 빈
내의 값에 관하여 특정
빈내에서 ild 코딩
}
}
}
여기서:
용어 "refresh_stereo"는 스테레오 파라미터들이 리프레시되는지 여부
(0= 거짓, 1= 참)를 표시하는 플래그이다.
용어 "ild_global[sf]"는 프레임 f에 대한 전체 주파수 영역에 대한 ILD의 호프만 인코딩 절대 표현 레벨(Huffman encoded absolute representation level)을 나타낸다.
용어 "ild_global_diff[f]"는 프레임 f에 대한 전체 주파수 영역에 대한 ILD의 호프만 인코딩 상대(relative) 표현 레벨을 나타낸다.
용어 "ild_bin[f,b]"는 프레임 f 및 빈 b에 대한 ILD의 호프만 인코딩 상대 표현 레벨을 나타낸다.
용어 "ild_bin_diff[f,b]"는 프레임 f 및 빈 b에 대한 ILD의 호프만 인코딩 상대 표현 레벨을 나타낸다.
상술된 실시예들은 본 발명을 제한하려고 예시한 것이 아니고, 당업자는 첨부된 청구의 범위를 벗어나지 않고 많은 대안 실시예들을 이루어낼 수 있을 것이다.
본 발명이 스테레오 신호에 관련하여 도면들에서 설명되었지만, 2개 이상의 채널 오디오 신호의 확장이 당업자에 의해 용이하게 이루어질 수 있다.
청구의 범위에서, 괄호간에 위치된 참조 부호들은 청구를 제한하는 것으로서 해석해서는 안될 것이다. 단어 "포함하는(comprising)"은 청구항에 나열된 것들외의 요소들 또는 단계들의 존재를 배제하는 것이 아니다. 본 발명은 여러 별개의 요소들을 포함하는 하드웨어의 수단, 및 적절하게 프로그램된 컴퓨터의 수단에 의해 구현될 수 있다. 여러 수단들을 열거하는 장치 청구항에서, 이들 여러 수단들은 하드웨어의 단일 및 동일한 아이템에 의해 실시될 수 있다. 일정 측정들이 상호간에 상이한 종속 청구항들에서 인용되는 단순한 사실은 이들 측정들의 조합이 유익하게 사용될 수 없다는 것을 표시하는 것이 아니다.
요약하면, 다채널 오디오 신호들은 모노럴 오디오 신호 및 정보로부터 다채널 오디오 신호를 복원하도록 허용하는 모노럴 오디오 신호 및 정보로 코딩된다. 정보는 다채널 오디오 신호의 제 1 주파수 영역에 대한 정보의 제 1 부분을 결정함으로서, 다채널 오디오 신호의 제 2 주파수 영역에 대한 정보의 제 2 부분을 결정함으로서 생성된다. 제 2 주파수 영역은 제 1 주파수 영역의 일부이고, 따라서, 제 2 주파수 영역은 제 1 주파수 영역의 부분-범위이다. 정보는 비트 레이트에 대한 디코딩 품질의 조정이 가능하도록 다층이 된다.

Claims (21)

  1. 적어도 2개의 오디오 채널들을 포함하는 다채널 오디오 신호를 인코딩하는 방법에 있어서:
    단일 채널 오디오 신호를 생성하고, 상기 단일 채널 오디오 신호를 비트 스트림으로 인코딩하여, 인코딩된 단일 채널 오디오 신호를 생성하는 단계; 및
    상기 적어도 2개의 오디오 채널들로부터 정보를 생성하는 단계로서, 상기 단일 채널 오디오 신호 및 상기 정보로부터 상기 다채널 오디오 신호를 요구된 품질의 레벨로 복원하도록 허용하는, 상기 정보 생성 단계를 포함하고, 상기 정보 생성 단계는:
    상기 다채널 오디오 신호의 제 1 주파수 영역에 대한 상기 정보의 제 1 부분을 결정하고, 상기 정보의 제 1 부분을 상기 비트 스트림으로 인코딩하여, 상기 정보의 인코딩된 제 1 부분을 생성하는 단계; 및
    상기 다채널 오디오 신호의 제 2 주파수 영역에 대한 상기 정보의 제 2 부분을 결정하고, 상기 제 2 주파수 영역은 상기 제 1 주파수 영역의 일부이고, 상기 정보의 제 2 부분을 상기 비트 스트림으로 인코딩하여, 상기 정보의 인코딩된 제 2 부분을 생성하는 단계를 포함하는, 다채널 오디오 신호 인코딩 방법.
  2. 적어도 2개의 오디오 채널들을 포함하는 다채널 오디오 신호를 인코딩하는 방법에 있어서,
    단일 채널 오디오 신호를 생성하는 단계; 및
    상기 적어도 2개의 오디오 채널들로부터 정보를 생성하는 단계로서, 상기 단일 채널 오디오 신호 및 상기 정보로부터 상기 다채널 오디오 신호를 요구된 품질의 레벨로 복원하도록 허용하는, 상기 정보 생성 단계를 포함하고, 상기 정보 생성 단계는:
    상기 인코딩된 다채널 오디오 신호의 최대 허용가능 비트 레이트를 수신하는 단계; 및
    상기 단일 채널 오디오 신호 및 상기 정보의 제 1 부분을 포함하는 상기 인코딩된 다채널 오디오 신호의 비트 레이트가 상기 최대 허용가능 비트 레이트보다 높지 않다면, 상기 다채널 오디오 신호의 제 1 주파수 영역에 대한 상기 정보의 제 1 부분만을 결정하는 단계를 포함하는, 다채널 오디오 신호 인코딩 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 단일 채널 오디오 신호는 상기 적어도 2개의 오디오 채널들의 특정 조합인, 다채널 오디오 신호 인코딩 방법.
  4. 제 1 항에 있어서,
    상기 정보는 파라미터들의 세트들을 포함하고, 상기 제 1 부분은 상기 파라미터들의 세트들 중 적어도 제 1 세트를 포함하고, 상기 제 2 부분은 상기 파라미터들의 세트들 중 적어도 제 2 세트를 포함하며, 파라미터들의 각각의 세트는 대응하는 주파수 영역에 연관되는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
  5. 제 4 항에 있어서,
    상기 파라미터들의 세트들은 적어도 하나의 로컬리제이션 큐(localization cue)를 포함하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
  6. 제 5 항에 있어서,
    상기 적어도 하나의 로컬리제이션 큐는:
    인터로럴(interaural) 레벨차, 인터로럴 시간 또는 위상차, 또는 인터로럴 상호 상관으로부터 선택되는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
  7. 제 1 항 또는 제 2 항에 있어서,
    상기 제 1 주파수 영역은 상기 다채널 오디오 신호의 전체 대역폭을 커버하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
  8. 제 1 항에 있어서,
    상기 제 1 주파수 영역은 상기 다채널 오디오 신호의 전체 대역폭을 커버하고, 상기 제 2 주파수 영역은 상기 전체 대역폭의 일부를 커버하고,
    상기 정보의 제 2 부분의 결정 단계는, 상기 제 2 주파수 영역 및 다른 주파수 영역들의 세트 둘 다에 대한 파라미터들의 세트들을 결정하고, 상기 제 2 주파수 영역 및 상기 다른 주파수 영역들의 세트는 상기 전체 대역폭을 커버하고, 상기 다른 주파수 영역들의 세트는 적어도 하나의 다른 주파수 영역을 포함하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
  9. 제 8 항에 있어서,
    상기 단일 채널 오디오 신호 및 상기 정보의 제 1 부분은 상기 인코딩된 다채널 오디오 신호에 항상 존재하는 정보의 기본층을 형성하고; 및
    상기 방법은 상기 인코딩된 다채널 오디오 신호의 최대 허용가능 비트 레이트를 수신하는 단계를 포함하고, 상기 정보의 제 2 부분은, 상기 인코딩된 기본층 및 향상층의 비트 레이트가 상기 최대 허용가능 비트 레이트보다 높지 않을 때만 인코딩되는 정보의 향상층을 형성하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
  10. 제 4 항에 있어서,
    인코딩된 정보의 특정 프레임에서의 상기 정보의 제 1 부분의 상기 결정 단계는 상기 특정 프레임에서의 상기 파라미터들의 세트들 중 상기 제 1 세트를 결정하는 단계, 및 상기 특정 프레임 이전의 프레임의 상기 파라미터들의 세트들 중 상기 제 1 세트에 기초하여 상기 파라미터들의 세트들 중 상기 제 1 세트를 코딩하는 단계를 포함하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
  11. 제 8 항에 있어서,
    상기 인코딩된 정보의 특정 프레임에서의 상기 정보의 제 2 부분의 상기 결정 단계는 상기 특정 프레임에서의 상기 제 2 부분의 상기 파라미터들의 세트들을 결정하는 단계, 및 상기 특정 프레임 이전의 프레임의 상기 파라미터들의 세트들에 기초하여 상기 특정 프레임에서의 상기 제 2 부분의 상기 파라미터들의 세트들을 코딩하는 단계를 포함하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
  12. 제 8 항에 있어서,
    상기 인코딩된 정보의 특정 프레임에서의 상기 정보의 제 2 부분의 상기 결정 단계는 상기 특정 프레임에서의 상기 제 2 부분의 상기 파라미터들의 세트들을 결정하는 단계, 및 상기 특정 프레임 이전의 프레임의 상기 파라미터들의 세트들 중 상기 제 1 세트에 기초하여 상기 특정 프레임에서의 상기 제 2 부분의 상기 파라미터들의 세트들을 코딩하는 단계를 포함하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
  13. 제 10 항 내지 제 12 항 중 어느 한 항에 있어서,
    상기 결정 단계는 상기 특정 프레임에서의 상기 대응하는 파라미터들과 상기 특정 프레임 이전의 상기 프레임간의 차를 계산하는 단계를 포함하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
  14. 적어도 2 개의 오디오 채널들을 포함하는 다채널 오디오 신호를 코딩하기 위한 인코더에 있어서:
    단일 채널 오디오 신호를 생성하기 위한 수단; 및
    상기 적어도 2개의 오디오 채널들로부터 정보를 생성하기 위한 수단으로서, 상기 단일 채널 오디오 신호 및 상기 정보로부터 상기 다채널 오디오 신호를 요구된 품질의 레벨로 복원하도록 허용하는, 상기 정보 생성 수단을 포함하고, 상기 정보 생성 수단은:
    상기 다채널 오디오 신호의 제 1 주파수 영역에 대한 상기 정보의 제 1 부분을 결정하기 위한 수단; 및
    상기 다채널 오디오 신호의 제 2 주파수 영역에 대한 상기 정보의 제 2 부분을 결정하기 위한 수단으로서, 상기 제 2 주파수 영역은 상기 제 1 주파수 영역의 일부인, 상기 제 2 부분 결정 수단을 포함하는, 인코더.
  15. 적어도 2개의 오디오 채널들을 포함하는 다채널 오디오 신호를 인코딩하기 위한 인코더에 있어서:
    단일 채널 오디오 신호를 생성하기 위한 수단; 및
    상기 적어도 2개의 오디오 채널들로부터 정보를 생성하기 위한 수단으로서, 상기 단일 채널 오디오 신호 및 상기 정보로부터 상기 다채널 오디오 신호를 요구된 품질의 레벨로 복원하도록 허용하는, 상기 정보 생성 수단을 포함하고, 상기 정보 생성 수단은:
    상기 인코딩된 다채널 오디오 신호의 최대 허용가능 비트 레이트를 수신하기 위한 수단; 및
    상기 단일 채널 오디오 신호 및 상기 정보의 제 1 부분을 포함하는 상기 인코딩된 다채널 오디오 신호의 비트 레이트가 상기 최대 허용가능 비트 레이트보다 높지 않다면, 상기 다채널 오디오 신호의 제 1 주파수 영역에 대한 상기 정보의 제 1 부분만을 결정하기 위한 수단을 포함하는, 인코더.
  16. 오디오 신호를 공급하기 위한 장치에 있어서:
    오디오 신호를 수신하기 위한 입력;
    인코딩된 오디오 신호를 얻기 위해 상기 오디오 신호를 인코딩하기 위한 제 14 항 또는 제 15 항에서 청구된 인코더; 및
    상기 인코딩된 오디오 신호를 공급하기 위한 출력을 포함하는, 오디오 신호 공급 장치.
  17. 인코딩된 오디오 신호에 있어서:
    단일 채널 오디오 신호; 및
    적어도 2개의 오디오 채널들로부터의 정보로서, 상기 단일 채널 오디오 신호 및 상기 정보로부터 다채널 오디오 신호를 요구된 품질의 레벨로 복원하도록 허용하는, 상기 정보를 포함하고, 상기 정보는:
    상기 다채널 오디오 신호의 제 1 주파수 영역에 대한 상기 정보의 제 1 부분; 및
    상기 다채널 오디오 신호의 제 2 주파수 영역에 대한 상기 정보의 제 2 부분으로서, 상기 제 2 주파수 영역은 상기 제 1 주파수 영역의 일부인, 상기 정보의 제 2 부분을 포함하는, 인코딩된 오디오 신호.
  18. 제 17 항에서 청구된 인코딩된 오디오 신호가 저장되는 저장 매체.
  19. 제 17 항에서 청구된 인코딩된 다채널 오디오 신호를 디코딩하는 방법에 있어서:
    디코딩된 단일 채널 오디오 신호를 얻는 단계;
    상기 정보로부터 디코딩된 정보를 얻는 단계로서, 상기 디코딩된 단일 채널 오디오 신호 및 상기 디코딩된 정보로부터 상기 다채널 오디오 신호를 복원하도록 허용하고, 상기 디코딩된 정보는 상기 정보의 제 1 부분 및 상기 정보의 제 2 부분을 포함하는, 상기 디코딩된 정보를 얻는 단계; 및
    상기 디코딩된 다채널 오디오 신호를 생성하기 위해, 상기 정보의 제 1 부분 또는 상기 정보의 제 1 부분 및 상기 제 2 부분을 상기 단일 채널 오디오 신호에 적용하는 단계를 포함하는, 디코딩 방법.
  20. 인코딩된 오디오 신호를 디코딩하기 위한 디코더에 있어서:
    디코딩된 단일 채널 오디오 신호를 얻기 위한 수단;
    정보로부터 디코딩된 정보를 얻기 위한 수단으로서, 상기 디코딩된 단일 채널 오디오 신호 및 상기 디코딩된 정보로부터 다채널 오디오 신호를 복원하도록 허용하고, 상기 디코딩된 정보는 상기 정보의 제 1 부분 및 상기 정보의 제 2 부분을 포함하는, 상기 디코딩된 정보를 얻기 위한 수단; 및
    상기 디코딩된 다채널 오디오 신호를 생성하기 위해, 상기 정보의 제 1 부분 및 상기 정보의 제 2 부분을 상기 단일 채널 오디오 신호에 적용하기 위한 수단을 포함하는, 디코더.
  21. 디코딩된 오디오 신호를 공급하기 위한 장치에 있어서,
    인코딩된 오디오 신호를 수신하기 위한 입력;
    다채널 출력 신호를 얻기 위해, 상기 인코딩된 오디오 신호를 디코딩하기 위한 제 20 항에서 청구된 디코더; 및
    상기 다채널 출력 신호를 공급하거나 또는 재생하기 위한 출력을 포함하는, 디코딩된 오디오 신호 공급 장치.
KR1020047017069A 2002-04-22 2003-04-22 파라메트릭 다채널 오디오 표현 KR101021079B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP02076588 2002-04-22
EP02076588.9 2002-04-22
EP02077869.2 2002-07-16
EP02077869 2002-07-16
PCT/IB2003/001591 WO2003090207A1 (en) 2002-04-22 2003-04-22 Parametric multi-channel audio representation

Publications (2)

Publication Number Publication Date
KR20040102163A KR20040102163A (ko) 2004-12-03
KR101021079B1 true KR101021079B1 (ko) 2011-03-14

Family

ID=29252214

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020047017069A KR101021079B1 (ko) 2002-04-22 2003-04-22 파라메트릭 다채널 오디오 표현

Country Status (11)

Country Link
US (1) US8498422B2 (ko)
EP (1) EP1500083B1 (ko)
JP (1) JP4714415B2 (ko)
KR (1) KR101021079B1 (ko)
CN (1) CN1647156B (ko)
AT (1) ATE332003T1 (ko)
AU (1) AU2003216686A1 (ko)
BR (2) BR0304542A (ko)
DE (1) DE60306512T2 (ko)
ES (1) ES2268340T3 (ko)
WO (1) WO2003090207A1 (ko)

Families Citing this family (115)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
DE60310449T2 (de) 2002-11-28 2007-10-31 Koninklijke Philips Electronics N.V. Audiosignalkodierung
US20040264713A1 (en) * 2003-06-27 2004-12-30 Robert Grzesek Adaptive audio communication code
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US20070168183A1 (en) * 2004-02-17 2007-07-19 Koninklijke Philips Electronics, N.V. Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7756713B2 (en) 2004-07-02 2010-07-13 Panasonic Corporation Audio signal decoding device which decodes a downmix channel signal and audio signal encoding device which encodes audio channel signals together with spatial audio information
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
TWI393121B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
TWI497485B (zh) 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
ATE442644T1 (de) * 2004-08-26 2009-09-15 Panasonic Corp Mehrkanalige signal-dekodierung
CN101010724B (zh) * 2004-08-27 2011-05-25 松下电器产业株式会社 音频编码器
KR20070056081A (ko) * 2004-08-31 2007-05-31 마츠시타 덴끼 산교 가부시키가이샤 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법
DE102004042819A1 (de) 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
EP1792520A1 (en) * 2004-09-06 2007-06-06 Koninklijke Philips Electronics N.V. Audio signal enhancement
DE102004043521A1 (de) * 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
US7860721B2 (en) * 2004-09-17 2010-12-28 Panasonic Corporation Audio encoding device, decoding device, and method capable of flexibly adjusting the optimal trade-off between a code rate and sound quality
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US7720230B2 (en) 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
KR101268218B1 (ko) * 2004-11-29 2013-10-17 내셔널 유니버시티 오브 싱가포르 휴대형 장치용 지각인지 저전력 오디오 디코더
KR101215868B1 (ko) * 2004-11-30 2012-12-31 에이저 시스템즈 엘엘시 오디오 채널들을 인코딩 및 디코딩하는 방법, 및 오디오 채널들을 인코딩 및 디코딩하는 장치
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
JP5017121B2 (ja) * 2004-11-30 2012-09-05 アギア システムズ インコーポレーテッド 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
EP1818911B1 (en) * 2004-12-27 2012-02-08 Panasonic Corporation Sound coding device and sound coding method
WO2006070757A1 (ja) * 2004-12-28 2006-07-06 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
US20080162148A1 (en) * 2004-12-28 2008-07-03 Matsushita Electric Industrial Co., Ltd. Scalable Encoding Apparatus And Scalable Encoding Method
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
WO2006075269A1 (en) * 2005-01-11 2006-07-20 Koninklijke Philips Electronics N.V. Scalable encoding/decoding of audio signals
WO2006082790A1 (ja) 2005-02-01 2006-08-10 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US9626973B2 (en) 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
JP4809370B2 (ja) * 2005-02-23 2011-11-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て
DE102005010057A1 (de) 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
JP4887288B2 (ja) * 2005-03-25 2012-02-29 パナソニック株式会社 音声符号化装置および音声符号化方法
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US8185403B2 (en) * 2005-06-30 2012-05-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
JP5113051B2 (ja) 2005-07-29 2013-01-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法
RU2414741C2 (ru) * 2005-07-29 2011-03-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ создания многоканального сигнала
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
KR101277041B1 (ko) * 2005-09-01 2013-06-24 파나소닉 주식회사 멀티 채널 음향 신호 처리 장치 및 방법
KR100878828B1 (ko) * 2005-10-05 2009-01-14 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
KR20070038439A (ko) 2005-10-05 2007-04-10 엘지전자 주식회사 신호 처리 방법 및 장치
US7761289B2 (en) 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths
US8036900B2 (en) * 2005-11-04 2011-10-11 National University Of Singapore Device and a method of playing audio clips
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
US20090018824A1 (en) * 2006-01-31 2009-01-15 Matsushita Electric Industrial Co., Ltd. Audio encoding device, audio decoding device, audio encoding system, audio encoding method, and audio decoding method
ATE456261T1 (de) 2006-02-21 2010-02-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
TWI447707B (zh) 2006-02-23 2014-08-01 Lg Electronics Inc 音頻訊號之處理方法及其裝置
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US20080004883A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Scalable audio coding
CN101652810B (zh) * 2006-09-29 2012-04-11 Lg电子株式会社 用于处理混合信号的装置及其方法
KR20090013178A (ko) 2006-09-29 2009-02-04 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
JP5232791B2 (ja) 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
US20080269929A1 (en) 2006-11-15 2008-10-30 Lg Electronics Inc. Method and an Apparatus for Decoding an Audio Signal
WO2008069596A1 (en) 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2102855A4 (en) 2006-12-07 2010-07-28 Lg Electronics Inc METHOD AND APPARATUS FOR DECODING AUDIO SIGNAL
EP2632164A3 (en) 2007-01-12 2014-02-26 ActiveVideo Networks, Inc. Interactive encoded content system including object models for viewing on a remote device
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
KR101453732B1 (ko) 2007-04-16 2014-10-24 삼성전자주식회사 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
US8521540B2 (en) * 2007-08-17 2013-08-27 Qualcomm Incorporated Encoding and/or decoding digital signals using a permutation value
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
EP2128856A4 (en) * 2007-10-16 2011-11-02 Panasonic Corp DEVICE FOR PRODUCING A STREAM AND DECODING DEVICE AND CORRESPONDING METHOD
JP5668923B2 (ja) * 2008-03-14 2015-02-12 日本電気株式会社 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
JP5773124B2 (ja) * 2008-04-21 2015-09-02 日本電気株式会社 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
PL2301017T3 (pl) * 2008-05-09 2017-05-31 Nokia Technologies Oy Urządzenie akustyczne
US8233629B2 (en) * 2008-09-04 2012-07-31 Dts, Inc. Interaural time delay restoration system and method
KR101108061B1 (ko) 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
US8258849B2 (en) * 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
US8346380B2 (en) 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
EP2214162A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
US7975063B2 (en) * 2009-05-10 2011-07-05 Vantrix Corporation Informative data streaming server
CN101556799B (zh) 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
US8194862B2 (en) * 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US9378754B1 (en) * 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
EP2628306B1 (en) 2010-10-14 2017-11-22 ActiveVideo Networks, Inc. Streaming digital video between video devices using a cable television system
EP2477418B1 (en) * 2011-01-12 2014-06-04 Nxp B.V. Signal processing method
US9204203B2 (en) 2011-04-07 2015-12-01 Activevideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
KR101930907B1 (ko) * 2011-05-30 2019-03-12 삼성전자주식회사 오디오 신호 처리 방법, 그에 따른 오디오 장치, 및 그에 따른 전자기기
US10409445B2 (en) 2012-01-09 2019-09-10 Activevideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
CN103534753B (zh) * 2012-04-05 2015-05-27 华为技术有限公司 用于信道间差估计的方法和空间音频编码装置
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
TWI505262B (zh) * 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
WO2014013294A1 (en) 2012-07-19 2014-01-23 Nokia Corporation Stereo audio signal encoder
US9460729B2 (en) * 2012-09-21 2016-10-04 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
WO2014145921A1 (en) 2013-03-15 2014-09-18 Activevideo Networks, Inc. A multiple-mode system and method for providing user selectable video content
US10199044B2 (en) * 2013-03-20 2019-02-05 Nokia Technologies Oy Audio signal encoder comprising a multi-channel parameter selector
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
EP3005712A1 (en) 2013-06-06 2016-04-13 ActiveVideo Networks, Inc. Overlay rendering of user interface onto source video
CN106104684A (zh) 2014-01-13 2016-11-09 诺基亚技术有限公司 多通道音频信号分类器
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
WO2016162283A1 (en) * 2015-04-07 2016-10-13 Dolby International Ab Audio coding with range extension
CN107358960B (zh) * 2016-05-10 2021-10-26 华为技术有限公司 多声道信号的编码方法和编码器
CN107358961B (zh) * 2016-05-10 2021-09-17 华为技术有限公司 多声道信号的编码方法和编码器
CN107731238B (zh) 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
US10063612B2 (en) * 2016-09-30 2018-08-28 Amazon Technologies, Inc. Request-based encoding for streaming content portions

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998051126A1 (en) * 1997-05-08 1998-11-12 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Method and apparatus for frequency-domain downmixing with block-switch forcing for audio decoding functions

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG49883A1 (en) * 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
IT1281001B1 (it) * 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
JPH09274500A (ja) * 1996-04-09 1997-10-21 Matsushita Electric Ind Co Ltd ディジタルオーディオ信号の符号化方法
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ATE338999T1 (de) * 2001-10-19 2006-09-15 Koninkl Philips Electronics Nv Differentielle kodierung im frequenz bereich von sinusmodell parametern
DE60208426T2 (de) * 2001-11-02 2006-08-24 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
DE60307252T2 (de) * 2002-04-11 2007-07-19 Matsushita Electric Industrial Co., Ltd., Kadoma Einrichtungen, verfahren und programme zur kodierung und dekodierung

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998051126A1 (en) * 1997-05-08 1998-11-12 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Method and apparatus for frequency-domain downmixing with block-switch forcing for audio decoding functions

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Patric De Smet et al., 'Subband based MPEG audio mixing for internet streaming applications',IEEE 2001

Also Published As

Publication number Publication date
EP1500083A1 (en) 2005-01-26
KR20040102163A (ko) 2004-12-03
US8498422B2 (en) 2013-07-30
AU2003216686A1 (en) 2003-11-03
WO2003090207A1 (en) 2003-10-30
US20050226426A1 (en) 2005-10-13
ATE332003T1 (de) 2006-07-15
EP1500083B1 (en) 2006-06-28
ES2268340T3 (es) 2007-03-16
JP2005523479A (ja) 2005-08-04
CN1647156A (zh) 2005-07-27
DE60306512T2 (de) 2007-06-21
CN1647156B (zh) 2010-05-26
JP4714415B2 (ja) 2011-06-29
DE60306512D1 (de) 2006-08-10
BRPI0304542B1 (pt) 2018-05-08
BR0304542A (pt) 2004-07-20

Similar Documents

Publication Publication Date Title
KR101021079B1 (ko) 파라메트릭 다채널 오디오 표현
JP4589962B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
US8359113B2 (en) Method and an apparatus for processing an audio signal
CA2645912C (en) Methods and apparatuses for encoding and decoding object-based audio signals
KR100717598B1 (ko) 파라미트릭 멀티채널 코딩 시스템에서의 주파수 기반오디오 채널 코딩
Faller et al. Binaural cue coding: a novel and efficient representation of spatial audio
JP2021503628A (ja) 量子化とエントロピーコーディングとを使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法
US7848931B2 (en) Audio encoder
TWI404429B (zh) 用於將多頻道音訊信號編碼/解碼之方法與裝置
KR20050021484A (ko) 오디오 코딩
US7644001B2 (en) Differentially coding an audio signal
TWI501220B (zh) 嵌入與擷取輔助資料
JP4809234B2 (ja) オーディオ符号化装置、復号化装置、方法、及びプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140227

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150227

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160225

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170303

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180223

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190222

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20200225

Year of fee payment: 10