KR101183857B1 - 다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및 장치 - Google Patents

다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및 장치 Download PDF

Info

Publication number
KR101183857B1
KR101183857B1 KR1020067026754A KR20067026754A KR101183857B1 KR 101183857 B1 KR101183857 B1 KR 101183857B1 KR 1020067026754 A KR1020067026754 A KR 1020067026754A KR 20067026754 A KR20067026754 A KR 20067026754A KR 101183857 B1 KR101183857 B1 KR 101183857B1
Authority
KR
South Korea
Prior art keywords
signal
residual
generating
component
prediction
Prior art date
Application number
KR1020067026754A
Other languages
English (en)
Other versions
KR20070030841A (ko
Inventor
알베르투스 씨. 덴 브린커
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20070030841A publication Critical patent/KR20070030841A/ko
Application granted granted Critical
Publication of KR101183857B1 publication Critical patent/KR101183857B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

다중 채널 오디오 신호를 인코딩하기 위한 인코더(100)는 심리-음향 예측 필터와 연관된 선형 예측에 의해 다중 채널 신호의 2개의 신호 성분을 위한 2개의 잔류 신호를 생성하는 예측 프로세서(101)를 포함한다. 예측 프로세서(105)는 메인 신호 및 사이드 신호를 생성하기 위해 2개의 잔류 신호의 결합된 신호를 회전시킨다. 바람직하게는, 메인 신호의 에너지는 최대화되고, 사이드 신호의 에너지는 최소화된다. 인코딩 프로세서(109)는 메인 및 바람직하게는 사이드 신호를 인코딩하고, 출력 프로세서(111)는 인코딩된 메인 데이터 및 바람직하게는 사이드 데이터, 예측 파라메타와 회전 파라메타를 포함하는 출력신호를 생성한다. 선형 예측, 다중 채널 신호를 인코딩하기 위한 일반 디코더(100)와 심리-음향 특성의 사용의 결합은 심리-음향 특성과 관련된 선형 예측에 의해 다중 채널 신호의 2개 신호 성분을 위한 2개의 잔류 신호를 생성하고, 특히 심리-음향 예측 필터를 사용하는 예측 프로세서(105)를 포함한다. 회전 프로세서(105)는 메인 신호 및 사이드 신호를 생성하기 위해 2개의 잔류 신호의 결합된 신호를 회전시킨다. 바람직하게는, 메인 신호의 에너지는 최대화되고, 사이드 신호의 에너지는 최소화된다. 인코딩 프로세서(109)는 메인 및 바람직하게는, 사이드 신호를 포함하며, 출력 프로세서(111)는 인코딩 메인 데이터 및 바람직하게는 사이드 데이터, 예측 파라메타 및 회전 파라메타를 포함하는 출력신호를 생성한다. 선형 예측, 심리-음향 특성의 사용, 메인 및 사이드 신호의 생성의 조합은 서로 다른 데이터 전송율을 위한 인코더의 유연성을 향상 시키고 인코딩을 개선한다.
Figure R1020067026754
신호, 파라메타, 인코딩, 디코딩, 심리

Description

다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및 장치 {METHOD AND APPARATUS TO ENCODE AND DECODE MULTI-CHANNEL AUDIO SIGNALS}
본 발명은 다중 신호 인코더, 다중 신호 디코더 및 방법에 관한 것으로서, 특히, 스테레오 오디오 신호의 인코딩에 대한 것이지만 이에 국한하는 것은 아니다.
최근에, 콘텐츠 신호를 디지털 폼으로의 배포 및 저장이 실질적으로 증가하고 있다. 따라서, 수많은 인코딩 표준 및 규약이 개발되고 있다.
가장 폭넓게 사용되는 오디오 신호의 디지털 인코딩을 위한 코딩 표준중의 하나가 MPEG(Motion Picture Expert Group) 레벨 3 표준(즉 MP3으로 언급됨)이 된다. 예를 들면, MP3은 30 또는 40 메가 바이트 노래의 PCM(Pulse Code Modulation) 오디오 레코딩이 예를 들면 3 또는 4 메가 바이트 MP3 파일로 압축되는 것을 허용한다. 정확한 압축율은 MP3로 인코딩된 오디오의 소정 품질에 의존한다.
MP3과 같은 오디오 인코딩 및 압축 기술은 비교적 작은 데이터 사이즈 및 고품질의 오디오 파일이 인터넷과 같은 데이터 네트워크를 통하여 편리하게 배포되도 록 허용되는 가장 효율적인 오디오 인코딩 방식을 제공한다.
많은 인코딩 규약은 스테레오 채널의 효율적인 인코딩을 제공한다. 스테레오 코딩은 주어진 품질 레벨을 위한 별도 채널의 비트 전송율의 합보다 오히려 더 낮은 비트 전송율을 얻기 위하여 스테레오 신호로부터 중복(redundancy) 및 부적절성(irrelevancy)을 제거하는데 목적이 있다.
수많은 스테레오 인코딩 알고리즘 및 기술이 알려져 있다. 한 가지 기술은 강도(intensity) 스테레오 코딩으로 알려져 있다. 이 강도 스테레오 코딩은 오디오 채널의 독립적인 코딩에 비교하여 비트 전송율에서 상당한 축소를 허용한다. 강도 스테레오에서, 모노 오디오 신호는 신호의 더 높은 주파수 범위를 위하여 발생된다. 또한, 별도의 강도 파라메타가 상이한 채널에 대해 발생된다. 일반적으로, 강도 파라메타는 모노 오디오 신호로부터 좌 및 우측 출력 신호를 발생시키기 위해 디코더에서 사용되는 좌 및 우측 스케일 팩터의 형태이다. 변형예는 단일 스케일 팩터 및 방향성 파라메타의 사용이다.
그러나, 강도 스테레오 코딩 기술은 몇 개의 단점을 가진다. 무엇보다도, 인코더는 더 높은 주파수에 대한 시간 및 위상 정보를 버리는 점이다. 그러므로 디코더는 원래의 오디오 자료에 존재하는 시간 또는 위상 채널 차이를 재생할 수 없게 된다. 더욱이, 일반적으로, 인코딩은 오디오 채널 사이의 상관관계를 보존할 수 없다. 따라서, 인코더에 의해 생성된 스테레오 신호의 품질 저하는 피할 수 없다.
또 다른 기술은 Mid/Side(즉 MS)코딩으로 알려져 있으며, 이 Mid 신호 성분은 좌 및 우측 채널 신호를 합산함으로써 발생될 수 있고, Side 채널은 좌 및 우측 채널 신호를 감산함으로써 발생될 수 있다. 좌 및 우측 신호 사이의 상관관계가 일반적으로 하이(high)이므로, 보통 이는 결국 Mid 신호 성분의 고 신호 에너지와 Side 신호의 저 신호 에너지가 된다. 따라서, Mid와 Side 신호는 일반적으로 서로 다른 인코딩 파라메타를 사용하여 인코딩되며, 여기서 Side 신호의 인코딩은 일반적으로 Side 신호에 대한 데이터 전송율을 감소시키는 방식으로 이루어진다.
MS 코딩의 단점은 MS 코딩의 비트 전송율 효율성이 일반적으로 예를 들면 강도 스테레오 인코딩보다 훨씬 더 낮아서 이에 의해 결국 증가된 데이터 전송율이 초래된다는 점이다. 최악의 상황에서, MS 코딩은 좌 및 우측 채널의 독립적인 코딩에 비교하여 비트 전송율에서 어떠한 이득도 제공하지 않게 된다.
또 다른 스테레오 인코딩 기술은 선형 예측 기술로 알려져 있으며, 이 경우 좌 및 우측 채널은 복소수 신호(complex signal)로 선형 결합된다. 따라서, 복소수 선형 예측 필터는 이 복소수 신호를 예측하기 위해 사용되고, 최종적인 잔류 신호가 인코딩된다. 이러한 인코더의 예가 Harma, Laine와 Karjalainen의 "An experimental audio codec based on warped linear prediction of complex valued signals"(회보 ICASSP-97, 페이지 323-326, 1997년 4월, 독일 뮌헨)에 주어진다.
현재의 선형 예측 제안과 관계된 문제는 좌 및 우측 채널을 복소수 신호로의 결합이 이 예측을 위한 이용 가능한 자유도에 있어 제한이 되는 좌 및 우측 채널의 시간적인 결합을 강요한다는 점이다. 따라서, 예측은 중복 정보(redundant information)의 최대 제거를 얻을 수 없게 된다. 더욱이, 이 기술은 인코딩이 개별적으로 최적화될 수 있는 메인 및 사이드 신호를 식별하거나 또는 구성하지 못한 다. 추가적으로, 사용된 예측 기준은 최적 예측이 되지 않는 단순한 예측 필터링에 기반한다. 따라서, 주어진 신호 품질을 위한 달성 가능한 데이터 전송율은 최적화되지 못한다.
다른 인코딩 기술은 주파수 대역 또는 주파수 서브 대역의 회전을 이용한다. 이러한 기술에서, 대역 필터는 좌 및 우측 채널을 위한 복수의 서브 대역 신호를 발생하기 위해 사용될 수 있다. 하나의 채널에 대한 각 서브 대역은 다른 채널의 서브 대역과 쌍을 이루고, 기본 성분 분석이 실행된다. 서브 대역 당 파라메타는 회전에 의해 서브 대역 당 메인 및 사이드 신호를 발생시키기 위해 인코더에 적용된다. 또한, 파라메타는 데이터 스트림에 저장되므로, 따라서 디코더는 역 프로세스를 적용할 수 있다.
이러한 회전자(rotator) 기술에서의 문제는 좌 및 우측 신호 사이에 가능한 시간-차이를 고려하지 않아 최적 성능을 달성할 수 없다는 점이다. 두 번째로, 오버랩 가산(overlap-add) 분석 및 합성으로 인해, 서브 대역 신호의 완전한 재구성은 신호 양자화가 없는 경우조차 가능하지 못하다.
현재, 저 데이터 전송율 스테레오 인코딩을 위한 가장 기대되는 기술은 지각적인(perceptual) 모델 및 정보가 이 인코딩된 데이터 전송율을 감소시키기 위해 사용되는 지각적인 스테레오 코딩이 될 것으로 보인다. 따라서, 가능한 한 촘촘하게 원래 스테레오 신호의 파형을 표현하려 하기 보다는, 이 지각적인 스테레오 인코딩은 디코더가 사용자를 위해 동일한 오디오 지각이 되는 출력 신호를 발생시키는 것을 필요로 하는 신호를 생성하는 것을 목표로 한다.
이러한 접근 방식에 있어 고유의 문제는 신호 양자화가 없는 경우조차, 원래 신호가 완전하게 재구성될 수 없다는 점이다. 이는 특히 분석 및 합성 시스템에서 사용되는 오버랩-가산 절차에 기인할 수 있다. 따라서, 고 데이터 전송율 응용을 위하여, 지각적인 스테레오 인코딩의 성능은 재구성된 신호의 더 낮은 품질을 제공하는 경향이 있다.
따라서, 다중 채널 인코딩 및/또는 디코딩을 위한 개선된 시스템은 유리하며, 특히 증가된 유연성, 감소된 데이터 전송율, 증가된 품질 및/또는 감소된 복잡성을 허용하는 시스템이 유리할 것이다. 특히, 높은 데이터 전송율에서의 높은 신호 품질 및 낮은 데이터 전송율에서의 효율적인 인코딩을 허용하는 시스템이 유리하다.
따라서, 바람직하게는, 본 발명은 상기 기술된 단점의 하나 이상을 단독으로, 또는 임의의 결합, 경감, 완화 또는 제거를 추구한다.
본 발명의 제 1 측면에 따르면, 적어도 제 1 신호 성분 및 제 2 신호 성분을 포함하는 다중 채널 신호를 인코딩하는 신호 인코더로서, 상기 제 1 신호 성분과 제 2 신호 성분의 심리-음향 특성과 관계된 선형 예측에 의해 상기 제 1 신호 성분의 제 1 잔류 신호와 상기 제 2 신호 성분의 제 2 잔류 신호를 생성하는 예측 수단; 상기 제 1 잔류 신호 및 제 2 잔류 신호를 포함하는 결합한 신호의 회전에 의해 사이드 신호와 상기 사이드 신호보다 더 높은 신호 에너지를 가지는 메인 신호를 생성하는 회전 수단; 인코딩된 메인 데이터를 생성하기 위해 상기 메인 신호를 인코딩하는 제 1 인코딩 수단; 및 상기 인코딩된 메인 데이터를 포함하는 출력 신호를 생성하는 출력 수단을 포함하는 다중 채널 신호를 인코딩하는 신호 인코더가 제공된다.
본 발명은 소정의 품질 레벨을 위한 감소된 데이터 전송율 및/또는 소정의 데이터 전송율에서 개선된 품질을 제공할 수 있다. 대안적으로 또는 추가적으로, 본 발명은 데이터 전송율의 범위에 대하여 개선된 유연성 및/또는 개선된 성능을 가지는 신호 인코더를 제공할 수 있다. 특히, 본 발명은 고 데이터 전송율에서 원래 신호의 파형의 정확한 표현을 허용하는 인코딩 방식을 제공하면서, 저 데이터 전송율에서 효율적인 인코딩에 적합한 메인 및 사이드 신호를 생성할 수 있다.
본 발명은 서로 다른 인코딩 접근법의 장점이 개별 인코딩 방식과 관련된 단점을 극복하기 위하여 결합되는 것을 허용할 수 있다. 특히, 본 발명은 예측을 위해 증가된 수의 자유도를 제공해서 잔류 신호의 크기를 감소시킬 수 있다. 더욱이, 오디오 신호를 위한 개선된 예측은 심리-음향 특성에 기반한 예측을 사용함으로써 달성될 수 있다. 이 심리-음향 특성은 사용자에 의한 오디오 신호의 지각을 가리킨다. 개선된 예측과 회전의 결합은 소정의 품질 레벨을 위한 데이터 전송율을 감소시킬 수 있으며, 특히 개별 신호의 특성에 특히 적합한 알고리즘에 의해 개별적으로 인코딩될 수 있는 메인 신호 및 사이드 신호를 생성할 수 있다.
특히, 본 발명의 실시예는 신호 양자화가 없는 경우 사실상 완전한 신호 재구성을 허용하고 따라서 고 데이터 전송율을 위한 거의 완벽한 신호 재구성을 허용하는 신호 인코더를 제공할 수 있다. 또한, 동일한 신호 인코더는 저 데이터 전송율 인코딩에 유리할 수 있는 파라메트릭(parametric) 지각 스테레오 코딩에 의해 제공된 메인 신호 및 사이드 신호와 유사한 메인 및 사이드 신호를 구성할 수 있다.
메인 신호의 인코딩은 예를 들면 메인 신호의 양자화를 포함할 수 있다. 바람직하게는, 출력 수단은 출력 신호에서 선형 예측의 회전 파라메타 및/또는 예측 파라메타를 더 포함하기 위해 동작 가능하다.
본 발명의 바람직한 특징에 따르면, 신호 인코더는 인코딩된 사이드 데이터를 생성하기 위해 사이드 신호를 인코딩하는 제 2 인코딩 수단을 더 포함하고, 출력 수단은 출력 신호에서 인코딩된 사이드 데이터를 포함하도록 추가로 작동가능하다.
이는 디코더가 저 데이터 전송율을 유지하면서 더 높은 품질을 가지는 신호를 생성하는 것을 허용할 수 있다.
바람직하게는, 인코딩된 메인 데이터 신호의 데이터 전송율은 인코딩된 사이드 데이터의 데이터 전송율보다 더 높다. 바람직하게는, 인코딩된 메인 데이터의 샘플링 율은 인코딩된 사이드 신호의 샘플링 율보다 더 높고, 및/또는 인코딩된 메인 데이터의 양자화는 인코딩된 사이드 신호에 대한 것보다 더 정교하다.
본 발명의 바람직한 특징에 따르면, 제 2 인코딩 수단은 사이드 신호를 파라메트릭(parametric)적으로 인코딩하도록 동작 가능하다. 이는 결국 소정의 품질 레벨을 위한 출력 신호의 저 데이터 전송율이 되는 효율적인 인코딩을 제공할 수 있다.
본 발명의 바람직한 특징에 따르면, 예측 수단은 적어도 하나의 심리-음향(psycho-acoustic)에 기반한 필터 시스템을 포함한다. 이는 효율적인 예측 성능을 제공할 수 있고/있거나 구현을 용이하게 할 수 있다. 심리-음향 기반 필터 시스템은 예를 들면 카우츠 필터 뱅크(Kautz filter bank), 라구에르 필터 뱅크(Laquerre filter bank), 탭된 올패쓰 라인(tapped allpass line) 또는 감마톤 필터 뱅크(Gamma-tone filter bank)가 될 수 있다.
본 발명의 바람직한 특징에 따르면, 회전 수단은 메인 신호의 신호 에너지를 실질적으로 최대화하기 위해 결합된 신호를 회전시키는 것이 가능하다. 이는 다중 채널 신호의 효율적인 인코딩을 제공할 수 있다. 특히, 이는 메인 신호에서의 정보를 증가시켜, 메인 신호의 정확한 인코딩이 높은 정도의 정보를 유지하는 것을 허용할 수 있다.
본 발명의 바람직한 특징에 따라, 회전 수단은 사이드 신호의 신호 에너지를 실질적으로 최소화시키기 위해 결합된 신호를 회전시키는 것이 가능하다. 이는 다중 채널 신호의 효율적인 인코딩을 제공할 수 있다. 특히, 이는 사이드 신호의 손실 인코딩으로부터 유래한 출력 신호에 대한 저하가 감소되는 것을 허용하는 사이드 신호의 상대적인 정보 콘텐츠를 감소시킬 수 있다. 특히, 사이드 신호가 폐기되는 실시예에서, 이와 연관된 품질저하가 감소될 수 있다.
본 발명의 바람직한 특징에 따라, 예측 수단은, 상기 제 1 신호 성분에 응답하여 상기 제 1 신호 성분을 위하여 제 1 평가 신호를 발생하는 제 1 예측기; 상기 제 2 신호 성분에 응답하여 상기 제 1 신호 성분을 위하여 제 2 평가 신호를 발생하는 제 2 예측기; 및 상기 제 1 평가 신호 및 제 2 평가 신호에 의해 감산되는 상기 제 1 신호 성분으로서의 상기 제 1 잔류 신호를 생성하는 수단을 포함한다.
이는 적합한 구현예를 제공할 수 있고/있거나 정확한 예측 및 출력 신호의 데이터 전송율과 품질 레벨 간의 개선된 비율을 야기할 수 있다. 특히, 특징은 제 1 신호 성분과 제 2 신호 성분에 기반한 제 1 신호 성분의 독립적인 예측을 허용할 수 있다. 제 1 및 제 2 예측기는 특히 서로 다른 시간 예측치를 결과로서 생기게 할 수 있다. 제 1 평가 신호와 제 2 평가 신호 사이의 시간적인 독립성은 결국 개선된 성능이 되는 예측을 위한 증가된 자유도(degree of freedom)를 제공한다.
제 1 및/또는 제 2 예측기의 각각은 FIR(Finite Impulse Response:유한 임펄스 응답) 또는 IIR(Infinite Impulse Response: 무한 임펄스 응답) 필터를 포함할 수 있고 특히 심리-음향 기반 필터 뱅크를 포함할 수 있다.
본 발명의 바람직한 특징에 따르면, 예측 수단은, 상기 제 1 신호 성분에 대한 응답으로 제 2 신호 성분을 위한 제 3 평가 신호를 생성하는 제 3 예측기; 제 2 신호 성분에 대한 응답으로 제 2 신호 성분을 위한 제 4 평가 신호를 생성하는 제 4 예측기; 및 제 3 평가 신호 및 제 4 평가 신호에 의해 감산되는 제 2 신호 성분으로서의 제 2 잔류 신호를 생성하는 수단을 포함한다.
이는 적합한 구현예를 제공할 수 있고/있거나 정확한 예측 및 출력 신호의 데이터 전송율과 품질 레벨 간의 개선된 비율을 야기할 수 있다.
제 3 및/또는 제 4 예측기의 각각은 FIR(Finite Impulse Response:유한 임펄스 응답) 또는 IIR(Infinite Impulse Response: 무한 임펄스 응답) 필터를 포함할 수 있고 특히 심리-음향 기반 필터 뱅크를 포함할 수 있다.
본 발명의 바람직한 특징에 따라, 회전자는 결합 신호에 행렬 곱셈을 실행하기 위해 동작할 수 있다. 이는 적절한 구현을 제공할 수 있다.
본 발명의 바람직한 특징에 따라, 신호 인코더는 제 1 신호 성분 및 제 2 신호 성분의 스펙트럼 특성에 대한 응답으로 메인 신호를 스펙트럼으로 형성하는 수단을 더 포함한다. 바람직하게는, 제 1 인코딩 수단은 심리-음향 모노 인코더를 포함한다. 이는 결국 출력 신호와 품질 레벨의 데이터 전송율 간에 개선된 비율이 된다.
다중 채널 신호는 임의의 복수의 신호 성분을 포함할 수 있으나, 바람직하게는 다중 채널 신호는 스테레오 오디오 신호가 된다.
본 발명의 제 2 측면에 따라, 다중 채널 신호를 디코딩하는 신호 디코더가 제공되며, 상기 신호 디코더는, 다중 채널 신호를 수신하는 수신 수단; 상기 다중 채널 신호의 회전에 의해 제 1 잔류 신호 및 제 2 잔류 신호를 생성하는 회전 수단; 상기 제 1 잔류 신호 및 상기 제 2 잔류 신호에 대한 응답으로 심리-음향 특성과 결합된 선형 예측에 의해 출력 다중 채널 신호를 생성하는 합성수단을 포함한다.
본 발명의 제 3 측면에 따르면, 적어도 제 1 신호 성분 및 제 2 신호 성분을 포함하는 다중 채널 신호를 인코딩하는 방법으로서, 상기 제 1 신호 성분과 제 2 신호 성분의 심리-음향 특성과 관계된 선형 예측에 의해 상기 제 1 신호 성분의 제 1 잔류 신호와 상기 제 2 신호 성분의 제 2 잔류 신호를 생성하는 단계; 상기 제 1 잔류 신호 및 제 2 잔류 신호를 포함하는 결합한 신호의 회전에 의해 사이드 신호와 상기 사이드 신호보다 더 높은 신호 에너지를 가지는 메인 신호를 생성하는 단계; 인코딩된 메인 데이터를 생성하기 위해 상기 메인 신호를 인코딩하는 단계; 및 상기 인코딩된 메인 데이터를 포함하는 출력 신호를 생성하는 단계를 포함하는 다중 채널 신호를 인코딩하는 방법이 제공된다.
본 발명의 제 4 측면에 따르면, 다중 채널 신호를 디코딩하는 방법으로서, 다중 채널 신호를 수신하는 단계; 상기 다중 채널 신호의 회전에 의해 제 1 잔류 신호 및 제 2 잔류 신호를 생성하는 단계; 및 상기 제 1 잔류 신호 및 제 2 잔류 신호에 대한 응답으로 심리-음향 특성과 결합된 선형 예측에 의해 출력 다중 채널 신호를 생성하는 단계를 포함하는 다중 채널 신호를 디코딩하는 방법이 제공된다.
본 발명의 제 5 측면에 따르면, 다중 채널 신호를 위한 인코딩된 데이터를 포함하는 데이터 스트림으로서, 상기 다중 채널 신호의 제 1 신호 성분 및 제 2 신호 성분의 선형 예측을 가리키는 선형 예측 파라메타; 상기 제 1 신호 성분의 선형 예측과 결합된 제 1 잔류 신호 및 상기 제 2 신호 성분의 선형 예측과 결합된 제 2 잔류 신호를 포함하는 결합된 신호와 메인 신호 사이에 회전값을 가리키는 회전 파라메타; 및 상기 메인 신호의 인코딩된 메인 데이터를 포함하는 인코딩된 데이터를 포함하는 데이터 스트림이 제공된다.
본 발명의 위 측면, 다른 측면, 특징 및 이점은 이후 기술되는 실시예를 참조하여 명백하고도 명료해질 것이다.
본 발명의 실시예는 도면을 참조하여 단지 예를 위하여 기술될 것이다.
도 1은 본 발명의 실시예에 따라 인코더를 위한 블럭도의 예를 예시한 도면.
도 2는 본 발명의 실시예에 따라 디코더를 위한 블럭도의 예를 예시한 도면.
도 3은 본 발명의 실시예에 따른 인코더를 위한 선형 예측 및 회전 수단의 구현을 예시한 도면.
도 4는 본 발명의 실시예에 따라 디코더 내의 선형 예측의 구현을 예시한 도면.
도 5는 본 발명의 실시예에 따라 디코더를 위한 선형 예측 및 회전 수단의 구현을 예시한 도면.
도 6은 본 발명의 실시예에 따라 디코더에서 선형 예측의 구현을 예시한 도면.
다음 설명은 스테레오 오디오 신호를 위한 인코더 및 디코더에 적용 가능한 본 발명의 실시예에 초점이 맞추어 진다. 그러나, 본 발명은 이러한 적용에 제한되지 않으며, 많은 다른 다중 채널 신호에 적용될 수 있음을 이해해야 할 것이다.
도 1은 본 발명의 실시예에 따라 인코더(100)를 위한 블럭도의 예를 도시한 것이다.
인코더(100)는 본 기술된 실시예에서 좌측 채널 신호가 되는 제 1 신호 성분(x1)과 본 기술된 실시예서 우측 채널 신호가 되는 제 2 신호 성분(x2)을 포함하는 스테레오 신호를 수신한다. 제 1 및 제 2 신호 성분(x1,x2)은 예측 프로세서(101)에 공급되고, 이 프로세서(101)는 제 1 및 제 2 신호 성분(x1,x2)의 선형 예측에 의해 제 1 신호 성분의 제 1 잔류 신호(e1)와 제 2 신호 성분의 제 2 잔류 신호(e2)를 생성한다.
제 1 및 제 2 신호 성분(x1,x2)은 예측 파라메타 프로세서(103)에 추가로 공급되며, 이 파라메타 프로세서는 예측 프로세서(101)에 의해 실행되는 선형 예측을 위한 최적 예측 계수를 결정한다. 따라서, 예측 파라메타 프로세서(103)는 예측 프로세서(101)에 연결되고, 이 결정된 예측 파라메타를 이 예측 파라메타 프로세서(103)에 공급한다. 예측 파라메타 프로세서(103)는 당업자에게 잘 알려진 선형 회귀과 같은 잘 알려진 최적화 알고리즘을 사용하여 예측 파라메타를 결정할 수 있다.
예측 파라메타 프로세서(103)는 예측 파라메타의 스펙트럼 평활화(또한 피크-넓힘(peak-broadening)으로도 알려짐) 및 보간과 같은 다른 표준 선형 예측 동작을 추가로 실행할 수 있다. 일반적으로, 또한 예측 파라메타 프로세서(103)는 파라메타의 양자화를 포함할 것이다.
예측 파라메타 프로세서(103)로부터 수신된 예측 파라메타에 기반하여, 예측 프로세서(101)는 현재의 좌측 및 우측 채널 샘플의 기대값을 생성하고 제 1 및 제 2 신호 성분(x1,x2)의 실제값으로부터 이 기대값을 감산한다. 따라서, 예측 프로세서(101)는 제 1 및 제 2 잔류 신호(e1,e2)를 발생시키며, 이 잔류 신호는 예측된 값과 제 1 및 제 2 신호 성분(x1,x2)의 실제값 사이의 차이에 대응한다. 잔류 신호(e1,e2)의 값은 일반적으로 제 1 및 제 2 신호 성분값보다 훨씬 더 낮은 값이다.
예측 프로세서(101)는 사람에 의해 오디오의 지각을 고려하는 선형 예측을 실행하는 것을 가능하게 한다. 따라서, 선형 예측은 심리-음향 특성과 연관된다. 예컨대, 선형 예측은 서로 다른 주파수 범위 내에서 사람의 귀에 대한 민감도, 임펄스 성능 및 볼륨 레벨에 대한 민감도 등을 고려할 수 있다. 선형 예측은 심리-음향 특성에 의존해서 파라메타를 변경하거나 변화시킬 수 있으며, 또는 이 심리-음향 특성은 예를 들면 예측 프로세서(101)의 구현 및 설계의 실질적인 일부일 수 있다. 예를 들면, 사용된 알고리즘은 인간 청취의 심리-음향 모델을 반영하기 위해 선택될 수 있다. 특히, 예측 프로세서(101)는 카우츠 필터 뱅크(Kautz filter bank), 라구에르 필터 뱅크(Laquerre filter bank) 또는 감마톤 필터 뱅크(Gamma-tone filter bank)와 같은 하나 이상의 심리-음향 기반 예측 시스템을 사용할 수 있다.
예측 프로세서(101)는 회전 프로세서(105)에 연결되며, 이 회전 프로세서(105)는 제 1 잔류 신호(e1) 및 제 2 잔류 신호(e2)를 포함하는 결합된 신호의 회전에 의해 메인 신호 및 사이드 신호를 생성한다. 더욱이, 예측 프로세서(101)는 회전 계수 프로세서(107)에 연결되며, 이 회전 계수 프로세서(107)는 회전 프로세서(105)에 의해 사용된 회전 계수를 결정한다. 특정 실시예에서, 결합된 신호는 e1+jㆍe2에 대응하는 복소수 신호로 여겨질 수 있으며, 이 복소수 신호는 복소수 회전 값(a + jㆍb)에 곱해지면서 다음식에 의해 주어진 메인 및 사이드 신호가 된다.
Figure 112006094008562-pct00001
등가적으로, 회전 계수 프로세서(107)는 회전 프로세서(105)에 의해 실행되는 다음 행렬 계산식에서 사용될 수 있는 각도값(α0)을 생성할 수 있다.
Figure 112006094008562-pct00002
본 실시예에서, 회전 계수 프로세서(107)는 메인 신호가 사이드 신호보다 더 높은 신호 에너지를 갖도록 회전 파라메타를 결정한다. 이는 일반적으로 메인 신호의 신호값이 사이드 신호의 값보다 더 커지게 하여 메인 신호에서 정보의 집중을 제공한다. 이는 더 효율적인 인코딩을 허용할 수 있다. 특히, 사이드 신호의 양자화 및/또는 샘플링율은 실질적으로 감소될 수 있다. 일부 실시예에서, 사이드 신호는 심지어는 완전히 폐기될 수 있다.
기술된 실시예에서, 회전 계수 프로세서(107)는 신호 에너지가 사이드 신호를 위해 최소화되고/되거나 메인 신호를 위해 최대화되도록 회전 파라메타를 결정한다. 예를 들면, 각도값(α0)이 결정되므로, 메인 신호는 최대화되고, 사이드 신호는 최소화되도록 결정된다.
회전 프로세서(105)는 인코딩 프로세서(109)에 연결되며, 이 인코딩 프로세서(109)는 인코딩된 메인 데이터를, 그리고, 바람직하게는, 인코딩된 사이드 데이터를 생성하기 위해 메인 및 사이드 신호를 인코딩한다. 메인 및 사이드 신호를 인코딩하는 임의의 적절한 인코딩 수단이 사용될 수 있다는 것이 인식될 것이다. 단순한 실시예에서, 인코딩 프로세서(109)는 메인 및 사이드 신호의 개별 양자화에 의해 메인 및 사이드 신호(bm, bs)를 위한 양자화 데이터를 생성하는 양자화기(quantizer generating quantized data)를 포함할 수 있다.
일부예에서, 사이드 신호는 파라메타적으로 인코딩되어 사이드 신호의 파형을 기술하는 신호 데이터 값을 포함하기 보다는, 사이드 신호의 하나 이상의 특성을 설명하는 하나 이상의 파라메타가 포함된다. 이는 사이드 신호의 매우 효율적이고 낮은 데이터 전송율의 인코딩을 허용할 수 있다.
인코딩 프로세서(109)는 인코딩된 메인 데이터 및 바람직하게는 인코딩된 사이드 데이터를 포함하는 출력 신호를 발생하는 출력 프로세서(111)에 연결된다. 덧붙여, 기술된 실시예에서 출력 프로세서(111)는 회전 파라메타뿐만 아니라 선형 예측을 위해 사용되는 예측 파라메타를 포함한다. 따라서, 스테레오 신호를 나타내는 단일 비트스트림(bitstream)이 발생한다.
회전으로 심리-음향 파라메타에 기반하는 선형 예측의 최종 잔류 신호와 결합은 고 유연성을 갖는 매우 효율적인 인코딩을 제공한다. 특히, 메인 및 사이드 신호의 생성은 더 낮은 데이터 전송율에서 매우 효율적인 인코딩을 제공할 수 있다. 더욱이, 고 데이터 전송율에서 인코더는 원래 신호가 매우 정확히 생성될 수 있는 비트스트림을 생성한다.
도 2는 본 발명의 실시예에 따라 디코더(200)를 위한 블럭도의 예를 예시한 것이다. 디코더는 도 1의 인코더로부터 비트스트림을 디코딩할 수 있으며 이를 참조하여 기술될 것이다.
디코더(200)는 리시버(201)를 포함하며, 이 리시버는 인코더(100)에 의해 생성된 비트스트림의 형태로 인코더(100)로부터 다중 채널 신호를 수신한다. 이 리시버(201)는 디멀티플렉서(de-multiplexer)를 포함하며, 이 디멀티플렉서는 비트스트림의 데이터를 분리하고 디코더(200)의 적합한 기능 블럭에 이 데이터를 제공하는 것을 가능하게 한다.
디코더(200)는 비트스트림으로부터 메인 신호 및 사이드 신호를 생성하는 디코더 프로세서(203)를 포함한다. 특히, 리시버(201)는 디코더 프로세서(203)에 인코딩된 메인 및 사이드 신호(bm,bs)를 공급하며, 이 디코더 프로세서는 도 1의 인코더(100)의 인코딩 프로세서(109)에 보상 동작을 실행한다. 단순한 실시예에서, 인코딩 프로세서(109)는 단순히 회전 프로세서(105)로부터 데이터 값을 양자화하고, 디코더 프로세서(203)는 인코딩된 메인 및 사이드 데이터에서 수신된 양자화된 값을 포워딩할 수 있다.
더욱이, 디코더(201)는 디코더 프로세서(203)에 연결된 디코딩 회전 프로세서(205)를 포함한다. 이 디코더 프로세서(203)는 수신된 메인 및 사이드 신호를 디코딩 회전 프로세서(205)에 제공하며, 이 디코딩 프로세서(205)는 메인 및 사이드 신호의 회전에 의해 제 1 잔류 신호(e1) 및 제 2 잔류 신호(e2)를 재생성한다. 특히, 디코딩 회전 프로세서(205)는 다음 행렬 연산을 실행할 수 있다.
Figure 112006094008562-pct00003
따라서, 디코딩 회전 프로세서(205)는 리시버(201)로부터 값(α0)을 제공받는다.
디코딩 회전 프로세서(205)는 예측 디코더(207)에 연결된다. 이 예측 디코더(207)는 선형 예측 필터링에 의하여 다중 채널 신호의 제 1 신호 성분을 위한 제 1 예측된 신호 및 다중 채널 신호의 제 2 신호 성분을 위한 제 2 예측된 신호를 생성한다. 제 1 및 제 2 예측된 신호는 잔류 신호를 발생시키기 위해 예측 프로세서(101)에 의해 사용된 예측된 신호에 대응하도록 생성된다. 특히, 동일한 예측 알고리즘이 디코딩된 신호에 기반하여 사용될 수 있다. 따라서, 예측 디코더(207)는 리시버(201)로부터 예측 파라메타(αm)를 수신한다.
인코더와 유사하게, 선형 예측 필터링은 인간 청취자의 심리-음향 인식의 특성을 나타내는 예측 필터와 같은 적절한 심리-음향 특성에 기반한다.
제 1 예측된 신호 및 제 1 잔류 신호(e1)에 기반하여, 제 1 신호 성분(x1)은 예측 디코더(207)에 의해 재생성된다. 유사하게, 제 2 신호 성분(x2)은 제 2 예측된 신호 및 제 2 잔류 신호에 기반하여 생성된다.
비록 위 설명이 예측 파라메타와 회전 파라메타가 수신된 데이터 스트림에 포함되는 구현예에 초점이 맞추어졌을 지라도, 이는 본 발명의 필수적인 특징이 될 수 없음을 이해할 것이다.
예를 들면, 일부 실시예에서 이 값은 역방향 즉응형 알고리즘을 사용하여 구성될 수 있다.
다음에서, 도 1의 인코더(100) 측면이 더 상세히 기술될 것이다.
도 3은 본 발명의 실시예에 따라 선형 예측 및 회전 수단의 구현을 예시한 것이다. 특히, 도면은 도 1의 예측 프로세서(101) 및 회전 프로세서(105)의 실시예를 예시한 것이다.
제 1 및 제 2 신호 성분(x1,x2)은 예측 프로세서(101)에 입력되며, 이 예측 프로세서(101)는 출력 신호(e1,e2)를 산출하는 2채널 예측기가 된다.
실시예에서, 예측 프로세서(101)는 4개의 예측기(301,303,305,307)를 포함하며, 각 예측기는 제 1 및 제 2 신호 성분(x1,x2)과 제1 및 제 2 예측 신호의 4가지 가능한 조합 중의 하나에 대응한다.
따라서, 실시예에서, 예측 프로세서(101)는 제 1 신호 성분에 응답해서 제 1 신호 성분에 대한 제 1 평가 신호를 생성하는 제 1 예측기(301), 제 2 신호 성분에 응답해서 제 1 신호성분에 대한 제 2 평가 신호를 생성하는 제 2 예측기(303), 제 1 신호 성분에 대한 응답으로 제 2 신호 성분을 위한 제 3 평가 신호를 생성하는 제 3 예측기(305) 및 제 2 신호 성분에 대한 응답으로 제 2 신호 성분을 위한 제 4 평가 신호를 생성하는 제 4 예측기(307)를 포함한다.
실시예에서, 예측기의 각각은 카우츠 필터 뱅크(Kautz filter bank), 라구에르 필터 뱅크(Laguerre filter bank), 탭된 올패쓰 라인(tapped allpass line) 또는 감마-톤 필터(Gamma-tone filter)와 같은 심리-음향 기반의 예측 시스템이다. 스미스와 아벨의 "Bark and ERB bilinear transform"(IEEE Trans. Speech and Audio Processing, VOL.7, 697 - 708 쪽, 1999년)에서 공개된 Barkscale 또는 ERB scale와 같은 심리-음향 관련 주파수 스케일을 닮은 뒤틀린 주파수 스케일(warped frequency scale)에 따라 라구에르 필터 뱅크 또는 탭된 올패쓰 라인에서의 올패쓰 필터가 취해질 수 있다. 카우츠 또는 감마-톤 필터 뱅크에서, 필터 전달(filter transfer)은 센터 주파수 및 대역폭이 정량적으로 심리-음향 실험에서 발견되는 것과 유사하도록 선택될 수 있다.
오디오 및 스피치 코딩을 목적으로, 심리-음향 특성과 결합된 예측 필터의 사용은 탭된-지연-라인(tapped-delay-line) 필터링에 기반한 종래의 예측 알고리즘에 비교하여 개선된 품질을 제공한다.
예측 프로세서(101)는 제 1 평가 신호 및 제 2 평가 신호에 의해 감산된 제 1 신호 성분(x1)으로서의 제 1 잔류 신호(e1)를 생성하는 제 1 가산기(309)(감산기:subtractor), 제 3 평가 신호와 제 4 평가 신호에 의해 감산된 제 2 신호 성분(x2)으로서의 제 2 잔류 신호(e2)를 생성하는 제 2 가산기(311)를 포함한다. 따라서, 잔류 신호(e1,e2)는 원래 신호 성분 및 결합된 평가 사이의 차이에 상응한다.
예측 프로세서(101)의 2-채널 시스템의 전달(transfer)은 안정된 상태에서 다음식에 의해 기술될 수 있다.
Figure 112006094008562-pct00004
여기서, Pn,m(z)는 개별 예측 필터의 전달 함수이다.
예측 필터를 위한 예측 파라메타가 개별적으로 결정됨으로써, 예측을 위한 다수의 자유도가 획득된다. 특히, 제 1 및 제 2 신호 성분(x1,x2) 사이에 시간적 가정 또는 연관이 부과되거나 또는 가정되지 않는다. 이는 복소 예측 필터가 복소 신호(x1+jㆍx2)를 위해 사용되는 상황과 대조적이다.
예측 필터를 위한 특정 필터 구조가 도 4에 예시된다. 일실시예의 예측 필터의 전달 함수는 다음식과 같이 표현될 수 있다:
Figure 112006094008562-pct00005
즉, 프리-필터 H0 은 계수
Figure 112006094008562-pct00006
에 의해 가중된 복수의
Figure 112006094008562-pct00007
에 뒤따르게 되며, 합산기(summmer)에서 합으로 계산된다.
대칭적인 시각으로 보면,
Figure 112011082270836-pct00008
Figure 112011082270836-pct00009
을 취하는 것이 유리할 수 있다. 복잡도를 감소시키기 위해,
Figure 112011082270836-pct00010
Figure 112011082270836-pct00011
으로 설정하는데, 이는 다음 전달 함수를 산출한다.
Figure 112006094008562-pct00012
필터(H1 내지 Hm)는 하나의 입력 및 M개 출력을 가지는 H로 표기된 필터 뱅크를 형성한다.
따라서, 이러한 예에서, 제 1 및 제 2 신호 성분(x1, x2)은 각기 전달 특성(H0)과 함께 원인 안정 필터(401)에 공급되며, 이 경우 이 전달 특성은 순 선형 예측 시스템으로 귀결되는 단일 지연이 H0(z) = z-1일 될 수 있다.
결과적으로, 필터(401)의 출력은 명확화를 위하여 2개의 출력을 갖는 필터 (403)로 도 4에 예시된 원인 안정형 선형 필터(causal, stable, linear filter)(403)로 구성되는 단일-입력 다중-출력(SIMO:Single-Input Multi-Output) 시스템에 공급된다. 일반적으로, 실제 구현예에 있어서, 적절한 심리-음향 주파수 스케일에 따라 적정한 개수의 자유도(또는 대역도:degrees of bands)를 반영해, 출력의 개수는 약 20 내지 50이 될 수 있을 것이다.
필터 뱅크(403)의 출력의 각각은 곱셈기(405)에서
Figure 112011082270836-pct00013
에 의해 곱해진다. 결과값은 제 1 및 제 2 신호 성분(x1,x2)의 (부분적) 예측을 발생시키기 위해 합산기(407)에서 가산된다. 특히, 제 1 평가 신호는 제 1 신호 성분(x1)들에 기반하여 하나의 제 1 신호 성분(x1)을 위해 생성되고, 제 2 평가 신호는 제 2 신호(x2)들에 기반하여 제 1 신호 성분(x2)을 위해 생성된다. 이들 평가 신호는 제 1 잔류 신호(e1)를 생성시키기 위해 제 1 신호 성분(x1)으로부터 감산된다. 대칭 처리가 제 2 잔류 신호(e2)를 생성시키기 위해 적용된다.
예측 계수
Figure 112006094008562-pct00014
는 표준 선형 회귀 방법(standard linear regression method), 즉 제 1 및 제 2 잔류 신호(e1,e2)의 (가중된)제곱합을 최소화함으로써 결정될 수 있다. 제 1 및 제 2 신호 성분(x1,x2)은 스테레오 신호로부터 처리되지 않은 좌 및 우측 신호가 될 수 있으나, 좌 및 우측 채널의 대역-제한된 버젼과 같은 미리 처리된 신호를 구성할 수 있다.
2채널 분석 시스템은 제 1 및 제 2 잔류 신호(e1,e2)의 스펙트럼이 평탄화되고(따라서, 모양에서 동일), 제 1 및 제 2 잔류 신호(e1,e2)와 관련된 크로스-상관은 제로 지연(zero lag)을 제외하고 최소화되는 것을 보장할 수 있다. 이는 회전에 적합한 상황이며, 따라서 회전 프로세서(105)는 메인 및 사이드 신호를 구성하기 위해 사용될 수 있다.
α0 의 최적값은 일반적으로 메인 신호의 (가중된) 제곱합의 최대값과 이에 따라 사이드 신호의 (가중된) 제곱합을 위한 최소값을 산출하는 값으로 정의된다.
디코더(200)는 인코더의 연산에 대하여 역 연산을 실행한다. 실제, 도 5에 예시된 바와 같이, 디코더(200)의 예측 디코더(207)는 인코더에 사용되는 예측기와 동일한 예측기(301,303,305,307)를 이용할 수 있다. 그러나, 순방향 공급 구조(feed-forward structure)를 사용하는 인코더와 대조적으로, 디코더는 현재 신호 샘플을 예측하기 위해 이전 디코딩된 신호 샘플을 이용하는 피드백 구조를 사용한다.
특히, 도 6에 예시된 바와 같이, 디코더(200)의 예측 디코더(207)는 최종 (부분) 신호 평가값을 잔류 신호(e1,e2)에 결합하고 더하면서 단지 피드백으로 연결된 인코더와 동일한 예측 필터 구조를 이용할 수 있다.
이러한 방식으로 생성된 제 1 및 제 2 잔류 신호(e1,e2)는 일반적으로 평판 또는 화이트 주파수 스펙트럼 및 가우시안 분포를 가질 것이다. 따라서, 또한 메인 및 사이드 신호는 평탄 주파수 스펙트럼을 가지는 가우시안 신호가 된다. 그러나, 일부 실시예에서, 장치는 메인 신호 바람직하게는 사이드 신호를 제 1 신호 성분 및 제 2 신호 성분의 스펙트럼 특성에 대한 응답으로 스펙트럼적으로 형성하는 수단을 더 포함할 수 있다.
예를 들면, 실시예가 인코딩 프로세서(109)에서 메인 신호의 인코딩을 위한 모노 코더를 사용할 수 있다. 심리-음향 모델을 이용하는 일반 모노 코더를 사용하기 위하여, 제 1 및 제 2 신호 성분(x1,x2)의 평균 스펙트럼 모양과 유사한 스펙트럼 모양을 갖는 신호를 가지는 것이 선호될 수 있다.
이는 메인 신호를 직접적으로 인코딩하는 대신에, 다음식과 같은 z표현을 가지는 신호(ms)를 사용함으로써 성취될 수 있다:
Figure 112006094008562-pct00015
여기서, M(z)은 메인 신호의 z-표현이다. 동일한 필터링이 사이드 신호에 적용될 수 있다. 1/Hs(z)를 위한 적당한 선택으로, 제 1 및 제 2 신호 성분(x1,x2)의 평균 스펙트럼 포락선이 인코더에서 복구된다. 이러한 필터링은 회전기(rotator)의 앞 또는 뒤에서 적용될 수 있다. 명확하게, 디코더는 Hs(z)에 의한 곱셈을 도입함으로써 이에 따라 적응될 수 있다.
바람직하게는, Hs(z)는 다음 2가지 조건을 충족한다.
│1/Hs(z)│는 제 1 및 제 2 신호 성분(x1,x2)의 평균 스펙트럼 포락선을 나타낸다.
Figure 112006094008562-pct00017
Hs(z)는 추가 데이터가 전송될 필요가 없음을 의미하는 예측 계수로부터 직접적으로 도출될 수 있다.
이론적 가능성은 다음식에 의해 주어진 필터링을 사용하는 것이다.
Figure 112006094008562-pct00018
여기서, Fk ,l(z)는 다음식인 필터의 z표현을 표시한다.
Figure 112006094008562-pct00019
Figure 112006094008562-pct00020
이 옵션은 필터(Hs(z))가 유한 순서가 아닐 가능성이 있다는 의미에서 이론적이다. 근사값을 사용하며, 구현 가능한 필터가 가능하고, 이때 단지 예측 계수를 토대로 여전히 한정될 것이다.
추가 필터(Hs(z))를 사용하는 경우, 디코더의 적응은 간단하다. 왜냐하면, 원래, 디코더가 다음식의 전달 함수 행렬로 2-채널 시스템을 구현하기 때문이다.
Figure 112006094008562-pct00021
따라서, 디코더는 대응하는 합성 시스템을 제공하기 위해 개조된다.
Figure 112006094008562-pct00022
명확화를 위한 위 설명은 스토리지 디바이스의 다른 기능 유닛을 참조하여 본 발명의 실시예를 기술한 것임이 이해될 것이다. 그러나, 서로 다른 기능 유닛 사이의 기능의 임의의 적합한 분배가 본 발명으로부터 벗어나지 않으면서도 사용될 수 있음이 명료해질 것이다. 따라서, 특정 기능 유닛에 대한 참조는 단지 엄격한 논리적 또는 물리적 구조, 조직 또는 분리를 가리키기 보다는 오히려 상술된 기능을 제공하기 위한 적절한 수단에 대한 참조로서 도시된 것이다. 예를 들면, 어플리케이션 데이터 생성기는 추출 프로세서(extraction processor)와 통합되어 상호쌍이 될 수 있거나 또는 이 프로세서의 일부가 될 수 있다.
본 발명은 하드웨어, 소프트웨어, 펌웨어 또는 이들의 임의 조합을 포함하는 임의의 적절한 형태로 구현될 수 있다. 그러나, 바람직하게는, 본 발명은 하나 이상의 데이터 프로세서 및/또는 디지털 신호 프로세서상에서 실행되는 컴퓨터 소프트웨어로 구현된다. 본 발명의 실시예의 구성소자 및 구성요소는 물리적, 기능적 및 논리적으로 임의의 적절한 방식으로 구현될 수 있다. 실제, 기능은 단일 유닛으로, 복수의 유닛으로, 또는 다른 기능 유닛의 일부로 구현될 수 있다. 따라서, 본 발명은 서로 다른 유닛 및 프로세서 사이에 물리적이고도 기능적으로 분배될 수 있거나 또는 단일 유닛으로 구현될 수 있다.
비록 본 발명이 바람직한 실시예와 연결하여 기술되었을 지라도, 여기에 설명된 특정 형태로 제한됨을 의미하지 않는다. 오히려, 본 발명의 범위는 첨부된 청구항에 의해 단지 제한된다. 청구항에서, 포함하는 이라는 용어는 다른 구성 소자 또는 단계의 존재를 제외하지 않는다. 더욱이, 비록 개별적으로 열거되었을 지라도, 복수의 수단, 구성소자 또는 방법 단계는 예를 들면 단일 유닛, 즉 프로세서에 의해 구현될 수 있다. 덧붙여, 비록 개별 특징이 다른 청구항에 포함되어 있을 지라도, 이들 개별 특징들은 가능하게는 유리하게 결합될 수 있으며, 서로 다른 청구항에서의 포함은 특징의 결합이 가능 및/또는 유리하지 않음을 암시하지는 않는다. 덧붙여, 단수 참조는 복수성을 배제하지 않는다. 따라서, "하나", "단일", "첫 번째", "두 번째"등에 대한 참조는 복수성을 배제하지 않는다. 청구항에서의 참조 부호는 단지 명확한 예시로서 제공되는 것으로, 어떠한 방식으로 청구항의 범위를 제한하는 것으로 이해되지 않아야 할 것이다.
전술한 바와 같이, 본 발명은 다중 신호 인코더, 다중 신호 디코더 및 방법 에 관한 것으로서, 특히, 배타적인 아니면서도 스테레오 오디오 신호의 인코딩에 이용 가능하다.

Claims (18)

  1. 적어도 제 1 신호 성분 및 제 2 신호 성분을 포함하는 다중 채널 신호를 인코딩하는 신호 인코더로서,
    상기 제 1 신호 성분과 제 2 신호 성분의 선형 예측에 의해 상기 제 1 신호 성분의 제 1 잔류 신호와 상기 제 2 신호 성분의 제 2 잔류 신호를 생성하는 예측 수단(101,103)으로서, 상기 선형 예측은 사용자에 의한 예측된 신호의 지각을 가리키는 심리-음향 특성과 결합되는, 예측 수단(101, 103);
    상기 제 1 잔류 신호 및 제 2 잔류 신호를 포함하는 결합된 신호의 회전에 의해 메인 신호(main signal) 및 사이드 신호를 생성하는 회전 수단(105,107)으로서, 상기 메인 신호는 상기 사이드 신호보다 더 높은 신호 에너지를 가지는, 회전 수단(105,107);
    인코딩된 메인 데이터를 생성하기 위해 상기 메인 신호를 인코딩하는 제 1 인코딩 수단(109); 및
    상기 인코딩된 메인 데이터를 포함하는 출력 신호를 생성하는 출력 수단(111)을 포함하며,
    상기 예측 수단(101, 103)은, 상기 제 1 잔류 신호와 상기 제 2 잔류 신호 사이의 크로스-상관(cross-correlation)을 최소화하도록 상기 제 1 잔류 신호와 상기 제 2 잔류 신호를 생성하는,
    다중 채널 신호를 인코딩하는 신호 인코더.
  2. 제 1 항에 있어서,
    인코딩된 사이드 데이터를 생성하기 위해 상기 사이드 신호를 인코딩하는 제 2 인코딩 수단(109)을 더 포함하고, 상기 출력 수단(111)은 상기 출력 신호 내에 상기 인코딩된 사이드 데이터를 포함시키기 위해 더 동작 가능한, 다중 채널 신호를 인코딩하는 신호 인코더.
  3. 제 2 항에 있어서,
    상기 제 2 인코딩 수단(109)은 상기 사이드 신호를 파라메타적으로 인코딩하기 위해 동작 가능한, 다중 채널 신호를 인코딩하는 신호 인코더.
  4. 제 1 항에 있어서,
    상기 예측 수단(101,103)은 적어도 하나의 심리-음향 기반 필터 뱅크를 포함하는, 다중 채널 신호를 인코딩하는 신호 인코더.
  5. 제 1 항에 있어서,
    상기 회전 수단(105,107)은 상기 메인 신호의 신호 에너지를 최대화하기 위해 상기 결합된 신호를 회전시키도록 동작할 수 있는, 다중 채널 신호를 인코딩하는 신호 인코더.
  6. 제 1 항에 있어서,
    상기 회전 수단(105,107)은 상기 사이드 신호의 신호 에너지를 최소화하기 위해 상기 결합된 신호를 회전시키도록 동작할 수 있는, 다중 채널 신호를 인코딩하는 신호 인코더.
  7. 제 1 항에 있어서,
    상기 예측 수단(101,103)은,
    상기 제 1 신호 성분에 응답하여 상기 제 1 신호 성분에 대한 제 1 평가 신호를 생성하는 제 1 예측기(301);
    상기 제 2 신호 성분에 응답하여 상기 제 1 신호 성분에 대한 제 2 평가 신호를 생성하는 제 2 예측기(303); 및
    상기 제 1 평가 신호 및 제 2 평가 신호만큼 감산된 제 1 신호 성분인 제 1 잔류 신호를 생성하는 수단(309)을 포함하는, 다중 채널 신호를 인코딩하는 신호 인코더.
  8. 제 7 항에 있어서,
    상기 예측 수단(101,103)은,
    상기 제 1 신호 성분에 응답하여 제 2 신호 성분에 대한 제 3 평가 신호를 생성하는 제 3 예측기(305);
    상기 제 2 신호 성분에 응답하여 제 2 신호 성분에 대한 제 4 평가 신호를 생성하는 제 4 예측기(307); 및
    상기 제 3 평가 신호 및 제 4 평가 신호만큼 감산된 제 2 신호 성분인 제 2 잔류 신호를 생성하는 수단(311)을 포함하는, 다중 채널 신호를 인코딩하는 신호 인코더.
  9. 제 1 항에 있어서,
    상기 회전 수단(105,107)은 결합된 신호에 대한 행렬 곱을 실행하기 위해 동작 가능한, 다중 채널 신호를 인코딩하는 신호 인코더.
  10. 제 1 항에 있어서,
    제 1 신호 성분 및 제 2 신호 성분의 스펙트럼 특성에 응답하여 메인 신호의 스펙트럼을 형성하는 수단을 더 포함하는, 다중 채널 신호를 인코딩하는 신호 인코더.
  11. 제 10 항에 있어서,
    제 1 인코딩 수단(109)은 심리-음향 모노 인코더를 포함하는, 다중 채널 신호를 인코딩하는 신호 인코더.
  12. 제 1 항에 있어서,
    다중 채널 신호는 스테레오 오디오 신호인, 다중 채널 신호를 인코딩하는 신호 인코더.
  13. 다중 채널 신호를 디코딩하는 신호 디코더로서,
    사이드 신호와 상기 사이드 신호보다 더 높은 신호 에너지를 가진 메인 신호를 포함하는 다중 채널 신호를 수신하는 수신 수단(201,203);
    상기 다중 채널 신호의 회전에 의해 제 1 잔류 신호 및 제 2 잔류 신호를 생성하는 회전 수단(205); 및
    상기 제 1 잔류 신호와 상기 제 2 잔류 신호에 응답하여 선형 예측에 의해 출력 다중 채널 신호를 생성하는 합성 수단(207)으로서, 상기 선형 예측은 사용자에 의한 예측된 신호의 지각을 가리키는 심리-음향 특성과 결합되는, 합성 수단(207)을 포함하며,
    상기 제 1 잔류 신호는 상기 제 2 잔류 신호에 대하여 최소화된 크로스-상관(cross-correlation)을 가지는,
    다중 채널 신호를 디코딩하는 신호 디코더.
  14. 적어도 제 1 신호 성분 및 제 2 신호 성분을 포함하는 다중 채널 신호를 인코딩하는 방법으로서,
    상기 제 1 신호 성분 및 제 2 신호 성분의 선형 예측에 의해 상기 제 1 신호 성분의 제 1 잔류 신호와 상기 제 2 신호 성분의 제 2 잔류 신호를 생성하는 단계로서, 상기 선형 예측은 사용자에 의한 예측된 신호의 지각을 가리키는 심리-음향 특성과 결합되는, 제 1 잔류 신호와 제 2 잔류 신호를 생성하는 단계;
    상기 제 1 잔류 신호 및 제 2 잔류 신호를 포함하는 결합된 신호의 회전에 의해 메인 신호 및 사이드 신호를 생성하는 단계로서, 상기 메인 신호는 상기 사이드 신호보다 더 높은 신호 에너지를 가지는, 메인 신호 및 사이드 신호를 생성하는 단계;
    인코딩된 메인 데이터를 생성하기 위해 상기 메인 신호를 인코딩하는 단계; 및
    상기 인코딩된 메인 데이터를 포함하는 출력 신호를 생성하는 단계를 포함하며,
    상기 제 1 잔류 신호와 상기 제 2 잔류 신호는, 상기 제 1 잔류 신호와 상기 제 2 잔류 신호 사이의 크로스-상관(cross-correlation)을 최소화하도록 생성되는,
    다중 채널 신호를 인코딩하는 방법.
  15. 다중 채널 신호를 디코딩하는 방법으로서,
    사이드 신호와 상기 사이드 신호보다 더 높은 신호 에너지를 가진 메인 신호를 포함하는 다중 채널 신호를 수신하는 단계;
    상기 다중 채널 신호의 회전에 의해 제 1 잔류 신호 및 제 2 잔류 신호를 생성하는 단계; 및
    상기 제 1 잔류 신호 및 제 2 잔류 신호에 응답하여 선형 예측에 의해 출력 다중 채널 신호를 생성하는 단계로서, 상기 선형 예측은 사용자에 의한 예측된 신호의 지각을 가리키는 심리-음향 특성과 결합되는, 출력 다중 채널 신호를 생성하는 단계를 포함하며,
    상기 제 1 잔류 신호는 상기 제 2 잔류 신호에 대하여 최소화된 크로스-상관(cross-correlation)을 가지는,
    다중 채널 신호를 디코딩하는 방법.
  16. 제 14 항 또는 제 15 항에 따른 방법의 실행을 가능하게 하는 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록 매체.
  17. 삭제
  18. 삭제
KR1020067026754A 2004-06-21 2005-06-14 다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및 장치 KR101183857B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP04102827 2004-06-21
EP04102827.5 2004-06-21
EP05746699A EP1761915B1 (en) 2004-06-21 2005-06-14 Method and apparatus to encode and decode multi-channel audio signals
PCT/IB2005/051964 WO2006000952A1 (en) 2004-06-21 2005-06-14 Method and apparatus to encode and decode multi-channel audio signals

Publications (2)

Publication Number Publication Date
KR20070030841A KR20070030841A (ko) 2007-03-16
KR101183857B1 true KR101183857B1 (ko) 2012-09-19

Family

ID=34970343

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067026754A KR101183857B1 (ko) 2004-06-21 2005-06-14 다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및 장치

Country Status (8)

Country Link
US (1) US7742912B2 (ko)
EP (1) EP1761915B1 (ko)
JP (1) JP4950040B2 (ko)
KR (1) KR101183857B1 (ko)
CN (1) CN1973319B (ko)
AT (1) ATE416455T1 (ko)
DE (1) DE602005011439D1 (ko)
WO (1) WO2006000952A1 (ko)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
CN101167124B (zh) * 2005-04-28 2011-09-21 松下电器产业株式会社 语音编码装置和语音编码方法
RU2007139784A (ru) * 2005-04-28 2009-05-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Устройство кодирования звука и способ кодирования звука
JP5025485B2 (ja) * 2005-10-31 2012-09-12 パナソニック株式会社 ステレオ符号化装置およびステレオ信号予測方法
WO2007104882A1 (fr) * 2006-03-15 2007-09-20 France Telecom Dispositif et procede de codage par analyse en composante principale d'un signal audio multi-canal
KR101149448B1 (ko) 2007-02-12 2012-05-25 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법
JP5404412B2 (ja) * 2007-11-01 2014-01-29 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
US20110282674A1 (en) * 2007-11-27 2011-11-17 Nokia Corporation Multichannel audio coding
KR101441897B1 (ko) 2008-01-31 2014-09-23 삼성전자주식회사 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치
KR20090131230A (ko) 2008-06-17 2009-12-28 삼성전자주식회사 적어도 두 개의 주파수 대역들을 이용하는 저 밀도 패리티코드 인코딩 장치 및 디코딩 장치
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
WO2010017833A1 (en) 2008-08-11 2010-02-18 Nokia Corporation Multichannel audio coder and decoder
US20100104015A1 (en) * 2008-10-24 2010-04-29 Chanchal Chatterjee Method and apparatus for transrating compressed digital video
EP2439736A1 (en) * 2009-06-02 2012-04-11 Panasonic Corporation Down-mixing device, encoder, and method therefor
KR101710113B1 (ko) 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
WO2011072729A1 (en) * 2009-12-16 2011-06-23 Nokia Corporation Multi-channel audio processing
US8463414B2 (en) * 2010-08-09 2013-06-11 Motorola Mobility Llc Method and apparatus for estimating a parameter for low bit rate stereo transmission
US9343076B2 (en) * 2011-02-16 2016-05-17 Dolby Laboratories Licensing Corporation Methods and systems for generating filter coefficients and configuring filters
CN104246873B (zh) * 2012-02-17 2017-02-01 华为技术有限公司 用于编码多声道音频信号的参数编码器
KR101662681B1 (ko) 2012-04-05 2016-10-05 후아웨이 테크놀러지 컴퍼니 리미티드 멀티채널 오디오 인코더 및 멀티채널 오디오 신호 인코딩 방법
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
KR101453733B1 (ko) 2014-04-07 2014-10-22 삼성전자주식회사 오디오 신호 처리장치
EP3136387B1 (en) * 2014-04-24 2018-12-12 Nippon Telegraph and Telephone Corporation Frequency domain parameter sequence generating method, encoding method, decoding method, frequency domain parameter sequence generating apparatus, encoding apparatus, decoding apparatus, program, and recording medium
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
EP3067886A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
CN106373578B (zh) * 2016-08-29 2019-10-11 福建联迪商用设备有限公司 一种音频通信解码方法
ES2911515T3 (es) * 2017-04-10 2022-05-19 Nokia Technologies Oy Codificación de audio
WO2020009082A1 (ja) * 2018-07-03 2020-01-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置及び符号化方法
KR20220066749A (ko) 2020-11-16 2022-05-24 한국전자통신연구원 잔차 신호의 생성 방법과 그 방법을 수행하는 부호화기 및 복호화기

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0761043B2 (ja) * 1986-04-10 1995-06-28 株式会社東芝 ステレオ音声伝送蓄積方式
WO1996032710A1 (en) * 1995-04-10 1996-10-17 Corporate Computer Systems, Inc. System for compression and decompression of audio signals for digital transmission
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
CN1480940A (zh) * 1997-01-16 2004-03-10 �ʼҷ����ֵ������޹�˾ 一种记录数据压缩复合信号的记录载体
US6121904A (en) * 1998-03-12 2000-09-19 Liquid Audio, Inc. Lossless data compression with low complexity
JP2000066700A (ja) 1998-08-17 2000-03-03 Oki Electric Ind Co Ltd 音声信号符号器、音声信号復号器
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
JP4240683B2 (ja) * 1999-09-29 2009-03-18 ソニー株式会社 オーディオ処理装置
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
JP3387088B2 (ja) 2000-10-20 2003-03-17 日本ビクター株式会社 光記録媒体、音声信号伝送方法及び音声復号方法
BRPI0308691B1 (pt) 2002-04-10 2018-06-19 Koninklijke Philips N.V. “Métodos para codificar um sinal de canal múltiplo e para decodificar informação de sinal de canal múltiplo, e arranjos para codificar e decodificar um sinal de canal múltiplo”

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Subband coding of stereophonic digital audio signals, ICASSP-91 vol.5 Page(s): 3601 - 3604 (1991. 4. 14-17.)*

Also Published As

Publication number Publication date
US7742912B2 (en) 2010-06-22
ATE416455T1 (de) 2008-12-15
CN1973319B (zh) 2010-12-01
EP1761915B1 (en) 2008-12-03
DE602005011439D1 (de) 2009-01-15
KR20070030841A (ko) 2007-03-16
JP4950040B2 (ja) 2012-06-13
EP1761915A1 (en) 2007-03-14
JP2008503767A (ja) 2008-02-07
WO2006000952A1 (en) 2006-01-05
CN1973319A (zh) 2007-05-30
US20070248157A1 (en) 2007-10-25

Similar Documents

Publication Publication Date Title
KR101183857B1 (ko) 다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및 장치
KR101178114B1 (ko) 복수의 입력 데이터 스트림을 믹싱하기 위한 장치
AU2005328264B2 (en) Near-transparent or transparent multi-channel encoder/decoder scheme
RU2425340C2 (ru) Оптимизированное по точности кодирование с подавлением упреждающего эхо
EP0770985B1 (en) Signal encoding method and apparatus
JP5820464B2 (ja) オーディオまたはビデオエンコーダ、オーディオまたはビデオデコーダ、及び予測方向可変の予測を使用したマルチチャンネルオーディオまたはビデオ信号処理方法
JP4567238B2 (ja) 符号化方法、復号化方法、符号化器、及び復号化器
JP4347698B2 (ja) パラメトリックオーディオ符号化
US20090204397A1 (en) Linear predictive coding of an audio signal
KR20090007396A (ko) 손실 인코딩된 데이터 스트림 및 무손실 확장 데이터 스트림을 이용하여 소스 신호를 무손실 인코딩하기 위한 방법 및 장치
KR20190095545A (ko) Mdct-기반의 복소수 예측 스테레오 코딩
EP1719115A1 (en) Parametric multi-channel coding with improved backwards compatibility
US7725324B2 (en) Constrained filter encoding of polyphonic signals
JP2019506633A (ja) 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法
JP4927264B2 (ja) オーディオ信号を符号化する方法
JP3099876B2 (ja) 多チャネル音声信号符号化方法及びその復号方法及びそれを使った符号化装置及び復号化装置
EP1639580B1 (en) Coding of multi-channel signals

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150902

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160909

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee