KR100915120B1 - 다중-채널 오디오 신호들을 무손실 부호화 및 복호화하기 위한 장치 및 방법 - Google Patents

다중-채널 오디오 신호들을 무손실 부호화 및 복호화하기 위한 장치 및 방법

Info

Publication number
KR100915120B1
KR100915120B1 KR1020017012853A KR20017012853A KR100915120B1 KR 100915120 B1 KR100915120 B1 KR 100915120B1 KR 1020017012853 A KR1020017012853 A KR 1020017012853A KR 20017012853 A KR20017012853 A KR 20017012853A KR 100915120 B1 KR100915120 B1 KR 100915120B1
Authority
KR
South Korea
Prior art keywords
matrix
channel
channel signals
downmix
signals
Prior art date
Application number
KR1020017012853A
Other languages
English (en)
Other versions
KR20010113782A (ko
Inventor
피터 그래햄 크레이븐
말콤 제임스 로우
존 로버트 스튜어트
Original Assignee
돌비 레버러토리즈 라이쎈싱 코오포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB9907919.6A external-priority patent/GB9907919D0/en
Priority claimed from GBGB9907918.8A external-priority patent/GB9907918D0/en
Application filed by 돌비 레버러토리즈 라이쎈싱 코오포레이션 filed Critical 돌비 레버러토리즈 라이쎈싱 코오포레이션
Publication of KR20010113782A publication Critical patent/KR20010113782A/ko
Application granted granted Critical
Publication of KR100915120B1 publication Critical patent/KR100915120B1/ko

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00992Circuits for stereophonic or quadraphonic recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

무손실 부호기 및 복호기가 DVD-오디오와 같은 매체에 다채널 신호를 전달하기 위해 제공된다. 부호기가 다운믹스 스페시픽케이션을 부가적으로 수용하고 부호화 스트림을 2개의 서브스트림으로 분리함으로써, 불충분한 컴튜터력의 2채널 복호기는 하나의 서브스트림을 복호화하여 다운믹스 스페시픽케이션을 실행할 수 있는 반면, 다채널 복호기는 2개의 서브스트림 모두를 사용하여 원시 다채널 신호를 무손실적으로 복호화할 수 있다. 24비트 프로세서에서의 효과적인 실행을 위해, 사용자에게 무손실 재생의 실행을 위해, 또한 과부하를 결과로 하는 다운믹스 스페시픽케이션의 경우에 반응을 시작하기 위해 다른 특징들이 제공된다. 그 원리는 혼합비 신호들에도 적용되며, 예컨대 일부의 입력채널들이 48kHz에서 샘플로되며 일부는 96kHz에서 샘플로 된다.

Description

다중-채널 오디오 신호들을 무손실 부호화 및 복호화하기 위한 장치 및 방법{APPARATUS AND METHOD FOR LOSSLESS ENCODING AND DECODING MULTI-CHANNEL AUDIO SIGNALS}
본 발명은 디지털 신호 스트림(stream), 특히 디지털 오디오 스트림을 매트릭싱 다채널 신호들(multichannel signals)에 관련하여 부호화(encoding) 및 복호화(decoding)하는 것에 관한 것이다.
무손실(lossless) 압축은 현재 디지털 오디오 신호를 저장하거나 전송하는데 필요한 데이터 비(date rate)를 감소시키는 확립된 수단이다. 다채널 신호의 데이터량을 감소시키는 하나의 방법은, 다른 채널들이 비교적 적은 정보를 이송시키는 동안 전송된 채널들의 일부에 주요정보가 집중되도록 매트릭싱(matrixing)을 적용하는 것이다. 예컨대, 중심 음 이미지를 이송시킨다면 2채널 오디오가 좌측 및 우측 채널들에서 거의 동일한 파형을 지닐 수 있으며, 이 경우 2채널의 합 및 차이를 부호화 하는데 더 효과적이다. 이 프로세스는 WO-A96/37048에 다소 상세하게 개시되어 있는바, 이 특허는 완전하게 역전 가능하거나 무손실 방식으로 매트릭싱을 달성하도록 ‘기초 매트릭스 양자화기(quantisers)’의 캐스케이드(cascade)의 사용을 포함한다.
WO-A96/37048에 개시된 프로세스는 또한 일반 가정 청취용으로 더 적합한 스피커 공급을 나타내는 매트릭스된 디지털 신호들을 이끌어 내기 위해 다채널의 본래 디지털 신호에 매트릭스를 적용하도록 매트릭스 양자화기의 사용을 꾀하고 있다. 이같이 매트릭스된 신호들은 DVD와 같은 캐리어상에 기록될 수 있으며, 통상의 플레이어는 각각의 매트릭스된 신호를 확성기에 간단하게 공급할 것이다. 그러나, 능숙한 플레이어는 매트릭스 양자화기의 결과를 역전시킬 수 있으며, 이에 따라 변형적인 방식으로 본래의 디지털 신호를 정확하게 재생산하기 위해 그 신호를 복원시킬 수 있다.
DVD-오디오의 통상적인 응용에서는, 무손실 압축을 사용하는 전송 시스템이 매트릭스된 신호와 원신호 모두를 제공할 수 있도록 전술된 2가지 개념들을 결합할 필요가 있다. 이 같은 응용에 있어서, 필요한 매트릭스된 신호는 2개의 채널을 지니는 반면 원신호는 2개 이상의 채널을 지님에 따라, 다채널 신호가 복원되게 하도록 부가적인 정보가 제공되어야 하지만; 부가적인 정보는 2채널 매트릭스된 신호만을 복호화하기 원하는 복호기들을 위한 계산관련 오버헤드를 강요하지 않아야 한다.
현재, 디지털 오디오는 종종 24비트로 전송되며, 모토롤라 56000시리즈와 같이 오디오용으로 설계된 대중적인 디지털 신호 프로세싱(Digital signal Processing)(DVD)칩들은 또한 24비트 워드(word)를 쉽게 처리한다. 그러나, WO-A 96/37048에 개시된 프로세싱은 원신호들 보다 큰 워드폭(word width)을 필요로 하는 수들을 발생시킬 수 있다. ‘2배 정도(double-precision)’계산법의 사용이 매우 비싸기 때문에, 증가된 워드폭을 필요로 함이 없이 실제로 실행될 프로세싱을 허용할 필요가 있다.
최종적으로 무손실 재생을 제공하도록 설계된 구매 설비를 지니는 소비자는 복원된 신호가 무손실로 되는 것이 보장되는 것을 선호할 것이다. 부호화 스트림 내의 통상의 패리티 및 CRC체크는 스트림 내의 데이터 점유(corruption)로 인한 에러를 보일 것이지만, 그들은 부호기와 복호기 사이의 매트릭싱 또는 다른 논리적 미결합으로 인한 에러를 노출시키지 않을 것이다.
발명의 개요
본 발명의 일면에 따르면, 2개의 서브스트림으로 분리되는 스트림이 제공되는바, 제1 서브스트림은 매트릭싱에 의해 획득된 ‘다운믹스(downmix)’신호에 관한 정보를 제공하고 채널을 포함하며, 제2 서브스트림은 복호기에 의해 무손실적으로 복원되게 하는 부가적인 정보를 제공한다. 서브스트림 모두가 무손실 압축을 사용하여 이송되는 상황(context)에서, 다운믹스 신호만을 복호화하는 복호기는 제1 서브스트림 만을 해독하는데 사용되므로 다채널 디지털신호를 복호화하는데 필요한 것보다 계산관련 자원을 덜 사용할 수 있다.
이 같은 제1개념의 변형에 있어서, 제1 서브스트림은 다수의 서브스트림들로 대체될 수 있어 다수의 다른 매트릭스된 표시들이 선택되게 한다. 그러나, 마지막 서브스트림은, 완전한 본래의 다채널 디지털 신호로 하여금 무손실하게 재생산되게 하는 부가적인 정보를 포함할 것이다.
제1개념의 바람직한 실행에 있어서, 부호기는 하나 이상의 최초의 매트릭스 양자화기의 캐스케이드를 사용하여 다운매트릭스 신호를 제공하며, 각각의 퀀터시스는 n×n 매트릭스를 실행하는바, 이는 다운매트릭스를 위해 필요한 m채널의 선택에 의해 후속된다.
다채널 복호기는 모든 서브스트림들로부터 신호를 취할 것이며 원(original) 다채널 신호를 복원하도록 역(inverse)의 본(primitive) 매트릭스의 캐스케이드를 적용한다. 제1서브스트림으로부터의 채널들이 시작점에 배치되도록 복호기의 캐스케이드에 입력되는 채널들을 배열하도록 자연적으로 고려되어야 한다. 그러나 이것은 복호기의 캐스케이드의 출력에서 배열되는 부정확한 채널로 결과될 수 있으며, 이에 따라 채널 순열은 부호기에 의해 지정되며 정확한 채널 순서를 복원하도록 복호기에 의해 실행된다.
바람직하게는, 매트릭싱 내에서의 절단 또는 라운딩은 디더(dither)를 이용하여 계산될 것이다. 이 경우, 무손실 코딩을 위해, 디더 신호는, 부호기에 의해 수행되어 본래의 신호를 무손실적으로 복원하도록 복호기에 대해 유용하게 이루어져야 한다. 디더는 WO-A96/37048에서 추구된 것과 같은 '자동디더'방식을 사용하여 계산될 수 있지만; 무손실 압축의 콘텍스트에서, 자동디더는 부호기에 의해 사용된 것으로 복호기가 그것의 디더 프로세스를 동기화하게 하는 부호화 스트림에 디더원(dither seed)을 제공함으로써 획득될 수 있다.
그러므로 본 발명의 제2면에 따르면, 부호화 비트스트림에서 디더원을 포함하는 무손실 압축시스템이 제된다. 디더원은, 복호기내의 가정의 불규칙 시이퀀스 제너레이터(pseudo-random sequence generator)를 기능적으로 동일한 부호기내의 복호기로 동시화하는데 사용된다.
본 발명의 중요한 적용에 있어서, 다운믹스는 2개의 채널을 지니며 본래의 다채널 디지털 신호에 대한 2개의 최초의 매트릭스 퀀더서스의 적용에 의해 가장 통상적으로 유도된다. 본 발명의 제2실시예를 실행한 실시예들에 있어서, 디더는 각각의 양자화기에 의해 요구되며; 더욱이 다른 디더가 2개의 컨티서스를 위해 제공되어야 하며 각각의 디더에 대한 바람직한 가능성 분배 기능(PDF)는 삼각형이다. 본원에서 ‘다이아몬드 디더’라 칭하는 2개의 그 같은 삼각형 PDF(TPDF) 디더 신호들을 실행하기 위한 효과적인 방식으로서, 2개의 독립적인 삼각형 PDF(RPDF)신호를 부가하고 빼는 방법이 있다. 더 많은 채널들에 대한 더 상세한 설명 및 개론들은 1997년 뉴욕에서 개최된 AES 103회 콘벤션에서 알.워너마커에 의해 발표된 “다채널 디더 신호들의 효과 발생”이라는 논문 제 4533호를 참조하시오.
따라서, 제2개념의 바람직한 실시에 있어서, 부호기는 2개의 독립 RPDF 디더 신호들을 실행하는데 단일 사이퀀스 발생기를 사용하며, 이같은 신호들의 합과 차는 그 채널 다운믹스를 이끌어 내는데 사용된 2개의 최초의 매트릭스 양자화기에 의해 요구된 디더를 제공하는데 사용된다.
WO-A 96/37048은 무손실 압축시스템내에서의 최초의 매트릭스 양자화기의 사용을 개시하고 있으며, 전술된 바와 같은 우리는 제1개념의 바람직한 인용할 것이며, 또한 그 실시예는 ‘다운믹스’신호를 위해 요구된 정보를 분리형 서브스트림으로 변환시키도록 최초의 매트릭스 퀀더서스를 사용한다.
따라서, 본발명의 제3면에는 명확하지 않은 본 매트릭스 양자화기를 포함하는 부호기 및 복호기가 제공되는바, 부호기는 계수들의 매트릭스로 지정된 다운믹스를 수용하고, 그 다운믹스를 제공하도록 최초의 매트릭스 양자화기의 번호를 배정하며 데이터양을 감소시키고 매트릭싱을 제공하도록 다른 번호를 선택적으로 배정하는 논리를 지닌다. 부호기는 사용될 최초의 매트릭스 양자화기의 지정을 포함하는 스트림을 제공하며, 선택적으로 디더의 부가를 포함할 수 있다. 바람직한 실시에 있어서, 디더는 2개의 RPDF 디더 시이퀀스로서 발생되며, 부호기는 각각의 디더 시이퀀스에 대해 하나의 계수를 지정한다. 따라서, 다이아몬드 디더는 제1의 본 매트릭스 양자화기의 경우에 동일한 신호의 2개의 계수들을 지정함으로써 획득될 수 있으며, 또한 제2의 본 매트릭스 양자화기의 경우에 반대 신호의 2개의 계수를 지정함으로써 획득될 수 있다.
제3면의 기본적인 실시에 있어서, 본래의 매트릭스들은 다운믹스신호들이 제1서브스트림에 직접 전달되도록 선정된다. 그러나, 이것은 여러 가지 이유 때문에 최적화 될 수 없다. 다채널 무공간의 n채널을 n-차원 벡터 공간을 한정하는 것으로 결정하면, 선형 다운믹스에서 0이 아닌 출력치를 결과로 하는 신호들은 보조공간을 형성할 것이다. 다운믹스가 m개의 채널을 지닌다면, 보조공간은 통상적으로 m차원으로 될 것이다. 제1 서브스트림에서의 신호들은 m차원의 부공간은 다운믹스 채널들의 매트릭스된 제공이 되도록 전송된 채널을 필요로 할 수 있다. 따라서, 매트릭싱 편의성이 단지 다운믹스 신호를 복원하도록 설계된 복호기에 의해서도 요구되는 것이 일반적이다.
오디오 신호들은 거의 24비트를 사용하여 이송되는 것이 일반적이며, 메리디언 로스리스 패킹(MLP)과 같은 무손실 재생시스템에 있어서, 본래의 입력치가 24비트를 초과하지 않기 때문에 출력은 24비트를 초과하지 않을 것으로 예상된다. MLP에 대한 설명을 1999년 3월 오디오 설명, 패킷 PCM, MLP 기본 정보 버전 1.0에서의 순수 판독 디스크, 파트 4에 대한 DVD 명세서로부터 또한 WO-A96/37048호로부터 획득할 수 있다. 다운믹스의 경우에 있어서, 출력 수준은 복호기내의 매트릭스에 의해 한정된다. 원칙적으로 출력은 24비트 워드로 한정된 순수 역치를 결코 초과할 수 없도록 매트릭스 계수를 스케일 할 수 있지만, 실제로 이것은 수용할 수 없는 낮은 출력 수준을 결과로 한다. 더욱이, 부호기가 다운믹스 신호들을 제한하거나 클립하는 것을 수용하지 않을 것인바, 이것은 무손실로 되지 않을 재구성된 다채널 신호를 결과로 하지 않고 실행될 수 없다. 순수 역치를 초과하는 출력수준은 본원에서 '오버헤드'로 지칭된다. 다운믹스 신호의 우연한 과부하는 허용 가능한 것으로 고려되는바, '랩-라운드(wrap-round)'로 허용되는 경우 매우 정확하지 못한 디지털 오버로드는 제외된다. 랩-라운드의 결과는 더 상세히 후술될 것이다. 그러므로, 실 발명의 제1면의 바람직한 실시에 있어서, 다운믹스 신호를 복호화하는 복호기는 과부하의 결과가 정확하지 못하지 않도록 매트릭스의 계산 후 클립명 또는 유사한 제한 능력을 지닌다.
고질의 오디오에서 24-비트 트래디션의 또 다른 결과는 24-비트 내부 워드 폭을 지니는 DSP프로세싱 칩들의 유용성이다. WO-A96/37048에 개시된 바와 같이 각각의 본래의 매트릭스 양자화기는 다른 채널들의 비율을 부가함으로써 다채널 신호의 하나의 채널을 수정한다. 그 같은 본래의 매트릭스 양자화기는 단일성의 직통 획득을 갖는다. 제4면의 발명은 수정된 채널에 대한 획득 계수를 수용하는 원시의 매트릭스 양자화기를 제공하며, 엘에스비_바이패스(lsb_bypass)로 공지된 부가적인 데이터 경로를 지닌다. 획득은 오버로드를 회피하기 위해 단일보다 적은 값으로 설정될 수 있다. 원시 매트릭스 양자화기의 종량화된 출력값은 입력치보다 적은 정보를 포함할 것인바, 이때 나머지 정보는 획득 계수의 적용에 의해 발생되는 부가적인 최소의 현전한 비트(LSBs)에 포함된다. 이 같은 LSB들의 일부 또는 모두는 엘에스비_바이패스 경로를 통해 분리적으로 이송된다. 특히, ±½의 획득 계수의 경우에 있어서, LSB신호는 엘에스비_바이패스를 통해 이송될 수 있도록 발생된다.
‘무손실_체크(lossless_check)’를 제공하는 본 발명의 제5면에 있어서, 체크값은 부호기에 대한 다채널 입력치로 계산되며 부호화된 스트림으로 이송된다. 복호기는 복호화된 출격치로부터의 유사한 체크값을 계산하여 그것을 스트림내에 이송된 체크값과 비교하여, 재생이 실제로 무손실로 되는 청취자에게 ‘무손실’ 광(light)과 같은 가시적 표시를 제공하는 것이 일반적이다. 본 발명의 제1면에 따른 다운믹스를 갖는 스트림의 경우에 있어서, 다운믹스는 원 신호의 무손실 재생이 아니다. 그럼에도 불구하고, 동시화된 디더가 제2면에 따른 복호기에 제공된다면, 또한 복호기 매트릭싱이 예컨대 본 발명의 제3면에 따른 매트릭스 양자화기와 같이 정확하게 개시된다면, 다운믹스 재생은 완전히 결정적이며 부호기에서 시뮬레이팅 될 수 있고 또한 마스터링 엔지니어 또는 프로듀서에 의해 검증될 수 있다. 그러므로 부호기는 시뮬레이팅된 다운믹스에서 체크값을 계산할 수 있고 이 워드는 복호기에 의해 체크될 수 있으며, 이에 따라 부호화 프로세스에서 오디션을 위해 유용하거나 시청되는 동일한 다운믹스의 무손실 재생을 확인한다.
본원에서 ‘AES 1997’로 지칭되는 1997년 3월 제이. 오디오. 이엔지. 에스오씨.,에서 피. 지. 크레이븐과 제이. 알. 스튜어트에 의해 발표된' ‘무손실 케널을 이용하는 캐스케이드 가능한 손실 데이터 압축’이라는 논문의 제45권, 제5호, 404페이지의 요약서에 개시된 ‘프리양자화기’를 합체하여 부호화 건에 원래의 다채널 신호를 변경시킬 수 있는 부호기는 체크값의 계산중 선택을 지닌다. 원 신호로부터 체크값을 계산한다면, 복호기 상의 ‘무손실 광’과 같은 무손실 재생의 표시가 변경된 경로동안 발광하지 않을 것이다. 하나의 변경은 부호화 프로세스의 일부로서 시청에 유용한 변형된 신호를 만드는 것이며, 또한 변경된 신호로부터 체크값을 계산하는 것이다. 이것은 다운믹스 경우와 일치하는바; 2가지 경우 모두에 있어서 무손실 광은 부호화 상태에서 시청에 유용한 신호의 무손실 재생을 나타낸다.
바람직한 실시에 있어서, 체크값은 모든 채널에서 계산되는 패리티-체크 워드이다. 본 발명의 제1면을 포함하는 하나의 실시예에 있어서, 제1 서브스트림은 클립핑과 같은 어떠한 수정이 과부하를 피하기 위해 적용되기 전에 동시화된 다운믹스로부터 계산되는 패리티-체크 워드를 포함하는 반면, 제2 서브스트림은 완전한 다채널 신호로부터 계산된 패리티-체크 워드를 포함한다. 패리티를 계산하기 전에, 각각의 채널값을 나타내는 워드는, 2개의 채널에 영향을 주는 하나의 에러가 검출되는 높은 확률을 동시에 지니도록 채널 개수와 동일한 비트의 수로 회전된다.
이 같은 설명을 전체적으로 볼 때, 더 특정한 부호화 스트림을 DVD와 같은 저장매체에 기록하는 부호화 프로세스를 만든다는 것이며, 또한 그 같은 저장매체로부터 부호화 스트림을 복원시키는 복호화 프로세스를 만든다는 것이다. 그러나, 본 발명에 따라 구현된 부호기는, 스펙트럼을 통해 초음파로부터 자외선 주파수까지의 대역 또는 모듈화된 통신 경로를 포함하는 어떠한 전달 매체를 수직으로 사용하는 부호화 스트림을 송신하는데 사용될 수 있거나, 또는 자성 및 광기술을 포함하는 어떠한 레코딩 기술을 필수적으로 사용하는 저장매체에 부호화 스트림을 기록하는데 사용될 수 있는 것으로 이해될 것이다. 유사하게, 본 발명에 따라 구현된 복호기는 그 같은 매체로부터 획득되는 부호화 스트림을 처리하는데 사용될 수 있다.
본 발명의 실시예들이 첨부 도면을 참조로 하여 설명될 것이다.
도 1은 매트릭스된 채널을 2개의 서브스트림으로 부호화하는데 사용된 매트릭스를 포함하는 무손실 6채널 부호기의 개략도.
도 2는 본래의 6채널의 무손실 재구성을 제공하도록 도1의 부호기에 의해 생산된 2개의 서브스트림을 복호화하는 다채널 복호기를 보여 주는 도면.
도 3은 2채널 다운믹스를 제공하도록 제1 서브스트림만을 복호화하는 2채널 복호기를 보여주는 도면.
도 4a는 4개의 채널 신호들 중 2개의 채널을 수정하는 2개의 본래 매트릭스 양자화기의 캐스케이드를 보여주는 도면.
도 4b는 도 4a의 프로세싱을 변환시키도록 구성된 2개의 원시 매트릭스 양자화기의 유사한 캐스케이드를 보여주는 도면.
도 5a는 디더를 포함하는 최초의 매트릭스 양자화기를 보여주는 도면.
도 5b는 디더를 포함하는 역전의 최초의 매트릭스 양자화기를 보여주는 도면.
도 6a는 ‘LSB 바이패스’ 설비를 제공하도록 수정된 최초의 매트릭스 양자화기와, 어떤 부가적인 무손실 프로세싱의 경우에서 바이패스된 분리·전송을 보여주는 도면.
도 6b는 도 6a의 계속으로서, 어떠한 역전의 무손실 프로세싱의 경우에서 바이패스된 LSB의 분리 전송과, 바이패스된 LSB를 일체화하고 원 신호를 재구성하는 최초의 매트릭스 양자화기를 보여주는 도면.
도 7a는 LSB바이패스를 갖는 MLP 부호기의 하나의 실시예의 부품의 블록도.
도 7b는 도 7a의 부호기에 대한 보조인 복호기의 하나의 실시예를 보여주는 도면.
도 8은 MLP복호기의 하나의 실시예에 사용하도록 명세된 최초의 매트릭스 양자화기를 보여주는 도면.
도 9는 시청을 위한 출력을 갖는 프리퀀티시에 의해 처리된 무손실 부호기와, 프리퀀티시된 출력으로부터 계산된 ‘무손실 체크’값을 보여주는 도면.
도 10은 48kHz 및 96kKHz에서 혼합된 양의 신호 샘플들을 부호화하고 업 샘플러에 의해 처리된 무손실 부호기를 포함하는 장치를 보여주는 도면.
다운믹스 부호화과 복호화
1996년 9월 제이. 오디오 이엔지. 에스오씨. 에 의한 ‘오디오 디스크용 무손실 코딩’이라는 제목의 논문 제44권 9호 제706-720페이지와 국제특허출원 WO-A 96/37048는 무손실 압축에 사용된 원리의 일부의 논의를 포함한다.
무손실 압축의 중요한 공통적 적용은 DVD-오디오에 있는 바, 그곳에는 2부류의 플레이어가 존재한다. 즉, ‘5.1’스피커 레이아웃을 이끌어내도록 전형적으로 사용된 6출격을 제공하는 다채널 플레이어와 헤드폰과 같은 휴대적으로 사용하거나 2개의 확성기와 같은 청취자를 위한 2개의 출력을 제공하는 2채널 플레이어가 있다.
그러므로, DVD-오디오는 기록된 신호를 2번 수행할 수 있는 능력을 지니는바, 다채널 신호로 한번 2채널 신호로 다시 한번 수행한다. 그러나, 2번의 신호를 수행하는 것은 플레잉시간동안 역전관계를 지닌다. 많은 경우에 있어서, 본래의 레코딩은 다채널 신호만으로 제공되며, 2채널 청취자는 다채널 마스터로부터 유도된 다운믹스를 부여받는다.
기록된 오디오가 통상의 펄스 코드 모듈레이션(PCM)샘플로 수행된다면, 디스크는 다채널 레코딩 펄스 다운믹스 계수를 수행하는 것이 유리할 수 있는바, 그 다운믹스 계수들은 플레이어가 다채널 신호들의 채널들의 선행 결합으로서 2채널 다운믹스를 유도하는 것을 허용한다. 예컨대 2채널 Lo와 R0로 이루어진 다운믹스는 좌·전, 우·전, 좌·변, 우·변, 중앙 및 저주파수 효과 채널로부터 계산될 수 있는바, 이들은 각각 Lf, Rf, Ls, C 및 Lfe로 나타내며 이는 다음과 같은 매트릭스식을 사용한다.
그러나 플레이어 내의 다운믹스의 계산은 무손실 압축이 사용될 때 바람직하지 못하다. 다채널 신호의 6개의 채널 모두는 위의 매트릭스 식이 적용되기 전에 복호화되어야 하며, 6개채널을 복호화하는데 따른 계산적인 오버헤드는 이 콘텍스트에서 초과하는 부분이다.
이 문제를 해결하는 하나의 예가 도 1, 2 및 3에 도시되어 있다. 도 1에 있어서, 부호기에 제공된 다채널 신호는 ‘매트릭스 1’에 공급되는바, 이 경우 m0....m5를 출격하는 6×6매트릭스는 2개의 부분집합 {m0, m1} 및 {m2, m3, m4, m5}로 분리된다. 이 부분집합은 ‘부호기 코어 0’와 ‘부호기 코어 1’에 의해 부호화되어 2개의 분리된 서브스트림인 지정된 ‘서브스트림0’과 ‘서브스트림1’로 된다. 각각의 서브스트림을 FIFO버퍼를 통해 공급되며, 서브스트림들은 도면에 도시된 바와 같이 DVD와 같은 매체에 존재될 수 있는 복합 출력스트림을 생산하도록 ‘팩킷서’로 결합된다. FIFO버퍼를 사용하는 이유는 미국특허 6,023,233호에 논의되어 있으며, 또한 본원에서 ‘AES 1998’로 참조된 1998년 9월 프로렌스에서 하이 퀄리티 오디오 코딩에 관한 AES 17회 국제 컨퍼런스에서 발간된 “MLP 무손실 압축시스템”에 엠. 에이. 게르존, 피. 지. 크레이브, 제. 알. 스튜어트, 엠. 제이, 로우 및 알. 제이. 윌슨에 의해 개시되어 있다.
도 1에 도시된 부호기에 의해 부호화된 다채널 신호를 플레이시키기위해, 도 2에 도시된 것과 같은 복호기가 사용된다. 이 복호기에 있어서, ‘디-패킷서’는 도시된 바와 같이 DVD와 같은 전송매체 또는 저장매체로부터 부호화 스트림을 수신하고, 부호화 스트림을 분석하고 그것을 2개의 서브스트림으로 분리한다. 각각의 서브스트림은 신호 m0....m5를 제공하기 위해 ‘복호기 코어’ FIFO 버퍼를 통해 통과된다. 이 같은 신호들은 본래의 다채널 신호를 제공하기 위해 매트릭스1의 역전을 통해 통과된다.
2채널 다운믹스를 플레이시키기 위해, 도 3에 도시된 것과 같은 복호기가 사용된다. 여기서 서브스트림들은 분리되지만 단지 서브스트림0은 신호 m0 및 m1을 제공하도록 유지되고, 버퍼되고 복호화된다. 이들로부터 매트릭스 매트릭스0는 원하는 신호 LO 및 RO를 이끌어냄으로써, 부호기는 가능하게될 것을 위해 정확한 정보를 m0 및 m1으로 배치시키는 것으로 가정된다. 예컨대, 도 1의 부호기에서의 매트릭스 1의 상부의 2개의 열은 전술된 2×6 매트릭스에서의 상부 2개의 열과 같은 다운믹스 계수를 포함한다면, 신호 m0 및 m1는 필요한 다운믹스 신호 LO 및 R O로 될 것이다. 이 경우에 있어서, 도 3에서의 ‘매트릭스0’는 불필요하며 동일한 매트릭스에 의해 교체되거나 생략될 수 있다.
본 발명의 구별되는 특징은 전체를 통해 무손실될 수 있음으로써, 도 2의 복호기로부터 획득된 다채널 출력 신호는 도 1의 부호기에 제공된 입력신호와 동일한 비트 대 비트(bit-for-bit)로 된다. 따라서, 부호기 및 복호기 코어들이 존재한다면 무손실로 되어야 하며, 매트릭스 1 및 그것의 역은 무손실로 되도록 필요하게 된다. 무손실 부호기 및 복호기 코어들은 무손실 코딩을 제공하는 어떤 방식을 필수적으로 이행될 수 있지만, 바람직한 실시예들에 있어서 이 같은 프로세스들은 WO-A96/37048에 개시되는 프로세스에 따라 실행된다. 매트릭스 1을 실행하기 위한 고찰들이 더 상세하게 후술된다.
무손실 코딩의 구별적인 특징은, DVD 또는 다른 매체로 하여금 하나의 형태로 부호화 스트림을 이송하는바, 그 형태는 본래의 다채널 신호의 무손실 회복을 허용하며 본래의 다채널 신호만을 이송하는데 필요하게 될 대역폭 또는 동일한 저장공간을 필수적으로 사용하는 본래의 신호의 다운믹스 또는 매트릭스된 식의 단순한 회복을 허용하는 형태이다. 특정 실시예에 있어서, 다운믹스를 합체하는 무손실적으로 압축된 신호의 밴드폭 또는 필요한 저장 공간은, 다운믹스를 역전시키도록 복호기에 의해 요구되는 부호화 스트림에 이송된 부가적인 정보로 인해 또한 코딩 프로세스를 최적화하는데 사용하기에 적합하지 않은 다운믹스를 부호화하는데 사용되는 PMQS의 인자 때문에 압축된 다채널 신호에 의해 요구되는 것보다 매우 약간 높게 될 수 있다.
매트릭싱을 무손실적으로 실행하는 하나의 방법이 WO-A96/37048에서 ‘최초(본) 매트릭’로 개시되는 최초의 매트릭스 양자화기(PMQ2)의 캐스케이드를 사용하는 방법이다. 이 같은 PMQS는 하나의 채널에서 신호를 모디파이(수정)하는데 사용되는 매트릭스들이며, 역전 가능한 방식으로 다른 채널로부터 획득된 신호값들을 사용한다. 특히, WO-A 96/37048은 역순으로의 각각의 양자화기의 효과를 역전시킴으로써 무손실 역전 매트릭싱이 수행될 수 있는 방식을 개시하고 있다. 이것은 도 4a에 개시되어 있으며, 부호기에서 사용하기 위한 캐스케이드에서 2개의 PMQS를 보여주며, 도 4b는 역순으로의 2개의 역전 PMQS를 보여준다. 특히 단지 2개의 최초 매트릭스 양자화기만이 단순한 상태에서, 신호 S1, S2, S3 및 S4는 Lf, Rf, Ls, R s 등과 같은 원채널들로 확인될 수 있으며, 변경된 신호 S1′ 및 S2′는 LO 및 RO로 확인되거나 신호 m0 및 m1으로 확인된다.
원 신호의 비트-대-비트 재구성을 검사하기 위해, 도 4b에서의 양자화기 Q2가 도 4a에서의 양자화기 Q2와 동일한 신호로 공급되었는지를 관찰한다. 그들이 동일한 것으로 추측되면 동일한 출력(q2)을 생산한다. 도 4a에서 신호(S2′)는 S2′=S2-q_2로 형성되는 반면, 도 4b는 복원식 S2=S2′+q_2을 수행한다. 따라서 S2가 복원되며, 도 4b의 양자화기(Q1)는 도 4a의 양자화기(Q1)와 동일한 신호로 공급되며, 신호 S1은 S2가 복원되는 방식과 동일한 방식으로 복원된다.
양자화기(Q1, Q2)는 수정된 신호 (S1′,S2′)의 워드길이가 입력신호 (S1,S2)의 워드길이를 초과하는 것을 방지하기 위해 필요하게 됨으로써, 정보 콘텐트는 증가되지 않는다.
도 4는 단순성을 위해 4개의 채널만을 보여주고 있지만, 이 같은 원리가 어떤 수의 채널들에까지 확장될 수 있는 방식과 더 많은 수의 PMQS가 캐스케이드에서 사용될 수 있는 방식을 보여줄 것이다. 각각의 PMQ는 바로 하나의 오디오 채널을 수정하며, 도 4에서는 첫 번째의 2개의 채널들만이 수정된다. 특히, 채널들 중 일부 또는 모두가 수정될 수 있다. 거기에는 순서상 아무런 제한이 없으며 주어진 채널이 한번이상 수정되는 어떠한 금지도 없다. 2채널 다운믹스의 경우에 있어서, 적어도 제 1의 2채널이 수정되는 것이 정상적일 것이다.
도 4의 각각의 PMQ는 그것을 수정하는 채널에 대해 일관성 있게 획득할 수 있을 것이다. 그 같은 PMQS의 캐스케이드로부터 가장 일반적인 매트릭스를 동기화하는 것이 불가능한바: WO-A 96/37048은 하나와 동일한 행렬식을 갖는 매트릭스들로 복원되는 세트를 설명한다. 일반적인 경우에 있어서, 단일량을 갖는 행렬식을 획득하기 위해 다운믹스 방정식을 설정할 필요가 있다. 예컨대, 조기에 디스플레이된 다운믹스 방정식들의 경우, 부호기내의 매트릭스1이
을 실행할 수 있는 반면, 2채널 복호기의 매트릭스0은 역계산인
을 실행 할 수 있도록 4/3으로 설정되어야 한다.
매트릭스0은 그것의 행렬식이 단일 양을 지니지 않기 때문에 PMQS의 캐스케이드로서 실행될 수 없음이 증명된다. 이것은, 매트릭스0이 원 신호의 무손실 재구성을 제공하는데 요구되지 않기 때문에 문제가 없다. 2채널 원 신호를 무손실적으로 복호화하기 위한 PMQS의 완전한 캐스케이드로서 또는 다운믹스 적용을 위한 더 일반적인 매트릭스로서 2채널 복호기로 하여금 매트릭스0을 실행하게 허용하는 구성이 도 8에 도시되어 있으며 후술된다.
매트릭스 0를 형성하는 PMQS에 대한 계수를 계산하기 위해, 다음 절차가 적용될 수 있다. 예컨대 전술된 경우에, 다운믹스 계수들의 매트릭스를 다운믹스함으로써 아래와 같이 표시되는바,
j=1...6이면
와 같이 계산되어
과 같이 계산되며, j=3...6이면
과 같이 계산된다.
i,j에 대한 도 4a 및 도 4b에서의 계수(m-coeff)는
과 같이 표현되어 제공되는바, 여기서 도 4a의 감산으로 인해 마이너스 표시가 나타난다.
도 2의 다채널 복호기에 있어서, 역 매트릭스 1은 도 4b에서와 같이 실행될 수 있는바, 부호기에서와 같이 동일값인 m-coeff을 사용하지만, PMQS의 역순으로 또한 도시된 바와 같은 부가에 의해 교체된 각각의 부호화 PMQ에서의 감산으로 실행될 수 있다. 이 경우 PMQS에 캐스케이드에 대한 입력(m0....m5)이 2개의 서브스트림으로부터 유도되는 것으로 주시된다.
본 발명이 전술된 바와 같이 압축의 콘텍스트에 특히 관련된다하더라도, 압축시스템에 일반적으로 적용할 수 있으며 제한적이지 않다. 또한, 전술된 원리는 2개의 서브스트림들로 제한되지 않는다. 예컨대, 3개의 서브스트림을 사용하면 9채널 신호가 무손실적으로 이송될 수 있는바, 이때 제 1의 2개의 서브스트림으로 수행된 6채널 다운믹스를 복호화하는데 필요한 정보와, 제 1서브스트림에서만 수행된 2채널 다운믹스(6채널의 선형결합)를 복호화하는데 필요한 정보가 이용된다.
현재의 통상적인 적용에 있어서, Lf, Rf, Ls, Rs, C 및 Lfe 의 단위로 다운믹스 신호 Lo, Ro를 한정하는 매트릭스는 일반적으로 전술된 실시예의 경우와 같이 Lf 및 Rf를 곱하는 가장 큰 계수를 지닐 것이다. 그러나, 이 같은 현상은 우성의 계수들이 다른 신호들의 일부를 곱할 수 있기 때문에 발생될 수 없다. 만일 Lf 및 Rf의 계수들이 작게 된다면, PMQ가 모디파이되는 채널에 대한 단일의 획득을 지니는 필요성이 하나의 문제를 초래할 것인바, 이는 하나 이상의 다른 채널들의 결과적으로 일정비율로 증가되기 때문이다. 전술된 바와 같은 스케일링이 이 같은 문제를 해결하는데 사용된다면, 매트릭스의 다른 계수들이 단일성을 초과할 것이며, 그 결과 과부하 또는 다른 문제들이 발생할 수 있다.
이 같은 문제는, 예컨대 Lo에서의 계수가 가장 큰 ‘제1’채널이 시이퀀스의 개시점으로 유도될 수 있도록 또한 Ro에서의 계수가 가장 큰 ‘제2’채널이 제2위치로 유도되도록 부호기의 채널들의 순열에 의해 해결될 수 있다. 이 실시예에 있어서, 제 1 및 제 2채널들은 동일하지 않은 것으로 가정된다. 이 같은 재배치는 제 1의 2개의 채널을 수정하도록 계수가 단일성을 초과하지 않는 2개의 PMQS를 사용하여 Lo 및 Ro에 대한 명제로 되는 매트릭스된 신호 (m0,m1)를 제공하는 것을 부호기로 하여금 가능하게 한다.
부호기에서의 그 같은 순열은, 도 2의 다채널 복호기가 정확한 순서로 신호들을 재생하기 위해 역순열을 필요로 할 것이다. 출력 채널들의 리맵핑(Re-mapping)이 복호화된 스트림에 ch-assign 정보에 의해 유도된 바와 같이 MLP복호기에 제공된다. 부호기가 하나의 순열을 사용하는 경우에 있어서, 적절한 리맵핑을 지정함으로써 복호기가 역순열을 적용할 수 있게 할 수 있다.
역순열은, 부호기가 매트릭싱 전에 순열을 적용한다면 복호기의 매트릭싱 후에 적용된다. 또 다른 가능성은, 순열이 매트릭싱 후에 부호기에 적용된다면 매트릭싱 전에 복호기에 순열이 적용되게 하는 것일 수 있다. 부가적으로, MLP스트림의 복호기는 매트릭스의 계수들이 변경된다면 매트릭싱 전에 순열을 적용할 수 있다.
비유사하지만 전술된 방법들이 처리하지 못할 다운믹스 스페시픽케이션들이 가능할 것이다. 하나의 가능성은, 동일하거나 거의 동일한 다시 말해, 다운믹스가 단일이거나 거의 단일한 계수들을 Lo 및 Ro가 지닐 수 있다는 것이다. 이 같은 상태에 있어서, 상기 절차는 불만족스러운바, 이는 coeff2,1에 대한 식의 분모가 제로(0) 또는 거의 제로로 되어 큰 계수 및 높은 과부하의 가능성을 결과로 하기 때문이다. 이 문제는 m0 및 m1을 다르게 선택함으로써 해결될 수 있다. 신호들을 벡터 스페이스의 요소들로서 관련시키면, 신호(Lo, Ro)는 6차원 유클리드 벡터 스페이스의 2차원 서브스페이스를 일반적으로 스팬하거나 또는 n-차원 유클리드 벡터 스페이스를 스팬할 것이며, 이들의 다채널 신호의 채널들은 정상근(orthonomal basis)을 형성한다. 신호(m0, m1)는 Lo 및 Ro가 재구성된다면 이 같은 서브스페이스를 스팬해야 한다. Lo 및 Ro에 의해 스팬된 서브스페이스에서 상호 직교하거나 거의 직교하도록 m0 및 m1을 선택하는 것이 바람직하다. 입력 채널들에 관하여 m0를 결정했다면, 이 같은 채널들은 m0에서의 계수가 가장 크거나 거의 가장 큰 채널이 먼저 오도록 매트릭스전에 변경될 수 있다. PMQ는, 전달된 채널이 원하는 m0의 스케일된 버전이 되도록 전술된 바와 같이 계산된다. 이후 m1의 스케일된 버전을 제공하도록 PMQ를 계산할 필요가 있다. 다시, 계수들의 양을 최소화하기 위해 이전의 변경이 요구될 수 있다. 매트릭스될 신호들의 이 같은 변경을 매트릭스변경의 기술분야의 당업자에게 공지된 ‘부분 피봇팅’의 프로세스에 유사한바, 이에 대해서는 상세하게 설명하지 않을 것이다. 초기에, m0 및 m1은 임의 스케일링으로 부여될 수 있다. 이후, 계수 결정에 대한 전술된 절차를 원 채널들에 대해 m0 및 m1을 부여하는 매트릭스로 매트릭스 다운믹스를 교체시킴으로써 이용될 수 있다. 이 같은 절차에 의해 결정된 계수들은 m0 및 m1의 실제 스케일링을 결정할 것이다.
Lo 및 Ro가 동일한 신호이거나 또는 상호간의 스케일된 버전으로 되는 변형된 경우에 있어서, Lo 및 Ro에 의해 스팬된 서브스페이스는 1차원으로 될 것이다. 이 경우, m0는 서브스페이스내에서 임의로 선택될 수 있으며 m1은 m0에 직교되지만 서브스페이스 외측으로부터 선택될 수 있다. 2채널 복호기에서의 매트릭스 0는 m0의 스케일된 버전으로서 Lo 및 Ro를 재구성할 것이며 m1을 무시할 것이다.
MLP 무손실 압축시스템에 있어서, 매트릭스0의 계수들은 제 1 서브스티림인 서브스트림0에서 실행되며, 매트릭스1의 계수들은 제 2 서브스트림인 서브스트림1에서 전체적으로 수행되더라도, 이 계수들의 일부는 제 1 서브스트림으로부터 복호화된 신호들을 증가시키는데 사용된다.
데이터량 감소가 수반된 다운믹스 부호화
매트릭싱을 사용하는 무손실 부호기들은 WO-A 96/37048에 광범위하게 논의되어 있는바, 매트릭싱의 목적은 전달된 채널들간의 상호관계를 감소시켜 전달된 데이터량을 감소시키는데 있다. 다운믹스가 전술된 바와 같이 부호화되는 경우에, 매트릭싱은 다운믹스 필요성에 의해 부분적으로 명세되지만, 그 스페시픽케이션에는 현저한 자유도가 존재한다.
첫째, m0 및 m1을 선택하는데 있어서, 그들이 거의 직교하는 상태에서는 Lo 및 Ro에 의해 스판된 서브스페이스내에서 임의의 회전이 허용된다. 이 같은 자유도는 제 1서브스트림인 서브스트림0을 부호화하는데 필요한 데이터 량을 최소화하는데 사용될 수 있는 바, 이때 예컨대 2개 이상의 채널들의 어떤 신호에 의해 취해진 데이터량을 최소화하는 WO-A 96/37048에 논의된 방법을 사용한다.
둘째, 예컨대 6채널의 다채널 신호를 가정하면, 다운믹스를 제공하는데 수정되지 않은 4개의 채널들의 매트릭싱이 완전하게 명세되지 않을 것이다. 다시 한번, WO-A96/37048에 개시된 방법은 제 2 서브스트림인 서브스트림1을 부호화하는데 필요한 데이터양을 최소화하는데 사용될 수 있다. PMQ수행의 경우에 있어서, 2 PMQS는 다운믹스를 이끌어내는데 사용될 수 있으며, 존재하는 어떠한 PMQS는 어떠한 다른 4개의 채널 신호에 대한 것과 동일한 방식으로 존재하는 4개의 채널들의 데이터양을 최소화하는데 사용될 수 있다. MLP 압축시스템에 있어서, 6 PMQS는 전체적으로 유용하며, 4개가 이테스크에 배정되는 것을 허용한다.
디더(Dither)
오디오신호의 재생을 달성하는 어떤 측정이 디더를 사용하여 수행되는 오디오애호가 그룹들에서는 매우 중요한 것으로 간주되고 있다. 전형적으로, 작은 의사난수(pseudo-random) 디더 값이 양자화기를 지나기 전에 신호에 부가된다. 예컨대, 1992년 5월 제이. 오디오 이엔지. 에쓰오씨.,에서 에스. 피. 리스피즈, 알. 에이. 워너마커, 및 제이. 반데쿠이에 의해 “양자화 및 디더: 이론적 개론,”제 40권 355-375페이지 참조.
최초의 매트릭스 양자화기는 본래 양자화를 수행한다. 무손실 부호화 및 복호화의 경우, 디더의 결핍은 문제가 없는바, 이것은 복호기에서의 무손실 매트릭싱이 부호기에서 수행된 매트릭싱을 정확하게 역전시켜 어떠한 양자화 효과를 포함하기 때문이다. 그러나, 전술된 바와 같이 다운믹스를 제공하는데 있어서 매트릭스 0는 매트릭스 1의 효과를 역전시키지 않으며, 또한 다운믹스는 2개의 매트릭스로부터 양자화 효과를 포함할 것이다.
다운믹스 양자화를 제공하기 위하여, 디더는 2개의 매트릭스 모두에 의해 부가되어야 한다. 그러나 부호기의 매트릭스1에 디더를 부가하는 것은 전달된 신호에 영향을 줄 것이며, 결국 다채널 신호의 복호화가 영향을 받게될 것이다. 그러므로, 무손실 복호화에 대해서, 다채널 복호기에서의 역전 매트릭스1은 부호화 매트릭싱에서의 디더의 영향을 보상해야 한다.
도 5a 및 5b는 3개의 채널 신호에 대한 경우 디더를 포함하는 최초의 매트릭tm 양자화기의 완전한 쌍을 보여준다. 2개의 매트릭스 양자화기는 신호(q1)가 도 5a에 도시된 양자화기에서 감해지는 반면 동일한 신호가 도 5b에 도시된 양자화기에서 감해지는 것만이 다르다. 모든 경우에 동일하게 박스로 표시된 ‘디더’에 의해 제공된 신호가 제공되며, 도 5b의 PMQ가 도 5a에서의 PMQ의 작용하에 있게 될 것이라는 것을 쉽게 알 수 있을 것이다. 따라서, 도 1에 도시된 바와 같은 부호기는, ‘매트릭스1’이 도 5a에 도시된 바와 같이 PMQS의 캐스케이드인 것으로 구성될 수 있으며, 도 2의 다채널 복호기는 ‘역전 매트릭스 1’이 도 5b에 도시된 바와 같이 PMQS의 역전된 순서의 캐스케이드인 것으로 구성된다. 이것은, 다채널 신호가 무손실적으로 재구성되는 것을 보장할 것이다.
최상의 질을 갖는 다운믹스 재생에 대해서, 디더에 대한 통상의 필요성들이 부호기의 ‘매트릭스1’과 복호기의 ‘매트릭스0’ 모두에서 만족하게 될 것이다. 따라서, 예컨대 부호기에 있어서, 도 5a 및 5b에서의 디더 제너레이터는 양자화기(Q)의 2개의 양자화 단계와 동일한 정점에서 정점까지의 진폭을 갖는 TPDF 디더를 유리하게 제공할 수 있다. 부호기에서 제 1의 2개의 PMQ가 다운믹스 신호를 제공한다면, 후속의 PMQS에 디더를 부가할 필요는 없다.
매트릭스0은 다른 형태의 매트릭스로 될 수 있지만, 그럼에도 불구하고 계산을 포함하며, 양자화에 따라 워드의 길이를 증가시키며, 각각의 양자화 이전에 디더가 정상적으로 부가된다.
도 5a 및 5b의 부호화 및 복호화 양자화기에서의 동일한 디더에 대한 필요성이 때때로 스트림내의 의사난수 시이퀀스 발생기의 상태를 이송시키는 ‘시이드’를 기록하는 부호기에 의해 충족될 수 있으며, 또한 시드를 판독하여 결과적으로 그 자신의 시이퀀스 발생기를 동시화하는 복호기에 의해 충족될 수 있다.
MLP에서 시이퀀스 발생기는 다음식을 사용하는 의사난수 2진 시이퀀스(PRBS)를 발생시키는 23-비트 원형 시프트 레지스터인바;
식중, b_x는 시프트 레지스터의 비트 x를 나타내며,
는 배타적 OR 작동을 나타낸다.
따라서, 스트림에서의 시드는 23비트로 길다. 시프트 레지스터는 각각의 샘플 주기에서 16비트까지 시프트된다. 이것은 장방형의 PDF를 갖는 새로운 16비트의 의사난수가 각각의 신호 샘플에 대해 발생되게 한다. 그러나, TPDF 디더가 바람직하기 때문에, 16비트는 2개의 8비트 디더 샘플로 분리된다. 이 8비트 샘플들 각각은 장방형 PDF를 지니지만, 부호기는 장방형 PDF를 지니는 2개의 부가적인 상관된 디더 샘플들을 제공하도록 2개의 샘플을 가감하는 옵션을 지닌다. 이 프로세서는 ‘다이아몬드 디더’로 공지되어 있으며, AES논문 제 4533호의 전술된 워너마커 서문에 설명되어 있다. 부호기는 다운믹스 신호를 제공하는 2개의 PMQS에 디더를 부가하도록 2개의 장방형 PAF샘플들을 사용할 수 있다.
음악애호가의 관심은, 부호기에서 상응하는 프로세스에 대해 동시화되는 다운믹스 신호를 복원시키도록 디더가 매트릭스0에 적용될 필요를 없애는 데 있다. 실제로, 동일한 디더가 인가되는 것이 바람직하거나, 매트릭스0이 매트릭스1에 인가된 디더와 관련되는 어떤 디더를 적용하는 것이 바람직하다. MLP에 있어서, 다운믹스 복호기는 다채널 복호기와 동일한 알고리즘을 사용하는 디더 신호를 발생시키지만, 디더는 시드가 다르기 때문에 다른 바: 매트릭스0 디더에 대한 시트가 서브스트림0에서 수행되는 반면, 매트릭스1 디더에 대한 시드는 서브스트림1에서 수행된다.
MLP에 있어서, 매트릭스 0의 양자화 및 계산은 매트릭스 1에 대한 것과 같이 정확하게 지정되며, 부호기에 의해 제어된 디더에 대해서, 그 부호기는 마지막 비트 이하로 복호기에 의해 복원된 Lo 및 Ro 신호들의 정확한 지식을 지닌다. 본 발명자는 이 같은 점에 대해 설명할 것이다.
다운믹스의 포화
디지털 채널이 처리할 수 있는 최대수준으로 오디오 신호를 부호화하는 것이 종종 경제적으로 중요한 관심사이다. 생음악에서의 피크는 매우 조절하기 힘들며, 평균 수준은 생신호의 피크가 과부하를 초래하지 않는다면 디지털 칩핑하여 잘 유지되어야 한다. 그러나, 전문적인 녹음 기술자는, 피크가 과부하로 되지 않을 것을 보장하는 반면 매우 완전하게 채널을 계산하는 ‘제어된’신호를 생산하게 하는 칩퍼 및 리미터와 같은 파형 수정을 위한 공구들을 구비하고 있다.
디지털 과부하는 ‘랩-라운드’효과에 의해 발생된 극히 바람직하지 못한 인공물들을 결과로 할 수 있을 것으로 이해된다. 예컨대, 통상의 2개의 완전한 24비트 오디오에 있어서, 최대 양성값은 7fffff 16진수에 의해 다시 부여된다. 하나의 양자화 수준에 의해 이 값을 증가시키기 위한 순수한 시도는 800000 16진수를 결과로 하는 바, 이것들은 최대의 음 진폭으로 해석된다. 따라서, 작은 과부하는 큰 고주파 에너지 내용을 지니는 완전한 스케일의 전이를 발생시킬 수 있으며, 이는 극히 바람직하지 못한 음을 낼 것이며 트위터의 소각을 초래한다.
DVD 마스터링의 콘텍스트에 있어서, ‘제어된’ 다채널 마스터가 무손실 부호화를 위해 생산되거나 제공되는 것으로 가정된다. 즉, 다채널 신호를 생산하는 중의 어떠한 과부하의 문제들이 이미 처리된 것으로 가정된다. 태스크는 수용가능한 LoRo 다운믹스를 생산하도록 존재한다.
도 3의 2채널 복호기의 출력에서의 과부하는 ‘매트릭스 0’의 계수들을 현저하게 낮게 스케일링함으로써 회피될 수 있다. 그러나, 그 같은 낮은 스케일링은 2가지 문제를 갖는다. 첫째, 필요한 스케일링의 양이 전체 프로그램 재료가 시험될 때까지 알려지지 않는다는 것이며, 이는 마스터링 단계에서는 통상적이지 못하다. 둘째, 그 같은 스케일링은 통상적인 표준들에 의해 수용가능하지 못하게 조용한 다운믹스를 결과로 한다. 이것은, 다채널 신호의 어떠한 이전의 칩핑 또는 리미팅이 다채널 신호로부터 유도된 다운믹스의 정점 대 평균 비를 구속하는데 불필요하게 영향을 미치지 않기 때문이다.
부호화 상태에서 다운믹스를 조절하기는 불가능한바, 이는 m0 및 m1의 전이를 변경시킬 것이기 때문이며 또한 다채널 신호의 복원이 무손실로 되지 않을 것이기 때문이다.
따라서, 본 발명은 디지털 출력이 처리할 수 있는 것보다 큰 폭을 지니는 다운믹스 신호를 내부적으로 발생시킬 능력을 지니는 다운믹스 복호기를 제공하고, 또한 다운믹스 신호의 과부하가 불만족한 결과없이 처리되도록 최종 출력전에 리미터 또는 치퍼를 합체한다.
MLP에 있어서, 출력 워드 폭은 24비트로 지정되며, PMQS 사이의 경로를 포함하는 대부분의 내부 신호 경로 또한 24비트 폭으로 지정된다. 그러나, 복호기에서의 마지막 PMQ 이후에, 때때로 복호화된 스트림에서 수행된 “output_shift”정보에 의해 지정된 가변적인 비트 수에 의해 좌 또는 우로 시프트시키도록 시프터(shifter)가 제공된다. 부호기가 24비트 이상을 요구하는 다운믹스를 결과로 하는 다운믹스 지정 및 입력으로 주어진다면, 부호기는 매트릭싱내에서의 과부하를 회피하도록 다운믹스 스페시픽케이션을 줄인다. 이 같은 감산은 2배로 될 수 있으므로, 정확한 폭이 “출력_시프트” 정보에서 양의 좌측시프트를 지정함으로써 복호기에 저장될 수 있다. 따라서 복호기에서의 시프터는 정확한 폭의 다운믹스 신호를 발생시키는 바, 이는 24비트 출력에 대해 더 크게 될 수 있다. 그러므로 클리퍼가 시프터와 출력사이에 배치됨으로써, 전술된 바람직하지 못한 “랩-라운드”효과를 피할 수 있다. 클리퍼는 많은 DSP칩에 제공된 설비를 사용하여 편리하게 실행될 수 있으므로, 누산기에서의 값은 ‘포화 계산’을 사용하여 메모리에 저장될 수 있다.
이 경우 누산기에 저장되는 메모리 위치가 스트림내의 “ch_assign” 정보에 따라 계산될 수 있다면 부가적인 시너지가 발생된다. 이것은 분리동작으로 계산함이 없이 복호기에서 필요로 하는 채널들의 역변경을 달성한다.
LSB 바이패스
입력신호가 전제 24-비트 범위를 초과한다면, 도 4 또는 도 5에 따른 PMQ를 사용하는 채널을 수정하기 위한 시도가 24비트 범위를 초과하는 신호에 유도된다. 무손실 부호화 및 복호화 프로세스와 동일한 증가된 범위는 도 6의 체계를 사용함으로써 24비트 계산을 사용하는 프로세서에서조차 경제적으로 수용될 수 있다.
도 6은 좌측에서 시프트를 합체화는 PMQ를 보여준다. 신호 경로들은 일반적으로 24비트의 광대역으로 추정되지만, S1으로부터 양자화된 신호(q)의 감산후 25비트 데이터 경로가 부가를 위해 헤드룸을 허용하도록 제공된다. 신호는 1비트씩 산술적으로 우측으로 시프트되며, 워드의 하부로부터 시프트된 LSB는 메인 출력 (S1′)으로부터 분리적으로 출력되는바, 이는 존재하는 24 고순위 비트를 포함한다.
따라서, 시프트된 LSB는 물론 신호와 함께 이송되어야 한다. 신호(S1, S2, S3)를 복호화하기 위해, LSB는 신호(S1′,S2 및 S3)와 함께 도 6b의 우측에 나타난 역전 PMQ에 나타나게 될 것이다. 여기서 LSB는 S1′에 종속되며 그 결과는 분리적으로 수행된 LSB가 시프트된 워드의 LSB가 되도록 1 비트만큼 우측으로 시프트됨으로써 양자화된 신호(q)가 부가되는 25비트 신호를 부여한다. 이 같은 부가의 결과는 도 6a에 도시된 PMQ에 입력된 것과 같이 공급된 시노(S1) 무손실 재구성에 의해 24비트 폭 만으로 되는바, S1은 24비트 신호인 것으로 제공된다.
도 6a의 우측 및 도 6b의 좌측에 도시된 바와 같이, 2개의 보조적인 PMQS사이의 24비트 폭의 경로 무손실 프로세싱을 삽입시키고 무손실 프로세싱을 역전시킬 수 있으므로써, LSB가 분리적으로 이송되도록 바이패스 경로가 제공된다. 예컨대, MLP 부호기의 부분 블록도가 도 7a에 도시되며 상응하는 복호기가 도 7b에 도시된다. 디콜리레이터 및 엔트로피 코더는 도 7a에 도시된 매트릭스 이후에 배치되며; 따라서, 이 실시예에서, 도 6a에 도시된 ‘무손실 프로세싱’은 이 같은 항목들을 포함할 것이다. 유사하게, 도 7b에 참조된 바와 같이, 도 6b에 도시된 ‘역전 무손실 프로세싱’은 엔트로피 복호기 및 리콜리레이터를 포함할 수 있다. 도 7a 및 7b에 도시된 바와 같이, 이 프로세싱을 가로지는 바이패스된 LSB를 유지하는데 신중을 기해야 하며, 그것을 부호화 스트림 또는 서브스트림에 저장하고 또한 회복시키는데 신중을 기해야 한다.
때때로 MLP에서의 매트릭싱이 과부하를 초래하지 않지만, 신호 진폭을 감소시키도록 일반적으로 설계된 디콜리레이터는 그것을 특정 샘플들에서 증가시키며 이에 따라 과부하 문제를 해결한다. 이 경우에 있어서, 도 6a에 도시된 형태의 PMQ는 신호의 진폭을 감소시키는데 사용될 수 있으며, 이에 따라 부가적인 프로세싱을 위한 헤드룸의 거의 6dB를 제공한다. 도 6에 도시된 계수들은, PMQ가 이 같은 목적을 위해서만 사용될 때 제로(0)로 설정될 수 있다.
도 6a의 조직은 1비트이상이 PMQ로부터 시프트되게 하도록 일반화 될 수 있으며 바이패스 신호로서 전달될 수 있이 명백해질 것이다. 이것은 MLP에서는 일어나지 않는다.
도 6a에 도시된 프로세싱은 무손실이며, 도 6b에 도시된 상응하는 역전 무손실 프로세싱 또한 무손실이다. 따라서, 이 프로세싱을 자리잡게 할 수 있다. 예컨대, 도 6a의 우측에 도시된 ‘무손실 프로세싱’은 도 6a의 좌측에 도시된 형식의 PMQ를 포함할 수 있으며, 이 보장된 PMQ의 코딩 효과는 도 6b의 우측에 도시된 형식의 PMQ를 도 6b의 우측에 도시된 ‘역전 무손실 프로세싱’에 포함시킴으로써 역전될 수 있다. 이 경우, 바이패스된 LSB는 각각의 단계에서 발생될 것이며, 이에 따라 2개의 바이패스된 LSB들이 어떤 다른 프로세싱 주변에서 수행되어야 한다.
MLP 부호기에는 캐스케이드에서 6개의 PMQ까지 존재하며, 그들 중 어떤 것 또는 모두는 바이패스된 LSB를 제공하도록 구성될 수 있다. 따라서, 서브스티림은 6개의 바이패스된 LSB까지 즉, 각각의 PMQ로부터 하나까지 수행할 수 있다. 각각의 바이패스된 LSB가 다른 PMQ로부터 온다 하더라도, 그들이 다른 채널들로부터 올 필요성은 없으며, 부호기는 하나의 채널에 2개 이상의 그 같은 PMQS를 배치시키도록 임시로 선택할 수 있으며, 이에 따라 그 같은 채널에 대해 12dB이상의 부가적인 헤드룸을 획득할 수 있다.
등가의 효과를 지니는 도 6a 및 6b에 도시된 위상의 변형이 존재한다. 도 6a에서의 신호(q)의 감산 및 도 6b에서의 신호(q)의 부가가 교체될 수 있다. 감산은 계수들의 신호를 변환시키고, 사용된다면 디더의 신호를 변환시키고, 필요하다면 예컨대 모아진 양자화기로 삭제된 양자화기를 교체하는 방식으로 양자화기(Q)에 조절을 행함으로써 회피될 수 있다. 또다른 변화가 사이드-체인 대신에 WO-A96/37048의 도 23a에 도시된 바와 같이 전방 경로에 양자화기(Q)를 배치시켜며, 다시 수집 또는 삭제되는 양자화기를 선택할 때 다시 신중을 기해야 한다. 도 6b에 있어서, S1′신호 및 LSB를 함께 시프팅하는 것은 S1′신호의 좌측 시프트로서 대신 실행될 수 있으므로써 제로 LSB를 생산하며, 분리적으로 전달된 LSB를 부가한다. 이 경우에 있어서, 분리적으로 전달된 LSB의 부가는 양자화된 신호(q)의 부가와 결합될 수 있거나 또는 후에 실행될 수 있다. MLP에 대한 실시예들에 있어서, 부가가 24비트수를 생산할 것이다.
도 8은 3개의 채널(S1,S2,S3)을 회복하도록 구성된 바와 같이 MLP에 대해 지정된 복호기 PMQ를 보여 주는바, 제 2채널(S2)이 수정된다. 이것은 전술된 변화들의 일부를 합체하며, 부가적으로 좌측시프트를 실행하도록 일반적인 증가를 사용한다. 부호기는 계수값을 정하고 그들을 스트림에 포함시킨다. 따라서, 신호(S2′)를 1비트만큼 좌측으로 시프트시키기 위해, 부호기는 +2와 같은 RTN m_coeff〔2,2〕를 설정할 수 있다. MLP는 범위〔-2,+2〕에서 16비트 계수를 사용하므로; 극값 +2는 변하지 않으며 부호기는 대신에 -2를 지정한다. 따라서, 복호화 PMQ는 이 경우 신호를 역전시키고 부호기는 또한 보상을 위해 신호를 역전시켜야 한다.
전술된 바와 같이, 가감에 의해 2개의 TPDF 디더 신호들을 제공하기 위해 2개의 관련 없는 RPDF 디더 신호들을 지니는 것이 유리하다. MLP 매트릭싱에 있어서, 시이퀀스 제너레이터로부터 획득된 2개의 8비트 RPDF 디더 신호들이 24비트로 사인 연장되며 그들이 2개의 여분의 채널들이었다면 처리된다. 이 같은 디더 채널들은 결코 PMQS로 수정되지 않는다. 도 8에서의 디더는 다음식으로 주어진다. 즉,
이 디더는 도 6b에서의 디더로 확인된 디더와 같다.
가 동일한 값을 지닌다면, 디더는 하나의 PMQ에서 동일한 사인을 또한 다른 PMQ에서 반대의 사인으로를 지정할 것이며, 이에 따라 전술된 ‘다이아몬드 디더’방법에 의해 상관없는 TPDF 디더 신호를 제공한다.
도 8에서 24비트 정수로 입력 신호 샘플들을 고려하면, 멀티플리어로부터의 출력값들은 2진 지점후에 14비트를 지니는 것이 일반적인바, 이것은 계수 m_coeff[2,j]가 2진점후에 14비트까지 지닐 수 있기 때문이다. 이것은 양자화기[Qss]가 24비트 정수값으로 양자화하는 시점으로 추측된다. 이 경우, 2개의 8비트 RPDF디더값들이 24 비트 워드 디더0 및 디더1에서 우측이 조절된다면, 에 대한 정확한 크기는 2-8이다.
부가적인 PMQS가 다운믹스 신호들에 영향을 주지않고 스트림의 비트양을 감소시키는데 사용된다면, 부호기에서는 디더를 사용하지 않는 것이 정상적일 것이며, 그러므로 PMQS에서의 디더 채널들을 증가시키는데 사용된 m_coeff[i,j]값들은 제로로 될 것이다. 이것은, 모든 PMQS에서 디더 능력을 포함하지 않으므로써 절약을 이룰 수 있다. 그러나 이 같은 경제성은 MLP 실행에서는 일어나지 않는바, 이것은 특정 실시예들에서의 구조의 규칙성으로부터 인식된 장점들이 부가적인 쌍의 증가의 비용을 너무 과도하게 하기 때문이다.
MLP에서, 도 8에 따라 캐스케이드된 PMQS가 매트릭스0 및 매트릭스1에 대해 모두 사용된다. 매트릭스 1의 경우에 있어서, 채널의 계수가 수정되는 것이 정상일 것인바, 이것은 예시된 경우에서 m_coeff[2,2]이며, LSB 바이패스가 사용될 때 값 -2를 지니도록 수정되며, LSB 바이패스가 사용되지 않으면 +1 또는 -1로 수정된다. 이 같은 선택은 부호기에 의해 이루어지며 계수는 복호기에 의해 사용하기 위한 스트림에 포함된다.
다운믹스를 재생하도록 2채널 복호기를 사용할 때, 매트릭스0은 Lo 및 Ro를 제공하도록 m0 및 m1신호들의 매트릭싱 및/또는 스케일링을 제공한다. 2개의 파워로 한정되지 않는 일반적인 계수들은 PMQS에서 요구된다. 다시 한번 복호기에서의 규칙성 및 부호기에 대한 신축성은 도 8의 구성을 균일하게 적용하기 위한 이유들이다.
매트릭스0에서, 채널의 스케일링은 디더 계수들을 제외하고 그것을 제공하는 계수들 모두를 스케일링함으로써 달성될 수 있다. 스케일링이 필요하면, 필요한 스케일링이 [-2,2]의 유용한 계수 범위를 초과할 것이거나 또는 신호 과부하가 매트릭싱내에서 발생할 가능성이 존재한다. 이것은 2개의 파워에 의한 스케일링을 감소시킴으로써 처리될 수 있어, 원하는 수준을 저항하도록 최종 “출력_시프트”를 사용한다.
다운믹스를 갖는 MLP에 있어서, 제 1스트림인 서브스트림0에서 바이패스된 LSBS를 운반하는 것은 비정상적인바, 이것은 다운믹스 복호기는 무손실 재생을 시도하지 않기 때문이다. 제 2서브스트림인 서브스트림1은 다채널 복호기의 매트릭싱을 위해 필요한 모든 정보를 운반하는바, 이것들은 서브스트림0에서 운반되는 채널들로부터 떨어지는 LSB를 포함하는 바이패스된 LSB, 디더시드, 계수들을 포함한다.
전술된 것에 영향을 주지 않는 도 8의 하나의 특징은 양자화기(QSS)가 2의 파워인 스텝 사이즈(step-size)로 양자화 될 수 있다는 것이며, 따라서 1비트 이상의 절단지점이 LSB위에서 취하게 한다. 이 같은 설비는, 24비트 워드의 적어도 현저한 비트를 초과하지 않는 입력 신호들의 처리를 최적화하기 위해 포함된다. MLP에 있어서, LSB 바이패스 특징은 양자화 스텝 사이즈가 단일성으로 설정될 때만 사용된다.
스트림 보전 및 ‘무손실 체크’
일반적으로 손실 코딩 시스템은 입력신호의 정확한 재구성이 아닌 출력을 제공한다. 예컨대 순환 중복 체크(CRC) 또는 부분 체크와 같은 보전성 체킹은, 이동 에러가 플래그될 수 있도록 부호화된 스트림의 체크로 한정될 것이다. 입력 신호와 그것의 최종 재구성간의 관계는, 손실 부호화 및 복호화 프로세스에서의 고유한 손실에 의해, 또한 부호화 프로세서와 다른 형태가 가능한 복호화 프로세서의 계산 행위에 의해 초래되는 플랫폼 관련 에러들에 의해 어떻게 영향을 받게 되는지 알려져 있지 않다.
MLP에 있어서, ‘무손실 체크’값으로 공지된 패리티 워드는 입력 신호의 각각의 세그먼트에 대해 계산되고 부호화된 스트림에 포함된다. 부호기는 유사한 패리티 워드를 계산할 것이며, 또한 이와 같이 계산된 워드가 스트림에 포함된 워드와 일치하지 않는다면 에러가 발생되는 것을 표시할 것이다. 손실 코딩 시스템에서 가능한 체크와는 달리, 무손실 코딩 시스템에서 취해진 체크는 과부하 또는 알고리즘 내에서의 다른 알고리즘의 실패, 플랫폼 관련 불일치 및 전달 에러를 보여줄 수 있다.
바람직한 실시예들에 있어서, 플레이어는 그 같은 에러들의 사용자를 안내할 수 있어야 하는 바: 예컨대 “무손실”광은 2개의 체크워드가 일치하고 상호 식별할 때 조명되거나 식별될 수 있다. 실패가 순간적으로 일어날 수 있기 때문에, 사용자가 실패를 인식하는 시간을 갖도록, 예컨대 광이 단일실패가 발생하는 즉시 2초동안 꺼질 수 있도록 펄스-스트레칭 회로가 사용될 수 있다.
MLP에 있어서, 무손실 체크 값은 전형적으로 1280워드의 세그먼트내의 모든 샘플 및 모든 채널들에 대해 계산되는 8비트 패리티 워드이다. MLP 지정에 있어서, 이 세그먼트는 2개의 연속하는 ‘재시작 지점’ 사이에서 모든 샘플을 포함한다. MLP가 24비트 워드라 가정하면, 패리티는 24비트 워드로 자연적으로 계산될 것이지만, 이 패리티 워드는 3개의 8중수 또는 바이트로 분리되며, 이것들은 무손실 체크 값을 제공하기 위해 배타적 논리합으로 된다. 패리티를 계산하기 전에, 각각의 24비트 신호 워드는 채널 개수와 동일한 비트의 개수만큼 회전된다. 이 같은 회전은, 2개의 채널에 동일하게 영향을 주는 에러가 검출되지 않을 문제점을 회피한다.
8비트 패리티 8중수를 생산하도록 각각의 채널의 각각의 세그먼트 내에 모든 8중수의 패리티를 취하기 위해 변형적인 실행이 행해지며, 배타적-ORing 전에 그들과 함께 채널 개수만큼 각각의 패리티 8중수를 회전시킨다. 이것은, 24비트 워드길이를 지니지 않는 프로세서에서 더 경제적이다.
단일 서브스트림을 갖는 MLP에 있어서, 무손실 체크값은 무손실적으로 재생되는 원 신호에 관한다. MLP가 다운믹스를 운반하면, 제 2서브스트림을 원 신호에 관련하는 무손실 체크값을 운반하며, 이것은 다채널 복호기에 의해 체크될 것이다.
이 같은 다운믹스 경우에 있어서 제 1 서브스트림은 무손실 체크 밸브를 운반하지만, 이것은 단지 다운믹스만을 회전시킨다. 다운믹스 출력은 원 신호의 무손실 재생이 아니더라도, 디더의 정확한 지정 및 매트릭스 0에서의 양자화의 정확한 지정에 의해 결정될 수 있다. 그러므로, 부호기는 복호기에 의해 재생될 다운믹스를 결정할 수 있으며, 또한 이 같이 시뮬레이트된 다운믹스로부터 ‘무손실 체크’값을 계산할 수 있다. DVD-오디오 마스터링의 콘텍스트에 있어서, 부호기가 오디션을 위해 유용한 시뮬레이트된 다운믹스를 만들 수 있는 것으로 기대되므로, 시청자는 그의 플레이어에 회복된 신호가 마스터링 엔지니어 또는 기록 프로듀서에 의해 신호 레드와 동일한 비트 대 비트로 됨을 추측하게 될 수 있다.
전술된 바와 같이 플레이어에서 칩핑 또는 제한에 의해 정상적으로 처리되는 과부하의 경우 예외가 발생된다. 칩핑 또는 한정의 동작이 정확히 형성되지 않기 때문에, 무손실 체크 값은 어떠한 포화 또는 한정직전에 신호로부터 계산된다. 전술된 바와 같이 복호기가 최종 PMQ 이후 시프터를 합체하며 포화 계산을 사용하여 메모리에 애큐뮬레이터를 저장함으로써 실행할 수 있는 MLP에 있어서, 무손실 체크는 어큐뮬레이터에서의 값으로부터 직접 계산될 수 있어 포화에 의해 영향을 받지 않게 된다.
때때로, 도 9에 도시된 바와 같이, 무손실 부호기는 전달된 데이터양을 감소시키기 위해 사전양자화기에 의해 처리될 수 있다. 사전 양자화에 관한 부가적인 정보가 전술된 AES 1997 및 AES 1998 레퍼런스로부터 획득될 수 있다. 이 같은 상황에 있어서, 사전양자화기에 의해 수신된 원 신호의 재생은 무손실로 되지 않을 것이지만 사전에 양자화된 신호의 재생은 무손실로 될 것이다. 다시 말해 사전에 양자화된 신호는 오디션을 위해 유용하게 될 것이며, 무손실 체크값은 사전에 양자화된 신호로부터 계산될 것이므로, 마스터링 상태에서 적어도 청취가 유용하거나 청취되는 신호와 동일한 비트 애 비트로 시청자의 플레이어에 복원된 신호가 됨을 청취자가 확인하게 될 수 있는 것이다.
부호기 매트릭스 선택 전략
2채널 다운믹스를 부호화하기 위해, 신호(m0, m1)는 다운믹스 채널(Lo, Ro)에 의해 스팬된 서브스페이스로 되어야 한다. 이와 같이 표준내에는 현저한 신축성이 존재하지만, 일부의 선택은 다른 것보다 우수하다. 부호기는 여러 가지 이유로 인해 거의 선형적으로 독립되도록 m0 및 m1의 선택을 회피할 것이다. 첫째, 매트릭스 0는 아마도 큰 계수들을 지닐 것이며 다운믹스의 회복은 시끄러울 것이다. 둘째, 매트릭스에 포함된 PMQS를 결정하기 위해 방정식을 푸는 중에 부호기는 아마도 허용가능한 범위보다 큰 계수들을 발생시킬 것이다. 셋째, 신호들의 매트릭싱은 무손실 압축에 대해 데이터양에 영향을 주며, 이것은 상호간에 매우 유사한 신호를 분리적으로 전달하는데 효과적이지 못하다.
전술된 바와 같이, 이 같은 문제들 중 최악의 문제를 해결하기 위한 하나의 방식으로 m0 와 m1을 상호간에 대해 직교되도록 선택하는 방식이 있다. 즉, m0 와 m1 은 상호간에 대해 직교하는 열을 갖는 매트릭스에 의해 입력 신호의 항목으로 한정된다. 이 같은 표준은 일부의 신축성을 남길 것이며, 예컨대 Lo에 비례하는 m0를 취함으로써 다시 해결될 수 있다. 예컨대 다운믹스 지정은 다음과 같다. 즉,
여기서 Lo를 제공하는 가장 큰 계수는 Lf의 계수이며, 이것은 0.75와 같은 값을 갖는다. 그러므로, 1/0.75=1.333으로 스케일된 Lo와 같은 m0를 생성시키면, 다음과 같은 식을 얻게 된다. 즉,
이것은 수정되지 않은 제 1채널을 남기는 PMQ에 의해 수행될 수 있다.
신호(m1)는 Lo 및 Ro의 선형 결합으로 되어야 한다. Lo에 직교하며 m0에 직교하는 선형결합은
으로 주어지는바,
식중 이며, 심벌은 2개의 벡터의 스칼라 또는 돗트 곱을 나타낸다.
결과적인 값은 다운믹스 매트릭스에서 열벡터의 도트곱을 취하는 것과 등가이다. 다운믹스 매트릭스를 나타내도록 다운 믹스를 사용한다면, 스칼라(λ)는 다음식으로 표시될 것인바,
식중 downmix_1은 매트릭스의 제 1열 벡터를 나타내고;
downmix_2는 매트릭스의 제 2열 벡터를 나타내며;
위와 같은 예로부터 다운믹스 매트릭스를 사용하면 λ=0.1849이다. 따라서:
로 된다.
m1을 발생시킬 제2 PMQ는 제1 PMQ에 의해 제공된 신호들을 수용하며, 제 1채널은 Lf이기 보다는 m0이다. 그러므로 m1은 m0, Rf 등의 항목으로 아래와 같이 다시 표현되어야 한다.
여기서, 가장 큰 계수인 0.8000은 제 4 입력채널인 Rs와 곱해진다. 그러므로, 전술된 바와 같이 제 2 및 제 4 입력 채널들을 교환하기 위해 순열배치를 적용하면, m1이 매트릭스 출력에서 제 2 위치에 나타날 수 있도록 Rs를 제 2 위치로 이동시키는 바; 즉,
로 된다.
최종적으로 Rs의 계수가 단일성이 되도록 스케일하면
로 된다.
이것은 제 2 PMQ에 의한 실행을 위한 정확한 형태이다.
상기 예는 부호기에 의해 적용될 수 있는 다양한 전략들 중 하나를 보여준다. 더 간단한 전략은 전술된 바와 같이 m0를 계산하고 스케일링과는 달리 L1의 계수가 제로가 되도록 L0로부터 Ro까지의 비율 λ을 감함으로써 m1을 한정하는 전략이 있다. 이 같은 특정예에 있어서, 본래의 다운믹스 지정의 희박성은 λ=0으로 만족되는 이 같은 조건을 결과로 하는 바; 즉,
로 된다.
제 1계수의 제로값은, 제 2 PMQ를 계산할 때 제 1 PMQ의 효과를 고려할 필요성을 회피한다. 즉, m0는 어떠한 다른 변화를 취함이 없이 상기 방정식에서의 Lf로 대체될 수 있다. 전술된 바와 같이 스케일링 및 변경을 적용하면 다음을 얻을 수 있다. 즉,
이며,
이것은 제 2 PMQ에 의한 실행을 위한 정확한 형태로 된다.
비록 위와 같이 단순화된 절차가 직교성을 달성하지 못하더라도, 예컨대 Lo 및 Ro 자체가 거의 선형으로 유지되고 있다면, 거의 선형으로 유지되고 있는 m0 및 m1의 발생을 피할 수 있는 것이다. Lo 및 Ro가 실제로 선형으로 유지되는 가능성(즉, 상호 스케일된 버전)은 특정케이스에 대해 테스트되고 처리되어야 한다.
선택적으로, 더 진보된 부호기에 있어서, 위와 같은 직교성 상태는, 신호(m0, m1)의 교차성 상호관계가 거의 제로로 되는 상태로 교체될 수 있다. 이 상태는 λ의 적절한 선택에 의해 만족될 수 있다. 제로의 교차성 상호관계의 상태는 m1에서 에너지를 최소화하며, 주파수 의존이 없는 상태에서는 전달된 데이터양을 효과적으로 최소화시킬 수 있다. WO-A 96/37048에 설명된 바와 같이, 스펙트럼 변화의 존재에서의 데이터 양은 에너지 측면에서 보다 정보 내용측면에 더 의존하게 된다. 전형적인 오디오 신호에 대해서, 에너지 및 교차성 상호 관계가 큰 저주파수 신호들에 의해 좌우될 것인바, 이는 그들의 낮은 대역폭 때문에 적은 정보 내용을 지닌다. 따라서, 스펙트럼 웨이팅이 신호 자체에 교차성 상관관계를 계산하기 전에 전형적으로 고주파수를 강조할 것이다. 스펙트럼 웨이팅이 신호 자체에 적용되는 것이 이상적이지만, 최적의 또는 최적에 근접한 웨이팅을 결정하는 것이 복잡하게 되며, 실제로 고정된 웨이팅이면 충분할 것이다. 예컨대, Z-변형이 (1-Z-1)2인 디지털 필터는 오디오 밴드의 저주파수 부분 및 중간주파수 부분을 넘어 8개당 12dB로 올라가는 응답을 지닐 것이며, 이것은 큰 저주파수 신호에 의한 적합지 낳은 우세를 억압하는데 충분하게 될 것이다.
WO-A 96/37048에 있어서, 전달된 신호들에 대한 바람직한 방향은 매트릭스의 고유벡터로 되는 것으로 개시되어 있는 바, 그 매트릭스는 주파수 의존없이 신호들의 상호관계 매트릭스로 된다. 그 같은 선택은 전달된 신호들 사이에서 상관관계가 없도록 유도할 것이다. 그러나 고유벡터의 계산은 시간이 소요되며, 상관관계가 감산에 의해 간단하게 달성되는 전술된 바와 같은 절차는 고유벡터 계산으로부터 결과되는 이론적으로 작은 차이를 보이는 데이터 양을 유도한다.
전달된 신호들의 방향들을 선택하기 위한 절차들이 일반적으로 적용될 수 있는 바, 그 같은 절차는 다운믹스를 계산하지 않는 부호기, 또는 다운믹스가 획득될 때 존재하는 채널들의 프로세싱에 적용된다.
본 발명자는 전달된 채널들의 벡터 방향이 한번씩 선택되는 절차를 설명하고자 한다. 제 1입력 채널이 선택되면, 다른 채널들은 그로부터 감산되는 바, 이 때 감산 후 존재하는 신호에서 에너지를 최소화하도록 선택된 계수로 감산된다. 최초의 매트릭스 양자화기가 감산을 실행하여 출력신호를 제공한다. 또 다른 입력채널들이 선택되며, 다시 다른 채널들의 PMQ만큼 감산된다. PMQ는 다음 출력 신호를 제공하며 그곳에서 에너지를 최소화하도록 선택된 계수를 지닌다. 그 프로세스는 모든 입력 채널들이 처리될 때까지, 또는 모든 유용한 PMQS가 사용될 때까지, 또는 다른 매트릭스 변형을 적용할 필요가 없는 것으로 간주될 때까지 반복된다. PMQ로 수정되지 않는 어떤 다른 입력 채널들은 수정없이 출력부로 통과된다.
이 같은 절차 중 개선점은 어떠한 측정치의 엔트로피 또는 에너지를 최소화하는데 보다 간단하게 되는 신호의 정보내용을 최소화하도록 감산을 선택한다는 것이다. WO-A 96/37048에 있어서, 엔트로피는 스펙트럼의 알고리즘의 주파수를 넘어 적분을 취함으로써 산정되었으며, 또한 이 같은 방정식에 대해 각각의 최소값을 전체적으로 계산할 수 있게 되는 것이다. 스펙트럼 가중된 에너지의 최소화는 덜 계산적으로 강한 변형으로 될 것이며, 신호에 의존하여 적합한 스펙트럼 웨이팅을 계산하는 다양한 방식이 있다. 예컨대, Z-변형인 (1-Z-1)2를 지니는 디지털 필터에 의해 제공된 고정 주파수 웨이팅을 사용하는 것이 더 경제적이다.
수열 대수학 분야의 전문가들은 전술된 프로세스가 벡터들의 직교세트를 제공하도록 그램-쉬미트 직교이론의 사용과 유사하다는 점을 인식할 것이다. 분석에 의하면, 감산을 고려할 때 이전에 처리된 벡터들을 포함할 필요가 없는 것으로 고려되는바, 이것은 그들이 아직 처리되지 않은 벡터들에 대해 직교하는 구조로 있기 때문이다. 그러나, 이것은 다운믹스가 부호화된 때 일반적으로 참(true)으로 되지 않을 뿐 아니라, 최소화가 에너지보다 엔트로피에 관한 것을 때 이 또한 참으로 되지 않을 것이다. 따라서, 일반적으로, 각각의 PMQ는 이미 처리된 신호들과 아직 처리중인 입력채널 모두를 감할 것이다.
여기까지는 채널들의 수정을 위해 선택되는 순서가 임의의 상수로 되는 것이 고려의 대상이었다. 많은 경우에 있어, 그 순서는 최종 데이터 양에 작게 영향을 미칠 수 있지만, 이것은 감산에서 계수들의 사이즈에 실제적으로 영향을 미칠 수 있다. MLP가 그의 최대값에 대한 계수를 한정함으로써, 이 같은 고려는 중요하다. 최소화가 에너지로 되어나 또는 고정된 스펙트럼 웨이팅을 갖는 에너지로 된다면, 이것은 매우 빠르게 계산되며 전체적으로 시험원칙 상 임의의 선택을 이룰 수 있으며 또한 계수들이 너무 크면 그것을 거절하고 다른 것을 시도할 수 있을 것이다. 에너지 또는 스펙트럼 웨이트 에너지가 가장 작은 채널을 수정하기 위해 또 다른 발견이 선택된다.
PMQ가 도 8과 같이 실행된다면, 수정되는 채널에 대해 +1 또는 -1의 계수를 선택하는 것이 정상적일 것이다. 감산이 그 같은 과부하 신호들을 발생시킨다면, 계수는 감소될 수 있다. MLP에서 그것을 -0.5까지 정상적으로 감소될 것이라면, 계수는 감소될 수 있다. 이것은 부가적인 6dB의 헤드룸을 제공할 것인바, 이는 통상적으로 충분하게 될 것이다. 그렇지 않다면, 다양한 가능성이 존재한다. 현재 고려된 매트릭스 변형이 수정되거나 포기될수 있는바; 즉, 입력채널이 수정없이 전달 될 수 있다. 또는, 또 다른 PMQ가 유용하다면, 이것은 LSB 바이패스 작동을 위해 구성될 수 있으며 또한 헤드룸에서 또 다른 6dB 증가를 허용하는 조건하에 채널에 지정될 수 있다. 부가적인 PMQ는 감산을 실행하는 PMQ 이전에 적용될 것이다. 신호 진폭을 감소시키는데 단순하게 요구되는 부가적인 PMQ는 통상적으로 MLP에서 -0.5 계수를 수정되는 채널에 인가할 것이며 그렇지 않으면 제로 계수를 지닐 것이다.
2개 또는 단지 3개의 PMQ가 채널을 처리하는데 이용될 수 있는 특정 케이스는 다운믹스 지정이 실제적으로 동일한 진폭의 다양한 계수를 지니는 경우이다. 예컨대, 전술된 예에서 m0를 제공하는 PMQ가 단일성보다 적은 모든 계수들 지니더라도, 계수들의 절대적인 양의 합은 2.627이다. 따라서, m0를 제공하는 PMQ는 LSB 바이패스를 사용하여 채널을 0.5만큼 스케일하는 경우에도, 팩터 1.313의 단일 진폭의 증가 가능성이 여전히 존재한다. 이것은, 주어진 샘플 기간 중 입력의 채널들이 전체 모듈레이션을 동시에 달성하고 PMQ에서의 계수와 같은 사인을 각각 지니거나, 또는 각각 그것의 계수와 반대의 사인을 지닌다면 발생될 수 있다. m0를 제공하는 PMQ전에 LSB 바이패스를 실행하는 부가적인 PMQ로 지정함으로써 과부하가 회필될 수 있다.
명확성을 위해, 전술된 설명은 부호기에 의해 실행된 PMQ에 대해서만 설명하였다. 각각의 PMQ에 대해서도 이것이 사용될 수 있음을 이해할 것이며, 엠코더는 무손실 복호기에 의해 매트릭스 1에 사용될 상응하는 PMQ를 지정해야 하며, 또한 복호기의 PMQ는 역순으로 적용되어야 함을 이해할 수 있을 것이다. LSB 바이패스의 경우에 있어서, -0.5의 계수를 수정되는 채널에 적용하는 부호기 PMQ는 그 채널에 -2.0의 계수를 적용하는 복호기 PMQ를 포함한다. 다운믹스 경우에 있어서, 부호기는 m0 및 m1을 위해 만들어진 선택에 의존하여 매트릭스 0에 대한 계수들을 지정해야 한다. 더욱이, 채널이 스케일 된다면, 스케일링 인자는 채널을 증가시킬 연속적인 다운믹스 계수를 계산하는 중에 참작되어야 한다.
혼합된 양의 콘텐트의 부호화
DVD-오디오 스페시피케이션은 2개의 샘플링 주파수를 사용하여 디스크에서 레코딩이 수행되게 한다. 예컨대, 전방 채널(Lf, Rf)은 96kHz의 샘플링 양으로 부호화 될 수 있다. 그러나, 제 1 서브스트림에서의 다운믹스 정보의 동시적 전송의 처리 설명은 채널들이 모두 동시적으로 샘플되거나 특히 동일한 샘플링 량으로 샘플화됨을 추정한다.
1997년 3월 제이. 오디오 이앤지. 에쓰오씨에서 피. 지. 크래븐, 엠. 제이. 알. 과 스튜어트에 의해 발표된 논문 ‘아이아이알 프리익션 필터를 사용하는 무손실 압축’이라는 제목의 논문집 4415호 제 45권 제 15번 404페이지의 서문은 무손실 압축을 사용할 때 데이터를 세이브 하기 위해 샘플링 양을 감소시킬 필요가 없음을 설명하고 있다. 이것은 신호의 대역폭을 충분히 한정할 수 있는바, 이것은 무손실 부호기가 신호의 정보 내용의 감소에 자동적으로 응답하여 낮은 비트량으로 부호화할 것이기 때문이다.
업샘플화된 신호는 제한된 대역폭을 고유적으로 지닌다. 예컨대, 96kHz 샘플된 신호는 거의 48kHz까지 주파수를 재생할 능력을 지니지만, 그같은 신호는 48kHz로 샘플된 신호를 업샘플링(upsampling)함으로써 유도된다면 24kHz 이상에서 매우 적은 에너지를 지닐 것이다. 따라서, 무손실 압축이 ‘혼합된 양’재료에 사용될 때, 데이터량에 역효과를 현저하게 미침이 없이, 모든 채널들이 예컨대 96KHz의 동일한 샘플링양으로 부호화되도록 부호화 되기 전에 예컨대 48kHz의 낮은 양으로 제공되는 모든 채널을 ‘업샘플’할 수 있다. ‘업샘플링’은 디지털 신호 프로세싱 논문에서 ‘보간(interpolation)’으로 알려져 있으며, 이것을 수행하기 위한 기술이 널리 공지되어 있다. 도 10은 이 같은 특징을 포함하는데 적용된 부호기를 보여준다. 필터링이 지연을 수반한다면, 업샘플링이 필요하지 않은 채널(Lf, Rf)은 보상 지연을 부여한다.
보간 필터링이 일반적으로 무손실이 아니지만, 바람직한 실시예에서 도 10의 ‘업샘플’필터들은 ‘절반 대역 필터’로 공지된 형태로 된다. 보간을 위해 절반 대역 필터가 사용된다면, 그 필터는 입력 샘플링 지점들로써 많은 샘플링 지점들을 2배로 하여 출력을 제공한다. 짝수로 된 출력지점들은 입력지점들에 상응하고 입력값들과 동일한 샘플 값들을 포함하는 반면, 홀수로 된 출력지점들은 입력 값들 사이에 절반이 놓여 있고 보간된 값을 포함한다.
스트림이 이 같은 방식으로 부호화 되면, 플레이어는 2개의 선택권을 갖는다. 모든 채널들의 96kHz로 본래 샘플화 되었더라도 스트림을 플레이 시킬 수 있으며, 이에 따라 짝수 샘플과 홀수 샘플의 다른 출처를 무시할 수 있다. 선택적으로, 플레이어는 48kHz로 부호기에 본래 제공된 채널들의 경우에 짝수 샘플들만 선택할 수 있다. 이 경우에 있어서, 플레이어는 부호기에 부여된 혼합종의 콘텐트의 무손실 재구성을 액세스 할 수 있다. 이것을 가능하게 하기 위해 부호화 스트림은 채널들의 낮은 샘플링양으로 본래 제공된 스페시픽케이션을 포함해야 하며, 또한 샘플들이 ‘짝수’로 간주되고 ‘홀수’로 간주되는 표시를 포함해야 한다. 후자는, 블록내의 샘플의 개수가 항상 짝수인 블록구조를 스트림이 포함한다면 절대적일 수 있다. DVD-오디오에서, ‘액세스 유닛’ 및 ‘프리젠테이션 유닛’의 사용은 그 같은 구조를 제공한다.
DVD-오디오 스페시픽케이션은 혼합양의 콘텐트에 대해 88.2kHz 및 44.1kHz로 유사하게 제공한다. 전술된 혼합양의 코딩 특징은 또한 동일 방식으로 이 경우에 적용될 수 있다.
실 행
본 발명의 다양한 개념들을 실시하는데 필요한 이 기능들은, 불연속 논리 성분, 하나 이상의 ASIC 및/또는 프로그램 제어되는 프로세서들을 포함하는 광범위한 방식으로 실행되는 구성요소들에 의해 수행될 수 있다. 이 같은 구성요소들이 실행되는 방법은 임계적이 아니다. 예컨대, 발명의 이 같은 개념들을 실시하는데 필요한 작동들이 하나의 장치에 의해 실행 될 수 있는바, 이 장치는 디지털 정보를 제공하는 신호를 수신 및 전송하기 위한 하나이상의 터미널, 디지털 정보를 저장하기 위한 램(random access memory), 하나 이상의 명령 프로그램을 기록하기 위한 매체, 및 명령 프로그램을 실행시키기 위한 프로세서를 포함한다. 명령 프로그램들은, 다양한 형태의 롬(reed only memory), 자기 테이프, 자기 디스크, 광디스크를 포함하는 제품 또는 다양한 기계 판독성 매체에 의해 기록되거나, 또는 초음파부터 자외선 주파수까지 스펙트럼을 통한 기본 대역 또는 모듈레이트된 통신경로에 의해 이송될 수 있다.
부호화 및 복호화 프로세스 및 장치의 다양한 특징들이 설명되었다. 이 같은 특징들이 분리적으로 실행될 수 있는 곳에서, 이 같은 특징들에 의해 제공된 다른 장점들로부터 이익을 획득하기 위해, 이 같은 특징들은 어떤 결합체로 함께 결합되는 것으로 구현될 수 있는 것으로 이해된다. 청구범위는 다양한 특징들을 독립적으로 한정하는 반면, 모든 청구항들의 특징들은 상호 결합될 수 있으며 본 명세서는 그같은 모든 결합들을 포함하는 것으로 의도된다.

Claims (63)

  1. N 개의 입력 채널 신호들을 획득하는 단계;
    N 개의 매트릭스 출력 채널 신호들을 제공하기 위하여 캐스케이드형 원시 매트릭스 양자화기들로서 구현된 매트릭스에 의해 상기 입력 채널 신호들을 변형하는 단계; 및
    상기 입력 채널 신호들로부터 도출된 채널 순위 정보(ordering information)에 응답하여, 상기 매트릭스 출력 채널 신호들에 반응하는 N 개의 복호화 출력 채널 신호들에 순서를 매기는 단계;
    를 포함하는 복호화 방법.
  2. 제 1 항에 있어서, 상기 순서 매김 단계는 상기 변형 단계 이후에 실행되는 복호화 방법.
  3. 제 1 항에 있어서, 상기 순서 매김 단계는 상기 변형 단계 이전에 실행되는 복호화 방법.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서, 상기 입력 채널 신호들은 좌측-전방, 우측-전방, 좌측-주변, 우측-주변, 중앙 및 저주파수 효과 채널 신호들의 6 채널 오디오 시스템을 나타내는 복호화 방법.
  5. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서, 상기 캐스케이드형 원시 매트릭스 양자화기들에서 원시 매트릭스 양자화기들 중 하나는 상기 입력 채널 신호들 중 하나에 반응하는 제 1 채널 신호를 처리하는 제 1 원시 매트릭스 양자화기이며, 상기 방법은:
    상기 제 1 원시 매트릭스 양자화기 내의 제 1 채널 신호를 상기 입력 채널 신호들로부터 획득된 이득 계수로 승산하는 단계; 및
    상기 승산된 제 1 채널 신호를 상기 입력 채널 신호들로부터 획득된 하나 이상의 최하위 비트와 결합하는 단계;
    를 포함하는 복호화 방법.
  6. N 개의 입력 채널 신호들을 획득하는 단계;
    N 개의 매트릭스 출력 채널 신호들을 제공하기 위해, 캐스케이드형 원시 매트릭스 양자화기들로서 구현된 매트릭스에 의해 상기 입력 채널 신호들을 변형하는 단계;
    채널 순위 정보에 응답하여, 상기 매트릭스 출력 채널 신호들에 반응하는 N 개의 부호화 출력 채널 신호들에 순서를 매기는 단계; 및
    상기 부호화 출력 채널 신호들과 상기 채널 순위 정보를 나타내는 정보를 전달하는 복수의 서브스트림들을 발생시키는 단계;를 포함하며,
    제 1 서브스트림이 상기 매트릭스 출력 채널 신호들의 절대 부집합을 나타내고 다운믹스 스페시픽케이션(specification)을 포함하는 부호화 방법.
  7. 제 6 항에 있어서, 상기 다운믹스 스페시픽케이션으로부터 상기 채널 순위 정보를 도출하는 부호화 방법.
  8. 제 7 항에 있어서, 상기 채널 순위 정보를 도출하여 상기 다운믹스 스페시픽케이션에서 최대 계수를 갖는 채널 신호가 제 1 서브스트림에서 나타내어지는 제 1 채널 신호가 되도록 순서가 매겨지는 부호화 방법.
  9. 제 6 항 내지 제 8 항 중 어느 한 항에 있어서, 복수의 서브스트림들에서 제 2 서브스트림에서 나타내어지는 채널 신호를 수정하기 위하여 캐스케이드형 원시 매트릭스 양자화기들 내의 원시 매트릭스 양자화기를 적용하여 제 2 서브스트림이 무손실로 압축되는 부호화 방법.
  10. 제 6 항 내지 제 8 항 중 어느 한 항에 있어서, 상기 캐스케이드형 원시 매트릭스 양자화기들에서 원시 매트릭스 양자화기들 중 하나가 상기 입력 채널 신호들 중 하나에 반응하는 제 1 채널 신호를 처리하는 제 1 원시 매트릭스 양자화기이며, 상기 방법은:
    상기 제 1 원시 매트릭스 양자화기 내의 제 1 채널 신호를 이득 계수로 승산하는 단계; 및
    상기 제 1 채널 신호의 승산으로부터 야기하는 제 1 채널에 할당되는 다수의 비트들을 초과하는 하나 이상의 최하위 비트들과 이득 계수를 포함하도록 복수의 서브스트림들을 발생시키는 단계;
    를 포함하는 부호화 방법.
  11. N 개의 입력 채널 신호들을 획득하는 단계;
    N 개의 매트릭스 출력 채널 신호들을 제공하기 위하여 캐스케이드형 원시 매트릭스 양자화기들로서 구현된 매트릭스에 의해 상기 입력 채널 신호들을 변형하는 단계; 및
    상기 입력 채널 신호들로부터 도출된 채널 순위 정보에 응답하여, 상기 매트릭스 출력 채널 신호들에 반응하는 N 개의 복호화 출력 채널 신호들에 순서를 매기는 단계;
    를 포함하는 방법을 수행하도록 기계에 의한 수행을 위한 프로그램 명령들을 지닌 기계에 의해 판독되는 컴퓨터 판독가능한 저장 매체.
  12. 제 11 항에 있어서, 상기 순서 매김 단계는 상기 변형 단계 이후에 실행되는 컴퓨터 판독가능한 저장 매체.
  13. 제 11 항에 있어서, 상기 순서 매김 단계는 상기 변형 단계 이전에 실행되는 컴퓨터 판독가능한 저장 매체.
  14. 제 11 항 내지 제 13 항 중 어느 한 항에 있어서, 상기 입력 채널 신호들은 좌측-전방, 우측-전방, 좌측-주변, 우측-주변, 중앙 및 저주파수 효과 채널 신호들의 6 채널 오디오 시스템을 나타내는 컴퓨터 판독가능한 저장 매체.
  15. 제 11 항 내지 제 13 항 중 어느 한 항에 있어서, 캐스케이드형 원시 매트릭스 양자화기들에서 원시 매트릭스 양자화기들 중 하나는 상기 입력 채널 신호들 중 하나에 반응하는 제 1 채널 신호를 처리하는 제 1 원시 매트릭스 양자화기이며, 상기 방법은:
    상기 제 1 원시 매트릭스 양자화기 내의 제 1 채널 신호를 상기 입력 채널 신호들로부터 획득된 이득 계수로 승산하는 단계; 및
    상기 승산된 제 1 채널 신호를 상기 입력 채널 신호들로부터 획득된 하나 이상의 최하위 비트와 결합하는 단계;
    를 포함하는 컴퓨터 판독가능한 저장 매체.
  16. N 개의 입력 채널 신호들을 획득하는 단계;
    N 개의 매트릭스 출력 채널 신호들을 제공하기 위하여 캐스케이드형 원시 매트릭스 양자화기들로서 구현된 매트릭스에 의해 상기 입력 채널 신호들을 변형하는 단계;
    채널 순위 정보에 응답하여, 상기 매트릭스 출력 채널 신호들에 반응하는 N 개의 부호화 출력 채널 신호들에 순서를 매기는 단계; 및
    상기 부호화 출력 채널 신호들과 채널 순위 정보를 나타내는 정보를 전달하는 복수의 서브스트림을 발생시키는 단계;를 포함하며,
    제 1 서브스트림이 상기 매트릭스 출력 채널 신호들의 절대 부집합을 나타내며 다운믹스 스페시픽케이션을 포함하는, 방법을 수행하는 기계에 의한 실행을 위한 프로그램 명령을 지닌 기계에 의해 판독되는 컴퓨터 판독가능한 저장 매체.
  17. 제 16 항에 있어서, 상기 방법은 상기 다운믹스 스페시픽케이션으로부터 채널 순위 정보를 도출하는 컴퓨터 판독가능한 저장 매체.
  18. 제 17 항에 있어서, 상기 방법은 상기 채널 순위 정보를 도출하여 상기 다운믹스 스페시픽케이션에서 최대 계수를 갖는 채널 신호가 제 1 서브스트림에서 나타내어지는 제 1 채널 신호가 되도록 순서가 매겨지는 컴퓨터 판독가능한 저장 매체.
  19. 제 16 항 내지 제 18 항 중 어느 한 항에 있어서, 상기 방법은 복수의 서브스트림들의 제 2 서브스트림에서 나타내어지는 채널 신호를 수정하기 위하여 캐스케이드형 원시 매트릭스 양자화기들 내의 원시 매트릭스 양자화기를 적용하여 제 2 서브스트림이 무손실로 압축되는 컴퓨터 판독가능한 저장 매체.
  20. 제 16 항 내지 제 18 항 중 어느 한 항에 있어서, 캐스케이드형 원시 매트릭스 양자화기들에서 원시 매트릭스 양자화기들 중 하나가 상기 입력 채널 신호들 중 하나에 반응하는 제 1 채널 신호를 처리하는 제 1 원시 매트릭스 양자화기이며, 상기 방법은:
    상기 제 1 원시 매트릭스 양자화기 내의 제 1 채널 신호를 이득 계수로 승산하는 단계; 및
    상기 제 1 채널 신호의 승산으로부터 야기하는 제 1 채널에 할당되는 다수의 비트들을 초과하는 하나 이상의 최하위 비트들과 이득 계수를 포함하도록 복수의 서브스트림들을 발생시키는 단계;
    를 포함하는 컴퓨터 판독가능한 저장 매체.
  21. N 개의 입력 채널 신호들을 획득하는 단계;
    N 개의 매트릭스 출력 채널 신호들을 제공하기 위하여 캐스케이드형 원시 매트릭스 양자화기들로서 구현된 매트릭스에 의해 상기 입력 채널 신호들을 변형하는 단계; 및
    상기 입력 채널 신호들로부터 도출된 채널 순위 정보에 응답하여, 상기 매트릭스 출력 채널 신호들에 반응하는 N 개의 복호화 출력 채널 신호들에 순서를 매기는 단계;
    를 포함하는 복호화 방법을 수행하는 회로를 포함하는 장치.
  22. 제 21 항에 있어서, 상기 순서 매김 단계는 상기 변형 단계 이후에 수행되는 장치.
  23. 제 21 항에 있어서, 상기 순서 매김 단계는 상기 변형 단계 이전에 수행되는 장치.
  24. 제 21 항 내지 제 23 항 중 어느 한 항에 있어서, 상기 입력 채널 신호들은 좌측-전방, 우측-전방, 좌측-주변, 우측-주변, 중앙 및 저주파수 효과 채널 신호들의 6 채널 오디오 시스템을 나타내는 장치.
  25. 제 21 항 내지 제 23 항 중 어느 한 항에 있어서, 캐스케이드형 원시 매트릭스 양자화기들에서 원시 매트릭스 양자화기들 중 하나는 상기 입력 채널 신호들 중 하나에 반응하는 제 1 채널 신호를 처리하는 제 1 원시 매트릭스 양자화기이며, 상기 방법은:
    상기 제 1 원시 매트릭스 양자화기 내의 제 1 채널 신호를 상기 입력 채널 신호들로부터 획득된 이득 계수로 승산하는 단계; 및
    상기 승산된 제 1 채널 신호를 상기 입력 채널 신호들로부터 획득된 하나 이상의 최하위 비트와 결합하는 단계;
    를 포함하는 장치.
  26. N 개의 입력 채널 신호들을 획득하는 단계;
    N 개의 매트릭스 출력 채널 신호들을 제공하기 위하여 캐스케이드형 원시 매트릭스 양자화기들로서 구현된 매트릭스에 의해 상기 채널 신호들을 변형하는 단계;
    채널 순위 정보에 응답하여, 상기 매트릭스 출력 채널 신호들에 반응하는 N 개의 부호화 출력 채널 신호들에 순서를 매기는 단계; 및
    상기 부호화 출력 채널 신호들과 채널 순위 정보를 나타내는 정보를 전달하는 복수의 서브스트림을 발생시키는 단계;를 포함하며,
    제 1 서브스트림이 상기 매트릭스 출력 채널 신호들의 절대 부집합을 나타내며 다운믹스 스페시픽케이션을 포함하는 부호화 방법을 수행하는 회로를 포함하는 장치.
  27. 제 26 항에 있어서, 상기 방법은 상기 다운믹스 스페시픽케이션으로부터 채널 순위 정보를 도출하는 장치.
  28. 제 27 항에 있어서, 상기 방법은 상기 채널 순위 정보를 도출하여 상기 다운믹스 스페시픽케이션에서 최대 계수를 갖는 채널 신호가 제 1 서브스트림에서 나타내어지는 제 1 채널 신호가 되도록 순서가 매겨지는 장치.
  29. 제 26 항 내지 제 28 항 중 어느 한 항에 있어서, 상기 방법은 복수의 서브스트림들에서 제 2 서브스트림에서 나타내어지는 채널 신호를 수정하기 위하여 캐스케이드형 원시 매트릭스 양자화기들 내의 원시 매트릭스 양자화기를 적용하여 제 2 서브스트림이 무손실로 압축되는 장치.
  30. 제 26 항 내지 제 28 항 중 어느 한 항에 있어서, 캐스케이드형 원시 매트릭스 양자화기들에서 원시 매트릭스 양자화기들 중 하나가 상기 입력 채널 신호들 중 하나에 반응하는 제 1 채널 신호를 처리하는 제 1 원시 매트릭스 양자화기이며, 상기 방법은:
    상기 제 1 원시 매트릭스 양자화기 내의 제 1 채널 신호를 이득 계수로 승산하는 단계; 및
    상기 제 1 채널 신호의 승산으로부터 야기하는 제 1 채널에 할당되는 다수의 비트들을 초과하는 하나 이상의 최하위 비트들과 이득 계수를 포함하도록 복수의 서브스트림들을 발생시키는 단계;
    를 포함하는 장치.
  31. 복수의 매트릭스 출력 채널 신호들을 갖는 매트릭스 변형에 의해 부호화된 복수의 채널 신호들을 나타내는 복수의 서브스트림으로 포맷된 정보를 지닌 기계에 의해 판독되는 컴퓨터 판독가능한 저장 매체로서, 복수의 서브스트림에서 제 1 서브스트림은 상기 매트릭스 출력 채널 신호들의 절대 부집합을 나타내며 다운믹스 스페시픽케이션을 포함하고, 상기 매체에 포함된 정보는 복수의 서브스트림에서 나타내어지는 채널 신호들의 순서를 전달하는 정보를 더 포함하는, 컴퓨터 판독가능한 저장 매체.
  32. 제 31 항에 있어서, 상기 매체에 전달되는 정보는 이득 계수, 상기 이득 계수에 의해 승산하여 지는 제 1 채널 신호의 정보, 및 제 1 채널에 할당되는 다수의 비트들을 초과하는 승산된 제 1 채널 신호로부터 야기하는 제 1 채널 신호의 하나 이상의 최하위 비트들을 더 포함하는 컴퓨터 판독가능한 저장 매체.
  33. 부호기에 있어서,
    다중 채널 디지털 신호와 다운믹스 스페시픽케이션을 위한 입력단; 및
    캐스케이드형 원시 매트릭스 양자화기들로서 구현되며, 복수의 서브스트림들로 포맷된 부호화 정보 스트림을 공급하는 매트릭스;를 포함하며,
    제1 서브스트림 내의 데이터는 상기 매트릭스의 출력들의 절대 부집합으로부터 취해지고 상기 다운믹스 스페시픽케이션의 구현을 위한 충분한 정보를 포함하며,
    상기 매트릭스는,
    제1 원시 매트릭스의 출력이 실질적으로 스케일링 인자로 승산된 상기 제1 다운믹스 채널이 되도록, 제1 다운믹스 채널을 위한 스페시픽케이션에 관하여 산출된 항목들을 갖는 제1 원시 매트릭스; 및
    상기 제1 원시 매트릭스의 출력과 승산되는 계수가 실질적으로 제로가 되도록 산출된 항목들을 갖는 제2 원시 매트릭스를 구비하는 것을 특징으로 하는 부호기.
  34. 제33항에 있어서, 상기 제1 원시 매트릭스는 제1 다운믹스 채널을 위한 스페시픽케이션 내에서 실질적으로 최대 계수를 갖는 입력 채널을 변경하는 것을 특징으로 하는 부호기.
  35. 부호기에 있어서,
    다중 채널 디지털 신호와 다운믹스 스페시픽케이션을 위한 입력단; 및
    캐스케이드형 원시 매트릭스 양자화기들로서 구현되고, 복수의 서브스트림들로 포맷된 부호화 정보 스트림을 공급하는 매트릭스;를 포함하며,
    제1 서브스트림 내의 데이터는 상기 매트릭스의 출력들의 절대 부집합으로부터 취해지고 상기 다운믹스 스페시픽케이션의 구현을 위한 충분한 정보를 포함하며, 상기 다중 채널 디지털 신호의 채널들에 관련하여 상기 제1 서브스트림에 전송된 채널들을 규정하는 상기 매트릭스는 서로에 대해 실질적으로 직교하는 열들을 갖는 것을 특징으로 하는 부호기.
  36. 부호기에 있어서,
    다중 채널 디지털 신호와 다운믹스 스페시픽케이션을 위한 입력단; 및
    캐스케이드형 원시 매트릭스 양자화기들로서 구현되고, 복수의 서브스트림들로 포맷된 부호화 정보 스트림을 공급하는 매트릭스;를 포함하며,
    제1 서브스트림 내의 데이터는 상기 매트릭스의 출력들의 절대 부집합으로부터 취해지고 상기 다운믹스 스페시픽케이션의 구현을 위한 충분한 정보를 포함하며, 상기 제1 서브스트림의 전송된 채널들 간의 상호상관(cross-correlation)은 실질적으로 제로인 것을 특징으로 하는 부호기.
  37. 제36항에 있어서, 상기 상호상관은 전송되는 데이터율에 실질적으로 기여하는 주파수 대역들을 강조하는 스펙트럼 웨이팅에 부여되는 것을 특징으로 하는 부호기.
  38. 제37항에 있어서, 상기 상호상관은 디지털 필터(1-z-1)n(여기서 n=1, 2 또는 3)에 의해 정의되는 것처럼 실질적으로 스펙트럼 웨이팅에 부여되는 것을 특징으로 하는 부호기.
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
  61. 삭제
  62. 삭제
  63. 삭제
KR1020017012853A 1999-04-07 2000-04-07 다중-채널 오디오 신호들을 무손실 부호화 및 복호화하기 위한 장치 및 방법 KR100915120B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
GB9907919.6 1999-04-07
GBGB9907919.6A GB9907919D0 (en) 1999-04-07 1999-04-07 Lossless packing
GB9907918.8 1999-04-07
GBGB9907918.8A GB9907918D0 (en) 1999-04-07 1999-04-07 Lossless packing

Publications (2)

Publication Number Publication Date
KR20010113782A KR20010113782A (ko) 2001-12-28
KR100915120B1 true KR100915120B1 (ko) 2009-09-03

Family

ID=26315389

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020017012853A KR100915120B1 (ko) 1999-04-07 2000-04-07 다중-채널 오디오 신호들을 무손실 부호화 및 복호화하기 위한 장치 및 방법

Country Status (15)

Country Link
US (3) US6611212B1 (ko)
EP (4) EP2391146A3 (ko)
JP (1) JP4610087B2 (ko)
KR (1) KR100915120B1 (ko)
AR (1) AR023424A1 (ko)
AT (1) ATE255785T1 (ko)
AU (1) AU781629B2 (ko)
CA (3) CA2859333A1 (ko)
DE (1) DE60006953T2 (ko)
DK (1) DK1173925T3 (ko)
ES (1) ES2208297T3 (ko)
MY (2) MY123651A (ko)
SG (2) SG144695A1 (ko)
TW (1) TWI226041B (ko)
WO (1) WO2000060746A2 (ko)

Families Citing this family (114)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001314181A (ja) * 2000-05-10 2001-11-13 Mi Tec:Kk キレート化合物含有酒類
SE0001727L (sv) * 2000-05-10 2001-11-11 Global Ip Sound Ab Överföring över paketförmedlade nät
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US20020191522A1 (en) * 2001-05-07 2002-12-19 Media Tek, Inc. DVD audio encoder and decoder
US6804565B2 (en) * 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
US7447321B2 (en) 2001-05-07 2008-11-04 Harman International Industries, Incorporated Sound processing system for configuration of audio signals in a vehicle
US7451006B2 (en) * 2001-05-07 2008-11-11 Harman International Industries, Incorporated Sound processing system using distortion limiting techniques
CN100364234C (zh) * 2001-11-29 2008-01-23 联发科技股份有限公司 声讯的播放***与无失真压缩编码***
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
CA2773294C (en) * 2002-05-03 2013-03-12 Harman International Industries, Incorporated Sound detection and localization system
US6935959B2 (en) * 2002-05-16 2005-08-30 Microsoft Corporation Use of multiple player real-time voice communications on a gaming device
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
ES2309486T3 (es) * 2003-11-27 2008-12-16 Yul Anderson Metodo y auricular tubular vsr.
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP2005215162A (ja) * 2004-01-28 2005-08-11 Dainippon Printing Co Ltd 音響信号の再生装置
DE102004009628A1 (de) * 2004-02-27 2005-10-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD
DE602005005640T2 (de) 2004-03-01 2009-05-14 Dolby Laboratories Licensing Corp., San Francisco Mehrkanalige audiocodierung
JP4938648B2 (ja) * 2004-04-05 2012-05-23 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネル・エンコーダ
US8032360B2 (en) * 2004-05-13 2011-10-04 Broadcom Corporation System and method for high-quality variable speed playback of audio-visual media
KR100918741B1 (ko) * 2004-07-27 2009-09-24 삼성전자주식회사 이동 통신 시스템에서 채널 부호화 장치 및 방법
US7706415B2 (en) * 2004-07-29 2010-04-27 Microsoft Corporation Packet multiplexing multi-channel audio
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
KR101183859B1 (ko) * 2004-11-04 2012-09-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 다중채널 오디오 신호들의 인코딩 및 디코딩
EP1817767B1 (en) * 2004-11-30 2015-11-11 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
DE102005014477A1 (de) * 2005-03-30 2006-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung
ATE473502T1 (de) 2005-03-30 2010-07-15 Koninkl Philips Electronics Nv Mehrkanal-audiocodierung
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
WO2006126856A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
US7958424B2 (en) * 2005-06-22 2011-06-07 Trident Microsystems (Far East) Ltd. Multi-channel LDPC decoder architecture
EP1946294A2 (en) 2005-06-30 2008-07-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8494667B2 (en) * 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
MX2008000122A (es) 2005-06-30 2008-03-18 Lg Electronics Inc Metodo y aparato para codificar y descodificar una senal de audio.
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
KR100880642B1 (ko) * 2005-08-30 2009-01-30 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
US8577483B2 (en) * 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
EP1922722A4 (en) 2005-08-30 2011-03-30 Lg Electronics Inc METHOD FOR DECODING A SOUND SIGNAL
JP5108768B2 (ja) * 2005-08-30 2012-12-26 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
US7770090B1 (en) 2005-09-14 2010-08-03 Trident Microsystems (Far East) Ltd. Efficient decoders for LDPC codes
CN102663975B (zh) * 2005-10-03 2014-12-24 夏普株式会社 显示装置
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
WO2007040363A1 (en) * 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
KR100857111B1 (ko) 2005-10-05 2008-09-08 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US8068569B2 (en) * 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
CN101278598B (zh) * 2005-10-07 2011-05-25 松下电器产业株式会社 音频信号处理装置以及音频信号处理方法
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
US20080262853A1 (en) * 2005-10-20 2008-10-23 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
US7840401B2 (en) 2005-10-24 2010-11-23 Lg Electronics Inc. Removing time delays in signal paths
EP1946310A4 (en) 2005-10-26 2011-03-09 Lg Electronics Inc METHOD FOR CODING AND DECODING A MULTI CHANNEL AUDIO SIGNAL AND DEVICE THEREFOR
EP1974348B1 (en) * 2006-01-19 2013-07-24 LG Electronics, Inc. Method and apparatus for processing a media signal
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US9306852B2 (en) * 2006-01-27 2016-04-05 Avaya Inc. Coding and packet distribution for alternative network paths in telecommunications networks
KR20080093024A (ko) * 2006-02-07 2008-10-17 엘지전자 주식회사 부호화/복호화 장치 및 방법
US7907579B2 (en) * 2006-08-15 2011-03-15 Cisco Technology, Inc. WiFi geolocation from carrier-managed system geolocation of a dual mode device
BRPI0715312B1 (pt) 2006-10-16 2021-05-04 Koninklijke Philips Electrnics N. V. Aparelhagem e método para transformação de parâmetros multicanais
MY145497A (en) 2006-10-16 2012-02-29 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
US20080175137A1 (en) * 2007-01-23 2008-07-24 Mediatek Inc. Method for encoding data written to optical storage media
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
WO2009049895A1 (en) * 2007-10-17 2009-04-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding using downmix
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101158096B1 (ko) * 2008-11-18 2012-06-22 삼성전자주식회사 다중 송수신 안테나 시스템에서 서로 다른 변조 차수를 갖는 복수의 레이어의 재정렬 방법, 신호 검출 방법 및 그 수신 장치
GB2466671B (en) 2009-01-06 2013-03-27 Skype Speech encoding
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
TWI463485B (zh) 2009-09-29 2014-12-01 Fraunhofer Ges Forschung 音訊信號解碼器或編碼器、用以提供上混信號表示型態或位元串流表示型態之方法、電腦程式及機器可存取媒體
US9305550B2 (en) * 2009-12-07 2016-04-05 J. Carl Cooper Dialogue detector and correction
US9138178B2 (en) * 2010-08-05 2015-09-22 Ace Communications Limited Method and system for self-managed sound enhancement
KR101756838B1 (ko) * 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
EP2695161B1 (en) 2011-04-08 2014-12-17 Dolby Laboratories Licensing Corporation Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams
CN104025190B (zh) 2011-10-21 2017-06-09 三星电子株式会社 能量无损编码方法和设备、音频编码方法和设备、能量无损解码方法和设备、以及音频解码方法和设备
GB2524424B (en) 2011-10-24 2016-04-27 Graham Craven Peter Lossless buried data
JP5930441B2 (ja) * 2012-02-14 2016-06-08 ホアウェイ・テクノロジーズ・カンパニー・リミテッド マルチチャネルオーディオ信号の適応ダウン及びアップミキシングを実行するための方法及び装置
ITTO20120274A1 (it) * 2012-03-27 2013-09-28 Inst Rundfunktechnik Gmbh Dispositivo per il missaggio di almeno due segnali audio.
TWI505262B (zh) 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
US9622014B2 (en) 2012-06-19 2017-04-11 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
EP2873073A1 (en) * 2012-07-12 2015-05-20 Dolby Laboratories Licensing Corporation Embedding data in stereo audio using saturation parameter modulation
CA2880891C (en) * 2012-08-03 2017-10-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Decoder and method for multi-instance spatial-audio-object-coding employing a parametric concept for multichannel downmix/upmix cases
US9373335B2 (en) 2012-08-31 2016-06-21 Dolby Laboratories Licensing Corporation Processing audio objects in principal and supplementary encoded audio signals
US20140229395A1 (en) 2013-02-14 2014-08-14 Howard M. Singer Methods, systems, and media for indicating digital media content quality to a user
CN110085240B (zh) 2013-05-24 2023-05-23 杜比国际公司 包括音频对象的音频场景的高效编码
TWI557724B (zh) * 2013-09-27 2016-11-11 杜比實驗室特許公司 用於將 n 聲道音頻節目編碼之方法、用於恢復 n 聲道音頻節目的 m 個聲道之方法、被配置成將 n 聲道音頻節目編碼之音頻編碼器及被配置成執行 n 聲道音頻節目的恢復之解碼器
EP2854133A1 (en) * 2013-09-27 2015-04-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generation of a downmix signal
US9794712B2 (en) 2014-04-25 2017-10-17 Dolby Laboratories Licensing Corporation Matrix decomposition for rendering adaptive audio using high definition audio codecs
US10068577B2 (en) * 2014-04-25 2018-09-04 Dolby Laboratories Licensing Corporation Audio segmentation based on spatial metadata
WO2016050900A1 (en) * 2014-10-03 2016-04-07 Dolby International Ab Smart access to personalized audio
US10176813B2 (en) 2015-04-17 2019-01-08 Dolby Laboratories Licensing Corporation Audio encoding and rendering with discontinuity compensation
TWI596955B (zh) * 2015-07-09 2017-08-21 元鼎音訊股份有限公司 具有測試功能之助聽器
WO2017019674A1 (en) 2015-07-28 2017-02-02 Dolby Laboratories Licensing Corporation Audio discontinuity detection and correction
GB2547877B (en) * 2015-12-21 2019-08-14 Graham Craven Peter Lossless bandsplitting and bandjoining using allpass filters
US10146500B2 (en) * 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
KR102291811B1 (ko) * 2016-11-08 2021-08-23 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 사이드 이득 및 잔여 이득을 사용하여 멀티채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
US10522155B2 (en) 2017-02-21 2019-12-31 Cirrus Logic, Inc. Pulse code modulation (PCM) data-marking
TWI739297B (zh) * 2020-02-06 2021-09-11 瑞昱半導體股份有限公司 音訊處理裝置及音訊處理方法
WO2023191796A1 (en) * 2022-03-31 2023-10-05 Zeku, Inc. Apparatus and method for data compression and data upsampling
GB2624686A (en) * 2022-11-25 2024-05-29 Lenbrook Industries Ltd Improvements to audio coding

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0631458A1 (en) * 1993-06-22 1994-12-28 Deutsche Thomson-Brandt Gmbh Method for obtaining a multi-channel decoder matrix
WO1996037048A2 (en) * 1995-05-15 1996-11-21 GERZON, Peter, Herbert Lossless coding method for waveform data
US5623424A (en) * 1995-05-08 1997-04-22 Kabushiki Kaisha Toshiba Rate-controlled digital video editing method and system which controls bit allocation of a video encoder by varying quantization levels
EP0784409A2 (en) * 1996-01-11 1997-07-16 Sony Corporation Video coding and multiplexing
US5684714A (en) * 1995-05-08 1997-11-04 Kabushiki Kaisha Toshiba Method and system for a user to manually alter the quality of a previously encoded video sequence
US5715187A (en) * 1996-03-04 1998-02-03 Holtek Microelectronics, Inc. Method and apparatus for integer multiplication

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4113506A1 (de) * 1991-04-25 1992-10-29 Thomson Brandt Gmbh Verfahren zur kompatiblen uebertragung von progressiv abgetasteten bildsignalen im zwischenzeilen-format
US5396228A (en) * 1992-01-16 1995-03-07 Mobile Telecommunications Technologies Methods and apparatus for compressing and decompressing paging data
US5731837A (en) * 1996-01-25 1998-03-24 Thomson Multimedia, S.A. Quantization circuitry as for video signal compression systems
US5839100A (en) * 1996-04-22 1998-11-17 Wegener; Albert William Lossless and loss-limited compression of sampled data signals
US5832490A (en) * 1996-05-31 1998-11-03 Siemens Medical Systems, Inc. Lossless data compression technique that also facilitates signal analysis
US5848106A (en) * 1996-12-16 1998-12-08 Ericsson, Inc. Receiver decoder circuitry, and associated method, for decoding an encoded signal
GB2323754B (en) * 1997-01-30 2002-03-20 Peter Graham Craven Lossless compression using iir prediction filters
KR100251453B1 (ko) * 1997-08-26 2000-04-15 윤종용 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크
US6023233A (en) 1998-03-20 2000-02-08 Craven; Peter G. Data rate control for variable rate compression systems

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0631458A1 (en) * 1993-06-22 1994-12-28 Deutsche Thomson-Brandt Gmbh Method for obtaining a multi-channel decoder matrix
US5623424A (en) * 1995-05-08 1997-04-22 Kabushiki Kaisha Toshiba Rate-controlled digital video editing method and system which controls bit allocation of a video encoder by varying quantization levels
US5684714A (en) * 1995-05-08 1997-11-04 Kabushiki Kaisha Toshiba Method and system for a user to manually alter the quality of a previously encoded video sequence
WO1996037048A2 (en) * 1995-05-15 1996-11-21 GERZON, Peter, Herbert Lossless coding method for waveform data
EP0784409A2 (en) * 1996-01-11 1997-07-16 Sony Corporation Video coding and multiplexing
US5715187A (en) * 1996-03-04 1998-02-03 Holtek Microelectronics, Inc. Method and apparatus for integer multiplication

Also Published As

Publication number Publication date
EP1370114A2 (en) 2003-12-10
WO2000060746A2 (en) 2000-10-12
EP2339756A2 (en) 2011-06-29
US6611212B1 (en) 2003-08-26
CA2365529A1 (en) 2000-10-12
MY123651A (en) 2006-05-31
EP1370114A3 (en) 2004-03-17
US20050007262A1 (en) 2005-01-13
SG2012056305A (en) 2015-09-29
US6774820B2 (en) 2004-08-10
CA2742649A1 (en) 2000-10-12
US7193538B2 (en) 2007-03-20
ATE255785T1 (de) 2003-12-15
EP2339756A3 (en) 2011-12-21
EP1173925A2 (en) 2002-01-23
CA2742649C (en) 2014-11-04
EP1173925B1 (en) 2003-12-03
AU781629B2 (en) 2005-06-02
JP4610087B2 (ja) 2011-01-12
ES2208297T3 (es) 2004-06-16
US20040070523A1 (en) 2004-04-15
JP2002541524A (ja) 2002-12-03
SG144695A1 (en) 2008-08-28
EP2391146A2 (en) 2011-11-30
EP2391146A3 (en) 2011-12-14
KR20010113782A (ko) 2001-12-28
AU3828400A (en) 2000-10-23
MY149792A (en) 2013-10-14
AR023424A1 (es) 2002-09-04
CA2859333A1 (en) 2000-10-12
DE60006953T2 (de) 2004-10-28
DK1173925T3 (da) 2004-03-29
TWI226041B (en) 2005-01-01
CA2365529C (en) 2011-08-30
DE60006953D1 (de) 2004-01-15
WO2000060746A3 (en) 2001-03-08

Similar Documents

Publication Publication Date Title
KR100915120B1 (ko) 다중-채널 오디오 신호들을 무손실 부호화 및 복호화하기 위한 장치 및 방법
US11343631B2 (en) Compatible multi-channel coding/decoding
JP4603037B2 (ja) マルチチャネルオーディオ信号を表示するための装置と方法
WO1996037048A2 (en) Lossless coding method for waveform data
WO1994018762A1 (en) Transmission of digital data words representing a signal waveform
US7043312B1 (en) CD playback augmentation for higher resolution and multi-channel sound
AU2005204293B2 (en) Matrix improvements to lossless encoding and decoding
AU2004306509B2 (en) Compatible multi-channel coding/decoding
AU682913B2 (en) Encoder/decoder for multidimensional sound fields

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120807

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130809

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140806

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150806

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160810

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170811

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20180810

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190809

Year of fee payment: 11