KR20070087494A - Method and apparatus for decoding multi-channel audio signal - Google Patents

Method and apparatus for decoding multi-channel audio signal Download PDF

Info

Publication number
KR20070087494A
KR20070087494A KR1020070013364A KR20070013364A KR20070087494A KR 20070087494 A KR20070087494 A KR 20070087494A KR 1020070013364 A KR1020070013364 A KR 1020070013364A KR 20070013364 A KR20070013364 A KR 20070013364A KR 20070087494 A KR20070087494 A KR 20070087494A
Authority
KR
South Korea
Prior art keywords
decoding
information
residual signal
signal
residual
Prior art date
Application number
KR1020070013364A
Other languages
Korean (ko)
Inventor
방희석
오현오
김동수
임재현
정양원
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020087005983A priority Critical patent/KR100904436B1/en
Priority to PCT/KR2007/000866 priority patent/WO2007097550A1/en
Priority to JP2008556238A priority patent/JP5254808B2/en
Priority to ES07709016T priority patent/ES2391117T3/en
Priority to ES07709017T priority patent/ES2407820T3/en
Priority to AU2007218453A priority patent/AU2007218453B2/en
Priority to JP2008556239A priority patent/JP5390197B2/en
Priority to JP2008556240A priority patent/JP5394753B2/en
Priority to US12/280,313 priority patent/US7991494B2/en
Priority to CN200780001487.3A priority patent/CN101361275B/en
Priority to PCT/KR2007/000865 priority patent/WO2007097549A1/en
Priority to TW096106320A priority patent/TWI333795B/en
Priority to CN2007800014801A priority patent/CN101361274B/en
Priority to CN200780001528.9A priority patent/CN101361277B/en
Priority to TW096106318A priority patent/TWI333644B/en
Priority to TW096106319A priority patent/TWI336599B/en
Priority to KR1020087021418A priority patent/KR101276849B1/en
Priority to TW098123546A priority patent/TWI447707B/en
Priority to EP07709014.0A priority patent/EP1987594B1/en
Priority to PCT/KR2007/000867 priority patent/WO2007097551A1/en
Priority to PCT/KR2007/000868 priority patent/WO2007097552A1/en
Priority to JP2008556241A priority patent/JP5394754B2/en
Priority to EP07709016A priority patent/EP1987596B1/en
Priority to KR1020087005986A priority patent/KR100904439B1/en
Priority to ES07709014T priority patent/ES2413807T3/en
Priority to CN200780001517.0A priority patent/CN101361276B/en
Priority to KR1020087005984A priority patent/KR100904437B1/en
Priority to ES07709015T priority patent/ES2391116T3/en
Priority to RU2008137781/09A priority patent/RU2404507C2/en
Priority to TW096106321A priority patent/TWI337341B/en
Priority to BRPI0706488-8A priority patent/BRPI0706488A2/en
Priority to EP07709017.3A priority patent/EP1987597B1/en
Priority to KR1020087005985A priority patent/KR100904438B1/en
Priority to US12/280,323 priority patent/US7991495B2/en
Priority to US12/280,314 priority patent/US7974287B2/en
Priority to US12/280,309 priority patent/US7881817B2/en
Priority to EP07709015A priority patent/EP1987595B1/en
Priority to CA2636330A priority patent/CA2636330C/en
Publication of KR20070087494A publication Critical patent/KR20070087494A/en
Priority to HK09105053.4A priority patent/HK1127825A1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)

Abstract

A method and an apparatus for decoding a multi-channel audio signal are provided to improve efficiency of decoding by selectively performing the decoding for residual coding data. A method for decoding a multi-channel audio signal includes the steps of: extracting extension data type information(201); and if a residual signal exists according to the extension data type information, extracting length information of the residual signal(203). The multi channel audio signal decoding method omits the decoding of the residual signal as much as the length information of the residual signal. The length information of the residual signal assigns a bit adaptively according to the length of the residual signal. The length information of the residual signal represents a header length of the residual signal. The length information of the residual signal represents a frame length of the residual signal.

Description

멀티 채널 오디오 신호의 디코딩 방법 및 장치{Method and Apparatus for decoding Multi-channel audio signal}Method and apparatus for decoding multi-channel audio signal {Method and Apparatus for decoding Multi-channel audio signal}

도 1은 본 발명이 적용되는 실시예로서, 멀티 채널 오디오 신호 처리 장치의 개략적인 블록도를 나타낸다.1 is a schematic block diagram of a multi-channel audio signal processing apparatus according to an embodiment to which the present invention is applied.

도 2는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 디코딩 방법을 설명하기 위한 흐름도이다.2 is a flowchart illustrating a method of decoding a residual signal in an embodiment to which the present invention is applied.

도 3a ~ 도 3c는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 길이 정보를 정의하는 방법들을 나타낸다.3A to 3C are diagrams illustrating methods for defining length information of a residual signal according to an embodiment to which the present invention is applied.

도 4a는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 헤더 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.4A is a flowchart illustrating a method of decoding a residual signal using header length information of the residual signal according to an embodiment to which the present invention is applied.

도 4b는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 데이터 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.4B is a flowchart illustrating a method of decoding a residual signal using data length information of the residual signal in an embodiment to which the present invention is applied.

도 5는 본 발명이 적용되는 실시예로서, 싱크워드를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.5 is a flowchart illustrating a method of decoding a residual signal using a sync word according to an embodiment to which the present invention is applied.

도 6a는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 하나의 오디오 신호를 이루는 파일/일반 스트리밍 구조를 나타낸다.FIG. 6A is an embodiment to which the present invention is applied and shows a file / general streaming structure in which a downmix signal and a spatial information signal constitute one audio signal.

도 6b는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 독립적인 신호를 이루는 파일/일반 스트리밍 구조를 나타낸다.6B illustrates a file / general streaming structure in which a downmix signal and a spatial information signal form independent signals according to an embodiment to which the present invention is applied.

도 7a는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 하나의 오디오 신호를 이루는 방송용 스트리밍 구조를 나타낸다.FIG. 7A is an embodiment to which the present invention is applied and shows a broadcast streaming structure in which a downmix signal and a spatial information signal constitute one audio signal.

도 7b는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 독립적인 오디오 신호를 이루는 방송용 스트리밍 구조를 나타낸다.FIG. 7B is an embodiment to which the present invention is applied and shows a broadcasting streaming structure in which a downmix signal and a spatial information signal form independent audio signals.

도 8은 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우 오디오 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.8 is an embodiment to which the present invention is applied and is a flowchart illustrating a method of decoding an audio signal when the audio signal is used for broadcasting.

도 9는 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우 오디오 신호를 디코딩하는 다른 방법을 설명하기 위한 흐름도이다.9 is an embodiment to which the present invention is applied and is a flowchart illustrating another method of decoding an audio signal when the audio signal is used for broadcasting.

도 10는 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우, 레지듀얼 신호의 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.FIG. 10 is a flowchart illustrating a method of decoding a residual signal using length information of the residual signal when an audio signal is used for broadcasting, etc. according to an embodiment to which the present invention is applied.

도 11은 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우, 싱크워드를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.FIG. 11 is an embodiment to which the present invention is applied and is a flowchart illustrating a method of decoding a residual signal using a sync word when an audio signal is used for broadcasting.

도 12은 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 길이 정보를 이용하여 프로파일 정보에 따른 레지듀얼 신호의 선택적 디코딩 방법을 설명하기 위한 흐름도이다.12 is a flowchart illustrating a selective decoding method of a residual signal according to profile information by using length information of the residual signal according to an embodiment to which the present invention is applied.

도 13는 본 발명이 적용되는 실시예로서, 싱크워드를 이용하여 프로파일 정보에 따른 레지듀얼 신호의 선택적 디코딩 방법을 설명하기 위한 흐름도이다.FIG. 13 is a flowchart illustrating a selective decoding method of a residual signal according to profile information by using a sync word according to an embodiment to which the present invention is applied.

도 14a는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 장치를 설명하기 위한 블록도이다.FIG. 14A is a block diagram illustrating an apparatus for decoding a residual signal using length information of the residual signal in an embodiment to which the present invention is applied.

도 14b는 본 발명이 적용되는 실시예로서, 싱크워드를 이용하여 레지듀얼 신호를 디코딩하는 장치를 설명하기 위한 블록도이다.FIG. 14B is a block diagram illustrating an apparatus for decoding a residual signal using a sync word according to an embodiment to which the present invention is applied.

도 15는 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우 오디오 신호를 디코딩하는 장치를 설명하기 위한 블록도이다.FIG. 15 is an embodiment to which the present invention is applied and is a block diagram illustrating an apparatus for decoding an audio signal when using the audio signal for broadcasting.

< 도면의 주요부분에 대한 부호의 설명 ><Description of Symbols for Major Parts of Drawings>

101: 인코딩 장치 103: 공간 정보 인코딩부101: encoding device 103: spatial information encoding unit

105: 다운믹싱부 107: 디코딩부 105: downmixing unit 107: decoding unit

1401: 데이터 타입 정보 추출부 1403: 길이 정보 추출부1401: data type information extraction unit 1403: length information extraction unit

1405: 디코딩부 1411: 데이터 타입 정보 추출부 1413: 싱크워드 추출부 1415: 디코딩부1405: decoding unit 1411: data type information extracting unit 1413: syncword extracting unit 1415: decoding unit

1501: 헤더 탐색부 1503: 헤더 파싱부1501: header search unit 1503: header parser

본 발명은 멀티 채널 오디오 신호의 디코딩 방법 및 장치에 관한 것으로서, 더욱 상세하게는 레지듀얼 신호를 디코딩하는 방법 및 장치에 관한 것이다.The present invention relates to a method and apparatus for decoding a multi-channel audio signal, and more particularly, to a method and apparatus for decoding a residual signal.

레지듀얼 신호란 원신호와 코딩된 신호와의 차이에 해당되는 신호를 말하는데, 디코더가 무조건적으로 레지듀얼 디코딩을 수행하도록 하면 디코더에 따라 음 질이 향상될 수도 있으나, 복잡도가 높아지고 연산량이 많아지는 문제가 있다. The residual signal is a signal corresponding to the difference between the original signal and the coded signal. If the decoder performs the residual decoding unconditionally, the sound quality may be improved depending on the decoder, but the complexity and the amount of computation are increased. There is.

또한, 일반적으로 오디오 신호의 헤더 정보는 불변이므로 비트스트림에 한 번만 헤더 정보를 삽입한다. 그러나 비트스트림에 한 번만 헤더 정보를 삽입하게 되면, 방송용이나 VOD 등과 같이 임의의 순간부터 오디오 신호를 재생하여야 할 경우에 헤더 정보가 없어 데이터 프레임 정보를 디코딩하지 못하는 문제가 있다.Also, since header information of an audio signal is generally immutable, header information is inserted only once in a bitstream. However, if the header information is inserted only once in the bitstream, there is a problem in that the data frame information cannot be decoded because there is no header information when the audio signal needs to be reproduced from an arbitrary moment such as broadcasting or VOD.

본 발명의 목적은, 멀티 채널 오디오 신호의 디코딩 효율을 향상시킬 수 있는 디코딩 방법 및 장치를 제공함에 있다.An object of the present invention is to provide a decoding method and apparatus capable of improving the decoding efficiency of a multi-channel audio signal.

본 발명의 다른 목적은, 레지듀얼 신호의 디코딩 효율을 향상시킬 수 있는 디코딩 방법 및 장치를 제공함에 있다.Another object of the present invention is to provide a decoding method and apparatus capable of improving the decoding efficiency of a residual signal.

본 발명의 또 다른 목적은, 오디오 신호의 음질을 향상시킬 수 있는 디코딩 방법 및 장치를 제공함에 있다.Still another object of the present invention is to provide a decoding method and apparatus capable of improving sound quality of an audio signal.

본 발명의 또 다른 목적은, 방송용 오디오 신호의 디코딩 효율을 향상시킬 수 있는 디코딩 방법 및 장치를 제공함에 있다.Still another object of the present invention is to provide a decoding method and apparatus capable of improving the decoding efficiency of a broadcast audio signal.

상기 목적을 달성하기 위하여 본 발명은, 확장 데이터 타입 정보를 추출하는 단계와 상기 확장 데이터 타입 정보에 따라 레지듀얼 신호가 존재하는 경우, 상기 레지듀얼 신호의 길이 정보를 추출하는 단계를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법을 제공한다.In order to achieve the above object, the present invention includes extracting extended data type information and extracting length information of the residual signal when a residual signal exists according to the extended data type information. A multi-channel audio signal decoding method is provided.

또한, 본 발명은 확장 데이터 타입 정보를 추출하는 단계와 상기 확장 데이 터 타입 정보에 따라 레지듀얼 신호가 존재하는 경우, 상기 레지듀얼 신호의 싱크워드를 추출하는 단계를 포함하되, 상기 싱크워드가 추출될 때까지 상기 레지듀얼 신호의 디코딩을 생략하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법을 제공한다.The present invention also includes extracting extended data type information and extracting a syncword of the residual signal when a residual signal exists according to the extended data type information, wherein the syncword is extracted. It provides a method for decoding a multi-channel audio signal, characterized in that the decoding of the residual signal is omitted until.

또한, 본 발명은 오디오 신호로부터 헤더 정보를 서치하는 단계와 상기 헤더 정보로부터 확장 데이터 타입 정보를 추출하는 단계를 포함하되, 상기 헤더 정보는 상기 오디오 신호에 적어도 두 번이상 포함되어 있는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법을 제공한다.The present invention also includes searching for header information from an audio signal and extracting extended data type information from the header information, wherein the header information is included at least twice in the audio signal. Provided are a multi-channel audio signal decoding method.

또한, 본 발명은 프로파일 정보에 따라 레지듀얼 신호를 선택적으로 디코딩하는 방법으로서, 오디오 신호로부터 레지듀얼 신호의 길이 정보를 추출하는 단계와 상기 레지듀얼 신호의 길이 정보만큼 상기 레지듀얼 신호를 선택적으로 디코딩하는 단계를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법을 제공한다.The present invention also provides a method for selectively decoding a residual signal according to profile information, the method comprising: extracting length information of a residual signal from an audio signal and selectively decoding the residual signal by the length information of the residual signal. It provides a multi-channel audio signal decoding method comprising the step of.

또한, 본 발명은 프로파일 정보에 따라 레지듀얼 신호를 선택적으로 디코딩하는 방법으로서, 오디오 신호로부터 레지듀얼 신호의 싱크워드를 추출하는 단계와 상기 싱크워드가 추출될 때까지 상기 레지듀얼 신호를 선택적으로 디코딩하는 단계를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법을 제공한다.The present invention also provides a method of selectively decoding a residual signal according to profile information, the method comprising: extracting a syncword of a residual signal from an audio signal and selectively decoding the residual signal until the syncword is extracted; It provides a multi-channel audio signal decoding method comprising the step of.

또한, 본 발명은 확장 데이터 타입 정보를 추출하는 데이터 타입 정보 추출부와 레지듀얼 신호의 길이 정보를 추출하는 길이 정보 추출부를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 장치를 제공한다.The present invention also provides a multi-channel audio signal decoding apparatus comprising a data type information extracting unit for extracting extended data type information and a length information extracting unit for extracting length information of the residual signal.

또한, 본 발명은 확장 데이터 타입 정보를 데이터 타입 정보 추출부와 레지듀얼 신호의 싱크워드를 추출하는 싱크워드 추출부와 상기 싱크워드가 추출된 이후 디코딩을 수행하는 디코딩부를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 장치를 제공한다.In addition, the present invention includes a sync word extracting unit for extracting a sync word of a residual signal and a data type information extracting unit, and a decoding unit for decoding after the sync word is extracted. Provided is a channel audio signal decoding apparatus.

또한, 본 발명은 헤더 정보를 적어도 두 번 이상 포함하는 오디오 신호로부터 헤더 정보를 서치하는 헤더 서치부와 상기 헤더 정보로부터 확장 데이터 타입 정보를 추출하는 헤더 파싱부를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 장치를 제공한다.The present invention also provides a multi-channel audio signal, comprising: a header searcher for searching header information from an audio signal including at least two times of header information, and a header parser for extracting extended data type information from the header information. Provided is a decoding apparatus.

상술한 목적 및 구성의 특징은 첨부된 도면과 관련하여 다음의 상세한 설명을 통하여 보다 명확해질 것이다. 이하 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예들를 상세히 설명한다.The above objects and features of the construction will become more apparent from the following detailed description taken in conjunction with the accompanying drawings. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

아울러, 본 발명에서 사용되는 용어는 가능한 한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우는 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재하였으므로, 단순한 용어의 명칭이 아닌 용어가 가지는 의미로서 본 발명을 파악하여야 함을 밝혀두고자 한다.In addition, the terms used in the present invention was selected as a general term widely used as possible now, but in some cases, the term is arbitrarily selected by the applicant, in which case the meaning is described in detail in the description of the invention, It is to be understood that the present invention is to be understood as the meaning of terms rather than the names of terms.

도 1은 본 발명이 적용되는 실시예로서, 멀티 채널 오디오 신호 처리 장치의 개략적인 블록도를 나타낸다.1 is a schematic block diagram of a multi-channel audio signal processing apparatus according to an embodiment to which the present invention is applied.

멀티 채널 오디오 신호 처리 장치는 크게 인코딩 장치(101)와 디코딩 장치(107)를 포함하고, 인코딩 장치는 공간정보 인코딩부(103)와 다운믹싱부(105)를 포함한다. 공간정보 인코딩부(103)는 멀티 채널 오디오 신호로부터 추출된 공간정보를 이용하여 공간정보 신호를 생성한다. 다운믹싱부(105)는 멀티 채널 오디오 신호를 다운믹싱하여 다운믹스 신호를 생성한다. 다운믹스 신호는 인위적으로 생성될 수도 있다. 이처럼 생성된 다운믹스 신호와 공간정보 신호는 하나의 비트스트림 형태로 디코딩 장치(107)에 전송될 수 있으며, 또는 공간정보 신호와 다운믹스 신호 각각의 독립적인 비트스트림 형태로 디코딩 장치(107)에 전송될 수 있다. 공간정보 신호 내에는 레지듀얼 신호가 포함될 수 있는데, 멀티 채널 오디오 신호를 효율적으로 디코딩하기 위하여 레지듀얼 신호를 효율적으로 디코딩할 필요가 있다.The multi-channel audio signal processing apparatus largely includes an encoding apparatus 101 and a decoding apparatus 107, and the encoding apparatus includes a spatial information encoding unit 103 and a downmixing unit 105. The spatial information encoding unit 103 generates the spatial information signal using the spatial information extracted from the multi-channel audio signal. The downmixing unit 105 downmixes the multi-channel audio signal to generate a downmix signal. The downmix signal may be artificially generated. The generated downmix signal and the spatial information signal may be transmitted to the decoding apparatus 107 in the form of one bitstream, or may be transmitted to the decoding apparatus 107 in the form of independent bitstreams of the spatial information signal and the downmix signal, respectively. Can be sent. In the spatial information signal, a residual signal may be included. In order to efficiently decode a multi-channel audio signal, it is necessary to efficiently decode the residual signal.

도 2는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 디코딩 방법을 설명하기 위한 흐름도이다.2 is a flowchart illustrating a method of decoding a residual signal in an embodiment to which the present invention is applied.

레지듀얼 신호(residual signal)란, 원 신호와 코딩된 신호와의 차이에 해당되는 신호를 의미한다. 여기에서 레지듀얼 신호는 일반적인 레지듀얼 신호와 임의의 다운믹스 신호의 보정을 위한 임의의 다운믹스 레지듀얼 신호를 총칭한다. 멀티 채널 오디오 코딩에서 레지듀얼 신호는 다음과 같은 경우 등에 사용할 수 있다. 예를 들어, 임의의 다운믹스(Artistic Downmix) 신호에 대한 보정용으로 사용할 수 있으며, 디코딩 중에 특정 채널 보정용으로도 사용할 수 있다. 또한, 두 가지 예의 경우를 모두 사용할 수도 있다. 입력된 오디오 신호는 레지듀얼 신호를 이용함으로써, 보다 원 신호에 가깝게 복원될 수 있어 음질이 향상될 수 있다. 또한, 필요한 경우 레지듀얼 신호를 디코딩하지 않음으로써 연산량을 줄일 수 있게 된다. The residual signal refers to a signal corresponding to the difference between the original signal and the coded signal. Here, the residual signal generically refers to a general residual signal and an arbitrary downmix residual signal for correction of an arbitrary downmix signal. In multi-channel audio coding, the residual signal may be used in the following cases. For example, it can be used for correction of an arbitrary downmix signal and can also be used for specific channel correction during decoding. In addition, both examples may be used. The input audio signal can be restored closer to the original signal by using the residual signal, so that the sound quality can be improved. In addition, the amount of computation can be reduced by not decoding the residual signal if necessary.

먼저, 전송된 오디오 신호로부터 확장 데이터 타입 정보를 추출한다(201). 확장 데이터 타입 정보란, 공간정보 신호의 확장된 데이터 타입을 의미한다. 예를 들어, 확장 데이터 타입 정보에는 레지듀얼 코딩 데이터, 임의의 다운믹스 레지듀얼 코딩 데이터, 임의의 트리 확장 데이터 등이 있을 수 있다. 확장 데이터 타입 정보에 따라 레지듀얼 코딩 데이터가 존재하는 경우, 레지듀얼 신호의 길이 정보를 추출한다(203). 이 경우, 디코딩부에서는 레지듀얼 신호를 디코딩할 것인지 여부를 선택하게 된다(205). 상기 선택은 예를 들어, 프로파일, 레벨 등의 정보를 참조하여 디코딩 장치에서 독립적으로 판단할 수 있다. 또한, 디코딩 장치의 연산량, 복잡도(complexity), 코드 사이즈, 메모리 사용량 등에 따라 달라질 수도 있다. First, extended data type information is extracted from the transmitted audio signal (201). Extended data type information refers to an extended data type of a spatial information signal. For example, the extension data type information may include residual coding data, arbitrary downmix residual coding data, arbitrary tree extension data, and the like. If residual coding data is present according to the extended data type information, length information of the residual signal is extracted (203). In this case, the decoding unit selects whether to decode the residual signal (205). For example, the selection may be independently determined by the decoding apparatus with reference to information such as a profile and a level. In addition, it may vary depending on the calculation amount, complexity, code size, memory usage, etc. of the decoding apparatus.

상기 선택에 따른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하지 않게 되는 경우, 레지듀얼 신호의 길이 정보만큼 레지듀얼 신호를 디코딩을 생략할 수 있다(207). 구체적 예로, 레지듀얼 신호의 비트(bit) 또는 바이트(byte) 길이 정보를 데이터 중에 삽입하여, 그 길이 정보로부터 구한만큼 레지듀얼 신호의 비트 필드(bit field)를 뛰어넘고 디코딩을 계속 진행하는 것을 들 수 있다. 또한, 상기 선택에 따른 다른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하게 되는 경우, 레지듀얼 신호를 파싱(parsing)하고 디코딩을 수행하게 된다(209). 레지듀얼 디코딩을 수행하게 되면, 레지듀얼 신호의 길이 정보는 무시할 수 있다.As an example of the decoding method according to the selection, when the residual decoding is not performed, decoding of the residual signal by length information of the residual signal may be omitted (207). For example, by inserting bit or byte length information of the residual signal into the data, skipping the bit field of the residual signal and continuing decoding as much as obtained from the length information. Can be. In addition, as an example of another decoding method according to the selection, when the residual decoding is performed, the residual signal is parsed and the decoding is performed (209). When residual decoding is performed, length information of the residual signal may be ignored.

도 3a는 본 발명이 적용되는 일실시예로서, 레지듀얼 신호의 길이 정보가 고정적으로 비트 할당되는 것을 설명하기 위해 나타낸 것이다.FIG. 3A illustrates an example to which the present invention is applied, in which length information of a residual signal is fixedly bit-allocated.

상기 레지듀얼 신호의 길이 정보는 비트 단위 또는 바이트 단위로 정의할 수 있다. 만약 바이트 단위로 정의한다면 이는 레지듀얼 신호가 바이트로 할당(align) 되어 있음을 의미한다. 도 3은 레지듀얼 신호의 길이 정보를 가장 간단하게 정의하는 방법을 나타낸 것이다. 상기 레지듀얼 신호의 길이 정보를 나타내는 신택스 요소(syntax element)를 정의하고, 그 신택스 요소에 일정한 비트를 할당하는 것이다. 예를 들어, 신택스 요소로서 'bsResidualSignalLength'를 정의하고 고정 비트인 16비트를 할당하는 것이다. 그러나 이와 같은 방법은 상대적으로 비트를 많이 소모할 수 있다. 따라서, 도 3b 및 도 3c의 방법을 설명한다.Length information of the residual signal may be defined in a bit unit or a byte unit. If defined in bytes, this means that the residual signal is aligned in bytes. 3 illustrates a method of most simply defining length information of a residual signal. A syntax element representing the length information of the residual signal is defined, and a predetermined bit is assigned to the syntax element. For example, it defines 'bsResidualSignalLength' as a syntax element and allocates 16 bits which are fixed bits. However, this method can be relatively bit consuming. Thus, the method of FIGS. 3B and 3C will be described.

도 3b는 본 발명이 적용되는 일실시예로서, 레지듀얼 신호의 길이 정보가 길이 타입에 따라 가변적으로 비트 할당되는 것을 설명하기 위해 나타낸 것이다.FIG. 3B illustrates an embodiment to which the present invention is applied to explain that length information of a residual signal is variably assigned to bits according to a length type.

도 3b는 비트 소모를 더욱 줄이기 위해서 'bsResidualSignalLength'를 몇 비트를 사용할 지를 정의하는 신택스 요소를 하나 더 정의해주는 방법을 나타낸 것이며, 도 6은 도 5의 방법을 도식적으로 표현한 것이다. 예를 들어, 길이 타입으로 'bsResidualSignalLengthType'을 새로 정의하여 그 값이 0인 경우에는 'bsResidualSignalLength'가 4비트로 할당되고, 1인 경우에는 8비트로, 2인 경우에는 12비트로, 3인 경우에는 16비트로 각각 할당되게 된다. 여기서 할당되는 비트는 예를 들어 설명한 것이므로, 위에서 정의한 비트와 다른 값의 비트가 할당될 수도 있다. 또한, 위의 방법들보다 더욱 비트 소모를 줄이기 위해서 도 3c의 방법이 제공된다. FIG. 3B illustrates a method of defining one more syntax element that defines how many bits are used for 'bsResidualSignalLength' to further reduce bit consumption, and FIG. 6 schematically illustrates the method of FIG. 5. For example, newly define 'bsResidualSignalLengthType' as the length type, and if the value is 0, 'bsResidualSignalLength' is assigned as 4 bits, 8 for 1, 12 for 2, 16 for 3 Each will be assigned. Since the bits allocated here are described, for example, bits having a different value from those defined above may be allocated. Also, the method of FIG. 3C is provided to further reduce bit consumption than the above methods.

도 3c는 본 발명이 적용되는 일실시예로서, 레지듀얼 신호의 길이 정보가 상기 레지듀얼 신호의 실제 길이에 따라 적응적으로 비트 할당되는 것을 설명하기 위해 나타낸 것이다.FIG. 3C illustrates an embodiment to which the present invention is applied to explain that length information of a residual signal is adaptively bit-allocated according to an actual length of the residual signal.

레지듀얼 신호가 들어오면 상기 레지듀얼 신호의 길이정보값을 최초 정해진 값까지 읽을 수 있다. 상기 길이정보값이 어느 일정한 값이 되면, 추가적으로 더 정해진 값까지 읽을 수 있게 된다. 그리고, 다시 상기 길이정보값이 어느 일정한 값이 되면, 다시 추가적으로 더 정해진 값까지 읽을 수 있게 된다. 이 때, 상기 길이정보값이 어느 일정한 값이 아닌 경우에는 그 값을 그대로 길이정보값으로 출력하게 된다. 이처럼, 레지듀얼 신호의 길이 정보를 실제 데이터 길이에 따라 적응적으로 읽어나감으로써 비트 소모를 최대한으로 줄일 수 있게 된다. When the residual signal is received, the length information value of the residual signal may be read up to a predetermined value. When the length information becomes a certain value, it is possible to read up to a further defined value. When the length information value becomes a certain value again, it is possible to read up to a further predetermined value again. At this time, if the length information value is not a constant value, the value is output as the length information value as it is. As such, the bit information can be reduced as much as possible by adaptively reading the length information of the residual signal according to the actual data length.

예를 들어, 레지듀얼 신호가 들어오면 상기 레지듀얼 신호 길이의 4비트를 읽는다. 그리고, 길이정보값(bsResidualSignalLength)이 24-1 (=15)이면, bsResidualSignalLength1 값으로 8비트를 더 읽는다. 동일한 방식으로 상기 길이정보값(bsResidualSignalLength)이 (24-1) + (28-1) = 15+255 이면, bsResidualSignalLength2 값으로 12비트를 더 읽는다. 동일한 방식으로 bsResidualSignalLength 값이 (24-1) + (28-1) + (212-1) = 15+255+4095 이면, bsResidualSignalLength3 값으로 16비트를 더 읽는다.For example, when a residual signal comes in, it reads 4 bits of the residual signal length. If the length information value bsResidualSignalLength is 2 4 -1 (= 15), 8 bits are further read as the bsResidualSignalLength1 value. In the same manner, if the length information value bsResidualSignalLength is (2 4 -1) + (2 8 -1) = 15 + 255, 12 bits are further read as the bsResidualSignalLength2 value. In the same way, if the value of bsResidualSignalLength is (2 4 -1) + (2 8 -1) + (2 12 -1) = 15 + 255 + 4095, 16 more bits are read as the value of bsResidualSignalLength3.

이를 다시 설명하면 다음과 같다. 레지듀얼 신호가 들어오면 먼저 4비트를 읽는다. 그리고, 길이정보를 읽은 값이 4비트보다 작으면 그 값이 길이정보가 된다. 그러나 길이정보를 읽은 값이 4비트보다 크면 추가적으로 8비트를 더 읽는다. 추가적으로 읽은 값이 8비트보다 작으면 읽게 된 총 길이정보값은 12(=4+8) 비트가 된다. 그러나, 추가적으로 읽은 값이 8비트보다 크면 다시 추가적으로 16비트를 더 읽는다. 예를 들어, 이를 보다 상세히 설명하면 다음과 같다. 먼저 길이정보가 들어오면 4비트를 읽는다. 실제 길이정보값은 0~14의 값이 된다. 그리고, 길이정보값이 24-1 (=15) 이 되면 상기 레지듀얼 신호를 추가적으로 더 읽는다. 이 때는 상기 레지듀얼 신호를 추가적으로 28-2 (=254) 값까지 더 읽을 수 있다. 그러나, 길이 정보값이 24-1 보다 작은 값이라면, 읽혀진 0 ~ 24-2 (=14) 의 값을 그대로 출력하게 된다. 길이정보값이 (24-1) + (28-1) 이 되면 상기 레지듀얼 신호를 추가적으로 더 읽게 된다. 이 때는 상기 레지듀얼 신호를 216-1 값까지 추가적으로 더 읽을 수 있다. 그러나, 길이 정보값이 216-1 보다 작은 값이라면, 읽혀진 0 ~ 216-1 의 값을 그대로 출력하게 된다. 여기서도 앞서 설명한 예에서와 마찬가지로, 할당되는 비트는 예를 들어 설명한 것이므로, 위에서 정의한 비트와 다른 값의 비트를 할당할 수도 있다.This will be described as follows. When a residual signal comes in, it first reads four bits. If the value of the length information is read less than 4 bits, the value is the length information. However, if the length information is larger than 4 bits, additional 8 bits are read. In addition, if the read value is less than 8 bits, the total length information read is 12 (= 4 + 8) bits. However, if the additional read value is larger than 8 bits, it reads additional 16 bits again. For example, this will be described in more detail as follows. When the length information comes in, it reads 4 bits. The actual length information value is a value between 0 and 14. When the length information becomes 2 4 -1 (= 15), the residual signal is further read. In this case, the residual signal may be further read up to a value of 2 8 -2 (= 254). However, if the length information value is less than 24-1, and outputs the value of the read 0 ~ 2 4 2 (= 14) as it is. When the length information value becomes (2 4 -1) + (2 8 -1), the residual signal is additionally read. In this case, the residual signal may be further read up to a value of 2 16 −1. However, if the length information value is less than 216-1, and outputs the value of the read 0 ~ 216-1 as it is. Here, as in the above-described example, since the bits to be allocated have been described, for example, bits of different values from those defined above may be allocated.

한편, 상기 도 2에서 설명한 레지듀얼 신호의 디코딩 방법은 공간정보 프레임뿐만 아니라 공간정보 헤더에도 적용될 수 있다. 이는 도 4a와 도 4b에서 설명한다.Meanwhile, the method of decoding the residual signal described with reference to FIG. 2 may be applied to a spatial information header as well as a spatial information frame. This is illustrated in FIGS. 4A and 4B.

도 4a는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 헤더 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.4A is a flowchart illustrating a method of decoding a residual signal using header length information of the residual signal according to an embodiment to which the present invention is applied.

전송된 오디오 신호로부터 확장 데이터 타입 정보를 추출한다(401). 상기 확장 데이터 타입 정보에 따라 레지듀얼 코딩 데이터가 존재하는 경우, 상기 레지듀얼 신호의 헤더 길이 정보를 추출한다(403). 이 경우, 디코딩부에서는 레지듀얼 신호를 디코딩할 것인지 여부를 선택하게 된다(405). 상기 선택은 예를 들어, 프로파일, 레벨 등의 정보를 참조하여 디코딩 장치에서 독립적으로 판단할 수 있다. 또한, 디코딩 장치의 연산량, 코드 사이즈, 메모리 사용량 등에 따라 달라질 수도 있다. The extended data type information is extracted from the transmitted audio signal (401). If residual coding data is present according to the extension data type information, header length information of the residual signal is extracted (403). In this case, the decoding unit selects whether or not to decode the residual signal (405). For example, the selection may be independently determined by the decoding apparatus with reference to information such as a profile and a level. In addition, it may vary depending on the calculation amount, code size, memory usage, etc. of the decoding apparatus.

상기 선택에 따른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하지 않게 되는 경우, 상기 레지듀얼 신호의 헤더 길이 정보만큼 레지듀얼 신호의 디코딩을 생략할 수 있다(407). 구체적 예로, 레지듀얼 신호 헤더의 비트 또는 바이트길이 정보를 데이터 중에 삽입하여, 그 길이 정보로부터 구한만큼 레지듀얼 신호의 비트 필드를 뛰어넘고 디코딩을 계속 진행하는 것을 들 수 있다. 또한, 상기 선택에 따른 다른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하게 되는 경우, 레지듀얼 신호를 파싱(parsing)하고 디코딩을 수행하게 된다(409). 레지듀얼 디코딩을 수행하게 되면, 상기 레지듀얼 신호의 헤더 길이 정보는 무시할 수 있다.As an example of the decoding method according to the selection, when the residual decoding is not performed, decoding of the residual signal by the header length information of the residual signal may be omitted (407). As a specific example, the bit or byte length information of the residual signal header may be inserted into the data, and the decoding may continue beyond the bit field of the residual signal by the amount obtained from the length information. As another example of the decoding method according to the selection, when the residual decoding is performed, the residual signal is parsed and the decoding is performed (409). When residual decoding is performed, header length information of the residual signal may be ignored.

도 4b는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 데이터 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.4B is a flowchart illustrating a method of decoding a residual signal using data length information of the residual signal in an embodiment to which the present invention is applied.

상기 도 2에서 설명한 레지듀얼 신호의 디코딩 방법은 공간정보 프레임에도 적용된다. 도 4b에서 설명하는 레지듀얼 신호의 디코딩 방법은 도 4a에서 설명한 것과 유사한 방식으로 적용된다.The method of decoding the residual signal described with reference to FIG. 2 is also applied to a spatial information frame. The method of decoding the residual signal described in FIG. 4B is applied in a manner similar to that described in FIG. 4A.

도 5는 본 발명이 적용되는 실시예로서, 싱크워드를 이용하여 레지듀얼 신호 를 디코딩하는 방법을 설명하기 위한 흐름도이다.5 is a flowchart illustrating a method of decoding a residual signal using a sync word according to an embodiment to which the present invention is applied.

전송된 오디오 신호로부터 확장 데이터 타입 정보를 추출한다(501). 상기 확장 데이터 타입 정보에 따라 레지듀얼 코딩 데이터가 존재하는 경우, 디코딩부에서는 레지듀얼 신호를 디코딩할 것인지 여부를 선택하게 된다(503). 상기 선택은 예를 들어, 프로파일, 레벨 등의 정보를 참조하여 디코딩 장치에서 독립적으로 판단할 수 있다. 또한, 디코딩 장치의 연산량, 코드 사이즈, 메모리 사용량 등에 따라 달라질 수도 있다. The extended data type information is extracted from the transmitted audio signal (501). If there is residual coding data according to the extended data type information, the decoding unit selects whether to decode the residual signal (503). For example, the selection may be independently determined by the decoding apparatus with reference to information such as a profile and a level. In addition, it may vary depending on the calculation amount, code size, memory usage, etc. of the decoding apparatus.

상기 선택에 따른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하지 않게 되는 경우, 레지듀얼 신호의 싱크워드를 찾을 때까지 레지듀얼 신호의 비트 필드를 계속 탐색한다. 싱크워드를 찾으면 탐색 과정을 멈추고 디코딩을 계속 진행한다. 즉, 레지듀얼 신호의 싱크워드를 찾을 때까지 레지듀얼 신호의 디코딩을 생략할 수 있다(505). 여기서, 싱크워드란 어느 프레임의 시작 또는 끝을 표시하는 동기신호로서, 이를 이용하면 프레임 사이즈를 알 수 있다. 예를 들어, 레지듀얼 신호가 끝나는 지점에 일정한 비트의 길이(예를 들어, 12비트)를 가지는 싱크워드를 삽입하여, 비트 필드를 스킵하는데 사용할 수 있다. 또한, 상기 선택에 따른 다른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하게 되는 경우, 레지듀얼 신호를 파싱(parsing)하고 디코딩을 수행하게 된다(507). 레지듀얼 디코딩을 수행하게 되면, 레지듀얼 신호의 싱크워드는 읽고 무시할 수 있다(509).As an example of the decoding method according to the selection, when the residual decoding is not performed, the bit field of the residual signal is continuously searched until a syncword of the residual signal is found. If it finds a syncword, it stops the search process and continues decoding. That is, decoding of the residual signal may be omitted (505) until a sync word of the residual signal is found. Here, the sync word is a synchronization signal indicating the start or end of a frame, and the sync word can be used to determine the frame size. For example, a syncword having a predetermined length of a bit (eg, 12 bits) may be inserted at a point where the residual signal ends and used to skip a bit field. In addition, as an example of another decoding method according to the selection, when the residual decoding is performed, the residual signal is parsed and the decoding is performed (507). When residual decoding is performed, the sync word of the residual signal may be read and ignored (509).

도 6a는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 하나의 오디오 신호를 이루는 파일/일반 스트리밍 구조를 나타낸다.FIG. 6A is an embodiment to which the present invention is applied and shows a file / general streaming structure in which a downmix signal and a spatial information signal constitute one audio signal.

오디오 신호는 다운믹스 신호와 공간정보 신호를 포함한다. 다운믹스 신호와 공간정보 신호는 프레임 단위로 전송된다. 공간정보 신호는 헤더 정보와 데이터 정보를 포함할 수 있고, 데이터만을 포함할 수도 있다. 이처럼 하나의 오디오 신호를 이루는 파일/일반 스트리밍 구조는 헤더 정보가 앞에 오고 그 뒤에 데이터 정보가 따른다. 예를 들어, 다운믹스 신호와 공간정보 신호가 하나의 오디오 신호를 이루는 파일/일반 스트리밍 구조의 경우, 앞부분에 헤더 정보인 다운믹스 헤더(Downmix Header, DH)와 공간정보 헤더(MPEG Surround Specific Configuration Header, MH)가 존재한다. 그리고 그 뒤에 데이터 정보로서, 다운믹스 프레임 데이터(Downmix Frame Data, DF)와 공간정보 데이터(MPEG Surround Spatial Frame, MF)와 레지듀얼 신호(MPEG Surround Residual Bitstream, MR)가 하나의 프레임을 구성할 수 있다. 이처럼, 레지듀얼 신호는 공간정보 신호 내에 포함될 수 있다. 또한, 레지듀얼 신호는 독립적인 신호로서 이용될 수도 있다. 레지듀얼 신호는 선택적으로 디코딩될 수 있기 때문에 프레임의 마지막 부분에 위치할 수 있으며, 또는 공간정보 신호에 바로 뒤에 연속하여 존재할 수 있다.The audio signal includes a downmix signal and a spatial information signal. The downmix signal and the spatial information signal are transmitted in units of frames. The spatial information signal may include header information and data information, or may include only data. As such, the file / general streaming structure of one audio signal is preceded by header information followed by data information. For example, in the case of a file / general streaming structure in which a downmix signal and a spatial information signal constitute one audio signal, a downmix header (DH) and a spatial information header (MPEG Surround Specific Configuration Header), which are header information, are included in the header section. , MH). Then, as data information, downmix frame data (Downmix Frame Data, DF), spatial information data (MPEG Surround Spatial Frame, MF), and residual signal (MPEG Surround Residual Bitstream, MR) can form one frame. have. As such, the residual signal may be included in the spatial information signal. The residual signal may also be used as an independent signal. Since the residual signal may be selectively decoded, it may be located at the end of the frame, or may be present immediately after the spatial information signal.

도 6b는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 독립적인 신호를 이루는 파일/일반 스트리밍 구조를 나타낸다.6B illustrates a file / general streaming structure in which a downmix signal and a spatial information signal form independent signals according to an embodiment to which the present invention is applied.

오디오 신호는 다운믹스 신호와 공간정보 신호를 포함하는데, 각각 독립적인 신호로 전송될 수도 있다. 이러한 경우, 다운믹스 신호는 앞부분에 헤더 정보인 다운믹스 헤더(DH)가 오고, 그 뒤에 데이터 정보로서 다운믹스 프레임 데이터(DF)가 따르는 구조를 가진다. 공간정보 신호는 앞 부분에 헤더 정보인 공간정보 헤더(MH) 가 오고, 그 뒤에 데이터 정보로서 공간정보 데이터(MF)와 레지듀얼 신호(MR)가 따르는 구조를 가진다. 마찬가지로, 레지듀얼 신호는 공간정보 신호 내에 포함될 수 있다. 또한, 레지듀얼 신호는 독립적인 신호로서 이용될 수도 있다. 레지듀얼 신호는 선택적으로 디코딩될 수 있기 때문에 프레임의 마지막 부분에 위치할 수 있으며, 또는 공간정보 신호에 바로 뒤에 연속하여 존재할 수 있다.The audio signal includes a downmix signal and a spatial information signal, which may be transmitted as independent signals. In this case, the downmix signal has a structure in which a downmix header DH, which is header information, comes first, followed by downmix frame data DF as data information. The spatial information signal has a structure in which the spatial information header MH, which is header information, is followed by the spatial information data MF and the residual signal MR as data information. Similarly, the residual signal may be included in the spatial information signal. The residual signal may also be used as an independent signal. Since the residual signal may be selectively decoded, it may be located at the end of the frame, or may be present immediately after the spatial information signal.

도 7a는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 하나의 오디오 신호를 이루는 방송용 스트리밍 구조를 나타낸다.FIG. 7A is an embodiment to which the present invention is applied and shows a broadcast streaming structure in which a downmix signal and a spatial information signal constitute one audio signal.

오디오 신호를 처음부터 디코딩하지 않고 임의의 순간부터 디코딩하게 되어 이전에 전송한 헤더 정보를 이용할 수 없는 경우, 오디오 신호에 삽입되어 있는 또 다른 헤더 정보를 이용하여 오디오 신호를 디코딩할 수 있다. 예를 들어, 오디오 신호를 방송 등에 이용하는 경우이거나, 오디오 신호를 전송하는 도중 헤더 정보를 분실하는 경우에는 신호를 어느 순간에 수신하더라도 그 순간부터 디코딩이 시작될 수 있어야 한다. 따라서, 상기 헤더 정보는 오디오 신호에 적어도 두 번 삽입되어 있다. 헤더 정보가 오디오 신호의 앞부분에 한번만 존재하게 된다면, 임의의 순간에 오디오 신호를 수신하게 될 경우 헤더 정보가 없어 디코딩을 할 수 없기 때문이다. 예를 들어, 헤더 정보를 매 프레임마다 삽입하거나, 또는 일정 간격의 프레임마다 주기적으로 삽입하거나, 또는 임의의 간격의 프레임마다 비주기적으로 삽입할 수도 있다. 또는 일정한 시간 간격에 따라(예를 들어, 2초) 한 번씩 헤더 정보를 삽입할 수도 있다. If the audio signal is not decoded from the beginning and decoded from an arbitrary moment and the previously transmitted header information is not available, the audio signal may be decoded using another header information inserted in the audio signal. For example, when the audio signal is used for broadcasting or the like, or when the header information is lost while transmitting the audio signal, decoding should be able to start from that moment even if the signal is received at any moment. Thus, the header information is inserted at least twice in the audio signal. If the header information is present only once in the front of the audio signal, if the audio signal is received at any moment, it cannot be decoded because there is no header information. For example, header information may be inserted every frame, periodically inserted every frame at regular intervals, or aperiodically inserted at every interval of frames. Alternatively, header information may be inserted once at a predetermined time interval (for example, 2 seconds).

하나의 오디오 신호를 이루는 방송용 스트리밍 구조는 데이터 정보들 사이에 적어도 2개의 헤더 정보가 삽입된 형태를 가진다. 예를 들어, 다운믹스 신호와 공간정보 신호가 하나의 오디오 신호를 이루는 방송용 스트리밍 구조의 경우, 데이터 정보로서, 다운믹스 프레임 데이터(Downmix Frame Data, DF)와 공간정보 데이터(MPEG Surround Spatial Frame, MF)와 레지듀얼 신호(MPEG Surround Residual Bitstream, MR)가 하나의 프레임을 구성할 수 있다. 이러한 데이터 정보들 사이에The broadcast streaming structure of one audio signal has a form in which at least two header information are inserted between data information. For example, in the case of a broadcasting streaming structure in which the downmix signal and the spatial information signal constitute one audio signal, the downmix frame data (Downmix Frame Data, DF) and the spatial information data (MPEG Surround Spatial Frame, MF) are used as data information. ) And the residual signal (MPEG Surround Residual Bitstream, MR) may constitute one frame. Between these data information

다운믹스 헤더(DH)와 공간정보 헤더(MH)가 각각 적어도 2번 이상 삽입된다. 이러한 헤더 정보들은 초기에 전송한 헤더 정보와 동일한 정보일 수도 있고, 가변적일 수도 있다. 헤더 정보가 가변적인 경우에는 새로운 헤더 정보를 디코딩하여 그에 따라 새로운 헤더 정보 뒤로 전송되는 데이터 정보를 디코딩한다. 상기 레지듀얼 신호는 공간정보 신호 내에 포함될 수 있다. 또한, 레지듀얼 신호는 독립적인 신호로서 이용될 수도 있다. 레지듀얼 신호는 선택적으로 디코딩될 수 있기 때문에 프레임의 마지막 부분에 위치할 수 있으며, 또는 공간정보 신호에 바로 뒤에 연속하여 존재할 수 있다.The downmix header DH and the spatial information header MH are inserted at least twice each. Such header information may be the same as the header information transmitted initially or may be variable. If the header information is variable, the new header information is decoded and accordingly the data information transmitted after the new header information is decoded. The residual signal may be included in the spatial information signal. The residual signal may also be used as an independent signal. Since the residual signal may be selectively decoded, it may be located at the end of the frame, or may be present immediately after the spatial information signal.

도 7b는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 독립적인 오디오 신호를 이루는 방송용 스트리밍 구조를 나타낸다.FIG. 7B is an embodiment to which the present invention is applied and shows a broadcasting streaming structure in which a downmix signal and a spatial information signal form independent audio signals.

오디오 신호는 다운믹스 신호와 공간정보 신호를 포함하는데, 각각 독립적인 신호로 전송될 수도 있다. 다운믹스 신호의 경우, 데이터 정보로서 다운믹스 프레임 데이터(DF)가 하나의 프레임을 구성할 수 있다. 이러한 데이터 정보 사이에 다운믹스 헤더(DH)가 적어도 2번 이상 삽입된다. 공간정보 신호의 경우, 데이터 정보로서 공간정보 데이터(MF)와 레지듀얼 신호(MR)가 하나의 프레임을 구성할 수 있 다. 이러한 데이터 정보들 사이에 공간정보 헤더(MH)가 적어도 2번 이상 삽입된다. 이러한 헤더 정보들은 초기에 전송한 헤더 정보와 동일한 정보일 수도 있고, 가변적인 정보일 수도 있다. 헤더 정보가 가변적인 경우에는 새로운 헤더 정보를 디코딩하여 그에 따라 새로운 헤더 정보 뒤로 전송되는 데이터 정보를 디코딩한다. 마찬가지로, 레지듀얼 신호는 공간정보 신호 내에 포함될 수 있다. 또한, 레지듀얼 신호는 독립적인 신호로서 이용될 수도 있다. 레지듀얼 신호는 선택적으로 디코딩될 수 있기 때문에 프레임의 마지막 부분에 위치할 수 있으며, 또는 공간정보 신호에 바로 뒤에 연속하여 존재할 수 있다.The audio signal includes a downmix signal and a spatial information signal, which may be transmitted as independent signals. In the case of the downmix signal, the downmix frame data DF may constitute one frame as data information. The downmix header DH is inserted at least two times between such data information. In the case of the spatial information signal, the spatial information data MF and the residual signal MR may constitute one frame as data information. The spatial information header MH is inserted at least twice between these data information. Such header information may be the same as the header information transmitted initially or may be variable information. If the header information is variable, the new header information is decoded and accordingly the data information transmitted after the new header information is decoded. Similarly, the residual signal may be included in the spatial information signal. The residual signal may also be used as an independent signal. Since the residual signal may be selectively decoded, it may be located at the end of the frame, or may be present immediately after the spatial information signal.

도 8은 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우 오디오 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.8 is an embodiment to which the present invention is applied and is a flowchart illustrating a method of decoding an audio signal when the audio signal is used for broadcasting.

파일/일반 스트리밍 구조의 오디오 신호가 수신되는 경우, 헤더 파싱은 1번 이루어지고, 그 외의 부분은 프레임 단위로 디코딩이 수행된다. 이와 달리, 방송용 스트리밍 구조의 경우에는, 수신된 오디오 신호 중 헤더 정보가 탐색될 때까지 디코딩을 하지 않고 기다린다(801). 헤더 정보가 오게 되면 헤더 파싱이 이루어진다(803). 이후로는 상기 헤더 정보의 해석에 따라 데이터 정보를 디코딩하게 된다. 여기서, 헤더 탐색은 처음 한 번 이루어지고, 헤더 정보 해석도 헤더를 찾은 후 바로 한 번만 수행된다. 상기 헤더 정보는 초기에 전송한 헤더 정보와 동일한 정보일 수도 있고, 가변적인 정보일 수도 있다. 동일한 정보인 경우라면, 그 후에 들어오는 헤더는 무시하거나 에러 감지(error detect)용으로 사용할 수 있다. When an audio signal of a file / general streaming structure is received, header parsing is performed once, and the other part is decoded in units of frames. In contrast, in the broadcasting streaming structure, the decoding waits without decoding until the header information of the received audio signal is found (801). When header information comes, header parsing is performed (803). Thereafter, the data information is decoded according to the interpretation of the header information. Here, the header search is performed once, and the header information interpretation is also performed only once once the header is found. The header information may be the same information as the initially transmitted header information or may be variable information. If the information is the same, subsequent headers can be ignored or used for error detection.

도 9는 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우 오디오 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.9 is an embodiment to which the present invention is applied and is a flowchart illustrating a method of decoding an audio signal when the audio signal is used for broadcasting.

먼저 오디오 신호가 수신되면(901), 디코딩부는 오디오 신호에 헤더 정보가 포함되어 있는지를 판단하고(903), 헤더 정보가 포함되어 있는 경우 헤더 정보를 추출한다(905). 디코딩부에서는 추출한 헤더 정보가 오디오 신호에서 첫번째로 추출한 헤더 정보인지를 판단한다(907). 추출한 헤더 정보가 오디오 신호에서 첫번째로 추출한 헤더 정보인 경우, 추출한 헤더 정보를 디코딩한다(909). 디코딩된 헤더 정보에 따라 헤더 정보 뒤로 전송되는 데이터 정보를 디코딩한다. First, if an audio signal is received (901), the decoding unit determines whether the header information is included in the audio signal (903), and if the header information is included (905). The decoding unit determines whether the extracted header information is first header information extracted from the audio signal (907). If the extracted header information is the first header information extracted from the audio signal, the extracted header information is decoded (909). The data information transmitted after the header information is decoded according to the decoded header information.

오디오 신호에서 추출한 헤더 정보가 첫번째로 추출한 헤더 정보가 아닌 경우, 첫번째로 추출했던 헤더 정보와 동일한지를 판단한다(911). 추출한 헤더 정보가 첫번째로 추출했던 헤더 정보와 동일한 경우에는 첫번째로 추출하여 디코딩한 헤더 정보를 이용하여 데이터 정보를 디코딩한다. 추출한 헤더 정보가 첫번째로 추출했던 헤더 정보와 동일하지 않은 경우에는 오디오 신호가 오디오 신호 인코딩 장치로부터 오디오 신호 디코딩 장치로 전송되는 경로 상에서 오디오 신호에 에러가 발생한 것인지를 판단한다(913). 헤더 정보가 가변인 경우에는 헤더 정보가 첫번째로 추출했던 헤더 정보와 동일하지 않아도 에러가 발생한 것이 아니므로 헤더 정보를 가변인 헤더 정보로 갱신하고(915), 갱신한 헤더 정보를 디코딩한다(909). 디코딩한 헤더 정보에 따라 헤더 정보 뒤로 전송되는 데이터 정보를 디코딩한다. 헤더 정보가 가변이 아님에도 첫번째로 추출한 헤더 정보와 동일하지 않은 경우, 오디오 신호 전송 경로 상에서 에러가 발생한 것이므로 에러가 발생한 헤더 정보를 포함하는 프레임에 포함된 데이터 정보를 제거하거나 또는 데이터 정보의 에러를 정정한 다(917).If the header information extracted from the audio signal is not the first header information extracted, it is determined whether the header information extracted from the audio signal is the same as the first extracted header information (911). If the extracted header information is the same as the header information extracted first, the data information is decoded using the header information extracted and decoded first. If the extracted header information is not the same as the header information extracted first, it is determined whether an error has occurred in the audio signal on the path from which the audio signal is transmitted from the audio signal encoding apparatus to the audio signal decoding apparatus (913). If the header information is variable, an error does not occur even if the header information is not the same as the header information extracted first, and the header information is updated with variable header information (915), and the updated header information is decoded (909). . The data information transmitted after the header information is decoded according to the decoded header information. If the header information is not variable but not the same as the first extracted header information, an error has occurred in the audio signal transmission path, so the data information included in the frame including the header information where the error occurred is removed or an error of the data information is removed. Correct (917).

도 10는 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우, 레지듀얼 신호의 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.FIG. 10 is a flowchart illustrating a method of decoding a residual signal using length information of the residual signal when an audio signal is used for broadcasting, etc. according to an embodiment to which the present invention is applied.

오디오 신호를 처음부터 디코딩하지 않고 임의의 순간부터 디코딩하게 되어 이전에 전송한 헤더 정보를 이용할 수 없는 경우, 수신된 오디오 신호 중 헤더 정보가 탐색될 때까지 디코딩을 하지 않고 기다린다(1001). 헤더 정보가 오게 되면 헤더 파싱이 이루어진다(1003). 이후로는 상기 헤더 정보의 해석에 따라 데이터 정보를 디코딩하게 된다. 여기서, 헤더 탐색은 처음 한 번 이루어지고, 헤더 정보 해석도 헤더를 찾은 후 바로 한 번만 수행된다. 상기 헤더 정보는 초기에 전송한 헤더 정보와 동일한 정보일 수도 있고, 가변적인 정보일 수도 있다. 동일한 정보인 경우라면, 그 후에 들어오는 헤더는 무시하거나 에러 감지(error detect)용으로 사용할 수 있다. 그리고, 전송된 오디오 신호로부터 확장 데이터 타입 정보를 추출한다(1005). 상기 확장 데이터 타입 정보에는 예를 들어, 레지듀얼 코딩 데이터, 임의의 다운믹스 레지듀얼 코딩 데이터, 임의의 트리 확장 데이터 등이 있을 수 있다. 상기 확장 데이터 타입 정보에 따라 레지듀얼 코딩 데이터가 존재하는 경우, 상기 레지듀얼 신호의 길이 정보를 추출한다(1007). 이 경우, 디코딩부에서는 레지듀얼 신호를 디코딩할 것인지 여부를 선택하게 된다(1009). 상기 선택은 예를 들어, 프로파일, 레벨 등의 정보를 참조하여 디코딩 장치에서 독립적으로 판단할 수 있다. 또한, 디코딩 장치의 연산량, 코드 사이즈, 메모리 사용량 등에 따라 달라질 수도 있다. If the audio signal is not decoded from the beginning and decoded from an arbitrary moment and the previously transmitted header information is not available, the processor waits without decoding until the header information of the received audio signal is found (1001). When the header information comes, header parsing is performed (1003). Thereafter, the data information is decoded according to the interpretation of the header information. Here, the header search is performed once, and the header information interpretation is also performed only once once the header is found. The header information may be the same information as the initially transmitted header information or may be variable information. If the information is the same, subsequent headers can be ignored or used for error detection. The extended data type information is extracted from the transmitted audio signal (1005). The extended data type information may include, for example, residual coding data, arbitrary downmix residual coding data, arbitrary tree extension data, and the like. If residual coding data is present according to the extension data type information, length information of the residual signal is extracted (1007). In this case, the decoding unit selects whether to decode the residual signal (1009). For example, the selection may be independently determined by the decoding apparatus with reference to information such as a profile and a level. In addition, it may vary depending on the calculation amount, code size, memory usage, etc. of the decoding apparatus.

상기 선택에 따른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하지 않게 되는 경우, 상기 레지듀얼 신호의 길이 정보만큼 레지듀얼 신호의 디코딩을 생략할수 있다(1011). 구체적 예로, 레지듀얼 신호의 비트 또는 바이트 길이 정보를 데이터 중에 삽입하여, 그 길이 정보로부터 구한만큼 레지듀얼 신호의 비트 필드를 뛰어넘고 디코딩을 계속 진행하는 것을 들 수 있다. 또한, 상기 선택에 따른 다른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하게 되는 경우, 레지듀얼 신호를 파싱하고 디코딩을 수행하게 된다(1013). 레지듀얼 디코딩을 수행하게 되면, 상기 레지듀얼 신호의 길이 정보는 무시할 수 있다.As an example of the decoding method according to the selection, when the residual decoding is not performed, decoding of the residual signal by the length information of the residual signal may be omitted (1011). As a specific example, the bit or byte length information of the residual signal may be inserted into the data, and the decoding may be continued beyond the bit field of the residual signal by the amount obtained from the length information. As another example of the decoding method according to the selection, when the residual decoding is performed, the residual signal is parsed and the decoding is performed (1013). When residual decoding is performed, length information of the residual signal may be ignored.

도 11은 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우, 싱크워드를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.FIG. 11 is an embodiment to which the present invention is applied and is a flowchart illustrating a method of decoding a residual signal using a sync word when an audio signal is used for broadcasting.

오디오 신호를 처음부터 디코딩하지 않고 임의의 순간부터 디코딩하게 되어 이전에 전송한 헤더 정보를 이용할 수 없는 경우, 수신된 오디오 신호 중 헤더 정보가 탐색될 때까지 디코딩을 하지 않고 기다린다(1101). 헤더 정보가 오게 되면 헤더 파싱이 이루어진다(1103). 이후로는 상기 헤더 정보의 해석에 따라 데이터 정보를 디코딩하게 된다. 그리고, 전송된 오디오 신호로부터 확장 데이터 타입 정보를 추출한다(1105). 상기 확장 데이터 타입 정보에는 예를 들어, 레지듀얼 코딩 데이터, 임의의 다운믹스 레지듀얼 코딩 데이터, 임의의 트리 확장 데이터 등이 있을 수 있다. 상기 확장 데이터 타입 정보에 따라 레지듀얼 코딩 데이터가 존재하는 경 우, 디코딩부에서는 레지듀얼 신호를 디코딩할 것인지 여부를 선택하게 된다(1107).If the audio signal is not decoded from the beginning and decoded from an arbitrary moment and the previously transmitted header information is not available, the receiver waits without decoding until the header information of the received audio signal is found (1101). When the header information comes, header parsing is performed (1103). Thereafter, the data information is decoded according to the interpretation of the header information. Then, the extended data type information is extracted from the transmitted audio signal (1105). The extended data type information may include, for example, residual coding data, arbitrary downmix residual coding data, arbitrary tree extension data, and the like. If there is residual coding data according to the extended data type information, the decoding unit selects whether to decode the residual signal (1107).

상기 선택에 따른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하지 않게 되는 경우, 상기 레지듀얼 신호의 싱크워드를 찾을 때까지 레지듀얼 신호의 비트 필드를 계속 탐색한다. 싱크워드를 찾으면 탐색 과정을 멈추고 디코딩을 계속 진행한다. 즉, 레지듀얼 신호의 싱크워드를 찾을 때까지 레지듀얼 신호의 디코딩을 생략할 수 있다(1109). 또한, 상기 선택에 따른 다른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하게 되는 경우, 레지듀얼 신호를 파싱하고 디코딩을 수행하게 된다(1111). 레지듀얼 디코딩을 수행하게 되면, 상기 레지듀얼 신호의 싱크워드는 읽고 무시할 수 있다(1113).As an example of the decoding method according to the selection, when the residual decoding is not performed, the bit field of the residual signal is continuously searched until a syncword of the residual signal is found. If it finds a syncword, it stops the search process and continues decoding. That is, decoding of the residual signal may be omitted until a sync word of the residual signal is found (1109). As another example of the decoding method according to the selection, when the residual decoding is performed, the residual signal is parsed and the decoding is performed (1111). When residual decoding is performed, the sync word of the residual signal may be read and ignored (1113).

도 12은 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 길이 정보를 이용하여 프로파일 정보에 따른 레지듀얼 신호의 선택적 디코딩 방법을 설명하기 위한 흐름도이다.12 is a flowchart illustrating a selective decoding method of a residual signal according to profile information by using length information of the residual signal according to an embodiment to which the present invention is applied.

프로파일(Profile)이란 코딩 과정에서 알고리즘상 들어가는 기술적 구성요소를 규격화한 것을 의미한다. 즉, 비트스트림을 디코딩하기 위해 필요한 기술요소의 집합으로서 일종의 서브 규격이라 할 수 있다. 레벨(Level)이란, 프로파일에서 규정된 기술요소를 어느 범위까지 지원할 것인지를 정의한다. 즉, 디코더의 능력과 비트스트림의 복잡도를 정의하는 역할을 한다. 본 발명에 있어서, 프로파일 정보라 함은, 상기 프로파일과 레벨에 대한 정의를 모두 포함한다. Profile refers to the standardization of technical components that go into algorithms during coding. In other words, it is a kind of sub-standard that is a set of description elements necessary for decoding a bitstream. Level defines to what extent the technical elements specified in the profile are supported. In other words, it defines the capabilities of the decoder and the complexity of the bitstream. In the present invention, the profile information includes both definitions of the profile and the level.

이러한 프로파일 정보에 따라 디코딩 방법이 선택적으로 달라질 수 있다. 예 를 들어, 전송된 오디오 신호 내에 레지듀얼 코딩 데이터가 존재하더라도 상기 프로파일 정보에 따라 레지듀얼 디코딩을 수행하지 않을 수 있으며, 또는 레지듀얼 디코딩을 수행할 수도 있고, 또는 레지듀얼 디코딩을 수행하더라도 일정한 저주파 부분만을 이용할 수도 있다. 뿐만 아니라, 레지듀얼 디코딩을 수행하지 않기 위하여 레지듀얼 신호의 길이 정보만큼 스킵할 수도 있으며, 레지듀얼 신호는 모두 읽되 디코딩만 하지 않을 수도 있다. 또한, 레지듀얼 신호의 일부를 읽고 그 읽은 부분만 디코딩을 수행하고, 나머지는 디코딩을 수행하지 않을 수 있으며, 레지듀얼 신호의 전부를 읽되 일부는 디코딩을 하고 나머지는 디코딩을 수행하지 않을 수도 있다.The decoding method may be selectively changed according to this profile information. For example, even if there is residual coding data in the transmitted audio signal, residual decoding may not be performed according to the profile information, or residual decoding may be performed, or constant low frequency may be performed even if residual decoding is performed. Only parts can be used. In addition, in order not to perform the residual decoding, the length information of the residual signal may be skipped, and the residual signal may be read but not decoded. In addition, a part of the residual signal may be read and only the read part may be decoded, and the rest may not be decoded. The entire part of the residual signal may be read, but some of the residual signal may be decoded.

전송된 오디오 신호로부터 레지듀얼 신호의 길이 정보를 추출한다(1201). 그리고, 프로파일 정보에 따라 레지듀얼 신호를 선택적으로 디코딩할 수 있다(1203). 디코딩 장치가 프로파일 정보에 의해 레지듀얼 신호의 일정 저주파 부분만 디코딩할 수 있도록 제한되는 경우에, 디코딩 장치는 레지듀얼 신호의 길이 정보만큼 레지듀얼 신호의 일정 저주파 부분만 디코딩할 수 있게 된다(1205). 또한, 디코딩 장치가 프로파일 정보에 의해 레지듀얼 신호의 디코딩이 제한되는 경우에, 디코딩 장치는 레지듀얼 신호의 길이 정보만큼 레지듀얼 신호의 디코딩을 생략하게 된다(1207).The length information of the residual signal is extracted from the transmitted audio signal (1201). In operation 1203, the residual signal may be selectively decoded according to the profile information. When the decoding apparatus is limited to decode only a constant low frequency portion of the residual signal by the profile information, the decoding apparatus may decode only a constant low frequency portion of the residual signal by the length information of the residual signal (1205). . In addition, when the decoding apparatus is limited in decoding the residual signal by the profile information, the decoding apparatus skips decoding of the residual signal by the length information of the residual signal (1207).

도 13는 본 발명이 적용되는 실시예로서, 싱크워드를 이용하여 프로파일 정보에 따른 레지듀얼 신호의 선택적 디코딩 방법을 설명하기 위한 흐름도이다.FIG. 13 is a flowchart illustrating a selective decoding method of a residual signal according to profile information by using a sync word according to an embodiment to which the present invention is applied.

전송된 오디오 신호로부터 레지듀얼 신호의 싱크워드를 추출한다(1301). 그 리고, 프로파일 정보에 따라 레지듀얼 신호를 선택적으로 디코딩할 수 있다(1303). 디코딩 장치가 프로파일 정보에 의해 레지듀얼 신호의 일정 저주파 부분만 디코딩할 수 있도록 제한되는 경우에, 디코딩 장치는 싱크워드가 추출될 때까지 레지듀얼 신호의 일정 저주파 부분만 디코딩할 수 있게 된다(1305). 또한, 디코딩 장치가 프로파일 정보에 의해 레지듀얼 신호의 디코딩을 할 수 없도록 제한되는 경우에는 싱크워드가 추출될 때까지 레지듀얼 신호의 디코딩을 생략하게 된다(1307).A syncword of the residual signal is extracted from the transmitted audio signal (1301). In operation 1303, the residual signal may be selectively decoded according to the profile information. When the decoding apparatus is limited to decode only a constant low frequency portion of the residual signal by the profile information, the decoding apparatus may decode only a constant low frequency portion of the residual signal until the syncword is extracted (1305). . In addition, when the decoding apparatus is restricted from decoding the residual signal by the profile information, decoding of the residual signal is omitted until the syncword is extracted (1307).

도 14a는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 장치를 설명하기 위한 블록도이다.FIG. 14A is a block diagram illustrating an apparatus for decoding a residual signal using length information of the residual signal in an embodiment to which the present invention is applied.

상기 장치는 데이터 타입 정보 추출부(1401)와 길이 정보 추출부(1403)와 디코딩부(1405)를 포함한다. 데이터 타입 정보 추출부(1401)는 전송된 오디오 신호로부터 확장 데이터 타입 정보를 추출한다. 길이 정보 추출부(1403)는 확장 데이터 타입 정보에 따라 레지듀얼 코딩 데이터가 존재하는 경우, 레지듀얼 신호의 길이 정보를 추출한다. 디코딩부(1405)에서는 레지듀얼 신호를 디코딩할 것인지 여부를 선택하게 된다. 상기 선택에 따라 레지듀얼 디코딩을 수행하지 않게 되는 경우, 레지듀얼 신호의 길이 정보만큼 레지듀얼 신호의 디코딩을 생략할 수 있다. 또한, 다른 선택에 따라 레지듀얼 디코딩을 수행하게 되는 경우, 레지듀얼 신호를 파싱하고 디코딩을 수행하게 된다.The apparatus includes a data type information extractor 1401, a length information extractor 1403, and a decoder 1405. The data type information extractor 1401 extracts extended data type information from the transmitted audio signal. The length information extractor 1403 extracts length information of the residual signal when the residual coding data exists according to the extended data type information. The decoding unit 1405 selects whether to decode the residual signal. When the residual decoding is not performed according to the selection, the decoding of the residual signal may be omitted as much as the length information of the residual signal. In addition, when the residual decoding is performed according to another selection, the residual signal is parsed and the decoding is performed.

도 14b는 본 발명이 적용되는 실시예로서, 싱크워드를 이용하여 레지듀얼 신호를 디코딩하는 장치를 설명하기 위한 블록도이다.FIG. 14B is a block diagram illustrating an apparatus for decoding a residual signal using a sync word according to an embodiment to which the present invention is applied.

상기 장치는 데이터 타입 정보 추출부(1411)와 싱크워드 추출부(1413)와 디 코딩부(1415)를 포함한다. 데이터 타입 정보 추출부(1411)는 전송된 오디오 신호로부터 확장 데이터 타입 정보를 추출한다. 싱크워드 추출부(1413)는 전송된 오디오 신호로부터 싱크워드를 추출한다. 디코딩부(1415)에서는 확장 데이터 타입 정보에 따라 레지듀얼 코딩 데이터가 존재하는 경우, 레지듀얼 신호를 디코딩할 것인지 여부를 선택하게 된다. 상기 선택에 따른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하지 않게 되는 경우, 레지듀얼 신호의 싱크워드를 찾을 때까지 레지듀얼 신호의 비트 필드를 계속 탐색한다. 싱크워드를 찾으면 탐색 과정을 멈추고 디코딩을 계속 진행한다. 즉, 레지듀얼 신호의 싱크워드를 찾을 때까지 레지듀얼 신호의 디코딩을 생략할 수 있다. 또한, 상기 선택에 따른 다른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하게 되는 경우, 레지듀얼 신호를 파싱하고 디코딩을 수행하게 된다.The apparatus includes a data type information extractor 1411, a syncword extractor 1413, and a decoder 1415. The data type information extractor 1411 extracts extended data type information from the transmitted audio signal. The syncword extractor 1413 extracts a syncword from the transmitted audio signal. The decoding unit 1415 selects whether or not to decode the residual signal when the residual coding data exists according to the extended data type information. As an example of the decoding method according to the selection, when the residual decoding is not performed, the bit field of the residual signal is continuously searched until a syncword of the residual signal is found. If it finds a syncword, it stops the search process and continues decoding. That is, decoding of the residual signal may be omitted until the sync word of the residual signal is found. In addition, as an example of another decoding method according to the selection, when the residual decoding is performed, the residual signal is parsed and the decoding is performed.

도 15는 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우 오디오 신호를 디코딩하는 장치를 설명하기 위한 블록도이다.FIG. 15 is an embodiment to which the present invention is applied and is a block diagram illustrating an apparatus for decoding an audio signal when using the audio signal for broadcasting.

상기 장치는 헤더 탐색부(1501)와 헤더 파싱부(1503)를 포함한다. 헤더 탐색부(1501)는 전송된 오디오 신호로부터 헤더 정보가 존재하는지를 탐색한다. 이 경우, 헤더 정보가 탐색될 때까지 디코딩은 하지 않고 기다리게 된다. 헤더 정보를 찾게 된 경우, 헤더 파싱부(1503)는 헤더 정보로부터 확장 데이터 타입 정보를 추출한다. 여기서, 헤더 탐색은 처음 한 번 이루어지고, 헤더 정보 해석도 헤더를 찾은 후 한 번만 수행된다.The apparatus includes a header searcher 1501 and a header parser 1503. The header search unit 1501 searches whether header information exists from the transmitted audio signal. In this case, it waits without decoding until the header information is found. When the header information is found, the header parser 1503 extracts extended data type information from the header information. Here, the header search is performed once, and the header information interpretation is only performed once after finding the header.

본 발명을 이용하여 디코딩을 수행할 경우, 레지듀얼 코딩 데이터에 대하여 선택적으로 디코딩을 수행함으로써 보다 효율적인 디코딩을 수행할 수 있다. 레지듀얼 디코딩을 수행하는 경우에는 오디오 신호의 음질을 보다 향상시킬 수 있으며, 레지듀얼 디코딩을 수행하지 않는 경우에는 연산량, 복잡도를 줄일 수 있는 효과가 있다. 뿐만 아니라, 레지듀얼 디코딩을 수행하더라도 일정 저주파 부분만을 디코딩함으로써 음질을 향상시킴과 동시에 연산량을 줄일 수도 있다. When decoding is performed using the present invention, it is possible to perform decoding more efficiently by selectively decoding residual coded data. When the residual decoding is performed, the sound quality of the audio signal may be further improved. When the residual decoding is not performed, the amount of computation and the complexity may be reduced. In addition, even if the residual decoding is performed, only a certain low frequency portion may be decoded to improve sound quality and to reduce computation.

또한, 오디오 신호 내에 헤더 정보를 적어도 두 번이상 포함시킴으로서, 오디오 신호를 방송 등에 이용할 경우에 임의의 순간부터 오디오 신호를 디코딩할 수 있는 효과가 있다.Also, by including the header information at least twice in the audio signal, the audio signal can be decoded from an arbitrary moment when the audio signal is used for broadcasting or the like.

Claims (20)

확장 데이터 타입 정보를 추출하는 단계;Extracting extended data type information; 상기 확장 데이터 타입 정보에 따라 레지듀얼 신호가 존재하는 경우, 상기 레지듀얼 신호의 길이 정보를 추출하는 단계;Extracting length information of the residual signal when there is a residual signal according to the extension data type information; 를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법. Multi-channel audio signal decoding method comprising a. 제 1항에 있어서, 상기 멀티 채널 오디오 신호 디코딩 방법은,The method of claim 1, wherein the multi-channel audio signal decoding method comprises: 상기 레지듀얼 신호의 길이 정보만큼 상기 레지듀얼 신호의 디코딩을 생략하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법.And decoding the residual signal by the length information of the residual signal. 제 1항 또는 제 2항에 있어서,The method according to claim 1 or 2, 상기 레지듀얼 신호의 길이 정보는 레지듀얼 신호의 길이에 따라 적응적으로 비트 할당되는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법.The length information of the residual signal is adaptively allocated bits according to the length of the residual signal. 제 1항 또는 제 2항에 있어서,The method according to claim 1 or 2, 상기 레지듀얼 신호의 길이 정보는 레지듀얼 신호의 헤더 길이를 나타내는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법.The length information of the residual signal indicates a header length of the residual signal. 제 1항 또는 제 2항에 있어서,The method according to claim 1 or 2, 상기 레지듀얼 신호의 길이 정보는 레지듀얼 신호의 프레임 길이를 나타내는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법.The length information of the residual signal indicates a frame length of the residual signal. 확장 데이터 타입 정보를 추출하는 단계;Extracting extended data type information; 상기 확장 데이터 타입 정보에 따라 레지듀얼 신호가 존재하는 경우, 상기 레지듀얼 신호의 싱크워드를 추출하는 단계를 포함하되,If there is a residual signal according to the extended data type information, extracting a sync word of the residual signal, 상기 싱크워드가 추출될 때까지 상기 레지듀얼 신호의 디코딩을 생략하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법.And decoding the residual signal until the syncword is extracted. 오디오 신호로부터 헤더 정보를 서치하는 단계;Searching for header information from an audio signal; 상기 헤더 정보로부터 확장 데이터 타입 정보를 추출하는 단계를 포함하되,Extracting extended data type information from the header information; 상기 헤더 정보는 상기 오디오 신호에 적어도 두 번이상 포함되어 있는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법.And the header information is included at least twice in the audio signal. 제 7항에 있어서,The method of claim 7, wherein 상기 오디오 신호는 공간정보 신호에 연속하는 레지듀얼 신호를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법.The audio signal includes a residual signal continuous to the spatial information signal. 제 8항에 있어서, 상기 멀티 채널 오디오 신호 디코딩 방법은,The method of claim 8, wherein the multi-channel audio signal decoding method comprises: 상기 확장 데이터 타입 정보에 따라 레지듀얼 디코딩을 수행하는 단계를 더 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법.And performing residual decoding according to the extended data type information. 제 8항에 있어서, 상기 멀티 채널 오디오 신호 디코딩 방법은,The method of claim 8, wherein the multi-channel audio signal decoding method comprises: 상기 확장 데이터 타입 정보에 따라 레지듀얼 신호가 존재하는 경우, 상기 레지듀얼 신호의 길이 정보를 추출하는 단계를 더 포함하고,If there is a residual signal according to the extended data type information, extracting length information of the residual signal; 상기 레지듀얼 신호의 길이 정보만큼 상기 레지듀얼 신호의 디코딩을 생략하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법.And decoding the residual signal by the length information of the residual signal. 제 8항에 있어서, 상기 멀티 채널 오디오 신호 디코딩 방법은,The method of claim 8, wherein the multi-channel audio signal decoding method comprises: 상기 확장 데이터 타입 정보에 따라 레지듀얼 신호가 존재하는 경우, 상기 레지듀얼 신호의 싱크워드를 추출하는 단계를 더 포함하고,If there is a residual signal according to the extension data type information, extracting a sync word of the residual signal; 상기 싱크워드가 추출될 때까지 상기 레지듀얼 신호의 디코딩을 생략하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법.And decoding the residual signal until the syncword is extracted. 프로파일 정보에 따라 레지듀얼 신호를 선택적으로 디코딩하는 방법으로서,A method of selectively decoding a residual signal according to profile information, 오디오 신호로부터 레지듀얼 신호의 길이 정보를 추출하는 단계;Extracting length information of the residual signal from the audio signal; 상기 레지듀얼 신호의 길이 정보만큼 상기 레지듀얼 신호를 선택적으로 디코딩하는 단계;Selectively decoding the residual signal by the length information of the residual signal; 를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법.Multi-channel audio signal decoding method comprising a. 제 12항에 있어서,The method of claim 12, 상기 선택적으로 디코딩하는 단계는, 상기 프로파일 정보에 따라 상기 레지듀얼 신호의 디코딩을 생략하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법.In the selectively decoding, the decoding of the residual signal according to the profile information is omitted, multi-channel audio signal decoding method. 제 12항에 있어서,The method of claim 12, 상기 선택적으로 디코딩하는 단계는, 상기 프로파일 정보에 따라 상기 레지듀얼 신호의 일정 저주파 부분만 디코딩하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법.The selectively decoding may include decoding only a predetermined low frequency portion of the residual signal according to the profile information. 프로파일 정보에 따라 레지듀얼 신호를 선택적으로 디코딩하는 방법으로서,A method of selectively decoding a residual signal according to profile information, 오디오 신호로부터 레지듀얼 신호의 싱크워드를 추출하는 단계;Extracting a syncword of the residual signal from the audio signal; 상기 싱크워드가 추출될 때까지 상기 레지듀얼 신호를 선택적으로 디코딩하는 단계;Selectively decoding the residual signal until the syncword is extracted; 를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법.Multi-channel audio signal decoding method comprising a. 확장 데이터 타입 정보를 추출하는 데이터 타입 정보 추출부;A data type information extracting unit for extracting extended data type information; 레지듀얼 신호의 길이 정보를 추출하는 길이 정보 추출부;A length information extracting unit extracting length information of the residual signal; 를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 장치. Multi-channel audio signal decoding apparatus comprising a. 제 16항에 있어서, The method of claim 16, 상기 레지듀얼 신호의 길이 정보만큼 레지듀얼 디코딩을 생략하고 디코딩을 수행하는 디코딩부를 더 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 장치.And a decoding unit configured to omit residual decoding and perform decoding as much as length information of the residual signal. 제 16항에 있어서,The method of claim 16, 상기 레지듀얼 신호의 일정 저주파 부분만 디코딩하는 디코딩부를 더 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 장치. And a decoding unit for decoding only a predetermined low frequency portion of the residual signal. 확장 데이터 타입 정보를 데이터 타입 정보 추출부;A data type information extracting unit for expanding data type information; 레지듀얼 신호의 싱크워드를 추출하는 싱크워드 추출부;A sync word extracting unit extracting a sync word of the residual signal; 상기 싱크워드가 추출된 이후 디코딩을 수행하는 디코딩부;A decoding unit which performs decoding after the syncword is extracted; 를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 장치.Multi-channel audio signal decoding apparatus comprising a. 헤더 정보를 적어도 두 번 이상 포함하는 오디오 신호로부터 헤더 정보를 서치하는 헤더 탐색부;A header search unit for searching for header information from an audio signal including header information at least twice; 상기 헤더 정보로부터 확장 데이터 타입 정보를 추출하는 헤더 파싱부를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 장치.And a header parser to extract extended data type information from the header information.
KR1020070013364A 2006-02-23 2007-02-08 Method and apparatus for decoding multi-channel audio signal KR20070087494A (en)

Priority Applications (39)

Application Number Priority Date Filing Date Title
US12/280,314 US7974287B2 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
PCT/KR2007/000867 WO2007097551A1 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
JP2008556238A JP5254808B2 (en) 2006-02-23 2007-02-16 Audio signal processing method and apparatus
ES07709016T ES2391117T3 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
ES07709017T ES2407820T3 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
AU2007218453A AU2007218453B2 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
EP07709014.0A EP1987594B1 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
JP2008556240A JP5394753B2 (en) 2006-02-23 2007-02-16 Audio signal processing method and apparatus
US12/280,313 US7991494B2 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
CN200780001487.3A CN101361275B (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
PCT/KR2007/000865 WO2007097549A1 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
TW096106320A TWI333795B (en) 2006-02-23 2007-02-16 Method and apparatus for processing a audio signal
CN2007800014801A CN101361274B (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
CN200780001528.9A CN101361277B (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
TW096106318A TWI333644B (en) 2006-02-23 2007-02-16 Method and apparatus for processing a audio signal
TW096106319A TWI336599B (en) 2006-02-23 2007-02-16 Method and apparatus for processing a audio signal
KR1020087021418A KR101276849B1 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
PCT/KR2007/000868 WO2007097552A1 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
JP2008556239A JP5390197B2 (en) 2006-02-23 2007-02-16 Audio signal processing method and apparatus
KR1020087005983A KR100904436B1 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
TW098123546A TWI447707B (en) 2006-02-23 2007-02-16 Method and apparatus for processing a audio signal
JP2008556241A JP5394754B2 (en) 2006-02-23 2007-02-16 Audio signal processing method and apparatus
EP07709016A EP1987596B1 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
KR1020087005986A KR100904439B1 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
ES07709014T ES2413807T3 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
CN200780001517.0A CN101361276B (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
KR1020087005984A KR100904437B1 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
ES07709015T ES2391116T3 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
RU2008137781/09A RU2404507C2 (en) 2006-02-23 2007-02-16 Audio signal processing method and device
TW096106321A TWI337341B (en) 2006-02-23 2007-02-16 Method and apparatus for processing a audio signal
BRPI0706488-8A BRPI0706488A2 (en) 2006-02-23 2007-02-16 method and apparatus for processing audio signal
EP07709017.3A EP1987597B1 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
KR1020087005985A KR100904438B1 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
US12/280,323 US7991495B2 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
PCT/KR2007/000866 WO2007097550A1 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
US12/280,309 US7881817B2 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
EP07709015A EP1987595B1 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
CA2636330A CA2636330C (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal
HK09105053.4A HK1127825A1 (en) 2006-02-23 2009-06-05 Method and apparatus for processing an audio signal

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US77577506P 2006-02-23 2006-02-23
US60/775,775 2006-02-23
US79190706P 2006-04-14 2006-04-14
US60/791,907 2006-04-14

Publications (1)

Publication Number Publication Date
KR20070087494A true KR20070087494A (en) 2007-08-28

Family

ID=38613498

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070013364A KR20070087494A (en) 2006-02-23 2007-02-08 Method and apparatus for decoding multi-channel audio signal

Country Status (2)

Country Link
KR (1) KR20070087494A (en)
RU (1) RU2404507C2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009054665A1 (en) * 2007-10-22 2009-04-30 Electronics And Telecommunications Research Institute Multi-object audio encoding and decoding method and apparatus thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009054665A1 (en) * 2007-10-22 2009-04-30 Electronics And Telecommunications Research Institute Multi-object audio encoding and decoding method and apparatus thereof

Also Published As

Publication number Publication date
RU2008137781A (en) 2010-03-27
RU2404507C2 (en) 2010-11-20

Similar Documents

Publication Publication Date Title
KR100904439B1 (en) Method and apparatus for processing an audio signal
US8867612B2 (en) Decoding method for decoding an incoming bitstream and method for performing the same
US20090216542A1 (en) Method and apparatus for encoding and decoding an audio signal
KR20070087494A (en) Method and apparatus for decoding multi-channel audio signal
AU2007218453B2 (en) Method and apparatus for processing an audio signal
JP2011085643A (en) Decoder, information processor and voice compression format determination method
KR20070003574A (en) Method and apparatus for encoding and decoding an audio signal