KR20070087494A - Method and apparatus for decoding multi-channel audio signal - Google Patents
Method and apparatus for decoding multi-channel audio signal Download PDFInfo
- Publication number
- KR20070087494A KR20070087494A KR1020070013364A KR20070013364A KR20070087494A KR 20070087494 A KR20070087494 A KR 20070087494A KR 1020070013364 A KR1020070013364 A KR 1020070013364A KR 20070013364 A KR20070013364 A KR 20070013364A KR 20070087494 A KR20070087494 A KR 20070087494A
- Authority
- KR
- South Korea
- Prior art keywords
- decoding
- information
- residual signal
- signal
- residual
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 116
- 238000000034 method Methods 0.000 title claims abstract description 88
- 238000010586 diagram Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Synchronisation In Digital Transmission Systems (AREA)
Abstract
Description
도 1은 본 발명이 적용되는 실시예로서, 멀티 채널 오디오 신호 처리 장치의 개략적인 블록도를 나타낸다.1 is a schematic block diagram of a multi-channel audio signal processing apparatus according to an embodiment to which the present invention is applied.
도 2는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 디코딩 방법을 설명하기 위한 흐름도이다.2 is a flowchart illustrating a method of decoding a residual signal in an embodiment to which the present invention is applied.
도 3a ~ 도 3c는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 길이 정보를 정의하는 방법들을 나타낸다.3A to 3C are diagrams illustrating methods for defining length information of a residual signal according to an embodiment to which the present invention is applied.
도 4a는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 헤더 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.4A is a flowchart illustrating a method of decoding a residual signal using header length information of the residual signal according to an embodiment to which the present invention is applied.
도 4b는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 데이터 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.4B is a flowchart illustrating a method of decoding a residual signal using data length information of the residual signal in an embodiment to which the present invention is applied.
도 5는 본 발명이 적용되는 실시예로서, 싱크워드를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.5 is a flowchart illustrating a method of decoding a residual signal using a sync word according to an embodiment to which the present invention is applied.
도 6a는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 하나의 오디오 신호를 이루는 파일/일반 스트리밍 구조를 나타낸다.FIG. 6A is an embodiment to which the present invention is applied and shows a file / general streaming structure in which a downmix signal and a spatial information signal constitute one audio signal.
도 6b는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 독립적인 신호를 이루는 파일/일반 스트리밍 구조를 나타낸다.6B illustrates a file / general streaming structure in which a downmix signal and a spatial information signal form independent signals according to an embodiment to which the present invention is applied.
도 7a는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 하나의 오디오 신호를 이루는 방송용 스트리밍 구조를 나타낸다.FIG. 7A is an embodiment to which the present invention is applied and shows a broadcast streaming structure in which a downmix signal and a spatial information signal constitute one audio signal.
도 7b는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 독립적인 오디오 신호를 이루는 방송용 스트리밍 구조를 나타낸다.FIG. 7B is an embodiment to which the present invention is applied and shows a broadcasting streaming structure in which a downmix signal and a spatial information signal form independent audio signals.
도 8은 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우 오디오 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.8 is an embodiment to which the present invention is applied and is a flowchart illustrating a method of decoding an audio signal when the audio signal is used for broadcasting.
도 9는 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우 오디오 신호를 디코딩하는 다른 방법을 설명하기 위한 흐름도이다.9 is an embodiment to which the present invention is applied and is a flowchart illustrating another method of decoding an audio signal when the audio signal is used for broadcasting.
도 10는 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우, 레지듀얼 신호의 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.FIG. 10 is a flowchart illustrating a method of decoding a residual signal using length information of the residual signal when an audio signal is used for broadcasting, etc. according to an embodiment to which the present invention is applied.
도 11은 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우, 싱크워드를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.FIG. 11 is an embodiment to which the present invention is applied and is a flowchart illustrating a method of decoding a residual signal using a sync word when an audio signal is used for broadcasting.
도 12은 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 길이 정보를 이용하여 프로파일 정보에 따른 레지듀얼 신호의 선택적 디코딩 방법을 설명하기 위한 흐름도이다.12 is a flowchart illustrating a selective decoding method of a residual signal according to profile information by using length information of the residual signal according to an embodiment to which the present invention is applied.
도 13는 본 발명이 적용되는 실시예로서, 싱크워드를 이용하여 프로파일 정보에 따른 레지듀얼 신호의 선택적 디코딩 방법을 설명하기 위한 흐름도이다.FIG. 13 is a flowchart illustrating a selective decoding method of a residual signal according to profile information by using a sync word according to an embodiment to which the present invention is applied.
도 14a는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 장치를 설명하기 위한 블록도이다.FIG. 14A is a block diagram illustrating an apparatus for decoding a residual signal using length information of the residual signal in an embodiment to which the present invention is applied.
도 14b는 본 발명이 적용되는 실시예로서, 싱크워드를 이용하여 레지듀얼 신호를 디코딩하는 장치를 설명하기 위한 블록도이다.FIG. 14B is a block diagram illustrating an apparatus for decoding a residual signal using a sync word according to an embodiment to which the present invention is applied.
도 15는 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우 오디오 신호를 디코딩하는 장치를 설명하기 위한 블록도이다.FIG. 15 is an embodiment to which the present invention is applied and is a block diagram illustrating an apparatus for decoding an audio signal when using the audio signal for broadcasting.
< 도면의 주요부분에 대한 부호의 설명 ><Description of Symbols for Major Parts of Drawings>
101: 인코딩 장치 103: 공간 정보 인코딩부101: encoding device 103: spatial information encoding unit
105: 다운믹싱부 107: 디코딩부 105: downmixing unit 107: decoding unit
1401: 데이터 타입 정보 추출부 1403: 길이 정보 추출부1401: data type information extraction unit 1403: length information extraction unit
1405: 디코딩부 1411: 데이터 타입 정보 추출부 1413: 싱크워드 추출부 1415: 디코딩부1405: decoding unit 1411: data type information extracting unit 1413: syncword extracting unit 1415: decoding unit
1501: 헤더 탐색부 1503: 헤더 파싱부1501: header search unit 1503: header parser
본 발명은 멀티 채널 오디오 신호의 디코딩 방법 및 장치에 관한 것으로서, 더욱 상세하게는 레지듀얼 신호를 디코딩하는 방법 및 장치에 관한 것이다.The present invention relates to a method and apparatus for decoding a multi-channel audio signal, and more particularly, to a method and apparatus for decoding a residual signal.
레지듀얼 신호란 원신호와 코딩된 신호와의 차이에 해당되는 신호를 말하는데, 디코더가 무조건적으로 레지듀얼 디코딩을 수행하도록 하면 디코더에 따라 음 질이 향상될 수도 있으나, 복잡도가 높아지고 연산량이 많아지는 문제가 있다. The residual signal is a signal corresponding to the difference between the original signal and the coded signal. If the decoder performs the residual decoding unconditionally, the sound quality may be improved depending on the decoder, but the complexity and the amount of computation are increased. There is.
또한, 일반적으로 오디오 신호의 헤더 정보는 불변이므로 비트스트림에 한 번만 헤더 정보를 삽입한다. 그러나 비트스트림에 한 번만 헤더 정보를 삽입하게 되면, 방송용이나 VOD 등과 같이 임의의 순간부터 오디오 신호를 재생하여야 할 경우에 헤더 정보가 없어 데이터 프레임 정보를 디코딩하지 못하는 문제가 있다.Also, since header information of an audio signal is generally immutable, header information is inserted only once in a bitstream. However, if the header information is inserted only once in the bitstream, there is a problem in that the data frame information cannot be decoded because there is no header information when the audio signal needs to be reproduced from an arbitrary moment such as broadcasting or VOD.
본 발명의 목적은, 멀티 채널 오디오 신호의 디코딩 효율을 향상시킬 수 있는 디코딩 방법 및 장치를 제공함에 있다.An object of the present invention is to provide a decoding method and apparatus capable of improving the decoding efficiency of a multi-channel audio signal.
본 발명의 다른 목적은, 레지듀얼 신호의 디코딩 효율을 향상시킬 수 있는 디코딩 방법 및 장치를 제공함에 있다.Another object of the present invention is to provide a decoding method and apparatus capable of improving the decoding efficiency of a residual signal.
본 발명의 또 다른 목적은, 오디오 신호의 음질을 향상시킬 수 있는 디코딩 방법 및 장치를 제공함에 있다.Still another object of the present invention is to provide a decoding method and apparatus capable of improving sound quality of an audio signal.
본 발명의 또 다른 목적은, 방송용 오디오 신호의 디코딩 효율을 향상시킬 수 있는 디코딩 방법 및 장치를 제공함에 있다.Still another object of the present invention is to provide a decoding method and apparatus capable of improving the decoding efficiency of a broadcast audio signal.
상기 목적을 달성하기 위하여 본 발명은, 확장 데이터 타입 정보를 추출하는 단계와 상기 확장 데이터 타입 정보에 따라 레지듀얼 신호가 존재하는 경우, 상기 레지듀얼 신호의 길이 정보를 추출하는 단계를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법을 제공한다.In order to achieve the above object, the present invention includes extracting extended data type information and extracting length information of the residual signal when a residual signal exists according to the extended data type information. A multi-channel audio signal decoding method is provided.
또한, 본 발명은 확장 데이터 타입 정보를 추출하는 단계와 상기 확장 데이 터 타입 정보에 따라 레지듀얼 신호가 존재하는 경우, 상기 레지듀얼 신호의 싱크워드를 추출하는 단계를 포함하되, 상기 싱크워드가 추출될 때까지 상기 레지듀얼 신호의 디코딩을 생략하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법을 제공한다.The present invention also includes extracting extended data type information and extracting a syncword of the residual signal when a residual signal exists according to the extended data type information, wherein the syncword is extracted. It provides a method for decoding a multi-channel audio signal, characterized in that the decoding of the residual signal is omitted until.
또한, 본 발명은 오디오 신호로부터 헤더 정보를 서치하는 단계와 상기 헤더 정보로부터 확장 데이터 타입 정보를 추출하는 단계를 포함하되, 상기 헤더 정보는 상기 오디오 신호에 적어도 두 번이상 포함되어 있는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법을 제공한다.The present invention also includes searching for header information from an audio signal and extracting extended data type information from the header information, wherein the header information is included at least twice in the audio signal. Provided are a multi-channel audio signal decoding method.
또한, 본 발명은 프로파일 정보에 따라 레지듀얼 신호를 선택적으로 디코딩하는 방법으로서, 오디오 신호로부터 레지듀얼 신호의 길이 정보를 추출하는 단계와 상기 레지듀얼 신호의 길이 정보만큼 상기 레지듀얼 신호를 선택적으로 디코딩하는 단계를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법을 제공한다.The present invention also provides a method for selectively decoding a residual signal according to profile information, the method comprising: extracting length information of a residual signal from an audio signal and selectively decoding the residual signal by the length information of the residual signal. It provides a multi-channel audio signal decoding method comprising the step of.
또한, 본 발명은 프로파일 정보에 따라 레지듀얼 신호를 선택적으로 디코딩하는 방법으로서, 오디오 신호로부터 레지듀얼 신호의 싱크워드를 추출하는 단계와 상기 싱크워드가 추출될 때까지 상기 레지듀얼 신호를 선택적으로 디코딩하는 단계를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 방법을 제공한다.The present invention also provides a method of selectively decoding a residual signal according to profile information, the method comprising: extracting a syncword of a residual signal from an audio signal and selectively decoding the residual signal until the syncword is extracted; It provides a multi-channel audio signal decoding method comprising the step of.
또한, 본 발명은 확장 데이터 타입 정보를 추출하는 데이터 타입 정보 추출부와 레지듀얼 신호의 길이 정보를 추출하는 길이 정보 추출부를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 장치를 제공한다.The present invention also provides a multi-channel audio signal decoding apparatus comprising a data type information extracting unit for extracting extended data type information and a length information extracting unit for extracting length information of the residual signal.
또한, 본 발명은 확장 데이터 타입 정보를 데이터 타입 정보 추출부와 레지듀얼 신호의 싱크워드를 추출하는 싱크워드 추출부와 상기 싱크워드가 추출된 이후 디코딩을 수행하는 디코딩부를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 장치를 제공한다.In addition, the present invention includes a sync word extracting unit for extracting a sync word of a residual signal and a data type information extracting unit, and a decoding unit for decoding after the sync word is extracted. Provided is a channel audio signal decoding apparatus.
또한, 본 발명은 헤더 정보를 적어도 두 번 이상 포함하는 오디오 신호로부터 헤더 정보를 서치하는 헤더 서치부와 상기 헤더 정보로부터 확장 데이터 타입 정보를 추출하는 헤더 파싱부를 포함하는 것을 특징으로 하는 멀티 채널 오디오 신호 디코딩 장치를 제공한다.The present invention also provides a multi-channel audio signal, comprising: a header searcher for searching header information from an audio signal including at least two times of header information, and a header parser for extracting extended data type information from the header information. Provided is a decoding apparatus.
상술한 목적 및 구성의 특징은 첨부된 도면과 관련하여 다음의 상세한 설명을 통하여 보다 명확해질 것이다. 이하 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예들를 상세히 설명한다.The above objects and features of the construction will become more apparent from the following detailed description taken in conjunction with the accompanying drawings. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
아울러, 본 발명에서 사용되는 용어는 가능한 한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우는 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재하였으므로, 단순한 용어의 명칭이 아닌 용어가 가지는 의미로서 본 발명을 파악하여야 함을 밝혀두고자 한다.In addition, the terms used in the present invention was selected as a general term widely used as possible now, but in some cases, the term is arbitrarily selected by the applicant, in which case the meaning is described in detail in the description of the invention, It is to be understood that the present invention is to be understood as the meaning of terms rather than the names of terms.
도 1은 본 발명이 적용되는 실시예로서, 멀티 채널 오디오 신호 처리 장치의 개략적인 블록도를 나타낸다.1 is a schematic block diagram of a multi-channel audio signal processing apparatus according to an embodiment to which the present invention is applied.
멀티 채널 오디오 신호 처리 장치는 크게 인코딩 장치(101)와 디코딩 장치(107)를 포함하고, 인코딩 장치는 공간정보 인코딩부(103)와 다운믹싱부(105)를 포함한다. 공간정보 인코딩부(103)는 멀티 채널 오디오 신호로부터 추출된 공간정보를 이용하여 공간정보 신호를 생성한다. 다운믹싱부(105)는 멀티 채널 오디오 신호를 다운믹싱하여 다운믹스 신호를 생성한다. 다운믹스 신호는 인위적으로 생성될 수도 있다. 이처럼 생성된 다운믹스 신호와 공간정보 신호는 하나의 비트스트림 형태로 디코딩 장치(107)에 전송될 수 있으며, 또는 공간정보 신호와 다운믹스 신호 각각의 독립적인 비트스트림 형태로 디코딩 장치(107)에 전송될 수 있다. 공간정보 신호 내에는 레지듀얼 신호가 포함될 수 있는데, 멀티 채널 오디오 신호를 효율적으로 디코딩하기 위하여 레지듀얼 신호를 효율적으로 디코딩할 필요가 있다.The multi-channel audio signal processing apparatus largely includes an
도 2는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 디코딩 방법을 설명하기 위한 흐름도이다.2 is a flowchart illustrating a method of decoding a residual signal in an embodiment to which the present invention is applied.
레지듀얼 신호(residual signal)란, 원 신호와 코딩된 신호와의 차이에 해당되는 신호를 의미한다. 여기에서 레지듀얼 신호는 일반적인 레지듀얼 신호와 임의의 다운믹스 신호의 보정을 위한 임의의 다운믹스 레지듀얼 신호를 총칭한다. 멀티 채널 오디오 코딩에서 레지듀얼 신호는 다음과 같은 경우 등에 사용할 수 있다. 예를 들어, 임의의 다운믹스(Artistic Downmix) 신호에 대한 보정용으로 사용할 수 있으며, 디코딩 중에 특정 채널 보정용으로도 사용할 수 있다. 또한, 두 가지 예의 경우를 모두 사용할 수도 있다. 입력된 오디오 신호는 레지듀얼 신호를 이용함으로써, 보다 원 신호에 가깝게 복원될 수 있어 음질이 향상될 수 있다. 또한, 필요한 경우 레지듀얼 신호를 디코딩하지 않음으로써 연산량을 줄일 수 있게 된다. The residual signal refers to a signal corresponding to the difference between the original signal and the coded signal. Here, the residual signal generically refers to a general residual signal and an arbitrary downmix residual signal for correction of an arbitrary downmix signal. In multi-channel audio coding, the residual signal may be used in the following cases. For example, it can be used for correction of an arbitrary downmix signal and can also be used for specific channel correction during decoding. In addition, both examples may be used. The input audio signal can be restored closer to the original signal by using the residual signal, so that the sound quality can be improved. In addition, the amount of computation can be reduced by not decoding the residual signal if necessary.
먼저, 전송된 오디오 신호로부터 확장 데이터 타입 정보를 추출한다(201). 확장 데이터 타입 정보란, 공간정보 신호의 확장된 데이터 타입을 의미한다. 예를 들어, 확장 데이터 타입 정보에는 레지듀얼 코딩 데이터, 임의의 다운믹스 레지듀얼 코딩 데이터, 임의의 트리 확장 데이터 등이 있을 수 있다. 확장 데이터 타입 정보에 따라 레지듀얼 코딩 데이터가 존재하는 경우, 레지듀얼 신호의 길이 정보를 추출한다(203). 이 경우, 디코딩부에서는 레지듀얼 신호를 디코딩할 것인지 여부를 선택하게 된다(205). 상기 선택은 예를 들어, 프로파일, 레벨 등의 정보를 참조하여 디코딩 장치에서 독립적으로 판단할 수 있다. 또한, 디코딩 장치의 연산량, 복잡도(complexity), 코드 사이즈, 메모리 사용량 등에 따라 달라질 수도 있다. First, extended data type information is extracted from the transmitted audio signal (201). Extended data type information refers to an extended data type of a spatial information signal. For example, the extension data type information may include residual coding data, arbitrary downmix residual coding data, arbitrary tree extension data, and the like. If residual coding data is present according to the extended data type information, length information of the residual signal is extracted (203). In this case, the decoding unit selects whether to decode the residual signal (205). For example, the selection may be independently determined by the decoding apparatus with reference to information such as a profile and a level. In addition, it may vary depending on the calculation amount, complexity, code size, memory usage, etc. of the decoding apparatus.
상기 선택에 따른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하지 않게 되는 경우, 레지듀얼 신호의 길이 정보만큼 레지듀얼 신호를 디코딩을 생략할 수 있다(207). 구체적 예로, 레지듀얼 신호의 비트(bit) 또는 바이트(byte) 길이 정보를 데이터 중에 삽입하여, 그 길이 정보로부터 구한만큼 레지듀얼 신호의 비트 필드(bit field)를 뛰어넘고 디코딩을 계속 진행하는 것을 들 수 있다. 또한, 상기 선택에 따른 다른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하게 되는 경우, 레지듀얼 신호를 파싱(parsing)하고 디코딩을 수행하게 된다(209). 레지듀얼 디코딩을 수행하게 되면, 레지듀얼 신호의 길이 정보는 무시할 수 있다.As an example of the decoding method according to the selection, when the residual decoding is not performed, decoding of the residual signal by length information of the residual signal may be omitted (207). For example, by inserting bit or byte length information of the residual signal into the data, skipping the bit field of the residual signal and continuing decoding as much as obtained from the length information. Can be. In addition, as an example of another decoding method according to the selection, when the residual decoding is performed, the residual signal is parsed and the decoding is performed (209). When residual decoding is performed, length information of the residual signal may be ignored.
도 3a는 본 발명이 적용되는 일실시예로서, 레지듀얼 신호의 길이 정보가 고정적으로 비트 할당되는 것을 설명하기 위해 나타낸 것이다.FIG. 3A illustrates an example to which the present invention is applied, in which length information of a residual signal is fixedly bit-allocated.
상기 레지듀얼 신호의 길이 정보는 비트 단위 또는 바이트 단위로 정의할 수 있다. 만약 바이트 단위로 정의한다면 이는 레지듀얼 신호가 바이트로 할당(align) 되어 있음을 의미한다. 도 3은 레지듀얼 신호의 길이 정보를 가장 간단하게 정의하는 방법을 나타낸 것이다. 상기 레지듀얼 신호의 길이 정보를 나타내는 신택스 요소(syntax element)를 정의하고, 그 신택스 요소에 일정한 비트를 할당하는 것이다. 예를 들어, 신택스 요소로서 'bsResidualSignalLength'를 정의하고 고정 비트인 16비트를 할당하는 것이다. 그러나 이와 같은 방법은 상대적으로 비트를 많이 소모할 수 있다. 따라서, 도 3b 및 도 3c의 방법을 설명한다.Length information of the residual signal may be defined in a bit unit or a byte unit. If defined in bytes, this means that the residual signal is aligned in bytes. 3 illustrates a method of most simply defining length information of a residual signal. A syntax element representing the length information of the residual signal is defined, and a predetermined bit is assigned to the syntax element. For example, it defines 'bsResidualSignalLength' as a syntax element and allocates 16 bits which are fixed bits. However, this method can be relatively bit consuming. Thus, the method of FIGS. 3B and 3C will be described.
도 3b는 본 발명이 적용되는 일실시예로서, 레지듀얼 신호의 길이 정보가 길이 타입에 따라 가변적으로 비트 할당되는 것을 설명하기 위해 나타낸 것이다.FIG. 3B illustrates an embodiment to which the present invention is applied to explain that length information of a residual signal is variably assigned to bits according to a length type.
도 3b는 비트 소모를 더욱 줄이기 위해서 'bsResidualSignalLength'를 몇 비트를 사용할 지를 정의하는 신택스 요소를 하나 더 정의해주는 방법을 나타낸 것이며, 도 6은 도 5의 방법을 도식적으로 표현한 것이다. 예를 들어, 길이 타입으로 'bsResidualSignalLengthType'을 새로 정의하여 그 값이 0인 경우에는 'bsResidualSignalLength'가 4비트로 할당되고, 1인 경우에는 8비트로, 2인 경우에는 12비트로, 3인 경우에는 16비트로 각각 할당되게 된다. 여기서 할당되는 비트는 예를 들어 설명한 것이므로, 위에서 정의한 비트와 다른 값의 비트가 할당될 수도 있다. 또한, 위의 방법들보다 더욱 비트 소모를 줄이기 위해서 도 3c의 방법이 제공된다. FIG. 3B illustrates a method of defining one more syntax element that defines how many bits are used for 'bsResidualSignalLength' to further reduce bit consumption, and FIG. 6 schematically illustrates the method of FIG. 5. For example, newly define 'bsResidualSignalLengthType' as the length type, and if the value is 0, 'bsResidualSignalLength' is assigned as 4 bits, 8 for 1, 12 for 2, 16 for 3 Each will be assigned. Since the bits allocated here are described, for example, bits having a different value from those defined above may be allocated. Also, the method of FIG. 3C is provided to further reduce bit consumption than the above methods.
도 3c는 본 발명이 적용되는 일실시예로서, 레지듀얼 신호의 길이 정보가 상기 레지듀얼 신호의 실제 길이에 따라 적응적으로 비트 할당되는 것을 설명하기 위해 나타낸 것이다.FIG. 3C illustrates an embodiment to which the present invention is applied to explain that length information of a residual signal is adaptively bit-allocated according to an actual length of the residual signal.
레지듀얼 신호가 들어오면 상기 레지듀얼 신호의 길이정보값을 최초 정해진 값까지 읽을 수 있다. 상기 길이정보값이 어느 일정한 값이 되면, 추가적으로 더 정해진 값까지 읽을 수 있게 된다. 그리고, 다시 상기 길이정보값이 어느 일정한 값이 되면, 다시 추가적으로 더 정해진 값까지 읽을 수 있게 된다. 이 때, 상기 길이정보값이 어느 일정한 값이 아닌 경우에는 그 값을 그대로 길이정보값으로 출력하게 된다. 이처럼, 레지듀얼 신호의 길이 정보를 실제 데이터 길이에 따라 적응적으로 읽어나감으로써 비트 소모를 최대한으로 줄일 수 있게 된다. When the residual signal is received, the length information value of the residual signal may be read up to a predetermined value. When the length information becomes a certain value, it is possible to read up to a further defined value. When the length information value becomes a certain value again, it is possible to read up to a further predetermined value again. At this time, if the length information value is not a constant value, the value is output as the length information value as it is. As such, the bit information can be reduced as much as possible by adaptively reading the length information of the residual signal according to the actual data length.
예를 들어, 레지듀얼 신호가 들어오면 상기 레지듀얼 신호 길이의 4비트를 읽는다. 그리고, 길이정보값(bsResidualSignalLength)이 24-1 (=15)이면, bsResidualSignalLength1 값으로 8비트를 더 읽는다. 동일한 방식으로 상기 길이정보값(bsResidualSignalLength)이 (24-1) + (28-1) = 15+255 이면, bsResidualSignalLength2 값으로 12비트를 더 읽는다. 동일한 방식으로 bsResidualSignalLength 값이 (24-1) + (28-1) + (212-1) = 15+255+4095 이면, bsResidualSignalLength3 값으로 16비트를 더 읽는다.For example, when a residual signal comes in, it reads 4 bits of the residual signal length. If the length information value bsResidualSignalLength is 2 4 -1 (= 15), 8 bits are further read as the bsResidualSignalLength1 value. In the same manner, if the length information value bsResidualSignalLength is (2 4 -1) + (2 8 -1) = 15 + 255, 12 bits are further read as the bsResidualSignalLength2 value. In the same way, if the value of bsResidualSignalLength is (2 4 -1) + (2 8 -1) + (2 12 -1) = 15 + 255 + 4095, 16 more bits are read as the value of bsResidualSignalLength3.
이를 다시 설명하면 다음과 같다. 레지듀얼 신호가 들어오면 먼저 4비트를 읽는다. 그리고, 길이정보를 읽은 값이 4비트보다 작으면 그 값이 길이정보가 된다. 그러나 길이정보를 읽은 값이 4비트보다 크면 추가적으로 8비트를 더 읽는다. 추가적으로 읽은 값이 8비트보다 작으면 읽게 된 총 길이정보값은 12(=4+8) 비트가 된다. 그러나, 추가적으로 읽은 값이 8비트보다 크면 다시 추가적으로 16비트를 더 읽는다. 예를 들어, 이를 보다 상세히 설명하면 다음과 같다. 먼저 길이정보가 들어오면 4비트를 읽는다. 실제 길이정보값은 0~14의 값이 된다. 그리고, 길이정보값이 24-1 (=15) 이 되면 상기 레지듀얼 신호를 추가적으로 더 읽는다. 이 때는 상기 레지듀얼 신호를 추가적으로 28-2 (=254) 값까지 더 읽을 수 있다. 그러나, 길이 정보값이 24-1 보다 작은 값이라면, 읽혀진 0 ~ 24-2 (=14) 의 값을 그대로 출력하게 된다. 길이정보값이 (24-1) + (28-1) 이 되면 상기 레지듀얼 신호를 추가적으로 더 읽게 된다. 이 때는 상기 레지듀얼 신호를 216-1 값까지 추가적으로 더 읽을 수 있다. 그러나, 길이 정보값이 216-1 보다 작은 값이라면, 읽혀진 0 ~ 216-1 의 값을 그대로 출력하게 된다. 여기서도 앞서 설명한 예에서와 마찬가지로, 할당되는 비트는 예를 들어 설명한 것이므로, 위에서 정의한 비트와 다른 값의 비트를 할당할 수도 있다.This will be described as follows. When a residual signal comes in, it first reads four bits. If the value of the length information is read less than 4 bits, the value is the length information. However, if the length information is larger than 4 bits, additional 8 bits are read. In addition, if the read value is less than 8 bits, the total length information read is 12 (= 4 + 8) bits. However, if the additional read value is larger than 8 bits, it reads additional 16 bits again. For example, this will be described in more detail as follows. When the length information comes in, it reads 4 bits. The actual length information value is a value between 0 and 14. When the length information becomes 2 4 -1 (= 15), the residual signal is further read. In this case, the residual signal may be further read up to a value of 2 8 -2 (= 254). However, if the length information value is less than 24-1, and outputs the value of the
한편, 상기 도 2에서 설명한 레지듀얼 신호의 디코딩 방법은 공간정보 프레임뿐만 아니라 공간정보 헤더에도 적용될 수 있다. 이는 도 4a와 도 4b에서 설명한다.Meanwhile, the method of decoding the residual signal described with reference to FIG. 2 may be applied to a spatial information header as well as a spatial information frame. This is illustrated in FIGS. 4A and 4B.
도 4a는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 헤더 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.4A is a flowchart illustrating a method of decoding a residual signal using header length information of the residual signal according to an embodiment to which the present invention is applied.
전송된 오디오 신호로부터 확장 데이터 타입 정보를 추출한다(401). 상기 확장 데이터 타입 정보에 따라 레지듀얼 코딩 데이터가 존재하는 경우, 상기 레지듀얼 신호의 헤더 길이 정보를 추출한다(403). 이 경우, 디코딩부에서는 레지듀얼 신호를 디코딩할 것인지 여부를 선택하게 된다(405). 상기 선택은 예를 들어, 프로파일, 레벨 등의 정보를 참조하여 디코딩 장치에서 독립적으로 판단할 수 있다. 또한, 디코딩 장치의 연산량, 코드 사이즈, 메모리 사용량 등에 따라 달라질 수도 있다. The extended data type information is extracted from the transmitted audio signal (401). If residual coding data is present according to the extension data type information, header length information of the residual signal is extracted (403). In this case, the decoding unit selects whether or not to decode the residual signal (405). For example, the selection may be independently determined by the decoding apparatus with reference to information such as a profile and a level. In addition, it may vary depending on the calculation amount, code size, memory usage, etc. of the decoding apparatus.
상기 선택에 따른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하지 않게 되는 경우, 상기 레지듀얼 신호의 헤더 길이 정보만큼 레지듀얼 신호의 디코딩을 생략할 수 있다(407). 구체적 예로, 레지듀얼 신호 헤더의 비트 또는 바이트길이 정보를 데이터 중에 삽입하여, 그 길이 정보로부터 구한만큼 레지듀얼 신호의 비트 필드를 뛰어넘고 디코딩을 계속 진행하는 것을 들 수 있다. 또한, 상기 선택에 따른 다른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하게 되는 경우, 레지듀얼 신호를 파싱(parsing)하고 디코딩을 수행하게 된다(409). 레지듀얼 디코딩을 수행하게 되면, 상기 레지듀얼 신호의 헤더 길이 정보는 무시할 수 있다.As an example of the decoding method according to the selection, when the residual decoding is not performed, decoding of the residual signal by the header length information of the residual signal may be omitted (407). As a specific example, the bit or byte length information of the residual signal header may be inserted into the data, and the decoding may continue beyond the bit field of the residual signal by the amount obtained from the length information. As another example of the decoding method according to the selection, when the residual decoding is performed, the residual signal is parsed and the decoding is performed (409). When residual decoding is performed, header length information of the residual signal may be ignored.
도 4b는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 데이터 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.4B is a flowchart illustrating a method of decoding a residual signal using data length information of the residual signal in an embodiment to which the present invention is applied.
상기 도 2에서 설명한 레지듀얼 신호의 디코딩 방법은 공간정보 프레임에도 적용된다. 도 4b에서 설명하는 레지듀얼 신호의 디코딩 방법은 도 4a에서 설명한 것과 유사한 방식으로 적용된다.The method of decoding the residual signal described with reference to FIG. 2 is also applied to a spatial information frame. The method of decoding the residual signal described in FIG. 4B is applied in a manner similar to that described in FIG. 4A.
도 5는 본 발명이 적용되는 실시예로서, 싱크워드를 이용하여 레지듀얼 신호 를 디코딩하는 방법을 설명하기 위한 흐름도이다.5 is a flowchart illustrating a method of decoding a residual signal using a sync word according to an embodiment to which the present invention is applied.
전송된 오디오 신호로부터 확장 데이터 타입 정보를 추출한다(501). 상기 확장 데이터 타입 정보에 따라 레지듀얼 코딩 데이터가 존재하는 경우, 디코딩부에서는 레지듀얼 신호를 디코딩할 것인지 여부를 선택하게 된다(503). 상기 선택은 예를 들어, 프로파일, 레벨 등의 정보를 참조하여 디코딩 장치에서 독립적으로 판단할 수 있다. 또한, 디코딩 장치의 연산량, 코드 사이즈, 메모리 사용량 등에 따라 달라질 수도 있다. The extended data type information is extracted from the transmitted audio signal (501). If there is residual coding data according to the extended data type information, the decoding unit selects whether to decode the residual signal (503). For example, the selection may be independently determined by the decoding apparatus with reference to information such as a profile and a level. In addition, it may vary depending on the calculation amount, code size, memory usage, etc. of the decoding apparatus.
상기 선택에 따른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하지 않게 되는 경우, 레지듀얼 신호의 싱크워드를 찾을 때까지 레지듀얼 신호의 비트 필드를 계속 탐색한다. 싱크워드를 찾으면 탐색 과정을 멈추고 디코딩을 계속 진행한다. 즉, 레지듀얼 신호의 싱크워드를 찾을 때까지 레지듀얼 신호의 디코딩을 생략할 수 있다(505). 여기서, 싱크워드란 어느 프레임의 시작 또는 끝을 표시하는 동기신호로서, 이를 이용하면 프레임 사이즈를 알 수 있다. 예를 들어, 레지듀얼 신호가 끝나는 지점에 일정한 비트의 길이(예를 들어, 12비트)를 가지는 싱크워드를 삽입하여, 비트 필드를 스킵하는데 사용할 수 있다. 또한, 상기 선택에 따른 다른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하게 되는 경우, 레지듀얼 신호를 파싱(parsing)하고 디코딩을 수행하게 된다(507). 레지듀얼 디코딩을 수행하게 되면, 레지듀얼 신호의 싱크워드는 읽고 무시할 수 있다(509).As an example of the decoding method according to the selection, when the residual decoding is not performed, the bit field of the residual signal is continuously searched until a syncword of the residual signal is found. If it finds a syncword, it stops the search process and continues decoding. That is, decoding of the residual signal may be omitted (505) until a sync word of the residual signal is found. Here, the sync word is a synchronization signal indicating the start or end of a frame, and the sync word can be used to determine the frame size. For example, a syncword having a predetermined length of a bit (eg, 12 bits) may be inserted at a point where the residual signal ends and used to skip a bit field. In addition, as an example of another decoding method according to the selection, when the residual decoding is performed, the residual signal is parsed and the decoding is performed (507). When residual decoding is performed, the sync word of the residual signal may be read and ignored (509).
도 6a는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 하나의 오디오 신호를 이루는 파일/일반 스트리밍 구조를 나타낸다.FIG. 6A is an embodiment to which the present invention is applied and shows a file / general streaming structure in which a downmix signal and a spatial information signal constitute one audio signal.
오디오 신호는 다운믹스 신호와 공간정보 신호를 포함한다. 다운믹스 신호와 공간정보 신호는 프레임 단위로 전송된다. 공간정보 신호는 헤더 정보와 데이터 정보를 포함할 수 있고, 데이터만을 포함할 수도 있다. 이처럼 하나의 오디오 신호를 이루는 파일/일반 스트리밍 구조는 헤더 정보가 앞에 오고 그 뒤에 데이터 정보가 따른다. 예를 들어, 다운믹스 신호와 공간정보 신호가 하나의 오디오 신호를 이루는 파일/일반 스트리밍 구조의 경우, 앞부분에 헤더 정보인 다운믹스 헤더(Downmix Header, DH)와 공간정보 헤더(MPEG Surround Specific Configuration Header, MH)가 존재한다. 그리고 그 뒤에 데이터 정보로서, 다운믹스 프레임 데이터(Downmix Frame Data, DF)와 공간정보 데이터(MPEG Surround Spatial Frame, MF)와 레지듀얼 신호(MPEG Surround Residual Bitstream, MR)가 하나의 프레임을 구성할 수 있다. 이처럼, 레지듀얼 신호는 공간정보 신호 내에 포함될 수 있다. 또한, 레지듀얼 신호는 독립적인 신호로서 이용될 수도 있다. 레지듀얼 신호는 선택적으로 디코딩될 수 있기 때문에 프레임의 마지막 부분에 위치할 수 있으며, 또는 공간정보 신호에 바로 뒤에 연속하여 존재할 수 있다.The audio signal includes a downmix signal and a spatial information signal. The downmix signal and the spatial information signal are transmitted in units of frames. The spatial information signal may include header information and data information, or may include only data. As such, the file / general streaming structure of one audio signal is preceded by header information followed by data information. For example, in the case of a file / general streaming structure in which a downmix signal and a spatial information signal constitute one audio signal, a downmix header (DH) and a spatial information header (MPEG Surround Specific Configuration Header), which are header information, are included in the header section. , MH). Then, as data information, downmix frame data (Downmix Frame Data, DF), spatial information data (MPEG Surround Spatial Frame, MF), and residual signal (MPEG Surround Residual Bitstream, MR) can form one frame. have. As such, the residual signal may be included in the spatial information signal. The residual signal may also be used as an independent signal. Since the residual signal may be selectively decoded, it may be located at the end of the frame, or may be present immediately after the spatial information signal.
도 6b는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 독립적인 신호를 이루는 파일/일반 스트리밍 구조를 나타낸다.6B illustrates a file / general streaming structure in which a downmix signal and a spatial information signal form independent signals according to an embodiment to which the present invention is applied.
오디오 신호는 다운믹스 신호와 공간정보 신호를 포함하는데, 각각 독립적인 신호로 전송될 수도 있다. 이러한 경우, 다운믹스 신호는 앞부분에 헤더 정보인 다운믹스 헤더(DH)가 오고, 그 뒤에 데이터 정보로서 다운믹스 프레임 데이터(DF)가 따르는 구조를 가진다. 공간정보 신호는 앞 부분에 헤더 정보인 공간정보 헤더(MH) 가 오고, 그 뒤에 데이터 정보로서 공간정보 데이터(MF)와 레지듀얼 신호(MR)가 따르는 구조를 가진다. 마찬가지로, 레지듀얼 신호는 공간정보 신호 내에 포함될 수 있다. 또한, 레지듀얼 신호는 독립적인 신호로서 이용될 수도 있다. 레지듀얼 신호는 선택적으로 디코딩될 수 있기 때문에 프레임의 마지막 부분에 위치할 수 있으며, 또는 공간정보 신호에 바로 뒤에 연속하여 존재할 수 있다.The audio signal includes a downmix signal and a spatial information signal, which may be transmitted as independent signals. In this case, the downmix signal has a structure in which a downmix header DH, which is header information, comes first, followed by downmix frame data DF as data information. The spatial information signal has a structure in which the spatial information header MH, which is header information, is followed by the spatial information data MF and the residual signal MR as data information. Similarly, the residual signal may be included in the spatial information signal. The residual signal may also be used as an independent signal. Since the residual signal may be selectively decoded, it may be located at the end of the frame, or may be present immediately after the spatial information signal.
도 7a는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 하나의 오디오 신호를 이루는 방송용 스트리밍 구조를 나타낸다.FIG. 7A is an embodiment to which the present invention is applied and shows a broadcast streaming structure in which a downmix signal and a spatial information signal constitute one audio signal.
오디오 신호를 처음부터 디코딩하지 않고 임의의 순간부터 디코딩하게 되어 이전에 전송한 헤더 정보를 이용할 수 없는 경우, 오디오 신호에 삽입되어 있는 또 다른 헤더 정보를 이용하여 오디오 신호를 디코딩할 수 있다. 예를 들어, 오디오 신호를 방송 등에 이용하는 경우이거나, 오디오 신호를 전송하는 도중 헤더 정보를 분실하는 경우에는 신호를 어느 순간에 수신하더라도 그 순간부터 디코딩이 시작될 수 있어야 한다. 따라서, 상기 헤더 정보는 오디오 신호에 적어도 두 번 삽입되어 있다. 헤더 정보가 오디오 신호의 앞부분에 한번만 존재하게 된다면, 임의의 순간에 오디오 신호를 수신하게 될 경우 헤더 정보가 없어 디코딩을 할 수 없기 때문이다. 예를 들어, 헤더 정보를 매 프레임마다 삽입하거나, 또는 일정 간격의 프레임마다 주기적으로 삽입하거나, 또는 임의의 간격의 프레임마다 비주기적으로 삽입할 수도 있다. 또는 일정한 시간 간격에 따라(예를 들어, 2초) 한 번씩 헤더 정보를 삽입할 수도 있다. If the audio signal is not decoded from the beginning and decoded from an arbitrary moment and the previously transmitted header information is not available, the audio signal may be decoded using another header information inserted in the audio signal. For example, when the audio signal is used for broadcasting or the like, or when the header information is lost while transmitting the audio signal, decoding should be able to start from that moment even if the signal is received at any moment. Thus, the header information is inserted at least twice in the audio signal. If the header information is present only once in the front of the audio signal, if the audio signal is received at any moment, it cannot be decoded because there is no header information. For example, header information may be inserted every frame, periodically inserted every frame at regular intervals, or aperiodically inserted at every interval of frames. Alternatively, header information may be inserted once at a predetermined time interval (for example, 2 seconds).
하나의 오디오 신호를 이루는 방송용 스트리밍 구조는 데이터 정보들 사이에 적어도 2개의 헤더 정보가 삽입된 형태를 가진다. 예를 들어, 다운믹스 신호와 공간정보 신호가 하나의 오디오 신호를 이루는 방송용 스트리밍 구조의 경우, 데이터 정보로서, 다운믹스 프레임 데이터(Downmix Frame Data, DF)와 공간정보 데이터(MPEG Surround Spatial Frame, MF)와 레지듀얼 신호(MPEG Surround Residual Bitstream, MR)가 하나의 프레임을 구성할 수 있다. 이러한 데이터 정보들 사이에The broadcast streaming structure of one audio signal has a form in which at least two header information are inserted between data information. For example, in the case of a broadcasting streaming structure in which the downmix signal and the spatial information signal constitute one audio signal, the downmix frame data (Downmix Frame Data, DF) and the spatial information data (MPEG Surround Spatial Frame, MF) are used as data information. ) And the residual signal (MPEG Surround Residual Bitstream, MR) may constitute one frame. Between these data information
다운믹스 헤더(DH)와 공간정보 헤더(MH)가 각각 적어도 2번 이상 삽입된다. 이러한 헤더 정보들은 초기에 전송한 헤더 정보와 동일한 정보일 수도 있고, 가변적일 수도 있다. 헤더 정보가 가변적인 경우에는 새로운 헤더 정보를 디코딩하여 그에 따라 새로운 헤더 정보 뒤로 전송되는 데이터 정보를 디코딩한다. 상기 레지듀얼 신호는 공간정보 신호 내에 포함될 수 있다. 또한, 레지듀얼 신호는 독립적인 신호로서 이용될 수도 있다. 레지듀얼 신호는 선택적으로 디코딩될 수 있기 때문에 프레임의 마지막 부분에 위치할 수 있으며, 또는 공간정보 신호에 바로 뒤에 연속하여 존재할 수 있다.The downmix header DH and the spatial information header MH are inserted at least twice each. Such header information may be the same as the header information transmitted initially or may be variable. If the header information is variable, the new header information is decoded and accordingly the data information transmitted after the new header information is decoded. The residual signal may be included in the spatial information signal. The residual signal may also be used as an independent signal. Since the residual signal may be selectively decoded, it may be located at the end of the frame, or may be present immediately after the spatial information signal.
도 7b는 본 발명이 적용되는 실시예로서, 다운믹스 신호와 공간정보 신호가 독립적인 오디오 신호를 이루는 방송용 스트리밍 구조를 나타낸다.FIG. 7B is an embodiment to which the present invention is applied and shows a broadcasting streaming structure in which a downmix signal and a spatial information signal form independent audio signals.
오디오 신호는 다운믹스 신호와 공간정보 신호를 포함하는데, 각각 독립적인 신호로 전송될 수도 있다. 다운믹스 신호의 경우, 데이터 정보로서 다운믹스 프레임 데이터(DF)가 하나의 프레임을 구성할 수 있다. 이러한 데이터 정보 사이에 다운믹스 헤더(DH)가 적어도 2번 이상 삽입된다. 공간정보 신호의 경우, 데이터 정보로서 공간정보 데이터(MF)와 레지듀얼 신호(MR)가 하나의 프레임을 구성할 수 있 다. 이러한 데이터 정보들 사이에 공간정보 헤더(MH)가 적어도 2번 이상 삽입된다. 이러한 헤더 정보들은 초기에 전송한 헤더 정보와 동일한 정보일 수도 있고, 가변적인 정보일 수도 있다. 헤더 정보가 가변적인 경우에는 새로운 헤더 정보를 디코딩하여 그에 따라 새로운 헤더 정보 뒤로 전송되는 데이터 정보를 디코딩한다. 마찬가지로, 레지듀얼 신호는 공간정보 신호 내에 포함될 수 있다. 또한, 레지듀얼 신호는 독립적인 신호로서 이용될 수도 있다. 레지듀얼 신호는 선택적으로 디코딩될 수 있기 때문에 프레임의 마지막 부분에 위치할 수 있으며, 또는 공간정보 신호에 바로 뒤에 연속하여 존재할 수 있다.The audio signal includes a downmix signal and a spatial information signal, which may be transmitted as independent signals. In the case of the downmix signal, the downmix frame data DF may constitute one frame as data information. The downmix header DH is inserted at least two times between such data information. In the case of the spatial information signal, the spatial information data MF and the residual signal MR may constitute one frame as data information. The spatial information header MH is inserted at least twice between these data information. Such header information may be the same as the header information transmitted initially or may be variable information. If the header information is variable, the new header information is decoded and accordingly the data information transmitted after the new header information is decoded. Similarly, the residual signal may be included in the spatial information signal. The residual signal may also be used as an independent signal. Since the residual signal may be selectively decoded, it may be located at the end of the frame, or may be present immediately after the spatial information signal.
도 8은 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우 오디오 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.8 is an embodiment to which the present invention is applied and is a flowchart illustrating a method of decoding an audio signal when the audio signal is used for broadcasting.
파일/일반 스트리밍 구조의 오디오 신호가 수신되는 경우, 헤더 파싱은 1번 이루어지고, 그 외의 부분은 프레임 단위로 디코딩이 수행된다. 이와 달리, 방송용 스트리밍 구조의 경우에는, 수신된 오디오 신호 중 헤더 정보가 탐색될 때까지 디코딩을 하지 않고 기다린다(801). 헤더 정보가 오게 되면 헤더 파싱이 이루어진다(803). 이후로는 상기 헤더 정보의 해석에 따라 데이터 정보를 디코딩하게 된다. 여기서, 헤더 탐색은 처음 한 번 이루어지고, 헤더 정보 해석도 헤더를 찾은 후 바로 한 번만 수행된다. 상기 헤더 정보는 초기에 전송한 헤더 정보와 동일한 정보일 수도 있고, 가변적인 정보일 수도 있다. 동일한 정보인 경우라면, 그 후에 들어오는 헤더는 무시하거나 에러 감지(error detect)용으로 사용할 수 있다. When an audio signal of a file / general streaming structure is received, header parsing is performed once, and the other part is decoded in units of frames. In contrast, in the broadcasting streaming structure, the decoding waits without decoding until the header information of the received audio signal is found (801). When header information comes, header parsing is performed (803). Thereafter, the data information is decoded according to the interpretation of the header information. Here, the header search is performed once, and the header information interpretation is also performed only once once the header is found. The header information may be the same information as the initially transmitted header information or may be variable information. If the information is the same, subsequent headers can be ignored or used for error detection.
도 9는 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우 오디오 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.9 is an embodiment to which the present invention is applied and is a flowchart illustrating a method of decoding an audio signal when the audio signal is used for broadcasting.
먼저 오디오 신호가 수신되면(901), 디코딩부는 오디오 신호에 헤더 정보가 포함되어 있는지를 판단하고(903), 헤더 정보가 포함되어 있는 경우 헤더 정보를 추출한다(905). 디코딩부에서는 추출한 헤더 정보가 오디오 신호에서 첫번째로 추출한 헤더 정보인지를 판단한다(907). 추출한 헤더 정보가 오디오 신호에서 첫번째로 추출한 헤더 정보인 경우, 추출한 헤더 정보를 디코딩한다(909). 디코딩된 헤더 정보에 따라 헤더 정보 뒤로 전송되는 데이터 정보를 디코딩한다. First, if an audio signal is received (901), the decoding unit determines whether the header information is included in the audio signal (903), and if the header information is included (905). The decoding unit determines whether the extracted header information is first header information extracted from the audio signal (907). If the extracted header information is the first header information extracted from the audio signal, the extracted header information is decoded (909). The data information transmitted after the header information is decoded according to the decoded header information.
오디오 신호에서 추출한 헤더 정보가 첫번째로 추출한 헤더 정보가 아닌 경우, 첫번째로 추출했던 헤더 정보와 동일한지를 판단한다(911). 추출한 헤더 정보가 첫번째로 추출했던 헤더 정보와 동일한 경우에는 첫번째로 추출하여 디코딩한 헤더 정보를 이용하여 데이터 정보를 디코딩한다. 추출한 헤더 정보가 첫번째로 추출했던 헤더 정보와 동일하지 않은 경우에는 오디오 신호가 오디오 신호 인코딩 장치로부터 오디오 신호 디코딩 장치로 전송되는 경로 상에서 오디오 신호에 에러가 발생한 것인지를 판단한다(913). 헤더 정보가 가변인 경우에는 헤더 정보가 첫번째로 추출했던 헤더 정보와 동일하지 않아도 에러가 발생한 것이 아니므로 헤더 정보를 가변인 헤더 정보로 갱신하고(915), 갱신한 헤더 정보를 디코딩한다(909). 디코딩한 헤더 정보에 따라 헤더 정보 뒤로 전송되는 데이터 정보를 디코딩한다. 헤더 정보가 가변이 아님에도 첫번째로 추출한 헤더 정보와 동일하지 않은 경우, 오디오 신호 전송 경로 상에서 에러가 발생한 것이므로 에러가 발생한 헤더 정보를 포함하는 프레임에 포함된 데이터 정보를 제거하거나 또는 데이터 정보의 에러를 정정한 다(917).If the header information extracted from the audio signal is not the first header information extracted, it is determined whether the header information extracted from the audio signal is the same as the first extracted header information (911). If the extracted header information is the same as the header information extracted first, the data information is decoded using the header information extracted and decoded first. If the extracted header information is not the same as the header information extracted first, it is determined whether an error has occurred in the audio signal on the path from which the audio signal is transmitted from the audio signal encoding apparatus to the audio signal decoding apparatus (913). If the header information is variable, an error does not occur even if the header information is not the same as the header information extracted first, and the header information is updated with variable header information (915), and the updated header information is decoded (909). . The data information transmitted after the header information is decoded according to the decoded header information. If the header information is not variable but not the same as the first extracted header information, an error has occurred in the audio signal transmission path, so the data information included in the frame including the header information where the error occurred is removed or an error of the data information is removed. Correct (917).
도 10는 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우, 레지듀얼 신호의 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.FIG. 10 is a flowchart illustrating a method of decoding a residual signal using length information of the residual signal when an audio signal is used for broadcasting, etc. according to an embodiment to which the present invention is applied.
오디오 신호를 처음부터 디코딩하지 않고 임의의 순간부터 디코딩하게 되어 이전에 전송한 헤더 정보를 이용할 수 없는 경우, 수신된 오디오 신호 중 헤더 정보가 탐색될 때까지 디코딩을 하지 않고 기다린다(1001). 헤더 정보가 오게 되면 헤더 파싱이 이루어진다(1003). 이후로는 상기 헤더 정보의 해석에 따라 데이터 정보를 디코딩하게 된다. 여기서, 헤더 탐색은 처음 한 번 이루어지고, 헤더 정보 해석도 헤더를 찾은 후 바로 한 번만 수행된다. 상기 헤더 정보는 초기에 전송한 헤더 정보와 동일한 정보일 수도 있고, 가변적인 정보일 수도 있다. 동일한 정보인 경우라면, 그 후에 들어오는 헤더는 무시하거나 에러 감지(error detect)용으로 사용할 수 있다. 그리고, 전송된 오디오 신호로부터 확장 데이터 타입 정보를 추출한다(1005). 상기 확장 데이터 타입 정보에는 예를 들어, 레지듀얼 코딩 데이터, 임의의 다운믹스 레지듀얼 코딩 데이터, 임의의 트리 확장 데이터 등이 있을 수 있다. 상기 확장 데이터 타입 정보에 따라 레지듀얼 코딩 데이터가 존재하는 경우, 상기 레지듀얼 신호의 길이 정보를 추출한다(1007). 이 경우, 디코딩부에서는 레지듀얼 신호를 디코딩할 것인지 여부를 선택하게 된다(1009). 상기 선택은 예를 들어, 프로파일, 레벨 등의 정보를 참조하여 디코딩 장치에서 독립적으로 판단할 수 있다. 또한, 디코딩 장치의 연산량, 코드 사이즈, 메모리 사용량 등에 따라 달라질 수도 있다. If the audio signal is not decoded from the beginning and decoded from an arbitrary moment and the previously transmitted header information is not available, the processor waits without decoding until the header information of the received audio signal is found (1001). When the header information comes, header parsing is performed (1003). Thereafter, the data information is decoded according to the interpretation of the header information. Here, the header search is performed once, and the header information interpretation is also performed only once once the header is found. The header information may be the same information as the initially transmitted header information or may be variable information. If the information is the same, subsequent headers can be ignored or used for error detection. The extended data type information is extracted from the transmitted audio signal (1005). The extended data type information may include, for example, residual coding data, arbitrary downmix residual coding data, arbitrary tree extension data, and the like. If residual coding data is present according to the extension data type information, length information of the residual signal is extracted (1007). In this case, the decoding unit selects whether to decode the residual signal (1009). For example, the selection may be independently determined by the decoding apparatus with reference to information such as a profile and a level. In addition, it may vary depending on the calculation amount, code size, memory usage, etc. of the decoding apparatus.
상기 선택에 따른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하지 않게 되는 경우, 상기 레지듀얼 신호의 길이 정보만큼 레지듀얼 신호의 디코딩을 생략할수 있다(1011). 구체적 예로, 레지듀얼 신호의 비트 또는 바이트 길이 정보를 데이터 중에 삽입하여, 그 길이 정보로부터 구한만큼 레지듀얼 신호의 비트 필드를 뛰어넘고 디코딩을 계속 진행하는 것을 들 수 있다. 또한, 상기 선택에 따른 다른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하게 되는 경우, 레지듀얼 신호를 파싱하고 디코딩을 수행하게 된다(1013). 레지듀얼 디코딩을 수행하게 되면, 상기 레지듀얼 신호의 길이 정보는 무시할 수 있다.As an example of the decoding method according to the selection, when the residual decoding is not performed, decoding of the residual signal by the length information of the residual signal may be omitted (1011). As a specific example, the bit or byte length information of the residual signal may be inserted into the data, and the decoding may be continued beyond the bit field of the residual signal by the amount obtained from the length information. As another example of the decoding method according to the selection, when the residual decoding is performed, the residual signal is parsed and the decoding is performed (1013). When residual decoding is performed, length information of the residual signal may be ignored.
도 11은 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우, 싱크워드를 이용하여 레지듀얼 신호를 디코딩하는 방법을 설명하기 위한 흐름도이다.FIG. 11 is an embodiment to which the present invention is applied and is a flowchart illustrating a method of decoding a residual signal using a sync word when an audio signal is used for broadcasting.
오디오 신호를 처음부터 디코딩하지 않고 임의의 순간부터 디코딩하게 되어 이전에 전송한 헤더 정보를 이용할 수 없는 경우, 수신된 오디오 신호 중 헤더 정보가 탐색될 때까지 디코딩을 하지 않고 기다린다(1101). 헤더 정보가 오게 되면 헤더 파싱이 이루어진다(1103). 이후로는 상기 헤더 정보의 해석에 따라 데이터 정보를 디코딩하게 된다. 그리고, 전송된 오디오 신호로부터 확장 데이터 타입 정보를 추출한다(1105). 상기 확장 데이터 타입 정보에는 예를 들어, 레지듀얼 코딩 데이터, 임의의 다운믹스 레지듀얼 코딩 데이터, 임의의 트리 확장 데이터 등이 있을 수 있다. 상기 확장 데이터 타입 정보에 따라 레지듀얼 코딩 데이터가 존재하는 경 우, 디코딩부에서는 레지듀얼 신호를 디코딩할 것인지 여부를 선택하게 된다(1107).If the audio signal is not decoded from the beginning and decoded from an arbitrary moment and the previously transmitted header information is not available, the receiver waits without decoding until the header information of the received audio signal is found (1101). When the header information comes, header parsing is performed (1103). Thereafter, the data information is decoded according to the interpretation of the header information. Then, the extended data type information is extracted from the transmitted audio signal (1105). The extended data type information may include, for example, residual coding data, arbitrary downmix residual coding data, arbitrary tree extension data, and the like. If there is residual coding data according to the extended data type information, the decoding unit selects whether to decode the residual signal (1107).
상기 선택에 따른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하지 않게 되는 경우, 상기 레지듀얼 신호의 싱크워드를 찾을 때까지 레지듀얼 신호의 비트 필드를 계속 탐색한다. 싱크워드를 찾으면 탐색 과정을 멈추고 디코딩을 계속 진행한다. 즉, 레지듀얼 신호의 싱크워드를 찾을 때까지 레지듀얼 신호의 디코딩을 생략할 수 있다(1109). 또한, 상기 선택에 따른 다른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하게 되는 경우, 레지듀얼 신호를 파싱하고 디코딩을 수행하게 된다(1111). 레지듀얼 디코딩을 수행하게 되면, 상기 레지듀얼 신호의 싱크워드는 읽고 무시할 수 있다(1113).As an example of the decoding method according to the selection, when the residual decoding is not performed, the bit field of the residual signal is continuously searched until a syncword of the residual signal is found. If it finds a syncword, it stops the search process and continues decoding. That is, decoding of the residual signal may be omitted until a sync word of the residual signal is found (1109). As another example of the decoding method according to the selection, when the residual decoding is performed, the residual signal is parsed and the decoding is performed (1111). When residual decoding is performed, the sync word of the residual signal may be read and ignored (1113).
도 12은 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 길이 정보를 이용하여 프로파일 정보에 따른 레지듀얼 신호의 선택적 디코딩 방법을 설명하기 위한 흐름도이다.12 is a flowchart illustrating a selective decoding method of a residual signal according to profile information by using length information of the residual signal according to an embodiment to which the present invention is applied.
프로파일(Profile)이란 코딩 과정에서 알고리즘상 들어가는 기술적 구성요소를 규격화한 것을 의미한다. 즉, 비트스트림을 디코딩하기 위해 필요한 기술요소의 집합으로서 일종의 서브 규격이라 할 수 있다. 레벨(Level)이란, 프로파일에서 규정된 기술요소를 어느 범위까지 지원할 것인지를 정의한다. 즉, 디코더의 능력과 비트스트림의 복잡도를 정의하는 역할을 한다. 본 발명에 있어서, 프로파일 정보라 함은, 상기 프로파일과 레벨에 대한 정의를 모두 포함한다. Profile refers to the standardization of technical components that go into algorithms during coding. In other words, it is a kind of sub-standard that is a set of description elements necessary for decoding a bitstream. Level defines to what extent the technical elements specified in the profile are supported. In other words, it defines the capabilities of the decoder and the complexity of the bitstream. In the present invention, the profile information includes both definitions of the profile and the level.
이러한 프로파일 정보에 따라 디코딩 방법이 선택적으로 달라질 수 있다. 예 를 들어, 전송된 오디오 신호 내에 레지듀얼 코딩 데이터가 존재하더라도 상기 프로파일 정보에 따라 레지듀얼 디코딩을 수행하지 않을 수 있으며, 또는 레지듀얼 디코딩을 수행할 수도 있고, 또는 레지듀얼 디코딩을 수행하더라도 일정한 저주파 부분만을 이용할 수도 있다. 뿐만 아니라, 레지듀얼 디코딩을 수행하지 않기 위하여 레지듀얼 신호의 길이 정보만큼 스킵할 수도 있으며, 레지듀얼 신호는 모두 읽되 디코딩만 하지 않을 수도 있다. 또한, 레지듀얼 신호의 일부를 읽고 그 읽은 부분만 디코딩을 수행하고, 나머지는 디코딩을 수행하지 않을 수 있으며, 레지듀얼 신호의 전부를 읽되 일부는 디코딩을 하고 나머지는 디코딩을 수행하지 않을 수도 있다.The decoding method may be selectively changed according to this profile information. For example, even if there is residual coding data in the transmitted audio signal, residual decoding may not be performed according to the profile information, or residual decoding may be performed, or constant low frequency may be performed even if residual decoding is performed. Only parts can be used. In addition, in order not to perform the residual decoding, the length information of the residual signal may be skipped, and the residual signal may be read but not decoded. In addition, a part of the residual signal may be read and only the read part may be decoded, and the rest may not be decoded. The entire part of the residual signal may be read, but some of the residual signal may be decoded.
전송된 오디오 신호로부터 레지듀얼 신호의 길이 정보를 추출한다(1201). 그리고, 프로파일 정보에 따라 레지듀얼 신호를 선택적으로 디코딩할 수 있다(1203). 디코딩 장치가 프로파일 정보에 의해 레지듀얼 신호의 일정 저주파 부분만 디코딩할 수 있도록 제한되는 경우에, 디코딩 장치는 레지듀얼 신호의 길이 정보만큼 레지듀얼 신호의 일정 저주파 부분만 디코딩할 수 있게 된다(1205). 또한, 디코딩 장치가 프로파일 정보에 의해 레지듀얼 신호의 디코딩이 제한되는 경우에, 디코딩 장치는 레지듀얼 신호의 길이 정보만큼 레지듀얼 신호의 디코딩을 생략하게 된다(1207).The length information of the residual signal is extracted from the transmitted audio signal (1201). In
도 13는 본 발명이 적용되는 실시예로서, 싱크워드를 이용하여 프로파일 정보에 따른 레지듀얼 신호의 선택적 디코딩 방법을 설명하기 위한 흐름도이다.FIG. 13 is a flowchart illustrating a selective decoding method of a residual signal according to profile information by using a sync word according to an embodiment to which the present invention is applied.
전송된 오디오 신호로부터 레지듀얼 신호의 싱크워드를 추출한다(1301). 그 리고, 프로파일 정보에 따라 레지듀얼 신호를 선택적으로 디코딩할 수 있다(1303). 디코딩 장치가 프로파일 정보에 의해 레지듀얼 신호의 일정 저주파 부분만 디코딩할 수 있도록 제한되는 경우에, 디코딩 장치는 싱크워드가 추출될 때까지 레지듀얼 신호의 일정 저주파 부분만 디코딩할 수 있게 된다(1305). 또한, 디코딩 장치가 프로파일 정보에 의해 레지듀얼 신호의 디코딩을 할 수 없도록 제한되는 경우에는 싱크워드가 추출될 때까지 레지듀얼 신호의 디코딩을 생략하게 된다(1307).A syncword of the residual signal is extracted from the transmitted audio signal (1301). In
도 14a는 본 발명이 적용되는 실시예로서, 레지듀얼 신호의 길이 정보를 이용하여 레지듀얼 신호를 디코딩하는 장치를 설명하기 위한 블록도이다.FIG. 14A is a block diagram illustrating an apparatus for decoding a residual signal using length information of the residual signal in an embodiment to which the present invention is applied.
상기 장치는 데이터 타입 정보 추출부(1401)와 길이 정보 추출부(1403)와 디코딩부(1405)를 포함한다. 데이터 타입 정보 추출부(1401)는 전송된 오디오 신호로부터 확장 데이터 타입 정보를 추출한다. 길이 정보 추출부(1403)는 확장 데이터 타입 정보에 따라 레지듀얼 코딩 데이터가 존재하는 경우, 레지듀얼 신호의 길이 정보를 추출한다. 디코딩부(1405)에서는 레지듀얼 신호를 디코딩할 것인지 여부를 선택하게 된다. 상기 선택에 따라 레지듀얼 디코딩을 수행하지 않게 되는 경우, 레지듀얼 신호의 길이 정보만큼 레지듀얼 신호의 디코딩을 생략할 수 있다. 또한, 다른 선택에 따라 레지듀얼 디코딩을 수행하게 되는 경우, 레지듀얼 신호를 파싱하고 디코딩을 수행하게 된다.The apparatus includes a data
도 14b는 본 발명이 적용되는 실시예로서, 싱크워드를 이용하여 레지듀얼 신호를 디코딩하는 장치를 설명하기 위한 블록도이다.FIG. 14B is a block diagram illustrating an apparatus for decoding a residual signal using a sync word according to an embodiment to which the present invention is applied.
상기 장치는 데이터 타입 정보 추출부(1411)와 싱크워드 추출부(1413)와 디 코딩부(1415)를 포함한다. 데이터 타입 정보 추출부(1411)는 전송된 오디오 신호로부터 확장 데이터 타입 정보를 추출한다. 싱크워드 추출부(1413)는 전송된 오디오 신호로부터 싱크워드를 추출한다. 디코딩부(1415)에서는 확장 데이터 타입 정보에 따라 레지듀얼 코딩 데이터가 존재하는 경우, 레지듀얼 신호를 디코딩할 것인지 여부를 선택하게 된다. 상기 선택에 따른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하지 않게 되는 경우, 레지듀얼 신호의 싱크워드를 찾을 때까지 레지듀얼 신호의 비트 필드를 계속 탐색한다. 싱크워드를 찾으면 탐색 과정을 멈추고 디코딩을 계속 진행한다. 즉, 레지듀얼 신호의 싱크워드를 찾을 때까지 레지듀얼 신호의 디코딩을 생략할 수 있다. 또한, 상기 선택에 따른 다른 디코딩 방법의 예로서, 레지듀얼 디코딩을 수행하게 되는 경우, 레지듀얼 신호를 파싱하고 디코딩을 수행하게 된다.The apparatus includes a data
도 15는 본 발명이 적용되는 실시예로서, 오디오 신호를 방송 등에 이용하는 경우 오디오 신호를 디코딩하는 장치를 설명하기 위한 블록도이다.FIG. 15 is an embodiment to which the present invention is applied and is a block diagram illustrating an apparatus for decoding an audio signal when using the audio signal for broadcasting.
상기 장치는 헤더 탐색부(1501)와 헤더 파싱부(1503)를 포함한다. 헤더 탐색부(1501)는 전송된 오디오 신호로부터 헤더 정보가 존재하는지를 탐색한다. 이 경우, 헤더 정보가 탐색될 때까지 디코딩은 하지 않고 기다리게 된다. 헤더 정보를 찾게 된 경우, 헤더 파싱부(1503)는 헤더 정보로부터 확장 데이터 타입 정보를 추출한다. 여기서, 헤더 탐색은 처음 한 번 이루어지고, 헤더 정보 해석도 헤더를 찾은 후 한 번만 수행된다.The apparatus includes a
본 발명을 이용하여 디코딩을 수행할 경우, 레지듀얼 코딩 데이터에 대하여 선택적으로 디코딩을 수행함으로써 보다 효율적인 디코딩을 수행할 수 있다. 레지듀얼 디코딩을 수행하는 경우에는 오디오 신호의 음질을 보다 향상시킬 수 있으며, 레지듀얼 디코딩을 수행하지 않는 경우에는 연산량, 복잡도를 줄일 수 있는 효과가 있다. 뿐만 아니라, 레지듀얼 디코딩을 수행하더라도 일정 저주파 부분만을 디코딩함으로써 음질을 향상시킴과 동시에 연산량을 줄일 수도 있다. When decoding is performed using the present invention, it is possible to perform decoding more efficiently by selectively decoding residual coded data. When the residual decoding is performed, the sound quality of the audio signal may be further improved. When the residual decoding is not performed, the amount of computation and the complexity may be reduced. In addition, even if the residual decoding is performed, only a certain low frequency portion may be decoded to improve sound quality and to reduce computation.
또한, 오디오 신호 내에 헤더 정보를 적어도 두 번이상 포함시킴으로서, 오디오 신호를 방송 등에 이용할 경우에 임의의 순간부터 오디오 신호를 디코딩할 수 있는 효과가 있다.Also, by including the header information at least twice in the audio signal, the audio signal can be decoded from an arbitrary moment when the audio signal is used for broadcasting or the like.
Claims (20)
Priority Applications (39)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/280,314 US7974287B2 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
PCT/KR2007/000867 WO2007097551A1 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
JP2008556238A JP5254808B2 (en) | 2006-02-23 | 2007-02-16 | Audio signal processing method and apparatus |
ES07709016T ES2391117T3 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
ES07709017T ES2407820T3 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
AU2007218453A AU2007218453B2 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
EP07709014.0A EP1987594B1 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
JP2008556240A JP5394753B2 (en) | 2006-02-23 | 2007-02-16 | Audio signal processing method and apparatus |
US12/280,313 US7991494B2 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
CN200780001487.3A CN101361275B (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
PCT/KR2007/000865 WO2007097549A1 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
TW096106320A TWI333795B (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing a audio signal |
CN2007800014801A CN101361274B (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
CN200780001528.9A CN101361277B (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
TW096106318A TWI333644B (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing a audio signal |
TW096106319A TWI336599B (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing a audio signal |
KR1020087021418A KR101276849B1 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
PCT/KR2007/000868 WO2007097552A1 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
JP2008556239A JP5390197B2 (en) | 2006-02-23 | 2007-02-16 | Audio signal processing method and apparatus |
KR1020087005983A KR100904436B1 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
TW098123546A TWI447707B (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing a audio signal |
JP2008556241A JP5394754B2 (en) | 2006-02-23 | 2007-02-16 | Audio signal processing method and apparatus |
EP07709016A EP1987596B1 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
KR1020087005986A KR100904439B1 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
ES07709014T ES2413807T3 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
CN200780001517.0A CN101361276B (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
KR1020087005984A KR100904437B1 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
ES07709015T ES2391116T3 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
RU2008137781/09A RU2404507C2 (en) | 2006-02-23 | 2007-02-16 | Audio signal processing method and device |
TW096106321A TWI337341B (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing a audio signal |
BRPI0706488-8A BRPI0706488A2 (en) | 2006-02-23 | 2007-02-16 | method and apparatus for processing audio signal |
EP07709017.3A EP1987597B1 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
KR1020087005985A KR100904438B1 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
US12/280,323 US7991495B2 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
PCT/KR2007/000866 WO2007097550A1 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
US12/280,309 US7881817B2 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
EP07709015A EP1987595B1 (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
CA2636330A CA2636330C (en) | 2006-02-23 | 2007-02-16 | Method and apparatus for processing an audio signal |
HK09105053.4A HK1127825A1 (en) | 2006-02-23 | 2009-06-05 | Method and apparatus for processing an audio signal |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US77577506P | 2006-02-23 | 2006-02-23 | |
US60/775,775 | 2006-02-23 | ||
US79190706P | 2006-04-14 | 2006-04-14 | |
US60/791,907 | 2006-04-14 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20070087494A true KR20070087494A (en) | 2007-08-28 |
Family
ID=38613498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070013364A KR20070087494A (en) | 2006-02-23 | 2007-02-08 | Method and apparatus for decoding multi-channel audio signal |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20070087494A (en) |
RU (1) | RU2404507C2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009054665A1 (en) * | 2007-10-22 | 2009-04-30 | Electronics And Telecommunications Research Institute | Multi-object audio encoding and decoding method and apparatus thereof |
-
2007
- 2007-02-08 KR KR1020070013364A patent/KR20070087494A/en unknown
- 2007-02-16 RU RU2008137781/09A patent/RU2404507C2/en active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009054665A1 (en) * | 2007-10-22 | 2009-04-30 | Electronics And Telecommunications Research Institute | Multi-object audio encoding and decoding method and apparatus thereof |
Also Published As
Publication number | Publication date |
---|---|
RU2008137781A (en) | 2010-03-27 |
RU2404507C2 (en) | 2010-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100904439B1 (en) | Method and apparatus for processing an audio signal | |
US8867612B2 (en) | Decoding method for decoding an incoming bitstream and method for performing the same | |
US20090216542A1 (en) | Method and apparatus for encoding and decoding an audio signal | |
KR20070087494A (en) | Method and apparatus for decoding multi-channel audio signal | |
AU2007218453B2 (en) | Method and apparatus for processing an audio signal | |
JP2011085643A (en) | Decoder, information processor and voice compression format determination method | |
KR20070003574A (en) | Method and apparatus for encoding and decoding an audio signal |