KR20100114484A - A method and an apparatus for processing an audio signal - Google Patents
A method and an apparatus for processing an audio signal Download PDFInfo
- Publication number
- KR20100114484A KR20100114484A KR1020100035031A KR20100035031A KR20100114484A KR 20100114484 A KR20100114484 A KR 20100114484A KR 1020100035031 A KR1020100035031 A KR 1020100035031A KR 20100035031 A KR20100035031 A KR 20100035031A KR 20100114484 A KR20100114484 A KR 20100114484A
- Authority
- KR
- South Korea
- Prior art keywords
- scale factor
- global gain
- information
- difference value
- data
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000005236 sound signal Effects 0.000 title abstract description 19
- 230000003595 spectral effect Effects 0.000 claims description 41
- 238000013139 quantization Methods 0.000 claims description 14
- 239000000284 extract Substances 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 14
- 230000000875 corresponding effect Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000003672 processing method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000003874 inverse correlation nuclear magnetic resonance spectroscopy Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
본 발명은 신호 처리 방법 및 장치에 관한 것으로서, 더욱 상세하게는 오디오 코딩에 있어서 양자화된 데이터(예: 글로벌게인과 스케일팩터 데이터)를 코딩하기 위한 방법 및 장치에 관한 것이다. The present invention relates to a signal processing method and apparatus, and more particularly, to a method and apparatus for coding quantized data (eg, global gain and scale factor data) in audio coding.
일반적으로, 음악 신호와 같은 오디오 신호에 대해서는 오디오 특성에 기반한 코딩 방식을 적용하고, 음성 신호에 대해서는 음성 특성에 기반한 코딩 방식을 적용한다.In general, a coding scheme based on audio characteristics is applied to an audio signal such as a music signal, and a coding scheme based on speech characteristics is applied to a speech signal.
오디오 특성과 음성 특성이 혼재되어 있는 신호에 대해서 어느 하나의 코딩 방식을 적용하는 경우, 오디오 코딩 효율이 떨어지거나, 음질이 나빠지는 문제점이 있다.When any one of the coding schemes is applied to a signal in which audio and voice characteristics are mixed, audio coding efficiency or sound quality deteriorates.
본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 스케일팩터 정보를 전송하는 데 있어서 비트수를 줄일 수 있는 코딩 방법 및 장치를 제공하는 데 그 목적이 있다. The present invention has been made to solve the above problems, and an object thereof is to provide a coding method and apparatus capable of reducing the number of bits in transmitting scale factor information.
본 발명의 또 다른 목적은, 신호 처리에서 글로벌게인정보와 스케일팩터 데이터를 정보간의 연관성에 따라서 효율적으로 전송하기 위한 코딩방법 및 장치에 대한 것이다. Still another object of the present invention is to provide a coding method and apparatus for efficiently transmitting global gain information and scale factor data according to an association between information in signal processing.
본 발명의 또 다른 목적은, 팩터 데이터(스케일팩터 데이터 또는 스케일팩터 밴드의 개수 등)를 전송하는 데 있어서, 이전 프레임의 데이터를 이용하여 효율적으로 전송하기 위한 코딩 방법 및 장치를 제공하는 데 있다.Another object of the present invention is to provide a coding method and apparatus for efficiently transmitting factor data (scale factor data or the number of scale factor bands) using data of a previous frame.
본 발명은 다음과 같은 효과와 이점을 제공한다.The present invention provides the following effects and advantages.
첫째, 음성 신호의 특성을 갖는 신호는 음성 신호로 디코딩하고, 오디오 신호의 특성을 갖는 신호는 오디오 신호로 디코딩하기 때문에, 각 신호 특성에 부합하는 디코딩 방식이 적응적으로 선택되는 효과가 있다.First, since a signal having a characteristic of a voice signal is decoded into a voice signal and a signal having a characteristic of an audio signal is decoded into an audio signal, there is an effect of adaptively selecting a decoding scheme corresponding to each signal characteristic.
둘째, 글로벌게인과 스케일팩터 데이터의 코딩 방식을 산술코딩방식으로 통합함으로써 추가적으로 발생할 수 있는 오버헤드값을 줄이고 낮은 비트수로 코딩이 가능하다.Second, by integrating the coding method of global gain and scale factor data into an arithmetic coding method, it is possible to reduce the overhead that can occur additionally and to code with a low number of bits.
셋째, 현재 프레임의 팩터 데이터를 그대로 전송하지 않고, 이전 프레임의 팩터 데이터와의 차분값을 전송함으로써, 비트수를 줄일 수 있다.Third, the number of bits can be reduced by transmitting the difference value with the factor data of the previous frame without transmitting the factor data of the current frame as it is.
넷째, 허프만 코딩방식에서는 확률테이블의 변경이 어려운 반면에 본 발명에서는 가변적으로 확률테이블을 변경하여 효율적인 코딩이 가능하다. Fourth, while it is difficult to change the probability table in the Huffman coding scheme, the present invention enables efficient coding by varying the probability table.
다섯째, 허프만 코딩방식에서 여러 개의 심볼을 이어서 코딩하는 경우에 비효율적인 반면 산술코딩시 한 세트의 여러 심볼을 보낼 때 비트수를 줄일 수 있는 유리한 이점을 가지고 있다. Fifth, the Huffman coding method is inefficient in the case of continuously coding a plurality of symbols, but has an advantageous advantage of reducing the number of bits when sending a set of several symbols in arithmetic coding.
여섯째, 사용되는 스케일팩터데이터의 개수를 1만큼 뺀 값으로 코딩하므로써, 코딩에 소요되는 비트수를 절약할 수 있다. Sixth, by coding the number of scale factor data used by subtracting by one, the number of bits required for coding can be saved.
일곱째, 글로벌게인의 할당 비트수를 가변비트수로 코딩 함으로써, 코딩에 소요되는 비트수를 현저히 절약할 수 있다.Seventh, by coding the number of bits of global gain allocated to the number of variable bits, the number of bits required for coding can be significantly reduced.
여덟째, 글로벌게인을 리셋플래그에 따라 절대값과 스케일팩터의 차분값으로 병행하여 사용할 수 있으므로, 비트수를 절약할 수 있다.Eighth, since the global gain can be used in parallel as the difference between the absolute value and the scale factor according to the reset flag, the number of bits can be saved.
도 1은 본 발명의 일 실시예에 따른 인코딩 장치의 구성도.
도 2는 본 발명의 일 실시예에 따른 인코딩 방법에 대한 순서도.
도 3(a)는 스케일팩터 및 스케일팩터 밴드의 관계에 대한 도면.
도3(b)는 윈도우그룹이 여러 개일 때 스케일팩터 및 스케일팩터 밴드의 관계에 대한 도면.
도 4는 본 발명의 일 실시예에 따른 게인결정부의 세부 순서도.
도 5는 전송되는 비트스트림의 스케일팩터의 차분값과 스펙트럴 데이터의 관계에 대한 도면.
도 6은 글로벌 게인 및 스케일팩터의 차분값과의 관계에 대한 도면.
도 7은 본 발명의 일 실시 예에 따른 산술인코딩부에 대한 세부 순서도.
도 8 은 본 발명의 일 실시 예에 따른 멀티플렉싱부에 대한 세부순서도.
도 09는 본 발명의 일 실시예에 따른 주파수도메인기반 코딩정보에 관한 채널의 비트스트림의 스케일팩터 밴드의 개수가 하나 이상일 때 수행되는 신텍스.
도 10은 본 발명의 일 실시예에 따른 스케일팩터와 스펙트럴데이터에 관한 신텍스.
도 12은 본 발명의 일 실시예에 따른 리셋플래그에 따른 산술코딩정보에 관한 신텍스.
도 13은 본 발명의 일 실시예에 따른 디코딩 장치의 구성도.
도 14는 본 발명의 일 실시예에 따른 디코딩 방법의 순서도.
도 15는 도 12의 디멀티플렉싱부의 일 실시 예에 따른 세부 순서도.
도 16은 도 12의 게인획득부의 일 실시 예에 따른 세부 순서도 .
도 17은 도 12의 산술디코딩부의 일 실시 예에 따른 세부 순서도.
도 18은 본 발명의 다른 실시예에 따른 산술코딩장치가 구현된 제품의 개략적인 구성도.1 is a block diagram of an encoding apparatus according to an embodiment of the present invention.
2 is a flowchart of an encoding method according to an embodiment of the present invention.
Figure 3 (a) is a diagram of the relationship between the scale factor and the scale factor band.
Figure 3 (b) is a diagram of the relationship between the scale factor and the scale factor band when there are several window groups.
4 is a detailed flowchart of a gain determination unit according to an embodiment of the present invention.
5 is a diagram illustrating a relationship between difference values of spectral data and scale factors of transmitted bitstreams;
6 is a diagram of a relationship between a global gain and a difference value of a scale factor.
7 is a detailed flowchart of an arithmetic encoding unit according to an embodiment of the present invention.
8 is a detailed flowchart of a multiplexing unit according to an embodiment of the present invention.
FIG. 09 is a syntax performed when the number of scale factor bands of a bitstream of a channel for frequency domain based coding information is one or more according to an embodiment of the present invention. FIG.
10 is a syntax for scale factor and spectral data according to an embodiment of the present invention.
12 is a syntax for arithmetic coding information according to a reset flag according to an embodiment of the present invention.
13 is a block diagram of a decoding apparatus according to an embodiment of the present invention.
14 is a flowchart of a decoding method according to an embodiment of the present invention.
15 is a detailed flowchart of an embodiment of the demultiplexing unit of FIG. 12.
16 is a detailed flowchart of an example of a gain acquisition unit of FIG. 12.
FIG. 17 is a detailed flowchart of an arithmetic decoding unit of FIG. 12. FIG.
18 is a schematic configuration diagram of a product in which an arithmetic coding device is implemented according to another embodiment of the present invention.
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시 예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시 예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시 예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다. Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. Prior to this, terms or words used in the present specification and claims should not be construed as being limited to the common or dictionary meanings, and the inventors should properly explain the concept of terms in order to best explain their own invention. Based on the principle that can be defined, it should be interpreted as meaning and concept corresponding to the technical idea of the present invention. Therefore, the embodiments described in this specification and the configurations shown in the drawings are merely the most preferred embodiments of the present invention and do not represent all the technical ideas of the present invention. Therefore, It is to be understood that equivalents and modifications are possible.
상기와 같은 목적을 달성하기 위하여 본 발명에 따른 신호처리 방법은 글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 포함하는 비트스트림을 수신하는 단계와 밴드의 개수를 수신하는 단계 및 상기 밴드의 개수를 이용하여 산술 코딩 함으로써, 글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 상기 비트스트림으로부터 획득하는 단계, 상기 글로벌게인 정보 및 상기 스케일팩터 차분값을 이용하여 스케일팩터 데이터를 생성하는 단계 및 상기 스케일팩터 데이터 및 상기 스펙트럴 데이터를 이용하여 역양자화를 수행함으로써, 스펙트럴 계수를 획득하는 단계를 포함한다. In order to achieve the above object, a signal processing method according to the present invention includes receiving a bitstream including global gain information, scale factor difference values, and spectral data, receiving a number of bands, and a number of bands. Obtaining a global gain information, a scale factor difference value, and spectral data from the bitstream by performing arithmetic coding using the method, generating scale factor data using the global gain information and the scale factor difference value, and Obtaining spectral coefficients by performing inverse quantization using scale factor data and the spectral data.
본 발명에서 다음 용어는 다음과 같은 기준으로 해석될 수 있고, 기재되지 않은 용어라도 하기 취지에 따라 해석될 수 있다. 코딩은 경우에 따라 인코딩 또는 디코딩으로 해석될 수 있고, 정보(information)는 값(values), 파라미터(parameter), 계수(coefficients), 성분(elements) 등을 모두 아우르는 용어로서, 경우에 따라 의미는 달리 해석될 수 있는바, 그러나 본 발명은 이에 한정되지 아니한다.In the present invention, the following terms may be interpreted based on the following criteria, and terms not described may be interpreted according to the following meanings. Coding can be interpreted as encoding or decoding in some cases, and information is a term that encompasses values, parameters, coefficients, elements, and so on. It may be interpreted otherwise, but the present invention is not limited thereto.
또한, 본 발명에서 스케일팩터 밴드란, 하나의 스케일팩터가 적용되는 주파수 밴드에 해당할 수 있지만, 이에 한정되지 아니하고, 다양한 용도의 주파수 밴드를 의미하는 것으로 이해되어야 한다. 한편 하나의 스케일팩터는 복수의 스펙트럴 데이터에 대응될 수 있는 값이므로, 스케일팩터 밴드는 복수의 스펙트럴 데이터에 적용되는 주파수 밴드일 수 있다. 여기서 스케일팩터 및 스펙트럴 데이터는 오디오 신호를 변형 이산 코사인 변환(Modified Discrete Cosine Transform: MDCT) 등을 수행하여 주파수 스펙트럼으로 변환이 수행된 결과일 수도 있지만 이에 한정되지 않는다. In addition, in the present invention, the scale factor band may correspond to a frequency band to which one scale factor is applied, but is not limited thereto and should be understood as meaning a frequency band for various uses. Meanwhile, since one scale factor is a value that may correspond to a plurality of spectral data, the scale factor band may be a frequency band applied to the plurality of spectral data. Here, the scale factor and spectral data may be the result of performing a transformed frequency spectrum by performing a modified discrete cosine transform (MDCT) on the audio signal, but is not limited thereto.
여기서 오디오 신호(audio signal)란, 광의로는, 비디오 신호와 구분되는 개념으로서, 재생 시 청각으로 식별할 수 있는 신호를 지칭하고, 협의로는, 음성(speech) 신호와 구분되는 개념으로서, 음성 특성이 없거나 적은 신호를 의미한다.Here, the audio signal is a concept that is broadly distinguished from the video signal, and refers to a signal that can be visually identified during reproduction. The narrow signal is a concept that is distinguished from a speech signal. Means a signal with little or no characteristics.
본 발명에 따른 오디오 신호 처리 방법 및 장치는, 변형이산 코사인 변환, 게인 결정과정 및 산술코딩이 이용되고 멀티플렉싱과 양자화 과정이 이용될 수 있는 인코딩/디코딩 장치 및 방법이 될 수 있는바, 이하, 변형 이산 코사인 변환(S110 단계), 양자화 과정(S120단계), 게인 결정 과정(S130단계), 산술코딩과정(S140단계) 및 멀티플렉싱 과정(S150단계)에 대하여 설명하고, 위 과정들이 적용된 오디오 신호 인코딩/ 디코딩 장치 및 방법에 대해서 설명하고자 한다.The audio signal processing method and apparatus according to the present invention may be an encoding / decoding apparatus and method in which modified discrete cosine transform, gain determination process, and arithmetic coding are used, and multiplexing and quantization process can be used. Discrete cosine transform (S110), quantization (S120), gain determination (S130), arithmetic coding (S140), and multiplexing (S150) will be described. A decoding apparatus and method will be described.
도1은, 본 발명의 일 실시예에 따른 신호 인코딩 장치(100)의 구성을 보여주는 도면이다. 도 1을 참조하면, 본 발명의 일 실시예에 따른 오디오 신호 인코딩 장치는 게인결정부(130) 및 산술코딩부(140)를 포함하고, 주파수 변환부(110), 양자화부(120), 및 멀티플렉싱부(150)를 더 포함할 수 있다. 1 is a diagram showing the configuration of a
이하 도 1 및 도 2를 함께 참조하면서 본 발명의 실시예에 따른 오디오 신호 인코딩 장치 및 이 장치가 수행하는 인코딩 방법에 대해서 설명하고자 한다.Hereinafter, an audio signal encoding apparatus and an encoding method performed by the apparatus will be described with reference to FIGS. 1 and 2.
주파수변환부(110)는 입력된 오디오 신호에 대해 주파수 변환을 수행함으로써 스펙트럴 계수를 획득한다(S110 단계). 여기수 주파수 변환은 이산 코사인 변환(Modified Discrete Cosine Transform: MDCT) 방식에 따른 것일 수 있지만 본 발명은 이에 한정되지 아니한다. 시간-주파수 변환 기법으로 변형 이산 코사인 변환의 장점은 데이터율을 증가시키지 않으면서도 이웃한 블록 간에 50%중복을 허용할 수 있어 블록 변환에서 발생하는 에지에러나 에일리어싱을 효율적으로 제거하는 동시에 코더의 완전복원 조건을 만족할 수 있다. 이러한 주파수 도메인으로 변환함으로써 양자화 과정의 전단계인 스펙트럴 계수를 얻는다. The
이러한 시간 주파수 변환은 시간영역신호를 주파수 영역으로 변환하는 것으로 오디오신호를 몇 개의 주파수 성분으로 세분화하고 이들 주파수 성분의 에너지 비율에 따라 비트를 적절히 할당하여 신호의 중복성을 줄이는 방법이다. 대표적으로 변형 이산 코사인 변환(MDCT)등이 이에 해당한다. The time frequency conversion is a method of converting a time domain signal into a frequency domain to subdivide an audio signal into several frequency components, and appropriately allocate bits according to energy ratios of these frequency components to reduce signal redundancy. Typically, such as modified discrete cosine transform (MDCT).
코딩된 비트스트림은 주파수 도메인 기반 코딩채널스트림 (fd_channel_stream)을 통해 전송된다. 음성 성분이 들어가 있는 데이터는 주로 선형 예측(Linear Prediction)기반의 코딩장치를 사용하는데 이 정보는 선형 예측된 주파수 도메인 기반 코딩채널스트림(Lpd_Channel_Stream)을 통해 전송된다. The coded bitstream is transmitted through a frequency domain based coding channel stream (fd_channel_stream). Data containing speech components is mainly used in a linear prediction based coding apparatus, and this information is transmitted through a linear predicted frequency domain based coding channel stream (Lpd_Channel_Stream).
이에 반하여 음악 데이터의 코딩에 주로 사용하는 주파수 도메인 기반 코딩채널스트림(Fd_Channel_Stream)의 경우에는 각 프레임의 샘플들을 변형 이산 코사인 변환(MDCT)을 통해 주파수 도메인의 값들로 변환한다.In contrast, in the case of a frequency domain-based coding channel stream (Fd_Channel_Stream) mainly used for coding of music data, samples of each frame are converted into values of the frequency domain through a modified discrete cosine transform (MDCT).
한편, 상기 주파수 변환은 스케일팩터 밴드별로 수행될 수 있으나, 본 발명은 이에 한정되지 아니한다. 스케일팩터 밴드에 대해서는 추후 도 3과 함께 후술하고자 한다.Meanwhile, the frequency conversion may be performed for each scale factor band, but the present invention is not limited thereto. The scale factor band will be described later with reference to FIG. 3.
상기 양자화부(120)는 스펙트럴 계수에 대해서 양자화를 수행함으로써, 스케일팩터 및 스펙트럴 데이터를 획득한다(S120 단계). 이 단계는 다음 수학에 따라 수행될 수 있다. The
상기 수학식에서 X'는 X를 양자화하여 얻어지는 근사값이며 이를 스펙트럴 계수라 한다. scf는 정수로 X양자화된 스케일팩터, Xquant는 정수로 양자화된 스펙트럴 데이터를 의미한다. In the above equation, X 'is an approximation obtained by quantizing X, which is called a spectral coefficient. scf is an X quantized scale factor as an integer, and Xquant is spectral data quantized as an integer.
스케일팩터는 스펙일팩터 밴드별로 정해질 수 있는데, 이에 대해서는 도 3을 참조하면서, 설명하고자 한다. 도 3은 스케일팩터와 스케일팩터 밴드의 관계를 나타낸 도면이다. 도 3의 (a)를 우선 참조하면, 각 스케일팩터 밴드에 하나의 스케일팩터가 존재함을 알 수 있다. 즉, 스케일팩터 밴드(sfb)는 0번째부터 max_sfb-1번째까지(여기서 max_sfb는 앞서 언급한 바와 같이 밴드의 개수) 존재하고, 각 스케일팩터 밴드(sfb(i))에 대응하여 스케일팩터(scf[i])가 존재함을 알 수 있다. 밴드의 개수(max_sfb)는 프레임에 상관없이 고정된 값일 수 있지만, 프레임마다 변화하는 값일 수도 있다.The scale factor may be determined for each specular factor band, which will be described with reference to FIG. 3. 3 is a diagram illustrating a relationship between a scale factor and a scale factor band. Referring first to FIG. 3A, it can be seen that one scale factor exists in each scale factor band. That is, the scale factor band sfb exists from 0th to max_sfb-1th (where max_sfb is the number of bands as mentioned above), and the scale factor scf corresponding to each scale factor band sfb (i). It can be seen that [i]) exists. The number of bands max_sfb may be a fixed value regardless of the frame, but may also be a value that varies from frame to frame.
도 3의 (b)는 윈도우 그룹이 여러 개일 때의 경우에 스케일팩터의 개수 및 스케일팩터 밴드의 개수와의 관계를 나타내는 도면이다. 도 3의 (b)를 참조하면 윈도우 그룹이 개수가 num_window_groups인 경우, 하나의 스케일팩터 밴드(sfb[i])에는 복수의 스케일팩터(scf[i](g=0), scf[i](g=1), ,scf[i](g=num_window_group-1)가 존재함을 알 수 있다. 한편, 복수의 스케일팩터(scf[i](g=0), scf[i](g=1), ,scf[i](g=num_window_group-1) (여기서 i는 스케일팩터 밴드 인덱스)는 서로 다른 값을 가질 수 있음은 물론이다. 즉, 총 스케일팩터의 개수는 윈도우 그룹의 개수(num_window_groups) 및 스케일팩터 밴드의 개수(max_sfb)의 곱에 해당함을 알 수 있다.FIG. 3B is a diagram showing a relationship between the number of scale factors and the number of scale factor bands when there are several window groups. Referring to FIG. 3B, when the number of window groups is num_window_groups, one scale factor band sfb [i] includes a plurality of scale factors scf [i] (g = 0) and scf [i] ( g = 1),, scf [i] (g = num_window_group-1), while a plurality of scale factors (scf [i] (g = 0), scf [i] (g = 1) are present. Of course, scf [i] (g = num_window_group-1) (where i is the scale factor band index) can have different values, that is, the total number of scale factors is the number of window groups (num_window_groups). And it can be seen that it corresponds to the product of the number of scale factor bands (max_sfb).
다시 도 1 및 도 2를 참조하면, 앞서 설명한 양자화부(120)는 양자화를 수행함으로써 스케일팩터 및 스펙트럴 데이터를 획득하는 과정에 있어서, 스펙트럴 밴드의 개수(또는 밴드의 개수)(max_sfb) 및 윈도우 그룹의 개수(num_window_groups)를 이용하거나 결정한다. 이 밴드의 개수 및 윈도우 그룹의 개수는 멀티플렉싱부(150)에 전달되어 비트스트림에 포함될 수 있다. 예를 들어 윈도우 그룹의 개수는 ics_info()의 스케일팩터 그룹핑 정보(scale_factor_grouping info)를 바탕으로 알 수 있으며, 스케일팩터 밴드의 개수(max_sfb) 또한 매 프레임마다 전송될 수 있다.Referring back to FIGS. 1 and 2, the
한편, 게인결정부(130)는 양자화부(120)에 의해 획득된 스케일팩터(scf[i])를 근거로 글로벌 게인(gg: global gain) 및 스케일팩터 차분값(dscf[i])를 결정한다(S130 단계). 나아가 글로벌 게인(gg)를 근거로 글로벌 게인 정보를 생성할 수 있다. 글로벌 게인 정보가 글로벌 게인의 차분값에 해당하는지 절대값에 해당하는지를 나타내는 리셋 플래그를 셋팅하여 멀티플렉싱부(150)에 전달할 수 있다. 이에 대한 구체적인 설명은 도 4내지 도 6 등 과 함께 후술하고자 한다.Meanwhile, the
산술코딩부(140)는 게인 결정부(130)에 의해 생성된 글로벌 게인 정보 및 스케일팩터 차분값(dscf[i]) 및 스펙트럴 데이터(sptr[j])에 대해서 산술 코딩(Arithmetic coding)을 수행함으로써 코딩 결과를 멀티플렉싱부(150)에 전달한다(S140 단계). 이 과정에 대한 구체적인 설명은 도 7과 함께 설명하고자 한다.
도 4는 앞서 언급된 게인결정부(130)가 글로벌 게인(gg) 및 스케일팩터 차분값(dscf)을 생성하는 세부적인 과정에 해당하는 순서도 있다. 도 4를 참조하면, 우선 게인결정부(13)는 스케일팩터(scf)를 이용하여 글로벌 게인(gg) 및 스케일팩터 차분값(dscf)를 생성한다(S132 단계). 우선 도 5를 참조하면서, 글로벌 게인 및 스케일팩터 차분값의 관계에 대해서 살펴보고자 한다. 도 5를 참조하면, 글로벌 게인(gg)는 하나의 프레임 내에 속하는 복수의 스케일팩터(scf[])를 대표하는 값으로서, 첫 번째 스케일팩터 밴드(i=0)에 대응하는 스케일팩터(scf[0])와 동일한 값일 수 있다. 스케일팩터 차분값(dscf[])은 일련의 스케일팩터들 중에서 이전에 해당하는 스케일팩터(예: scf[max_sfb_-m])과 현재의 스케일팩터(예:scf[max_sfb-m+1])와의 차분값에 해당할 수 있다. 따라서, 첫 번째 스케일팩터(scf[0])가 글로벌 게인(gg)이 되는 경우, 첫 번째 스케일팩터 밴드에 대응하는 스케일팩터 차분값(dscf[0])은 0이 될 수 있다.4 is a flowchart corresponding to a detailed process of generating the global gain gg and the scale factor difference value dscf by the
또한, 글로벌게인을 조절하는 경우 전체적인 게인의 조절이 가능하다. 그러므로 글로벌게인을 1만큼 증가시키는 경우 전체적인 스케일팩터의 값들이 1만큼 증가하는 효과를 얻는다.In addition, when adjusting the global gain, it is possible to adjust the overall gain. Therefore, if the global gain is increased by 1, the value of the overall scale factor is increased by 1.
도 6을 참조하면, 윈도우 그룹이 여러 개인 경우 일련의 스케일팩터들이 나타나 있음을 알 수 있다. 여기서 스케일 팩터들은 도면에서와 같이 윈도우그룹 순서대로(즉 g=0에 속하는 스케일팩터들 이후에 g=1에 속하는 스케일팩터들이 존재, g는 윈도우 그룹 인덱스) 있을 수도 있지만, 스케일팩터 밴드 순서대로(즉, i=0은 스케일팩터들이 위치한 다음에, i=1에 속하는 스케일팩터들이 위치(i는 스케일팩터 밴드 인덱스)) 존재할 수도 있다.Referring to FIG. 6, it can be seen that a series of scale factors are shown when there are several window groups. Here, the scale factors may be in window group order as shown in the figure (ie, scale factors belonging to g = 1 after scale factors belonging to g = 0, g is a window group index), but in scale factor band order ( That is, i = 0 may exist after the scale factors are located, and then scale factors belonging to i = 1 (i is the scale factor band index).
다시 도 4를 참조하면, S132 단계에서 글로벌 게인(gg)이 결정된 이후, 이 현재 프레임에 해당하는 글로벌 게인(gg_cur)을 그대로 글로벌 게인 정보로서 전송할지 아니면, 이전 프레임의 글로벌 게인(gg_prev)과의 차분값을 글로벌 게인 정보로서 전송할지 여부를 결정한다(S133 단계).Referring back to FIG. 4, after the global gain gg is determined in step S132, the global gain gg_cur corresponding to the current frame is transmitted as the global gain information as it is, or with the global gain gg_prev of the previous frame. It is determined whether to transmit the difference value as global gain information (step S133).
만약, 이전 프레임의 글로벌 게인(gg_prev)를 참조하기로 결정한 경우(S133 단계의 yes), 게인 결정부(130)에 의해 획득된 글로벌 게인값에 이전 프레임의 글로벌 게인(gg_prev)을 차감함으로써 글로벌 게인의 차분값을 획득한다(S134 단계)(상대값 모드). 이 경우 이전 프레임의 정보를 참조하는지 여부를 나타내는 리셋 플래그를 셋팅한다. 예를 들어, 이전 프레임의 정보를 참조한다는 것을 나타내기 위해 리셋 플래그를 0으로 셋팅할 수 있다(S136 단계).If it is determined to refer to the global gain (gg_prev) of the previous frame (yes in step S133), the global gain by subtracting the global gain (gg_prev) of the previous frame from the global gain value obtained by the
반대로, 이전 프레임의 글로벌 게인(gg_prev)를 참조하지 않기로 결정한 경우 (S133 단계의 no), 게인 결정부(130)에 의해 획득된 글로벌 게인값의 절대값 그대로 글로벌 게인 정보로 코딩한다(S135 단계)(절대값 모드). 이 경우, 이전 프레임의 정보를 참조하지 않는다는 것을 나타내기 위해 리셋 플래그를 1로 셋팅할 수 있지만(S137 단계), 본 발명은 이에 한정되지 아니한다. 글로벌게인정보가 절대값을 가지는 경우는 예를 들어 처음부터 코딩되지 아니하고 중간부터 코딩해야 하는 경우 이전프레임의 정보를 이용할 수 없어 코딩이 불가능한 경우 효율적으로 절대값을 지정하여 코딩하게 할 수 있는 것이다.On the contrary, when it is decided not to refer to the global gain (gg_prev) of the previous frame (no in step S133), the absolute gain of the global gain value obtained by the
한편, 여기서 글로벌 게인 정보(gg) (차분값 또는 절대값)은 그대로 전송할 수 있지만 옵셋(OFFSET)값을 적용(global_gain=global_gain + SF_OFFSET, SF_OFFSET=100)한 후에 전송할 수도 있다. Meanwhile, the global gain information gg (differential value or absolute value) may be transmitted as it is, but may be transmitted after applying an offset value (global_gain = global_gain + SF_OFFSET, SF_OFFSET = 100).
한편, 스케일팩터의 경우, 인덱스 오프셋(index_offset)이 더 이용될 수 있다. 여기서 인덱스 오프셋(index_offset)이란, 예를 들어, 인코더에서 -100 ~155을 0~255로 표현하기 위해 빼주고, 디코더에서 0 ~255를 -100 ~155로 복원하기 위해 더해주는 수(예: -100)일 수 있다. 따라서 작은 숫자로 인코더에서 전송함으로써 비트수를 줄이고 추후에 디코더에서 복원과정을 거쳐 신호를 만들어 효율을 높일 수 있다.On the other hand, in the case of a scale factor, an index offset index_offset may be further used. In this case, the index offset (index_offset) is, for example, a number subtracted from -100 빼 ~ 155 to 0 ~ 255 in the encoder and added to restore 0 ~ 255 to -100-~ 155 in the decoder (eg -100). Can be. Therefore, by transmitting a small number from the encoder, the number of bits can be reduced, and a signal can be made later through a decoder to improve efficiency.
도 5 및 도 6은 산술 코딩의 대상을 설명하기 위한 도면이고, 도 7은 앞서 산술코딩부(140)가 산술코딩을 수행하는 과정의 세부 단계에 대한 도면이다. 우선 도 5를 참조하면, 글로벌 게인(gg: global_gain), 및 스케일팩터 차분값(dscf[i], i는 스펙트럴밴드 인덱스) 및 스펙트럴 데이터(sptr[j])(j는 스펙트럴 데이터 인덱스)가 순서대로 위치하고 있음을 알 수 있다. 스케일팩터 차분값(dscf[])는 스케일팩터(scf[])와 그 개수가 동일할 수 있다. 앞서 설명한 바와 같이, 하나의 스케일팩터 밴드(sfb)에 복수의 스펙트럴 데이터(sptr[j])가 대응될 수 있기 때문에, 스펙트럴 데이터의 개수(n)은 스케일팩터 차분값의 개수보다 클 수 있다. 5 and 6 are diagrams for explaining an object of arithmetic coding, and FIG. 7 is a diagram for a detailed step of a process of performing arithmetic coding by the
이와 같이 글로벌 게인(gg), 스케일팩터 차분값(dscf) 및 스펙트럴 데이터(sptr) 전체가 산술 코딩의 대상이 되거나, 또는 글로벌 게인(gg) 및 스케일팩터 차분값(dscf)가 산술 코딩의 대상이 될 수 있다.In this way, the global gain (gg), the scale factor difference value (dscf) and the spectral data (sptr) are all subjected to arithmetic coding, or the global gain (gg) and scale factor difference value (dscf) are the object of arithmetic coding. This can be
산술 코딩(Arithmetic coding)이라 함은 엔트로피 코딩 방식 중 하나로서, 각 소스 심볼 대신 전체 메시지를 0과 1 사이의 단일 숫자로 변환하여 코딩하는 방법이다. 메시지의 크기에 따라, 허프만 코딩보다 압축률은 좋을 수 있다.Arithmetic coding is one of entropy coding schemes in which an entire message is converted into a single number between 0 and 1 instead of each source symbol. Depending on the size of the message, the compression rate may be better than Huffman coding.
도 6은 윈도우 그룹이 여러 개인 경우, 산술 코딩의 대상을 나타내는 도면으로서, 도 5의 경우보다 스케일팩터 차분값(dscf)의 개수가 윈도우 그룹의 개수(num_window_group)에 비례해서 크다는 점에서 차이가 있다.FIG. 6 is a diagram illustrating arithmetic coding targets when there are several window groups, which is different in that the number of scale factor difference values dscf is proportional to the number of window groups num_window_group than in FIG. 5. .
도 7을 참조하면서 산술코딩부(140)의 세부 과정에 대해서 설명하고자 한다. 앞서 도 5 및 도 6과 함께 나타낸 산술 코딩의 대상 중에서, 첫번째 밴드의 스케일팩터 차분값(dscf[0])이 0이 될 수 있기 때문에, 이를 산술 코딩의 대상에 포함시킬 수도 있거나(S141 단계), 제외시킬 수도 있다(S142 단계). A detailed process of the
이전 프레임의 동일 밴드의 스케일팩터의 차분값을 참조하여 산술코딩시 이용할 확률테이블을 선택한다(S143 단계). 이전프레임의 동일 밴드의 스케일팩터의 차분값을 이용함으로써, 코딩시 대체로 비슷한 패턴을 보이는 특성을 이용하여 이에 따른 확률분포를 분석한다. 이에 따른 확률테이블로서 코딩하여 코딩효율을 높이는 것이 가능하다. A probability table to be used in arithmetic coding is selected by referring to difference values of scale factors of the same band of the previous frame (step S143). By using the difference value of the scale factor of the same band of the previous frame, the probability distribution is analyzed by using the characteristic showing a generally similar pattern in coding. Accordingly, it is possible to increase coding efficiency by coding as a probability table.
표1에 따르면 이전 프레임의 스케일팩터 밴드에서의 차분값이 현재프레임의 스케일팩터의 차분값과 상관성을 가지고 있으며, 이는 이전프레임의 스케일팩터의 각 값에 대하여 현재프레임의 스케일팩터의 차분값이 0을 중심으로 가장 높은 값으로 분포되어 있으며, 이전 프레임의 스케일팩터의 차분값이 양수로 갈수록 현재프레임의 스케일팩터의 차분값은 일반적으로 낮아지는 분포를 가지므로 표1과 같은 상관성에 근거하여 현재 프레임의 스케일팩터의 차분값을 코딩하는데 이용할 수 있다.According to Table 1, the difference in the scale factor band of the previous frame is correlated with the difference in the scale factor of the current frame, which means that the difference in the scale factor of the current frame is 0 for each value of the scale factor of the previous frame. It is distributed with the highest value around, and the difference of scale factor of current frame generally decreases as the difference of scale factor of previous frame becomes positive, so the current frame is based on correlation as shown in Table 1. It can be used to code the difference value of the scale factor of.
Difference value of scale factor of current frame
본 발명에서의 스케일팩터의 차분값(dscf)에 관한 확률테이블의 개수 예시는 표 2와 같다.Table 2 shows an example of the number of probability tables regarding the difference value dscf of the scale factor in the present invention.
조건에 따라 11개 중 스케일팩터의 차분값(dscf)을 코딩하는데 사용하는 확률테이블을 적응적으로 변경하여 사용한다. 여기서 이전 프레임의 스케일팩터의 차분값(p_dscf)은 이전 프레임의 동일 스케일팩터 밴드(sfb)에서의 스케일팩터의 차분값(dscf)를 의미한다.According to the condition, the probability table used to code the difference value (dscf) of the scale factor among 11 is adaptively used. Here, the difference value p_dscf of the scale factor of the previous frame means the difference value dscf of the scale factor in the same scale factor band sfb of the previous frame.
상기 스케일팩터의 차분값은 이전 프레임과 현재 프래임을 코딩하기 위하여, 프레임의 길이에 따른 확률테이블을 결정하는 단계를 포함하는 디코딩 과정에서도 사용된다.The difference value of the scale factor is also used in the decoding process including determining a probability table according to the length of the frame, in order to code the previous frame and the current frame.
롱 프레임인 경우에는 상기 발명과 같은 과정을 그대로 수행하나, 숏 프레임의 경우에는 롱 프레임과 동일한 과정을 수행하는 것은 비트절감차원에서 비효율적이므로 이전 프레임정보를 사용하지 아니하고 별도로 확률테이블을 사용하여 코딩효율을 높일 수 있다. 즉, 이전 프레임의 스케일팩터의 차분값(dscf) 저장시 이전 프레임의 0부터 maxsfb-1까지의 스케일팩터밴드에 대해 스케일팩터의 차분값(dscf)을 저장하게 되는데 이 때 스케일팩터밴드의 개수(max_sfb)보다 이전 프래임의 밴드의 개수가 같거나 큰 스케일팩터밴드(sfb)의 스케일팩터의 차분값(dscf)은 0으로 세팅한다.In the case of a long frame, the same process as described above is performed. However, in the case of a short frame, performing the same process as the long frame is inefficient in terms of bit reduction. Therefore, coding efficiency is achieved by using a probability table separately without using previous frame information. Can increase. That is, when the difference value (dscf) of the scale factor of the previous frame is stored, the difference value (dscf) of the scale factor is stored for the scale factor band of 0 to maxsfb-1 of the previous frame. The difference value dscf of the scale factor of the scale factor band sfb equal to or larger than the number of bands of the previous frame is set to 0.
또한 롱 프레임의 경우 숏 프레임일 경우의 스케일팩터의 차분값(dscf)의 분포와 특성이 다르기 때문에 숏 프레임에 대해서는 별도의 스케일팩터의 차분값(dscf)에 관한 확률테이블을 두어 코딩효율을 높일 수 있다.In addition, in the case of long frames, the distribution and characteristics of the difference value (dscf) of the scale factor in the case of the short frame are different. Therefore, the coding efficiency can be improved by providing a probability table for the difference value (dscf) of the separate scale factor for the short frame. have.
도 8은 멀티플렉싱부(150)가 각 단계에서 생성된 팩터들을 멀티플렉싱하여 전송하는 과정을 나타내고 있다. 도 8을 참조하면, 우선 앞서 설명한 밴드의 개수(max_sfb)가 0인 경우, 현재 프레임에 대해 팩터들(예: 스케일팩터 등)이 존재하지 않거나 존재할 필요가 없기 때문에, 밴드의 개수(max_sfb)가 0인 경우(S151 단계의 no), 멀티플렉싱하는 과정을 종료한다. 이에 의해, 밴드의 개수(max_sfb)가 0일 때 어떤 정보도 인코딩하지 않음으로써 비트수를 보다 절감할 수 있다. 8 illustrates a process in which the
반대로 밴드의 개수(max_sfb)가 1이상인 경우(S151 단계의 yes), 현재 프레임에 대해 스케일팩터 등의 정보가 존재하는 것이기 때문에, 멀티플렉싱 과정을 진행한다.On the contrary, when the number of bands max_sfb is 1 or more (yes in step S151), since the information such as scale factor exists for the current frame, the multiplexing process is performed.
한편, 도 9 내지 도 12는 멀티플렉싱부(150)가 비트스트림을 생성할 때 신택스의 예들이다. 도 9의 (L1) 및 (L2) 행을 참조하면, 상기 S151 단계에 대응하는 조건, 즉, 밴드의 개수 1이상일 때의 조건(if(max_sfb){})이 만족되는 경우, 그 이후 단계(ac_scf_spectral_data())가 수행됨을 알 수 있다. 도 9 내지 도 12에 도시된 신택스는 일 예일뿐, 본 발명은 이에 한정되지 않음은 물론이다.9 to 12 are examples of syntax when the
다시 도 8을 참조하면, 앞서 설명한 바와 같이 밴드의 개수가 1이상인 경우, 앞서 S136 단계(또는 S137 단계)에서 셋팅한 리셋 플래그를 비트스트림에 포함시킨다(S152 단계). 도 10을 참조하면, 앞서 도 9에서의 ac_scf_sepctral_data()의 세부 내용이 나타나 있다. 즉, (L1) 행을 참조하면, 제일 상단에 리셋 플래그(arith_reset_flag)가 존재함을 알 수 있다. 즉, 추후 설명될 산술 코딩의 결과에 앞서서 리셋 플래그가 존재하는 것이다.Referring to FIG. 8 again, as described above, when the number of bands is one or more, the reset flag set in step S136 (or step S137) is included in the bitstream (step S152). Referring to FIG. 10, details of ac_scf_sepctral_data () in FIG. 9 are shown. That is, referring to the (L1) line, it can be seen that the reset flag (arith_reset_flag) is present at the top. That is, the reset flag exists before the result of the arithmetic coding described later.
그런 다음, 앞서 S144 단계에서 산술 코딩된 결과를 비트스트림에 포함시킴으로써 디코더에 전송한다(S153 단계). 도 10의 (L2) 행 및 도 11을 참조하면, 글로벌 게인 및 스케일팩터가 산술코딩되어 전송됨을 알 수 있다. 보다 구체적으로, 도 11의 (L1)행에 나타난 바와 같이(acod_gg) 글로벌 게인(gg)이 산술 코딩이 됨으로써, 고정비트가 아닌 가변비트(vlclbf)로 코딩됨을 알 수 있다. 한편, 도 11의 (L2)행에 나타난 바와 같이(acod_scf[]) 스케일팩터가 역시 산술코딩되어 가변비트로서 비트스트림에 포함됨을 알 수 있다. 한편, 도 10의 (L3)행에 나타난 신택스 엘리먼트(arith_data()) 및 도 12는 스펙트럴 데이터(sptr) 역시 산술 코딩되어 가변비트로서 비트스트림에 포함되는 것을 나타내는 것이다.Thereafter, the arithmetic-coded result in step S144 is included in the bitstream and transmitted to the decoder (step S153). Referring to (L2) of FIG. 10 and FIG. 11, it can be seen that the global gain and scale factor are arithmetic coded and transmitted. More specifically, it can be seen that the global gain gg is coded as a variable bit (vlclbf) rather than a fixed bit as shown in the (L1) line of FIG. 11 (acod_gg) by arithmetic coding. On the other hand, as shown in (L2) of Figure 11 (acod_scf []) scale factor is also arithmetic coded it can be seen that included in the bitstream as a variable bit. On the other hand, the syntax element (arith_data ()) and FIG. 12 shown in the line (L3) of FIG. 10 indicate that the spectral data sptr is also arithmetic coded and included in the bitstream as a variable bit.
이와 같이 본 발명의 실시예에 다른 따른 인코딩 장치 및 인코딩 방법은 상기와 같이 설명된 바에 따라, 글로벌 게인 및 스케일팩터 (나아가 스펙트럴 데이터)까지 산술 코딩함으로써, 보다 비트효율을 높일 수 있다.As described above, the encoding apparatus and the encoding method according to the embodiment of the present invention can increase bit efficiency by arithmetically coding global gain and scale factor (or spectral data).
이하에서는 본 발명의 실시예에 따른 디코딩 장치 및 디코딩 방법에 대해서 설명하고자 한다.Hereinafter, a decoding apparatus and a decoding method according to an embodiment of the present invention will be described.
도13은, 본 발명의 일 실시예에 따른 신호 디코딩 장치(200)의 구성을 보여주는 도면이다. 이는 앞서 도1에서 설명된 인코딩 장치의 역과정을 수행하는 장치에 해당할 수 있다. 도 13을 참조하면, 디코딩 장치(200)는 산술디코딩부(220), 및 스케일팩터 획득부(230)를 포함하고, 디멀티플렉싱부(210), 역양자화부(240) 및 주파수역변환부(예:IMDCT) (250)를 더 포함할 수 있다. 13 is a diagram showing the configuration of the
디멀티플렉싱부(210)는 오디오 신호에 대한 비트스트림으로부터 밴드의 개수(max_sfb), 윈도우 그룹의 개수(num_window_group), 및 리셋 플래그 등을 추출한다(S210 단계). 밴드의 개수, 윈도우 그룹의 개수, 리셋 플래그 등에 대해서는 상기 인코딩 장치 및 방법에서 설명한 바와 같을 수 있으므로, 구체적인 설명은 생략하고자 한다. 한편, S210 단계에 대한 구체적인 설명은 추후 도 15와 함께 후술하고자 한다.The
산술디코딩부(220)는 밴드의 개수 (및 윈도우 그룹의 개수)를 이용하여 상기 비트스트림의 해당 영역을 산술 디코딩함으로써, 글로벌 게인 정보(gg), 스케일팩터의 차분값(dscf) 및 스펙트럴 데이터(sptr)를 획득한다(S220 단계). 이에 대한 구체적인 설명은 도 16과 함께 후술하고자 한다.The
스케일팩터 획득부(230)은 글로벌게인 정보(gg) 및 스케일팩터의 차분값(dscf)을 이용하여 스케일팩터 (데이터)를 생성한다(S230 단계). 이에 대한 구체적인 설명은 도 17과 함께 후술하고자 한다.The scale
역양자화부(240)는 스케일팩터 획득부(230)에 의해 생성된 스케일팩터 데이터(scf) 및 산술디코딩부(220)에 의해 획득된 스펙트럴 데이터(sptr)를 역양자화함으로써, 스펙트럴 계수를 획득한다(S240 단계). 이는 앞서 설명된 수학식 1에 따라 수행될 수 있다.The
주파수역변환부(250)는 스펙트럴 계수에 대해 역-주파수 변환을 수행하므로써 시간 도메인의 오디오 신호를 생성한다(S250 단계). 여기서 역-주파수 변환은 IMDCT(INVERSE Modified Discrete Cosine Transform: MDCT) 방식에 해당할 수 있으나 본 발명은 이에 한정되지 아니한다.The frequency
도 14는 디멀티플렉싱부(210)가 비트스트림으로부터 필요한 정보를 추출하는 과정에 대한 세부 순서도이다. 도 14를 참조하면, 디멀티플렉싱부(210)는 밴드의 개수(max_sfb) 및 윈도우그룹의 개수정보(num_window_group)을 추출한다(S211 단계). 앞서 언급한 바와 같이 ics_info()등의 신택스에 포함될 수 있다. 그런 다음, 밴드의 개수(max_sfb)가 1 이상인 경우(S212 단계의 yes)에 한해 이후 단계를 수행한다(S213 단계 및 S214 단계). 이는 앞서 도 9의 (L1) 및 (L2) 행과 같은 신택스에 따라 비트스트림을 파싱하는 과정일 수 있으나, 본 발명은 이에 한정되지 아니한다.14 is a detailed flowchart illustrating a process of
만약, 밴드의 개수가 0인 경우(S212의 no), 리셋 플래그를 획득하거나, 산술 디코딩을 수행하지 않고 과정이 종료된다.If the number of bands is 0 (no in S212), the process ends without obtaining a reset flag or performing arithmetic decoding.
우선 비트스트림으로부터 리셋 플래그를 획득한다(S213 단계). 리셋 플래그는 앞서 설명한 바와 같이, 이전 프레임의 정보(글로벌 게인, 스케일팩터 등)을 참조하는지 여부를 지시하는 플래그이다. 이 리셋 플래그는 도 10의 (L1) 행에 나타난 바와 같이 산술 코딩된 글로벌 게인, 스케일팩터(의 차분값) 및 스펙트럴 데이터 보다 앞서서 위치하기 때문에, 산술 디코딩에 앞서서 추출된다.First, a reset flag is obtained from the bitstream (step S213). As described above, the reset flag is a flag indicating whether to refer to information (global gain, scale factor, etc.) of the previous frame. This reset flag is extracted prior to the arithmetic decoding because it is located before the arithmetic coded global gain, scale factor (differential value) and spectral data as shown in the (L1) line of FIG.
그런 다음, 산술 코딩된 결과(글로벌 게인, 스케일팩터(의 차분값) 등)에 대한 파싱 즉, 산술 디코딩을 수행하는 단계(S220)를 수행한다(S214 단계).Then, parsing, that is, arithmetic decoding, on the arithmetic coded result (global gain, scale factor (difference value), etc.) is performed (S220).
도 16은 산술 디코딩부(220)가 산술 디코딩을 수행하는 과정에 대한 세부 순서도이다. 도 16을 참조하면, 우선 산술 디코딩시 이용하기 위한 확률 테이블을 결정한다(S221 단계). 확률 테이블은 전송된 확률 테이블 인덱스, 또는 전송된 확률 테이블에 의해 결정될 수도 있고, 앞서 S143 단계의 과정에 따라 결정될 수도 있다.16 is a detailed flowchart of a process of performing arithmetic decoding by the
이와 같이 결정된 확률 테이블을 근거로 산술 디코딩을 수행함으로써, 글로벌 게인 정보(gg), 스케일팩터 차분값(dscf[]) 및 스펙트럴 데이터(sptr[])을 비트스트림으로부터 획득한다(S222 단계). 이 단계는 앞서 도 9 내지 도 12의 신택스에 따라 파싱하는 과정에 해당할 수 있다.By performing arithmetic decoding based on the determined probability table, global gain information gg, scale factor difference value dscf [], and spectral data sptr [] are obtained from the bitstream (step S222). This step may correspond to a process of parsing according to the syntax of FIGS. 9 to 12.
도 17은 스케일팩터 획득부(230)가 글로벌게인 정보 등으로부터 스케일팩터 (데이터)를 획득하는 과정에 대한 세부 순서도이다. 도 17을 참조하면, 우선 앞서 S213 단계에서 획득한 리셋 플래그가 0인지(즉, 이전 프레임을 참조해야하는지 아닌지)를 판단한다(S231 단계). 리셋 플래그가 이전 프레임을 참조하는 모드(상대값 또는 차분값 모드)임을 지시하는 경우(예: 리셋 플래그가 0인 경우)(S231 단계의 yes), 이전 프레임의 글로벌 게인값을 획득한다(S232 단계). 이 이전 프레임의 글로벌 게인(gg_prev)에 현재 프레임의 글로벌 게인 정보(gg_cur)를 더함으로써, 현재 프레임의 글로벌 게인값을 획득한다(S233 단계).FIG. 17 is a detailed flowchart illustrating a process of acquiring a scale factor (data) by the scale
만약, 반대로 리셋 플래그가 이전 프레임을 참조하지 않는 모드임(절대값 모드)을 지시하는 경우(예: 리셋 플래그가 1인 경우)(S231 단계의 no), 이전 프레임의 글로벌 게인 값과 상관없이, 현재 프레임의 글로벌 게인 정보를 그대로 글로벌 게인 값으로 결정한다(S234 단계).On the contrary, if the reset flag indicates a mode that does not refer to the previous frame (absolute value mode) (for example, when the reset flag is 1) (no at step S231), regardless of the global gain value of the previous frame, The global gain information of the current frame is determined as the global gain value (step S234).
그런 다음, S233 단계 및 S234 단계에서 획득된 글로벌 게인 값, 및 S22 단계에서 산술 디코딩으로 획득된 스케일팩터 차분값(dscf[])를 이용하여 스케일팩터 (데이터)(scf)를 생성한다(S235 단계). 예를 들어, 글로벌 게인 값(gg)에 첫번째 밴드의 스케일팩터 차분값(dscf[0])을 더해서 첫번째 밴드의 스케일팩터 값(scf[0])을 획득한다. 그리고 첫번째 밴드의 스케일팩터 값(scf[0])에 두번째 밴드의 스케일팩터 값(dscf[1])을 더해서 두번째 밴드의 스케일팩터 값(scf[1])을 생성하는 것이다.Next, a scale factor (data) scf is generated using the global gain values obtained in steps S233 and S234 and the scale factor difference value dscf [] obtained by arithmetic decoding in step S22 (step S235). ). For example, the scale factor difference value dscf [0] of the first band is added to the global gain value gg to obtain the scale factor value scf [0] of the first band. The scale factor value scf [0] of the first band is added to the scale factor value dscf [1] of the second band to generate the scale factor value scf [1] of the second band.
이와 같이, 본 발명의 실시예에 따른 디코딩 방법 및 디코딩 장치는, 산술 디코딩을 수행함으로써 글로벌 게인 정보 및 스케일팩터 차분값 등을 획득한다.As described above, the decoding method and the decoding apparatus according to the embodiment of the present invention obtain the global gain information and the scale factor difference value by performing arithmetic decoding.
도 18은, 본 발명의 실시예에 따른 산술코딩 장치(300)가 구현된 제품의 개략적인 구성을 보여주는 도면이다. 18 is a view showing a schematic configuration of a product in which the
도 18을 참조하면, 유무선 통신부는 유무선 통신 방식을 통해서 비트스트림을 수신한다. 구체적으로 유무선 통신부(310)는 유선통신부, 적외선통신부, 블루투스부, 무선랜통신부 중 하나 이상을 포함할 수 있다.Referring to FIG. 18, the wired / wireless communication unit receives a bitstream through a wired / wireless communication scheme. Specifically, the wired /
사용자 인증부(320)는 사용자 정보를 입력 받아서 사용자 인증을 수행하는 것으로서 지문인식부, 홍채인식부, 얼굴인식부, 및 음성인식부 중 하나 이상을 포함할 수 있는데, 각각 지문, 홍채정보, 얼굴 윤곽 정보, 음성 정보를 입력받아서, 사용자 정보로 변환하고, 사용자 정보 및 기존 등록되어 있는 사용자 데이터와의 일치여부를 판단하여 사용자 인증을 수행할 수 있다. The
입력부(330)는 사용자가 여러 종류의 명령을 입력하기 위한 입력장치로서, 키패드부, 터치패드부, 리모컨부 중 하나 이상을 포함할 수 있지만, 본 발명은 이에 한정되지 아니한다. 신호 디코딩부는 산술코딩부를 포함하는데, The
신코 디코딩부(340)는 앞서 설명한 본 발명의 실시예에 따른 인코딩 장치 또는/및 디코딩 장치에 해당하는 것으로써, 글로벌 게인, 스케일팩터 차분값, 및 스펙트럴 데이터를 산술코딩 또는 산술 디코딩한다. 이로써, 프레임당 여러가지 심볼을 한꺼번에 보내므로 중간과정에서 발생하는 헤더의 중복을 막아 비트손실을 줄여서 코딩효율을 향상시킬 수 있다.The
제어부(350)는 입력장치들로부터 입력 신호를 수신하고, 신호 디코딩부와 출력부의 모든 프로세스를 제어한다. 출력부(360)는 신호 디코딩부에 의해 생성된 출력 신호 등이 출력되는 구성요소로서, 스피커부 및 디스플레이부를 포함할 수 있다. 출력 신호가 오디오 신호일 때 출력 신호는 스피커로 출력되고, 비디오 신호일 때 출력 신호는 디스플레이를 통해 출력된다.The
본 발명에 따른 오디오 신호 처리 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 본 발명에 따른 데이터 구조를 가지는 멀티미디어 데이터도 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 상기 인코딩 방법에 의해 생성된 비트스트림은 컴퓨터가 읽을 수 있는 기록 매체에 저장되거나, 유/무선 통신망을 이용해 전송될 수 있다. The audio signal processing method according to the present invention can be stored in a computer-readable recording medium which is produced as a program for execution in a computer, and multimedia data having a data structure according to the present invention can also be stored in a computer-readable recording medium. Can be stored. The computer readable recording medium includes all kinds of storage devices in which data that can be read by a computer system is stored. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like, and may also be implemented in the form of a carrier wave (for example, transmission over the Internet). Include. In addition, the bitstream generated by the encoding method may be stored in a computer-readable recording medium or transmitted using a wired / wireless communication network.
이상과 같이, 본 발명은 비록 한정된 실시 예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다. As described above, although the present invention has been described by way of limited embodiments and drawings, the present invention is not limited thereto and is intended by those skilled in the art to which the present invention pertains. Of course, various modifications and variations are possible within the scope of equivalents of the claims to be described.
Claims (14)
밴드의 개수를 수신하는 단계; 및
상기 밴드의 개수를 이용하여 산술 코딩 함으로써, 글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 상기 비트스트림으로부터 획득하는 단계;
상기 글로벌게인 정보 및 상기 스케일팩터 차분값을 이용하여 스케일팩터 데이터를 생성하는 단계; 및
상기 스케일팩터 데이터 및 상기 스펙트럴 데이터를 이용하여 역양자화를 수행함으로써, 스펙트럴 계수를 획득하는 단계를 포함하는 것을 특징으로 하는 오디오신호의 처리 방법.Receiving a bitstream including global gain information, scale factor difference values, and spectral data;
Receiving the number of bands; And
Arithmetic coding using the number of bands to obtain global gain information, scale factor difference values, and spectral data from the bitstream;
Generating scale factor data using the global gain information and the scale factor difference value; And
And obtaining spectral coefficients by performing inverse quantization using the scale factor data and the spectral data.
상기 윈도우그룹의 개수정보를 수신하는 단계를 더 포함하고,
상기 산술 코딩은 상기 윈도우그룹의 개수정보를 더 이용하여 수행되는 것을 특징으로 하는 오디오 신호의 처리 방법.The method of claim 1,
Receiving the number information of the window group;
And the arithmetic coding is performed by further using the number information of the window group.
상기 윈도우그룹의 개수정보를 수신하는 단계를 더 포함하고,
상기 스케일팩터 차분값은, 윈도우그룹의 개수정보에 대응하는 그룹의 개수와, 상기 밴드의 개수의 곱을 근거로 획득되는 것을 특징으로 하는 오디오 신호의 처리 방법.The method of claim 1,
Receiving the number information of the window group;
The scale factor difference value is obtained based on the product of the number of groups corresponding to the number information of the window group and the number of bands.
상기 산술 코딩을 하는 단계는 상기 밴드의 개수가 1이상인 경우에 수행되는 것을 특징으로 하는 오디오 신호의 처리 방법.The method of claim 1,
The arithmetic coding is performed when the number of bands is one or more.
상기 산술 코딩하는 단계는,
현재 프레임의 첫번째 밴드에 대응하는 스케일팩터 차분값을 0으로 결정하는 단계를 더 포함하고,
상기 스케일팩터 데이터를 생성하는 단계는,
상기 글로벌게인정보를 그대로 상기 첫번째 밴드에 대응하는 스케일팩터 데이터로 결정하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 처리 방법.The method of claim 1,
The arithmetic coding step,
Determining a scale factor difference value corresponding to the first band of the current frame to 0,
Generating the scale factor data,
And determining the global gain information as scale factor data corresponding to the first band as it is.
상기 글로벌게인정보가 이전 프레임의 글로벌게인과의 차분 값인지 아니면 절대값인지 여부를 지시하는 플래그 정보를 수신하는 단계를 더 포함하고,
상기 수신된 플래그 정보가 이전 프레임의 글로벌게인과의 차분 값을 글로벌게인정보로 지시한 경우, 상기 스케일팩터 데이터를 생성하는 단계는,
상기 글로벌게인 정보 및 이전 프레임의 글로벌게인을 이용하여 현재 프레임의 글로벌 게인을 생성하는 단계; 및,
상기 현재 프레임의 글로벌 게인 및 상기 스케일팩터 차분값을 이용하여 상기 스케일팩터 데이터를 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 처리 방법.The method of claim 1,
And receiving flag information indicating whether the global gain information is a difference value or an absolute value from a global gain of a previous frame,
When the received flag information indicates a difference value from the global gain of the previous frame as global gain information, generating the scale factor data may include:
Generating a global gain of a current frame by using the global gain information and the global gain of a previous frame; And,
Generating the scale factor data using the global gain of the current frame and the scale factor difference value.
상기 산술 코딩은,
이전 프레임의 특정 밴드의 스케일팩터의 차분값을 근거로 선택된 확률 테이블을 이용하여 수행되는 것을 특징으로 하는 오디오 신호의 처리 방법.The method of claim 1,
The arithmetic coding is,
And a probability table selected based on a difference value of a scale factor of a specific band of a previous frame.
상기 밴드의 개수를 이용하여 산술 코딩함으로써, 글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 상기 비트스트림으로부터 획득하는 산술 디코딩부;
상기 글로벌게인 정보 및 상기 스케일팩터 차분값을 이용하여 스케일팩터 데이터를 생성하는 스케일팩터 획득부; 및
상기 스케일팩터 데이터 및 상기 스펙트럴 데이터를 이용하여 역양자화를 수행함으로써, 스펙트럴 계수를 획득하는 역양자화부를 포함하는 것을 특징으로 하는 오디오신호의 처리 장치.A demultiplexer which receives a bitstream including global gain information, scale factor difference values, and spectral data, and receives a number of bands; And
An arithmetic decoding unit for arithmetic coding using the number of bands to obtain global gain information, scale factor difference values, and spectral data from the bitstream;
A scale factor acquisition unit generating scale factor data using the global gain information and the scale factor difference value; And
And an inverse quantization unit configured to obtain spectral coefficients by performing inverse quantization by using the scale factor data and the spectral data.
상기 디멀티플렉싱부는, 상기 윈도우그룹의 개수정보를 더 수신하고,
상기 산술디코딩부는, 상기 윈도우그룹의 개수정보를 더 이용하여 상기 산술 코딩을 수행하는 것을 특징으로 하는 오디오 신호의 처리 장치.The method of claim 8,
The demultiplexer further receives the number information of the window group,
And the arithmetic decoding unit further performs the arithmetic coding using the number information of the window group.
상기 디멀티플렉싱부는, 상기 윈도우그룹의 개수정보를 더 수신하고,
상기 스케일팩터 차분값은, 윈도우그룹의 개수정보에 대응하는 그룹의 개수와, 상기 밴드의 개수의 곱을 근거로 획득되는 것을 특징으로 하는 오디오 신호의 처리 장치.The method of claim 8,
The demultiplexer further receives the number information of the window group,
And the scale factor difference value is obtained based on a product of the number of groups corresponding to the number information of the window group and the number of bands.
상기 산술디코딩부는, 상기 밴드의 개수가 1이상인 경우에 상기 산술 코딩을 수행되는 것을 특징으로 하는 오디오 신호의 처리 장치.The method of claim 8,
And the arithmetic decoding unit is configured to perform the arithmetic coding when the number of bands is one or more.
상기 스케일팩터 획득부는,
현재 프레임의 첫번째 밴드에 대응하는 스케일팩터 차분값을 0으로 결정하고, 상기 글로벌게인정보를 그대로 상기 첫번째 밴드에 대응하는 스케일팩터 데이터로 결정하는 것을 특징으로 하는 오디오 신호의 처리 장치.The method of claim 8,
The scale factor acquisition unit,
And determining the scale factor difference value corresponding to the first band of the current frame as 0 and determining the global gain information as the scale factor data corresponding to the first band as it is.
상기 디멀티플렉싱부는,
상기 글로벌게인정보가 이전 프레임의 글로벌게인과의 차분 값인지 아니면 절대값인지 여부를 지시하는 플래그 정보를 더 수신하고,
상기 스케일팩터 획득부는,
상기 수신된 플래그 정보가 이전 프레임의 글로벌게인과의 차분 값을 글로벌게인정보로 지시한 경우, 상기 글로벌게인 정보 및 이전 프레임의 글로벌게인을 이용하여 현재 프레임의 글로벌 게인을 생성하고, 상기 현재 프레임의 글로벌 게인 및 상기 스케일팩터 차분값을 이용하여 상기 스케일팩터 데이터를 생성하는 것을 특징으로 하는 오디오 신호의 처리 장치.The method of claim 8,
The demultiplexing unit,
Further receiving flag information indicating whether the global gain information is a difference value or an absolute value from a global gain of a previous frame,
The scale factor acquisition unit,
When the received flag information indicates a difference value from the global gain of the previous frame as global gain information, the global gain of the current frame is generated using the global gain information and the global gain of the previous frame, and And generating the scale factor data by using a global gain and the scale factor difference value.
상기 산술 코딩은,
이전 프레임의 특정 밴드의 스케일팩터의 차분값을 근거로 선택된 확률 테이블을 이용하여 수행되는 것을 특징으로 하는 오디오 신호의 처리 장치.The method of claim 8,
The arithmetic coding is,
And a probability table selected based on a difference value of a scale factor of a specific band of a previous frame.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16970509P | 2009-04-15 | 2009-04-15 | |
US61/169,705 | 2009-04-15 | ||
US21975309P | 2009-06-23 | 2009-06-23 | |
US61/219,753 | 2009-06-23 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100114484A true KR20100114484A (en) | 2010-10-25 |
KR101644883B1 KR101644883B1 (en) | 2016-08-02 |
Family
ID=43133662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100035031A KR101644883B1 (en) | 2009-04-15 | 2010-04-15 | A method and an apparatus for processing an audio signal |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101644883B1 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060101335A (en) * | 2005-03-18 | 2006-09-22 | 가시오게산키 가부시키가이샤 | Audio coding apparatus and audio decoding apparatus |
-
2010
- 2010-04-15 KR KR1020100035031A patent/KR101644883B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060101335A (en) * | 2005-03-18 | 2006-09-22 | 가시오게산키 가부시키가이샤 | Audio coding apparatus and audio decoding apparatus |
Also Published As
Publication number | Publication date |
---|---|
KR101644883B1 (en) | 2016-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101162275B1 (en) | A method and an apparatus for processing an audio signal | |
EP2282310B1 (en) | Entropy coding by adapting coding between level and run-length/level modes | |
KR101343267B1 (en) | Method and apparatus for audio coding and decoding using frequency segmentation | |
US7813932B2 (en) | Apparatus and method of encoding and decoding bitrate adjusted audio data | |
US7539612B2 (en) | Coding and decoding scale factor information | |
KR101251813B1 (en) | Efficient coding of digital media spectral data using wide-sense perceptual similarity | |
KR101330362B1 (en) | Modification of codewords in dictionary used for efficient coding of digital media spectral data | |
JP3878952B2 (en) | How to signal noise substitution during audio signal coding | |
JP5277350B2 (en) | Compression encoding and decoding method, encoder, decoder, and encoding apparatus | |
JP2023098967A (en) | Context-based entropy coding of spectral envelope sample value | |
US20020049586A1 (en) | Audio encoder, audio decoder, and broadcasting system | |
KR20050087956A (en) | Lossless audio decoding/encoding method and apparatus | |
US20030093266A1 (en) | Speech coding apparatus, speech decoding apparatus and speech coding/decoding method | |
US7620543B2 (en) | Method, medium, and apparatus for converting audio data | |
US7181079B2 (en) | Time signal analysis and derivation of scale factors | |
JP5379871B2 (en) | Quantization for audio coding | |
CN113129913B (en) | Encoding and decoding method and encoding and decoding device for audio signal | |
KR101644883B1 (en) | A method and an apparatus for processing an audio signal | |
KR100737386B1 (en) | Method for estimating and quantifying inter-channel level difference for spatial audio coding | |
JPH0761044B2 (en) | Speech coding method | |
KR100947065B1 (en) | Lossless audio decoding/encoding method and apparatus | |
KR101259120B1 (en) | Method and apparatus for processing an audio signal | |
JP3692959B2 (en) | Digital watermark information embedding device | |
KR20100054749A (en) | A method and apparatus for processing a signal | |
JP2008268792A (en) | Audio signal encoding device and bit rate converting device thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |