KR20100114484A - A method and an apparatus for processing an audio signal - Google Patents

A method and an apparatus for processing an audio signal Download PDF

Info

Publication number
KR20100114484A
KR20100114484A KR1020100035031A KR20100035031A KR20100114484A KR 20100114484 A KR20100114484 A KR 20100114484A KR 1020100035031 A KR1020100035031 A KR 1020100035031A KR 20100035031 A KR20100035031 A KR 20100035031A KR 20100114484 A KR20100114484 A KR 20100114484A
Authority
KR
South Korea
Prior art keywords
scale factor
global gain
information
difference value
data
Prior art date
Application number
KR1020100035031A
Other languages
Korean (ko)
Other versions
KR101644883B1 (en
Inventor
윤성용
이현국
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20100114484A publication Critical patent/KR20100114484A/en
Application granted granted Critical
Publication of KR101644883B1 publication Critical patent/KR101644883B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PURPOSE: A method and a device for processing an audio signal are provided to decode signal having characteristic of voice signal into a voice signal and to decode a signal having a characteristic of an audio signal into a audio signal, thereby decoding way which accords to each signal characteristic to be selected adaptively. CONSTITUTION: A decoding device(200) comprises arithmetic coding unit(220), a scale factor acquisition unit(230). A demutliplexing unit(210) extracts the number of band(max_sfb), the number of window group(num_window_group), and reset plug from a bit stream about an audio signal. The arithmetic coding unit arithmetically decoding a relevant area of bit stream by suing the number of band(and the number of window group). A scale factor acquisition unit generates a scale factor(data) by using global gain information(gg), and difference value(dscf) of scale factor.

Description

오디오 신호 처리 방법 및 장치{A METHOD AND AN APPARATUS FOR PROCESSING AN AUDIO SIGNAL}Audio signal processing method and apparatus {A METHOD AND AN APPARATUS FOR PROCESSING AN AUDIO SIGNAL}

본 발명은 신호 처리 방법 및 장치에 관한 것으로서, 더욱 상세하게는 오디오 코딩에 있어서 양자화된 데이터(예: 글로벌게인과 스케일팩터 데이터)를 코딩하기 위한 방법 및 장치에 관한 것이다. The present invention relates to a signal processing method and apparatus, and more particularly, to a method and apparatus for coding quantized data (eg, global gain and scale factor data) in audio coding.

일반적으로, 음악 신호와 같은 오디오 신호에 대해서는 오디오 특성에 기반한 코딩 방식을 적용하고, 음성 신호에 대해서는 음성 특성에 기반한 코딩 방식을 적용한다.In general, a coding scheme based on audio characteristics is applied to an audio signal such as a music signal, and a coding scheme based on speech characteristics is applied to a speech signal.

오디오 특성과 음성 특성이 혼재되어 있는 신호에 대해서 어느 하나의 코딩 방식을 적용하는 경우, 오디오 코딩 효율이 떨어지거나, 음질이 나빠지는 문제점이 있다.When any one of the coding schemes is applied to a signal in which audio and voice characteristics are mixed, audio coding efficiency or sound quality deteriorates.

본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 스케일팩터 정보를 전송하는 데 있어서 비트수를 줄일 수 있는 코딩 방법 및 장치를 제공하는 데 그 목적이 있다. The present invention has been made to solve the above problems, and an object thereof is to provide a coding method and apparatus capable of reducing the number of bits in transmitting scale factor information.

본 발명의 또 다른 목적은, 신호 처리에서 글로벌게인정보와 스케일팩터 데이터를 정보간의 연관성에 따라서 효율적으로 전송하기 위한 코딩방법 및 장치에 대한 것이다. Still another object of the present invention is to provide a coding method and apparatus for efficiently transmitting global gain information and scale factor data according to an association between information in signal processing.

본 발명의 또 다른 목적은, 팩터 데이터(스케일팩터 데이터 또는 스케일팩터 밴드의 개수 등)를 전송하는 데 있어서, 이전 프레임의 데이터를 이용하여 효율적으로 전송하기 위한 코딩 방법 및 장치를 제공하는 데 있다.Another object of the present invention is to provide a coding method and apparatus for efficiently transmitting factor data (scale factor data or the number of scale factor bands) using data of a previous frame.

본 발명은 다음과 같은 효과와 이점을 제공한다.The present invention provides the following effects and advantages.

첫째, 음성 신호의 특성을 갖는 신호는 음성 신호로 디코딩하고, 오디오 신호의 특성을 갖는 신호는 오디오 신호로 디코딩하기 때문에, 각 신호 특성에 부합하는 디코딩 방식이 적응적으로 선택되는 효과가 있다.First, since a signal having a characteristic of a voice signal is decoded into a voice signal and a signal having a characteristic of an audio signal is decoded into an audio signal, there is an effect of adaptively selecting a decoding scheme corresponding to each signal characteristic.

둘째, 글로벌게인과 스케일팩터 데이터의 코딩 방식을 산술코딩방식으로 통합함으로써 추가적으로 발생할 수 있는 오버헤드값을 줄이고 낮은 비트수로 코딩이 가능하다.Second, by integrating the coding method of global gain and scale factor data into an arithmetic coding method, it is possible to reduce the overhead that can occur additionally and to code with a low number of bits.

셋째, 현재 프레임의 팩터 데이터를 그대로 전송하지 않고, 이전 프레임의 팩터 데이터와의 차분값을 전송함으로써, 비트수를 줄일 수 있다.Third, the number of bits can be reduced by transmitting the difference value with the factor data of the previous frame without transmitting the factor data of the current frame as it is.

넷째, 허프만 코딩방식에서는 확률테이블의 변경이 어려운 반면에 본 발명에서는 가변적으로 확률테이블을 변경하여 효율적인 코딩이 가능하다. Fourth, while it is difficult to change the probability table in the Huffman coding scheme, the present invention enables efficient coding by varying the probability table.

다섯째, 허프만 코딩방식에서 여러 개의 심볼을 이어서 코딩하는 경우에 비효율적인 반면 산술코딩시 한 세트의 여러 심볼을 보낼 때 비트수를 줄일 수 있는 유리한 이점을 가지고 있다. Fifth, the Huffman coding method is inefficient in the case of continuously coding a plurality of symbols, but has an advantageous advantage of reducing the number of bits when sending a set of several symbols in arithmetic coding.

여섯째, 사용되는 스케일팩터데이터의 개수를 1만큼 뺀 값으로 코딩하므로써, 코딩에 소요되는 비트수를 절약할 수 있다. Sixth, by coding the number of scale factor data used by subtracting by one, the number of bits required for coding can be saved.

일곱째, 글로벌게인의 할당 비트수를 가변비트수로 코딩 함으로써, 코딩에 소요되는 비트수를 현저히 절약할 수 있다.Seventh, by coding the number of bits of global gain allocated to the number of variable bits, the number of bits required for coding can be significantly reduced.

여덟째, 글로벌게인을 리셋플래그에 따라 절대값과 스케일팩터의 차분값으로 병행하여 사용할 수 있으므로, 비트수를 절약할 수 있다.Eighth, since the global gain can be used in parallel as the difference between the absolute value and the scale factor according to the reset flag, the number of bits can be saved.

도 1은 본 발명의 일 실시예에 따른 인코딩 장치의 구성도.
도 2는 본 발명의 일 실시예에 따른 인코딩 방법에 대한 순서도.
도 3(a)는 스케일팩터 및 스케일팩터 밴드의 관계에 대한 도면.
도3(b)는 윈도우그룹이 여러 개일 때 스케일팩터 및 스케일팩터 밴드의 관계에 대한 도면.
도 4는 본 발명의 일 실시예에 따른 게인결정부의 세부 순서도.
도 5는 전송되는 비트스트림의 스케일팩터의 차분값과 스펙트럴 데이터의 관계에 대한 도면.
도 6은 글로벌 게인 및 스케일팩터의 차분값과의 관계에 대한 도면.
도 7은 본 발명의 일 실시 예에 따른 산술인코딩부에 대한 세부 순서도.
도 8 은 본 발명의 일 실시 예에 따른 멀티플렉싱부에 대한 세부순서도.
도 09는 본 발명의 일 실시예에 따른 주파수도메인기반 코딩정보에 관한 채널의 비트스트림의 스케일팩터 밴드의 개수가 하나 이상일 때 수행되는 신텍스.
도 10은 본 발명의 일 실시예에 따른 스케일팩터와 스펙트럴데이터에 관한 신텍스.
도 12은 본 발명의 일 실시예에 따른 리셋플래그에 따른 산술코딩정보에 관한 신텍스.
도 13은 본 발명의 일 실시예에 따른 디코딩 장치의 구성도.
도 14는 본 발명의 일 실시예에 따른 디코딩 방법의 순서도.
도 15는 도 12의 디멀티플렉싱부의 일 실시 예에 따른 세부 순서도.
도 16은 도 12의 게인획득부의 일 실시 예에 따른 세부 순서도 .
도 17은 도 12의 산술디코딩부의 일 실시 예에 따른 세부 순서도.
도 18은 본 발명의 다른 실시예에 따른 산술코딩장치가 구현된 제품의 개략적인 구성도.
1 is a block diagram of an encoding apparatus according to an embodiment of the present invention.
2 is a flowchart of an encoding method according to an embodiment of the present invention.
Figure 3 (a) is a diagram of the relationship between the scale factor and the scale factor band.
Figure 3 (b) is a diagram of the relationship between the scale factor and the scale factor band when there are several window groups.
4 is a detailed flowchart of a gain determination unit according to an embodiment of the present invention.
5 is a diagram illustrating a relationship between difference values of spectral data and scale factors of transmitted bitstreams;
6 is a diagram of a relationship between a global gain and a difference value of a scale factor.
7 is a detailed flowchart of an arithmetic encoding unit according to an embodiment of the present invention.
8 is a detailed flowchart of a multiplexing unit according to an embodiment of the present invention.
FIG. 09 is a syntax performed when the number of scale factor bands of a bitstream of a channel for frequency domain based coding information is one or more according to an embodiment of the present invention. FIG.
10 is a syntax for scale factor and spectral data according to an embodiment of the present invention.
12 is a syntax for arithmetic coding information according to a reset flag according to an embodiment of the present invention.
13 is a block diagram of a decoding apparatus according to an embodiment of the present invention.
14 is a flowchart of a decoding method according to an embodiment of the present invention.
15 is a detailed flowchart of an embodiment of the demultiplexing unit of FIG. 12.
16 is a detailed flowchart of an example of a gain acquisition unit of FIG. 12.
FIG. 17 is a detailed flowchart of an arithmetic decoding unit of FIG. 12. FIG.
18 is a schematic configuration diagram of a product in which an arithmetic coding device is implemented according to another embodiment of the present invention.

이하 첨부된 도면을 참조로 본 발명의 바람직한 실시 예를 상세히 설명하기로 한다.  이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시 예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시 예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다. Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. Prior to this, terms or words used in the present specification and claims should not be construed as being limited to the common or dictionary meanings, and the inventors should properly explain the concept of terms in order to best explain their own invention. Based on the principle that can be defined, it should be interpreted as meaning and concept corresponding to the technical idea of the present invention. Therefore, the embodiments described in this specification and the configurations shown in the drawings are merely the most preferred embodiments of the present invention and do not represent all the technical ideas of the present invention. Therefore, It is to be understood that equivalents and modifications are possible.

상기와 같은 목적을 달성하기 위하여 본 발명에 따른 신호처리 방법은 글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 포함하는 비트스트림을 수신하는 단계와 밴드의 개수를 수신하는 단계 및 상기 밴드의 개수를 이용하여 산술 코딩 함으로써, 글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 상기 비트스트림으로부터 획득하는 단계, 상기 글로벌게인 정보 및 상기 스케일팩터 차분값을 이용하여 스케일팩터 데이터를 생성하는 단계 및 상기 스케일팩터 데이터 및 상기 스펙트럴 데이터를 이용하여 역양자화를 수행함으로써, 스펙트럴 계수를 획득하는 단계를 포함한다. In order to achieve the above object, a signal processing method according to the present invention includes receiving a bitstream including global gain information, scale factor difference values, and spectral data, receiving a number of bands, and a number of bands. Obtaining a global gain information, a scale factor difference value, and spectral data from the bitstream by performing arithmetic coding using the method, generating scale factor data using the global gain information and the scale factor difference value, and Obtaining spectral coefficients by performing inverse quantization using scale factor data and the spectral data.

본 발명에서 다음 용어는 다음과 같은 기준으로 해석될 수 있고, 기재되지 않은 용어라도 하기 취지에 따라 해석될 수 있다. 코딩은 경우에 따라 인코딩 또는 디코딩으로 해석될 수 있고, 정보(information)는 값(values), 파라미터(parameter), 계수(coefficients), 성분(elements) 등을 모두 아우르는 용어로서, 경우에 따라 의미는 달리 해석될 수 있는바, 그러나 본 발명은 이에 한정되지 아니한다.In the present invention, the following terms may be interpreted based on the following criteria, and terms not described may be interpreted according to the following meanings. Coding can be interpreted as encoding or decoding in some cases, and information is a term that encompasses values, parameters, coefficients, elements, and so on. It may be interpreted otherwise, but the present invention is not limited thereto.

또한, 본 발명에서 스케일팩터 밴드란, 하나의 스케일팩터가 적용되는 주파수 밴드에 해당할 수 있지만, 이에 한정되지 아니하고, 다양한 용도의 주파수 밴드를 의미하는 것으로 이해되어야 한다. 한편 하나의 스케일팩터는 복수의 스펙트럴 데이터에 대응될 수 있는 값이므로, 스케일팩터 밴드는 복수의 스펙트럴 데이터에 적용되는 주파수 밴드일 수 있다. 여기서 스케일팩터 및 스펙트럴 데이터는 오디오 신호를 변형 이산 코사인 변환(Modified Discrete Cosine Transform: MDCT) 등을 수행하여 주파수 스펙트럼으로 변환이 수행된 결과일 수도 있지만 이에 한정되지 않는다. In addition, in the present invention, the scale factor band may correspond to a frequency band to which one scale factor is applied, but is not limited thereto and should be understood as meaning a frequency band for various uses. Meanwhile, since one scale factor is a value that may correspond to a plurality of spectral data, the scale factor band may be a frequency band applied to the plurality of spectral data. Here, the scale factor and spectral data may be the result of performing a transformed frequency spectrum by performing a modified discrete cosine transform (MDCT) on the audio signal, but is not limited thereto.

여기서 오디오 신호(audio signal)란, 광의로는, 비디오 신호와 구분되는 개념으로서, 재생 시 청각으로 식별할 수 있는 신호를 지칭하고, 협의로는, 음성(speech) 신호와 구분되는 개념으로서, 음성 특성이 없거나 적은 신호를 의미한다.Here, the audio signal is a concept that is broadly distinguished from the video signal, and refers to a signal that can be visually identified during reproduction. The narrow signal is a concept that is distinguished from a speech signal. Means a signal with little or no characteristics.

본 발명에 따른 오디오 신호 처리 방법 및 장치는, 변형이산 코사인 변환, 게인 결정과정 및 산술코딩이 이용되고 멀티플렉싱과 양자화 과정이 이용될 수 있는 인코딩/디코딩 장치 및 방법이 될 수 있는바, 이하, 변형 이산 코사인 변환(S110 단계), 양자화 과정(S120단계), 게인 결정 과정(S130단계), 산술코딩과정(S140단계) 및 멀티플렉싱 과정(S150단계)에 대하여 설명하고, 위 과정들이 적용된 오디오 신호 인코딩/ 디코딩 장치 및 방법에 대해서 설명하고자 한다.The audio signal processing method and apparatus according to the present invention may be an encoding / decoding apparatus and method in which modified discrete cosine transform, gain determination process, and arithmetic coding are used, and multiplexing and quantization process can be used. Discrete cosine transform (S110), quantization (S120), gain determination (S130), arithmetic coding (S140), and multiplexing (S150) will be described. A decoding apparatus and method will be described.

도1은, 본 발명의 일 실시예에 따른 신호 인코딩 장치(100)의 구성을 보여주는 도면이다. 도 1을 참조하면, 본 발명의 일 실시예에 따른 오디오 신호 인코딩 장치는 게인결정부(130) 및 산술코딩부(140)를 포함하고, 주파수 변환부(110), 양자화부(120), 및 멀티플렉싱부(150)를 더 포함할 수 있다. 1 is a diagram showing the configuration of a signal encoding apparatus 100 according to an embodiment of the present invention. 1, an audio signal encoding apparatus according to an embodiment of the present invention includes a gain determiner 130 and an arithmetic coder 140, a frequency converter 110, a quantizer 120, and The apparatus may further include a multiplexing unit 150.

이하 도 1 및 도 2를 함께 참조하면서 본 발명의 실시예에 따른 오디오 신호 인코딩 장치 및 이 장치가 수행하는 인코딩 방법에 대해서 설명하고자 한다.Hereinafter, an audio signal encoding apparatus and an encoding method performed by the apparatus will be described with reference to FIGS. 1 and 2.

주파수변환부(110)는 입력된 오디오 신호에 대해 주파수 변환을 수행함으로써 스펙트럴 계수를 획득한다(S110 단계). 여기수 주파수 변환은 이산 코사인 변환(Modified Discrete Cosine Transform: MDCT) 방식에 따른 것일 수 있지만 본 발명은 이에 한정되지 아니한다. 시간-주파수 변환 기법으로 변형 이산 코사인 변환의 장점은 데이터율을 증가시키지 않으면서도 이웃한 블록 간에 50%중복을 허용할 수 있어 블록 변환에서 발생하는 에지에러나 에일리어싱을 효율적으로 제거하는 동시에 코더의 완전복원 조건을 만족할 수 있다. 이러한 주파수 도메인으로 변환함으로써 양자화 과정의 전단계인 스펙트럴 계수를 얻는다. The frequency converter 110 obtains a spectral coefficient by performing frequency conversion on the input audio signal (S110). The excitation frequency transform may be based on a discrete discrete cosine transform (MDCT) scheme, but the present invention is not limited thereto. The advantage of transformed discrete cosine transform with time-frequency transform technique is that it allows 50% redundancy between neighboring blocks without increasing data rate, effectively eliminating edge errors or aliasing that occur in block transforms, while at the same time The recovery condition may be satisfied. By converting into the frequency domain, spectral coefficients are obtained, which are the first steps of the quantization process.

이러한 시간 주파수 변환은 시간영역신호를 주파수 영역으로 변환하는 것으로 오디오신호를 몇 개의 주파수 성분으로 세분화하고 이들 주파수 성분의 에너지 비율에 따라 비트를 적절히 할당하여 신호의 중복성을 줄이는 방법이다. 대표적으로 변형 이산 코사인 변환(MDCT)등이 이에 해당한다. The time frequency conversion is a method of converting a time domain signal into a frequency domain to subdivide an audio signal into several frequency components, and appropriately allocate bits according to energy ratios of these frequency components to reduce signal redundancy. Typically, such as modified discrete cosine transform (MDCT).

코딩된 비트스트림은 주파수 도메인 기반 코딩채널스트림 (fd_channel_stream)을 통해 전송된다. 음성 성분이 들어가 있는 데이터는 주로 선형 예측(Linear Prediction)기반의 코딩장치를 사용하는데 이 정보는 선형 예측된 주파수 도메인 기반 코딩채널스트림(Lpd_Channel_Stream)을 통해 전송된다. The coded bitstream is transmitted through a frequency domain based coding channel stream (fd_channel_stream). Data containing speech components is mainly used in a linear prediction based coding apparatus, and this information is transmitted through a linear predicted frequency domain based coding channel stream (Lpd_Channel_Stream).

이에 반하여 음악 데이터의 코딩에 주로 사용하는 주파수 도메인 기반 코딩채널스트림(Fd_Channel_Stream)의 경우에는 각 프레임의 샘플들을 변형 이산 코사인 변환(MDCT)을 통해 주파수 도메인의 값들로 변환한다.In contrast, in the case of a frequency domain-based coding channel stream (Fd_Channel_Stream) mainly used for coding of music data, samples of each frame are converted into values of the frequency domain through a modified discrete cosine transform (MDCT).

한편, 상기 주파수 변환은 스케일팩터 밴드별로 수행될 수 있으나, 본 발명은 이에 한정되지 아니한다. 스케일팩터 밴드에 대해서는 추후 도 3과 함께 후술하고자 한다.Meanwhile, the frequency conversion may be performed for each scale factor band, but the present invention is not limited thereto. The scale factor band will be described later with reference to FIG. 3.

상기 양자화부(120)는 스펙트럴 계수에 대해서 양자화를 수행함으로써, 스케일팩터 및 스펙트럴 데이터를 획득한다(S120 단계). 이 단계는 다음 수학에 따라 수행될 수 있다. The quantization unit 120 obtains scale factor and spectral data by performing quantization on the spectral coefficients (S120). This step can be performed according to the following mathematics.

Figure pat00001
Figure pat00001

상기 수학식에서 X'는 X를 양자화하여 얻어지는 근사값이며 이를 스펙트럴 계수라 한다. scf는 정수로 X양자화된 스케일팩터, Xquant는 정수로 양자화된 스펙트럴 데이터를 의미한다. In the above equation, X 'is an approximation obtained by quantizing X, which is called a spectral coefficient. scf is an X quantized scale factor as an integer, and Xquant is spectral data quantized as an integer.

스케일팩터는 스펙일팩터 밴드별로 정해질 수 있는데, 이에 대해서는 도 3을 참조하면서, 설명하고자 한다. 도 3은 스케일팩터와 스케일팩터 밴드의 관계를 나타낸 도면이다. 도 3의 (a)를 우선 참조하면, 각 스케일팩터 밴드에 하나의 스케일팩터가 존재함을 알 수 있다. 즉, 스케일팩터 밴드(sfb)는 0번째부터 max_sfb-1번째까지(여기서 max_sfb는 앞서 언급한 바와 같이 밴드의 개수) 존재하고, 각 스케일팩터 밴드(sfb(i))에 대응하여 스케일팩터(scf[i])가 존재함을 알 수 있다. 밴드의 개수(max_sfb)는 프레임에 상관없이 고정된 값일 수 있지만, 프레임마다 변화하는 값일 수도 있다.The scale factor may be determined for each specular factor band, which will be described with reference to FIG. 3. 3 is a diagram illustrating a relationship between a scale factor and a scale factor band. Referring first to FIG. 3A, it can be seen that one scale factor exists in each scale factor band. That is, the scale factor band sfb exists from 0th to max_sfb-1th (where max_sfb is the number of bands as mentioned above), and the scale factor scf corresponding to each scale factor band sfb (i). It can be seen that [i]) exists. The number of bands max_sfb may be a fixed value regardless of the frame, but may also be a value that varies from frame to frame.

도 3의 (b)는 윈도우 그룹이 여러 개일 때의 경우에 스케일팩터의 개수 및 스케일팩터 밴드의 개수와의 관계를 나타내는 도면이다. 도 3의 (b)를 참조하면 윈도우 그룹이 개수가 num_window_groups인 경우, 하나의 스케일팩터 밴드(sfb[i])에는 복수의 스케일팩터(scf[i](g=0), scf[i](g=1), ,scf[i](g=num_window_group-1)가 존재함을 알 수 있다. 한편, 복수의 스케일팩터(scf[i](g=0), scf[i](g=1), ,scf[i](g=num_window_group-1) (여기서 i는 스케일팩터 밴드 인덱스)는 서로 다른 값을 가질 수 있음은 물론이다. 즉, 총 스케일팩터의 개수는 윈도우 그룹의 개수(num_window_groups) 및 스케일팩터 밴드의 개수(max_sfb)의 곱에 해당함을 알 수 있다.FIG. 3B is a diagram showing a relationship between the number of scale factors and the number of scale factor bands when there are several window groups. Referring to FIG. 3B, when the number of window groups is num_window_groups, one scale factor band sfb [i] includes a plurality of scale factors scf [i] (g = 0) and scf [i] ( g = 1),, scf [i] (g = num_window_group-1), while a plurality of scale factors (scf [i] (g = 0), scf [i] (g = 1) are present. Of course, scf [i] (g = num_window_group-1) (where i is the scale factor band index) can have different values, that is, the total number of scale factors is the number of window groups (num_window_groups). And it can be seen that it corresponds to the product of the number of scale factor bands (max_sfb).

다시 도 1 및 도 2를 참조하면, 앞서 설명한 양자화부(120)는 양자화를 수행함으로써 스케일팩터 및 스펙트럴 데이터를 획득하는 과정에 있어서, 스펙트럴 밴드의 개수(또는 밴드의 개수)(max_sfb) 및 윈도우 그룹의 개수(num_window_groups)를 이용하거나 결정한다. 이 밴드의 개수 및 윈도우 그룹의 개수는 멀티플렉싱부(150)에 전달되어 비트스트림에 포함될 수 있다. 예를 들어 윈도우 그룹의 개수는 ics_info()의 스케일팩터 그룹핑 정보(scale_factor_grouping info)를 바탕으로 알 수 있으며, 스케일팩터 밴드의 개수(max_sfb) 또한 매 프레임마다 전송될 수 있다.Referring back to FIGS. 1 and 2, the quantization unit 120 described above, in the process of obtaining scale factor and spectral data by performing quantization, includes the number of spectral bands (or the number of bands) max_sfb and Use or determine the number of window groups (num_window_groups). The number of bands and the number of window groups may be transmitted to the multiplexer 150 to be included in the bitstream. For example, the number of window groups can be known based on scale_factor_grouping info of ics_info (), and the number of scale factor bands (max_sfb) can also be transmitted every frame.

한편, 게인결정부(130)는 양자화부(120)에 의해 획득된 스케일팩터(scf[i])를 근거로 글로벌 게인(gg: global gain) 및 스케일팩터 차분값(dscf[i])를 결정한다(S130 단계). 나아가 글로벌 게인(gg)를 근거로 글로벌 게인 정보를 생성할 수 있다. 글로벌 게인 정보가 글로벌 게인의 차분값에 해당하는지 절대값에 해당하는지를 나타내는 리셋 플래그를 셋팅하여 멀티플렉싱부(150)에 전달할 수 있다. 이에 대한 구체적인 설명은 도 4내지 도 6 등 과 함께 후술하고자 한다.Meanwhile, the gain determiner 130 determines the global gain and the scale factor difference value dscf [i] based on the scale factor scf [i] obtained by the quantization unit 120. (Step S130). Furthermore, global gain information may be generated based on the global gain (gg). A reset flag indicating whether the global gain information corresponds to the difference value or the absolute value of the global gain may be set and transmitted to the multiplexing unit 150. A detailed description thereof will be provided later with reference to FIGS. 4 to 6.

산술코딩부(140)는 게인 결정부(130)에 의해 생성된 글로벌 게인 정보 및 스케일팩터 차분값(dscf[i]) 및 스펙트럴 데이터(sptr[j])에 대해서 산술 코딩(Arithmetic coding)을 수행함으로써 코딩 결과를 멀티플렉싱부(150)에 전달한다(S140 단계). 이 과정에 대한 구체적인 설명은 도 7과 함께 설명하고자 한다.Arithmetic coding unit 140 performs arithmetic coding on the global gain information and scale factor difference value dscf [i] and spectral data sptr [j] generated by gain determining unit 130. In operation S140, the coding result is transmitted to the multiplexing unit 150. A detailed description of this process will be described with reference to FIG. 7.

도 4는 앞서 언급된 게인결정부(130)가 글로벌 게인(gg) 및 스케일팩터 차분값(dscf)을 생성하는 세부적인 과정에 해당하는 순서도 있다. 도 4를 참조하면, 우선 게인결정부(13)는 스케일팩터(scf)를 이용하여 글로벌 게인(gg) 및 스케일팩터 차분값(dscf)를 생성한다(S132 단계). 우선 도 5를 참조하면서, 글로벌 게인 및 스케일팩터 차분값의 관계에 대해서 살펴보고자 한다. 도 5를 참조하면, 글로벌 게인(gg)는 하나의 프레임 내에 속하는 복수의 스케일팩터(scf[])를 대표하는 값으로서, 첫 번째 스케일팩터 밴드(i=0)에 대응하는 스케일팩터(scf[0])와 동일한 값일 수 있다. 스케일팩터 차분값(dscf[])은 일련의 스케일팩터들 중에서 이전에 해당하는 스케일팩터(예: scf[max_sfb_-m])과 현재의 스케일팩터(예:scf[max_sfb-m+1])와의 차분값에 해당할 수 있다. 따라서, 첫 번째 스케일팩터(scf[0])가 글로벌 게인(gg)이 되는 경우, 첫 번째 스케일팩터 밴드에 대응하는 스케일팩터 차분값(dscf[0])은 0이 될 수 있다.4 is a flowchart corresponding to a detailed process of generating the global gain gg and the scale factor difference value dscf by the gain determination unit 130 described above. Referring to FIG. 4, first, the gain determiner 13 generates a global gain gg and a scale factor difference value dscf using the scale factor scf (step S132). First, the relationship between the global gain and the scale factor difference value will be described with reference to FIG. 5. Referring to FIG. 5, the global gain gg is a value representing a plurality of scale factors scf [] belonging to one frame, and the scale factor scf [corresponding to the first scale factor band i = 0. 0]). The scale factor differential value (dscf []) is the value of the previous scale factor (e.g. scf [max_sfb_-m]) and the current scale factor (e.g. scf [max_sfb-m + 1]). It may correspond to a difference value. Therefore, when the first scale factor scf [0] becomes the global gain gg, the scale factor difference value dscf [0] corresponding to the first scale factor band may be zero.

또한, 글로벌게인을 조절하는 경우 전체적인 게인의 조절이 가능하다. 그러므로 글로벌게인을 1만큼 증가시키는 경우 전체적인 스케일팩터의 값들이 1만큼 증가하는 효과를 얻는다.In addition, when adjusting the global gain, it is possible to adjust the overall gain. Therefore, if the global gain is increased by 1, the value of the overall scale factor is increased by 1.

도 6을 참조하면, 윈도우 그룹이 여러 개인 경우 일련의 스케일팩터들이 나타나 있음을 알 수 있다. 여기서 스케일 팩터들은 도면에서와 같이 윈도우그룹 순서대로(즉 g=0에 속하는 스케일팩터들 이후에 g=1에 속하는 스케일팩터들이 존재, g는 윈도우 그룹 인덱스) 있을 수도 있지만, 스케일팩터 밴드 순서대로(즉, i=0은 스케일팩터들이 위치한 다음에, i=1에 속하는 스케일팩터들이 위치(i는 스케일팩터 밴드 인덱스)) 존재할 수도 있다.Referring to FIG. 6, it can be seen that a series of scale factors are shown when there are several window groups. Here, the scale factors may be in window group order as shown in the figure (ie, scale factors belonging to g = 1 after scale factors belonging to g = 0, g is a window group index), but in scale factor band order ( That is, i = 0 may exist after the scale factors are located, and then scale factors belonging to i = 1 (i is the scale factor band index).

다시 도 4를 참조하면, S132 단계에서 글로벌 게인(gg)이 결정된 이후, 이 현재 프레임에 해당하는 글로벌 게인(gg_cur)을 그대로 글로벌 게인 정보로서 전송할지 아니면, 이전 프레임의 글로벌 게인(gg_prev)과의 차분값을 글로벌 게인 정보로서 전송할지 여부를 결정한다(S133 단계).Referring back to FIG. 4, after the global gain gg is determined in step S132, the global gain gg_cur corresponding to the current frame is transmitted as the global gain information as it is, or with the global gain gg_prev of the previous frame. It is determined whether to transmit the difference value as global gain information (step S133).

만약, 이전 프레임의 글로벌 게인(gg_prev)를 참조하기로 결정한 경우(S133 단계의 yes), 게인 결정부(130)에 의해 획득된 글로벌 게인값에 이전 프레임의 글로벌 게인(gg_prev)을 차감함으로써 글로벌 게인의 차분값을 획득한다(S134 단계)(상대값 모드). 이 경우 이전 프레임의 정보를 참조하는지 여부를 나타내는 리셋 플래그를 셋팅한다. 예를 들어, 이전 프레임의 정보를 참조한다는 것을 나타내기 위해 리셋 플래그를 0으로 셋팅할 수 있다(S136 단계).If it is determined to refer to the global gain (gg_prev) of the previous frame (yes in step S133), the global gain by subtracting the global gain (gg_prev) of the previous frame from the global gain value obtained by the gain determiner 130. Obtain the difference value (step S134) (relative value mode). In this case, a reset flag indicating whether to refer to the information of the previous frame is set. For example, the reset flag may be set to 0 to indicate that the information of the previous frame is referred to (step S136).

반대로, 이전 프레임의 글로벌 게인(gg_prev)를 참조하지 않기로 결정한 경우 (S133 단계의 no), 게인 결정부(130)에 의해 획득된 글로벌 게인값의 절대값 그대로 글로벌 게인 정보로 코딩한다(S135 단계)(절대값 모드). 이 경우, 이전 프레임의 정보를 참조하지 않는다는 것을 나타내기 위해 리셋 플래그를 1로 셋팅할 수 있지만(S137 단계), 본 발명은 이에 한정되지 아니한다. 글로벌게인정보가 절대값을 가지는 경우는 예를 들어 처음부터 코딩되지 아니하고 중간부터 코딩해야 하는 경우 이전프레임의 정보를 이용할 수 없어 코딩이 불가능한 경우 효율적으로 절대값을 지정하여 코딩하게 할 수 있는 것이다.On the contrary, when it is decided not to refer to the global gain (gg_prev) of the previous frame (no in step S133), the absolute gain of the global gain value obtained by the gain determiner 130 is coded as global gain information (step S135). (Absolute value mode). In this case, the reset flag may be set to 1 to indicate that the information of the previous frame is not referred to (step S137), but the present invention is not limited thereto. If the global gain information has an absolute value, for example, if it is not coded from the beginning and must be coded from the middle, it is possible to efficiently designate the absolute value when coding is impossible because the information of the previous frame is not available.

한편, 여기서 글로벌 게인 정보(gg) (차분값 또는 절대값)은 그대로 전송할 수 있지만 옵셋(OFFSET)값을 적용(global_gain=global_gain + SF_OFFSET, SF_OFFSET=100)한 후에 전송할 수도 있다. Meanwhile, the global gain information gg (differential value or absolute value) may be transmitted as it is, but may be transmitted after applying an offset value (global_gain = global_gain + SF_OFFSET, SF_OFFSET = 100).

한편, 스케일팩터의 경우, 인덱스 오프셋(index_offset)이 더 이용될 수 있다. 여기서 인덱스 오프셋(index_offset)이란, 예를 들어, 인코더에서 -100 ~155을 0~255로 표현하기 위해 빼주고, 디코더에서 0 ~255를 -100 ~155로 복원하기 위해 더해주는 수(예: -100)일 수 있다. 따라서 작은 숫자로 인코더에서 전송함으로써 비트수를 줄이고 추후에 디코더에서 복원과정을 거쳐 신호를 만들어 효율을 높일 수 있다.On the other hand, in the case of a scale factor, an index offset index_offset may be further used. In this case, the index offset (index_offset) is, for example, a number subtracted from -100 빼 ~ 155 to 0 ~ 255 in the encoder and added to restore 0 ~ 255 to -100-~ 155 in the decoder (eg -100). Can be. Therefore, by transmitting a small number from the encoder, the number of bits can be reduced, and a signal can be made later through a decoder to improve efficiency.

도 5 및 도 6은 산술 코딩의 대상을 설명하기 위한 도면이고, 도 7은 앞서 산술코딩부(140)가 산술코딩을 수행하는 과정의 세부 단계에 대한 도면이다. 우선 도 5를 참조하면, 글로벌 게인(gg: global_gain), 및 스케일팩터 차분값(dscf[i], i는 스펙트럴밴드 인덱스) 및 스펙트럴 데이터(sptr[j])(j는 스펙트럴 데이터 인덱스)가 순서대로 위치하고 있음을 알 수 있다. 스케일팩터 차분값(dscf[])는 스케일팩터(scf[])와 그 개수가 동일할 수 있다. 앞서 설명한 바와 같이, 하나의 스케일팩터 밴드(sfb)에 복수의 스펙트럴 데이터(sptr[j])가 대응될 수 있기 때문에, 스펙트럴 데이터의 개수(n)은 스케일팩터 차분값의 개수보다 클 수 있다. 5 and 6 are diagrams for explaining an object of arithmetic coding, and FIG. 7 is a diagram for a detailed step of a process of performing arithmetic coding by the arithmetic coding unit 140. First, referring to FIG. 5, a global gain (gg: global_gain), a scale factor difference value (dscf [i], i is a spectral band index), and spectral data (sptr [j]) (j is a spectral data index. You can see that are located in order. The scale factor difference value dscf [] may have the same number as the scale factor scf []. As described above, since a plurality of spectral data sptr [j] may correspond to one scale factor band sfb, the number n of spectral data may be larger than the number of scale factor differential values. have.

이와 같이 글로벌 게인(gg), 스케일팩터 차분값(dscf) 및 스펙트럴 데이터(sptr) 전체가 산술 코딩의 대상이 되거나, 또는 글로벌 게인(gg) 및 스케일팩터 차분값(dscf)가 산술 코딩의 대상이 될 수 있다.In this way, the global gain (gg), the scale factor difference value (dscf) and the spectral data (sptr) are all subjected to arithmetic coding, or the global gain (gg) and scale factor difference value (dscf) are the object of arithmetic coding. This can be

산술 코딩(Arithmetic coding)이라 함은 엔트로피 코딩 방식 중 하나로서, 각 소스 심볼 대신 전체 메시지를 0과 1 사이의 단일 숫자로 변환하여 코딩하는 방법이다. 메시지의 크기에 따라, 허프만 코딩보다 압축률은 좋을 수 있다.Arithmetic coding is one of entropy coding schemes in which an entire message is converted into a single number between 0 and 1 instead of each source symbol. Depending on the size of the message, the compression rate may be better than Huffman coding.

도 6은 윈도우 그룹이 여러 개인 경우, 산술 코딩의 대상을 나타내는 도면으로서, 도 5의 경우보다 스케일팩터 차분값(dscf)의 개수가 윈도우 그룹의 개수(num_window_group)에 비례해서 크다는 점에서 차이가 있다.FIG. 6 is a diagram illustrating arithmetic coding targets when there are several window groups, which is different in that the number of scale factor difference values dscf is proportional to the number of window groups num_window_group than in FIG. 5. .

도 7을 참조하면서 산술코딩부(140)의 세부 과정에 대해서 설명하고자 한다. 앞서 도 5 및 도 6과 함께 나타낸 산술 코딩의 대상 중에서, 첫번째 밴드의 스케일팩터 차분값(dscf[0])이 0이 될 수 있기 때문에, 이를 산술 코딩의 대상에 포함시킬 수도 있거나(S141 단계), 제외시킬 수도 있다(S142 단계). A detailed process of the arithmetic coding unit 140 will be described with reference to FIG. 7. Since the scale factor difference value dscf [0] of the first band may be zero among the objects of the arithmetic coding shown in FIGS. 5 and 6 above, it may be included in the object of the arithmetic coding (step S141). It may be excluded (step S142).

이전 프레임의 동일 밴드의 스케일팩터의 차분값을 참조하여 산술코딩시 이용할 확률테이블을 선택한다(S143 단계). 이전프레임의 동일 밴드의 스케일팩터의 차분값을 이용함으로써, 코딩시 대체로 비슷한 패턴을 보이는 특성을 이용하여 이에 따른 확률분포를 분석한다. 이에 따른 확률테이블로서 코딩하여 코딩효율을 높이는 것이 가능하다. A probability table to be used in arithmetic coding is selected by referring to difference values of scale factors of the same band of the previous frame (step S143). By using the difference value of the scale factor of the same band of the previous frame, the probability distribution is analyzed by using the characteristic showing a generally similar pattern in coding. Accordingly, it is possible to increase coding efficiency by coding as a probability table.

표1에 따르면 이전 프레임의 스케일팩터 밴드에서의 차분값이 현재프레임의 스케일팩터의 차분값과 상관성을 가지고 있으며, 이는 이전프레임의 스케일팩터의 각 값에 대하여 현재프레임의 스케일팩터의 차분값이 0을 중심으로 가장 높은 값으로 분포되어 있으며, 이전 프레임의 스케일팩터의 차분값이 양수로 갈수록 현재프레임의 스케일팩터의 차분값은 일반적으로 낮아지는 분포를 가지므로 표1과 같은 상관성에 근거하여 현재 프레임의 스케일팩터의 차분값을 코딩하는데 이용할 수 있다.According to Table 1, the difference in the scale factor band of the previous frame is correlated with the difference in the scale factor of the current frame, which means that the difference in the scale factor of the current frame is 0 for each value of the scale factor of the previous frame. It is distributed with the highest value around, and the difference of scale factor of current frame generally decreases as the difference of scale factor of previous frame becomes positive, so the current frame is based on correlation as shown in Table 1. It can be used to code the difference value of the scale factor of.

이전 프레임과 현재 프레임간의 스케일팩터의 차분값(dscf) 관계 예Example of difference (dscf) of scale factor between previous frame and current frame 이전 프레임의 동일 스케일팩터 밴드에서의스케일팩터의 차분값Difference value of scale factor in same scale factor band of previous frame -4-4 -3-3 -2-2 -1-One -- 1One 22 33 44 현재프레임의 스케일팩터의 차분값
Difference value of scale factor of current frame
-6-6 ...... ...... ...... ...... ...... ...... ...... ...... ......
-5-5 ...... 1.9%1.9% 1.1%1.1% 0.6%0.6% 0.4%0.4% 0.3%0.3% 0.3%0.3% 0.3%0.3% ...... -4-4 ...... 3.7%3.7% 2.3%2.3% 1.4%1.4% 0.9%0.9% 0.9%0.9% 0.8%0.8% 0.8%0.8% ...... -3-3 ...... 7.1%7.1% 5.1%5.1% 3.6%3.6% 2.4%2.4% 2.3%2.3% 2.3%2.3% 2.0%2.0% ...... -2-2 ...... 11.9%11.9% 10.5%10.5% 8.5%8.5% 6.2%6.2% 5.9%5.9% 5.6%5.6% 5.0%5.0% ...... -1-One ...... 14.314.3 14.7%14.7% 15.0%15.0% 11.5%11.5% 11.0%11.0% 9.8%9.8% 8.7%8.7% ...... 00 ...... 47.2%47.2% 52.3%52.3% 56.5%56.5% 63.3%63.3% 55.9%55.9% 53.3%53.3% 50.2%50.2% ...... 1One ...... 7.1%7.1% 7.7%7.7% 8.3%8.3% 8.5%8.5% 12.4%12.4% 13.0%13.0% 13.2%13.2% ...... 22 ...... 3.2%3.2% 3.5%3.5% 3.6%3.6% 4.0%4.0% 6.4%6.4% 7.7%7.7% 8.8%8.8% ...... 33 ...... 1.3%1.3% 1.3%1.3% 1.4%1.4% 1.6%1.6% 2.8%2.8% 3.9%3.9% 5.1%5.1% ...... 44 ...... 0.5%0.5% 0.5%0.5% 0.5%0.5% 0.6%0.6% 1.1%1.1% 1.7%1.7% 2.7%2.7% ...... 55 ...... 0.2%0.2% 0.2%0.2% 0.2%0.2% 0.3%0.3% 0.5%0.5% 0.8%0.8% 1.5%1.5% ...... 66 ...... ...... ...... ...... ...... ...... ...... ...... ......

본 발명에서의 스케일팩터의 차분값(dscf)에 관한 확률테이블의 개수 예시는 표 2와 같다.Table 2 shows an example of the number of probability tables regarding the difference value dscf of the scale factor in the present invention.

조건에 따라 11개 중 스케일팩터의 차분값(dscf)을 코딩하는데 사용하는 확률테이블을 적응적으로 변경하여 사용한다. 여기서 이전 프레임의 스케일팩터의 차분값(p_dscf)은 이전 프레임의 동일 스케일팩터 밴드(sfb)에서의 스케일팩터의 차분값(dscf)를 의미한다.According to the condition, the probability table used to code the difference value (dscf) of the scale factor among 11 is adaptively used. Here, the difference value p_dscf of the scale factor of the previous frame means the difference value dscf of the scale factor in the same scale factor band sfb of the previous frame.

상기 스케일팩터의 차분값은 이전 프레임과 현재 프래임을 코딩하기 위하여, 프레임의 길이에 따른 확률테이블을 결정하는 단계를 포함하는 디코딩 과정에서도 사용된다.The difference value of the scale factor is also used in the decoding process including determining a probability table according to the length of the frame, in order to code the previous frame and the current frame.

롱 프레임인 경우에는 상기 발명과 같은 과정을 그대로 수행하나, 숏 프레임의 경우에는 롱 프레임과 동일한 과정을 수행하는 것은 비트절감차원에서 비효율적이므로 이전 프레임정보를 사용하지 아니하고 별도로 확률테이블을 사용하여 코딩효율을 높일 수 있다. 즉, 이전 프레임의 스케일팩터의 차분값(dscf) 저장시 이전 프레임의 0부터 maxsfb-1까지의 스케일팩터밴드에 대해 스케일팩터의 차분값(dscf)을 저장하게 되는데 이 때 스케일팩터밴드의 개수(max_sfb)보다 이전 프래임의 밴드의 개수가 같거나 큰 스케일팩터밴드(sfb)의 스케일팩터의 차분값(dscf)은 0으로 세팅한다.In the case of a long frame, the same process as described above is performed. However, in the case of a short frame, performing the same process as the long frame is inefficient in terms of bit reduction. Therefore, coding efficiency is achieved by using a probability table separately without using previous frame information. Can increase. That is, when the difference value (dscf) of the scale factor of the previous frame is stored, the difference value (dscf) of the scale factor is stored for the scale factor band of 0 to maxsfb-1 of the previous frame. The difference value dscf of the scale factor of the scale factor band sfb equal to or larger than the number of bands of the previous frame is set to 0.

또한 롱 프레임의 경우 숏 프레임일 경우의 스케일팩터의 차분값(dscf)의 분포와 특성이 다르기 때문에 숏 프레임에 대해서는 별도의 스케일팩터의 차분값(dscf)에 관한 확률테이블을 두어 코딩효율을 높일 수 있다.In addition, in the case of long frames, the distribution and characteristics of the difference value (dscf) of the scale factor in the case of the short frame are different. Therefore, the coding efficiency can be improved by providing a probability table for the difference value (dscf) of the separate scale factor for the short frame. have.

스케일팩터의 차분값(dscf)에 관한 확률테이블의 개수 예시Example of the number of probability tables for the difference value (dscf) of the scale factor 조건Condition 테이블 인덱스Table index ResetReset 00 Short frameShort frame 1One p_dscf가 -4이하p_dscf is less than -4 22 P_dscf가 -3P_dscf goes -3 33 P_dscf가 -2P_dscf goes -2 44 P_dscf가 -1P_dscf goes -1 55 P_dscf가 0P_dscf is 0 66 P_dscf가 1P_dscf goes 1 77 P_dscf가 2P_dscf goes 2 88 P_dscf가 3P_dscf goes 3 99 p_dscf가 4이상p_dscf is 4 or more 1010

도 8은 멀티플렉싱부(150)가 각 단계에서 생성된 팩터들을 멀티플렉싱하여 전송하는 과정을 나타내고 있다. 도 8을 참조하면, 우선 앞서 설명한 밴드의 개수(max_sfb)가 0인 경우, 현재 프레임에 대해 팩터들(예: 스케일팩터 등)이 존재하지 않거나 존재할 필요가 없기 때문에, 밴드의 개수(max_sfb)가 0인 경우(S151 단계의 no), 멀티플렉싱하는 과정을 종료한다. 이에 의해, 밴드의 개수(max_sfb)가 0일 때 어떤 정보도 인코딩하지 않음으로써 비트수를 보다 절감할 수 있다. 8 illustrates a process in which the multiplexer 150 multiplexes and transmits the factors generated in each step. Referring to FIG. 8, if the number of bands (max_sfb) described above is 0, the number of bands (max_sfb) is not present because the factors (eg, scale factors, etc.) do not exist or do not need to exist for the current frame. If 0 (no in step S151), the process of multiplexing is terminated. Accordingly, the number of bits can be further reduced by not encoding any information when the number of bands max_sfb is zero.

반대로 밴드의 개수(max_sfb)가 1이상인 경우(S151 단계의 yes), 현재 프레임에 대해 스케일팩터 등의 정보가 존재하는 것이기 때문에, 멀티플렉싱 과정을 진행한다.On the contrary, when the number of bands max_sfb is 1 or more (yes in step S151), since the information such as scale factor exists for the current frame, the multiplexing process is performed.

한편, 도 9 내지 도 12는 멀티플렉싱부(150)가 비트스트림을 생성할 때 신택스의 예들이다. 도 9의 (L1) 및 (L2) 행을 참조하면, 상기 S151 단계에 대응하는 조건, 즉, 밴드의 개수 1이상일 때의 조건(if(max_sfb){})이 만족되는 경우, 그 이후 단계(ac_scf_spectral_data())가 수행됨을 알 수 있다. 도 9 내지 도 12에 도시된 신택스는 일 예일뿐, 본 발명은 이에 한정되지 않음은 물론이다.9 to 12 are examples of syntax when the multiplexing unit 150 generates a bitstream. Referring to (L1) and (L2) of FIG. 9, when the condition corresponding to the step S151, that is, the condition (if (max_sfb) {}) when the number of bands is 1 or more is satisfied, the subsequent step ( It can be seen that ac_scf_spectral_data ()) is performed. The syntax shown in FIGS. 9 to 12 is merely an example, and the present invention is not limited thereto.

다시 도 8을 참조하면, 앞서 설명한 바와 같이 밴드의 개수가 1이상인 경우, 앞서 S136 단계(또는 S137 단계)에서 셋팅한 리셋 플래그를 비트스트림에 포함시킨다(S152 단계). 도 10을 참조하면, 앞서 도 9에서의 ac_scf_sepctral_data()의 세부 내용이 나타나 있다. 즉, (L1) 행을 참조하면, 제일 상단에 리셋 플래그(arith_reset_flag)가 존재함을 알 수 있다. 즉, 추후 설명될 산술 코딩의 결과에 앞서서 리셋 플래그가 존재하는 것이다.Referring to FIG. 8 again, as described above, when the number of bands is one or more, the reset flag set in step S136 (or step S137) is included in the bitstream (step S152). Referring to FIG. 10, details of ac_scf_sepctral_data () in FIG. 9 are shown. That is, referring to the (L1) line, it can be seen that the reset flag (arith_reset_flag) is present at the top. That is, the reset flag exists before the result of the arithmetic coding described later.

그런 다음, 앞서 S144 단계에서 산술 코딩된 결과를 비트스트림에 포함시킴으로써 디코더에 전송한다(S153 단계). 도 10의 (L2) 행 및 도 11을 참조하면, 글로벌 게인 및 스케일팩터가 산술코딩되어 전송됨을 알 수 있다. 보다 구체적으로, 도 11의 (L1)행에 나타난 바와 같이(acod_gg) 글로벌 게인(gg)이 산술 코딩이 됨으로써, 고정비트가 아닌 가변비트(vlclbf)로 코딩됨을 알 수 있다. 한편, 도 11의 (L2)행에 나타난 바와 같이(acod_scf[]) 스케일팩터가 역시 산술코딩되어 가변비트로서 비트스트림에 포함됨을 알 수 있다. 한편, 도 10의 (L3)행에 나타난 신택스 엘리먼트(arith_data()) 및 도 12는 스펙트럴 데이터(sptr) 역시 산술 코딩되어 가변비트로서 비트스트림에 포함되는 것을 나타내는 것이다.Thereafter, the arithmetic-coded result in step S144 is included in the bitstream and transmitted to the decoder (step S153). Referring to (L2) of FIG. 10 and FIG. 11, it can be seen that the global gain and scale factor are arithmetic coded and transmitted. More specifically, it can be seen that the global gain gg is coded as a variable bit (vlclbf) rather than a fixed bit as shown in the (L1) line of FIG. 11 (acod_gg) by arithmetic coding. On the other hand, as shown in (L2) of Figure 11 (acod_scf []) scale factor is also arithmetic coded it can be seen that included in the bitstream as a variable bit. On the other hand, the syntax element (arith_data ()) and FIG. 12 shown in the line (L3) of FIG. 10 indicate that the spectral data sptr is also arithmetic coded and included in the bitstream as a variable bit.

이와 같이 본 발명의 실시예에 다른 따른 인코딩 장치 및 인코딩 방법은 상기와 같이 설명된 바에 따라, 글로벌 게인 및 스케일팩터 (나아가 스펙트럴 데이터)까지 산술 코딩함으로써, 보다 비트효율을 높일 수 있다.As described above, the encoding apparatus and the encoding method according to the embodiment of the present invention can increase bit efficiency by arithmetically coding global gain and scale factor (or spectral data).

이하에서는 본 발명의 실시예에 따른 디코딩 장치 및 디코딩 방법에 대해서 설명하고자 한다.Hereinafter, a decoding apparatus and a decoding method according to an embodiment of the present invention will be described.

도13은, 본 발명의 일 실시예에 따른 신호 디코딩 장치(200)의 구성을 보여주는 도면이다. 이는 앞서 도1에서 설명된 인코딩 장치의 역과정을 수행하는 장치에 해당할 수 있다. 도 13을 참조하면, 디코딩 장치(200)는 산술디코딩부(220), 및 스케일팩터 획득부(230)를 포함하고, 디멀티플렉싱부(210), 역양자화부(240) 및 주파수역변환부(예:IMDCT) (250)를 더 포함할 수 있다. 13 is a diagram showing the configuration of the signal decoding apparatus 200 according to an embodiment of the present invention. This may correspond to an apparatus for performing the reverse process of the encoding apparatus described above with reference to FIG. 1. Referring to FIG. 13, the decoding apparatus 200 includes an arithmetic decoding unit 220 and a scale factor obtaining unit 230, and includes a demultiplexing unit 210, an inverse quantization unit 240, and a frequency inverse transform unit (eg, (IMDCT) 250 may be further included.

디멀티플렉싱부(210)는 오디오 신호에 대한 비트스트림으로부터 밴드의 개수(max_sfb), 윈도우 그룹의 개수(num_window_group), 및 리셋 플래그 등을 추출한다(S210 단계). 밴드의 개수, 윈도우 그룹의 개수, 리셋 플래그 등에 대해서는 상기 인코딩 장치 및 방법에서 설명한 바와 같을 수 있으므로, 구체적인 설명은 생략하고자 한다. 한편, S210 단계에 대한 구체적인 설명은 추후 도 15와 함께 후술하고자 한다.The demultiplexer 210 extracts the number of bands max_sfb, the number of window groups num_window_group, and the reset flag from the bitstream of the audio signal (S210). Since the number of bands, the number of window groups, the reset flag, and the like may be the same as those described in the encoding apparatus and method, a detailed description thereof will be omitted. On the other hand, a detailed description of the step S210 will be described later with reference to FIG.

산술디코딩부(220)는 밴드의 개수 (및 윈도우 그룹의 개수)를 이용하여 상기 비트스트림의 해당 영역을 산술 디코딩함으로써, 글로벌 게인 정보(gg), 스케일팩터의 차분값(dscf) 및 스펙트럴 데이터(sptr)를 획득한다(S220 단계). 이에 대한 구체적인 설명은 도 16과 함께 후술하고자 한다.The arithmetic decoding unit 220 performs arithmetic decoding on the corresponding region of the bitstream using the number of bands (and the number of window groups), thereby providing global gain information (gg), scale factor difference value (dscf), and spectral data. (sptr) is obtained (step S220). A detailed description thereof will be provided later with reference to FIG. 16.

스케일팩터 획득부(230)은 글로벌게인 정보(gg) 및 스케일팩터의 차분값(dscf)을 이용하여 스케일팩터 (데이터)를 생성한다(S230 단계). 이에 대한 구체적인 설명은 도 17과 함께 후술하고자 한다.The scale factor acquisition unit 230 generates a scale factor (data) using the global gain information gg and the difference value dscf of the scale factor (step S230). A detailed description thereof will be provided later with reference to FIG. 17.

역양자화부(240)는 스케일팩터 획득부(230)에 의해 생성된 스케일팩터 데이터(scf) 및 산술디코딩부(220)에 의해 획득된 스펙트럴 데이터(sptr)를 역양자화함으로써, 스펙트럴 계수를 획득한다(S240 단계). 이는 앞서 설명된 수학식 1에 따라 수행될 수 있다.The inverse quantization unit 240 inversely quantizes the scale factor data scf generated by the scale factor acquisition unit 230 and the spectral data sptr obtained by the arithmetic decoding unit 220, thereby obtaining a spectral coefficient. Acquire (step S240). This may be performed according to Equation 1 described above.

주파수역변환부(250)는 스펙트럴 계수에 대해 역-주파수 변환을 수행하므로써 시간 도메인의 오디오 신호를 생성한다(S250 단계). 여기서 역-주파수 변환은 IMDCT(INVERSE Modified Discrete Cosine Transform: MDCT) 방식에 해당할 수 있으나 본 발명은 이에 한정되지 아니한다.The frequency inverse transform unit 250 generates an audio signal in the time domain by performing inverse-to-frequency conversion on the spectral coefficients (S250). Here, the reverse-frequency transform may correspond to an INVERSE Modified Discrete Cosine Transform (MDCT) method, but the present invention is not limited thereto.

도 14는 디멀티플렉싱부(210)가 비트스트림으로부터 필요한 정보를 추출하는 과정에 대한 세부 순서도이다. 도 14를 참조하면, 디멀티플렉싱부(210)는 밴드의 개수(max_sfb) 및 윈도우그룹의 개수정보(num_window_group)을 추출한다(S211 단계). 앞서 언급한 바와 같이 ics_info()등의 신택스에 포함될 수 있다. 그런 다음, 밴드의 개수(max_sfb)가 1 이상인 경우(S212 단계의 yes)에 한해 이후 단계를 수행한다(S213 단계 및 S214 단계). 이는 앞서 도 9의 (L1) 및 (L2) 행과 같은 신택스에 따라 비트스트림을 파싱하는 과정일 수 있으나, 본 발명은 이에 한정되지 아니한다.14 is a detailed flowchart illustrating a process of demultiplexing unit 210 extracting necessary information from a bitstream. Referring to FIG. 14, the demultiplexing unit 210 extracts the number of bands max_sfb and the number information of a window group (num_window_group) (step S211). As mentioned above, it may be included in syntax such as ics_info (). Then, the subsequent steps are performed only when the number of bands max_sfb is 1 or more (yes in step S212) (steps S213 and S214). This may be a process of parsing the bitstream according to syntax, such as (L1) and (L2) in FIG. 9, but the present invention is not limited thereto.

만약, 밴드의 개수가 0인 경우(S212의 no), 리셋 플래그를 획득하거나, 산술 디코딩을 수행하지 않고 과정이 종료된다.If the number of bands is 0 (no in S212), the process ends without obtaining a reset flag or performing arithmetic decoding.

우선 비트스트림으로부터 리셋 플래그를 획득한다(S213 단계). 리셋 플래그는 앞서 설명한 바와 같이, 이전 프레임의 정보(글로벌 게인, 스케일팩터 등)을 참조하는지 여부를 지시하는 플래그이다. 이 리셋 플래그는 도 10의 (L1) 행에 나타난 바와 같이 산술 코딩된 글로벌 게인, 스케일팩터(의 차분값) 및 스펙트럴 데이터 보다 앞서서 위치하기 때문에, 산술 디코딩에 앞서서 추출된다.First, a reset flag is obtained from the bitstream (step S213). As described above, the reset flag is a flag indicating whether to refer to information (global gain, scale factor, etc.) of the previous frame. This reset flag is extracted prior to the arithmetic decoding because it is located before the arithmetic coded global gain, scale factor (differential value) and spectral data as shown in the (L1) line of FIG.

그런 다음, 산술 코딩된 결과(글로벌 게인, 스케일팩터(의 차분값) 등)에 대한 파싱 즉, 산술 디코딩을 수행하는 단계(S220)를 수행한다(S214 단계).Then, parsing, that is, arithmetic decoding, on the arithmetic coded result (global gain, scale factor (difference value), etc.) is performed (S220).

도 16은 산술 디코딩부(220)가 산술 디코딩을 수행하는 과정에 대한 세부 순서도이다. 도 16을 참조하면, 우선 산술 디코딩시 이용하기 위한 확률 테이블을 결정한다(S221 단계). 확률 테이블은 전송된 확률 테이블 인덱스, 또는 전송된 확률 테이블에 의해 결정될 수도 있고, 앞서 S143 단계의 과정에 따라 결정될 수도 있다.16 is a detailed flowchart of a process of performing arithmetic decoding by the arithmetic decoding unit 220. Referring to FIG. 16, first, a probability table for use in arithmetic decoding is determined (step S221). The probability table may be determined by the transmitted probability table index or the transmitted probability table, or may be determined by the process of step S143.

이와 같이 결정된 확률 테이블을 근거로 산술 디코딩을 수행함으로써, 글로벌 게인 정보(gg), 스케일팩터 차분값(dscf[]) 및 스펙트럴 데이터(sptr[])을 비트스트림으로부터 획득한다(S222 단계). 이 단계는 앞서 도 9 내지 도 12의 신택스에 따라 파싱하는 과정에 해당할 수 있다.By performing arithmetic decoding based on the determined probability table, global gain information gg, scale factor difference value dscf [], and spectral data sptr [] are obtained from the bitstream (step S222). This step may correspond to a process of parsing according to the syntax of FIGS. 9 to 12.

도 17은 스케일팩터 획득부(230)가 글로벌게인 정보 등으로부터 스케일팩터 (데이터)를 획득하는 과정에 대한 세부 순서도이다. 도 17을 참조하면, 우선 앞서 S213 단계에서 획득한 리셋 플래그가 0인지(즉, 이전 프레임을 참조해야하는지 아닌지)를 판단한다(S231 단계). 리셋 플래그가 이전 프레임을 참조하는 모드(상대값 또는 차분값 모드)임을 지시하는 경우(예: 리셋 플래그가 0인 경우)(S231 단계의 yes), 이전 프레임의 글로벌 게인값을 획득한다(S232 단계). 이 이전 프레임의 글로벌 게인(gg_prev)에 현재 프레임의 글로벌 게인 정보(gg_cur)를 더함으로써, 현재 프레임의 글로벌 게인값을 획득한다(S233 단계).FIG. 17 is a detailed flowchart illustrating a process of acquiring a scale factor (data) by the scale factor obtaining unit 230 from global gain information. Referring to FIG. 17, first, it is determined whether the reset flag acquired in step S213 is 0 (that is, whether to refer to a previous frame or not) (step S231). If the reset flag indicates that the mode refers to the previous frame (relative value or difference value mode) (for example, when the reset flag is 0) (YES in step S231), a global gain value of the previous frame is obtained (step S232). ). By adding global gain information gg_cur of the current frame to the global gain gg_prev of the previous frame, a global gain value of the current frame is obtained (step S233).

만약, 반대로 리셋 플래그가 이전 프레임을 참조하지 않는 모드임(절대값 모드)을 지시하는 경우(예: 리셋 플래그가 1인 경우)(S231 단계의 no), 이전 프레임의 글로벌 게인 값과 상관없이, 현재 프레임의 글로벌 게인 정보를 그대로 글로벌 게인 값으로 결정한다(S234 단계).On the contrary, if the reset flag indicates a mode that does not refer to the previous frame (absolute value mode) (for example, when the reset flag is 1) (no at step S231), regardless of the global gain value of the previous frame, The global gain information of the current frame is determined as the global gain value (step S234).

그런 다음, S233 단계 및 S234 단계에서 획득된 글로벌 게인 값, 및 S22 단계에서 산술 디코딩으로 획득된 스케일팩터 차분값(dscf[])를 이용하여 스케일팩터 (데이터)(scf)를 생성한다(S235 단계). 예를 들어, 글로벌 게인 값(gg)에 첫번째 밴드의 스케일팩터 차분값(dscf[0])을 더해서 첫번째 밴드의 스케일팩터 값(scf[0])을 획득한다. 그리고 첫번째 밴드의 스케일팩터 값(scf[0])에 두번째 밴드의 스케일팩터 값(dscf[1])을 더해서 두번째 밴드의 스케일팩터 값(scf[1])을 생성하는 것이다.Next, a scale factor (data) scf is generated using the global gain values obtained in steps S233 and S234 and the scale factor difference value dscf [] obtained by arithmetic decoding in step S22 (step S235). ). For example, the scale factor difference value dscf [0] of the first band is added to the global gain value gg to obtain the scale factor value scf [0] of the first band. The scale factor value scf [0] of the first band is added to the scale factor value dscf [1] of the second band to generate the scale factor value scf [1] of the second band.

이와 같이, 본 발명의 실시예에 따른 디코딩 방법 및 디코딩 장치는, 산술 디코딩을 수행함으로써 글로벌 게인 정보 및 스케일팩터 차분값 등을 획득한다.As described above, the decoding method and the decoding apparatus according to the embodiment of the present invention obtain the global gain information and the scale factor difference value by performing arithmetic decoding.

도 18은, 본 발명의 실시예에 따른 산술코딩 장치(300)가 구현된 제품의 개략적인 구성을 보여주는 도면이다. 18 is a view showing a schematic configuration of a product in which the arithmetic coding apparatus 300 according to an embodiment of the present invention is implemented.

도 18을 참조하면, 유무선 통신부는 유무선 통신 방식을 통해서 비트스트림을 수신한다. 구체적으로 유무선 통신부(310)는 유선통신부, 적외선통신부, 블루투스부, 무선랜통신부 중 하나 이상을 포함할 수 있다.Referring to FIG. 18, the wired / wireless communication unit receives a bitstream through a wired / wireless communication scheme. Specifically, the wired / wireless communication unit 310 may include at least one of a wired communication unit, an infrared communication unit, a Bluetooth unit, and a wireless LAN communication unit.

사용자 인증부(320)는 사용자 정보를 입력 받아서 사용자 인증을 수행하는 것으로서 지문인식부, 홍채인식부, 얼굴인식부, 및 음성인식부 중 하나 이상을 포함할 수 있는데, 각각 지문, 홍채정보, 얼굴 윤곽 정보, 음성 정보를 입력받아서, 사용자 정보로 변환하고, 사용자 정보 및 기존 등록되어 있는 사용자 데이터와의 일치여부를 판단하여 사용자 인증을 수행할 수 있다. The user authentication unit 320 receives user information and performs user authentication. The user authentication unit 320 may include one or more of a fingerprint recognition unit, an iris recognition unit, a face recognition unit, and a voice recognition unit, respectively, the fingerprint, iris information, and face. The user may perform contour authentication and voice information, convert the user information into user information, determine whether the user information matches the existing registered user data, and perform user authentication.

입력부(330)는 사용자가 여러 종류의 명령을 입력하기 위한 입력장치로서, 키패드부, 터치패드부, 리모컨부 중 하나 이상을 포함할 수 있지만, 본 발명은 이에 한정되지 아니한다. 신호 디코딩부는 산술코딩부를 포함하는데, The input unit 330 is an input device for a user to input various types of commands, and may include one or more of a keypad unit, a touch pad unit, and a remote controller unit, but the present invention is not limited thereto. The signal decoding unit includes an arithmetic coding unit,

신코 디코딩부(340)는 앞서 설명한 본 발명의 실시예에 따른 인코딩 장치 또는/및 디코딩 장치에 해당하는 것으로써, 글로벌 게인, 스케일팩터 차분값, 및 스펙트럴 데이터를 산술코딩 또는 산술 디코딩한다. 이로써, 프레임당 여러가지 심볼을 한꺼번에 보내므로 중간과정에서 발생하는 헤더의 중복을 막아 비트손실을 줄여서 코딩효율을 향상시킬 수 있다.The synth decoding unit 340 corresponds to an encoding apparatus and / or a decoding apparatus according to the embodiment of the present invention described above, and performs arithmetic coding or arithmetic decoding of global gain, scale factor difference values, and spectral data. As a result, since various symbols are sent at the same time, the coding efficiency can be improved by reducing the bit loss by preventing duplication of headers occurring in the intermediate process.

제어부(350)는 입력장치들로부터 입력 신호를 수신하고, 신호 디코딩부와 출력부의 모든 프로세스를 제어한다. 출력부(360)는 신호 디코딩부에 의해 생성된 출력 신호 등이 출력되는 구성요소로서, 스피커부 및 디스플레이부를 포함할 수 있다. 출력 신호가 오디오 신호일 때 출력 신호는 스피커로 출력되고, 비디오 신호일 때 출력 신호는 디스플레이를 통해 출력된다.The controller 350 receives input signals from the input devices and controls all processes of the signal decoding unit and the output unit. The output unit 360 is a component that outputs an output signal generated by the signal decoding unit, and may include a speaker unit and a display unit. When the output signal is an audio signal, the output signal is output to the speaker, and when the output signal is a video signal, the output signal is output through the display.

본 발명에 따른 오디오 신호 처리 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 본 발명에 따른 데이터 구조를 가지는 멀티미디어 데이터도 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 상기 인코딩 방법에 의해 생성된 비트스트림은 컴퓨터가 읽을 수 있는 기록 매체에 저장되거나, 유/무선 통신망을 이용해 전송될 수 있다. The audio signal processing method according to the present invention can be stored in a computer-readable recording medium which is produced as a program for execution in a computer, and multimedia data having a data structure according to the present invention can also be stored in a computer-readable recording medium. Can be stored. The computer readable recording medium includes all kinds of storage devices in which data that can be read by a computer system is stored. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like, and may also be implemented in the form of a carrier wave (for example, transmission over the Internet). Include. In addition, the bitstream generated by the encoding method may be stored in a computer-readable recording medium or transmitted using a wired / wireless communication network.

이상과 같이, 본 발명은 비록 한정된 실시 예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다. As described above, although the present invention has been described by way of limited embodiments and drawings, the present invention is not limited thereto and is intended by those skilled in the art to which the present invention pertains. Of course, various modifications and variations are possible within the scope of equivalents of the claims to be described.

Claims (14)

글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 포함하는 비트스트림을 수신하는 단계;
밴드의 개수를 수신하는 단계; 및
상기 밴드의 개수를 이용하여 산술 코딩 함으로써, 글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 상기 비트스트림으로부터 획득하는 단계;
상기 글로벌게인 정보 및 상기 스케일팩터 차분값을 이용하여 스케일팩터 데이터를 생성하는 단계; 및
상기 스케일팩터 데이터 및 상기 스펙트럴 데이터를 이용하여 역양자화를 수행함으로써, 스펙트럴 계수를 획득하는 단계를 포함하는 것을 특징으로 하는 오디오신호의 처리 방법.
Receiving a bitstream including global gain information, scale factor difference values, and spectral data;
Receiving the number of bands; And
Arithmetic coding using the number of bands to obtain global gain information, scale factor difference values, and spectral data from the bitstream;
Generating scale factor data using the global gain information and the scale factor difference value; And
And obtaining spectral coefficients by performing inverse quantization using the scale factor data and the spectral data.
제1항에 있어서,
상기 윈도우그룹의 개수정보를 수신하는 단계를 더 포함하고,
상기 산술 코딩은 상기 윈도우그룹의 개수정보를 더 이용하여 수행되는 것을 특징으로 하는 오디오 신호의 처리 방법.
The method of claim 1,
Receiving the number information of the window group;
And the arithmetic coding is performed by further using the number information of the window group.
제1항에 있어서,
상기 윈도우그룹의 개수정보를 수신하는 단계를 더 포함하고,
상기 스케일팩터 차분값은, 윈도우그룹의 개수정보에 대응하는 그룹의 개수와, 상기 밴드의 개수의 곱을 근거로 획득되는 것을 특징으로 하는 오디오 신호의 처리 방법.
The method of claim 1,
Receiving the number information of the window group;
The scale factor difference value is obtained based on the product of the number of groups corresponding to the number information of the window group and the number of bands.
제1항에 있어서,
상기 산술 코딩을 하는 단계는 상기 밴드의 개수가 1이상인 경우에 수행되는 것을 특징으로 하는 오디오 신호의 처리 방법.
The method of claim 1,
The arithmetic coding is performed when the number of bands is one or more.
제1항에 있어서,
상기 산술 코딩하는 단계는,
현재 프레임의 첫번째 밴드에 대응하는 스케일팩터 차분값을 0으로 결정하는 단계를 더 포함하고,
상기 스케일팩터 데이터를 생성하는 단계는,
상기 글로벌게인정보를 그대로 상기 첫번째 밴드에 대응하는 스케일팩터 데이터로 결정하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 처리 방법.
The method of claim 1,
The arithmetic coding step,
Determining a scale factor difference value corresponding to the first band of the current frame to 0,
Generating the scale factor data,
And determining the global gain information as scale factor data corresponding to the first band as it is.
제1항에 있어서,
상기 글로벌게인정보가 이전 프레임의 글로벌게인과의 차분 값인지 아니면 절대값인지 여부를 지시하는 플래그 정보를 수신하는 단계를 더 포함하고,
상기 수신된 플래그 정보가 이전 프레임의 글로벌게인과의 차분 값을 글로벌게인정보로 지시한 경우, 상기 스케일팩터 데이터를 생성하는 단계는,
상기 글로벌게인 정보 및 이전 프레임의 글로벌게인을 이용하여 현재 프레임의 글로벌 게인을 생성하는 단계; 및,
상기 현재 프레임의 글로벌 게인 및 상기 스케일팩터 차분값을 이용하여 상기 스케일팩터 데이터를 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 처리 방법.
The method of claim 1,
And receiving flag information indicating whether the global gain information is a difference value or an absolute value from a global gain of a previous frame,
When the received flag information indicates a difference value from the global gain of the previous frame as global gain information, generating the scale factor data may include:
Generating a global gain of a current frame by using the global gain information and the global gain of a previous frame; And,
Generating the scale factor data using the global gain of the current frame and the scale factor difference value.
제1항에 있어서,
상기 산술 코딩은,
이전 프레임의 특정 밴드의 스케일팩터의 차분값을 근거로 선택된 확률 테이블을 이용하여 수행되는 것을 특징으로 하는 오디오 신호의 처리 방법.
The method of claim 1,
The arithmetic coding is,
And a probability table selected based on a difference value of a scale factor of a specific band of a previous frame.
글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 포함하는 비트스트림을 수신하고, 밴드의 개수를 수신하는 디멀티플렉싱부; 및
상기 밴드의 개수를 이용하여 산술 코딩함으로써, 글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 상기 비트스트림으로부터 획득하는 산술 디코딩부;
상기 글로벌게인 정보 및 상기 스케일팩터 차분값을 이용하여 스케일팩터 데이터를 생성하는 스케일팩터 획득부; 및
상기 스케일팩터 데이터 및 상기 스펙트럴 데이터를 이용하여 역양자화를 수행함으로써, 스펙트럴 계수를 획득하는 역양자화부를 포함하는 것을 특징으로 하는 오디오신호의 처리 장치.
A demultiplexer which receives a bitstream including global gain information, scale factor difference values, and spectral data, and receives a number of bands; And
An arithmetic decoding unit for arithmetic coding using the number of bands to obtain global gain information, scale factor difference values, and spectral data from the bitstream;
A scale factor acquisition unit generating scale factor data using the global gain information and the scale factor difference value; And
And an inverse quantization unit configured to obtain spectral coefficients by performing inverse quantization by using the scale factor data and the spectral data.
제8 항에 있어서,
상기 디멀티플렉싱부는, 상기 윈도우그룹의 개수정보를 더 수신하고,
상기 산술디코딩부는, 상기 윈도우그룹의 개수정보를 더 이용하여 상기 산술 코딩을 수행하는 것을 특징으로 하는 오디오 신호의 처리 장치.
The method of claim 8,
The demultiplexer further receives the number information of the window group,
And the arithmetic decoding unit further performs the arithmetic coding using the number information of the window group.
제 8 항에 있어서,
상기 디멀티플렉싱부는, 상기 윈도우그룹의 개수정보를 더 수신하고,
상기 스케일팩터 차분값은, 윈도우그룹의 개수정보에 대응하는 그룹의 개수와, 상기 밴드의 개수의 곱을 근거로 획득되는 것을 특징으로 하는 오디오 신호의 처리 장치.
The method of claim 8,
The demultiplexer further receives the number information of the window group,
And the scale factor difference value is obtained based on a product of the number of groups corresponding to the number information of the window group and the number of bands.
제8항에 있어서,
상기 산술디코딩부는, 상기 밴드의 개수가 1이상인 경우에 상기 산술 코딩을 수행되는 것을 특징으로 하는 오디오 신호의 처리 장치.
The method of claim 8,
And the arithmetic decoding unit is configured to perform the arithmetic coding when the number of bands is one or more.
제 8 항에 있어서,
상기 스케일팩터 획득부는,
현재 프레임의 첫번째 밴드에 대응하는 스케일팩터 차분값을 0으로 결정하고, 상기 글로벌게인정보를 그대로 상기 첫번째 밴드에 대응하는 스케일팩터 데이터로 결정하는 것을 특징으로 하는 오디오 신호의 처리 장치.
The method of claim 8,
The scale factor acquisition unit,
And determining the scale factor difference value corresponding to the first band of the current frame as 0 and determining the global gain information as the scale factor data corresponding to the first band as it is.
제8항에 있어서,
상기 디멀티플렉싱부는,
상기 글로벌게인정보가 이전 프레임의 글로벌게인과의 차분 값인지 아니면 절대값인지 여부를 지시하는 플래그 정보를 더 수신하고,
상기 스케일팩터 획득부는,
상기 수신된 플래그 정보가 이전 프레임의 글로벌게인과의 차분 값을 글로벌게인정보로 지시한 경우, 상기 글로벌게인 정보 및 이전 프레임의 글로벌게인을 이용하여 현재 프레임의 글로벌 게인을 생성하고, 상기 현재 프레임의 글로벌 게인 및 상기 스케일팩터 차분값을 이용하여 상기 스케일팩터 데이터를 생성하는 것을 특징으로 하는 오디오 신호의 처리 장치.
The method of claim 8,
The demultiplexing unit,
Further receiving flag information indicating whether the global gain information is a difference value or an absolute value from a global gain of a previous frame,
The scale factor acquisition unit,
When the received flag information indicates a difference value from the global gain of the previous frame as global gain information, the global gain of the current frame is generated using the global gain information and the global gain of the previous frame, and And generating the scale factor data by using a global gain and the scale factor difference value.
제8 항에 있어서,
상기 산술 코딩은,
이전 프레임의 특정 밴드의 스케일팩터의 차분값을 근거로 선택된 확률 테이블을 이용하여 수행되는 것을 특징으로 하는 오디오 신호의 처리 장치.
The method of claim 8,
The arithmetic coding is,
And a probability table selected based on a difference value of a scale factor of a specific band of a previous frame.
KR1020100035031A 2009-04-15 2010-04-15 A method and an apparatus for processing an audio signal KR101644883B1 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US16970509P 2009-04-15 2009-04-15
US61/169,705 2009-04-15
US21975309P 2009-06-23 2009-06-23
US61/219,753 2009-06-23

Publications (2)

Publication Number Publication Date
KR20100114484A true KR20100114484A (en) 2010-10-25
KR101644883B1 KR101644883B1 (en) 2016-08-02

Family

ID=43133662

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100035031A KR101644883B1 (en) 2009-04-15 2010-04-15 A method and an apparatus for processing an audio signal

Country Status (1)

Country Link
KR (1) KR101644883B1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060101335A (en) * 2005-03-18 2006-09-22 가시오게산키 가부시키가이샤 Audio coding apparatus and audio decoding apparatus

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060101335A (en) * 2005-03-18 2006-09-22 가시오게산키 가부시키가이샤 Audio coding apparatus and audio decoding apparatus

Also Published As

Publication number Publication date
KR101644883B1 (en) 2016-08-02

Similar Documents

Publication Publication Date Title
KR101162275B1 (en) A method and an apparatus for processing an audio signal
EP2282310B1 (en) Entropy coding by adapting coding between level and run-length/level modes
KR101343267B1 (en) Method and apparatus for audio coding and decoding using frequency segmentation
US7813932B2 (en) Apparatus and method of encoding and decoding bitrate adjusted audio data
US7539612B2 (en) Coding and decoding scale factor information
KR101251813B1 (en) Efficient coding of digital media spectral data using wide-sense perceptual similarity
KR101330362B1 (en) Modification of codewords in dictionary used for efficient coding of digital media spectral data
JP3878952B2 (en) How to signal noise substitution during audio signal coding
JP5277350B2 (en) Compression encoding and decoding method, encoder, decoder, and encoding apparatus
JP2023098967A (en) Context-based entropy coding of spectral envelope sample value
US20020049586A1 (en) Audio encoder, audio decoder, and broadcasting system
KR20050087956A (en) Lossless audio decoding/encoding method and apparatus
US20030093266A1 (en) Speech coding apparatus, speech decoding apparatus and speech coding/decoding method
US7620543B2 (en) Method, medium, and apparatus for converting audio data
US7181079B2 (en) Time signal analysis and derivation of scale factors
JP5379871B2 (en) Quantization for audio coding
CN113129913B (en) Encoding and decoding method and encoding and decoding device for audio signal
KR101644883B1 (en) A method and an apparatus for processing an audio signal
KR100737386B1 (en) Method for estimating and quantifying inter-channel level difference for spatial audio coding
JPH0761044B2 (en) Speech coding method
KR100947065B1 (en) Lossless audio decoding/encoding method and apparatus
KR101259120B1 (en) Method and apparatus for processing an audio signal
JP3692959B2 (en) Digital watermark information embedding device
KR20100054749A (en) A method and apparatus for processing a signal
JP2008268792A (en) Audio signal encoding device and bit rate converting device thereof

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant