KR101390551B1 - Method of low delay modified discrete cosine transform - Google Patents

Method of low delay modified discrete cosine transform Download PDF

Info

Publication number
KR101390551B1
KR101390551B1 KR1020120105657A KR20120105657A KR101390551B1 KR 101390551 B1 KR101390551 B1 KR 101390551B1 KR 1020120105657 A KR1020120105657 A KR 1020120105657A KR 20120105657 A KR20120105657 A KR 20120105657A KR 101390551 B1 KR101390551 B1 KR 101390551B1
Authority
KR
South Korea
Prior art keywords
mdct
low delay
frame
discrete cosine
modified discrete
Prior art date
Application number
KR1020120105657A
Other languages
Korean (ko)
Other versions
KR20140039492A (en
Inventor
이인성
이상길
Original Assignee
충북대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 충북대학교 산학협력단 filed Critical 충북대학교 산학협력단
Priority to KR1020120105657A priority Critical patent/KR101390551B1/en
Publication of KR20140039492A publication Critical patent/KR20140039492A/en
Application granted granted Critical
Publication of KR101390551B1 publication Critical patent/KR101390551B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Algebra (AREA)
  • Discrete Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 변형된 이산 코사인 변환(Modified discrete cosine transform; MDCT )과정에서 발생하는 지연을 줄이는 방법에 관한 것으로서, 본 발명은 입력되는 데이터를 변형된 이산 코사인 변환(Modified discrete cosine transform; MDCT) 처리하는 방법에 있어서, 프레임이 입력되면, 입력된 프레임에 저 지연(low delay) 윈도우(window)를 사용하는 단계, 상기 프레임에 저 지연(low delay) MDCT(Modified discrete cosine transform)를 수행하는 단계, 상기 MDCT 수행된 신호에 저 지연 역 MDCT를 수행하는 단계 및 프레임 별로 과거 프레임과의 중첩 합을 수행하는 단계를 포함하되, N은 프레임 길이, x(k)는 입력 샘플, w(n)은 저 지연 윈도우, X(m)은 MDCT 계수, D는 엘리어싱(aliasing)을 제거하기 위한 위상을 나타낸다고 할 때, 상기 저 지연 MDCT는

Figure 112012077193880-pat00020
의 제1 수학식으로 나타낼 수 있으며, 상기 제1 수학식에서 상기 D를 변화시키는 방식으로 룩-어헤드(Look-ahead) 부분을 감소시킨다.The present invention relates to a method for reducing a delay occurring in a modified discrete cosine transform (MDCT) process, and the present invention provides a method for processing modified discrete cosine transform (MDCT). A method, comprising: using a low delay window for an input frame, performing a low delay modified discrete cosine transform (MDCT) on the frame when the frame is input, the Performing a low delay inverse MDCT on the MDCT signal and performing an overlap sum with a past frame on a frame-by-frame basis, where N is the frame length, x (k) is the input sample, and w (n) is the low delay When the window, X (m) is the MDCT coefficient, D is the phase for eliminating aliasing, the low delay MDCT is
Figure 112012077193880-pat00020
It can be expressed by the first equation of, and the look-ahead portion is reduced in such a manner as to change the D in the first equation.

Description

저 지연 변형된 이산 코사인 변환 방법 {Method of low delay modified discrete cosine transform}Low delay modified discrete cosine transform

본 발명은 변형된 이산 코사인 변환(Modified discrete cosine transform; MDCT )과정에서 발생하는 지연을 줄이는 방법에 관한 것으로, 더욱 상세하게는 MDCT의 위상을 변형하여 MDCT와 역 MDCT과정에서 중첩 합 영역을 줄이는 방식으로 지연을 줄이는 방법에 관한 것이다.
The present invention relates to a method for reducing a delay occurring in a modified discrete cosine transform (MDCT) process, and more particularly, a method of reducing overlapping sum regions in MDCT and inverse MDCT processes by modifying the phase of MDCT. To reduce latency.

오디오 코딩의 한 가지 목적은 가능한 한 원래의 음질을 유지하면서 원하는 한정된 정보량으로 압축하는 것이다. 인코딩 프로세스에서 시간 영역의 오디오 신호는 주파수 영역으로 변환된다.One purpose of audio coding is to compress the desired limited amount of information while keeping the original sound quality as much as possible. In the encoding process, the audio signal in the time domain is converted into the frequency domain.

MPEG 계층-3(MP3), MPEG-2 및 MPEG-4와 같은 지각적 오디오 코딩 기술들은 데이터량을 줄이기 위해 인간의 귀의 특성들을 차단(mask)하는 신호를 사용한다. 그와 같이 함으로써, 양자화 잡음이 우세한 전체 신호에 의해 차단되도록, 즉 양자화 잡음이 여전히 들리지 않는 방식으로 주파수 대역들에 분포된다. 오디오 품질의 지각적 손실이 거의 없거나 전혀 없이 상당한 저장 크기 축소가 가능하다. 지각적 오디오 코딩 기술들은 종종 스케일러블(scalable)하며 기본 또는 핵심 계층 및 적어도 하나의 확장 계층을 갖는 계층화된 비트 스트림을 생성한다.Perceptual audio coding techniques such as MPEG Layer-3 (MP3), MPEG-2 and MPEG-4 use signals that mask the characteristics of the human ear to reduce the amount of data. In so doing, the quantization noise is distributed in the frequency bands in such a way that the quantization noise is blocked by the dominant overall signal, ie the quantization noise is still inaudible. Significant storage size reduction is possible with little or no perceptual loss of audio quality. Perceptual audio coding techniques are often scalable and produce a layered bit stream having a base or core layer and at least one enhancement layer.

이는 비트 레이트 스케일러빌러티(scalability), 즉 디코더 측에서 서로 다른 오디오 품질 레벨로의 디코딩 또는 트래픽 쉐이핑(traffic shaping)이나 컨디셔닝에 의한 네트워크에서의 비트 레이트가 감소된다.This reduces the bit rate scalability, i.e. the bit rate in the network by decoding or traffic shaping or conditioning to different audio quality levels at the decoder side.

변형된 이산 코사인 변환(Modified discrete cosine transform, MDCT)는 음성 및 오디오 부호화 기술에서 신호를 분석하기 위해 많이 사용되는 주파수 변환 방법이다. MDCT는 일반적으로 이산 퓨리에 변환(discrete fourier transform)과는 다르게 MDCT 와 역 MDCT(inverse MDCT)에 의하여 원 신호가 완벽 복원되지 않는다.Modified discrete cosine transform (MDCT) is a frequency conversion method widely used for analyzing signals in speech and audio coding techniques. In general, MDCT, unlike discrete fourier transform, does not completely recover the original signal by MDCT and inverse MDCT.

따라서 중첩 프레임에서의 중첩 합을 통하여 완벽 복원을 하는 성질을 가지며, 이러한 방법을 TDAC(time domain aliasing cancellation)라 한다. 이 과정에서 기존의 MDCT는 미래의 프레임을 사용하므로 프레임 길이 N만큼의 지연이 발생 한다. 따라서 MDCT를 사용하는 MPEG, AAC, G.729.1 등과 같은 부호화기 에서는 프레임길이 N 만큼의 지연이 발생하게 된다는 문제점이 있다.
Therefore, perfect restoration is achieved through overlapping sum in overlapping frames, and this method is called TDAC (time domain aliasing cancellation). In this process, the existing MDCT uses future frames, resulting in a delay of frame length N. Accordingly, there is a problem that a delay of frame length N occurs in encoders such as MPEG, AAC, and G.729.1 using MDCT.

본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, MDCT의 위상을 변형하여 MDCT와 역 MDCT 과정에서 중첩 합 영역을 줄임으로써, MDCT가 부호화기에서 사용될 때 발생하는 지연을 줄이는 것을 그 목적으로 한다.SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and the object of the present invention is to reduce the delay occurring when MDCT is used in an encoder by modifying the phase of MDCT to reduce the overlap sum region in the MDCT and inverse MDCT processes. .

본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
The objects of the present invention are not limited to the above-mentioned objects, and other objects not mentioned can be clearly understood by those skilled in the art from the following description.

이와 같은 목적을 달성하기 위한 본 발명은 입력되는 데이터를 변형된 이산 코사인 변환(Modified discrete cosine transform; MDCT) 처리하는 방법에 있어서, 프레임이 입력되면, 입력된 프레임에 저 지연(low delay) 윈도우(window)를 사용하는 단계, 상기 프레임에 저 지연(low delay) MDCT(Modified discrete cosine transform)를 수행하는 단계, 상기 MDCT 수행된 신호에 저 지연 역 MDCT를 수행하는 단계 및 프레임 별로 과거 프레임과의 중첩 합을 수행하는 단계를 포함하되, N은 프레임 길이, x(k)는 입력 샘플, w(n)은 저 지연 윈도우, X(m)은 MDCT 계수, D는 엘리어싱(aliasing)을 제거하기 위한 위상을 나타낸다고 할 때, 상기 저 지연 MDCT는

Figure 112012077193880-pat00001
의 제1 수학식으로 나타낼 수 있으며, 상기 제1 수학식에서 상기 D를 변화시키는 방식으로 룩-어헤드(Look-ahead) 부분을 감소시킨다.In order to achieve the above object, the present invention provides a method of processing a modified discrete cosine transform (MDCT) for input data. When a frame is input, a low delay window is input to the input frame. using a window), performing a low delay modified discrete cosine transform (MDCT) on the frame, performing a low delay inverse MDCT on the MDCT signal, and overlapping with a past frame for each frame Performing a summation, wherein N is the frame length, x (k) is the input sample, w (n) is the low delay window, X (m) is the MDCT coefficient, and D is for eliminating aliasing. Given the phase, the low delay MDCT is
Figure 112012077193880-pat00001
It can be expressed by the first equation of, and the look-ahead portion is reduced in such a manner as to change the D in the first equation.

d는 짝수일 때, 상기 D값은

Figure 112012077193880-pat00002
의 제2 수학식으로 나타낼 수 있다. When d is even, the D value is
Figure 112012077193880-pat00002
It can be represented by the second equation of.

wpw(n)은 power complementary window일 때, 상기 저 지연 윈도우는

Figure 112012077193880-pat00003
의 제3 수학식으로 나타낼 수 있다.When w pw (n) is a power complementary window, the low delay window
Figure 112012077193880-pat00003
It may be represented by the third equation of.

상기 wpw(n)은

Figure 112012077193880-pat00004
의 제4 수학식으로 나타낼 수 있다.Where w pw (n) is
Figure 112012077193880-pat00004
It may be represented by the fourth equation of.

Figure 112012077193880-pat00005
는 복원된 신호를 나타낼 때, 상기 저 지연 역 MDCT는
Figure 112012077193880-pat00006
의 제5 수학식으로 나타낼 수 있다.
Figure 112012077193880-pat00005
When the restored signal is represented, the low delay inverse MDCT is
Figure 112012077193880-pat00006
It may be represented by the fifth equation of.

본 발명에 의하면 MDCT의 위상변화와 저 지연 윈도우를 사용하는 저 지연 MDCT 방법을 통해 기존의 MDCT에서 발생하는 프레임 길이 N만큼의 지연을 줄임으로써, 실제 음성 및 오디오 부호화기에서 낮은 지연으로 MDCT를 할 수 있는 효과가 있다. 이는 실시간 통신에 사용하는 부호화기에서 더욱 효과적으로 사용될 것으로 기대된다.
According to the present invention, a low delay MDCT method using a phase change of MDCT and a low delay window reduces the delay by the frame length N generated in the existing MDCT, so that MDCT can be performed with a low delay in an actual speech and audio encoder. It has an effect. It is expected to be used more effectively in encoders used for real time communication.

도 1은 본 발명의 일 실시예에 따른 저 지연 MDCT/역 MDCT 과정을 포함하는 변형된 이산 코사인 변환 방법을 보여주는 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 저 지연 윈도우의 프레임 적용을 나타내는 도면이다.
도 3은 본 발명의 일 실시예에 따른 저 지연 윈도우의 중첩합 영역을 나타내는 도면이다.
도 4는 본 발명의 일 실시예에 따른 저 지연 MDCT, 역 MDCT 및 중첩 합을 통해 신호가 복원되는 과정을 도시한 도면이다.
도 5는 기존의 MDCT와 본 발명의 저 지연 MDCT의 엘리어싱(aliasing)을 비교한 도면이다.
도 6은 기존의 MDCT와 본 발명의 일 실시예에 따른 저 지연 MDCT의 복원된 신호의 스펙트럼을 비교한 도면이다.
도 7은 본 발명의 일 실시예에 따른 음성 부호화기에 적용한 저 지연 MDCT의 음질 테스트를 나타내는 도면이다.
1 is a flowchart illustrating a modified discrete cosine transform method including a low delay MDCT / inverse MDCT process according to an embodiment of the present invention.
2 illustrates a frame application of a low delay window according to an embodiment of the present invention.
3 is a diagram illustrating an overlapping sum region of a low delay window according to an exemplary embodiment of the present invention.
4 is a diagram illustrating a process of restoring a signal through a low delay MDCT, an inverse MDCT, and an overlap sum according to an embodiment of the present invention.
5 is a diagram comparing aliasing of a conventional MDCT and a low delay MDCT of the present invention.
6 is a diagram comparing the spectrum of the restored signal of the conventional MDCT and low delay MDCT according to an embodiment of the present invention.
7 is a diagram illustrating a sound quality test of a low delay MDCT applied to a speech coder according to an embodiment of the present invention.

이하, 첨부된 도면을 참조해서 본 발명의 실시예를 상세히 설명하면 다음과 같다. 우선 각 도면의 구성 요소들에 참조 부호를 부가함에 있어서, 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 그리고, 본 발명을 설명함에 있어서, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 명세서 전반에 걸쳐서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라, 다른 구성요소를 더 포함할 수 있다는 것을 의미한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the drawings, the same reference numerals are used for the same reference numerals even though they are shown in different drawings. In the following description of the present invention, a detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear. Also, throughout this specification, when a component is referred to as "comprising ", it means that it can include other components, aside from other components, .

본 발명은 기존의 MDCT(Modified discrete cosine transform)에서 발생하는 지연을 줄이는 방법으로서, 기존의MDCT의 위상을 변화시켜 룩-어헤드(Look-ahead) 부분을 줄이고, 중첩 합 영역을 줄임으로써 MDCT에서 발생하는 지연을 줄이는 방법을 제안한다. The present invention is a method for reducing the delay caused by the existing MDCT (Modified Discrete Cosine transform), by changing the phase of the existing MDCT to reduce the look-ahead portion, reduce the overlap sum region in MDCT Suggest ways to reduce the delays that occur.

도 1은 본 발명의 일 실시예에 따른 저 지연 MDCT/역 MDCT 과정을 포함하는 변형된 이산 코사인 변환(Modified discrete cosine transform; MDCT) 방법을 보여주는 흐름도이다.1 is a flowchart illustrating a modified discrete cosine transform (MDCT) method including a low delay MDCT / inverse MDCT process according to an embodiment of the present invention.

도 1을 참조하면, 본 발명에서 프레임이 입력되면(S110), 프레임에 저 지연(low delay) 윈도우(window)를 사용한다(S120).Referring to FIG. 1, when a frame is input in the present invention (S110), a low delay window is used for the frame (S120).

그리고, 저 지연(low delay) MDCT(Modified discrete cosine transform)를 수행한다(S130).In addition, low delay MDCT (Modified Discrete Cosine Transform) is performed (S130).

그리고, 저 지연 역 MDCT를 수행한다(S140).Then, low delay inverse MDCT is performed (S140).

다음, 프레임 별로 과거 프레임과의 중첩 합을 수행한다(S150).Next, an overlap sum with a past frame is performed for each frame (S150).

이러한 과정을 통해 현재 프레임이 복원된다(S160).Through this process, the current frame is restored (S160).

본 발명의 일 실시예에서 S130 단계에서 저 지연 MDCT 방법은 기존의 MDCT에서 위상을 변화시켜 중첩 합 영역을 줄임으로써 MDCT에서 발생하는 지연을 줄일 수 있으며, 다음 수학식 1과 같이 나타낸다.In an embodiment of the present invention, the low delay MDCT method in step S130 may reduce the delay occurring in the MDCT by changing the phase in the existing MDCT to reduce the overlap sum region, as shown in Equation 1 below.

Figure 112012077193880-pat00007
Figure 112012077193880-pat00007

여기서 N은 프레임 길이, x(k)는 입력 샘플, w(n)은 저 지연 윈도우, X(m)은 MDCT 계수, D는 엘리어싱(aliasing)을 제거하기 위한 위상을 나타낸다.Where N is the frame length, x (k) is the input sample, w (n) is the low delay window, X (m) is the MDCT coefficient, and D is the phase for eliminating aliasing.

종래 MDCT 방법의 경우, D값이 프레임 길이 N으로 고정되어 사용되었다. 따라서, 기존의 MDCT는 신호를 완벽하게 복원하기 위해 N 샘플의 룩-어헤드(Look-ahead)가 필요하고, 여기서 프레임 길이 N만큼의 지연이 발생한다.In the conventional MDCT method, the D value is fixed to the frame length N and used. Therefore, the existing MDCT requires a look-ahead of N samples to completely recover the signal, where a delay of frame length N occurs.

본 발명에서는 D값을 변형하여 MDCT에서 발생하는 룩-어헤드 부분을 줄임으로써, 지연을 줄일 수 있다. 본 발명의 일 실시예에 따른 D값은 다음 수학식2와 같이 정의할 수 있다.In the present invention, the delay can be reduced by reducing the look-ahead portion generated in the MDCT by modifying the D value. D value according to an embodiment of the present invention can be defined as shown in Equation 2.

Figure 112012077193880-pat00008
Figure 112012077193880-pat00008

여기서, d는 짝수이다.Where d is even.

다음, 본 발명의 일 실시예에서 S120 단계에서 저 지연 MDCT에서 사용하는 저 지연 윈도우에 대해 설명한다.Next, the low delay window used in the low delay MDCT in step S120 according to an embodiment of the present invention will be described.

도 2는 본 발명의 일 실시예에 따른 저 지연 윈도우의 프레임 적용을 나타내는 도면이다.2 illustrates a frame application of a low delay window according to an embodiment of the present invention.

본 발명의 일 실시예에서 저 지연 윈도우는 다음 수학식 3과 같이 정의된다.In one embodiment of the present invention, the low delay window is defined as in Equation 3 below.

Figure 112012077193880-pat00009
Figure 112012077193880-pat00009

여기서, wpw(n)은 power complementary window이며, 다음 수학식 4와 같이 나타낼 수 있다.Here, w pw (n) is a power complementary window, which can be expressed by Equation 4 below.

Figure 112012077193880-pat00010
Figure 112012077193880-pat00010

본 발명에서 저 지연 윈도우는 wpw(n)를 변형하여 만든 윈도우로서, 중첩 합 영역에 wpw(n)를 사용하고, 중첩 합이 아닌 영역은 크기가 1인 윈도우를 사용하는 방식으로 생성된다.Low-delay window in the present invention as a window is created by modifying the w pw (n), using the w pw (n) to overlap the sum areas, and not the total overlap area is created in a way that uses a window size of 1 .

다음, 본 발명의 일 실시예에서 S140 단계에서 저 지연 역 MDCT에 대해 설명한다. Next, a low delay inverse MDCT in step S140 in an embodiment of the present invention.

본 발명에서 저 지연 역 MDCT도 저 지연 MDCT와 같이 기존의 MDCT에서 위상을 변화시키는 방식으로 구할 수 있다. 본 발명의 일 실시예에 따른 저 지연 역 MDCT는 다음 수학식 5와 같이 나타낸다.In the present invention, the low delay inverse MDCT can also be obtained by changing the phase in the existing MDCT like the low delay MDCT. Low delay inverse MDCT according to an embodiment of the present invention is represented by the following equation (5).

Figure 112012077193880-pat00011
Figure 112012077193880-pat00011

여기서,

Figure 112012077193880-pat00012
는 복원된 신호를 나타내며, D값은 저 지연 MDCT에서 사용한 D값과 동일하다. here,
Figure 112012077193880-pat00012
Denotes a reconstructed signal, and the D value is the same as the D value used in the low delay MDCT.

다음, 저 지연 MDCT에서 원 신호의 복원을 위해 사용하는 중첩 합 방법에 대해 설명하기로 한다. Next, the overlap sum method used for reconstruction of the original signal in the low delay MDCT will be described.

도 3은 본 발명의 일 실시예에 따른 저 지연 윈도우의 중첩합 영역을 나타내는 도면이고, 도 4는 본 발명의 일 실시예에 따른 저 지연 MDCT, 역 MDCT 및 중첩 합을 통해 신호가 복원되는 과정을 도시한 도면이다.3 is a diagram illustrating a superposition sum region of a low delay window according to an embodiment of the present invention, and FIG. 4 is a process of restoring a signal through a low delay MDCT, an inverse MDCT, and a superposition sum according to an embodiment of the present invention; Figure is a diagram.

본 발명에서 저 지연 MDCT와 역 MDCT 과정을 거친 최종 결과는 다음 수학식 6과 같은 대칭 특성을 갖는다.In the present invention, the final result of the low delay MDCT and the reverse MDCT process has a symmetric characteristic as shown in Equation 6 below.

Figure 112012077193880-pat00013
Figure 112012077193880-pat00013

본 발명에서는 이와 같은 대칭 특성을 이용하여 도 3과 같이 프레임 별로 중첩 합을 수행하게 된다. 이러한 과정은 도 4에서 보다 상세하게 도시되어 있다.In the present invention, the overlap sum is performed for each frame as shown in FIG. This process is illustrated in more detail in FIG.

도 4를 참조하면, D값의 변화에 따라 MDCT의 룩-어헤드(Look-ahead)길이와 중첩 합 영역이 어떻게 변화하는지를 나타내고 있다. Referring to FIG. 4, it illustrates how the look-ahead length and the overlap sum region of the MDCT change as the value of D changes.

도 4에서 보는 바와 같이, 본 발명에서 저 지연 MDCT는 위상인 D값에 따라 지연을 다양하게 줄일 수 있다. 본 발명에서 D 값은 MDCT에서 사용하는 룩 어헤드(Look-ahead) 길이와 같으므로, D값이 줄게 되면 룩-어헤드(Look-ahead) 길이도 감소함을 알 수 있다. 따라서 룩-어헤드(Look-ahead)가 감소하기 때문에, 결과적으로 MDCT의 지연이 감소하게 된다.As shown in FIG. 4, in the present invention, the low delay MDCT can variously reduce the delay according to the phase D value. In the present invention, since the D value is the same as the look-ahead length used in the MDCT, it can be seen that the look-ahead length is also reduced when the D value is decreased. Therefore, since the look-ahead is reduced, the delay of MDCT is reduced as a result.

마지막으로 본 발명에 따른 저 지연 MDCT의 성능에 대해서 설명하기로 한다.Finally, the performance of the low delay MDCT according to the present invention will be described.

도 5는 기존의 MDCT와 본 발명의 저 지연 MDCT의 엘리어싱(aliasing)을 비교한 도면이고, 도 6은 기존의 MDCT와 본 발명의 일 실시예에 따른 저 지연 MDCT의 복원된 신호의 스펙트럼을 비교한 도면이고, 도 7은 본 발명의 일 실시예에 따른 음성 부호화기에 적용한 저 지연 MDCT의 음질 테스트를 나타내는 도면이다.5 is a diagram comparing aliasing of a conventional MDCT and a low delay MDCT of the present invention, and FIG. 6 is a spectrum of a restored signal of a conventional MDCT and a low delay MDCT according to an embodiment of the present invention. FIG. 7 is a diagram illustrating a sound quality test of low delay MDCT applied to a speech encoder according to an embodiment of the present invention.

먼저, 저 지연 MDCT의 엘리어싱 제거 성능에 대해 설명하기로 한다. 기존의 MDCT의 경우 엘리어싱을 제거하기 위해 프레임 길이 N만큼의 룩-어헤드(Look-ahead)를 사용하여 지연이 발생한다. First, the anti-aliasing performance of the low delay MDCT will be described. In the case of the existing MDCT, a delay occurs by using a look-ahead of a frame length N to eliminate aliasing.

도 5의 (a)는 원 신호이고, 기존의 MDCT에서 룩-어헤드(Look-ahead)의 길이를 줄였을 때 발생하는 스펙트럼 홀 부분에 엘리어싱을 도 5의 (b)에 나타내었다. 반면에 도 5 (c)에서 본 발명에 따른 저 지연 MDCT는 룩-어헤드(Look-ahead)를 줄였음에도 불구하고, 스펙트럼 홀 부분에 엘리어싱이 완벽하게 제거된 것을 볼 수 있다. FIG. 5 (a) shows an original signal, and aliasing of the spectral hole portion generated when the length of the look-ahead is reduced in the conventional MDCT is shown in FIG. 5 (b). On the other hand, in Fig. 5 (c), although the low delay MDCT according to the present invention reduces the look-ahead, it can be seen that aliasing is completely removed in the spectral hole portion.

도 6을 참조하면, 본 발명에서 저 지연 MDCT을 이용하여 지연을 다양하게 줄였음에도 불구하고, 신호가 완벽하게 복원되는 것을 확인할 수 있다. Referring to FIG. 6, although the delay is variously reduced by using the low delay MDCT in the present invention, it can be seen that the signal is completely recovered.

마지막으로, 저 지연 MDCT를 실제 음성 부호화기에 적용하여 음질 실험을 한 결과를 도 7에서 보여주고 있다. 이때 사용한 음성 부호화기는 G.729.1 부호화기를 사용하였고, PESQ 음질 테스트로 성능을 나타내었다. Finally, the results of the sound quality experiment by applying the low delay MDCT to the actual speech coder are shown in FIG. 7. The speech coder used was G.729.1 coder and showed performance by PESQ sound quality test.

도 7을 참조하면, 기존의 N 길이 지연을 사용하는 MDCT와 본 발명의 저 지연 MDCT를 이용하여 지연을 N/2부터 N/16 까지 줄인 MDCT를 사용한 음질이 차이가 없음을 알 수 있다.
Referring to FIG. 7, it can be seen that there is no difference in sound quality using the MDCT using the N length delay and the MDCT reducing the delay from N / 2 to N / 16 using the low delay MDCT of the present invention.

이상 본 발명을 몇 가지 바람직한 실시예를 사용하여 설명하였으나, 이들 실시예는 예시적인 것이며 한정적인 것이 아니다. 본 발명이 속하는 기술분야에서 통상의 지식을 지닌 자라면 본 발명의 사상과 첨부된 특허청구범위에 제시된 권리범위에서 벗어나지 않으면서 다양한 변화와 수정을 가할 수 있음을 이해할 것이다.
While the present invention has been described with reference to several preferred embodiments, these embodiments are illustrative and not restrictive. It will be understood by those skilled in the art that various changes and modifications may be made therein without departing from the spirit of the invention and the scope of the appended claims.

Claims (5)

입력되는 데이터를 변형된 이산 코사인 변환(Modified discrete cosine transform; MDCT) 처리하는 방법에 있어서,
프레임이 입력되면, 입력된 프레임에 저 지연(low delay) 윈도우(window)를 사용하는 단계;
상기 프레임에 저 지연(low delay) MDCT(Modified discrete cosine transform)를 수행하는 단계;
상기 MDCT 수행된 신호에 저 지연 역 MDCT를 수행하는 단계; 및
프레임 별로 과거 프레임과의 중첩 합을 수행하는 단계를 포함하되,
N은 프레임 길이, x(k)는 입력 샘플, w(n)은 저 지연 윈도우, X(m)은 MDCT 계수, D는 엘리어싱(aliasing)을 제거하기 위한 위상을 나타낸다고 할 때, 상기 저 지연 MDCT는,
Figure 112013112458526-pat00014

의 제1 수학식으로 나타낼 수 있으며,
상기 제1 수학식에서 상기 D를 변화시키는 방식으로 룩-어헤드(Look-ahead) 부분을 감소시키고,
d는 짝수일 때,
상기 D값은,
Figure 112013112458526-pat00015

의 제2 수학식으로 나타낼 수 있는 것을 특징으로 하는 변형된 이산 코사인 변환 방법.
In the method of processing the modified discrete cosine transform (MDCT) input data,
If a frame is input, using a low delay window for the input frame;
Performing a low delay modified discrete cosine transform (MDCT) on the frame;
Performing low delay inverse MDCT on the MDCT performed signal; And
Performing a superposition sum with a past frame on a frame-by-frame basis,
The low delay, where N is the frame length, x (k) is the input sample, w (n) is the low delay window, X (m) is the MDCT coefficient, and D is the phase for eliminating aliasing. MDCT,
Figure 112013112458526-pat00014

Can be represented by the first equation of,
In the first equation, the look-ahead portion is reduced by changing the D,
when d is even,
The D value is,
Figure 112013112458526-pat00015

Modified discrete cosine transform method, characterized in that can be represented by the second equation.
삭제delete 제1항에 있어서,
wpw(n)은 power complementary window일 때,
상기 저 지연 윈도우는,
Figure 112013112458526-pat00016

의 제3 수학식으로 나타낼 수 있는 것을 특징으로 하는 변형된 이산 코사인 변환 방법.
The method of claim 1,
w pw (n) is the power complementary window,
The low delay window,
Figure 112013112458526-pat00016

The modified discrete cosine transform method of claim 3, characterized by.
제3항에 있어서,
상기 wpw(n)은
Figure 112012077193880-pat00017
의 제4 수학식으로 나타낼 수 있는 것을 특징으로 하는 변형된 이산 코사인 방법.
The method of claim 3,
Where w pw (n) is
Figure 112012077193880-pat00017
Modified discrete cosine method, characterized in that can be represented by the fourth equation.
제4항에 있어서,
Figure 112012077193880-pat00018
는 복원된 신호를 나타낼 때,
상기 저 지연 역 MDCT는,
Figure 112012077193880-pat00019

의 제5 수학식으로 나타낼 수 있는 것을 특징으로 하는 변형된 이산 코사인 방법.
5. The method of claim 4,
Figure 112012077193880-pat00018
When represents the restored signal,
The low delay inverse MDCT,
Figure 112012077193880-pat00019

Modified discrete cosine method, characterized in that can be represented by the fifth equation.
KR1020120105657A 2012-09-24 2012-09-24 Method of low delay modified discrete cosine transform KR101390551B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120105657A KR101390551B1 (en) 2012-09-24 2012-09-24 Method of low delay modified discrete cosine transform

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120105657A KR101390551B1 (en) 2012-09-24 2012-09-24 Method of low delay modified discrete cosine transform

Publications (2)

Publication Number Publication Date
KR20140039492A KR20140039492A (en) 2014-04-02
KR101390551B1 true KR101390551B1 (en) 2014-04-30

Family

ID=50650105

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120105657A KR101390551B1 (en) 2012-09-24 2012-09-24 Method of low delay modified discrete cosine transform

Country Status (1)

Country Link
KR (1) KR101390551B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107483029A (en) * 2017-07-28 2017-12-15 广州多益网络股份有限公司 The length adjusting method and device of a kind of sef-adapting filter

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000056661A (en) * 1999-02-24 2000-09-15 유수근 A method for backward decoding an audio data
KR20070068424A (en) * 2004-10-26 2007-06-29 마츠시타 덴끼 산교 가부시키가이샤 Sound encoding device and sound encoding method
KR20100031742A (en) * 2007-06-13 2010-03-24 콸콤 인코포레이티드 Signal encoding using pitch-regularizing and non-pitch-regularizing coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000056661A (en) * 1999-02-24 2000-09-15 유수근 A method for backward decoding an audio data
KR20070068424A (en) * 2004-10-26 2007-06-29 마츠시타 덴끼 산교 가부시키가이샤 Sound encoding device and sound encoding method
KR20100031742A (en) * 2007-06-13 2010-03-24 콸콤 인코포레이티드 Signal encoding using pitch-regularizing and non-pitch-regularizing coding

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107483029A (en) * 2017-07-28 2017-12-15 广州多益网络股份有限公司 The length adjusting method and device of a kind of sef-adapting filter
CN107483029B (en) * 2017-07-28 2021-12-07 广州多益网络股份有限公司 Method and device for adjusting length of adaptive filter in voip communication

Also Published As

Publication number Publication date
KR20140039492A (en) 2014-04-02

Similar Documents

Publication Publication Date Title
JP7007344B2 (en) Post-processors, pre-processors, audio coders, audio decoders, and related methods to enhance transient processing.
KR101455915B1 (en) Decoder for audio signal including generic audio and speech frames
JP4741476B2 (en) Encoder
JP7391930B2 (en) Apparatus and method for generating enhanced signals with independent noise filling
KR101428608B1 (en) Spectrum flatness control for bandwidth extension
JP5140730B2 (en) Low-computation spectrum analysis / synthesis using switchable time resolution
JP5038138B2 (en) Time envelope shaping for spatial audio coding using frequency domain Wiener filters
KR101162275B1 (en) A method and an apparatus for processing an audio signal
JP5418930B2 (en) Speech decoding method and speech decoder
EP2860729A1 (en) Audio encoding method and device, audio decoding method and device, and multimedia device employing same
JP6148811B2 (en) Low frequency emphasis for LPC coding in frequency domain
US20140257824A1 (en) Apparatus and a method for encoding an input signal
WO2013061584A1 (en) Hybrid sound-signal decoder, hybrid sound-signal encoder, sound-signal decoding method, and sound-signal encoding method
KR101390551B1 (en) Method of low delay modified discrete cosine transform
Muin et al. A review of lossless audio compression standards and algorithms
JP6718670B2 (en) ADPCM decoder including packet loss concealment method in ADPCM codec and PLC circuit
Ofir et al. Packet loss concealment for audio streaming based on the GAPES and MAPES algorithms
US20240194209A1 (en) Apparatus and method for removing undesired auditory roughness
JP2016105168A5 (en)
Chen et al. Scalefactor based bit shift FGS audio coding
Dhas et al. Designing a Hybrid Codec with the help of Integer-MDCT and to estimate the audio quality by means of SPL and CR
KR100587613B1 (en) Audio signal coding device and coding method thereof

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee