KR101346771B1 - 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를효율적으로 인코딩하는 방법 및 장치, 그리고 인코딩된오디오 신호를 디코딩하는 방법 및 장치 - Google Patents

심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를효율적으로 인코딩하는 방법 및 장치, 그리고 인코딩된오디오 신호를 디코딩하는 방법 및 장치 Download PDF

Info

Publication number
KR101346771B1
KR101346771B1 KR1020070082287A KR20070082287A KR101346771B1 KR 101346771 B1 KR101346771 B1 KR 101346771B1 KR 1020070082287 A KR1020070082287 A KR 1020070082287A KR 20070082287 A KR20070082287 A KR 20070082287A KR 101346771 B1 KR101346771 B1 KR 101346771B1
Authority
KR
South Korea
Prior art keywords
sinusoidal signal
signal
sinusoidal
encoding
component
Prior art date
Application number
KR1020070082287A
Other languages
English (en)
Other versions
KR20090017819A (ko
Inventor
이남숙
이건형
이철우
문한길
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070082287A priority Critical patent/KR101346771B1/ko
Priority to EP08765913A priority patent/EP2179588B1/en
Priority to AT08765913T priority patent/ATE534118T1/de
Priority to PCT/KR2008/002939 priority patent/WO2009022789A1/en
Priority to CN2008801034031A priority patent/CN101779462B/zh
Priority to US12/131,446 priority patent/US8165871B2/en
Publication of KR20090017819A publication Critical patent/KR20090017819A/ko
Application granted granted Critical
Publication of KR101346771B1 publication Critical patent/KR101346771B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를 효율적으로 인코딩하는 방법 및 장치, 인코딩된 정현파 신호를 디코딩하는 방법 및 장치, 그리고 이러한 인코딩 방법/디코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체가 개시된다. 심리 음향 모델에 따른 마스킹 값보다 작은 제1 정현파 신호를 인코딩할 때 이러한 신호를 나타내는 특정한 코드를 사용하도록 함에 의하여, 제1 정현파 신호에 연결되는 다음 프레임의 정현파 신호인 제3 정현파 신호를 인코딩할 때, 상기 특정한 코드를 사용하는 방식에 따라 선택된 정현파 신호를 이용하여 차이값 코딩을 수행하며, 디코딩 측에서는 선택된 정현파 신호를 이용하여 전송된 차이 값과 합을 구하도록 한다. 따라서, 종래 방식과 비교하여 인코딩에 필요한 비트 수를 줄일 수 있게 되어, 효율적인 인코딩이 가능하게 된다.

Description

심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를 효율적으로 인코딩하는 방법 및 장치, 그리고 인코딩된 오디오 신호를 디코딩하는 방법 및 장치{Method and apparatus for efficiently encoding sinusoid less than masking value according to psychoacoustic model, and method and apparatus for decoding the encoded sinusoid}
본 발명은 오디오 신호의 처리에 관한 것으로서, 특히 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를 인코딩하는 방법 및 장치, 인코딩된 정현파 신호를 디코딩하는 방법 및 장치, 그리고 이러한 인코딩 방법과 디코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체에 관한 것이다.
파라메트릭 오디오 코딩(parametric audio coding)은 특정한 파라미터로 오디오 신호를 표현하는 코딩 방식이다. 파라메트릭 코딩은 MPEG-4(Moving Picture Experts Group 4) 표준에서 이용되고 있다.
파라메트릭 오디오 코딩 방식에서는 입력된 오디오 신호에 대하여 트랜지언트(transient) 분석, 정현파(sinusoid) 분석 및 노이즈(noise) 분석의 세 가지 분 석을 수행하여 각각의 영역에서의 오디오 성분들에 대한 파라미터들을 추출한다. 추출된 파라미터들은 비트 스트림으로 포맷팅하여 디코더 측으로 전달된다.
정현파 분석을 수행한 후에 정현파 성분(sinusoid)에 대하여 ADPCM(adaptive differential pulse code modulation)이나 DPCM(differential pulse code modulation) 코딩을 하기 위하여 정현파 성분에 대한 트랙킹(tracking)을 수행한다. 트랙킹이란 전후 프레임에 포함된 정현파 성분들간에 서로 연결되는 정현파 성분을 찾아내고 대응 관계를 설정하는 것을 의미한다.
이전 프레임의 정현파 성분으로부터 트랙킹이 가능한 현재 프레임의 정현파 성분을 연속(continuation) 정현파 성분이라고 한다. 연속 정현파 성분에 대하여는 대응하는 이전 프레임의 정현파 성분을 이용하여 차이값 코딩(difference coding)을 수행하므로 효율적인 코딩이 가능하다. 연속 정현파 성분 중에서 특히 다음 프레임의 정현파 성분과 연결되지 않고 사라지는 정현파 성분을 종지(death) 정현파 성분이라고 한다.
반면, 이전 프레임의 정현파 성분들로부터 트랙킹이 가능하지 않은 현재 프레임의 정현파 성분을 신생(birth) 정현파 성분이라고 한다. 신생 정현파 성분에 대하여는 이전 프레임의 정현파 성분을 이용하여 코딩할 수가 없으므로, 절대 코딩(absolute coding)을 수행하여야 하므로, 코딩을 위하여 많은 비트 수가 필요하게 된다.
오디오 데이터의 인코딩에서는 심리 음향 모델을 사용하여 인코딩된 데이터의 비트 수를 줄이고자 한다. 도 1a는 심리 음향 모델에 따른 마스킹 효과를 나타 낸 도면이다.
도 1a에 도시된 바와 같이, 어떤 오디오 신호(4)가 존재할 때, 신호의 크기가 오디오 신호(4)의 크기보다 어느 정도 작은 소리들은 인간의 귀에 들리지 않게 된다. 이렇게 특정 오디오 신호(4)가 존재할 때 인간이 들을 수 있는 최소한의 신호의 크기를 나타낸 선을 마스킹 곡선(masking curve, 2)이라고 하며, 해당 주파수에서의 마스킹 곡선(2)의 값을 마스킹 값(masking value)이라고 한다.
도 1a에서 정현파 신호(6)의 크기는 마스킹 값보다 크므로, 정현파 신호(6)은 인간의 귀에 들린다. 따라서, 정현파 신호(6)은 반드시 인코딩하여야 한다.
반면, 정현파 신호(8)의 크기는 마스킹 값보다 작으므로, 정현파 신호(8)은 인간의 귀에 들리지 않는다. 따라서, 심리 음향 모델을 사용하는 인코딩에서는 정현파 신호(8)을 인코딩하지 않는다. 즉, 심리 음향 모델을 사용하는 인코딩 방식에서는 마스킹 값보다 작은 정현파 신호에 대하여 존재하지 않는 것으로 취급한다.
도 1b는 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호가 정현파 트랙킹에서 어떻게 취급되는지를 나타낸 도면이다.
도 1b에서 정현파 신호(10)은 심리 음향 모델에 따른 마스킹 값보다 작은 신호를 나타낸다. 정현파 신호(10)은 같은 프레임 내 정현파 신호들(18, 20)과 비교하여 신호의 크기가 작은 값을 가진다.
만일 심리 음향 모델이 적용되지 않는다면, 정현파 신호(10)은 이전 프레임의 정현파 신호(12)와 연결되며, 또한 이후 프레임의 정현파 신호(14)와 연결될 것이다. 따라서, 정현파 신호(12)-정현파 신호(10)-정현파 신호(14)의 트랙킹이 수행 되어, 정현파 신호(14)에 대하여는 연속 정현파 신호에 적용되는 차이값 코딩이 가능할 것이다.
하지만, 심리 음향 모델이 적용되는 경우, 마스킹 값보다 작은 신호들은 존재하지 않는 것으로 취급된다(신호가 없는 것으로 취급되는 빈 자리의 예 - 16).
심리 음향 모델이 적용되는 경우, 정현파 신호(10)은 존재하지 않는 것으로 취급되므로, 정현파 신호(14)는 신생 정현파 신호로서 취급되며, 따라서 인코딩하는데 많은 비트 수를 필요로 하게 된다.
이와 같이, 심리 음향 모델에 따른 마스킹 값보다 작은 신호들을 존재하지 않는 것으로 취급하게 되면, 다음 프레임의 정현파 신호를 신생 정현파 신호로서 인코딩하여야 하는 문제점이 발생한다.
또한, 심리 음향 모델에 따른 마스킹 값보다 작은 신호를 코딩하는 경우에도 문제점은 발생한다.
도 2는 심리 음향 모델에 따른 마스킹 값보다 작은 신호를 취급하는 종래의 방식을 나타낸 흐름도이다.
먼저 정현파 트랙킹(sinusoid tracking)을 수행한다(S10). 정현파 트랙킹 수행 결과 P(n-2), P(n-1), P(n)이 서로 연결되어 있다고 가정하자.
이때 P(n-1)이 심리 음향 모델에 따른 마스킹 값보다 작은 신호라고 하자(S20). 심리 음향 모델에 따른 마스킹 값보다 작은 신호는, 진폭(amplitude)가 작거나 0의 값을 가질 것이다.
앞에서 살펴본 두 가지 방식 중 하나에 따라, P(n-1)을 코딩할 것인지 여부 를 결정한다(S30).
심리 음향 모델을 적용하여 P(n-1)이 존재하지 않는 것으로 취급하는 경우, P(n-1)을 코딩하지 않고(S40), 다음 프레임의 정현파 신호인 P(n)은 신생 정현파 신호의 인코딩 방식에 따라 절대 코딩(absolute coding) 한다.
반면, P(n-1)을 코딩할 것으로 결정한 경우, 먼저 P(n-1)에 대하여 연속 정현파 신호의 인코딩 방식에 따라 P(n-2)와의 차이값 코딩(difference coding)을 수행하고(S60), P(n)에 대하여는 P(n-1)과의 차이값 코딩(difference coding)을 수행한다(S70).
앞서 살펴본 바와 같이, P(n-1)을 코딩하지 않는 경우(S40), P(n)을 코딩하는데 신생 정현파 신호의 인코딩 방식을 적용하여야 하므로, 진폭(amplitude), 주파수(frequency), 위상(phase) 성분들을 코딩하는데 많은 비트 수가 사용된다.
반면, P(n-1)을 코딩하는 경우(S60), 주파수나 진폭을 코딩하는데 사용되는 비트 수는 적게 된다. 하지만, P(n-1)의 진폭은 그 값이 작거나 0이므로, P(n-1)의 진폭과 P(n-2)의 진폭의 차이 값은 매우 클 것이다. 또한, P(n)의 진폭과 P(n-1)의 진폭의 차이 값도 매우 클 것이다. 따라서, 이러한 차이 값들을 인코딩하는데 많은 비트 수가 사용되거나 또는 표현할 수 없는 범위일 수 있다.
이와 같이, 종래의 방식을 사용하여서는, 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를 포함하는 오디오 신호를 코딩하기 위하여는, 일반적인 정현파 신호를 코딩하는 경우보다 많은 비트 수가 필요하게 되어, 인코딩의 효율성이 매우 저하되는 문제가 있다.
따라서, 본 발명에서는 이와 같이 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를 효율적으로 코딩하는 방식 및 이러한 방식으로 인코딩된 정현파 신호를 디코딩하는 방식을 제공하고자 한다.
상기 기술적 과제를 해결하기 위하여 본 발명에 따른 정현파 신호의 인코딩 방법은, 심리 음향 모델에 따른 마스킹 값보다 작은 제1 정현파 신호를 포함하는 오디오 신호에 대하여 정현파 트랙킹(sinusoidal tracking)을 수행하여, 상기 제1 정현파 신호가 포함된 프레임의 이전 프레임(previous frame)의 정현파 신호들 중에서 상기 제1 정현파 신호와 연결된 제2 정현파 신호와, 상기 제1 정현파 신호가 포함된 프레임의 다음 프레임(next frame)의 정현파 신호들 중에서 상기 제1 정현파 신호와 연결된 제3 정현파 신호를 결정하는 단계; 상기 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 코드를 사용하여 상기 제1 정현파 신호를 인코딩하는 단계; 및 상기 특정한 코드를 사용하는 방식에 따라 상기 제2 정현파 신호를 이용하거나 또는 상기 제1 정현파 신호와 상기 제2 정현파 신호를 이용하여, 상기 제3 정현파 신호와의 차이값 코딩을 수행함에 의하여, 상기 제3 정현파 신호를 인코딩하는 단계를 포함한다.
또한, 상기 기술적 과제를 해결하기 위한 본 발명에 따른 정현파 신호의 인코딩 장치는, 심리 음향 모델에 따른 마스킹 값보다 작은 제1 정현파 신호를 포함 하는 오디오 신호에 대하여 정현파 트랙킹(sinusoidal tracking)을 수행하여, 상기 제1 정현파 신호가 포함된 프레임의 이전 프레임(previous frame)의 정현파 신호들 중에서 상기 제1 정현파 신호와 연결된 제2 정현파 신호와, 상기 제1 정현파 신호가 포함된 프레임의 다음 프레임(next frame)의 정현파 신호들 중에서 상기 제1 정현파 신호와 연결된 제3 정현파 신호를 결정하는 정현파 트랙킹부; 상기 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 코드를 사용하여 상기 제1 정현파 신호를 인코딩하는 제1인코딩부; 및 상기 제1 인코딩부에서 상기 특정한 코드를 사용하는 방식에 따라 상기 제2 정현파 신호를 이용하거나 또는 상기 제1 정현파 신호와 상기 제2 정현파 신호를 이용하여, 상기 제3 정현파 신호와의 차이값 코딩을 수행함에 의하여, 상기 제3 정현파 신호를 인코딩하는 제2 인코딩부를 포함한다.
상기 기술적 과제를 해결하기 위하여, 본 발명에 따른 정현파 신호의 디코딩 방법은, 입력된 비트 스트림으로부터, 디코딩하고자 하는 제3 정현파 신호가 포함된 프레임의 이전 프레임(previous frame)의 정현파 신호들 중에서 상기 제3 정현파 신호와 연결된 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 코드를 추출하는 단계; 및 상기 특정한 코드의 종류에 따라, 상기 제1 정현파 신호가 포함된 프레임의 이전 프레임의 정현파 신호들 중에서 상기 제1 정현파 신호와 연결된 제2 정현파 신호를 이용하거나 또는 상기 제1 정현파 신호와 상기 제2 정현파 신호를 이용하여, 상기 제3 정현파 신호를 디코딩하는 단계를 포함한다.
또한, 상기 기술적 과제를 해결하기 위한 본 발명에 따른 정현파 신호의 디코딩 장치는, 입력된 비트 스트림으로부터, 디코딩하고자 하는 제3 정현파 신호가 포함된 프레임의 이전 프레임(previous frame)의 정현파 신호들 중에서 상기 제3 정현파 신호와 연결된 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 코드를 추출하는 코드 추출부; 및 상기 특정한 코드의 종류에 따라, 상기 제1 정현파 신호가 포함된 프레임의 이전 프레임의 정현파 신호들 중에서 상기 제1 정현파 신호와 연결된 제2 정현파 신호를 이용하거나 또는 상기 제1 정현파 신호와 상기 제2 정현파 신호를 이용하여, 상기 제3 정현파 신호를 디코딩하는 정현파 신호 디코딩부를 포함한다.
본 발명에 따른 정현파 신호의 인코딩 방법 및 장치에 따르면, 심리 음향 모델에 따른 마스킹 값보다 작은 제1 정현파 신호를 인코딩할 때 이러한 신호를 나타내는 특정한 코드를 사용하도록 함에 의하여, 제1 정현파 신호에 연결되는 다음 프레임의 정현파 신호인 제3 정현파 신호를 인코딩할 때, 상기 특정한 코드를 사용하는 방식에 따라 제1 정현파 신호에 연결되는 이전 프레임의 정현파 신호인 제2 정현파 신호를 이용하거나 또는 상기 제1 정현파 신호와 상기 제2 정현파 신호를 이용하여 상기 제3 정현파 신호와의 차이값 코딩을 수행하며, 디코딩 측에서는 상기 특정한 코드의 종류에 따라 선택된 정현파 신호를 이용하여 제3 정현파 신호를 디코딩하도록 한다.
반면 종래 방식에서는, 제3 정현파 신호를 인코딩할 때, 절대 코딩을 수행하 거나 또는 모든 성분에 대하여 단순히 제1 정현파 신호와의 차이값 코딩을 수행한다.
따라서, 본 발명에 의하면, 종래 방식과 비교하여 인코딩에 필요한 비트 수를 줄일 수 있게 되어, 효율적인 인코딩이 가능하게 되는 효과가 있다.
이하 첨부된 도면들을 참조하여, 본 발명에 따른 정현파 신호의 인코딩 방법 및 장치에 대하여 상세히 설명한다.
도 3은 본 발명의 일 실시예에 따른 정현파 신호의 인코딩 방법을 나타낸 흐름도이다. 또한, 도 4는 본 발명의 일 실시예에 따른 정현파 신호의 인코딩 장치의 구성을 나타낸 블록도이다.
먼저, 도 4를 참조하면, 본 발명에 따른 정현파 신호의 인코딩 장치(100)는 정현파 트랙킹부(110), 제1 인코딩부(120) 및 제2 인코딩부(130)를 포함하는 것이 바람직하다.
P(n-1)이 심리 음향 모델에 따른 마스킹 값보다 작은 신호라고 하고, P(n-2), P(n-1), P(n)이 서로 연결되어 있다고 가정하자. 이하에서는 심리 음향 모델에 따른 마스킹 값보다 작은 신호를 제1 정현파 신호라고 하고, 이전 프레임의 정현파 신호들 중에서 제1 정현파 신호와 연결된 정현파 신호를 제2 정현파 신호라고 하고, 다음 프레임의 정현파 신호들 중에서 제1 정현파 신호와 연결된 정현파 신호를 제3 정현파 신호라고 부르기로 한다.
정현파 트랙킹부(110)는 정현파 트랙킹(sinusoid tracking)을 수행하 여(S100) 제1 정현파 신호와 연결된 제2 정현파 신호와 제3 정현파 신호를 결정한다.
도 3의 예에서, 제1 정현파 신호는 P(n-1)이며, 제2 정현파 신호는 P(n-2)이고, 제3 정현파 신호는 P(n)이 된다.
제1 인코딩부(120)는 P(n-1), 즉 제1 정현파 신호를 특정한 코드로 표현함에 의하여 제1 정현파 신호를 인코딩한다(S110). 제1 인코딩부(120)는 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 코드를 사용한다.
제2 인코딩부(130)는 P(n), 즉 제3 정현파 신호를 인코딩한다. 이때 제1 인코딩부에서 상기 특정한 코드를 사용하는 방식에 따라, 상기 제2 정현파 신호 P(n-2)를 이용하거나 또는 상기 제1 정현파 신호 P(n-1)와 상기 제2 정현파 신호 P(n-2)를 이용하여, 상기 제3 정현파 신호와의 차이값 코딩을 수행한다.
이러한 특정한 코드를 사용하는 방식에는 다음과 같은 것들이 있을 수 있다. 하지만, 이러한 예에 한정되지 아니하며, 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 코드를 사용한다면, 본 발명에 따른 제1 인코딩부에 대응하는 구성이 될 수 있을 것이다.
<특정한 코드를 사용하는 방식>
1. 제어 플래그들 중에서 인코딩되는 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 플래그를 지정하는 방식
: 정현파 신호를 인코딩하기 위하여 제어 플래그들이 사용된다. 이 중 하나 를 지정함에 의하여 인코딩되는 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타낼 수 있다. 이러한 제어 플래그를 사용하는 방식에서는, 제1 정현파 신호의 진폭, 주파수, 위상 성분을 인코딩하지 않아도 된다. 다음 프레임의 제3 정현파 신호에 대하여는 제2 정현파 신호를 이용하여 차이값 코딩을 수행할 수 있다. 종래 기술에서 제1 정현파 신호를 존재하지 않는 것으로 취급하는 방식과 비교하면, 본 방식에서는 제3 정현파 신호를 인코딩할 때 차이값 코딩을 수행하도록 하여 비트 수를 줄일 수 있다는 장점이 있다.
2. 제1 정현파 신호의 진폭 성분 대신 인코딩되는 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 값을 인코딩하는 방식
: 이때 제1 정현파 신호의 주파수 성분과 위상 성분에 대하여는 이전 프레임의 정현파 성분인 제2 정현파 신호의 주파수 성분과 위상 성분을 이용하여 차이값 코딩(difference coding)을 수행한다. 이러한 방식에서는, 제3 정현파 신호의 인코딩 시에, 진폭 성분에 대하여는 제2 정현파 신호의 진폭 성분과 차이값 코딩을 수행하고, 주파수 성분에 대하여는 제1 정현파 신호의 주파수 성분과의 차이값 코딩을 수행하고, 위상 성분에 대하여는 제1 정현파 신호의 위상 성분과의 차이값 코딩을 수행한다. 이에 의하여, 제3 정현파 신호를 인코딩할 때 절대 코딩을 사용하지 않고, 차이값 코딩을 수행하도록 하여 인코딩에 필요한 비트 수를 줄일 수 있게 된다. 또한, 단순히 제1 정현파 신호와의 차이값 코딩을 수행하는 종래 기술과 비교할 때, 진폭 성분에 대하여는 제2 정현파 신호의 진폭 성분과 차이값 코딩을 수행 하므로, 종래 기술에서와 같이 차이 값을 코딩하는데 많은 비트 수가 필요하거나 표현할 수 없는 범위의 값을 가지게 되는 문제점이 해결되게 된다.
3. 제1 정현파 신호의 주파수 성분(또는 위상 성분) 대신 인코딩되는 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 값을 인코딩하는 방식
: 이때 제1 정현파 신호의 진폭 성분과 위상 성분(또는 주파수 성분)은 코딩하지 않아도 된다. 이는 1번째 방식인 제어 플래그들 중에서 인코딩되는 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 플래그를 지정하는 방식과 유사하다.
다음 프레임의 제3 정현파 신호에 대하여는 제2 정현파 신호를 이용하여 차이값 코딩을 수행할 수 있다. 이러한 제3 방식과 종래 기술에서 제1 정현파 신호를 존재하지 않는 것으로 취급하는 방식과 비교하면, 본 방식에서는 제3 정현파 신호를 인코딩할 때 차이값 코딩을 수행하도록 하여 비트 수를 줄일 수 있다는 장점이 있다.
제3 방식은 제1 방식과 유사한 면이 있는데, 실시예에 따라서 비트 수를 더 줄일 수 있는 방식을 선택할 수 있을 것이다. 즉, 플래그에 특정한 코드를 사용하는 방식과 주파수 또는 위상 성분에 특정한 값을 인코딩하는 방식 중에서 인코딩시 비트 수가 더 적은 쪽을 선택할 수 있다.
실시예에 따라서는, 특정한 플래그를 추가로 지정하기 위하여 어려움이 있을 수도 있는데, 이러한 예에서는 상기 제3 방식을 채용함에 의하여 이러한 어려움을 극복할 수 있을 것이다.
<제3 정현파 신호를 인코딩하는 방식>
A. 제1 인코딩부(120)에서 상기 제1 방식 또는 제3 방식을 사용하는 경우, 제2 인코딩부(130)에서는 제2 정현파 신호만을 이용하여 제3 정현파 신호와의 차이값 코딩을 수행한다.
도 5는 제2 정현파 신호만을 이용하여 제3 정현파 신호를 인코딩하는 경우를 나타낸 도면이다. 도 5는 n=5일 때를 도시하고 있다. 따라서, 제1 정현파 신호는 P4, 제2 정현파 신호는 P3, 제3 정현파 신호는 P5가 된다.
P4를 인코딩할 때는 상기 제1 방식에 따라 특정한 플래그를 지정하거나, 상기 제3 방식에 따라 주파수 성분 또는 위상 성분 대신에 특정한 값을 인코딩한다.
P5를 인코딩할 때, P3만을 이용하여 차이값 코딩을 수행한다. 즉, P5의 진폭 성분에 대하여는 P3의 진폭 성분과의 차이 값을 구하여 인코딩하고, P5의 주파수 성분에 대하여는 P3의 주파수 성분과의 차이 값을 구하여 인코딩하고, P5의 위상 성분에 대하여는 P3의 위상 성분과의 차이 값을 구하여 인코딩한다.
B. 제1 인코딩부(120)에서 상기 제2 방식을 사용하는 경우, 제2 인코딩 부(130)에서는 제1 정현파 신호와 제2 정현파 신호를 함께 이용하여 제3 정현파 신호와의 차이값 코딩을 수행한다.
도 6은 제1 정현파 신호와 제2 정현파 신호를 이용하여 제3 정현파 신호를 인코딩하는 경우를 나타낸 도면이다. 도 6은 n=5일 때를 도시하고 있다. 따라서, 제1 정현파 신호는 P4, 제2 정현파 신호는 P3, 제3 정현파 신호는 P5가 된다.
P4를 인코딩할 때는 상기 제2 방식에 따라 진폭 성분 대신에 특정한 값을 인코딩한다. P4의 주파수 성분에 대하여는 P3의 주파수 성분과의 차이 값을 구하여 인코딩한다. P4의 위상 성분에 대하여는 P3의 위상 성분과의 차이 값을 구하여 인코딩한다.
P5를 인코딩할 때, P3와 P4를 모두 이용하여 차이값 코딩을 수행한다. 즉, P5의 진폭 성분에 대하여는 P3의 진폭 성분과의 차이 값을 구하여 인코딩하고, P5의 주파수 성분에 대하여는 P4의 주파수 성분과의 차이 값을 구하여 인코딩하고, P5의 위상 성분에 대하여는 P4의 위상 성분과의 차이 값을 구하여 인코딩한다.
도 4에 도시되지는 않았지만, 본 발명에 따른 정현파 신호의 인코딩 장치(100)는 주파수 변경부를 더 포함할 수 있다. 주파수 변경부는, 제1 정현파 신호의 주파수를 변경하여, 제1 인코딩부에 전달한다.
제2 정현파 신호의 주파수 성분을 fp라고 하고, 제3 정현파 신호의 주파수 성분을 fn이라 할 때, 주파수 변경부는, 제1 정현파 신호의 주파수를 상기 두 주파수의 평균 값인 (fp+fn)/2로 변경한다.
인코딩된 정현파 신호는 비트 스트림으로 포맷팅되어, 정현파 신호의 인코딩 장치(100)로부터 정현파 신호의 디코딩 장치로 전달된다.
도 7은 본 발명의 일 실시예에 따른 정현파 신호의 디코딩 장치의 구성을 나타낸 블록도이다.
도 7을 참조하면, 본 발명에 따른 정현파 신호의 디코딩 장치(200)는, 코드 추출부(210) 및 정현파 신호 디코딩부(220)를 포함하는 것이 바람직하다.
코드 추출부(210)는 입력된 비트 스트림으로부터 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 코드를 추출한다.
정현파 신호 디코딩부(220)는 상기 특정한 코드의 종류에 따라, 상기 제2 정현파 신호를 이용하거나 또는 상기 제1 정현파 신호와 제2 정현파 신호를 이용하여, 제3 정현파 신호를 디코딩한다.
<제3 정현파 신호를 디코딩하는 방식>
A. 정현파 신호 인코딩 장치(100)에서 상기 제1 방식 또는 제3 방식을 사용한 경우, 정현파 신호 디코딩부(220)에서는 제2 정현파 신호만을 이용하여 제3 정현파 신호를 디코딩한다.
즉, 제1 정현파 신호를 인코딩할 때 사용된 제어 플래그들 중에서 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 플래그가 지정되어 있거나(상기 제1 방식), 제1 정현파 신호의 주파수 성분(또는 위상 성분) 대신 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 값이 인코딩되어(상기 제2 방식) 상기 입력 비트 스트림에 포함되어 있는 경우이다.
이때 제1 정현파 신호의 진폭(주파수, 위상) 성분은 인코딩되지 않았으므로, 입력 비트 스트림으로부터 인코딩된 진폭(주파수, 위상) 성분의 차이 값을 추출하여 디코딩하고, 이를 제2 정현파 신호의 진폭(주파수, 위상) 성분과 합하여, 제3 정현파 신호의 진폭(주파수, 위상) 성분을 구한다.
B. 정현파 신호 인코딩 장치(100)에서 상기 제2 방식을 사용한 경우, 정현파 신호 디코딩부( 220)에서는 제1 정현파 신호와 제2 정현파 신호를 함께 이용하여 제3 정현파 신호를 디코딩한다.
즉, 제1 정현파 신호의 진폭 성분 대신 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 값이 인코딩되어 입력 비트 스트림에 포함되어 있는 경우이다.
이때 제1 정현파 신호의 진폭 성분은 인코딩되지 않았으므로, 입력 비트 스트림으로부터 인코딩된 진폭 성분의 차이 값을 추출하여 디코딩하고, 이를 제2 정현파 신호의 진폭 성분과 합하여, 제3 정현파 신호의 진폭 성분을 구한다.
반면, 제1 정현파 신호의 주파수 성분과 위상 성분에 대하여는 인코딩 장치(100)에서 제2 정현파 신호의 주파수 성분과 위상 성분을 이용하여 차이값 코딩을 수행하였다. 따라서, 입력 비트 스트림으로부터 제1 정현파 신호에 대하여 인코딩된 주파수(위상) 성분의 차이 값을 추출하여 디코딩하고, 이를 제2 정현파 신호의 주파수(위상) 성분과 합하여, 제1 정현파 신호의 주파수(위상) 성분을 구한다.
또한, 입력 비트 스트림으로부터 인코딩된 주파수(위상) 성분의 차이 값을 추출하여 디코딩하고, 이를 상기 제1 정현파 신호의 주파수(위상) 성분과 합하여, 상기 제3 정현파 신호의 주파수(위상) 성분을 구한다.
<제1 정현파 신호의 성분 지정>
제1 정현파 신호는 심리 음향 모델에 따른 마스킹 값보다 작은 신호이다. 이는 인간의 귀에 들리지 않는 신호이므로, 디코딩 장치(200)에서는 이를 디코딩하지 않을 수 있다.
한편, 인간의 귀에 들리지는 않아도 신호 자체가 존재함에 의해 음의 느낌이 달라질 수도 있다. 따라서, 제1 정현파 신호를 대체하는 특정한 신호를 지정할 수 도 있다.
우선, 제1 정현파 신호의 진폭 성분으로 심리 음향 모델에 따른 마스킹 값보다 작은 임의의 값을 지정한다.
제1 정현파 신호의 주파수 성분으로는 제2 정현파 신호의 주파수 성분 fp와 제3 정현파 신호의 주파수 성분 fn의 평균 주파수 값인 (fp+fn)/2를 지정한다.
이러한 진폭 성분과 주파수 성분의 방식에 의하면, 제3 정현파 신호의 디코딩에 영향을 미치지 않고, 제1 정현파 신호를 생성할 수 있는 장점이 있다.
본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.
비록 상기 설명이 다양한 실시예들에 적용되는 본 발명의 신규한 특징들에 초점을 맞추어 설명되었지만, 본 기술 분야에 숙달된 기술을 가진 사람은 본 발명의 범위를 벗어나지 않으면서도 상기 설명된 장치 및 방법의 형태 및 세부 사항에서 다양한 삭제, 대체, 및 변경이 가능함을 이해할 것이다. 따라서, 본 발명의 범위는 상기 설명에서보다는 첨부된 특허청구범위에 의해 정의된다. 특허청구범위의 균등 범위 안의 모든 변형은 본 발명의 범위에 포섭된다.
도 1a는 심리 음향 모델에 따른 마스킹 효과를 나타낸 도면이다.
도 1b는 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호가 정현파 트랙킹에서 어떻게 취급되는지를 나타낸 도면이다.
도 2는 심리 음향 모델에 따른 마스킹 값보다 작은 신호를 취급하는 종래의 방식을 나타낸 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 정현파 신호의 인코딩 방법을 나타낸 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 정현파 신호의 인코딩 장치의 구성을 나타낸 블록도이다.
도 5는 제2 정현파 신호만을 이용하여 제3 정현파 신호를 인코딩하는 경우를 나타낸 도면이다.
도 6은 제1 정현파 신호와 제2 정현파 신호를 이용하여 제3 정현파 신호를 인코딩하는 경우를 나타낸 도면이다.
도 7은 본 발명의 일 실시예에 따른 정현파 신호의 디코딩 장치의 구성을 나타낸 블록도이다.

Claims (22)

  1. 심리 음향 모델에 따른 마스킹 값보다 작은 제1 정현파 신호를 포함하는 오디오 신호에 대하여 정현파 트랙킹(sinusoidal tracking)을 수행하여, 상기 제1 정현파 신호가 포함된 프레임의 이전 프레임(previous frame)의 정현파 신호들 중에서 상기 제1 정현파 신호와 연결된 제2 정현파 신호와, 상기 제1 정현파 신호가 포함된 프레임의 다음 프레임(next frame)의 정현파 신호들 중에서 상기 제1 정현파 신호와 연결된 제3 정현파 신호를 결정하는 단계;
    상기 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 코드를 사용하여 상기 제1 정현파 신호를 인코딩하는 단계; 및
    상기 특정한 코드를 사용하는 방식에 따라 상기 제2 정현파 신호를 이용하거나 또는 상기 제1 정현파 신호와 상기 제2 정현파 신호를 이용하여, 상기 제3 정현파 신호와의 차이값 코딩을 수행함에 의하여, 상기 제3 정현파 신호를 인코딩하는 단계를 포함하는 것을 특징으로 하는 정현파 신호의 인코딩 방법.
  2. 제1항에 있어서, 상기 특정한 코드를 사용하여 상기 제1 정현파 신호를 인코딩하는 단계는,
    상기 제1 정현파 신호를 인코딩하기 위하여 사용되는 제어 플래그들 중 상기 인코딩되는 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 플래그를 지정하는 단계를 포함하는 것을 특징으로 하는 정현파 신호 의 인코딩 방법.
  3. 제1항에 있어서, 상기 특정한 코드를 사용하여 상기 제1 정현파 신호를 인코딩하는 단계는,
    상기 제1 정현파 신호의 진폭 성분 대신 상기 인코딩되는 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 값을 인코딩하는 단계;
    상기 제1 정현파 신호의 주파수 성분과 상기 제2 정현파 신호의 주파수 성분의 차이를 구하고 인코딩하는 단계; 및
    상기 제1 정현파 신호의 위상 성분과 상기 제2 정현파 신호의 위상 성분의 차이를 구하고 인코딩하는 단계를 포함하는 것을 특징으로 하는 정현파 신호의 인코딩 방법.
  4. 제1항에 있어서, 상기 특정한 코드를 사용하여 상기 제1 정현파 신호를 인코딩하는 단계는,
    상기 제1 정현파 신호의 주파수 성분 또는 위상 성분 대신 상기 인코딩되는 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 값을 인코딩하는 단계를 포함하는 것을 특징으로 하는 정현파 신호의 인코딩 방법.
  5. 제1항에 있어서, 상기 특정한 코드를 사용하여 상기 제1 정현파 신호를 인코딩하는 단계 전에,
    상기 제1 정현파 신호의 주파수를, 상기 제2 정현파 신호의 주파수 성분 fp와 상기 제3 정현파 신호의 주파수 성분 fn의 평균 주파수 값인 (fp+fn)/2로 변경하는 단계를 더 포함하는 것을 특징으로 하는 정현파 신호의 인코딩 방법.
  6. 제1항에 있어서, 상기 제3 정현파 신호를 인코딩하는 단계는,
    상기 제3 정현파 신호의 진폭 성분과 상기 제2 정현파 신호의 진폭 성분의 차이를 구하고 인코딩하는 단계;
    상기 제3 정현파 신호의 주파수 성분과 상기 제2 정현파 신호의 주파수 성분의 차이를 구하고 인코딩하는 단계; 및
    상기 제3 정현파 신호의 위상 성분과 상기 제2 정현파 신호의 위상 성분의 차이를 구하고 인코딩하는 단계를 포함하는 것을 특징으로 하는 정현파 신호의 인코딩 방법.
  7. 제1항에 있어서, 상기 제3 정현파 신호를 인코딩하는 단계는,
    상기 제3 정현파 신호의 진폭 성분과 상기 제2 정현파 신호의 진폭 성분의 차이를 구하고 인코딩하는 단계;
    상기 제3 정현파 신호의 주파수 성분과 상기 제1 정현파 신호의 주파수 성분의 차이를 구하고 인코딩하는 단계; 및
    상기 제3 정현파 신호의 위상 성분과 상기 제1 정현파 신호의 위상 성분의 차이를 구하고 인코딩하는 단계를 포함하는 것을 특징으로 하는 정현파 신호의 인코딩 방법.
  8. 심리 음향 모델에 따른 마스킹 값보다 작은 제1 정현파 신호를 포함하는 오디오 신호에 대하여 정현파 트랙킹(sinusoidal tracking)을 수행하여, 상기 제1 정현파 신호가 포함된 프레임의 이전 프레임(previous frame)의 정현파 신호들 중에서 상기 제1 정현파 신호와 연결된 제2 정현파 신호와, 상기 제1 정현파 신호가 포함된 프레임의 다음 프레임(next frame)의 정현파 신호들 중에서 상기 제1 정현파 신호와 연결된 제3 정현파 신호를 결정하는 정현파 트랙킹부;
    상기 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 코드를 사용하여 상기 제1 정현파 신호를 인코딩하는 제1 인코딩부; 및
    상기 제1 인코딩부에서 상기 특정한 코드를 사용하는 방식에 따라 상기 제2 정현파 신호를 이용하거나 또는 상기 제1 정현파 신호와 상기 제2 정현파 신호를 이용하여, 상기 제3 정현파 신호와의 차이값 코딩을 수행함에 의하여, 상기 제3 정현파 신호를 인코딩하는 제2 인코딩부를 포함하는 것을 특징으로 하는 정현파 신호의 인코딩 장치.
  9. 제8항에 있어서, 상기 제1 인코딩부는,
    상기 제1 정현파 신호를 인코딩하기 위하여 사용되는 제어 플래그들 중 상기 인코딩되는 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 플래그를 지정하는 것을 특징으로 하는 정현파 신호의 인코딩 장치.
  10. 제8항에 있어서, 상기 제1 인코딩부는,
    상기 제1 정현파 신호의 진폭 성분 대신 상기 인코딩되는 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 값을 인코딩하고, 상기 제1 정현파 신호의 주파수 성분과 상기 제2 정현파 신호의 주파수 성분의 차이를 구하여 인코딩하고, 상기 제1 정현파 신호의 위상 성분과 상기 제2 정현파 신호의 위상 성분의 차이를 구하여 인코딩하는 것을 특징으로 하는 정현파 신호의 인코딩 장치.
  11. 제8항에 있어서, 제1 인코딩부는,
    상기 제1 정현파 신호의 주파수 성분 또는 위상 성분 대신 상기 인코딩되는 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 값을 인코딩하는 것을 특징으로 하는 정현파 신호의 인코딩 장치.
  12. 제8항에 있어서,
    상기 제1 정현파 신호의 주파수를, 상기 제2 정현파 신호의 주파수 성분 fp와 상기 제3 정현파 신호의 주파수 성분 fn의 평균 주파수 값인 (fp+fn)/2로 변경 하여 상기 제1 인코딩부에 전달하는 주파수변경부를 더 포함하는 것을 특징으로 하는 정현파 신호의 인코딩 장치.
  13. 제8항에 있어서, 상기 제2 인코딩부는,
    상기 제3 정현파 신호의 진폭 성분과 상기 제2 정현파 신호의 진폭 성분의 차이를 구하여 인코딩하고, 상기 제3 정현파 신호의 주파수 성분과 상기 제2 정현파 신호의 주파수 성분의 차이를 구하여 인코딩하고, 상기 제3 정현파 신호의 위상 성분과 상기 제2 정현파 신호의 위상 성분의 차이를 구하여 인코딩하는 것을 특징으로 하는 정현파 신호의 인코딩 장치.
  14. 제8항에 있어서, 상기 제2 인코딩부는,
    상기 제3 정현파 신호의 진폭 성분과 상기 제2 정현파 신호의 진폭 성분의 차이를 구하여 인코딩하고, 상기 제3 정현파 신호의 주파수 성분과 상기 제1 정현파 신호의 주파수 성분의 차이를 구하여 인코딩하고, 상기 제3 정현파 신호의 위상 성분과 상기 제1 정현파 신호의 위상 성분의 차이를 구하여 인코딩하는 것을 특징으로 하는 정현파 신호의 인코딩 장치.
  15. 정현파 신호의 인코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체에 있어서,
    상기 정현파 신호의 인코딩 방법은,
    심리 음향 모델에 따른 마스킹 값보다 작은 제1 정현파 신호를 포함하는 오디오 신호에 대하여 정현파 트랙킹(sinusoidal tracking)을 수행하여, 상기 제1 정현파 신호가 포함된 프레임의 이전 프레임(previous frame)의 정현파 신호들 중에서 상기 제1 정현파 신호와 연결된 제2 정현파 신호와, 상기 제1 정현파 신호가 포함된 프레임의 다음 프레임(next frame)의 정현파 신호들 중에서 상기 제1 정현파 신호와 연결된 제3 정현파 신호를 결정하는 단계;
    상기 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 코드를 사용하여 상기 제1 정현파 신호를 인코딩하는 단계; 및
    상기 특정한 코드를 사용하는 방식에 따라 상기 제2 정현파 신호를 이용하거나 또는 상기 제1 정현파 신호와 상기 제2 정현파 신호를 이용하여, 상기 제3 정현파 신호와의 차이값 코딩을 수행함에 의하여, 상기 제3 정현파 신호를 인코딩하는 단계를 포함하는 것을 특징으로 하는 컴퓨터로 읽을 수 있는 기록 매체.
  16. 입력된 비트 스트림으로부터, 디코딩하고자 하는 제3 정현파 신호가 포함된 프레임의 이전 프레임(previous frame)의 정현파 신호들 중에서 상기 제3 정현파 신호와 연결된 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 코드를 추출하는 단계; 및
    상기 특정한 코드의 종류에 따라, 상기 제1 정현파 신호가 포함된 프레임의 이전 프레임의 정현파 신호들 중에서 상기 제1 정현파 신호와 연결된 제2 정현파 신호를 이용하거나 또는 상기 제1 정현파 신호와 상기 제2 정현파 신호를 이용하 여, 상기 제3 정현파 신호를 디코딩하는 단계를 포함하는 것을 특징으로 하는 정현파 신호의 디코딩 방법.
  17. 제16항에 있어서, 상기 특정한 코드의 종류에 따라 상기 제3 정현파 신호를 디코딩하는 단계는,
    상기 제1 정현파 신호를 인코딩할 때 사용된 제어 플래그들 중 상기 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 플래그가 지정되어 있거나, 상기 제1 정현파 신호의 주파수 성분 또는 위상 성분 대신 상기 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 값이 인코딩되어 상기 입력 비트 스트림에 포함되어 있는 경우,
    상기 입력 비트 스트림으로부터 인코딩된 진폭 성분의 차이 값을 추출하여 디코딩하고, 이를 상기 제2 정현파 신호의 진폭 성분과 합하여, 상기 제3 정현파 신호의 진폭 성분을 구하는 단계;
    상기 입력 비트 스트림으로부터 인코딩된 주파수 성분의 차이 값을 추출하여 디코딩하고, 이를 상기 제2 정현파 신호의 주파수 성분과 합하여, 상기 제3 정현파 신호의 주파수 성분을 구하는 단계; 및
    상기 입력 비트 스트림으로부터 인코딩된 위상 성분의 차이 값을 추출하여 디코딩하고, 이를 상기 제2 정현파 신호의 위상 성분과 합하여, 상기 제3 정현파 신호의 위상 성분을 구하는 단계를 포함하는 것을 특징으로 하는 정현파 신호의 디코딩 방법.
  18. 제16항에 있어서, 상기 특정한 코드의 종류에 따라 상기 제3 정현파 신호를 디코딩하는 단계는,
    상기 제1 정현파 신호의 진폭 성분 대신 상기 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 값이 인코딩되어 상기 입력 비트 스트림에 포함되어 있는 경우,
    상기 입력 비트 스트림으로부터 인코딩된 진폭 성분의 차이 값을 추출하여 디코딩하고, 이를 상기 제2 정현파 신호의 진폭 성분과 합하여, 상기 제3 정현파 신호의 진폭 성분을 구하는 단계;
    상기 입력 비트 스트림으로부터 인코딩된 주파수 성분의 차이 값을 추출하여 디코딩하고, 이를 상기 제1 정현파 신호의 주파수 성분과 합하여, 상기 제3 정현파 신호의 주파수 성분을 구하는 단계; 및
    상기 입력 비트 스트림으로부터 인코딩된 위상 성분의 차이 값을 추출하여 디코딩하고, 이를 상기 제1 정현파 신호의 위상 성분과 합하여, 상기 제3 정현파 신호의 위상 성분을 구하는 단계를 포함하는 것을 특징으로 하는 정현파 신호의 디코딩 방법.
  19. 제18항에 있어서, 상기 특정한 코드의 종류에 따라 상기 제3 정현파 신호를 디코딩하는 단계 전에,
    상기 입력 스트림으로부터 제1 정현파 신호에 대하여 인코딩된 주파수 성분 의 차이 값을 추출하여 디코딩하고, 이를 상기 제2 정현파 신호의 주파수 성분에 합하여, 상기 제1 정현파 신호의 주파수 성분을 구하는 단계; 및
    상기 입력 스트림으로부터 제1 정현파 신호에 대하여 인코딩된 위상 성분의 차이 값을 추출하여 디코딩하고, 이를 상기 제2 정현파 신호의 위상 성분에 합하여, 상기 제1 정현파 신호의 위상 성분을 구하는 단계를 더 포함하는 것을 특징으로 하는 정현파 신호의 디코딩 방법.
  20. 제16항에 있어서,
    상기 제1 정현파 신호의 진폭 성분으로 상기 심리 음향 모델에 따른 마스킹 값보다 작은 임의의 값을 지정하는 단계; 및
    상기 제1 정현파 신호의 진폭 성분으로 상기 제2 정현파 신호의 주파수 성분 fp와 상기 제3 정현파 신호의 주파수 성분 fn의 평균 주파수 값인 (fp+fn)/2를 지정하는 단계를 더 포함하는 것을 특징으로 하는 정현파 신호의 디코딩 방법.
  21. 입력된 비트 스트림으로부터, 디코딩하고자 하는 제3 정현파 신호가 포함된 프레임의 이전 프레임(previous frame)의 정현파 신호들 중에서 상기 제3 정현파 신호와 연결된 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 코드를 추출하는 코드 추출부; 및
    상기 특정한 코드의 종류에 따라, 상기 제1 정현파 신호가 포함된 프레임의 이전 프레임의 정현파 신호들 중에서 상기 제1 정현파 신호와 연결된 제2 정현파 신호를 이용하거나 또는 상기 제1 정현파 신호와 상기 제2 정현파 신호를 이용하여, 상기 제3 정현파 신호를 디코딩하는 정현파 신호 디코딩부를 포함하는 것을 특징으로 하는 정현파 신호의 디코딩 장치.
  22. 정현파 신호를 디코딩하는 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체에 있어서,
    상기 정현파 신호의 디코딩 방법은,
    입력된 비트 스트림으로부터, 디코딩하고자 하는 제3 정현파 신호가 포함된 프레임의 이전 프레임(previous frame)의 정현파 신호들 중에서 상기 제3 정현파 신호와 연결된 제1 정현파 신호가 심리 음향 모델에 따른 마스킹 값보다 작은 신호임을 나타내는 특정한 코드를 추출하는 단계; 및
    상기 특정한 코드의 종류에 따라, 상기 제1 정현파 신호가 포함된 프레임의 이전 프레임의 정현파 신호들 중에서 상기 제1 정현파 신호와 연결된 제2 정현파 신호를 이용하거나 또는 상기 제1 정현파 신호와 상기 제2 정현파 신호를 이용하여, 상기 제3 정현파 신호를 디코딩하는 단계를 포함하는 것을 특징으로 하는 컴퓨터로 읽을 수 있는 기록 매체.
KR1020070082287A 2007-08-16 2007-08-16 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를효율적으로 인코딩하는 방법 및 장치, 그리고 인코딩된오디오 신호를 디코딩하는 방법 및 장치 KR101346771B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020070082287A KR101346771B1 (ko) 2007-08-16 2007-08-16 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를효율적으로 인코딩하는 방법 및 장치, 그리고 인코딩된오디오 신호를 디코딩하는 방법 및 장치
EP08765913A EP2179588B1 (en) 2007-08-16 2008-05-27 Encoding method and apparatus for efficiently encoding sinusoidal signal whose magnitude is less than masking value according to psychoacoustic model and decoding method and apparatus for decoding encoded sinusoidal signal
AT08765913T ATE534118T1 (de) 2007-08-16 2008-05-27 Kodierungsverfahren und vorrichtung zum effizienten kodieren eines sinusförmigen signals, dessen betrag gemäss einem psychoakustischen modell kleiner als ein maskierungswert ist, und dekodierungsverfahren und vorrichtung zum dekodieren eines kodierten sinusförmigen signals
PCT/KR2008/002939 WO2009022789A1 (en) 2007-08-16 2008-05-27 Encoding method and apparatus for efficiently encoding sinusoidal signal whose magnitude is less than masking value according to psychoacoustic model and decoding method and apparatus for decoding encoded sinusoidal signal
CN2008801034031A CN101779462B (zh) 2007-08-16 2008-05-27 对根据心理声学模型幅度小于掩蔽值的正弦信号有效编码的编码方法和设备以及对编码的正弦信号解码的解码设备和方法
US12/131,446 US8165871B2 (en) 2007-08-16 2008-06-02 Encoding method and apparatus for efficiently encoding sinusoidal signal whose magnitude is less than masking value according to psychoacoustic model and decoding method and apparatus for decoding encoded sinusoidal signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070082287A KR101346771B1 (ko) 2007-08-16 2007-08-16 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를효율적으로 인코딩하는 방법 및 장치, 그리고 인코딩된오디오 신호를 디코딩하는 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20090017819A KR20090017819A (ko) 2009-02-19
KR101346771B1 true KR101346771B1 (ko) 2013-12-31

Family

ID=40350828

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070082287A KR101346771B1 (ko) 2007-08-16 2007-08-16 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를효율적으로 인코딩하는 방법 및 장치, 그리고 인코딩된오디오 신호를 디코딩하는 방법 및 장치

Country Status (6)

Country Link
US (1) US8165871B2 (ko)
EP (1) EP2179588B1 (ko)
KR (1) KR101346771B1 (ko)
CN (1) CN101779462B (ko)
AT (1) ATE534118T1 (ko)
WO (1) WO2009022789A1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060015328A1 (en) 2002-11-27 2006-01-19 Koninklijke Philips Electronics N.V. Sinusoidal audio coding
WO2006030340A2 (en) 2004-09-17 2006-03-23 Koninklijke Philips Electronics N.V. Combined audio coding minimizing perceptual distortion

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5274711A (en) * 1989-11-14 1993-12-28 Rutledge Janet C Apparatus and method for modifying a speech waveform to compensate for recruitment of loudness
US6266644B1 (en) * 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
JP2003502703A (ja) * 1999-06-18 2003-01-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 改善された符号器を有するオーディオ伝送システム
WO2002037476A1 (en) * 2000-11-03 2002-05-10 Koninklijke Philips Electronics N.V. Sinusoidal model based coding of audio signals
KR100927842B1 (ko) * 2001-04-18 2009-11-23 아이피지 일렉트로닉스 503 리미티드 오디오 신호를 인코딩하고 디코딩하는 방법, 오디오 코더, 오디오 플레이어, 그러한 오디오 코더와 그러한 오디오 플레이어를 포함하는 오디오 시스템 및 오디오 스트림을 저장하기 위한 저장 매체
JP2005506581A (ja) * 2001-10-19 2005-03-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 正弦波モデルパラメータの周波数差分符号化
EP1479071B1 (en) 2002-02-18 2006-01-11 Koninklijke Philips Electronics N.V. Parametric audio coding
RU2005120236A (ru) * 2002-11-28 2006-01-20 Конинклейке Филипс Электроникс Н.В. (Nl) Кодирование аудиосигнала
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CN101006496B (zh) * 2004-08-17 2012-03-21 皇家飞利浦电子股份有限公司 可分级音频编码
CN101053018A (zh) * 2004-11-01 2007-10-10 皇家飞利浦电子股份有限公司 包括幅度包络的参数音频编码

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060015328A1 (en) 2002-11-27 2006-01-19 Koninklijke Philips Electronics N.V. Sinusoidal audio coding
WO2006030340A2 (en) 2004-09-17 2006-03-23 Koninklijke Philips Electronics N.V. Combined audio coding minimizing perceptual distortion

Also Published As

Publication number Publication date
EP2179588A1 (en) 2010-04-28
US8165871B2 (en) 2012-04-24
US20090048826A1 (en) 2009-02-19
ATE534118T1 (de) 2011-12-15
KR20090017819A (ko) 2009-02-19
EP2179588A4 (en) 2010-11-24
CN101779462A (zh) 2010-07-14
WO2009022789A1 (en) 2009-02-19
CN101779462B (zh) 2012-05-30
EP2179588B1 (en) 2011-11-16

Similar Documents

Publication Publication Date Title
KR100348368B1 (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
DE60325314D1 (de) Kodierung und Dekodierung von mehrkanaligen Tonsignalen
US8687818B2 (en) Method for dynamically adjusting the spectral content of an audio signal
JP2009516402A (ja) 符号化/復号化方法及び装置
JP4359499B2 (ja) オーディオ信号の編集
KR101149449B1 (ko) 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
KR101131880B1 (ko) 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
JP2003523535A (ja) 複数のデータ圧縮フォーマット間でのオーディオ信号の変換方法及び装置
US8392177B2 (en) Method and apparatus for frequency encoding, and method and apparatus for frequency decoding
KR101410230B1 (ko) 종지 정현파 신호와 일반적인 연속 정현파 신호를 다른방식으로 처리하는 오디오 신호 인코딩 방법 및 장치와오디오 신호 디코딩 방법 및 장치
KR101346771B1 (ko) 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를효율적으로 인코딩하는 방법 및 장치, 그리고 인코딩된오디오 신호를 디코딩하는 방법 및 장치
KR101149448B1 (ko) 오디오 부호화 및 복호화 장치와 그 방법
KR101080421B1 (ko) 정현파 오디오 코딩 방법 및 장치
CN113192517A (zh) 一种音频编解码方法和音频编解码设备
US8160869B2 (en) Method and apparatus for encoding continuation sinusoid signal information of audio signal and method and apparatus for decoding same
KR101317269B1 (ko) 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치
KR20080072223A (ko) 파라메트릭 부/복호화 방법 및 이를 위한 장치
KR20090008611A (ko) 오디오 신호의 인코딩 방법 및 장치
CN111179955B (zh) 包括编码hoa表示的位流的解码方法和装置、以及介质
JP2005122034A (ja) オーディオデータ圧縮方法
KR101425354B1 (ko) 오디오 신호의 연속 정현파 신호를 인코딩하는 방법 및장치와 디코딩 방법 및 장치
JPS58128000A (ja) 音声パラメ−タ符号化方式
JPH11220402A (ja) 情報符号化装置および方法、並びに提供媒体

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161129

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20171129

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee