KR20080086762A - 오디오 신호의 인코딩 방법 및 장치 - Google Patents

오디오 신호의 인코딩 방법 및 장치 Download PDF

Info

Publication number
KR20080086762A
KR20080086762A KR1020070028869A KR20070028869A KR20080086762A KR 20080086762 A KR20080086762 A KR 20080086762A KR 1020070028869 A KR1020070028869 A KR 1020070028869A KR 20070028869 A KR20070028869 A KR 20070028869A KR 20080086762 A KR20080086762 A KR 20080086762A
Authority
KR
South Korea
Prior art keywords
harmonic
frequency band
coding
frequency
signals
Prior art date
Application number
KR1020070028869A
Other languages
English (en)
Inventor
이남숙
이건형
오재원
이철우
정종훈
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070028869A priority Critical patent/KR20080086762A/ko
Publication of KR20080086762A publication Critical patent/KR20080086762A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

입력 오디오 신호를 복수의 주파수 대역으로 분리하고 각각의 주파수 대역마다 서로 다른 코딩 방식을 적용하는 오디오 신호 인코딩 방법 및 장치가 개시된다. 본 발명에 따른 오디오 신호의 인코딩 방법은, 입력 오디오 신호를 두 개 이상의 주파수 대역으로 나누는 단계, 저주파 대역에 대하여, 정현파 신호들의 주파수, 진폭 및 위상 성분을 코딩하는 정현파 성분 코딩(Sinusoid Coding)을 수행하는 단계, 고주파 대역에 대하여, 하모닉 신호들의 진폭 성분들을 코딩하는 하모닉 성분 코딩(Harmonic Coding)을 수행하는 단계, 및 주파수 대역들에 대하여 코딩된 값들을 결합하여 비트 스트림을 생성하는 단계를 포함한다. 오디오 신호를 복수 개의 주파수 대역으로 분리하고 각각의 주파수 대역별로 서로 다른 코딩 방식을 적용함에 의하여, 오디오 신호의 음질을 높이면서도 코딩 후의 데이터의 크기가 상당량 줄어드는 효율적인 신호의 인코딩이 가능하다.

Description

오디오 신호의 인코딩 방법 및 장치{Method and apparatus for encoding audio signal}
도 1은 본 발명의 일 실시예에 따른 오디오 신호 인코딩 장치를 나타낸 블록도이다.
도 2는 본 발명의 일 실시예에 따른 오디오 신호 인코딩 방법을 나타낸 흐름도이다.
도 3은 본 발명의 일 실시예에 따라서 입력 오디오 신호를 세 개의 주파수 대역으로 나눈 경우를 나타낸 도면이다.
도 4는 본 발명의 일 실시예에 따라서 고주파 대역에 대한 하모닉 성분 코딩을 수행하는 방법을 나타낸 흐름도이다.
도 5는 본 발명의 일 실시예에 따라서 하모닉 신호들의 주파수를 이동하는 방법을 나타낸 도면이다.
도 6은 본 발명의 일 실시예에 따라서 하모닉 신호들을 시간 영역에서의 신호로 간주하는 방법을 나타낸 흐름도이다.
도 7은 본 발명의 일 실시예에 따라서 하모닉 신호들을 시간 영역에서의 신호로 간주하는 예를 나타낸 도면이다.
<도면의 주요 부분에 관한 부호의 설명>
100: 오디오 신호 인코딩 장치
10: 입력 오디오 신호
12: 저주파 대역 신호
14: 중간 주파수 대역 신호
16: 고주파 대역 신호
18. 20, 22: 각각의 주파수 대역들에 대하여 코딩된 값들
24: 비트 스트림
50~56: 정현파 신호들
60: 기본 주파수 신호
61~70: 하모닉 신호들
71~79: 변환 하모닉 신호들
81: delta 값
ω: 기본 주파수(fundamental frequency)
본 발명은 오디오 신호의 인코딩에 관한 것으로서, 특히 입력 오디오 신호를 복수의 주파수 대역으로 분리하고 각각의 주파수 대역마다 서로 다른 코딩 방식을 적용하는 오디오 신호 인코딩 방법 및 장치에 관한 것이다.
오디오 신호를 인코딩하는 방식 중에 파라메트릭 코딩(parametric coding) 방식이 있다. 파라메트릭 코딩 방식에서는 입력 오디오 신호 중에서 하모닉 신호들을 추출하여 먼저 코딩하고(하모닉 성분 코딩, Harmonic coding), 하모닉 신호가 아닌 정현파 신호들을 코딩한다(정현파 성분 코딩, Sinusoid Coding).
그런데 종래 기술에서는 모든 주파수 대역에 대하여 하모닉 성분 코딩과 정현파 성분 코딩을 모두 적용한다. 본 발명에서는 종래 기술보다 더 효율적으로 오디오 신호를 코딩하는 방식을 제안한다.
본 발명이 이루고자 하는 기술적 과제는 주파수 대역별로 서로 다른 코딩 방식을 적용하여 효율적으로 코딩할 수 있는 오디오 신호의 인코딩 방법 및 장치를 제공하는 것이다.
본 발명이 이루고자 하는 다른 기술적 과제는 상기 오디오 신호의 인코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 것이다.
상기 기술적 과제를 이루기 위한 오디오 신호의 인코딩 방법은, 입력 오디오 신호를 두 개 이상의 주파수 대역으로 나누는 단계; 상기 주파수 대역 중 저주파 대역에 대하여, 상기 저주파 대역에 포함된 정현파 신호들의 주파수, 진폭 및 위상 성분을 코딩하는 정현파 성분 코딩(Sinusoid Coding)을 수행하는 단계; 상기 주파수 대역 중 고주파 대역에 대하여, 상기 고주파 대역에 포함된 하모닉 신호들의 진폭 성분들을 코딩하는 하모닉 성분 코딩(Harmonic Coding)을 수행하는 단계; 및 상 기 주파수 대역들에 대하여 코딩된 값들을 결합하여 비트 스트림을 생성하는 단계를 포함하는 것이 바람직하다.
일 실시예에 있어서, 상기 고주파 대역에 대하여 하모닉 성분 코딩을 수행하는 단계는, 상기 하모닉 신호들의 주파수 중에서 가장 낮은 주파수와 기본 주파수(fundamental frequency)의 주파수 차이값을 구하는 단계; 상기 하모닉 신호들의 주파수를 상기 주파수 차이값만큼 주파수가 낮은 쪽으로 이동한 변환 하모닉 신호들을 생성하는 단계; 상기 변환 하모닉 신호들에 대하여 하모닉 합성을 수행하는 단계; 및 상기 하모닉 신호들의 진폭 성분에 대한 선형 예측 계수(Linear Prediction Coefficient: LPC) 값들을 구하는 단계를 포함하는 것이 바람직하다.
다른 일 실시예에 있어서, 상기 고주파 대역에 대하여 하모닉 성분 코딩을 수행하는 단계는, 상기 하모닉 신호들에 대하여 하모닉 분석을 수행하여 상기 하모닉 신호들의 진폭 성분들을 구하는 단계; 상기 하모닉 신호들을 주파수가 작은 순서대로 번호를 매기는 단계; 및 상기 매겨진 번호를 시간 영역에서의 프레임 번호로 간주하여 상기 하모닉 신호들의 진폭 성분들에 대하여 시간-주파수 변환을 수행하는 단계를 포함하는 것이 바람직하다.
상기 기술적 과제를 이루기 위한 오디오 신호의 인코딩 장치는, 입력 오디오 신호를 두 개 이상의 주파수 대역으로 나누는 대역 분리부; 상기 주파수 대역 중 저주파 대역에 대하여, 상기 저주파 대역에 포함된 정현파 신호들의 주파수, 진폭 및 위상 성분을 코딩하는 정현파 성분 코딩(Sinusoid Coding)을 수행하는 저주파 대역 신호 코딩부; 상기 주파수 대역 중 고주파 대역에 대하여, 상기 고주파 대역 에 포함된 하모닉 신호들의 진폭 성분들을 코딩하는 하모닉 성분 코딩(Harmonic Coding)을 수행하는 고주파 대역 신호 코딩부; 및 상기 주파수 대역들에 대하여 코딩된 값들을 결합하여 비트 스트림을 생성하는 비트 스트림 생성부를 포함하는 것이 바람직하다.
이하 첨부된 도면들을 참조하여 본 발명에 따른 오디오 신호의 인코딩 방법 및 장치에 대하여 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따른 오디오 신호 인코딩 장치를 나타낸 블록도이고, 도 2는 본 발명의 일 실시예에 따른 오디오 신호 인코딩 방법을 나타낸 흐름도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 오디오 신호 인코딩 장치(100)는 대역 분리부(110), 저주파 대역 신호 코딩부(120), 중간 주파수 대역 신호 코딩부(130), 고주파 대역 신호 코딩부(140) 및 비트 스트림 생성부(150)를 포함하는 것이 바람직하다.
대역 분리부(110)는 입력 오디오 신호(10)를 두 개 이상의 주파수 대역으로 분리한다(S100). 분리된 주파수 대역 중 주파수가 가장 낮은 쪽을 저주파 대역(12)이라 하고, 가장 주파수가 높은 쪽을 고주파 대역(16)이라고 한다. 저주파 대역과 고주파 대역을 제외한 나머지 주파수 대역을 중간 주파수 대역(14)이라고 한다.
본 발명의 일 실시예에 있어서, 중간 주파수 대역(14)의 대역폭(bandwidth)이 0이 될 수 있다. 이러한 경우, 대역 분리부(110)는 입력 오디오 신호(10)를 저주파 대역(12)과 고주파 대역(16)의 2개의 주파수 대역만으로 나누며, 중간 주파수 대역 신호 코딩부(130)는 생략될 수 있다.
본 발명은 입력 오디오 신호를 복수의 주파수 대역으로 나눈 후에, 각각의 주파수 대역별로 서로 다른 코딩 방식을 적용한다. 특히, 저주파 대역에 대하여는 정현파 성분 코딩(Sinusoid Coding)을 수행하고, 고주파 대역에 대하여는 하모닉 성분 코딩(Harmonic Coding)을 수행한다. 즉, 저주파 대역 신호 코딩부(120)는 저주파 대역에 포함된 정현파 신호들의 주파수, 진폭 및 위상 성분을 코딩하는 정현파 성분 코딩을 수행하고(S110), 고주파 대역 신호 코딩부(140)는 고주파 대역에 포함된 하모닉 신호들의 진폭 성분들을 코딩하는 하모닉 성분 코딩을 수행한다(S120).
저주파 대역에서 정현파 신호들의 주파수, 진폭 및 위상 성분을 모두 코딩하는 것은 사람의 귀가 저주파에 민감하기 때문이다.
고주파 대역에서는 하모닉 성분들의 위상 성분을 제외하여 인코딩 효율을 높일 수 있다.
대역폭이 0이 아닌 중간 주파수 대역을 출력하는 경우에 중간 주파수 대역 신호 코딩부(130)는 중간 주파수 대역에 대하여 정현파 성분 코딩과 하모닉 성분 코딩을 모두 수행할 수 있다(S130). 이때 중간 주파수 대역의 정현파 성분에 대하여는 위상 성분을 제외하고 주파수 및 진폭 성분만을 코딩하여 인코딩 효율을 높일 수 있다.
각각의 주파수 대역에 대하여 상기와 같은 코딩 방식을 적용하는 이유는 도 3을 참조하여 설명하기로 한다.
일 실시예에 있어서, 본 발명에 따른 오디오 신호 인코딩 장치(100)는 저주파 대역 신호 코딩부(120), 중간 주파수 대역 신호 코딩부(130), 고주파 대역 신호 코딩부(140) 대신 하나의 신호 코딩부만을 포함할 수 있다.
또한, 상기 대역별 신호의 코딩(S110, S120, S130)은 동시에 수행될 수도 있고, 순차적으로 수행될 수도 있다. 예를 들어, 도 1에 도시된 바와 같이 각각의 주파수 대역에 대한 신호 코딩부(120, 130, 140)가 분리된 구성을 가지는 경우, 각각의 대역별 신호의 코딩은 동시에 수행될 수 있을 것이다. 하나의 신호 코딩부만을 포함하는 구성에 있어서는, 각각의 대역별 신호의 코딩은 순차적으로 수행될 수 있을 것이다.
비트 스트림 생성부(150)는 각각의 주파수 대역들에 대하여 코딩된 값들(18, 20, 22)을 결합하여 비트 스트림(24)을 생성한다(S140).
도 3은 본 발명의 일 실시예에 따라서 입력 오디오 신호를 세 개의 주파수 대역으로 나눈 경우를 나타낸 도면이다.
도 3을 참조하면, 오디오 신호는 다수의 정현파 신호들을 포함하고 있다. 이러한 정현파 신호들 중에는, 일정한 주파수의 배수가 되는 주파수를 가지는 신호들이 포함된다. 이러한 신호들을 하모닉 신호라고 하며, 하모닉 신호들의 주파수들의 최대 공약수인 주파수를 기본 주파수(fundamental frequency)라고 한다. 따라서, 하모닉 신호의 주파수는 기본 주파수의 배수가 된다. 도 3의 예에서 기본 주파수를 가지는 신호는 참조 번호 60으로 나타낸 신호이며, 하모닉 신호들은 참조 번호 61 내지 70으로 나타낸 신호들이다.
반면, 하모닉 신호가 아닌 정현파 신호들(도 3의 예에서 50 내지 56)도 포함된다. 이하에서는 하모닉 신호가 아닌 일반적인 정현파 신호들만을 "정현파 신호"로 부르기로 한다.
도 3을 참조하면, 오디오 신호에서는, 주파수가 낮을수록 일반적인 정현파 신호가 많이 포함되어 있으며, 주파수가 높을수록 하모닉 신호가 많이 포함되어 있다.
본 발명에 따른 대역 분리부(110)는 기본 주파수 신호가 아닌 하모닉 신호의 크기가 충분히 커지는 영역부터 중간 주파수 대역으로 분리한다. 도 3의 예에서는 하모닉 신호 61까지를 저주파 대역으로 분리하고, 그보다 주파수가 높은 정현파 신호 52부터를 중간 주파수 대역으로 분리한다.
하모닉 신호의 크기가 충분히 커지는 영역이란, 이러한 하모닉 신호를 코딩에서 제외하는 경우 재생시 출력되는 오디오의 음질에 상당한 영향을 미치는 정도를 의미한다.
또한, 일반적인 정현파 신호가 충분히 작아져서 포함되지 않고 하모닉 신호만이 포함되는 영역을 고주파 대역으로 분리한다. 도 3의 예에서는 하모닉 신호 66부터가 고주파 대역으로 분리된다.
일반적인 정현파 신호가 충분히 작아져서 포함되지 않는 영역이란, 이러한 정현파 신호를 코딩에서 제외하더라도 재생시 출력되는 오디오의 음질에 영향을 미치지 않는 정도를 의미한다.
만일, 하모닉 신호의 크기가 충분히 커지는 주파수(저주파 대역과 중간 주파 수 대역의 경계)가 정현파 신호의 크기가 충분히 작아지는 주파수(중간 주파수 대역과 고주파 대역의 경계)와 일치하게 되면, 중간 주파수 대역의 대역폭은 0이 된다.
살펴본 바와 같이, 종래 기술에 있어서는 주파수 대역을 구별하지 않고 정현파 성분 코딩과 하모닉 성분 코딩을 모두 적용하므로 코딩 후의 데이터의 크기가 매우 크다. 그러나, 본원 발명에 따른 오디오 신호 인코딩 방식에 의하면, 하모닉 신호가 적게 포함되는 영역(저주파 대역)에서는 정현파 성분 코딩만을 수행하고, 일반적인 정현파 신호가 적게 포함되는 영역(고주파 대역)에서는 하모닉 성분 코딩만을 수행하므로, 오디오 신호의 음질을 높이면서도 코딩 후의 데이터의 크기가 상당량 줄어든다. 즉, 효율적인 신호의 인코딩이 가능하게 된다.
도 4는 본 발명의 일 실시예에 따라서 고주파 대역에 대한 하모닉 성분 코딩을 수행하는 방법을 나타낸 흐름도이다.
중간 주파수 대역에 대하여도 하모닉 성분 코딩을 수행하는 경우에는, 중간 주파수 대역과 고주파 대역을 하나의 고주파 대역으로 간주하고 이러한 방법을 수행할 수 있다.
먼저, 고주파 대역에 포함된 하모닉 성분들에 대하여 하모닉 파라미터를 구한다(S200). 하모닉 파라미터란 하모닉 성분의 주파수, 진폭 및 위상 성분을 의미한다.
그 다음에는 고주파 대역에 포함된 하모닉 신호들의 주파수 중에서 가장 낮은 주파수와 기본 주파수의 주파수 차이값인 delta 값을 구한다(S210). 도 3의 경 우, 중간 주파수 대역과 고주파 대역에 포함된 하모닉 신호들의 주파수 중에서 가장 주파수가 낮은 하모닉 신호 62와 기본 주파수 신호 60과의 주파수 차이가 delta 값이 된다.
주파수 차이값인 delta 값을 구한 후에는 고주파 대역에 포함된 하모닉 신호들의 주파수를 delta 값만큼 주파수가 낮은 쪽으로 이동한다(S220). 이렇게 주파수가 줄어든 하모닉 신호를 이하에서는 변환 하모닉 신호라고 부르기로 한다.
변환 하모닉 신호들에 대하여 하모닉 합성을 수행하고(S230), 하모닉 신호들의 진폭 성분에 대한 선형 예측 계수(Linear Prediction Coefficient: LPC) 값들을 구하여 하모닉 엔벨로프를 구한다(S240).
다음으로 LPC 값들을 LSF(Line Spectrum Frequencies)나 LSP(Line Spectrum Pairs) 또는 LAR(Log Area Ratio) 등으로 전환하고(S250), 전환된 계수들을 전송한다.
이때 LPC 값들을 LSF나 LSP 또는 LAR로 전환하는 단계(S250)는 생략될 수 있다.
도 5는 본 발명의 일 실시예에 따라서 하모닉 신호들의 주파수를 이동하는 방법을 나타낸 도면이다. 도 5의 윗부분에는 도 3에 도시된 신호들 중에서 하모닉 신호들만을 선택하여 도시하고 있다. 도 5의 예에서는 중간 주파수 대역에 대하여도 하모닉 성분 코딩을 수행하는 예를 나타내고 있다. 따라서, 언급한 바와 같이, 중간 주파수 대역과 고주파 대역을 하나의 대역으로 간주하고 상기 설명된 방법을 수행하게 된다.
도 5에서, 중간 주파수 대역과 고주파 대역에 포함된 하모닉 신호들의 주파수 중에서 가장 주파수가 낮은 신호는 하모닉 신호 62이다. 따라서, 기본 주파수 신호 60과 하모닉 신호 62의 주파수 차이(81)가 delta 값이 된다.
도 5의 아래 부분에는 중간 주파수 대역과 고주파 대역에 포함된 하모닉 신호들(62 내지 70)을 delta 값만큼 저주파 영역 쪽으로 이동한 모습을 도시하고 있다. 이때 이동 후의 하모닉 신호들(71 내지 79)이 변환 하모닉 신호들이 된다.
도 5의 아래 부분에 도시된 변환 하모닉 신호들을 살펴보면, 이는 하모닉 신호 71을 기본 주파수 신호로 하는 하모닉 신호들과 동일한 형태를 가진다. 따라서, 일반적인 하모닉 신호 코딩을 적용하여 LPC 계수 값들을 생성할 수 있게 된다.
일 실시예에 있어서는, 하모닉 엔벨로프를 구함에 있어서 LPC를 구하는 방법 대신 하모닉 신호들을 시간 영역에서의 신호로 간주하여 시간-주파수 변환을 적용할 수도 있다.
도 6은 본 발명의 일 실시예에 따라서 하모닉 신호들을 시간 영역에서의 신호로 간주하는 방법을 나타낸 흐름도이고, 도 7은 본 발명의 일 실시예에 따라서 하모닉 신호들을 시간 영역에서의 신호로 간주하는 예를 나타낸 도면이다.
먼저, 하모닉 분석을 수행하여 하모닉 신호들의 주파수, 진폭 및 위상 성분들들 구한다(S300). 그리고, 도 4에서 설명된 바와 같이 주파수 이동을 수행한다.
도 7의 윗부분에 하모닉 신호들의 주파수 및 진폭 성분이 도시되고 있다. 도 7은 주파수 이동이 수행된 후 기본 주파수 ω가 300Hz인 변환 하모닉 신호들을 나타내고 있다.
하모닉 신호들을 시간 영역에서의 신호로 간주하여 코딩하기 위하여는, 먼저 하모닉 신호들을 주파수가 작은 순서대로 번호를 매긴다(S310). 그리고, 매겨진 번호를 프레임 번호로 간주하여 시간-주파수 변환을 수행한다(S320). 도 7의 아래 부분에는 이와 같이 프레임 번호가 매겨진 하모닉 신호들을 나타내고 있다.
시간 주파수 변환의 예로는 DCT(Discrete Cosine Transform), MDCT(Modified Discrete Cosine Transform), FFT(Fast Fourier Transform) 변환 등이 사용될 수 있다.
코딩 효율을 높이기 위하여 주파수가 낮은 것부터 m개를 선택하여 코딩한다(S330). 이러한 m개의 신호의 선택은 다음과 같이 수행된다.
시간-주파수 변환된 결과는 주파수 영역에서의 신호로 나타나는데, 이때 어느 정도의 주파수 영역을 벗어나면 그 신호의 크기가 현저히 감소하게 된다. 상기 m개의 신호들은 이와 같이 신호가 현저히 감소하기 전의 영역의 신호들을 선택한다.
이와 같이 m개의 신호를 벗어나 그 크기가 현저히 감소된 신호를 제거하여도, 재생된 오디오의 음질은 그다지 나빠지지 않는 반면, 코딩 후의 데이터의 크기는 현저히 감소하므로 코딩 효율이 좋아지게 된다.
본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.
비록 상기 설명이 다양한 실시예들에 적용되는 본 발명의 신규한 특징들에 초점을 맞추어 설명되었지만, 본 기술 분야에 숙달된 기술을 가진 사람은 본 발명의 범위를 벗어나지 않으면서도 상기 설명된 장치 및 방법의 형태 및 세부 사항에서 다양한 삭제, 대체, 및 변경이 가능함을 이해할 것이다. 따라서, 본 발명의 범위는 상기 설명에서보다는 첨부된 특허청구범위에 의해 정의된다. 특허청구범위의 균등 범위 안의 모든 변형은 본 발명의 범위에 포섭된다.
본 발명에 따른 오디오 신호의 인코딩 방법 및 장치에 의하면, 오디오 신호를 복수 개의 주파수 대역으로 분리하고 각각의 주파수 대역별로 서로 다른 코딩 방식을 적용함에 의하여, 하모닉 신호가 적게 포함되는 영역(저주파 대역)에서는 정현파 성분 코딩만을 수행하고, 일반적인 정현파 신호가 적게 포함되는 영역(고주파 대역)에서는 하모닉 성분 코딩만을 수행하므로, 오디오 신호의 음질을 높이면서도 코딩 후의 데이터의 크기가 상당량 줄어드는 효율적인 신호의 인코딩이 가능한 효과가 있다.

Claims (5)

  1. 입력 오디오 신호를 두 개 이상의 주파수 대역으로 나누는 단계;
    상기 주파수 대역 중 저주파 대역에 대하여, 상기 저주파 대역에 포함된 정현파 신호들의 주파수, 진폭 및 위상 성분을 코딩하는 정현파 성분 코딩(Sinusoid Coding)을 수행하는 단계;
    상기 주파수 대역 중 고주파 대역에 대하여, 상기 고주파 대역에 포함된 하모닉 신호들의 진폭 성분들을 코딩하는 하모닉 성분 코딩(Harmonic Coding)을 수행하는 단계; 및
    상기 주파수 대역들에 대하여 코딩된 값들을 결합하여 비트 스트림을 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 인코딩 방법.
  2. 제1항에 있어서, 상기 고주파 대역에 대하여 하모닉 성분 코딩을 수행하는 단계는,
    상기 하모닉 신호들의 주파수 중에서 가장 낮은 주파수와 기본 주파수(fundamental frequency)의 주파수 차이값을 구하는 단계;
    상기 하모닉 신호들의 주파수를 상기 주파수 차이값만큼 주파수가 낮은 쪽으로 이동한 변환 하모닉 신호들을 생성하는 단계;
    상기 변환 하모닉 신호들에 대하여 하모닉 합성을 수행하는 단계; 및
    상기 하모닉 신호들의 진폭 성분에 대한 선형 예측 계수(Linear Prediction Coefficient: LPC) 값들을 구하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 인코딩 방법.
  3. 제1항에 있어서, 상기 고주파 대역에 대하여 하모닉 성분 코딩을 수행하는 단계는,
    상기 하모닉 신호들에 대하여 하모닉 분석을 수행하여 상기 하모닉 신호들의 진폭 성분들을 구하는 단계;
    상기 하모닉 신호들을 주파수가 작은 순서대로 번호를 매기는 단계; 및
    상기 매겨진 번호를 시간 영역에서의 프레임 번호로 간주하여 상기 하모닉 신호들의 진폭 성분들에 대하여 시간-주파수 변환을 수행하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 인코딩 방법.
  4. 입력 오디오 신호를 두 개 이상의 주파수 대역으로 나누는 대역 분리부;
    상기 주파수 대역 중 저주파 대역에 대하여, 상기 저주파 대역에 포함된 정현파 신호들의 주파수, 진폭 및 위상 성분을 코딩하는 정현파 성분 코딩(Sinusoid Coding)을 수행하는 저주파 대역 신호 코딩부;
    상기 주파수 대역 중 고주파 대역에 대하여, 상기 고주파 대역에 포함된 하모닉 신호들의 진폭 성분들을 코딩하는 하모닉 성분 코딩(Harmonic Coding)을 수행하는 고주파 대역 신호 코딩부; 및
    상기 주파수 대역들에 대하여 코딩된 값들을 결합하여 비트 스트림을 생성하 는 비트 스트림 생성부를 포함하는 것을 특징으로 하는 오디오 신호의 인코딩 장치.
  5. 입력 오디오 신호를 두 개 이상의 주파수 대역으로 나누는 단계;
    상기 주파수 대역 중 저주파 대역에 대하여, 상기 저주파 대역에 포함된 정현파 신호들의 주파수, 진폭 및 위상 성분을 코딩하는 정현파 성분 코딩(Sinusoid Coding)을 수행하는 단계;
    상기 주파수 대역 중 고주파 대역에 대하여, 상기 고주파 대역에 포함된 하모닉 신호들의 진폭 성분들을 코딩하는 하모닉 성분 코딩(Harmonic Coding)을 수행하는 단계; 및
    상기 주파수 대역들에 대하여 코딩된 값들을 결합하여 비트 스트림을 생성하는 단계를 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
KR1020070028869A 2007-03-23 2007-03-23 오디오 신호의 인코딩 방법 및 장치 KR20080086762A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070028869A KR20080086762A (ko) 2007-03-23 2007-03-23 오디오 신호의 인코딩 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070028869A KR20080086762A (ko) 2007-03-23 2007-03-23 오디오 신호의 인코딩 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20080086762A true KR20080086762A (ko) 2008-09-26

Family

ID=40025916

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070028869A KR20080086762A (ko) 2007-03-23 2007-03-23 오디오 신호의 인코딩 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20080086762A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010093224A3 (ko) * 2009-02-16 2010-11-18 한국전자통신연구원 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치
KR20180131518A (ko) * 2009-05-19 2018-12-10 한국전자통신연구원 계층형 정현파 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010093224A3 (ko) * 2009-02-16 2010-11-18 한국전자통신연구원 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치
CN102396024A (zh) * 2009-02-16 2012-03-28 韩国电子通信研究院 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备
US8805694B2 (en) 2009-02-16 2014-08-12 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding
US9251799B2 (en) 2009-02-16 2016-02-02 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding
KR20180131518A (ko) * 2009-05-19 2018-12-10 한국전자통신연구원 계층형 정현파 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치

Similar Documents

Publication Publication Date Title
RU2682340C1 (ru) Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
US8793123B2 (en) Apparatus and method for converting an audio signal into a parameterized representation using band pass filters, apparatus and method for modifying a parameterized representation using band pass filter, apparatus and method for synthesizing a parameterized of an audio signal using band pass filters
KR100427753B1 (ko) 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치
CN103733258B (zh) 编码装置和方法、解码装置和方法
CN103765509B (zh) 编码装置及方法、解码装置及方法
US20080120117A1 (en) Method, medium, and apparatus with bandwidth extension encoding and/or decoding
EP3525208B1 (en) Encoding method, encoder, program and recording medium
CN101568959B (zh) 用带宽扩展进行编码和/或解码的方法
JP2010079275A (ja) 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
JP2004046179A (ja) 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置
KR20090083068A (ko) 오디오 신호의 부호화, 복호화 방법 및 장치
JP2005274708A (ja) 信号処理装置および信号処理方法、プログラム、並びに記録媒体
JP3804902B2 (ja) 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置
KR101149449B1 (ko) 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
KR101131880B1 (ko) 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
KR20080082142A (ko) 노이즈 신호 부호화 및 복호화 장치 및 방법
WO2011004744A1 (ja) 音響信号処理装置、その処理方法およびプログラム
US20090070120A1 (en) Audio regeneration method
JP3576942B2 (ja) 周波数補間システム、周波数補間装置、周波数補間方法及び記録媒体
EP2595147A1 (en) Audio data encoding method and device
JP6334564B2 (ja) 低複雑度の調性適応音声信号量子化
KR20080086762A (ko) 오디오 신호의 인코딩 방법 및 장치
JP4888048B2 (ja) オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム
US20160035365A1 (en) Sound encoding device, sound encoding method, sound decoding device and sound decoding method
JP2008298942A (ja) デジタル音声処理装置及びデジタル音声処理プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application