KR20080026481A - 오디오 신호 보간 방법 및 오디오 신호 보간 장치 - Google Patents

오디오 신호 보간 방법 및 오디오 신호 보간 장치 Download PDF

Info

Publication number
KR20080026481A
KR20080026481A KR1020070082830A KR20070082830A KR20080026481A KR 20080026481 A KR20080026481 A KR 20080026481A KR 1020070082830 A KR1020070082830 A KR 1020070082830A KR 20070082830 A KR20070082830 A KR 20070082830A KR 20080026481 A KR20080026481 A KR 20080026481A
Authority
KR
South Korea
Prior art keywords
spectral
spectrum
frequency
variation
interpolation
Prior art date
Application number
KR1020070082830A
Other languages
English (en)
Other versions
KR100912587B1 (ko
Inventor
마사끼요 다나까
마사나오 스즈끼
미유끼 시라까와
다까시 마끼우찌
Original Assignee
후지쯔 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지쯔 가부시끼가이샤 filed Critical 후지쯔 가부시끼가이샤
Publication of KR20080026481A publication Critical patent/KR20080026481A/ko
Application granted granted Critical
Publication of KR100912587B1 publication Critical patent/KR100912587B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)

Abstract

본 발명은, 보간할 주파수 대역을 정확하게 특정하여 불필요한 보간을 행하지 않아, 음질 열화를 방지할 수 있는 오디오 신호 보간 방법 및 오디오 신호 보간 장치를 제공하는 것을 목적으로 한다. 입력되는 오디오 신호의 현 프레임의 주파수 스펙트럼과 스펙트럼 저장 수단에 저장되어 있는 과거의 프레임의 주파수 스펙트럼의 각 스펙트럼 성분의 변동인 스펙트럼 변동을 구하고, 주파수 스펙트럼과 상기 스펙트럼 변동을 이용하여 피보간 대역을 결정하고, 현 프레임의 주파수 스펙트럼 또는 과거의 프레임의 주파수 스펙트럼을 이용하여 현 프레임의 피보간 대역의 스펙트럼 성분의 보간을 행한다.
Figure P1020070082830
스펙트럼 성분, 주파수 스펙트럼, 오디오 신호, 씨닝, 피보간 대역

Description

오디오 신호 보간 방법 및 오디오 신호 보간 장치{AUDIO SIGNAL INTERPOLATION METHOD AND DEVICE}
본 발명은, 오디오 신호 보간 방법 및 오디오 신호 보간 장치에 관한 것으로, 특히, 일부의 스펙트럼 성분이 씨닝된 오디오 신호에 대하여, 씨닝된 스펙트럼 성분을 보간함으로써 음질을 개선하는 오디오 신호 보간 방법 및 오디오 신호 보간 장치에 관한 것이다.
최근, 인터넷을 통한 음악 배신 서비스가 급속히 보급되고 있다. 이들, 음악 배신 서비스에서는, 악곡을 AAC(Advanced Audio Coding)나, MP3(MPEG1 Audio Layer 3) 등과 같은 오디오 부호화 기술에 의해 압축되어 배신되는 것이 일반적이다.
전술한 AAC나 MP3에서는, 인간의 주관에 기초하여, 청각적으로 중요하지 않은 스펙트럼 성분을 씨닝함으로써, 정보를 압축하는 것을 특징으로 한다. 도 1의 (a)에 부호화 전의 주파수 스펙트럼을 도시하고, 도 1의 (b)에 부호화 후의 주파수 스펙트럼을 도시한다. 도 1의 (b)의 파선으로 둘러싼 스펙트럼 성분을 씨닝하고 있다.
또한, 본 명세서에서는 도 1에 도시한 바와 같이 오디오 신호를 주파수마다의 진폭 레벨로 나타낸 전체를 주파수 스펙트럼이라고 부르고, 각 주파수의 진폭 레벨을 스펙트럼 성분이라고 부른다.
이 스펙트럼 성분의 씨닝은, 악곡 데이터를 복수 샘플마다 통합한 프레임 단위로 행해지고, 어느 스펙트럼 성분이 씨닝될지는 프레임마다 독립하여 결정된다. 즉, 도 2의 (a)에 도시하는 시각 t의 프레임에서는 씨닝되지 않았던 스펙트럼 성분이, 도 2의 (b)에 도시하는 시각 (t+1)의 프레임에서는 파선으로 둘러싼 스펙트럼 성분이 씨닝된다고 하는 현상이 생겨서, 스펙트럼 성분이 격하게 변동하는 경우가 있다.
인간의 청각은 스펙트럼 성분의 변동에 민감하기 때문에, 이러한 스펙트럼 성분의 변동은 청각적인 위화감을 낳아, 음질이 열화하는 원인으로 된다. 이러한 스펙트럼 성분의 씨닝에 의한 음질 열화를 방지하기 위해서, 씨닝된 스펙트럼 성분을 적절히 보간하는 기술이 요구되고 있다.
씨닝된 스펙트럼 성분을 보간하는 기술로서, 예를 들면 특허 문헌1에 기재된 기술이 있다. 이 기술에서는, 첫째, 스펙트럼 성분이 존재하지 않는 대역을 피보간 대역으로서 특정한다. 둘째, 특정한 피보간 대역을 과거 혹은 미래의 프레임에서의 피보간 대역과 동일한 대역, 혹은 피보간 대역의 저역측에 인접하는 대역의 스펙트럼 성분을 이용하여 보간한다. 도 3의 (a)에 보간 전의 주파수 스펙트럼을 도시하고, 도 3의 (b)에 피보간 대역의 저역측에 인접하는 대역의 스펙트럼 성분을 이용하여 보간하는 모습을 도시한다.
[특허 문헌1] 일본 특허 3576936호 공보
종래 기술에서는, 스펙트럼 성분이 존재하지 않는 대역을 피보간 대역으로서 특정하여 보간을 행하고 있다. 여기에서, 스펙트럼 성분이 존재하지 않는 대역에는, 부호화에 의해 씨닝된 대역과, 스펙트럼 성분이 애당초 존재하지 않는(혹은 작은) 대역의 2종류가 고려된다. 씨닝된 대역은 보간이 필요한 대역이지만, 스펙트럼 성분이 애당초 존재하지 않는 대역은 보간을 행해서는 안되는 대역이다.
그러나, 종래 기술에서는, 그 어느쪽의 대역에 대해서도 보간을 행하게 되기 때문에, 스펙트럼 성분이 애당초 존재하지 않는 대역에 대한 불필요한 보간이 행해지는 영향에 의해, 음질이 열화한다고 하는 문제가 있었다.
본 발명은, 상기의 점을 감안하여 이루어진 것으로, 보간할 주파수 대역을 정확하게 특정하여 불필요한 보간을 행하지 않아, 음질 열화를 방지할 수 있는 오디오 신호 보간 방법 및 오디오 신호 보간 장치를 제공하는 것을 목적으로 한다.
본 발명의 일 실시 양태에 따른 오디오 신호 보간 방법은,
입력되는 오디오 신호의 현 프레임의 주파수 스펙트럼과 스펙트럼 저장 수단에 저장되어 있는 과거의 프레임의 주파수 스펙트럼의 각 스펙트럼 성분의 변동인 스펙트럼 변동을 구하고,
상기 주파수 스펙트럼과 상기 스펙트럼 변동을 이용하여 피보간 대역을 결정 하고,
상기 현 프레임의 주파수 스펙트럼 또는 과거의 프레임의 주파수 스펙트럼을 이용하여 상기 현 프레임의 피보간 대역의 스펙트럼 성분의 보간을 행함으로써, 보간할 주파수 대역을 정확하게 특정하여 불필요한 보간을 행하지 않아, 음질 열화를 방지할 수 있다.
본 발명의 일 실시 양태에 따른 오디오 신호 보간 장치는,
입력되는 오디오 신호의 현 프레임의 주파수 스펙트럼과 스펙트럼 저장 수단에 저장되어 있는 과거의 프레임의 주파수 스펙트럼의 각 스펙트럼 성분의 변동인 스펙트럼 변동을 구하는 스펙트럼 변동 산출 수단과,
상기 주파수 스펙트럼과 상기 스펙트럼 변동을 이용하여 피보간 대역을 결정하는 보간 대역 결정 수단과,
상기 현 프레임의 주파수 스펙트럼 또는 과거의 프레임의 주파수 스펙트럼을 이용하여 상기 현 프레임의 피보간 대역의 스펙트럼 성분의 보간을 행하는 스펙트럼 보간 수단
을 가짐으로써, 보간할 주파수 대역을 정확하게 특정하여 불필요한 보간을 행하지 않아, 음질 열화를 방지할 수 있다.
상기 오디오 신호 보간 장치에 있어서,
상기 스펙트럼 변동 산출 수단은, 과거의 프레임부터 현 프레임까지의 스펙트럼 성분의 변화량을 상기 스펙트럼 변동으로서 구하고,
상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제2 임계치 이상의 감쇠일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 구성으로 하여도 된다.
상기 오디오 신호 보간 장치에 있어서,
상기 스펙트럼 변동 산출 수단은, 과거의 프레임에서의 스펙트럼 성분의 변화량으로부터 현 프레임에서의 스펙트럼 성분의 변화량의 차를 상기 스펙트럼 변동으로서 구하고,
상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제3 임계치 이상일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 구성으로 하여도 된다.
상기 오디오 신호 보간 장치에 있어서,
상기 스펙트럼 변동 산출 수단은, 과거의 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량으로부터 현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량의 차를 상기 스펙트럼 변동으로서 구하고,
상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제4 임계치 이상일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 구성으로 하여도 된다.
상기 오디오 신호 보간 장치에 있어서,
상기 스펙트럼 보간 수단은, 상기 피보간 대역으로서 결정된 현 프레임의 주파수 스펙트럼을, 과거의 프레임의 상기 피보간 대역과 동일한 대역의 스펙트럼 성분을 이용하여 보간하는 구성으로 하여도 된다.
상기 오디오 신호 보간 장치에 있어서,
상기 스펙트럼 보간 수단은, 상기 피보간 대역으로서 결정된 현 프레임의 주파수 스펙트럼을, 현 프레임의 상기 피보간 대역의 저역측에 인접하는 스펙트럼 성분을 이용하여 보간하는 구성으로 하여도 된다.
상기 오디오 신호 보간 장치에 있어서,
입력되는 시간 영역의 오디오 신호를 주파수 영역의 오디오 신호로 변환하여 현 프레임의 주파수 스펙트럼으로서 상기 스펙트럼 변동 산출 수단에 공급하는 변환 수단을 갖는 구성으로 하여도 된다.
상기 오디오 신호 보간 장치에 있어서,
입력되는 부호화 오디오 정보를 복호하여 현 프레임의 주파수 스펙트럼으로서 상기 스펙트럼 변동 산출 수단에 공급하는 복호 수단을 갖는 구성으로 하여도 된다.
상기 오디오 신호 보간 장치에 있어서,
상기 제1 임계치는, 고역측의 주파수 스펙트럼에 대해서는 낮게, 저역측의 주파수 스펙트럼에 대해서는 높게 설정한 구성으로 하여도 된다.
본 발명에 따르면, 보간할 주파수 대역을 정확하게 특정하여 불필요한 보간을 행하지 않아, 음질 열화를 방지할 수 있다.
이하, 도면에 기초하여 본 발명의 실시예에 대하여 설명한다.
<본 발명의 원리>
본 발명은, 부호화되지 않은 오디오 신호(즉, 원음)는 각 주파수의 진폭 레벨이 완만하게 감쇠하는 것에 대해, 부호화에 의해 스펙트럼 성분이 씨닝된 오디오 신호는, 스펙트럼 성분이 급격하게 감쇠하는 것을 이용하고, 스펙트럼 성분의 크기 외에 스펙트럼 성분의 진폭 변동인 스펙트럼 변동의 크기를 피보간 대역의 특정에 이용함으로써, 부호화에 의해 스펙트럼 성분이 씨닝된 대역을 정확하게 특정하고, 보간을 행하는 것을 특징으로 한다.
[제1 실시예]
도 4는 본 발명의 오디오 신호 보간 장치의 제1 실시예의 구성예의 블록도를 도시한다. 도 4 중, 단자(11)에는 부호화 오디오 정보를 복호 및 신장한 시간 영역의 오디오 신호가 악곡 데이터를 복수 샘플마다 통합한 프레임 단위로 입력되고, 시간-주파수 변환부(12)에 공급된다.
시간-주파수 변환부(12)에서는, 프레임마다 시간 영역의 오디오 신호를 주파수 영역의 오디오 신호로 변환한다. 또한, 시간-주파수 변환은, 예를 들면, 고속 푸리에 변환(Fast Fourier Transform: FFT)이나 변형 이산 코사인 변환(Modified Discrete Cosine Transform: MDCT) 등의 임의의 변환 방법을 이용한다. 변환된 주파수 영역의 오디오 신호, 즉 주파수 스펙트럼은, 스펙트럼 변동 산출부(13), 보간 대역 결정부(15), 스펙트럼 보간부(16) 각각에 공급된다.
스펙트럼 변동 산출부(13)는, 시간-주파수 변환부(12)로부터의 주파수 스펙트럼과, 스펙트럼 저장부(14)로부터 판독한 전 프레임의 주파수 스펙트럼을 이용하 여 스펙트럼 변동을 구하고, 보간 대역 결정부(15)에 공급한다. 스펙트럼 변동으로서는, 과거의 프레임부터 현 프레임까지의 스펙트럼 성분의 변화량, 과거의 프레임에서의 스펙트럼 성분의 변화량(전전 프레임부터 전 프레임까지의 스펙트럼 성분 변동량)으로부터 현 프레임에서의 스펙트럼 성분의 변화량(전 프레임부터 현 프레임까지의 스펙트럼 성분 변동량)의 차, 과거의 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량(전 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분)으로부터 현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량(현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분)의 차 등이다.
또한, 스펙트럼 변동 산출부(13)는 스펙트럼 변동 산출 후, 다음의 프레임에서의 스펙트럼 변동 산출을 위해, 스펙트럼 저장부(14)에 현 프레임의 주파수 스펙트럼을 보존한다. 또한, 스펙트럼 변동은, 인접하는 복수의 스펙트럼 성분을 통합한 주파수 대역마다 구하여도 된다.
보간 대역 결정부(15)에서는, 시간-주파수 변환부(12)로부터의 주파수 스펙트럼, 및 스펙트럼 변동 산출부(13)로부터의 스펙트럼 변동으로부터, 스펙트럼 성분을 보간할 피보간 주파수를 결정한다. 피보간 주파수의 결정 방법으로서는, 예를 들면, 이하에 기재하는 바와 같은 결정 방법이 있다.
도 5는, 보간 대역 결정부(15)에서의 피보간 주파수 결정 방법의 일 형태의 플로우차트를 도시한다. 스텝 S1에서 스펙트럼 성분의 크기(진폭 레벨)가 소정의 임계치 X[㏈ov] 이하인지의 여부를 판별하고, 스텝 S2에서 스펙트럼 변동으로서의 과거의 프레임부터 현 프레임까지의 스펙트럼 성분의 변화량이 소정의 임계치 Y[㏈] 이상 감쇠하고 있는지의 여부를 판별한다. 스펙트럼 성분의 크기가 X[㏈ov] 이하, 또는, 전 프레임으로부터 Y[㏈] 이상 감쇠하고 있는 경우에 스텝 S3에서 피보간 주파수로서 특정한다. 스펙트럼 성분의 크기가 X[㏈ov]를 초과하는 경우, 또는, 스펙트럼 성분의 감쇠가 전 프레임으로부터 Y[㏈] 미만인 경우에는 스텝 S4에서 보간 불필요 대역으로서 특정한다. 또한, 예를 들면 X=-60, Y=20으로 한다.
도 6은, 보간 대역 결정부(15)에서의 피보간 주파수 결정 방법의 다른 형태의 플로우차트를 도시한다. 스텝 S11에서 스펙트럼 성분의 크기가 X[㏈ov] 이하인지의 여부를 판별하고, 스텝 S12에서 전전 프레임부터 전 프레임까지의 스펙트럼 성분 변동량 Y1[㏈]과, 전 프레임부터 현 프레임까지의 스펙트럼 성분 변동량 Y2[㏈]의 차(Y1-Y2)[㏈]가 소정의 임계치 α 이상인지의 여부를 판별한다. 스펙트럼 성분의 크기가 X[㏈ov] 이하, 또는, 차(Y1-Y2)[㏈]가 소정의 임계치 α 이상인 경우에 스텝 S13에서 피보간 주파수로서 특정한다. 스펙트럼 성분의 크기가 X[㏈ov]를 초과하는 경우, 또는, 차(Y1-Y2)[㏈]가 소정의 임계치 α 미만인 경우에는 스텝 S14에서 보간 불필요 대역으로서 특정한다. 여기에서, 임계치 α는 예를 들면 수[㏈]로 한다. 또한, 전 프레임보다 더 전의 프레임에서의 변동량과의 차를 이용하여도 된다.
도 7은, 보간 대역 결정부(15)에서의 피보간 주파수 결정 방법의 또 다른 형태의 플로우차트를 도시한다. 스텝 S21에서 스펙트럼 성분의 크기가 X[㏈ov] 이하인지의 여부를 판별하고, 스텝 S22에서 전 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분 Z1[㏈]과, 현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분 Z2[㏈]의 차(Z1-Z2)[㏈]가 임계치 β 이상인지의 여부를 판별한다. 스펙트럼 성분의 크기가 X[㏈ov] 이하, 또는, 차(Z1-Z2)[㏈]가 임계치 β 이상인 경우에 스텝 S23에서 피보간 주파수로서 특정한다. 스펙트럼 성분의 크기가 X[㏈ov]를 초과하는 경우, 또는, 차(Z1-Z2)[㏈]가 임계치 β 미만인 경우에는 스텝 S24에서 보간 불필요 대역으로서 특정한다. 여기에서, 임계치 β는 예를 들면 수[㏈]로 한다.
상기 도 5∼도 7에서는, 임계치 X, Y 각각은 고정의 값으로 하고 있지만, 주파수 대역에 따라 상이한 임계치를 이용하여도 된다. 예를 들면 오디오 신호의 고주파수 대역에서는 X=-50으로 하고, 저주파수 대역에서는 X=-60으로 하고, 고주파수 대역에서는 Y=20으로 하고, 저주파수 대역에서는 Y=15로 하는 등이다. 또한, α, β에 대해서도 고주파수 대역에서의 값에 대하여, 저주파수 대역에서의 값을 작게 하여도 된다.
또한, 현 프레임의 주파수 스펙트럼의 전체 대역에서의 오디오 신호의 평균 파워에 소정의 계수를 승산하여 임계치 X, Y, α, β를 생성하는 등, 임계치를 동적으로 변동시켜도 되고, AAC, MP3 등의 오디오 부호화 방식에 따라 상이한 임계치를 이용하여도 된다. 또한, 유저가 임계치 X, Y, α, β를 임의로 변동할 수 있도록 하여도 된다.
도 4로 되돌아가서 설명하면, 스펙트럼 보간부(16)는, 보간 대역 결정부(15)에서 보간 대역으로 결정된 스펙트럼 성분의 보간을 행한다. 보간의 방법으로서 는, 예를 들면 종래 기술과 마찬가지로, 피보간 대역으로서 결정된 현 프레임의 주파수 스펙트럼을 전 프레임의 피보간 대역과 동일한 대역의 스펙트럼 성분을 이용하여 보간하는 방법이나, 현 프레임의 저역측에 인접하는 스펙트럼 성분을 카피하여 보간하는 방법을 이용한다. 주파수-시간 변환부(17)에서는, 프레임마다 보간 후의 주파수 스펙트럼의 주파수-시간 변환을 행하여, 시간 영역의 오디오 신호로 되돌아가서, 단자(18)로부터 출력된다.
본 실시예에서는, 스펙트럼 성분의 크기 외에, 전 프레임으로부터의 스펙트럼 성분의 변동을 이용하여 피보간 주파수를 특정하여 보간을 행하기 때문에, 보간하지 않아야 하는 대역을 보간하는 것을 방지할 수 있어, 잘못된 보간에 의한 음질 열화가 생기는 일이 없고, 부호화에 의해 씨닝된 주파수 대역을 적절하게 보간하여 부호화 전의 스펙트럼에 가까운 형태로 복원하여, 음질을 개선할 수 있다.
[제2 실시예]
도 8은 본 발명의 오디오 신호 보간 장치의 제2 실시예의 구성예의 블록도를 도시한다. 도 8 중, 도 4와 동일 부분에는 동일 부호를 붙인다. 도 8에서, 단자(11)에는 부호화 오디오 정보를 복호 및 신장한 시간 영역의 오디오 신호가 악곡 데이터를 복수 샘플마다 통합한 프레임 단위로 입력되어, 시간-주파수 변환부(12)에 공급된다.
시간-주파수 변환부(12)에서는, 프레임마다 시간 영역의 오디오 신호를 주파수 영역의 오디오 신호로 변환한다. 또한, 시간-주파수 변환은, 예를 들면, 고속 푸리에 변환이나 변형 이산 코사인 변환 등의 임의의 변환 방법을 이용한다. 변환 된 주파수 영역의 오디오 신호, 즉 주파수 스펙트럼은, 스펙트럼 변동 산출부(13), 보간 대역 결정부(15), 스펙트럼 보간부(16) 각각에 공급된다.
스펙트럼 변동 산출부(13)는, 시간-주파수 변환부(12)로부터의 주파수 스펙트럼과, 스펙트럼 저장부(20)로부터 판독한 전 프레임의 주파수 스펙트럼을 이용하여 스펙트럼 변동을 구하고, 보간 대역 결정부(15)에 공급한다. 스펙트럼 변동으로서는, 과거의 프레임부터 현 프레임까지의 스펙트럼 성분의 변화량, 과거의 프레임에서의 스펙트럼 성분의 변화량(전전 프레임부터 전 프레임까지의 스펙트럼 성분 변동량)으로부터 현 프레임에서의 스펙트럼 성분의 변화량(전 프레임부터 현 프레임까지의 스펙트럼 성분 변동량)의 차, 과거의 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량(전 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분)으로부터 현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량(현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분)의 차 등이다.
또한, 스펙트럼 변동 산출부(13)는 스펙트럼 변동 산출 후, 스펙트럼 저장부(20)에 현 프레임의 주파수 스펙트럼을 보존하지 않는다. 또한, 스펙트럼 변동은, 인접하는 복수의 스펙트럼 성분을 통합한 주파수 대역마다 구하여도 된다.
보간 대역 결정부(15)에서는, 시간-주파수 변환부(12)로부터의 주파수 스펙트럼, 및 스펙트럼 변동 산출부(13)로부터의 스펙트럼 변동으로부터, 스펙트럼을 보간할 피보간 주파수를 결정한다. 피보간 주파수의 결정 방법으로서는, 도 5∼도 7에 도시하는 방법을 이용한다.
스펙트럼 보간부(16)는, 보간 대역 결정부(15)에서 보간 대역으로 결정된 스펙트럼 성분의 보간을 행한다. 보간의 방법으로서는, 예를 들면 종래 기술과 마찬가지로, 전 프레임의 동일 대역의 스펙트럼 성분을 카피하여 보간하는 방법이나, 현 프레임의 저역측에 인접하는 스펙트럼 성분을 카피하여 보간하는 방법을 이용한다. 스펙트럼 보간부(16)는 보간 후의 주파수 스펙트럼을 스펙트럼 저장부(20)에 저장한다. 주파수-시간 변환부(17)에서는, 프레임마다 보간 후의 주파수 스펙트럼의 주파수-시간 변환을 행하여, 시간 영역의 오디오 신호로 되돌아가서, 단자(18)로부터 출력된다.
본 실시예에서는, 스펙트럼 저장부에, 보간 후의 주파수 스펙트럼을 스펙트럼 저장부(20)에 저장하고, 스펙트럼 변동의 산출을, 전 프레임의 보간 후의 주파수 스펙트럼을 이용하여 행함으로써, 연속하는 복수 프레임에서 동일 대역의 스펙트럼 성분이 씨닝되었을 때에도, 적절하게 스펙트럼 성분을 보간할 수 있어, 제1 실시예보다 더 정밀도 좋게, 부호화 전의 스펙트럼을 복원하여 음질을 개선할 수 있다.
[제3 실시예]
도 9는 본 발명의 오디오 신호 보간 장치의 제3 실시예의 구성예의 블록도를 도시한다. 도 9 중, 도 4와 동일 부분에는 동일 부호를 붙인다. 여기에서, AAC나 MP3 등의 오디오 부호화에서는 시간 영역의 오디오 신호(원음)를 주파수 영역의 오디오 신호로 변환하여 스펙트럼 성분의 씨닝을 행한 후, 부호화를 행하여 부호화 오디오 정보로 하고 있다.
도 9에서, 단자(21)에는 AAC나 MP3 등의 오디오 부호화를 이용하여 압축된 부호화 오디오 정보가 입력되고, 스펙트럼 복호부(22)에 공급된다. 스펙트럼 복호부(22)에서는 부호화 오디오 정보를 복호하여 주파수 영역의 오디오 신호 즉 주파수 스펙트럼으로 하고, 프레임 단위로 스펙트럼 변동 산출부(13), 보간 대역 결정부(15), 스펙트럼 보간부(16) 각각에 공급된다.
스펙트럼 변동 산출부(13)는, 시간-주파수 변환부(12)로부터의 주파수 스펙트럼과, 스펙트럼 저장부(14)로부터 판독한 전 프레임의 주파수 스펙트럼을 이용하여 스펙트럼 변동을 구하고, 보간 대역 결정부(15)에 공급한다. 스펙트럼 변동으로서는, 과거의 프레임부터 현 프레임까지의 스펙트럼 성분의 변화량, 과거의 프레임에서의 스펙트럼 성분의 변화량(전전 프레임부터 전 프레임까지의 스펙트럼 성분 변동량)으로부터 현 프레임에서의 스펙트럼 성분의 변화량(전 프레임부터 현 프레임까지의 스펙트럼 성분 변동량)의 차, 과거의 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량(전 스펙트럼에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분)으로부터 현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량(현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분)의 차 등이다.
또한, 스펙트럼 변동 산출부(13)는 스펙트럼 변동 산출 후, 다음의 프레임에서의 스펙트럼 변동 산출을 위해, 스펙트럼 저장부(14)에 현 프레임의 주파수 스펙트럼을 보존한다. 또한, 스펙트럼 변동은, 인접하는 복수의 스펙트럼 성분을 통합한 주파수 대역마다 구하여도 된다.
보간 대역 결정부(15)에서는, 시간-주파수 변환부(12)로부터의 주파수 스펙트럼, 및 스펙트럼 변동 산출부(13)로부터의 스펙트럼 변동으로부터, 스펙트럼을 보간할 피보간 주파수를 결정한다. 피보간 주파수의 결정 방법으로서는, 도 5∼도 7에 도시하는 방법을 이용한다.
스펙트럼 보간부(16)는, 보간 대역 결정부(15)에서 보간 대역으로 결정된 스펙트럼 성분의 보간을 행한다. 보간의 방법으로서는, 예를 들면 종래 기술과 마찬가지로, 전 프레임의 동일 대역의 스펙트럼 성분을 카피하여 보간하는 방법이나, 현 프레임의 저역측에 인접하는 스펙트럼 성분을 카피하여 보간하는 방법을 이용한다. 주파수-시간 변환부(17)에서는, 프레임마다 보간 후의 주파수 스펙트럼의 주파수-시간 변환을 행하여, 시간 영역의 오디오 신호로 되돌아가서, 단자(18)로부터 출력된다.
이 실시예에서는, 주파수 영역에서 부호화된 부호화 오디오 정보에 대하여, 시간 영역의 오디오 신호로 되돌아가기 전의 주파수 영역의 오디오 신호에 대하여 보간을 행한다. 이에 의해, 시간-주파수 변환을 행하는 코스트를 삭감할 수 있음과 함께, 시간 영역의 오디오 신호로부터 주파수 스펙트럼을 분석할 때의 분석 오차가 생기지 않기 때문에, 제1 실시예보다 더 정밀도 좋게, 부호화 전의 주파수 스펙트럼을 복원하여, 음질을 개선할 수 있다.
[제4 실시예]
도 10은 본 발명의 오디오 신호 보간 장치의 제3 실시예의 구성예의 블록도를 도시한다. 도 10 중, 도 4와 동일 부분에는 동일 부호를 붙인다.
도 10에서, 단자(21)에는 AAC나 MP3 등의 오디오 부호화를 이용하여 압축된 부호화 오디오 정보가 입력되고, 스펙트럼 복호부(22)에 공급된다. 스펙트럼 복호부(22)에서는 부호화 오디오 정보를 복호하여 주파수 영역의 오디오 신호 즉 주파수 스펙트럼으로 하고, 프레임 단위로 스펙트럼 변동 산출부(13), 보간 대역 결정부(15), 스펙트럼 보간부(16) 각각에 공급된다.
스펙트럼 변동 산출부(13)는, 시간-주파수 변환부(12)로부터의 주파수 스펙트럼과, 스펙트럼 저장부(20)로부터 판독한 전 프레임의 주파수 스펙트럼을 이용하여 스펙트럼 변동을 구하고, 보간 대역 결정부(15)에 공급한다. 스펙트럼 변동으로서는, 과거의 프레임부터 현 프레임까지의 스펙트럼 성분의 변화량, 과거의 프레임에서의 스펙트럼 성분의 변화량(전전 프레임부터 전 프레임까지의 스펙트럼 성분 변동량)으로부터 현 프레임에서의 스펙트럼 성분의 변화량(전 프레임부터 현 프레임까지의 스펙트럼 성분 변동량)의 차, 과거의 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량(전 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분)으로부터 현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량(현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분)의 차 등이다.
또한, 스펙트럼 변동 산출부(13)는 스펙트럼 변동 산출 후, 스펙트럼 저장부(20)에 현 프레임의 주파수 스펙트럼을 보존하지 않는다. 또한, 스펙트럼 변동은, 인접하는 복수의 스펙트럼 성분을 통합한 주파수 대역마다 구하여도 된다.
보간 대역 결정부(15)에서는, 시간-주파수 변환부(12)로부터의 주파수 스펙 트럼, 및 스펙트럼 변동 산출부(13)로부터의 스펙트럼 변동으로부터, 스펙트럼을 보간할 피보간 주파수를 결정한다. 피보간 주파수의 결정 방법으로서는, 도 5∼도 7에 도시하는 방법을 이용한다.
스펙트럼 보간부(16)는, 보간 대역 결정부(15)에서 보간 대역으로 결정된 스펙트럼 성분의 보간을 행한다. 보간의 방법으로서는, 예를 들면 종래 기술과 마찬가지로, 전 프레임의 동일 대역의 스펙트럼 성분을 카피하여 보간하는 방법이나, 현 프레임의 저역측에 인접하는 스펙트럼 성분을 카피하여 보간하는 방법을 이용한다. 스펙트럼 보간부(16)는 보간 후의 주파수 스펙트럼을 스펙트럼 저장부(20)에 저장한다. 주파수-시간 변환부(17)에서는, 프레임마다 보간 후의 주파수 스펙트럼의 주파수-시간 변환을 행하여, 시간 영역의 오디오 신호로 되돌아가서, 단자(18)로부터 출력된다.
본 실시예에서는, 스펙트럼 저장부에, 보간 후의 주파수 스펙트럼을 스펙트럼 저장부(20)에 저장하고, 스펙트럼 변동의 산출을, 전 프레임의 보간 후의 주파수 스펙트럼을 이용하여 행함으로써, 연속하는 복수 프레임에서 동일 대역의 스펙트럼 성분이 씨닝되었을 때에도, 적절하게 스펙트럼 성분을 보간할 수 있어, 제3 실시예보다 더 정밀도 좋게, 부호화 전의 스펙트럼을 복원하여 음질을 개선할 수 있다.
또한, 스펙트럼 저장부(14, 20)가 청구항 또는 부기에 기재된 스펙트럼 저장 수단에 상당하고, 스펙트럼 변동 산출부(13)가 스펙트럼 변동 산출 수단에 상당하고, 보간 대역 결정부(15)가 보간 대역 결정 수단에 상당하고, 스펙트럼 보간 부(16)가 스펙트럼 보간 수단에 상당하고, 시간-주파수 변환부(12)가 변환 수단에 상당하고, 스펙트럼 복호부(22)가 복호 수단에 상당한다.
(부기 1)
입력되는 오디오 신호의 현 프레임의 주파수 스펙트럼과 스펙트럼 저장 수단에 저장되어 있는 과거의 프레임의 주파수 스펙트럼의 각 스펙트럼 성분의 변동인 스펙트럼 변동을 구하고,
상기 주파수 스펙트럼과 상기 스펙트럼 변동을 이용하여 피보간 대역을 결정하고,
상기 현 프레임의 주파수 스펙트럼 또는 과거의 프레임의 주파수 스펙트럼을 이용하여 상기 현 프레임의 피보간 대역의 스펙트럼 성분의 보간을 행하는 것을 특징으로 하는 오디오 신호 보간 방법.
(부기 2)
입력되는 오디오 신호의 현 프레임의 주파수 스펙트럼과 스펙트럼 저장 수단에 저장되어 있는 과거의 프레임의 주파수 스펙트럼의 각 스펙트럼 성분의 변동인 스펙트럼 변동을 구하는 스펙트럼 변동 산출 수단과,
상기 주파수 스펙트럼과 상기 스펙트럼 변동을 이용하여 피보간 대역을 결정하는 보간 대역 결정 수단과,
상기 현 프레임의 주파수 스펙트럼 또는 과거의 프레임의 주파수 스펙트럼을 이용하여 상기 현 프레임의 피보간 대역의 스펙트럼 성분의 보간을 행하는 스펙트럼 보간 수단
을 갖는 것을 특징으로 하는 오디오 신호 보간 장치.
(부기 3)
부기 2에 기재된 오디오 신호 보간 장치에 있어서,
상기 스펙트럼 변동 산출 수단은, 과거의 프레임부터 현 프레임까지의 스펙트럼 성분의 변화량을 상기 스펙트럼 변동으로서 구하고,
상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제2 임계치 이상의 감쇠일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 것을 특징으로 하는 오디오 신호 보간 장치.
(부기 4)
부기 2에 기재된 오디오 신호 보간 장치에 있어서,
상기 스펙트럼 변동 산출 수단은, 과거의 프레임에서의 스펙트럼 성분의 변화량으로부터 현 프레임에서의 스펙트럼 성분의 변화량의 차를 상기 스펙트럼 변동으로서 구하고,
상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제3 임계치 이상일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 것을 특징으로 하는 오디오 신호 보간 장치.
(부기 5)
부기 2에 기재된 오디오 신호 보간 장치에 있어서,
상기 스펙트럼 변동 산출 수단은, 과거의 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량으로부터 현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량의 차를 상기 스펙트럼 변동으로서 구하고,
상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제4 임계치 이상일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 것을 특징으로 하는 오디오 신호 보간 장치.
(부기 6)
부기 2 내지 5 중 어느 하나에 기재된 오디오 신호 보간 장치에 있어서,
상기 스펙트럼 보간 수단은, 상기 피보간 대역으로서 결정된 현 프레임의 주파수 스펙트럼을, 과거의 프레임의 상기 피보간 대역과 동일한 대역의 스펙트럼 성분을 이용하여 보간하는 것을 특징으로 하는 오디오 신호 보간 장치.
(부기 7)
부기 2 내지 5 중 어느 하나에 기재된 오디오 신호 보간 장치에 있어서,
상기 스펙트럼 보간 수단은, 상기 피보간 대역으로서 결정된 현 프레임의 주파수 스펙트럼을, 현 프레임의 상기 피보간 대역의 저역측에 인접하는 스펙트럼 성분을 이용하여 보간하는 것을 특징으로 하는 오디오 신호 보간 장치.
(부기 8)
부기 2에 기재된 오디오 신호 보간 장치에 있어서,
입력되는 시간 영역의 오디오 신호를 주파수 영역의 오디오 신호로 변환하여 현 프레임의 주파수 스펙트럼으로서 상기 스펙트럼 변동 산출 수단에 공급하는 변환 수단을 갖는 것을 특징으로 하는 오디오 신호 보간 장치.
(부기 9)
부기 2에 기재된 오디오 신호 보간 장치에 있어서,
입력되는 부호화 오디오 정보를 복호하여 현 프레임의 주파수 스펙트럼으로서 상기 스펙트럼 변동 산출 수단에 공급하는 복호 수단을 갖는 것을 특징으로 하는 오디오 신호 보간 장치.
(부기 10)
부기 3 내지 5 중 어느 하나에 기재된 오디오 신호 보간 장치에 있어서,
상기 제1 임계치는, 고역측의 주파수 스펙트럼에 대해서 작게, 저역측의 주파수 스펙트럼에 대해서 크게 설정한 것을 특징으로 하는 오디오 신호 보간 장치.
(부기 11)
부기 2에 기재된 오디오 신호 보간 장치에 있어서,
상기 스펙트럼 변동 산출 수단에서 스펙트럼 변동을 구한 후 상기 현 프레임의 주파수 스펙트럼을 상기 스펙트럼 저장 수단에 저장하는 것을 특징으로 하는 오디오 신호 보간 장치.
(부기 12)
부기 2에 기재된 오디오 신호 보간 장치에 있어서,
상기 스펙트럼 보간 수단에서 보간을 행한 현 프레임의 주파수 스펙트럼을 상기 스펙트럼 저장 수단에 저장하는 것을 특징으로 하는 오디오 신호 보간 장치.
(부기 13)
부기 3에 기재된 오디오 신호 보간 장치에 있어서,
상기 제2 임계치는, 고역측의 주파수 스펙트럼에 대해서 크게, 저역측의 주 파수 스펙트럼에 대해서 작게 설정한 것을 특징으로 하는 오디오 신호 보간 장치.
(부기 14)
부기 4에 기재된 오디오 신호 보간 장치에 있어서,
상기 제3 임계치는, 고역측의 주파수 스펙트럼에 대해서 크게, 저역측의 주파수 스펙트럼에 대해서 작게 설정한 것을 특징으로 하는 오디오 신호 보간 장치.
(부기 15)
부기 5에 기재된 오디오 신호 보간 장치에 있어서,
상기 제4 임계치는, 고역측의 주파수 스펙트럼에 대해서 크게, 저역측의 주파수 스펙트럼에 대해서 작게 설정한 것을 특징으로 하는 오디오 신호 보간 장치.
(부기 16)
부기 5에 기재된 오디오 신호 보간 장치에 있어서,
상기 제1 내지 제4 임계치를, 현 프레임의 주파수 스펙트럼의 전체 대역에서의 오디오 신호의 평균 파워에 따라서 가변하는 것을 특징으로 하는 오디오 신호 보간 장치.
도 1은 스펙트럼 성분의 씨닝을 설명하기 위한 도면.
도 2는 스펙트럼 성분의 씨닝을 설명하기 위한 도면.
도 3은 스펙트럼 성분의 보간을 설명하기 위한 도면.
도 4는 본 발명의 오디오 신호 보간 장치의 제1 실시예의 구성예의 블록도.
도 5는 피보간 주파수 결정 방법의 일 형태의 플로우차트.
도 6은 피보간 주파수 결정 방법의 다른 형태의 플로우차트.
도 7은 피보간 주파수 결정 방법의 또 다른 형태의 플로우차트.
도 8은 본 발명의 오디오 신호 보간 장치의 제2 실시예의 구성예의 블록도.
도 9는 본 발명의 오디오 신호 보간 장치의 제3 실시예의 구성예의 블록도.
도 10은 본 발명의 오디오 신호 보간 장치의 제4 실시예의 구성예의 블록도.
<도면의 주요 부분에 대한 부호의 설명>
12 : 시간-주파수 변환부
13 : 스펙트럼 변동 산출부
14, 20 : 스펙트럼 저장부
15 : 보간 대역 결정부
16 : 스펙트럼 보간부
17 : 주파수-시간 변환부
22 : 스펙트럼 복호부

Claims (10)

  1. 입력되는 오디오 신호의 현 프레임의 주파수 스펙트럼과 스펙트럼 저장 수단에 저장되어 있는 과거의 프레임의 주파수 스펙트럼의 각 스펙트럼 성분의 변동인 스펙트럼 변동을 구하고,
    상기 주파수 스펙트럼과 상기 스펙트럼 변동을 이용하여 피보간 대역을 결정하고,
    상기 현 프레임의 주파수 스펙트럼 또는 과거의 프레임의 주파수 스펙트럼을 이용하여 상기 현 프레임의 피보간 대역의 스펙트럼 성분의 보간을 행하는 것을 특징으로 하는 오디오 신호 보간 방법.
  2. 입력되는 오디오 신호의 현 프레임의 주파수 스펙트럼과 스펙트럼 저장 수단에 저장되어 있는 과거의 프레임의 주파수 스펙트럼의 각 스펙트럼 성분의 변동인 스펙트럼 변동을 구하는 스펙트럼 변동 산출 수단과,
    상기 주파수 스펙트럼과 상기 스펙트럼 변동을 이용하여 피보간 대역을 결정하는 보간 대역 결정 수단과,
    상기 현 프레임의 주파수 스펙트럼 또는 과거의 프레임의 주파수 스펙트럼을 이용하여 상기 현 프레임의 피보간 대역의 스펙트럼 성분의 보간을 행하는 스펙트럼 보간 수단
    을 갖는 것을 특징으로 하는 오디오 신호 보간 장치.
  3. 제2항에 있어서,
    상기 스펙트럼 변동 산출 수단은, 과거의 프레임부터 현 프레임까지의 스펙트럼 성분의 변화량을 상기 스펙트럼 변동으로서 구하고,
    상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제2 임계치 이상의 감쇠일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 것을 특징으로 하는 오디오 신호 보간 장치.
  4. 제2항에 있어서,
    상기 스펙트럼 변동 산출 수단은, 과거의 프레임에서의 스펙트럼 성분의 변화량으로부터 현 프레임에서의 스펙트럼 성분의 변화량의 차를 상기 스펙트럼 변동으로서 구하고,
    상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제3 임계치 이상일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 것을 특징으로 하는 오디오 신호 보간 장치.
  5. 제2항에 있어서,
    상기 스펙트럼 변동 산출 수단은, 과거의 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량으로부터 현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량의 차를 상기 스펙트럼 변동으로서 구하고,
    상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제4 임계치 이상일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 것을 특징으로 하는 오디오 신호 보간 장치.
  6. 제2항 내지 제5항 중 어느 한 항에 있어서,
    상기 스펙트럼 보간 수단은, 상기 피보간 대역으로서 결정된 현 프레임의 주파수 스펙트럼을, 과거의 프레임의 상기 피보간 대역과 동일한 대역의 스펙트럼 성분을 이용하여 보간하는 것을 특징으로 하는 오디오 신호 보간 장치.
  7. 제2항 내지 제5항 중 어느 한 항에 있어서,
    상기 스펙트럼 보간 수단은, 상기 피보간 대역으로서 결정된 현 프레임의 주파수 스펙트럼을, 현 프레임의 상기 피보간 대역의 저역측에 인접하는 스펙트럼 성분을 이용하여 보간하는 것을 특징으로 하는 오디오 신호 보간 장치.
  8. 제2항에 있어서,
    입력되는 시간 영역의 오디오 신호를 주파수 영역의 오디오 신호로 변환하여 현 프레임의 주파수 스펙트럼으로서 상기 스펙트럼 변동 산출 수단에 공급하는 변환 수단을 갖는 것을 특징으로 하는 오디오 신호 보간 장치.
  9. 제2항에 있어서,
    입력되는 부호화 오디오 정보를 복호하여 현 프레임의 주파수 스펙트럼으로서 상기 스펙트럼 변동 산출 수단에 공급하는 복호 수단을 갖는 것을 특징으로 하는 오디오 신호 보간 장치.
  10. 제3항 내지 제5항 중 어느 한 항에 있어서,
    상기 제1 임계치는, 고역측의 주파수 스펙트럼에 대해서는 낮게, 저역측의 주파수 스펙트럼에 대해서는 높게 설정한 것을 특징으로 하는 오디오 신호 보간 장치.
KR1020070082830A 2006-09-20 2007-08-17 오디오 신호 보간 방법 및 오디오 신호 보간 장치 KR100912587B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006254425A JP4769673B2 (ja) 2006-09-20 2006-09-20 オーディオ信号補間方法及びオーディオ信号補間装置
JPJP-P-2006-00254425 2006-09-20

Publications (2)

Publication Number Publication Date
KR20080026481A true KR20080026481A (ko) 2008-03-25
KR100912587B1 KR100912587B1 (ko) 2009-08-19

Family

ID=38829579

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070082830A KR100912587B1 (ko) 2006-09-20 2007-08-17 오디오 신호 보간 방법 및 오디오 신호 보간 장치

Country Status (6)

Country Link
US (1) US7957973B2 (ko)
EP (1) EP1903558B1 (ko)
JP (1) JP4769673B2 (ko)
KR (1) KR100912587B1 (ko)
CN (1) CN101149926B (ko)
DE (1) DE602007002352D1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2466671B (en) 2009-01-06 2013-03-27 Skype Speech encoding
GB2466672B (en) 2009-01-06 2013-03-13 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466669B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
KR101320963B1 (ko) 2009-03-31 2013-10-23 후아웨이 테크놀러지 컴퍼니 리미티드 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템
US8452606B2 (en) 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
JP2012177828A (ja) * 2011-02-28 2012-09-13 Pioneer Electronic Corp ノイズ検出装置、ノイズ低減装置及びノイズ検出方法
US9263054B2 (en) * 2013-02-21 2016-02-16 Qualcomm Incorporated Systems and methods for controlling an average encoding rate for speech signal encoding

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5226084A (en) * 1990-12-05 1993-07-06 Digital Voice Systems, Inc. Methods for speech quantization and error correction
JP3576935B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
JP3576936B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
JP2002169597A (ja) * 2000-09-05 2002-06-14 Victor Co Of Japan Ltd 音声信号処理装置、音声信号処理方法、音声信号処理のプログラム、及び、そのプログラムを記録した記録媒体
JP3576951B2 (ja) * 2000-10-06 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
KR100591350B1 (ko) * 2001-03-06 2006-06-19 가부시키가이샤 엔.티.티.도코모 오디오 데이터 보간장치 및 방법, 오디오 데이터관련 정보작성장치 및 방법, 오디오 데이터 보간 정보 송신장치 및방법, 및 그 프로그램 및 기록 매체
JP4296752B2 (ja) * 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
JP3881932B2 (ja) * 2002-06-07 2007-02-14 株式会社ケンウッド 音声信号補間装置、音声信号補間方法及びプログラム
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal

Also Published As

Publication number Publication date
CN101149926B (zh) 2011-06-15
EP1903558B1 (en) 2009-09-09
KR100912587B1 (ko) 2009-08-19
EP1903558A2 (en) 2008-03-26
US20080071541A1 (en) 2008-03-20
DE602007002352D1 (de) 2009-10-22
JP4769673B2 (ja) 2011-09-07
EP1903558A3 (en) 2008-09-03
CN101149926A (zh) 2008-03-26
JP2008076636A (ja) 2008-04-03
US7957973B2 (en) 2011-06-07

Similar Documents

Publication Publication Date Title
KR100912587B1 (ko) 오디오 신호 보간 방법 및 오디오 신호 보간 장치
JP6789365B2 (ja) 音声符号化装置および方法
KR101747918B1 (ko) 고주파수 신호 복호화 방법 및 장치
JP6184519B2 (ja) 音声信号復号化または符号化の時間領域レベル調整
JP5247721B2 (ja) 重み付けウィンドウを用いた低遅延変換符号化
NO20170988A1 (no) Analysefilterbank, syntesefilterbank, koder, dekoder, blander og konferansesystem
KR20080002757A (ko) 통신 시스템에서 프레임들을 연결하는 방법
JP2004101720A (ja) 音響符号化装置及び音響符号化方法
KR20090083070A (ko) 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
JP2010078915A (ja) オーディオ復号方法、装置、及びプログラム
JP2004198485A (ja) 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
EP3550563B1 (en) Encoder, decoder, encoding method, decoding method, and associated programs
JP5295372B2 (ja) デジタルオーディオ信号におけるプリエコーの減衰
TW202215417A (zh) 多聲道信號產生器、音頻編碼器及依賴混合噪音信號的相關方法
US20130346073A1 (en) Audio encoder/decoder apparatus
US20130096928A1 (en) Method and apparatus for processing an audio signal
JP6713424B2 (ja) 音声復号装置、音声復号方法、プログラム、および記録媒体
JP2007004050A (ja) ステレオ信号の符号化装置及び符号化プログラム
JP2008151958A (ja) 信号処理方法、信号処理装置及びプログラム
JP2017227701A (ja) 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、プログラム、および記録媒体

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120724

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130719

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140721

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150716

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160720

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170719

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee