KR20080026481A

KR20080026481A - 오디오 신호 보간 방법 및 오디오 신호 보간 장치

Info

Publication number: KR20080026481A
Application number: KR1020070082830A
Authority: KR
Inventors: 마사끼요 다나까; 마사나오 스즈끼; 미유끼 시라까와; 다까시 마끼우찌
Original assignee: 후지쯔 가부시끼가이샤
Priority date: 2006-09-20
Filing date: 2007-08-17
Publication date: 2008-03-25
Also published as: CN101149926B; EP1903558B1; KR100912587B1; EP1903558A2; US20080071541A1; DE602007002352D1; JP4769673B2; EP1903558A3; CN101149926A; JP2008076636A; US7957973B2

Abstract

본 발명은, 보간할 주파수 대역을 정확하게 특정하여 불필요한 보간을 행하지 않아, 음질 열화를 방지할 수 있는 오디오 신호 보간 방법 및 오디오 신호 보간 장치를 제공하는 것을 목적으로 한다. 입력되는 오디오 신호의 현 프레임의 주파수 스펙트럼과 스펙트럼 저장 수단에 저장되어 있는 과거의 프레임의 주파수 스펙트럼의 각 스펙트럼 성분의 변동인 스펙트럼 변동을 구하고, 주파수 스펙트럼과 상기 스펙트럼 변동을 이용하여 피보간 대역을 결정하고, 현 프레임의 주파수 스펙트럼 또는 과거의 프레임의 주파수 스펙트럼을 이용하여 현 프레임의 피보간 대역의 스펙트럼 성분의 보간을 행한다.

스펙트럼 성분, 주파수 스펙트럼, 오디오 신호, 씨닝, 피보간 대역

Description

오디오 신호 보간 방법 및 오디오 신호 보간 장치{AUDIO SIGNAL INTERPOLATION METHOD AND DEVICE}

본 발명은, 오디오 신호 보간 방법 및 오디오 신호 보간 장치에 관한 것으로, 특히, 일부의 스펙트럼 성분이 씨닝된 오디오 신호에 대하여, 씨닝된 스펙트럼 성분을 보간함으로써 음질을 개선하는 오디오 신호 보간 방법 및 오디오 신호 보간 장치에 관한 것이다.

최근, 인터넷을 통한 음악 배신 서비스가 급속히 보급되고 있다. 이들, 음악 배신 서비스에서는, 악곡을 AAC(Advanced Audio Coding)나, MP3(MPEG1 Audio Layer 3) 등과 같은 오디오 부호화 기술에 의해 압축되어 배신되는 것이 일반적이다.

전술한 AAC나 MP3에서는, 인간의 주관에 기초하여, 청각적으로 중요하지 않은 스펙트럼 성분을 씨닝함으로써, 정보를 압축하는 것을 특징으로 한다. 도 1의 (a)에 부호화 전의 주파수 스펙트럼을 도시하고, 도 1의 (b)에 부호화 후의 주파수 스펙트럼을 도시한다. 도 1의 (b)의 파선으로 둘러싼 스펙트럼 성분을 씨닝하고 있다.

또한, 본 명세서에서는 도 1에 도시한 바와 같이 오디오 신호를 주파수마다의 진폭 레벨로 나타낸 전체를 주파수 스펙트럼이라고 부르고, 각 주파수의 진폭 레벨을 스펙트럼 성분이라고 부른다.

이 스펙트럼 성분의 씨닝은, 악곡 데이터를 복수 샘플마다 통합한 프레임 단위로 행해지고, 어느 스펙트럼 성분이 씨닝될지는 프레임마다 독립하여 결정된다. 즉, 도 2의 (a)에 도시하는 시각 t의 프레임에서는 씨닝되지 않았던 스펙트럼 성분이, 도 2의 (b)에 도시하는 시각 (t+1)의 프레임에서는 파선으로 둘러싼 스펙트럼 성분이 씨닝된다고 하는 현상이 생겨서, 스펙트럼 성분이 격하게 변동하는 경우가 있다.

인간의 청각은 스펙트럼 성분의 변동에 민감하기 때문에, 이러한 스펙트럼 성분의 변동은 청각적인 위화감을 낳아, 음질이 열화하는 원인으로 된다. 이러한 스펙트럼 성분의 씨닝에 의한 음질 열화를 방지하기 위해서, 씨닝된 스펙트럼 성분을 적절히 보간하는 기술이 요구되고 있다.

씨닝된 스펙트럼 성분을 보간하는 기술로서, 예를 들면 특허 문헌1에 기재된 기술이 있다. 이 기술에서는, 첫째, 스펙트럼 성분이 존재하지 않는 대역을 피보간 대역으로서 특정한다. 둘째, 특정한 피보간 대역을 과거 혹은 미래의 프레임에서의 피보간 대역과 동일한 대역, 혹은 피보간 대역의 저역측에 인접하는 대역의 스펙트럼 성분을 이용하여 보간한다. 도 3의 (a)에 보간 전의 주파수 스펙트럼을 도시하고, 도 3의 (b)에 피보간 대역의 저역측에 인접하는 대역의 스펙트럼 성분을 이용하여 보간하는 모습을 도시한다.

[특허 문헌1] 일본 특허 3576936호 공보

종래 기술에서는, 스펙트럼 성분이 존재하지 않는 대역을 피보간 대역으로서 특정하여 보간을 행하고 있다. 여기에서, 스펙트럼 성분이 존재하지 않는 대역에는, 부호화에 의해 씨닝된 대역과, 스펙트럼 성분이 애당초 존재하지 않는(혹은 작은) 대역의 2종류가 고려된다. 씨닝된 대역은 보간이 필요한 대역이지만, 스펙트럼 성분이 애당초 존재하지 않는 대역은 보간을 행해서는 안되는 대역이다.

그러나, 종래 기술에서는, 그 어느쪽의 대역에 대해서도 보간을 행하게 되기 때문에, 스펙트럼 성분이 애당초 존재하지 않는 대역에 대한 불필요한 보간이 행해지는 영향에 의해, 음질이 열화한다고 하는 문제가 있었다.

본 발명은, 상기의 점을 감안하여 이루어진 것으로, 보간할 주파수 대역을 정확하게 특정하여 불필요한 보간을 행하지 않아, 음질 열화를 방지할 수 있는 오디오 신호 보간 방법 및 오디오 신호 보간 장치를 제공하는 것을 목적으로 한다.

본 발명의 일 실시 양태에 따른 오디오 신호 보간 방법은,

입력되는 오디오 신호의 현 프레임의 주파수 스펙트럼과 스펙트럼 저장 수단에 저장되어 있는 과거의 프레임의 주파수 스펙트럼의 각 스펙트럼 성분의 변동인 스펙트럼 변동을 구하고,

상기 주파수 스펙트럼과 상기 스펙트럼 변동을 이용하여 피보간 대역을 결정 하고,

상기 현 프레임의 주파수 스펙트럼 또는 과거의 프레임의 주파수 스펙트럼을 이용하여 상기 현 프레임의 피보간 대역의 스펙트럼 성분의 보간을 행함으로써, 보간할 주파수 대역을 정확하게 특정하여 불필요한 보간을 행하지 않아, 음질 열화를 방지할 수 있다.

본 발명의 일 실시 양태에 따른 오디오 신호 보간 장치는,

입력되는 오디오 신호의 현 프레임의 주파수 스펙트럼과 스펙트럼 저장 수단에 저장되어 있는 과거의 프레임의 주파수 스펙트럼의 각 스펙트럼 성분의 변동인 스펙트럼 변동을 구하는 스펙트럼 변동 산출 수단과,

상기 주파수 스펙트럼과 상기 스펙트럼 변동을 이용하여 피보간 대역을 결정하는 보간 대역 결정 수단과,

상기 현 프레임의 주파수 스펙트럼 또는 과거의 프레임의 주파수 스펙트럼을 이용하여 상기 현 프레임의 피보간 대역의 스펙트럼 성분의 보간을 행하는 스펙트럼 보간 수단

을 가짐으로써, 보간할 주파수 대역을 정확하게 특정하여 불필요한 보간을 행하지 않아, 음질 열화를 방지할 수 있다.

상기 오디오 신호 보간 장치에 있어서,

상기 스펙트럼 변동 산출 수단은, 과거의 프레임부터 현 프레임까지의 스펙트럼 성분의 변화량을 상기 스펙트럼 변동으로서 구하고,

상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제2 임계치 이상의 감쇠일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 구성으로 하여도 된다.

상기 오디오 신호 보간 장치에 있어서,

상기 스펙트럼 변동 산출 수단은, 과거의 프레임에서의 스펙트럼 성분의 변화량으로부터 현 프레임에서의 스펙트럼 성분의 변화량의 차를 상기 스펙트럼 변동으로서 구하고,

상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제3 임계치 이상일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 구성으로 하여도 된다.

상기 오디오 신호 보간 장치에 있어서,

상기 스펙트럼 변동 산출 수단은, 과거의 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량으로부터 현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량의 차를 상기 스펙트럼 변동으로서 구하고,

상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제4 임계치 이상일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 구성으로 하여도 된다.

상기 오디오 신호 보간 장치에 있어서,

상기 스펙트럼 보간 수단은, 상기 피보간 대역으로서 결정된 현 프레임의 주파수 스펙트럼을, 과거의 프레임의 상기 피보간 대역과 동일한 대역의 스펙트럼 성분을 이용하여 보간하는 구성으로 하여도 된다.

상기 오디오 신호 보간 장치에 있어서,

상기 스펙트럼 보간 수단은, 상기 피보간 대역으로서 결정된 현 프레임의 주파수 스펙트럼을, 현 프레임의 상기 피보간 대역의 저역측에 인접하는 스펙트럼 성분을 이용하여 보간하는 구성으로 하여도 된다.

상기 오디오 신호 보간 장치에 있어서,

입력되는 시간 영역의 오디오 신호를 주파수 영역의 오디오 신호로 변환하여 현 프레임의 주파수 스펙트럼으로서 상기 스펙트럼 변동 산출 수단에 공급하는 변환 수단을 갖는 구성으로 하여도 된다.

상기 오디오 신호 보간 장치에 있어서,

입력되는 부호화 오디오 정보를 복호하여 현 프레임의 주파수 스펙트럼으로서 상기 스펙트럼 변동 산출 수단에 공급하는 복호 수단을 갖는 구성으로 하여도 된다.

상기 오디오 신호 보간 장치에 있어서,

상기 제1 임계치는, 고역측의 주파수 스펙트럼에 대해서는 낮게, 저역측의 주파수 스펙트럼에 대해서는 높게 설정한 구성으로 하여도 된다.

본 발명에 따르면, 보간할 주파수 대역을 정확하게 특정하여 불필요한 보간을 행하지 않아, 음질 열화를 방지할 수 있다.

이하, 도면에 기초하여 본 발명의 실시예에 대하여 설명한다.

<본 발명의 원리>

본 발명은, 부호화되지 않은 오디오 신호(즉, 원음)는 각 주파수의 진폭 레벨이 완만하게 감쇠하는 것에 대해, 부호화에 의해 스펙트럼 성분이 씨닝된 오디오 신호는, 스펙트럼 성분이 급격하게 감쇠하는 것을 이용하고, 스펙트럼 성분의 크기 외에 스펙트럼 성분의 진폭 변동인 스펙트럼 변동의 크기를 피보간 대역의 특정에 이용함으로써, 부호화에 의해 스펙트럼 성분이 씨닝된 대역을 정확하게 특정하고, 보간을 행하는 것을 특징으로 한다.

[제1 실시예]

도 4는 본 발명의 오디오 신호 보간 장치의 제1 실시예의 구성예의 블록도를 도시한다. 도 4 중, 단자(11)에는 부호화 오디오 정보를 복호 및 신장한 시간 영역의 오디오 신호가 악곡 데이터를 복수 샘플마다 통합한 프레임 단위로 입력되고, 시간-주파수 변환부(12)에 공급된다.

시간-주파수 변환부(12)에서는, 프레임마다 시간 영역의 오디오 신호를 주파수 영역의 오디오 신호로 변환한다. 또한, 시간-주파수 변환은, 예를 들면, 고속 푸리에 변환(Fast Fourier Transform: FFT)이나 변형 이산 코사인 변환(Modified Discrete Cosine Transform: MDCT) 등의 임의의 변환 방법을 이용한다. 변환된 주파수 영역의 오디오 신호, 즉 주파수 스펙트럼은, 스펙트럼 변동 산출부(13), 보간 대역 결정부(15), 스펙트럼 보간부(16) 각각에 공급된다.

스펙트럼 변동 산출부(13)는, 시간-주파수 변환부(12)로부터의 주파수 스펙트럼과, 스펙트럼 저장부(14)로부터 판독한 전 프레임의 주파수 스펙트럼을 이용하 여 스펙트럼 변동을 구하고, 보간 대역 결정부(15)에 공급한다. 스펙트럼 변동으로서는, 과거의 프레임부터 현 프레임까지의 스펙트럼 성분의 변화량, 과거의 프레임에서의 스펙트럼 성분의 변화량(전전 프레임부터 전 프레임까지의 스펙트럼 성분 변동량)으로부터 현 프레임에서의 스펙트럼 성분의 변화량(전 프레임부터 현 프레임까지의 스펙트럼 성분 변동량)의 차, 과거의 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량(전 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분)으로부터 현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량(현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분)의 차 등이다.

또한, 스펙트럼 변동 산출부(13)는 스펙트럼 변동 산출 후, 다음의 프레임에서의 스펙트럼 변동 산출을 위해, 스펙트럼 저장부(14)에 현 프레임의 주파수 스펙트럼을 보존한다. 또한, 스펙트럼 변동은, 인접하는 복수의 스펙트럼 성분을 통합한 주파수 대역마다 구하여도 된다.

보간 대역 결정부(15)에서는, 시간-주파수 변환부(12)로부터의 주파수 스펙트럼, 및 스펙트럼 변동 산출부(13)로부터의 스펙트럼 변동으로부터, 스펙트럼 성분을 보간할 피보간 주파수를 결정한다. 피보간 주파수의 결정 방법으로서는, 예를 들면, 이하에 기재하는 바와 같은 결정 방법이 있다.

도 5는, 보간 대역 결정부(15)에서의 피보간 주파수 결정 방법의 일 형태의 플로우차트를 도시한다. 스텝 S1에서 스펙트럼 성분의 크기(진폭 레벨)가 소정의 임계치 X[㏈ov] 이하인지의 여부를 판별하고, 스텝 S2에서 스펙트럼 변동으로서의 과거의 프레임부터 현 프레임까지의 스펙트럼 성분의 변화량이 소정의 임계치 Y[㏈] 이상 감쇠하고 있는지의 여부를 판별한다. 스펙트럼 성분의 크기가 X[㏈ov] 이하, 또는, 전 프레임으로부터 Y[㏈] 이상 감쇠하고 있는 경우에 스텝 S3에서 피보간 주파수로서 특정한다. 스펙트럼 성분의 크기가 X[㏈ov]를 초과하는 경우, 또는, 스펙트럼 성분의 감쇠가 전 프레임으로부터 Y[㏈] 미만인 경우에는 스텝 S4에서 보간 불필요 대역으로서 특정한다. 또한, 예를 들면 X=-60, Y=20으로 한다.

도 6은, 보간 대역 결정부(15)에서의 피보간 주파수 결정 방법의 다른 형태의 플로우차트를 도시한다. 스텝 S11에서 스펙트럼 성분의 크기가 X[㏈ov] 이하인지의 여부를 판별하고, 스텝 S12에서 전전 프레임부터 전 프레임까지의 스펙트럼 성분 변동량 Y1[㏈]과, 전 프레임부터 현 프레임까지의 스펙트럼 성분 변동량 Y2[㏈]의 차(Y1-Y2)[㏈]가 소정의 임계치 α 이상인지의 여부를 판별한다. 스펙트럼 성분의 크기가 X[㏈ov] 이하, 또는, 차(Y1-Y2)[㏈]가 소정의 임계치 α 이상인 경우에 스텝 S13에서 피보간 주파수로서 특정한다. 스펙트럼 성분의 크기가 X[㏈ov]를 초과하는 경우, 또는, 차(Y1-Y2)[㏈]가 소정의 임계치 α 미만인 경우에는 스텝 S14에서 보간 불필요 대역으로서 특정한다. 여기에서, 임계치 α는 예를 들면 수[㏈]로 한다. 또한, 전 프레임보다 더 전의 프레임에서의 변동량과의 차를 이용하여도 된다.

도 7은, 보간 대역 결정부(15)에서의 피보간 주파수 결정 방법의 또 다른 형태의 플로우차트를 도시한다. 스텝 S21에서 스펙트럼 성분의 크기가 X[㏈ov] 이하인지의 여부를 판별하고, 스텝 S22에서 전 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분 Z1[㏈]과, 현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분 Z2[㏈]의 차(Z1-Z2)[㏈]가 임계치 β 이상인지의 여부를 판별한다. 스펙트럼 성분의 크기가 X[㏈ov] 이하, 또는, 차(Z1-Z2)[㏈]가 임계치 β 이상인 경우에 스텝 S23에서 피보간 주파수로서 특정한다. 스펙트럼 성분의 크기가 X[㏈ov]를 초과하는 경우, 또는, 차(Z1-Z2)[㏈]가 임계치 β 미만인 경우에는 스텝 S24에서 보간 불필요 대역으로서 특정한다. 여기에서, 임계치 β는 예를 들면 수[㏈]로 한다.

상기 도 5∼도 7에서는, 임계치 X, Y 각각은 고정의 값으로 하고 있지만, 주파수 대역에 따라 상이한 임계치를 이용하여도 된다. 예를 들면 오디오 신호의 고주파수 대역에서는 X=-50으로 하고, 저주파수 대역에서는 X=-60으로 하고, 고주파수 대역에서는 Y=20으로 하고, 저주파수 대역에서는 Y=15로 하는 등이다. 또한, α, β에 대해서도 고주파수 대역에서의 값에 대하여, 저주파수 대역에서의 값을 작게 하여도 된다.

또한, 현 프레임의 주파수 스펙트럼의 전체 대역에서의 오디오 신호의 평균 파워에 소정의 계수를 승산하여 임계치 X, Y, α, β를 생성하는 등, 임계치를 동적으로 변동시켜도 되고, AAC, MP3 등의 오디오 부호화 방식에 따라 상이한 임계치를 이용하여도 된다. 또한, 유저가 임계치 X, Y, α, β를 임의로 변동할 수 있도록 하여도 된다.

도 4로 되돌아가서 설명하면, 스펙트럼 보간부(16)는, 보간 대역 결정부(15)에서 보간 대역으로 결정된 스펙트럼 성분의 보간을 행한다. 보간의 방법으로서 는, 예를 들면 종래 기술과 마찬가지로, 피보간 대역으로서 결정된 현 프레임의 주파수 스펙트럼을 전 프레임의 피보간 대역과 동일한 대역의 스펙트럼 성분을 이용하여 보간하는 방법이나, 현 프레임의 저역측에 인접하는 스펙트럼 성분을 카피하여 보간하는 방법을 이용한다. 주파수-시간 변환부(17)에서는, 프레임마다 보간 후의 주파수 스펙트럼의 주파수-시간 변환을 행하여, 시간 영역의 오디오 신호로 되돌아가서, 단자(18)로부터 출력된다.

본 실시예에서는, 스펙트럼 성분의 크기 외에, 전 프레임으로부터의 스펙트럼 성분의 변동을 이용하여 피보간 주파수를 특정하여 보간을 행하기 때문에, 보간하지 않아야 하는 대역을 보간하는 것을 방지할 수 있어, 잘못된 보간에 의한 음질 열화가 생기는 일이 없고, 부호화에 의해 씨닝된 주파수 대역을 적절하게 보간하여 부호화 전의 스펙트럼에 가까운 형태로 복원하여, 음질을 개선할 수 있다.

[제2 실시예]

도 8은 본 발명의 오디오 신호 보간 장치의 제2 실시예의 구성예의 블록도를 도시한다. 도 8 중, 도 4와 동일 부분에는 동일 부호를 붙인다. 도 8에서, 단자(11)에는 부호화 오디오 정보를 복호 및 신장한 시간 영역의 오디오 신호가 악곡 데이터를 복수 샘플마다 통합한 프레임 단위로 입력되어, 시간-주파수 변환부(12)에 공급된다.

시간-주파수 변환부(12)에서는, 프레임마다 시간 영역의 오디오 신호를 주파수 영역의 오디오 신호로 변환한다. 또한, 시간-주파수 변환은, 예를 들면, 고속 푸리에 변환이나 변형 이산 코사인 변환 등의 임의의 변환 방법을 이용한다. 변환 된 주파수 영역의 오디오 신호, 즉 주파수 스펙트럼은, 스펙트럼 변동 산출부(13), 보간 대역 결정부(15), 스펙트럼 보간부(16) 각각에 공급된다.

스펙트럼 변동 산출부(13)는, 시간-주파수 변환부(12)로부터의 주파수 스펙트럼과, 스펙트럼 저장부(20)로부터 판독한 전 프레임의 주파수 스펙트럼을 이용하여 스펙트럼 변동을 구하고, 보간 대역 결정부(15)에 공급한다. 스펙트럼 변동으로서는, 과거의 프레임부터 현 프레임까지의 스펙트럼 성분의 변화량, 과거의 프레임에서의 스펙트럼 성분의 변화량(전전 프레임부터 전 프레임까지의 스펙트럼 성분 변동량)으로부터 현 프레임에서의 스펙트럼 성분의 변화량(전 프레임부터 현 프레임까지의 스펙트럼 성분 변동량)의 차, 과거의 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량(전 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분)으로부터 현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량(현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분)의 차 등이다.

또한, 스펙트럼 변동 산출부(13)는 스펙트럼 변동 산출 후, 스펙트럼 저장부(20)에 현 프레임의 주파수 스펙트럼을 보존하지 않는다. 또한, 스펙트럼 변동은, 인접하는 복수의 스펙트럼 성분을 통합한 주파수 대역마다 구하여도 된다.

보간 대역 결정부(15)에서는, 시간-주파수 변환부(12)로부터의 주파수 스펙트럼, 및 스펙트럼 변동 산출부(13)로부터의 스펙트럼 변동으로부터, 스펙트럼을 보간할 피보간 주파수를 결정한다. 피보간 주파수의 결정 방법으로서는, 도 5∼도 7에 도시하는 방법을 이용한다.

스펙트럼 보간부(16)는, 보간 대역 결정부(15)에서 보간 대역으로 결정된 스펙트럼 성분의 보간을 행한다. 보간의 방법으로서는, 예를 들면 종래 기술과 마찬가지로, 전 프레임의 동일 대역의 스펙트럼 성분을 카피하여 보간하는 방법이나, 현 프레임의 저역측에 인접하는 스펙트럼 성분을 카피하여 보간하는 방법을 이용한다. 스펙트럼 보간부(16)는 보간 후의 주파수 스펙트럼을 스펙트럼 저장부(20)에 저장한다. 주파수-시간 변환부(17)에서는, 프레임마다 보간 후의 주파수 스펙트럼의 주파수-시간 변환을 행하여, 시간 영역의 오디오 신호로 되돌아가서, 단자(18)로부터 출력된다.

본 실시예에서는, 스펙트럼 저장부에, 보간 후의 주파수 스펙트럼을 스펙트럼 저장부(20)에 저장하고, 스펙트럼 변동의 산출을, 전 프레임의 보간 후의 주파수 스펙트럼을 이용하여 행함으로써, 연속하는 복수 프레임에서 동일 대역의 스펙트럼 성분이 씨닝되었을 때에도, 적절하게 스펙트럼 성분을 보간할 수 있어, 제1 실시예보다 더 정밀도 좋게, 부호화 전의 스펙트럼을 복원하여 음질을 개선할 수 있다.

[제3 실시예]

도 9는 본 발명의 오디오 신호 보간 장치의 제3 실시예의 구성예의 블록도를 도시한다. 도 9 중, 도 4와 동일 부분에는 동일 부호를 붙인다. 여기에서, AAC나 MP3 등의 오디오 부호화에서는 시간 영역의 오디오 신호(원음)를 주파수 영역의 오디오 신호로 변환하여 스펙트럼 성분의 씨닝을 행한 후, 부호화를 행하여 부호화 오디오 정보로 하고 있다.

도 9에서, 단자(21)에는 AAC나 MP3 등의 오디오 부호화를 이용하여 압축된 부호화 오디오 정보가 입력되고, 스펙트럼 복호부(22)에 공급된다. 스펙트럼 복호부(22)에서는 부호화 오디오 정보를 복호하여 주파수 영역의 오디오 신호 즉 주파수 스펙트럼으로 하고, 프레임 단위로 스펙트럼 변동 산출부(13), 보간 대역 결정부(15), 스펙트럼 보간부(16) 각각에 공급된다.

스펙트럼 변동 산출부(13)는, 시간-주파수 변환부(12)로부터의 주파수 스펙트럼과, 스펙트럼 저장부(14)로부터 판독한 전 프레임의 주파수 스펙트럼을 이용하여 스펙트럼 변동을 구하고, 보간 대역 결정부(15)에 공급한다. 스펙트럼 변동으로서는, 과거의 프레임부터 현 프레임까지의 스펙트럼 성분의 변화량, 과거의 프레임에서의 스펙트럼 성분의 변화량(전전 프레임부터 전 프레임까지의 스펙트럼 성분 변동량)으로부터 현 프레임에서의 스펙트럼 성분의 변화량(전 프레임부터 현 프레임까지의 스펙트럼 성분 변동량)의 차, 과거의 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량(전 스펙트럼에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분)으로부터 현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량(현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 크기의 차분)의 차 등이다.

스펙트럼 보간부(16)는, 보간 대역 결정부(15)에서 보간 대역으로 결정된 스펙트럼 성분의 보간을 행한다. 보간의 방법으로서는, 예를 들면 종래 기술과 마찬가지로, 전 프레임의 동일 대역의 스펙트럼 성분을 카피하여 보간하는 방법이나, 현 프레임의 저역측에 인접하는 스펙트럼 성분을 카피하여 보간하는 방법을 이용한다. 주파수-시간 변환부(17)에서는, 프레임마다 보간 후의 주파수 스펙트럼의 주파수-시간 변환을 행하여, 시간 영역의 오디오 신호로 되돌아가서, 단자(18)로부터 출력된다.

이 실시예에서는, 주파수 영역에서 부호화된 부호화 오디오 정보에 대하여, 시간 영역의 오디오 신호로 되돌아가기 전의 주파수 영역의 오디오 신호에 대하여 보간을 행한다. 이에 의해, 시간-주파수 변환을 행하는 코스트를 삭감할 수 있음과 함께, 시간 영역의 오디오 신호로부터 주파수 스펙트럼을 분석할 때의 분석 오차가 생기지 않기 때문에, 제1 실시예보다 더 정밀도 좋게, 부호화 전의 주파수 스펙트럼을 복원하여, 음질을 개선할 수 있다.

[제4 실시예]

도 10은 본 발명의 오디오 신호 보간 장치의 제3 실시예의 구성예의 블록도를 도시한다. 도 10 중, 도 4와 동일 부분에는 동일 부호를 붙인다.

도 10에서, 단자(21)에는 AAC나 MP3 등의 오디오 부호화를 이용하여 압축된 부호화 오디오 정보가 입력되고, 스펙트럼 복호부(22)에 공급된다. 스펙트럼 복호부(22)에서는 부호화 오디오 정보를 복호하여 주파수 영역의 오디오 신호 즉 주파수 스펙트럼으로 하고, 프레임 단위로 스펙트럼 변동 산출부(13), 보간 대역 결정부(15), 스펙트럼 보간부(16) 각각에 공급된다.

보간 대역 결정부(15)에서는, 시간-주파수 변환부(12)로부터의 주파수 스펙 트럼, 및 스펙트럼 변동 산출부(13)로부터의 스펙트럼 변동으로부터, 스펙트럼을 보간할 피보간 주파수를 결정한다. 피보간 주파수의 결정 방법으로서는, 도 5∼도 7에 도시하는 방법을 이용한다.

본 실시예에서는, 스펙트럼 저장부에, 보간 후의 주파수 스펙트럼을 스펙트럼 저장부(20)에 저장하고, 스펙트럼 변동의 산출을, 전 프레임의 보간 후의 주파수 스펙트럼을 이용하여 행함으로써, 연속하는 복수 프레임에서 동일 대역의 스펙트럼 성분이 씨닝되었을 때에도, 적절하게 스펙트럼 성분을 보간할 수 있어, 제3 실시예보다 더 정밀도 좋게, 부호화 전의 스펙트럼을 복원하여 음질을 개선할 수 있다.

또한, 스펙트럼 저장부(14, 20)가 청구항 또는 부기에 기재된 스펙트럼 저장 수단에 상당하고, 스펙트럼 변동 산출부(13)가 스펙트럼 변동 산출 수단에 상당하고, 보간 대역 결정부(15)가 보간 대역 결정 수단에 상당하고, 스펙트럼 보간 부(16)가 스펙트럼 보간 수단에 상당하고, 시간-주파수 변환부(12)가 변환 수단에 상당하고, 스펙트럼 복호부(22)가 복호 수단에 상당한다.

(부기 1)

상기 주파수 스펙트럼과 상기 스펙트럼 변동을 이용하여 피보간 대역을 결정하고,

상기 현 프레임의 주파수 스펙트럼 또는 과거의 프레임의 주파수 스펙트럼을 이용하여 상기 현 프레임의 피보간 대역의 스펙트럼 성분의 보간을 행하는 것을 특징으로 하는 오디오 신호 보간 방법.

(부기 2)

을 갖는 것을 특징으로 하는 오디오 신호 보간 장치.

(부기 3)

부기 2에 기재된 오디오 신호 보간 장치에 있어서,

상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제2 임계치 이상의 감쇠일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 것을 특징으로 하는 오디오 신호 보간 장치.

(부기 4)

부기 2에 기재된 오디오 신호 보간 장치에 있어서,

상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제3 임계치 이상일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 것을 특징으로 하는 오디오 신호 보간 장치.

(부기 5)

부기 2에 기재된 오디오 신호 보간 장치에 있어서,

상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제4 임계치 이상일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 것을 특징으로 하는 오디오 신호 보간 장치.

(부기 6)

부기 2 내지 5 중 어느 하나에 기재된 오디오 신호 보간 장치에 있어서,

상기 스펙트럼 보간 수단은, 상기 피보간 대역으로서 결정된 현 프레임의 주파수 스펙트럼을, 과거의 프레임의 상기 피보간 대역과 동일한 대역의 스펙트럼 성분을 이용하여 보간하는 것을 특징으로 하는 오디오 신호 보간 장치.

(부기 7)

상기 스펙트럼 보간 수단은, 상기 피보간 대역으로서 결정된 현 프레임의 주파수 스펙트럼을, 현 프레임의 상기 피보간 대역의 저역측에 인접하는 스펙트럼 성분을 이용하여 보간하는 것을 특징으로 하는 오디오 신호 보간 장치.

(부기 8)

부기 2에 기재된 오디오 신호 보간 장치에 있어서,

입력되는 시간 영역의 오디오 신호를 주파수 영역의 오디오 신호로 변환하여 현 프레임의 주파수 스펙트럼으로서 상기 스펙트럼 변동 산출 수단에 공급하는 변환 수단을 갖는 것을 특징으로 하는 오디오 신호 보간 장치.

(부기 9)

부기 2에 기재된 오디오 신호 보간 장치에 있어서,

입력되는 부호화 오디오 정보를 복호하여 현 프레임의 주파수 스펙트럼으로서 상기 스펙트럼 변동 산출 수단에 공급하는 복호 수단을 갖는 것을 특징으로 하는 오디오 신호 보간 장치.

(부기 10)

부기 3 내지 5 중 어느 하나에 기재된 오디오 신호 보간 장치에 있어서,

상기 제1 임계치는, 고역측의 주파수 스펙트럼에 대해서 작게, 저역측의 주파수 스펙트럼에 대해서 크게 설정한 것을 특징으로 하는 오디오 신호 보간 장치.

(부기 11)

부기 2에 기재된 오디오 신호 보간 장치에 있어서,

상기 스펙트럼 변동 산출 수단에서 스펙트럼 변동을 구한 후 상기 현 프레임의 주파수 스펙트럼을 상기 스펙트럼 저장 수단에 저장하는 것을 특징으로 하는 오디오 신호 보간 장치.

(부기 12)

부기 2에 기재된 오디오 신호 보간 장치에 있어서,

상기 스펙트럼 보간 수단에서 보간을 행한 현 프레임의 주파수 스펙트럼을 상기 스펙트럼 저장 수단에 저장하는 것을 특징으로 하는 오디오 신호 보간 장치.

(부기 13)

부기 3에 기재된 오디오 신호 보간 장치에 있어서,

상기 제2 임계치는, 고역측의 주파수 스펙트럼에 대해서 크게, 저역측의 주 파수 스펙트럼에 대해서 작게 설정한 것을 특징으로 하는 오디오 신호 보간 장치.

(부기 14)

부기 4에 기재된 오디오 신호 보간 장치에 있어서,

상기 제3 임계치는, 고역측의 주파수 스펙트럼에 대해서 크게, 저역측의 주파수 스펙트럼에 대해서 작게 설정한 것을 특징으로 하는 오디오 신호 보간 장치.

(부기 15)

부기 5에 기재된 오디오 신호 보간 장치에 있어서,

상기 제4 임계치는, 고역측의 주파수 스펙트럼에 대해서 크게, 저역측의 주파수 스펙트럼에 대해서 작게 설정한 것을 특징으로 하는 오디오 신호 보간 장치.

(부기 16)

부기 5에 기재된 오디오 신호 보간 장치에 있어서,

상기 제1 내지 제4 임계치를, 현 프레임의 주파수 스펙트럼의 전체 대역에서의 오디오 신호의 평균 파워에 따라서 가변하는 것을 특징으로 하는 오디오 신호 보간 장치.

도 1은 스펙트럼 성분의 씨닝을 설명하기 위한 도면.

도 2는 스펙트럼 성분의 씨닝을 설명하기 위한 도면.

도 3은 스펙트럼 성분의 보간을 설명하기 위한 도면.

도 4는 본 발명의 오디오 신호 보간 장치의 제1 실시예의 구성예의 블록도.

도 5는 피보간 주파수 결정 방법의 일 형태의 플로우차트.

도 6은 피보간 주파수 결정 방법의 다른 형태의 플로우차트.

도 7은 피보간 주파수 결정 방법의 또 다른 형태의 플로우차트.

도 8은 본 발명의 오디오 신호 보간 장치의 제2 실시예의 구성예의 블록도.

도 9는 본 발명의 오디오 신호 보간 장치의 제3 실시예의 구성예의 블록도.

도 10은 본 발명의 오디오 신호 보간 장치의 제4 실시예의 구성예의 블록도.

<도면의 주요 부분에 대한 부호의 설명>

12 : 시간-주파수 변환부

13 : 스펙트럼 변동 산출부

14, 20 : 스펙트럼 저장부

15 : 보간 대역 결정부

16 : 스펙트럼 보간부

17 : 주파수-시간 변환부

22 : 스펙트럼 복호부

Claims

입력되는 오디오 신호의 현 프레임의 주파수 스펙트럼과 스펙트럼 저장 수단에 저장되어 있는 과거의 프레임의 주파수 스펙트럼의 각 스펙트럼 성분의 변동인 스펙트럼 변동을 구하고,

상기 주파수 스펙트럼과 상기 스펙트럼 변동을 이용하여 피보간 대역을 결정하고,

상기 현 프레임의 주파수 스펙트럼 또는 과거의 프레임의 주파수 스펙트럼을 이용하여 상기 현 프레임의 피보간 대역의 스펙트럼 성분의 보간을 행하는 것을 특징으로 하는 오디오 신호 보간 방법.
입력되는 오디오 신호의 현 프레임의 주파수 스펙트럼과 스펙트럼 저장 수단에 저장되어 있는 과거의 프레임의 주파수 스펙트럼의 각 스펙트럼 성분의 변동인 스펙트럼 변동을 구하는 스펙트럼 변동 산출 수단과,

상기 주파수 스펙트럼과 상기 스펙트럼 변동을 이용하여 피보간 대역을 결정하는 보간 대역 결정 수단과,

상기 현 프레임의 주파수 스펙트럼 또는 과거의 프레임의 주파수 스펙트럼을 이용하여 상기 현 프레임의 피보간 대역의 스펙트럼 성분의 보간을 행하는 스펙트럼 보간 수단

을 갖는 것을 특징으로 하는 오디오 신호 보간 장치.
제2항에 있어서,

상기 스펙트럼 변동 산출 수단은, 과거의 프레임부터 현 프레임까지의 스펙트럼 성분의 변화량을 상기 스펙트럼 변동으로서 구하고,

상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제2 임계치 이상의 감쇠일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 것을 특징으로 하는 오디오 신호 보간 장치.
제2항에 있어서,

상기 스펙트럼 변동 산출 수단은, 과거의 프레임에서의 스펙트럼 성분의 변화량으로부터 현 프레임에서의 스펙트럼 성분의 변화량의 차를 상기 스펙트럼 변동으로서 구하고,

상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제3 임계치 이상일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 것을 특징으로 하는 오디오 신호 보간 장치.
제2항에 있어서,

상기 스펙트럼 변동 산출 수단은, 과거의 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량으로부터 현 프레임에서의 그 스펙트럼 성분과 인접 스펙트럼 성분의 변화량의 차를 상기 스펙트럼 변동으로서 구하고,

상기 보간 대역 결정 수단은, 스펙트럼 성분의 크기가 제1 임계치 이하이고, 또한, 상기 스펙트럼 변동이 제4 임계치 이상일 때 그 스펙트럼 성분을 피보간 대역으로서 결정하는 것을 특징으로 하는 오디오 신호 보간 장치.
제2항 내지 제5항 중 어느 한 항에 있어서,

상기 스펙트럼 보간 수단은, 상기 피보간 대역으로서 결정된 현 프레임의 주파수 스펙트럼을, 과거의 프레임의 상기 피보간 대역과 동일한 대역의 스펙트럼 성분을 이용하여 보간하는 것을 특징으로 하는 오디오 신호 보간 장치.
제2항 내지 제5항 중 어느 한 항에 있어서,

상기 스펙트럼 보간 수단은, 상기 피보간 대역으로서 결정된 현 프레임의 주파수 스펙트럼을, 현 프레임의 상기 피보간 대역의 저역측에 인접하는 스펙트럼 성분을 이용하여 보간하는 것을 특징으로 하는 오디오 신호 보간 장치.
제2항에 있어서,

입력되는 시간 영역의 오디오 신호를 주파수 영역의 오디오 신호로 변환하여 현 프레임의 주파수 스펙트럼으로서 상기 스펙트럼 변동 산출 수단에 공급하는 변환 수단을 갖는 것을 특징으로 하는 오디오 신호 보간 장치.
제2항에 있어서,

입력되는 부호화 오디오 정보를 복호하여 현 프레임의 주파수 스펙트럼으로서 상기 스펙트럼 변동 산출 수단에 공급하는 복호 수단을 갖는 것을 특징으로 하는 오디오 신호 보간 장치.
제3항 내지 제5항 중 어느 한 항에 있어서,

상기 제1 임계치는, 고역측의 주파수 스펙트럼에 대해서는 낮게, 저역측의 주파수 스펙트럼에 대해서는 높게 설정한 것을 특징으로 하는 오디오 신호 보간 장치.