KR100547898B1 - 오디오 정보 제공 시스템 및 그 방법 - Google Patents

오디오 정보 제공 시스템 및 그 방법 Download PDF

Info

Publication number
KR100547898B1
KR100547898B1 KR1020040006687A KR20040006687A KR100547898B1 KR 100547898 B1 KR100547898 B1 KR 100547898B1 KR 1020040006687 A KR1020040006687 A KR 1020040006687A KR 20040006687 A KR20040006687 A KR 20040006687A KR 100547898 B1 KR100547898 B1 KR 100547898B1
Authority
KR
South Korea
Prior art keywords
weight
signal
sound source
audio information
music
Prior art date
Application number
KR1020040006687A
Other languages
English (en)
Other versions
KR20050078524A (ko
Inventor
박상환
Original Assignee
(주)위트콤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)위트콤 filed Critical (주)위트콤
Priority to KR1020040006687A priority Critical patent/KR100547898B1/ko
Publication of KR20050078524A publication Critical patent/KR20050078524A/ko
Application granted granted Critical
Publication of KR100547898B1 publication Critical patent/KR100547898B1/ko

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F21LIGHTING
    • F21VFUNCTIONAL FEATURES OR DETAILS OF LIGHTING DEVICES OR SYSTEMS THEREOF; STRUCTURAL COMBINATIONS OF LIGHTING DEVICES WITH OTHER ARTICLES, NOT OTHERWISE PROVIDED FOR
    • F21V11/00Screens not covered by groups F21V1/00, F21V3/00, F21V7/00 or F21V9/00
    • F21V11/06Screens not covered by groups F21V1/00, F21V3/00, F21V7/00 or F21V9/00 using crossed laminae or strips, e.g. grid-shaped louvers; using lattices or honeycombs
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F21LIGHTING
    • F21VFUNCTIONAL FEATURES OR DETAILS OF LIGHTING DEVICES OR SYSTEMS THEREOF; STRUCTURAL COMBINATIONS OF LIGHTING DEVICES WITH OTHER ARTICLES, NOT OTHERWISE PROVIDED FOR
    • F21V17/00Fastening of component parts of lighting devices, e.g. shades, globes, refractors, reflectors, filters, screens, grids or protective cages
    • F21V17/10Fastening of component parts of lighting devices, e.g. shades, globes, refractors, reflectors, filters, screens, grids or protective cages characterised by specific fastening means or way of fastening
    • F21V17/104Fastening of component parts of lighting devices, e.g. shades, globes, refractors, reflectors, filters, screens, grids or protective cages characterised by specific fastening means or way of fastening using feather joints, e.g. tongues and grooves, with or without friction
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F21LIGHTING
    • F21WINDEXING SCHEME ASSOCIATED WITH SUBCLASSES F21K, F21L, F21S and F21V, RELATING TO USES OR APPLICATIONS OF LIGHTING DEVICES OR SYSTEMS
    • F21W2121/00Use or application of lighting devices or systems for decorative purposes, not provided for in codes F21W2102/00 – F21W2107/00

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 이동통신망을 통한 오디오 정보 제공 시스템 및 그 방법에 관련되며, 좀 더 상세하게는 단말기에서 청취되는 음질을 향상시키도록 개선된 오디오 정보 제공 시스템 및 그 방법에 관련된다.
본 발명에 따른 오디오 정보 제공 시스템은 이동통신 시스템으로 음원을 송출하기 전에 음원 신호에서 높은 에너지를 포함한 주파수 성분을 강조하는 전처리를 부가한다. 이때 높은 에너지 성분을 포함한 주파수 성분에 대한 가중치는 전처리 전후 음악간의 상관관계를 최대화시키는 값으로 결정된다. 이 같은 특징적인 양상에 따라 본 발명에 따른 오디오 정보 제공 시스템은 음성 전용으로 최적화된 이동통신 단말기의 코덱을 통해서도 양호한 음질의 음악 서비스를 제공하는 것이 가능하다.
또한 본 발명의 오디오 정보 제공 시스템은 음악 신호의 시작 부분에 에너지가 낮은 신호구간을 적어도 하나 이상 부가하여 전송함에 의해 끊김 현상과 같은 음질 열화를 일으키는 전송률 저하를 방지하는 것이 가능하다.
이동통신, 휴대폰, 음성, 음악, 묵음, 음질, EVRC, 가변률, 오디오

Description

오디오 정보 제공 시스템 및 그 방법{Method and system for providing audio information}
도 1은 본 발명의 일 실시예에 따른 오디오 정보 제공 시스템을 포함한 이동통신 시스템을 개략적으로 도시한다.
도 2는 본 발명의 일 실시예에 따른 오디오 정보 제공 시스템(10)의 전체적인 구성을 개략적으로 도시한다.
도 3은 도 2에서 본 발명의 일 실시예에 따른 주파수 필터(310)의 개략적인 구성을 도시한다.
도 4는 공지된 EVRC 인코더의 전체적인 구성을 개략적으로 도시한다.
도 5는 공지된 EVRC 인코더의 기본이 되는 CELP 코덱의 개략적인 구성을 도시한다.
도 6a는 예시적인 음성 신호와 음악 신호를 시간 영역에서 도시한다.
도 6b는 예시적인 음성 신호와 음악 신호를 주파수 영역에서 도시한다.
도 7은 EVRC 코덱을 통과하기 전과 후의 예시적인 음악 신호를 시간 영역에서 도시한다.
도 8은 예시적인 음악 신호에 대해 단기 예측 이득 및 장기 예측 이득과, 코드북 이득의 변화를 시간 영역에서 도시한다.
도 9는 본 발명의 일 실시예에 따른 주파수 인덱스별 가중치의 관계를 도시한다.
도 10a, 10b는 예시적인 음악 샘플들에 대해 묵음 프레임을 추가한 경우와 그렇지 않은 경우의 문턱치의 변화 및 전송률의 변화를 대비하여 도시한 그래프이다.
도 11a, 11b, 11c는 각각 예시적인 음악 샘플들에 대해 두드러진 주파수 성분을 강조하는 전처리를 부가한 경우와 그렇지 않은 경우의 단기 예측 이득값, 장기 예측 이득값, 코드북 이득값의 변화를 대비하여 도시한 그래프이다.
도 12는 예시적인 음악 샘플들에 대해 두드러진 주파수 성분을 강조하는 전처리를 부가한 경우와 그렇지 않은 경우의 EVRC 출력을 시간 영역에서 대비하여 도시한 그래프이다.
<도면의 주요부분에 대한 부호의 설명>
10 : 오디오 정보 제공 시스템 20 : 무선통신 시스템
30 : 이동통신 단말기
110 : 음원 데이터베이스 100 : 음원 제공부
300 : 전처리부 310 : 주파수 필터
330 : 신호 삽입부 500 : 컨텐츠 제공부
311 : 푸리에 변환부 312 : 분류기
313 : 파라메터 산출부 314 : 가중치 결정부
315 : 가중치 처리부 316 : 가중 필터부
317 : 메모리 318 : 역 푸리에 변환부
본 발명은 이동통신망을 통한 오디오 정보 제공 시스템 및 그 방법에 관련되며, 좀 더 상세하게는 단말기에서 청취되는 음질을 향상시키도록 개선된 오디오 정보 제공 시스템 및 그 방법에 관련된다.
이동통신 서비스 중 음성 통화 채널을 통한 음악 전송 서비스가 증가하고 있다. 고전적인 자동응답 시스템을 통한 음악 서비스 외에도 최근 들어서는 착신음 대신에 음악을 전송하는 착신대기 중 음악 제공 서비스나 통화중 배경음악을 제공하는 서비스 등이 널리 보급되고 있다. 기존의 오디오 플레이어에 익숙한 고객들은 이 같은 서비스를 통해 제공되는 음악의 음질에 대해 불만이 높아지고 있다. 특히나 이동통신 시스템의 경우 음성 전용으로 최적화된 EVRC(Enhanced Variable Rate Codec) 코덱을 통해 이 같이 전송된 음악이 재생되므로 유선 전화망에 비해서도 훨씬 음질이 떨어지게 된다.
종래 이 같은 문제점을 해결하기위한 음질 개선 방법으로 피치 하모닉스 강화(Pitch Harmonics Enhancement) 방법이 있다. 이는 장기 예측 이득(Long-term Prediction Ganin)을 높여 전송률 저하를 방지하는 방법이다. 이 방법은 음악 신호의 약한 주기적 성분을 강화시켜 전송률 결정 문턱치(threshold)의 증가를 줄이는 것이나 피치 하모닉스(pitch harmonics) 강화 정도의 결정 기준이 없고 가변 전 송률 음성 코덱의 특징 중 일부만 고려되어 음질 개선 효과가 크지 않다.
본 발명은 이 같은 상황에서 도출된 것으로, 이동통신 시스템을 통해 제공되는 오디오 정보의 음질을 향상시키는 것을 목적으로 한다.
상기 목적을 달성하기 위한 본 발명의 일 양상에 따른 오디오 정보 제공 시스템은 이동통신 시스템으로 음원을 송출하기 전에 음원 신호에서 높은 에너지를 포함한 주파수 성분을 강조하는 전처리를 부가하는 것을 특징으로 한다.
본 발명의 추가적인 양상에 따라 높은 에너지 성분을 포함한 주파수 성분에 대한 가중치는 전처리 전후 음악간의 상관관계를 최대화시키는 값으로 결정된다.
본 발명의 이 같은 특징적인 양상에 따라 본 발명에 따른 오디오 정보 제공 시스템은 음성 전용으로 최적화된 이동통신 단말기의 코덱을 통해서도 양호한 음질의 음악 서비스를 제공하는 것이 가능하다.
본 발명의 추가적인 양상에 따른 오디오 정보 제공 시스템은 음악 신호의 시작 부분에 에너지가 낮은 신호구간을 적어도 하나 이상 부가하여 전송하는 것을 특징으로 한다.
본 발명의 이 같은 특징적인 양상에 따라 본 발명에 따른 오디오 정보 제공 시스템은 끊김 현상과 같은 음질 열화를 일으키는 전송률 저하를 방지하는 것이 가능하다.
이동통신 시스템을 통해 제공되는 음원은 전송 시스템 및 단말기의 음성 코 덱을 거치면서 음질의 열화가 심해진다. 이동통신 시스템을 포함한 많은 음성(vocie) 시스템은 전송 데이터를 줄이기 위해 CELP(Code Excited Linear prediction) 방식의 코덱을 채택하고 있다. 본 명세서에 있어서, 음성 시스템이란 용어는 이동통신 시스템과 같은 음성 통화 시스템을 비롯하여 음성을 전송하거나 재생하는 시스템을 포괄하도록 해석된다. 본 발명자는 음성 신호와 음악 신호의 특성의 차이를 분석하고, 음성 시스템에 채택되는 음성 코덱의 인코딩 과정을 분석하여 음질 저하의 원인을 파악하였다. 먼저 본 발명은 음성 시스템에 채택되는 가변 전송률 코덱의 전송률 결정 알고리즘 분석을 바탕으로 전송률 저하로 인한 음질 열화를 막기 위한 전치리 기법을 제공한다. 나아가 본 발명은 CELP 알고리즘 분석을 통하여 최고 전송률 조건에서도 발생하는 음질 열화를 줄이는 방법을 제시하였다.
본 발명의 기술적 구성을 설명하기에 앞서 본 발명에 따른 음성 서비스 제공 시스템이 적용되는 음성 코덱의 특성을 분석하여 본 발명의 이해를 돕고자 한다.
[음성 코덱의 개요]
[전송률의 결정]
EVRC(Enhanced Variable rate codec)는 CDMA(Code division Multiple Access) 환경에서 사용되는 가변 전송률 음성 코덱으로 CELP(Code Excited Linear Prediction) 방식을 기반으로 한다. 도 4는 본 발명이 적용되는 EVRC 코덱의 전체적인 구성을 개략적으로 도시한다. 도시된 바와 같이 이동통신 시스템에서는 일정 수준의 통화 품질을 유지하면서 자원을 효율적으로 사용하기 위하여 가변 전송률 코덱이 사용된다. EVRC 코덱에서는 전송률이 Rate 1 (171 bits/packet), Rate 1/2 (80 bits/packet), 그리고 Rate 1/8 (16 bits/packet) 전송률 중의 하나로 모델 파라메터 추정(Model Parameter Estimation) 알고리즘에 따라 결정된다. 전송률의 결정은 아래의 파라미터들에의해 이루어진다.
(1) 대역 에너지(Band Energy ,BE)
프레임의 에너지는 두 개의 대역 f(1) = 0.3~2.0 kHz 과 f(2) = 2.0~4.0 kHz 에서 다음과 같이 계산된다.
Figure 112004004284949-pat00001
(2.7)
여기서,
Figure 112004004284949-pat00002
Figure 112004004284949-pat00003
: 대역 통과 필터 i 의 임펄스 응답, i = 1, 2
Figure 112004004284949-pat00004
: 자기 상관 순열(autocorrelation sequence)
(2) 결정 문턱치(Determination Thresholds T1, T2)
전송률 결정에서 대역 에너지와의 비교값이 되는 T1과 T2는 다음과 같이 이전 프레임의 SNR과 배경 잡음 추정치(Background Noise Estimate)로 표현된다.
Figure 112004004284949-pat00005
(2.2)
Figure 112004004284949-pat00006
(2.3)
여기서,
Figure 112004004284949-pat00007
Figure 112004004284949-pat00008
m : 현재 프레임
Figure 112004004284949-pat00009
: 신호 에너지 추정치(Signal Energy Estimate)
Figure 112004004284949-pat00010
: 배경 에너지 추정치(Background Energy Estimate)
(3) 스무딩된 대역 에너지 (Smoothed Band Energy)
배경 에너지 추정치(Background Energy Estimate)와 신호 에너지 추정치(Signal Energy Estimate) 계산에 필요한 것으로 다음과 같이 계산된다.
Figure 112004004284949-pat00011
(2.4)
여기서,
Figure 112004004284949-pat00012
(4) 배경 잡음 추정치(Background Noise Estimate)
배경 잡음 추정치가 계산되는 방법을 pseudo-code로 정리하면 아래와 같다.
{
if (β<0.3 for 8 or more consecutive frames)
Bf(i)(m) = min { Esm(m), Bf(i)(0), max {1.03Bf(i)(m-1), Bf(i)(m-1)+1 } }
else {
if ( SNR(m-1) > 3 )
Bf(i)(m) = min { Esm(m), Bf(i)(0), max {1.00547Bf(i)(m-1), Bf(i)(m-1)+1 } }
else
Bf(i)(m) = min { Esm(m), Bf(i)(0), Bf(i)(m-1) }
}
if ( Bf(i)(m) < lownoisi(i) ) Bf(i)(m) = lownoise(i)
}
여기서 β : 장기 예측 이득값
Bf(i)(0) = 80954304
lownoisi(1) = 160.0 , lownoisi(2) = 80.0
(5) 신호 에너지 추정치(Signal Energy Estimate)
신호 에너지 추정치는 장기 예측 이득(long-term prediction gain)이 0.5보다 큰 프레임이 다섯 개 이상인 경우 다음과 같이 계산된다.
Figure 112004004284949-pat00013
(2.5)
그 외의 경우는 다음과 같이 계산된다.
Figure 112004004284949-pat00014
(2.6)
초기값은 각각
Figure 112004004284949-pat00015
= 51200000과
Figure 112004004284949-pat00016
=5120000이다.
이상과 같이 계산된 파라메터들로부터 전송률은 두 대역 (f(1), f(2))에서 각각 정해진 후 둘 중 높은 것이 전송률로 결정된다. Table 1과 같이 전송률은 대역 에너지와 문턱치들과의 비교를 통하여 결정되게 된다.
Figure 112004004284949-pat00017
음악 신호의 경우 음성신호와 달리 주기적 성분이 적고 휴지기가 없어 배경 잡음 추정치가 지속적으로 증가한다. 이에 따라 최고 전송률로 인코딩되어야 할 음악 신호가 낮은 전송률로 인코딩되게 되고 따라서 끊김 현상과 같은 음질저하가 발생하게 된다. 통상 음악 전송 서비스에 사용되는 약 40초 구간 내에서의 배경 잡음 추정치 증가가 전송률 저하를 일으키는 값까지 증가하는 것을 방지하는 것이 요구된다. 본 발명은 이 같은 분석에 기초하여 음악의 시작 부분에 묵음 구간을 추가함으로써 배경 잡음 추정치가 가장 낮은 값으로 시작되게 한다. 이에 따라 전송률 저하를 방지하여 끊김 현상을 방지할 수 있다.
[인코딩방식]
본 발명을 이해하기 위해서는 EVRC방식의 인코딩 과정을 이해할 필요가 있다. 도 5는 본 발명이 적용되는 EVRC 코덱의 인코더의 구성을 개략적으로 도시한다. EVRC 인코딩의 기본이 되는 CELP 인코딩은 단기 예측 (Short-term Prediction), 장기 예측(Long-term Prediction) 그리고 코드북 탐색(Codebook Search)으로 이루어 진다. 도 5의 1/A(z)는 단기 예측 (Short-term Prediction)에 의한 선형예측코딩(LPC : Linear Predictive Coding) 합성 필터(Synthesis Filter) 이고 1/P(z)는 단기 예측(Long-term Prediction)에 의한 피치 합성 필터(Pitch Synthesis Filter)이다. 코드북은 합성 필터들의 여기 입력(excitation)으로 합성에 의한 분석(Analysis-by-Synthesis) 방식의 페루프(closed loop)에 의하여 코드북 인덱스와 이득(gain) 계수값들이 결정된다.
(1) 단기 예측(Short-term Prediction)
선형 예측으로 입력 신호를 나타내는 것으로 EVRC에서는 이전 10개 샘플로 현재 샘플을 나타낸다. 식 (2.5)와 같이 입력 샘플 s(n)은 선형 예측 부분인
Figure 112004004284949-pat00018
과 오차 부분 e(n) 으로 나타낼 수 있으며
Figure 112004004284949-pat00019
~
Figure 112004004284949-pat00020
의 계수는 더빈의 회귀법(Durbin’s Recursion)에 의하여 구할 수 있다.
Figure 112004004284949-pat00021
(2.7)
여기서,
Figure 112004004284949-pat00022
이다.
주파수 영역에서 본다면 스펙트럼의 개형을 결정짓는 것으로 식(2.6)의 분석필터(Analysis Filter)의 임펄스 응답(impulse response)은 입력 신호 스펙트럼의 윤곽선(envelop)을 나타내게 된다.
Figure 112004004284949-pat00023
(2.8)
(2) 장기 예측(Long-term Prediction)
장기 예측은 단기 예측의 오차 e(n) 에 남아있는 주기적 성분을 모델링 하기 위한 것으로 식(2.9) 의 장기예측 이득과 피치(pitch), 즉 지연(delay) 값 τ을 구하는 것이다.
Figure 112004004284949-pat00024
(2.9)
(3) 코드북 탐색(Codebook Search)
합성 필터(Synthesis Filter)의 여기 입력(excitation)을 구하는 것으로 Rate 1의 경우 서브 프레임(160샘플 길이의 한 프레임을 53, 53, 54개의 샘플로 이루어진 3개 프레임으로 나눈 것)마다 최대 8개의 펄스로 코드북이 이루어져 있다.
이하에서는 음성 신호와 음악 신호의 특성의 차이를 분석하여 설명한다. 음악 신호는 음성 신호와 다른 특징을 갖고 있어 음성 코덱을 통과했을 경우 음질 열화가 크게 된다. 시간 영역에서 비교해 보면 도 6a에서 도시된 바와 같이 음성 신호에서는 에너지가 낮은 구간이 존재하는 것을 알 수 있으나 일반적으로 음악 신호에서는 이러한 휴지기가 없다. 주파수 영역에서 두 신호를 비교하면, 음성 신호와 음악 신호의 주기적 성분의 정도에 차이가 있음을 알 수 있다. 도 6b의 파워 스펙트럼을 보면 알 수 있듯이 음성 신호는 유성음의 경우 주기적 성분이 크기 때문에 하나의 큰 피크가 있고 몇 개의 주요 주파수 성분이 있으나 음악의 경우 일반적으로 주기적 성분이 적으며 여러 주파수 성분이 있음을 알 수 있다.
다음으로 EVRC 코덱의 특성 상 음악 신호는 전송률 저하를 일으켜 끊김 현상을 발생한다. 즉, 음악 신호는 음성 신호와 다르게 주기적 성분이 적고 휴지기가 거의 없기 때문에 전송률 결정의 주요 파라 미터인 배경 잡음 추정치(Background Noise Estimate)가 감소하는 경우가 없이 지속적으로 증가하게 된다. 이는 전송률 저하를 유발하게 되고 음질 열화를 일으킨다. 전송률 결정의 임계치 T1, T2는 식(2.2)와 식(2.3)에서와 같이 이전 프레임의 SNR과 배경 잡음 추정치 B에 영향을 받게 된다. 여기에서 SNR에 따라 계수 k1과 k2는 7.0~79.6이고 B는 80.0~80954304 이다. 따라서 전송률 결정은 배경 잡음 추정치에 주로 영향을 받는 것을 알 수 있다. pseudo-code 로 전술한 갱신 알고리즘을 보면 장기 예측 이득값이 클수록 증가 폭이 적으며 현재 프레임의 스무딩된 대역 에너지(Smoothed Band Energy)가 이전 프레임의 배경 잡음 추정치 보다 적을 경우를 제외하고는 지속적으로 증가하는 것을 알 수 있다. 즉 배경 잡음 추정치가 감소하는 경우는
Figure 112004004284949-pat00025
인 경우
Figure 112004004284949-pat00026
로 되는 경우 밖에 없다. 따라서 음악의 경우 주기적 성분이 적고 일반적으로 낮은 에너지 구간, 즉 묵음(silence)과 같은 휴지기가 거의 없기 때문에 배경 잡음 추정치가 지속적으로 증가하게 된다. 이에 따라 EVRC 코덱의 전송률 결정 알고리즘은 낮은 전송률로 결정하게 되어 오히려 일반 음성 보다 더 낮은 전송률로 전송되면서 끊김 현상 같은 음질 저하를 발생시킨다.
통상 음악 전송 서비스에 사용되는 약 40초 구간 내에서의 배경 잡음 추정치 증가가 전송률 저하를 일으키는 값까지 증가하는 것을 방지하는 것이 요구된다. 본 발명은 이 같은 분석에 기초하여 음악의 시작 부분에 묵음 구간을 추가함으로써 배경 잡음 추정치가 가장 낮은 값으로 시작되게 한다. 실험 결과에 따르면 약 40초 구간의 음악의 경우 시작 부분에 2개의 묵음 프레임을 추가함에 의해 전송률저하를 실질적을 방지하여 끊김 현상을 방지하는 것이 가능하였다. 더 많은 묵음 프레임의 추가는 전송률 저하 방지에 큰 도움이 되지 않았다. 그러나 본 발명은 이에 한정되지 않으며, 더 음악 전송 중에 주기적으로 혹은 판단 알고리즘을 통하여 적당한 시점에 묵음 프레임을 추가하는 것도 포괄한다. 나아가 묵음 프레임이 아 니라 에너지가 아주 낮은 프레임이라면 어느 형태도 무방하다.
다음으로 EVRC 인코딩 과정의 특성 상 음악 신호는 코딩 손실이 커서 음성 신호에 비해 음질 저하가 크게 된다. EVRC 인코딩 과정은 선형 예측의 파라미터를 구하고 여기 신호로서 코드북 인덱스를 결정하는 것이다. 음성 신호는 선형 예측에 의하여 나타내고 잔류 신호(예측 오차)를 주어진 코드북의 인덱스와 이득으로 표현하였을 때 오차(원래 음성 신호와 합성된 음성 신호와의 차이)가 적으므로 음성 코덱으로 만족할만한 수준의 음질을 높은 압축률과 함께 달성할 수 있다. 이는 음성 코덱의 인코딩-디코딩 과정이 음성의 발성 원리를 모델링으로 만들어 졌다는 것으로도 예측 가능하다. 그러나 음악의 경우 음성과는 다른 특성을 갖고 있기 때문에 음성 코덱 통과 시 음질 저하가 크게 된다.
음악이 음성 코덱의 인코딩 과정을 거치는 것을 분석해 보면 음질 저하가 큰 부분은 단기 예측 필터와 장기 예측 필터를 거친 후에도 잔류 신호가 크기 때문에 양자화되어 인코딩 전의 코드북 이득이 크게 되고 따라서 인코딩 되었을 때는 실제 여기 신호(excitation)를 나타내지 못하게 된다. 따라서 합성된(디코딩된) 음악은 볼륨의 감소가 크게 되고 음질의 저하도 크다.
음악의 EVRC 통과에 따른 신호 변화 예를 도 7과 도 8에 나타냈었다. 도7에서는 EVRC 통과로 볼륨의 감소가 큰 것을 알 있다. EVRC 입력 대 출력의 파워비는 0.4351로 듣기를 통한 평가와 비교해 보았을 때 음질 저하가 큰 부분에서 볼륨 감소가 크게 일어났다.
도 8에는 선형 예측 이득(Linear Prediction Gain)과 코드북 이득(Codebook Gain)을 나타내었다. 단기 예측 이득(Short-term Prediction Gain)은 다음 식(3.1)과 같이 예측기(Predictor) 입력 신호 s(n) 과 예측 오차 e(n) 으로 나타내지며 이것은 단기 예측(Short-term Prediction)의 성능을 나타내고 음질 저하가 큰 부분에서 낮은 값을 가졌다.
Figure 112004004284949-pat00027
(3.1)
장기 예측 이득값(Long-term Prediction Gain_은 신호의 주기적 성분을 나타내며 음질 저하가 큰 부분에서 주기적 성분이 낮은 것을 알 수 있다. 장기 예측 이득값은 식(3.2)와 같이 서브프레임의 데이터와 이것의 지연(delay)되고 스케일(scaled)된 신호와의 차이(E(τ,β))를 최소화 시키는 것이다.
Figure 112004004284949-pat00028
(3.2)
여기서, N = 서브 프레임 싸이즈, τ = 피치(혹은 지연), β = 이득값 이다.
따라서 신호의 주기적인 성분이 크다면 큰 β 값을 갖게 된다. 도 8의 (b) 그래프에서 보면 음질이 열화가 심한 부분에서 단기 예측 이득값에서와 같이 낮은 β 값을 갖는 것을 알 수 있다.
코드북 이득값은 식(3.3)과 같이 나타내어지며 도 8의 (c) 그래프는 인코딩된 코드북 이득값의 예이다.
Figure 112004004284949-pat00029
(3.3)
여기서,
Figure 112004004284949-pat00030
= 타겟 신호와 코드북 벡터와의 곱(product of target signal and codebook vector)
Figure 112004004284949-pat00031
= 코드북 벡터의 제곱값(square norm of codebook vector)
여기에서 음질 열화가 커 선형 이득이 낮은 구간에서 최대값을 갖는데 인코딩되기 전의 값은 이보다 크지만 인코딩에 의해 최대값으로 포화된 것이다. 이것은 합성(디코딩)된 신호와 EVRC 입력신호와의 차이를 크게 만들고 이는 음질 저하를 의미한다. 즉, 음악 신호의 경우 일반적으로 주기적 성분이 적고 여러 주파수 성분을 갖고 있어 선형 예측과 코드북 탐색으로 인코딩된 파라미터로 신호를 합성하게 되는 과정에서 선형 예측 이득이 낮아 코드북 이득값이 포화되면서 음질 열화가 심하게 발생한다. 본 발명자는 이 같은 상황을 개선하기 위해 높은 에너지 성분을 갖는 주파수 성분을 강조함으로써 이 같은 현상을 방지하여 음질 열화를 개선시켰다.
이상에서 본 발명자가 본 발명에 이르기 위해 분석한 결과를 정리하였다. 이하에서는 전술한 그리고 추가적인 본 발명의 양상들을 첨부된 도면을 참조하여 기술되는 바람직한 실시예를 통하여 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 오디오 정보 제공 시스템을 포함한 이동통신 시스템을 개략적으로 도시한다. 도시된 바와 같이 본 발명의 일 실시예에 따 른 오디오 정보 제공 시스템을 포함한 이동통신 시스템은 오디오 정보 제공 시스템(10)과, 무선통신 시스템(20) 및 이동통신 단말기(30)를 포함하여 구성된다. 오디오 정보 제공 시스템은 예를 들어 교환기에 연결된 자동응답 장비일 수 있다. 또다른 실시예에 있어서, 오디오 정보 제공 시스템은 이동통신 교환망에 연결되어 예를 들면 링백톤을 대체하는 음악을 제공하는 음원 서버 및 지능망 장비로 구성될 수 있다. 무선 통신 시스템(20)은 오디오 정보 제공 시스템에서 출력되는 음성 신호를 EVRC 인코더로 인코딩하여 송신하는 교환기와 기지국 장비를 포함하여 구성된다. 이때 EVRC 인코더는 밴드 에너지와 기준치와의 비교에 의해 전송률이 결정되는 가변율 코덱이다. 이동통신 단말기(30)는 무선 통신 시스템(20)을 통한 음성 통화를 지원하는 단말기이다. 이 같은 무선 통신 시스템(20) 및 이동통신 단말기(30)는 당업계에서 공지된 것이므로 상세한 설명은 생략한다.
도 2는 본 발명의 일 실시예에 따른 오디오 정보 제공 시스템(10)의 전체적인 구성을 개략적으로 도시한다. 오디오 정보 제공 시스템(10)은 가변 전송률로 전송하는 음성 시스템을 통한 음악 서비스를 위해 제공된다. 도시된 바와 같이 본 실시예에 따른 오디오 정보 제공 시스템(10)은 지정받은 음원 신호를 출력하는 음원 제공부(100)와, 음원 제공부(100)에서 출력된 음원 신호에서 높은 에너지를 포함한 주파수 성분을 강조하여 출력하는 전처리부(300)와, 전처리부(300)에서 출력된 음원 신호를 음성 시스템(20)으로 제공하는 컨텐츠 제공부(500)를 포함한다.
음원 제공부(100)는 음원 데이터베이스(110)에서 지정된 음원을 추출(retrieve)하여 디지탈 오디오 신호로 복원한다. 예를 들어 음원 제공부(100) 는 현재 이동통신망을 통해 연결된 이동통신 단말기에 지정된 음원 인덱스를 지능망 장비로부터 수신하여 이 음원 인덱스에 해당하는 음원 파일을 음원 데이터베이스(110)에서 추출하는 음원 서버일 수 있다. 오디오 데이터는 압축되어 저장될 수 있으며 이 경우 음원 제공부(100)는 압축된 데이터를 디코딩하는 코덱을 포함한다. 음원이 미디 형태라면 음원 제공부(100)는 미디 재생부를 포함한다.
전처리부(300)는 본 발명의 특징적인 양상에따라 추가된 구성이다. 본 발명의 특징적인 양상에 따라 전처리부(300)는 음원 제공부(100)에서 출력된 음원 신호에서 높은 에너지를 포함한 주파수 성분을 강조하여 출력하는 주파수 필터(310)를 포함한다. 컨텐츠 제공부(500)는 오디오 정보 제공 시스템의 송출단으로 교환기와 인터페이스되어 디지탈 오디오 신호를 제공한다.
음악 신호는 최고 전송률(Rate 1)로 인코딩 되어 끊김 현상으로 인한 음질 저하가 없더라도 디코딩되었을 경우 음질 열화가 큰 경우가 많다. 이는 전술한 바와 같이 음성 신호와 달리 두드러진 주기적 성분이 적은 특징 즉 여러 주파수 성분이 존재하는 점 때문에 주어진 선형 예측 계수와 코드북으로 인코딩된 후 디코딩 되었을 경우 음질 열화가 크다.
본 발명에서는 높은 압축률로 인한 피할 수 없는 손실 조건에서 가능한 음질 열화를 줄이는 전처리 기법으로 높은 에너지 성분을 갖는 주파수 성분을 강조하였다. 이에따라 주요 주파수 성분만을 EVRC에 통과 시킴으로써 인코딩 성능을 향상 시키고 결과적으로 전처리 하지 않았을 때 비하여 음질을 개선시키는 것이 가능하다.
본 발명의 추가적인 양상에 따라 주파수 필터(310)는 입력되는 음원 신호를 주파수 영역으로 변환하는 푸리에 변환부(311)와, 푸리에 변환부(311)에서 변환된 데이터의 각 영역별 에너지를 산출하여 높은 에너지를 가진 적어도 하나의 주파수 성분을 결정하고, 그 성분에 대한 가중치를 결정하여 출력하는 가중치 결정부(314)와, 푸리에 변환부(311)에서 출력되는 음원 신호에 대해 가중치 결정부(314)에서 결정된 주파수 성분에 대해 가중치 결정부(314)에서 출력된 가중치로 가중 필터링하여 출력하는 가중 필터부(316)와, 가중 필터부(316)에서 출력된 신호를 역 푸리에 변환하여 출력하는 역 푸리에 변환부(318)를 포함하여 구성된다.
푸리에 변환부(311) 및 역푸리에 변환부(318)는 본 실시예에 있어서 이산 푸리에 변환(Discrete Fourier Trnasform, DFT) 방식이나 본 발명에서 푸리에 변환이란 용어는 이에 한정되지 않으며, 일반적인 주파수 영역으로의 변환을 포괄하도록 해석된다. 가중 필터부(316)는 가중치 결정부(314)에서 강조하기로 결정된 주파수 성분들에 대해 가중치 결정부(314)에서 결정된 각각의 주파수 성분들에 대한 가중치들로 가중하여 출력한다. 일 실시예에 있어서, 가중 필터부(316)는 DFT 변환된 각각의 계수들 중 가중치 결정부(314)에서 강조하기로 결정된 주파수 성분에 해당하는 푸리에 계수들을 가중치 결정부(314)에서 결정된 각각의 주파수 성분에 대한 가중치로 곱하여 출력한다.
가중치 결정부(314)는 푸리에 변환부(311)에서 변환된 신호의 각 영역별 에너지를 산출하여 높은 에너지를 가진 적어도 하나의 주파수 성분을 결정하고, 그 성분에 대한 가중치를 결정하여 출력한다. 본 발명의 특징적인 양상에 따라 가중 치 결정부(314)는 파라메터 산출부(313)에서 산출된 선형 예측 이득값들과 전처리 전후의 신호 차이값으로부터 가중치를 결정하는 것을 특징으로 한다. 파라메터 산출부(313)에서 선형 예측 이득값들을 산출하는 과정은 일반적인 EVRC 코덱의 인코더에서 선형 예측 이득값들을 구하기 위해 이루어지는 처리와 동일하다. 파라메터 산출부(313)에서 산출하는 전처리 전후의 신호 차이값은 주파수 필터(310)의 입력 신호와 출력신호의 차이에 해당하며 후술한다. 분류기(312)는 푸리에 변환에 의하여 주파수 영역으로 변환된 계수 값들을 크기 순서로 정렬하여 주요 주파수 성분을 추출하기 위한 구성이다.
이하에서는 본 발명의 특징적인 양상에 따른 가중치 결정의 과정을 설명한다. 먼저 프레임의 신호를 푸리에 변환하고 크기에따라 정렬한 뒤 몇 개의 주파수 성분에 얼마의 가중치를 부여할 것인지 정하게 된다. 가중치 부여 형태의 기준은 선형 예측 이득과 전처리 전후 신호차이다. 이것은 선형 예측 이득이 인코딩을 성능을 나타내고 결과적으로 디코딩되었을 경우 음질을 나타낼 수 있다는 분석을 통하여 결정되었다. 또한 선형 예측 이득의 증가시키는 가중치 부여로 인코딩 성능은 향상되나 원래 신호와 차이가 크다면 음질 개선의 목적을 달성할 수 없으므로 제한 조건으로 전처리 전후 신호차이를 선택하였다.
전술한 바와 같이 음악 신호는 음성 신호와는 달리 일반적으로 주기적 성분이 적고 여러 주파수 성분을 갖고 있어 음성 코덱의 인코딩과 디코딩 과정을 거치게 되면 음질 열화가 심하게 된다. 음악 신호의 경우 선형 예측 이득이 낮아 선형 예측과 코드북 탐색으로 인코딩된 파라미터로 신호를 합성하는 과정에서 음질 저하 게 크게 된다. 본 발명은 이에 따라 높은 압축률로 인한 피할 수 없는 손실 조건에서 음질 열화를 최소화하기 위하여 주요 주파수 성분을 강조한다. 도 9는 본 발명의 일 실시예에 따른 주파수 인덱스별 가중치의 관계를 도시한다. 여기서 P1, P2, P3, P4는 아래 식 (3.5)로 표시된 목표치를 최대화시키도록 탐색되어 결정된다.
Figure 112004004284949-pat00032
(3.5)
여기서,
GS : 단기 예측 이득
GL : 장기 예측 이득
D = ∥S-S'∥ (전처리 전 후의 신호의 차이)
a = α max(GS 2)/max(GL 2)
b = β max(GS 2)/max(D2)
여기서 가중 상수 a,b는 전처리 되기 전의 신호와 전처리한 신호가 EVRC 인코더를 통과한 후의 것과의 상관관계가 크게 만드는 값으로 정하였다.
이 같이 하여 현재 음성 프레임을 위한 가중치가 일단 결정되면, 주파수 가중치 부여로 인하여 현재 프레임과 전후 프레임의 급격한 차이에 따른 음질의 악화를 방지하기 위하여 스무딩 처리가 부가된다. 즉, 본 발명의 추가적인 양상에 따라 본 발명에 따른 주파수 필터(310)는 가중치 결정부(314)에서 결정된 현재 프레 임의 가중치를 전 후 프레임의 가중치로 스무딩 처리한 가중치를 현재 프레임의 최종 가중치로 결정하는 가중치 처리부(315)를 더 포함하는 것을 특징으로 한다.
아래 식(3.4)는 이 같은 스무딩 과정을 예시적으로 표현한 것이다.
Figure 112004004284949-pat00033
본 발명의 또다른 특징적인 양상에 따르면, 전처리부(300)는 에너지가 낮은 음성 신호 구간을 추가하는 신호 삽입부(330)를 더 포함하는 것을 특징으로 한다. 일 실시예에 있어서, 신호 삽입부(330)는 음악 시작부에 적어도 하나의 묵음 프레임을 삽입하도록 처리한다.
전송률 저하는 끊김 현상과 같은 음질 열화를 일으키게 된다. 음악 신호가 최고 전송률로 인코딩되어야 함에도 불구하고 낮은 전송률로 인코딩되기 쉽다는 것을 음성 신호와 음악 신호의 특성 비교와 전송률 결정 알고리즘으로부터 알 수 있었다.
전송률 저하를 방지하기 위한 전처리 기법을 설명하기 위하여 먼저 전송률 결정의 주요 파라미터인 배경 잡음 추정치(Background Noise Estimate) B가 초기값부터 어떻게 갱신 되는지 f(1)에 대하여 아래 표에 나타내었다.
BE(0)=0 ESM(0)=51,00,000 B(0)=80,954,000
BE(1)=E1 ESM(1)=E1 B(1)=ESM(1)=E1 (E1≤80,954,000)
BE(2)=E2 ESM(2)=0.6 E1+0.4 E2 B(2)=ESM(2)=ESM(2)=0.6 E1+0.4 E2 (E2 ≤E1)
대역 에너지(Band Energy,BE)와 문턱치(T1, T2)의 비교를 통하여 전송률은 결정되고 여기에서 BE의 초기값은 0이지만 T1과 T2의 중요 요소인 B의 초기값은 B 의 최대값(80954000)이다.
음악 전송 서비스를 위한 신호의 길이가 약 2000프레임이고 이 구간 내에서 B가 전송률 저하를 일으키지 않는 크기 까지만 증가하기 위해서는 가능한 낮은 값으로 시작하여야 한다. 그러나 일반적인 경우 위 표에서 E1은 B의 최소값이 아니므로 B의 지속적 증가로 인한 전송률 저하를 일으킨다. 그러므로 E1이 B의 최소값이 되도록 낮은 에너지의 프레임(묵음 구간)의 첨가로 B가 최소값에서 부터 시작할 수 있게 된다. EVRC에서 프레임의 인코딩 시 "이전(lookback)" 프레임과 "이후(lookahead)" 프레임이 영향을 미치므로 두 프레임의 묵음 구간 첨가로 B(1)이 최소값이 될 수 있고 전송률 저하를 일으키는 값까지 증가를 방지할 수 있다. 실험에 의해서도 약 2000 프레임 길이의 음악 신호에 대하여 시작 부분에 단지 2 개의 묵음 프레임을 추가함에 의해 전송률 저하에 의한 끊김 현상을 실질적으로 방지할 수 있음이 확인되었다. 그러나 본 발명은 이에 한정되지 않으며, 더 긴 음악 정보 전송의 경우 일정한 주기 또는 전송률의 모니터링 혹은 예측에 의해 판단된 적절한 시기에 묵음 프레임을 한 두개 추가하는 실시예로 확장될 수 있음은 자명하다. 또한 반드시 묵음 프레임이 아니라도 배경 잡음 추정치의 갱신에 영향을 미칠 정도로 적은 에너지를 가진 프레임이라도 무방한 것이다.
이하에서는 본 발명에 따라 가변 전송률로 전송하는 음성 시스템을 통해 음악을 서비스하는 오디오 정보 제공 방법에 대해 설명한다. 본 발명에 다른 오디오 정보 제공 방법은 지정된 음원 신호를 추출하는 음원 제공 단계와, 상기 음원신호에서 높은 에너지를 포함한 주파수 성분을 강조하여 출력하는 전처리 단계와, 전처 리된 음원 신호를 음성 시스템으로 제공하는 컨텐츠 제공단계를 포함하는 것을 특징으로 한다.
또한 이때 전처리 단계는 입력되는 음원 신호를 주파수 영역으로 변환하는 푸리에 변환 단계와, 푸리에 변환된 신호의 각 영역별 에너지를 산출하여 높은 에너지를 가진 적어도 한 개의 주파수 성분을 결정하고, 그 성분에 대한 가중치를 결정하여 출력하는 가중치 결정 단계와, 푸리에 변환 단계에서 출력되는 음원 신호에 대해 가중치 결정 단계에서 결정된 주파수 성분에 대해 가중치 결정 단계에서 출력된 가중치로 가중 필터링하여 출력하는 가중 필터 단계와, 가중 필터 단계에서 출력된 신호를 역 푸리에 변환하여 출력하는 역 푸리에 변환 단계를 포함하는 것을 특징으로 한다.
여기서 가중치 결정 단계는 선형 예측 이득과 전처리 전후의 신호차이로부터 가중치를 결정하는 것을 특징으로 한다. 또한 가중치 결정 단계는 결정된 현재 프레임의 가중치를 전 후 프레임의 가중치로 스무딩 처리한 가중치를 현재 프레임의 최종 가중치로 결정하는 단계를 더 포함할 수 있다.
또 본 발명의 또다른 특징적인 양상에 따라 본 발명에 따른 오디오 정보 제공 방법은 전처리 단계가 에너지가 낮은 음성 신호 구간을 추가하는 신호 삽입 단계를 더 포함하는 것을 특징으로 한다. 일 실시예에 있어서, 신호 삽입 단계는 음악 시작부에 적어도 하나의 묵음 프레임을 삽입하는 처리일 수 있다.
본 발명에 따른 오디오 정보 제공 방법의 각 단계는 전술한 장치의 개별 구성요소들의 동작에 의해 구현된 것이므로 추가적인 설명은 생략한다.
전송률 결정의 Thresholds가 가장 낮은 값으로부터 시작하게 하기 위하여 두 프레임의 묵음 구간을 첨가한 결과 도 10a의 예에서 볼 수 있듯이 증가된 문턱치가 전처리 하지 않았을 경우 시작값 보다 작은 결과를 나타내었다. 따라서 도 10b에서 볼 수 있듯이 묵음 구간 첨가로 전송률 저하도 방지할 수 있게 되었다.
한편, 중요 주파수 성분에 가중치 부여를 통한 전처리로 도 11a의 예와 같이 단기 예측 이득값(Short-term Prediction Gain)이 증가한 것을 확인하였다. 이것은 단기 예측 처리 후의 잔류(오차) 신호가 줄어든 것으로 음질 저하를 줄이는 결과를 가져오게 되었다. 음질과 관련된 또 하나의 지표인 장기 예측 이득값(Long-term Prediction Gain)도 도 11b에서 볼 수 있듯이 전처리를 통하여 증가하였다. 이와 같은 선형 예측 이득의 증가는 예측 오차의 감소를 의미하며 따라서 도 11c에서 확인할 수 있듯이 코드북 이득값(codebook gain)의 포화 문제가 해결되는 결과를 가져 왔다.
전처리 효과는 시간 영역에서 EVRC 인코더 전후의 데이터를 보아도 알 수 있다. 도 12는 전처리를 통하여 EVRC 출력 신호의 볼륨 감소가 줄어든 것을 알 수 있으며 RMS는 EVRC 입력 신호가 0.1951, 전처리하지 않은 경우 EVRC 출력이 0.0854, 그리고 전처리한 경우 0.1296이다. 이상과 같은 음질에 영향을 미치는 지수를 통한 전처리 효과의 확인에서뿐만 아니라 듣기를 통한 평가 에서도 전처리를 통한 음질 개선 효과를 확인할 수 있었다.
이상에서 상세히 설명한 바와 같이 본 발명에 따른 오디오 정보 제공 시스템 은 음성 신호와 음악 신호의 차이 분석에 기초하여 음악 신호를 음성 시스템을 통해 전송함에 있어서 주요 주파수 성분을 강조함에 의해 음질의 저하를 방지할 수 있는 작용효과가 있다.
또한 본 발명에 따른 오디오 정보 제공 시스템은 음성을 위한 가변률 전송 시스템을 통해 음악 신호를 전송함에 있어서 음악 신호의 초기 프레임에 묵음 프레임을 추가함에 의해 전송률의 저하에 따른 끊김 현상을 효과적으로 방지할 수 있는 작용효과가 있다.
본 발명은 첨부된 도면을 참조하여 기술되는 실시예를 중심으로 설명되었으나 이에 한정되는 것은 아니며 당업자에게 자명한 다양한 변형예를 포괄하도록 의도된 청구범위에 의해 해석되어져야 한다. 예를 들어 본 발명은 이동통신망을 통한 오디오 정보 제공 시스템에 관해 설명되었으나 이에 한정되는 것은 아니며, 음성 전송이나 재생을 위해 최적화된 일반적인 음성(voice) 시스템에 적용될 수 있다.

Claims (12)

  1. 가변 전송률로 전송하는 음성 시스템을 통해 음악을 서비스하는 오디오 정보 제공 시스템에 있어서, 상기 시스템이 :
    지정받은 음원 신호를 출력하는 음원 제공부와;
    상기 음원 제공부에서 출력된 음원 신호에서 높은 에너지를 포함한 주파수 성분을 강조하여 출력하는 전처리부와;
    상기 전처리부에서 출력된 음원 신호를 음성 시스템으로 제공하는 컨텐츠 제공부를 포함하는 것을 특징으로 하는 오디오 정보 제공 시스템.
  2. 제 1 항에 있어서, 상기 전처리부는 :
    입력되는 음원 신호를 주파수 영역으로 변환하는 푸리에 변환부와,
    상기 푸리에 변환부에서 변환된 신호의 각 영역별 에너지를 산출하여 높은 에너지를 가진 적어도 하나의 주파수 성분을 결정하고, 그 성분에 대한 가중치를 결정하여 출력하는 가중치 결정부와,
    상기 푸리에 변환부에서 출력되는 음원 신호에 대해 상기 가중치 결정부에서 결정된 주파수 성분에 대해 상기 가중치 결정부에서 출력된 가중치로 가중 필터링하여 출력하는 가중 필터부와,
    상기 가중 필터부에서 출력된 신호를 역 푸리에 변환하여 출력하는 역 푸리에 변환부를 포함하는 것을 특징으로 하는 오디오 정보 제공 시스템.
  3. 제 2 항에 있어서, 상기 가중치 결정부는 :
    선형 예측 이득과 전처리 전후의 신호 차이로부터 가중치를 결정하는 것을 특징으로 하는 오디오 정보 제공 시스템.
  4. 제 3 항에 있어서, 상기 전처리부가 가중치 결정부에서 결정된 현재 프레임의 가중치를 전 후 프레임의 가중치로 스무딩 처리한 가중치를 현재 프레임의 최종 가중치로 결정하는 가중치 처리부를 더 포함하는 것을 특징으로 하는 오디오 정보 제공 시스템.
  5. 제 1 항에 있어서, 상기 전처리부가 에너지가 낮은 음성 신호 구간을 추가하는 신호 삽입부를 더 포함하는 것을 특징으로 하는 오디오 정보 제공 시스템.
  6. 제 5 항에 있어서, 상기 신호 삽입부는 음악 시작부에 적어도 하나의 묵음 프레임을 삽입하는 것을 특징으로 하는 오디오 정보 제공 시스템.
  7. 가변 전송률로 전송하는 음성 시스템을 통해 음악을 서비스하는 오디오 정보 제공 방법에 있어서, 상기 방법이 :
    지정된 음원 신호를 추출하는 음원 제공 단계와;
    상기 음원신호에서 높은 에너지를 포함한 주파수 성분을 강조하여 출력하는 전처리 단계와;
    전처리된 음원 신호를 음성 시스템으로 제공하는 컨텐츠 제공단계;를 포함하는 것을 특징으로 하는 오디오 정보 제공 방법.
  8. 제 7 항에 있어서, 상기 전처리 단계는 :
    입력되는 음원 신호를 주파수 영역으로 변환하는 푸리에 변환 단계와,
    상기 푸리에 변환된 신호의 각 영역별 에너지를 산출하여 높은 에너지를 가진 적어도 한 개의 주파수 성분을 결정하고, 그 성분에 대한 가중치를 결정하여 출력하는 가중치 결정 단계와,
    상기 푸리에 변환 단계에서 출력되는 음원 신호에 대해 상기 가중치 결정 단계에서 결정된 주파수 성분에 대해 상기 가중치 결정 단계에서 출력된 가중치로 가중 필터링하여 출력하는 가중 필터 단계와,
    상기 가중 필터 단계에서 출력된 신호를 역 푸리에 변환하여 출력하는 역 푸리에 변환 단계를 포함하는 것을 특징으로 하는 음성 시스템을 통한 오디오 정보 제공 방법.
  9. 제 8 항에 있어서, 상기 가중치 결정 단계는 선형 예측 이득과 전처리 전후의 신호차이로부터 가중치를 결정하는 것을 특징으로 하는 음성 시스템을 통한 오디오 정보 제공 방법.
  10. 제 9 항에 있어서, 상기 가중치 결정 단계는 결정된 현재 프레임의 가중치를 전 후 프레임의 가중치로 스무딩 처리한 가중치를 현재 프레임의 최종 가중치로 결정하는 단계를 더 포함하는 것을 특징으로 하는 오디오 정보 제공 방법.
  11. 제 7 항에 있어서, 상기 전처리 단계가 에너지가 낮은 음성 신호 구간을 추가하는 신호 삽입 단계를 더 포함하는 것을 특징으로 하는 음성 시스템을 통한 오디오 정보 제공 방법.
  12. 제 11 항에 있어서, 상기 신호 삽입 단계는 음악 시작부에 적어도 하나의 묵음 프레임을 삽입하는 묵음 프레임 삽입 단계인 것을 특징으로 하는 음성 시스템을 통한 오디오 정보 제공 방법.
KR1020040006687A 2004-02-02 2004-02-02 오디오 정보 제공 시스템 및 그 방법 KR100547898B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040006687A KR100547898B1 (ko) 2004-02-02 2004-02-02 오디오 정보 제공 시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040006687A KR100547898B1 (ko) 2004-02-02 2004-02-02 오디오 정보 제공 시스템 및 그 방법

Publications (2)

Publication Number Publication Date
KR20050078524A KR20050078524A (ko) 2005-08-05
KR100547898B1 true KR100547898B1 (ko) 2006-01-31

Family

ID=37265650

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040006687A KR100547898B1 (ko) 2004-02-02 2004-02-02 오디오 정보 제공 시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR100547898B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100785471B1 (ko) * 2006-01-06 2007-12-13 와이더댄 주식회사 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
WO2010093224A2 (ko) 2009-02-16 2010-08-19 한국전자통신연구원 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치

Also Published As

Publication number Publication date
KR20050078524A (ko) 2005-08-05

Similar Documents

Publication Publication Date Title
RU2262748C2 (ru) Многорежимное устройство кодирования
KR100804461B1 (ko) 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치
RU2251750C2 (ru) Обнаружение активности сложного сигнала для усовершенствованной классификации речи/шума в аудиосигнале
US6898566B1 (en) Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US8019599B2 (en) Speech codecs
US6202046B1 (en) Background noise/speech classification method
US7610197B2 (en) Method and apparatus for comfort noise generation in speech communication systems
KR100575193B1 (ko) 적응 포스트필터를 포함하는 디코딩 방법 및 시스템
US7710982B2 (en) Sound packet reproducing method, sound packet reproducing apparatus, sound packet reproducing program, and recording medium
EP1214705B1 (en) Method and apparatus for maintaining a target bit rate in a speech coder
JPH1097292A (ja) 音声信号伝送方法および不連続伝送システム
JPH09152900A (ja) 予測符号化における人間聴覚モデルを使用した音声信号量子化法
JPH09152895A (ja) 合成フィルタの周波数応答に基づく知覚ノイズマスキング測定法
US6940967B2 (en) Multirate speech codecs
JPH09152898A (ja) 符号化されたパラメータのない音声信号の合成法
KR100841096B1 (ko) 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
CN109712633A (zh) 音频编码器和解码器
KR100752797B1 (ko) 음성 코더에서 선 스펙트럼 정보 양자화법을 인터리빙하는 방법 및 장치
EP1726006A2 (en) Method of comfort noise generation for speech communication
CA2702669A1 (en) A method and an apparatus for processing a signal
US20120179459A1 (en) Method and apparatus for processing audio signals
KR20020033736A (ko) 음성 코더의 프레임 프로토타입들 사이의 선형 위상시프트들을 계산하기 위해 주파수 대역들을 식별하는 방법및 장치
CN1244090C (zh) 具备背景噪声再现的语音编码
JPH06236198A (ja) 音質主観評価予測方式
KR100547898B1 (ko) 오디오 정보 제공 시스템 및 그 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110121

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee