KR20040104508A

KR20040104508A - 오디오 변환부호화기에서 적응 코드북 피치 지연 연산을위한 방법

Info

Publication number: KR20040104508A
Application number: KR10-2004-7014297A
Authority: KR
Inventors: 자브리마르완에이.; 왕지안웨이; 죠지사메; 이브라힘마이클
Original assignee: 딜리시움 네트웍스 피티와이 리미티드
Priority date: 2002-03-12
Filing date: 2003-03-12
Publication date: 2004-12-10
Also published as: CN1653521B; US20080189101A1; US7996217B2; US7260524B2; US20040002855A1; EP1483758A4; WO2003079330A1; CN1653521A; JP2005520206A; EP1483758A1; AU2003214182A1

Abstract

본 발명은 하나의 CELP를 기반으로 하는 표준으로부터 다른 CELP를 기반으로 하는 표준으로 적응 코드북 피치 지연을 처리하는 장치를 제공한다. 본 발명의 장치는 본 명세서에 개시된 기능을 수행하는 다양한 모듈을 구비한다. 본 발명의 장치는 하나 이상의 입력 서브프레임을 데스티네이션 코덱의 출력 서브프레임에 연계시키는 시간을 기준으로 하는 서브프레임 검사 모듈을 구비한다. 본 발명의 장치는 또한 시간을 기준으로 하는 서브프레임 검사 모듈에 연결되는 결정 모듈을 구비한다. 이 결정 모듈은 2개 이상의 입력되는 서브프레임 중의 복수개의 피치 지연 파라미터로부터 원하는 피치 지연 파라미터를 결정하기 위한 것이다. 본 발명의 장치는 또한 결정 모듈에 연결되는 피치 지연 선택 모듈을 구비한다. 이 피치 지연 선택 모듈은 원하는 피치 지연 파라미터를 선택하기 위한 것이다.

Description

오디오 변환부호화기에서 적응 코드북 피치 지연 연산을 위한 방법 {METHOD FOR ADAPTIVE CODEBOOK PITCH-LAG COMPUTATION IN AUDIO TRANSCODERS}

전기통신 기술은 계속해서 발전해 왔다. 그 하나의 예로서, 부호화 기술(coding techniques)은 전기통신 매체를 통해 전송용 신호를 패키지화한다. 부호화(coding)는 순수한 신호(음성, 이미지, 영상 등)를 전송이나 저장을 위한 포맷으로 변화하는 처리를 포함할 수 있다. 이러한 부호화는 상당히 많은 압축이 이루어지는 것이 일반적이지만, 대체적으로 중요한 신호처리 기술이 수반된다. 부호화의결과는 주어진 압축 포맷에 따라 부호화(코드화)된 파라미터의 비트스트림(프레임의 연속)이다. 압축은 신호를 모델링하기 위한 다양한 기술을 이용하여 중복(redundant) 정보를 지각적(perceptual) 및 통계적(statistical)으로 제거함으로써 달성된다. 이에 따라 부호화된 포맷을 "압축 포맷" 또는 "파라미터 공간"(parameter space)이라고 한다. 복호화기는 압축처리된 비트스트림을 수신하여 원래의 신호를 재생성한다. 음성 부호화의 압축에는 통상적으로 정보의 손실이 뒤따르게 된다.

코덱 장치를 이용하여 부호화처리가 수행될 수 있다. 예를 들어, CELP(코드여기 선형예측)를 기반으로 하는 코덱(codec)은 음성 생성의 모델을 이용하여 일부 파라미터 공간과 샘플링된 음성을 매핑시키는 알고리즘, 즉 디지털 음성을 부호화 및 복호화하는 것이라고 할 수 있다. 일반적으로, CELP를 기반으로 하는 모든 알고리즘은 음성 프레임 단위로 동작하며, 이러한 프레임은 몇개의 서브프레임으로 분리되어 있다. CELP를 기반으로 하는 모델에 사용되는 프레임 파라미터는 음성 신호(신체적으로는, 성도, 입, 비강 및 입술과 관련되어 있음) 뿐만 아니라 적응 및 고정 코드북으로 구성된 여기 신호의 단기(short-term) 예측에 이용되는 선형 예측 계수(LPC: linear-predictive coefficients)를 갖는다. 적응 코드북은 음성의 장기(long-term) 피치 정보를 모델화하는데 이용된다. 음성 프레임을 분석하기 위한 연산의 대부분은 LPC 계수를 결정하고 피치 지연(또는, 이와 등가인 적응 코드북 인덱스)을 검색하는데 소요된다.

많은 CELP를 기반으로 하는 음성 부호화 표준 중 하나(또는 여러개)를 지원하는 다중의 다양한 접속장치(즉, 터미널: terminal)에 접속되는 많은 수의 다양한 네트워크가 존재한다. 음성 압축 표준들간에는 본질적으로 상호호환성이 부족하기 때문에, 종단간 호출(end-to-end call)이 네트워크의 경계를 횡단할 때, 변환의 필요성이 생길 수 있다. 이들 다양한 네트워크와 터미널들을 상호접속시키기 위해서는 일반적으로 하나의 음성 표준으로부터 다른 음성 표준으로 음성 변환부호화(transcoding)가 필요하게 된다. 모바일 스위칭 센터, 미디어 게이트웨이, 멀티미디어 메시징 시스템에서 그리고 네트워크의 에지상에서 이러한 변환부호화에 대한 필요성이 집중되는 것이 일반적이다.

예를 들어, 이종(heterogeneous)의 무선, 모바일 및 유선 네트워크와 관련된 음성 부호화는 상이한 표준에서 운영되는 네트워크를 나타낸다. 상이한 네트워크의 터미널에 대해 사용되는 다양한 음성 압축 및 부호화 표준, 즉 IP(VoIP), GSM, GSM-AMR, EVRC를 통한 음성용의 G.729 및 G.723.1과, 상이한 무선 네트워크에 사용되는(또는 출현되는) 다른 범위의 표준이 존재한다. 도 1의 (a), (b) 및 (c)는 CELP 기반의 음성 압축 표준의 이러한 다양성을 단순화하여 나타내고 있다. 이 경우, 모든 네트워크의 에지에서 그리고 임의의 2개의 네트워크 사이에서 음성 변환부호화가 이루어진다.

적응 코드북 피치 지연의 연산은 음성 변환부호화에서 적응 코드북을 검색하는데 중요한 역할을 한다. 가장 일반적인 CELP 기반의 표준들 사이에서 변환부호화가 이루어질 때, 프레임 사이즈 또는 서브프레임 사이즈가 상이하게 될 수 있기 때문에, 상이한 서브프레임 사이즈를 위한 코드북 피치 지연의 계산을 재연산(re-computing)하는 것이 요구되고 있다. 예를 들어, G.723.1에서의 서브프레임의 사이즈는 7.5ms (도 1의 (b))이지만, GSM-AMR에서는 5ms (도 1의 (a))이고, EVRC에서는 6.625ms 또는 6.75ms (도 1의 (c))이다.

몇개의 "스마트" 변환부호화 방법과 탠덤 변환부호화[부르트 포스 방식(brute-force approach)]를 포함하는 종래의 변환부호화 방법은 여전히 음성 신호를 재구성하고, 개방루프 또는 폐루프의 검색을 통해 피치 지연을 추출하는, 자원이 많이 드는 연산을 수행하는 것이다. 즉, 이들 방법들은 여전히 파라미터 공간이 아니라 음성 신호 공간에서 운용되고 있다. 이에 따라, 종래의 방법들에서는 과도한 연산이 행해지게 된다.

음성 신호 공간에서의 피치 지연 보간(pitch-lag interpolation)을 제거하기 위한 시도로서는, 미국공개특허 제2002/0077812 A1 공보에 개시된 "스마트" 변환부호화가 있다. 이 방법은 CELP 파라미터간에 변환부호화를 수행하는 것이지만, 일반적으로 소스 CELP 코덱과 데스티네이션 CELP 코덱간에 매우 엄격한 조건을 필요로 하는 특별한 경우에만 적용할 수 있다. 예컨대, 이 방법은 대수적(algebraic) CELP(ACELP) 알고리즘이 사용되고, 소스 코덱과 데스티네이션 코덱이 모두 동일한 서브프레임 사이즈를 가질 것을 필요로 하기 때문에, 이러한 것은 많은 제한사항이 되며 광범위하게 적용될 수 없게 된다.

따라서, 개선된 음성 변환부호화기가 적응 코드북 피치 지연을 효율적으로 계산할 수 있도록 할 필요가 있다.

본 발명은 일반적으로 전기통신 신호(telecommunication signals)를 처리하는 기술에 관한 것으로서, 특히 본 발명은 하나의 코드여기 선형예측(CELP: Code Excited Linear Prediction) 포맷으로부터 다른 CELP 포맷으로 디지털 음성 패킷을 변환하는 방법 및 장치를 제공하는 것이다. 더 구체적으로 말하면, 본 발명은 입력으로서의 제1 CELP 부호화기(coder)에 의해 획득된 적응 코드북(adaptive codebook) 피치 지연(pitch-lag)을 제2 CELP 부호화기의 다른 적응 코드북 피치 지연으로 보간(interpolate)하기 위한 방법 및 장치에 관한 것이다. 본 발명은 실시예에 의해 음성 변환부호화(voice transcoding)에 적용되는 것으로 하였지만, 다른 응용도 포함한다는 것을 알 수 있을 것이다.

도 1의 (a), (b) 및 (c)는 상이한 CELP 코덱에 사용되는 상이한 사이즈의 서브프레임을 나타내기 위한 도면.

도 2는 본 발명의 실시예에 따라 적응 코드북 피치 지연 보간을 수행하기 위한 단순화된 기능 블록도.

도 3은 본 발명에 실시예에 따라 소스 코덱과 데스티네이션 코덱간의 상이한 서브프레임 사이즈의 비교 및 중첩을 나타내는 단순화된 도면.

도 4는 본 발명의 실시예에 따라 상이한 서브프레임 사이즈에 대한 피치 지연을 보간하기 위한 루틴을 나타내는 단순화된 흐름도.

도 5는 본 발명의 실시예에 따라 G.723.1로부터 GSM-AMR로 변환부호화를 행한 특정 예에서의 서브프레임 연산을 나타내는 단순화된 블록도.

본 발명에 의하면, 전기통신 신호를 처리하기 위한 기술이 제공된다. 특히, 본 발명은 하나의 코드여기 선형예측(CELP) 포맷으로부터 다른 CELP 포맷으로 디지털 음성 패킷을 변환하는 방법 및 장치를 제공하는 것이다. 더 구체적으로 말하면, 본 발명은 입력으로서의 제1 CELP 부호화기에 의해 획득된 적응 코드북 피치 지연을 제2 CELP 부호화기의 다른 적응 코드북 피치 지연으로 보간하기 위한 방법 및 장치에 관한 것이다. 본 발명은 실시예에 의해 음성 변환부호화에 적용되는 것으로 하였지만, 다른 응용도 포함한다는 것을 알 수 있을 것이다.

본 발명은 적응 코드북 피치 지연 연산을 위한 방법 및 장치이다. 본 발명의 장치는 (a) 보간 또는 매핑을 위해 대기하는 소스 코덱으로부터 각 서브프레임의 적응 코드북 파라미터를 저장하고, 소스 코덱과 데스티네이션 코덱간의 서브프레임 중첩 부분을 계산하는, 시간 기준의(시간을 기준으로 하는) 서브프레임 검사 모듈과; (b) 데스티네이션 서브프레임과 중첩하는 모든 소스 서브프레임 중에서 적응 코드북의 에너지를 계산하고, 피치 지연의 선택을 위한 기준으로서의 최대 에너지값을 검색하는 판정 모듈과; (c) 판정 모듈의 출력에 기초하여 모든 중첩되는 소스 서브프레임으로부터 출력으로서 서브프레임의 피치 지연을 선택하는 선택 모듈을 구비한다. 시간 기준의 서브프레임 검사 모듈은 데스티네이션 서브프레임으로의 매핑을 위해 대기하는 소스 서브프레임의 피치 지연, 피치 이득 및 샘플수를 저장하는 버퍼와, 데스티네이션 서브프레임이 복수개의 소스 서브프레임에 의해 커버되는지를 판별하는 판별장치를 구비한다.

본 발명의 방법은 소스 CELP 코덱 파라미터 공간으로부터 데스티네이션 서브프레임의 피치 지연을 계산하는 단계를 포함한다. 피치 지연을 연산하는 단계는 데스티네이션 서브프레임과 중첩하는 각 소스 서브프레임의 적응 코드북 파라미터를 저장하는 단계, 데스티네이션 서브프레임이 하나의 소스 서브프레임 또는 복수개의 소스 서브프레임에 의해 완전히 커버되는지 여부를 판정하는 단계, 데스티네이션 서브프레임이 단지 하나의 소스 서브프레임에 의해 완전히 커버되는 경우에는 소스 서브프레임의 피치 지연을 출력하고, 데스티네이션 서브프레임이 복수개의 소스 서브프레임에 의해 커버되는 경우에는 판정 모듈에 의해 사용되는 기준의 최대값을 갖는 서브프레임의 피치 지연을 출력하는 단계를 포함한다. 판정 모듈에 의해 이용되는 기준의 최대값을 갖는 서브프레임의 피치 지연을 출력하는 단계는 판정 모듈에 의한 기준의 최대값을 검색하는 단계와, 중첩되는 모든 소스 서브프레임 중에서 최대값을 갖는 서브프레임의 피치 지연을 선택하는 단계와, 선택된 서브프레임의 피치 지연을 출력하는 단계를 포함한다. 판정 모듈에 의한 기준의 최대값을 검색하는 단계는 중첩된 소스 서브프레임의 적응 코드북 파라미터를 조합시키는 단계와, 각 소스 서브프레임의 중첩 부분을 계산하는 단계와, 각 중첩된 서브프레임에서의 기준값으로서 이용되는 에너지 분포를 계산하는 단계와, 기준의 최대값을 갖는 서브프레임을 지수화하는 단계를 포함한다.

특정의 실시예로서, 본 발명은 하나의 CELP 기반의 표준으로부터 다른 CELP 기반의 표준으로 적응 코드북 피치 지연을 처리하는 장치를 제공한다. 본 발명의 장치는 본 명세서에 개시된 기능을 수행하는 다양한 모듈을 갖는다. 본 발명의 장치는 하나 이상의 입력 서브프레임을 데스티네이션 코덱의 출력 서브프레임과 연계시키는 시간 기준의 서브프레임 검사 모듈을 포함한다. 본 발명의 장치는 또한 시간 기준의 서브프레임 검사 모듈에 연결된 판정 모듈을 갖는다. 이 판정 모듈은 2개 이상의 입력 서브프레임들 각각 중에서 복수개의 피치 지연 파라미터로부터 원하는 서브프레임의 피치 지연 파라미터를 결정한다. 본 발명의 장치는 판정 모듈에 연결된 피치 지연 선택 모듈을 구비한다. 이 피치 지연 선택 모듈은 원하는 피치 지연 파라미터를 선택한다.

다른 특정의 실시예로서, 본 발명은 소스 CELP 기반의 코덱으로부터 데스티네이션 CELP 기반의 코덱으로 적응 코드북 파라미터 피치 지연을 처리하는 방법을 제공한다. 본 발명의 방법은 매핑을 위해 대기하는 소스 코덱으로부터 하나 이상의 각 서브프레임의 하나 이상의 적응 코드북 파라미터를 메모리에 저장하는 단계를 포함한다. 본 발명의 방법은 또한 하나 이상의 서브프레임이 매핑을 위해 대기하는 동안 데스티네이션 서브프레임이 하나의 소스 서브프레임에 의해 완전히 커버되는지 여부를 판정한다. 본 발명의 방법은 데스티네이션 서브프레임이 단지 하나의 소스 서브프레임에 의해 완전히 커버되는 경우 소스 서브프레임의 피치 지연을 출력하거나, 데스티네이션 서브프레임이 2개 이상의 복수개의 소스 서브프레임에 의해 커버되는 경우 판정 모듈에 의한 기준에 기초하여 최대값을 갖는 소스 서브프레임의 피치 지연의 원하는 값을 출력하는 단계를 포함한다. 본 실시예에 의하면 다른 구성요소가 포함될 수도 있다.

다른 실시예로서, 본 발명은 하나의 CELP를 기반으로 하는 표준으로부터 다른 CELP를 기반으로 하는 표준으로 적응 코드북 피치 지연을 처리하는 컴퓨터를 기반으로 하는 시스템을 제공한다. 본 발명의 시스템은 하나 이상의 메모리로 구성될 수 있는 컴퓨터 메모리를 구비한다. 이러한 하나 이상의 메모리에 다양한 코드(code)가 제공된다. 본 발명의 시스템은 하나 이상의 입력 서브프레임을 데스티네이션 코덱의 출력 서브프레임에 연계시키는 시간 기준의 서브프레임 검사 모듈에 사용되는 하나 이상의 코드를 포함한다. 본 발명의 시스템은 또한 2개 이상의 입력 서브프레임의 각각 중에서 복수개의 피치 지연 파라미터로부터 원하는 피치 지연 파라미터를 결정하는데 사용되는 하나 이상의 코드를 포함한다. 판정 모듈에 연결된 피치 지연 선택 모듈에 하나 이상의 코드가 사용된다. 판정 모듈은 원하는 피치 지연 파라미터를 선택하기 위한 것이다. 본 실시예에 의하면, 컴퓨터 코드 또는 코드들은 본 명세서에 개시된 기능을 수행하기 위해 소프트웨어 또는 펌웨어의 형태로 이용될 수 있다.

특정의 실시예에 의하면, 많은 이점 및/또는 장점을 가질 수 있다. 본 발명의 장점은, 특정의 실시예에 따라 변환부호화시에 오디오 품질의 손상없이 하나의 코덱으로부터 다른 코덱으로의 신속한 피치 지연 파라미터 연산이 제공된다는 것이다. 신속하고 정확한 연산 알고리즘에 의해 연산 성능의 관점에서 뿐만 아니라 더 중요하게는 오디오 품질의 유지 관점에서 오디오 변환부호화를 개선할 수 있다. 본 실시예에 의하면, 이들 하나 이상의 장점들이 달성될 수 있다.

본 발명의 목적, 특징 및 장점들은 신규한 것이며 첨부된 청구범위에 특정적으로 개시되어 있다. 본 발명은 그 구성과 동작과, 추가의 목적과 장점에 대해 첨부 도면을 참조하여 이하의 상세한 설명에 따라 잘 이해될 수 있을 것이다.

본 발명에 의하면, 전기통신 신호를 처리하기 위한 기술이 제공된다. 특히, 본 발명은 하나의 코드여기 선형예측(CELP) 포맷으로부터 다른 CELP 포맷으로 디지털 음성 패킷을 변환하는 방법 및 장치를 제공한다. 구체적으로 말하면, 본 발명은 입력으로서의 제1 CELP 부호화기에 의해 획득된 적응 코드북 피치 지연을 제2 CELP 부호화기의 다른 적응 코드북 피치 지연으로 보간하기 위한 방법 및 장치에 관한 것이다. 본 발명은 실시예에 의해 음성 변환부호화에 적응되는 것으로 하였지만, 다른 응용도 포함한다는 것을 알 수 있을 것이다.

기존의 오디오 코덱 표준에서의 적응 코드북을 자세히 살펴보면, 변환부호화의 수행에 있어서 하나의 코덱으로부터 다른 코덱으로 오디오 품질의 손실 없이 코드북 피치 지연 파라미터를 보간하는 것이 가능한 것을 알 수 있다. 계산상의 성능뿐만이 아니라 더 중요하게는 오디오 품질의 유지 관점에서, 신속하고 정확한 연산 알고리즘이 오디오 변환부호화를 개선시킬 수 있다.

특정의 실시예로서, 음성 신호는 유성음 신호 또는 무성음 신호로 분류될 수 있다. 적응 코드북 피치 지연 파라미터는 유성음 여기 시퀀스(voiced excitation sequences) 동안은 매우 안정적이지만, 무성음 사운드 동안 또는 유성음 사운드의 개시 시점에서는 안정적이지 않다. 무성음 사운드는 일반적으로 약한 무작위 신호이며, 이 경우 적응 코드북 이득은 매우 작고, 적응 코드북 피치 지연의 선택은 유성음 신호에 대한 것만큼 중요하지는 않다. 한편, 유성음 신호는 일반적으로 강하고 안정적이며, 적응 코드북 피치 지연의 선택에 의해 음성 압축의 품질이 직접 결정된다.

상이한 오디오 코덱에서의 최적화된 적응 코드북 피치 지연들이 매우 인접해 있다고 하더라도, 스마트한 적응 코드북 피치 지연 계산은 오디오 변환부호화에 필수적이다. 그 이유는 소스 코덱과 데스티네이션 코덱에서의 서브프레임의 사이즈가 상이할 수 있기 때문이다(도 3). 도시된 것과 같이, 소스 코덱에서의 서브프레임은 제1 서브프레임의 경우 사이즈가 N_S이다. 데스티네이션 코덱(참조부호 1을 참고하시오)은 제1 코덱 서브프레임보다 작은 사이즈 N_D인 제1 서브프레임을 갖는다. 또, 도시된 것과 같이, 제1 소스 코덱의 에지와 제1 데스티네이션 코덱이 정렬되어 있다. 제1 소스 서브프레임은 사이즈가 크고, 공간적으로 제1 데스티네이션 서브프레임을 넘어 연장하여 정렬되어 있기 때문에, 제1 소스 서브프레임이 제1 데스티네이션 서브프레임을 커버(즉, 완전히 커버)하게 된다. 또한, 제2 데스티네이션 서브프레임(참조부호 2를 참조하시오)이 도시되어 있는데, 이 서브프레임은 소스 코덱의 제1 서브프레임과 소스 코덱의 제2 서브프레임이 중첩되어 있는 α1 부분과 α2 부분을 갖는다. 제2 데스티네이션 서브프레임은 단일의 소스 서브프레임에 의해서는 커버되지 않는다. 상이한 사이즈를 갖는 서브프레임에 적용되는 것으로서 본 발명의 추가 설명이 본 명세서 전체를 통해 제공되며 이하 더 구체적으로 제공된다.

특정의 실시예에 의하면, 상이한 사이즈를 갖는 서브프레임에 대한 오디오 변환부호화에서의 적응 코드북 피치 지연을 보간하는 방법뿐만이 아니라 기타 다른 변형, 변경 및 선택사항이 제공된다.

도 2는 본 발명에 따른 피치 지연 보간에 이용되는 빌딩 블록의 계층을 나타낸다. 이 도면은 단지 예일뿐이며, 첨부된 청구범위의 범위를 부당하게 한정하여서는 안된다. 당업자라면, 많은 변형, 변경 및 선택적 대안이 가능하다는 것을 알 수 있을 것이다. 특정의 실시예에 의하면, 시간 기준의 서브프레임 검사 모듈은 소스 코덱과 데스티네이션 코덱간의 서브프레임 보간을 처리하는데, 이는 소스 코덱과 데스티네이션 코덱의 서브프레임의 사이즈가 유사하지 않기 때문이다. 이 검사 모듈은 소스 및 데스티네이션의 서브프레임 길이에 대한 모든 경우(즉, 소스 서브프레임 길이가 데스티네이션 서브프레임의 길이보다 짧은 경우, 긴 경우 및 동일한 경우)를 처리한다. 신속한 판정 모듈은 데스티네이션 코덱에 대해 바람직한 피치 지연의 연산을 처리한다. 선택 모듈은 신속한 판정 모듈에 의해 연산된 기준 출력에 기초하여 최종의 피치 지연의 연산을 처리한다. 주의할 것은, 시간 기준의 서브프레임 검사 모듈은 상기 출력에 직접 연결될 수 있다는 것이다(즉, 신속한 판정 모듈과 선택 모듈을 우회할 수 있다는 것이다). 이것은 시간 기준의 검사 모듈이 출력에 직접 매핑할 수 있는 능력을 가지고 있기 때문이다. 이것은 소스 서브프레임에 관한 데스티네이션 서브프레임의 위치에 기초하여 시간 기준의 검사 모듈에 의해 적적한 시기에 결정된다.

도 3을 다시 보면, 소스 코덱에서의 적응 코드북 이득, 적응 코드북 피치 지연 및 서브프레임 사이즈를 각각 g_P ^S, L^S, N_S로 하고, 데스티네이션 코덱에서의 서브프레임 사이즈를 N_D로 한다. 소스 코덱에서의 서브프레임 사이즈는 데스티네이션에서의 서브프레임 사이즈와 상이하게 될 수 있다. 또한, 소스 프레임과 데스티네이션 프레임은 정렬되지 않을 수 있고 중첩될 수도 있다. 특정의 실시예에 따라, 이하 상이한 케이스(즉, 특정의 상태)에 있어서의 다양한 실시예를 설명하고 있지만, 이들은 예시적으로 제공되고 있을 뿐이다. 이들 실시예는 청구범위를 제한하는 의도는 아니다. 당업자라면 많은 변형, 선택적 대안 및 변경이 가능하다는 것을 알 수 있을 것이다.

제1 케이스 : 데스티네이션 서브프레임이 소스 코덱으로부터 하나의 서브프레임에 의해 완전하게 커버되는 경우, 데스티네이션에서의 적응 코드북 피치 지연은, 다음 식 1과 같이 된다.

[방정식 1]

L _D =L _S

제2 케이스 : 데스티네이션 서브프레임이 소스 코덱으로부터 여러 개의 서브프레임에 의해 커버되는 경우, 적응 코드북 피치 지연은 적응 코드북 이득의 함수에 해당하는 소스 서브프레임의 피치 지연이 되며, 중첩되는 부분의 크기가 최대로 된다. 이는 다음과 같이 표현될 수 있다.

[방정식 2]

E_n= α_n·g_P ^S

[방정식 3]

E_max= max(E₁, E₂, ..., E_n)

여기서, E_n은 소스 서브프레임에서의 중첩부α와 적응 이득 g_P ^S의 함수이고, E_max는 데스티네이션 서브프레임 m과 중첩되는 모든 서브프레임 중에서 최대값 E이다.

따라서, 선택된 적응 코드북 피치 지연은 데스티네이션 서브프레임에 대한 적응 코드북 피치 지연으로서 또는 추가로 튜닝(tuning)이 요구되는 경우의 개방루프 적응 코드북 피치 지연으로서 이용될 수 있다.

도 4에는 본 발명의 동작 흐름을 나타내는 흐름도가 예시되어 있다. 이 도면은 단지 예일뿐이며, 첨부된 청구범위의 범위를 부당하게 한정하여서는 안된다. 당업자라면, 많은 변형, 변경 및 선택적 대안이 가능하다는 것을 알 수 있을 것이다. 적응 코드북 파라미터는 오디오 변환부호화기의 보간기 모듈의 입력에 도달한다. 소스 서브프레임과 관련하여 현재의 데스티네이션 서브프레임 정렬에 대한 점검이 이루어진다. 데스티네이션 서브프레임이 소스 코덱의 하나의 서브프레임에 의해 완전히 커버된다면, 데스티네이션에서의 피치 지연은, 방정식 1에서 특정한 것과 같이, 소스 서브프레임의 대응하는 피치 지연과 동일하게 된다.

만일 데스티네이션 서브프레임이 소스 코덱의 2개 이상의 서브프레임에 의해 커버된다면, 오디오 변환부호화기내의 선택 모듈은, 방정식 2 및 방정식 3에서 특정한 것과 같이, 최대 기준값에 대한 중첩되는 소스 서브프레임을 검색하게 된다.

방정식 2 및 3에서의 기준에 대한 기초는 소스 코덱 서브프레임에서의 피치 이득의 세기(strength)이다. 정상적인 대화에서 묵음 기간 동안, 적응 코드북 이득은 매우 작게 되고, 유성음 기간과 대비를 이루게 되는데, 여기에서 피치 이득은 강하다. 그러므로, 소스 서브프레임의 충첩되는 부분에 따라, 피치 이득의 크기와 방정식 3으로부터의 인자α에 의해 특정되는 바와 같이, 방정식 3에서 특정된 것과 같은 판단 기준 (E_n)이 연산된다.

피치 지연은 데스티네이션 코덱에서 출력된다. 연산된 피치 지연은 데스티네이션 코덱에 대한 피치 지연의 허용된 지수 범위내로 맞춰져야 한다. 계산된 피치 지연이 데스티네이션 코덱의 허용된 지수 범위내로 맞춰지지 않는 경우에는, 피치 지연은, 허용된 최소 피치인지 또는 허용된 최대 피치인지, 그 속하는 범위에 따라 2배로 되거나 절반으로 될 수 있다. 본 실시예에 의하면, 제공된 특정의 예는 예시의 목적으로 제공된 것이다. 이들 예들은 본 명세서 전체를 통해 발견될 수 있으며 이하 더 구체적으로 알 수 있다.

G.723.1 ↔ GSM-AMR 변환부호화의 예

예시되는 예로서, 적응 코드북 피치 지연이 G.723.1에서 GSM-AMR로의 변환부호화기에서 어떻게 보간되는지를 보여준다(도 5). 이 도면은 단지 예일뿐이며, 첨부된 청구범위의 범위를 부당하게 한정하여서는 안된다. 당업자라면, 많은 변형, 변경 및 선택적 대안이 가능하다는 것을 알 수 있을 것이다.

2개의 G.723.1 서브프레임과 동일한 구간의 음성 신호를 기술하기 위해서는 3개의 GSM-AMR 서브프레임이 필요하다는 것을 도 5로부터 알 수 있다. 마찬가지로, 2개의 G.723.1 서브프레임마다 3개의 GSM-AMR 서브프레임이 필요하다. 소스 코덱이 G.723.1이고 데스티네이션 코덱이 GSM-AMR인 경우, GSM-AMR 적응 코드북 피치 지연은 다음과 같다.

(1)m번째 서브프레임: GSM-AMR 서브프레임은 5ms 이고, G.723.1 서브프레임은 7.5ms 이다. GSM-AMR 서브프레임 {m}은 G.723.1 서브프레임 {n}에 의해 완전히 커버된다. 방정식 1에 의하면, 적응 코드북 피치는 다음과 같이 된다.

L_m ^GSM-AMR= L_n ^G.723.1

(2)m+1번째 서브프레임: {m+1}번째 서브프레임은 2개의 소스 서브프레임{n}과 {n+1}에 의해 커버되고, G.723.1 서브프레임 {n}에 대한 GSM-AMR 서브프레임 {m}의 중첩은 {m}+{n+1}과 동일하다. 이에 따라, 소스 적응 코드북 이득에 의해 계산이 결정된다. 방정식 2 및 3에 따라, {m+1}번째 서브프레임 적응 코드북 피치 지연이 다음과 같이 획득될 수 있다.

여기서 G_P는 피치 이득이다.

(3)m+2번째 서브프레임: {m+2}번째 서브프레임은 G.723.1 서브프레임 {n+1}에 의해서만 커버된다. 따라서, 적응 코드북 피치 지연은 G.723.1과 동일하게 된다.

L _m+2 ^GSM-AMR =L _n+1 ^G.723.1

(4) 후속하는 서브프레임의 적응 코드북 피치 지연은 상기와 같이 획득될 수 있다.

다른 CELP 변환부호화기

다른 특정의 실시예에 의하면, 본 문서에 기재된 적응 코드북 계산의 발명은 모든 CELP 기반의 음성 코덱에 대해 일반적인 것이며, 기존의 코덱 G.723.1, GSM-AMR, EVRC, G.728, G.729, QCELP, MPEG-4 CELP, SMV와 피치 지연 정보를 이용하는 모든 다른 향휴의 CELP를 기반으로 하는 음성 코덱간의 임의의 음성 변환부호화기에 적용된다.

이러한 바람직한 실시예의 설명은 당업자가 본 발명의 구현 또는 이용할 수 있도록 제공된다. 이들 실시예에 대한 다양한 변형이 당업자에게 명백할 것이며, 본 명세서에서 정의한 일반적인 원리는 독창적인 능력을 이용하지 않고도 다른 실시예에 적용될 수 있다. 따라서, 본 발명은 본 명세서의 실시예에 한정되지 않으며, 본 명세서에 개시된 원리와 신규한 특성과 일치하는 가장 넓은 범위를 허용한다.

Claims

하나의 CELP 기반의 표준으로부터 다른 CELP 기반의 표준으로 적응 코드북 피치 지연을 처리하는 장치로서,

하나 이상의 입력 서브프레임을 데스티네이션 코덱의 출력 서브프레임에 연계시키기 위한 시간 기준의 서브프레임 검사 모듈과;

상기 시간 기준의 서브프레임 검사 모듈에 연결되어, 2개 이상의 입력 서브프레임의 각각 중에서 복수개의 피치 지연 파라미터로부터 원하는 피치 지연 파라미터를 판정하기 위한 판정 모듈과;

상기 결정 모듈에 연결되어, 상기 원하는 피치 지연 파라미터를 선택하기 위한 피치 지연 선택 모듈을 구비하는 것을 특징으로 하는 적응 코드북 피치 지연 처리 장치.
제1항에 있어서, 상기 시간 기준의 서브프레임 검사 모듈은 단일의 모듈 또는 복수개의 모듈인 것을 특징으로 하는 적응 코드북 피치 지연 처리 장치.
제1항에 있어서, 상기 원하는 피치 지연 파라미터는 상기 2개 이상의 입력 서브프레임과 연계된 피치 지연 선택을 위한 기준으로서의 최대값을 갖는 입력 서브프레임의 피치 지연인 것을 특징으로 하는 적응 코드북 피치 지연 처리 장치.
제1항에 있어서, 상기 원하는 피치 지연 파라미터는 상기 2개 이상의 입력 서브프레임과 연계된 피치 지연 선택을 위한 기준으로서의 평균값 또는 가중화된 평균값을 갖는 입력 서브프레임의 피치 지연인 것을 특징으로 하는 적응 코드북 피치 지연 처리 장치.
제1항에 있어서, 상기 판정 모듈은 단일의 모듈 또는 복수개의 모듈인 것을 특징으로 하는 적응 코드북 피치 지연 처리 장치.
제1항에 있어서, 상기 피치 지연 선택 모듈은 단일의 모듈 또는 복수개의 모듈인 것을 특징으로 하는 적응 코드북 피치 지연 처리 장치.
제1항에 있어서, 상기 하나의 CELP 기반의 표준 및 다른 CELP 기반의 표준은 상이한 서브프레임 사이즈의 CELP 코덱 또는 동일한 서브프레임 사이즈의 CELP 코덱을 갖는 것을 특징으로 하는 적응 코드북 피치 지연 처리 장치.
제1항에 있어서, 상기 시간 기준의 서브프레임 검사 모듈은,

하나 이상의 데스티네이션 서브프레임에 매핑하기 위해 대기하는 입력 서브프레임의 피치 지연, 피치 이득 및 하나 이상의 샘플을 저장하기 위한 적응 코드북 버퍼와;

상기 적응 코드북 버퍼에 연결되어, 상기 데스티네이션 서브프레임이 복수개의 소스 서브프레임에 의해 커버되는지 여부를 판별하기 위한 판별장치를 구비하는 것을 특징으로 하는 적응 코드북 피치 지연 처리 장치.
하나의 CELP 기반의 표준으로부터 다른 CELP 기반의 표준으로 적응 코드북 피치 지연을 처리하는 방법으로서,

소스 코덱으로부터 하나 이상의 각각의 서브프레임의 하나 이상의 적응 코드북 파라미터를 메모리에 저장하는 단계와;

상기 하나 이상의 서브프레임이 매핑을 위해 대기하는 동안 데스티네이션 서브프레임이 하나의 소스 서브프레임에 의해 완전하게 커버되는지 여부를 판정하는 단계와;

상기 데스티네이션 서브프레임이 단일의 상기 소스 서브프레임에 의해 완전하게 커버되는 경우, 상기 소스 서브프레임의 피치 지연을 출력하는 단계와;

상기 데스티네이션 서브프레임이 2개 이상의 소스 서브프레임에 의해 커버되는 경우, 판정 모듈에 의한 기준에 기초하여 선택을 위한 원하는 값을 갖는 소스 서브프레임의 피치 지연을 출력하는 단계를 포함하는 것을 특징으로 하는 적응 코드북 피치 지연 처리 방법.
제9항에 있어서, 상기 원하는 값을 갖는 소스 서브프레임의 피치 지연의 출력은 상기 판정 모듈에 의한 기준의 최대값을 가지며,

상기 데스티네이션 서브프레임이 하나 이상의 소스 서브프레임에 의해 커버되는 경우 상기 판정 모듈에 의한 상기 기준의 최대값을 검색하는 단계와;

상기 검색된 모든 서브프레임 중에서 선택을 위한 기준으로서의 최대값을 갖는 서브프레임의 피치 지연을 선택하는 단계와;

상기 소스 코덱으로부터 상기 선택된 서브프레임의 피치 지연을 출력하는 단계를 포함하는 것을 특징으로 하는 적응 코드북 피치 지연 처리 방법.
제9항에 있어서, 상기 원하는 피치 지연값은 상기 기준의 최대값을 갖는 입력 서브프레임의 피치 지연인 것을 특징으로 하는 적응 코드북 피치 지연 처리 방법.
제9항에 있어서, 상기 원하는 피치 지연값은 기준의 평균값 또는 가중화된 평균값을 갖는 입력 서브프레임의 피치 지연인 것을 특징으로 하는 적응 코드북 피치 지연 처리 방법.
제9항에 있어서, 상기 소스 코덱의 상기 하나 이상의 서브프레임은 입력 에지를 갖는 제1 입력 서브프레임을 구비하며, 상기 데스티네이션 코덱의 데스티네이션 서브프레임은 출력 에지를 갖는 제1 출력 서브프레임을 구비하고, 상기 입력 에지는 미리 정해진 시점에서 상기 출력 에지와 정렬되는 것을 특징으로 하는 적응 코드북 피치 지연 처리 방법.
제10항에 있어서, 상기 판정 모듈에 의해 상기 기준의 원하는 값을 검색하는 단계는,

상기 데스티네이션 서브프레임을 커버하는 각 서브프레임의 적응 코드북 파라미터를 조합시키는 단계와;

상기 데스티네이션 서브프레임을 커버하는 각 서브프레임의 비율을 계산하는 단계와;

각 서브프레임에서 상기 적응 코드북 파라미터의 에너지를 계산하는 단계와;

상기 적응 코드북 파라미터의 최대 에너지를 갖는 상기 소스 서브프레임을 지수화하는 단계를 포함하는 것을 특징으로 하는 적응 코드북 피치 지연 처리 방법.
제1항에 있어서, 상기 판정 모듈은 이하의 방정식에 의해 각 서브프레임에서의 적응 코드북 파라미터의 에너지를 계산하는데,

E_n= α_n·g_P ^S

여기서, E_n은 소스 서브프레임에서 중첩부분 α와 적응 이득 g_P ^s의 함수인 것을 특징으로 하는 적응 코드북 피치 지연 처리 장치.
제1항에 있어서, 상기 판정 모듈은 이하의 방정식에 의해 상기 기준의 최대값을 갖는 원하는 값을 검색하는데,

E_max= max(E₁, E₂, ..., E_n)

여기서, E_max는 상기 데스티네이션 서브프레임 m과 중첩되는 모든 서브프레임 중에서 최대값 E인 것을 특징으로 하는 적응 코드북 피치 지연 처리 장치.
하나의 CELP 기반의 표준으로부터 다른 CELP 기반의 표준으로 적응 코드북 피치 지연을 처리하는 컴퓨터를 기반으로 하는 시스템에 있어서,

a) 하나 이상의 입력 서브프레임을 데스티네이션 코덱의 출력 서브프레임에 연계시키는 시간 기준의 검사 모듈에 사용되는 하나 이상의 코드와;

b) 상기 시간 기준의 검사 모듈에 연결되어, 2개 이상의 입력 서브프레임 각각 중에서 복수개의 피치 지연 파라미터로부터 원하는 피치 지연 파라미터를 판정하기 위한 판정 모듈에 사용되는 하나 이상의 코드와;

c) 상기 판정 모듈에 연결되어, 상기 원하는 피치 지연 파라미터를 선택하기 위한 피치 지연 선택 모듈에 사용되는 하나 이상의 코드를 구비하는 것을 특징으로 하는 컴퓨터 기반의 시스템.
제17항에 있어서, 상기 시간 기준의 서브프레임 검사 모듈은 단일의 모듈 또는 복수개의 모듈인 것을 특징으로 하는 컴퓨터 기반의 시스템.
제17항에 있어서, 상기 원하는 피치 지연 파라미터는 2개 이상의 입력 서브프레임과 연계된 최대 피치 지연인 것을 특징으로 하는 컴퓨터 기반의 시스템.
제17항에 있어서, 상기 원하는 피치 지연 파라미터는 상기 2개 이상의 입력 서브프레임과 연계된 기준의 평균값 또는 가중화된 평균값을 갖는 입력 서브프레임의 피치 지연인 것을 특징으로 하는 컴퓨터 기반의 시스템.
제17항에 있어서, 상기 판정 모듈은 단일의 모듈 또는 복수개의 모듈인 것을 특징으로 하는 컴퓨터 기반의 시스템.
제17항에 있어서, 상기 피치 지연 선택 모듈은 단일의 모듈 또는 복수개의 모듈인 것을 특징으로 하는 컴퓨터 기반의 시스템.
제17항에 있어서, 상기 하나의 CELP 기반의 표준 및 다른 CELP 기반의 표준은 상이한 서브프레임 사이즈의 CELP 코덱 또는 동일한 서브프레임 사이즈의 CELP 코덱을 갖는 것을 특징으로 하는 컴퓨터 기반의 시스템.
제17항에 있어서, 상기 시간 기준의 서브프레임 검사 모듈은,

a) 하나 이상의 데스티네이션 서브프레임에 매핑하기 위해 대기하는 입력 서브프레임의 피치 지연, 피치 이득 및 하나 이상의 샘플을 저장하기 위한 적응 코드북 버퍼에 사용되는 하나 이상의 코드와;

b) 상기 적응 코드북 버퍼에 연결되어, 상기 데스티네이션 서브프레임이 복수개의 소스 서브프레임에 의해 커버되는지 여부를 판별하기 위한 판별장치에 사용되는 하나 이상의 코드를 구비하는 것을 특징으로 하는 컴퓨터 기반의 시스템.