KR20050049543A - 위상 갱신을 사용한 사인 오디오 코딩 - Google Patents

위상 갱신을 사용한 사인 오디오 코딩 Download PDF

Info

Publication number
KR20050049543A
KR20050049543A KR1020057006349A KR20057006349A KR20050049543A KR 20050049543 A KR20050049543 A KR 20050049543A KR 1020057006349 A KR1020057006349 A KR 1020057006349A KR 20057006349 A KR20057006349 A KR 20057006349A KR 20050049543 A KR20050049543 A KR 20050049543A
Authority
KR
South Korea
Prior art keywords
phase
track
sine
component
sinusoidal
Prior art date
Application number
KR1020057006349A
Other languages
English (en)
Inventor
안드레아스 요트. 게리트스
알베르투스 체. 덴 브링커
게라드 하. 호트호
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20050049543A publication Critical patent/KR20050049543A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

복수의 순차적인 세그먼트 각각에 대한 샘플링된 신호 값의 각 세트에 의해 표현된 오디오 신호(x)의 코딩이 개시된다. 샘플링된 신호 값은 복수의 순차적인 세그먼트 각각에 대한 하나 이상의 사인 성분(fk, fk-1)을 생성하기 위해 분석된다(130). 링크된 사인 성분(fk, fk-1)의 트랙을 포함하는 사인 코드(CS)가 생성되고(13), 트랙에서의 선택된 사인 성분의 위상 값을 나타내는 위상 갱신 정보()가 결정된다. 상기 사인 코드(CS)와 상기 위상 갱신 정보(

Description

위상 갱신을 사용한 사인 오디오 코딩{SINUSOIDAL AUDIO CODING WITH PHASE UPDATES}
본 발명은 오디오 신호를 코딩하고 디코딩하는 분야에 관한 것이다.
변수 코딩 방식, 특히 사인 코더는 PCT 특허출원 제 WO 00/79519-A1(대리인 관리번호 제 PHN017502호)호와 PCT 특허 출원 제 IB/02/01297(대리인 관리번호 제 PHNL010252호)호(2001년 4월 18일에 출원됨)에 기술되어 있다. 이 코더에서, 오디오 세그먼트나 프레임은 진폭, 주파수, 및 위상 변수에 의해 표현되는 다수의 사인파를 사용하여 사인 코더에 의해 모델링된다. 세그먼트에 대한 사인파가 추정되면, 추적 알고리즘이 개시된다. 이 알고리즘은 세그먼트 단위로 사인파들을 서로간에 링크시키고자 시도한다. 연속 세그먼트로부터의 적절한 사인파로부터의 사인 변수는 그에 따라 소위 트랙을 얻기 위해 링크된다. 링크 시의 기준은 두 개의 후속하는 세그먼트 주파수를 기초로 하지만, 진폭 및/또는 위상 정보가 또한 사용될 수 있다. 이 정보는 링크될 사인파를 결정하는 비용 함수에 결합된다. 그에 따라, 추적 알고리즘은 특정한 시간 인스턴스에 시작하고, 복수의 시간 세그먼트에 걸쳐서 특정한 양의 시간 동안 전개되며, 그 이후 정지하는 사인 트랙을 결국 생성한다.
이러한 종래기술의 코더를 실제 구현할 때, 사인 트랙에 대해, 단지 초기 위상만이 코더에 의해 송신되고, 디코더에서, 사인 트랙에서의 사인파의 연속 위상은 원 사인파의 위상과 중간 사인파의 주파수로부터 계산된다. 따라서, 예컨대, 트랙 내의 사인파(k)의 연속 위상()은 다음의 수학식 1로서 계산될 수 있다:
여기서, L은 보통은 대략 10ms인 주파수의 업데이트 주기(초 단위)이고, fk 및 fk-1은 프레임(k 및 k-1) 각각의 양자화된 주파수(라디안/초 단위)이다. 함수 mod는 사이의 간격상으로 매핑하는 모듈로 연산을 나타낸다. 더나아가, 초기 위상(k=1)은 =이며, 여기서 는 한 트랙 내의 원래 사인파의 측정되고 양자화된 위상이다. 다른 위상 연속 함수는 또한 2001년 10월 26일자로 출원된 유럽특허출원 제 01204062.2호(대리인 관리번호 제 PHNL010787호)에 지시된 바와 같이 가능하며, 여기서, warp 인자는 코더에 의해 결정될 수 있고, 트랙을 링크시킬 때 사용될 뿐만 아니라 연속 위상을 계산할 때 디코더에서 사용될 수 있다.
그럼에도 불구하고, 특히 긴 트랙에 대해, 연속 위상()은 측정된 위상()에서 이 위상과 서로 닯지 않을 정도로 발산할 것이다. 이러한 발산은 주파수 추정, 주파수 양자화, 및 초기 위상이나 이 위상의 선형 연속시의 부정확성으로 인해 초래될 수 있다. 개별 사인 트랙에 대해, 이러한 발산은 들을 수 없을 것이다. 그러나, 자연 오디오에서, 사인 트랙 사이의 위상 관계가 중요할 수 있다. 이처럼, 트랙 사이의 위상 동기화 손실은 이중 화자(double speaker) 효과, 금속성 사운드 등과 같은 아티팩트를 초래할 수 있다.
트랙 사이의 위상 동기화 손실은 도 4에 정량적으로 예시되어 있다. 이 도면에서, 상단 트레이스는 독일인 남성 화자에 의해 생성된 파형의 일부를 도시한다. 중앙 트레이스는 종래기술의 인코더/디코더를 사용하여 생성된 대응하는 사인 신호의 파형을 도시하며, 하단 트레이스는 원래 신호와 사인 신호 사이의 차이를 도시한다. 에러 신호로부터 볼 수 있는 바와 같이, 사인 신호는 원래 신호와 일치하지 않는다.
도 1은 본 발명에 따른 오디오 코더의 실시예를 도시한 도면.
도 2는 본 발명에 따른 오디오 플레이어의 실시예를 도시한 도면.
도 3은 본 발명에 따른 오디오 코더와 오디오 플레이어를 포함하는 시스템을 도시한 도면.
도 4는 종래기술의 인코더/디코더로 생성된 연속 위상(중앙 트레이스)을 갖는 사인 신호와 비교한 원래 파형(상단 트레이스) 및 그 에러 신호(하단 트레이스)를 도시한 도면.
도 5는 본 발명의 바람직한 실시예에 따른 인코더/디코더로 생성된 갱신된 위상(중앙 트레이스)을 갖는 사인 신호와 비교한 원래 파형(상단 트레이스) 및 그 에러 신호(바닥 트레이스)를 도시한 도면.
도 6은 독일인 남성 화자의 발췌부에 대한 위상차(Δ)의 분포도를 도시한 도면.
본 발명은 이러한 문제점을 완화하고자 한다.
본 발명에 따라, 청구항 1에 기재된 방법이 제공된다.
종래기술에서, 특히 연속 위상 정보로만 디코딩된 긴 트랙의 경우에, 연속 위상과 원래 측정된 위상 간의 발산은 커질것이다. 본 발명에 따른 위상 갱신 방법은 연속 위상으로 인코딩 및 디코딩된 트랙에 의해 초래된 아티팩트를 상당히 제거한다.
본 발명의 바람직한 실시예인 도 1에서, 인코더는 국제공개공보 제 WO01/69593-A1호(대리인 관리번호 제 PH-NL000120호)에 기술된 유형의 사인 코더이다. 이 코더 및 그 대응하는 디코더의 동작이 잘 기술되어있고, 본 발명에 관련된 부분에 대한 설명만이 본 명세서에서 제공된다.
이전의 경우 및 바람직한 실시예에서, 오디오 코더(1)는 특정한 샘플링 주파수에서 입력 오디오 신호를 샘플링하여, 결국 오디오 신호의 디지털 표현값{x(t)}을 생성한다. 그러면, 코더(1)는 샘플링된 입력 신호를 세 개의 성분으로 분리한다: 과도 신호 성분, 지속성의 결정 성분, 및 지속성의 확률 성분. 오디오 코더(1)는 과도 코더(11), 사인 코더(13), 및 노이즈 코더(14)를 포함한다. 오디오 코더는 선택적으로 이득 압축 메커니즘(GC)(12)을 포함한다.
과도 코더(11)는 과도 검출기(TD)(110), 과도 분석기(TA)(111), 및 과도 합성기(TS)(112)를 포함한다. 먼저, 신호{x(t)}는 과도 검출기(110)에 입력된다. 이 검출기(110)는 과도 신호 성분이 있는지와 이 성분의 위치를 추정한다. 이 정보는 과도 분석기(111)이 공급된다. 만약 과도 신호 성분의 위치가 결정된다면, 과도 분석기(111)는 과도 신호 성분(의 주요한 부분)을 추출하려고 시도한다. 분석기(111)는 형성 함수를 바람직하게는 추정된 시작 위치에서 시작하는 신호 세그먼트에 매칭시키며, 예컨대 (작은) 수의 사인 성분을 사용함으로써 형성 함수 하에서 내용을 결정한다. 이 정보는 과도 코드(CT)에 포함되며, 과도 코드(CT)를 생성에 관한 좀더 상세한 정보가 국제공개공보 제 WO01/69593-A1호에서 제공된다.
과도 코드(CT)는 과도 합성기(112)에 공급된다. 합성된 과도 신호 성분은 감산기(16)에서 입력 신호{x(t)}에서 감산되어, 신호(x1)를 생성한다. GC(12)가 생략된 경우에, x1=x2이다.
신호(x2)는 사인 코더(13)에 공급되며, 코더(13)에서, 신호는 사인 분석기(SA)(130)에서 분석되고, 분석기(130)는 (결정) 사인 성분을 결정한다. 그러므로, 과도 분석기가 존재하는 것이 바람직하지만, 이러한 분석기는 반드시 필요한 것이 아니며, 본 발명은 이러한 분석기 없이 구현될 수 있다는 점을 알아야 할 것이다. 어떠한 경우에도, 사인 코딩의 최종 결과는 사인 코드(CS)이고, 예시적인 사인 코드(CS)를 생성하는 기존의 예를 예시하는 좀더 상세한 예가 PCT 특허출원 제 WO00/79519-A1(대리인 관리번호 제 PHN017502호)에서 제공되어 있다.
간단히 말해, 그러나, 이러한 사인 코더는 한 프레임 세그먼트에서 그 다음 프레임 세그먼트로 링크된 사인 성분의 트랙으로서 입력 신호(x2)를 인코딩한다. 사인 코더를 통해 생성된 사인 코드(CS)로부터, 사인 신호 성분은 사인 합성기(SS)(131)에 의해 재구성된다. 이 신호는 사인 코더(13)로의 입력(x2)으로부터 감산기(17)에서 감산되어, 결국 (큰) 과도 신호 성분 및 (주요한) 결정 사인 성분이 없는 나머지 신호(x3)를 생성한다.
트랙은 주어진 세그먼트에서 시작한 사인파, 즉 생성된 파에 대해 시작 주파수, 시작 진폭, 및 시작 위상에 의해 초기에 표현된다. 2002년 7월 8일자로 출원된 유럽특허출원 제 02077727.2호(대리인 관리번호 제 PHNL020598호)에 개시된 바와 같이, 시작 위상은 매우 짧은 트랙에 대해 생략될 수 있다. 이러한 경우, 디코더는 짧은 트랙의 시작 세그먼트를 합성할 때 랜덤한 시작 위상을 사용한다.
어떠한 경우에도, 생성된 파 이후, 트랙은, 이 트랙이 종료(소멸)하는 세그먼트까지 주파수차와 진폭차(연속 신호)에 의해 후속한 세그먼트로 표현된다. 종래기술의 인코더를 실제로 구현할 때, 길거나 짧은 트랙에 대해, 위상 정보는 연속 신호에 대해 전혀 인코딩되지 않으며, 위상 정보는 연속 위상 재구성을 사용하여 재생성된다. 이러한 동작은, 위상 정보의 송신이 비트율을 상당히 증가시키기 때문에 실행된다.
본 발명에 따라, 신호를 분석할 때 사인 분석기(130)에 의해 측정된 위상()과, 한 트랙에서의 매 n번째 프레임에 대해 신호를 합성할 때 인코더 합성기(131) 및 대응하는 디코더 합성기(32) 모두에 의해 생성된 연속 위상() 사이의 차수 제한 발산에서, 사인 분석기(130)는 위상 갱신을 생성한다. 바람직한 실시예에서, n은 4이다. (만약 트랙이 n개의 프레임보다 더 짧다면, 어떠한 위상 갱신도 적용되지 않으며, 단지 제 1 위상만이 송신될 수 있다.) 그에 따라, 합성기(131, 32)에서, 위상은 이들 n개의 프레임 내에서 단지 발산할 수 있으며, 이 후, 위상은 다시 복구된다.
제 1 실시예에서, 한 트랙의 수명 동안에, 분석기(130)는 측정된 위상()을 주기적으로 양자화하며, 디코더에 송신된 사인 코드(CS)에 이 값을 포함한다. 전형적으로, 위상은 5 비트를 사용하여 정확하고도 균일하게 양자화될 수 있다. 위상 갱신은 추가적인 정보가 디코더에 송신되는 것을 필요로 한다는 점을 인식해야 한다. 테스트 신호(오디오 및 음성)의 전형적인 세트에 대해, n=4에 대한 위상 갱신을 갖는 비트율은, 발췌부에 따라서, 24kbit/s 사인 코더에 대해 1-3kbit/s만큼 증가할 것이다.
위상 갱신을 디코더에 송신하는 몇 가지 방식이 있음을 알게 될 것이다. 제 1 실시예에서, 측정된 위상은 한 트랙에서 제 1 사인파의 위상을 결정하는데 사용된 방식과 동일한 방식으로 양자화된다. 위상 갱신이 발생하는, 즉 매 n 프레임마다 발생하는 사인파에 대해, 이러한 양자화된 양자()가 송신된다.
인코더에 위상 갱신을 송신하는 제 2 방법은 각 갱신 지점에 대해 위상차를 양자화하는 것이다. 그에 따라, 측정된 위상과 연속 위상 간의, Δk 로 표시되는 차이는 수학식 2에 의해 계산된다:
는 수학식 1에 의해 한정되고, k는 트랙 내의 프레임 수이고, 는 양자화된 위상을 나타낸다. 예컨대, 차이(Δk)는 k-1이 n의 배수일 때 계산된다. n=4에 대해, 이것이 의미하는 것은, 위상 갱신은 프레임 1, 5, 9 등에 대해서 발생하며, 이러한 프레임들에서 위상차(Δk)는 디코더로 송신된다는 점이다.
도 6에서, 독일인 남자 화자에 대한 제 2 실시예의 Δ의 분포도가 도시되어 있다. 작은 범위의 Δ값 주위의 피크치가 있는 분포도로 인해, 균일하지 않은 양자화(엔트로피 코딩)가, 갱신 당 5비트미만의 비트가 제 1 실시예와 동일한 정확도를 제공하는데 사용될 수 있도록 적용될 수 있다. 더나아가, 적응형 차동 펄스 코드 변조(ADPCM)에서 사용된 방법과 유사한 양자화 방법이 사용될 수 있다. ADPCM에서, 각 샘플 지점에서 절대값 측정치를 코딩하는 대신에, 샘플간의 차이를 코딩하고, 진폭과 주파수의 변동을 보상하기 위해 코딩 스케일을 동적으로 스위칭할 수 있다. 그에 따라, 본 경우에, (위상 연속을 기초로 한) 적응형 예측기는 위상, 또는 위상차 양자화 스케일을 변경하는데 사용될 수 있다. 또한, n으로 지시되는 위상의 갱신율은 또한 주파수에 의존할 수 있다. 높은 주파수에 대해서는, 더 낮은 주파수(더 큰 n)에 대해서보다 갱신된 더 높은 위상(더 작은 n)이 사용될 수 있다.
어떠한 경우에도, 위상 갱신을 고려한 사인 분석 이후 남아 있는 신호(x3)는 주로 노이즈를 포함할 것이며, 바람직한 실시예의 노이즈 분석기(14)는 예컨대 PCT특허출원 제 WO01/89086-A1호(대리인 관리번호 제 PHNL000287호)에 기술된 바와 같이 이러한 노이즈를 나타내는 노이즈 코드(CN)를 생성한다. 다시, 이러한 분석기를 사용하는 것이 본 발명의 구현에 필수적인 것이 아니라, 이러한 사용을 보완하는 것임을 알 수 있을 것이다.
마지막으로, 멀티플렉서(15)에서, 오디오 스트림(AS)은 코드(CT, CS, 및 CN)를 포함하도록 구성된다. 오디오 스트림(AS)은 예컨대 데이터 버스, 안테나 시스템, 저장 매체 등에 공급된다.
도 2는 본 발명에 따른 오디오 플레이어(3)를 도시한다. 예컨대, 도 1에 따른 인코더에 의해 생성된 오디오 스트림(AS')은 데이터 버스, 안테나 시스템, 저장 매체 등으로부터 얻는다. 오디오 스트림(AS')은 코드(CT, CS, 및 CN)를 얻기 위해 디-멀티플렉서(30)에서 디-멀티플렉싱된다. 이들 코드는 과도 합성기(31), 사인 합성기(32), 및 노이즈 합성기(33) 각각에 공급된다. 과도 코드(CT)로부터, 과도 신호 성분은 과도 합성기(31)에서 계산된다. 과도 코드가 형태 함수를 지시하는 경우, 그 형태가 수신된 변수를 기초로 해서 계산된다. 나아가, 형태 내용은 사인 성분의 주파수와 진폭을 기초로 해서 계산된다. 만약 과도 코드(CT)가 한 스텝을 지시한다면, 어떠한 과도 신호도 계산되지 않는다. 총 과도 신호(yT)는 모든 과도 신호의 합이다.
사인 코드(CS)는 주어진 세그먼트 상의 사인파의 합으로서 기술된 신호(yS)를 생성하는데 사용된다. 종래기술의 디코더에서, 주파수를 디코딩하기 위해, 사인 트랙 내의 사인파의 연속 위상은 원래 사인파의 위상과 중간 사인파의 주파수로부터만 계산된다.
바람직한 실시예의 디코더에서, 송신된, 양자화된 위상()은 위상차(Δk)를 계산하는데 사용되거나, 위상차(Δk)는 비트스트림으로부터 직접 유도된다.
바람직한 실시예의 합성기(131, 32)는 또한 "위상 점프"의 가능성을 고려한다. 한 트랙 내의 두 연속 위상 사이의 차이가 큰 경우에 위상 점프가 일어난다. 이로 인해 클릭과 같은 아티팩트가 생성된다. 그러므로, 바람직한 실시예에서, 합성기(131, 32)는 n개의 프레임에 걸쳐서 측정된 위상과 연속 위상 간의 차이를 확산시키며, 따라서, 이 경우, 사인파 당 단지 작은 위상 정정만이 이뤄져서, 큰 위상 점프가 회피된다. 그에 따라, Δk는 현재의 프레임과 n-1개의 이전의 프레임에 걸쳐서 확산된다. 이것은 예컨대 선형적으로 이뤄질 수 있다.
여기서, K-n<k≤K이며, 여기서, K는 위상 갱신이 일어나는 트랙 내의 프레임의 수이다. 다른 방법이 또한 가능하다. 예컨대:
K-n<k≤K이다. 이 경우, 더 많은 위상 정정이 위상 갱신 지점에 더 근접한 사인파에 적용된다.
그에 따라, 본 발명의 바람직한 실시예에 따른 신호의 사인 성분을 합성할 때, 연속 위상은 위상을 갱신하는데 필요한 수학식 4 또는 5로부터 보간된 위상 차이(Δ')를 고려함으로써 계산된다:
정기적으로 위상을 갱신하고, 트랙 내의 사인파에 대한 위상차를 보간함으로써, 원래 신호와 위상이 갱신된 사인파 신호(여기서, n=4) 사이의 매칭이 개선된다. 이것이 도 5에 도시되어 있으며, 여기서, 원래 신호(상단 트레이스)와 사인파 신호(중앙 트레이스) 간의 에러 신호(하단 트레이스)는 도 4와 비교할 때 훨씬 감소함을 알 수 있다.
동시에, 신호의 사인 성분이 합성되고 있음에 따라, 노이즈 코드(CN)가 노이즈 합성기(NS)(33)에 공급되며, 이 합성기는 주로 노이즈의 스펙트럼을 근사화하는 주파수 응답을 갖는 필터이다. NS(33)는 백색 노이즈 신호를 노이즈 코드(CN)로 필터링함으로써 재구성된 노이즈(yN)를 생성한다.
총 신호{y(t)}는 과도 신호(yT)와, 임의의 진폭 압축해제신호(g)와 사인 신호(yS) 및 노이즈 신호(yN)의 합의 곱을 포함한다. 오디오 플레이어는 각 신호를 합하기 위한 두 개의 가산기(36 및 37)를 포함한다. 총 신호는 예컨대 스피커인 출력 유닛(35)에 공급된다.
상기 바람직한 실시예에서, 위상 갱신은 갱신에 앞서 수신된 n개의 프레임에 적용된대로 기술된다. 그러나, 본 발명은 갱신이 적용되는 n개의 프레임의 시작 시에 위상 갱신 정보를 포함하는 경우에도 마찬가지로 응용될 수 있음을 알아야 할 것이다. 이러한 방식으로, 위상은, 프레임에 대한 정보가 수신됨에 따라, 수학식 5와 유사한 수학식을 사용하여 결정될 수 있다.
절대 위상값이나 위상차가 위상 갱신 정보로서 송신될지에 대한 지시자를 예컨대 송신하는 것을 포함하여, 추가적인 변경이 또한 가능하다. 유사하게, (n을 변경하는) 적응형 갱신을 사용하는 것은 비트스트림으로 신호화될 수 있다. 또한, 특정한 주파수 범위에 대해, 어떠한 위상 갱신 정보도 공급되지 않을 것임을 비트스트림에서 지시하는 것이 바람직할 수 있으며, 이는 위상 갱신 정보를 사용하는 것이 특정한 주파수 범위에 대한 사운드 품질만을 유리하게 함을 알 수 있기 때문이다.
도 3은 도 1에 도시된 바와 같은 오디오 코더(1)와 도 2에 도시된 바와 같은 오디오 플레이어(3)를 포함하는 본 발명에 따른 오디오 시스템을 도시한다. 이러한 시스템은 재생 및 레코딩 특성을 제공한다. 오디오 스트림(AS)은 오디오 코더로부터 오디오 플레이어로 통신 채널(2)을 통해 공급되며, 이 채널(2)은 무선 연결, 데이터 버스나 저장 매체일 수 있다. 통신 채널(2)이 저장 매체인 경우에, 저장 매체는 시스템 내에서 고정되거나, 또한 탈착 가능한 디스크, 메모리 스틱 등일 수 있다. 통신 채널(2)은 오디오 시스템의 일부일 수 있지만, 종종 오디오 시스템 외부에 있을 것이다.
본 발명은 연속 위상이 사용되는 임의의 사인 오디오 코더에서 사용될 수 있다. 이처럼, 본 발명은 이러한 코더가 사용되는 곳이면 어디에서나 적용될 수 있다.
전술된 실시예가 본 발명을 제한하기 보다는 예시한다는 점과, 당업자가 첨부된 청구항의 범위에서 벗어나지 않고 많은 대안적인 실시예를 디자인할 수 있을 것이라는 점을 주목해야 한다. 청구항에서, 괄호 안의 임의의 참조번호는 청구항을 제한하는 것으로 해석되지 않아야 한다. 용어, '포함하다'는 청구항에 나열된 요소나 단계와는 다른 요소 또는 단계의 존재를 배제하지 않는다. 본 발명은 여러 별도의 요소를 포함하는 하드웨어와, 적절하게 프로그램된 컴퓨터에 의해 구현될 수 있다. 여러 수단을 열거하고 있는 디바이스 청구항에서, 이들 수단 중 몇몇은 하드웨어의 하나의 아이템에 의해 구현될 수 있다. 특정한 수단이 서로 다른 종속항에서 상술되어 있다는 단순한 사실이 이들 수단의 결합이 이점을 주는데 사용될 수 없다는 점을 지시하지 않는다.
상술한 바와 같이, 본 발명은 오디오 신호를 코딩하고 디코딩하는 분야에 이용된다.

Claims (18)

  1. 오디오 신호를 인코딩하는 방법으로서,
    복수의 순차적인 세그먼트 각각에 대한 샘플링된 신호 값의 각 세트를 제공하는 단계와;
    상기 복수의 순차적인 세그먼트 각각에 대한 하나 이상의 사인 성분을 생성하기 위해 상기 샘플링된 신호 값을 분석하는 단계와;
    링크된 사인 성분의 트랙을 포함하는 사인 코드를 생성하는 단계와;
    트랙 내에서 선택된 사인 성분의 위상 값을 나타내는 위상 갱신 정보를 결정하는 단계와;
    상기 사인 코드와 상기 위상 갱신 정보를 포함하는 인코딩된 오디오 스트림을 생성하는 단계를,
    포함하는, 오디오 신호를 인코딩하는 방법.
  2. 제 1항에 있어서, 상기 위상 갱신 정보는 선택된 사인 성분의 위상 값을 포함하는, 오디오 신호를 인코딩하는 방법.
  3. 제 1항에 있어서, 상기 위상 갱신 정보는 선택된 사인 성분의 위상 값과, 트랙의 상기 링크된 사인 성분을 통해 이전 위상 정보로부터 외삽된 상기 선택된 사인 성분에 대한 연속 위상 값 사이의 차이를 포함하는, 오디오 신호를 인코딩하는 방법.
  4. 제 1항에 있어서, 상기 위상 갱신 정보는 트랙 내의 매 n번째 세그먼트에 대해 제공되는, 오디오 신호를 인코딩하는 방법.
  5. 제 4항에 있어서, n은 4인, 오디오 신호를 인코딩하는 방법.
  6. 제 4항에 있어서, n은 상기 링크된 사인 성분의 주파수에 따라 변하는, 오디오 신호를 인코딩하는 방법.
  7. 제 1항에 있어서, 상기 위상 갱신 정보는 균일 또는 비균일한 척도 중 하나에 따라 양자화되는, 오디오 신호를 인코딩하는 방법.
  8. 제 1항에 있어서, 각 트랙은 트랙의 시작 세그먼트에서 사인 성분에 대한 주파수, 진폭 및 위상을 포함하고, 상기 트랙의 후속하는 연속 세그먼트에서 각 사인 성분에 대한 주파수 및 위상차를 포함하는, 오디오 신호를 인코딩하는 방법.
  9. 제 1항에 있어서, 상기 사인 코드와 상기 위상 갱신 정보를 사용하여 상기 사인 성분을 합성하는 단계와;
    상기 오디오 신호의 남은 성분을 나타내는 값 세트를 제공하기 위해 상기 샘플링된 신호 값으로부터 상기 합성된 신호 값을 감산하는 단계와;
    상기 남은 성분을 근사치를 구하게 하는 변수를 결정함으로써, 상기 오디오 신호의 상기 남은 성분을 모델링하는 단계와;
    상기 오디오 스트림에서 상기 변수를 포함시키는 단계를,
    포함하는, 오디오 신호를 인코딩하는 방법.
  10. 제 1항에 있어서, 상기 샘플링된 신호 값은 과도 성분을 제거시킨 오디오 신호를 나타내는, 오디오 신호를 인코딩하는 방법.
  11. 오디오 스트림을 디코딩하는 방법으로서,
    트랙에서 선택된 사인 성분의 위상값을 나타내는 위상 갱신 정보와, 링크된 사인 성분의 트랙을 포함하는 사인 코드를 포함하는 인코딩된 오디오스트림을 판독하는 단계와;
    트랙의 상기 링크된 사인 성분에 걸친 이전 위상 정보로부터 외삽된 연속 위상 정보와 상기 위상 갱신 정보의 함수로서 복수의 순차적인 세그먼트에 걸쳐서 사인 성분을 재구성하는 것을 포함해 상기 오디오 신호를 합성하기 위해 상기 사인 코드를 사용하는 단계를,
    포함하는 오디오 스트림을 디코딩하는 방법.
  12. 제 11항에 있어서, 세그먼트(k)에서 상기 사인 성분의 위상은 다음의 수학식:
    에 따라 재구성되며, L은 주파수의 갱신 간격이고, 는 선택된 사인 성분 사이의 상기 위상 갱신 정보로부터 보간되는, 오디오 신호를 인코딩하는 방법.
  13. 제 12항에 있어서,이나 이며, 여기서, n은 선택된 세그먼트 사이의 세그먼트의 수이며, 여기서, K-n<k≤K이며, 여기서, K는 위상 갱신 정보가 제공되는 트랙에서의 선택된 세그먼트의 수이며, 는 선택된 사인 성분의 측정된 위상값과, 트랙의 상기 링크된 사인 성분에 걸쳐서 이전 위상 정보로부터 외삽된 상기 선택된 사인 성분에 대한 연속 위상값 간의 차이를 포함하는, 오디오 신호를 디코딩하는 방법.
  14. 오디오 신호(x)의 복수의 순차적인 세그먼트 각각에 대한 샘플링된 신호 값의 각 세트를 처리하도록 배열된 오디오 코더로서,
    상기 복수의 순차적인 세그먼트 각각에 대한 하나 이상의 사인 성분을 생성하기 위해 상기 샘플링된 신호 값을 분석하기 위한 분석기와;
    링크된 사인 성분의 트랙을 포함하는 사인 코드를 생성하기 위한 성분과;
    트랙에서 선택된 사인 성분의 상기 위상 값을 나타내는 위상 갱신 정보를 결정하기 위한 수단과;
    상기 사인 코드와 상기 위상 갱신 정보를 포함하는 인코딩된 오디오 스트림을 생성하기 위한 비트스트림 생성기를,
    포함하는, 오디오 코더.
  15. 오디오 플레이어로서,
    링크된 사인 성분의 트랙을 포함하는 사인 코드와, 한 트랙에서 선택된 사인 성분의 위상 값을 나타내는 위상 갱신 정보를 포함하는 인코딩된 오디오 스트림을 판독하기 위한 수단과;
    트랙의 상기 링크된 사인 성분에 걸친 이전 위상 정보로부터 외삽된 연속 위상 정보와 상기 위상 갱신 정보의 함수로서 복수의 순차적인 세그먼트에 걸쳐서 사인 성분을 재구성하는 것을 포함해 상기 오디오 신호를 합성하기 위해 상기 사인 코드를 사용하도록 배열된 합성기를,
    포함하는, 오디오 플레이.
  16. 제 14항에 기재된 오디오 코더와 제 15항에 기재된 오디오 플레이어를 포함하는 오디오 시스템.
  17. 오디오 신호의 적어도 한 성분을 나타내며, 링크된 사인 성분의 트랙과, 트랙에서의 선택된 사인 성분의 위상 값을 나타내는 위상 갱신 정보를 포함하는 사인 코드를 포함하는, 오디오 스트림.
  18. 제 17항에 기재된 오디오 스트림이 저장되어 있는 저장 매체.
KR1020057006349A 2002-10-17 2003-09-19 위상 갱신을 사용한 사인 오디오 코딩 KR20050049543A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02079353 2002-10-17
EP02079353.5 2002-10-17

Publications (1)

Publication Number Publication Date
KR20050049543A true KR20050049543A (ko) 2005-05-25

Family

ID=32103967

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057006349A KR20050049543A (ko) 2002-10-17 2003-09-19 위상 갱신을 사용한 사인 오디오 코딩

Country Status (11)

Country Link
US (1) US20060009967A1 (ko)
EP (1) EP1563488A1 (ko)
JP (1) JP2006503323A (ko)
KR (1) KR20050049543A (ko)
CN (1) CN1689071A (ko)
AU (1) AU2003263509A1 (ko)
BR (1) BR0315338A (ko)
MX (1) MXPA05003937A (ko)
PL (1) PL376257A1 (ko)
RU (1) RU2005114916A (ko)
WO (1) WO2004036550A1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101080421B1 (ko) * 2007-03-16 2011-11-04 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치
KR20090008611A (ko) * 2007-07-18 2009-01-22 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치
KR101425354B1 (ko) * 2007-08-28 2014-08-06 삼성전자주식회사 오디오 신호의 연속 정현파 신호를 인코딩하는 방법 및장치와 디코딩 방법 및 장치
KR101425355B1 (ko) * 2007-09-05 2014-08-06 삼성전자주식회사 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법
WO2009059633A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
US9872066B2 (en) * 2007-12-18 2018-01-16 Ibiquity Digital Corporation Method for streaming through a data service over a radio link subsystem
CN103946918B (zh) * 2011-09-28 2017-03-08 Lg电子株式会社 语音信号编码方法、语音信号解码方法及使用其的装置
US10066001B2 (en) * 2013-03-15 2018-09-04 Apotex Inc. Enhanced liquid formulation stability of erythropoietin alpha through purification processing
WO2017064264A1 (en) * 2015-10-15 2017-04-20 Huawei Technologies Co., Ltd. Method and appratus for sinusoidal encoding and decoding

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6018682A (en) * 1998-04-30 2000-01-25 Medtronic, Inc. Implantable seizure warning system
US6449592B1 (en) * 1999-02-26 2002-09-10 Qualcomm Incorporated Method and apparatus for tracking the phase of a quasi-periodic signal
JP5485488B2 (ja) * 2000-06-20 2014-05-07 コーニンクレッカ フィリップス エヌ ヴェ 正弦波符号化

Also Published As

Publication number Publication date
MXPA05003937A (es) 2005-06-17
WO2004036550A1 (en) 2004-04-29
US20060009967A1 (en) 2006-01-12
JP2006503323A (ja) 2006-01-26
RU2005114916A (ru) 2005-10-10
PL376257A1 (en) 2005-12-27
AU2003263509A1 (en) 2004-05-04
EP1563488A1 (en) 2005-08-17
CN1689071A (zh) 2005-10-26
BR0315338A (pt) 2005-08-16

Similar Documents

Publication Publication Date Title
US7146324B2 (en) Audio coding based on frequency variations of sinusoidal components
KR101058064B1 (ko) 저비트율 오디오 인코딩
JP2011203752A (ja) オーディオ符号化方法及び装置
KR20060083202A (ko) 낮은 비트율 오디오 인코딩
EP1203369B1 (en) Sinusoidal coding
RU2353980C2 (ru) Аудиокодирование
KR20050049543A (ko) 위상 갱신을 사용한 사인 오디오 코딩
EP1522063B1 (en) Sinusoidal audio coding
KR20070019650A (ko) 오디오 인코딩
KR20050017088A (ko) 사인 곡선 오디오 부호화

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid