KR101091593B1 - 음성 신호의 스펙트럼 재구성 방법 및 디바이스 - Google Patents

음성 신호의 스펙트럼 재구성 방법 및 디바이스 Download PDF

Info

Publication number
KR101091593B1
KR101091593B1 KR1020057016445A KR20057016445A KR101091593B1 KR 101091593 B1 KR101091593 B1 KR 101091593B1 KR 1020057016445 A KR1020057016445 A KR 1020057016445A KR 20057016445 A KR20057016445 A KR 20057016445A KR 101091593 B1 KR101091593 B1 KR 101091593B1
Authority
KR
South Korea
Prior art keywords
frequency
encoder
cut
core
decoder
Prior art date
Application number
KR1020057016445A
Other languages
English (en)
Other versions
KR20060007371A (ko
Inventor
삐에릭 삘리프
쟝-베르나르 롤
Original Assignee
프랑스 뗄레꽁
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프랑스 뗄레꽁 filed Critical 프랑스 뗄레꽁
Publication of KR20060007371A publication Critical patent/KR20060007371A/ko
Application granted granted Critical
Publication of KR101091593B1 publication Critical patent/KR101091593B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

본 발명은 데이터-인코딩된 음성 신호의 스펙트럼 재구성 방법에 관한 것이다. 본 발명에 의하면, 음성 신호의 주파수 스펙트럼의 일부는 코어 디코더라고 하는 스펙트럼 대역 제한 디코더로 디코딩되고, 음성 신호의 주파수 스펙트럼의 상보적인 부분은 확장 디코더로 디코딩된다. 본 발명의 방법은, 코어 디코더에 의해 디코딩된 신호의 적어도 하나의 컷-오프 주파수를 나타내는 정보를 획득하는 단계, 및 선행 단계에서 획득된 정보에 따라, 디코딩될 데이터 또는 확장 디코더로 디코딩된 데이터로부터 데이터를 선택하는 단계를 포함한다. 또한, 본 발명은, 재구성 방법과 연관된 방법 및 인코딩 디바이스에 관한 것이다.
코어 인코더, 코어 디코더, 확장 인코더, 확장 디코더, 컷-오프 주파수

Description

음성 신호의 스펙트럼 재구성 방법 및 디바이스 {METHOD AND DEVICE FOR THE SPECTRAL RECONSTRUCTION OF AN AUDIO SIGNAL}
본 발명은 스펙트럼 재구성 기술을 이용하여 음성 신호를 인코딩 및 디코딩하는 방법 및 디바이스에 관한 것이다.
보다 상세하게는, 본 발명은 코어 인코더라 불리는 스펙트럼 대역 제한 인코더에 의해 인코딩된 음성 신호의 디코딩을 개선시키는 방법에 관한 것이다.
음성 신호 송신의 종래 기술에 있어서, 송신 전에, 원 신호의 인코딩 동작을 수행하는 것이 공지되어 있다. 수신된 신호에 관해서는, 이것은 역의 디코딩 동작을 경험한다. 이 인코딩은 비트 레이트 감소 인코딩일 수 있다. 공지된 비트 레이트 감소 인코더들은, 예를 들어, MPEG1, MPEG2, 또는 MPEG4-GA 인코더, CELP 형 인코더, 및 가능하다면 파라메트릭 MPEG4 형 인코더와 같은 파라메트릭형 인코더와 같은 변환형 인코더들이다.
비트 레이트 감소 음성 인코딩에 있어서, 음성 신호는, 비트 레이트가 낮은 경우에 종종 통과대역 제한을 경험해야 한다. 이 통과대역 제한은, 인코딩된 신호에 가청 양자화 잡음이 삽입되는 것을 회피하기 위해 필요하다. 그 후, 원 신호의 스펙트럼 콘텐츠 (spectral content) 를 가능한 한 완성하는 것이 바람직하다.
예를 들어, HFR (고-주파수 재생; High-Frequency Regeneration) 방법이라는 명칭으로 알려진 스펙트럼 확장 방법과 같이, 대역 확장이 종래 기술에서 공지된다. 제한된 대역의 디코딩된 저-주파수 신호는, 고조파 (harmonics) 로 강화된 신호를 획득하기 위해 비-선형 디바이스에 영향을 받기 쉽다. 이러한 신호는, 인코딩 전의 전체-대역 신호의 스펙트럼 포락선 (envelope) 을 설명하는 정보에 기초한 백색화 (whitening) 및 형상화 (shaping) 후에, 인코딩 전의 신호의 고-주파수 콘텐츠에 대응하는 고-주파수 신호의 생성을 허용한다.
또한, 디코더 레벨에서 뿐만 아니라 인코더 레벨에서도 고-주파수 스펙트럼 재구성 기술을 이용하는 디지털 음성 인코딩 시스템이 공지된다.
이러한 디지털 음성 인코딩 시스템은, 코어 인코더라 불리는 인코더에 의해 인코딩된 저-주파수 대역과, 대역 확장 인코더라 불리는 HFR 시스템에 의해 인코딩된 고-주파수 대역 사이의 컷-오프 주파수의 시간에 따른 적응을 수행한다.
이 경우에, 코어 인코더 및 대역 확장 인코더는 적응된 컷-오프 주파수에 따라 통과대역을 공유한다.
이 유형의 시스템은 특히 음성 신호를 인코딩하는데 유익하다.
인터넷, 무선 통신 네트워크, 및 그 밖의 통신 네트워크와 같은 특정 통신 네트워크는, 발신인과 수신인 간에 완전한 데이터 라우팅을 보장하지 않는다. 따라서, 어떤 데이터는 수신인에게 절대 도달하지 않거나 또는 수신인에게 너무 늦게 도달할 수도 있다. 너무 늦게 도달하는 경우, 수신인은 그 데이터를 손실된 것으로 간주한다.
이러한 네트워크에서, 데이터를 라우팅하는데 이용가능한 통과대역은 또한 계속적으로 상당히 변화한다.
무선 네트워크와 같은 다른 네트워크에서, 송신된 데이터 중의 몇몇 데이터는 다른 데이터들보다 높은 우선순위를 갖는다. 매우 효과적인 에러-정정 코드는, 이러한 우선순위가 높은 데이터와 연관되어, 정확한 디코딩을 보장하기 때문에 송신 손실이 없다. 반면에, 다른 데이터들은 덜 중요하고, 더 낮은-성능 에러-정정 코드 (어쩌면 전혀 없다) 가 그 다른 데이터들과 연관된다. 후자의 데이터는 네트워크의 위험 요소가 되기 쉽고 디코딩이 달성가능하지 않을 수도 있다.
MPEG4 표준에서 이용된 것과 같은 특정한 인코딩 시스템에서는, 아마도 송신 에러 후에, 인코딩된 신호의 스펙트럼의 특정한 주파수 대역의 신호가 더 이상 디코딩될 수 없고, 그 후 이러한 주파수 성분은 손실될 것이다.
따라서, 음성 신호의 인코딩이 최선의 가능한 방식으로 수행되었다고 할지라도, 그러한 네트워크상에서 송신된 신호의 디코딩은 네트워크와 연관된 많은 결점들을 포함한다.
본 발명은, 음성 신호의 주파수 스펙트럼의 일부가 코어 인코더라 불리는 스펙트럼 대역 제한 인코더로 인코딩되고 음성 신호의 주파수 스펙트럼의 상보저인 부분이 확장 인코더로 인코딩되는, 음성 신호를 인코딩하는 방법을 제안함으로써 종래 기술의 결점들을 해결하려고 시도하며, 코어 인코더로 인코딩된 스펙트럼의 적어도 일부가 또한, 확장 인코더로 인코딩되는 것을 특징으로 한다.
따라서, 음성 신호의 적어도 일부는, 양자의 인코더에 의해 인코딩되는데, 이는, 음성 신호의 적어도 일부가, 몇몇 데이터가 손실되거나 또는 에러가 있을 수도 있는 네트워크를 통과한다고 할지라도, 그 신호의 정확한 수신을 보장한다.
상관적으로, 본 발명은, 음성 신호의 주파수 스펙트럼의 일부가 코어 인코더라 불리는 스펙트럼 대역 제한 인코더로 인코딩되고 음성 신호의 주파수 스펙트럼의 상보적인 부분이 확장 인코더로 인코딩되는, 음성 신호를 인코딩하는 디바이스를 제안하는데, 이 디바이스는, 스펙트럼의 적어도 일부를 코어 인코더 및 확장 인코더로 인코딩하는 수단을 구비하는 것을 특징으로 한다.
보다 자세하게는, 코어 인코더의 적어도 하나의 컷-오프 주파수의 결정이 수행된다.
따라서, 코어 인코더의 컷-오프 주파수는 코어 인코더의 동작 조건에 적응될 수 있다.
보다 상세하게는, 인코딩된 디지털 신호는 네트워크를 통해 전송되고 결정된 주파수 또는 각각의 결정된 주파수는 인코딩된 디지털 신호와 함께 전송된다.
따라서, 디코더는, 정보를 인코딩된 디지털 신호로부터 판독함으로써 이 정보를 신속하게 프로세싱할 수 있다.
보다 상세하게는, 코어 인코더는 계층적인 (hierarchical) 인코더이고, 각각의 인코딩 계층에 대해, 각 인코딩 계층의 적어도 하나의 컷-오프 주파수가 결정된다.
따라서, 코어 인코더의 각 인코딩 계층에 대해, 코어 인코더의 컷-오프 주파수는 코어 인코더의 동작 조건에 적응될 수 있다.
보다 자세하게는, 인코딩된 디지털 신호의 각 인코딩 계층은 네트워크를 통해 송신되고, 그 계층에 대해 결정된 주파수 또는 각각의 주파수는 그 계층과 함께 전송된다.
따라서, 디코더는 모든 정보를 신속하게 입수할 수 있다. 그 후, 디코딩된 신호에 대해 어떤 특별한 프로세싱도 필요하지 않다.
보다 자세하게는, 코어 인코더 및 확장 인코더로 인코딩된 스펙트럼의 일부가 결정된다.
따라서, 양자의 인코더로 인코딩된 음성 신호의 일부는 시간에 따라 변할 수 있고, 예를 들어, 네트워크의 상태를 고려할 수 있다.
보다 자세하게는, 코어 인코더로 인코딩된 음성 신호의 주파수 스펙트럼의 일부는 음성 신호의 낮은 주파수 스펙트럼 부분이다.
또한, 본 발명은, 음성 신호의 주파수 스펙트럼의 일부가 코어 디코더라 불리는 스펙트럼 대역 제한 디코더로 디코딩되고 음성 신호의 주파수 스펙트럼의 상보적인 부분이 확장 디코더로 디코딩되는, 데이터의 형태로 인코딩된 음성 신호의 주파수 재구성 방법에 관한 것으로, 이 방법은,
- 코어 디코더에 의해 디코딩된 신호의 적어도 하나의 컷-오프 주파수를 나타내는 정보를 획득하는 단계;
- 획득된 정보에 따라, 디코딩될 데이터 또는 확장 디코더로 디코딩된 데이터 중에서, 디코딩에 관련된 데이터를 선택하는 단계를 포함하는 것을 특징으로 한다.
상관적으로, 본 발명은, 음성 신호의 주파수 스펙트럼의 일부가 코어 디코더라 불리는 스펙트럼 대역 제한 디코더로 디코딩되고 음성 신호의 주파수 스펙트럼의 상보적인 부분이 확장 디코더로 디코딩되는, 데이터의 형태로 인코딩된 음성 신호의 스펙트럼 재구성 디바이스를 제안하는데, 이 디바이스는,
- 코어 디코더에 의해 디코딩된 신호의 적어도 하나의 컷-오프 주파수를 나타내는 정보를 획득하는 수단;
- 획득된 정보에 따라, 디코딩될 데이터 또는 확장 디코더로 디코딩된 데이터 중에서, 디코딩에 관련된 데이터를 선택하는 수단을 구비하는 것을 특징으로 한다.
따라서, 디코딩된 신호는 더 나은 품질이 될 것이고, 신호의 스펙트럼 성분이 결여되지 않으며, 확장 디코더로 디코딩된 주파수 스펙트럼은 코어 디코더에 의해 디코딩된 신호의 컷-오프 주파수에 따라 변경된다.
보다 상세하게는, 코어 디코더로 디코딩된 음성 신호의 주파수 스펙트럼의 일부는 음성 신호의 낮은 주파수 스펙트럼 부분이다.
유리하게, 코어 디코더에 의해 디코딩된 신호의 적어도 하나의 컷-오프 주파수를 나타내는 정보는, 코어 디코더에 의해 디코딩된 신호의 높은 컷-오프 주파수의 평가를 실시함으로써 획득된다.
따라서, 인코딩되어 송신된 신호에 부가적인 정보를 포함하는 것이 불필요하고, 보다 적은 정보가 네트워크를 통해 통과한다.
보다 상세하게는, 코어 디코더는 계층적인 디코더이고, 코어 디코더에 의해 디코딩된 신호의 통과대역을 나타내는 정보는 디코딩된 신호의 각 계층에 대해 획득된다.
유리하게, 코어 디코더에 의해 디코딩된 신호의 적어도 하나의 컷-오프 주파수를 나타내는 정보는, 인코딩된 디지털 신호를 포함하는 데이터 스트림에 포함된 정보로부터 획득된다.
따라서, 디코더에서의 프로세싱 속도가 증가되는 동시에, 디코더를 단순화한다.
보다 상세하게는, 코어 디코더는 계층적인 디코더이고, 코어 디코더에 의해 디코딩된 신호의 통과대역을 나타내는 정보는 디코딩된 신호의 각 계층에 대해 획득된다.
따라서, 디코더는, 그 프로세싱을 각 인코딩 계층에 대해 적응시킬 수 있고, 디코더는, 이 정보를 각 계층에서 입수가능하기 때문에, 이 정보에 따라 확장 디코더로 디코딩된 주파수 스펙트럼을 변경할 수 있다.
상관적으로, 본 발명은, 음성 신호의 주파수 스펙트럼의 일부가 코어 인코더라 불리는 스펙트럼 대역 제한 인코더로 인코딩되고 음성 신호의 주파수 스펙트럼의 상보적인 부분이 확장 인코더로 인코딩되는, 인코딩된 음성 신호를 나타내는 데이터의 신호를 제안하는데, 그 신호는, 코어 인코더 및 확장 인코더로 인코딩된 스펙트럼의 일부를 포함하는 것을 특징으로 한다.
유리하게, 그 신호는 또한, 코어 인코더 또는 확장 인코더의 적어도 하나의 컷-오프 주파수를 나타내는 정보를 포함한다.
또한, 본 발명은, 데이터 매체 상에 저장된 컴퓨터 프로그램에 관한 것으로, 그 프로그램은 컴퓨터 시스템에 의해 로딩되고 실행되는 경우에, 전술된 프로세싱 방법의 구현을 가능하게 하는 명령들을 포함한다.
전술한 본 발명의 특성들 뿐만 아니라 다른 특성들도, 예시적인 실시형태에 관한 이하의 설명의 판독으로부터 보다 명확해질 것이며, 그 설명은 첨부 도면과 관련하여 주어진다.
도 1a 내지 도 1d 는, 코어 인코더 및 확장 인코더로 인코딩된 음성 신호의 다양한 주파수 스펙트럼들을 도시한다.
도 1e 내지 도 1g 는, 네트워크를 통해 송신되어, 코어 디코더 및 확장 디코더로 디코딩된 음성 신호의 다양한 주파수 스펙트럼들을 도시한다.
도 2a 내지 도 2e 는, 계층적인 코어 인코더 및 확장 인코더로 인코딩된 음성 신호의 다양한 주파수 스펙트럼들을 도시한다.
도 2f 내지 도 2i 는, 네트워크를 통해 송신되어, 계층적인 코어 디코더 및 확장 디코더로 디코딩된 음성 신호의 다양한 주파수 스펙트럼들을 도시한다.
도 3a 내지 도 3c 는, 본 발명에 따라 코어 인코더 및 확장 인코더로 인코딩된 음성 신호의 다양한 주파수 스펙트럼들을 도시한다.
도 3d 내지 도 3f 는, 네트워크를 통해 송신되어, 본 발명에 따라 코어 디코더 및 확장 디코더로 디코딩된 음성 신호의 다양한 주파수 스펙트럼들을 도시한다.
도 4a 는, 본 발명에 따른 인코딩 디바이스를 나타내는 블록도를 도시한다.
도 4b 는, 코어 계층적인 인코더의 주요 엘리먼트를 나타내는 블록도를 도시한다.
도 5 는, 본 발명에 따른 디코딩 디바이스를 나타내는 블록도를 도시한다.
도 6 은, 본 발명에 따라, 인코더 레벨에서 수행되는 알고리즘을 도시한다.
도 7 은, 본 발명에 따라, 디코더 레벨에서 수행되는 알고리즘을 도시한다.
도 1a 는, 인코딩되는 음성 신호의 주파수 스펙트럼을 도시한다. 코어 인코더/확장 인코더 결합과 같은 인코더들의 조합을 이용하는 인코더들에 따라, 스펙트럼의 저 주파수 (도 1b) 가 코어 인코더에 의해 인코딩되는 반면, 고 주파수는 확장 인코더에 의해 인코딩된다. 이 고 주파수의 부분은 도 1c 에서 도시된다.
그 후, 고 주파수 및 저 주파수를 결합하는 것이 도 1a 스펙트럼과 동일하거나, 그렇지 않으면 유사한 도 1d 에 도시된 전체 스펙트럼을 제공한다.
이렇게 인코딩된 음성 신호가 네트워크를 통해 송신될 때, 모든 송신된 데이터 중의 몇몇 데이터가 손실된다. 예를 들어, MPEG4 표준에서 이용된 것과 같은 특정한 인코딩 시스템의 경우에, 송신 에러 후에, 인코딩된 신호의 스펙트럼의 특정한 주파수로부터의 신호를 디코딩하는 것은 더 이상 불가능하다. 그 때, 이 주파수를 넘는 주파수 스펙트럼 성분을 나타내는 정보는 손실된 것으로 간주된다.
삭제
도 1e 는, 코어 디코더로 디코딩된 음성 신호의 주파수 스펙트럼을 도시한 것으로, 인코딩된 음성 신호는 네트워크를 통해 송신되며, 몇몇 데이터 (10) 는 손실된다.
이러한 유형의 손실은 코어 인코더에 의해 인코딩된 정보에 대한 특유의 결함이다. 데이터 (10) 의 결여는, 디코딩된 주파수의 스펙트럼에 홀을 구성하고, 이 홀은 음향 신호의 복구 시에 히싱 (hissing) 과 같은 상당한 잡음을 생성한다.
확장 인코더에 의해 인코딩된 정보의 항목은, 그들의 수에 관하여 훨씬 더 제한된다.
그들은, 코어 인코더에 의해 인코딩된 데이터에 포함되거나 또는 독립적으로 송신된다.
여기의 예에서, 네트워크를 통해 송신되어 확장 디코더로 디코딩된 음성 신호의 주파수 스펙트럼은 정확한 것으로 간주된다. 이것은 도 1f 에서 도시된다.
코어 디코더 및 확장 디코더 각각에 의한 음성 신호의 재구성은, 도 1g 에서, 손실된 주파수 성분 (10) 을 포함하는 주파수 스펙트럼을 나타낸다.
이러한 손실된 주파수 성분 (10) 은 음성 신호의 복원 특성을 상당히 손상시킨다.
도 2a 는, 계층적인 코어 인코더 및 확장 인코더에 의해 인코딩되는 전체 음성 신호의 주파수 스펙트럼을 도시한다.
계층적인 코어 인코더는, 인코딩될 음성 신호의 주파수 스펙트럼의 상이한 서브-부분들을 연속적으로 인코딩할 것이다.
스펙트럼의 제 1 부분, 예를 들어, 도 2b 에 도시된 스펙트럼과 같은 최저 주파수 성분을 포함하는 부분이 인코딩될 것이다. 이것을 제 1 계층이라 한다. 다음에, 부가적인 주파수 성분을 포함하는 또 다른 부분이 인코딩될 것이다. 이것은 제 2 계층이고, 도 2c 에서 도시된다.
따라서, 이러한 음성 데이터 송신 시스템에서, 최저 주파수를 나타내는 정보는 일반적으로 제 1 계층에서 송신된다. 그 후, 다른 계층들은, 예를 들어, 그들이 나타내는 스펙트럼의 주파수의 함수인 순서로 송신된다.
무선형 데이터 분산 네트워크에서, 송신된 계층들 중의 일정한 계층은 다른 계층들보다 더 높은 우선순위를 갖는다. 일반적으로, 최저 주파수를 포함하는 계층은 가장 높은 우선순위를 갖는 것으로 간주되고, 최고 주파수를 포함하는 계층은 가장 낮은 우선순위를 갖는 것으로 간주된다.
최저 주파수를 포함하는 계층의 경우에는, 매우 효과적인 에러-정정 코드가 연관되어, 정확한 디코딩을 보장하기 때문에 송신 손실이 없다.
덜 효과적인 에러-정정 코드는 최고 주파수를 포함하는 계층과 연관된다. 후자는 네트워크의 위험 요소가 되기 쉽고, 디코딩이 달성가능하지 않을 것이다.
도 2d 는, 대역 확장 인코더에 할당되는 스펙트럼의 일부를 도시하며, 그것은 도 1c 에 도시된 것과 동일하다.
도 2b, 도 2c, 및 도 2d 의 세 스펙트럼들을 결합하면, 도 2a 의 스펙트럼과 동일하거나 그렇지 않으면 유사한 도 2e 에 도시된 전체 스펙트럼이 주어진다.
도 2f 및 도 2g 는, 2 개의 계층의 계층구조 (hierarchy) 를 포함하는 계층적인 코어 디코더로 디코딩된 음성 신호의 주파수 스펙트럼들을 도시한 것으로, 인코딩된 음성 신호는 네트워크를 통해 송신되며, 그 음성 신호의 일정한 계층이 손실된다.
제 1 계층의 송신 중에, 이 계층에 상응하는 스펙트럼은, 도 2f 에서 도시되는 바와 같이, 송신 에러에 의해 손상되지 않았다.
데이터는 제 2 계층의 송신 중에 손실되며, 이 계층에 상응하는 스펙트럼은, 결여되는 주파수 성분 (도 2g 에서 25) 을 포함한다.
대역 확장 인코더에 할당된 스펙트럼의 일부는 도 1c 에서 설명된 것과 동일하다. 그것은 도 2h 에 도시된다.
따라서, 코어 계층적인 디코더 및 확장 디코더 각각에 의한 음성 신호의 재구성은, 주파수 성분 (25) 을 포함하는 주파수 스펙트럼을 도 2i 에 나타낸 것으로, 주파수 성분 (25) 은 손실되어 있다.
도 3a 는, 본 발명에 따라 코어 인코더 및 확장 인코더에 의해 인코딩되는 전체 음성 신호의 주파수 스펙트럼을 도시한다.
코어 인코더는, 음성 신호의 주파수 스펙트럼의 저-주파수 성분을 인코딩한다. 이것은 도 3b 에서 도시된다.
종래 기술과는 달리, 본 발명에 따라, 확장 인코더는, 인코딩될 음성 신호의 주파수 스펙트럼의 고-주파수 성분뿐만 아니라, 코어 인코더가 인코딩하는 저-주파수 성분의 일부 (30) 도 인코딩한다. 이러한 성분들은 도 3c 에서 도시된다.
도 3d 는, 코어 디코더로 디코딩된 음성 신호의 주파수 스펙트럼을 도시한 것으로, 인코딩된 음성 신호는 네트워크를 통해 송신되며, 그 음성 신호의 일정한 계층 (31) 이 손실된다.
코어 디코더에 의해 디코딩된 음성 신호의 통과대역에 대한 평가가 이루어지며, 그것이 예상되는 것과 상이하다면, 코어 디코더는 확장 디코더에 손실 통과대역에 대해 통지한다.
이러한 정보에 의해, 확장 디코더는, 디코딩이 손실 통과대역에도 적용될 수 있도록 디코딩을 적응시킨다.
도 3e 는, 확장 디코더에 의해 수신된 인코딩 정보에 상응하는 주파수 스펙트럼을 도시한다. 이 스펙트럼은 성분들 (32, 33, 및 34) 로 구성된다.
네트워크의 통과대역에서의 변화와 관련된 송신 에러 또는 송신 에러들이 발생하지 않는다면, 성분 (34) 에 대응하는 정보가 디코딩하는데 충분하다.
네트워크의 통과대역이 변화하거나 또는 송신 에러들이 발생하여 도 3d 의 성분 (31) 이 손실된다면, 성분들 (33 및 34) 에 대응하는 정보는 디코딩이 필요하다.
따라서, 코어 계층적인 디코더 및 확장 디코더 각각에 의한 음성 신호의 재구성은, 도 3f 에서, 더 이상 어떠한 손실 주파수 성분도 포함하지 않는 주파수 스펙트럼을 나타낸다. 따라서, 네트워크가 큰 통과대역 변화를 갖는 경우라고 해도, 디코딩된 음성 신호는 높은 품질이 유지된다.
도 4a 는, 본 발명에 따른 인코딩 디바이스를 나타내는 블록도를 도시한다.
인코딩 디바이스는, 인코딩될 아날로그 신호를 디지털 신호로 변환하는 아날로그-디지털 변환기 (400) 로 구성된다. 물론, 데이터가 이미 디지털 형태로 존재한다면, 아날로그-디지털 변환기는 불필요하다.
디지털 신호는, 이 신호를 인코딩하는 코어 인코더 (401) 로 전달된다. 코어 인코더 (401) 는, 예를 들어, MPEG1, MPEG2, 또는 MPEG4-GA 표준 중 하나에 따르는 비트 레이트 감소 인코더, 또는 CELP 형 인코더, 계층적인 인코더, 가능하다면 파라메트릭 MPEG4 인코더이다.
코어 인코더의 출력은, 도 3b 에서 도시된 것과 같은 주파수 스펙트럼을 커버링하는 신호의 데이터를 나타낸다.
이 동일한 디지털 신호는 대역 확장 인코더 (403) 로 전달된다. 대역 확장 인코더는, 예를 들어, 마틴 디에츠 (Martin Dietz) 에 의해 제 112 회 AES 협의회에서 제출된 문서 "음성공학 학회, 협의회 논문 5553" 에서 기술된 것과 같은, HFR (High-Frequency Regeneration; 고-주파수 재생), 예를 들어 SBR (Spectral Band Replication; 스펙트럼 대역 복제) 형 인코더이다.
대역 확장 인코더의 출력은, 도 3c 에서 도시된 것과 같은 주파수 스펙트럼을 커버링하는 신호의 포락선의 데이터를 나타낸다.
컷-오프 주파수 조정 모듈 (402) 은, 대역 확장 인코더 (403) 및 코어 인코더 (401) 에 접속된다.
이 컷-오프 주파수 조정 모듈 (402) 은, 확장 인코더가 인코딩을 고려하는 주파수 스펙트럼을 정의한다.
이 컷-오프 주파수 조정 모듈 (402) 은, 이 주파수 스펙트럼을, 코어 인코더 (401) 의 높은 컷-오프 주파수 및 본 발명에 따른 디코더가 가능한 송신 손실을 극복할 수 있도록 하는 가변 주파수 대역에 따라 결정한다.
예를 들어, 계층적인 인코더의 이용 및 송신된 계층에 따라 강건성이 가변하는 에러-정정 코드에 의한 송신의 경우에 있어서, 가변 주파수 대역은, 강건한 에러-정정 코드를 갖지 않는 계층에 대하여 신호의 정확한 개조를 보장하도록 조정된다.
변형에 있어서, 코어 인코더 (401) 의 주파수 스펙트럼 대역은 확장 인코더 (403) 의 주파수 스펙트럼으로부터 조정될 수 있다는 것을 알아야 한다.
이 경우에, 컷-오프 주파수 조정 모듈 (402) 은, 코어 인코더 (401) 가 인코딩을 고려하는 주파수 스펙트럼을 정의한다. 이 컷-오프 주파수 조정 모듈 (402) 은, 이 주파수 스펙트럼을, 대역 확장 인코더 (403) 의 낮은 컷-오프 주파수 및 본 발명에 따른 디코더가 가능한 송신 손실을 극복할 수 있도록 하는 가변 주파수 대역에 따라 정의한다.
또한, 인코딩 디바이스는, 코어 인코더 (401) 및 대역 확장 인코더 (403) 에 의해 인코딩된 음성 신호를 멀티플렉싱하는 멀티플렉서 (404) 를 포함한다.
본 발명의 변형에 따르면, 컷-오프 주파수 조정 모듈 (402) 은, 코어 인코더 (401) 의 통과대역 또는 그 컷-오프 주파수, 가능하다면 확장 인코더 (403) 의 낮은 컷-오프 주파수도 나타내는 정보를 멀티플렉서 (404) 로 전송하므로, 이러한 것들은 송신된 데이터에 포함된다.
포함 (inclusion) 은 각 인코딩 계층에 대해 계층적인 인코더의 경우에 수행된다.
그 후, 멀티플렉싱된 데이터는, 예를 들어, 무선 송신의 경우에 에러-정정 코드를 멀티플렉싱된 데이터에 적용하여 이를 네트워크 (405) 를 통해 송신하는 네트워크 송신 모듈로 전송된다.
도 4b 는, 코어 계층적인 인코더의 주요 엘리먼트를 나타내는 블록도를 도시한다.
이 계층적인 인코더는 도 4a 를 참조하여 전술된 인코더 (401) 를 대신할 수 있다.
보통, 코어 계층적인 인코더는 인코딩될 주파수 스펙트럼을 상이한 계층으로 세분한다. 계층은 인코딩될 스펙트럼의 주파수 대역을 나타낸다. 계층의 수는 가변적이고 인코딩된 신호의 연속적인 송신을 허용한다.
단순함을 위하여, 오직 두 개의 계층만이 여기에 도시된다. 인코더는 원 신호의 주파수 스펙트럼의 최저부를 인코딩하는 제 1 인코더 (410) 로 구성된다.
인코딩된 정보는, 이러한 데이터를 멀티플렉서 (404) 로 전송하는 멀티플렉서 (416) 로 전송된다.
전술된 컷-오프 주파수 조정 모듈 (402) 은, 코어 인코더 (410) 의 통과대역을 나타내는 정보를 멀티플렉서 (404) 로 전송하므로, 이것은 이 계층과 연관된 데이터 스트림에 포함된다.
그 후, 이것은 인코딩된 신호의 제 1 계층을 구성한다.
또한, 인코딩된 정보는 디코더 (411) 로 전송된다. 이 디코더는 이 정보를 디코딩하여, 후에 그것을 원 신호로부터 디코딩된 신호를 감산할 감산 회로 (413) 로 송신한다.
원 신호는 미리, 제 1 인코더 (410) 의 인코딩 시간 및 디코더 (411) 의 디코딩 시간과 동일한 시간 간격만큼 지연 (414) 되었다는 것을 알아야 한다.
감산 회로의 출력에서 획득된 신호는 그 때, 인코딩의 잔여부를 제외하고 미리 인코딩된 저-주파수 성분이 제거되는 원 신호가 된다.
이 신호는, 제 1 인코더 (410) 와 동일한 유형의 인코더일 수도 있는 인코더 (415) 에 의해 다시 인코딩된다. 여기서, 제 1 인코더 (410) 에 의해 인코딩된 상기 신호들인 신호의 주파수 성분이 인코딩된다.
인코딩된 정보는, 이러한 데이터를 멀티플렉서 (404) 로 전송하는 멀티플렉서 (416) 로 전송된다.
전술된 컷-오프 주파수 조정 모듈 (402) 은, 코어 인코더 (415) 의 통과대역을 나타내는 정보를 멀티플렉서 (404) 에 전송하므로, 이것은 이 계층과 연관된 데이터 스트림에 포함된다. 또한, 인코딩 계층의 총 수, 또는 코어 인코더 (415) 의 높은 또는 낮은 컷-오프 주파수를 전송할 수도 있다.
이것은 그 때 인코딩된 신호의 제 2 계층을 구성한다.
계층의 수를 증가시키고자 한다면, 엘리먼트들 (410, 411, 413, 및 414) 이 각각의 부가적인 계층에 관하여 중복되어야 한다는 것을 알아야 한다.
또한, 각 인코더에 의해 프로세싱된 주파수 스펙트럼은 가변적일 수 있다는 것을 알아야 한다.
또한, 본 발명은 단일음, 입체음, 또는 멀티-채널 형태의 음성 신호에 대해 적용가능하다는 것을 알아야 한다.
멀티-채널 신호의 경우에 있어서, 인코더에 의해 송신된 통과대역 정보는, 결합 방식으로, 또는 우선 모드 (preferential mode) 로 송신될 수 있고, 각 채널의 통과대역은 차별적인 인코딩에 의해 다른 채널들로부터 추정될 수 있다.
도 5 는, 본 발명에 따른 디코딩 디바이스를 나타내는 블록도를 도시한다.
디코딩 디바이스는, 네트워크 (405) 의 수단에 의해 수신된 신호를 코어 디코더 (511) 에 대해 의도된 데이터 및 확장 디코더 (512) 에 대해 의도된 데이터로 분리하는 디멀티플렉서 (510) 로 구성된다. 또한, 그것은, 다음의 정보들이 송신된 데이터에 포함되었다면, 인코딩 디바이스의 코어 인코더 (401), 신호가 계층적인 인코더로 인코딩되었다면 인코더들 (410 및 415) 의 통과대역, 가능하다면 인코딩 디바이스의 확장 인코더 (403) 의 낮은 컷-오프 주파수도 나타내는 정보를 수신되는 신호로부터 추출한다.
코어 디코더 (511) 는 데이터를 디코딩하여, 도 3d 에서 도시된 신호와 같은 디코딩된 신호를 공급한다.
코어 디코더 (511) 는, 예를 들어, MPEG1, MPEG2, 또는 MPEG4-GA 표준 중 하나에 따르는 것과 같은 디코더, 또는 CELP 형 디코더, 계층적인 디코더, 가능하다면 파라메트릭 MPEG4 디코더이다.
코어 디코더 (511) 는, 제 1 실시형태에 따라, 그 코어 디코더에 의해 수신된 신호의 주파수 스펙트럼을 평가하는 적어도 하나의 컷-오프 주파수를 나타내는 정보를 획득하는 모듈 (511b) 을 포함한다. 이 모듈 (511b) 은, 예를 들어, 디코딩된 신호에 대해 시간-주파수 변환을 수행하고, 신호의 에너지가 무시될 수 있는 주파수를 결정함으로써 이것을 구현한다. 바람직하게는, 이것은 지각 (perception) 모델의 지원에 의해 수행될 수 있다.
디코더 (511), 보다 정확하게는 그 모듈 (511b) 은, 다음에, 컷-오프 주파수 또는 통과대역을 나타내는 정보의 항목을 확장 디코더 (512) 로 전송한다.
확장 디코더 (512) 는, 디코더 (511) 에 의해 송신된 정보의 대표 항목을 이용하여, 디멀티플렉서 (510) 로부터 수신한 인코딩된 데이터 중에서, 디코더 (511) 에 의해 결정된 주파수를 넘는 스펙트럼 포락선의 표시에 대응하는 데이터를 선택한다.
이러한 방식으로, 인코딩된 신호의 송신과 관련된 손실이 보상된다.
코어 디코더 (511), 보다 자세하게는, 적어도 하나의 컷-오프 주파수를 나타내는 정보를 획득하는 모듈 (511b) 은, 제 2 실시형태에 따라, 다음의 정보들이 송신된 데이터에 포함되었다면, 코어 인코더 (401) 또는 인코딩 디바이스의 인코더들 (410 및 415) 의 통과대역, 또는 가능하다면 인코딩된 신호의 계층의 수, 가능하다면 인코딩 디바이스의 확장 인코더 (403) 의 낮은 컷-오프 주파수도 나타내는 정보를 디멀티플렉서 (510) 로부터 획득한다.
이렇게 획득된 정보를 이용하여, 이 모듈 (511b) 은, 후자가 계층적인 디코더인 경우에, 각 계층이 정확하게 수신되었는지의 여부을 체크하고, 만약 그렇지 않다면, 하나 이상의 손실된 계층의 통과대역을 나타내는 정보의 항목을 확장 디코더 (512) 로 전송한다.
확장 디코더 (512) 는, 모듈 (511b) 에 의해 송신된 정보의 대표 항목을 이용하여, 디멀티플렉서 (510) 로부터 수신된 인코딩된 데이터 중에서, 손실된 주파수 대역에 대응하는 가장 낮은 주파수를 넘는 주파수의 스펙트럼 포락선의 표시에 대응하는 신호의 포락선에 대응하는 데이터를 선택한다.
따라서, 확장 디코더는, 수신된 마지막 계층에 영향을 미치는 손실에 관여하든지 중간 계층에 영향을 미치는 손실에 관여하든지 간에, 네트워크로 인한 손실을 정정한다.
대역 확장 디코더 (512) 는, 예를 들어, 마틴 디에츠 (Martin Dietz) 에 의해 제 112 회 AES 협의회에서 제출된 문서 "음성공학 학회, 협의회 논문 5553" 에서 기술된 것과 같은, HFR (High-Frequency Regeneration; 고-주파수 재생) 형 디코더, 예를 들어 SBR (Spectral Band Replication; 스펙트럼 대역 복제) 형 디코더이다.
변형에 있어서, 확장 디코더 (512) 는 수신된 모든 정보를 디코딩한다는 것을 알아야 한다. 디코딩된 데이터로부터의 선택은, 디코더 (511) 에 의해 결정된 주파수를 넘는 스펙트럼 포락선의 표시에 대응하는 것들만을 유지하도록 수행된다.
확장 디코더 (512) 에 의해 디코딩되거나 또는 선택된 포락선은 이득 제어 모듈 (515) 로 전송된다.
코어 디코더 (511) 에 의해 디코딩된 신호는, 저-주파수 디코딩된 신호로부터 스펙트럼의 고 주파수에서의 신호를 생성하는 전위 (transposition) 모듈 (513) 로 전송된다.
이 신호는 고-주파수 신호 포락선의 조정을 허용하기 위해 이득 제어 모듈 (515) 로 도입된다.
조정된 포락선 신호는 그 후, 가산기 (516) 에서, 코어 디코더 (511) 에 의해 디코딩된 신호에 가산된다.
바람직한 실시형태에서, 가산기 (516) 는 예를 들어, 특정한 성분을 계수로 곱함으로써 특정한 주파수 성분을 지지할 수 있다.
코어 디코더 (511) 에 의해 디코딩된 신호는 미리, 가산된 신호들 사이의 프로세싱 시간의 차이와 동일한 시간 간격만큼 지연되었다는 것을 알아야 한다. 이러한 지연은 지연 회로 (514) 에 의해 수행된다.
따라서 획득된 신호의 주파수 스펙트럼은 도 3f 의 스펙트럼과 유사하다.
다음에, 합산 신호는 디지털-아날로그 변환기 (517) 에 의해 아날로그 형태로 변환될 수 있다.
도 6 은, 인코더에서 본 발명에 따라 수행되는 알고리즘을 도시한다. 도면을 참조하여 전술된 바와 같이, 본 발명은 또한, 프로세서가 도 6 의 알고리즘을 단계 E1 내지 단계 E7 과 연관되는 실행가능한 코드를 실행하는 소프트웨어 형태로 구현될 수 있다.
인코딩 디바이스의 파워-업 시, 보다 상세하게는 인코딩 디바이스로서 컴퓨터를 이용하는 경우에, 프로세서는, 컴퓨터 판독-전용 메모리 또는 컴팩트 디스크 (CD-ROM) 와 같은 데이터 매체로부터, 도 6 의 단계 E1 내지 단계 E7 에 대응하는 프로그램의 명령들을 판독하고, 그 명령들을 랜덤 액세스 메모리 (RAM) 로 로딩하여 실행한다.
단계 E1 에서, 인코딩될 음성 데이터의 수신 시에, 프로세서는 코어 인코더의 통과대역 또는 적어도 하나의 컷-오프 주파수를 결정한다.
코어 인코더의 통과대역은, 예를 들어 코어 인코더의 로드에 의존하여 시간에 따라 가변적일 수도 있고, 가변적이지 않을 수도 있다는 것을 알아야 한다.
이 동일 단계에서, 프로세서는, MPEG1, MPEG2 또는 MPEG4-GA 표준 중 하나, 또는 CELP 형, 계층적인 유형, 가능하다면 파라메트릭 MPEG4 형에 따르는 소위 코어 인코딩 알고리즘에 따라 데이터를 인코딩한다.
단계 E2 는, 계층적인 인코딩의 경우에, 모든 계층이 인코딩되었는지의 여부를 체크하는 것으로 구성된다.
인코딩되지 않았다면, 그리고 코어 인코딩이 계층적인 인코딩이라면, 프로세서는 인코딩된 음성 신호의 각 계층에 대해 단계 E1 을 반복한다.
모든 계층이 인코딩되었거나, 또는 인코딩이 계층적인 인코딩이 아니라면, 알고리즘은 다음 단계 E3 로 진행한다.
단계 E3 에서, 프로세서는 주파수 마진을 결정한다. 이 마진은 미리 결정되어 레지스터에 저장될 수도 있거나 또는 변수 형태일 수도 있다.
이 변수는 예를 들어, 네트워크를 통한 송신 중에 인코딩된 데이터에 적용될 에러 정정의 유형에 의존한다.
이 마진이 결정됨에 따라, 단계 E4 에서, 프로세서는, 코어 인코더의 높은 컷-오프 주파수 및 마진으로부터, 확장 인코더의 낮은 컷-오프 주파수를 결정한다.
이 동작이 수행됨에 따라, 단계 E5 에서 프로세서는 이 정보를 확장 인코딩 서브루틴으로 전송한다.
마지막으로, 본 발명의 특정한 실시형태에 따라, 단계 E6 에서, 프로세서는 이 정보를 저장한다.
단계 E7 에서, 프로세서는, 스펙트럼이 단계 E5 에서 전송된 정보를 넘는 데이터를 인코딩함으로써 확장 인코딩을 실행한다. 대역 확장 인코딩은, 예를 들어, 마틴 디에츠 (Martin Dietz) 에 의해 제 112 회 AES 협의회에서 제출된 문서 "음성공학 학회, 협의회 논문 5553" 에서 기술된 것과 같은, HFR (High-Frequency Regeneration; 고-주파수 재생) 의 인코딩, 예를 들어 SBR (Spectral Band Replication; 스펙트럼 대역 복제) 형의 인코딩이다.
이 동작이 수행됨에 따라, 프로세서는, 인코딩되어 네트워크를 통해 송신된 데이터 스트림을 형성하기 위하여, 단계 E1 에서 인코딩된 음성 신호와 단계 E7 에서 인코딩된 음성 신호를 멀티플렉싱하는 것으로 구성되는 단계 E7 로 진행한다.
본 발명의 변형에 따라, 프로세서는, 인코딩되고 송신된 데이터 스트림에, 단계 E6 에 저장된 정보를 삽입하거나, 또는 다음의 정보 항목들, 즉, 코어 인코더의 통과대역, 확장 인코더의 통과대역, 각 인코딩 계층의 낮고 높은 주파수, 계층적인 인코더가 이용되는 경우의 인코딩 계층의 수 중 하나 이상을 삽입한다.
삽입은 각 인코딩 계층에 대해 계층적인 인코더의 경우에 수행된다.
이러한 동작이 수행됨에 따라, 프로세서는 단계 E1 으로 되돌아가서 인코딩될 새로운 음성 데이터를 기다린다.
도 7 은, 디코더에서 본 발명에 따라 수행되는 알고리즘을 도시한다.
도면을 참조하여 전술된 바와 같이, 본 발명은 또한, 프로세서가 도 7 의 알고리즘의 단계 E10 내지 단계 E15 와 연관된 코드를 실행하는 소프트웨어 형태로 구현될 수 있다.
수신 디바이스의 파워-업 시, 보다 상세하게는, 수신 디바이스로서 컴퓨터를 이용하는 경우에, 프로세서는, 컴퓨터 판독-전용 메모리로부터 또는 컴팩트 디스크 (CD-ROM) 와 같은 데이터 매체로부터, 도 7 의 단계 E10 내지 단계 E15 에 대응하는 프로그램의 명령들을 판독하고, 그 명령들을 랜덤 액세스 메모리 (RAM) 로 로딩하여 실행한다.
단계 E10 에서, 프로세서는, 디코딩될 음성 데이터의 수신 시에, 네트워크 (405) 의 수단에 의해 수신된 신호를 코어 디코더에 대해 의도된 데이터 및 확장 인코더에 대해 의도된 데이터로 분리한다. 그것은 또한, 다음의 정보들이 송신된 데이터에 포함되었다면, 음성 신호를 인코딩한 코어 인코더 또는 신호가 계층적인 인코더로 인코딩되었다면 음성 신호를 인코딩한 인코더의 통과대역 또는 적어도 하나의 컷-오프 주파수, 가능하다면 음성 신호를 인코딩한 확장 인코더의 낮은 컷-오프 주파수도 나타내는 정보를 수신된 신호로부터 추출한다.
이 동작이 수행됨에 따라, 프로세서는 단계 E11 로 진행한다. 그 후, 프로세서는 이러한 데이터의 디코딩을 수행한다.
프로세서는, MPEG1, MPEG2 또는 MPEG4-GA 표준 중 하나, 또는 CELP 형에 따르는 것과 같은 소위 코어 디코딩 알고리즘, 계층적인 디코딩, 가능하다면 파라메트릭 MPEG4 형 디코딩에 따라 데이터의 디코딩을 수행한다.
이 코어 디코딩 단계가 수행됨에 따라, 프로세서는, 제 1 실시형태에 따라, 코어 디코딩 단계에 의해 수신된 신호의 주파수 스펙트럼을 평가하는 적어도 하나의 컷-오프 주파수를 나타내는 정보를 획득하는 단계인 단계 E12 로 진행한다. 이것은 예를 들어, 단계 E11 에서 디코딩된 신호에 대해 시간-주파수 변환을 수행하고 신호의 에너지가 무시될 수 있는 주파수를 결정함으로써 수행된다. 바람직하게는, 이것은 지각 모델의 지원에 의해 수행될 수 있다.
또 다른 실시형태에 따라, 프로세서는, 단계 E1 에서 추출된 정보를 획득하고, 후자가 계층적인 디코더인 경우에, 각 계층이 정확하게 수신되었는지의 여부를 체크하고, 만약 그렇지 않다면, 하나 이상의 손실된 계층의 통과대역을 나타내는 정보의 항목을 확장 디코더로 전송한다.
이 동작이 수행됨에 따라, 단계 E13 은, 확장 디코더의 낮은 컷-오프 주파수의 적응으로 구성되어 확장 디코더가 네트워크로 인한 손실을 보상하도록 한다. 적응은 단계 E12 에서 획득된 컷-오프 주파수 또는 통과대역을 나타내는 정보, 또는 단계 E11 의 디코딩이 계층적인 디코딩이라면 하나 이상의 손실된 계층의 통과대역 또는 컷-오프 주파수를 나타내는 정보를 이용하여 수행된다.
이 동작이 수행됨에 따라, 프로세서는 단계 E14 로 진행하고, 소위 확장 디코딩 알고리즘에 따라, 이 미리 결정된 낮은 컷-오프 주파수를 넘는 주파수에 대응하는 데이터를 디코딩한다.
프로세서는, 적응된 주파수를 이용하여, 단계 E1 에서 분리되고 확장 디코딩에 대해 의도된 데이터 중에서, 손실된 주파수 대역에 대응하는 최저 주파수를 넘는 주파수의 스펙트럼 포락선의 표시에 대응하는 신호의 포락선에 대응하는 데이터를 선택한다.
따라서, 수신된 마지막 계층에 영향을 미치는 손실에 관여하든 중간 계층에 영향을 미치는 손실에 관여하든 간에, 확장 디코딩은 네트워크로 인한 손실을 정정한다.
확장 디코딩은, 예를 들어, 마틴 디에츠 (Martin Dietz) 에 의해 제 112 회 AES 협의회에서 제출된 문서 "음성공학 학회, 협의회 논문 5553" 에서 기술된 것과 같은, HFR (High-Frequency Regeneration; 고-주파수 재생) 형 디코딩, 예를 들어 SBR (Spectral Band Replication; 스펙트럼 대역 복제) 형 디코딩과 같은 대역 확장 디코딩 알고리즘이다.
마지막으로, 코어 디코더 및 확장 디코더에 의해 디코딩된 데이터는 가산되어 단계 E15 에서 디코딩된 음성 신호를 형성한다.
이러한 동작이 수행됨에 따라, 프로세서는 단계 E10 으로 되돌아가서 디코딩될 새로운 음성 데이터를 기다린다.
삭제
삭제
삭제
삭제

Claims (26)

  1. 음성 신호의 주파수 스펙트럼의 제 1 부분이 코어 인코더라고 하는 스펙트럼 대역 제한 인코더로 인코딩되고, 상기 음성 신호의 상기 주파수 스펙트럼의 상보적인 부분이, 상기 코어 인코더와는 별개인 확장 인코더로 인코딩되는, 상기 음성 신호를 인코딩하는 방법으로서,
    상기 코어 인코더로 인코딩된 상기 주파수 스펙트럼의 제 1 부분의 적어도 일부가 또한 상기 확장 인코더로 인코딩되며,
    상기 방법은,
    상기 코어 인코더의 로드를 고려하는 조정 모듈에 의해, 상기 코어 인코더의 적어도 하나의 컷-오프 주파수를 결정하는 단계; 및
    상기 조정 모듈에 의해 결정된 컷-오프 주파수를 이용하여, 상기 코어 인코더 및 상기 확장 인코더로 인코딩되는 상기 주파수 스펙트럼의 제 1 부분의 일부를 결정하는 단계로서, 상기 코어 인코더로 인코딩되는 주파수 스펙트럼의 부분의 송신 중에 발생가능한 데이터의 손실을 보상하기 위해, 상기 제 1 부분 및 상보적인 부분이 상기 컷-오프 주파수 근처에서 오버랩핑되는, 상기 주파수 스펙트럼의 제 1 부분의 일부를 결정하는 단계를 포함하고,
    조정 모듈에 의해, 상기 코어 인코더의 적어도 하나의 컷-오프 주파수를 결정하는 단계는,
    주파수 마진을 결정하는 단계로서, 상기 마진은 미리 결정되어 레지스터에 저장될 수도 있거나 또는 변수 형태인, 주파수 마진을 결정하는 단계;
    상기 마진으로부터, 상기 코어 인코더의 높은 컷-오프 주파수, 상기 확장 인코더의 낮은 컷-오프 주파수를 결정하고 상기 확장 인코더의 낮은 컷-오프 주파수의 표시 정보를 전달하는 단계;
    상기 정보를 전송하는 단계; 및
    상기 정보를 저장하는 단계를 포함하는 것을 특징으로 하는 음성 신호의 인코딩 방법.
  2. 제 1 항에 있어서,
    인코딩된 디지털 신호를 네트워크를 통해 전송하는 단계를 포함하고,
    상기 결정된 컷-오프 주파수 또는 각각의 결정된 컷-오프 주파수는 상기 인코딩된 디지털 신호와 함께 전송되는 것을 특징으로 하는 음성 신호의 인코딩 방법.
  3. 제 1 항에 있어서,
    상기 코어 인코더는 계층적인 (hierarchical) 인코더이며,
    각 인코딩 계층에 대해, 각 인코딩 계층의 적어도 하나의 컷-오프 주파수가 결정되는 것을 특징으로 하는 음성 신호의 인코딩 방법.
  4. 제 3 항에 있어서,
    인코딩된 디지털 신호의 각 인코딩 계층을 네트워크를 통해 전송하는 단계를 포함하고,
    상기 인코딩 계층에 대한 상기 결정된 컷-오프 주파수 또는 각각의 결정된 컷-오프 주파수는 상기 인코딩 계층과 함께 전송되는 것을 특징으로 하는 음성 신호의 인코딩 방법.
  5. 제 1 항에 있어서,
    상기 코어 인코더로 인코딩된 상기 음성 신호의 상기 주파수 스펙트럼의 일부는, 상기 음성 신호의 낮은 주파수 스펙트럼 부분인 것을 특징으로 하는 음성 신호의 인코딩 방법.
  6. 데이터 형태로 인코딩된 음성 신호의 스펙트럼 재구성 방법으로서,
    코어 디코더라고 하는 스펙트럼 대역 제한 디코더로 디코딩되는 상기 음성 신호의 주파수 스펙트럼의 낮은 주파수 컴포넌트에 대응되는 데이터와, 상기 코어 디코더와 별개인 확장 디코더로 디코딩되는 높은 주파수 컴포넌트를 포함하는 상기 음성 신호의 주파수 스펙트럼의 제 2 일부에 대응되는 데이터를 포함하고,
    상기 코어 디코더와 별개인 확장 디코더로 디코딩되는 상기 데이터는, 상기 높은 주파수 컴포넌트에 대응되고, 또한, 상기 코더 인코더에 의해 인코딩된 음성 신호의 주파수 스펙트럼의 낮은 주파수 컴포넌트의 일부에도 대응되며, 주파수 마진에 대응되는 부분은 상기 확장 인코더의 낮은 컷-오프 주파수와 상기 코어 인코더의 높은 컷-오프 주파수 사이이며,
    상기 방법은,
    상기 코어 디코더에 의해 디코딩된 상기 신호의 적어도 하나의 높은 컷-오프 주파수를 추정하는 단계;
    상기 적어도 하나의 높은 컷-오프 주파수로부터 상기 확장 디코더의 낮은 컷-오프 주파수를 얻는 단계; 및
    상기 얻은 낮은 컷-오프 주파수보다 높은 주파수에 대응되는 확장 데이터를 상기 확장 디코더에 의해 디코딩하는 단계를 포함하는 것을 특징으로 하는 음성 신호의 스펙트럼 재구성 방법.
  7. 삭제
  8. 삭제
  9. 제 6 항에 있어서,
    상기 코어 디코더에 의해 디코딩된 상기 음성 신호의 적어도 하나의 컷-오프 주파수를 나타내는 정보는, 인코딩된 디지털 신호를 포함하는 데이터 스트림에 포함된 정보로부터 획득되는 것을 특징으로 하는 음성 신호의 스펙트럼 재구성 방법.
  10. 제 6 항에 있어서,
    상기 코어 디코더는 계층적인 (hierarchical) 디코더이며,
    상기 디코딩된 상기 음성 신호의 각 계층에 대해, 상기 코어 디코더에 의해 디코딩된 상기 음성 신호의 통과대역을 나타내는 정보를 획득하는 것을 특징으로 하는 음성 신호의 스펙트럼 재구성 방법.
  11. 음성 신호의 주파수 스펙트럼의 제 1 부분이 코어 인코더라고 하는 스펙트럼 대역 제한 인코더로 인코딩되고, 상기 음성 신호의 상기 주파수 스펙트럼의 상보적인 부분이 상기 코어 인코더와 별개인 확장 인코더로 인코딩되는, 음성 신호를 인코딩하는 디바이스로서,
    상기 코어 인코더로 인코딩된 상기 스펙트럼의 제 1 부분의 적어도 일부는 또한 상기 확장 인코더로도 인코딩되며,
    상기 코어 인코더의 적어도 하나의 컷-오프 주파수를 결정하는, 상기 코어 인코더의 로드를 고려하는 조정 모듈;
    상기 조정 모듈에 의해 결정된 상기 컷-오프 주파수를 사용하여, 상기 코어 인코더 및 상기 확장 인코더로 인코딩되는 상기 스펙트럼의 제 1 부분의 적어도 일부를 결정하는 수단으로서, 상기 코어 인코더로 인코딩되는 주파수 스펙트럼의 부분의 송신 중에 발생가능한 데이터의 손실을 보상하기 위해, 상기 제 1 부분 및 상보적인 부분이 상기 컷-오프 주파수 근처에서 오버랩핑되는, 스펙트럼의 제 1 부분의 적어도 일부를 결정하는 수단;
    주파수 마진을 결정하는 수단으로서, 상기 마진은 미리 결정되어 레지스터에 저장될 수도 있거나 또는 변수 형태인, 주파수 마진을 결정하는 수단;
    상기 코어 인코더의 높은 컷-오프 주파수, 상기 확장 인코더의 낮은 컷-오프 주파수를 결정하고 상기 확장 인코더의 낮은 컷-오프 주파수의 표시 정보를 전달하는 수단;
    상기 정보를 전송하는 수단; 및
    상기 정보를 저장하는 수단을 포함하는 것을 특징으로 하는 음성 신호의 인코딩 디바이스.
  12. 제 11 항에 있어서,
    인코딩된 디지털 신호를 네트워크를 통해 전송하는 수단을 포함하고,
    상기 결정된 컷-오프 주파수 또는 각각의 결정된 컷-오프 주파수는 상기 인코딩된 디지털 신호와 함께 전송되는 것을 특징으로 하는 음성 신호의 인코딩 디바이스.
  13. 제 11 항에 있어서,
    상기 코어 인코더는 계층적인 (hierarchical) 인코더이며,
    각 인코딩 계층에 대해, 각 인코딩 계층의 적어도 하나의 컷-오프 주파수가 결정되는 것을 특징으로 하는 음성 신호의 인코딩 디바이스.
  14. 제 13 항에 있어서,
    인코딩된 디지털 신호의 각 인코딩 계층을 네트워크를 통해 전송하는 수단을 포함하고,
    상기 인코딩 계층에 대한 상기 결정된 컷-오프 주파수 또는 각각의 결정된 컷-오프 주파수는 상기 인코딩 계층과 함께 전송되는 것을 특징으로 하는 음성 신호의 인코딩 디바이스.
  15. 제 11 항에 있어서,
    상기 코어 인코더로 인코딩된 상기 음성 신호의 상기 주파수 스펙트럼의 일부는, 상기 음성 신호의 낮은 주파수 스펙트럼 부분인 것을 특징으로 하는 음성 신호의 인코딩 디바이스.
  16. 데이터 형태로 인코딩된 음성 신호의 스펙트럼 재구성 디바이스로서,
    음성 신호의 주파수 스펙트럼의 낮은 주파수 컴포넌트에 대응되는 데이터를 디코딩할 수 있는 코어 디코더라고 하는 스펙트럼 대역 제한 디코더;
    높은 주파수 컴포넌트를 포함하는, 음성 신호의 주파수 스펙트럼의 제 2 부분에 대응되는 데이터를 디코딩할 수 있는 상기 코어 디코더와는 별개인, 확장 디코더로서, 높은 주파수 컴포넌트에 대응되고 코어 디코더와는 별개인 확장 디코더로 디코딩되는 상기 데이터는 상기 코어 인코더에 의해 인코딩된 음성 신호의 주파수 스펙트럼의 낮은 주파수 컴포넌트의 부분에도 대응되며, 주파수 마진에 대응되는 부분은 확장 인코더의 낮은 컷-오프 주파수 및 코어 인코더의 높은 컷-오프 주파수 사이인, 확장 디코더;
    상기 코어 디코더에 의해 디코딩된 신호의 적어도 하나의 높은 컷-오프 주파수를 추정하는 수단;
    상기 적어도 하나의 높은 컷-오프 주파수로부터 상기 확장 디코더의 낮은 컷-오프 주파수를 얻는 수단; 및
    상기 얻은 낮은 컷-오프 주파수보다 높은 주파수에 대응되는 확장 데이터를 확장 디코더에 의해 디코딩하는 수단을 포함하는 것을 특징으로 하는 음성 신호의 스펙트럼 재구성 디바이스.
  17. 삭제
  18. 삭제
  19. 제 16 항에 있어서,
    상기 코어 디코더에 의해 디코딩된 상기 음성 신호의 적어도 하나의 컷-오프 주파수를 나타내는 정보는, 인코딩된 디지털 신호를 포함하는 데이터 스트림에 포함된 정보로부터 획득되는 것을 특징으로 하는 음성 신호의 스펙트럼 재구성 디바이스.
  20. 제 19 항에 있어서,
    상기 코어 디코더는 계층적인 (hierarchical) 디코더이며,
    상기 디코딩된 상기 음성 신호의 각 계층에 대해, 상기 코어 디코더에 의해 디코딩된 상기 음성 신호의 적어도 하나의 컷-오프 주파수를 나타내는 정보를 획득하는 것을 특징으로 하는 음성 신호의 스펙트럼 재구성 디바이스.
  21. 컴퓨터 프로그램을 저장하고 있는 컴퓨터 판독가능 저장 매체로서,
    상기 컴퓨터 프로그램은, 컴퓨터 시스템에 의해 로딩되어 실행되는 경우에, 제 1 항에 기재된 음성 신호의 인코딩 방법의 구현을 가능하게 하는 명령들을 포함하는, 컴퓨터 판독가능 저장 매체.
  22. 컴퓨터 프로그램을 저장하고 있는 컴퓨터 판독가능 저장 매체로서,
    상기 컴퓨터 프로그램은, 컴퓨터 시스템에 의해 로딩되어 실행되는 경우에, 제 6 항에 기재된 음성 신호의 스펙트럼 재구성 방법의 구현을 가능하게 하는 명령들을 포함하는, 컴퓨터 판독가능 저장 매체.
  23. 삭제
  24. 제 1 항의 단계를 수행하도록 배치된 프로세서 장치.
  25. 제 6 항의 단계를 수행하도록 배치된 프로세서 장치.
  26. 주파수 대역 내에 있고, 상기 대역 내의 다른 주파수보다 대역 에지 (band edge) 로부터 큰 정도로 제거된 주파수를 약화시키는 경향을 갖는 매체를 통해, 송신기로부터 수신기로, 주파수 대역을 갖는 음성 신호를 통신하는 방법으로서,
    상기 송신기에서,
    (i) 상기 음성 신호를 인코딩하여, (a) 음성 신호의 주파수 스펙트럼의 제 1 부분이 코어 인코더라고 하는 스펙트럼 대역 제한 인코더로 인코딩되고 (b) 상기 음성 신호의 상기 주파수 스펙트럼의 상보적인 부분이, 상기 코어 인코더와는 별개인 확장 인코더로 인코딩되며, 상기 코어 인코더로 인코딩된 상기 스펙트럼의 제 1 부분의 적어도 일부가 또한 상기 확장 인코더로 인코딩되는 단계, (ii) 상기 코어 인코더의 로드를 고려하는 조정 모듈에 의해, 상기 코어 인코더의 적어도 하나의 컷-오프 주파수를 결정하는 단계, (iii) 상기 조정 모듈에 의해 결정된 컷-오프 주파수를 이용하여, 상기 코어 인코더 및 상기 확장 인코더로 인코딩되는 상기 스펙트럼의 제 1 부분의 일부를 결정하며, 상기 코어 인코더로 인코딩되는 주파수 스펙트럼의 부분의 송신 중에 발생가능한 데이터의 손실을 보상하기 위해, 상기 제 1 부분 및 상보적인 부분은 상기 컷-오프 주파수 근처에서 오버랩핑되는 단계;
    상기 매체를 통해 상기 송신기로부터 수신기로, 상기 코어 인코더의 높은 컷-오프 주파수, 상기 확장 인코더의 낮은 컷-오프 주파수, 상기 코어 인코더에 의해 인코딩된 신호 및 상기 확장 인코더에 의해 인코딩된 신호의 표시를 송신하는 단계;
    상기 매체를 통해, 상기 코어 인코더의 높은 컷-오프 주파수, 상기 확장 인코더의 낮은 컷-오프 주파수, 상기 코어 인코더에 의해 인코딩된 신호, 상기 확장 인코더에 의해 인코딩된 신호의 표시를 상기 수신기에서 수신하는 단계; 및
    상기 수신기에서, (i) 코어 디코더라고 하는 스펙트럼 대역 제한 디코더로 디코딩되는 음성 신호를 스펙트럼으로 재구성하는 단계로서, 상기 데이터는, 음성 신호의 주파수 스펙트럼의 낮은 주파수 컴포넌트에 대응되고, 높은 주파수 컴포넌트를 포함하고 음성 신호의 주파수 스펙트럼의 제 2 부분에 대응되는 데이터는 상기 코어 디코더와는 별개인 확장 디코더로 디코딩되는, 음성 신호를 스펙트럼으로 재구성하는 단계를 포함하고,
    조정 모듈에 의해, 상기 코어 인코더의 적어도 하나의 컷-오프 주파수를 결정하는 단계는,
    주파수 마진을 결정하는 단계로서, 상기 마진은 미리 결정되어 레지스터에 저장될 수도 있거나 또는 변수 형태인, 주파수 마진을 결정하는 단계; 및
    상기 마진으로부터, 상기 코어 인코더의 높은 컷-오프 주파수, 상기 확장 인코더의 낮은 컷-오프 주파수의 표시를 결정하는 단계를 포함하고,
    상기 코어 디코더와는 별개인 상기 확장 디코더로 디코딩되는 데이터는 상기 코어 인코더에 의해 인코딩된 음성 신호의 주파수 스펙트럼의 상기 높은 주파수 컴포넌트 및 낮은 주파수 컴포넌트의 일부에도 대응되며, 주파수 마진에 대응되는 상기 일부는 상기 확장 인코더의 낮은 컷-오프 주파수 및 상기 코어 인코더의 높은 컷-오프 주파수 사이이며,
    상기 방법은,
    상기 코어 디코더에 의해 디코딩된 신호의 적어도 하나의 높은 컷-오프 주파수를 추정하는 단계;
    상기 적어도 하나의 높은 컷-오프 주파수로부터 상기 확장 디코더의 낮은 컷-오프 주파수를 얻는 단계; 및
    상기 얻은 낮은 컷-오프 주파수보다 높은 주파수에 대응되는 확장 데이터를 확장 디코더에 의해 디코딩하는 단계를 더 포함하는 것을 특징으로 하는 음성 신호 통신 방법.
KR1020057016445A 2003-03-04 2004-03-03 음성 신호의 스펙트럼 재구성 방법 및 디바이스 KR101091593B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0302730A FR2852172A1 (fr) 2003-03-04 2003-03-04 Procede et dispositif de reconstruction spectrale d'un signal audio
FR03/02730 2003-03-04
PCT/FR2004/000488 WO2004081918A1 (fr) 2003-03-04 2004-03-03 Procede et dispositif de reconstruction spectrale d’un signal audio

Publications (2)

Publication Number Publication Date
KR20060007371A KR20060007371A (ko) 2006-01-24
KR101091593B1 true KR101091593B1 (ko) 2011-12-13

Family

ID=32865273

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057016445A KR101091593B1 (ko) 2003-03-04 2004-03-03 음성 신호의 스펙트럼 재구성 방법 및 디바이스

Country Status (9)

Country Link
US (1) US7720676B2 (ko)
EP (1) EP1599868B1 (ko)
JP (1) JP4660470B2 (ko)
KR (1) KR101091593B1 (ko)
AT (1) ATE468584T1 (ko)
DE (1) DE602004027219D1 (ko)
ES (1) ES2345489T3 (ko)
FR (1) FR2852172A1 (ko)
WO (1) WO2004081918A1 (ko)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
PT1423847E (pt) 2001-11-29 2005-05-31 Coding Tech Ab Reconstrucao de componentes de frequencia elevada
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
JP4606418B2 (ja) * 2004-10-13 2011-01-05 パナソニック株式会社 スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
JP4977471B2 (ja) * 2004-11-05 2012-07-18 パナソニック株式会社 符号化装置及び符号化方法
KR100818268B1 (ko) 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
ATE523877T1 (de) * 2005-07-14 2011-09-15 Koninkl Philips Electronics Nv Audiodecodierung
EP1933304A4 (en) * 2005-10-14 2011-03-16 Panasonic Corp DIMENSIONABLE CODING APPARATUS, DIMENSIONABLE DECODING APPARATUS AND METHODS OF USING SAME
JP5173795B2 (ja) * 2006-03-17 2013-04-03 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
WO2008084688A1 (ja) * 2006-12-27 2008-07-17 Panasonic Corporation 符号化装置、復号装置及びこれらの方法
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
GB0705328D0 (en) * 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
WO2009029037A1 (en) * 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive transition frequency between noise fill and bandwidth extension
CN101809657B (zh) 2007-08-27 2012-05-30 爱立信电话股份有限公司 用于噪声填充的方法和设备
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
FR2929466A1 (fr) 2008-03-28 2009-10-02 France Telecom Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
WO2009157824A1 (en) * 2008-06-24 2009-12-30 Telefonaktiebolaget L M Ericsson (Publ) Multi-mode scheme for improved coding of audio
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
WO2013142650A1 (en) 2012-03-23 2013-09-26 Dolby International Ab Enabling sampling rate diversity in a voice communication system
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US20150170655A1 (en) * 2013-12-15 2015-06-18 Qualcomm Incorporated Systems and methods of blind bandwidth extension
EP3107096A1 (en) 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
KR102067044B1 (ko) * 2016-02-17 2020-01-17 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 과도 프로세싱을 향상시키기 위한 사후 프로세서, 사전 프로세서, 오디오 인코더, 오디오 디코더, 및 관련 방법
MX2018010753A (es) * 2016-03-07 2019-01-14 Fraunhofer Ges Forschung Método de ocultamiento híbrido: combinación de ocultamiento de pérdida paquete de dominio de frecuencia y tiempo en códecs de audio.
US20240212704A1 (en) * 2021-09-22 2024-06-27 Boe Technology Group Co., Ltd. Audio adjusting method, device and apparatus, and storage medium

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5495552A (en) * 1992-04-20 1996-02-27 Mitsubishi Denki Kabushiki Kaisha Methods of efficiently recording an audio signal in semiconductor memory
FR2729030B1 (fr) * 1994-12-30 1997-03-28 France Telecom Procede de reconfiguration dynamique d'un signal presentant un entrelacement temporel, recepteur et signal correspondants
JP3344944B2 (ja) * 1997-05-15 2002-11-18 松下電器産業株式会社 オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
US6023233A (en) * 1998-03-20 2000-02-08 Craven; Peter G. Data rate control for variable rate compression systems
FR2791167B1 (fr) * 1999-03-17 2003-01-10 Matra Nortel Communications Procedes de codage, de decodage et de transcodage audio
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US6704703B2 (en) * 2000-02-04 2004-03-09 Scansoft, Inc. Recursively excited linear prediction speech coder
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
FI109393B (fi) * 2000-07-14 2002-07-15 Nokia Corp Menetelmä mediavirran enkoodaamiseksi skaalautuvasti, skaalautuva enkooderi ja päätelaite
EP1199812A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Perceptually improved encoding of acoustic signals
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
PT1423847E (pt) * 2001-11-29 2005-05-31 Coding Tech Ab Reconstrucao de componentes de frequencia elevada
KR100636145B1 (ko) * 2004-06-04 2006-10-18 삼성전자주식회사 확장된 고해상도 오디오 신호 부호화 및 복호화 장치
EP1987513B1 (fr) * 2006-02-06 2009-09-09 France Telecom Procede et dispositif de codage hierarchique d'un signal audio source, procede et dispositif de decodage, programmes et signal correspondants
FR2898443A1 (fr) * 2006-03-13 2007-09-14 France Telecom Procede de codage d'un signal audio source, dispositif de codage, procede et dispositif de decodage, signal, produits programme d'ordinateur correspondants

Also Published As

Publication number Publication date
US20060265087A1 (en) 2006-11-23
ATE468584T1 (de) 2010-06-15
JP2006520487A (ja) 2006-09-07
EP1599868B1 (fr) 2010-05-19
JP4660470B2 (ja) 2011-03-30
WO2004081918A1 (fr) 2004-09-23
DE602004027219D1 (de) 2010-07-01
EP1599868A1 (fr) 2005-11-30
ES2345489T3 (es) 2010-09-24
KR20060007371A (ko) 2006-01-24
FR2852172A1 (fr) 2004-09-10
US7720676B2 (en) 2010-05-18

Similar Documents

Publication Publication Date Title
KR101091593B1 (ko) 음성 신호의 스펙트럼 재구성 방법 및 디바이스
US20220277756A1 (en) Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
KR101135726B1 (ko) 인코더, 디코더, 인코딩 방법, 디코딩 방법 및 기록 매체
KR101455915B1 (ko) 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더
JP6013646B2 (ja) オーディオ処理システム
US7050972B2 (en) Enhancing the performance of coding systems that use high frequency reconstruction methods
CN1327409C (zh) 提供信号重建的宽带音频信号发送机、接收机、***和方法
JP4740548B2 (ja) 帯域幅拡張技術を利用して符号化及び復号化を行う方法及び装置
CN102779519B (zh) 用于同步多声道扩展数据与音频信号以及用于处理音频信号的装置和方法
KR100717600B1 (ko) 오디오 파일 포맷 변환
JP2002521739A (ja) 音声データストリーム中への副データ挿入方法
JP2008107415A (ja) 符号化装置
KR101207110B1 (ko) 스케일러블 무손실 비트스트림의 인코딩 방법
WO2005083679A1 (en) An audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
EP2395503A2 (en) Audio signal encoding and decoding method, and apparatus for same
US20060235683A1 (en) Lossless encoding of information with guaranteed maximum bitrate
KR20060135699A (ko) 신호 복호화 장치 및 신호 복호화 방법
JP2007504503A (ja) 低ビットレートオーディオ符号化
JP6286554B2 (ja) 低演算資源を用いて符号化済みオーディオ信号を復号化する装置及び方法
JP2004184975A (ja) 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置
JP3649854B2 (ja) 音声符号化装置
JP6079230B2 (ja) 付加情報挿入装置、付加情報挿入方法、付加情報挿入プログラム、付加情報抽出装置、付加情報抽出方法、及び付加情報抽出プログラム
JP2006522949A (ja) 埋め込みデータ・チャンネルの更新
GB2624686A (en) Improvements to audio coding
JP2005148539A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant