KR100648760B1 - 고주파 재생 기술 향상을 위한 방법들 및 그를 수행하는 프로그램이 저장된 컴퓨터 프로그램 기록매체 - Google Patents

고주파 재생 기술 향상을 위한 방법들 및 그를 수행하는 프로그램이 저장된 컴퓨터 프로그램 기록매체 Download PDF

Info

Publication number
KR100648760B1
KR100648760B1 KR1020047007036A KR20047007036A KR100648760B1 KR 100648760 B1 KR100648760 B1 KR 100648760B1 KR 1020047007036 A KR1020047007036 A KR 1020047007036A KR 20047007036 A KR20047007036 A KR 20047007036A KR 100648760 B1 KR100648760 B1 KR 100648760B1
Authority
KR
South Korea
Prior art keywords
signal
frequency
difference
band
reproduction
Prior art date
Application number
KR1020047007036A
Other languages
English (en)
Other versions
KR20040066114A (ko
Inventor
크졸링크리스토퍼
엑스트란트페르
호리히홀거
Original Assignee
코딩 테크놀러지스 에이비
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=20286143&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR100648760(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 코딩 테크놀러지스 에이비 filed Critical 코딩 테크놀러지스 에이비
Publication of KR20040066114A publication Critical patent/KR20040066114A/ko
Application granted granted Critical
Publication of KR100648760B1 publication Critical patent/KR100648760B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Ceramic Products (AREA)
  • Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
  • Channel Selection Circuits, Automatic Tuning Circuits (AREA)
  • Piezo-Electric Transducers For Audible Bands (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Inorganic Insulating Materials (AREA)

Abstract

본 발명은 고주파 재생(high frequency reconstruction, HFR)을 활용함으로써 오디오 소스 코딩 시스템의 성능을 향상시킬 수 있는 새로운 방법과 새로운 장치를 제안한다. 본 방법은 스펙트럼의 어떤 부분이 디코더에서 HFR 방법에 의해 올바르게 재생되지 않을지 평가하기 위해서 인코더 부분에서 검출 도구(703a)를 이용한다. 이에 관한 정보들은 효율적으로 코딩(703b)되어서, 디코더에 보내진다. 디코더에서는 이 정보들이 고주파 재생기의 출력과 결합된다.
스펙트럼 포락선, HFR

Description

고주파 재생 기술 향상을 위한 방법들 및 그를 수행하는 프로그램이 저장된 컴퓨터 프로그램 기록매체{METHODS FOR IMPROVING HIGH FREQUENCY RECONSTRUCTION AND COMPUTER PROGRAM MEDIUM HAVING STORED THEREON PROGRAM FOR PERFORMING THE SAME}
본 발명은 스펙트럼 대역 복사(Spectral Band Replication, SBR)[WO 98/57436] 또는 이와 관련된 방법 등의 고주파 재생(high frequency reconstruction, HFR)을 이용하는 소스 코딩 시스템에 관한 것이다. 이 방법은 품질이 낮은 copy-up 방법[U.S. Pat. 5, 127, 054] 뿐만 아니라 고급 방법(스펙트럼 대역 복사, SBR)의 성능 또한 향상시킨다. 이 방법은 음성 코딩 시스템과 자연 언어 코딩 시스템 모두에 적용 가능하다.
고주파 재생(HFR)은 오디오 코딩 시스템과 음성 코딩 시스템을 향상시키는 비교적 새로운 기술이다. 현재까지 제 3세대 셀룰러 시스템을 위한 광대역 AMR 코더 같은 음성 코덱과 전통적인 웨이브폼 코덱인 MP3 또는 AAC 같은 오디오 코더에서 고주파 재생 알고리즘 SBR이 추가되는 MP3PRO 또는 AAC + SBR에서 이용하는 법에 관해서 소개되어 왔다.
고주파 재생(HFR)은 오디오와 음성 신호의 고주파대역을 인코딩하는데 매우 효율적인 방법이다. 이 방법은 독립적으로 코딩을 수행할 수 없기 때문에 항상 AAC, MP3 같은 표준 웨이브폼 오디오 코더 또는 음성 코더와 조합되어서 사용된다. 이러한 코더가 스펙트럼의 저주파 범위의 코딩을 맡게 된다. 고주파 재생의 기본 아이디어는 상위 주파수는 코딩되어서 전송되지 않고, 몇몇 추가 파라미터(주로 오디오 신호의 고주파 스펙트럼 포락선을 기술하는 데이터)의 도움을 받아서 하위 스펙트럼을 바탕으로 디코더에서 재생된다. 저 비트레이트로 전송되는 이 비트열은 독립적으로 또는 기본 코더의 추가 데이터로서 전송될 수 있다. 추가 파라미터는 또한 생략될 수도 있으나, 그렇게 할 경우 추가 파라미터를 사용하는 시스템에 비교해서 품질이 나빠질 것이다.
오디오 코딩에 있어서, 고주파 재생은 특히 품질 면에서 코딩 효율성을 굉장히 향상시킨다. 소리는 훌륭하지만 투명하지는 않다. 이것에는 두 가지의 주요한 이유가 있다.
- MP3 같은 전통적인 웨이브폼 코덱은 매우 낮은 비트레이트에 대한 오디오 대역을 감소시키는 것을 필요로 한다. 그렇지 않으면 스펙트럼에서 인공음(artifact) 수준이 너무 높아지기 때문이다. 고주파 재생은 그러한 고주파 대역을 매우 낮은 비용과 좋은 품질을 유지하면서 다시 재구성한다. 고주파 재생은 낮은 비용으로 고주파 구성 요소를 인코딩할 수 있기 때문에 오디오 코더에 의해 인코딩되는 오디오 대역폭은 추가로 줄여질 수 있다. 그 결과 인공음 수준은 낮아지게 되고, 토탈 시스템에서 최악의 출력보다 좋은 결과를 얻을 수 있다.
- 고주파 재생은 인코더에서의 다운샘플링 또는 디코더에서의 업샘플링과 조합하여 사용될 수 있다. 이러한 자주 사용되는 시나리오에서, 고주파 재생 인코더는 전체 대역의 오디오 신호를 분석하지만, 오디오 코더에 공급되는 신호는 낮은 샘플링 비 율로 다운샘플링 된다. 전형적인 예로 44.1 kHz의 고주파 재생 레이트과 22.05 kHz의 오디오 코더 레이트가 있다. 대체로 더 낮은 샘플링 비율에서 오디오 인코더를 실행하는 것이 보다 효과적이기 때문에, 낮은 샘플링 비율에서 오디오 인코더를 실행하는 것이 효율적이다. 디코딩 측면에서는, 낮은 샘플 비율 오디오 신호는 업샘플링되고, 고주파 재생 부분이 추가된다. 그래서 비록 오디오 코더가 위의 예에서처럼 절반으로 다운샘플링되어 실행되더라도 원시 나이키스트(original Nyquist) 주파수의 오디오 신호까지도 재생될 수 있다.
고주파 재생을 사용하는 시스템에 대한 기본 파라미터는 크로스오버 주파수(cross over frequency, COF)라고 불리는 파라미터이다. 이 주파수는 표준 웨이브폼 코딩을 적용하지 않고, 고주파 재생을 적용하는 범위가 시작되는 주파수이다. 가장 간단한 설정 방법은 COF를 일정한 상수 주파수로 정하는 것이다. 이미 소개된 바 있듯이 보다 발전한 해결 방법은 COF를 코딩되는 신호의 특성에 따라 동적으로 변화하도록 조정하는 것이다.
고주파 재생에 있어서 주된 문제점은 오디오 신호가 현재의 HFR 방법으로 재생되기 어려운 높은 고주파 구성 요소를 가지고 있을 수 있다는 것이다. 반면에, 이러한 고주파 구성 요소는 웨이브폼 코딩 방법이나 합성 신호 생성 같은 다른 방법으로는 쉽게 재생될 수 있다.
한 간단한 예는 도 1에서처럼 단순히 COF보다 높은 주파수에 있는 사인 파(sine wave)로만 구성되는 신호를 코딩하는 것이다.
여기서 COF는 5.5 kHz이다. COF보다 낮은 주파수 대역에서 이용할 수 있는 유용한 신호가 전혀 없기 때문에, 저대역의 정보를 바탕으로 고대역을 추정하는 HFR 방법은 어떠한 신호도 생성하지 않을 것이다.
따라서, 이런 이유로 사인 파 신호는 재생될 수 없을 것이다. 이 신호를 유용한 방법으로 코딩하기 위해서는 다른 방법이 필요하다. 이러한 간단한 경우에서는, COF를 다양하게 조정하는 방법을 이용해서 고주파 재생 시스템은 어느 정도 문제를 해결할 수 있다. 만약 COF가 사인 파의 주파수 보다 높은 주파수로 설정된다면 그 신호는 코어 코더를 이용해서 매우 효율적으로 인코딩될 수 있다. COF를 조정해서 인코딩 가능할 경우에는 이 문제가 해결되지만, 항상 그렇진 않다. 앞에서 언급했듯이, 오디오 코딩에 고주파 재생 기술을 결합하는 방법의 주요한 이점 중에 하나는 코어 코더가 (높은 압축 효율을 제공하면서) 샘플링 비율의 절반에서 실행할 수 있다는 사실이다. 예를 들어, 코어 코더가 44.1 kHz의 샘플링 비율을 가지는 오디오 신호를 22.05 kHz에서 실행하는 시스템을 들 수 있다. 이런 코어 코더는 단지 최대 10.5 kHz 정도까지의 신호를 인코딩 할 수 있다. 그러나, 이 점과 별개로, 보다 더 복잡한 신호를 코딩할 경우에는 코어 코더가 닿을 수 있는 범위내의 스펙트럼의 부분에 대해서도 인코딩은 엄청나게 복잡해진다.
실 세계의 신호는 복잡한 스펙트럼 내의 고주파에서 귀에 들리는 사인 파와 같은 구성 요소를 포함할 수 있다. 도 2는 그 한 예로 팝 음악에서 작은 종의 스펙트럼을 보여준다. 이러한 경우에 COF를 조정하는 것은 해결책이 되지 못한다. 왜냐하면, 고주파 재생 방법에 의해서 얻어지는 대부분의 이익은 스펙트럼 상의 너무 많은 부분에 대해 코어 코더를 사용해야 하기 때문에 감소되기 때문이다.
발명의 개요
위에서 기술한 문제에 대한 해결 방법으로, 본 발명의 주제는 고도로 유연한 HRF 시스템에 대한 아이디어이다. 본 시스템은 단순히 COF를 변화하는 것뿐만 아니라 다른 방법을 이용해 주파수를 선택하도록 함으로서 디코딩 또는 재생되는 스펙트럼을 보다 유연하게 합성할 수 있도록 허용한다.
본 발명의 기초는 HFR 시스템에서 주파수에 따라서 다른 코딩 또는 재생 방법을 선택할 수 있도록 해주는 구성 방법이다. 예를 들어 이 방법은 SBR에서 사용되는 것처럼, 64 대역 필터 뱅크 분석(64 band filter bank analysis)/합성 시스템(synthesis system)과 함께 사용될 수 있을 것이다. 알리어스가 없는 균등화 함수들(alias free equalisation functions)을 제공하는 복소수 필터 뱅크는 특히 효과적으로 사용될 수 있을 것이다.
본 발명의 핵심 포인트는 지금부터 필터 뱅크가 COF와 그 뒤에 나오는 포락선(envelope) 조정을 위한 필터로서의 역할만으로 사용되지는 않는다는 것이다. 이런 방법은 또한 다음과 같은 소스로부터 나오는 각각의 필터 뱅크 채널들에 대한 입력을 선택하기 위한 매우 유연한 방법으로 사용된다. 이런 소스 코드로는 다음과 같은 것들이 있다.
(코어 코더를 이용하는) 웨이브폼 코딩,
(그 뒤에 나오는 포락선 조정과의) 치환,
(나이키스트의 범위를 벗어나는 추가 코딩을 사용하는) 웨이브폼 코딩,
파라미터 코딩,
스펙트럼의 특정 부분에 적용할 수 있는 다른 어떤 코딩/재생 방법,
또는 위의 방법들의 다양한 조합 등이 사용된다.
따라서, 웨이브폼 코딩, 기타 다른 코딩 방법과 HFR 재생은 인제 가능한 한 최상의 품질과 코딩의 효율성을 얻기 위해서 다양하게 스펙트럼을 정렬하고 조합해서 사용할 수 있다. 그러나 본 발명은 하위 대역 필터 뱅크(subband filter bank)의 사용만으로 제한되지 않고, 다양한 주파수 선택 필터와 함께 사용될 수 있다는 것은 명백하다.
본 발명은 다음의 항목을 포함한다.
앞에서 설명한 디코더에서 고대역을 추정하기 위해서 저대역을 활용하는 HFR 방법
인코더 부분에서, COF 보다 낮은 주파수 범위를 바탕으로, HFR 방법이 원시 신호의 스펙트럼 선들과 유사한 스펙트럼 선들을 올바르게 생성하지 못하는 다른 주파수 범위에서 HFR 방법을 사용하는 것
다른 주파수 범위에 대해서 스펙트럼 선들의 코딩
다른 주파수 범위에 대해서 스펙트럼 선들을 인코더에서 디코더로 전달
스펙트럼 선 또는 스펙트럼 선들의 디코딩
디코더에서 HFR 방법으로부터 나오는 출력의 다른 주파수 범위에 디코딩된 스펙트럼 선들을 추가
이 코딩은 위에서 설명한 스펙트럼 선들의 파라미터 코딩이다.
이 코딩은 위에서 설명한 스펙트럼 선들의 웨이브폼 코딩이다.
파라미터를 이용해서 코딩되는 스펙트럼 선들은 하위 대역 필터 뱅크(subband filterbank)를 이용해서 합성된다.
스펙트럼 선들의 웨이브폼 코딩은 소스 코딩 시스템의 기본 코어 코더에 의해 수행된다.
스펙트럼 선들의 웨이브폼 코딩은 임의의 웨이브폼 코더에 의해서 수행된다.
다음의 첨부 도면을 참조하여, 본 발명의 범위 및 사상을 제한하지 않는 예시적인 실시 예를 통하여 본 발명을 설명한다.
도 1은 5.5 kHz의 COF 보다 높은 주파수에 위치하는 사인으로 구성되는 원시 신호의 스펙트럼을 보여준다.
도 2는 팝 음악에서 종을 포함하는 원시 신호의 스펙트럼을 보여준다.
도 3은 추정 이득(prediction gain)을 이용해서 생략된 고조파(harmonics)를 검출하는 것을 보여준다.
도 4는 원시 신호의 스펙트럼을 보여준다.
도 5는 본 발명 방법을 사용하지 않은 스펙트럼을 보여준다.
도 6은 본 발명을 이용한 출력 스펙트럼을 보여준다.
도 7은 본 발명의 적용 가능한 인코더 구현 방법을 보여준다.
도 8은 본 발명의 적용 가능한 디코더 구현 방법을 보여준다.
도 9는 본 발명의 인코더에 대한 구조도이다.
도 10은 본 발명의 디코더에 대한 구조도이다.
도 11은 크로스오버 주파수와 샘플링 주파수와 연관하여 스케일 인수 대역들(scale factor bands)와 채널들로 들어가는 스펙트럼 범위의 구조를 보여주는 도면이다.
도 12는 필터 뱅크 방법(filter bank approach)에 기반한 HFR 치환(HFR transposition) 방법을 결합한 본 발명의 디코더에 대한 구조도이다.
아래에 기술되는 실시 예들은 고주파 재생 시스템의 향상에 관한 본 발명의 원리를 단지 도식적으로 보여주는 것뿐이다. 이 분야에서 통상의 지식을 가진 자들은 여기서 기술된 배치 방법과 세부 사항의 수정 또는 변경들을 명백하게 이해할 수 있을 것이다. 따라서, 실시 예들의 기술 및 설명을 통하여 제시되는 특정한 세부 사항들만이 아니라, 첨부한 특허 청구 범위의 범위에 의해서만 본 발명이 제한되어야 한다.
도 9는 본 발명의 인코더를 보여준다. 이 인코더는 코어 코더 (702)를 포함한다. 여기서 본 발명의 방법은 또한 기존의 코어 코더에 애드온 모듈(add-on module)로서 사용될 수 있음을 확인할 수 있다. 이러한 경우에, 본 발명에서 인코더는 분리되어 동작하는 코어 코더 (702)에 의해 인코딩된 입력 신호 출력을 받는 입력을 포함한다.
도 9에서 본 발명의 인코더는 추가적으로 결합기(combiner) (705) 뿐만 아니라 고주파 재생 블록 (703c), 차 검출기(difference detector) (703a), 차 묘사기(difference describer) (703b)를 포함한다.
다음에는, 위에서 언급한 도구들의 기능적 상호 의존성이 기술된다.
특히 본 발명의 인코더는 인코딩된 신호를 얻기 위해서 오디오 신호 입력 (900)의 입력을 인코딩하도록 한다. 인코딩된 신호는 크로스오버 주파수라고 불리기도 하는 미리 결정된 소정의 주파수(predetermined frequency)보다 낮은 주파수 구성 요소에 기반하여, 소정의 주파수 보다 높은 주파수 구성 요소를 생성하도록 하는 고주파 재생 기술을 이용해서 디코딩된다.
여기서 최근에 알려지고 있는 다양한 기술 중 하나인 고주파 재생 기술이 사용될 수 있다는 것을 알 수 있다. 이 점에 관해서는, 넓은 의미에서 주파수 성분(frequency component)이란 용어를 이해해야 한다. 이 용어는 적어도 FFT, MDCT와 같은 시간 도메인/주파수 도메인 변환(time domain/frequency domain transform)에 의하여 얻어지는 스펙트럼 계수들(spectral coefficients)을 포함한다. 게다가, 주파수 성분이란 용어는 대역 통과 신호(band pass signals)를 포함한다. 대역 통과 신호는 저대역 통과 필터(low pass filter), 대역 통과 필터(band pass filter), 또는 고대역 통과 필터(high pass filter)와 같은 주파수를 선택하는 필터의 출력에서 얻어지는 신호이다.
코어 코더 (702)가 본 발명의 인코더의 한 부분으로서 포함되든 아니든 또는 본 발명의 인코더가 기존의 코어 코더에 애드온 모듈로 사용되든 아니든 이 사실에 관계 없이, 인코더는 인코딩된 입력 신호를 제공하는 수단을 포함한다. 인코딩된 입력 신호는 코딩 알고리즘을 이용해서 입력 신호를 인코딩해서 표현한 것이다. 이 부분에서, 입력 신호는 소정의 주파수(예를 들어 크로스오버 주파수)보다 낮은 주파수를 가지는 오디오 신호의 주파수 내용을 표현한다는 점을 확인해야 한다. 입력 신호의 주파수 내용이 단지 오디오 신호의 저대역 부분만을 포함한다는 사실을 설명 하기 위해서, 도 9에서 저대역 통과 필터 (902)가 이를 나타내고 있다. 실제로도 본 발명의 인코더는 이러한 저대역 통과 필터를 가질 수 있다. 다른 방법으로, 코어 코더 (702)에 그러한 저대역 통과 필터가 포함될 수 있다. 또 다른 방법으로, 코어 코더는 다른 어떤 공지된 방법을 이용해서 필요 없는 오디오 신호의 주파수 대역을 버리는 역할을 수행할 수 있다.
코어 코더 (702)의 출력에서, 인코딩된 입력 신호는 그 신호의 주파수 내용에 관해서, 입력 신호와 유사하긴 하지만 인코딩된 신호가 소정의 주파수 보다 높은 대역의 주파수 컴포넌트는 전혀 포함하지 않는다는 점에서 오디오 신호와 다르다는 점이 문제이다.
고주파 재생 블록 (703c)는 입력 신호(예를 들어, 코어 코더 (702)에 들어가는 신호 입력) 또는 입력 신호를 코딩한 후 다시 디코딩한 신호에 대해 고주파 재생 기술을 수행하는 기관이다. 이 방법이 선택되는 경우에는, 본 발명의 디코더는 또한 코어 디코더 (903)을 포함한다. 코어 디코더 (903)은 코어 코더로부터 인코딩된 입력 신호를 받아서 디코딩한다. 코어 디코더 (903)은 저 비트 레이트로 전달되는 인코딩된 신호에 대한 오디오 대역폭을 향상시킬 수 있도록 고주파 재생 기술이 수행되는 디코더/수신기에서 존재하는 경우와 정확하게 동일한 환경이 얻어질 수 있도록 이 신호를 디코딩한다.
HFR 블록 (703c)는 소정의 주파수 보다 높은 주파수에 위치하는 주파수 컴포넌트를 가진 재생 신호를 출력한다.
도 9에서 보여주듯이, HFR 블록 (703c)에 의해서 만들어지는 재생 신호 출력은 차 검출기(difference detector) (703a)에 입력으로 들어간다. 반면에, 차 검출기는 또한 오디오 신호 입력 (900)에서 원시 오디오 신호를 받는다. HFR 블록 (703c)로부터 재생 신호와 입력 (900)으로부터 나오는 오디오 신호 사이의 차이를 검출하는 차 검출기는 소정의 중요성 한계치(significance threshold)보다 높은 주파수를 가지는 신호들 사이에서 차이를 감지하도록 구성된다. 중요성 한계치로서 역할을 하는 적당한 한계치에 대한 몇몇 예제들이 아래에 기술 된다.
차 검출기의 출력은 차 묘사기 블록 (703b)의 입력으로 연결된다. 차 묘사기 블록 (703b)는 검출된 차에 대한 추가 정보를 얻기 위해서 특별한 방법으로 검출된 차를 기술하는 역할을 한다. 이러한 추가 정보는 결합기(combiner) (705)로 들어가는 입력에 알맞도록 만들어진다. 이 결합기 (705)는 수신기에 전달되거나 저장 매체에 저장될 인코딩된 신호를 얻기 위해서 생산되는 인코딩된 입력 신호, 추가 정보, 그리고 다른 여러 신호들을 결합시키는 역할을 한다. 추가 정보에 대한 좋은 예는 스펙트럼 포락선 추측기(spectral envelope estimator) (704)에 의해서 생성되는 스펙트럼 포락선 정보이다. 스펙트럼 포락선 추측기 (704)는 소정의 주파수(예를 들어 크로스오버 주파수)보다 높은 주파수 대역 오디오 신호의 스펙트럼 포락선 정보를 제공하기 위해서 배열된다. 이 스펙트럼 포락선 정보는 소정의 주파수보다 높은 주파수에 있는 디코딩된 오디오 신호의 스펙트럼 성분들을 합성하기 위해서 디코더 부분의 HFR 모듈에서 사용된다.
본 발명의 올바른 실시예를 볼 때, 스펙트럼 포락선 추측기 (704)는 단지 스펙트럼 포락선의 근사적인 표현을 제공하도록 배열된다. 특별히, 각각의 스케일 인수 대역(scale factor band)에 대해서 오직 하나의 스펙트럼 포락선 값이 제공되는 것이 바람직하다. 스케일 인수 대역을 사용하는 방법은 이 분야에서 숙련된 사람들에게는 잘 알려져 있다. MP3 또는 MPEG-AAC 같은 변환 코더와 관련해서, 스케일 인수 대역은 다양한 MDCT 선들을 포함한다. 어떤 스펙트럼 선이 어떤 스케일 인수 대역에 속하는지에 대한 상세한 구성은 일반화 되어있긴 하지만 매우 다양하게 구성될 수 있을 것이다.
일반적으로, 스케일 인수 대역은 MDCT 선과 같은 다양한 스펙트럼 선 또는 대역통과 신호를 포함한다. 여기서, MDCT는 수정된 이산 코사인 변환(discrete cosine transform)을 나타내고, 대역 통과 신호는 스케일 인수 대역이 변함에 따라서 다양하게 변하는 값을 가진다. 일반적으로, 하나의 스케일 인수 대역은 적어도 두 개 이상 대체로 일 이십 개 이상의 스펙트럼 선들이나 대역 통과 신호들을 포함하게 된다.
본 발명의 올바른 실시예와 조화를 이루어, 본 발명의 인코더는 추가적으로 가변적인 값을 가지는 크로스오버 주파수를 포함한다. 크로스오버 주파수의 조정은 본 발명의 차 검출기 (703a)에 의해서 수행된다. 이 값의 조정은 낮은 크로스오버 주파수에서 단순히 HFR만에 의해 생성되는 출력보다 높은 크로스오버 주파수에서 인공음 수준을 낮출 수 있다는 결과를 얻게 될 때, 인코딩된 입력 신호의 대역폭을 확대하기 위해서 크로스오버 주파수를 보다 높은 주파수로 설정하도록 차 검출기가 코어 코더 (702) 뿐만 아니라 저대역 통과 필터 (902)와 스펙트럼 포락선 추측기 (704)를 명령할 수 있도록 함으로써 조정한다.
다른 한편으로, 차 검출기는 크로스오버 주파수보다 낮은 범위의 대역폭이 음파상 중요하지 않다고 판단될 때, 그래서 코어 코더에 의해서 직접 인코딩 되도록 하기 보다는 HFR 합성에 의해서 보다 쉽게 생성될 수 있는 경우에는 크로스오버 주파수를 감소시킬 수 있도록 조정할 수 있다.
반면에, 크로스오버 주파수를 감소시킴으로서 절약되는 비트들은 다음과 같은 경우에 사용될 수 있을 것이다. 이 비트는 사이코어쿠스틱 코팅 방법(psychoacoustic coating method)으로 알려져 있는 일종의 비트 세이빙 옵션(bit-saving-option)을 얻을 수 있도록 크로스오버 주파수가 증가되어야 할 경우에 사용될 수 있다. 이러한 방법에서, 다른 한편에서, 입력으로 인코딩 하기 쉬운 잡음으로 구성된 신호 부분(예를 들어, 인공음 없이 인코딩되는데 단지 적은 수의 비트만을 필요로 하는 부분)이 존재하고 특정한 비트를 절약할 수 있는 조정 방법이 있을 때에도, 인코딩하기 어려운 주요한 음향 성분(예를 들어, 인공음 없이 인코딩되기 위해서 많은 수의 비트를 필요로 하는 부분)은 더욱 많은 비트를 소모할 수 있다.
요약해서, 크로스오버 주파수 조정은 소정의 주파수를 증가시키거나 감소시킬 수 있도록 배치된다. 여기서 소정의 주파수로 디코더에서 실제 상황을 가상하도록 HFR 블록 (703c)의 효율성과 성능을 평가하는 차 검출기에 의한 결과를 이용해서 크로스오버 주파수를 조정할 수 있을 것이다.
대체로, 차 검출기 (703a)는 재생 신호에서 포함되지 않는 오디오 신호에서 스펙트럼 선들을 감지하기 위해서 배치된다. 이 작업을 하기 위해서, 차 검출기는 재생 신호와 오디오 신호에 대한 예측 연산을 수행할 수 있는 예측기(predictor)와 재생 신호와 오디오 신호에 대해 얻어진 추정 이득들(prediction gains) 사이의 차를 결정하는 수단을 모두 포함한다. 특히, 추정 이득들에서 차가 이득 한계치(gain threshold)보다 크도록 재생 신호 또는 오디오 신호에서 주파수 연관된 부분들은 결정될 것이다. 여기서, 일반적으로 이득 한계치로 중요성 한계치를 이용한다.
여기서 차 검출기 (703a)는 한편으로는 재생 신호에서 또 다른 한편으로는 오디오 신호에서 대응하는 주파수 대역을 할당하는 주파수 선택 요소로서 역할을 하게 된다는 점에 주의해야 한다. 이 점 때문에, 차 검출기는 오디오 신호와 재생 신호를 변환하는 시간-주파수 변환 요소(time-frequency conversion elements)을 포함할 수 있다. HFR 블록 (703c)에 의해서 생성되는 재생 신호가 이미 주파수 연관된 표현으로서 존재하는 경우는 어떠한 경우도 그러한 시간 도메인/주파수 도메인 변환 수단은 필요하지 않을 것이다. 이러한 경우가 본 발명의 고주파 재생 방법에서 주로 사용하는 방법이다.
일반적으로 시간 도메인 신호로 구성되는 오디오 신호를 변환하는 경우에서처럼, 시간 도메인 - 주파수 도메인 변환 요소를 사용해야 하는 경우에 필터 뱅크 방법(filter bank approach)이 자주 사용된다. 분석 필터 뱅크(analysis filter bank)는 적당한 크기를 가진 인접한 대역 통과 필터의 뱅크를 포함한다. 여기서 대역 통과 필터는 그것의 대역폭에 의해서 정의되는 대역폭을 가지는 대역 통과 신호를 출력한다. 대역 통과 필터 신호는 그것이 유도되는 신호와 비교했을 때 제한된 대역폭을 가지는 시간 도메인 신호로서 해석될 수 있다. 이 분야에서 이미 알려져 있듯이, 대역 통과 신호의 중앙 주파수는 분석 필터 뱅크에 있는 각각의 대역 통과 필터의 위치에 의해 정의된다.
나중에 설명을 하듯이, 중요성 한계치보다 큰 차를 결정하는데 자주 사용하는 방법은 음향 수치(tonality measure)와 특히 음향-잡음 비율(tonal to noise ratio)에 기초한 결정 방법이다. 왜냐하면 이런 방법은 견고하고 효율적인 방법으로 신호에서 스펙트럼 선들을 찾아내거나 잡음과 같은 부분을 찾아내는데 적당하기 때문이다.
인코딩될 스펙트럼 선들의 검출
고주파 재생 후에 디코딩된 출력에서 생략되는 스펙트럼 선들을 인코딩 할 수 있도록 하기 위해서, 인코더에서 이를 감지하는 것이 필수적이다. 이러한 작업을 성취하기 위해서, 인코더에서는 그 다음에 실행될 디코더 HFR과의 적당한 합성이 수행될 필요가 있다. 이것은 이 합성의 출력이 디코더의 출력 신호와 유사한 시간 도메인 출력 신호여야 한다는 것을 의미하지는 않는다. 디코더에서 HFR의 절대 스펙트럼 표현을 보존하고 합성하는 것만으로도 충분하다. 이것은 QMF 필터 뱅크에서 예측과 그 후에 원시 신호와 HFR로 디코딩된 신호 사이에 추정 이득에서 차의 최고치 선택을 이용해서 이루어질 수 있다.
추정 이득에서 차의 최고치를 선택하는 대신에, 절대 스펙트럼의 차가 사용될 수도 있다. 두 가지 모든 방법에서 주파수에 의존하는 추정 이득 또는 HFR의 절대 스펙트럼은 단지 구성 요소의 주파수 분포를 재배열 함으로서 합성된다. 이것은 HFR이 디코더에서 하는 방법과 유사하다.
일단 원시 신호와 합성된 HFR 신호의 두 가지 표현이 얻어지면, 다양한 방법으로 인코딩될 스펙트럼 선들은 검출될 수 있다.
QMF 필터 뱅크에서 낮은 순위의 선형 예측(linear prediction)이 수행될 수 있다. 예를 들어, 다른 채널에 대한 LPC-order 2 같은 방법이 있다. 예측된 신호의 에너지와 신호의 총 에너지가 주어진 경우에, 음향-잡음 비율(tonal to noise ratio)은 다음과 같이 정의 될 수 있다.
Figure 112004019372820-pct00001
여기서 주어진 필터 뱅크 채널에 대해서,
Figure 112004019372820-pct00002
는 신호 블록의 에너지이고, E 는 추정 에러 블록(prediction error block)의 에너지이다. 이것은 원시 신호에 대해서 계산될 수 있고, 디코더에서 HFR 출력에 있는 다른 주파수 대역에 대한 음향-잡음 비율이 어떻게 얻어지는지를 보여준다. (QMF의 주파수 해상도보다 큰) 임의의 주파수 선택 기반에 관련한 둘 사이의 차는 이렇게 계산될 수 있다. 이 차 벡터는 원시 신호와 디코더에서 HFR로부터 나오는 예상된 출력 사이에 음향-잡음 비율들의 차를 표현한다. 이 차 벡터는 도 3에서 보여주는 HFR 기술의 단점을 보완하기 위해서 어디에 추가적인 인코딩 방법을 필요로 하는지 결정하기 위해서 그 후에 계속 사용된다. 도 3에서는 하위 대역 필터 뱅크 대역 (15)에서 (41) 사이의 범위에 대응하는 원시 신호와 합성된 HFR 출력의 음향-잡음 비율을 보여준다. 격자 표시는 bark-scale 방법으로 분류된 주파수 범위의 스케일 인수 대역을 나타낸다. 모든 스케일 인수 대역에 대해서 원시 신호와 HFR 출력의 최대 구성 요소 사이의 차는 계산되고, 세 번째 그래프에서 이를 보여준다.
위의 검출 방법은 원시 신호와 합성된 HFR 출력의 특정 스펙트럼 표현 방법을 이용해서 수행될 수 있다. 예를 들어, 절대 스펙트럼에서 최대치를 고르는 방법["Extraction of spectral peak parameters using a short-time Fourier transform modeling[sic] and no sidelobe windows." Ph Depalle, T Helie, IRCAM] 또는 이와 유사한 방법이 사용된다. 그리고 나서 원시 신호에서 검출된 음향 성분들과 합성된 HFR 출력에서 검출되는 성분을 비교한다.
스펙트럼 선이 HFR 출력으로부터 생략될 때, 이 스펙트럼 선들은 효율적으로 코딩되어서, 디코더에 전달되고, 그리고 HFR 출력에 더해질 필요가 있다. 이를 위해서 다양한 접근 방법이 사용된다. 여기에 사용되는 방법으로 삽입된 웨이브폼 코딩(interleaved waveform coding) 또는 스펙트럼 선의 파라미터 코딩 등이 있다.
QMF/혼성 필터 뱅크, 삽입된 웨이브폼 코딩(QMF/hybrid filterbank, interleaved wave form coding)
만약 인코딩될 스펙트럼 선이 코어 코더의 FS/2(샘플링 주파수의 반) 보다 낮은 주파수 대역에 놓이게 된다면, 같은 방법으로 인코딩될 수 있다. 이것은 코어 코더가 최대 COF까지 전체 주파수 범위를 인코딩하고, 또한 디코더에서 HFR에 의해 재생되지 않는 음향 성분의 범위를 포함하는 정의된 주파수 범위도 인코딩한다는 것을 의미한다. 다른 대안으로, 음향 성분은 임의의 웨이브폼 코더에 의해서 인코딩될 수 있다. 이 접근 방법은 시스템이 코어 코더의 FS/2에 의해서 제한되지 않고, 원시 신호의 전체 주파수 범위에서 동작할 수 있다.
이것 때문에, 코어 코드 제어 유닛(core coder control unit) (910)이 본 발명의 인코더에 제공된다. 차 검출기 (703a)는 그 최대값이 소정의 주파수 보다 높은 주파수이지만 샘플링 주파수 값의 절반 값(FS/2)보다 적은 값을 가진다는 것을 검출하는 경우가 있다. 이런 경우에, 차 검출기 (703a)는 코어 코더 (702)가 오디오 신호로부터 유도되는 대역 통과 신호와 실제 구현에 따라 검출된 스펙트럼 선을 포함하는 특정 주파수 대역을 코어 코더로 인코딩 하도록 명령한다. 여기서, 대역 통과 신호의 주파수 대역은 스펙트럼 선이 검출되는 주파수를 포함한다. 이것 때문에, 코어 코더 (702) 자체 또는 코어 코더 내부의 제어할 수 있는 대역 통과 필터는 직접 코어 코더에 전해지는 오디오 신호로부터 나오는 적당한 부분을 걸러낸다. 이 과정은 도 9에서 점선 (912)로 표시해서 보여주고 있다.
이러한 경우에, 코어 코더 (702)는 차 검출기에 의해서 검출되는 크로스오버 주파수보다 높은 주파수를 가지는 스펙트럼 선을 인코딩한다는 점에서 차 묘사기 (703b)로서의 역할을 한다. 따라서, 차 묘사기 (703b)에 의해 얻어지는 추가 정보는 코어 코더 (702)에 의해서 인코딩되는 신호 출력에 대응한다. 코어 코더 (702)에 의해서 인코딩되는 신호 출력은 소정의 주파수 보다 높은 주파수를 가지지만 샘플링 주파수 값의 절반(FS/2)보다 작은 주파수를 가지는 오디오 신호의 특정 대역과 연관되어 있다.
앞에서 언급한 주파수 스케줄링은 도 11을 통해서 보다 잘 설명 된다. 도 11은 주파수 0인 점에서 시작해서 오른쪽으로 늘어나는 주파수 스케일을 보여준다. 특정 주파수 값에서, 크로스오버 주파수라고도 불리는 소정의 주파수 (1100)을 볼 수 있 다. 이 주파수보다 낮은 대역에 대해서, 도 9에서 나오는 코어 코더 (702)가 인코딩된 입력 신호를 생산하는 역할을 한다. 소정의 주파수 보다 높은 주파수에 대해서는, 스펙트럼 포락선 추측기 (704)가 각각의 스케일 인수 대역에 대한 하나의 스펙트럼 포락선 값을 구하는 일을 맡게 된다. 도 11로부터, 스케일 인수 대역은 여러 개의 채널을 포함한다는 것을 확인할 수 있다. 이 경우는 알려진 변환 코더들이 주파수 계수들 또는 대역 통과 신호들에 대응하는 경우이다. 도 11은 또한 다음에 설명할 도 12의 합성 필터 뱅크로부터 나오는 합성 필터 뱅크 채널을 보여주고 있다. 그리고, 샘플링 주파수 값의 절반(FS/2)에 표시가 되어있다. 도 11의 경우에서는 FS/2가 소정의 주파수보다 높은 주파수를 가지고 있다.
검출된 스펙트럼 선이 FS/2 보다 높은 주파수인 경우에, 코어 코더 (702)는 차 묘사기 (703b)로서 역할을 할 수 없다. 이런 경우에는, 위에서 개략적으로 설명했듯이, 일반적인 HFR 기술에 의해서 재생되지 않는 오디오 신호에서 스펙트럼 선에 대한 추가 정보를 코딩하고 얻어낼 수 있도록, 차 묘사기에 완전히 다른 코딩 알고리즘이 적용되어야 한다.
다음에는, 인코딩된 신호를 디코딩하는 본 발명의 디코더를 도 10에서 보여준다. 인코딩된 신호는 데이터 스트림 역다중화기 (801)로 들어가는 입력 (1000)으로 표현된다. 특히, 인코딩된 신호는 인코딩된 입력 신호(도 9에서 코어 코더 (702)로부터 나오는 출력)를 포함한다. 인코딩된 입력 신호는 소정의 주파수보다 낮은 원시 오디오 신호(도 9에서 입력 900)의 주파수 내용들을 나타낸다. 원시 신호의 인코딩은 공지된 특정 인코딩 알고리즘을 이용해서 코어 코더 (702)에서 수행된다. 입력 (1000)의 인코딩된 신호는 재생 신호와 원시 오디오 신호 사이에 검출된 차를 표현하는 추가 정보를 포함한다. 여기에 재생 신호는 입력 신호 또는 입력 신호의 인코딩된 후 다시 디코딩된 신호(도 9에서 코어 디코더 903으로 표현됨)로부터 (도 9에서 HFR 블록 703c에서 구현되는) 고주파 재생 기술에 의해 생성된다. 특히, 본 발명의 디코더는 코딩 알고리즘에 따라 인코딩된 입력 신호를 디코딩함으로서 생성되는 디코딩된 입력 신호를 얻어내는 수단을 포함한다. 이것 때문에, 본 발명의 디코더는 도 10에서 보여주듯이 코어 디코더 (803)을 포함할 수 있다. 다른 방법으로, 디코딩된 입력 신호를 얻는 수단이 도 10에서처럼 연결되서 위치한 HFR 블록 (804)의 특정 입력을 이용함으로서 구현될 수 있도록, 본 발명의 디코더는 또한 기존의 코어 코더에 애드온 모듈로서도 사용될 수 있다. 본 발명의 디코더는 또한 도 9에서 보여주는 차 묘사기 (703b)에 의해서 생성되어진 추가 정보에 기초해서 검출된 차를 재구성하는 재구성기(reconstructor) (805)를 포함한다.
핵심 구성 요소로, 본 발명의 디코더에서는 추가적으로 고주파 재생 수단을 포함한다. 이것은 도 9에서 보여주는 것처럼 HFR 블록 (703c)에 의해 구현되어진 고주파 재생 방법과 유사한 방법으로 고주파 재생 방법을 수행한다.
고주파 재생 블록은 재생 신호를 출력하게 되는데, 이 재생 신호는 인코더에서 생략되는 오디오 신호의 스펙트럼 부분을 평범한 HFR 디코더에서 합성하는데 사용된다.
본 발명에 따라서, 도 8에서의 블록 (806)과 블록 (807)의 기능성을 포함하는 생산기(producer)는 생산기로부터 나오는 오디오 신호 출력이 고주파 재생 부분 뿐만 아니라 어떤 검출된 차들도 포함하도록 하기 위해서 제공된다. 여기서 검출된 차는 대체로 HFR 블록 (704)에 의해서 합성될 수 없지만 원시 오디오 신호에는 존재하는 스펙트럼 선들이 된다.
후반에 다시 설명되듯이, 생산기(producer) (806, 807)은 HFR 블록 (804)에 의해 재생된 신호 출력을 이용할 수 있다. 그리고, 생산기 (806, 807)은 단순히 재생 신호를 코어 디코더 (803)에 의해 생성되는 저대역 재생 신호 출력과 함께 결합할 수 있다. 그리고 나서 추가 정보에 기초해서 스펙트럼 선을 삽입한다. 다른 방법으로, 도 12에서 설명되듯이 생산기는 또한 HFR에서 생산한 스펙트럼 선에 어떤 조절을 하기도 한다. 일반적으로, 생산기는 단순히 특정 주파수 위치에 있는 HFR 스펙트럼에 스펙트럼 선을 삽입할 뿐만 아니라 삽입된 스펙트럼 선의 주변에서 약해지는 HFR에 의해 재생된 스펙트럼 선에 있는 삽입된 스펙트럼 선의 에너지를 계산한다.
위에서 설명한 내용은 인코더에서 수행되는 스펙트럼 포락선 파라미터 추측법(spectral envelope parameter estimation)에 기초를 두고 있다. 스펙트럼 선이 위치하는 크로스오버 주파수 같은 소정의 주파수보다 높은 주파수를 가지는 스펙트럼 대역에서, 스펙트럼 포락선 추측기는 이 대역에서의 에너지를 예측한다. 그러한 대역의 한 예로 스케일 인수 대역이 있다. 에너지가 잡음으로 구성된 스펙트럼 선에서 나오는지 특정한 의미가 있는 최고점(예를 들어, 음성의 스펙트럼 선들)에서 나오는지 사실에 관계없이, 스펙트럼 포락선 추측기는 이 대역에서 에너지를 축적하기 때문에, 주어진 스케일 인수 대역에 대한 스펙트럼 포락선 추측값은 주어진 스케일 인수 대역에서 잡음으로 구성된 스펙트럼 선들의 에너지 뿐만 아니 라 스펙트럼 선의 에너지도 포함한다.
인코딩된 신호와 관련하여 전달되는 스펙트럼 에너지 추측 정보를 가능한 한 정확하게 이용하기 위해서, 본 발명의 디코더는 인코더에서의 에너지 축적 방법(energy accumulation method)을 사용한다. 이 방법은 총 에너지(예를 들어 이 대역에 있는 모든 선의 에너지)가 이 스케일 인수 대역에 대해서, 전송된 스펙트럼 포락선 추측값에 의해 결정되는 에너지에 대응할 수 있도록 하기 위해서, 주어진 스케일 인수 대역에 주변의 잡음으로 구성된 스펙트럼 선들 뿐만 아니라 삽입된 스펙트럼 선들을 조절한다.
도 12는 분석 필터 뱅크 (1200)과 합성 필터 뱅크 (1202)에 기초하는 올바른 HFR 재구성에 대한 개략적인 그림을 보여준다. 합성 필터 뱅크 뿐만 아니라 분석 필터 뱅크는 여러 개의 필터 뱅크 채널들로 구성되는데, 이 필터 뱅크 채널들은 스케일 인수 대역과 소정의 주파수와 함께 도 11에서 설명되고 있다. 도 12에서 (1204)로 표시되는 소정의 주파수보다 높은 주파수를 가지는 필터 뱅크 채널들은 필터 뱅크 신호들을 써서 재구성되어야만 한다. 예를 들어, 필터 뱅크 신호들은 도 12에서 직선 (1206)에 의해서 표시되듯이 소정의 주파수보다 낮은 주파수를 가지는 필터 뱅크 채널들이다. 여기서 각각의 필터 뱅크 채널에서, 복소수의 대역 통과 신호 샘플들을 가지는 대역 통과 신호가 존재한다는 것을 알아야 한다. 도 10에서의 고주파 재생 블록 (804)와 도 9에서의 HFR 블록 (703c)는 치환/포락선 조정 모듈 (1208)을 포함한다. 이 모듈은 특정 HFR 알고리즘에 따라서 HFR을 수행하도록 배치된다. 인코더 부분에 있는 블록은 반드시 포락선 조정 모듈을 포함할 필요는 없다는 점을 알아두어야 한다. 주파수의 함수로서 음향 수치를 측정하는 방법이 더 좋은 방법이 된다. 원시 신호와 HFR-재생 신호 간의 음향 차는 차 검출기(703a)에서 결정된다. 이러한 결정에서, 원시 신호의 절대 스펙트럼 포락선과 HFR 블럭(703a)에 의해 출력된 스펙트럼의 절대 스펙트럼 포락선 간의 차는 적합하지 않다.
HFR 알고리즘은 순수한 고조파 HFR 알고리즘 또는 근사적 고조파 HFR 알고리즘 또는 복잡도가 낮은 HFR 알고리즘일 수 있다. 이 알고리즘은 소정의 주파수보다 높은 특정의 연속되는 합성 필터 뱅크 채널에 대한 소정의 주파수보다 낮은 여러 개의 연속적인 분석 필터 뱅크 채널들의 치환(transposition)을 포함한다. 게다가, 블록 (1208)은 대체로 포락선 조정 함수를 포함한다. 이 함수는 하나의 스케일 인수 대역에서 조정된 스펙트럼 선들의 축적된 에너지가 그 스케일 인수 대역에 대한 스펙트럼 포락선 값에 대응하도록 치환된 스펙트럼 선의 크기를 조정한다.
도 12에서 하나의 스케일 인수 대역은 여러 개의 필터 뱅크 채널을 포함한다는 것을 보여준다. 하나의 예로 스케일 인수 대역은 필터 뱅크 채널 llow 로부터 필터 뱅크 채널 lup 까지 범위에서 분포한다.
다음에 수행되는 적응/사인 삽입 방법(adaption/sine insertion method)에 관하여, 여기서 이 적응 또는 "조종"은 도 10에 있는 생산기 (806, 807)에 의해서 수행된다는 것을 알아야 한다. 생산기 (806, 807)은 HFR이 생성한 대역 통과 신호를 조정하는 조종기 (1210)을 포함한다. 입력으로서, 이 조종기 (1210)은 적어도 선의 위치(예를 들어, 합성된 사인의 위치를 나타내는 수 ls)를 도 10에 있는 재구성기 (805)로부터 받는다. 게다가, 조종기 (1210)은 이 스펙트럼 선(사인 파)에 대한 알맞은 레벨을 받고, 또한 주어진 스케일 인수 대역 sfb (1212)의 총 에너지에 대한 정보를 받게 된다. 조종기(1210)는 도 10에서는 도시되지 않은 대신, 도 12에 도시되었다.
여기서 합성 사인 신호가 삽입되는 특정 채널 ls 는 아래에 설명되듯이 주어진 스케일 인수 대역 (1212)에 있는 다른 채널들과는 다르게 처리되어야 한다는 점을 알아야 한다. 위에서 설명하였듯이, 블록 (1208)에 의한 출력으로서 HFR 재생 채널 신호들을 처리하는 것은 도 10에 있는 생산기 (806, 807)에 포함되는 조종기 (1210)에 의해서 수행된다.
스펙트럼 선들의 파라미터 코딩(parametric coding)
아래에는 생략된 스펙트럼 선들에 대한 파라미터 코딩을 이용하는 필터 뱅크에 기초한 시스템의 예제를 보여준다.
시스템에서 [PCT/SE00/00159]에 따라서 적합한 잡음 최저 덧셈(noise floor addition)이 사용되는 HFR 방법을 사용할 때, 단지 생략된 스펙트럼 선의 주파수 위치가 인코딩될 필요가 있다. 이는 스펙트럼 선의 레벨이 암시적으로 포락선 데이타와 잡음 최저 데이터(noise-floor data)에 의해서 주어지기 때문이다. 주어진 스케일 인수 대역의 총 에너지는 에너지 데이터에 의해서 주어지고, 음향/잡음 에너지 양(tonal/noise energy ration)은 잡음 최저 레벨 데이터(noise floor level data)에 의해서 주어진다. 더군다나, 고주파에서는 인간 청각 시스템의 주파수 해상도가 다소 떨어지므로, 고주파 도메인에서는 스펙트럼 선의 정확한 위치가 보다 덜 중요하다. 이것은 디코더에서 사인이 그 특정 대역에 더해지든 아니든 각각의 스케일 인수 대역을 가리키는 벡터와 함께 스펙트럼 선들이 매우 효율적으로 인코딩 될 수 있음을 암시한다.
스펙트럼 선들은 디코더에서 다양한 방법으로 생성될 수 있다. 그 한 접근 방법으로 HFR 신호의 포락선 조정을 위해서 이미 이용되었던 QMF 필터 뱅크를 활용하는 것이다. 이 방법은 매우 효율적인 방법인데, 왜냐하면 인접한 채널들에서 알리어스를 생성하지 않도록 하기 위해서 사인 파들이 필터 채널의 중간에 놓여진다면, 하위 대역 필터 뱅크에서 사인파들을 간단하게 생성할 수 있기 때문이다. 이것은 스펙트럼 선의 주파수 위치가 대체로 다소 정확하지 않게 양자화되어있기 때문에 심각한 제한 사항은 아니다.
만약 인코더에서 디코더로 보내지는 스펙트럼 포락선 데이타가 시간과 주파수에 따라 그룹별로 구성된 하위 대역 필터 뱅크 에너지들로 표현된다면, 주어진 시간에서 스펙트럼 포락선 벡터는 다음의 식으로 표현될 것이다.
Figure 112004019372820-pct00003
그리고, 잡음 최저 레벨 벡터(noise-floor level vector)는 다음의 식으로 표현될 것이다.
Figure 112004019372820-pct00004
여기서 에너지와 잡음 최저 데이터는 다음의 벡터에 의해서 표현되는 QMF 필터 뱅 크 대역들에 대해 평균값으로 구해진다.
Figure 112004019372820-pct00005
이 벡터는 QMF 대역에서 사용되는 최소값 lsb에서 최대값 usb까지의 값을 가지는 QMF-대역 원소를 포함하고, 벡터의 길이는 M+1이다. 그리고 (QMF-대역들에서) 각각의 스케일 인수 대역의 한계값은 다음의 식으로 주어진다.
Figure 112004019372820-pct00006
여기서, l l 은 스케일 인수 대역 n의 최소 한계값이고, l u 는 스케일 인수 대역 n의 최대 한계값이다. 위에서 에너지 데이터
Figure 112004019372820-pct00007
와 마찬가지로, 잡음 최저 레벨 데이터 벡터 는
Figure 112004019372820-pct00008
동일한 주파수 해상도에 사상된다.
만약 합성 사인이 하나의 필터 뱅크 채널에서 생성된다면, 이것은 특정 스케일 인수 대역에 포함된 모든 하위 대역 필터 뱅크 채널들에 대해서 고려할 필요가 있다. 왜냐하면 이것은 그 주파수 범위에서 스펙트럼 포락선의 최대 주파수 해상도이기 때문이다. 만약 이 주파수 해상도가 HFR로부터 생략되고 출력에 더해질 필요가 있는 스펙트럼 선들의 주파수 위치를 신호화하는데도 사용된다면, 이러한 합성 사인들에 대한 생성과 보상은 다음과 같이 수행될 수 있다.
첫째로, 대역에 대한 평균 에너지가 유지되도록, 현재의 스케일 인수 대역의 범위 내에 있는 모든 하위 대역 채널들은 다음의 식에 따라 조정될 필요가 있다.
Figure 112004019372820-pct00009
여기서 l l l u 는 합성 사인이 더해질 스케일 인수 대역의 최소, 최대 한계값이고, x re x im 는 각각 하위 대역 샘플에 대한 실수 부분과 허수 부분이다. l은 채널 인덱스이다. 그리고,
Figure 112004019372820-pct00010
n 이 현재의 스케일 인수 대역 일 때, 위의 식은 필요한 이득 조절 인수(gain adjustment factor)를 나타낸다. 여기서 위의 식은 사인이 놓여지는 필터 뱅크 채널의 스펙트럼 선 또는 대역 통과 신호에 대해서는 유효하지 않음을 언급한다.
여기서 위의 식은 ls를 값으로 가지는 채널에 있는 대역 통과 신호를 제외하고, llow 에서 lup 까지의 값을 가지는 주어진 스케일 인수 대역에 있는 채널에 대해서만 유효하다는 것을 주의해야 한다. 이 신호는 다음의 식들을 이용해서 다루어진다.
조종기(manipulator) (1210)은 채널 수 ls 를 가지는 채널에 대해서 다음의 식을 수행한다. 예를 들어 합성 사인파를 표현하는 복소수의 변조 신호를 사용해서 채널 ls 에 있는 대역 통과 신호를 변조한다. 게다가, 조종기 (1210)은 합성 사인 조정 인 수 gsine에 의하여 합성 사인의 레벨을 결정할 뿐만 아니라 HFR 블록 (1208)로부터 나오는 스펙트럼 선 출력의 레벨을 결정한다. 따라서, 다음의 공식은 단지 사인이 놓여지는 필터 뱅크 채널 ls 에 대해서만 유효하다.
따라서, 사인은 ll≤ls≤lu인 조건을 만족하는 QMF 채널ls에 다음 식에 따라 놓여진다.
Figure 112004019372820-pct00011
여기서, k는 변조 벡터 인덱스(0≤k<4)이고,
Figure 112004019372820-pct00012
는 다른 모든 채널에 대한 복소수를 준다. 이것은 QMF 필터 뱅크에 있는 다른 모든 채널이 주파수가 거꾸로 되어있기 때문에 필요하다. 복소수 하위대역 필터 뱅크의 중간에 있는 사인을 배치하는 변조 벡터(modulation vector)는 다음과 같다.
Figure 112004019372820-pct00013
그리고, 합성 사인의 레벨은 다음 식으로 주어진다.
Figure 112004019372820-pct00014
위에 서술한 내용은 도 4, 5, 6에서 보여주고 있다. 도 4에서는 원시 신호의 스펙트럼을 보여준다. 도 5에서는 본 발명 방법을 사용하지 않은 출력의 스펙트럼를 보 여주고, 도 6에서는 본 발명 방법을 사용한 출력의 스펙트럼들을 보여준다. 도 5에서, 8 kHz 범위에 있는 음조는 광대역 잡음으로 바꾸어져 있다. 도 6에서는 8 kHz 범위에서 스케일 인수 대역의 중간에 사인이 삽입되어 있다. 그리고, 전체 스케일 인수 대역에 대한 에너지는 그 값이 그 스케일 인수 대역에 대한 정확한 평균 에너지를 유지하도록 조정된다.
실제 구현 방법
본 발명은 임의의 코덱들을 이용해서, 아날로그 또는 디지털 신호의 저장 및 전송을 위한 다양한 종류의 시스템에 대해 하드웨어 칩과 DSP 두 가지 모든 방법으로 구현될 수 있다.
도 7에서 본 발명의 가능한 인코더 구현을 보여주고 있다. 아날로그 입력 신호는 A/D 변환기 (701)에서 디지털로 변환되고, 파라미터를 추출하는 모듈 HFR (704) 뿐만 아니라 코어 코더 (702)에 입력으로 들어간다. 디코더에서 고주파 재생 후에 어떤 스펙트럼 선이 생략될지 결정하는 분석 과정이 (703)에서 수행된다. 이러한 스펙트럼 선들은 적당한 방법으로 인코딩되고, (705)에서 인코딩된 데이터의 나머지 부분과 함께 비트 열로 다중화된다. 도 8은 본 발명에서 가능한 디코더 구현 방법을 보여주고 있다. 비트 열은 (801)에서 역다중화되고, 저대역은 코어 디코더 (803)에 의해서 디코딩된다. 고대역은 적당한 HFR 유닛 (804)를 사용해서 재생된다. HFR 이후에 생략된 스펙트럼 선에 대한 추가 정보는 (805)에서 디코딩되고, 생략된 성분을 재생하기 위해서 (806)에서 사용된다. 고대역의 스펙트럼 포락선은 (802)에서 디코딩되고, 재생된 고대역의 스펙트럼 포락선을 조정하기 위해서 (807) 에서 이를 사용한다. 재생된 고대역과의 정확한 시간 동기화를 보장하기 위해서 (808)에서 저대역의 시간을 조정하고, 그 후, 그 두 신호는 함께 합쳐진다. 마지막으로 D/A 변환기 (809)에서 디지털 광대역 신호는 아날로그 광대역 신호로 변환된다.
세부 구현 방법에 따라서, 본 발명의 인코딩 또는 디코딩 방법은 하드웨어 또는 소프트웨어로 구현될 수 있다. 이 방법은 특히, 전기적으로 읽을 수 있는 제어 신호로 구성되는 디스크, CD 같은 디지털 저장 매체에서 사용될 수 있다. 그리고, 이러한 매체는 인코딩 또는 디코딩 방법이 수행될 수 있는 프로그램 가능한 컴퓨터 시스템과 같이 사용될 수 있다.
일반적으로, 본 발명은 컴퓨터 프로그램이 컴퓨터에서 실행될 때, 이 발명의 방법이 수행될 수 있도록 기계가 읽을 수 있는 형태로 저장된 프로그램 코드로 구성된 컴퓨터 프로그램 제품에 적용될 수 있다. 다시 말해서, 본 발명은 컴퓨터 프로그램이 컴퓨터 상에서 실행될 때, 인코딩 또는 디코딩에 관한 본 발명 방법이 수행되는 프로그램 코드를 포함하는 컴퓨터 프로그램으로 사용된다.
위에서 서술한 내용은 복소수 시스템과 관련이 있다. 그러나, 본 발명의 디코더 구현은 또한 실수값을 가지는 시스템에서도 잘 동작한다. 이러한 경우에는 조종기 (1210)에 의해서 수행되는 공식은 실수 부분에 대한 공식들로만 구성된다.

Claims (30)

  1. 소정의 주파수보다 낮은 주파수 성분에 기초해서 소정의 주파수보다 높은 주파수 성분을 생성하는데 알맞은 방법인 고주파 재생 기술을 이용해서 디코딩할 수 있는 인코딩된 신호를 얻을 수 있도록 오디오 신호를 인코딩하는 인코더로서,
    소정의 주파수보다 낮은 오디오 신호의 주파수 성분을 표현하도록 코딩 알고리즘을 이용해서 입력신호를 인코딩하여 인코딩된 입력신호를 공급하는 수단(702)과;
    소정의 주파수보다 높은 주파수 대역의 주파수 성분들을 가지는 재생 신호를 얻기 위해서, 입력 신호 또는 입력 신호의 코딩된 후 다시 디코딩된 신호에 고주파 재생 기술을 수행하는 고주파 재생기(703c)와;
    중요성 한계치보다 큰 값을 가지는 오디오 신호와 재생 신호 사이에 차를 검출하는 차 검출기(703a)와;
    추가 정보를 얻기 위해서 검출된 차를 기술하는 차 묘사기(703b)와;
    상기 인코딩된 입력 신호와 상기 추가 정보를 결합하여 인코딩된 신호를 생성하는 결합기(705)를 포함하는 것을 특징으로 하는 인코더.
  2. 청구항 1항에 있어서,
    상기 검출된 차는 재생 신호에서 포함되지 않는 오디오 신호의 스펙트럼 선들로 구성되는 것을 특징으로 하는 인코더.
  3. 청구항 1항 또는 청구항 2항에 있어서,
    미리 정해진 소정의 주파수는 입력 신호가 코딩 알고리즘에 의해서 코딩되는 영역의 최대 주파수를 결정하는 크로스오버 주파수인 것을 특징으로 하는 인코더.
  4. 청구항 1항에 있어서,
    재생 신호의 주파수 대역과 오디오 신호의 같은 주파수 대역에 기초해서 검출되는 차를 얻기 위해서, 차 검출기(703a)는 재생 신호와 오디오 신호에 대한 다양한 주파수 대역들을 이용하도록 배열되는 것을 특징으로 하는 인코더.
  5. 청구항 1항에 있어서,
    차 검출기(703a) 및/또는 고주파 재생기는 시간 도메인에서 주파수 도메인으로 변환하는 변환기를 포함하는 것을 특징으로 하는 인코더.
  6. 청구항 5항에 있어서,
    시간 도메인에서 주파수 도메인으로 변환하는 상기 변환기는 변환 또는 필터 뱅크로 구성되는 것을 특징으로 하는 인코더.
  7. 청구항 1항에 있어서, 차 검출기(703)는,
    재생 신호와 오디오 신호에 대한 예측을 수행하는 예측기와;
    상기 예측기에 의해서 얻어지는 예측 이득들에서 중요성 한계치를 구성하는 이득 한계치보다 큰 값을 가지는 차를 검출하는 검출기를 포함하는 것을 특징으로 하는 인코더.
  8. 청구항 1항에 있어서,
    차 검출기(703a)는 오디오 신호와 재생 신호의 절대 스펙트럼들에서 중요성 한계치를 구성하는 소정의 차 한계치보다 큰 값을 가지는 차를 검출하도록 배열되는 것을 특징으로 하는 인코더.
  9. 청구항 1항에 있어서,
    차 검출기(703a)는 오디오 신호와 재생 신호에 대한 주파수 의존적이고, 중요성 한계치를 구성하는 차 한계치보다 큰 값을 가지는 음향 수치를 측정하도록 배열되는 것을 특징으로 하는 인코더.
  10. 청구항 9항에 있어서,
    상기 음향 수치는 음향 잡음 비율을 적용하는 것을 특징으로 하는 인코더.
  11. 청구항 1항에 있어서,
    오디오 신호는 샘플링 주파수를 이용해서 샘플링된 이산 오디오 신호이고;
    소정의 주파수는 샘플링 주파수 값의 절반(FS/2)보다 작은 값을 가지고;
    차 검출기(703a)는 샘플링 주파수 값의 절반보다 작은 특정 주파수의 중심 주파수인 소정의 주파수 대역보다 큰 특정 주파수 대역에 대한 차를 검출하도록 배열되고;
    검출된 차를 기술하기 위해서 인코딩 알고리즘에 따라 코어 코더(702)의 출력이 추가 정보로서의 역할을 하는 특정 주파수 대역에 관하여 추가적으로 오디오 신호를 인코딩할 수 있도록 인코딩된 입력 신호를 생성하는 인코더를 제어하는 제어기(901)를 부가적으로 포함하는 것을 특징으로 하는 인코더.
  12. 청구항 1항에 있어서,
    차 묘사기(703b)는 오디오 신호의 대역을 필터링하도록 검출된 차를 포함하는 특정 주파수 대역으로 설정되는 대역 통과 필터를 포함하고,
    차 묘사기(703b)는 추가 신호를 얻기 위해 인코딩된 입력 신호를 코딩하는 코딩 알고리즘과 다른 코딩 알고리즘을 사용하여서 대역 통과 필터의 출력을 인코딩하는 인코더를 포함하는 것을 특징으로 하는 인코더.
  13. 청구항 1항에 있어서,
    차를 검출하는 차 검출기는 스펙트럼 선들을 검출하도록 배열되고,
    차 묘사기는 검출된 스펙트럼 선의 주파수 위치에 대한 정보를 생성하도록 배열되는 것을 특징으로 하는 인코더.
  14. 청구항 13항에 있어서,
    주파수 위치에 대한 정보는 스케일 인수 대역에 대해 인코딩된 신호를 디코딩할 때 스펙트럼 선이 특정 스케일 인수 대역에 더해졌는지 아닌지를 가리키는 벡터를 포함하는 것을 특징으로 하는 인코더.
  15. 청구항 1항에 있어서,
    오디오 신호는 프레임 단위로 처리되고, 소정의 주파수는 프레임에 따라 가변적인 값을 가지는 것을 특징으로 하는 인코더.
  16. 청구항 15항에 있어서,
    차 검출기(703a)는 검출된 차에 기초해서 소정의 주파수를 변경하는 크로스오버 주파수 제어기를 포함하는 것을 특징으로 하는 인코더.
  17. 청구항 1항에 있어서,
    HFR 기술은 소정의 주파수보다 낮은 스펙트럼 값들로부터 소정의 주파수보다 높은 스펙트럼 값들을 생성하도록 배열되는 것을 특징으로 하는 인코더.
  18. 청구항 1항에 있어서,
    HFR 기술은 연속적인 주파수에 대응하는 소정의 주파수 보다 높은 한 그룹의 스펙트럼 값들 또는 대역 통과 신호들에 대한 연속적인 주파수와 관련 있는 한 그룹의 스펙트럼 값들 또는 대역 통과 신호들을 치환하기 위해서 배열되는 것을 특징으로 하는 인코더.
  19. 청구항 17항에 있어서,
    소정의 주파수보다 높은 오디오 신호의 스펙트럼 부분과 관련되는 오디오 신호의 스펙트럼 포락선을 결정하는 스펙트럼 포락선 추측기(704)를 추가적으로 포함하는 것을 특징으로 하는 인코더.
  20. 청구항 19항에 있어서,
    하나의 스케일 인수 대역에 대해서 하나의 데이터 포인트가 제공되고, 스펙트럼 포락선 데이터는 스펙트럼 값들보다 크기가 작은 포락선 데이터 포인트들을 포함하는 것을 특징으로 하는 인코더.
  21. 청구항 1항에 있어서,
    주파수 성분들은 복소수 변환 계수들 또는 복소수 대역 통과 신호들로 구성되는 것을 특징으로 하는 인코더.
  22. 소정의 주파수보다 낮은 원시 오디오 신호의 주파수 성분을 표현하도록 코딩 알고리즘을 이용해서 인코딩된 입력 신호와, 입력 신호 또는 입력 신호의 인코딩된 후 다시 디코딩된 신호로부터 고주파 재생 기술에 의해서 생성되된 재생신호와 원시 오디오 신호 사이에서 검출된 차를 표현하는 추가 정보를 가지고 있는 인코딩된 신 호를 디코딩하는 디코더로서,
    코딩 알고리즘을 이용해서 인코딩된 입력 신호를 디코딩함으로서 디코딩된 입력 신호를 얻기 위한 수단(803)과;
    추가 정보에 기초해서 검출된 차를 재구성하는 재구성기(805)와;
    재생 신호를 얻기 위해서 검출된 차를 구하는데 이용되는 고주파 재생 기술과 유사한 고주파 재생 기술을 수행하는 고주파 재생기(804)와;
    상기 디코딩된 입력 신호, 상기 재구성된 차, 그리고 상기 재생 신호에 기초해서 고주파 재생 오디오 신호를 생성하는 생산기(806, 807)를 포함하는 것을 특징으로 하는 디코더.
  23. 청구항 22항에 있어서,
    검출된 차는 지정된 주파수 범위에 있는 스펙트럼 선과 특정 주파수 범위에 연관된 추가 정보를 포함하고,
    재구성기(805)는 추가 정보에 대하여 지정된 범위에 있는 스펙트럼 선을 생성하도록 배열되는 것을 특징으로 하는 디코더.
  24. 청구항 22항에 있어서,
    추가 정보는 스펙트럼 선이 재생되는 스케일 인수 대역을 지시하고,
    인코딩된 신호는 소정의 주파수보다 높은 오디오 신호의 스펙트럼 부분을 표현하는 스펙트럼 포락선 데이타를 부가적으로 포함하고,
    생산기(806, 807)는 스케일 인수 대역에서 스펙트럼 선을 생성하도록 배열되고,
    생산기(806, 807)는 생성된 스펙트럼 선을 포함하는 스케일 인수 대역에 대해 주어진 에너지가 유지될 수 있도록 스케일 인수 대역에 있는 스펙트럼 선들을 조정하도록 배열되는 것을 특징으로 하는 디코더.
  25. 청구항 22항에 있어서,
    하나의 스케일 인수 대역은 하나보다 많은 필터 뱅크 채널들을 포함하는데, 고주파 재생기(804)는 합성 필터 뱅크 채널들을 가지는 합성 필터 뱅크(1203)를 포함하고,
    인코딩된 신호는 스펙트럼 포락선 벡터와 잡음 최저 레벨 벡터를 포함하고,
    재구성기(805)는 스펙트럼 포락선 벡터에 기초해서 재생된 스펙트럼 선의 레벨을 계산하도록 배열되는 것을 특징으로 하는 인코더.
  26. 청구항 25 항에 있어서, l은 필터 뱅크 채널 수이고, l l 은 스케일 인수 대역에 대한 필터 뱅크 채널 수의 최소값이고, l u 는 스케일 인수 대역에 대한 필터 뱅크 채널 수의 최대값이고, x re 는 HFR 블록(804)에 의한 대역 통과 신호 샘플 출력의 실수 부분이고, x im 은 HFR 블록(804)에 의한 대역 통과 신호 샘플 출력의 허수 부분이고, y re y im 은 각각 필터 뱅크 채널에 대한 조정된 대역 통과 신호의 실수 부분과 허수 부분이고, g hfr 은 잡음-최저 레벨 벡터로부터 유도되는 이득 조절 인수(gain adjustment factor)일 때,
    스케일 인수 대역은 다음의 식
    Figure 112004019372820-pct00015
    을 따르고,
    생산기(806, 807)는 이 스케일 인수 대역에서 어떠한 사인도 삽입되지 않은 필터 뱅크 채널들에 대한 대역 통과 신호들을 결정하도록 배열되는 것을 특징으로 하는 디코더.
  27. 청구항 25항에 있어서,
    재구성기(805)는 합성 사인이 삽입되는 특정 스케일 인수 대역 ls를 결정하도록 배열되고,
    n은 주어진 스케일 인수 대역의 수이고, e는 스펙트럼 포락선 벡터일 때, 삽입되는 합성 사인의 레벨을 다음의 식
    Figure 112006023655359-pct00016
    으로 정의되고,
    ls 는 사인이 삽입되는 필터 뱅크 채널 수이고, ll 는 스케일 인수 대역에 대한 필터 뱅크 채널 수의 최소값이고, lu 는 스케일 인수 대역에 대한 필터 뱅크 채널 수의 최대값이고, xre 는 HFR 블록(804)에 의한 대역 통과 신호 샘플 출력의 실수 부분이고, xim 는 HFR 블록(804)에 의한 대역 통과 신호 샘플 출력의 허수 부분이고, yre yim 은 각각 필터 뱅크 채널에 대한 조정된 대역 통과 신호의 실수 부분과 허수 부분이고, ghfr 은 잡음-최저 레벨 벡터로부터 유도되는 이득 조절 인수이며,
    Figure 112006023655359-pct00017
    Figure 112006023655359-pct00018
    은 사인을 대역 통과 신호로 삽입하는 복소수 변조 벡터를 구성하고, k는 0과 4 사이에 위치하는 변조 벡터 인덱스일 때, 생산기는 다음의 식
    Figure 112006023655359-pct00019
    에 따라서 합성 사인이 놓여지는 채널에 대한 대역 통과 신호를 결정하도록 배열되는 것을 특징으로 하는 디코더.
  28. 소정의 주파수보다 낮은 주파수 성분들에 기초해서 소정의 주파수보다 높은 주파수 성분들을 생성하도록 맞춰진 고주파 재생 기술을 사용하여 디코딩되는 인코딩 신호를 얻기 위해서 오디오 신호를 인코딩하는 방법으로서,
    소정의 주파수보다 낮은 오디오 신호의 주파수 내용을 표현하도록 코딩 알고리즘을 이용해서 인코딩된 입력 신호를 제공하는 단계와,
    소정의 주파수보다 높은 주파수 성분들을 가지는 재생 신호를 얻기 위해서 입력 신호 또는 입력 신호의 코딩된 후 디코딩된 신호에 대해서 고주파 재생 기술을 수행 하는 단계와,
    중요성 한계치를 넘어서는 재생 신호와 오디오 신호 사이의 차를 검출(703a)하는 단계와,
    상기 검출된 차를 추가 정보를 얻기 위해서 기술(703b)하는 단계와,
    인코딩된 신호를 만들기 위해서 인코딩된 입력 신호와 추가 정보를 결합하는 단계를 포함하여 이루어진 것을 특징으로 하는 인코딩 방법.
  29. 소정의 주파수보다 낮은 원시 오디오 신호의 주파수 성분들을 표현하도록 코딩 알고리즘을 이용해서 인코딩된 입력 신호와,
    입력 신호 또는 입력 신호의 코딩된 후 디코딩된 신호로부터 고주파 재생 기술에 의해 생성되는 재생 신호와 원시 오디오 신호 사이에 검출된 차를 표현한 추가 정보를 가지고 있는 인코딩 된 신호를 디코딩하는 방법으로서,
    코딩 알고리즘에 따라서 인코딩된 입력 신호를 디코딩 함으로서 생성되는 디코딩된 입력 신호를 획득하는 단계와,
    추가 정보에 기초해서 검출된 차를 재구성하는 단계와,
    재생 신호를 얻을 수 있도록 검출된 차를 얻기 위한 고주파 재생 기술과 유사한 고주파 재생 기술을 수행하는 단계와,
    상기 디코딩된 입력 신호, 재구성된 차, 그리고 재생 신호에 기초해서 고주파 재생 오디오 신호를 생성하는 단계를 포함하여 이루어진 것을 특징으로 하는 디코딩 방법.
  30. 청구항 28항의 인코딩 방법 또는 청구항 29항의 디코딩 방법을 수행하는 프로그램 코드가 저장된 컴퓨터 프로그램 기록매체.
KR1020047007036A 2001-11-29 2002-11-28 고주파 재생 기술 향상을 위한 방법들 및 그를 수행하는 프로그램이 저장된 컴퓨터 프로그램 기록매체 KR100648760B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE0104004 2001-11-29
SE0104004-7 2001-11-29
PCT/EP2002/013462 WO2003046891A1 (en) 2001-11-29 2002-11-28 Methods for improving high frequency reconstruction

Publications (2)

Publication Number Publication Date
KR20040066114A KR20040066114A (ko) 2004-07-23
KR100648760B1 true KR100648760B1 (ko) 2006-11-23

Family

ID=20286143

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020047007036A KR100648760B1 (ko) 2001-11-29 2002-11-28 고주파 재생 기술 향상을 위한 방법들 및 그를 수행하는 프로그램이 저장된 컴퓨터 프로그램 기록매체

Country Status (12)

Country Link
US (15) US7469206B2 (ko)
EP (1) EP1423847B1 (ko)
JP (1) JP3870193B2 (ko)
KR (1) KR100648760B1 (ko)
CN (1) CN1279512C (ko)
AT (1) ATE288617T1 (ko)
AU (1) AU2002352182A1 (ko)
DE (1) DE60202881T2 (ko)
ES (1) ES2237706T3 (ko)
HK (1) HK1062350A1 (ko)
PT (1) PT1423847E (ko)
WO (1) WO2003046891A1 (ko)

Families Citing this family (131)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1423847B1 (en) 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
BRPI0311601B8 (pt) 2002-07-19 2018-02-14 Matsushita Electric Ind Co Ltd "aparelho e método decodificador de áudio"
SE0202770D0 (sv) * 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
JP2005024756A (ja) * 2003-06-30 2005-01-27 Toshiba Corp 復号処理回路および移動端末装置
KR100513729B1 (ko) * 2003-07-03 2005-09-08 삼성전자주식회사 계층적인 대역폭 구조를 갖는 음성 압축 및 복원 장치와그 방법
RU2374703C2 (ru) 2003-10-30 2009-11-27 Конинклейке Филипс Электроникс Н.В. Кодирование или декодирование аудиосигнала
WO2005104094A1 (ja) * 2004-04-23 2005-11-03 Matsushita Electric Industrial Co., Ltd. 符号化装置
KR101213840B1 (ko) * 2004-05-14 2012-12-20 파나소닉 주식회사 복호화 장치 및 복호화 방법, 및 복호화 장치를 구비하는 통신 단말 장치 및 기지국 장치
JP5013863B2 (ja) * 2004-05-19 2012-08-29 パナソニック株式会社 符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法及び復号化方法
CN101053019B (zh) * 2004-11-02 2012-01-25 皇家飞利浦电子股份有限公司 使用复值滤波器组的音频信号的编码和解码的装置和方法
EP1840874B1 (en) * 2005-01-11 2019-04-10 NEC Corporation Audio encoding device, audio encoding method, and audio encoding program
US7536304B2 (en) * 2005-05-27 2009-05-19 Porticus, Inc. Method and system for bio-metric voice print authentication
JP4899359B2 (ja) * 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
KR101171098B1 (ko) * 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
KR20080049085A (ko) 2005-09-30 2008-06-03 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
WO2007099580A1 (ja) * 2006-02-28 2007-09-07 Matsushita Electric Industrial Co., Ltd. マルチメディアデータ再生装置および方法
US20080109215A1 (en) * 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
JP2010503881A (ja) * 2006-09-13 2010-02-04 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声・音響送信器及び受信器のための方法及び装置
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
KR101565919B1 (ko) * 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
DE102007003187A1 (de) 2007-01-22 2008-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines zu sendenden Signals oder eines decodierten Signals
US20100280830A1 (en) * 2007-03-16 2010-11-04 Nokia Corporation Decoder
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US9269372B2 (en) 2007-08-27 2016-02-23 Telefonaktiebolaget L M Ericsson (Publ) Adaptive transition frequency between noise fill and bandwidth extension
US9177569B2 (en) 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
WO2009059631A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation Audio coding apparatus and method thereof
US20100250260A1 (en) * 2007-11-06 2010-09-30 Lasse Laaksonen Encoder
CN102568489B (zh) * 2007-11-06 2015-09-16 诺基亚公司 编码器
CN101896967A (zh) * 2007-11-06 2010-11-24 诺基亚公司 编码器
JP5404418B2 (ja) * 2007-12-21 2014-01-29 パナソニック株式会社 符号化装置、復号装置および符号化方法
ATE500588T1 (de) * 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
CA2716926C (en) * 2008-03-04 2014-08-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for mixing a plurality of input data streams
CN101281748B (zh) * 2008-05-14 2011-06-15 武汉大学 用编码索引实现的空缺子带填充方法及编码索引生成方法
CN102089814B (zh) * 2008-07-11 2012-11-21 弗劳恩霍夫应用研究促进协会 对编码的音频信号进行解码的设备和方法
AU2009267507B2 (en) 2008-07-11 2012-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and discriminator for classifying different segments of a signal
CA2871268C (en) * 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
EP2301028B1 (en) 2008-07-11 2012-12-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus and a method for calculating a number of spectral envelopes
ES2796552T3 (es) * 2008-07-11 2020-11-27 Fraunhofer Ges Forschung Sintetizador de señales de audio y codificador de señales de audio
JP5203077B2 (ja) * 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
US8407046B2 (en) * 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8515747B2 (en) * 2008-09-06 2013-08-20 Huawei Technologies Co., Ltd. Spectrum harmonic/noise sharpness control
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
WO2010028297A1 (en) 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
WO2010031049A1 (en) * 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
CN101685637B (zh) * 2008-09-27 2012-07-25 华为技术有限公司 音频编码方法及装置和音频解码方法及装置
PT2945159T (pt) * 2008-12-15 2018-06-26 Fraunhofer Ges Forschung Codificador de áudio e descodificador de extensão de largura de banda
AU2013203159B2 (en) * 2008-12-15 2015-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and bandwidth extension decoder
EP2360687A4 (en) * 2008-12-19 2012-07-11 Fujitsu Ltd VOICE BAND EXTENSION DEVICE AND VOICE BAND EXTENSION METHOD
EP3598446B1 (en) 2009-01-16 2021-12-22 Dolby International AB Cross product enhanced harmonic transposition
CA3107567C (en) 2009-01-28 2022-08-02 Dolby International Ab Improved harmonic transposition
ES2906255T3 (es) 2009-01-28 2022-04-13 Dolby Int Ab Transposición armónica mejorada
KR101441474B1 (ko) * 2009-02-16 2014-09-17 한국전자통신연구원 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치
US8983831B2 (en) * 2009-02-26 2015-03-17 Panasonic Intellectual Property Corporation Of America Encoder, decoder, and method therefor
BR122019023877B1 (pt) 2009-03-17 2021-08-17 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI643187B (zh) 2009-05-27 2018-12-01 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
KR101697497B1 (ko) * 2009-09-18 2017-01-18 돌비 인터네셔널 에이비 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체
WO2011035813A1 (en) * 2009-09-25 2011-03-31 Nokia Corporation Audio coding
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US9105300B2 (en) 2009-10-19 2015-08-11 Dolby International Ab Metadata time marking information for indicating a section of an audio object
CN102577114B (zh) * 2009-10-20 2014-12-10 日本电气株式会社 多带域压缩器
EP2491557B1 (en) * 2009-10-21 2014-07-30 Dolby International AB Oversampling in a combined transposer filter bank
US8326607B2 (en) * 2010-01-11 2012-12-04 Sony Ericsson Mobile Communications Ab Method and arrangement for enhancing speech quality
WO2011114192A1 (en) * 2010-03-19 2011-09-22 Nokia Corporation Method and apparatus for audio coding
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
MX2012011828A (es) * 2010-04-16 2013-02-27 Fraunhofer Ges Forschung Aparato, metodo y programa de computadora para generar una señal de banda amplia que utiliza extension de ancho de banda guiada y extension oculta de ancho de banda.
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9245538B1 (en) * 2010-05-20 2016-01-26 Audience, Inc. Bandwidth enhancement of speech signals assisted by noise reduction
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
KR102632248B1 (ko) * 2010-07-19 2024-02-02 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
KR101572034B1 (ko) 2011-05-19 2015-11-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 파라메트릭 오디오 코딩 방식들의 포렌식 검출
EP3029672B1 (en) * 2012-02-23 2017-09-13 Dolby International AB Method and program for efficient recovery of high frequency audio content
HUE028238T2 (en) * 2012-03-29 2016-12-28 ERICSSON TELEFON AB L M (publ) Extend the bandwidth of a harmonic audio signal
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
ES2549953T3 (es) * 2012-08-27 2015-11-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada
CN103928031B (zh) 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
WO2014115225A1 (ja) * 2013-01-22 2014-07-31 パナソニック株式会社 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法
JP6148811B2 (ja) 2013-01-29 2017-06-14 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 周波数領域におけるlpc系符号化のための低周波数エンファシス
RU2641461C2 (ru) * 2013-01-29 2018-01-17 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодер, аудиодекодер, способ обеспечения кодированной аудиоинформации, способ обеспечения декодированной аудиоинформации, компьютерная программа и кодированное представление с использованием сигнально-адаптивного расширения полосы пропускания
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
KR102170665B1 (ko) * 2013-04-05 2020-10-29 돌비 인터네셔널 에이비 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더
EP2830056A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
CN108172239B (zh) * 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
CN104517611B (zh) * 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
US9858941B2 (en) * 2013-11-22 2018-01-02 Qualcomm Incorporated Selective phase compensation in high band coding of an audio signal
US9524720B2 (en) * 2013-12-15 2016-12-20 Qualcomm Incorporated Systems and methods of blind bandwidth extension
CA2934602C (en) 2013-12-27 2022-08-30 Sony Corporation Decoding apparatus and method, and program
US20150194157A1 (en) * 2014-01-06 2015-07-09 Nvidia Corporation System, method, and computer program product for artifact reduction in high-frequency regeneration audio signals
PL3117432T3 (pl) * 2014-03-14 2019-10-31 Ericsson Telefon Ab L M Sposób i aparatura do kodowania audio
JPWO2015151451A1 (ja) * 2014-03-31 2017-04-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法、復号方法、およびプログラム
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP3210207A4 (en) 2014-10-20 2018-09-26 Audimax LLC Systems, methods, and devices for intelligent speech recognition and processing
TW202242853A (zh) 2015-03-13 2022-11-01 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
WO2017140600A1 (en) * 2016-02-17 2017-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing
DE102016104665A1 (de) * 2016-03-14 2017-09-14 Ask Industries Gmbh Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals
US9666191B1 (en) * 2016-03-17 2017-05-30 Vocalzoom Systems Ltd. Laser-based system and optical microphone having increased bandwidth
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
EP3288031A1 (en) * 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
JP6769299B2 (ja) * 2016-12-27 2020-10-14 富士通株式会社 オーディオ符号化装置およびオーディオ符号化方法
TW202341126A (zh) 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
KR20180002888U (ko) 2017-03-29 2018-10-10 박미숙 무좀 예방용 양말
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
WO2019121982A1 (en) * 2017-12-19 2019-06-27 Dolby International Ab Methods and apparatus for unified speech and audio decoding qmf based harmonic transposer improvements
MA50760A (fr) 2018-04-25 2020-06-10 Dolby Int Ab Intégration de techniques de reconstruction haute fréquence à retard post-traitement réduit
MA52530A (fr) * 2018-04-25 2021-03-03 Dolby Int Ab Intégration de techniques de reconstruction audio haute fréquence
CN111766443B (zh) * 2020-06-02 2022-11-01 江苏集萃移动通信技术研究所有限公司 基于窄带频谱缝合的分布式宽带电磁信号监测方法及***
CN111916090B (zh) * 2020-08-17 2024-03-05 北京百瑞互联技术股份有限公司 一种lc3编码器近奈奎斯特频率信号检测方法、检测器、存储介质及设备
CN117275446B (zh) * 2023-11-21 2024-01-23 电子科技大学 一种基于声音事件检测的交互式有源噪声控制***及方法

Family Cites Families (213)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US36478A (en) * 1862-09-16 Improved can or tank for coal-oil
US3947827A (en) 1974-05-29 1976-03-30 Whittaker Corporation Digital storage system for high frequency signals
US4053711A (en) 1976-04-26 1977-10-11 Audio Pulse, Inc. Simulation of reverberation in audio signals
US4166924A (en) 1977-05-12 1979-09-04 Bell Telephone Laboratories, Incorporated Removing reverberative echo components in speech signals
FR2412987A1 (fr) 1977-12-23 1979-07-20 Ibm France Procede de compression de donnees relatives au signal vocal et dispositif mettant en oeuvre ledit procede
US4330689A (en) 1980-01-28 1982-05-18 The United States Of America As Represented By The Secretary Of The Navy Multirate digital voice communication processor
GB2100430B (en) 1981-06-15 1985-11-27 Atomic Energy Authority Uk Improving the spatial resolution of ultrasonic time-of-flight measurement system
EP0070948B1 (fr) 1981-07-28 1985-07-10 International Business Machines Corporation Procédé de codage de la voix et dispositif de mise en oeuvre dudit procédé
US4700390A (en) 1983-03-17 1987-10-13 Kenji Machida Signal synthesizer
US4667340A (en) 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4672670A (en) 1983-07-26 1987-06-09 Advanced Micro Devices, Inc. Apparatus and methods for coding, decoding, analyzing and synthesizing a signal
US4700362A (en) 1983-10-07 1987-10-13 Dolby Laboratories Licensing Corporation A-D encoder and D-A decoder system
EP0139803B1 (fr) 1983-10-28 1987-10-14 International Business Machines Corporation Procédé de reconstitution d'informations perdues dans un système de transmission numérique de la voix et système de transmission utilisant ledit procédé
US4706287A (en) 1984-10-17 1987-11-10 Kintek, Inc. Stereo generator
US4885790A (en) 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4748669A (en) 1986-03-27 1988-05-31 Hughes Aircraft Company Stereo enhancement system
DE3683767D1 (de) 1986-04-30 1992-03-12 Ibm Sprachkodierungsverfahren und einrichtung zur ausfuehrung dieses verfahrens.
JPH0690209B2 (ja) 1986-06-13 1994-11-14 株式会社島津製作所 反応管の攪拌装置
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
GB8628046D0 (en) 1986-11-24 1986-12-31 British Telecomm Transmission system
US5054072A (en) 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US5285520A (en) 1988-03-02 1994-02-08 Kokusai Denshin Denwa Kabushiki Kaisha Predictive coding apparatus
FR2628918B1 (fr) 1988-03-15 1990-08-10 France Etat Dispositif annuleur d'echo a filtrage en sous-bandes de frequence
US5127054A (en) * 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
JPH0212299A (ja) 1988-06-30 1990-01-17 Toshiba Corp 音場効果自動制御装置
JPH02177782A (ja) 1988-12-28 1990-07-10 Toshiba Corp モノラルtv音声復調回路
US5297236A (en) 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
EP0392126B1 (en) 1989-04-11 1994-07-20 International Business Machines Corporation Fast pitch tracking process for LTP-based speech coders
CA2014935C (en) 1989-05-04 1996-02-06 James D. Johnston Perceptually-adapted image coding system
US5309526A (en) 1989-05-04 1994-05-03 At&T Bell Laboratories Image processing system
US5434948A (en) 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
US5261027A (en) 1989-06-28 1993-11-09 Fujitsu Limited Code excited linear prediction speech coding system
US4974187A (en) 1989-08-02 1990-11-27 Aware, Inc. Modular digital signal processing system
US5054075A (en) 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
US4969040A (en) 1989-10-26 1990-11-06 Bell Communications Research, Inc. Apparatus and method for differential sub-band coding of video signals
JPH03214956A (ja) 1990-01-19 1991-09-20 Mitsubishi Electric Corp テレビ会議装置
JPH03217782A (ja) 1990-01-19 1991-09-25 Matsushita Refrig Co Ltd 冷蔵庫の棚装置
JPH0685607B2 (ja) 1990-03-14 1994-10-26 関西電力株式会社 薬液注入防護工法
JP2906646B2 (ja) 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
US5293449A (en) 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
JP3158458B2 (ja) 1991-01-31 2001-04-23 日本電気株式会社 階層表現された信号の符号化方式
GB9104186D0 (en) 1991-02-28 1991-04-17 British Aerospace Apparatus for and method of digital signal processing
US5235420A (en) 1991-03-22 1993-08-10 Bell Communications Research, Inc. Multilayer universal video coder
JP2990829B2 (ja) 1991-03-29 1999-12-13 ヤマハ株式会社 効果付与装置
JP3050978B2 (ja) 1991-12-18 2000-06-12 沖電気工業株式会社 音声符号化方法
JPH05191885A (ja) 1992-01-10 1993-07-30 Clarion Co Ltd 音響信号イコライザ回路
JP3500633B2 (ja) * 1992-02-07 2004-02-23 セイコーエプソン株式会社 マイクロエレクトロニクス・デバイスのエミュレーション方法及びエミュレーション装置並びにシミュレーション装置
US5559891A (en) 1992-02-13 1996-09-24 Nokia Technology Gmbh Device to be used for changing the acoustic properties of a room
US5765127A (en) 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
GB9211756D0 (en) 1992-06-03 1992-07-15 Gerzon Michael A Stereophonic directional dispersion method
US5278909A (en) 1992-06-08 1994-01-11 International Business Machines Corporation System and method for stereo digital audio compression with co-channel steering
US5436940A (en) 1992-06-11 1995-07-25 Massachusetts Institute Of Technology Quadrature mirror filter banks and method
IT1257065B (it) 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
JPH0685607A (ja) 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
JP2779886B2 (ja) 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
FR2696874B1 (fr) 1992-10-13 1994-12-09 Thomson Csf Modulateur d'onde électromagnétique à puits quantiques.
JP3191457B2 (ja) * 1992-10-31 2001-07-23 ソニー株式会社 高能率符号化装置、ノイズスペクトル変更装置及び方法
CA2106440C (en) 1992-11-30 1997-11-18 Jelena Kovacevic Method and apparatus for reducing correlated errors in subband coding systems with quantizers
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JPH06202629A (ja) 1992-12-28 1994-07-22 Yamaha Corp 楽音の効果付与装置
JPH06215482A (ja) 1993-01-13 1994-08-05 Hitachi Micom Syst:Kk オーディオ情報記録媒体、およびこのオーディオ情報記録媒体を用いる音場生成装置
JP3496230B2 (ja) 1993-03-16 2004-02-09 パイオニア株式会社 音場制御システム
US5664059A (en) * 1993-04-29 1997-09-02 Panasonic Technologies, Inc. Self-learning speaker adaptation based on spectral variation source decomposition
JP3685812B2 (ja) 1993-06-29 2005-08-24 ソニー株式会社 音声信号送受信装置
US5463424A (en) 1993-08-03 1995-10-31 Dolby Laboratories Licensing Corporation Multi-channel transmitter/receiver system providing matrix-decoding compatible signals
US5581653A (en) 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
DE4331376C1 (de) 1993-09-15 1994-11-10 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
US5533052A (en) 1993-10-15 1996-07-02 Comsat Corporation Adaptive predictive coding with transform domain quantization based on block size adaptation, backward adaptive power gain control, split bit-allocation and zero input response compensation
SG48273A1 (en) 1993-11-26 1998-04-17 Philips Electronics Nv A transmission system and a transmitter and a receiver for use in such a system
JPH07160299A (ja) 1993-12-06 1995-06-23 Hitachi Denshi Ltd 音声信号帯域圧縮伸張装置並びに音声信号の帯域圧縮伝送方式及び再生方式
JP3404837B2 (ja) 1993-12-07 2003-05-12 ソニー株式会社 多層符号化装置
JP2616549B2 (ja) 1993-12-10 1997-06-04 日本電気株式会社 音声復号装置
KR960012475B1 (ko) 1994-01-18 1996-09-20 대우전자 주식회사 디지탈 오디오 부호화장치의 채널별 비트 할당 장치
DE4409368A1 (de) 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
KR960003455A (ko) 1994-06-02 1996-01-26 윤종용 입체영상용 액정 셔터 안경
US5787387A (en) 1994-07-11 1998-07-28 Voxware, Inc. Harmonic adaptive speech coding method and system
KR100372905B1 (ko) 1994-09-13 2003-05-01 애질런트 테크놀로지스, 인크. 산화물영역보호장치
US6141446A (en) * 1994-09-21 2000-10-31 Ricoh Company, Ltd. Compression and decompression system with reversible wavelets and lossy reconstruction
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
US5839102A (en) 1994-11-30 1998-11-17 Lucent Technologies Inc. Speech coding parameter sequence reconstruction by sequence classification and interpolation
JPH08162964A (ja) 1994-12-08 1996-06-21 Sony Corp 情報圧縮装置及び方法、情報伸張装置及び方法、並びに記録媒体
FR2729024A1 (fr) 1994-12-30 1996-07-05 Matra Communication Annuleur d'echo acoustique avec filtrage en sous-bandes
US5701390A (en) 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
JP2956548B2 (ja) 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
JP3139602B2 (ja) 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
JP3416331B2 (ja) 1995-04-28 2003-06-16 松下電器産業株式会社 音声復号化装置
US5915235A (en) 1995-04-28 1999-06-22 Dejaco; Andrew P. Adaptive equalizer preprocessor for mobile telephone speech coder to modify nonideal frequency response of acoustic transducer
US5692050A (en) 1995-06-15 1997-11-25 Binaura Corporation Method and apparatus for spatially enhancing stereo and monophonic signals
DE19526366A1 (de) * 1995-07-20 1997-01-23 Bosch Gmbh Robert Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen
JPH0946233A (ja) 1995-07-31 1997-02-14 Kokusai Electric Co Ltd 音声符号化方法とその装置、音声復号方法とその装置
JPH0955778A (ja) 1995-08-15 1997-02-25 Fujitsu Ltd 音声信号の広帯域化装置
US5774837A (en) 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
JP3301473B2 (ja) 1995-09-27 2002-07-15 日本電信電話株式会社 広帯域音声信号復元方法
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5687191A (en) 1995-12-06 1997-11-11 Solana Technology Development Corporation Post-compression hidden data transport
US5732189A (en) 1995-12-22 1998-03-24 Lucent Technologies Inc. Audio signal coding with a signal adaptive filterbank
TW307960B (en) 1996-02-15 1997-06-11 Philips Electronics Nv Reduced complexity signal transmission system
JP3519859B2 (ja) 1996-03-26 2004-04-19 三菱電機株式会社 符号器及び復号器
US6226325B1 (en) * 1996-03-27 2001-05-01 Kabushiki Kaisha Toshiba Digital data processing system
JP3529542B2 (ja) 1996-04-08 2004-05-24 株式会社東芝 信号の伝送/記録/受信/再生方法と装置及び記録媒体
US5848164A (en) 1996-04-30 1998-12-08 The Board Of Trustees Of The Leland Stanford Junior University System and method for effects processing on audio subband data
DE19628293C1 (de) 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
DE19628292B4 (de) 1996-07-12 2007-08-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
US5951235A (en) * 1996-08-08 1999-09-14 Jerr-Dan Corporation Advanced rollback wheel-lift
CA2184541A1 (en) 1996-08-30 1998-03-01 Tet Hin Yeap Method and apparatus for wavelet modulation of signals for transmission and/or storage
GB2317537B (en) 1996-09-19 2000-05-17 Matra Marconi Space Digital signal processing apparatus for frequency demultiplexing or multiplexing
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
US5875122A (en) 1996-12-17 1999-02-23 Intel Corporation Integrated systolic architecture for decomposition and reconstruction of signals using wavelet transforms
US5886276A (en) 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
US6345246B1 (en) 1997-02-05 2002-02-05 Nippon Telegraph And Telephone Corporation Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
JP4326031B2 (ja) 1997-02-06 2009-09-02 ソニー株式会社 帯域合成フィルタバンク及びフィルタリング方法並びに復号化装置
US5862228A (en) 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6236731B1 (en) 1997-04-16 2001-05-22 Dspfactory Ltd. Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signal in hearing aids
IL120788A (en) * 1997-05-06 2000-07-16 Audiocodes Ltd Systems and methods for encoding and decoding speech for lossy transmission networks
US6370504B1 (en) 1997-05-29 2002-04-09 University Of Washington Speech recognition on MPEG/Audio encoded files
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
EP0926658A4 (en) 1997-07-11 2005-06-29 Sony Corp INFORMATION DECODERS AND DECODING METHOD, INFORMATION CODERS AND CODING METHOD AND DISTRIBUTION MEDIUM
DE19730129C2 (de) * 1997-07-14 2002-03-07 Fraunhofer Ges Forschung Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
US5890125A (en) 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6144937A (en) 1997-07-23 2000-11-07 Texas Instruments Incorporated Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information
US6124895A (en) 1997-10-17 2000-09-26 Dolby Laboratories Licensing Corporation Frame-based audio coding with video/audio data synchronization by dynamic audio frame alignment
KR100335611B1 (ko) 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
US20010040930A1 (en) 1997-12-19 2001-11-15 Duane L. Abbey Multi-band direct sampling receiver
KR100304092B1 (ko) 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
JPH11262100A (ja) 1998-03-13 1999-09-24 Matsushita Electric Ind Co Ltd オーディオ信号の符号化/復号方法および装置
US6351730B2 (en) 1998-03-30 2002-02-26 Lucent Technologies Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
KR100474826B1 (ko) 1998-05-09 2005-05-16 삼성전자주식회사 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치
US6782132B1 (en) * 1998-08-12 2004-08-24 Pixonics, Inc. Video coding and reconstruction apparatus and methods
JP3354880B2 (ja) 1998-09-04 2002-12-09 日本電信電話株式会社 情報多重化方法、情報抽出方法および装置
JP3352406B2 (ja) * 1998-09-17 2002-12-03 松下電器産業株式会社 オーディオ信号の符号化及び復号方法及び装置
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
JP2000099061A (ja) 1998-09-25 2000-04-07 Sony Corp 効果音付加装置
JP4193243B2 (ja) * 1998-10-07 2008-12-10 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
GB2344036B (en) 1998-11-23 2004-01-21 Mitel Corp Single-sided subband filters
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE9903552D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching
US6507658B1 (en) 1999-01-27 2003-01-14 Kind Of Loud Technologies, Llc Surround sound panner
US6496795B1 (en) 1999-05-05 2002-12-17 Microsoft Corporation Modulated complex lapped transform for integrated signal enhancement and coding
JP2000267699A (ja) 1999-03-19 2000-09-29 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
US6363338B1 (en) 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
US6937665B1 (en) 1999-04-19 2005-08-30 Interuniversitaire Micron Elektronica Centrum Method and apparatus for multi-user transmission
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US6298322B1 (en) * 1999-05-06 2001-10-02 Eric Lindemann Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal
US6426977B1 (en) 1999-06-04 2002-07-30 Atlantic Aerospace Electronics Corporation System and method for applying and removing Gaussian covering functions
US6226616B1 (en) 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
KR100749291B1 (ko) 1999-07-27 2007-08-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 필터링 장치
JP4639441B2 (ja) 1999-09-01 2011-02-23 ソニー株式会社 ディジタル信号処理装置および処理方法、並びにディジタル信号記録装置および記録方法
DE19947098A1 (de) 1999-09-30 2000-11-09 Siemens Ag Verfahren zur Ermittlung der Kurbelwellenstellung
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
WO2001037263A1 (en) * 1999-11-16 2001-05-25 Koninklijke Philips Electronics N.V. Wideband audio transmission system
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US6947509B1 (en) 1999-11-30 2005-09-20 Verance Corporation Oversampled filter bank for subband processing
JP2001184090A (ja) 1999-12-27 2001-07-06 Fuji Techno Enterprise:Kk 信号符号化装置,及び信号復号化装置,並びに信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体
EP1114814A3 (en) * 1999-12-29 2003-01-22 Haldor Topsoe A/S Method for the reduction of iodine compounds from a process stream
KR100359821B1 (ko) * 2000-01-20 2002-11-07 엘지전자 주식회사 움직임 보상 적응형 영상 압축과 복원방법 및 그 장치와디코더
US6732070B1 (en) 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
EP1139336A3 (en) * 2000-03-30 2004-01-02 Matsushita Electric Industrial Co., Ltd. Determination of quantizaion coefficients for a subband audio encoder
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US6718300B1 (en) 2000-06-02 2004-04-06 Agere Systems Inc. Method and apparatus for reducing aliasing in cascaded filter banks
US6879652B1 (en) 2000-07-14 2005-04-12 Nielsen Media Research, Inc. Method for encoding an input signal
ES2461167T3 (es) 2000-07-19 2014-05-19 Koninklijke Philips N.V. Convertidor estéreo de múltiples canales para derivar una señal envolvente estéreo y/o central de audio
US20020040299A1 (en) * 2000-07-31 2002-04-04 Kenichi Makino Apparatus and method for performing orthogonal transform, apparatus and method for performing inverse orthogonal transform, apparatus and method for performing transform encoding, and apparatus and method for encoding data
CN1470147A (zh) 2000-08-07 2004-01-21 �µ��ǿƼ��ɷ��������޹�˾ 声音信号过滤和压缩的方法与装置
US6674876B1 (en) * 2000-09-14 2004-01-06 Digimarc Corporation Watermarking in the time-frequency domain
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
EP1211636A1 (en) 2000-11-29 2002-06-05 STMicroelectronics S.r.l. Filtering device and method for reducing noise in electrical signals, in particular acoustic signals and images
JP4649735B2 (ja) 2000-12-14 2011-03-16 ソニー株式会社 符号化装置および方法、並びに記録媒体
US7930170B2 (en) 2001-01-11 2011-04-19 Sasken Communication Technologies Limited Computationally efficient audio coder
US6931373B1 (en) 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
SE0101175D0 (sv) 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
US6722114B1 (en) * 2001-05-01 2004-04-20 James Terry Poole Safe lawn mower blade alternative system
WO2002093552A1 (en) 2001-05-11 2002-11-21 Koninklijke Philips Electronics N.V. Estimating signal power in compressed audio
US6473013B1 (en) 2001-06-20 2002-10-29 Scott R. Velazquez Parallel processing analog and digital converter
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
CA2354755A1 (en) 2001-08-07 2003-02-07 Dspfactory Ltd. Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank
CA2354808A1 (en) 2001-08-07 2003-02-07 King Tam Sub-band adaptive signal processing in an oversampled filterbank
CA2354858A1 (en) 2001-08-08 2003-02-08 Dspfactory Ltd. Subband directional audio signal processing using an oversampled filterbank
EP1292036B1 (en) * 2001-08-23 2012-08-01 Nippon Telegraph And Telephone Corporation Digital signal decoding methods and apparatuses
US7362818B1 (en) 2001-08-30 2008-04-22 Nortel Networks Limited Amplitude and phase comparator for microwave power amplifier
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
EP1440432B1 (en) 2001-11-02 2005-05-04 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
EP1423847B1 (en) 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US7095907B1 (en) 2002-01-10 2006-08-22 Ricoh Co., Ltd. Content and display device dependent creation of smaller representation of images
US6771177B2 (en) 2002-01-14 2004-08-03 David Gene Alderman Warning device for food storage appliances
US20100042406A1 (en) 2002-03-04 2010-02-18 James David Johnston Audio signal processing using improved perceptual model
US20030215013A1 (en) * 2002-04-10 2003-11-20 Budnikov Dmitry N. Audio encoder with adaptive short window grouping
US6904146B2 (en) 2002-05-03 2005-06-07 Acoustic Technology, Inc. Full duplex echo cancelling circuit
BRPI0311601B8 (pt) 2002-07-19 2018-02-14 Matsushita Electric Ind Co Ltd "aparelho e método decodificador de áudio"
EP1527442B1 (en) 2002-08-01 2006-04-05 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and audio decoding method based on spectral band replication
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US6792057B2 (en) 2002-08-29 2004-09-14 Bae Systems Information And Electronic Systems Integration Inc Partial band reconstruction of frequency channelized filters
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
JP3646939B1 (ja) 2002-09-19 2005-05-11 松下電器産業株式会社 オーディオ復号装置およびオーディオ復号方法
US7191136B2 (en) * 2002-10-01 2007-03-13 Ibiquity Digital Corporation Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband
US7191235B1 (en) * 2002-11-26 2007-03-13 Cisco Technology, Inc. System and method for communicating data in a loadbalancing environment
US20040252772A1 (en) 2002-12-31 2004-12-16 Markku Renfors Filter bank based signal processing
US20040162866A1 (en) 2003-02-19 2004-08-19 Malvar Henrique S. System and method for producing fast modulated complex lapped transforms
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US6982377B2 (en) 2003-12-18 2006-01-03 Texas Instruments Incorporated Time-scale modification of music signals based on polyphase filterbanks and constrained time-domain processing
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム

Also Published As

Publication number Publication date
US8019612B2 (en) 2011-09-13
ATE288617T1 (de) 2005-02-15
CN1571993A (zh) 2005-01-26
US20110295608A1 (en) 2011-12-01
US20190385624A1 (en) 2019-12-19
KR20040066114A (ko) 2004-07-23
US20170178647A1 (en) 2017-06-22
US20090326929A1 (en) 2009-12-31
CN1279512C (zh) 2006-10-11
US7469206B2 (en) 2008-12-23
US20170178654A1 (en) 2017-06-22
US9761236B2 (en) 2017-09-12
US20170178656A1 (en) 2017-06-22
US9818418B2 (en) 2017-11-14
US20170178655A1 (en) 2017-06-22
EP1423847A1 (en) 2004-06-02
US8447621B2 (en) 2013-05-21
US20160358616A1 (en) 2016-12-08
US10403295B2 (en) 2019-09-03
ES2237706T3 (es) 2005-08-01
US9818417B2 (en) 2017-11-14
US20160232912A1 (en) 2016-08-11
US20090132261A1 (en) 2009-05-21
WO2003046891A1 (en) 2003-06-05
US20170178658A1 (en) 2017-06-22
JP3870193B2 (ja) 2007-01-17
PT1423847E (pt) 2005-05-31
US9792923B2 (en) 2017-10-17
US20050096917A1 (en) 2005-05-05
JP2005510772A (ja) 2005-04-21
DE60202881T2 (de) 2006-01-19
US20170178657A1 (en) 2017-06-22
US9431020B2 (en) 2016-08-30
AU2002352182A1 (en) 2003-06-10
US9812142B2 (en) 2017-11-07
US20130226597A1 (en) 2013-08-29
EP1423847B1 (en) 2005-02-02
US11238876B2 (en) 2022-02-01
US20170178646A1 (en) 2017-06-22
US9779746B2 (en) 2017-10-03
DE60202881D1 (de) 2005-03-10
US8112284B2 (en) 2012-02-07
US9761237B2 (en) 2017-09-12
US9761234B2 (en) 2017-09-12
HK1062350A1 (en) 2004-10-29

Similar Documents

Publication Publication Date Title
KR100648760B1 (ko) 고주파 재생 기술 향상을 위한 방법들 및 그를 수행하는 프로그램이 저장된 컴퓨터 프로그램 기록매체
JP4511443B2 (ja) 情報源符号化システムの性能向上装置
KR101373004B1 (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
US9177569B2 (en) Apparatus, medium and method to encode and decode high frequency signal

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121025

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20131025

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20141028

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20151027

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20161026

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20171026

Year of fee payment: 12