KR102022500B1 - 오디오 코딩 방법 및 관련 장치 - Google Patents

오디오 코딩 방법 및 관련 장치 Download PDF

Info

Publication number
KR102022500B1
KR102022500B1 KR1020197003520A KR20197003520A KR102022500B1 KR 102022500 B1 KR102022500 B1 KR 102022500B1 KR 1020197003520 A KR1020197003520 A KR 1020197003520A KR 20197003520 A KR20197003520 A KR 20197003520A KR 102022500 B1 KR102022500 B1 KR 102022500B1
Authority
KR
South Korea
Prior art keywords
subband
spectral coefficients
audio frame
khz
coefficients located
Prior art date
Application number
KR1020197003520A
Other languages
English (en)
Other versions
KR20190014603A (ko
Inventor
제신 류
레이 미아오
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20190014603A publication Critical patent/KR20190014603A/ko
Application granted granted Critical
Publication of KR102022500B1 publication Critical patent/KR102022500B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrolytic Production Of Non-Metals, Compounds, Apparatuses Therefor (AREA)
  • Stereophonic System (AREA)

Abstract

오디오 인코딩 방법 및 관련 장치에 대해 개시한다. 오디오 코딩 방법은, 현재 오디오 프레임의 시간-도메인 신호에 대해 시간-주파수 변환 프로세싱을 수행하여 현재 오디오 프레임의 스펙트럼 계수를 획득하는 단계; 상기 현재 오디오 프레임의 참조 코딩 파라미터를 획득하는 단계; 및 상기 현재 오디오 프레임의 획득된 참조 코딩 파라미터가 제1 파라미터 조건을 만족하면, 변환 코딩 여기 알고리즘(transform coded excitation algorithm)에 기초하여 상기 현재 오디오 프레임의 스펙트럼 계수를 코딩하거나, 상기 현재 오디오 프레임의 획득된 참조 코딩 파라미터가 제2 파라미터 조건을 만족하면, 고품질 변환 코딩 알고리즘(high quality transform coding algorithm)에 기초하여 상기 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 단계를 포함한다. 오디오 인코딩 방법 및 관련 장치는 오디오 프레임 코딩의 코딩 품질 또는 코딩 효율을 높이는 데도 일조한다.

Description

오디오 코딩 방법 및 관련 장치{AUDIO CODING METHOD AND RELEVANT APPARATUS}
본 발명은 오디오 코딩 기술에 관한 것이며, 특히 오디오 코딩 방법 및 관련 장치에 관한 것이다.
기존의 오디오(예를 들어, 음악) 코딩 알고리즘에서는 동일한 비트 레이트에서, 일부의 오디오 코딩 알고리즘은 특별한 코딩 대역폭에 제한되고, 상대적으로 낮은 대역폭의 오디오 프레임을 코딩하는 데 주로 사용되며, 일부의 오디오 코딩 알고리즘은 코딩 대역폭에 제한되지 않고, 상대적으로 높은 대역폭의 오디오 프레임을 코딩하는 데 주로 사용된다. 당연히, 두 카테고리의 오디오 코딩 방식 양자는 장점과 단점을 가진다.
그렇지만, 종래기술에서는 오디오 프레임 코딩 동안, 고정 코딩 알고리즘을 오디오 프레임을 코딩하는 데 직접적으로 사용한다. 이 방법에서는, 사용된 오디오 코딩 알고리즘은 우수한 코딩 품질 또는 코딩 효율을 확보하기가 어렵다.
본 발명의 실시예는 오디오 프레임 코딩의 코딩 품질 또는 코딩 효율을 높이기 위한 오디오 코딩 방법 및 관련 장치를 제공하고자 한다.
본 발명의 실시예의 제1 관점은 오디오 코딩 방법을 제공하며, 상기 방법은:
현재 오디오 프레임의 시간-도메인 신호에 대해 시간-주파수 변환 프로세싱을 수행하여 현재 오디오 프레임의 스펙트럼 계수를 획득하는 단계;
상기 현재 오디오 프레임의 참조 코딩 파라미터를 획득하는 단계; 및
상기 현재 오디오 프레임의 획득된 참조 코딩 파라미터가 제1 파라미터 조건을 만족하면, 변환 코딩 여기 알고리즘에 기초하여 상기 현재 오디오 프레임의 스펙트럼 계수를 코딩하거나, 상기 현재 오디오 프레임의 획득된 참조 코딩 파라미터가 제2 파라미터 조건을 만족하면, 고품질 변환 코딩 알고리즘에 기초하여 상기 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 단계
를 포함한다.
제1 관점을 참조하여, 제1 관점의 제1 가능한 실시 방식에서, 참조 코딩 파라미터는 다음의 파라미터: 상기 현재 오디오 프레임의 코딩 레이트; 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비; 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차; 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균; 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균 및 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균; 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비 및 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비; 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 및 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차; 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프 및 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프; 또는 현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값 중 적어도 하나를 포함하며,
서브밴드 z의 최고 주파수 빈(bin)은 임계 주파수 빈 F1보다 크고; 서브밴드 w의 최고 주파수 빈은 임계 주파수 빈 F1보다 크고; 서브밴드 j의 최고 주파수 빈은 임계 주파수 빈 F2보다 크고; 서브밴드 n의 최고 주파수 빈은 임계 주파수 빈 F2보다 크고;
임계 주파수 빈 F1의 값 범위는 6.4 kHz 내지 12 kHz이고;
임계 주파수 빈 F2의 값 범위는 4.8 kHz 내지 8 kHz이고; 그리고
서브밴드 i의 최고 주파수 빈은 서브밴드 j의 최고 주파수 빈보다 작고; 서브밴드 m의 최고 주파수 빈은 서브밴드 n의 최고 주파수 빈보다 작고; 서브밴드 x의 최고 주파수 빈은 서브밴드 y의 최저 주파수 빈보다 작거나 같고; 서브밴드 p의 최고 주파수 빈은 서브밴드 q의 최저 주파수 빈보다 작거나 같고; 서브밴드 r의 최고 주파수 빈은 서브밴드 s의 최저 주파수 빈보다 작거나 같고; 그리고 서브밴드 e의 최고 주파수 빈은 서브밴드 f의 최저 주파수 빈보다 작거나 같다.
제1 관점의 제1 관점의 제1 가능한 실시 방식을 참조하여, 제1 관점의 제2 가능한 실시 방식에서,
다음의 조건: 서브밴드 w의 최저 주파수 빈은 임계 주파수 빈 F1보다 크거나 같거나, 서브밴드 z의 최저 주파수 빈은 임계 주파수 빈 F1보다 크거나 같거나, 서브밴드 i의 최고 주파수 빈은 서브밴드 j의 최저 주파수 빈보다 작거나 같거나, 서브밴드 m의 최고 주파수 빈은 서브밴드 n의 최저 주파수 빈보다 작거나 같거나, 서브밴드 j의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나, 또는 서브밴드 n의 최저 주파수 빈은 임계 주파수 빈 F2보다 크다는 조건 중 적어도 하나를 만족한다.
제1 관점의 제1 관점의 제1 가능한 실시 방식 또는 제1 관점의 제2 관점의 제1 가능한 실시 방식을 참조하여, 제1 관점의 제3 가능한 실시 방식에서, 상기 제1 파라미터 조건은 다음의 조건:
현재 오디오 프레임의 코딩 레이트는 임계값 T1보다 작거나;
현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T2보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T3보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T4보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T5보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T6보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T7보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비는 구간 R1 내에 있거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비와 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비 간의 차이의 절댓값은 임계값 T8보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에 대한 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차의 비는 구간 R2 내에 있거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차와 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 간의 차이의 절댓값은 임계값 T9보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프에 대한 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프의 비는 구간 R3 내에 있고;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프와 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프 간의 차이의 절댓값은 임계값 T10보다 작거나 같거나; 또는
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값은 임계값 T11보다 크거나 같다는 조건 중 적어도 하나를 포함한다.
제1 관점의 제1 관점의 제1 가능한 실시 방식, 제1 관점의 제2 관점의 제1 가능한 실시 방식, 또는 제1 관점의 제3 가능한 실시 방식을 참조하여, 제1 관점의 제4 가능한 실시 방식에서, 상기 제1 파라미터 조건은 다음의 조건:
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비를 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비로 제산하는 몫은 임계값 T44보다 작고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T45보다 작거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비를 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비로 제산하는 몫은 임계값 T46보다 크고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T47보다 크거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비에서 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 감산하는 차는 임계값 T48보다 작고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T49보다 작거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비에서 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 감산하는 차는 임계값 T50보다 크고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T51보다 크거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차로 제산하는 몫은 임계값 T52보다 작고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T53보다 작거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차로 제산하는 몫은 임계값 T54보다 크고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T55보다 크거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에서 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 감산하는 차는 임계값 T56보다 작고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T57보다 작거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에서 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 감산하는 차는 임계값 T58보다 크고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T59보다 크거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프를 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프로 제산하는 몫은 임계값 T60보다 작고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T61보다 작거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프를 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프로 제산하는 몫은 임계값 T62보다 크고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T63보다 크거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프에서 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프를 감산하는 차는 임계값 T64보다 작고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T65보다 작거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프에서 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프를 감산하는 차는 임계값 T66보다 크고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T67보다 크거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T68보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T69보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T70보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T71보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T72보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T73보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T74보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T75보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T76보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T77보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T78보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T79보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T80보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T81보다 작거나 같거나; 또는
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T82보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T83보다 작거나 같다는 조건 중 적어도 하나를 포함한다.
제1 관점의 제1 관점의 제1 가능한 실시 방식, 제1 관점의 제2 관점의 제1 가능한 실시 방식, 제1 관점의 제3 가능한 실시 방식, 또는 제1 관점의 제4 가능한 실시 방식을 참조하여, 제1 관점의 제5 가능한 실시 방식에서, 상기 제2 파라미터 조건은 다음의 조건:
현재 오디오 프레임의 코딩 레이트는 임계값 T1보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T2보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T3보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T4보다 작거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T5보다 작거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T6보다 작거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T7보다 작거나;
현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비는 구간 R1 내에 있지 않거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비와 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비 간의 차이의 절댓값은 임계값 T8보다 크거나;
현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에 대한 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차의 비는 구간 R2 내에 있지 않거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차와 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 간의 차이의 절댓값은 임계값 T9보다 크거나;
현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프에 대한 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프의 비는 구간 R3 내에 있지 않거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프와 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프 간의 차이의 절댓값은 임계값 T10보다 크거나; 또는
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값은 임계값 T11보다 작다는 조건 중 적어도 하나를 포함한다.
제1 관점의 제1 관점의 제1 가능한 실시 방식, 제1 관점의 제2 관점의 제1 가능한 실시 방식, 제1 관점의 제3 가능한 실시 방식, 제1 관점의 제4 가능한 실시 방식, 또는 제1 관점의 제5 가능한 실시 방식을 참조하여, 제1 관점의 제6 가능한 실시 방식에서, 상기 제1 파라미터 조건은 다음의 조건:
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비를 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비로 제산하는 몫은 임계값 T44보다 작고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T45보다 크거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비를 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비로 제산하는 몫은 임계값 T46보다 크고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T47보다 작거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비에서 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 감산하는 차는 임계값 T48보다 작고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T49보다 크거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비에서 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 감산하는 차는 임계값 T50보다 크고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T51보다 작거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차로 제산하는 몫은 임계값 T52보다 작고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T53보다 크거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차로 제산하는 몫은 임계값 T54보다 크고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T55보다 작거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에서 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 감산하는 차는 임계값 T56보다 작고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T57보다 크거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에서 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 감산하는 차는 임계값 T58보다 크고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T59보다 작거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프를 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프로 제산하는 몫은 임계값 T60보다 작고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T61보다 크거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프를 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프로 제산하는 몫은 임계값 T62보다 크고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T63보다 작거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프에서 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프를 감산하는 차는 임계값 T64보다 작고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T65보다 크거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프에서 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프를 감산하는 차는 임계값 T66보다 크고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T67보다 작거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T68보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T69보다 크거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T70보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T71보다 크거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T72보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T73보다 크거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T74보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T75보다 크거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T76보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T77보다 크거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T78보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T79보다 크거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T80보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T81보다 크거나; 또는
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T82보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T83보다 크다는 조건 중 적어도 하나를 포함한다.
제1 관점의 제3 가능한 실시 방식, 제1 관점의 제4 가능한 실시 방식, 또는 제1 관점의 제5 가능한 실시 방식, 또는 제1 관점의 제6 가능한 실시 방식을 참조하여, 제1 관점의 제7 가능한 실시 방식에서,
다음의 조건:
임계값 T2는 2보다 크거나 같거나;
임계값 T4는 1/1.2보다 작거나 같거나;
구간 R1은 [1/2.25, 2.25]이거나;
임계값 T44는 1/2.56보다 작거나 같거나;
임계값 T45는 1.5보다 크거나 같거나;
임계값 T46은 1/2.56보다 크거나 같거나;
임계값 T47은 1.5보다 작거나 같거나;
임계값 T68은 1.25보다 작거나 같거나; 또는
임계값 T69는 2보다 크거나 같다는 조건 중 적어도 하나를 만족한다.
본 발명의 실시예의 제2 관점은 오디오 코더를 제공하며, 상기 오디오 코더는:
현재 오디오 프레임의 시간-도메인 신호에 대해 시간-주파수 변환 프로세싱을 수행하여 현재 오디오 프레임의 스펙트럼 계수를 획득하도록 구성되어 있는 시간-주파수 변환 유닛;
상기 현재 오디오 프레임의 참조 코딩 파라미터를 획득하도록 구성되어 있는 획득 유닛; 및
상기 획득 유닛에 의해 획득되는 현재 오디오 프레임의 참조 코딩 파라미터가 제1 파라미터 조건을 만족하면, 변환 코딩 여기 알고리즘에 기초하여 상기 현재 오디오 프레임의 스펙트럼 계수를 코딩하거나, 상기 획득 유닛에 의해 획득되는 현재 오디오 프레임의 참조 코딩 파라미터가 제2 파라미터 조건을 만족하면, 고품질 변환 코딩 알고리즘에 기초하여 상기 현재 오디오 프레임의 스펙트럼 계수를 코딩하도록 구성되어 있는 코딩 유닛
을 포함한다.
제2 관점을 참조하여, 제2 관점의 제1 가능한 실시 방식에서, 상기 참조 코딩 파라미터는 다음의 파라미터: 상기 현재 오디오 프레임의 코딩 레이트; 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비; 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차; 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균; 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균 및 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균; 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비 및 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비; 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프 및 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프; 현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값; 또는 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 및 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 중 적어도 하나를 포함하며,
서브밴드 z의 최고 주파수 빈은 임계 주파수 빈 F1보다 크고; 서브밴드 w의 최고 주파수 빈은 임계 주파수 빈 F1보다 크고; 서브밴드 j의 최고 주파수 빈은 임계 주파수 빈 F2보다 크고; 서브밴드 n의 최고 주파수 빈은 임계 주파수 빈 F2보다 크고;
임계 주파수 빈 F1의 값 범위는 6.4 kHz 내지 12 kHz이고;
임계 주파수 빈 F2의 값 범위는 4.8 kHz 내지 8 kHz이고; 그리고
서브밴드 i의 최고 주파수 빈은 서브밴드 j의 최고 주파수 빈보다 작고; 서브밴드 m의 최고 주파수 빈은 서브밴드 n의 최고 주파수 빈보다 작고; 서브밴드 x의 최고 주파수 빈은 서브밴드 y의 최저 주파수 빈보다 작거나 같고; 서브밴드 p의 최고 주파수 빈은 서브밴드 q의 최저 주파수 빈보다 작거나 같고; 서브밴드 r의 최고 주파수 빈은 서브밴드 s의 최저 주파수 빈보다 작거나 같고; 그리고 서브밴드 e의 최고 주파수 빈은 서브밴드 f의 최저 주파수 빈보다 작거나 같다.
제2 관점의 제1 가능한 실시 방식을 참조하여, 제2 관점의 제2 가능한 실시 방식에서, 다음의 조건: 서브밴드 w의 최저 주파수 빈은 임계 주파수 빈 F1보다 크거나 같거나, 서브밴드 z의 최저 주파수 빈은 임계 주파수 빈 F1보다 크거나 같거나, 서브밴드 i의 최고 주파수 빈은 서브밴드 j의 최저 주파수 빈보다 작거나 같거나, 서브밴드 m의 최고 주파수 빈은 서브밴드 n의 최저 주파수 빈보다 작거나 같거나, 서브밴드 j의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나, 또는 서브밴드 n의 최저 주파수 빈은 임계 주파수 빈 F2보다 크다는 조건 중 적어도 하나를 만족한다.
제2 관점의 제1 가능한 실시 방식 또는 제2 관점의 제2 가능한 실시 방식을 참조하여, 제2 관점의 제3 가능한 실시 방식에서, 상기 제1 파라미터 조건은 다음의 조건:
현재 오디오 프레임의 코딩 레이트는 임계값 T1보다 작거나;
현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T2보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T3보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T4보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T5보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T6보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T7보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비는 구간 R1 내에 있거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비와 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비 간의 차이의 절댓값은 임계값 T8보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에 대한 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차의 비는 구간 R2 내에 있거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차와 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 간의 차이의 절댓값은 임계값 T9보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프에 대한 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프의 비는 구간 R3 내에 있거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프와 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프 간의 차이의 절댓값은 임계값 T10보다 작거나 같거나; 또는
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값은 임계값 T11보다 크거나 같다는 조건 중 적어도 하나를 포함한다.
제2 관점의 제1 가능한 실시 방식, 제2 관점의 제2 가능한 실시 방식, 또는 제2 관점의 제3 가능한 실시 방식을 참조해서, 제2 관점의 제4 가능한 실시 방식에서, 상기 제1 파라미터 조건은 다음의 조건:
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비를 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비로 제산하는 몫은 임계값 T44보다 작고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T45보다 작거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비를 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비로 제산하는 몫은 임계값 T46보다 크고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T47보다 크거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비에서 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 감산하는 차는 임계값 T48보다 작고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T49보다 작거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비에서 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 감산하는 차는 임계값 T50보다 크고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T51보다 크거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차로 제산하는 몫은 임계값 T52보다 작고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T53보다 작거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차로 제산하는 몫은 임계값 T54보다 크고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T55보다 크거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에서 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 감산하는 차는 임계값 T56보다 작고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T57보다 작거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에서 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 감산하는 차는 임계값 T58보다 크고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T59보다 크거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프를 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프로 제산하는 몫은 임계값 T60보다 작고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T61보다 작거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프를 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프로 제산하는 몫은 임계값 T62보다 크고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T63보다 크거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프에서 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프를 감산하는 차는 임계값 T64보다 작고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T65보다 작거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프에서 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프를 감산하는 차는 임계값 T66보다 크고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T67보다 크거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T68보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T69보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T70보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T71보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T72보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T73보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T74보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T75보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T76보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T77보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T78보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T79보다 작거나 같거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T80보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T81보다 작거나 같거나; 또는
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T82보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T83보다 작거나 같다는 조건 중 적어도 하나를 포함한다.
제2 관점의 제1 가능한 실시 방식, 제2 관점의 제2 가능한 실시 방식, 제2 관점의 제3 가능한 실시 방식, 또는 제2 관점의 제4 가능한 실시 방식을 참조해서, 제2 관점의 제5 가능한 실시 방식에서, 상기 제2 파라미터 조건은 다음의 조건:
현재 오디오 프레임의 코딩 레이트는 임계값 T1보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T2보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T3보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T4보다 작거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T5보다 작거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T6보다 작거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T7보다 작거나;
현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비는 구간 R1 내에 있지 않거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비와 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비 간의 차이의 절댓값은 임계값 T8보다 크거나;
현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에 대한 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차의 비는 구간 R2 내에 있지 않거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차와 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 간의 차이의 절댓값은 임계값 T9보다 크거나;
현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프에 대한 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프의 비는 구간 R3 내에 있지 않거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프와 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프 간의 차이의 절댓값은 임계값 T10보다 크거나; 또는
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값은 임계값 T11보다 작다는 조건 중 적어도 하나를 포함한다.
제2 관점의 제1 가능한 실시 방식, 제2 관점의 제2 가능한 실시 방식, 제2 관점의 제3 가능한 실시 방식, 제2 관점의 제4 가능한 실시 방식, 또는 제2 관점의 제5 가능한 실시 방식을 참조해서, 제2 관점의 제6 가능한 실시 방식에서, 상기 제1 파라미터 조건은 다음의 조건:
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비를 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비로 제산하는 몫은 임계값 T44보다 작고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T45보다 크거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비를 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비로 제산하는 몫은 임계값 T46보다 크고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T47보다 작거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비에서 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 감산하는 차는 임계값 T48보다 작고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T49보다 크거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비에서 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 감산하는 차는 임계값 T50보다 크고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T51보다 작거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차로 제산하는 몫은 임계값 T52보다 작고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T53보다 크거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차로 제산하는 몫은 임계값 T54보다 크고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T55보다 작거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에서 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 감산하는 차는 임계값 T56보다 작고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T57보다 크거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에서 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 감산하는 차는 임계값 T58보다 크고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T59보다 작거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프를 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프로 제산하는 몫은 임계값 T60보다 작고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T61보다 크거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프를 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프로 제산하는 몫은 임계값 T62보다 크고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T63보다 작거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프에서 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프를 감산하는 차는 임계값 T64보다 작고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T65보다 크거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프에서 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프를 감산하는 차는 임계값 T66보다 크고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T67보다 작거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T68보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T69보다 크거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T70보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T71보다 크거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T72보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T73보다 크거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T74보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T75보다 크거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T76보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T77보다 크거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T78보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T79보다 크거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T80보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T81보다 크거나; 또는
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T82보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T83보다 크다는 조건 중 적어도 하나를 포함한다.
제2 관점의 제3 가능한 실시 방식, 제2 관점의 제4 가능한 실시 방식, 제2 관점의 제5 가능한 실시 방식, 또는 제2 관점의 제6 가능한 실시 방식을 참조해서, 제2 관점의 제7 가능한 실시 방식에서, 다음의 조건:
임계값 T2는 2보다 크거나 같거나;
임계값 T4는 1/1.2보다 작거나 같거나;
구간 R1은 [1/2.25, 2.25]이거나;
임계값 T44는 1/2.56보다 작거나 같거나;
임계값 T45는 1.5보다 크거나 같거나;
임계값 T46은 1/2.56보다 크거나 같거나;
임계값 T47은 1.5보다 작거나 같거나;
임계값 T68은 1.25보다 작거나 같거나; 또는
임계값 T69는 2보다 크거나 같다는 조건 중 적어도 하나를 만족한다.
알 수 있는 바와 같이, 본 발명의 일부의 실시예에서의 기술적 솔루션에서, 현재 오디오 프레임의 참조 코딩 파라미터가 획득된 후, 현재 오디오 프레임의 획득된 참조 코딩 파라미터에 기초해서 TCX 알고리즘 또는 HQ 알고리즘이 선택되어, 현재 오디오 프레임의 스펙트럼 계수를 코딩한다. 현재 오디오 프레임의 참조 코딩 파라미터는 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘과 관련 있으며, 이것은 코딩 알고리즘과 현재 오디오 프레임의 참조 코딩 파라미터 간의 적응성과 적합성을 높이는 데 일조하며, 현재 오디오 프레임의 코딩 품질 또는 코딩 효율을 높이는 데도 일조한다.
본 발명의 실시예는 오디오 프레임 코딩의 코딩 품질 또는 코딩 효율을 높이기 위한 오디오 코딩 방법 및 관련 장치를 제공한다.
본 발명의 실시예의 기술적 솔루션을 더 명확하게 설명하기 위해, 이하에서는 본 발명의 실시예를 설명하는 데 필요한 첨부된 도면에 대해 간략하게 설명한다. 당연히, 이하의 실시예의 첨부된 도면은 본 발명의 일부의 실시예에 지나지 않으며, 당업자라면 창조적 노력 없이 첨부된 도면으로부터 다른 도면을 도출해낼 수 있을 것이다.
도 1 내지 도 8은 본 발명의 실시예에 따른 수 개의 오디오 코딩 방법에 대한 개략적인 흐름도이다.
도 9 및 도 10은 본 발명의 실시예에 따른 2 유형의 오디오 코더에 대한 개략적인 도면이다.
본 발명의 실시예는 오디오 프레임 코딩의 코딩 품질 또는 코딩 효율을 높이기 위한 오디오 코딩 방법 및 관련 장치를 제공한다.
당업자가 본 발명의 기술적 솔루션을 더 잘 이해하도록 하기 위해, 이하에서는 본 발명의 실시예에 첨부된 도면을 참조하여 본 발명의 실시예의 기술적 솔루션에 대해 명확하고 완전하게 설명한다. 당연히, 설명된 실시예는 본 발명의 모든 실시예가 아닌 일부에 지나지 않는다. 당업자가 창조적 노력 없이 본 발명의 실시예에 기초하여 획득하는 모든 다른 실시예는 본 발명의 보호 범위 내에 있게 된다.
이하에서는 상세한 설명을 제공한다.
본 발명의 명세서, 청구범위, 및 첨부된 도면에서 "제1", "제2", "제3", "제4" 등의 용어는 유사한 대상들을 구별하기 위해 사용되지만 특정한 순서나 순위를 나타내기 위해 반드시 사용되는 것은 아니다. 또한, "포함하다" 및 "가지다" 및 이의 임의의 변형과 같은 용어는 배제 없는 포함을 망라하도록 의도된 것이며, 예를 들어, 프로세스, 방법 또는 시스템, 일련의 단계 또는 유닛을 포함하는 제품 또는 장치는 이러한 단계 또는 유닛을 명확하게 열거하지 않아도 되며, 명확하게 열거되지 않았거나 프로세스, 방법, 제품 또는 장치에 본래 내재하는 다른 단계 또는 유닛을 포함할 수 있다.
이하에서는 먼저 본 발명의 실시예에서 제공하는 오디오 코딩 방법을 소개한다. 본 발명의 실시예에서 제공하는 오디오 코딩 방법은 오디오 코더에 의해 실행될 수 있다. 오디오 코더는 오디오 신호를 수집, 저장, 전송해야 하는 임의의 장치, 예를 들어, 이동 전화, 태블릿 컴퓨터, 퍼스널 컴퓨터, 또는 노트북 컴퓨터일 수 있다.
본 발명의 오디오 코딩 방법의 일실시예에서, 오디오 코딩 방법은, 현재 오디오 프레임의 시간-도메인 신호에 대해 시간-주파수 변환 프로세싱을 수행하여 현재 오디오 프레임의 스펙트럼 계수를 획득하는 단계; 상기 현재 오디오 프레임의 참조 코딩 파라미터를 획득하는 단계; 및 상기 현재 오디오 프레임의 획득된 참조 코딩 파라미터가 제1 파라미터 조건을 만족하면, 변환 코딩 여기 알고리즘(transform coded excitation algorithm)에 기초하여 상기 현재 오디오 프레임의 스펙트럼 계수를 코딩하거나, 상기 현재 오디오 프레임의 획득된 참조 코딩 파라미터가 제2 파라미터 조건을 만족하면, 고품질 변환 코딩 알고리즘(high quality transform coding algorithm)에 기초하여 상기 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 단계를 포함한다.
도 1을 참조하면, 도 1은 본 발명의 실시예에 따른 오디오 코딩 방법에 대한 개략적인 흐름도이다. 도 1에 도시된 바와 같이, 본 발명의 이 실시예에서 제공하는 오디오 코딩 방법은 이하의 내용을 포함할 수 있다:
101: 현재 오디오 프레임의 시간-도메인 신호에 대해 시간-주파수 변환 프로세싱을 수행하여 현재 오디오 프레임의 스펙트럼 계수를 획득한다.
본 발명의 실시예에서 언급하는 오디오 프레임은 음성 프레임 또는 음악 프레임일 수 있다.
102: 현재 오디오 프레임의 참조 코딩 파라미터를 획득한다.
103: 현재 오디오 프레임의 획득된 참조 코딩 파라미터가 제1 파라미터 조건을 만족하면, 변환 코딩 여기(transform coded excitation, TCX로 약칭) 알고리즘에 기초하여 상기 현재 오디오 프레임의 스펙트럼 계수를 코딩한다.
104: 현재 오디오 프레임의 획득된 참조 코딩 파라미터가 제2 파라미터 조건을 만족하면, 고품질 변환 코딩(high coded excitation, HQ로 약칭) 알고리즘에 기초하여 상기 현재 오디오 프레임의 스펙트럼 계수를 코딩한다.
알 수 있는 바와 같이, 본 발명의 일부의 실시예에서의 기술적 솔루션에서, 현재 오디오 프레임의 참조 코딩 파라미터가 획득된 후, 현재 오디오 프레임의 획득된 참조 코딩 파라미터에 기초해서 TCX 알고리즘 또는 HQ 알고리즘이 선택되어, 현재 오디오 프레임의 스펙트럼 계수를 코딩한다. 현재 오디오 프레임의 참조 코딩 파라미터는 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘과 관련 있으며, 이것은 코딩 알고리즘과 현재 오디오 프레임의 참조 코딩 파라미터 간의 적응성과 적합성을 높이는 데 일조하며, 현재 오디오 프레임의 코딩 품질 또는 코딩 효율을 높이는 데도 일조한다.
TCX 알고리즘에서는, 현재 오디오 프레임의 시간-도메인 신호에 대해 스트리핑 프로세싱(stripping processing)이 수행된다. 예를 들어, 현재 오디오 프레임의 시간-도메인 신호에 대해 스트리밍 프로세싱을 수행하는 데 구적 미러 필터(quadrature mirror filter)가 사용된다. HQ 알고리즘에서는, 현재 오디오 프레임의 시간-도메인 신호에 대해 스트리핑 프로세싱이 수행되지 않는다.
애플리케이션 시나리오의 요건에 따라, 단계(102)에서 획득된, 현재 오디오 프레임의 참조 코딩 파라미터는 가변될 수 있다.
예를 들어, 참조 코딩 파라미터는 다음의 파라미터: 현재 오디오 프레임의 코딩 레이트; 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비; 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차; 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균; 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균 및 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균; 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비 및 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비; 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 및 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차; 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프 및 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프; 또는 현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값 중 적어도 하나를 포함한다.
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값이 클수록 서브밴드 p 내에 위치하는 스펙트럼 계수와 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계가 더 강하다.
서브밴드의 주파수 빈 범위(frequency bin range)는 실제의 필요에 따라 결정될 수 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 서브밴드 z의 최고 주파수 빈은 임계 주파수 빈 F1보다 클 수 있고, 서브밴드 w의 최고 주파수 빈은 임계 주파수 빈 F1보다 클 수 있다. 임계 주파수 빈 F1의 값 범위는 예를 들어, 6.4 kHz 내지 12 kHz일 수 있다. 예를 들어, 임계 주파수 빈 F1의 값은 6.4 kHz, 8 kHz, 9 kHz, 10 kHz, 또는 12 kHz일 수 있다. 당연히, 임계 주파수 빈 F1은 다른 값일 수도 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 서브밴드 j의 최고 주파수 빈은 임계 주파수 빈 F2보다 클 수 있고, 서브밴드 n의 최고 주파수 빈은 임계 주파수 빈 F2보다 크다. 예를 들어, 임계 주파수 빈 F2의 값 범위는 4.8 kHz 내지 8 kHz일 수 있다. 구체적으로, 예를 들어, 임계 주파수 빈 F2의 값은 6.4 kHz, 4.8 kHz, 6 kHz, 8 kHz, 5 kHz, 또는 7 kHz일 수 있다. 당연히, 임계 주파수 빈 F2는 다른 값일 수도 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 서브밴드 i의 최고 주파수 빈은 서브밴드 j의 최고 주파수 빈보다 작을 수 있고; 서브밴드 m의 최고 주파수 빈은 서브밴드 n의 최고 주파수 빈보다 작을 수 있고; 서브밴드 x의 최고 주파수 빈은 서브밴드 y의 최저 주파수 빈보다 작거나 같을 수 있고; 서브밴드 p의 최고 주파수 빈은 서브밴드 q의 최저 주파수 빈보다 작거나 같을 수 있고; 서브밴드 r의 최고 주파수 빈은 서브밴드 s의 최저 주파수 빈보다 작거나 같을 수 있고; 그리고 서브밴드 e의 최고 주파수 빈은 서브밴드 f의 최저 주파수 빈보다 작거나 같을 수 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 다음의 조건:
서브밴드 w의 최저 주파수 빈은 임계 주파수 빈 F1보다 크거나 같을 수 있고, 서브밴드 z의 최저 주파수 빈은 임계 주파수 빈 F1보다 크거나 같을 수 있고, 서브밴드 i의 최고 주파수 빈은 서브밴드 j의 최저 주파수 빈보다 작거나 같을 수 있고, 서브밴드 m의 최고 주파수 빈은 서브밴드 n의 최저 주파수 빈보다 작거나 같을 수 있고, 서브밴드 j의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있거나, 또는 서브밴드 n의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있고, 서브밴드 i의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 서브밴드 m의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 서브밴드 j의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있거나, 또는 서브밴드 n의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있다는 조건 중 적어도 하나를 만족할 수 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 다음의 조건: 서브밴드 e의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 서브밴드 x의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 서브밴드 p의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있거나, 또는 서브밴드 r의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있다는 조건 중 하나를 만족할 수 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 서브밴드 f의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 당연히, 서브밴드 f의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있다. 서브밴드 q의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 당연히, 서브밴드 q의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있다. 서브밴드 s의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 당연히, 서브밴드 s의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있다.
예를 들어, 서브밴드 z의 최고 주파수 빈의 값 범위는 12 kHz 내지 16 kHz일 수 있다. 서브밴드 z의 최저 주파수 빈의 값 범위는 8 kHz 내지 14 kHz일 수 있다. 서브밴드 z의 대역폭의 값 범위는 1.6 kHz 내지 8 kHz일 수 있다. 구체적으로, 예를 들어, 서브밴드 z의 주파수 빈 범위는 8 kHz 내지 12 kHz, 9 kHz 내지 11 kHz, 8 kHz 내지 9.6 kHz, 또는 12 kHz 내지 14 kHz일 수 있다. 당연히, 서브밴드 z의 주파수 빈 범위는 전술한 예에 제한되지 않는다.
예를 들어, 서브밴드 w의 주파수 빈 범위는 실제의 필요에 따라 결정될 수 있다. 예를 들어, 서브밴드 w의 최고 주파수 빈의 값 범위는 12 kHz 내지 16 kHz일 수 있고, 서브밴드 w의 최저 주파수 빈의 값 범위는 8 kHz 내지 14 kHz일 수 있다. 구체적으로, 예를 들어, 서브밴드 w의 주파수 빈 범위는 8 kHz 내지 12 kHz, 9 kHz 내지 11 kHz, 8 kHz 내지 9.6 kHz, 12 kHz 내지 14 kHz, 또는 12.2 kHz 내지 14.5 kHz일 수 있다. 당연히, 서브밴드 w의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 w의 주파수 빈 범위는 서브밴드 z의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 i의 주파수 빈 범위는 3.2 kHz 내지 6.4 kHz, 3.2 kHz 내지 4.8 kHz, 4.8 kHz 내지 6.4 kHz, 0.4 kHz 내지 6.4 kHz, 또는 0.4 kHz 내지 3.6 kHz일 수 있다. 당연히, 서브밴드 i의 주파수 빈 범위는 전술한 예에 제한되지 않는다.
예를 들어, 서브밴드 j의 주파수 빈 범위는 6.4 kHz 내지 9.6 kHz, 6.4 kHz 내지 8 kHz, 8 kHz 내지 9.6 kHz, 4.8 kHz 내지 9.6 kHz, 또는 4.8 kHz 내지 8 kHz일 수 있다. 당연히, 서브밴드 j의 주파수 빈 범위는 전술한 예에 제한되지 않는다.
예를 들어, 서브밴드 m의 주파수 빈 범위는 3.2 kHz 내지 6.4 kHz, 3.2 kHz 내지 4.8 kHz, 4.8 kHz 내지 6.4 kHz, 0.4 kHz 내지 6.4 kHz, 또는 0.4 kHz 내지 3.6 kHz일 수 있다. 당연히, 서브밴드 m의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 m의 주파수 빈 범위는 서브밴드 i의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 n의 주파수 빈 범위는 6.4 kHz 내지 9.6 kHz, 6.4 kHz 내지 8 kHz, 8 kHz 내지 9.6 kHz, 4.8 kHz 내지 9.6 kHz, 또는 4.8 kHz 내지 8 kHz일 수 있다. 당연히, 서브밴드 n의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 n의 주파수 빈 범위는 서브밴드 j의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 x의 주파수 빈 범위는 0 kHz 내지 1.6 kHz, 1 kHz 내지 2.6 kHz, 1.6 kHz 내지 3.2 kHz, 2 kHz 내지 3.2 kHz, 또는 2.5 kHz 내지 3.4 kHz일 수 있다. 당연히, 서브밴드 x의 주파수 빈 범위는 전술한 예에 제한되지 않는다.
예를 들어, 서브밴드 y의 주파수 빈 범위는 6.4 kHz 내지 8 kHz, 7.4 kHz 내지 9 kHz, 4.8 kHz 내지 6.4 kHz, 4.4 kHz 내지 6.4 kHz, 또는 4.5 kHz 내지 6.2 kHz일 수 있다. 당연히, 서브밴드 y의 주파수 빈 범위는 전술한 예에 제한되지 않는다.
예를 들어, 서브밴드 p의 주파수 빈 범위는 0 kHz 내지 1.6 kHz, 1 kHz 내지 2.6 kHz, 1.6 kHz 내지 3.2 kHz, 2.1 kHz 내지 3.2 kHz, 또는 2.5 kHz 내지 3.5 kHz일 수 있다. 당연히, 서브밴드 p의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 p의 주파수 빈 범위는 서브밴드 x의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 q의 주파수 빈 범위는 6.4 kHz 내지 8 kHz, 7.4 kHz 내지 9 kHz, 4.8 kHz 내지 6.4 kHz, 4.2 kHz 내지 6.4 kHz, 또는 4.7 kHz 내지 6.2 kHz일 수 있다. 당연히, 서브밴드 q의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 q의 주파수 빈 범위는 서브밴드 y의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 r의 주파수 빈 범위는 0 kHz 내지 1.6 kHz, 1 kHz 내지 2.6 kHz, 1.6 kHz 내지 3.2 kHz, 2.05 kHz 내지 3.27 kHz, 또는 2.59 kHz 내지 3.51 kHz일 수 있다. 당연히, 서브밴드 r의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 r의 주파수 빈 범위는 서브밴드 x의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 s의 주파수 빈 범위는 6.4 kHz 내지 8 kHz, 7.4 kHz 내지 9 kHz, 4.8 kHz 내지 6.4 kHz, 5.4 kHz 내지 7.1 kHz, 또는 4.55 kHz 내지 6.29 kHz일 수 있다. 당연히, 서브밴드 s의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 s의 주파수 빈 범위는 서브밴드 y의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 e의 주파수 빈 범위는 0 kHz 내지 1.6 kHz, 1 kHz 내지 2.6 kHz, 1.6 kHz 내지 3.2 kHz, 0.8 kHz 내지 3 kHz, 또는 1.9 kHz 내지 3.8 kHz일 수 있다. 당연히, 서브밴드 e의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 e의 주파수 빈 범위는 서브밴드 x의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 f의 주파수 빈 범위는 6.4 kHz 내지 8 kHz, 7.4 kHz 내지 9 kHz, 4.8 kHz 내지 6.4 kHz, 5.3 kHz 내지 7.15 kHz, 또는 4.58 kHz 내지 6.52 kHz일 수 있다. 당연히, 서브밴드 f의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 f의 주파수 빈 범위는 서브밴드 y의 주파수 빈 범위와 같거나 유사할 수 있다.
제1 파라미터 조건은 변할 수 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 제1 파라미터 조건은 다음의 조건:
현재 오디오 프레임의 코딩 레이트는 임계값 T1보다 작고(임계값 T1은 예를 들어 24.4 kbps, 32 kbps, 64 kbps보다 크거나 같을 수도 있고 다른 레이트일 수도 있다);
현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T2보다 작거나 같고(임계값 T2는 예를 들어 1, 2, 3, 4보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T3보다 작거나 같고(임계값 T3은 예를 들어 10, 20, 35보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T4보다 크거나 같고(임계값 T4는 예를 들어 0.5, 1, 2, 3보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T5보다 크거나 같고(임계값 T5는 예를 들어 10, 20, 51, 100보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T6보다 크거나 같고(임계값 T6은 예를 들어 0.5, 1.1, 2, 3보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T7보다 크거나 같고(임계값 T7은 예를 들어 11, 20, 50, 101보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비는 구간 R1 내에 있고(구간 R1은 예를 들어 [0.5, 2], [0.4, 2.5]일 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비와 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비 간의 차이의 절댓값은 임계값 T8보다 작거나 같고(임계값 T8은 예를 들어 1, 2, 3보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에 대한 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차의 비는 구간 R2 내에 있고(구간 R2는 예를 들어 [0.5, 2], [0.4, 2.5]일 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차와 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 간의 차이의 절댓값은 임계값 T9보다 작거나 같고(임계값 T9는 예를 들어 10, 20, 35보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프에 대한 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프의 비는 구간 R3 내에 있고(구간 R3은 예를 들어 [0.5, 2], [0.4, 2.5]일 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프와 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프 간의 차이의 절댓값은 임계값 T10보다 작거나 같거나(임계값 T0은 예를 들어 11, 20, 50, 101보다 크거나 같을 수도 있고 다른 값일 수도 있다); 또는
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값은 임계값 T11보다 크거나 같다(임계값 T11은 예를 들어 0.5, 0.8, 0.9, 1일 수도 있고 다른 값일 수도 있다)는 조건 중 적어도 하나를 포함할 수 있다.
다른 예에서, 본 발명의 일부의 가능한 실시 방식에서, 제1 파라미터 조건은 다음의 조건:
현재 오디오 프레임의 코딩 레이트는 임계값 T1보다 크거나 같으며, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T12보다 크거나 같고(임계값 T12는 예를 들어 임계값 T4보다 크거나 같을 수 있고, 임계값 T12는 예를 들어 2, 3, 5, 8보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의 코딩 레이트는 임계값 T1보다 크거나 같으며, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T13보다 크거나 같고(임계값 T13은 예를 들어 임계값 T6보다 크거나 같을 수 있고, 임계값 T13은 예를 들어 2, 3, 9, 7보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의 코딩 레이트는 임계값 T1보다 크거나 같으며, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T14보다 작거나 같고(임계값 T14는 예를 들어 임계값 T2보다 작거나 같을 수 있고, 임계값 T14는 예를 들어 0.5, 2, 3, 1.5, 4보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의 코딩 레이트는 임계값 T1보다 크거나 같으며, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T15보다 작거나 같고(임계값 T15는 예를 들어 임계값 T3보다 작거나 같을 수 있고, 임계값 T15는 예를 들어 5, 8, 10, 20보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비는 구간 R1 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T16보다 크거나 같고(임계값 T16은 예를 들어 임계값 T4보다 크거나 같을 수 있고, 임계값 T16은 예를 들어 2, 3, 5, 8보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비는 구간 R1 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T17보다 크거나 같고(임계값 T17은 예를 들어 임계값 T6보다 크거나 같을 수 있고, 임계값 T17은 예를 들어 2, 3, 9, 7보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비는 구간 R1 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T18보다 작거나 같고(임계값 T18은 예를 들어 임계값 T2보다 작거나 같을 수 있고, 임계값 T18은 예를 들어 0.5, 2, 3, 1.5, 4, 5보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비는 구간 R1 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T19보다 작거나 같고(임계값 T19는 예를 들어 임계값 T3보다 작거나 같을 수 있고, 임계값 T19는 예를 들어 5, 8, 10, 20보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비와 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비 간의 차이의 절댓값은 임계값 T18보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T20보다 크거나 같고(임계값 T20은 예를 들어 임계값 T4보다 크거나 같을 수 있고, 임계값 T20은 예를 들어 2, 3, 5, 8보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비와 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비 간의 차이의 절댓값은 임계값 T8보다 크고, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T21보다 크거나 같고(임계값 T21은 예를 들어 임계값 T6보다 크거나 같을 수 있고, 임계값 T21은 예를 들어 2, 3, 9, 7보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비와 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비 간의 차이의 절댓값은 임계값 T8보다 크고, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T22보다 작거나 같고(임계값 T22는 예를 들어 임계값 T2보다 작거나 같을 수 있고, 임계값 T22는 예를 들어 0.5, 2, 3, 1.5, 4, 5보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비와 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비 간의 차이의 절댓값은 임계값 T8보다 크고, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T23보다 작거나 같고(임계값 T23은 예를 들어 임계값 T3보다 작거나 같을 수 있고, 임계값 T23은 예를 들어 5, 8, 10, 20보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에 대한 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차의 비는 구간 R2 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T24보다 크거나 같고(임계값 T24는 예를 들어 임계값 T4보다 크거나 같을 수 있고, 임계값 T24는 예를 들어 2, 3, 5, 8보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에 대한 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차의 비는 구간 R2 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T25보다 크거나 같고(임계값 T25는 예를 들어 임계값 T6보다 크거나 같을 수 있고, 임계값 T25는 예를 들어 2, 3, 9, 7보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에 대한 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차의 비는 구간 R2 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T26보다 작거나 같고(임계값 T26은 예를 들어 임계값 T2보다 작거나 같을 수 있고, 임계값 T26은 예를 들어 0.5, 2, 3, 1.5, 4, 5보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에 대한 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차의 비는 구간 R2 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T27보다 작거나 같고(임계값 T27은 예를 들어 임계값 T3보다 작거나 같을 수 있고, 임계값 T27은 예를 들어 5, 8, 10, 20보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차와 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 간의 차이의 절댓값은 임계값 T9보다 크고, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T28보다 크거나 같고(임계값 T28은 예를 들어 임계값 T4보다 크거나 같을 수 있고, 임계값 T28은 예를 들어 2, 3, 5, 8보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차와 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 간의 차이의 절댓값은 임계값 T9보다 크고, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T29보다 크거나 같고(임계값 T29은 예를 들어 임계값 T6보다 크거나 같을 수 있고, 임계값 T29은 예를 들어 2, 3, 9, 7보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차와 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 간의 차이의 절댓값은 임계값 T9보다 크고, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T30다 작거나 같고(임계값 T30은 예를 들어 임계값 T2보다 작거나 같을 수 있고, 임계값 T30은 예를 들어 0.5, 2, 3, 1.5, 4, 5보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차와 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 간의 차이의 절댓값은 임계값 T9보다 크고, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T31보다 작거나 같고(임계값 T31은 예를 들어 임계값 T3보다 작거나 같을 수 있고, 임계값 T31은 예를 들어 5, 8, 10, 20보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프에 대한 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프의 비는 구간 R3 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T32보다 크거나 같고(임계값 T32는 예를 들어 임계값 T4보다 크거나 같을 수 있고, 임계값 T32는 예를 들어 2, 3, 5, 8보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프에 대한 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프의 비는 구간 R3 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T33보다 크거나 같고(임계값 T33은 예를 들어 임계값 T6보다 크거나 같을 수 있고, 임계값 T33은 예를 들어 2, 3, 9, 7보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프에 대한 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프의 비는 구간 R3 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T34보다 작거나 같고(임계값 T34는 예를 들어 임계값 T2보다 작거나 같을 수 있고, 임계값 T34는 예를 들어 0.5, 2, 3, 1.5, 4, 5보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프에 대한 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프의 비는 구간 R3 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T35보다 작거나 같고(임계값 T35는 예를 들어 임계값 T3보다 작거나 같을 수 있고, 임계값 T35는 예를 들어 5, 8, 9.5, 10, 15, 20보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프와 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프 간의 차이의 절댓값은 임계값 T10보다 크고, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T36보다 크거나 같고(임계값 T36은 예를 들어 임계값 T4보다 크거나 같을 수 있고, 임계값 T36은 예를 들어 2, 3, 5, 8보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프와 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프 간의 차이의 절댓값은 임계값 T10보다 크고, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T37보다 크거나 같고(임계값 T37은 예를 들어 임계값 T6보다 크거나 같을 수 있고, 임계값 T13은 예를 들어 2, 3, 9, 7보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프와 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프 간의 차이의 절댓값은 임계값 T10보다 크고, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T38보다 작거나 같고(임계값 T38은 예를 들어 임계값 T2보다 작거나 같을 수 있고, 임계값 T38은 예를 들어 0.5, 2, 3, 1.5, 4, 5보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프와 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프 간의 차이의 절댓값은 임계값 T10보다 크고, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T39보다 작거나 같고(임계값 T39는 예를 들어 임계값 T3보다 작거나 같을 수 있고, 임계값 T39는 예를 들어 5, 8, 9.5, 10, 15, 20보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값은 임계값 T11보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T40보다 크거나 같고(임계값 T40은 예를 들어 임계값 T4보다 크거나 같을 수 있고, 임계값 T40은 예를 들어 2, 3, 5, 8보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값은 임계값 T11보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T41보다 크거나 같고(임계값 T41은 예를 들어 임계값 T6보다 크거나 같을 수 있고, 임계값 T41은 예를 들어 2, 3, 9, 7보다 크거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값은 임계값 T11보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T42보다 작거나 같고(임계값 T42는 예를 들어 임계값 T2보다 작거나 같을 수 있고, 임계값 T42는 예를 들어 0.5, 2, 3, 1.5, 4, 5보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값은 임계값 T11보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T43보다 작거나 같고(임계값 T43은 예를 들어 임계값 T3보다 작거나 같을 수 있고, 임계값 T43은 예를 들어 5, 8, 9.5, 10, 15, 20보다 작거나 같을 수도 있고 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비를 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비로 제산하는 몫은 임계값 T44보다 작고(임계값 T44의 값 범위는 예를 들어 1.5 내지 3일 수 있다), 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T45보다 작고(임계값 T45의 값 범위는 예를 들어 1 내지 3일 수 있다);
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비를 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비로 제산하는 몫은 임계값 T46보다 크고(임계값 T46의 값 범위는 예를 들어 1.5 내지 3일 수 있다), 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T47보다 크고(임계값 T47의 값 범위는 예를 들어 1 내지 3일 수 있다);
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비에서 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 감산하는 차는 임계값 T48보다 작고(임계값 T48의 값 범위는 예를 들어 -1 내지 3일 수 있다), 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T49보다 작고(임계값 T49의 값 범위는 예를 들어 1 내지 3일 수 있다);
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비에서 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 감산하는 차는 임계값 T50보다 크고(임계값 T50의 값 범위는 예를 들어 -1 내지 3일 수 있다), 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T51보다 크고(임계값 T51의 값 범위는 예를 들어 1 내지 3일 수 있다);
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차로 제산하는 몫은 임계값 T52보다 작고(임계값 T52의 값 범위는 예를 들어 1 내지 3일 수 있다), 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T53보다 작고(임계값 T53의 값 범위는 예를 들어 10, 20, 30, 또는 다른 값일 수 있다);
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차로 제산하는 몫은 임계값 T54보다 크고(임계값 T54의 값 범위는 예를 들어 1 내지 3일 수 있다), 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T55보다 크고(임계값 T55는 예를 들어, 10, 20, 30, 또는 다른 값일 수 있다);
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에서 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 감산하는 차는 임계값 T56보다 작고(임계값 T56의 값 범위는 예를 들어 -40 내지 40일 수 있다), 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T57보다 작고(임계값 T57은 예를 들어, 10, 20, 30, 또는 다른 값일 수 있다);
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에서 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 감산하는 차는 임계값 T58보다 크고(임계값 T58의 값 범위는 예를 들어 -40 내지 40일 수 있다), 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T59보다 크고(임계값 T59는 예를 들어, 10, 20, 30, 또는 다른 값일 수 있다);
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프를 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프로 제산하는 몫은 임계값 T60보다 작고(임계값 T60의 값 범위는 예를 들어 1 내지 3일 수 있다), 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T61보다 작고(임계값 T61은 10, 20, 30, 또는 다른 값일 수 있다);
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프를 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프로 제산하는 몫은 임계값 T62보다 크고(임계값 T62의 값 범위는 예를 들어 1 내지 3일 수 있다), 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T63보다 크고(임계값 T63은 10, 20, 30, 또는 다른 값일 수 있다);
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프에서 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프를 감산하는 차는 임계값 T64보다 작고(임계값 T64의 값 범위는 예를 들어 -40 내지 40일 수 있다), 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T65보다 작고(임계값 T65는 10, 20, 30, 또는 다른 값일 수 있다);
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프에서 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프를 감산하는 차는 임계값 T66보다 크고(임계값 T66의 값 범위는 예를 들어 -40 내지 40일 수 있다), 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T67보다 크고(임계값 T67은 10, 20, 30, 또는 다른 값일 수 있다);
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T68보다 작거나 같고(임계값 T68은 예를 들어 0.5, 1, 2, 3보다 작거나 같을 수도 있고, 다른 값일 수도 있다), 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T69보다 작거나 같고(임계값 T2는 예를 들어 1, 2, 3, 5보다 작거나 같을 수도 있고, 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감하는 차는 임계값 T70보다 작거나 같고(임계값 T70은 예를 들어 10, 20, 51, 100보다 작거나 같을 수도 있고, 다른 값일 수도 있다), 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T71보다 작거나 같고(임계값 T71은 예를 들어 1, 2, 3, 5보다 작거나 같을 수도 있고, 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T72보다 작거나 같고(임계값 T72는 0.5, 1.1, 2, 3보다 크거나 같을 수도 있고, 다른 값일 수도 있다), 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T73보다 작거나 같고(임계값 T73은 예를 들어 1, 2, 3, 5보다 작거나 같을 수도 있고, 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T74보다 작거나 같고(임계값 T74는 예를 들어 11, 20, 50, 101보다 크거나 같을 수도 있고, 다른 값일 수도 있다), 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T75보다 작거나 같고(임계값 T75는 예를 들어 1, 2, 3, 5보다 작거나 같을 수도 있고, 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T76보다 작거나 같고(임계값 T76은 예를 들어 0.5, 1, 2, 3보다 작거나 같을 수도 있고, 다른 값일 수도 있다), 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T77보다 작거나 같고(임계값 T77은 예를 들어 10, 20, 35보다 크거나 같을 수도 있고, 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T78보다 작거나 같고(임계값 T78은 예를 들어 10, 20, 51, 100보다 작거나 같을 수도 있고, 다른 값일 수도 있다), 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T79보다 작거나 같고(임계값 T79는 예를 들어 10, 20, 35보다 크거나 같을 수도 있고, 다른 값일 수도 있다);
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T80보다 작거나 같고(임계값 T80은 예를 들어 0.5, 1.1, 2, 3보다 크거나 같을 수도 있거나, 다른 값일 수도 있다), 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T81보다 작거나 같고(임계값 T81은 예를 들어 10, 20, 35보다 크거나 같을 수도 있고, 다른 값일 수도 있다); 또는
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T82보다 작거나 같고(임계값 T82는 예를 들어 0.5, 11, 20, 50, 101보다 크거나 같을 수도 있거나, 다른 값일 수도 있다), 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T83보다 작거나 같다(임계값 T83은 예를 들어 10, 20, 35보다 크거나 같을 수도 있고, 다른 값일 수도 있다)
는 조건 중 하나를 포함할 수 있다.
제1 파라미터 조건은 전술한 예에 제한되지 않으며, 복수의 다른 가능한 실행 방식은 전술한 예에 기초해서 확장될 수 있다는 것을 이해해야 한다.
예를 들어, 본 발명의 일부의 가능한 실행 방식에서, 제2 파라미터 조건은 다음의 조건:
현재 오디오 프레임의 코딩 레이트는 임계값 T1보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T2보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T3보다 크거나 같거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T4보다 작거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T5보다 작거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T6보다 작거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T7보다 작거나;
현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비는 구간 R1 내에 있지 않거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비와 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비 간의 차이의 절댓값은 임계값 T8보다 크거나;
현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에 대한 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차의 비는 구간 R2 내에 있지 않거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차와 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 간의 차이의 절댓값은 임계값 T9보다 크거나;
현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프에 대한 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프의 비는 구간 R3 내에 있지 않거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프와 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프 간의 차이의 절댓값은 임계값 T10보다 크거나; 또는
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값은 임계값 T11보다 작다는 조건 중 적어도 하나를 포함한다.
다른 예에서, 본 발명의 일부의 가능한 실시 방식에서, 제2 파라미터 조건은 다음의 조건:
현재 오디오 프레임의 코딩 레이트는 임계값 T1보다 크거나 같으며, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T12보다 작고;
현재 오디오 프레임의 코딩 레이트는 임계값 T1보다 크거나 같으며, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T13보다 작고;
현재 오디오 프레임의 코딩 레이트는 임계값 T1보다 크거나 같으며, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T14보다 크고;
현재 오디오 프레임의 코딩 레이트는 임계값 T1보다 크거나 같으며, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T15보다 크고;
현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비는 구간 R1 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T16보다 작고;
현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비는 구간 R1 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T17보다 작고;
현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비는 구간 R1 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T18보다 크고;
현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비는 구간 R1 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T19보다 크고;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비와 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비 간의 차이의 절댓값은 임계값 T8보다 크고, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T20보다 작고;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비와 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비 간의 차이의 절댓값은 임계값 T8보다 크고, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T21보다 작고;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비와 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비 간의 차이의 절댓값은 임계값 T8보다 크고, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T22보다 크고;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비와 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비 간의 차이의 절댓값은 임계값 T8보다 크고, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T23보다 크고;
현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에 대한 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차의 비는 구간 R2 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T24보다 작고;
현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에 대한 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차의 비는 구간 R2 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T25보다 작고;
현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에 대한 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차의 비는 구간 R2 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T26보다 크고;
현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에 대한 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차의 비는 구간 R2 내에 있지 않고, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T27보다 크고;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차와 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 간의 차이의 절댓값은 임계값 T9보다 크고, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T28보다 작고;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차와 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 간의 차이의 절댓값은 임계값 T9보다 크고, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T29보다 작고;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차와 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 간의 차이의 절댓값은 임계값 T9보다 크고, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T30보다 크고;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차와 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 간의 차이의 절댓값은 임계값 T9보다 크고, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T31보다 크고;
현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프에 대한 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프의 비는 구간 R3 내에 있고, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T32보다 작고;
현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프에 대한 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프의 비는 구간 R3 내에 있고, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T33보다 작고;
현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프에 대한 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프의 비는 구간 R3 내에 있고, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T34보다 크고;
현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프에 대한 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프의 비는 구간 R3 내에 있고, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T35보다 크고;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프와 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프 간의 차이의 절댓값은 임계값 T10보다 크고, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T36보다 작고;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프와 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프 간의 차이의 절댓값은 임계값 T10보다 크고, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T37보다 작고;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프와 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프 간의 차이의 절댓값은 임계값 T10보다 크고, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T38보다 크고;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프와 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프 간의 차이의 절댓값은 임계값 T10보다 크고, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T39보다 크고;
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값은 임계값 T11보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T40보다 작고;
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값은 임계값 T11보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T41보다 작고;
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값은 임계값 T11보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T42보다 크고;
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값은 임계값 T11보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T43보다 크고;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비를 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비로 제산하는 몫은 임계값 T44보다 작고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T45보다 크거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비를 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비로 제산하는 몫은 임계값 T46보다 크고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T47보다 작거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비에서 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 감산하는 차는 임계값 T48보다 작고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T49보다 크거나;
현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비에서 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 감산하는 차는 임계값 T50보다 크고, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T51보다 작거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차로 제산하는 몫은 임계값 T52보다 작고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T53보다 크거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차로 제산하는 몫은 임계값 T54보다 크고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T55보다 작거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에서 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 감산하는 차는 임계값 T56보다 작고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T57보다 크거나;
현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차에서 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차를 감산하는 차는 임계값 T58보다 크고, 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T59보다 작거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프를 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프로 제산하는 몫은 임계값 T60보다 작고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T61보다 크거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프를 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프로 제산하는 몫은 임계값 T62보다 크고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T63보다 작거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프에서 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프를 감산하는 차는 임계값 T64보다 작고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T65보다 크거나;
현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프에서 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프를 감산하는 차는 임계값 T66보다 크고, 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프는 임계값 T67보다 작거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T68보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T69보다 크거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T70보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T71보다 크거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T72보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T73보다 크거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T74보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비는 임계값 T75보다 크거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T76보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T77보다 크거나;
현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에서 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 감산하는 차는 임계값 T78보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T79보다 크거나;
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫은 임계값 T80보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T81보다 크거나; 또는
현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균에서 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 감산하는 차는 임계값 T82보다 작거나 같거나, 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차는 임계값 T83보다 크다는 조건 중 하나를 포함한다.
제2 파라미터 조건은 전술한 예에 제한되지 않으며, 복수의 다른 가능한 실행 방식은 전술한 예에 기초해서 확장될 수 있다는 것을 이해해야 한다.
제1 파라미터 조건 및 제2 파라미터 조건의 예는 모든 가능한 실시 방식은 아니라는 것을 이해해야 한다. 실제의 애플리케이션에서, 전술한 예는 제1 파라미터 조건 및 제2 파라미터 조건의 가능한 실행 방식을 광범위하게 확장할 수 있다.
본 발명의 실시예를 더 잘 이해하기 위해, 이하에서는 일부의 특정한 애플리케이션 시나리오를 참조하여 예시적으로 설명한다.
도 2를 참조하면, 도 2는 본 발명의 실시예에 따른 다른 실시예에 따른 다른 오디오 코딩 방법에 대한 개략적인 흐름이다. 도 2에 도시된 예에서, 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘은 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균에 기초해서 주로 결정된다.
도 2에 도시된 바와 같이, 본 발명의 다른 실시예에서 제공하는 다른 오디오 코딩 방법은 이하의 내용을 포함할 수 있다:
201: 현재 오디오 프레임의 시간-도메인 신호에 대해 시간-주파수 변환 프로세싱을 수행하여 현재 오디오 프레임의 스펙트럼 계수를 획득한다.
본 발명의 실시예에서 언급하는 오디오 프레임은 음성 프레임 또는 음악 프레임일 수 있다.
현재 오디오 프레임의 시간-도메인 신호의 대역폭이 16 kHz인 것으로 가정한다.
시간-주파수 변환 프로세싱은 고속 푸리에 변환(fast Fourier transform, FET로 약칭) 알고리즘, 변형 이산 코사인 변환(modified discrete cosine transform, MDCT로 약칭) 알고리즘, 또는 다른 시간-주파수 변환 알고리즘을 사용함으로써 현재 오디오 프레임의 시간-도메인 신호에 대해 수행되어, 현재 오디오 프레임의 스펙트럼 계수를 획득한다.
202: 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 획득한다.
203: 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫이 임계값 T4보다 크거나 같은지를 판정한다.
예이면, 단계 204가 수행되고, 아니오이면, 단계 205가 수행된다.
임계값 T4는 0.5보다 크거나 같을 수 있고, 임계값 T4는 예를 들어 0.5, 1, 1.5, 2, 3이거나, 다른 값이다.
예를 들어, 서브밴드 i의 주파수 빈 범위는 3.2 kHz 내지 6.4 kHz, 3.2 kHz 내지 4.8 kHz, 4.8 kHz 내지 6.4 kHz, 또는 0.4 kHz 내지 6.4 kHz일 수 있다.
예를 들어, 서브밴드 j의 주파수 빈 범위는 6.4 kHz 내지 9.6 kHz, 6.4 kHz 내지 8 kHz, 8 kHz 내지 9.6 kHz, 또는 4.8 kHz 내지 9.6 kHz일 수 있다.
204: TCX 알고리즘에 기초해서 현재 오디오 프레임의 스펙트럼 계수를 코딩한다.
205: HQ 알고리즘에 기초해서 현재 오디오 프레임의 스펙트럼 계수를 코딩한다.
알 수 있는 바와 같이, 본 발명의 일부의 실시예에서의 기술적 솔루션에서, 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘은 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균이 획득된 후, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 획득된 에너지 평균 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 획득된 에너지 평균에 기초해서 TCX 알고리즘 또는 HQ 알고리즘이 선택되어, 현재 오디오 프레임의 스펙트럼 계수를 코딩한다. 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균과 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균 간의 관계는 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘과 관련 있으며, 이것은 코딩 알고리즘과 현재 오디오 프레임의 참조 코딩 파라미터 간의 적응성과 적합성을 높이는 데 일조하며, 현재 오디오 프레임의 코딩 품질 또는 코딩 효율을 높이는 데도 일조한다.
도 3을 참조하면, 도 3은 본 발명의 실시예에 따른 다른 실시예에 따른 다른 오디오 코딩 방법에 대한 개략적인 흐름이다. 도 3에 도시된 예에서, 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘은 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균, 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균, 및 현재 오디오 프레임의, 서브밴드 z에 위치하는 스펙트럼 계수의 피크대평균비에 기초해서 주로 결정된다.
도 3에 도시된 바와 같이, 본 발명의 다른 실시예에서 제공하는 다른 오디오 코딩 방법은 이하의 내용을 포함할 수 있다:
301: 현재 오디오 프레임의 시간-도메인 신호에 대해 시간-주파수 변환 프로세싱을 수행하여 현재 오디오 프레임의 스펙트럼 계수를 획득한다.
본 발명의 실시예에서 언급하는 오디오 프레임은 음성 프레임 또는 음악 프레임일 수 있다.
현재 오디오 프레임의 시간-도메인 신호의 대역폭이 16 kHz인 것으로 가정한다.
302: 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 획득한다.
303: 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫이 임계값 T68보다 크거나 같은지를 판정한다.
아니오이면, 단계 304가 수행되고, 예이면, 단계 306이 수행된다.
임계값 T68은 임계값 T4보다 크거나 같다. 예를 들어, 임계값 T68은 0.6보다 크거나 같을 수 있고, 임계값 T68은 예를 들어 0.8, 0.6, 1, 1.5, 2, 3, 5이거나, 또는 다른 값이다.
예를 들어, 서브밴드 i의 주파수 빈 범위는 3.2 kHz 내지 6.4 kHz, 3.2 kHz 내지 4.8 kHz, 4.8 kHz 내지 6.4 kHz, 또는 0.4 kHz 내지 6.4 kHz일 수 있다.
예를 들어, 서브밴드 j의 주파수 빈 범위는 6.4 kHz 내지 9.6 kHz, 6.4 kHz 내지 8 kHz, 8 kHz 내지 9.6 kHz, 또는 4.8 kHz 내지 9.6 kHz일 수 있다.
304: 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비를 획득한다.
305: 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비가 임계값 T69보다 큰지를 판정한다.
예이면, 단계 307이 수행되고, 아니오이면, 단계 306이 수행된다.
임계값 T69는 1보다 크거나 같을 수 있으며, 임계값 T69는 예를 들어 1, 1.1, 1.5, 2, 3.5, 6, 4.6이거나, 또는 다른 값이다.
예를 들어, 서브밴드 z의 최고 주파수 빈의 값 범위는 12 kHz 내지 16 kHz일 수 있고, 서브밴드 z의 최저 주파수 빈의 값 범위는 8 kHz 내지 14 kHz일 수 있다. 구체적으로, 예를 들어, 서브밴드 z의 주파수 빈 범위는 8 kHz 내지 12 kHz, 9 kHz 내지 11 kHz, 또는 8 kHz 내지 9.6 kHz일 수 있다.
306: TCX 알고리즘에 기초해서 현재 오디오 프레임의 스펙트럼 계수를 코딩한다.
307: HQ 알고리즘에 기초해서 현재 오디오 프레임의 스펙트럼 계수를 코딩한다.
알 수 있는 바와 같이, 본 발명의 일부의 실시예에서의 기술적 솔루션에서, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균, 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균, 및 현재 오디오 프레임의, 서브밴드 z에 위치하는 스펙트럼 계수의 피크대평균비에 기초해서 TCX 알고리즘 또는 HQ 알고리즘이 선택되어, 현재 오디오 프레임의 스펙트럼 계수를 코딩한다. 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균과, 현재 오디오 프레임의, 서브밴드 z에 위치하는 스펙트럼 계수의 피크대평균비 간의 관계는 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘과 관련 있으며, 이것은 코딩 알고리즘과 현재 오디오 프레임의 참조 코딩 파라미터 간의 적응성과 적합성을 높이는 데 일조하며, 현재 오디오 프레임의 코딩 품질 또는 코딩 효율을 높이는 데도 일조한다.
도 4를 참조하면, 도 4는 본 발명의 실시예에 따른 다른 실시예에 따른 다른 오디오 코딩 방법에 대한 개략적인 흐름이다. 도 4에 도시된 예에서, 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘은 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비 및 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 기초해서 주로 결정된다.
도 4에 도시된 바와 같이, 본 발명의 다른 실시예에서 제공하는 다른 오디오 코딩 방법은 이하의 내용을 포함할 수 있다:
401: 현재 오디오 프레임의 시간-도메인 신호에 대해 시간-주파수 변환 프로세싱을 수행하여 현재 오디오 프레임의 스펙트럼 계수를 획득한다.
본 발명의 실시예에서 언급하는 오디오 프레임은 음성 프레임 또는 음악 프레임일 수 있다.
현재 오디오 프레임의 시간-도메인 신호의 대역폭이 16 kHz인 것으로 가정한다.
402: 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비 및 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 획득한다.
403: 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비가 구간 R1 내에 있는지를 판정한다.
예이면, 단계 404가 수행되고, 아니오이면, 단계 405가 수행된다.
구간 R1은 예를 들어 [0.5, 2], [0.8, 1.25], [0.4, 2.5], 또는 다른 범위일 수 있다.
예를 들어, 서브밴드 x의 주파수 빈 범위는 0 kHz 내지 1.6 kHz, 1 kHz 내지 2.6 kHz, 또는 1.6 kHz 내지 3.2 kHz일 수 있고, 서브밴드 y의 주파수 빈 범위는 6.4 kHz 내지 8 kHz, 7.4 kHz 내지 9 kHz, 또는 4.8 kHz 내지 6.4 kHz일 수 있다.
404: TCX 알고리즘에 기초해서 현재 오디오 프레임의 스펙트럼 계수를 코딩한다.
405: HQ 알고리즘에 기초해서 현재 오디오 프레임의 스펙트럼 계수를 코딩한다.
알 수 있는 바와 같이, 본 발명의 일부의 실시예에서의 기술적 솔루션에서, 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비 및 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 기초해서 TCX 알고리즘 또는 HQ 알고리즘이 선택되어, 현재 오디오 프레임의 스펙트럼 계수를 코딩한다. 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비 및 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘과 관련 있으며, 이것은 코딩 알고리즘과 현재 오디오 프레임의 참조 코딩 파라미터 간의 적응성과 적합성을 높이는 데 일조하며, 현재 오디오 프레임의 코딩 품질 또는 코딩 효율을 높이는 데도 일조한다.
도 5를 참조하면, 도 5는 본 발명의 실시예에 따른 다른 실시예에 따른 다른 오디오 코딩 방법에 대한 개략적인 흐름이다. 도 5에 도시된 예에서, 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘은 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비 및 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 기초해서 주로 결정된다.
도 5에 도시된 바와 같이, 본 발명의 다른 실시예에서 제공하는 다른 오디오 코딩 방법은 이하의 내용을 포함할 수 있다:
501: 현재 오디오 프레임의 시간-도메인 신호에 대해 시간-주파수 변환 프로세싱을 수행하여 현재 오디오 프레임의 스펙트럼 계수를 획득한다.
본 발명의 실시예에서 언급하는 오디오 프레임은 음성 프레임 또는 음악 프레임일 수 있다.
현재 오디오 프레임의 시간-도메인 신호의 대역폭이 16 kHz인 것으로 가정한다.
502: 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비 및 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 획득한다.
503: 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비로 제산하는 몫이 임계값 T46보다 크거나 같은지를 판정한다.
예이면, 단계 504가 수행되고, 아니오이면, 단계 505가 수행된다.
임계값 T46은 0.5보다 크거나 같을 수 있고, 임계값 T4는 예를 들어 0.5, 1, 1.5, 2, 3, 또는 다른 값이다.
예를 들어, 서브밴드 x의 주파수 빈 범위는 0 kHz 내지 1.6 kHz, 1 kHz 내지 2.6 kHz, 또는 1.6 kHz 내지 3.2 kHz일 수 있고, 서브밴드 y의 주파수 빈 범위는 6.4 kHz 내지 8 kHz, 7.4 kHz 내지 9 kHz, 또는 4.8 kHz 내지 6.4 kHz일 수 있다.
504: 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비가 임계값 T47보다 크거나 같은지를 판정한다.
예이면, 단계 506이 수행되고, 아니오이면, 단계 507이 수행된다.
505: 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비가 임계값 T47보다 작은지를 판정한다.
예이면, 단계 506이 수행되고, 아니오이면, 단계 507이 수행된다.
506: TCX 알고리즘에 기초해서 현재 오디오 프레임의 스펙트럼 계수를 코딩한다.
507: HQ 알고리즘에 기초해서 현재 오디오 프레임의 스펙트럼 계수를 코딩한다.
알 수 있는 바와 같이, 본 발명의 일부의 실시예에서의 기술적 솔루션에서, 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비 및 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 기초해서 TCX 알고리즘 또는 HQ 알고리즘이 선택되어, 현재 오디오 프레임의 스펙트럼 계수를 코딩한다. 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비 및 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비는 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘과 관련 있으며, 이것은 코딩 알고리즘과 현재 오디오 프레임의 참조 코딩 파라미터 간의 적응성과 적합성을 높이는 데 일조하며, 현재 오디오 프레임의 코딩 품질 또는 코딩 효율을 높이는 데도 일조한다.
도 6을 참조하면, 도 6은 본 발명의 실시예에 따른 다른 실시예에 따른 다른 오디오 코딩 방법에 대한 개략적인 흐름이다. 도 6에 도시된 예에서, 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘은 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균, 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균에 기초해서 주로 결정된다.
도 6에 도시된 바와 같이, 본 발명의 다른 실시예에서 제공하는 다른 오디오 코딩 방법은 이하의 내용을 포함할 수 있다:
601: 현재 오디오 프레임의 시간-도메인 신호에 대해 시간-주파수 변환 프로세싱을 수행하여 현재 오디오 프레임의 스펙트럼 계수를 획득한다.
본 발명의 실시예에서 언급하는 오디오 프레임은 음성 프레임 또는 음악 프레임일 수 있다.
현재 오디오 프레임의 시간-도메인 신호의 대역폭이 16 kHz인 것으로 가정한다.
602: 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비 및 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비를 획득한다.
603: 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비에 대한 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비의 비가 구간 R1 내에 있는지를 판정한다.
아니오이면, 단계 604를 수행하고, 예이면, 단계 606이 수행된다.
구간 R1은 예를 들어 [0.5, 2], [0.8, 1.25], [0.4, 2.5], 또는 다른 범위일 수 있다.
예를 들어, 서브밴드 x의 주파수 빈 범위는 0 kHz 내지 1.6 kHz, 1 kHz 내지 2.6 kHz, 또는 1.6 kHz 내지 3.2 kHz일 수 있고, 서브밴드 y의 주파수 빈 범위는 6.4 kHz 내지 8 kHz, 7.4 kHz 내지 9 kHz, 또는 4.8 kHz 내지 6.4 kHz일 수 있다.
604: 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 획득한다.
605: 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫이 임계값 T16보다 크거나 같은지를 판정한다.
예이면, 단계 606이 수행되고, 아니오이면, 단계 607이 수행된다.
서브밴드 i의 주파수 빈 번역은 예를 들어 0 kHz 내지 1.6 kHz 또는 1 kHz 내지 2.6 kHz일 수 있고, 서브밴드 j의 주파수 빈 번역은 예를 들어 6.4 kHz 내지 8 kHz, 4.8 kHz 내지 6.4 kHz, 또는 7.4 kHz 내지 9 kHz일 수 있다.
임계값 T16은 임계값 T4보다 크다. 예를 들어, 임계값 T16은 2보다 크거나 같을 수 있고, 임계값 T16은 예를 들어 2, 2.5, 3, 3.5, 5, 5.1, 또는 다른 값이다.
606: TCX 알고리즘에 기초해서 현재 오디오 프레임의 스펙트럼 계수를 획득한다.
607: HQ 알고리즘에 기초해서 현재 오디오 프레임의 스펙트럼 계수를 획득한다.
알 수 있는 바와 같이, 본 발명의 일부의 실시예에서의 기술적 솔루션에서, 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균, 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균에 기초해서 TCX 알고리즘 또는 HQ 알고리즘이 선택되어, 현재 오디오 프레임의 스펙트럼 계수를 코딩한다. 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비, 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균, 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균은 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘과 관련 있으며, 이것은 코딩 알고리즘과 현재 오디오 프레임의 참조 코딩 파라미터 간의 적응성과 적합성을 높이는 데 일조하며, 현재 오디오 프레임의 코딩 품질 또는 코딩 효율을 높이는 데도 일조한다.
도 7을 참조하면, 도 7은 본 발명의 실시예에 따른 다른 실시예에 따른 다른 오디오 코딩 방법에 대한 개략적인 흐름이다. 도 7에 도시된 예에서, 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘은 현재 오디오 프레임의 코딩 레이트, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균, 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균에 기초해서 주로 결정된다.
도 7에 도시된 바와 같이, 본 발명의 다른 실시예에서 제공하는 다른 오디오 코딩 방법은 이하의 내용을 포함할 수 있다:
701: 현재 오디오 프레임의 시간-도메인 신호에 대해 시간-주파수 변환 프로세싱을 수행하여 현재 오디오 프레임의 스펙트럼 계수를 획득한다.
본 발명의 실시예에서 언급하는 오디오 프레임은 음성 프레임 또는 음악 프레임일 수 있다.
현재 오디오 프레임의 시간-도메인 신호의 대역폭이 16 kHz인 것으로 가정한다.
702: 현재 오디오 프레임의 코딩 레이트가 임계값 T1보다 크거나 같은지를 판정한다.
예이면, 단계 703이 수행되고, 아니오이면, 단계 705가 수행된다.
임계값 T1은 예를 들어 24.4 kbps보다 크거나 같다. 예를 들어, 임계값 T1은 24.4 kbps, 32 kbps, 64 kbps, 또는 다른 레이트이다.
703: 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균을 획득한다.
704: 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균을 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균으로 제산하는 몫은 임계값 T4보다 크거나 같은지를 판정한다.
예이면, 단계 705가 수행되고, 아니오이면, 단계 706이 수행된다.
서브밴드 i의 주파수 빈 번역은 예를 들어 0 kHz 내지 1.6 kHz 또는 1 kHz 내지 2.6 kHz일 수 있고, 서브밴드 j의 주파수 빈 번역은 예를 들어 6.4 kHz 내지 8 kHz, 4.8 kHz 내지 6.4 kHz, 또는 7.4 kHz 내지 9 kHz일 수 있다.
임계값 T12는 임계값 T4보다 클 수 있다. 예를 들어, 임계값 T12는 2보다 크거나 같을 수 있고, 임계값 T2는 예를 들어 2, 2.5, 3, 3.5, 5, 5.2, 또는 다른 값이다.
705: TCX 알고리즘에 기초해서 현재 오디오 프레임의 스펙트럼 계수를 코딩한다.
706: HQ 알고리즘에 기초해서 현재 오디오 프레임의 스펙트럼 계수를 코딩한다.
알 수 있는 바와 같이, 본 발명의 일부의 실시예에서의 기술적 솔루션에서, 현재 오디오 프레임의 코딩 레이트, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균, 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균에 기초해서 TCX 알고리즘 또는 HQ 알고리즘이 선택되어, 현재 오디오 프레임의 스펙트럼 계수를 코딩한다. 현재 오디오 프레임의 코딩 레이트, 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균, 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균은 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘과 관련 있으며, 이것은 코딩 알고리즘과 현재 오디오 프레임의 참조 코딩 파라미터 간의 적응성과 적합성을 높이는 데 일조하며, 현재 오디오 프레임의 코딩 품질 또는 코딩 효율을 높이는 데도 일조한다.
도 8을 참조하면, 도 8은 본 발명의 실시예에 따른 다른 실시예에 따른 다른 오디오 코딩 방법에 대한 개략적인 흐름이다. 도 2에 도시된 예에서, 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘은 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균 및 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균에 기초해서 주로 결정된다.
도 8에 도시된 바와 같이, 본 발명의 다른 실시예에서 제공하는 다른 오디오 코딩 방법은 이하의 내용을 포함할 수 있다:
801: 현재 오디오 프레임의 시간-도메인 신호에 대해 시간-주파수 변환 프로세싱을 수행하여 현재 오디오 프레임의 스펙트럼 계수를 획득한다.
본 발명의 실시예에서 언급하는 오디오 프레임은 음성 프레임 또는 음악 프레임일 수 있다.
현재 오디오 프레임의 시간-도메인 신호의 대역폭이 16 kHz인 것으로 가정한다.
802: 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균 및 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균을 획득한다.
803: 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균을 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균으로 제산하는 몫이 임계값 T6보다 크거나 같은지를 판정한다.
예이면, 단계 804가 수행되고, 아니오이면, 단계 805가 수행된다.
임계값 T6은 0.3보다 크거나 같을 수 있고, 임계값 T6은 예를 들어 0.5, 1, 1.5, 2, 3.2, 또는 다른 값이다.
예를 들어, 서브밴드 m의 주파수 빈 범위는 3.2 kHz 내지 6.4 kHz, 3.2 kHz 내지 4.8 kHz, 4.8 kHz 내지 6.4 kHz, 또는 0.4 kHz 내지 6.4 kHz일 수 있다.
예를 들어, 서브밴드 n의 주파수 빈 범위는 6.4 kHz 내지 9.6 kHz, 6.4 kHz 내지 8 kHz, 8 kHz 내지 9.6 kHz, 또는 4.8 kHz 내지 9.6 kHz일 수 있다.
804: TCX 알고리즘에 기초해서 현재 오디오 프레임의 스펙트럼 계수를 코딩한다.
805: HQ 알고리즘에 기초해서 현재 오디오 프레임의 스펙트럼 계수를 코딩한다.
알 수 있는 바와 같이, 본 발명의 일부의 실시예에서의 기술적 솔루션에서, 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균 및 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균에 기초해서 TCX 알고리즘 또는 HQ 알고리즘이 선택되어, 현재 오디오 프레임의 스펙트럼 계수를 코딩한다. 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균 및 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균과, 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비 간의 관계는 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘과 관련 있으며, 이것은 코딩 알고리즘과 현재 오디오 프레임의 참조 코딩 파라미터 간의 적응성과 적합성을 높이는 데 일조하며, 현재 오디오 프레임의 코딩 품질 또는 코딩 효율을 높이는 데도 일조한다.
도 2 내지 도 8에서의 예시적 실행 방식은 단지 본 발명의 일부의 실행 방식에 불과하다는 것을 이해해야 한다. 실제의 애플리케이션에서는 복수의 다른 가능한 실행 방식이 도 1에 대응하는 실시예에서의 관련 예시 설명에 기초해서 확장될 수 있다.
일부의 시나리오에서, 서브밴드의 선택 동안 이하가 고려될 수 있다.
2개의 서브밴드 내에 위치하는 스펙트럼 계수의 속성 파라미터 간의 유사성이 계산될 때, 2개의 일치된 서브밴드가 선택될 수 있는데, 예를 들어, 2개의 서브밴드는 0 kHz 내지 1.6 kHz 및 6.4 kHz 내지 8 kHz이다. 일부의 시나리오에서, 0 내지 1 kHz에서의 스펙트럼 계수의 속성은 1 내지 16 kHz에서의 스펙트럼 계수의 속성과는 크게 다르기 때문에, 스펙트럼 계수의 속성 파라미터 간의 유사성이 계산될 때 0 내지 1 kHz의 스펙트럼은 선택되지 않는다. 예를 들어, 0 내지 1.6 kHz 내의 스펙트럼 계수를 대체하도록 1 kHz 내지 2.6 kHz 내의 스펙트럼 계수가 선택되어, 저주파 스펙트럼 계수의 속성 파라미터를 계산한다. 이 경우, 1 kHz 내지 2.6 kHz 내의 저주파 스펙트럼 계수가 고주파로 복사되면, 대응하는 스펙트럼 계수는 7.4 kHz 내지 9 kHz 내의 고주파 스펙트럼 계수이다. 고주파 스펙트럼 계수의 속성 파라미터가 계산될 때, 7.4 kHz 내지 9 kHz 내의 스펙트럼 계수가 스펙트럼 속성의 계산에 더 적절하다. 그렇지만, 일부의 시나리오에서는, 0 kHz 내지 6.4 kHz 내의 스펙트럼 계수의 분해능이 매우 높을 수 있으며, 0 kHz 내지 6.4 kHz 내의 스펙트럼 계수가 속성 파라미터의 계산에 적합하다. 6.4 kHz 내지 16 kHz 내의 스펙트럼 계수의 분해능이 상대적으로 낮으면, 6.4 kHz 내지 16 kHz 내의 스펙트럼 계수는 스펙트럼 계수의 속성 파라미터의 계산에 부적절할 수 있다. 그러므로 고주파 스펙트럼 계수의 속성 파라미터를 계산할 때, 4.8 kHz 내지 6.4 kHz 내의 스펙트럼 계수가 속성 파라미터를 계산하는 데 선택될 수 있고, 그 속성 파라미터는 고주파 속성 파라미터로서 사용된다.
변환 코딩 여기 알고리즘에 기초해서 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 단계는 구체적으로: 스펙트럼 계수를 N개의 서브밴드로 분할하는 단계; 각각의 서브밴드의 엔벨로프를 계산 및 양자화하는 단계; 양자화된 엔벨로프 값 및 이용 가능한 비트 수에 따라 각각의 서브밴드에 비트 할당을 수행하는 단계; 서브밴드에 할당된 비트 수에 따라 각각의 서브밴드의 스펙트럼 계수를 양자화하는 단계; 및 양자화된 스펙트럼 계수 및 스펙트럼 엔벨로프의 인덱스 값을 비트스트림에 기록하는 단계를 포함할 수 있다.
이하에서는 전술한 솔루션을 실행하도록 구성된 관련 장치를 추가로 제공한다.
도 9를 참조하면, 본 발명의 실시예는 오디오 코더(900)를 추가로 제공한다. 오디오 코더(900)는 시간-주파수 변환 유닛(910), 획득 유닛(920), 및 코딩 유닛(930)을 포함할 수 있다.
시간-주파수 변환 유닛(910)은 현재 오디오 프레임의 시간-도메인 신호에 대해 시간-주파수 변환 프로세싱을 수행하여 현재 오디오 프레임의 스펙트럼 계수를 획득하도록 구성되어 있다.
획득 유닛(920)은 상기 현재 오디오 프레임의 참조 코딩 파라미터를 획득하도록 구성되어 있다.
코딩 유닛(930)은 획득 유닛(920)에 의해 획득되는 현재 오디오 프레임의 참조 코딩 파라미터가 제1 파라미터 조건을 만족하면, 변환 코딩 여기 알고리즘에 기초하여 상기 현재 오디오 프레임의 스펙트럼 계수를 코딩하거나, 상기 획득 유닛에 의해 획득되는 현재 오디오 프레임의 참조 코딩 파라미터가 제2 파라미터 조건을 만족하면, 고품질 변환 코딩 알고리즘에 기초하여 상기 현재 오디오 프레임의 스펙트럼 계수를 코딩하도록 구성되어 있다.
애플리케이션 시나리오의 요건에 따라, 획득 유닛에 의해 획득되는 현재 오디오 프레임의 참조 코딩 파라미터는 변할 수 있다.
예를 들어, 참조 코딩 파라미터는 다음의 파라미터: 현재 오디오 프레임의 코딩 레이트; 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비; 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차; 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균; 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균 및 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균; 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비 및 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비; 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 및 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차; 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프 및 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프; 또는 현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값 중 적어도 하나를 포함한다.
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값이 클수록 서브밴드 p 내에 위치하는 스펙트럼 계수와 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계가 더 강하다. 스펙트럼 상관관계의 파라미터 값은 예를 들어 정규화된 교차 상관관계 파라미터 값일 수 있다.
서브밴드의 주파수 빈 범위는 실제의 필요에 따라 결정될 수 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 서브밴드 z의 최고 주파수 빈은 임계 주파수 빈 F1보다 클 수 있고, 서브밴드 w의 최고 주파수 빈은 임계 주파수 빈 F1보다 클 수 있다. 임계 주파수 빈 F1의 값 범위는 예를 들어, 6.4 kHz 내지 12 kHz일 수 있다. 예를 들어, 임계 주파수 빈 F1의 값은 6.4 kHz, 8 kHz, 9 kHz, 10 kHz, 또는 12 kHz일 수 있다. 당연히, 임계 주파수 빈 F1은 다른 값일 수도 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 서브밴드 j의 최고 주파수 빈은 임계 주파수 빈 F2보다 클 수 있고, 서브밴드 n의 최고 주파수 빈은 임계 주파수 빈 F2보다 크다. 예를 들어, 임계 주파수 빈 F2의 값 범위는 4.8 kHz 내지 8 kHz일 수 있다. 구체적으로, 예를 들어, 임계 주파수 빈 F2의 값은 6.4 kHz, 4.8 kHz, 6 kHz, 8 kHz, 5 kHz, 또는 7 kHz일 수 있다. 당연히, 임계 주파수 빈 F2는 다른 값일 수도 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 서브밴드 i의 최고 주파수 빈은 서브밴드 j의 최고 주파수 빈보다 작을 수 있고; 서브밴드 m의 최고 주파수 빈은 서브밴드 n의 최고 주파수 빈보다 작을 수 있고; 서브밴드 x의 최고 주파수 빈은 서브밴드 y의 최저 주파수 빈보다 작거나 같을 수 있고; 서브밴드 p의 최고 주파수 빈은 서브밴드 q의 최저 주파수 빈보다 작거나 같을 수 있고; 서브밴드 r의 최고 주파수 빈은 서브밴드 s의 최저 주파수 빈보다 작거나 같을 수 있고; 그리고 서브밴드 e의 최고 주파수 빈은 서브밴드 f의 최저 주파수 빈보다 작거나 같을 수 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 다음의 조건:
서브밴드 w의 최저 주파수 빈은 임계 주파수 빈 F1보다 크거나 같을 수 있고, 서브밴드 z의 최저 주파수 빈은 임계 주파수 빈 F1보다 크거나 같을 수 있고, 서브밴드 i의 최고 주파수 빈은 서브밴드 j의 최저 주파수 빈보다 작거나 같을 수 있고, 서브밴드 m의 최고 주파수 빈은 서브밴드 n의 최저 주파수 빈보다 작거나 같을 수 있고, 서브밴드 j의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있거나, 또는 서브밴드 n의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있고, 서브밴드 i의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 서브밴드 m의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 서브밴드 j의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있거나, 또는 서브밴드 n의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있다는 조건 중 적어도 하나를 만족할 수 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 다음의 조건: 서브밴드 e의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 서브밴드 x의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 서브밴드 p의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있거나, 또는 서브밴드 r의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있다는 조건 중 하나를 만족할 수 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 서브밴드 f의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 당연히, 서브밴드 f의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있다. 서브밴드 q의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 당연히, 서브밴드 q의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있다. 서브밴드 s의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 당연히, 서브밴드 s의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있다.
예를 들어, 서브밴드 z의 최고 주파수 빈의 값 범위는 12 kHz 내지 16 kHz일 수 있다. 서브밴드 z의 최저 주파수 빈의 값 범위는 8 kHz 내지 14 kHz일 수 있다. 서브밴드 z의 대역폭의 값 범위는 1.6 kHz 내지 8 kHz일 수 있다. 구체적으로, 예를 들어, 서브밴드 z의 주파수 빈 범위는 8 kHz 내지 12 kHz, 9 kHz 내지 11 kHz, 8 kHz 내지 9.6 kHz, 또는 12 kHz 내지 14 kHz일 수 있다. 당연히, 서브밴드 z의 주파수 빈 범위는 전술한 예에 제한되지 않는다.
예를 들어, 서브밴드 w의 주파수 빈 범위는 실제의 필요에 따라 결정될 수 있다. 예를 들어, 서브밴드 w의 최고 주파수 빈의 값 범위는 12 kHz 내지 16 kHz일 수 있고, 서브밴드 w의 최저 주파수 빈의 값 범위는 8 kHz 내지 14 kHz일 수 있다. 구체적으로, 예를 들어, 서브밴드 w의 주파수 빈 범위는 8 kHz 내지 12 kHz, 9 kHz 내지 11 kHz, 8 kHz 내지 9.6 kHz, 12 kHz 내지 14 kHz, 또는 12.2 kHz 내지 14.5 kHz일 수 있다. 당연히, 서브밴드 w의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 w의 주파수 빈 범위는 서브밴드 z의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 i의 주파수 빈 범위는 3.2 kHz 내지 6.4 kHz, 3.2 kHz 내지 4.8 kHz, 4.8 kHz 내지 6.4 kHz, 0.4 kHz 내지 6.4 kHz, 또는 0.4 kHz 내지 3.6 kHz일 수 있다. 당연히, 서브밴드 i의 주파수 빈 범위는 전술한 예에 제한되지 않는다.
예를 들어, 서브밴드 j의 주파수 빈 범위는 6.4 kHz 내지 9.6 kHz, 6.4 kHz 내지 8 kHz, 8 kHz 내지 9.6 kHz, 4.8 kHz 내지 9.6 kHz, 또는 4.8 kHz 내지 8 kHz일 수 있다. 당연히, 서브밴드 j의 주파수 빈 범위는 전술한 예에 제한되지 않는다.
예를 들어, 서브밴드 m의 주파수 빈 범위는 3.2 kHz 내지 6.4 kHz, 3.2 kHz 내지 4.8 kHz, 4.8 kHz 내지 6.4 kHz, 0.4 kHz 내지 6.4 kHz, 또는 0.4 kHz 내지 3.6 kHz일 수 있다. 당연히, 서브밴드 m의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 m의 주파수 빈 범위는 서브밴드 i의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 n의 주파수 빈 범위는 6.4 kHz 내지 9.6 kHz, 6.4 kHz 내지 8 kHz, 8 kHz 내지 9.6 kHz, 4.8 kHz 내지 9.6 kHz, 또는 4.8 kHz 내지 8 kHz일 수 있다. 당연히, 서브밴드 n의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 n의 주파수 빈 범위는 서브밴드 j의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 x의 주파수 빈 범위는 0 kHz 내지 1.6 kHz, 1 kHz 내지 2.6 kHz, 1.6 kHz 내지 3.2 kHz, 2 kHz 내지 3.2 kHz, 또는 2.5 kHz 내지 3.4 kHz일 수 있다. 당연히, 서브밴드 x의 주파수 빈 범위는 전술한 예에 제한되지 않는다.
예를 들어, 서브밴드 y의 주파수 빈 범위는 6.4 kHz 내지 8 kHz, 7.4 kHz 내지 9 kHz, 4.8 kHz 내지 6.4 kHz, 4.4 kHz 내지 6.4 kHz, 또는 4.5 kHz 내지 6.2 kHz일 수 있다. 당연히, 서브밴드 y의 주파수 빈 범위는 전술한 예에 제한되지 않는다.
예를 들어, 서브밴드 p의 주파수 빈 범위는 0 kHz 내지 1.6 kHz, 1 kHz 내지 2.6 kHz, 1.6 kHz 내지 3.2 kHz, 2.1 kHz 내지 3.2 kHz, 또는 2.5 kHz 내지 3.5 kHz일 수 있다. 당연히, 서브밴드 p의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 p의 주파수 빈 범위는 서브밴드 x의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 q의 주파수 빈 범위는 6.4 kHz 내지 8 kHz, 7.4 kHz 내지 9 kHz, 4.8 kHz 내지 6.4 kHz, 4.2 kHz 내지 6.4 kHz, 또는 4.7 kHz 내지 6.2 kHz일 수 있다. 당연히, 서브밴드 q의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 q의 주파수 빈 범위는 서브밴드 y의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 r의 주파수 빈 범위는 0 kHz 내지 1.6 kHz, 1 kHz 내지 2.6 kHz, 1.6 kHz 내지 3.2 kHz, 2.05 kHz 내지 3.27 kHz, 또는 2.59 kHz 내지 3.51 kHz일 수 있다. 당연히, 서브밴드 r의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 r의 주파수 빈 범위는 서브밴드 x의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 s의 주파수 빈 범위는 6.4 kHz 내지 8 kHz, 7.4 kHz 내지 9 kHz, 4.8 kHz 내지 6.4 kHz, 5.4 kHz 내지 7.1 kHz, 또는 4.55 kHz 내지 6.29 kHz일 수 있다. 당연히, 서브밴드 s의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 s의 주파수 빈 범위는 서브밴드 y의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 e의 주파수 빈 범위는 0 kHz 내지 1.6 kHz, 1 kHz 내지 2.6 kHz, 1.6 kHz 내지 3.2 kHz, 0.8 kHz 내지 3 kHz, 또는 1.9 kHz 내지 3.8 kHz일 수 있다. 당연히, 서브밴드 e의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 e의 주파수 빈 범위는 서브밴드 x의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 f의 주파수 빈 범위는 6.4 kHz 내지 8 kHz, 7.4 kHz 내지 9 kHz, 4.8 kHz 내지 6.4 kHz, 5.3 kHz 내지 7.15 kHz, 또는 4.58 kHz 내지 6.52 kHz일 수 있다. 당연히, 서브밴드 f의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 f의 주파수 빈 범위는 서브밴드 y의 주파수 빈 범위와 같거나 유사할 수 있다.
제1 파라미터 조건 및 제2 파라미터 조건은 변할 수 있다.
예를 들어, 본 발명의 일부의 가능한 실행 방식에서, 이 실시예에서의 제1 파라미터 조건은 예를 들어 방법 실시예에서의 제1 파라미터 조건일 수 있고, 이 실시예에서의 제2 파라미터 조건은 예를 들어 방법 실시예에서의 제2 파라미터 조건일 수 있다. 관련 설명에 대해서는 방법 실시예를 참조한다.
이 실시예에서의 오디오 코더(900)의 각각의 기능 모듈의 기능은 구체적으로 전술한 방법 실시예에서의 방법에 따라 실행될 수 있다는 것을 이해해야 한다. 특정한 실행 프로세스에 대해서는 전술한 방법 실시예의 관련 설명을 참조하며, 이에 대해서는 여기서 설명하지 않는다.
오디오 코더(900)는 오디오 신호를 수집, 저장, 또는 전송해야 하는 임의의 장치, 예를 들어, 예를 들어 이동 전화, 태블릿 컴퓨터, 퍼스널 컴퓨터, 또는 노트북 컴퓨터일 수 있다.
알 수 있는 바와 같이, 본 발명의 일부의 실시예에서의 기술적 솔루션에서, 현재 오디오 프레임의 참조 코딩 파라미터를 획득한 후, 오디오 코더(900)는 현재 오디오 프레임의 획득된 참조 코딩 파라미터에 기초해서 TCX 알고리즘 또는 HQ 알고리즘을 선택하여, 현재 오디오 프레임의 스펙트럼 계수를 코딩한다. 현재 오디오 프레임의 참조 코딩 파라미터는 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘과 관련 있으며, 이것은 코딩 알고리즘과 현재 오디오 프레임의 참조 코딩 파라미터 간의 적응성과 적합성을 높이는 데 일조하며, 현재 오디오 프레임의 코딩 품질 또는 코딩 효율을 높이는 데도 일조한다.
도 10을 참조하면, 도 10은 본 발명의 다른 실시예에 따른 오디오 코더(1000)의 구조 블록도이다.
오디오 코더(1000)는 적어도 하나의 프로세서(1001), 메모리(1005), 및 적어도 하나의 통신 버스(1002)를 포함할 수 있다. 통신 버스(1002)는 구성요소 간의 접속 및 통신을 실행하도록 구성되어 있다.
선택적으로, 오디오 코더(1000)는 적어도 하나의 네트워크 인터페이스(1004), 사용자 인터페이스(1003) 등을 더 포함할 수 있다. 선택적으로, 사용자 인터페이스(1003)는 디스플레이(예를 들어, 터치 스크린, 액정 디스플레이, 홀로그래픽 이미징 디바이스(Holographic), 프로젝터(Projector), 클릭 디바이스(예를 들어, 마우스, 트랙볼(trackball), 터치 패널, 또는 터치 스크린), 카메라, 및/또는 픽업 디바이스를 포함한다.
메모리(1005)는 리드 온리 메모리 및 랜덤 액세스 메모리를 포함할 수 있으며, 프로세서(1001)에 명령 및 데이터를 제공한다. 메모리(1005)의 일부는 비휘발성 랜덤 액세스 메모리를 더 포함할 수 있다.
일부의 실행 방식에서, 메모리(1005)는 이하의 요소, 실행 가능한 모듈 또는 데이터 구조, 또는 이것들의 서브세트, 또는 이것들의 확장 세트: 시간-주파수 변환 유닛(910), 획득 유닛(920), 및 코딩 유닛(930)을 저장한다.
본 발명의 이 실시예에서, 프로세서(1001)는 메모리(1005)에 저장되어 있는 코드 또는 명령을 실행하여: 현재 오디오 프레임의 시간-도메인 신호에 대해 시간-주파수 변환 프로세싱을 수행하여 현재 오디오 프레임의 스펙트럼 계수를 획득하고; 상기 현재 오디오 프레임의 참조 코딩 파라미터를 획득하며; 그리고 상기 현재 오디오 프레임의 획득된 참조 코딩 파라미터가 제1 파라미터 조건을 만족하면, 변환 코딩 여기 알고리즘에 기초하여 상기 현재 오디오 프레임의 스펙트럼 계수를 코딩하거나, 상기 현재 오디오 프레임의 획득된 참조 코딩 파라미터가 제2 파라미터 조건을 만족하면, 고품질 변환 코딩 알고리즘에 기초하여 상기 현재 오디오 프레임의 스펙트럼 계수를 코딩한다.
애플리케이션 시나리오의 요건에 따라, 프로세서(1001)에 의해 획득되는 현재 오디오 프레임의 참조 코딩 파라미터는 변할 수 있다.
예를 들어, 참조 코딩 파라미터는 다음의 파라미터: 상기 현재 오디오 프레임의 코딩 레이트; 현재 오디오 프레임의, 서브밴드 z 내에 위치하는 스펙트럼 계수의 피크대평균비; 현재 오디오 프레임의, 서브밴드 w 내에 위치하는 스펙트럼 계수의 엔벨로프 편차; 현재 오디오 프레임의, 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균 및 현재 오디오 프레임의, 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균; 현재 오디오 프레임의, 서브밴드 m 내에 위치하는 스펙트럼 계수의 크기 평균 및 현재 오디오 프레임의, 서브밴드 n 내에 위치하는 스펙트럼 계수의 크기 평균; 현재 오디오 프레임의, 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크대평균비 및 현재 오디오 프레임의, 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크대평균비; 현재 오디오 프레임의, 서브밴드 r 내에 위치하는 스펙트럼 계수의 엔벨로프 편차 및 현재 오디오 프레임의, 서브밴드 s 내에 위치하는 스펙트럼 계수의 엔벨로프 편차; 현재 오디오 프레임의, 서브밴드 e 내에 위치하는 스펙트럼 계수의 엔벨로프 및 현재 오디오 프레임의, 서브밴드 f 내에 위치하는 스펙트럼 계수의 엔벨로프; 또는 현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값 중 적어도 하나를 포함한다.
현재 오디오 프레임의, 서브밴드 p 내에 위치하는 스펙트럼 계수와 현재 오디오 프레임의, 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계의 파라미터 값이 클수록 서브밴드 p 내에 위치하는 스펙트럼 계수와 서브밴드 q 내에 위치하는 스펙트럼 계수 간의 스펙트럼 상관관계가 더 강하다.
서브밴드의 주파수 빈 범위는 실제의 필요에 따라 결정될 수 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 서브밴드 z의 최고 주파수 빈은 임계 주파수 빈 F1보다 클 수 있고, 서브밴드 w의 최고 주파수 빈은 임계 주파수 빈 F1보다 클 수 있다. 임계 주파수 빈 F1의 값 범위는 예를 들어, 6.4 kHz 내지 12 kHz일 수 있다. 예를 들어, 임계 주파수 빈 F1의 값은 6.4 kHz, 8 kHz, 9 kHz, 10 kHz, 또는 12 kHz일 수 있다. 당연히, 임계 주파수 빈 F1은 다른 값일 수도 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 서브밴드 j의 최고 주파수 빈은 임계 주파수 빈 F2보다 클 수 있고, 서브밴드 n의 최고 주파수 빈은 임계 주파수 빈 F2보다 크다. 예를 들어, 임계 주파수 빈 F2의 값 범위는 4.8 kHz 내지 8 kHz일 수 있다. 구체적으로, 예를 들어, 임계 주파수 빈 F2의 값은 6.4 kHz, 4.8 kHz, 6 kHz, 8 kHz, 5 kHz, 또는 7 kHz일 수 있다. 당연히, 임계 주파수 빈 F2는 다른 값일 수도 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 서브밴드 i의 최고 주파수 빈은 서브밴드 j의 최고 주파수 빈보다 작을 수 있고; 서브밴드 m의 최고 주파수 빈은 서브밴드 n의 최고 주파수 빈보다 작을 수 있고; 서브밴드 x의 최고 주파수 빈은 서브밴드 y의 최저 주파수 빈보다 작거나 같을 수 있고; 서브밴드 p의 최고 주파수 빈은 서브밴드 q의 최저 주파수 빈보다 작거나 같을 수 있고; 서브밴드 r의 최고 주파수 빈은 서브밴드 s의 최저 주파수 빈보다 작거나 같을 수 있고; 그리고 서브밴드 e의 최고 주파수 빈은 서브밴드 f의 최저 주파수 빈보다 작거나 같을 수 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 다음의 조건:
서브밴드 w의 최저 주파수 빈은 임계 주파수 빈 F1보다 크거나 같을 수 있고, 서브밴드 z의 최저 주파수 빈은 임계 주파수 빈 F1보다 크거나 같을 수 있고, 서브밴드 i의 최고 주파수 빈은 서브밴드 j의 최저 주파수 빈보다 작거나 같을 수 있고, 서브밴드 m의 최고 주파수 빈은 서브밴드 n의 최저 주파수 빈보다 작거나 같을 수 있고, 서브밴드 j의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있거나, 또는 서브밴드 n의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있고, 서브밴드 i의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 서브밴드 m의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 서브밴드 j의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있거나, 또는 서브밴드 n의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있다는 조건 중 적어도 하나를 만족할 수 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 다음의 조건:
서브밴드 e의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 서브밴드 x의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 서브밴드 p의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있거나, 또는 서브밴드 r의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있다는 조건 중 하나를 만족할 수 있다.
선택적으로, 본 발명의 일부의 가능한 실시 방식에서, 서브밴드 f의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 당연히, 서브밴드 f의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있다. 서브밴드 q의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 당연히, 서브밴드 q의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있다. 서브밴드 s의 최고 주파수 빈은 임계 주파수 빈 F2보다 작거나 같을 수 있고, 당연히, 서브밴드 s의 최저 주파수 빈은 임계 주파수 빈 F2보다 크거나 같을 수 있다.
예를 들어, 서브밴드 z의 최고 주파수 빈의 값 범위는 12 kHz 내지 16 kHz일 수 있다. 서브밴드 z의 최저 주파수 빈의 값 범위는 8 kHz 내지 14 kHz일 수 있다. 서브밴드 z의 대역폭의 값 범위는 1.6 kHz 내지 8 kHz일 수 있다. 구체적으로, 예를 들어, 서브밴드 z의 주파수 빈 범위는 8 kHz 내지 12 kHz, 9 kHz 내지 11 kHz, 8 kHz 내지 9.6 kHz, 또는 12 kHz 내지 14 kHz일 수 있다. 당연히, 서브밴드 z의 주파수 빈 범위는 전술한 예에 제한되지 않는다.
예를 들어, 서브밴드 w의 주파수 빈 범위는 실제의 필요에 따라 결정될 수 있다. 예를 들어, 서브밴드 w의 최고 주파수 빈의 값 범위는 12 kHz 내지 16 kHz일 수 있고, 서브밴드 w의 최저 주파수 빈의 값 범위는 8 kHz 내지 14 kHz일 수 있다. 구체적으로, 예를 들어, 서브밴드 w의 주파수 빈 범위는 8 kHz 내지 12 kHz, 9 kHz 내지 11 kHz, 8 kHz 내지 9.6 kHz, 12 kHz 내지 14 kHz, 또는 12.2 kHz 내지 14.5 kHz일 수 있다. 당연히, 서브밴드 w의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 w의 주파수 빈 범위는 서브밴드 z의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 i의 주파수 빈 범위는 3.2 kHz 내지 6.4 kHz, 3.2 kHz 내지 4.8 kHz, 4.8 kHz 내지 6.4 kHz, 0.4 kHz 내지 6.4 kHz, 또는 0.4 kHz 내지 3.6 kHz일 수 있다. 당연히, 서브밴드 i의 주파수 빈 범위는 전술한 예에 제한되지 않는다.
예를 들어, 서브밴드 j의 주파수 빈 범위는 6.4 kHz 내지 9.6 kHz, 6.4 kHz 내지 8 kHz, 8 kHz 내지 9.6 kHz, 4.8 kHz 내지 9.6 kHz, 또는 4.8 kHz 내지 8 kHz일 수 있다. 당연히, 서브밴드 j의 주파수 빈 범위는 전술한 예에 제한되지 않는다.
예를 들어, 서브밴드 m의 주파수 빈 범위는 3.2 kHz 내지 6.4 kHz, 3.2 kHz 내지 4.8 kHz, 4.8 kHz 내지 6.4 kHz, 0.4 kHz 내지 6.4 kHz, 또는 0.4 kHz 내지 3.6 kHz일 수 있다. 당연히, 서브밴드 m의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 m의 주파수 빈 범위는 서브밴드 i의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 n의 주파수 빈 범위는 6.4 kHz 내지 9.6 kHz, 6.4 kHz 내지 8 kHz, 8 kHz 내지 9.6 kHz, 4.8 kHz 내지 9.6 kHz, 또는 4.8 kHz 내지 8 kHz일 수 있다. 당연히, 서브밴드 n의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 n의 주파수 빈 범위는 서브밴드 j의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 x의 주파수 빈 범위는 0 kHz 내지 1.6 kHz, 1 kHz 내지 2.6 kHz, 1.6 kHz 내지 3.2 kHz, 2 kHz 내지 3.2 kHz, 또는 2.5 kHz 내지 3.4 kHz일 수 있다. 당연히, 서브밴드 x의 주파수 빈 범위는 전술한 예에 제한되지 않는다.
예를 들어, 서브밴드 y의 주파수 빈 범위는 6.4 kHz 내지 8 kHz, 7.4 kHz 내지 9 kHz, 4.8 kHz 내지 6.4 kHz, 4.4 kHz 내지 6.4 kHz, 또는 4.5 kHz 내지 6.2 kHz일 수 있다. 당연히, 서브밴드 y의 주파수 빈 범위는 전술한 예에 제한되지 않는다.
예를 들어, 서브밴드 p의 주파수 빈 범위는 0 kHz 내지 1.6 kHz, 1 kHz 내지 2.6 kHz, 1.6 kHz 내지 3.2 kHz, 2.1 kHz 내지 3.2 kHz, 또는 2.5 kHz 내지 3.5 kHz일 수 있다. 당연히, 서브밴드 p의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 p의 주파수 빈 범위는 서브밴드 x의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 q의 주파수 빈 범위는 6.4 kHz 내지 8 kHz, 7.4 kHz 내지 9 kHz, 4.8 kHz 내지 6.4 kHz, 4.2 kHz 내지 6.4 kHz, 또는 4.7 kHz 내지 6.2 kHz일 수 있다. 당연히, 서브밴드 q의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 q의 주파수 빈 범위는 서브밴드 y의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 r의 주파수 빈 범위는 0 kHz 내지 1.6 kHz, 1 kHz 내지 2.6 kHz, 1.6 kHz 내지 3.2 kHz, 2.05 kHz 내지 3.27 kHz, 또는 2.59 kHz 내지 3.51 kHz일 수 있다. 당연히, 서브밴드 r의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 r의 주파수 빈 범위는 서브밴드 x의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 s의 주파수 빈 범위는 6.4 kHz 내지 8 kHz, 7.4 kHz 내지 9 kHz, 4.8 kHz 내지 6.4 kHz, 5.4 kHz 내지 7.1 kHz, 또는 4.55 kHz 내지 6.29 kHz일 수 있다. 당연히, 서브밴드 s의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 s의 주파수 빈 범위는 서브밴드 y의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 e의 주파수 빈 범위는 0 kHz 내지 1.6 kHz, 1 kHz 내지 2.6 kHz, 1.6 kHz 내지 3.2 kHz, 0.8 kHz 내지 3 kHz, 또는 1.9 kHz 내지 3.8 kHz일 수 있다. 당연히, 서브밴드 e의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 e의 주파수 빈 범위는 서브밴드 x의 주파수 빈 범위와 같거나 유사할 수 있다.
예를 들어, 서브밴드 f의 주파수 빈 범위는 6.4 kHz 내지 8 kHz, 7.4 kHz 내지 9 kHz, 4.8 kHz 내지 6.4 kHz, 5.3 kHz 내지 7.15 kHz, 또는 4.58 kHz 내지 6.52 kHz일 수 있다. 당연히, 서브밴드 f의 주파수 빈 범위는 전술한 예에 제한되지 않는다. 일부의 가능한 실시 방식에서, 서브밴드 f의 주파수 빈 범위는 서브밴드 y의 주파수 빈 범위와 같거나 유사할 수 있다.
제1 파라미터 조건 및 제2 파라미터 조건은 변할 수 있다.
예를 들어, 본 발명의 일부의 가능한 실행 방식에서, 이 실시예에서의 제1 파라미터 조건은 예를 들어 방법 실시예에서의 제1 파라미터 조건일 수 있고, 이 실시예에서의 제2 파라미터 조건은 예를 들어 방법 실시예에서의 제2 파라미터 조건일 수 있다. 관련 설명에 대해서는 방법 실시예를 참조한다.
이 실시예에서의 오디오 코더(1000)의 각각의 기능 모듈의 기능은 구체적으로 전술한 방법 실시예에서의 방법에 따라 실행될 수 있다는 것을 이해해야 한다. 특정한 실행 프로세스에 대해서는 전술한 방법 실시예의 관련 설명을 참조하며, 이에 대해서는 여기서 설명하지 않는다.
오디오 코더(1000)는 오디오 신호를 수집, 저장, 또는 전송해야 하는 임의의 장치, 예를 들어, 예를 들어 이동 전화, 태블릿 컴퓨터, 퍼스널 컴퓨터, 또는 노트북 컴퓨터일 수 있다.
알 수 있는 바와 같이, 본 발명의 일부의 실시예에서의 기술적 솔루션에서, 현재 오디오 프레임의 참조 코딩 파라미터를 획득한 후, 오디오 코더(1000)는 현재 오디오 프레임의 획득된 참조 코딩 파라미터에 기초해서 TCX 알고리즘 또는 HQ 알고리즘을 선택하여, 현재 오디오 프레임의 스펙트럼 계수를 코딩한다. 현재 오디오 프레임의 참조 코딩 파라미터는 현재 오디오 프레임의 스펙트럼 계수를 코딩하는 데 사용되는 코딩 알고리즘과 관련 있으며, 이것은 코딩 알고리즘과 현재 오디오 프레임의 참조 코딩 파라미터 간의 적응성과 적합성을 높이는 데 일조하며, 현재 오디오 프레임의 코딩 품질 또는 코딩 효율을 높이는 데도 일조한다.
또한, 복수의 선택적 참조 코딩 파라미터가 사용되며, 이것은 복수의 시나리오에서 알고리즘 서낵 요건을 만족시키는 데 일조한다.
본 발명의 실시예는 컴퓨터 저장 매체를 추가로 제공하며, 컴퓨터 저장 매체는 프로그램을 저장할 수 있으며, 프로그램이 실행되면, 방법 실시예에서 기록되는 오디오 코딩 방법에서의 단계 중 일부 또는 전부가 수행된다.
설명의 간략화를 위해, 전술한 방법 실시예는 동작의 순서의 조합으로서 설명되었다는 것을 이해해야 한다. 그렇지만, 본 발명에 따라 일부의 단계가 다른 순서로 또는 동시에 수행될 수 있으므로, 당업자라면 본 발명은 설명된 동작 순서에 제한되지 않는다는 것을 이해할 수 있을 것이다. 또한, 당업자는 명세서에 설명된 모든 실시예는 예시적인 실시예이며, 관련 동작 및 모듈은 본 발명에 반드시 필수적인 것이 아니라는 것도 이해하여야 한다.
전술한 실시예에서, 각각의 실시예에 대한 설명은 각각의 초점을 가지고 있다. 실시예에서 상세히 설명되지 않은 부분에 대해서는 다른 실시예에서의 관련 설명을 참조하면 된다.
본 출원에서 제공하는 수 개의 실시예에서, 전술한 시스템, 장치, 및 방법은 다른 방식으로도 실현될 수 있다는 것은 물론이다. 예를 들어, 설명된 장치 실시예는 단지 예시에 불과하다. 예를 들어, 유닛의 분할은 단지 일종의 논리적 기능 분할일 뿐이며, 실제의 실행 동안 다른 분할 방식으로 있을 수 있다. 예를 들어, 복수의 유닛 또는 구성요소를 다른 시스템에 결합 또는 통합할 수 있거나, 또는 일부의 특징은 무시하거나 수행하지 않을 수도 있다. 또한, 도시되거나 논의된 상호 커플링 또는 직접 결합 또는 통신 접속은 일부의 인터페이스를 통해 실현될 수 있다. 장치 또는 유닛 간의 간접 결합 또는 통신 접속은 전자식, 기계식 또는 다른 형태로 실현될 수 있다.
별도의 부분으로 설명된 유닛들은 물리적으로 별개일 수 있고 아닐 수도 있으며, 유닛으로 도시된 부분은 물리적 유닛일 수도 있고 아닐 수도 있으며, 한 위치에 위치할 수도 있고, 복수의 네트워크 유닛에 분산될 수도 있다. 유닛 중 일부 또는 전부는 실제의 필요에 따라 선택되어 실시예의 솔루션의 목적을 달성할 수 있다.
또한, 본 발명의 실시예에서의 기능 유닛은 하나의 프로세싱 유닛으로 통합될 수 있거나, 각각의 유닛이 물리적으로 단독으로 존재할 수도 있거나, 2개 이상의 유닛이 하나의 유닛으로 통합될 수도 있다. 통합 유닛은 하드웨어의 형태로 실현될 수도 있고, 소프트웨어 기능 유닛의 형태로 실현될 수도 있다.
통합 유닛이 소프트웨어 기능 유닛의 형태로 실현되어 독립 제품으로 시판되거나 사용되면, 이 통합 유닛은 컴퓨터 판독 가능형 저장 매체에 저장될 수 있다. 이러한 이해를 바탕으로, 본 발명의 필수적인 기술적 솔루션 또는 종래기술에 기여하는 부분, 또는 기술적 솔루션의 일부는 소프트웨어 제품의 형태로 실현될 수 있다. 컴퓨터 소프트웨어 제품은 저장 매체에 저장되고, 본 발명의 실시예에 설명된 방법의 단계 중 일부 또는 전부를 수행하도록 컴퓨터 장치(이것은 퍼스널 컴퓨터, 서버, 또는 네트워크 장치 등이 될 수 있다)에 명령하는 수개의 명령어를 포함한다. 전술한 저장 매체는: 프로그램 코드를 저장할 수 있는 임의의 저장 매체, 예를 들어, USB 플래시 디스크, 휴대형 하드디스크, 리드-온리 메모리(Read Only Memory, ROM), 랜덤 액세스 메모리(Random Access Memory, RAM), 자기디스크 또는 광디스크를 포함한다.
전술한 설명은 단지 본 발명의 특정한 실행 방식에 불과하며, 본 발명의 보호 범위를 제한하려는 것이 아니다. 본 발명을 전술한 실시예를 참조하여 상세히 설명하였으나, 그럼에도 당업자라면 본 발명의 실시예의 기술적 솔루션의 범주를 벗어남이 없이 전술한 실시예에 설명된 기술적 솔루션을 수정할 수 있거나 일부의 기술적 특징에 대해 등가의 대체를 수행할 수 있다는 것을 이해할 수 있을 것이다.

Claims (21)

  1. 오디오 신호 코딩 방법에 있어서,
    오디오 신호를 획득하는 단계 - 상기 오디오 신호는 현재 프레임을 포함하고, 상기 현재 프레임은 서브밴드 i, 서브밴드 j, 서브밴드 x, 및 서브밴드 y를 포함 -;
    상기 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균, 상기 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균, 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크, 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 평균, 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크, 및 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 얻는 단계; 및
    상기 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균은 상기 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에 상수 T4를 곱한 값보다 크고, 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 곱한 값이 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 평균 및 소정의 구간 R1의 최소 값을 곱한 값보다 크며, 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 곱한 값이 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 평균 및 상기 구간 R1의 최대 값을 곱한 값보다 작을 때, 고품질 변환 코딩 알고리즘을 사용하여 현재 프레임을 인코딩하는 단계를 포함하는,
    오디오 신호 코딩 방법.
  2. 제1항에 있어서,
    상기 서브밴드 i의 최고 주파수 빈은 상기 서브밴드 j의 최저 주파수 빈보다 낮고, 상기 서브밴드 j의 최고 주파수 빈은 8kHz보다 높으며,
    상기 서브밴드 x의 최고 주파수 빈은 상기 서브밴드 y의 최저 주파수 빈보다 낮은,
    오디오 신호 코딩 방법.
  3. 제1항에 있어서,
    상기 상수 T4는 1/1.2 미만이고 0.5 이상인, 오디오 신호 코딩 방법.
  4. 제1항에 있어서,
    상기 서브밴드 i의 주파수 빈의 범위 중 최저 주파수 빈은 0.4kHz이고, 상기 서브밴드 j의 주파수 빈의 범위는 4.8kHz 내지 9.6kHz이며, 상기 서브밴드 x의 주파수 빈의 범위는 1kHz 내지 2.6kHz이고, 상기 서브밴드 y의 주파수 빈의 범위는 4.8kHz 내지 6.4kHz인, 오디오 신호 코딩 방법.
  5. 오디오 신호 코딩 방법에 있어서,
    오디오 신호를 획득하는 단계 - 상기 오디오 신호는 현재 프레임을 포함하고, 상기 현재 프레임은 서브밴드 x 및 서브밴드 y를 포함 -;
    상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크, 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 평균, 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크 및 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 획득하는 단계; 및
    상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 곱한 값이 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 평균 및 상수 T44를 곱한 값보다 작고, 상기 서브밴드 y 내에 위치하는 스펙트럼 피크가 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균에 상수 T45를 곱한 값보다 클 때, 고품질 변환 코딩 알고리즘을 사용하여 현재 프레임을 인코딩하거나,
    상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 곱한 값이 상기 서브밴드 y 내에 위치하는 스펙트럼 피크에 상기 서브밴드 x 내에 위치하는 스펙트럼 평균 및 상수 T46를 곱한 값보다 크고, 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크가 상기 서브밴드 y 내에 위치하는 스펙트럼 평균에 상수 T47을 곱한 값보다 작을 때, 고품질 변환 코딩 알고리즘을 사용하여 현재 프레임을 인코딩하는 단계를 포함하는,
    오디오 신호 코딩 방법.
  6. 제5항에 있어서,
    상기 상수 T47은 1.5이고, 상기 상수 T45는 1.5인, 오디오 신호 코딩 방법.
  7. 제5항에 있어서,
    상기 서브밴드 x의 주파수 빈의 범위는 1kHz 내지 2.6kHz이고, 상기 서브밴드 y의 주파수 빈의 범위는 4.8kHz 내지 6.4kHz인 오디오 신호 코딩 방법.
  8. 오디오 신호 코더에 있어서,
    적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서에 의한 실행을 위한 프로그램 명령들을 저장하는 메모리를 포함하고,
    상기 적어도 하나의 프로세서는, 상기 프로그램 명령을 실행하여,
    오디오 신호를 획득하고, 상기 오디오 신호는 현재 프레임을 포함하고, 상기 현재 프레임은 서브밴드 i, 서브밴드 j, 서브밴드 x, 및 서브밴드 y를 포함하며,
    상기 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균, 상기 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균, 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크, 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 평균, 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크, 및 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 획득하고,
    상기 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균은 상기 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에 상수 T4를 곱한 값보다 크고, 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 곱한 값이 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 평균 및 소정의 구간 R1의 최소 값을 곱한 값보다 크며, 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 곱한 값이 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 평균 및 상기 구간 R1의 최대 값을 곱한 값보다 작을 때, 고품질 변환 코딩 알고리즘을 사용하여 현재 프레임을 코딩하는,
    오디오 신호 코더.
  9. 제8항에 있어서,
    상기 서브밴드 i의 최고 주파수 빈은 상기 서브밴드 j의 최저 주파수 빈보다 낮고, 상기 서브밴드 j의 최고 주파수 빈은 8kHz보다 높고,
    상기 서브밴드 x의 최고 주파수 빈은 상기 서브밴드 y의 최저 주파수 빈보다 낮은, 오디오 신호 코더.
  10. 제8항에 있어서,
    상기 상수 T4는 1/1.2 미만이고 0.5 이상인, 오디오 신호 코더.
  11. 제8항에 있어서,
    상기 서브밴드 i의 주파수 빈의 범위의 최저 주파수 빈은 0.4kHz이고, 상기 서브밴드 j의 주파수 빈의 범위는 4.8kHz 내지 9.6kHz이며, 상기 서브밴드 x의 주파수 빈의 범위는 1kHz 내지 2.6kHz이고, 상기 서브밴드 y의 주파수 빈의 범위는 4.8kHz 내지 6.4kHz인,
    오디오 신호 코더.
  12. 오디오 신호 코더에 있어서,
    적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서에 의한 실행을 위한 프로그램 명령들을 저장하는 메모리를 포함하고,
    상기 적어도 하나의 프로세서는, 상기 프로그램 명령을 실행하여,
    오디오 신호를 획득하고, 상기 오디오 신호는 현재 프레임을 포함하고, 상기 현재 프레임은 서브밴드 x 및 서브밴드 y를 포함하며,
    상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크, 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 평균, 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크 및 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 획득하고,
    상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 곱한 값이 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 평균 및 상수 T44를 곱한 값보다 작고, 상기 서브밴드 y 내에 위치하는 스펙트럼 피크가 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균에 상수 T45를 곱한 값보다 클 때, 고품질 변환 코딩 알고리즘을 사용하여 현재 프레임을 코딩하거나,
    상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 곱한 값이 상기 서브밴드 y 내에 위치하는 스펙트럼 피크에 상기 서브밴드 x 내에 위치하는 스펙트럼 평균 및 상수 T46를 곱한 값보다 크고, 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크가 상기 서브밴드 y 내에 위치하는 스펙트럼 평균에 상수 T47을 곱한 값보다 작을 때, 고품질 변환 코딩 알고리즘을 사용하여 현재 프레임을 코딩하는,
    오디오 신호 코더.
  13. 제12항에 있어서,
    상기 상수 T47은 1.5이고, 상기 상수 T45는 1.5인, 오디오 신호 코더.
  14. 제12항에 있어서,
    상기 서브밴드 x의 주파수 빈의 범위는 1kHz 내지 2.6kHz이고, 상기 서브밴드 y의 주파수 빈의 범위는 4.8kHz 내지 6.4kHz인, 오디오 신호 코더.
  15. 오디오 신호 코더에 있어서,
    오디오 신호를 획득하도록 구성된 유닛 - 상기 오디오 신호는 현재 프레임을 포함하고, 상기 현재 프레임은 서브밴드 i, 서브밴드 j, 서브밴드 x 및 서브밴드 y를 포함 -;
    상기 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균, 상기 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균, 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크, 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 평균, 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크, 및 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 획득하도록 구성된 유닛; 및
    상기 서브밴드 j 내에 위치하는 스펙트럼 계수의 에너지 평균은 상기 서브밴드 i 내에 위치하는 스펙트럼 계수의 에너지 평균에 상수 T4를 곱한 값보다 크고, 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 곱한 값이 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 평균 및 소정의 구간 R1의 최소 값을 곱한 값보다 크며, 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 곱한 값이 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 평균 및 상기 구간 R1의 최대 값을 곱한 값보다 작을 때, 고품질 변환 코딩 알고리즘을 사용하여 현재 프레임을 코딩하도록 구성된 유닛을 포함하는,
    오디오 신호 코더.
  16. 제15항에 있어서,
    상기 서브밴드 i의 최고 주파수 빈은 상기 서브밴드 j의 최저 주파수 빈보다 낮고, 상기 서브밴드 j의 최고 주파수 빈은 8kHz보다 높고,
    상기 서브밴드 x의 최고 주파수 빈은 상기 서브밴드 y의 가장 낮은 주파수 빈보다 낮은,
    오디오 신호 코더.
  17. 제15항에 있어서,
    상기 상수 T4는 1/1.2보다 미만이고 0.5 이상인, 오디오 신호 코더.
  18. 제15항에 있어서,
    상기 서브밴드 i의 주파수 빈의 범위의 최저 주파수 빈은 0.4 kHz이고, 상기 서브밴드 j의 주파수 빈의 범위는 4.8 kHz 내지 9.6 kHz이며, 상기 서브밴드 x의 주파수 빈의 범위는 1kHz 내지 2.6kHz이고, 상기 서브밴드 y의 주파수 빈의 범위는 4.8kHz 내지 6.4kHz인,
    오디오 신호 코더.
  19. 오디오 신호 코더에 있어서,
    오디오 신호를 획득하도록 구성된 유닛 - 상기 오디오 신호는 현재 프레임을 포함하고, 상기 현재 프레임은 서브밴드 x 및 서브밴드 y를 포함 -;
    상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크, 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 평균, 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크 및 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 획득하도록 구성된 유닛; 및
    상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 곱한 값이 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 평균 및 상수 T44를 곱한 값보다 작고, 상기 서브밴드 y 내에 위치하는 스펙트럼 피크가 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균에 상수 T45를 곱한 값보다 클 때, 고품질 변환 코딩 알고리즘을 사용하여 현재 프레임을 코딩하도록 구성된 유닛, 또는
    상기 서브밴드 x 내에 위치하는 스펙트럼 계수의 피크에 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 평균을 곱한 값이 상기 서브밴드 y 내에 위치하는 스펙트럼 피크에 상기 서브밴드 x 내에 위치하는 스펙트럼 평균 및 상수 T46를 곱한 값보다 크고, 상기 서브밴드 y 내에 위치하는 스펙트럼 계수의 피크가 상기 서브밴드 y 내에 위치하는 스펙트럼 평균에 상수 T47을 곱한 값보다 작을 때, 고품질 변환 코딩 알고리즘을 사용하여 현재 프레임을 코딩하도록 구성된 유닛을 포함하는,
    오디오 신호 코더.
  20. 제19항에 있어서,
    상기 상수 T47은 1.5이고, 상기 상수 T45는 1.5 인, 오디오 신호 코더.
  21. 제19항에 있어서,
    상기 서브밴드 x의 주파수 빈의 범위는 1kHz 내지 2.6kHz이고, 상기 서브밴드 y의 주파수 빈의 범위는 4.8kHz 내지 6.4kHz인, 오디오 신호 코더.
KR1020197003520A 2014-07-28 2015-04-01 오디오 코딩 방법 및 관련 장치 KR102022500B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410363905.5 2014-07-28
CN201410363905.5A CN104143335B (zh) 2014-07-28 2014-07-28 音频编码方法及相关装置
PCT/CN2015/075645 WO2016015485A1 (zh) 2014-07-28 2015-04-01 音频编码方法及相关装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020167035938A Division KR101947127B1 (ko) 2014-07-28 2015-04-01 오디오 코딩 방법 및 관련 장치

Publications (2)

Publication Number Publication Date
KR20190014603A KR20190014603A (ko) 2019-02-12
KR102022500B1 true KR102022500B1 (ko) 2019-11-25

Family

ID=51852493

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020197003520A KR102022500B1 (ko) 2014-07-28 2015-04-01 오디오 코딩 방법 및 관련 장치
KR1020167035938A KR101947127B1 (ko) 2014-07-28 2015-04-01 오디오 코딩 방법 및 관련 장치

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020167035938A KR101947127B1 (ko) 2014-07-28 2015-04-01 오디오 코딩 방법 및 관련 장치

Country Status (15)

Country Link
US (4) US10056089B2 (ko)
EP (2) EP3790007B1 (ko)
JP (2) JP6538822B2 (ko)
KR (2) KR102022500B1 (ko)
CN (2) CN104143335B (ko)
AU (2) AU2015296447B2 (ko)
BR (1) BR112016029904B1 (ko)
CA (3) CA3064092C (ko)
ES (2) ES2938742T3 (ko)
MX (1) MX360606B (ko)
MY (1) MY174461A (ko)
PL (1) PL3790007T3 (ko)
RU (1) RU2670790C9 (ko)
SG (2) SG11201610047RA (ko)
WO (1) WO2016015485A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104143335B (zh) * 2014-07-28 2017-02-01 华为技术有限公司 音频编码方法及相关装置
JP6501259B2 (ja) * 2015-08-04 2019-04-17 本田技研工業株式会社 音声処理装置及び音声処理方法
US20220254331A1 (en) * 2021-02-05 2022-08-11 Cambium Assessment, Inc. Neural network and method for machine learning assisted speech recognition
CN112767956B (zh) * 2021-04-09 2021-07-16 腾讯科技(深圳)有限公司 音频编码方法、装置、计算机设备及介质
WO2023274507A1 (en) * 2021-06-29 2023-01-05 Telefonaktiebolaget Lm Ericsson (Publ) Spectrum classifier for audio coding mode selection

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050240399A1 (en) 2004-04-21 2005-10-27 Nokia Corporation Signal encoding
US20120253797A1 (en) 2009-10-20 2012-10-04 Ralf Geiger Multi-mode audio codec and celp coding adapted therefore
US20130090929A1 (en) 2010-06-14 2013-04-11 Tomokazu Ishikawa Hybrid audio encoder and hybrid audio decoder

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3364825B2 (ja) * 1996-05-29 2003-01-08 三菱電機株式会社 音声符号化装置および音声符号化復号化装置
EP0932141B1 (en) * 1998-01-22 2005-08-24 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
CA2246532A1 (en) * 1998-09-04 2000-03-04 Northern Telecom Limited Perceptual audio coding
US6721280B1 (en) 2000-04-19 2004-04-13 Qualcomm Incorporated Method and apparatus for voice latency reduction in a voice-over-data wireless communication system
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
DE60230856D1 (de) 2001-07-13 2009-03-05 Panasonic Corp Audiosignaldecodierungseinrichtung und audiosignalcodierungseinrichtung
CN1308913C (zh) * 2002-04-11 2007-04-04 松下电器产业株式会社 编码设备、解码设备及其方法
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
US7333930B2 (en) 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
CN101185127B (zh) * 2005-04-01 2014-04-23 高通股份有限公司 用于编码和解码语音信号的高频带部分的方法和设备
KR20080101872A (ko) 2006-01-18 2008-11-21 연세대학교 산학협력단 부호화/복호화 장치 및 방법
CN101496099B (zh) * 2006-07-31 2012-07-18 高通股份有限公司 用于对有效帧进行宽带编码和解码的***、方法和设备
CN101145345B (zh) * 2006-09-13 2011-02-09 华为技术有限公司 音频分类方法
CN101145343B (zh) * 2006-09-15 2011-07-20 展讯通信(上海)有限公司 一种用于音频处理框架中的编码和解码方法
CN101025918B (zh) * 2007-01-19 2011-06-29 清华大学 一种语音/音乐双模编解码无缝切换方法
KR101411901B1 (ko) * 2007-06-12 2014-06-26 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
JP5244971B2 (ja) 2008-07-11 2013-07-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号合成器及びオーディオ信号符号器
PL2346030T3 (pl) * 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
JP5551695B2 (ja) * 2008-07-11 2014-07-16 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声符号器、音声復号器、音声符号化方法、音声復号化方法およびコンピュータプログラム
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
WO2010003545A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. An apparatus and a method for decoding an encoded audio signal
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
KR20130069833A (ko) 2008-10-08 2013-06-26 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 다중 분해능 스위치드 오디오 부호화/복호화 방법
US8498874B2 (en) 2009-09-11 2013-07-30 Sling Media Pvt Ltd Audio signal encoding employing interchannel and temporal redundancy reduction
RU2591661C2 (ru) * 2009-10-08 2016-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Многорежимный декодировщик аудио сигнала, многорежимный кодировщик аудио сигналов, способы и компьютерные программы с использованием кодирования с линейным предсказанием на основе ограничения шума
AU2010309838B2 (en) * 2009-10-20 2014-05-08 Dolby International Ab Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
JP5809066B2 (ja) * 2010-01-14 2015-11-10 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声符号化装置および音声符号化方法
US8886523B2 (en) 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
WO2011156905A2 (en) 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CN102074242B (zh) * 2010-12-27 2012-03-28 武汉大学 语音音频混合分级编码中核心层残差提取***及方法
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
US9037456B2 (en) * 2011-07-26 2015-05-19 Google Technology Holdings LLC Method and apparatus for audio coding and decoding
CN103477388A (zh) * 2011-10-28 2013-12-25 松下电器产业株式会社 声音信号混合解码器、声音信号混合编码器、声音信号解码方法及声音信号编码方法
US9111531B2 (en) 2012-01-13 2015-08-18 Qualcomm Incorporated Multiple coding mode signal classification
ES2661504T3 (es) * 2012-05-30 2018-04-02 Nippon Telegraph And Telephone Corporation Método de codificación, codificador, programa y medio de grabación
CN104143335B (zh) * 2014-07-28 2017-02-01 华为技术有限公司 音频编码方法及相关装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050240399A1 (en) 2004-04-21 2005-10-27 Nokia Corporation Signal encoding
US20120253797A1 (en) 2009-10-20 2012-10-04 Ralf Geiger Multi-mode audio codec and celp coding adapted therefore
US20130090929A1 (en) 2010-06-14 2013-04-11 Tomokazu Ishikawa Hybrid audio encoder and hybrid audio decoder

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ISO/IEC FDIS 23003-3:2011(E), Information technology - MPEG audio technologies - Part 3: Unified speech and audio coding. ISO/IEC JTC 1/SC 29/WG 11. 2011.09.20.*

Also Published As

Publication number Publication date
RU2670790C9 (ru) 2018-11-23
US20180268832A1 (en) 2018-09-20
EP3790007A1 (en) 2021-03-10
US20200066290A1 (en) 2020-02-27
BR112016029904B1 (pt) 2023-04-18
KR101947127B1 (ko) 2019-02-12
CA3064092A1 (en) 2016-02-04
CA2951321A1 (en) 2016-02-04
CA2951321C (en) 2019-12-31
PL3790007T3 (pl) 2023-05-02
RU2017101806A (ru) 2018-08-30
WO2016015485A1 (zh) 2016-02-04
KR20170010822A (ko) 2017-02-01
RU2670790C2 (ru) 2018-10-25
CN106448688A (zh) 2017-02-22
EP3790007B1 (en) 2023-01-04
EP3157010A1 (en) 2017-04-19
CA3058990A1 (en) 2016-02-04
MY174461A (en) 2020-04-20
US10706866B2 (en) 2020-07-07
JP2019164379A (ja) 2019-09-26
JP6888051B2 (ja) 2021-06-16
US20190164562A1 (en) 2019-05-30
KR20190014603A (ko) 2019-02-12
CN104143335A (zh) 2014-11-12
ES2814154T3 (es) 2021-03-26
SG11201610047RA (en) 2017-01-27
JP6538822B2 (ja) 2019-07-03
US10504534B2 (en) 2019-12-10
AU2018201411A1 (en) 2018-03-22
SG10201805102PA (en) 2018-08-30
ES2938742T3 (es) 2023-04-14
AU2015296447A1 (en) 2017-01-05
CN104143335B (zh) 2017-02-01
RU2017101806A3 (ko) 2018-08-30
US20170125031A1 (en) 2017-05-04
BR112016029904A2 (pt) 2017-08-22
CA3064092C (en) 2022-04-19
US10056089B2 (en) 2018-08-21
CN106448688B (zh) 2019-11-05
EP3157010B1 (en) 2020-06-10
JP2017522608A (ja) 2017-08-10
AU2015296447B2 (en) 2018-01-18
EP3157010A4 (en) 2017-10-25
AU2018201411B2 (en) 2019-08-22
MX360606B (es) 2018-11-09
US10269366B2 (en) 2019-04-23
MX2017001039A (es) 2017-05-04

Similar Documents

Publication Publication Date Title
JP6888051B2 (ja) 音声符号化方法および関連装置
JP6202545B2 (ja) 帯域幅拡張周波数帯域信号を予測する方法、および復号デバイス
JP7301154B2 (ja) 音声データの処理方法並びにその、装置、電子機器及びコンピュータプログラム
AU2017272204A1 (en) Signal processing method and device
WO2012139401A1 (zh) 一种音频编码方法及装置
AU2014286765A1 (en) Signal encoding and decoding methods and devices
JP5783395B2 (ja) 信号処理方法およびデバイス
US10165362B2 (en) Automated equalization

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant