RU2670790C2 - Способ аудиокодирования и соответствующее устройство - Google Patents

Способ аудиокодирования и соответствующее устройство Download PDF

Info

Publication number
RU2670790C2
RU2670790C2 RU2017101806A RU2017101806A RU2670790C2 RU 2670790 C2 RU2670790 C2 RU 2670790C2 RU 2017101806 A RU2017101806 A RU 2017101806A RU 2017101806 A RU2017101806 A RU 2017101806A RU 2670790 C2 RU2670790 C2 RU 2670790C2
Authority
RU
Russia
Prior art keywords
subband
khz
audio frame
spectral coefficients
current audio
Prior art date
Application number
RU2017101806A
Other languages
English (en)
Other versions
RU2670790C9 (ru
RU2017101806A (ru
RU2017101806A3 (ru
Inventor
Цзэсинь ЛЮ
Лэй МЯО
Original Assignee
Хуавэй Текнолоджиз Ко., Лтд.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Хуавэй Текнолоджиз Ко., Лтд. filed Critical Хуавэй Текнолоджиз Ко., Лтд.
Publication of RU2017101806A publication Critical patent/RU2017101806A/ru
Publication of RU2017101806A3 publication Critical patent/RU2017101806A3/ru
Application granted granted Critical
Publication of RU2670790C2 publication Critical patent/RU2670790C2/ru
Publication of RU2670790C9 publication Critical patent/RU2670790C9/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrolytic Production Of Non-Metals, Compounds, Apparatuses Therefor (AREA)
  • Stereophonic System (AREA)

Abstract

Изобретение относится к технологиям аудиокодирования. Технический результат заключается в повышении эффективности аудиокодирования. Технический результат достигается за счет осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио; получения одного или более опорных параметров кодирования текущего кадра аудио; и если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет любому одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием; или если полученный опорный параметр кодирования текущего кадра аудио не удовлетворяет ни одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества. 6 н. и 16 з.п. ф-лы, 10 ил.

Description

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
[0002] Настоящее изобретение относится к технологиям аудиокодирования и, в частности, к способу аудиокодирования и соответствующему устройству.
УРОВЕНЬ ТЕХНИКИ
[0003] В существующем алгоритме кодирования аудиосигнала (например, музыки), при одинаковой битовой скорости, некоторые алгоритмы аудиокодирования ограничиваются конкретной полосой кодирования и, в основном используются для кодирования кадра аудио, имеющего относительно узкую полосу, и некоторые алгоритмы аудиокодирования не ограничиваются полосой кодирования и, в основном используются для кодирования кадра аудио, имеющего относительно широкую полосу. Конечно, обе категории алгоритмов аудиокодирования имеют достоинства и недостатки.
[0004] Однако, в уровне техники, в ходе кодирования кадра аудио, фиксированный алгоритм кодирования непосредственно используется для кодирования кадра аудио. Таким образом, используемый алгоритм аудиокодирования вряд ли может гарантировать высокое качество кодирования или высокую эффективность кодирования.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0005] Варианты осуществления настоящего изобретения предусматривают способ аудиокодирования и соответствующее устройство для повышения качества кодирования или эффективности кодирования при кодировании кадра аудио.
[0006] Первый аспект вариантов осуществления настоящего изобретения предусматривает способ аудиокодирования, включающий в себя:
осуществление обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;
получение опорного параметра кодирования текущего кадра аудио; и
если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет первому условию параметра, кодирование спектральных коэффициентов текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием, или если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет второму условию параметра, кодирование спектральных коэффициентов текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества.
[0007] Согласно первому аспекту, в первом возможном варианте реализации первого аспекта, опорный параметр кодирования включает в себя, по меньшей мере, один из следующих параметров: скорости кодирования текущего кадра аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио; среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио; среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио; огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио; или значения параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, причем
наибольший элемент разрешения по частоте подполосы z больше, чем критический элемент F1 разрешения по частоте; наибольший элемент разрешения по частоте подполосы w больше, чем критический элемент F1 разрешения по частоте; наибольший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте; и наибольший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте;
диапазон значений критического элемента F1 разрешения по частоте составляет от 6,4 кГц до 12 кГц;
диапазон значений критического элемента F2 разрешения по частоте составляет от 4,8 кГц до 8 кГц; и
наибольший элемент разрешения по частоте подполосы i меньше, чем наибольший элемент разрешения по частоте подполосы j; наибольший элемент разрешения по частоте подполосы m меньше, чем наибольший элемент разрешения по частоте подполосы n; наибольший элемент разрешения по частоте подполосы x меньше или равен наименьшему элементу разрешения по частоте подполосы y; наибольший элемент разрешения по частоте подполосы p меньше или равен наименьшему элементу разрешения по частоте подполосы q; наибольший элемент разрешения по частоте подполосы r меньше или равен наименьшему элементу разрешения по частоте подполосы s; и наибольший элемент разрешения по частоте подполосы e меньше или равен наименьшему элементу разрешения по частоте подполосы f.
[0008] Согласно первому возможному варианту реализации первого аспекта, во втором возможном варианте реализации первого аспекта,
выполняется, по меньшей мере, одно из следующих условий: наименьший элемент разрешения по частоте подполосы w больше или равен критическому элементу F1 разрешения по частоте, наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m меньше или равен наименьшему элементу разрешения по частоте подполосы n, наименьший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте, или наименьший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте.
[0009] Согласно первому возможному варианту реализации первого аспекта или второму возможному варианту реализации первого аспекта, в третьем возможном варианте реализации первого аспекта, первое условие параметра включает в себя, по меньшей мере, одно из следующих условий:
скорость кодирования текущего кадра аудио меньше, чем порог T1;
отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T2;
отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T3;
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T4;
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, больше или равна порогу T5;
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T6;
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, больше или равна порогу T7;
отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, попадает в интервал R1;
абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше или равно порогу T8;
отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, попадает в интервал R2;
абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше или равно порогу T9;
отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3;
абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше или равно порогу T10; или
значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, больше или равно порогу T11.
[0010] Согласно первому возможному варианту реализации первого аспекта, второму возможному варианту реализации первого аспекта или третьему возможному варианту реализации первого аспекта, в четвертом возможном варианте реализации первого аспекта, первое условие параметра включает в себя одно из следующих условий:
частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T45;
частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T47;
разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T49;
разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T51;
частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T53;
частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T55;
разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T57;
разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T59;
частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T61;
частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T63;
разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T65;
разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T67;
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T69;
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T71;
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T73;
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T75;
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T77;
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T79;
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T81; или
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T83.
[0011] Согласно первому возможному варианту реализации первого аспекта, второму возможному варианту реализации первого аспекта, третьему возможному варианту реализации первого аспекта или четвертому возможному варианту реализации первого аспекта, в пятом возможном варианте реализации первого аспекта, второе условие параметра включает в себя, по меньшей мере, одно из следующих условий:
скорость кодирования текущего кадра аудио больше или равна порогу T1;
отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T2;
отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T3;
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T4;
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше, чем порог T5;
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T6;
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше, чем порог T7;
отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1;
абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8;
отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2;
абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9;
отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, не попадает в интервал R3;
абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10; или
значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше, чем порог T11.
[0012] Согласно первому возможному варианту реализации первого аспекта, второму возможному варианту реализации первого аспекта, третьему возможному варианту реализации первого аспекта, четвертому возможному варианту реализации первого аспекта или пятому возможному варианту реализации первого аспекта, в шестом возможном варианте реализации первого аспекта, второе условие параметра включает в себя одно из следующих условий:
частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T45;
частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T47;
разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T49;
разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T51;
частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T53;
частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T55;
разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T57;
разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T59;
частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T61;
частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T63;
разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T65;
разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T67;
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T69;
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T71;
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T73;
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T75;
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T77;
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T79;
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T81; или
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T83.
[0013] Согласно третьему возможному варианту реализации первого аспекта, четвертому возможному варианту реализации первого аспекта, пятому возможному варианту реализации первого аспекта или шестому возможному варианту реализации первого аспекта, в седьмом возможном варианте реализации первого аспекта,
выполняется, по меньшей мере, одно из следующих условий:
порог T2 больше или равен 2;
порог T4 меньше или равен 1/1,2;
интервал R1 составляет [1/2,25, 2,25];
порог T44 меньше или равен 1/2,56;
порог T45 больше или равен 1,5;
порог T46 больше или равен 1/2,56;
порог T47 меньше или равен 1,5;
порог T68 меньше или равен 1,25; или
порог T69 больше или равен 2.
[0014] Второй аспект вариантов осуществления настоящего изобретения предусматривает аудиокодер, включающий в себя:
блок временно-частотного преобразования, выполненный с возможностью осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;
блок получения, выполненный с возможностью получения опорного параметра кодирования текущего кадра аудио; и
блок кодирования, выполненный с возможностью: если опорный параметр кодирования, полученный блоком получения и относящийся к текущему кадру аудио, удовлетворяет первому условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием, или если опорный параметр кодирования, полученный блоком получения и относящийся к текущему кадру аудио, удовлетворяет второму условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества.
[0015] Согласно второму аспекту, в первом возможном варианте реализации второго аспекта, опорный параметр кодирования включает в себя, по меньшей мере, один из следующих параметров: скорости кодирования текущего кадра аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио; среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио; среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио; огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио; или значения параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, причем
наибольший элемент разрешения по частоте подполосы z больше, чем критический элемент F1 разрешения по частоте; наибольший элемент разрешения по частоте подполосы w больше, чем критический элемент F1 разрешения по частоте; наибольший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте; и наибольший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте; диапазон значений критического элемента F1 разрешения по частоте составляет от 6,4 кГц до 12 кГц; и диапазон значений критического элемента F2 разрешения по частоте составляет от 4,8 кГц до 8 кГц; и
наибольший элемент разрешения по частоте подполосы i меньше, чем наибольший элемент разрешения по частоте подполосы j; наибольший элемент разрешения по частоте подполосы m меньше, чем наибольший элемент разрешения по частоте подполосы n; наибольший элемент разрешения по частоте подполосы x меньше или равен наименьшему элементу разрешения по частоте подполосы y; наибольший элемент разрешения по частоте подполосы p меньше или равен наименьшему элементу разрешения по частоте подполосы q; наибольший элемент разрешения по частоте подполосы r меньше или равен наименьшему элементу разрешения по частоте подполосы s; и наибольший элемент разрешения по частоте подполосы e меньше или равен наименьшему элементу разрешения по частоте подполосы f.
[0016] Согласно первому возможному варианту реализации второго аспекта, во втором возможном варианте реализации второго аспекта, выполняется, по меньшей мере, одно из следующих условий: наименьший элемент разрешения по частоте подполосы w больше или равен критическому элементу F1 разрешения по частоте, наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m меньше или равен наименьшему элементу разрешения по частоте подполосы n, наименьший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте, или наименьший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте.
[0017] Согласно первому возможному варианту реализации второго аспекта или второму возможному варианту реализации второго аспекта, в третьем возможном варианте реализации второго аспекта, первое условие параметра включает в себя, по меньшей мере, одно из следующих условий:
скорость кодирования текущего кадра аудио меньше, чем порог T1;
отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T2;
отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T3;
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T4;
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, больше или равна порогу T5;
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T6;
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, больше или равна порогу T7;
отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, попадает в интервал R1;
абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше или равно порогу T8;
отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, попадает в интервал R2;
абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше или равно порогу T9;
отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3;
абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше или равно порогу T10; или
значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, больше или равно порогу T11.
[0018] Согласно первому возможному варианту реализации второго аспекта, второму возможному варианту реализации второго аспекта или третьему возможному варианту реализации второго аспекта, в четвертом возможном варианте реализации второго аспекта, первое условие параметра включает в себя одно из следующих условий:
частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T45;
частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T47;
разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T49;
разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T51;
частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T53;
частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T55;
разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T57;
разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T59;
частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T61;
частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T63;
разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T65;
разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T67;
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T69;
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T71;
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T73;
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T75;
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T77;
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T79;
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T81; или
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T83.
[0019] Согласно первому возможному варианту реализации второго аспекта, второму возможному варианту реализации второго аспекта, третьему возможному варианту реализации второго аспекта или четвертому возможному варианту реализации второго аспекта, в пятом возможном варианте реализации второго аспекта, второе условие параметра включает в себя, по меньшей мере, одно из следующих условий:
скорость кодирования текущего кадра аудио больше или равна порогу T1;
отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T2;
отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T3;
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T4;
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше, чем порог T5;
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T6;
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше, чем порог T7;
отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1;
абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8;
отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2;
абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9;
отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, не попадает в интервал R3;
абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10; или
значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше, чем порог T11.
[0020] Согласно первому возможному варианту реализации второго аспекта, второму возможному варианту реализации второго аспекта, третьему возможному варианту реализации второго аспекта, четвертому возможному варианту реализации второго аспекта или пятому возможному варианту реализации второго аспекта, в шестом возможном варианте реализации второго аспекта, второе условие параметра включает в себя одно из следующих условий:
частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T45;
частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T47;
разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T49;
разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T51;
частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T53;
частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T55;
разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T57;
разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T59;
частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T61;
частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T63;
разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T65;
разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T67;
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T69;
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T71;
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T73;
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T75;
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T77;
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T79;
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T81; или
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T83.
[0021] Согласно третьему возможному варианту реализации второго аспекта, четвертому возможному варианту реализации второго аспекта, пятому возможному варианту реализации второго аспекта или шестому возможному варианту реализации второго аспекта, в седьмом возможном варианте реализации второго аспекта,
выполняется, по меньшей мере, одно из следующих условий:
порог T2 больше или равен 2;
порог T4 меньше или равен 1/1,2;
интервал R1 составляет [1/2,25, 2,25];
порог T44 меньше или равен 1/2,56;
порог T45 больше или равен 1,5;
порог T46 больше или равен 1/2,56;
порог T47 меньше или равен 1,5;
порог T68 меньше или равен 1,25; или
порог T69 больше или равен 2.
[0022] Как можно видеть, в технических решений в некоторых вариантах осуществления настоящего изобретения, после получения опорного параметра кодирования текущего кадра аудио, алгоритм TCX или алгоритм HQ выбирается на основании полученного опорного параметра кодирования текущего кадра аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Опорный параметр кодирования текущего кадра аудио связан с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0023] Для более наглядного описания технических решений согласно вариантам осуществления настоящего изобретения, ниже кратко перечислены прилагаемые чертежи, необходимые для описания вариантов осуществления. Очевидно, прилагаемые чертежи в нижеследующем описании демонстрируют лишь некоторые варианты осуществления настоящего изобретения, и специалисты в данной области техники могут вывести другие чертежи из этих прилагаемых чертежей без применения творческих способностей.
[0024] Фиг. 1-8 - блок-схемы операций нескольких способов аудиокодирования согласно вариантам осуществления настоящего изобретения; и
[0025] Фиг. 9 и фиг. 10 - схемы двух типов аудиокодеров согласно вариантам осуществления настоящего изобретения.
ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ
[0026] Варианты осуществления настоящего изобретения предусматривают способ аудиокодирования и соответствующее устройство для повышения качества кодирования или эффективности кодирования при кодировании кадра аудио.
[0027] Чтобы специалисты в данной области техники могли лучше понять технические решения в настоящем изобретении, ниже отчетливо описаны технические решения согласно вариантам осуществления настоящего изобретения со ссылкой на прилагаемые чертежи согласно вариантам осуществления настоящего изобретения. Очевидно, описанные варианты осуществления представляют собой лишь часть, а не все из вариантов осуществления настоящего изобретения. Все остальные варианты осуществления, полученные специалистами в данной области техники на основании вариантов осуществления настоящего изобретения без применения творческих способностей подлежат включению в объем защиты настоящего изобретения.
[0028] Ниже приведено подробное описание.
[0029] В описании изобретения, формуле изобретения и прилагаемых чертежах настоящего изобретения, термины "первый", "второй", "третий", "четвертый" и т.д. предназначены для различения между разными объектами, но не предназначены для описания конкретного порядка. Кроме того, термины "включают в себя" и "имеют" и любая их вариация призваны охватывать неисключающее включение. Например, процесс, способ, система, продукт или устройство, которые включают в себя несколько этапов или блоков, не ограничивается перечисленными этапам или блоками, но, в необязательном порядке, дополнительно включает в себя неперечисленный этап или блок или, в необязательном порядке, дополнительно включает в себя другой внутренний этап или блок процесса, способа, продукта или устройства.
[0030] Рассмотрим способ аудиокодирования, предусмотренный согласно вариантам осуществления настоящего изобретения. Способ аудиокодирования, предусмотренный согласно вариантам осуществления настоящего изобретения может выполняться аудиокодером. Аудиокодер может представлять собой любое устройство, которое необходимо для сбора, сохранения или передачи аудиосигнала, например, мобильный телефон, планшетный компьютер, персональный компьютер или компьютер-ноутбук.
[0031] В одном варианте осуществления способа аудиокодирования в настоящем изобретении, способ аудиокодирования включает в себя: осуществление обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио; получение опорного параметра кодирования текущего кадра аудио; и если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет первому условию параметра, кодирование спектральных коэффициентов текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием, или если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет второму условию параметра, кодирование спектральных коэффициентов текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества.
[0032] На фиг. 1 показана блок-схема операций способа аудиокодирования согласно варианту осуществления настоящего изобретения. Как показано на фиг. 1, способ аудиокодирования, предусмотренный в этом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:
[0033] 101: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.
[0034] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.
[0035] 102: Получать опорный параметр кодирования текущего кадра аудио.
[0036] 103: Если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет первому условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с возбуждением, кодированным преобразованием (по-английски: transform coded excitation, сокращенно TCX).
[0037] 104: Если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет второму условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества (по-английски: high quality transform coding, сокращенно HQ).
[0038] Как можно видеть, в решениях этого варианта осуществления, после получения опорного параметра кодирования текущего кадра аудио, алгоритм TCX или алгоритм HQ выбирается на основании полученного опорного параметра кодирования текущего кадра аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Опорный параметр кодирования текущего кадра аудио связан с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.
[0039] В алгоритме TCX, обработка изъятия обычно осуществляется на сигнале временной области текущего кадра аудио. Например, квадратный зеркальный фильтр используется для осуществления обработки изъятия на сигнале временной области текущего кадра аудио. В алгоритме HQ, обработка изъятия не осуществляется на сигнале временной области текущего кадра аудио.
[0040] Согласно требованию сценария применения, опорный параметр кодирования, полученный на этапе 102, текущего кадра аудио может изменяться.
[0041] Например, опорный параметр кодирования может включать в себя, по меньшей мере, один из следующих параметров: скорости кодирования текущего кадра аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио; среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио; среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио; огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио; или значения параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио.
[0042] Большее значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио указывает более сильную спектральную корреляцию между спектральными коэффициентами, расположенными в подполосе p, и спектральными коэффициентами, расположенными в подполосе q. Значение параметра спектральной корреляции может быть, например, значением параметра нормализованной кросс-корреляции.
[0043] Диапазоны элемента разрешения по частоте подполос могут определяться согласно фактическим потребностям.
[0044] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы z может быть больше критического элемента F1 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы w может быть больше критического элемента F1 разрешения по частоте. Диапазон значений критического элемента F1 разрешения по частоте может составлять, например, от 6,4 кГц до 12 кГц. Например, значение критического элемента F1 разрешения по частоте может быть равно 6,4 кГц, 8 кГц, 9 кГц, 10 кГц или 12 кГц. Конечно, критический элемент F1 разрешения по частоте может иметь другое значение.
[0045] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы j может быть больше критического элемента F2 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте. Например, диапазон значений критического элемента F2 разрешения по частоте может составлять от 4,8 кГц до 8 кГц. В частности, например, значение критического элемента F2 разрешения по частоте может быть равно 6,4 кГц, 4,8 кГц, 6 кГц, 8 кГц, 5 кГц или 7 кГц. Конечно, критический элемент F2 разрешения по частоте может иметь другое значение.
[0046] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы i может быть меньше наибольшего элемента разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m может быть меньше наибольшего элемента разрешения по частоте подполосы n, наибольший элемент разрешения по частоте подполосы x может быть меньше или равен наименьшему элементу разрешения по частоте подполосы y, наибольший элемент разрешения по частоте подполосы p может быть меньше или равен наименьшему элементу разрешения по частоте подполосы q, наибольший элемент разрешения по частоте подполосы r может быть меньше или равен наименьшему элементу разрешения по частоте подполосы s, и наибольший элемент разрешения по частоте подполосы e может быть меньше или равен наименьшему элементу разрешения по частоте подполосы f.
[0047] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий:
наименьший элемент разрешения по частоте подполосы w больше или равен критическому элементу F1 разрешения по частоте, наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m меньше или равен наименьшему элементу разрешения по частоте подполосы n, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы m меньше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, или наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте.
[0048] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий: наибольший элемент разрешения по частоте подполосы e меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы x меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы p меньше или равен критическому элементу F2 разрешения по частоте, или наибольший элемент разрешения по частоте подполосы r меньше или равен критическому элементу F2 разрешения по частоте.
[0049] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы f может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы f может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы q может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы q может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы s может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы s может быть больше или равен критическому элементу F2 разрешения по частоте.
[0050] Например, диапазон значений наибольшего элемента разрешения по частоте подполосы z может составлять от 12 кГц до 16 кГц. Диапазон значений наименьшего элемента разрешения по частоте подполосы z может составлять от 8 кГц до 14 кГц. Диапазон значений полосы подполосы z может составлять от 1,6 кГц до 8 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы z может составлять от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц или от 12 кГц до 14 кГц. Конечно, диапазон элемента разрешения по частоте подполосы z не ограничивается вышеприведенными примерами.
[0051] Например, диапазон элемента разрешения по частоте подполосы w может определяться согласно фактическим потребностям. Например, диапазон значений наибольшего элемента разрешения по частоте подполосы w может составлять от 12 кГц до 16 кГц, и диапазон значений наименьшего элемента разрешения по частоте подполосы w может составлять от 8 кГц до 14 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы w составляет от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц, от 12 кГц до 14 кГц или от 12,2 кГц до 14,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы w не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы w может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы z.
[0052] Например, диапазон элемента разрешения по частоте подполосы i может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы i не ограничивается вышеприведенными примерами.
[0053] Например, диапазон элемента разрешения по частоте подполосы j может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы j не ограничивается вышеприведенными примерами.
[0054] Например, диапазон элемента разрешения по частоте подполосы m может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы m не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы m может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы i.
[0055] Например, диапазон элемента разрешения по частоте подполосы n может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы n не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы n может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы j.
[0056] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2 кГц до 3,2 кГц или от 2,5 кГц до 3,4 кГц. Конечно, диапазон элемента разрешения по частоте подполосы x не ограничивается вышеприведенными примерами.
[0057] Например, диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,4 кГц до 6,4 кГц или от 4,5 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы y не ограничивается вышеприведенными примерами.
[0058] Например, диапазон элемента разрешения по частоте подполосы p может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,1 кГц до 3,2 кГц или от 2,5 кГц до 3,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы p не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы p может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.
[0059] Например, диапазон элемента разрешения по частоте подполосы q может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,2 кГц до 6,4 кГц или от 4,7 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы q не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы q может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.
[0060] Например, диапазон элемента разрешения по частоте подполосы r может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,05 кГц до 3,27 кГц или от 2,59 кГц до 3,51 кГц. Конечно, диапазон элемента разрешения по частоте подполосы r не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы r может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.
[0061] Например, диапазон элемента разрешения по частоте подполосы s может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,4 кГц до 7,1 кГц или от 4,55 кГц до 6,29 кГц. Конечно, диапазон элемента разрешения по частоте подполосы s не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы s может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.
[0062] Например, диапазон элемента разрешения по частоте подполосы e может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 0,8 кГц до 3 кГц или от 1,9 кГц до 3,8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы e не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы e может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.
[0063] Например, диапазон элемента разрешения по частоте подполосы f может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,3 кГц до 7,15 кГц или от 4,58 кГц до 6,52 кГц. Конечно, диапазон элемента разрешения по частоте подполосы f не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы f может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.
[0064] Первое условие параметра может изменяться.
[0065] Например, в некоторых возможных вариантах реализации настоящего изобретения, первое условие параметра, например, может включать в себя, по меньшей мере, одно из следующих условий:
скорость кодирования текущего кадра аудио меньше, чем порог T1 (порог T1 может быть, например, больше или равен 24,4 кбит/с, 32 кбит/с, 64 кбит/с или другой скорости);
отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T2 (порог T2 может быть, например, больше или равен 1, 2, 3, 5 или другому значению);
отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T3 (порог T3 может быть, например, больше или равен 10, 20, 35 или другому значению);
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T4 (порог T4 может быть, например, больше или равен 0,5, 1, 2, 3 или другому значению);
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, больше или равна порогу T5 (порог T5 может быть, например, больше или равен 10, 20, 51, 100 или другому значению);
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T6 (порог T6 может быть, например, больше или равен 0,5, 1,1, 2, 3 или другому значению);
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, больше или равна порогу T7 (порог T7 может быть, например, больше или равен 11, 20, 50, 101 или другому значению);
отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, попадает в интервал R1 (интервал R1 может быть равен, например, [0,5, 2], [0,4, 2,5] или другому значению);
абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше или равно порогу T8 (порог T8 может быть, например, больше или равен 1, 2, 3 или другому значению);
отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, попадает в интервал R2 (интервал R2 может быть равен, например, [0,5, 2], [0,4, 2,5] или другому значению);
абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше или равно порогу T9 (порог T9 может быть, например, больше или равен 10, 20, 35 или другому значению);
отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3 (интервал R3 может быть равен, например, [0,5, 2], [0,4, 2,5] или другому значению);
абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше или равно порогу T10 (порог T10 может быть, например, больше или равен 11, 20, 50, 101 или другому значению); или
значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, больше или равно порогу T11 (порог T11 может быть равен, например, 0,5, 0,8, 0,9, 1, или другому значению).
[0066] В порядке другого примера, в некоторых возможных вариантах реализации настоящего изобретения, первое условие параметра, например, может включать в себя одно из следующих условий:
скорость кодирования текущего кадра аудио больше или равна порогу T1, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T12 (порог T12 может быть, например, больше или равен порогу T4, и порог T12 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);
скорость кодирования текущего кадра аудио больше или равна порогу T1, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T13 (порог T13 может быть, например, больше или равен порогу T6, и порог T13 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);
скорость кодирования текущего кадра аудио больше или равна порогу T1, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T14 (порог T14 может быть, например, меньше или равен порогу T2, и порог T14 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4 или другому значению);
скорость кодирования текущего кадра аудио больше или равна порогу T1, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T15 (порог T15 может быть, например, меньше или равен порогу T3, и порог T15 может быть, например, меньше или равен 5, 8, 10, 20, или другому значению);
отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T16 (порог T16 может быть, например, больше или равен порогу T4, и порог T16 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);
отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T17 (порог T17 может быть, например, больше или равен порогу T6, и порог T17 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);
отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T18 (порог T18 может быть, например, меньше или равен порогу T2, и порог T18 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);
отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T19 (порог T19 может быть, например, меньше или равен порогу T3, и порог T19 может быть, например, меньше или равен 5, 8, 10, 20, или другому значению);
абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T20 (порог T20 может быть, например, больше или равен порогу T4, и порог T20 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);
абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T21 (порог T21 может быть, например, больше или равен порогу T6, и порог T21 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);
абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T22 (порог T22 может быть, например, меньше или равен порогу T2, и порог T22 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);
абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T23 (порог T23 может быть, например, меньше или равен порогу T3, и порог T23 может быть, например, меньше или равен 5, 8, 10, 20, или другому значению);
отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T24 (порог T24 может быть, например, больше или равен порогу T4, и порог T24 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);
отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T25 (порог T25 может быть, например, больше или равен порогу T6, и порог T25 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);
отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T26 (порог T26 может быть, например, меньше или равен порогу T2, и порог T26 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);
отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T27 (порог T27 может быть, например, меньше или равен порогу T3, и порог T27 может быть, например, меньше или равен 5, 8, 10, 20, или другому значению);
абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T28 (порог T28 может быть, например, больше или равен порогу T4, и порог T28 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);
абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T29 (порог T29 может быть, например, больше или равен порогу T6, и порог T29 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);
абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T30 (порог T30 может быть, например, меньше или равен порогу T2, и порог T30 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);
абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T31 (порог T31 может быть, например, меньше или равен порогу T3, и порог T31 может быть, например, меньше или равен 5, 8, 10, 20, или другому значению);
отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T32 (порог T32 может быть, например, больше или равен порогу T4, и порог T32 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);
отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T33 (порог T33 может быть, например, больше или равен порогу T6, и порог T33 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);
отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T34 (порог T34 может быть, например, меньше или равен порогу T2, и порог T34 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);
отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T35 (порог T35 может быть, например, меньше или равен порогу T3, и порог T35 может быть, например, меньше или равен 5, 8, 9,5, 10, 15, 20 или другому значению);
абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T36 (порог T36 может быть, например, больше или равен порогу T4, и порог T36 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);
абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T37 (порог T37 может быть, например, больше или равен порогу T6, и порог T37 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);
абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T38 (порог T38 может быть, например, меньше или равен порогу T2, и порог T38 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);
абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T39 (порог T39 может быть, например, меньше или равен порогу T3, и порог T39 может быть, например, меньше или равен 5, 8, 9,5, 10, 15, 20 или другому значению);
значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T40 (порог T40 может быть, например, больше или равен порогу T4, и порог T40 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);
значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T41 (порог T41 может быть, например, больше или равен порогу T6, и порог T41 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);
значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T42 (порог T42 может быть, например, меньше или равен порогу T2, и порог T42 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);
значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T43 (порог T43 может быть, например, меньше или равен порогу T3, и порог T43 может быть, например, меньше или равен 5, 8, 9,5, 10, 15, 20 или другому значению);
частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44 (диапазон значений порога T44 может составлять, например, от 1,5 до 3), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T45 (диапазон значений порога T45 может составлять, например, от 1 до 3);
частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46 (диапазон значений порога T46 может составлять, например, от 1,5 до 3), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T47 (диапазон значений порога T47 может составлять, например, от 1 до 3);
разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48 (диапазон значений порога T48 может составлять, например, от -1 до 3), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T49 (диапазон значений порога T49 может составлять, например, от 1 до 3);
разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50 (диапазон значений порога T50 может составлять, например, от -1 до 3), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T51 (диапазон значений порога T51 может составлять, например, от 1 до 3);
частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52 (диапазон значений порога T52 может составлять, например, от 1 до 3), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T53 (порог T53 может быть равен, например, 10, 20, 30 или другому значению);
частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54 (диапазон значений порога T54 может составлять, например, от 1 до 3), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T55 (порог T55 может быть равен, например, 10, 20, 30 или другому значению);
разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56 (диапазон значений порога T56 может составлять, например, от -40 до 40), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T57 (порог T57 может быть равен, например, 10, 20, 30 или другому значению);
разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58 (диапазон значений порога T58 может составлять, например, от -40 до 40), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T59 (порог T59 может быть равен, например, 10, 20, 30 или другому значению);
частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60 (диапазон значений порога T60 может составлять, например, от 1 до 3), и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T61 (порог T61 может быть равен, например, 10, 20, 30 или другому значению);
частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62 (диапазон значений порога T62 может составлять, например, от 1 до 3), и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T63 (порог T63 может быть равен, например, 10, 20, 30 или другому значению);
разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64 (диапазон значений порога T64 может составлять, например, от -40 до 40), и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T65 (порог T65 может быть равен, например, 10, 20, 30 или другому значению);
разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66 (диапазон значений порога T66 может составлять, например, от -40 до 40), и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T67 (порог T67 может быть равен, например, 10, 20, 30 или другому значению);
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68 (порог T68 может быть, например, меньше или равен 0,5, 1, 2, 3 или другому значению), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T69 (порог T69 может быть, например, меньше или равен 1, 2, 3, 5 или другому значению);
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70 (порог T70 может быть, например, меньше или равен 10, 20, 51, 100 или другому значению), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T71 (порог T71 может быть, например, меньше или равен 1, 2, 3, 5 или другому значению);
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72 (порог T72 может быть, например, больше или равен 0,5, 1,1, 2, 3 или другому значению), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T73 (порог T73 может быть, например, меньше или равен 1, 2, 3, 5 или другому значению);
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74 (порог T74 может быть, например, больше или равен 11, 20, 50, 101 или другому значению), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T75 (порог T75 может быть, например, меньше или равен 1, 2, 3, 5 или другому значению);
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76 (порог T76 может быть, например, меньше или равен 0,5, 1, 2, 3 или другому значению), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T77 (порог T77 может быть, например, больше или равен 10, 20, 35 или другому значению);
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78 (порог T78 может быть, например, меньше или равен 10, 20, 51, 100 или другому значению), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T79 (порог T79 может быть, например, больше или равен 10, 20, 35 или другому значению);
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80 (порог T80 может быть, например, больше или равен 0,5, 1,1, 2, 3 или другому значению), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T81 (порог T81 может быть, например, больше или равен 10, 20, 35 или другому значению); или
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82 (порог T82 может быть, например, больше или равен 11, 20, 50, 101 или другому значению), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T83 (порог T83 может быть, например, больше или равен 10, 20, 35 или другому значению).
[0067] Очевидно, что первое условие параметра не ограничивается вышеприведенными примерами, и некоторые другие возможные варианты реализации можно расширять на основании вышеприведенных примеров.
[0068] Например, в некоторых возможных вариантах реализации настоящего изобретения, второе условие параметра включает в себя, по меньшей мере, одно из следующих условий:
скорость кодирования текущего кадра аудио больше или равна порогу T1;
отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T2;
отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T3;
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T4;
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше, чем порог T5;
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T6;
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше, чем порог T7;
отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1;
абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8;
отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2;
абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9;
отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, не попадает в интервал R3;
абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10; или
значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше, чем порог T11.
[0069] В порядке другого примера, в некоторых возможных вариантах реализации настоящего изобретения, второе условие параметра включает в себя одно из следующих условий:
скорость кодирования текущего кадра аудио больше или равна порогу T1, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T12;
скорость кодирования текущего кадра аудио больше или равна порогу T1, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T13;
скорость кодирования текущего кадра аудио больше или равна порогу T1, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T14;
скорость кодирования текущего кадра аудио больше или равна порогу T1, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T15;
отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T16;
отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T17;
отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T18;
отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T19;
абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T20;
абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T21;
абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T22;
абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T23;
отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T24;
отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T25;
отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T26;
отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T27;
абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T28;
абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T29;
абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T30;
абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T31;
отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T32;
отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T33;
отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T34;
отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T35;
абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T36;
абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T37;
абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T38;
абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T39;
значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T40;
значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T41;
значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T42;
значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T43;
частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T45;
частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T47;
разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T49;
разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T51;
частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T53;
частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T55;
разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T57;
разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T59;
частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T61;
частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T63;
разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T65;
разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T67;
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T69;
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T71;
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T73;
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T75;
частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T77;
разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T79;
частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T81; или
разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T83.
[0070] Очевидно, что второе условие параметра не ограничивается вышеприведенными примерами, и некоторые другие возможные варианты реализации можно расширять на основании вышеприведенных примеров.
[0071] Очевидно, что примеры первого условия параметра и второго условия параметра являются не всеми возможными вариантами реализации. В фактическом применении, вышеприведенные примеры можно расширять, для обогащения возможных вариантов реализации первого условия параметра и второго условия параметра.
[0072] Для лучшего понимания вариантов осуществления настоящего изобретения, ниже приведено иллюстративное описание согласно некоторым конкретным сценариям применения.
[0073] На фиг. 2 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 2, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.
[0074] Как показано на фиг. 2, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:
[0075] 201: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.
[0076] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.
[0077] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.
[0078] Обработка временно-частотного преобразования осуществляется на сигнале временной области текущего кадра аудио с использованием алгоритма быстрого преобразования Фурье (по-английски: fast fourier transform, сокращенно FFT), алгоритма модифицированного дискретного косинусного преобразования (по-английски: modified discrete cosine transform, сокращенно MDCT), или другого алгоритма временно-частотного преобразования, для получения спектральных коэффициентов текущего кадра аудио.
[0079] 202: Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.
[0080] 203: Определять, больше или равно ли порогу T4 частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.
[0081] Если да, осуществляется этап 204; если нет, осуществляется этап 205.
[0082] Порог T4 может быть больше или равен 0,5, и порог T4, например, равен 0,5, 1, 1,5, 2, 3 или другому значению.
[0083] Например, диапазон элемента разрешения по частоте подполосы i может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц или от 0,4 кГц до 6,4 кГц.
[0084] Например, диапазон элемента разрешения по частоте подполосы j может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц или от 4,8 кГц до 9,6 кГц.
[0085] 204: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.
[0086] 205: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.
[0087] Как можно видеть, в решениях этого варианта осуществления, после получения среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, алгоритм TCX или алгоритм HQ выбирается на основании полученного среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и полученного среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Соотношение между средним по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио и средним по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, связано с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.
[0088] На фиг. 3 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 3, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио.
[0089] Как показано на фиг. 3, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:
[0090] 301: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.
[0091] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.
[0092] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.
[0093] 302: Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.
[0094] 303: Определять, больше или равно ли частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, порогу T68.
[0095] Если нет, осуществляется этап 304; если да, осуществляется этап 306.
[0096] Порог T68 больше или равен порогу T4. Например, порог T68 может быть больше или равен 0,6, и порог T68, например, равен 0,8, 0,6, 1, 1,5, 2, 3, 5 или другому значению.
[0097] Например, диапазон элемента разрешения по частоте подполосы i может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц или от 0,4 кГц до 6,4 кГц.
[0098] Например, диапазон элемента разрешения по частоте подполосы j может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц или от 4,8 кГц до 9,6 кГц.
[0099] 304: Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио.
[00100] 305: Определять, ли отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T69.
[0100] Если да, осуществляется этап 307; если нет, осуществляется этап 306.
[0101] Порог T69 может быть больше или равен 1, и порог T69, например, равен 1, 1,1, 1,5, 2, 3,5, 6, 4,6 или другому значению.
[0102] Например, диапазон значений наибольшего элемента разрешения по частоте подполосы z может составлять от 12 кГц до 16 кГц, и диапазон значений наименьшего элемента разрешения по частоте подполосы z может составлять от 8 кГц до 14 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы z может составлять от 8 кГц до 12 кГц, от 9 кГц до 11 кГц или от 8 кГц до 9,6 кГц.
[0103] 306: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.
[0104] 307: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.
[0105] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Соотношение между средним по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио и средним по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.
[0106] На фиг. 4 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 4, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио.
[0107] Как показано на фиг. 4, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:
[0108] 401: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.
[0109] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.
[0110] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.
[0111] 402: Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио.
[0112] 403: Определять, ли отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, попадает в интервал R1.
[0113] Если да, осуществляется этап 404; если нет, осуществляется этап 405.
[0114] Интервал R1 может представлять собой, например, [0,5, 2], [0,8, 1,25], [0,4, 2,5] или другой диапазон.
[0115] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц или от 1,6 кГц до 3,2 кГц, и диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц или от 4,8 кГц до 6,4 кГц.
[0116] 404: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.
[0117] 405: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.
[0118] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.
[0119] На фиг. 5 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 5, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио.
[0120] Как показано на фиг. 5, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:
[0121] 501: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.
[0122] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.
[0123] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.
[0124] 502: Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио.
[0125] 503: Определять, больше или равно ли частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, порогу T46.
[0126] Если да, осуществляется этап 504; если нет, осуществляется этап 505.
[0127] порог T46 может быть больше или равен 0,5, и порог T46, например, равен 0,5, 1, 1,5, 2, 3 или другому значению.
[0128] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц или от 1,6 кГц до 3,2 кГц, и диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц или от 4,8 кГц до 6,4 кГц.
[0129] 504: Определять, ли отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше или равно порогу T47.
[0130] Если да, осуществляется этап 506; если нет, осуществляется этап 507.
[0131] 505: Определять, меньше ли отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, чем порог T47.
[0132] Если да, осуществляется этап 506; если нет, осуществляется этап 507.
[0133] 506: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.
[0134] 507: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.
[0135] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.
[0136] На фиг. 6 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 6, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.
[0137] Как показано на фиг. 6, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:
[0138] 601: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.
[0139] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.
[0140] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.
[0141] 602: Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио.
[0142] 603: Определять, ли отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, попадает в интервал R1.
[0143] Если нет, осуществляется этап 604; если да, осуществляется этап 606.
[0144] Интервал R1 может представлять собой, например, [0,5, 2], [0,8, 1,25], [0,4, 2,5] или другой диапазон.
[0145] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц или от 1,6 кГц до 3,2 кГц, и диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц или от 4,8 кГц до 6,4 кГц.
[0146] 604: Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.
[0147] 605: Определять, больше или равно ли частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, порогу T16.
[0148] Если да, осуществляется этап 606; если нет, осуществляется этап 607.
[0149] Диапазон элемента разрешения по частоте подполосы i может составлять, например, от 0 кГц до 1,6 кГц или от 1 кГц до 2,6 кГц, и диапазон элемента разрешения по частоте подполосы j может составлять, например, от 6,4 кГц до 8 кГц, от 4,8 кГц до 6,4 кГц или от 7,4 кГц до 9 кГц.
[0150] Порог T16 больше, чем порог T4. Например, порог T16 может быть больше или равен 2, и порог T16, например, равен 2, 2,5, 3, 3,5, 5, 5, 1, или другому значению.
[0151] 606: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.
[0152] 607: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.
[0153] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.
[0154] На фиг. 7 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 7, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, с использованием скорости кодирования текущего кадра аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.
[0155] Как показано на фиг. 7, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:
[0156] 701: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.
[0157] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.
[0158] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.
[0159] 702: Определять, больше или равна ли скорость кодирования текущего кадра аудио порогу T1.
[0160] Если да, осуществляется этап 703; если нет, осуществляется этап 705.
[0161] Порог T1, например, больше или равен 24,4 кбит/с. Например, порог T1 равен 24,4 кбит/с, 32 кбит/с, 64 кбит/с или другой скорости.
[0162] 703: Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.
[0163] 704: Определять, больше или равно ли частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, порогу T12.
[0164] Если да, осуществляется этап 705; если нет, осуществляется этап 706.
[0165] Диапазон элемента разрешения по частоте подполосы i может составлять, например, от 0 кГц до 1,6 кГц или от 1 кГц до 2,6 кГц, и диапазон элемента разрешения по частоте подполосы j может составлять, например, от 6,4 кГц до 8 кГц, от 4,8 кГц до 6,4 кГц или от 7,4 кГц до 9 кГц.
[0166] Порог T12 может быть больше порога T4. Например, порог T12 может быть больше или равен 2, и порог T12, например, равен 2, 2,5, 3, 3,5, 5, 5,2 или другому значению.
[0167] 705: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.
[0168] 706: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.
[0169] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании скорости кодирования текущего кадра аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Скорость кодирования текущего кадра аудио, среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.
[0170] На фиг. 8 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 8, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио.
[0171] Как показано на фиг. 8, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:
[0172] 801: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.
[0173] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.
[0174] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.
[0175] 802: Получать среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио и среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио.
[0176] 803: Определять, больше или равно ли порогу T6 частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио.
[0177] Если да, осуществляется этап 804; если нет, осуществляется этап 805.
[0178] Порог T6 может быть больше или равен 0,3, и порог T6, например, равен 0,5, 1, 1,5, 2, 3,2, или другому значению.
[0179] Например, диапазон элемента разрешения по частоте подполосы m может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц или от 0,4 кГц до 6,4 кГц.
[0180] Например, диапазон элемента разрешения по частоте подполосы n может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц или от 4,8 кГц до 9,6 кГц.
[0181] 804: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.
[0182] 805: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.
[0183] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Соотношение между средним по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и средним по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.
[0184] Очевидно, что иллюстративные варианты реализации, представленные на фиг. 2-8, являются лишь некоторыми вариантами реализации настоящего изобретения. В фактическом применении, многие другие возможные варианты реализации могут расширяться на основании соответствующих иллюстративных описаний согласно варианту осуществления, соответствующему фиг. 1.
[0185] В некоторых сценариях, в ходе выбора подполосы можно рассматривать следующее.
[0186] При вычислении сходства между параметрами свойства спектральных коэффициентов, расположенных в двух подполосах, можно выбирать две согласованные подполосы, например, две подполосы составляют от 0 кГц до 1,6 кГц и от 6,4 кГц до 8 кГц. В некоторых сценариях, поскольку свойство спектральных коэффициентов в пределах от 0 до 1 кГц значительно отличается от свойства спектральных коэффициентов в пределах от 1 до 1,6 кГц, спектр от 0 кГц до 1,6 кГц может не выбираться при вычислении сходства между параметрами свойства спектральных коэффициентов. Например, спектральные коэффициенты в пределах от 1 кГц до 2,6 кГц можно выбирать для замены спектральных коэффициентов в пределах от 0 до 1,6 кГц, для вычисления параметра свойства низкочастотных спектральных коэффициентов. В этом случае, если низкочастотные спектральные коэффициенты в пределах от 1 кГц до 2,6 кГц копируются в высокую частоту, соответствующие спектральные коэффициенты являются высокочастотными спектральными коэффициентами в пределах от 7,4 кГц до 9 кГц. При вычислении параметра свойства высокочастотных спектральных коэффициентов, спектральные коэффициенты в пределах от 7,4 кГц до 9 кГц более пригодны для вычисления спектрального свойства. Однако, в некоторых сценариях, разрешение спектральных коэффициентов в пределах от 0 кГц до 6,4 кГц может быть очень высоким, и спектральные коэффициенты в пределах от 0 кГц до 6,4 кГц пригодны для вычисления параметра свойства. Если разрешение спектральных коэффициентов в пределах от 6,4 кГц до 16 кГц относительно низко, спектральные коэффициенты в пределах от 6,4 кГц до 16 кГц могут быть не пригодны для вычисления параметра свойства спектральных коэффициентов. Поэтому, при вычислении параметра свойства высокочастотных спектральных коэффициентов, для вычисления параметра свойства можно выбирать спектральные коэффициенты в пределах от 4,8 кГц до 6,4 кГц, и параметр свойства используется в качестве высокочастотного параметра свойства.
[0187] Кодирование спектральных коэффициентов текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием может, в частности, включать в себя: деление спектральных коэффициентов на N подполос; вычисление и квантование огибающей каждой подполосы; осуществление выделение битов для каждой подполосы согласно квантованному значению огибающей и количеству доступных битов; квантование спектральные коэффициенты каждой подполосы согласно количеству битов, выделенных подполосе; и запись квантованных спектральных коэффициентов и значение индекса спектральной огибающей в битовый поток.
[0188] Ниже дополнительно представлено соответствующее устройство, выполненное с возможностью реализации вышеприведенного решения.
[0189] Согласно фиг. 9, вариант осуществления настоящего изобретения дополнительно предусматривает аудиокодер 900. Аудиокодер 900 может включать в себя блок 910 временно-частотного преобразования, блок 920 получения и блок 930 кодирования.
[0190] Блок 910 временно-частотного преобразования выполнен с возможностью осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.
[0191] Блок 920 получения выполнен с возможностью получения опорного параметра кодирования текущего кадра аудио.
[0192] Блок 930 кодирования выполнен с возможностью: если опорный параметр кодирования, полученный блоком 920 получения и относящийся к текущему кадру аудио, удовлетворяет первому условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием, или если опорный параметр кодирования, полученный блоком получения и относящийся к текущему кадру аудио, удовлетворяет второму условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества.
[0193] Согласно требованию сценария применения, опорный параметр кодирования, полученный блоком 920 получения и относящийся к текущему кадру аудио, может изменяться.
[0194] Например, опорный параметр кодирования может включать в себя, по меньшей мере, один из следующих параметров: скорости кодирования текущего кадра аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио; среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио; среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио; огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио; или значения параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио.
[0195] Большее значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио указывает более сильную спектральную корреляцию между спектральными коэффициентами, расположенными в подполосе p, и спектральными коэффициентами, расположенными в подполосе q. Значение параметра спектральной корреляции может быть, например, значением параметра нормализованной кросс-корреляции.
[0196] Диапазоны элемента разрешения по частоте подполос могут определяться согласно фактическим потребностям.
[0197] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы z может быть больше критического элемента F1 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы w может быть больше критического элемента F1 разрешения по частоте. Диапазон значений критического элемента F1 разрешения по частоте может составлять, например, от 6,4 кГц до 12 кГц. Например, значение критического элемента F1 разрешения по частоте может быть равно 6,4 кГц, 8 кГц, 9 кГц, 10 кГц или 12 кГц. Конечно, критический элемент F1 разрешения по частоте может иметь другое значение.
[0198] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы j может быть больше критического элемента F2 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте. Например, диапазон значений критического элемента F2 разрешения по частоте может составлять от 4,8 кГц до 8 кГц. В частности, например, значение критического элемента F2 разрешения по частоте может быть равно 6,4 кГц, 4,8 кГц, 6 кГц, 8 кГц, 5 кГц или 7 кГц. Конечно, критический элемент F2 разрешения по частоте может иметь другое значение.
[0199] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы i может быть меньше наибольшего элемента разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m может быть меньше наибольшего элемента разрешения по частоте подполосы n, наибольший элемент разрешения по частоте подполосы x может быть меньше или равен наименьшему элементу разрешения по частоте подполосы y, наибольший элемент разрешения по частоте подполосы p может быть меньше или равен наименьшему элементу разрешения по частоте подполосы q, наибольший элемент разрешения по частоте подполосы r может быть меньше или равен наименьшему элементу разрешения по частоте подполосы s, и наибольший элемент разрешения по частоте подполосы e может быть меньше или равен наименьшему элементу разрешения по частоте подполосы f.
[0200] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий:
наименьший элемент разрешения по частоте подполосы w больше или равен критическому элементу F1 разрешения по частоте, наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m меньше или равен наименьшему элементу разрешения по частоте подполосы n, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы m меньше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, или наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте.
[0201] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий: наибольший элемент разрешения по частоте подполосы e меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы x меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы p меньше или равен критическому элементу F2 разрешения по частоте, или наибольший элемент разрешения по частоте подполосы r меньше или равен критическому элементу F2 разрешения по частоте.
[0202] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы f может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы f может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы q может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы q может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы s может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы s может быть больше или равен критическому элементу F2 разрешения по частоте.
[0203] Например, диапазон значений наибольшего элемента разрешения по частоте подполосы z может составлять от 12 кГц до 16 кГц. Диапазон значений наименьшего элемента разрешения по частоте подполосы z может составлять от 8 кГц до 14 кГц. Диапазон значений полосы подполосы z может составлять от 1,6 кГц до 8 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы z может составлять от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц или от 12 кГц до 14 кГц. Конечно, диапазон элемента разрешения по частоте подполосы z не ограничивается вышеприведенными примерами.
[0204] Например, диапазон элемента разрешения по частоте подполосы w может определяться согласно фактическим потребностям. Например, диапазон значений наибольшего элемента разрешения по частоте подполосы w может составлять от 12 кГц до 16 кГц, и диапазон значений наименьшего элемента разрешения по частоте подполосы w может составлять от 8 кГц до 14 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы w составляет от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц, от 12 кГц до 14 кГц или от 12,2 кГц до 14,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы w не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы w может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы z.
[0205] Например, диапазон элемента разрешения по частоте подполосы i может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы i не ограничивается вышеприведенными примерами.
[0206] Например, диапазон элемента разрешения по частоте подполосы j может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы j не ограничивается вышеприведенными примерами.
[0207] Например, диапазон элемента разрешения по частоте подполосы m может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы m не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы m может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы i.
[0208] Например, диапазон элемента разрешения по частоте подполосы n может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы n не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы n может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы j.
[0209] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2 кГц до 3,2 кГц или от 2,5 кГц до 3,4 кГц. Конечно, диапазон элемента разрешения по частоте подполосы x не ограничивается вышеприведенными примерами.
[0210] Например, диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,4 кГц до 6,4 кГц или от 4,5 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы y не ограничивается вышеприведенными примерами.
[0211] Например, диапазон элемента разрешения по частоте подполосы p может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,1 кГц до 3,2 кГц или от 2,5 кГц до 3,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы p не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы p может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.
[0212] Например, диапазон элемента разрешения по частоте подполосы q может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,2 кГц до 6,4 кГц или от 4,7 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы q не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы q может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.
[0213] Например, диапазон элемента разрешения по частоте подполосы r может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,05 кГц до 3,27 кГц или от 2,59 кГц до 3,51 кГц. Конечно, диапазон элемента разрешения по частоте подполосы r не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы r может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.
[0214] Например, диапазон элемента разрешения по частоте подполосы s может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,4 кГц до 7,1 кГц или от 4,55 кГц до 6,29 кГц. Конечно, диапазон элемента разрешения по частоте подполосы s не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы s может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.
[0215] Например, диапазон элемента разрешения по частоте подполосы e может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 0,8 кГц до 3 кГц или от 1,9 кГц до 3,8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы e не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы e может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.
[0216] Например, диапазон элемента разрешения по частоте подполосы f может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,3 кГц до 7,15 кГц или от 4,58 кГц до 6,52 кГц. Конечно, диапазон элемента разрешения по частоте подполосы f не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы f может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.
[0217] Первое условие параметра и второе условие параметра может изменяться.
[0218] Например, в некоторых возможных вариантах реализации настоящего изобретения, первое условие параметра в этом варианте осуществления может быть, например, первым условием параметра согласно варианту осуществления способа, и второе условие параметра в этом варианте осуществления может быть, например, вторым условием параметра согласно варианту осуществления способа. За соответствующими описаниями, обратимся к записям согласно варианту осуществления способа.
[0219] Очевидно, что функции каждого функционального модуля аудиокодера 900 в этом варианте осуществления, в частности, могут быть реализованы согласно способам вышеприведенных вариантов осуществления способа. За конкретным процессом реализации, обратимся к соответствующему описанию вышеприведенных вариантов осуществления способа, и детали здесь не описаны.
[0220] Аудиокодер 900 может представлять собой любое устройство, которое необходимо для сбора, сохранения или передачи аудиосигнала, например, мобильный телефон, планшетный компьютер, персональный компьютер или компьютер-ноутбук.
[0221] Как можно видеть, в решениях этого варианта осуществления, после получения опорного параметра кодирования текущего кадра аудио, аудиокодер 900 выбирает алгоритм TCX или алгоритм HQ на основании полученного опорного параметра кодирования текущего кадра аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Опорный параметр кодирования текущего кадра аудио связан с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.
[0222] На фиг. 10 показана структурная блок-схема аудиокодера 1000 согласно другому варианту осуществления настоящего изобретения.
[0223] Аудиокодер 1000 может включать в себя, по меньшей мере, один процессор 1001, память 1005 и, по меньшей мере, одну шину 1002 связи. Шина 1002 связи выполнена с возможностью реализации соединения и связи между компонентами.
[0224] В необязательном порядке, аудиокодер 1000 может дополнительно включать в себя, по меньшей мере, один сетевой интерфейс 1004, пользовательский интерфейс 1003 и пр. В необязательном порядке, пользовательский интерфейс 1003 включает в себя дисплей (например, сенсорный экран, жидкокристаллический дисплей, устройство формирования голографического (по-английски: Holographic) изображения или проектор (по-английски: Projector)), указательное устройство (например, мышь, шаровой манипулятор (по-английски: trackball), сенсорную панель или сенсорный экран), камеру и/или считывающее устройство.
[0225] Память 1005 может включать в себя постоянную память и оперативную память и обеспечивать инструкцию и данные для процессора 1001. Часть памяти 1005 может дополнительно включать в себя энергонезависимую оперативную память.
[0226] В некоторых вариантах реализации, в памяти 1005 хранятся следующие элементы, исполнимые модули или структуры данных, или их подмножество, или их расширяющее множество: блок 910 временно-частотного преобразования, блок 920 получения и блок 930 кодирования.
[0227] В этом варианте осуществления настоящего изобретения, процессор 1001 выполняет код или инструкцию в памяти 1005, чтобы: осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио; получать опорный параметр кодирования текущего кадра аудио; и если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет первому условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием, или если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет второму условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества.
[0228] Согласно требованию сценария применения, опорный параметр кодирования, полученный процессором 1001 и относящийся к текущему кадру аудио, может изменяться.
[0229] Например, опорный параметр кодирования может включать в себя, по меньшей мере, один из следующих параметров: скорости кодирования текущего кадра аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио; среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио; среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио; огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио; или значения параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио.
[0230] Большее значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио указывает более сильную спектральную корреляцию между спектральными коэффициентами, расположенными в подполосе p, и спектральными коэффициентами, расположенными в подполосе q. Значение параметра спектральной корреляции может быть, например, значением параметра нормализованной кросс-корреляции.
[0231] Диапазоны элемента разрешения по частоте подполос могут определяться согласно фактическим потребностям.
[0232] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы z может быть больше критического элемента F1 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы w может быть больше критического элемента F1 разрешения по частоте. Диапазон значений критического элемента F1 разрешения по частоте может составлять, например, от 6,4 кГц до 12 кГц. Например, значение критического элемента F1 разрешения по частоте может быть равно 6,4 кГц, 8 кГц, 9 кГц, 10 кГц или 12 кГц. Конечно, критический элемент F1 разрешения по частоте может иметь другое значение.
[0233] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы j может быть больше критического элемента F2 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте. Например, диапазон значений критического элемента F2 разрешения по частоте может составлять от 4,8 кГц до 8 кГц. В частности, например, значение критического элемента F2 разрешения по частоте может быть равно 6,4 кГц, 4,8 кГц, 6 кГц, 8 кГц, 5 кГц или 7 кГц. Конечно, критический элемент F2 разрешения по частоте может иметь другое значение.
[0234] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы i может быть меньше наибольшего элемента разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m может быть меньше наибольшего элемента разрешения по частоте подполосы n, наибольший элемент разрешения по частоте подполосы x может быть меньше или равен наименьшему элементу разрешения по частоте подполосы y, наибольший элемент разрешения по частоте подполосы p может быть меньше или равен наименьшему элементу разрешения по частоте подполосы q, наибольший элемент разрешения по частоте подполосы r может быть меньше или равен наименьшему элементу разрешения по частоте подполосы s, и наибольший элемент разрешения по частоте подполосы e может быть меньше или равен наименьшему элементу разрешения по частоте подполосы f.
[0235] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий:
наименьший элемент разрешения по частоте подполосы w больше или равен критическому элементу F1 разрешения по частоте, наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m меньше или равен наименьшему элементу разрешения по частоте подполосы n, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы m меньше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, или наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте.
[0236] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий:
наибольший элемент разрешения по частоте подполосы e меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы x меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы p меньше или равен критическому элементу F2 разрешения по частоте, или наибольший элемент разрешения по частоте подполосы r меньше или равен критическому элементу F2 разрешения по частоте.
[0237] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы f может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы f может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы q может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы q может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы s может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы s может быть больше или равен критическому элементу F2 разрешения по частоте.
[0238] Например, диапазон значений наибольшего элемента разрешения по частоте подполосы z может составлять от 12 кГц до 16 кГц. Диапазон значений наименьшего элемента разрешения по частоте подполосы z может составлять от 8 кГц до 14 кГц. Диапазон значений полосы подполосы z может составлять от 1,6 кГц до 8 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы z может составлять от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц или от 12 кГц до 14 кГц. Конечно, диапазон элемента разрешения по частоте подполосы z не ограничивается вышеприведенными примерами.
[0239] Например, диапазон элемента разрешения по частоте подполосы w может определяться согласно фактическим потребностям. Например, диапазон значений наибольшего элемента разрешения по частоте подполосы w может составлять от 12 кГц до 16 кГц, и диапазон значений наименьшего элемента разрешения по частоте подполосы w может составлять от 8 кГц до 14 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы w составляет от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц, от 12 кГц до 14 кГц или от 12,2 кГц до 14,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы w не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы w может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы z.
[0240] Например, диапазон элемента разрешения по частоте подполосы i может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы i не ограничивается вышеприведенными примерами.
[0241] Например, диапазон элемента разрешения по частоте подполосы j может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы j не ограничивается вышеприведенными примерами.
[0242] Например, диапазон элемента разрешения по частоте подполосы m может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы m не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы m может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы i.
[0243] Например, диапазон элемента разрешения по частоте подполосы n может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы n не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы n может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы j.
[0244] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2 кГц до 3,2 кГц или от 2,5 кГц до 3,4 кГц. Конечно, диапазон элемента разрешения по частоте подполосы x не ограничивается вышеприведенными примерами.
[0245] Например, диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,4 кГц до 6,4 кГц или от 4,5 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы y не ограничивается вышеприведенными примерами.
[0246] Например, диапазон элемента разрешения по частоте подполосы p может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,1 кГц до 3,2 кГц или от 2,5 кГц до 3,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы p не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы p может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.
[0247] Например, диапазон элемента разрешения по частоте подполосы q может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,2 кГц до 6,4 кГц или от 4,7 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы q не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы q может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.
[0248] Например, диапазон элемента разрешения по частоте подполосы r может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,05 кГц до 3,27 кГц или от 2,59 кГц до 3,51 кГц. Конечно, диапазон элемента разрешения по частоте подполосы r не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы r может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.
[0249] Например, диапазон элемента разрешения по частоте подполосы s может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,4 кГц до 7,1 кГц или от 4,55 кГц до 6,29 кГц. Конечно, диапазон элемента разрешения по частоте подполосы s не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы s может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.
[0250] Например, диапазон элемента разрешения по частоте подполосы e может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 0,8 кГц до 3 кГц или от 1,9 кГц до 3,8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы e не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы e может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.
[0251] Например, диапазон элемента разрешения по частоте подполосы f может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,3 кГц до 7,15 кГц или от 4,58 кГц до 6,52 кГц. Конечно, диапазон элемента разрешения по частоте подполосы f не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы f может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.
[0252] Первое условие параметра и второе условие параметра может изменяться.
[0253] Например, в некоторых возможных вариантах реализации настоящего изобретения, первое условие параметра в этом варианте осуществления может быть, например, первым условием параметра согласно варианту осуществления способа, и второе условие параметра в этом варианте осуществления может быть, например, вторым условием параметра согласно варианту осуществления способа. За соответствующими описаниями, обратимся к записям согласно варианту осуществления способа.
[0254] Очевидно, что функции каждого функционального модуля аудиокодера 1000 в этом варианте осуществления, в частности, могут быть реализованы согласно способам вышеприведенных вариантов осуществления способа. За конкретным процессом реализации, обратимся к соответствующему описанию вышеприведенных вариантов осуществления способа, и детали здесь не описаны.
[0255] Аудиокодер 1000 может представлять собой любое устройство, которое необходимо для сбора, сохранения или передачи аудиосигнала, например, мобильный телефон, планшетный компьютер, персональный компьютер или компьютер-ноутбук.
[0256] Как можно видеть, в решениях этого варианта осуществления, после получения опорного параметра кодирования текущего кадра аудио, аудиокодер 1000 выбирает алгоритм TCX или алгоритм HQ на основании полученного опорного параметра кодирования текущего кадра аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Опорный параметр кодирования текущего кадра аудио связан с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.
[0257] Дополнительно, используется несколько необязательных опорных параметров кодирования, что позволяет удовлетворять требованиям выбора алгоритма в нескольких сценариях.
[0258] Вариант осуществления настоящего изобретения дополнительно предусматривает компьютерный носитель данных, причем на компьютерном носителе данных может храниться программа, и когда программа выполняется, осуществляются некоторые или все этапы способа аудиокодирования, записанные согласно варианту осуществления способа.
[0259] Следует отметить, что, для краткого описания, вышеприведенные варианты осуществления способа представлены в виде нескольких действий. Однако специалистам в данной области техники очевидно, что настоящее изобретение не ограничивается описанным порядком действий, поскольку, согласно настоящему изобретению, некоторые этапы могут осуществляться в других порядках или одновременно. Специалисту в данной области техники также очевидно, что все варианты осуществления, описанные в этом описании изобретения принадлежат иллюстративным вариантам осуществления, и предусмотренные действия и модули не обязательно требуются согласно настоящему изобретению.
[0260] Согласно вышеприведенным вариантам осуществления, описание каждого варианта осуществления сосредоточены на соответствующих аспектах. За частью, которая не описана подробно согласно варианту осуществления, можно обратиться к соответствующим описаниям в других вариантах осуществления.
[0261] В некоторых вариантах осуществления, представленных в настоящей заявке, следует понимать, что раскрытое устройство можно реализовать иначе. Например, описанный вариант осуществления устройства является лишь иллюстративным. Например, разделение на блоки является лишь разделение на логические функции, и в фактической реализации может существовать другое разделение. Например, несколько блоков или компонентов может быть объединено или интегрировано в другую систему, или некоторые признаки можно игнорировать или не осуществлять. Кроме того, отображаемые или рассматриваемые взаимные соединения или прямые соединения или коммуникационные соединения можно реализовать через некоторые интерфейсы. Непрямые соединения или коммуникационные соединения между устройствами иди блоками могут быть реализованы электрическими, механическими или другими средствами.
[0262] Блоки, описанные как отдельные части могут быть или не быть физически отдельными, и части, отображаемые как блоки, могут быть или не быть физическими блоками, могут располагаться в одном положении, или могут распределяться по множеству сетевых блоков. Некоторые или все из блоков могут выбираться согласно фактическим потребностям для решения задач вариантов осуществления.
[0263] Кроме того, функциональные блоки согласно вариантам осуществления настоящего изобретения могут интегрироваться в один блок обработки, или каждый из блоков может существовать физически отдельно, или два или более блоков интегрированы в один блок. Объединенный блок можно реализовать в форме оборудования или можно реализовать в форме программного функционального блока.
[0264] Когда объединенный блок реализован в форме программного функционального блока и продается или используется как независимый продукт, объединенный блок может храниться на компьютерно-считываемом носителе данных. На основании такого понимания, технические решения настоящего изобретения, по существу, или часть, вносящая вклад в уровень техники, или все или часть технических решений можно реализовать в форме программного продукта. Программный продукт хранится на носителе данных и включает в себя несколько инструкций для предписания компьютерному устройству (которым может быть персональный компьютер, сервер или сетевое устройство) для осуществления всех или некоторых из этапов способов, описанных согласно вариантам осуществления настоящего изобретения. Вышеупомянутый носитель данных включает в себя: любой носитель, где может храниться программный код, например, флэш-носитель с интерфейсом USB, сменный жесткий диск, постоянную память (ROM, Read-Only Memory), оперативную память (RAM, Random Access Memory), магнитный диск или оптический диск.
[0265] Вышеприведенные варианты осуществления предназначены лишь для описания технических решений настоящего изобретения, но не для ограничения настоящего изобретения. Хотя настоящее изобретение подробно описано согласно вышеприведенным вариантам осуществления, специалисты в данной области техники должны понимать, что они могут вносить изменения в технические решения, описанные согласно вышеприведенным вариантам осуществления или делать эквивалентные замены в некоторых их технических особенностях, не выходя за рамки объема технических решений вариантов осуществления настоящего изобретения.
ПЕРЕВОД ЧЕРТЕЖЕЙ
фиг. 1
101. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио
102. получать опорный параметр кодирования текущего кадра аудио
103. если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет первому условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием
104. если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет второму условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества
фиг. 2
201. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио
202. Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио
203. Больше или равно ли частное средних по энергии порогу T4
204. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием
205. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества
фиг. 3
301. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио
302. Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио
303. определять, больше или равно ли частное средних по энергии порогу T68
304. Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио
305. больше ли отношение пикового значения к среднему, чем порог T69
306. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием
307. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества
фиг. 4
401. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио
402. Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио
403. попадает ли отношение между отношениями пикового значения к среднему в интервал R1
404. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием
405. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества
фиг. 5
501. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио
502. Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио
503. больше или равно ли частное отношений пикового значения к среднему порогу T46
504. больше или равно ли отношение пикового значения к среднему спектральных коэффициентов, расположенных в подполосе y, порогу T47
505. меньше ли отношение пикового значения к среднему спектральных коэффициентов, расположенных в подполосе y, чем порог T47
506. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием
507. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества
фиг. 6
601. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио
602. Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио
603. попадает ли отношение отношений пикового значения к среднему в интервал R1
604. Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио
605. больше или равно ли частное средних по энергии порогу T16
606. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием
607. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества
фиг. 7
701. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио
702. больше или равна ли скорость кодирования текущего кадра аудио порогу T1
703. Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио
704. больше или равно ли частное средних по энергии порогу T12
705. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием
706. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества
фиг. 8
801. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио
802. Получать среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио и среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио
803. больше или равно ли частное средних по амплитуде порогу T6
804. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием
805. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества
фиг. 9
900. Аудиокодер
910. блок временно-частотного преобразования
920. Блок получения
930. Блок кодирования
фиг. 10
1000. Аудиокодер
1001. Процессор
1003. Пользовательский интерфейс
1004. Сетевой интерфейс
1005. Память

Claims (95)

1. Способ аудиокодирования, содержащий этапы, на которых:
осуществляют обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;
получают один или более опорных параметров кодирования текущего кадра аудио; и
если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет любому одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием; или
если полученный опорный параметр кодирования текущего кадра аудио не удовлетворяет ни одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества;
причем текущий кадр содержит подполосу z, подполосу i и подполосу j, при этом подполосы z, i и j являются такими, что:
наибольший элемент разрешения по частоте подполосы z больше, чем критический элемент F1 разрешения по частоте, диапазон значений критического элемента F1 разрешения по частоте составляет от 6,4 кГц до 12 кГц;
наибольший элемент разрешения по частоте подполосы i меньше, чем наибольший элемент разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте, и диапазон значений критического элемента F2 разрешения по частоте составляет от 4,8 кГц до 8 кГц;
при этом опорные параметры кодирования содержат:
пиковое значение спектральных коэффициентов, расположенных в пределах подполосы z, и среднее значение спектральных коэффициентов, расположенных в пределах подполосы z; и
среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы i, и среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы j; и
при этом условия параметра содержат следующее условие параметра:
пиковое значение спектральных коэффициентов, расположенных в пределах подполосы z, больше, чем среднее значение спектральных коэффициентов, расположенных в пределах подполосы z, умноженное на порог Т2; и
средняя энергия спектральных коэффициентов, расположенных в пределах подполосы j, больше, чем произведение средней энергии спектральных коэффициентов, расположенных в пределах подполосы i, умноженной на порог Т4.
2. Способ по п. 1, в котором наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j или наименьший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте.
3. Способ по п. 1 или 2, в котором порог Т2 является не меньше чем 1, или порог Т2 является не меньше чем 2, или порог Т2 является не меньше чем 3, или порог Т2 является не меньше чем 5; и
при этом порог Т4 является не меньше чем 0,5, или порог Т4 является не меньше чем 1, или порог Т4 является не меньше чем 2, или порог Т4 является не меньше чем 3.
4. Способ по п. 1 или 2, в котором диапазон элементов разрешения по частоте подполосы z от 8 кГц до 12 кГц, или от 9 кГц до 11 кГц, или от 8 кГц до 9,6 кГц, или от 12 кГц до 14 кГц;
при этом диапазон элементов разрешения по частоте подполосы i от 3,2 кГц до 6,4 кГц, или от 3,2 кГц до 4,8 кГц, или от 4,8 кГц до 6,4 кГц, или от 0,4 кГц до 6,4 кГц, или от 0,4 кГц до 3,6 кГц; и
при этом диапазон элементов разрешения по частоте подполосы j от 6,4 кГц до 9,6 кГц, или от 6,4 кГц до 8 кГц, или от 8 кГц до 9,6 кГц, или от 4,8 кГц до 9,6 кГц, или от 4,8 кГц до 8 кГц.
5. Способ аудиокодирования, содержащий этапы, на которых:
осуществляют обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;
получают один или более опорных параметров кодирования текущего кадра аудио; и
если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет любому одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием; или
если полученный опорный параметр кодирования текущего кадра аудио не удовлетворяет ни одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества;
причем текущий кадр содержит подполосу i и подполосу j;
при этом наибольший элемент разрешения по частоте подполосы i меньше, чем наибольший элемент разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы j больше критического элемента F2 разрешения по частоте, и F2 находится в диапазоне от 4,8 кГц до 8 кГц;
причем опорные параметры кодирования содержат:
среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы i, и среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы j;
и при этом условия параметра содержат следующее условие параметра:
средняя энергия спектральных коэффициентов, размещенных в пределах подполосы j больше, чем произведение средней энергии спектральных коэффициентов, расположенных в пределах подполосы i, умноженной на порог Т4.
6. Способ по п. 5, в котором наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j или наименьший элемент разрешения по частоте подполосы j больше критического элемента разрешения по частоте F2.
7. Способ по п. 5 или 6, в котором порог Т4 является не меньше чем 0,5, или порог Т4 является не меньше чем 1, или порог Т4 является не меньше чем 2, или порог Т4 является не меньше чем 3.
8. Способ по п. 5 или 6, в котором диапазон элементов разрешения по частоте подполосы i от 3,2 кГц до 6,4 кГц, или от 3,2 кГц до 4,8 кГц, или от 4,8 кГц до 6,4 кГц, или от 0,4 кГц до 6,4 кГц, или от 0,4 кГц до 3,6 кГц; и
диапазон элементов разрешения по частоте подполосы j от 6,4 кГц до 9,6 кГц, или от 6,4 кГц до 8 кГц, или от 8 кГц до 9,6 кГц, или от 4,8 кГц до 9,6 кГц, или от 4,8 кГц до 8 кГц.
9. Способ аудиокодирования, содержащий этапы, на которых:
осуществляют обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;
получают один или более опорных параметров кодирования текущего кадра аудио; и
если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет любому одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием; или
если полученный опорный параметр кодирования текущего кадра аудио не удовлетворяет ни одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества;
причем текущий кадр содержит подполосу x и подполосу y;
при этом наибольший элемент разрешения по частоте подполосы x меньше или равен наименьшему элементу разрешения по частоте подполосы y;
причем опорные параметры кодирования содержат:
пиковое значение спектральных коэффициентов, расположенных в пределах подполосы x, и среднее значение спектральных коэффициентов, расположенных в пределах подполосы x; пиковое значение спектральных коэффициентов, расположенных в пределах подполосы y, и среднее значение спектральных коэффициентов, расположенных в пределах подполосы y; и
при этом условия параметра содержат следующее условие параметра:
произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы x, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы y, меньше, чем произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы y, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы x и умноженного на наименьшее значение интервала R1; или
произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы x, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы y, больше, чем произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы y, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы x, и умноженного на наибольшее значение интервала R1.
10. Способ по п. 9, в котором интервал R1 составляет [0,5, 2], или интервал R1 составляет [0,4, 2,5], или интервал R1 составляет [0,8, 1,25].
11. Способ по п. 9 или 10, в котором диапазон элементов разрешения по частоте подполосы x от 1 кГц до 2,6 кГц и диапазон элементов разрешения по частоте подполосы y от 4,8 кГц до 6,4 кГц.
12. Аудиокодер, содержащий:
блок временно-частотного преобразования, выполненный с возможностью осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;
блок получения, выполненный с возможностью получения одного или более опорных параметров кодирования текущего кадра аудио; и
блок кодирования, выполненный с возможностью: если опорные параметры кодирования текущего кадра аудио удовлетворяют любому одному из набора условий параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием, или если опорные параметры кодирования текущего кадра аудио не удовлетворяют ни одному из условий параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества;
причем текущий кадр содержит подполосу z, подполосу i и подполосу j, при этом подполосы z, i и j являются такими, что:
наибольший элемент разрешения по частоте подполосы z больше, чем критический элемент F1 разрешения по частоте, диапазон значений критического элемента F1 разрешения по частоте составляет от 6,4 кГц до 12 кГц;
наибольший элемент разрешения по частоте подполосы i меньше, чем наибольший элемент разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте, и диапазон значений критического элемента F2 разрешения по частоте составляет от 4,8 кГц до 8 кГц; и
при этом опорные параметры кодирования содержат:
пиковое значение спектральных коэффициентов, расположенных в пределах подполосы z, и среднее значение спектральных коэффициентов, расположенных в пределах подполосы z; и
среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы i, и среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы j; и
при этом условия параметра содержат следующее условие параметра:
пиковое значение спектральных коэффициентов, расположенных в пределах подполосы z, больше, чем среднее значение спектральных коэффициентов, расположенных в пределах подполосы z, умноженное на порог Т2; и
средняя энергия спектральных коэффициентов, расположенных в пределах подполосы j, больше, чем произведение средней энергии спектральных коэффициентов, расположенных в пределах подполосы i, умноженной на порог Т4.
13. Аудиокодер по п. 12, в котором наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j или наименьший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте.
14. Аудиокодер по п. 12 или 13, в котором порог Т2 является не меньше чем 1, или порог Т2 является не меньше чем 2, или порог Т2 является не меньше чем 3, или порог Т2 является не меньше чем 5; и
при этом порог Т4 является не меньше чем 0,5, или порог Т4 является не меньше чем 1, или порог Т4 является не меньше чем 2, или порог Т4 является не меньше чем 3.
15. Аудиокодер по п. 12 или 13, в котором диапазон элементов разрешения по частоте подполосы z от 8 кГц до 12 кГц, или от 9 кГц до 11 кГц, или от 8 кГц до 9,6 кГц, или от 12 кГц до 14 кГц;
при этом диапазон элементов разрешения по частоте подполосы i от 3,2 кГц до 6,4 кГц, или от 3,2 кГц до 4,8 кГц, или от 4,8 кГц до 6,4 кГц, или от 0,4 кГц до 6,4 кГц, или от 0,4 кГц до 3,6 кГц; и
при этом диапазон элементов разрешения по частоте подполосы j от 6,4 кГц до 9,6 кГц, или от 6,4 кГц до 8 кГц, или от 8 кГц до 9,6 кГц, или от 4,8 кГц до 9,6 кГц, или от 4,8 кГц до 8 кГц.
16. Аудиокодер, содержащий:
блок временно-частотного преобразования, выполненный с возможностью осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;
блок получения, выполненный с возможностью получения одного или более опорных параметров кодирования текущего кадра аудио; и
блок кодирования, выполненный с возможностью: если опорные параметры кодирования текущего кадра аудио удовлетворяют любому одному из набора условий параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием, или если опорные параметры кодирования текущего кадра аудио не удовлетворяют ни одному из условий параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества;
причем текущий кадр содержит подполосу i и подполосу j;
при этом наибольший элемент разрешения по частоте подполосы i меньше, чем наибольший элемент разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы j больше критического элемента F2 разрешения по частоте, и F2 находится в диапазоне от 4,8 кГц до 8 кГц;
причем опорные параметры кодирования содержат:
среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы i, и среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы j;
и при этом условия параметра содержат следующее условие параметра:
средняя энергия спектральных коэффициентов, размещенных в пределах подполосы j больше, чем произведение средней энергии спектральных коэффициентов, расположенных в пределах подполосы i, умноженной на порог Т4.
17. Аудиокодер по п. 16, в котором наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j или наименьший элемент разрешения по частоте подполосы j больше критического элемента разрешения по частоте F2.
18. Аудиокодер по п. 16 или 17, в котором порог Т4 является не меньше чем 0,5, или порог Т4 является не меньше чем 1, или порог Т4 является не меньше чем 2, или порог Т4 является не меньше чем 3.
19. Аудиокодер по п. 16 или 17, в котором диапазон элементов разрешения по частоте подполосы i от 3,2 кГц до 6,4 кГц, или от 3,2 кГц до 4,8 кГц, или от 4,8 кГц до 6,4 кГц, или от 0,4 кГц до 6,4 кГц, или от 0,4 кГц до 3,6 кГц; и
диапазон элементов разрешения по частоте подполосы j от 6,4 кГц до 9,6 кГц, или от 6,4 кГц до 8 кГц, или от 8 кГц до 9,6 кГц, или от 4,8 кГц до 9,6 кГц, или от 4,8 кГц до 8 кГц.
20. Аудиокодер, содержащий:
блок временно-частотного преобразования, выполненный с возможностью осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;
блок получения, выполненный с возможностью получения одного или более опорных параметров кодирования текущего кадра аудио; и
блок кодирования, выполненный с возможностью: если опорные параметры кодирования текущего кадра аудио удовлетворяют любому одному из набора условий параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием, или если опорные параметры кодирования текущего кадра аудио не удовлетворяют ни одному из условий параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества;
причем текущий кадр содержит подполосу x и подполосу y;
при этом наибольший элемент разрешения по частоте подполосы x меньше или равен наименьшему элементу разрешения по частоте подполосы y;
причем опорные параметры кодирования содержат:
пиковое значение спектральных коэффициентов, расположенных в пределах подполосы x, и среднее значение спектральных коэффициентов, расположенных в пределах подполосы x; пиковое значение спектральных коэффициентов, расположенных в пределах подполосы y, и среднее значение спектральных коэффициентов, расположенных в пределах подполосы y; и
при этом условия параметра содержат следующее условие параметра:
произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы x, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы y, меньше, чем произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы y, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы x, и умноженного на наименьшее значение интервала R1; или
произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы x, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы y, больше, чем произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы y, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы x, и умноженного на наибольшее значение интервала R1.
21. Аудиокодер по п. 20, в котором интервал R1 составляет [0,5, 2], или интервал R1 составляет [0,4, 2,5], или интервал R1 составляет [0,8, 1,25].
22. Аудиокодер по п. 20 или 21, в котором диапазон элементов разрешения по частоте подполосы x от 1 кГц до 2,6 кГц и диапазон элементов разрешения по частоте подполосы y от 4,8 кГц до 6,4 кГц.
RU2017101806A 2014-07-28 2015-04-01 Способ аудиокодирования и соответствующее устройство RU2670790C9 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410363905.5 2014-07-28
CN201410363905.5A CN104143335B (zh) 2014-07-28 2014-07-28 音频编码方法及相关装置
PCT/CN2015/075645 WO2016015485A1 (zh) 2014-07-28 2015-04-01 音频编码方法及相关装置

Publications (4)

Publication Number Publication Date
RU2017101806A RU2017101806A (ru) 2018-08-30
RU2017101806A3 RU2017101806A3 (ru) 2018-08-30
RU2670790C2 true RU2670790C2 (ru) 2018-10-25
RU2670790C9 RU2670790C9 (ru) 2018-11-23

Family

ID=51852493

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017101806A RU2670790C9 (ru) 2014-07-28 2015-04-01 Способ аудиокодирования и соответствующее устройство

Country Status (15)

Country Link
US (4) US10056089B2 (ru)
EP (2) EP3790007B1 (ru)
JP (2) JP6538822B2 (ru)
KR (2) KR102022500B1 (ru)
CN (2) CN104143335B (ru)
AU (2) AU2015296447B2 (ru)
BR (1) BR112016029904B1 (ru)
CA (3) CA3064092C (ru)
ES (2) ES2938742T3 (ru)
MX (1) MX360606B (ru)
MY (1) MY174461A (ru)
PL (1) PL3790007T3 (ru)
RU (1) RU2670790C9 (ru)
SG (2) SG11201610047RA (ru)
WO (1) WO2016015485A1 (ru)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104143335B (zh) * 2014-07-28 2017-02-01 华为技术有限公司 音频编码方法及相关装置
JP6501259B2 (ja) * 2015-08-04 2019-04-17 本田技研工業株式会社 音声処理装置及び音声処理方法
US20220254331A1 (en) * 2021-02-05 2022-08-11 Cambium Assessment, Inc. Neural network and method for machine learning assisted speech recognition
CN112767956B (zh) * 2021-04-09 2021-07-16 腾讯科技(深圳)有限公司 音频编码方法、装置、计算机设备及介质
WO2023274507A1 (en) * 2021-06-29 2023-01-05 Telefonaktiebolaget Lm Ericsson (Publ) Spectrum classifier for audio coding mode selection

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030195742A1 (en) * 2002-04-11 2003-10-16 Mineo Tsushima Encoding device and decoding device
US20050240399A1 (en) * 2004-04-21 2005-10-27 Nokia Corporation Signal encoding
US20080312912A1 (en) * 2007-06-12 2008-12-18 Samsung Electronics Co., Ltd Audio signal encoding/decoding method and apparatus
RU2011117699A (ru) * 2008-10-08 2012-11-10 Фраунхофер-Гезелльшафт цур Фердерунг дер ангевандтен (DE) Переключаемая аудиокодирующая/декодирующая схема с мультиразрешением
US20130030796A1 (en) * 2010-01-14 2013-01-31 Panasonic Corporation Audio encoding apparatus and audio encoding method

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3364825B2 (ja) * 1996-05-29 2003-01-08 三菱電機株式会社 音声符号化装置および音声符号化復号化装置
EP0932141B1 (en) * 1998-01-22 2005-08-24 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
CA2246532A1 (en) * 1998-09-04 2000-03-04 Northern Telecom Limited Perceptual audio coding
US6721280B1 (en) 2000-04-19 2004-04-13 Qualcomm Incorporated Method and apparatus for voice latency reduction in a voice-over-data wireless communication system
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
DE60230856D1 (de) 2001-07-13 2009-03-05 Panasonic Corp Audiosignaldecodierungseinrichtung und audiosignalcodierungseinrichtung
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
US7333930B2 (en) 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
CN101185127B (zh) * 2005-04-01 2014-04-23 高通股份有限公司 用于编码和解码语音信号的高频带部分的方法和设备
KR20080101872A (ko) 2006-01-18 2008-11-21 연세대학교 산학협력단 부호화/복호화 장치 및 방법
CN101496099B (zh) * 2006-07-31 2012-07-18 高通股份有限公司 用于对有效帧进行宽带编码和解码的***、方法和设备
CN101145345B (zh) * 2006-09-13 2011-02-09 华为技术有限公司 音频分类方法
CN101145343B (zh) * 2006-09-15 2011-07-20 展讯通信(上海)有限公司 一种用于音频处理框架中的编码和解码方法
CN101025918B (zh) * 2007-01-19 2011-06-29 清华大学 一种语音/音乐双模编解码无缝切换方法
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
JP5244971B2 (ja) 2008-07-11 2013-07-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号合成器及びオーディオ信号符号器
PL2346030T3 (pl) * 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
JP5551695B2 (ja) * 2008-07-11 2014-07-16 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声符号器、音声復号器、音声符号化方法、音声復号化方法およびコンピュータプログラム
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
WO2010003545A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. An apparatus and a method for decoding an encoded audio signal
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
US8498874B2 (en) 2009-09-11 2013-07-30 Sling Media Pvt Ltd Audio signal encoding employing interchannel and temporal redundancy reduction
RU2591661C2 (ru) * 2009-10-08 2016-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Многорежимный декодировщик аудио сигнала, многорежимный кодировщик аудио сигналов, способы и компьютерные программы с использованием кодирования с линейным предсказанием на основе ограничения шума
AU2010309838B2 (en) * 2009-10-20 2014-05-08 Dolby International Ab Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
EP2491555B1 (en) * 2009-10-20 2014-03-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode audio codec
US8886523B2 (en) 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
WO2011158485A2 (ja) 2010-06-14 2011-12-22 パナソニック株式会社 オーディオハイブリッド符号化装置およびオーディオハイブリッド復号装置
WO2011156905A2 (en) 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CN102074242B (zh) * 2010-12-27 2012-03-28 武汉大学 语音音频混合分级编码中核心层残差提取***及方法
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
US9037456B2 (en) * 2011-07-26 2015-05-19 Google Technology Holdings LLC Method and apparatus for audio coding and decoding
CN103477388A (zh) * 2011-10-28 2013-12-25 松下电器产业株式会社 声音信号混合解码器、声音信号混合编码器、声音信号解码方法及声音信号编码方法
US9111531B2 (en) 2012-01-13 2015-08-18 Qualcomm Incorporated Multiple coding mode signal classification
ES2661504T3 (es) * 2012-05-30 2018-04-02 Nippon Telegraph And Telephone Corporation Método de codificación, codificador, programa y medio de grabación
CN104143335B (zh) * 2014-07-28 2017-02-01 华为技术有限公司 音频编码方法及相关装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030195742A1 (en) * 2002-04-11 2003-10-16 Mineo Tsushima Encoding device and decoding device
US20050240399A1 (en) * 2004-04-21 2005-10-27 Nokia Corporation Signal encoding
US20080312912A1 (en) * 2007-06-12 2008-12-18 Samsung Electronics Co., Ltd Audio signal encoding/decoding method and apparatus
RU2011117699A (ru) * 2008-10-08 2012-11-10 Фраунхофер-Гезелльшафт цур Фердерунг дер ангевандтен (DE) Переключаемая аудиокодирующая/декодирующая схема с мультиразрешением
US20130030796A1 (en) * 2010-01-14 2013-01-31 Panasonic Corporation Audio encoding apparatus and audio encoding method

Also Published As

Publication number Publication date
RU2670790C9 (ru) 2018-11-23
US20180268832A1 (en) 2018-09-20
EP3790007A1 (en) 2021-03-10
US20200066290A1 (en) 2020-02-27
BR112016029904B1 (pt) 2023-04-18
KR101947127B1 (ko) 2019-02-12
CA3064092A1 (en) 2016-02-04
CA2951321A1 (en) 2016-02-04
CA2951321C (en) 2019-12-31
PL3790007T3 (pl) 2023-05-02
RU2017101806A (ru) 2018-08-30
WO2016015485A1 (zh) 2016-02-04
KR20170010822A (ko) 2017-02-01
CN106448688A (zh) 2017-02-22
EP3790007B1 (en) 2023-01-04
EP3157010A1 (en) 2017-04-19
CA3058990A1 (en) 2016-02-04
MY174461A (en) 2020-04-20
US10706866B2 (en) 2020-07-07
JP2019164379A (ja) 2019-09-26
JP6888051B2 (ja) 2021-06-16
US20190164562A1 (en) 2019-05-30
KR20190014603A (ko) 2019-02-12
CN104143335A (zh) 2014-11-12
ES2814154T3 (es) 2021-03-26
SG11201610047RA (en) 2017-01-27
JP6538822B2 (ja) 2019-07-03
US10504534B2 (en) 2019-12-10
AU2018201411A1 (en) 2018-03-22
KR102022500B1 (ko) 2019-11-25
SG10201805102PA (en) 2018-08-30
ES2938742T3 (es) 2023-04-14
AU2015296447A1 (en) 2017-01-05
CN104143335B (zh) 2017-02-01
RU2017101806A3 (ru) 2018-08-30
US20170125031A1 (en) 2017-05-04
BR112016029904A2 (pt) 2017-08-22
CA3064092C (en) 2022-04-19
US10056089B2 (en) 2018-08-21
CN106448688B (zh) 2019-11-05
EP3157010B1 (en) 2020-06-10
JP2017522608A (ja) 2017-08-10
AU2015296447B2 (en) 2018-01-18
EP3157010A4 (en) 2017-10-25
AU2018201411B2 (en) 2019-08-22
MX360606B (es) 2018-11-09
US10269366B2 (en) 2019-04-23
MX2017001039A (es) 2017-05-04

Similar Documents

Publication Publication Date Title
JP6888051B2 (ja) 音声符号化方法および関連装置
JP6202545B2 (ja) 帯域幅拡張周波数帯域信号を予測する方法、および復号デバイス
BR112016006925B1 (pt) Metodo e aparelho de codificaqao
EP2661746A1 (en) Multi-channel encoding and/or decoding
JP2021043453A (ja) 信号処理方法及び装置
AU2014286765A1 (en) Signal encoding and decoding methods and devices
JP5783395B2 (ja) 信号処理方法およびデバイス
EP3090574B1 (en) Method and apparatus for improved ambisonic decoding

Legal Events

Date Code Title Description
TH4A Reissue of patent specification