RU2644078C1 - Способ, устройство и система кодирования/декодирования - Google Patents

Способ, устройство и система кодирования/декодирования Download PDF

Info

Publication number
RU2644078C1
RU2644078C1 RU2016151460A RU2016151460A RU2644078C1 RU 2644078 C1 RU2644078 C1 RU 2644078C1 RU 2016151460 A RU2016151460 A RU 2016151460A RU 2016151460 A RU2016151460 A RU 2016151460A RU 2644078 C1 RU2644078 C1 RU 2644078C1
Authority
RU
Russia
Prior art keywords
signal
full
range
frequency
audio signal
Prior art date
Application number
RU2016151460A
Other languages
English (en)
Inventor
Бинь Ван
Цзэсинь ЛЮ
Лэй МЯО
Original Assignee
Хуавэй Текнолоджиз Ко., Лтд.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=54936715&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=RU2644078(C1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Хуавэй Текнолоджиз Ко., Лтд. filed Critical Хуавэй Текнолоджиз Ко., Лтд.
Application granted granted Critical
Publication of RU2644078C1 publication Critical patent/RU2644078C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к области кодирования и декодирования аудиосигналов. Технический результат заключается в снижении сигнального искажения аудиосигналов. Технический результат достигается за счет обработки с коррекцией предыскажений, которая выполняется в отношении полнодиапазонного сигнала за счет использования параметра коррекции предыскажений, определяемого согласно характеристическому фактору входного аудиосигнала, и затем полнодиапазонный сигнал кодируется и отправляется декодеру, чтобы декодер выполнял соответствующую обработку с декодированием и коррекцией предыскажений в отношении полнодиапазонного сигнала согласно характеристическому фактору входного аудиосигнала и восстанавливал входной аудиосигнал. 4 н. и 16 з.п. ф-лы, 7 ил.

Description

Область техники, к которой относится изобретение
Настоящее изобретение относится к технологиям обработки аудиосигналов и, в частности, к способу, устройству и системе кодирования/декодирования во временной области.
Уровень техники
Учитывая, что уши человека менее чувствительны к высокочастотной информации, чем к низкочастотной информации аудиосигнала, для сохранения пропускной способности канала и объема памяти высокочастотную информацию обычно «вырезают», что приводит к снижению качества аудиосигнала. Поэтому применяется технология расширения диапазона частот для восстановления «вырезанной» высокочастотной информации, с тем чтобы улучшить качество аудиосигнала. Поскольку скорость передачи аудиосигналов увеличивается, при этом обеспечивая эффективность кодирования, более широкий диапазон высокочастотной части, которая может быть кодирована, позволяет приемнику получать аудиосигнал с более широким диапазоном и более высоким качеством.
В уровне техники при условии высокой передачи аудиосигналов частотный спектр входного аудиосигнала может быть кодирован во всем диапазоне с использованием технологии расширения диапазона частот. Основной принцип кодирования состоит в следующем: выполняют обработку с полосовой фильтрацией в отношении входного аудиосигнала с использованием полосового фильтра (Band Pass Filter - BPF для краткости), чтобы получить полнодиапазонный сигнал для входного аудиосигнала; выполняют расчет энергии в отношении полнодиапазонного сигнала, чтобы получить энергию Ener0 полнодиапазонного сигнала; выполняют кодирование сигнала высокочастотного диапазона с использованием кодера на основе технологий расширения временного диапазона (Time Band Extension - TBE для краткости) и суперширокого диапазона (Super Wide Band - SWB для краткости), чтобы получить информацию кодирования в высокочастотном диапазоне; согласно сигналу высокочастотного диапазона определяют коэффициент кодирования с линейным прогнозированием (Linear Predictive Coding - LPC для краткости) в полном диапазоне и полнодиапазонный (Full Band - FB для краткости) сигнал возбуждения (Excitation), которые используются для прогнозирования полнодиапазонного сигнала; выполняют обработку с прогнозированием согласно коэффициенту LPC и FB сигналу возбуждения для получения прогнозируемого полнодиапазонного сигнала; выполняют обработку с коррекцией предыскажений в отношении прогнозируемого полнодиапазонного сигнала для определения энергии Ener1 прогнозируемого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений; и вычисляют энергетическое отношение Ener1 к Ener0. Информацию кодирования в высокочастотном диапазоне и энергетическое отношение передают декодеру, чтобы декодер мог восстанавливать полнодиапазонный сигнал для входного аудиосигнала согласно информации кодирования в высокочастотном диапазоне и энергетическому отношению и восстанавливать входной аудиосигнал.
В вышеописанном решении входной аудиосигнал, восстанавливаемый декодером, с высокой вероятностью имеет относительно сильное сигнальное искажение.
Раскрытие изобретения
Варианты осуществления настоящего изобретения обеспечивают способ, устройство и систему кодирования/декодирования для смягчения или устранения проблемы уровня техники, состоящей в том, что входной аудиосигнал, восстанавливаемый декодером, с высокой вероятностью имеет относительно сильное сигнальное искажение.
Согласно первому аспекту настоящее изобретение обеспечивает способ кодирования, включающий в себя этапы, на которых:
используя устройство кодирования, кодируют сигнал низкочастотного диапазона входного аудиосигнала для получения характеристического фактора входного аудиосигнала;
используя устройство кодирования, выполняют кодирование и прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала;
используя устройство кодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяют согласно характеристическому фактору;
используя устройство кодирования, вычисляют первую энергию первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений;
используя устройство кодирования, выполняют обработку с полосовой фильтрацией в отношении входного аудиосигнала для получения второго полнодиапазонного сигнала;
используя устройство кодирования, вычисляют вторую энергию второго полнодиапазонного сигнала;
используя устройство кодирования, вычисляют энергетическое отношение второй энергии второго полнодиапазонного сигнала к первой энергии первого полнодиапазонного сигнала; и
используя устройство кодирования, отправляют на устройство декодирования битовый поток, получаемый в результате кодирования входного аудиосигнала, причем битовый поток включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение входного аудиосигнала.
Со ссылкой на первый аспект в первом возможном варианте реализации первого аспекта способ дополнительно включает в себя этапы, на которых:
используя устройство кодирования, получают количество характеристических факторов;
используя устройство кодирования, определяют среднее значение характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
используя устройство кодирования, определяют параметр коррекции предыскажений согласно среднему значению характеристических факторов.
Со ссылкой на первый аспект или первый возможный вариант реализации первого аспекта во втором возможном варианте реализации первого аспекта этап, на котором, используя устройство кодирования, выполняют прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала, включает в себя этапы, на которых:
используя устройство кодирования, определяют, согласно сигналу высокочастотного диапазона, коэффициент LPC и полнодиапазонный сигнал возбуждения, которые используют для прогнозирования полнодиапазонного сигнала; и
используя устройство кодирования, выполняют обработку с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Со ссылкой на любой один из первого аспекта или первого или второго возможного варианта реализации первого аспекта в третьем возможном варианте реализации первого аспекта этап, на котором, используя устройство кодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, включает в себя этапы, на которых:
используя устройство кодирования, выполняют коррекцию путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и выполняют обработку с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
используя устройство кодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
Со ссылкой на любой один из первого аспекта или первого, второго и третьего возможных вариантов реализации первого аспекта в четвертом возможном варианте реализации первого аспекта характеристический фактор используют для отражения характеристики аудиосигнала, и он включает в себя голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
Согласно второму аспекту, настоящее изобретение обеспечивает способ декодирования, включающий в себя этапы, на которых:
используя устройство декодирования, принимают битовый поток аудиосигнала, отправляемый устройством кодирования, причем битовый поток аудиосигнала включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение аудиосигнала, соответствующего битовому потоку аудиосигнала;
используя устройство декодирования, выполняют декодирование в низкочастотном диапазоне в отношении битового потока аудиосигнала с использованием характеристического фактора для получения сигнала низкочастотного диапазона;
используя устройство декодирования, выполняют декодирование в высокочастотном диапазоне в отношении битового потока аудиосигнала с использованием информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона;
используя устройство декодирования, выполняют прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала;
используя устройство декодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяют согласно характеристическому фактору;
используя устройство декодирования, вычисляют первую энергию первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений;
используя устройство декодирования, получают второй полнодиапазонный сигнал согласно энергетическому отношению, содержащемуся в битовом потоке аудиосигнала, первому полнодиапазонному сигналу, который был подвергнут обработке с коррекцией предыскажений, и первой энергии, причем энергетическое отношение представляет собой энергетическое отношение энергии второго полнодиапазонного сигнала к первой энергии; и
используя устройство декодирования, восстанавливают аудиосигнал, соответствующий битовому потоку аудиосигнала согласно второму полнодиапазонному сигналу, сигналу низкочастотного диапазона и сигналу высокочастотного диапазона.
Со ссылкой на второй аспект в первом возможном варианте реализации второго аспекта способ дополнительно включает в себя этапы, на которых:
используя устройство декодирования, получают количество характеристических факторов посредством декодирования;
используя устройство декодирования, определяют среднее значение характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
используя устройство декодирования, определяют параметр коррекции предыскажений согласно среднему значению характеристических факторов.
Со ссылкой на второй аспект или первый возможный вариант реализации второго аспекта во втором возможном варианте реализации второго аспекта этап, на котором, используя устройство декодирования, выполняют прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала, включает в себя этапы, на которых:
используя устройство декодирования, определяют, согласно сигналу высокочастотного диапазона, коэффициент LPC и полнодиапазонный сигнал возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
используя устройство декодирования, выполняют обработку с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Со ссылкой на любой один из второго аспекта или первого или второго возможного варианта реализации второго аспекта в третьем возможном варианте реализации второго аспекта этап, на котором, используя устройство декодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, включает в себя этапы, на которых:
используя устройство декодирования, выполняют коррекцию путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и выполняют обработку с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
используя устройство декодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
Со ссылкой на любой один из второго аспекта или первого, второго и третьего возможных вариантов реализации второго аспекта в четвертом возможном варианте реализации второго аспекта характеристический фактор используют для отражения характеристики аудиосигнала, и он включает в себя голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
Согласно третьему аспекту, настоящее изобретение обеспечивает устройство кодирования, включающее в себя:
первый модуль кодирования, выполненный с возможностью кодирования сигнала низкочастотного диапазона входного аудиосигнала для получения характеристического фактора входного аудиосигнала;
второй модуль кодирования, выполненный с возможностью осуществления кодирования и прогнозирования в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала;
модуль обработки с коррекцией предыскажений, выполненный с возможностью осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяется согласно характеристическому фактору;
модуль вычисления, выполненный с возможностью вычисления первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений;
модуль обработки с полосовой фильтрацией, выполненный с возможностью осуществления обработки с полосовой фильтрацией в отношении входного аудиосигнала для получения второго полнодиапазонного сигнала, при этом модуль вычисления выполнен с дополнительной возможностью вычисления второй энергии второго полнодиапазонного сигнала и вычисления энергетического отношения второй энергии второго полнодиапазонного сигнала к первой энергии первого полнодиапазонного сигнала; и
модуль отправки, выполненный с возможностью отправки на устройство декодирования битового потока, получаемого в результате кодирования входного аудиосигнала, причем битовый поток включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение входного аудиосигнала.
Со ссылкой на третий аспект в первом возможном варианте реализации третьего аспекта устройство кодирования дополнительно включает в себя модуль определения параметра коррекции предыскажений, выполненный с возможностью:
получения количества характеристических факторов;
определения среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определения параметра коррекции предыскажений согласно среднему значению характеристических факторов.
Со ссылкой на третий аспект или первый возможный вариант реализации третьего аспекта во втором возможном варианте реализации третьего аспекта второй модуль кодирования, в частности, выполнен с возможностью:
определения, согласно сигналу высокочастотного диапазона, коэффициента LPC и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнения обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Со ссылкой на любой один из третьего аспекта или первого или второго возможного варианта реализации третьего аспекта в третьем возможном варианте реализации третьего аспекта модуль обработки с коррекцией предыскажений выполнен, в частности, с возможностью:
осуществления коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала, полученного вторым модулем кодирования, и осуществления обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
Со ссылкой на любой один из третьего аспекта или первого, второго и третьего возможных вариантов реализации третьего аспекта в четвертом возможном варианте реализации третьего аспекта характеристический фактор используется для отражения характеристики аудиосигнала, и он включает в себя голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
Согласно четвертому аспекту настоящее изобретение обеспечивает устройство декодирования, включающее в себя:
приемный модуль, выполненный с возможностью приема битового потока аудиосигнала, отправляемого устройством кодирования, причем битовый поток аудиосигнала включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение аудиосигнала, соответствующего битовому потоку аудиосигнала;
первый модуль декодирования, выполненный с возможностью осуществления декодирования в низкочастотном диапазоне в отношении битового потока аудиосигнала с использованием характеристического фактора для получения сигнала низкочастотного диапазона;
второй модуль декодирования, выполненный с возможностью: осуществления декодирования в высокочастотном диапазоне в отношении битового потока аудиосигнала с использованием информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона; и осуществления прогнозирования в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала;
модуль обработки с коррекцией предыскажений, выполненный с возможностью осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяется согласно характеристическому фактору;
модуль вычисления, выполненный с возможностью: вычисления первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений; и получения второго полнодиапазонного сигнала согласно энергетическому отношению, содержащемуся в битовом потоке аудиосигнала, первому полнодиапазонному сигналу, который был подвергнут обработке с коррекцией предыскажений, и первой энергии, причем энергетическое отношение представляет собой энергетическое отношение энергии второго полнодиапазонного сигнала к первой энергии; и
модуль восстановления, выполненный с возможностью восстановления аудиосигнала, соответствующего битовому потоку аудиосигнала, согласно второму полнодиапазонному сигналу, сигналу низкочастотного диапазона и сигналу высокочастотного диапазона.
Со ссылкой на четвертый аспект в первом возможном варианте реализации четвертого аспекта устройство декодирования дополнительно включает в себя модуль определения параметра коррекции предыскажений, выполненный с возможностью:
получения количества характеристических факторов посредством декодирования;
определения среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определения параметра коррекции предыскажений согласно среднему значению характеристических факторов.
Со ссылкой на четвертый аспект или первый возможный вариант реализации четвертого аспекта во втором возможном варианте реализации четвертого аспекта второй модуль декодирования выполнен, в частности, с возможностью:
определения, согласно сигналу высокочастотного диапазона, коэффициента LPC и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнения обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Со ссылкой на любой один из четвертого аспекта или первого или второго возможного варианта реализации четвертого аспекта в третьем возможном варианте реализации четвертого аспекта модуль обработки с коррекцией предыскажений выполнен, в частности, с возможностью:
осуществления коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и осуществления обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
Со ссылкой на любой один из четвертого аспекта или первого, второго и третьего возможных вариантов реализации четвертого аспекта в четвертом возможном варианте реализации четвертого аспекта характеристический фактор используется для отражения характеристики аудиосигнала, и он включает в себя голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
Согласно пятому аспекту настоящее изобретение обеспечивает систему кодирования/декодирования, включающую в себя устройство кодирования по любому одному из третьего аспекта или первого, второго, третьего и четвертого возможных вариантов реализации третьего аспекта и устройство декодирования по любому одному из четвертого аспекта или первого, второго, третьего и четвертого возможных вариантов реализации четвертого аспекта.
Согласно способу устройству и системе кодека, предложенных в вариантах осуществления настоящего изобретения, обработка с коррекцией предыскажений выполняется в отношении полнодиапазонного сигнала за счет использования параметра коррекции предыскажений, определяемого согласно характеристическому фактору входного аудиосигнала, и затем полнодиапазонный сигнал кодируется и отправляется декодеру, чтобы декодер выполнял соответствующую обработку с декодированием и коррекцией предыскажений в отношении полнодиапазонного сигнала согласно характеристическому фактору входного аудиосигнала и восстанавливал входной аудиосигнал. Это решает проблему уровня техники, состоящую в том, что аудиосигнал, восстанавливаемый декодером, с высокой вероятностью имеет сигнальное искажение, и реализует адаптивную обработку с коррекцией предыскажений в отношении полнодиапазонного сигнала согласно характеристическому фактору аудиосигнала для улучшения производительности кодирования, чтобы входной аудиосигнал, восстанавливаемый декодером, имел относительно высокую точность воспроизведения и был ближе к исходному сигналу.
Краткое описание чертежей
Чтобы яснее изложить технические решения в вариантах осуществления настоящего изобретения или в уровне техники, далее вкратце описаны сопроводительные чертежи, необходимые для пояснения вариантов осуществления или уровня техники. Очевидно, что сопроводительные чертежи в последующем описании показывают некоторые варианты осуществления настоящего изобретения, и специалист в данной области техники сможет получить еще другие чертежи из этих сопроводительных чертежей, не применяя творческих усилий.
Фиг. 1 представляет собой блок-схему варианта осуществления способа кодирования согласно варианту осуществления настоящего изобретения;
Фиг. 2 представляет собой блок-схему варианта осуществления способа декодирования согласно варианту осуществления настоящего изобретения;
Фиг. 3 представляет собой блок-схему варианта 1 осуществления устройства кодирования согласно варианту осуществления настоящего изобретения;
Фиг. 4 представляет собой блок-схему варианта 1 осуществления устройства декодирования согласно варианту осуществления настоящего изобретения;
Фиг. 5 представляет собой блок-схему варианта 2 осуществления устройства кодирования согласно варианту осуществления настоящего изобретения;
Фиг. 6 представляет собой блок-схему варианта 2 осуществления устройства декодирования согласно варианту осуществления настоящего изобретения; и
Фиг. 7 представляет собой блок-схему варианта осуществления системы кодирования/декодирования согласно настоящему изобретению.
Осуществление изобретения
Чтобы сделать яснее цели, технические решения и преимущества вариантов осуществления настоящего изобретения, ниже четко и тщательно описываются технические решения в вариантах осуществления настоящего изобретения со ссылкой на сопроводительные чертежи в вариантах осуществления настоящего изобретения. Очевидно, что описанные варианты осуществления представляют собой лишь часть, а не все варианты осуществления настоящего изобретения. Все другие варианты осуществления, получаемые специалистом в данной области техники, исходя из вариантов осуществления настоящего изобретения без применения творческих усилий, должны подпадать под объем защиты настоящего изобретения.
Фиг. 1 представляет собой блок-схему варианта осуществления способа кодирования согласно варианту осуществления настоящего изобретения. Как показано на Фиг. 1, вариант осуществления способа включает в себя следующие этапы:
S101: Устройство кодирования кодирует сигнал низкочастотного диапазона входного аудиосигнала для получения характеристического фактора входного аудиосигнала.
Кодированный сигнал представляет собой аудиосигнал. Характеристический фактор используется для отражения характеристики аудиосигнала и включает в себя (без ограничения) «голосовой фактор», «спектральный наклон», «краткосрочную среднюю энергию» или «краткосрочную частоту переходов через нуль». Характеристический фактор может быть получен устройством кодирования путем кодирования сигнала низкочастотного диапазона входного аудиосигнала. В частности, используя голосовой фактор в качестве примера, этот голосовой фактор может быть получен посредством выполнения вычисления согласно периоду основного тона, алгебраической кодовой книге и их соответствующим коэффициентам усиления, получаемым из информации кодирования в низкочастотном диапазоне, которая получается путем кодирования сигнала низкочастотного диапазона.
S102: Устройство кодирования выполняет кодирование и прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала.
Когда сигнал высокочастотного диапазона кодирован, то далее получается информация кодирования в высокочастотном диапазоне.
S103: Устройство кодирования выполняет обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяется согласно характеристическому фактору.
S104: Устройство кодирования вычисляет первую энергию первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений.
S105: Устройство кодирования выполняет обработку с полосовой фильтрацией в отношении входного аудиосигнала для получения второго полнодиапазонного сигнала.
S106: Устройство кодирования вычисляет вторую энергию второго полнодиапазонного сигнала.
S107: Устройство кодирования вычисляет энергетическое отношение второй энергии второго полнодиапазонного сигнала к первой энергии первого полнодиапазонного сигнала.
S108: Устройство кодирования отправляет на устройство декодирования битовый поток, получаемый в результате кодирования входного аудиосигнала, причем битовый поток включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношении входного аудиосигнала.
Кроме того, вариант осуществления способа дополнительно включает в себя:
получение устройством кодирования количества характеристических факторов;
определение устройством кодирования среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определение устройством кодирования параметра коррекции предыскажений согласно среднему значению характеристических факторов.
В частности, устройство кодирования может получать один из характеристических факторов. Используя пример, в котором характеристический фактор представляет собой голосовой фактор, устройство кодирования получает количество голосовых факторов и определяет, согласно голосовым факторам и количеству голосовых факторов, среднее значение голосовых факторов входного аудиосигнала, и далее определяет параметр коррекции предыскажений согласно среднему значению голосовых факторов.
Кроме того, выполнение устройством кодирования кодирования и прогнозирования в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала на этапе S102 включает в себя:
определение устройством кодирования, согласно сигналу высокочастотного диапазона, коэффициента LPC и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнение устройством кодирования обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Кроме того, этап S103 включает в себя:
выполнение устройством кодирования коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и выполнение обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
выполнение устройством кодирования обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
При необходимости после этапа S103 вариант осуществления способа дополнительно включает в себя:
выполнение устройством кодирования обработки с повышающей дискретизацией и обработки с полосовой фильтрацией в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений; и
соответственно этап S104 включает в себя:
вычисление устройством кодирования первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений, повышающей дискретизации и обработке с полосовой фильтрацией.
Конкретный вариант реализации варианта осуществления способа описан ниже с помощью примера, в котором характеристический фактор представляет собой голосовой фактор. Для других характеристических факторов процессы их реализации являются аналогичными и не будут подробно описаны в дальнейшем.
В частности, после приема входного аудиосигнала устройство сигнального кодирования в устройстве кодирования извлекает сигнал низкочастотного диапазона из входного аудиосигнала, причем соответствующий диапазон частотного спектра составляет [0, f1], и кодирует сигнал низкочастотного диапазона для получения голосового фактора входного аудиосигнала. В частности, устройство сигнального кодирования кодирует сигнал низкочастотного диапазона для получения информации кодирования в низкочастотном диапазоне, выполняет вычисления, согласно периоду основного тона, алгебраической кодовой книге и их соответствующим коэффициентам усиления, содержащимся в информации кодирования в низкочастотном диапазоне, для получения голосового фактора, и определяет параметр коррекции предыскажений согласно голосовому фактору. Устройство сигнального кодирования извлекает сигнал высокочастотного диапазона из входного аудиосигнала, причем соответствующий диапазон частотного спектра составляет [f1, f2], выполняет кодирование и прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона для получения информации кодирования в высокочастотном диапазоне, определяет, согласно сигналу высокочасотного диапазона, коэффициент LPC и полнодиапазонный сигнал возбуждения, которые используются для прогнозирования полнодиапазонного сигнала, выполняет обработку с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения прогнозируемого первого полнодиапазонного сигнала, и выполняет обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяется согласно голосовому фактору. После определения первого полнодиапазонного сигнала могут быть выполнены коррекция путем смещения частотного спектра и обработка с отражением частотного спектра в отношении первого полнодиапазонного сигнала и затем может быть выполнена обработка с коррекцией предыскажений. При необходимости повышающая дискретизация и обработка с полосовой фильтрацией могут быть выполнены в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений. Далее устройство кодирования вычисляет первую энергию Ener0 обработанного первого полнодиапазонного сигнала, выполняет обработку с полосовой фильтрацией в отношении входного аудиосигнала для получения второго полнодиапазонного сигнала, чей диапазон частотного спектра составляет [f2, f3], определяет вторую энергию Ener1 второго полнодиапазонного сигнала, определяет энергетическое отношение (ratio) Ener1 к Ener0 и включает характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение входного аудиосигнала в битовый поток, получаемый в результате кодирования входного аудиосигнала, и отправляет битовый поток устройству декодирования, чтобы устройство декодирования восстанавливало аудиосигнал согласно принятому битовому потоку, характеристическому фактору, информации кодирования в высокочастотном диапазоне и энергетическому отношению.
Как правило, для входного аудиосигнала 48 килогерц (кГц - для краткости) соответствующий диапазон частотного спектра [0, f1] сигнала низкочастотного диапазона во входном аудиосигнале может, в частности, составлять [0, 8 кГц], и соответствующий диапазон частотного спектра [f1, f2] сигнала высокочастотного диапазона во входном аудиосигнале может, в частности, составлять [8 кГц, 16 кГц]. Соответствующий диапазон частотного спектра [f2, f3], соответствующий второму полнодиапазонному сигналу, может, в частности, составлять [16 кГц, 20 кГц]. Далее в качестве примера подробно описан способ реализации варианта осуществления способа путем использования конкретных диапазонов частотного спектра. Следует отметить, что настоящее изобретение применимо к этому варианту реализации, но не ограничено им.
В конкретной реализации сигнал низкочастотного диапазона, соответствующий [0, 8 кГц], может быть кодирован с использованием внутреннего кодера на основе технологии линейного прогнозирования с кодовым возбуждением (Code Excited Linear Prediction - CELP для краткости) с тем, чтобы получить информацию кодирования в низкочастотном диапазоне. Алгоритм кодирования, используемый внутренним кодером, может представлять собой существующий алгоритм линейного прогнозирования с возбуждением по алгебраическому коду (Algebraic Code Excited Linear Prediction - ACELP для краткости), но не ограничен им.
Период основного тона, алгебраическая кодовая книга и их соответствующие коэффициенты усиления извлекаются из информации кодирования в низкочастотном диапазоне, голосовой фактор (voice_factor) получается через вычисление, используя существующий алгоритм, причем подробности этого алгоритма не будут описаны дополнительно. После определения голосового фактора определяется фактор μ коррекции предыскажений, используемый для вычисления параметра коррекции предыскажений. Далее, используя в качестве примера голосовой фактор, описан подробно процесс вычисления, в котором определяется фактор μ коррекции предыскажений.
Сначала определяется количество М получаемых голосовых факторов, которое обычно может составлять 4 или 5. М голосовых факторов суммируются и усредняются, чтобы определить среднее значение varvoiceshape голосовых факторов. Фактор μ коррекции предыскажений определяется согласно среднему значению, и параметр H(Z) коррекции предыскажений может быть далее получен согласно μ, как показано нижеследующей формулой (1):
H(Z)=1/(1-μZ-1), (1)
где H(Z) - выражение передаточной функции в области Z, Z-1 представляет собой элемент задержки, и μ определяется согласно varvoiceshape. Любое значение, относимое к varvoiceshape, может быть выбрано в качестве μ, которое может, в частности, быть равным: μ=varvoiceshape3, μ=varvoiceshape2, μ=varvoiceshape или μ=1-varvoiceshape, но не ограничиваться этим.
Сигнал высокочастотного диапазона, соответствующий [8 кГц, 16 кГц], может быть кодирован с использованием кодера на основе технологий расширения временного диапазона (Time Band Extension - TBE для краткости) и суперширокого диапазона (Super Wide Band - SWB для краткости). Это подразумевает следующее: извлечение периода основного тона, алгебраической кодовой книги и их соответствующих коэффициентов усиления из внутреннего кодера для восстановления сигнала возбуждения высокочастотного диапазона; извлечение составляющей сигнала высокочастотного диапазона для выполнения анализа LPC, чтобы получить коэффициент LPC высокочастотного диапазона; объединение сигнала возбуждения высокочастотного диапазона и коэффициента LPC высокочастотного диапазона для получения восстановленного сигнала высокочастотного диапазона; сравнение восстановленного сигнала высокочастотного диапазона с сигналом высокочастотного диапазона во входной аудиоинформации для получения параметра gain коррекции коэффициента усиления; и квантование, используя малое количество битов, коэффициента LPC высокочастотного диапазона и параметра gain коэффициента усиления для получения информации кодирования в высокочастотного диапазоне.
Далее SWB кодер определяет, согласно сигналу высокочастотного диапазона во входном аудиосигнале, коэффициент LPC полного диапазона и полнодиапазонный сигнал возбуждения, которые используются для прогнозирования полнодиапазонного сигнала, и выполняет обработку с объединением в отношении коэффициента LPC полного диапазона и полнодиапазонного сигнала возбуждения для получения прогнозируемого первого полнодиапазонного сигнала, а затем в отношении первого полнодиапазонного сигнала может быть выполнена коррекция путем смещения частотного спектра, используя следующую формулу (2):
S2k=S1k×cos(2×PI×fn×k/fs), (2)
где k представляет собой k-ю точку временной выборки, k - положительное целое число, S2 - первый сигнал частотного спектра после коррекции путем смещения частотного спектра, S1 - первый полнодиапазонный сигнал, PI - отношение периметра круга к его диаметру, fn указывает, что расстояние, на которое требуется сместить частотный спектр, составляет n точек временной выборки, n - положительное целое число, и fs представляет собой скорость дискретизации сигналов.
После коррекции путем смещения частотного спектра в отношении S2 выполняется обработка с отражением частотного спектра для получения первого полнодиапазонного сигнала S3, который был подвергнут обработке с отражением частотного спектра, при которой отражаются амплитуды сигналов частотного спектра соответствующих точек временной выборки до и после смещения частотного спектра. Способ реализации отражения частотного спектра может быть таким же, как и общеизвестное отражение частотного спектра, так чтобы частотный спектр имел структуру, идентичную структуре исходного частотного спектра, в связи с чем подробности этого будут опущены.
Далее в отношении S3 выполняется обработка с коррекцией предыскажений, используя параметр H(Z) коррекции предыскажений, определенный согласно голосовому фактору, для получения первого полнодиапазонного сигнала S4, который был подвергнут обработке с коррекцией предыскажений, и затем определяется энергия Ener0 для S4. В частности, обработка с коррекцией предыскажений может быть выполнена с использованием фильтра коррекции предыскажений, обладающего параметром коррекции предыскажений.
При необходимости после получения S4 может быть выполнена обработка с повышающей дискретизацией посредством вставки нулей в отношении первого полнодиапазонного сигнала S4, который был подвергнут обработке с коррекцией предыскажений, для получения первого полнодиапазонного сигнала S5, который был подвергнут обработке с повышающей дискретизацией, и затем в отношении S5 может быть выполнена обработка с полосовой фильтрацией с использованием полосового фильтра (Band Pass Filter - BPF для краткости), обладающего диапазоном пропускания [16 кГц, 20 кГц], для получения первого полнодиапазонного сигнала S6, и после этого определяется энергия Ener0 для S6. Повышающая дискретизация и обработка с полосовой фильтрацией выполняются в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений, и затем определяется энергия первого полнодиапазонного сигнала, так что энергия частотного спектра и структура частотного спектра сигнала возбуждения высокочастотного диапазона могут быть скорректированы для улучшения производительности кодирования.
Второй полнодиапазонный сигнал может быть получен устройством кодирования посредством выполнения обработки с полосовой фильтрацией в отношении входного аудиосигнала, используя полосовой фильтр (Band Pass Filter - BPF для краткости), обладающий диапазоном пропускания [16 кГц, 20 кГц]. После получения второго полнодиапазонного сигнала устройство кодирования определяет энергию Ener1 второго полнодиапазонного сигнала и вычисляет отношение энергию Ener1 к энергии Ener0. После выполнения обработки с квантованием в отношении энергетического отношения энергетическое отношение, характеристический фактор и информация кодирования в высокочастотном диапазоне для входного аудиосигнала заключаются в битовый поток и отправляются устройству декодирования.
В уровне технике фактор μ коррекции предыскажений параметра H(Z) фильтрации с коррекцией предыскажений обычно имеет фиксированное значение, и сигнальный тип входного аудиосигнала не учитывается, что приводит к тому, что входной аудиосигнал, восстанавливаемый устройством декодирования, с высокой вероятностью имеет сигнальное искажение.
Согласно варианту осуществления способа обработка с коррекцией предыскажений выполняется в отношении полнодиапазонного сигнала с использованием параметра коррекции предыскажений, определяемого согласно характеристическому фактору входного аудиосигнала, и затем полнодиапазонный сигнал кодируется и отправляется декодеру, чтобы декодер выполнял соответствующую обработку с декодированием и коррекцией предыскажений в отношении полнодиапазонного сигнала согласно характеристическому фактору входного аудиосигнала и восстанавливал входной аудиосигнал. Это решает проблему уровня техники, состоящую в том, что аудиосигнал, восстанавливаемый декодером, с высокой вероятностью имеет сигнальное искажение, и реализует адаптивную обработку с коррекцией предыскажений в отношении полнодиапазонного сигнала согласно характеристическому фактору аудиосигнала для улучшения производительности кодирования, чтобы входной аудиосигнал, восстанавливаемый декодером, имел относительно высокую точность воспроизведения и был ближе к исходному сигналу.
Фиг. 2 представляет собой блок-схему варианта осуществления способа декодирования согласно варианту осуществления настоящего изобретения и она является вариантом осуществления способа на стороне декодера, который соответствует варианту осуществления способа, показанному на Фиг. 1. Как показано на Фиг. 2, вариант осуществления способа включает в себя следующие этапы:
S201: Устройство декодирования принимает битовый поток аудиосигнала, отправляемый устройством кодирования, причем битовый поток аудиосигнала включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение аудиосигнала, соответствующего битовому потоку аудиосигнала.
Характеристический фактор используется для отражения характеристики аудиосигнала и включает в себя (без ограничения) «голосовой фактор», «спектральный наклон», «краткосрочную среднюю энергию» или «краткосрочную частоту переходов через нуль». Этот характеристический фактор является таким же, как и характеристический фактор в варианте осуществления способа, показанном на Фиг. 1, в связи с чем он не будет снова подробно описан.
S202: Устройство декодирования выполняет декодирование в низкочастотном диапазоне в отношении битового потока аудиосигнала с использованием характеристического фактора для получения сигнала низкочастотного диапазона.
S203: Устройство декодирования выполняет декодирование в высокочастотном диапазоне в отношении битового потока аудиосигнала с использованием информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона.
S204: Устройство декодирования выполняет прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала.
S205: Устройство декодирования выполняет обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяется согласно характеристическому фактору.
S206: Устройство декодирования вычисляет первую энергию первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений.
S207: Устройство декодирования получает второй полнодиапазонный сигнал согласно энергетическому отношению, содержащемуся в битовом потоке аудиосигнала, первому полнодиапазонному сигналу, который был подвергнут обработке с коррекцией предыскажений, и первой энергии, причем энергетическое отношение представляет собой энергетическое отношение энергии второго полнодиапазонного сигнала к первой энергии.
S208: Устройство декодирования восстанавливает аудиосигнал, соответствующий битовому потоку аудиосигнала, согласно второму полнодиапазонному сигналу, сигналу низкочастотного диапазона и сигналу высокочастотного диапазона.
Кроме того, вариант осуществления способа дополнительно включает в себя:
получение устройством декодирования количества характеристических факторов посредством декодирования;
определение устройством декодирования среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определение устройством декодирования параметра коррекции предыскажений согласно среднему значению характеристических факторов.
Кроме того, этап S204 включает в себя:
определение устройством декодирования, согласно сигналу высокочастотного диапазона, коэффициента LPC и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнение устройством декодирования обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Кроме того, этап S205 включает в себя:
выполнение устройством декодирования коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и выполнение обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
выполнение устройством декодирования обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
При необходимости после этапа S205 вариант осуществления способа дополнительно включает в себя:
выполнение устройством декодирования повышающей дискретизации и обработки с полосовой фильтрацией в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений; и
соответственно этап S206 включает в себя:
определение устройством декодирования первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений, повышающей дискретизации и обработке с полосовой фильтрацией.
Этот вариант осуществление способа соответствует техническому решению в варианте осуществления способа, показанном на Фиг. 1. Конкретный способ реализации варианта осуществления способа описан с использованием примера, в котором характеристический фактор представляет собой голосовой фактор. Для других характеристических факторов процессы их реализации являются аналогичными и не будут подробно описаны в дальнейшем.
В частности, устройство декодирования принимает битовый поток аудиосигнала, отправляемый устройством кодирования, причем битовый поток аудиосигнала включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение аудиосигнала, соответствующего битовому потоку аудиосигнала. Далее устройство декодирования извлекает характеристический фактор аудиосигнала из битового потока аудиосигнала, выполняет декодирование в низкочастотном диапазоне в отношении битового потока аудиосигнала с использованием характеристического фактора аудиосигнала для получения сигнала низкочастотного диапазона и выполняет декодирование в высокочастотном диапазоне в отношении битового потока аудиосигнала с использованием информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона. Устройство декодирования определяет параметр коррекции предыскажений согласно характеристическому фактору, выполняет прогнозирование полнодиапазонного сигнала согласно сигналу высокочастотного диапазона, полученного посредством декодирования, для получения первого полнодиапазонного сигнала S1, выполняет обработку с коррекцией путем смещения частотного спектра в отношении S1 для получения первого полнодиапазонного сигнала S2, который был подвергнут обработке с коррекцией путем смещения частотного спектра, выполняет обработку с отражением частотного спектра в отношении S2 для получения сигнала S3, выполняет обработку с коррекцией предыскажений с использованием параметра коррекции предыскажений, определенного согласно характеристическому фактору для получения сигнала S4, и вычисляет первую энергию Ener0 для S4. При необходимости устройство декодирования выполняет обработку с повышающей дискретизацией в отношении S4 для получения сигнала S5, выполняет обработку с полосовой фильтрацией в отношении S5 для получения сигнала S6, а затем вычисляет первую энергию Ener0 для S6. После этого согласно сигналу S4 или S6 Ener0 и принятому энергетическому отношению получается второй полнодиапазонный сигнал, и аудиосигнал, соответствующий битовому потоку аудиосигнала, восстанавливается согласно второму полнодиапазонному сигналу, сигналу низкочастотного диапазона и сигналу высокочастотного диапазона, которые получаются посредством декодирования.
В конкретной реализации декодирование в низкочастотном диапазоне может быть выполнено внутренним декодером в отношении битового потока аудиосигнала, используя характеристический фактор, для получения сигнала низкочастотного диапазона. Декодирование в высокочастотном диапазоне может быть выполнено SWB декодером в отношении информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона. После получения сигнала высокочастотного диапазона прогнозирование в расширенном спектре выполняется непосредственно согласно сигналу высокочастотного диапазона или после умножения сигнала высокочастотного диапазона на коэффициент ослабления, чтобы получить первый полнодиапазонный сигнал, и обработка с коррекцией путем смещения частотного спектра, обработка с отражением частотного спектра и обработка с коррекцией предыскажений выполняются в отношении первого полнодиапазонного сигнала. При необходимости обработка с повышающей дискретизацией и обработка с полосовой фильтрацией выполняются в отношении первого сигнала частотного диапазона, который был подвергнут обработке с коррекцией предыскажений. В конкретной реализации способ реализации, аналогичный тому, что использовался в варианте осуществления, показанном на Фиг. 1, может быть использован для обработки, в связи с чем он не будет снова подробно описан.
Получение второго полнодиапазонного сигнала согласно сигналу S4 или S6, Ener0 и принятому энергетическому отношению, в частности, состоит в следующем: выполнение коррекции по энергии в отношении первого полнодиапазонного сигнала согласно энергетическому отношению R и первой энергии Ener0 для восстановления второго полнодиапазонного сигнала Ener1=Ener0×R, и получение второго полнодиапазонного сигнала согласно частотному спектру первого полнодиапазонного сигнала и энергии Ener1.
Согласно варианту осуществления способа устройство декодирования определяет параметр коррекции предыскажений, используя характеристический фактор аудиосигнала, который содержится в битовом потоке аудиосигнала, выполняет обработку с коррекцией предыскажений в отношении полнодиапазонного сигнала и получает сигнал низкочастотного диапазона посредством декодирования с использованием характеристического фактора, чтобы аудиосигнал, восстанавливаемый устройством декодирования, был ближе к исходному входному аудиосигналу и имел более высокую точность воспроизведения.
Фиг. 3 представляет собой блок-схему варианта 1 осуществления устройства кодирования согласно варианту осуществления настоящего изобретения. Как показано на Фиг. 3, устройство 300 кодирования включает в себя первый модуль 301 кодирования, второй модуль 302 кодирования, модуль 303 обработки с коррекцией предыскажений, модуль 304 вычисления, модуль 305 обработки с полосовой фильтрацией и модуль 306 отправки, при этом:
первый модуль 301 кодирования выполнен с возможностью кодирования сигнала низкочастотного диапазона входного аудиосигнала для получения характеристического фактора входного аудиосигнала, причем
характеристический фактор используется для отражения характеристики аудиосигнала и включает в себя голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль;
второй модуль 302 кодирования выполнен с возможностью осуществления кодирования и прогнозирования в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала;
модуль 303 обработки с коррекцией предыскажений выполнен с возможностью осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяется согласно характеристическому фактору;
модуль 304 вычисления выполнен с возможностью вычисления первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений;
модуль 305 обработки с полосовой фильтрацией выполнен с возможностью осуществления обработки с полосовой фильтрацией в отношении входного аудиосигнала для получения второго полнодиапазонного сигнала;
модуль 304 вычисления выполнен с дополнительной возможностью вычисления второй энергии второго полнодиапазонного сигнала и вычисления энергетического отношения второй энергии второго полнодиапазонного сигнала к первой энергии первого полнодиапазонного сигнала; и
модуль 306 отправки выполнен с возможностью отправки на устройство декодирования битового потока, получаемого в результате кодирования входного аудиосигнала, причем битовый поток включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение входного аудиосигнала.
Кроме того, устройство 300 кодирования дополнительно включает в себя модуль 307 определения параметра коррекции предыскажений, выполненный с возможностью:
получения количества характеристических факторов;
определения среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определения параметра коррекции предыскажений согласно среднему значению характеристических факторов.
Кроме того, второй модуль 302 кодирования, в частности, выполнен с возможностью:
определения, согласно сигналу высокочастотного диапазона, коэффициента LPC и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнения обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Кроме того, модуль 303 обработки с коррекцией предыскажений выполнен, в частности, с возможностью:
осуществления коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала, полученного вторым модулем 302 кодирования, и осуществления обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
Устройство кодирования, обеспеченное в этом варианте осуществления, может быть выполнено с возможностью исполнения технического решения в варианте осуществления способа, показанном на Фиг. 1. Их принципы реализации и технические эффекты являются аналогичными, в связи с чем они не будут снова подробно описаны.
Фиг. 4 представляет собой блок-схему варианта 1 осуществления устройства декодирования согласно варианту осуществления настоящего изобретения. Как показано на Фиг. 4, устройство 400 декодирования включает в себя приемный модуль 401, первый модуль 402 декодирования, второй модуль 403 декодирования, модуль 404 обработки с коррекцией предыскажений, модуль 405 вычисления и модуль 406 восстановления, при этом:
приемный модуль 401 выполнен с возможностью приема битового потока аудиосигнала, отправляемого устройством кодирования, причем битовый поток аудиосигнала включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение аудиосигнала, соответствующего битовому потоку аудиосигнала, причем
характеристический фактор используется для отражения характеристики аудиосигнала и включает в себя голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль;
первый модуль 402 декодирования выполнен с возможностью осуществления декодирования в низкочастотном диапазоне в отношении битового потока аудиосигнала с использованием характеристического фактора для получения сигнала низкочастотного диапазона;
второй модуль 403 декодирования выполнен с возможностью: осуществления декодирования в высокочастотном диапазоне в отношении битового потока аудиосигнала с использованием информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона; и осуществления прогнозирования в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала;
модуль 404 обработки с коррекцией предыскажений выполнен с возможностью осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяется согласно характеристическому фактору;
модуль 405 вычисления выполнен с возможностью: вычисления первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений; и получения второго полнодиапазонного сигнала согласно энергетическому отношению, содержащемуся в битовом потоке аудиосигнала, первому полнодиапазонному сигналу, который был подвергнут обработке с коррекцией предыскажений, и первой энергии, причем энергетическое отношение представляет собой энергетическое отношение энергии второго полнодиапазонного сигнала к первой энергии; и
модуль 406 восстановления выполнен с возможностью восстановления аудиосигнала, соответствующего битовому потоку аудиосигнала, согласно второму полнодиапазонному сигналу, сигналу низкочастотного диапазона и сигналу высокочастотного диапазона.
Кроме того, устройство 400 декодирования дополнительно включает в себя модуль 407 определения параметра коррекции предыскажений, выполненный с возможностью:
получения количества характеристических факторов посредством декодирования;
определения среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определения параметра коррекции предыскажений согласно среднему значению характеристических факторов.
Кроме того, второй модуль 403 декодирования выполнен, в частности, с возможностью:
определения, согласно сигналу высокочастотного диапазона, коэффициента LPC и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнения обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Кроме того, модуль 404 обработки с коррекцией предыскажений выполнен, в частности, с возможностью:
осуществления коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и осуществления обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
Устройство декодирования, обеспеченное в этом варианте осуществления, может быть выполнено с возможностью исполнения технического решения в варианте осуществления способа, показанном на Фиг. 2. Их принципы реализации и технические эффекты являются аналогичными, в связи с чем они не будут снова подробно описаны.
Фиг. 5 представляет собой блок-схему варианта 2 осуществления устройства кодирования согласно варианту осуществления настоящего изобретения. Как показано на Фиг. 5, устройство 500 кодирования включает в себя процессор 501, память 502 и интерфейс 503 связи. Процессор 501, память 502 и интерфейс 503 связи соединены посредством шины (которая показана сплошной толстой линией на фигуре).
Интерфейс 503 связи выполнен с возможностью приема входных данных аудиосигнала и осуществления связи с устройством декодирования. Память 502 выполнена с возможностью хранения программного кода. Процессор 501 выполнен с возможностью вызова программного кода, хранимого в памяти 502, для исполнения технического решения в варианте осуществления способа, показанном на Фиг. 1. Их принципы реализации и технические эффекты являются аналогичными, в связи с чем они не будут снова подробно описаны.
Фиг. 6 представляет собой блок-схему варианта 2 осуществления устройства декодирования согласно варианту осуществления настоящего изобретения. Как показано на Фиг. 6, устройство 600 декодирования включает в себя процессор 601, память 602 и интерфейс 603 связи. Процессор 601, память 602 и интерфейс 603 связи соединены посредством шины (которая показана сплошной толстой линией на фигуре).
Интерфейс 603 связи выполнен с возможностью осуществления связи с устройством кодирования и вывода восстановленного аудиосигнала. Память 602 выполнена с возможностью хранения программного кода. Процессор 601 выполнен с возможностью вызова программного кода, хранимого в памяти 602, для исполнения технического решения в варианте осуществления способа, показанном на Фиг. 2. Их принципы реализации и технические эффекты являются аналогичными, в связи с чем они не будут снова подробно описаны.
Фиг. 7 представляет собой блок-схему варианта осуществления системы кодирования/декодирования согласно настоящему изобретению. Как показано на Фиг. 7, система 700 кодека включает в себя устройство 701 кодирования и устройство 702 декодирования. Устройство 701 кодирования и устройство 702 декодирования могут быть соответственно устройством кодирования, показанном на Фиг. 3, и устройством декодирования, показанном на Фиг. 4 и могут быть соответственно выполнены с возможностью исполнения технических решений в вариантах осуществления способов, показанных на Фиг. 1 и Фиг. 2. Их принципы реализации и технические эффекты являются аналогичными, в связи с чем они не будут снова подробно описаны.
Используя описания вышеуказанных вариантов осуществления, специалист в данной области техники сможет ясно осознать, что настоящее изобретение может быть реализовано с помощью аппаратного обеспечения, программно-аппаратного обеспечения или их комбинации. В случае реализации настоящего изобретения с помощью программного обеспечения вышеописанные функции могут храниться на машиночитаемом носителе или передаваться в виде одной или более команд или кода на машиночитаемом носителе. Машиночитаемый носитель включает в себя компьютерный носитель данных и среду связи, при этом среда связи включает в себя любую среду, которая позволяет компьютерной программе передаваться из одного места в другое. Носитель данных может быть любым существующим носитель, доступ к которому осуществляется через компьютер. Далее приведен пример, который не накладывает какое-либо ограничение: машиночитаемый носитель может включать в себя RAM, ROM, EEPROM, CD-ROM или любое оптическое дисковое запоминающее устройство или дисковый носитель данных, или другое магнитное запоминающее устройство, или любой другой носитель, который может переносить или хранить требуемый программный код в виде команд или структур данных, и доступ к которому можно осуществлять через компьютер. Кроме того, любое соединение может быть подходящим образом определено как машиночитаемый носитель. Например, если программное обеспечение передается с веб-сайта, сервера или другого удаленного источника с использованием коаксиального кабеля, оптического волокна/кабеля, витой пары, цифровой абонентской линии (DSL) или беспроводных технологий, таких как инфракрасный луч, радио и микроволна, то такие коаксиальный кабель, оптическое волокно/кабель, витая пара, DSL или беспроводные технологии, такие как инфракрасный луч, радио и микроволна, подпадают под определение носителя. Например, термин «диск», используемый в настоящем изобретении, включает в себя компакт-диск CD, лазерный диск, оптический диск, цифровой универсальный диск (DVD), флоппи-диск и диск Blu-ray, причем диск в целом копирует данные магнитным способом или копирует данные оптически с помощью лазерного средства. Вышеприведенная комбинация носителей должна быть также включена в объем защиты, обеспечиваемый термином «машиночитаемый носитель».
Более того, должно быть понятно, что в зависимости от вариантов осуществления некоторые действия или этапы какого-либо способа, описанного в этом описании, могут быть исполнены согласно разным последовательностям или могут быть добавлены, объединены или опущены (например, для достижения некоторых определенных целей не все описанные действия или этапы являются обязательными). Кроме того, в некоторых вариантах осуществления действия или этапы могут выполняться при гиперпотоковой обработке, обработке с прерываниями или одновременной обработке посредством множества процессоров, причем одновременная обработка может представлять собой непоследовательное исполнение. Вдобавок, в целях ясности конкретные варианты осуществления настоящего изобретения описаны в виде функции, выполняемой одним этапом или модулем, но следует понимать, что технологии, применяемые в настоящем изобретении, могут представлять собой объединенное исполнение множества вышеописанных этапов или модулей.
Наконец, следует отметить, что вышеприведенные варианты осуществления всего лишь предназначены для описания технических решений настоящего изобретения, а не для ограничения настоящего изобретения. Хотя настоящее изобретение описано подробно со ссылкой на вышеприведенные варианты осуществления, специалистам в данной области техники должно быть понятно, что они, тем не менее, могут внести изменения в технические решения, описанные в вышеприведенных вариантах осуществления, или сделать эквивалентные замены некоторых или всех их технических признаков, не отступая от объема технических решений вариантов осуществления настоящего изобретения.

Claims (76)

1. Способ кодирования, содержащий этапы, на которых:
используя устройство кодирования, кодируют сигнал низкочастотного диапазона входного аудиосигнала для получения характеристического фактора входного аудиосигнала;
используя устройство кодирования, выполняют кодирование и прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала;
используя устройство кодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяют согласно характеристическому фактору;
используя устройство кодирования, вычисляют первую энергию первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений;
используя устройство кодирования, выполняют обработку с полосовой фильтрацией в отношении входного аудиосигнала для получения второго полнодиапазонного сигнала;
используя устройство кодирования, вычисляют вторую энергию второго полнодиапазонного сигнала;
используя устройство кодирования, вычисляют энергетическое отношение второй энергии второго полнодиапазонного сигнала к первой энергии первого полнодиапазонного сигнала; и
используя устройство кодирования, отправляют на устройство декодирования битовый поток, получаемый в результате кодирования входного аудиосигнала, причем битовый поток содержит характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение входного аудиосигнала.
2. Способ по п.1, дополнительно содержащий этапы, на которых:
используя устройство кодирования, получают количество характеристических факторов;
используя устройство кодирования, определяют среднее значение характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
используя устройство кодирования, определяют параметр коррекции предыскажений согласно среднему значению характеристических факторов.
3. Способ по п.1 или 2, в котором этап, на котором, используя устройство кодирования, выполняют прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала, содержит этапы, на которых:
используя устройство кодирования, определяют, согласно сигналу высокочастотного диапазона, коэффициент кодирования с линейным прогнозированием, LPC, и полнодиапазонный сигнал возбуждения, которые используют для прогнозирования полнодиапазонного сигнала; и
используя устройство кодирования, выполняют обработку с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
4. Способ по п.1 или 2, в котором этап, на котором, используя устройство кодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, содержит этапы, на которых:
используя устройство кодирования, выполняют коррекцию путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и выполняют обработку с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
используя устройство кодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
5. Способ по п.1 или 2, в котором характеристический фактор используют для отражения характеристики аудиосигнала, и он содержит голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
6. Способ декодирования, содержащий этапы, на которых:
используя устройство декодирования, принимают битовый поток аудиосигнала, отправляемый устройством кодирования, причем битовый поток аудиосигнала содержит характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение аудиосигнала, соответствующего битовому потоку аудиосигнала;
используя устройство декодирования, выполняют декодирование в низкочастотном диапазоне в отношении битового потока аудиосигнала с использованием характеристического фактора для получения сигнала низкочастотного диапазона;
используя устройство декодирования, выполняют декодирование в высокочастотном диапазоне в отношении битового потока аудиосигнала с использованием информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона;
используя устройство декодирования, выполняют прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала;
используя устройство декодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяют согласно характеристическому фактору;
используя устройство декодирования, вычисляют первую энергию первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений;
используя устройство декодирования, получают второй полнодиапазонный сигнал согласно энергетическому отношению, содержащемуся в битовом потоке аудиосигнала, первому полнодиапазонному сигналу, который был подвергнут обработке с коррекцией предыскажений, и первой энергии, причем энергетическое отношение представляет собой энергетическое отношение энергии второго полнодиапазонного сигнала к первой энергии; и
используя устройство декодирования, восстанавливают аудиосигнал, соответствующий битовому потоку аудиосигнала согласно второму полнодиапазонному сигналу, сигналу низкочастотного диапазона и сигналу высокочастотного диапазона.
7. Способ декодирования по п.6, дополнительно содержащий этапы, на которых:
используя устройство декодирования, получают количество характеристических факторов посредством декодирования;
используя устройство декодирования, определяют среднее значение характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
используя устройство декодирования, определяют параметр коррекции предыскажений согласно среднему значению характеристических факторов.
8. Способ декодирования по п.6 или 7, в котором этап, на котором, используя устройство декодирования, выполняют прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала, содержит этапы, на которых:
используя устройство декодирования, определяют, согласно сигналу высокочастотного диапазона, коэффициент кодирования с линейным прогнозированием, LPC, и полнодиапазонный сигнал возбуждения, которые используют для прогнозирования полнодиапазонного сигнала; и
используя устройство декодирования, выполняют обработку с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
9. Способ декодирования по п.6 или 7, в котором этап, на котором, используя устройство декодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, содержит этапы, на которых:
используя устройство декодирования, выполняют коррекцию путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и выполняют обработку с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
используя устройство декодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
10. Способ по п.6 или 7, в котором характеристический фактор используют для отражения характеристики аудиосигнала, и он содержит голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
11. Устройство кодирования, содержащее:
первый модуль кодирования, выполненный с возможностью кодирования сигнала низкочастотного диапазона входного аудиосигнала для получения характеристического фактора входного аудиосигнала;
второй модуль кодирования, выполненный с возможностью осуществления кодирования и прогнозирования в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала;
модуль обработки с коррекцией предыскажений, выполненный с возможностью осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определен согласно характеристическому фактору;
модуль вычисления, выполненный с возможностью вычисления первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений;
модуль обработки с полосовой фильтрацией, выполненный с возможностью осуществления обработки с полосовой фильтрацией в отношении входного аудиосигнала для получения второго полнодиапазонного сигнала, при этом модуль вычисления выполнен с дополнительной возможностью вычисления второй энергии второго полнодиапазонного сигнала и вычисления энергетического отношения второй энергии второго полнодиапазонного сигнала к первой энергии первого полнодиапазонного сигнала; и
модуль отправки, выполненный с возможностью отправки на устройство декодирования битового потока, получаемого в результате кодирования входного аудиосигнала, причем битовый поток содержит характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение входного аудиосигнала.
12. Устройство кодирования по п.11, дополнительно содержащее модуль определения параметра коррекции предыскажений, выполненный с возможностью:
получения количества характеристических факторов;
определения среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определения параметра коррекции предыскажений согласно среднему значению характеристических факторов.
13. Устройство кодирования по п.11 или 12, в котором второй модуль кодирования, в частности, выполнен с возможностью:
определения, согласно сигналу высокочастотного диапазона, коэффициента кодирования с линейным прогнозированием, LPC, и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнения обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
14. Устройство кодирования по п.11 или 12, в котором модуль обработки с коррекцией предыскажений выполнен, в частности, с возможностью:
осуществления коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала, полученного вторым модулем кодирования, и осуществления обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
15. Устройство кодирования по п.11 или 12, в котором характеристический фактор используется для отражения характеристики аудиосигнала, и он содержит голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
16. Устройство декодирования, содержащее:
приемный модуль, выполненный с возможностью приема битового потока аудиосигнала, отправляемого устройством кодирования, причем битовый поток аудиосигнала содержит характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение аудиосигнала, соответствующего битовому потоку аудиосигнала;
первый модуль декодирования, выполненный с возможностью осуществления декодирования в низкочастотном диапазоне в отношении битового потока аудиосигнала с использованием характеристического фактора для получения сигнала низкочастотного диапазона;
второй модуль декодирования, выполненный с возможностью: осуществления декодирования в высокочастотном диапазоне в отношении битового потока аудиосигнала с использованием информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона; и осуществления прогнозирования в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала;
модуль обработки с коррекцией предыскажений, выполненный с возможностью осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определен согласно характеристическому фактору;
модуль вычисления, выполненный с возможностью: вычисления первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений; и получения второго полнодиапазонного сигнала согласно энергетическому отношению, содержащемуся в битовом потоке аудиосигнала, первому полнодиапазонному сигналу, который был подвергнут обработке с коррекцией предыскажений, и первой энергии, причем энергетическое отношение представляет собой энергетическое отношение энергии второго полнодиапазонного сигнала к первой энергии; и
модуль восстановления, выполненный с возможностью восстановления аудиосигнала, соответствующего битовому потоку аудиосигнала, согласно второму полнодиапазонному сигналу, сигналу низкочастотного диапазона и сигналу высокочастотного диапазона.
17. Устройство декодирования по п.16, дополнительно содержащее модуль определения параметра коррекции предыскажений, выполненный с возможностью:
получения количества характеристических факторов посредством декодирования;
определения среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определения параметра коррекции предыскажений согласно среднему значению характеристических факторов.
18. Устройство декодирования по п.16 или 17, в котором второй модуль декодирования выполнен, в частности, с возможностью:
определения, согласно сигналу высокочастотного диапазона, коэффициента кодирования с линейным прогнозированием, LPC, и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнения обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
19. Устройство декодирования по п.16 или 17, в котором модуль обработки с коррекцией предыскажений выполнен, в частности, с возможностью:
осуществления коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и осуществления обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
20. Устройство декодирования по п.16 или 17, в котором характеристический фактор используется для отражения характеристики аудиосигнала, и он содержит голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
RU2016151460A 2014-06-26 2015-03-20 Способ, устройство и система кодирования/декодирования RU2644078C1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410294752.3 2014-06-26
CN201410294752.3A CN105225671B (zh) 2014-06-26 2014-06-26 编解码方法、装置及***
PCT/CN2015/074704 WO2015196835A1 (zh) 2014-06-26 2015-03-20 编解码方法、装置及***

Publications (1)

Publication Number Publication Date
RU2644078C1 true RU2644078C1 (ru) 2018-02-07

Family

ID=54936715

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016151460A RU2644078C1 (ru) 2014-06-26 2015-03-20 Способ, устройство и система кодирования/декодирования

Country Status (15)

Country Link
US (3) US9779747B2 (ru)
EP (2) EP3637416A1 (ru)
JP (1) JP6496328B2 (ru)
KR (1) KR101906522B1 (ru)
CN (2) CN106228991B (ru)
AU (1) AU2015281686B2 (ru)
BR (1) BR112016026440B8 (ru)
CA (1) CA2948410C (ru)
DE (2) DE202015009942U1 (ru)
HK (1) HK1219802A1 (ru)
MX (1) MX356315B (ru)
MY (1) MY173513A (ru)
RU (1) RU2644078C1 (ru)
SG (1) SG11201609523UA (ru)
WO (1) WO2015196835A1 (ru)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2626977T3 (es) * 2013-01-29 2017-07-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y medio informático para sintetizar una señal de audio
CN105978540B (zh) * 2016-05-26 2018-09-18 英特格灵芯片(天津)有限公司 一种连续时间信号的去加重处理电路及其方法
CN106601267B (zh) * 2016-11-30 2019-12-06 武汉船舶通信研究所 一种基于超短波fm调制的语音增强方法
CN112885364B (zh) * 2021-01-21 2023-10-13 维沃移动通信有限公司 音频编码方法和解码方法、音频编码装置和解码装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012025429A1 (en) * 2010-08-24 2012-03-01 Dolby International Ab Reduction of spurious uncorrelation in fm radio noise
RU2456682C2 (ru) * 2008-01-04 2012-07-20 Долби Интернэшнл Аб Аудиокодер и декодер
RU2470384C1 (ru) * 2007-06-13 2012-12-20 Квэлкомм Инкорпорейтед Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов
EP1949062B1 (en) * 2005-10-05 2014-05-14 LG Electronics Inc. Method and apparatus for decoding an audio signal
RU2519295C2 (ru) * 2009-05-08 2014-06-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Транскодировщик аудио формата

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000134105A (ja) * 1998-10-29 2000-05-12 Matsushita Electric Ind Co Ltd オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法
US6912496B1 (en) * 1999-10-26 2005-06-28 Silicon Automation Systems Preprocessing modules for quality enhancement of MBE coders and decoders for signals having transmission path characteristics
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US9886959B2 (en) * 2005-02-11 2018-02-06 Open Invention Network Llc Method and system for low bit rate voice encoding and decoding applicable for any reduced bandwidth requirements including wireless
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
KR100789368B1 (ko) * 2005-05-30 2007-12-28 한국전자통신연구원 잔차 신호 부호화 및 복호화 장치와 그 방법
US20070299655A1 (en) * 2006-06-22 2007-12-27 Nokia Corporation Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
JP4850086B2 (ja) * 2007-02-14 2012-01-11 パナソニック株式会社 Memsマイクロホン装置
JP4984983B2 (ja) * 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
EP2186087B1 (en) * 2007-08-27 2011-11-30 Telefonaktiebolaget L M Ericsson (PUBL) Improved transform coding of speech and audio signals
KR101413968B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US8433582B2 (en) 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
JP4818335B2 (ja) * 2008-08-29 2011-11-16 株式会社東芝 信号帯域拡張装置
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
US8457688B2 (en) * 2009-02-26 2013-06-04 Research In Motion Limited Mobile wireless communications device with voice alteration and related methods
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
AU2011241424B2 (en) 2010-04-14 2016-05-05 Voiceage Evs Llc Flexible and scalable combined innovation codebook for use in CELP coder and decoder
CN102800317B (zh) 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
EP3089164A1 (en) * 2011-11-02 2016-11-02 Telefonaktiebolaget LM Ericsson (publ) Generation of a high band extension of a bandwidth extended audio signal
FR2984580A1 (fr) 2011-12-20 2013-06-21 France Telecom Procede de detection d'une bande de frequence predeterminee dans un signal de donnees audio, dispositif de detection et programme d'ordinateur correspondant
CN102737646A (zh) * 2012-06-21 2012-10-17 佛山市瀚芯电子科技有限公司 单一麦克风的实时动态语音降噪方法
CN105976830B (zh) 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
CN103928031B (zh) * 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1949062B1 (en) * 2005-10-05 2014-05-14 LG Electronics Inc. Method and apparatus for decoding an audio signal
RU2470384C1 (ru) * 2007-06-13 2012-12-20 Квэлкомм Инкорпорейтед Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов
RU2456682C2 (ru) * 2008-01-04 2012-07-20 Долби Интернэшнл Аб Аудиокодер и декодер
RU2519295C2 (ru) * 2009-05-08 2014-06-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Транскодировщик аудио формата
WO2012025429A1 (en) * 2010-08-24 2012-03-01 Dolby International Ab Reduction of spurious uncorrelation in fm radio noise

Also Published As

Publication number Publication date
DE202015009916U1 (de) 2021-08-04
AU2015281686B2 (en) 2018-02-01
WO2015196835A1 (zh) 2015-12-30
JP6496328B2 (ja) 2019-04-03
CN106228991B (zh) 2019-08-20
US20170372715A1 (en) 2017-12-28
US9779747B2 (en) 2017-10-03
EP3133600A1 (en) 2017-02-22
BR112016026440B8 (pt) 2023-03-07
US10614822B2 (en) 2020-04-07
JP2017525992A (ja) 2017-09-07
EP3637416A1 (en) 2020-04-15
US20190333528A1 (en) 2019-10-31
MY173513A (en) 2020-01-30
US10339945B2 (en) 2019-07-02
MX356315B (es) 2018-05-23
US20170110137A1 (en) 2017-04-20
CN106228991A (zh) 2016-12-14
BR112016026440A2 (ru) 2017-08-15
HK1219802A1 (zh) 2017-04-13
CA2948410C (en) 2018-09-04
KR101906522B1 (ko) 2018-10-10
DE202015009942U1 (de) 2021-10-01
EP3133600A4 (en) 2017-05-10
CN105225671B (zh) 2016-10-26
MX2016015526A (es) 2017-04-25
EP3133600B1 (en) 2019-08-28
BR112016026440B1 (pt) 2022-09-20
AU2015281686A1 (en) 2016-12-01
CA2948410A1 (en) 2015-12-30
SG11201609523UA (en) 2016-12-29
KR20160145799A (ko) 2016-12-20
CN105225671A (zh) 2016-01-06

Similar Documents

Publication Publication Date Title
US9524721B2 (en) Apparatus and method for concealing frame erasure and voice decoding apparatus and method using the same
KR101246991B1 (ko) 오디오 신호 처리 방법
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
JP6076247B2 (ja) ディジタルオーディオ信号エンコーダでのノイズシェーピングフィードバックループの制御
US10614822B2 (en) Coding/decoding method, apparatus, and system for audio signal
JP2023022073A (ja) 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス
EP2041745A1 (en) Adaptive encoding and decoding methods and apparatuses
JP2010537261A (ja) 周波数サブバンドのスペクトルダイナミクスに基づくオーディオ符号化における時間マスキング
JP7008756B2 (ja) デジタルオーディオ信号におけるプレエコーを識別し、減衰させる方法及び装置
RU2651184C1 (ru) Способ обработки речевого/звукового сигнала и устройство
JP2013084002A (ja) 音声コーデックの品質向上装置およびその方法
JP5295372B2 (ja) デジタルオーディオ信号におけるプリエコーの減衰
CN111292755B (zh) 突发帧错误处理
KR102132326B1 (ko) 통신 시스템에서 오류 은닉 방법 및 장치
CN105632504A (zh) Adpcm编解码器及adpcm解码器丢包隐藏的方法
Krasner et al. Efficient Encoding and Decoding of Speech.

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20210204