RU2644078C1 - Способ, устройство и система кодирования/декодирования - Google Patents
Способ, устройство и система кодирования/декодирования Download PDFInfo
- Publication number
- RU2644078C1 RU2644078C1 RU2016151460A RU2016151460A RU2644078C1 RU 2644078 C1 RU2644078 C1 RU 2644078C1 RU 2016151460 A RU2016151460 A RU 2016151460A RU 2016151460 A RU2016151460 A RU 2016151460A RU 2644078 C1 RU2644078 C1 RU 2644078C1
- Authority
- RU
- Russia
- Prior art keywords
- signal
- full
- range
- frequency
- audio signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 51
- 238000012937 correction Methods 0.000 claims abstract description 168
- 238000012545 processing Methods 0.000 claims abstract description 168
- 230000005236 sound signal Effects 0.000 claims abstract description 160
- 238000001228 spectrum Methods 0.000 claims description 84
- 230000005284 excitation Effects 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000001914 filtration Methods 0.000 claims description 12
- 230000003595 spectral effect Effects 0.000 claims description 12
- 238000011084 recovery Methods 0.000 claims description 4
- 230000007704 transition Effects 0.000 claims 4
- 230000000694 effects Effects 0.000 abstract description 6
- 239000000126 substance Substances 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Изобретение относится к области кодирования и декодирования аудиосигналов. Технический результат заключается в снижении сигнального искажения аудиосигналов. Технический результат достигается за счет обработки с коррекцией предыскажений, которая выполняется в отношении полнодиапазонного сигнала за счет использования параметра коррекции предыскажений, определяемого согласно характеристическому фактору входного аудиосигнала, и затем полнодиапазонный сигнал кодируется и отправляется декодеру, чтобы декодер выполнял соответствующую обработку с декодированием и коррекцией предыскажений в отношении полнодиапазонного сигнала согласно характеристическому фактору входного аудиосигнала и восстанавливал входной аудиосигнал. 4 н. и 16 з.п. ф-лы, 7 ил.
Description
Область техники, к которой относится изобретение
Настоящее изобретение относится к технологиям обработки аудиосигналов и, в частности, к способу, устройству и системе кодирования/декодирования во временной области.
Уровень техники
Учитывая, что уши человека менее чувствительны к высокочастотной информации, чем к низкочастотной информации аудиосигнала, для сохранения пропускной способности канала и объема памяти высокочастотную информацию обычно «вырезают», что приводит к снижению качества аудиосигнала. Поэтому применяется технология расширения диапазона частот для восстановления «вырезанной» высокочастотной информации, с тем чтобы улучшить качество аудиосигнала. Поскольку скорость передачи аудиосигналов увеличивается, при этом обеспечивая эффективность кодирования, более широкий диапазон высокочастотной части, которая может быть кодирована, позволяет приемнику получать аудиосигнал с более широким диапазоном и более высоким качеством.
В уровне техники при условии высокой передачи аудиосигналов частотный спектр входного аудиосигнала может быть кодирован во всем диапазоне с использованием технологии расширения диапазона частот. Основной принцип кодирования состоит в следующем: выполняют обработку с полосовой фильтрацией в отношении входного аудиосигнала с использованием полосового фильтра (Band Pass Filter - BPF для краткости), чтобы получить полнодиапазонный сигнал для входного аудиосигнала; выполняют расчет энергии в отношении полнодиапазонного сигнала, чтобы получить энергию Ener0 полнодиапазонного сигнала; выполняют кодирование сигнала высокочастотного диапазона с использованием кодера на основе технологий расширения временного диапазона (Time Band Extension - TBE для краткости) и суперширокого диапазона (Super Wide Band - SWB для краткости), чтобы получить информацию кодирования в высокочастотном диапазоне; согласно сигналу высокочастотного диапазона определяют коэффициент кодирования с линейным прогнозированием (Linear Predictive Coding - LPC для краткости) в полном диапазоне и полнодиапазонный (Full Band - FB для краткости) сигнал возбуждения (Excitation), которые используются для прогнозирования полнодиапазонного сигнала; выполняют обработку с прогнозированием согласно коэффициенту LPC и FB сигналу возбуждения для получения прогнозируемого полнодиапазонного сигнала; выполняют обработку с коррекцией предыскажений в отношении прогнозируемого полнодиапазонного сигнала для определения энергии Ener1 прогнозируемого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений; и вычисляют энергетическое отношение Ener1 к Ener0. Информацию кодирования в высокочастотном диапазоне и энергетическое отношение передают декодеру, чтобы декодер мог восстанавливать полнодиапазонный сигнал для входного аудиосигнала согласно информации кодирования в высокочастотном диапазоне и энергетическому отношению и восстанавливать входной аудиосигнал.
В вышеописанном решении входной аудиосигнал, восстанавливаемый декодером, с высокой вероятностью имеет относительно сильное сигнальное искажение.
Раскрытие изобретения
Варианты осуществления настоящего изобретения обеспечивают способ, устройство и систему кодирования/декодирования для смягчения или устранения проблемы уровня техники, состоящей в том, что входной аудиосигнал, восстанавливаемый декодером, с высокой вероятностью имеет относительно сильное сигнальное искажение.
Согласно первому аспекту настоящее изобретение обеспечивает способ кодирования, включающий в себя этапы, на которых:
используя устройство кодирования, кодируют сигнал низкочастотного диапазона входного аудиосигнала для получения характеристического фактора входного аудиосигнала;
используя устройство кодирования, выполняют кодирование и прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала;
используя устройство кодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяют согласно характеристическому фактору;
используя устройство кодирования, вычисляют первую энергию первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений;
используя устройство кодирования, выполняют обработку с полосовой фильтрацией в отношении входного аудиосигнала для получения второго полнодиапазонного сигнала;
используя устройство кодирования, вычисляют вторую энергию второго полнодиапазонного сигнала;
используя устройство кодирования, вычисляют энергетическое отношение второй энергии второго полнодиапазонного сигнала к первой энергии первого полнодиапазонного сигнала; и
используя устройство кодирования, отправляют на устройство декодирования битовый поток, получаемый в результате кодирования входного аудиосигнала, причем битовый поток включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение входного аудиосигнала.
Со ссылкой на первый аспект в первом возможном варианте реализации первого аспекта способ дополнительно включает в себя этапы, на которых:
используя устройство кодирования, получают количество характеристических факторов;
используя устройство кодирования, определяют среднее значение характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
используя устройство кодирования, определяют параметр коррекции предыскажений согласно среднему значению характеристических факторов.
Со ссылкой на первый аспект или первый возможный вариант реализации первого аспекта во втором возможном варианте реализации первого аспекта этап, на котором, используя устройство кодирования, выполняют прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала, включает в себя этапы, на которых:
используя устройство кодирования, определяют, согласно сигналу высокочастотного диапазона, коэффициент LPC и полнодиапазонный сигнал возбуждения, которые используют для прогнозирования полнодиапазонного сигнала; и
используя устройство кодирования, выполняют обработку с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Со ссылкой на любой один из первого аспекта или первого или второго возможного варианта реализации первого аспекта в третьем возможном варианте реализации первого аспекта этап, на котором, используя устройство кодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, включает в себя этапы, на которых:
используя устройство кодирования, выполняют коррекцию путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и выполняют обработку с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
используя устройство кодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
Со ссылкой на любой один из первого аспекта или первого, второго и третьего возможных вариантов реализации первого аспекта в четвертом возможном варианте реализации первого аспекта характеристический фактор используют для отражения характеристики аудиосигнала, и он включает в себя голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
Согласно второму аспекту, настоящее изобретение обеспечивает способ декодирования, включающий в себя этапы, на которых:
используя устройство декодирования, принимают битовый поток аудиосигнала, отправляемый устройством кодирования, причем битовый поток аудиосигнала включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение аудиосигнала, соответствующего битовому потоку аудиосигнала;
используя устройство декодирования, выполняют декодирование в низкочастотном диапазоне в отношении битового потока аудиосигнала с использованием характеристического фактора для получения сигнала низкочастотного диапазона;
используя устройство декодирования, выполняют декодирование в высокочастотном диапазоне в отношении битового потока аудиосигнала с использованием информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона;
используя устройство декодирования, выполняют прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала;
используя устройство декодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяют согласно характеристическому фактору;
используя устройство декодирования, вычисляют первую энергию первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений;
используя устройство декодирования, получают второй полнодиапазонный сигнал согласно энергетическому отношению, содержащемуся в битовом потоке аудиосигнала, первому полнодиапазонному сигналу, который был подвергнут обработке с коррекцией предыскажений, и первой энергии, причем энергетическое отношение представляет собой энергетическое отношение энергии второго полнодиапазонного сигнала к первой энергии; и
используя устройство декодирования, восстанавливают аудиосигнал, соответствующий битовому потоку аудиосигнала согласно второму полнодиапазонному сигналу, сигналу низкочастотного диапазона и сигналу высокочастотного диапазона.
Со ссылкой на второй аспект в первом возможном варианте реализации второго аспекта способ дополнительно включает в себя этапы, на которых:
используя устройство декодирования, получают количество характеристических факторов посредством декодирования;
используя устройство декодирования, определяют среднее значение характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
используя устройство декодирования, определяют параметр коррекции предыскажений согласно среднему значению характеристических факторов.
Со ссылкой на второй аспект или первый возможный вариант реализации второго аспекта во втором возможном варианте реализации второго аспекта этап, на котором, используя устройство декодирования, выполняют прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала, включает в себя этапы, на которых:
используя устройство декодирования, определяют, согласно сигналу высокочастотного диапазона, коэффициент LPC и полнодиапазонный сигнал возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
используя устройство декодирования, выполняют обработку с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Со ссылкой на любой один из второго аспекта или первого или второго возможного варианта реализации второго аспекта в третьем возможном варианте реализации второго аспекта этап, на котором, используя устройство декодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, включает в себя этапы, на которых:
используя устройство декодирования, выполняют коррекцию путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и выполняют обработку с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
используя устройство декодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
Со ссылкой на любой один из второго аспекта или первого, второго и третьего возможных вариантов реализации второго аспекта в четвертом возможном варианте реализации второго аспекта характеристический фактор используют для отражения характеристики аудиосигнала, и он включает в себя голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
Согласно третьему аспекту, настоящее изобретение обеспечивает устройство кодирования, включающее в себя:
первый модуль кодирования, выполненный с возможностью кодирования сигнала низкочастотного диапазона входного аудиосигнала для получения характеристического фактора входного аудиосигнала;
второй модуль кодирования, выполненный с возможностью осуществления кодирования и прогнозирования в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала;
модуль обработки с коррекцией предыскажений, выполненный с возможностью осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяется согласно характеристическому фактору;
модуль вычисления, выполненный с возможностью вычисления первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений;
модуль обработки с полосовой фильтрацией, выполненный с возможностью осуществления обработки с полосовой фильтрацией в отношении входного аудиосигнала для получения второго полнодиапазонного сигнала, при этом модуль вычисления выполнен с дополнительной возможностью вычисления второй энергии второго полнодиапазонного сигнала и вычисления энергетического отношения второй энергии второго полнодиапазонного сигнала к первой энергии первого полнодиапазонного сигнала; и
модуль отправки, выполненный с возможностью отправки на устройство декодирования битового потока, получаемого в результате кодирования входного аудиосигнала, причем битовый поток включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение входного аудиосигнала.
Со ссылкой на третий аспект в первом возможном варианте реализации третьего аспекта устройство кодирования дополнительно включает в себя модуль определения параметра коррекции предыскажений, выполненный с возможностью:
получения количества характеристических факторов;
определения среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определения параметра коррекции предыскажений согласно среднему значению характеристических факторов.
Со ссылкой на третий аспект или первый возможный вариант реализации третьего аспекта во втором возможном варианте реализации третьего аспекта второй модуль кодирования, в частности, выполнен с возможностью:
определения, согласно сигналу высокочастотного диапазона, коэффициента LPC и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнения обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Со ссылкой на любой один из третьего аспекта или первого или второго возможного варианта реализации третьего аспекта в третьем возможном варианте реализации третьего аспекта модуль обработки с коррекцией предыскажений выполнен, в частности, с возможностью:
осуществления коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала, полученного вторым модулем кодирования, и осуществления обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
Со ссылкой на любой один из третьего аспекта или первого, второго и третьего возможных вариантов реализации третьего аспекта в четвертом возможном варианте реализации третьего аспекта характеристический фактор используется для отражения характеристики аудиосигнала, и он включает в себя голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
Согласно четвертому аспекту настоящее изобретение обеспечивает устройство декодирования, включающее в себя:
приемный модуль, выполненный с возможностью приема битового потока аудиосигнала, отправляемого устройством кодирования, причем битовый поток аудиосигнала включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение аудиосигнала, соответствующего битовому потоку аудиосигнала;
первый модуль декодирования, выполненный с возможностью осуществления декодирования в низкочастотном диапазоне в отношении битового потока аудиосигнала с использованием характеристического фактора для получения сигнала низкочастотного диапазона;
второй модуль декодирования, выполненный с возможностью: осуществления декодирования в высокочастотном диапазоне в отношении битового потока аудиосигнала с использованием информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона; и осуществления прогнозирования в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала;
модуль обработки с коррекцией предыскажений, выполненный с возможностью осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяется согласно характеристическому фактору;
модуль вычисления, выполненный с возможностью: вычисления первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений; и получения второго полнодиапазонного сигнала согласно энергетическому отношению, содержащемуся в битовом потоке аудиосигнала, первому полнодиапазонному сигналу, который был подвергнут обработке с коррекцией предыскажений, и первой энергии, причем энергетическое отношение представляет собой энергетическое отношение энергии второго полнодиапазонного сигнала к первой энергии; и
модуль восстановления, выполненный с возможностью восстановления аудиосигнала, соответствующего битовому потоку аудиосигнала, согласно второму полнодиапазонному сигналу, сигналу низкочастотного диапазона и сигналу высокочастотного диапазона.
Со ссылкой на четвертый аспект в первом возможном варианте реализации четвертого аспекта устройство декодирования дополнительно включает в себя модуль определения параметра коррекции предыскажений, выполненный с возможностью:
получения количества характеристических факторов посредством декодирования;
определения среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определения параметра коррекции предыскажений согласно среднему значению характеристических факторов.
Со ссылкой на четвертый аспект или первый возможный вариант реализации четвертого аспекта во втором возможном варианте реализации четвертого аспекта второй модуль декодирования выполнен, в частности, с возможностью:
определения, согласно сигналу высокочастотного диапазона, коэффициента LPC и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнения обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Со ссылкой на любой один из четвертого аспекта или первого или второго возможного варианта реализации четвертого аспекта в третьем возможном варианте реализации четвертого аспекта модуль обработки с коррекцией предыскажений выполнен, в частности, с возможностью:
осуществления коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и осуществления обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
Со ссылкой на любой один из четвертого аспекта или первого, второго и третьего возможных вариантов реализации четвертого аспекта в четвертом возможном варианте реализации четвертого аспекта характеристический фактор используется для отражения характеристики аудиосигнала, и он включает в себя голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
Согласно пятому аспекту настоящее изобретение обеспечивает систему кодирования/декодирования, включающую в себя устройство кодирования по любому одному из третьего аспекта или первого, второго, третьего и четвертого возможных вариантов реализации третьего аспекта и устройство декодирования по любому одному из четвертого аспекта или первого, второго, третьего и четвертого возможных вариантов реализации четвертого аспекта.
Согласно способу устройству и системе кодека, предложенных в вариантах осуществления настоящего изобретения, обработка с коррекцией предыскажений выполняется в отношении полнодиапазонного сигнала за счет использования параметра коррекции предыскажений, определяемого согласно характеристическому фактору входного аудиосигнала, и затем полнодиапазонный сигнал кодируется и отправляется декодеру, чтобы декодер выполнял соответствующую обработку с декодированием и коррекцией предыскажений в отношении полнодиапазонного сигнала согласно характеристическому фактору входного аудиосигнала и восстанавливал входной аудиосигнал. Это решает проблему уровня техники, состоящую в том, что аудиосигнал, восстанавливаемый декодером, с высокой вероятностью имеет сигнальное искажение, и реализует адаптивную обработку с коррекцией предыскажений в отношении полнодиапазонного сигнала согласно характеристическому фактору аудиосигнала для улучшения производительности кодирования, чтобы входной аудиосигнал, восстанавливаемый декодером, имел относительно высокую точность воспроизведения и был ближе к исходному сигналу.
Краткое описание чертежей
Чтобы яснее изложить технические решения в вариантах осуществления настоящего изобретения или в уровне техники, далее вкратце описаны сопроводительные чертежи, необходимые для пояснения вариантов осуществления или уровня техники. Очевидно, что сопроводительные чертежи в последующем описании показывают некоторые варианты осуществления настоящего изобретения, и специалист в данной области техники сможет получить еще другие чертежи из этих сопроводительных чертежей, не применяя творческих усилий.
Фиг. 1 представляет собой блок-схему варианта осуществления способа кодирования согласно варианту осуществления настоящего изобретения;
Фиг. 2 представляет собой блок-схему варианта осуществления способа декодирования согласно варианту осуществления настоящего изобретения;
Фиг. 3 представляет собой блок-схему варианта 1 осуществления устройства кодирования согласно варианту осуществления настоящего изобретения;
Фиг. 4 представляет собой блок-схему варианта 1 осуществления устройства декодирования согласно варианту осуществления настоящего изобретения;
Фиг. 5 представляет собой блок-схему варианта 2 осуществления устройства кодирования согласно варианту осуществления настоящего изобретения;
Фиг. 6 представляет собой блок-схему варианта 2 осуществления устройства декодирования согласно варианту осуществления настоящего изобретения; и
Фиг. 7 представляет собой блок-схему варианта осуществления системы кодирования/декодирования согласно настоящему изобретению.
Осуществление изобретения
Чтобы сделать яснее цели, технические решения и преимущества вариантов осуществления настоящего изобретения, ниже четко и тщательно описываются технические решения в вариантах осуществления настоящего изобретения со ссылкой на сопроводительные чертежи в вариантах осуществления настоящего изобретения. Очевидно, что описанные варианты осуществления представляют собой лишь часть, а не все варианты осуществления настоящего изобретения. Все другие варианты осуществления, получаемые специалистом в данной области техники, исходя из вариантов осуществления настоящего изобретения без применения творческих усилий, должны подпадать под объем защиты настоящего изобретения.
Фиг. 1 представляет собой блок-схему варианта осуществления способа кодирования согласно варианту осуществления настоящего изобретения. Как показано на Фиг. 1, вариант осуществления способа включает в себя следующие этапы:
S101: Устройство кодирования кодирует сигнал низкочастотного диапазона входного аудиосигнала для получения характеристического фактора входного аудиосигнала.
Кодированный сигнал представляет собой аудиосигнал. Характеристический фактор используется для отражения характеристики аудиосигнала и включает в себя (без ограничения) «голосовой фактор», «спектральный наклон», «краткосрочную среднюю энергию» или «краткосрочную частоту переходов через нуль». Характеристический фактор может быть получен устройством кодирования путем кодирования сигнала низкочастотного диапазона входного аудиосигнала. В частности, используя голосовой фактор в качестве примера, этот голосовой фактор может быть получен посредством выполнения вычисления согласно периоду основного тона, алгебраической кодовой книге и их соответствующим коэффициентам усиления, получаемым из информации кодирования в низкочастотном диапазоне, которая получается путем кодирования сигнала низкочастотного диапазона.
S102: Устройство кодирования выполняет кодирование и прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала.
Когда сигнал высокочастотного диапазона кодирован, то далее получается информация кодирования в высокочастотном диапазоне.
S103: Устройство кодирования выполняет обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяется согласно характеристическому фактору.
S104: Устройство кодирования вычисляет первую энергию первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений.
S105: Устройство кодирования выполняет обработку с полосовой фильтрацией в отношении входного аудиосигнала для получения второго полнодиапазонного сигнала.
S106: Устройство кодирования вычисляет вторую энергию второго полнодиапазонного сигнала.
S107: Устройство кодирования вычисляет энергетическое отношение второй энергии второго полнодиапазонного сигнала к первой энергии первого полнодиапазонного сигнала.
S108: Устройство кодирования отправляет на устройство декодирования битовый поток, получаемый в результате кодирования входного аудиосигнала, причем битовый поток включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношении входного аудиосигнала.
Кроме того, вариант осуществления способа дополнительно включает в себя:
получение устройством кодирования количества характеристических факторов;
определение устройством кодирования среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определение устройством кодирования параметра коррекции предыскажений согласно среднему значению характеристических факторов.
В частности, устройство кодирования может получать один из характеристических факторов. Используя пример, в котором характеристический фактор представляет собой голосовой фактор, устройство кодирования получает количество голосовых факторов и определяет, согласно голосовым факторам и количеству голосовых факторов, среднее значение голосовых факторов входного аудиосигнала, и далее определяет параметр коррекции предыскажений согласно среднему значению голосовых факторов.
Кроме того, выполнение устройством кодирования кодирования и прогнозирования в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала на этапе S102 включает в себя:
определение устройством кодирования, согласно сигналу высокочастотного диапазона, коэффициента LPC и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнение устройством кодирования обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Кроме того, этап S103 включает в себя:
выполнение устройством кодирования коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и выполнение обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
выполнение устройством кодирования обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
При необходимости после этапа S103 вариант осуществления способа дополнительно включает в себя:
выполнение устройством кодирования обработки с повышающей дискретизацией и обработки с полосовой фильтрацией в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений; и
соответственно этап S104 включает в себя:
вычисление устройством кодирования первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений, повышающей дискретизации и обработке с полосовой фильтрацией.
Конкретный вариант реализации варианта осуществления способа описан ниже с помощью примера, в котором характеристический фактор представляет собой голосовой фактор. Для других характеристических факторов процессы их реализации являются аналогичными и не будут подробно описаны в дальнейшем.
В частности, после приема входного аудиосигнала устройство сигнального кодирования в устройстве кодирования извлекает сигнал низкочастотного диапазона из входного аудиосигнала, причем соответствующий диапазон частотного спектра составляет [0, f1], и кодирует сигнал низкочастотного диапазона для получения голосового фактора входного аудиосигнала. В частности, устройство сигнального кодирования кодирует сигнал низкочастотного диапазона для получения информации кодирования в низкочастотном диапазоне, выполняет вычисления, согласно периоду основного тона, алгебраической кодовой книге и их соответствующим коэффициентам усиления, содержащимся в информации кодирования в низкочастотном диапазоне, для получения голосового фактора, и определяет параметр коррекции предыскажений согласно голосовому фактору. Устройство сигнального кодирования извлекает сигнал высокочастотного диапазона из входного аудиосигнала, причем соответствующий диапазон частотного спектра составляет [f1, f2], выполняет кодирование и прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона для получения информации кодирования в высокочастотном диапазоне, определяет, согласно сигналу высокочасотного диапазона, коэффициент LPC и полнодиапазонный сигнал возбуждения, которые используются для прогнозирования полнодиапазонного сигнала, выполняет обработку с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения прогнозируемого первого полнодиапазонного сигнала, и выполняет обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяется согласно голосовому фактору. После определения первого полнодиапазонного сигнала могут быть выполнены коррекция путем смещения частотного спектра и обработка с отражением частотного спектра в отношении первого полнодиапазонного сигнала и затем может быть выполнена обработка с коррекцией предыскажений. При необходимости повышающая дискретизация и обработка с полосовой фильтрацией могут быть выполнены в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений. Далее устройство кодирования вычисляет первую энергию Ener0 обработанного первого полнодиапазонного сигнала, выполняет обработку с полосовой фильтрацией в отношении входного аудиосигнала для получения второго полнодиапазонного сигнала, чей диапазон частотного спектра составляет [f2, f3], определяет вторую энергию Ener1 второго полнодиапазонного сигнала, определяет энергетическое отношение (ratio) Ener1 к Ener0 и включает характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение входного аудиосигнала в битовый поток, получаемый в результате кодирования входного аудиосигнала, и отправляет битовый поток устройству декодирования, чтобы устройство декодирования восстанавливало аудиосигнал согласно принятому битовому потоку, характеристическому фактору, информации кодирования в высокочастотном диапазоне и энергетическому отношению.
Как правило, для входного аудиосигнала 48 килогерц (кГц - для краткости) соответствующий диапазон частотного спектра [0, f1] сигнала низкочастотного диапазона во входном аудиосигнале может, в частности, составлять [0, 8 кГц], и соответствующий диапазон частотного спектра [f1, f2] сигнала высокочастотного диапазона во входном аудиосигнале может, в частности, составлять [8 кГц, 16 кГц]. Соответствующий диапазон частотного спектра [f2, f3], соответствующий второму полнодиапазонному сигналу, может, в частности, составлять [16 кГц, 20 кГц]. Далее в качестве примера подробно описан способ реализации варианта осуществления способа путем использования конкретных диапазонов частотного спектра. Следует отметить, что настоящее изобретение применимо к этому варианту реализации, но не ограничено им.
В конкретной реализации сигнал низкочастотного диапазона, соответствующий [0, 8 кГц], может быть кодирован с использованием внутреннего кодера на основе технологии линейного прогнозирования с кодовым возбуждением (Code Excited Linear Prediction - CELP для краткости) с тем, чтобы получить информацию кодирования в низкочастотном диапазоне. Алгоритм кодирования, используемый внутренним кодером, может представлять собой существующий алгоритм линейного прогнозирования с возбуждением по алгебраическому коду (Algebraic Code Excited Linear Prediction - ACELP для краткости), но не ограничен им.
Период основного тона, алгебраическая кодовая книга и их соответствующие коэффициенты усиления извлекаются из информации кодирования в низкочастотном диапазоне, голосовой фактор (voice_factor) получается через вычисление, используя существующий алгоритм, причем подробности этого алгоритма не будут описаны дополнительно. После определения голосового фактора определяется фактор μ коррекции предыскажений, используемый для вычисления параметра коррекции предыскажений. Далее, используя в качестве примера голосовой фактор, описан подробно процесс вычисления, в котором определяется фактор μ коррекции предыскажений.
Сначала определяется количество М получаемых голосовых факторов, которое обычно может составлять 4 или 5. М голосовых факторов суммируются и усредняются, чтобы определить среднее значение varvoiceshape голосовых факторов. Фактор μ коррекции предыскажений определяется согласно среднему значению, и параметр H(Z) коррекции предыскажений может быть далее получен согласно μ, как показано нижеследующей формулой (1):
H(Z)=1/(1-μZ-1), (1)
где H(Z) - выражение передаточной функции в области Z, Z-1 представляет собой элемент задержки, и μ определяется согласно varvoiceshape. Любое значение, относимое к varvoiceshape, может быть выбрано в качестве μ, которое может, в частности, быть равным: μ=varvoiceshape3, μ=varvoiceshape2, μ=varvoiceshape или μ=1-varvoiceshape, но не ограничиваться этим.
Сигнал высокочастотного диапазона, соответствующий [8 кГц, 16 кГц], может быть кодирован с использованием кодера на основе технологий расширения временного диапазона (Time Band Extension - TBE для краткости) и суперширокого диапазона (Super Wide Band - SWB для краткости). Это подразумевает следующее: извлечение периода основного тона, алгебраической кодовой книги и их соответствующих коэффициентов усиления из внутреннего кодера для восстановления сигнала возбуждения высокочастотного диапазона; извлечение составляющей сигнала высокочастотного диапазона для выполнения анализа LPC, чтобы получить коэффициент LPC высокочастотного диапазона; объединение сигнала возбуждения высокочастотного диапазона и коэффициента LPC высокочастотного диапазона для получения восстановленного сигнала высокочастотного диапазона; сравнение восстановленного сигнала высокочастотного диапазона с сигналом высокочастотного диапазона во входной аудиоинформации для получения параметра gain коррекции коэффициента усиления; и квантование, используя малое количество битов, коэффициента LPC высокочастотного диапазона и параметра gain коэффициента усиления для получения информации кодирования в высокочастотного диапазоне.
Далее SWB кодер определяет, согласно сигналу высокочастотного диапазона во входном аудиосигнале, коэффициент LPC полного диапазона и полнодиапазонный сигнал возбуждения, которые используются для прогнозирования полнодиапазонного сигнала, и выполняет обработку с объединением в отношении коэффициента LPC полного диапазона и полнодиапазонного сигнала возбуждения для получения прогнозируемого первого полнодиапазонного сигнала, а затем в отношении первого полнодиапазонного сигнала может быть выполнена коррекция путем смещения частотного спектра, используя следующую формулу (2):
S2k=S1k×cos(2×PI×fn×k/fs), (2)
где k представляет собой k-ю точку временной выборки, k - положительное целое число, S2 - первый сигнал частотного спектра после коррекции путем смещения частотного спектра, S1 - первый полнодиапазонный сигнал, PI - отношение периметра круга к его диаметру, fn указывает, что расстояние, на которое требуется сместить частотный спектр, составляет n точек временной выборки, n - положительное целое число, и fs представляет собой скорость дискретизации сигналов.
После коррекции путем смещения частотного спектра в отношении S2 выполняется обработка с отражением частотного спектра для получения первого полнодиапазонного сигнала S3, который был подвергнут обработке с отражением частотного спектра, при которой отражаются амплитуды сигналов частотного спектра соответствующих точек временной выборки до и после смещения частотного спектра. Способ реализации отражения частотного спектра может быть таким же, как и общеизвестное отражение частотного спектра, так чтобы частотный спектр имел структуру, идентичную структуре исходного частотного спектра, в связи с чем подробности этого будут опущены.
Далее в отношении S3 выполняется обработка с коррекцией предыскажений, используя параметр H(Z) коррекции предыскажений, определенный согласно голосовому фактору, для получения первого полнодиапазонного сигнала S4, который был подвергнут обработке с коррекцией предыскажений, и затем определяется энергия Ener0 для S4. В частности, обработка с коррекцией предыскажений может быть выполнена с использованием фильтра коррекции предыскажений, обладающего параметром коррекции предыскажений.
При необходимости после получения S4 может быть выполнена обработка с повышающей дискретизацией посредством вставки нулей в отношении первого полнодиапазонного сигнала S4, который был подвергнут обработке с коррекцией предыскажений, для получения первого полнодиапазонного сигнала S5, который был подвергнут обработке с повышающей дискретизацией, и затем в отношении S5 может быть выполнена обработка с полосовой фильтрацией с использованием полосового фильтра (Band Pass Filter - BPF для краткости), обладающего диапазоном пропускания [16 кГц, 20 кГц], для получения первого полнодиапазонного сигнала S6, и после этого определяется энергия Ener0 для S6. Повышающая дискретизация и обработка с полосовой фильтрацией выполняются в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений, и затем определяется энергия первого полнодиапазонного сигнала, так что энергия частотного спектра и структура частотного спектра сигнала возбуждения высокочастотного диапазона могут быть скорректированы для улучшения производительности кодирования.
Второй полнодиапазонный сигнал может быть получен устройством кодирования посредством выполнения обработки с полосовой фильтрацией в отношении входного аудиосигнала, используя полосовой фильтр (Band Pass Filter - BPF для краткости), обладающий диапазоном пропускания [16 кГц, 20 кГц]. После получения второго полнодиапазонного сигнала устройство кодирования определяет энергию Ener1 второго полнодиапазонного сигнала и вычисляет отношение энергию Ener1 к энергии Ener0. После выполнения обработки с квантованием в отношении энергетического отношения энергетическое отношение, характеристический фактор и информация кодирования в высокочастотном диапазоне для входного аудиосигнала заключаются в битовый поток и отправляются устройству декодирования.
В уровне технике фактор μ коррекции предыскажений параметра H(Z) фильтрации с коррекцией предыскажений обычно имеет фиксированное значение, и сигнальный тип входного аудиосигнала не учитывается, что приводит к тому, что входной аудиосигнал, восстанавливаемый устройством декодирования, с высокой вероятностью имеет сигнальное искажение.
Согласно варианту осуществления способа обработка с коррекцией предыскажений выполняется в отношении полнодиапазонного сигнала с использованием параметра коррекции предыскажений, определяемого согласно характеристическому фактору входного аудиосигнала, и затем полнодиапазонный сигнал кодируется и отправляется декодеру, чтобы декодер выполнял соответствующую обработку с декодированием и коррекцией предыскажений в отношении полнодиапазонного сигнала согласно характеристическому фактору входного аудиосигнала и восстанавливал входной аудиосигнал. Это решает проблему уровня техники, состоящую в том, что аудиосигнал, восстанавливаемый декодером, с высокой вероятностью имеет сигнальное искажение, и реализует адаптивную обработку с коррекцией предыскажений в отношении полнодиапазонного сигнала согласно характеристическому фактору аудиосигнала для улучшения производительности кодирования, чтобы входной аудиосигнал, восстанавливаемый декодером, имел относительно высокую точность воспроизведения и был ближе к исходному сигналу.
Фиг. 2 представляет собой блок-схему варианта осуществления способа декодирования согласно варианту осуществления настоящего изобретения и она является вариантом осуществления способа на стороне декодера, который соответствует варианту осуществления способа, показанному на Фиг. 1. Как показано на Фиг. 2, вариант осуществления способа включает в себя следующие этапы:
S201: Устройство декодирования принимает битовый поток аудиосигнала, отправляемый устройством кодирования, причем битовый поток аудиосигнала включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение аудиосигнала, соответствующего битовому потоку аудиосигнала.
Характеристический фактор используется для отражения характеристики аудиосигнала и включает в себя (без ограничения) «голосовой фактор», «спектральный наклон», «краткосрочную среднюю энергию» или «краткосрочную частоту переходов через нуль». Этот характеристический фактор является таким же, как и характеристический фактор в варианте осуществления способа, показанном на Фиг. 1, в связи с чем он не будет снова подробно описан.
S202: Устройство декодирования выполняет декодирование в низкочастотном диапазоне в отношении битового потока аудиосигнала с использованием характеристического фактора для получения сигнала низкочастотного диапазона.
S203: Устройство декодирования выполняет декодирование в высокочастотном диапазоне в отношении битового потока аудиосигнала с использованием информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона.
S204: Устройство декодирования выполняет прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала.
S205: Устройство декодирования выполняет обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяется согласно характеристическому фактору.
S206: Устройство декодирования вычисляет первую энергию первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений.
S207: Устройство декодирования получает второй полнодиапазонный сигнал согласно энергетическому отношению, содержащемуся в битовом потоке аудиосигнала, первому полнодиапазонному сигналу, который был подвергнут обработке с коррекцией предыскажений, и первой энергии, причем энергетическое отношение представляет собой энергетическое отношение энергии второго полнодиапазонного сигнала к первой энергии.
S208: Устройство декодирования восстанавливает аудиосигнал, соответствующий битовому потоку аудиосигнала, согласно второму полнодиапазонному сигналу, сигналу низкочастотного диапазона и сигналу высокочастотного диапазона.
Кроме того, вариант осуществления способа дополнительно включает в себя:
получение устройством декодирования количества характеристических факторов посредством декодирования;
определение устройством декодирования среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определение устройством декодирования параметра коррекции предыскажений согласно среднему значению характеристических факторов.
Кроме того, этап S204 включает в себя:
определение устройством декодирования, согласно сигналу высокочастотного диапазона, коэффициента LPC и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнение устройством декодирования обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Кроме того, этап S205 включает в себя:
выполнение устройством декодирования коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и выполнение обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
выполнение устройством декодирования обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
При необходимости после этапа S205 вариант осуществления способа дополнительно включает в себя:
выполнение устройством декодирования повышающей дискретизации и обработки с полосовой фильтрацией в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений; и
соответственно этап S206 включает в себя:
определение устройством декодирования первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений, повышающей дискретизации и обработке с полосовой фильтрацией.
Этот вариант осуществление способа соответствует техническому решению в варианте осуществления способа, показанном на Фиг. 1. Конкретный способ реализации варианта осуществления способа описан с использованием примера, в котором характеристический фактор представляет собой голосовой фактор. Для других характеристических факторов процессы их реализации являются аналогичными и не будут подробно описаны в дальнейшем.
В частности, устройство декодирования принимает битовый поток аудиосигнала, отправляемый устройством кодирования, причем битовый поток аудиосигнала включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение аудиосигнала, соответствующего битовому потоку аудиосигнала. Далее устройство декодирования извлекает характеристический фактор аудиосигнала из битового потока аудиосигнала, выполняет декодирование в низкочастотном диапазоне в отношении битового потока аудиосигнала с использованием характеристического фактора аудиосигнала для получения сигнала низкочастотного диапазона и выполняет декодирование в высокочастотном диапазоне в отношении битового потока аудиосигнала с использованием информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона. Устройство декодирования определяет параметр коррекции предыскажений согласно характеристическому фактору, выполняет прогнозирование полнодиапазонного сигнала согласно сигналу высокочастотного диапазона, полученного посредством декодирования, для получения первого полнодиапазонного сигнала S1, выполняет обработку с коррекцией путем смещения частотного спектра в отношении S1 для получения первого полнодиапазонного сигнала S2, который был подвергнут обработке с коррекцией путем смещения частотного спектра, выполняет обработку с отражением частотного спектра в отношении S2 для получения сигнала S3, выполняет обработку с коррекцией предыскажений с использованием параметра коррекции предыскажений, определенного согласно характеристическому фактору для получения сигнала S4, и вычисляет первую энергию Ener0 для S4. При необходимости устройство декодирования выполняет обработку с повышающей дискретизацией в отношении S4 для получения сигнала S5, выполняет обработку с полосовой фильтрацией в отношении S5 для получения сигнала S6, а затем вычисляет первую энергию Ener0 для S6. После этого согласно сигналу S4 или S6 Ener0 и принятому энергетическому отношению получается второй полнодиапазонный сигнал, и аудиосигнал, соответствующий битовому потоку аудиосигнала, восстанавливается согласно второму полнодиапазонному сигналу, сигналу низкочастотного диапазона и сигналу высокочастотного диапазона, которые получаются посредством декодирования.
В конкретной реализации декодирование в низкочастотном диапазоне может быть выполнено внутренним декодером в отношении битового потока аудиосигнала, используя характеристический фактор, для получения сигнала низкочастотного диапазона. Декодирование в высокочастотном диапазоне может быть выполнено SWB декодером в отношении информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона. После получения сигнала высокочастотного диапазона прогнозирование в расширенном спектре выполняется непосредственно согласно сигналу высокочастотного диапазона или после умножения сигнала высокочастотного диапазона на коэффициент ослабления, чтобы получить первый полнодиапазонный сигнал, и обработка с коррекцией путем смещения частотного спектра, обработка с отражением частотного спектра и обработка с коррекцией предыскажений выполняются в отношении первого полнодиапазонного сигнала. При необходимости обработка с повышающей дискретизацией и обработка с полосовой фильтрацией выполняются в отношении первого сигнала частотного диапазона, который был подвергнут обработке с коррекцией предыскажений. В конкретной реализации способ реализации, аналогичный тому, что использовался в варианте осуществления, показанном на Фиг. 1, может быть использован для обработки, в связи с чем он не будет снова подробно описан.
Получение второго полнодиапазонного сигнала согласно сигналу S4 или S6, Ener0 и принятому энергетическому отношению, в частности, состоит в следующем: выполнение коррекции по энергии в отношении первого полнодиапазонного сигнала согласно энергетическому отношению R и первой энергии Ener0 для восстановления второго полнодиапазонного сигнала Ener1=Ener0×R, и получение второго полнодиапазонного сигнала согласно частотному спектру первого полнодиапазонного сигнала и энергии Ener1.
Согласно варианту осуществления способа устройство декодирования определяет параметр коррекции предыскажений, используя характеристический фактор аудиосигнала, который содержится в битовом потоке аудиосигнала, выполняет обработку с коррекцией предыскажений в отношении полнодиапазонного сигнала и получает сигнал низкочастотного диапазона посредством декодирования с использованием характеристического фактора, чтобы аудиосигнал, восстанавливаемый устройством декодирования, был ближе к исходному входному аудиосигналу и имел более высокую точность воспроизведения.
Фиг. 3 представляет собой блок-схему варианта 1 осуществления устройства кодирования согласно варианту осуществления настоящего изобретения. Как показано на Фиг. 3, устройство 300 кодирования включает в себя первый модуль 301 кодирования, второй модуль 302 кодирования, модуль 303 обработки с коррекцией предыскажений, модуль 304 вычисления, модуль 305 обработки с полосовой фильтрацией и модуль 306 отправки, при этом:
первый модуль 301 кодирования выполнен с возможностью кодирования сигнала низкочастотного диапазона входного аудиосигнала для получения характеристического фактора входного аудиосигнала, причем
характеристический фактор используется для отражения характеристики аудиосигнала и включает в себя голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль;
второй модуль 302 кодирования выполнен с возможностью осуществления кодирования и прогнозирования в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала;
модуль 303 обработки с коррекцией предыскажений выполнен с возможностью осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяется согласно характеристическому фактору;
модуль 304 вычисления выполнен с возможностью вычисления первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений;
модуль 305 обработки с полосовой фильтрацией выполнен с возможностью осуществления обработки с полосовой фильтрацией в отношении входного аудиосигнала для получения второго полнодиапазонного сигнала;
модуль 304 вычисления выполнен с дополнительной возможностью вычисления второй энергии второго полнодиапазонного сигнала и вычисления энергетического отношения второй энергии второго полнодиапазонного сигнала к первой энергии первого полнодиапазонного сигнала; и
модуль 306 отправки выполнен с возможностью отправки на устройство декодирования битового потока, получаемого в результате кодирования входного аудиосигнала, причем битовый поток включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение входного аудиосигнала.
Кроме того, устройство 300 кодирования дополнительно включает в себя модуль 307 определения параметра коррекции предыскажений, выполненный с возможностью:
получения количества характеристических факторов;
определения среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определения параметра коррекции предыскажений согласно среднему значению характеристических факторов.
Кроме того, второй модуль 302 кодирования, в частности, выполнен с возможностью:
определения, согласно сигналу высокочастотного диапазона, коэффициента LPC и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнения обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Кроме того, модуль 303 обработки с коррекцией предыскажений выполнен, в частности, с возможностью:
осуществления коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала, полученного вторым модулем 302 кодирования, и осуществления обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
Устройство кодирования, обеспеченное в этом варианте осуществления, может быть выполнено с возможностью исполнения технического решения в варианте осуществления способа, показанном на Фиг. 1. Их принципы реализации и технические эффекты являются аналогичными, в связи с чем они не будут снова подробно описаны.
Фиг. 4 представляет собой блок-схему варианта 1 осуществления устройства декодирования согласно варианту осуществления настоящего изобретения. Как показано на Фиг. 4, устройство 400 декодирования включает в себя приемный модуль 401, первый модуль 402 декодирования, второй модуль 403 декодирования, модуль 404 обработки с коррекцией предыскажений, модуль 405 вычисления и модуль 406 восстановления, при этом:
приемный модуль 401 выполнен с возможностью приема битового потока аудиосигнала, отправляемого устройством кодирования, причем битовый поток аудиосигнала включает в себя характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение аудиосигнала, соответствующего битовому потоку аудиосигнала, причем
характеристический фактор используется для отражения характеристики аудиосигнала и включает в себя голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль;
первый модуль 402 декодирования выполнен с возможностью осуществления декодирования в низкочастотном диапазоне в отношении битового потока аудиосигнала с использованием характеристического фактора для получения сигнала низкочастотного диапазона;
второй модуль 403 декодирования выполнен с возможностью: осуществления декодирования в высокочастотном диапазоне в отношении битового потока аудиосигнала с использованием информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона; и осуществления прогнозирования в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала;
модуль 404 обработки с коррекцией предыскажений выполнен с возможностью осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяется согласно характеристическому фактору;
модуль 405 вычисления выполнен с возможностью: вычисления первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений; и получения второго полнодиапазонного сигнала согласно энергетическому отношению, содержащемуся в битовом потоке аудиосигнала, первому полнодиапазонному сигналу, который был подвергнут обработке с коррекцией предыскажений, и первой энергии, причем энергетическое отношение представляет собой энергетическое отношение энергии второго полнодиапазонного сигнала к первой энергии; и
модуль 406 восстановления выполнен с возможностью восстановления аудиосигнала, соответствующего битовому потоку аудиосигнала, согласно второму полнодиапазонному сигналу, сигналу низкочастотного диапазона и сигналу высокочастотного диапазона.
Кроме того, устройство 400 декодирования дополнительно включает в себя модуль 407 определения параметра коррекции предыскажений, выполненный с возможностью:
получения количества характеристических факторов посредством декодирования;
определения среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определения параметра коррекции предыскажений согласно среднему значению характеристических факторов.
Кроме того, второй модуль 403 декодирования выполнен, в частности, с возможностью:
определения, согласно сигналу высокочастотного диапазона, коэффициента LPC и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнения обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
Кроме того, модуль 404 обработки с коррекцией предыскажений выполнен, в частности, с возможностью:
осуществления коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и осуществления обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
Устройство декодирования, обеспеченное в этом варианте осуществления, может быть выполнено с возможностью исполнения технического решения в варианте осуществления способа, показанном на Фиг. 2. Их принципы реализации и технические эффекты являются аналогичными, в связи с чем они не будут снова подробно описаны.
Фиг. 5 представляет собой блок-схему варианта 2 осуществления устройства кодирования согласно варианту осуществления настоящего изобретения. Как показано на Фиг. 5, устройство 500 кодирования включает в себя процессор 501, память 502 и интерфейс 503 связи. Процессор 501, память 502 и интерфейс 503 связи соединены посредством шины (которая показана сплошной толстой линией на фигуре).
Интерфейс 503 связи выполнен с возможностью приема входных данных аудиосигнала и осуществления связи с устройством декодирования. Память 502 выполнена с возможностью хранения программного кода. Процессор 501 выполнен с возможностью вызова программного кода, хранимого в памяти 502, для исполнения технического решения в варианте осуществления способа, показанном на Фиг. 1. Их принципы реализации и технические эффекты являются аналогичными, в связи с чем они не будут снова подробно описаны.
Фиг. 6 представляет собой блок-схему варианта 2 осуществления устройства декодирования согласно варианту осуществления настоящего изобретения. Как показано на Фиг. 6, устройство 600 декодирования включает в себя процессор 601, память 602 и интерфейс 603 связи. Процессор 601, память 602 и интерфейс 603 связи соединены посредством шины (которая показана сплошной толстой линией на фигуре).
Интерфейс 603 связи выполнен с возможностью осуществления связи с устройством кодирования и вывода восстановленного аудиосигнала. Память 602 выполнена с возможностью хранения программного кода. Процессор 601 выполнен с возможностью вызова программного кода, хранимого в памяти 602, для исполнения технического решения в варианте осуществления способа, показанном на Фиг. 2. Их принципы реализации и технические эффекты являются аналогичными, в связи с чем они не будут снова подробно описаны.
Фиг. 7 представляет собой блок-схему варианта осуществления системы кодирования/декодирования согласно настоящему изобретению. Как показано на Фиг. 7, система 700 кодека включает в себя устройство 701 кодирования и устройство 702 декодирования. Устройство 701 кодирования и устройство 702 декодирования могут быть соответственно устройством кодирования, показанном на Фиг. 3, и устройством декодирования, показанном на Фиг. 4 и могут быть соответственно выполнены с возможностью исполнения технических решений в вариантах осуществления способов, показанных на Фиг. 1 и Фиг. 2. Их принципы реализации и технические эффекты являются аналогичными, в связи с чем они не будут снова подробно описаны.
Используя описания вышеуказанных вариантов осуществления, специалист в данной области техники сможет ясно осознать, что настоящее изобретение может быть реализовано с помощью аппаратного обеспечения, программно-аппаратного обеспечения или их комбинации. В случае реализации настоящего изобретения с помощью программного обеспечения вышеописанные функции могут храниться на машиночитаемом носителе или передаваться в виде одной или более команд или кода на машиночитаемом носителе. Машиночитаемый носитель включает в себя компьютерный носитель данных и среду связи, при этом среда связи включает в себя любую среду, которая позволяет компьютерной программе передаваться из одного места в другое. Носитель данных может быть любым существующим носитель, доступ к которому осуществляется через компьютер. Далее приведен пример, который не накладывает какое-либо ограничение: машиночитаемый носитель может включать в себя RAM, ROM, EEPROM, CD-ROM или любое оптическое дисковое запоминающее устройство или дисковый носитель данных, или другое магнитное запоминающее устройство, или любой другой носитель, который может переносить или хранить требуемый программный код в виде команд или структур данных, и доступ к которому можно осуществлять через компьютер. Кроме того, любое соединение может быть подходящим образом определено как машиночитаемый носитель. Например, если программное обеспечение передается с веб-сайта, сервера или другого удаленного источника с использованием коаксиального кабеля, оптического волокна/кабеля, витой пары, цифровой абонентской линии (DSL) или беспроводных технологий, таких как инфракрасный луч, радио и микроволна, то такие коаксиальный кабель, оптическое волокно/кабель, витая пара, DSL или беспроводные технологии, такие как инфракрасный луч, радио и микроволна, подпадают под определение носителя. Например, термин «диск», используемый в настоящем изобретении, включает в себя компакт-диск CD, лазерный диск, оптический диск, цифровой универсальный диск (DVD), флоппи-диск и диск Blu-ray, причем диск в целом копирует данные магнитным способом или копирует данные оптически с помощью лазерного средства. Вышеприведенная комбинация носителей должна быть также включена в объем защиты, обеспечиваемый термином «машиночитаемый носитель».
Более того, должно быть понятно, что в зависимости от вариантов осуществления некоторые действия или этапы какого-либо способа, описанного в этом описании, могут быть исполнены согласно разным последовательностям или могут быть добавлены, объединены или опущены (например, для достижения некоторых определенных целей не все описанные действия или этапы являются обязательными). Кроме того, в некоторых вариантах осуществления действия или этапы могут выполняться при гиперпотоковой обработке, обработке с прерываниями или одновременной обработке посредством множества процессоров, причем одновременная обработка может представлять собой непоследовательное исполнение. Вдобавок, в целях ясности конкретные варианты осуществления настоящего изобретения описаны в виде функции, выполняемой одним этапом или модулем, но следует понимать, что технологии, применяемые в настоящем изобретении, могут представлять собой объединенное исполнение множества вышеописанных этапов или модулей.
Наконец, следует отметить, что вышеприведенные варианты осуществления всего лишь предназначены для описания технических решений настоящего изобретения, а не для ограничения настоящего изобретения. Хотя настоящее изобретение описано подробно со ссылкой на вышеприведенные варианты осуществления, специалистам в данной области техники должно быть понятно, что они, тем не менее, могут внести изменения в технические решения, описанные в вышеприведенных вариантах осуществления, или сделать эквивалентные замены некоторых или всех их технических признаков, не отступая от объема технических решений вариантов осуществления настоящего изобретения.
Claims (76)
1. Способ кодирования, содержащий этапы, на которых:
используя устройство кодирования, кодируют сигнал низкочастотного диапазона входного аудиосигнала для получения характеристического фактора входного аудиосигнала;
используя устройство кодирования, выполняют кодирование и прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала;
используя устройство кодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяют согласно характеристическому фактору;
используя устройство кодирования, вычисляют первую энергию первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений;
используя устройство кодирования, выполняют обработку с полосовой фильтрацией в отношении входного аудиосигнала для получения второго полнодиапазонного сигнала;
используя устройство кодирования, вычисляют вторую энергию второго полнодиапазонного сигнала;
используя устройство кодирования, вычисляют энергетическое отношение второй энергии второго полнодиапазонного сигнала к первой энергии первого полнодиапазонного сигнала; и
используя устройство кодирования, отправляют на устройство декодирования битовый поток, получаемый в результате кодирования входного аудиосигнала, причем битовый поток содержит характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение входного аудиосигнала.
2. Способ по п.1, дополнительно содержащий этапы, на которых:
используя устройство кодирования, получают количество характеристических факторов;
используя устройство кодирования, определяют среднее значение характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
используя устройство кодирования, определяют параметр коррекции предыскажений согласно среднему значению характеристических факторов.
3. Способ по п.1 или 2, в котором этап, на котором, используя устройство кодирования, выполняют прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала, содержит этапы, на которых:
используя устройство кодирования, определяют, согласно сигналу высокочастотного диапазона, коэффициент кодирования с линейным прогнозированием, LPC, и полнодиапазонный сигнал возбуждения, которые используют для прогнозирования полнодиапазонного сигнала; и
используя устройство кодирования, выполняют обработку с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
4. Способ по п.1 или 2, в котором этап, на котором, используя устройство кодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, содержит этапы, на которых:
используя устройство кодирования, выполняют коррекцию путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и выполняют обработку с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
используя устройство кодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
5. Способ по п.1 или 2, в котором характеристический фактор используют для отражения характеристики аудиосигнала, и он содержит голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
6. Способ декодирования, содержащий этапы, на которых:
используя устройство декодирования, принимают битовый поток аудиосигнала, отправляемый устройством кодирования, причем битовый поток аудиосигнала содержит характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение аудиосигнала, соответствующего битовому потоку аудиосигнала;
используя устройство декодирования, выполняют декодирование в низкочастотном диапазоне в отношении битового потока аудиосигнала с использованием характеристического фактора для получения сигнала низкочастотного диапазона;
используя устройство декодирования, выполняют декодирование в высокочастотном диапазоне в отношении битового потока аудиосигнала с использованием информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона;
используя устройство декодирования, выполняют прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала;
используя устройство декодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определяют согласно характеристическому фактору;
используя устройство декодирования, вычисляют первую энергию первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений;
используя устройство декодирования, получают второй полнодиапазонный сигнал согласно энергетическому отношению, содержащемуся в битовом потоке аудиосигнала, первому полнодиапазонному сигналу, который был подвергнут обработке с коррекцией предыскажений, и первой энергии, причем энергетическое отношение представляет собой энергетическое отношение энергии второго полнодиапазонного сигнала к первой энергии; и
используя устройство декодирования, восстанавливают аудиосигнал, соответствующий битовому потоку аудиосигнала согласно второму полнодиапазонному сигналу, сигналу низкочастотного диапазона и сигналу высокочастотного диапазона.
7. Способ декодирования по п.6, дополнительно содержащий этапы, на которых:
используя устройство декодирования, получают количество характеристических факторов посредством декодирования;
используя устройство декодирования, определяют среднее значение характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
используя устройство декодирования, определяют параметр коррекции предыскажений согласно среднему значению характеристических факторов.
8. Способ декодирования по п.6 или 7, в котором этап, на котором, используя устройство декодирования, выполняют прогнозирование в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала, содержит этапы, на которых:
используя устройство декодирования, определяют, согласно сигналу высокочастотного диапазона, коэффициент кодирования с линейным прогнозированием, LPC, и полнодиапазонный сигнал возбуждения, которые используют для прогнозирования полнодиапазонного сигнала; и
используя устройство декодирования, выполняют обработку с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
9. Способ декодирования по п.6 или 7, в котором этап, на котором, используя устройство декодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, содержит этапы, на которых:
используя устройство декодирования, выполняют коррекцию путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и выполняют обработку с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
используя устройство декодирования, выполняют обработку с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
10. Способ по п.6 или 7, в котором характеристический фактор используют для отражения характеристики аудиосигнала, и он содержит голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
11. Устройство кодирования, содержащее:
первый модуль кодирования, выполненный с возможностью кодирования сигнала низкочастотного диапазона входного аудиосигнала для получения характеристического фактора входного аудиосигнала;
второй модуль кодирования, выполненный с возможностью осуществления кодирования и прогнозирования в расширенном спектре в отношении сигнала высокочастотного диапазона входного аудиосигнала для получения первого полнодиапазонного сигнала;
модуль обработки с коррекцией предыскажений, выполненный с возможностью осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определен согласно характеристическому фактору;
модуль вычисления, выполненный с возможностью вычисления первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений;
модуль обработки с полосовой фильтрацией, выполненный с возможностью осуществления обработки с полосовой фильтрацией в отношении входного аудиосигнала для получения второго полнодиапазонного сигнала, при этом модуль вычисления выполнен с дополнительной возможностью вычисления второй энергии второго полнодиапазонного сигнала и вычисления энергетического отношения второй энергии второго полнодиапазонного сигнала к первой энергии первого полнодиапазонного сигнала; и
модуль отправки, выполненный с возможностью отправки на устройство декодирования битового потока, получаемого в результате кодирования входного аудиосигнала, причем битовый поток содержит характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение входного аудиосигнала.
12. Устройство кодирования по п.11, дополнительно содержащее модуль определения параметра коррекции предыскажений, выполненный с возможностью:
получения количества характеристических факторов;
определения среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определения параметра коррекции предыскажений согласно среднему значению характеристических факторов.
13. Устройство кодирования по п.11 или 12, в котором второй модуль кодирования, в частности, выполнен с возможностью:
определения, согласно сигналу высокочастотного диапазона, коэффициента кодирования с линейным прогнозированием, LPC, и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнения обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
14. Устройство кодирования по п.11 или 12, в котором модуль обработки с коррекцией предыскажений выполнен, в частности, с возможностью:
осуществления коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала, полученного вторым модулем кодирования, и осуществления обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
15. Устройство кодирования по п.11 или 12, в котором характеристический фактор используется для отражения характеристики аудиосигнала, и он содержит голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
16. Устройство декодирования, содержащее:
приемный модуль, выполненный с возможностью приема битового потока аудиосигнала, отправляемого устройством кодирования, причем битовый поток аудиосигнала содержит характеристический фактор, информацию кодирования в высокочастотном диапазоне и энергетическое отношение аудиосигнала, соответствующего битовому потоку аудиосигнала;
первый модуль декодирования, выполненный с возможностью осуществления декодирования в низкочастотном диапазоне в отношении битового потока аудиосигнала с использованием характеристического фактора для получения сигнала низкочастотного диапазона;
второй модуль декодирования, выполненный с возможностью: осуществления декодирования в высокочастотном диапазоне в отношении битового потока аудиосигнала с использованием информации кодирования в высокочастотном диапазоне для получения сигнала высокочастотного диапазона; и осуществления прогнозирования в расширенном спектре в отношении сигнала высокочастотного диапазона для получения первого полнодиапазонного сигнала;
модуль обработки с коррекцией предыскажений, выполненный с возможностью осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, причем параметр коррекции предыскажений при обработке с коррекцией предыскажений определен согласно характеристическому фактору;
модуль вычисления, выполненный с возможностью: вычисления первой энергии первого полнодиапазонного сигнала, который был подвергнут обработке с коррекцией предыскажений; и получения второго полнодиапазонного сигнала согласно энергетическому отношению, содержащемуся в битовом потоке аудиосигнала, первому полнодиапазонному сигналу, который был подвергнут обработке с коррекцией предыскажений, и первой энергии, причем энергетическое отношение представляет собой энергетическое отношение энергии второго полнодиапазонного сигнала к первой энергии; и
модуль восстановления, выполненный с возможностью восстановления аудиосигнала, соответствующего битовому потоку аудиосигнала, согласно второму полнодиапазонному сигналу, сигналу низкочастотного диапазона и сигналу высокочастотного диапазона.
17. Устройство декодирования по п.16, дополнительно содержащее модуль определения параметра коррекции предыскажений, выполненный с возможностью:
получения количества характеристических факторов посредством декодирования;
определения среднего значения характеристических факторов согласно характеристическим факторам и количеству характеристических факторов; и
определения параметра коррекции предыскажений согласно среднему значению характеристических факторов.
18. Устройство декодирования по п.16 или 17, в котором второй модуль декодирования выполнен, в частности, с возможностью:
определения, согласно сигналу высокочастотного диапазона, коэффициента кодирования с линейным прогнозированием, LPC, и полнодиапазонного сигнала возбуждения, которые используются для прогнозирования полнодиапазонного сигнала; и
выполнения обработки с кодированием в отношении коэффициента LPC и полнодиапазонного сигнала возбуждения для получения первого полнодиапазонного сигнала.
19. Устройство декодирования по п.16 или 17, в котором модуль обработки с коррекцией предыскажений выполнен, в частности, с возможностью:
осуществления коррекции путем смещения частотного спектра в отношении первого полнодиапазонного сигнала и осуществления обработки с отражением частотного спектра в отношении скорректированного первого полнодиапазонного сигнала; и
осуществления обработки с коррекцией предыскажений в отношении первого полнодиапазонного сигнала, который был подвергнут обработке с отражением частотного спектра.
20. Устройство декодирования по п.16 или 17, в котором характеристический фактор используется для отражения характеристики аудиосигнала, и он содержит голосовой фактор, спектральный наклон, краткосрочную среднюю энергию или краткосрочную частоту переходов через нуль.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410294752.3 | 2014-06-26 | ||
CN201410294752.3A CN105225671B (zh) | 2014-06-26 | 2014-06-26 | 编解码方法、装置及*** |
PCT/CN2015/074704 WO2015196835A1 (zh) | 2014-06-26 | 2015-03-20 | 编解码方法、装置及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2644078C1 true RU2644078C1 (ru) | 2018-02-07 |
Family
ID=54936715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2016151460A RU2644078C1 (ru) | 2014-06-26 | 2015-03-20 | Способ, устройство и система кодирования/декодирования |
Country Status (15)
Country | Link |
---|---|
US (3) | US9779747B2 (ru) |
EP (2) | EP3637416A1 (ru) |
JP (1) | JP6496328B2 (ru) |
KR (1) | KR101906522B1 (ru) |
CN (2) | CN106228991B (ru) |
AU (1) | AU2015281686B2 (ru) |
BR (1) | BR112016026440B8 (ru) |
CA (1) | CA2948410C (ru) |
DE (2) | DE202015009942U1 (ru) |
HK (1) | HK1219802A1 (ru) |
MX (1) | MX356315B (ru) |
MY (1) | MY173513A (ru) |
RU (1) | RU2644078C1 (ru) |
SG (1) | SG11201609523UA (ru) |
WO (1) | WO2015196835A1 (ru) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2626977T3 (es) * | 2013-01-29 | 2017-07-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato, procedimiento y medio informático para sintetizar una señal de audio |
CN105978540B (zh) * | 2016-05-26 | 2018-09-18 | 英特格灵芯片(天津)有限公司 | 一种连续时间信号的去加重处理电路及其方法 |
CN106601267B (zh) * | 2016-11-30 | 2019-12-06 | 武汉船舶通信研究所 | 一种基于超短波fm调制的语音增强方法 |
CN112885364B (zh) * | 2021-01-21 | 2023-10-13 | 维沃移动通信有限公司 | 音频编码方法和解码方法、音频编码装置和解码装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012025429A1 (en) * | 2010-08-24 | 2012-03-01 | Dolby International Ab | Reduction of spurious uncorrelation in fm radio noise |
RU2456682C2 (ru) * | 2008-01-04 | 2012-07-20 | Долби Интернэшнл Аб | Аудиокодер и декодер |
RU2470384C1 (ru) * | 2007-06-13 | 2012-12-20 | Квэлкомм Инкорпорейтед | Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов |
EP1949062B1 (en) * | 2005-10-05 | 2014-05-14 | LG Electronics Inc. | Method and apparatus for decoding an audio signal |
RU2519295C2 (ru) * | 2009-05-08 | 2014-06-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Транскодировщик аудио формата |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000134105A (ja) * | 1998-10-29 | 2000-05-12 | Matsushita Electric Ind Co Ltd | オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法 |
US6912496B1 (en) * | 1999-10-26 | 2005-06-28 | Silicon Automation Systems | Preprocessing modules for quality enhancement of MBE coders and decoders for signals having transmission path characteristics |
US6931373B1 (en) * | 2001-02-13 | 2005-08-16 | Hughes Electronics Corporation | Prototype waveform phase modeling for a frequency domain interpolative speech codec system |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US9886959B2 (en) * | 2005-02-11 | 2018-02-06 | Open Invention Network Llc | Method and system for low bit rate voice encoding and decoding applicable for any reduced bandwidth requirements including wireless |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
KR100789368B1 (ko) * | 2005-05-30 | 2007-12-28 | 한국전자통신연구원 | 잔차 신호 부호화 및 복호화 장치와 그 방법 |
US20070299655A1 (en) * | 2006-06-22 | 2007-12-27 | Nokia Corporation | Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
JP4850086B2 (ja) * | 2007-02-14 | 2012-01-11 | パナソニック株式会社 | Memsマイクロホン装置 |
JP4984983B2 (ja) * | 2007-03-09 | 2012-07-25 | 富士通株式会社 | 符号化装置および符号化方法 |
EP2186087B1 (en) * | 2007-08-27 | 2011-11-30 | Telefonaktiebolaget L M Ericsson (PUBL) | Improved transform coding of speech and audio signals |
KR101413968B1 (ko) | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
US8433582B2 (en) | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
JP4818335B2 (ja) * | 2008-08-29 | 2011-11-16 | 株式会社東芝 | 信号帯域拡張装置 |
WO2010070770A1 (ja) * | 2008-12-19 | 2010-06-24 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
US8457688B2 (en) * | 2009-02-26 | 2013-06-04 | Research In Motion Limited | Mobile wireless communications device with voice alteration and related methods |
CN101521014B (zh) * | 2009-04-08 | 2011-09-14 | 武汉大学 | 音频带宽扩展编解码装置 |
AU2011241424B2 (en) | 2010-04-14 | 2016-05-05 | Voiceage Evs Llc | Flexible and scalable combined innovation codebook for use in CELP coder and decoder |
CN102800317B (zh) | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
EP3089164A1 (en) * | 2011-11-02 | 2016-11-02 | Telefonaktiebolaget LM Ericsson (publ) | Generation of a high band extension of a bandwidth extended audio signal |
FR2984580A1 (fr) | 2011-12-20 | 2013-06-21 | France Telecom | Procede de detection d'une bande de frequence predeterminee dans un signal de donnees audio, dispositif de detection et programme d'ordinateur correspondant |
CN102737646A (zh) * | 2012-06-21 | 2012-10-17 | 佛山市瀚芯电子科技有限公司 | 单一麦克风的实时动态语音降噪方法 |
CN105976830B (zh) | 2013-01-11 | 2019-09-20 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
CN103928031B (zh) * | 2013-01-15 | 2016-03-30 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
-
2014
- 2014-06-26 CN CN201610617731.XA patent/CN106228991B/zh active Active
- 2014-06-26 CN CN201410294752.3A patent/CN105225671B/zh active Active
-
2015
- 2015-03-20 SG SG11201609523UA patent/SG11201609523UA/en unknown
- 2015-03-20 EP EP19177798.6A patent/EP3637416A1/en active Pending
- 2015-03-20 EP EP15812214.3A patent/EP3133600B1/en active Active
- 2015-03-20 MY MYPI2016704099A patent/MY173513A/en unknown
- 2015-03-20 KR KR1020167032571A patent/KR101906522B1/ko active IP Right Grant
- 2015-03-20 DE DE202015009942.4U patent/DE202015009942U1/de active Active
- 2015-03-20 RU RU2016151460A patent/RU2644078C1/ru active
- 2015-03-20 DE DE202015009916.5U patent/DE202015009916U1/de active Active
- 2015-03-20 CA CA2948410A patent/CA2948410C/en active Active
- 2015-03-20 BR BR112016026440A patent/BR112016026440B8/pt active IP Right Grant
- 2015-03-20 JP JP2016574888A patent/JP6496328B2/ja active Active
- 2015-03-20 MX MX2016015526A patent/MX356315B/es active IP Right Grant
- 2015-03-20 AU AU2015281686A patent/AU2015281686B2/en active Active
- 2015-03-20 WO PCT/CN2015/074704 patent/WO2015196835A1/zh active Application Filing
-
2016
- 2016-07-05 HK HK16107771.2A patent/HK1219802A1/zh unknown
- 2016-12-27 US US15/391,339 patent/US9779747B2/en active Active
-
2017
- 2017-09-06 US US15/696,591 patent/US10339945B2/en active Active
-
2019
- 2019-05-22 US US16/419,777 patent/US10614822B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1949062B1 (en) * | 2005-10-05 | 2014-05-14 | LG Electronics Inc. | Method and apparatus for decoding an audio signal |
RU2470384C1 (ru) * | 2007-06-13 | 2012-12-20 | Квэлкомм Инкорпорейтед | Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов |
RU2456682C2 (ru) * | 2008-01-04 | 2012-07-20 | Долби Интернэшнл Аб | Аудиокодер и декодер |
RU2519295C2 (ru) * | 2009-05-08 | 2014-06-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Транскодировщик аудио формата |
WO2012025429A1 (en) * | 2010-08-24 | 2012-03-01 | Dolby International Ab | Reduction of spurious uncorrelation in fm radio noise |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9524721B2 (en) | Apparatus and method for concealing frame erasure and voice decoding apparatus and method using the same | |
KR101246991B1 (ko) | 오디오 신호 처리 방법 | |
US8862463B2 (en) | Adaptive time/frequency-based audio encoding and decoding apparatuses and methods | |
JP6076247B2 (ja) | ディジタルオーディオ信号エンコーダでのノイズシェーピングフィードバックループの制御 | |
US10614822B2 (en) | Coding/decoding method, apparatus, and system for audio signal | |
JP2023022073A (ja) | 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス | |
EP2041745A1 (en) | Adaptive encoding and decoding methods and apparatuses | |
JP2010537261A (ja) | 周波数サブバンドのスペクトルダイナミクスに基づくオーディオ符号化における時間マスキング | |
JP7008756B2 (ja) | デジタルオーディオ信号におけるプレエコーを識別し、減衰させる方法及び装置 | |
RU2651184C1 (ru) | Способ обработки речевого/звукового сигнала и устройство | |
JP2013084002A (ja) | 音声コーデックの品質向上装置およびその方法 | |
JP5295372B2 (ja) | デジタルオーディオ信号におけるプリエコーの減衰 | |
CN111292755B (zh) | 突发帧错误处理 | |
KR102132326B1 (ko) | 통신 시스템에서 오류 은닉 방법 및 장치 | |
CN105632504A (zh) | Adpcm编解码器及adpcm解码器丢包隐藏的方法 | |
Krasner et al. | Efficient Encoding and Decoding of Speech. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PC41 | Official registration of the transfer of exclusive right |
Effective date: 20210204 |