RU2585990C2 - Устройство и способ для выполнения кодирования методом хаффмана - Google Patents

Устройство и способ для выполнения кодирования методом хаффмана Download PDF

Info

Publication number
RU2585990C2
RU2585990C2 RU2013146688/08A RU2013146688A RU2585990C2 RU 2585990 C2 RU2585990 C2 RU 2585990C2 RU 2013146688/08 A RU2013146688/08 A RU 2013146688/08A RU 2013146688 A RU2013146688 A RU 2013146688A RU 2585990 C2 RU2585990 C2 RU 2585990C2
Authority
RU
Russia
Prior art keywords
index
frequency band
difference
difference index
indices
Prior art date
Application number
RU2013146688/08A
Other languages
English (en)
Other versions
RU2013146688A (ru
Inventor
Цзунсянь ЛЮ
Кок Сэн ЧУН
Масахиро ОСИКИРИ
Original Assignee
Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=47041264&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=RU2585990(C2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка filed Critical Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка
Publication of RU2013146688A publication Critical patent/RU2013146688A/ru
Application granted granted Critical
Publication of RU2585990C2 publication Critical patent/RU2585990C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к беспроводной связи и предназначено для кодирования и декодирования звука/речи. Технический результат - повышение точности кодирования и декодирования звукового сигнала. Для этого таблица Хаффмана может быть создана автономно при помощи большой базы данных входных последовательностей. В способе определяют интервал значений индексов квантования (или разностных индексов) для кодирования методом Хаффмана. Для каждого значения из этого интервала собирают все входные сигналы, имеющие один и тот же интервал значений, и вычисляют распределение вероятности каждого значения индексов квантования (или разностных индексов) в пределах этого интервала. Для каждого значения из этого интервала создают одну таблицу Хаффмана в соответствии с вероятностью появления каждого возможного значения входного сигнала. 4 н. и 3 з.п. ф-лы, 14 ил.

Description

ОБЛАСТЬ ТЕХНИКИ
Настоящее изобретение относится к устройству кодирования звука/речи, к устройству декодирования звука/речи и к способам кодирования и декодирования звука/речи с использованием кодирования методом Хаффмана (Huffman).
УРОВЕНЬ ТЕХНИКИ
При сжатии сигнала для кодирования входного сигнала широко используется кодирование методом Хаффмана с использованием таблицы кодов переменной длины (VL-кодов) (таблицы Хаффмана). Кодирование методом Хаффмана является более эффективным, чем кодирование входного сигнала, имеющего неравномерное статистическое распределение, кодами фиксированной длины (FL-кодами).
При кодировании методом Хаффмана таблицу Хаффмана получают особым способом на основании оцененной вероятности появления каждого возможного значения входного сигнала. Во время кодирования каждое значение входного сигнала ставят в соответствие конкретному коду переменной длины в таблице Хаффмана.
Посредством кодирования значений сигнала, которые статистически встречаются с большей вероятностью, с использованием относительно коротких VL-кодов (с использованием относительно малого количества битов), и, наоборот, кодирования значений сигнала, которые статистически встречаются редко, с использованием относительно длинных VL-кодов (с использованием относительно большего количества битов) может быть уменьшено общее количество битов, используемых для кодирования входного сигнала.
СПИСОК ЦИТАТ
[Непатентный документ 1] ITU-T Recommendation G.719 (06/2008) “Low-complexity, full-band audio coding for high-quality, conversational applications”
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Техническая задача
Однако в некоторых применениях, например при кодировании звукового сигнала, статистика данных сигнала может существенно изменяться от одного набора звукового сигнала до другого набора звукового сигнала. И даже в пределах одного и того же набора звукового сигнала.
Если статистика звукового сигнала существенно расходится со статистикой из заранее заданной таблицы Хаффмана, то не может быть реализовано оптимальное кодирование сигнала. И происходит то, что для кодирования звукового сигнала, имеющего различную статистику, при кодировании методом Хаффмана расходуется намного больше битов, чем количество битов, расходуемое при кодировании с фиксированной длиной кода.
Одним возможным решением является включение в кодирование как кодирования методом Хаффмана, так и кодирования с фиксированной длиной кода, и выбор способа кодирования, который расходует меньше битов. К стороне декодера передают один сигнал флага для указания того, какой способ кодирования выбран в кодере. Это решение используется в недавно стандартизованном посредством ITU-T кодеке G.719 речи.
Это решение решает проблему для некоторых очень экстремальных последовательностей, в которых кодирование методом Хаффмана использует больше битов, чем кодирование с фиксированной длиной кода. Но для других входных сигналов, которые имеют статистику, отличающуюся от таблицы Хаффмана, но которые, тем не менее, выбрали кодирование методом Хаффмана, оно все же не является оптимальным.
В стандартизованном ITU-T кодеке G.719 речи кодирование методом Хаффмана используется при кодировании индексов квантования нормировочных коэффициентов.
Структура кодека G.719 проиллюстрирована на Фиг. 1.
На стороне кодера производят обработку входного сигнала, дискретизированного с частотой 48 кГц, посредством детектора (101) обнаружения нестационарного состояния. Для кадра входного сигнала применяют преобразование (102) с высокой разрешающей способностью по частоте или с низкой разрешающей способностью по частоте в зависимости от обнаружения нестационарного состояния. Полученные спектральные коэффициенты группируют в полосы частот неравной длины. Оценивают (103) норму каждой полосы частот, и выполняют квантование и кодирование (104) полученной в результате этого огибающей спектра, состоящей из норм всех полос частот. Затем нормируют коэффициенты по квантованным нормам (105). Квантованные нормы дополнительно корректируют (106) на основании адаптивного спектрального взвешивания и используют в качестве входных данных для распределения битов (107). Нормированные спектральные коэффициенты квантуют по векторам решетки и кодируют (108) на основании распределенных битов для каждой полосы частот. Производят оценку уровня незакодированных спектральных коэффициентов, выполняют его кодирование (109) и передачу в декодер. Кодирование методом Хаффмана применяют для индексов квантования как для закодированных спектральных коэффициентов, так и для закодированных норм.
На стороне декодера сначала декодируют флаг нестационарного состояния, который указывает конфигурацию кадра, то есть, является ли он стационарным или нестационарным. Декодируют огибающую спектра, и в декодере используют те же самые алгоритмы регулирования норм и распределения битов с точностью до бита для повторного вычисления распределения битов, что является существенным для декодирования индексов квантования нормированных коэффициентов преобразования. После обращения квантования (112) восстанавливают низкочастотные незакодированные спектральные коэффициенты (распределенные нулевые биты) с использованием кодовой книги с заполнением спектра, построенной из принятых спектральных коэффициентов (спектральных коэффициентов с распределением ненулевых битов) (113). Используют индекс регулирования уровня шума для регулирования уровня восстановленных коэффициентов. Высокочастотные незакодированные спектральные коэффициенты восстанавливают с использованием расширения полосы частот. Декодированные спектральные коэффициенты и восстановленные спектральные коэффициенты смешивают и приводят к нормированному спектру. Применяют декодированную огибающую спектра, что приводит к декодированному спектру во всей полосе частот (114). Наконец, применяют обратное преобразование (115) для восстановления декодированного сигнала во временной области. Это выполняют путем применения либо модифицированного обратного дискретного косинусного преобразования для стационарных режимов, либо обратного преобразования с более высоким разрешением по времени для нестационарного режима.
В кодере (104) нормировочные коэффициенты спектральных поддиапазонов подвергают скалярному квантованию логарифмическим скалярным квантователем с равномерным шагом с 40 шагами по 3 дБ. Записи кодовой книги логарифмического квантователя показаны на Фиг. 2. Из этой кодовой книги видно, что интервал значений нормировочных коэффициентов равен [2-2,5,217] и что значение уменьшается с увеличением индекса.
Кодирование индексов квантования для нормировочных коэффициентов проиллюстрировано на Фиг. 3. Всего имеется 44 поддиапазона частот и, соответственно, 44 нормировочных коэффициента. Для первого поддиапазона частот нормировочный коэффициент квантуют с использованием первых 32 записей (301) кодовой книги, тогда как другие нормировочные коэффициенты подвергают скалярному квантованию с использованием 40 записей кодовой книги (302), показанных на Фиг. 2. Индекс квантования для нормировочного коэффициента для первого поддиапазона частот непосредственно закодирован 5 битами (303), тогда как индексы для других поддиапазонов частот закодированы способом разностного кодирования. Разностные индексы получают с использованием приведенной ниже формулы (304):
Figure 00000001
. (уравнение 1)
А разностные индексы кодируют двумя возможными способами: кодирования с фиксированной длиной кода (305) и кодирования методом Хаффмана (306). Таблица Хаффмана для разностных индексов показана на Фиг. 4. В этой таблице имеется всего 32 записи, от 0 до 31, которые учитывают возможность резкого изменения энергии между соседними поддиапазонами частот.
Однако для входного аудиосигнала существует физическое явление, именуемое слуховой маскировкой. Слуховая маскировка происходит тогда, когда на восприятие одного звука воздействует наличие другого звука. В качестве примера, если имеются два сигнала со сходными частотами, существующие в одно и то же время: один мощный пик на частоте 1 кГц и один тональный сигнал с более низким уровнем на частоте 1,1 кГц, то тональный сигнал с более низким уровнем на частоте 1,1 кГц будет маскирован (будет неслышимым) вследствие существования мощного пика на частоте 1 кГц.
Уровень звукового давления, необходимый для того, чтобы сделать звук воспринимаемым в присутствии другого звука (маскирующего сигнала), задан в кодировании звука как порог маскирующего эффекта. Порог маскирующего эффекта зависит от частоты, уровня звукового давления маскирующего сигнала. Если два звука имеют сходную частоту, то маскирующий эффект является сильным, и порог маскирующего эффекта также является высоким. Если маскирующий сигнал имеет высокий уровень звукового давления, то он оказывает сильное маскирующее влияние на другой звук, и порог маскирующего эффекта также является высоким.
Согласно описанной выше теории слуховой маскировки, если один поддиапазон частот имеет очень большую энергию, то он оказывает сильное маскирующее влияние на другие поддиапазоны частот, в особенности, на соседние с ним поддиапазоны частот. В таком случае порог маскирующего эффекта для других поддиапазонов частот, в особенности для соседнего поддиапазона частот, является высоким.
Если составляющая аудиосигнала в соседнем поддиапазоне частот имеет малые ошибки квантования (меньшие, чем порог маскирующего эффекта), то слушатели не способны ощущать ухудшение составляющей аудио сигнала в этом поддиапазоне частот.
Отсутствует необходимость кодирования нормировочного коэффициента для этого поддиапазона частот с очень высоким разрешением, если ошибки квантования являются меньшими, чем порог маскирующего эффекта.
РЕШЕНИЕ ЗАДАЧИ
В этом изобретении предложены устройство и способы анализа свойств аудиосигнала для генерации таблиц Хаффмана и для выбора таблиц Хаффмана из набора заданных таблиц во время кодирования аудио сигнала.
В кратком изложении, исследованы свойства слуховой маскировки для сужения интервала значений разностных индексов, в результате чего может быть разработана таблица Хаффмана, имеющая меньшее количество кодовых слов, и использована для кодирования. Поскольку таблица Хаффмана имеет меньшее количество кодовых слов, то могут быть разработаны коды с более короткой длиной кода (с использованием меньшего количества битов). Посредством этого может быть сокращено общее количество битов, расходуемых для кодирования разностных индексов.
ПОЛЕЗНЫЕ ЭФФЕКТЫ ИЗОБРЕТЕНИЯ
Посредством применения кодов Хаффмана, использующих меньшее количество битов, может быть уменьшено общее количество битов, расходуемых для кодирования разностных индексов.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
На Фиг. 1 проиллюстрирована структура кодека ITU-T G.719;
на Фиг. 2 показана кодовая книга для квантования нормировочных коэффициентов;
на Фиг. 3 проиллюстрирован способ квантования и кодирования нормировочных коэффициентов;
на Фиг. 4 показана таблица Хаффмана, используемая для кодирования индексов нормировочных коэффициентов;
на Фиг. 5 показана инфраструктура, в которой применено это изобретение;
на Фиг. 6A и Фиг. 6B показаны примеры заданных таблиц Хаффмана;
на Фиг. 7 проиллюстрировано получение кривой маскирования;
на Фиг. 8 проиллюстрировано то, как сужают интервал значений разностных индексов;
на Фиг. 9 показана схема последовательности операций того, как выполняют модифицирование индексов;
на Фиг. 10 проиллюстрировано то, как могут быть созданы таблицы Хаффмана;
на Фиг. 11 проиллюстрирована структура второго варианта осуществления этого изобретения;
на Фиг. 12 проиллюстрирована структура третьего варианта осуществления этого изобретения;
на Фиг. 13 проиллюстрирован кодер из четвертого варианта осуществления этого изобретения;
на Фиг. 14 проиллюстрирован декодер из четвертого варианта осуществления этого изобретения.
ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
В этом разделе приведено описание основного принципа из настоящего изобретения со ссылкой на чертежи с Фиг. 5 по Фиг. 12. Специалисты в данной области техники способны видоизменять и адаптировать это изобретение, не отклоняясь от сущности настоящего изобретения. Иллюстрации приведены для облегчения объяснения.
(Первый вариант осуществления изобретения)
На Фиг. 5 проиллюстрирован предложенный в изобретении кодек, который содержит кодер и декодер, в которых применяется предложенная в изобретении схема кодирования методом Хаффмана.
В кодере, проиллюстрированном на Фиг. 5, выполняют обработку значений энергии поддиапазонов частот методом психоакустического моделирования (501) для получения порога Mask(n) маскирующего эффекта. Согласно полученному Mask(n), модифицируют (502) индексы квантования нормировочных коэффициентов для тех поддиапазонов частот, ошибки квантования которых являются меньшими, чем порог маскирующего эффекта для того, чтобы интервал значений разностных индексов мог быть уменьшен.
Разностные индексы для модифицированных индексов вычисляют согласно приведенному ниже уравнению:
Figure 00000002
. (уравнение 2)
Интервал значений разностных индексов для кодирования методом Хаффмана определяют так, как показано в приведенном ниже уравнении (504).
Figure 00000003
. (уравнение 3)
Согласно величине интервала значений, из набора заданных таблиц Хаффмана выбирают (505) таблицу Хаффмана, предназначенную для конкретного интервала значений, для кодирования разностных индексов (506). В качестве примера, если среди всех разностных индексов для входного кадра минимальное значение равно 12, а максимальное значение равно 18, то в этом случае интервал значений
Figure 00000004
=[12,18]. В качестве таблицы Хаффмана для кодирования выбирают таблицу Хаффмана, предназначенную для интервала [12,18].
Набор заранее заданных таблиц Хаффмана создают (подробности будут объяснены в дальнейшей части описания) и упорядочивают в соответствии с интервалом значений разностных индексов. Сигнал флага для указания выбранной таблицы Хаффмана и закодированных индексов передают в декодер.
Другим способом выбора таблицы Хаффмана является вычисление расходования всех битов с использованием каждой таблицы Хаффмана, а затем выбор той таблицы Хаффмана, которая расходует наименьшее количество битов.
В качестве примера на Фиг. 6A и Фиг. 6B показан набор из четырех заранее заданных таблиц Хаффмана. В этом примере приведены 4 заранее заданные таблицы Хаффмана, охватывающие интервал значений, соответственно, из [13,17], [12,18], [11,19] и [10,20]. В таблице 6.1 показан сигнал флага и соответствующий интервал значений для таблицы Хаффмана. В таблице 6.2 показаны коды Хаффмана для всех значений в интервале [13,17]. В таблице 6.3 показаны коды Хаффмана для всех значений в интервале [12,18]. В таблице 6.4 показаны коды Хаффмана для всех значений в интервале [11,19]. В таблице 6.5 показаны коды Хаффмана для всех значений в интервале [10,20].
Сравнивая длину кода Хаффмана на Фиг. 6A и Фиг. 6B с исходной таблицей Хаффмана, показанной на Фиг. 4, можно заметить, что длина кода Хаффмана для одних и тех же значений расходует меньше битов. Это объясняет экономию битов.
В декодере, проиллюстрированном на Фиг. 5, соответствующую таблицу Хаффмана для декодирования разностных индексов (508) выбирают (507) согласно сигналу флага. Для восстановления индексов квантования нормировочных коэффициентов используют разностные индексы согласно приведенному ниже уравнению:
Figure 00000005
. (уравнение 4)
На Фиг. 7 проиллюстрировано получение кривой маскирования входного сигнала. Сначала вычисляют значения энергии поддиапазонов частот, и по этим значениям энергии получают кривую маскирования входного сигнала. При получении кривой маскирования могут быть использованы некоторые существующие технологии из предшествующего уровня техники, например, способ получения кривой маскирования в кодеке MPEG AAC.
На Фиг. 8 проиллюстрировано то, как сужают интервал значений разностных индексов. Сначала производят сравнение между порогом маскирующего эффекта и энергией ошибки квантования поддиапазона частот. Для поддиапазонов частот, в которых энергия ошибок квантования является более низкой, чем порог маскирующего эффекта, их индексы модифицируют в значение, являющееся более близким к соседнему поддиапазону частот, но это модифицирование гарантирует, что соответствующая энергия ошибки квантования не превышает порог маскирующего эффекта, вследствие чего она не влияет на качество звука. После модифицирования интервал значений индексов может являться более узким. Объяснение этого приведено ниже.
Как показано на Фиг. 8, для поддиапазонов частот 0, 2 и 4 их индексы модифицируют так, чтобы они были более близкими к соседним с ними индексам, поскольку значения энергии их ошибки квантования являются более низкими, чем порог маскирующего эффекта.
Модифицирование индексов может быть выполнено так, как описано ниже (с использованием поддиапазона частот 2 в качестве примера). Как показано на Фиг. 2, большой индекс соответствует меньшей энергии, и в этом случае индекс
Figure 00000006
является меньшим, чем индекс
Figure 00000007
. Модифицирование индекса
Figure 00000007
фактически уменьшает его значение. Это может быть выполнено так, как показано на Фиг. 9.
Для поддиапазонов частот 1 и 3 их индексы не изменяют, поскольку их значения энергии превышают порог маскирующего эффекта. В этом случае разностные индексы находятся ближе к центру. Используя поддиапазон частот 1 в качестве примера:
Figure 00000008
, (уравнение 5)
Figure 00000009
. (уравнение 6)
Figure 00000010
. (уравнение 7)
В этом изобретении таблица Хаффмана может быть создана автономно при помощи большой базы данных входных последовательностей. Этот способ проиллюстрирован на Фиг. 10.
Значения энергии поддиапазонов частот обрабатывают методом психоакустического моделирования (1001) для получения порога маскирующего эффекта Mask(n). Согласно полученному Mask(n), индексы квантования нормировочных коэффициентов для тех поддиапазонов частот, в которых энергия ошибок квантования является более низкой, чем порог маскирующего эффекта, модифицируют (1002) так, чтобы интервал значений разностных индексов мог быть меньшим.
Вычисляют (1003) разностные индексы для модифицированных индексов.
Определяют (1004) интервал значений разностных индексов для кодирования методом Хаффмана. Для каждого значения из этого интервала собирают все входные сигналы, имеющие один и тот же интервал значений, и вычисляют распределение вероятности каждого значения разностного индекса в пределах этого интервала.
Для каждого значения из этого интервала создают одну таблицу Хаффмана в соответствии с вероятностью. Здесь для создания таблицы Хаффмана могут использоваться некоторые традиционные методы создания таблицы Хаффмана.
(Второй вариант осуществления изобретения)
В этом варианте осуществления изобретения представлен способ, который может сохранять экономию битов, но восстанавливать значения разностных индексов, более близкие к исходному значению.
Как показано на Фиг. 11, после выбора таблицы Хаффмана при операции 1105, вычисляют разностные индексы между исходными индексами квантования. Исходные разностные индексы и новые разностные индексы сравнивают относительно того, расходуют ли они то же самое количество битов в выбранной таблице Хаффмана.
Если они расходуют одинаковое количество битов в выбранной таблице Хаффмана, то модифицированные разностные индексы восстанавливают равными исходным разностным индексам. Если же они не расходуют одинаковое количество битов, в качестве восстановленных разностных индексов выбирают кодовые слова из той таблицы Хаффмана, которая является ближайшей к исходным разностным индексам и расходует то же самое количество битов.
Преимуществом этого варианта осуществления изобретения является то, что ошибка квантования нормировочного коэффициента может быть меньшей, тогда как расходование битов является тем же самым, как и в первом варианте осуществления изобретения.
(Третий вариант осуществления изобретения)
В этом варианте осуществления изобретения представлен способ, в котором избегают использования психоакустической модели, но используют только лишь некоторый порог отношения энергий.
Как показано на Фиг. 12, вместо использования психоакустической модели для получения порога маскирующего эффекта для определения того, следует ли модифицировать индекс квантования конкретного поддиапазона частот (1201), используют значения энергии поддиапазонов частот и заранее заданный порог отношения энергий. Как показано в приведенном ниже уравнении, если отношение энергий между текущим поддиапазоном частот и соседним поддиапазоном частот является меньшим, чем порог (
Figure 00000011
), то текущий поддиапазон частот считают не столь важным, и в этом случае индекс квантования текущего поддиапазона частот может быть модифицирован.
Figure 00000012
Figure 00000013
. (уравнение 8)
Модифицирование индекса квантования может быть выполнено так, как показано в приведенном ниже уравнении:
Figure 00000014
,
(уравнение 9)
где
Figure 00000015
означает нормировочный коэффициент для поддиапазона частот
Figure 00000016
, декодированный с использованием модифицированного индекса квантования;
Figure 00000017
означает нормировочный коэффициент для поддиапазона частот
Figure 00000018
, декодированный с использованием исходного индекса квантования;
Figure 00000019
означает энергию для поддиапазона частот
Figure 00000020
;
Figure 00000021
означает энергию для поддиапазона частот
Figure 00000022
;
Figure 00000023
означает энергию для поддиапазона частот
Figure 00000024
.
Преимущество этого варианта осуществления изобретения состоит в том, можно избежать очень сложного и очень трудоемкого психоакустического моделирования.
(Четвертый вариант осуществления изобретения)
В этом варианте осуществления изобретения представлен способ, сужающий интервал значений разностных индексов, который способен при этом отлично восстанавливать разностные индексы.
Как показано на Фиг. 13, разностные индексы получают из исходных индексов квантования (1301) согласно приведенному ниже уравнению:
Figure 00000025
, (уравнение 10)
где
Figure 00000026
означает разностный индекс для поддиапазона частот
Figure 00000027
Figure 00000028
означает индекс квантования для поддиапазона частот
Figure 00000029
Figure 00000030
означает индекс квантования для поддиапазона частот
Figure 00000031
Для уменьшения интервала значений разностных индексов, реализован модуль, модифицирующий значения некоторых разностных индексов (1302).
Это модифицирование выполняют согласно значению разностного индекса для предыдущего поддиапазона частот и порогового значения.
Один из способов модифицирования разностного индекса (когда n≥1) может быть реализован так, как показано в приведенном ниже уравнении, первый разностный индекс не был модифицирован для обеспечения точного восстановления в декодере:
Figure 00000032
где
n≥1;
Diff_index(n) означает разностный индекс для поддиапазона частот n;
Diff_index(n-1) означает разностный индекс для поддиапазона частот n-1;
Diff_index_new(n) означает новый разностный индекс для поддиапазона частот n;
Threshold означает значение, анализируемое для определения того, следует ли выполнять модифицирование разностного индекса.
Причина того, почему это модифицирование может уменьшить интервал значений разностных индексов, объясняется следующим образом: для аудио/речевого сигнала справедливо утверждение, что энергия изменяется от одной полосы частот до другой полосы частот. Однако замечено, что обычно отсутствует какое-либо резкое изменение энергии между соседними полосами частот. Энергия постепенно увеличивается или уменьшается от одной полосы частот до другой полосы частот. Нормировочные коэффициенты, которые отображают энергию, также изменяются постепенно. Индексы квантования нормировочных коэффициентов также изменяются постепенно, и в этом случае разностные индексы изменяются в небольшом интервале.
Резкое изменение энергии происходит только тогда, когда некоторые основные составляющие аудио сигнала, которые имеют большую энергию, начинают проявлять влияние в полосе частот или их влияние начинает ослабляться. Нормировочные коэффициенты, которые отображают энергию, также имеют резкое изменение относительно предыдущей полосы частот, индексы квантования нормировочных коэффициентов также внезапно увеличиваются или уменьшаются на большую величину. Затем это приводит к очень большому или к очень малому разностному индексу.
В качестве примера предположим, что имеется одна основная составляющая звукового сигнала, которая имеет большую энергию в поддиапазоне частот
Figure 00000033
. При этом, в поддиапазонах частот
Figure 00000034
и
Figure 00000035
основная составляющая звукового сигнала отсутствует. В этом случае согласно таблице Хаффмана, показанной на Фиг. 2, значение
Figure 00000036
будет очень малым, тогда как значения
Figure 00000037
и
Figure 00000038
будут очень большими. В таком случае согласно уравнению (10)
Figure 00000039
является очень малым (меньшим, чем
Figure 00000040
), а
Figure 00000041
является очень большим. Если в Уравнении (11) произведено модифицирование, то, согласно приведенному ниже уравнению (12), верхняя граница разностных индексов, вероятно, может быть уменьшена, следовательно, интервал значений разностных индексов может быть сужен.
Figure 00000042
Figure 00000043
Figure 00000044
Figure 00000045
(уравнение 12)
Как показано на Фиг. 14, для точного восстановления разностных индексов в декодере реализован один модуль, именуемый "восстановлением разностных индексов" (1403). Восстановление производят согласно значению разностного индекса для предыдущего поддиапазона частот и пороговому значению. Пороговое значение в декодере является тем же самым, что и пороговое значение, используемое в кодере.
Способ восстановления разностного индекса (когда
Figure 00000046
), который соответствует модифицированию в кодере, может быть реализован так, как показано в приведенном ниже уравнении, первый разностный индекс принимают непосредственно, поскольку он не модифицирован в кодере:
Figure 00000047
Figure 00000048
Figure 00000049
Figure 00000050
Figure 00000051
Figure 00000052
(уравнение 13)
где
Figure 00000053
;
Figure 00000039
означает разностный индекс для поддиапазона частот
Figure 00000054
;
Figure 00000055
означает разностный индекс для поддиапазона частот
Figure 00000056
;
Figure 00000057
означает новый разностный индекс для поддиапазона частот
Figure 00000054
;
Figure 00000058
означает значение, анализируемое для определения того, следует ли восстанавливать разностный индекс.
Как показано в приведенных выше уравнениях: в уравнении (11) и в уравнении (13), то, следует ли выполнять модифицирование разностного индекса и насколько его следует модифицировать, полностью зависит от разностного индекса для предыдущей полосы частот. Если разностный индекс для предыдущей полосы частот может быть точно восстановлен, то текущий разностный индекс также может быть точно восстановлен.
Как показано в приведенных выше уравнении (11) и в уравнении (13), первый разностный индекс не модифицируют в кодере, его принимают непосредственно, и он может быть точно восстановлен, затем может быть восстановлен второй разностный индекс согласно значению первого разностного индекса; затем третий разностный индекс, четвертый разностный индекс и т.д., придерживаясь той же самой процедуры, могут быть точно восстановлены все разностные индексы.
Преимущество этого варианта осуществления изобретения состоит в том, что интервал значений разностных индексов может быть уменьшен, при этом разностные индексы могут быть по-прежнему точно восстановлены в декодере. Следовательно, эффективность использования битов может быть улучшена с одновременным сохранением точности битов индексов квантования.
Кроме того, несмотря на то, что в приведенных выше вариантах осуществления изобретения были описаны случаи, когда настоящее изобретение сконфигурировано аппаратными средствами, настоящее изобретение может быть реализовано при помощи программного обеспечения в комбинации с аппаратными средствами.
Каждый функциональный блок, используемый в описании вышеупомянутого варианта осуществления изобретения, обычно может быть реализован в виде большой интегральной схемы (БИС), составленной из интегральных схем. Ими могут являться отдельные микросхемы, или они могут частично или полностью содержаться на одном кристалле. Здесь применен термин "большая интегральная схема" (БИС), но она также может именоваться "интегральной схемой" (ИС), "системной БИС", "БИС со сверхвысокой степенью интеграции" или "БИС с ультравысокой степенью интеграции" в зависимости от отличающихся степеней интегрирования.
Кроме того, способ интеграции схемы не ограничен большими интегральными схемами (БИС), и также возможна реализация с использованием специализированных схем или универсальных процессоров. После изготовления БИС также возможно использование программируемой пользователем вентильной матрицы (ППВМ) или реконфигурируемого процессора, в котором может быть произведена реконфигурация соединений и установочных параметров ячеек схемы внутри БИС.
Кроме того, если в результате развития полупроводниковой технологии или иной технологии, производной от нее, на замену БИС выходит иная технология создания интегральных схем, то, естественно, что интеграция функциональных блоков также может быть выполнена с использованием этой технологии. Также возможно применение биотехнологии.
Раскрытие сущности заявок на патенты Японии № 2011-94295, поданной 20 апреля 2011 г., и № 2011-133432, поданной 15 июня 2011 г., включая описание, чертежи и реферат, включено сюда в полном объеме путем ссылки.
ПРОМЫШЛЕННАЯ ПРИМЕНИМОСТЬ
Устройство кодирования, устройство декодирования и способы кодирования и декодирования согласно настоящему изобретению применимы для устройства, представляющего собой терминал беспроводной связи, устройства, представляющего собой базовую станцию в системе мобильной связи, устройства, представляющего собой терминал для телеконференций, устройства, представляющего собой терминал для видеоконференций и устройства, представляющего собой терминал речевой связи по протоколу IP (VOIP).
ПЕРЕЧЕНЬ ОБОЗНАЧЕНИЙ ССЫЛОЧНЫХ ПОЗИЦИЙ
101 - детектор обнаружения нестационарного состояния
102 - преобразование
103 - оценка нормы
104 - квантование и кодирование нормы
105 - нормировка спектра
106 - корректировка нормы
107 - распределение битов
108 - квантование и кодирование на сетке
109 - регулирование уровня шума
110 - мультиплексирование
111 - демультиплексирование
112 - декодирование на сетке
113 - генератор заполнения спектра
114 - формирование огибающей
115 - обратное преобразование
301 - скалярное квантование (32 шага)
302 - скалярное квантование (40 шагов)
303 - прямая передача (5 бит)
304 - разность
305 - кодирование с фиксированной длиной кода
306 - кодирование методом Хаффмана
501 - психоакустическая модель
502 - модифицирование индекса
503 - разность
504 - проверка интервала значений
505 - выбор таблицы кодов Хаффмана
506 - кодирование методом Хаффмана
507 - выбор таблицы Хаффмана
508 - декодирование методом Хаффмана
509 - сумма
1001 - психоакустическая модель
1002 - модифицирование индекса
1003 - разность
1004 - проверка интервала значений
1005 - вероятность
1006 - получение кода Хаффмана
1101 - психоакустическая модель
1102 - модифицирование индекса
1103 - разность
1104 - проверка интервала значений
1105 - выбор таблицы кодов Хаффмана
1106 - разность
1107 - восстановление разностных индексов
1108 - кодирование методом Хаффмана
1201 - модифицирование индекса
1202 - разность
1203 - проверка интервала значений
1204 - выбор таблицы кодов Хаффмана
1205 - кодирование методом Хаффмана
1301 - разность
1302 - модифицирование разностных индексов
1303 - проверка интервала значений
1304 - выбор таблицы кодов Хаффмана
1305 - кодирование методом Хаффмана
1401 - выбор таблицы кодов Хаффмана
1402 - кодирование методом Хаффмана
1403 - восстановление разностных индексов
1404 - сумма

Claims (7)

1. Устройство кодирования аудио/речи, содержащее:
преобразователь, который осуществляет преобразование входного сигнала аудио/речи во временной области в частотный спектр;
разделитель полосы частот, который разделяет спектр частот на множество полос частот;
вычислитель энергии, который вычисляет уровень значений энергии для каждой полосы частот;
квантователь, который выполняет квантование значений энергий для каждой полосы частот;
вычислитель разностного индекса, который вычисляет разностные индексы между индексом N-й полосы частот и индексом (N-1)-й полосы частот (N - целое число, равное 1 или больше);
модификатор разностного индекса, который модифицирует диапазон разностных индексов для N-й полосы частот, когда N есть целое число, равное 2 или больше, и заменяет разностный индекс на модифицированный разностный индекс;
кодировщик Хаффмана, который кодирует разностные индексы, используя выбранную таблицу Хаффмана, из числа заранее заданных таблиц Хаффмана; и
передатчик, который передает кодированные разностные индексы и сигнал флага для указания выбранной таблицы Хаффмана устройству декодирования аудио/речи;
причем если вычисленный разностный индекс (N-1)-й полосы частот больше, чем верхний предел, то модификатор разностного индекса модифицирует разностный индекс для N-й полосы частот путем добавления значения вычитания, полученного от вычитания верхнего предела из разностного индекса для (N-1)-й полосы частот, и
если вычисленный разностный индекс (N-1)-й полосы частот меньше, чем нижний предел, то модификатор разностного индекса модифицирует разностный индекс для N-й полосы частот путем добавления значения вычитания, полученного от вычитания нижнего предела из разностного индекса для (N-1)-й полосы частот.
2. Устройство кодирования аудио/речи по п. 1, в котором
значения верхнего предела и нижнего предела являются теми же значениями, что и сохраненные в устройстве декодирования аудио/речи.
3. Устройство декодирования аудио/речи, содержащее:
селектор таблицы Хаффмана, который выбирает таблицу Хаффмана в соответствии с сигналом флага для указания выбранной таблицы Хаффмана посредством устройства кодирования аудио/речи;
декодер Хаффмана, который декодирует разностные индексы между индексом N-й полосы частот и индексом (N-1)-й полосы частот (N - целое число, равное 1 или больше), полученные устройством кодирования аудио/речи, используя выбранную таблицу Хаффмана,
восстановитель разностных индексов, который восстанавливает N-й различный индекс, декодированный с использованием выбранной таблицы Хаффмана, когда N - целое число, равное 2 или больше, и заменяет разностный индекс на восстановленный разностный индекс;
вычислитель индекса, который вычисляет индексы квантования с использованием восстановленных разностных индексов;
деквантователь, который выполняет обратное квантование энергий для каждой полосы частот; и
преобразователь, который преобразует декодированный спектр, который генерируется с использованием энергий для каждой полосы частот в частотной области, в сигнал временной области,
при этом если декодированный разностный индекс (N-1)-й полосы частот больше, чем верхний предел, то восстановитель разностных индексов восстанавливает разностный индекс для N-й полосы частот путем добавления значения вычитания, полученного от вычитания верхнего предела из разностного индекса для (N-1)-й полосы частот, и
если декодированный разностный индекс (N-1)-й полосы частот меньше, чем нижний предел, то восстановитель разностных индексов восстанавливает разностный индекс для N-й полосы частот путем добавления значения вычитания, полученного от вычитания нижнего предела из разностного индекса для (N-1)-й полосы частот.
4. Устройство декодирования аудио/речи по п. 3, в котором
значения верхнего предела и нижнего предела являются теми же, что и значения, сохраненные в устройстве кодирования аудио/речи.
5. Устройство декодирования аудио/речи по п. 3, в котором
восстановитель разностных индексов восстанавливает N-й различный индекс, начиная с меньшего, и по порядку.
6. Способ кодирования аудио/речи, содержащий этапы, на которых:
преобразуют посредством преобразователя входной сигнал аудио/речи во временной области в частотный спектр;
разделяют частотный спектр на множественные полосы частот;
вычисляют уровень энергий для каждой полосы частот;
квантуют энергии для каждой полосы частот;
вычисляют разностные индексы между индексом N-й полосы частот и индексом (N-1)-й полосы частот (N - целое число, равное 1 или больше);
модифицируют диапазон разностных индексов для N-й полосы частот, когда N - целое число, равное 2 или больше, и заменяют разностный индекс на модифицированный разностный индекс;
кодируют разностные индексы, используя выбранную таблицу Хаффмана из числа заранее заданных таблиц Хаффмана; и
передают кодированные разностные индексы и сигнал флага для указания выбранной таблицы Хаффмана устройству декодирования аудио/речи,
при этом если вычисленный разностный индекс (N-1)-й полосы частот больше, чем верхний предел, то разностный индекс для N-й полосы частот модифицируется путем добавления значения вычитания, полученного от вычитания верхнего предела из разностного индекса для (N-1)-й полосы частот, и
если вычисленный разностный индекс (N-1) полосы частот меньше, чем нижний предел, то разностный индекс для N-й полосы частот модифицируется путем добавления значения вычитания, полученного от вычитания нижнего предела из разностного индекса для (N-1)-й полосы частот.
7. Способ декодирования аудио/речи, содержащий этапы, на которых:
выбирают таблицу Хаффмана в соответствии с сигналом флага, чтобы указывать выбранную таблицу Хаффмана устройством кодирования аудио/речи;
декодируют разностные индексы между индексом N-й полосы частот и индексом (N-1)-й полосы частот (N - целое число, равное 1 или больше), полученные устройством кодирования аудио/речи, используя выбранную таблицу Хаффмана;
восстанавливают N-й различный индекс, декодированный, используя выбранную таблицу Хаффмана, когда N - целое число, равное 2 или больше, и заменяют разностный индекс на восстановленный разностный индекс;
вычисляют индексы квантования, используя восстановленные разностные индексы;
обратно квантуют энергии для каждой полосы частот; и
преобразуют декодированный спектр, который генерируется, используя энергии для каждой полосы частот в частотной области, в сигнал временной области,
при этом
если декодированный разностный индекс (N-1)-й полосы частот больше, чем верхний предел, то разностный индекс для N-й полосы частот восстанавливается путем добавления значения вычитания, полученного от вычитания верхнего предела из разностного индекса для (N-1)-й полосы частот, и
если декодированный разностный индекс (N-1)-й полосы частот меньше, чем нижний предел, то разностный индекс для N-й полосы частот восстанавливается путем добавления значения вычитания, полученного от вычитания нижнего предела из разностного индекса для (N-1)-й полосы частот.
RU2013146688/08A 2011-04-20 2012-03-12 Устройство и способ для выполнения кодирования методом хаффмана RU2585990C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2011094295 2011-04-20
JP2011-094295 2011-04-20
JP2011-133432 2011-06-15
JP2011133432 2011-06-15
PCT/JP2012/001701 WO2012144127A1 (ja) 2011-04-20 2012-03-12 ハフマン符号化を実行するための装置および方法

Publications (2)

Publication Number Publication Date
RU2013146688A RU2013146688A (ru) 2015-05-27
RU2585990C2 true RU2585990C2 (ru) 2016-06-10

Family

ID=47041264

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013146688/08A RU2585990C2 (ru) 2011-04-20 2012-03-12 Устройство и способ для выполнения кодирования методом хаффмана

Country Status (14)

Country Link
US (3) US9881625B2 (ru)
EP (4) EP3594943B1 (ru)
JP (3) JP5937064B2 (ru)
KR (3) KR101995694B1 (ru)
CN (2) CN103415884B (ru)
BR (1) BR112013026850B1 (ru)
CA (2) CA3051552C (ru)
ES (1) ES2765527T3 (ru)
MY (2) MY164987A (ru)
PL (1) PL3096315T3 (ru)
RU (1) RU2585990C2 (ru)
TW (2) TWI598872B (ru)
WO (1) WO2012144127A1 (ru)
ZA (1) ZA201307316B (ru)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100715450B1 (ko) * 2004-02-02 2007-05-07 (주)경안인더스트리 비석면 단열판 및 그 제조방법
ES2765527T3 (es) * 2011-04-20 2020-06-09 Panasonic Ip Corp America Dispositivo y método para la ejecución de la codificación de Huffman
JP6535466B2 (ja) * 2012-12-13 2019-06-26 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法
EP3961622B1 (en) 2013-05-24 2023-11-01 Dolby International AB Audio encoder
EP4134951B1 (en) 2013-09-13 2024-07-24 Samsung Electronics Co., Ltd. Energy lossless coding apparatus
KR102270106B1 (ko) 2013-09-13 2021-06-28 삼성전자주식회사 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치
US20150142345A1 (en) * 2013-10-18 2015-05-21 Alpha Technologies Inc. Status Monitoring Systems and Methods for Uninterruptible Power Supplies
US9876913B2 (en) 2014-02-28 2018-01-23 Dolby Laboratories Licensing Corporation Perceptual continuity using change blindness in conferencing
WO2016162283A1 (en) * 2015-04-07 2016-10-13 Dolby International Ab Audio coding with range extension
US10074981B2 (en) 2015-09-13 2018-09-11 Alpha Technologies Inc. Power control systems and methods
US10381867B1 (en) 2015-10-16 2019-08-13 Alpha Technologeis Services, Inc. Ferroresonant transformer systems and methods with selectable input and output voltages for use in uninterruptible power supplies
WO2018121887A1 (en) * 2017-01-02 2018-07-05 Huawei Technologies Duesseldorf Gmbh Apparatus and method for shaping the probability distribution of a data sequence
US10714146B2 (en) * 2017-03-14 2020-07-14 Sony Corporation Recording device, recording method, reproducing device, reproducing method, and recording/reproducing device
US20180288439A1 (en) * 2017-03-31 2018-10-04 Mediatek Inc. Multiple Transform Prediction
CA3069966A1 (en) 2017-07-14 2019-01-17 Alpha Technologies Services, Inc. Voltage regulated ac power supply systems and methods
CN109286922B (zh) * 2018-09-27 2021-09-17 珠海市杰理科技股份有限公司 蓝牙提示音处理方法、***、可读存储介质和蓝牙设备
WO2024012666A1 (en) * 2022-07-12 2024-01-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding ar/vr metadata with generic codebooks

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2377670C2 (ru) * 2004-03-15 2009-12-27 Майкрософт Корпорейшн Сжатие данных
US7822601B2 (en) * 2002-09-04 2010-10-26 Microsoft Corporation Adaptive vector Huffman coding and decoding based on a sum of values of audio data symbols
RU2406165C2 (ru) * 2007-02-14 2010-12-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3131542B2 (ja) * 1993-11-25 2001-02-05 シャープ株式会社 符号化復号化装置
JP3186007B2 (ja) * 1994-03-17 2001-07-11 日本電信電話株式会社 変換符号化方法、復号化方法
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5848195A (en) 1995-12-06 1998-12-08 Intel Corporation Selection of huffman tables for signal encoding
US6366614B1 (en) * 1996-10-11 2002-04-02 Qualcomm Inc. Adaptive rate control for digital video compression
JP3784993B2 (ja) * 1998-06-26 2006-06-14 株式会社リコー 音響信号の符号化・量子化方法
EP1345331B1 (en) * 2000-12-22 2008-08-20 Sony Corporation Encoder
US6411226B1 (en) * 2001-01-16 2002-06-25 Motorola, Inc. Huffman decoder with reduced memory size
JP2002268693A (ja) * 2001-03-12 2002-09-20 Mitsubishi Electric Corp オーディオ符号化装置
JP2003233397A (ja) * 2002-02-12 2003-08-22 Victor Co Of Japan Ltd オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置
US20040120404A1 (en) * 2002-11-27 2004-06-24 Takayuki Sugahara Variable length data encoding method, variable length data encoding apparatus, variable length encoded data decoding method, and variable length encoded data decoding apparatus
JP4369140B2 (ja) 2003-02-17 2009-11-18 パナソニック株式会社 オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体
WO2005004113A1 (ja) 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
EP1513137A1 (en) * 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Speech processing system and method with multi-pulse excitation
US7668715B1 (en) * 2004-11-30 2010-02-23 Cirrus Logic, Inc. Methods for selecting an initial quantization step size in audio encoders and systems using the same
US8090587B2 (en) * 2005-09-27 2012-01-03 Lg Electronics Inc. Method and apparatus for encoding/decoding multi-channel audio signal
EP1989707A2 (fr) * 2006-02-24 2008-11-12 France Telecom Procede de codage binaire d'indices de quantification d'une enveloppe d'un signal, procede de decodage d'une enveloppe d'un signal et modules de codage et decodage correspondants
JP5010197B2 (ja) * 2006-07-26 2012-08-29 株式会社東芝 音声符号化装置
WO2008022207A2 (en) * 2006-08-15 2008-02-21 Broadcom Corporation Time-warping of decoded audio signal after packet loss
JP4823001B2 (ja) * 2006-09-27 2011-11-24 富士通セミコンダクター株式会社 オーディオ符号化装置
MY145497A (en) * 2006-10-16 2012-02-29 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
US7966175B2 (en) * 2006-10-18 2011-06-21 Polycom, Inc. Fast lattice vector quantization
US7953595B2 (en) * 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
WO2009004727A1 (ja) * 2007-07-04 2009-01-08 Fujitsu Limited 符号化装置、符号化方法および符号化プログラム
KR101426788B1 (ko) * 2007-11-20 2014-08-06 삼성전자주식회사 무선 통신 시스템에서 채널 품질 정보 전송 방법 및 장치
US8630848B2 (en) * 2008-05-30 2014-01-14 Digital Rise Technology Co., Ltd. Audio signal transient detection
US8463603B2 (en) * 2008-09-06 2013-06-11 Huawei Technologies Co., Ltd. Spectral envelope coding of energy attack signal
US8194862B2 (en) * 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
JP5358818B2 (ja) 2009-10-27 2013-12-04 株式会社ユーシン 扉用の施解錠装置
JP2011133432A (ja) 2009-12-25 2011-07-07 Shizuoka Oil Service:Kk オイル粘度チェッカー並びにこれを用いたオイル供給システム
US9106925B2 (en) * 2010-01-11 2015-08-11 Ubiquity Holdings, Inc. WEAV video compression system
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法***及瞬态信号可分层编解码方法
ES2765527T3 (es) * 2011-04-20 2020-06-09 Panasonic Ip Corp America Dispositivo y método para la ejecución de la codificación de Huffman

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7822601B2 (en) * 2002-09-04 2010-10-26 Microsoft Corporation Adaptive vector Huffman coding and decoding based on a sum of values of audio data symbols
RU2377670C2 (ru) * 2004-03-15 2009-12-27 Майкрософт Корпорейшн Сжатие данных
RU2406165C2 (ru) * 2007-02-14 2010-12-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов

Also Published As

Publication number Publication date
KR20190028569A (ko) 2019-03-18
US10515648B2 (en) 2019-12-24
TWI573132B (zh) 2017-03-01
EP2701144A4 (en) 2014-03-26
KR101995694B1 (ko) 2019-07-02
CA3051552C (en) 2021-09-21
BR112013026850B1 (pt) 2021-02-23
TW201717194A (zh) 2017-05-16
KR101859246B1 (ko) 2018-05-17
EP4322161A3 (en) 2024-05-01
EP3096315B1 (en) 2019-10-16
CA2832032C (en) 2019-09-24
CN104485111B (zh) 2018-08-24
PL3096315T3 (pl) 2020-04-30
JP6321072B2 (ja) 2018-05-09
CA3051552A1 (en) 2012-10-26
JP2018112759A (ja) 2018-07-19
ZA201307316B (en) 2014-12-23
CN103415884A (zh) 2013-11-27
JPWO2012144127A1 (ja) 2014-07-28
JP6518361B2 (ja) 2019-05-22
EP2701144B1 (en) 2016-07-27
EP2701144A1 (en) 2014-02-26
MY164987A (en) 2018-02-28
US9881625B2 (en) 2018-01-30
US20140114651A1 (en) 2014-04-24
MY193565A (en) 2022-10-19
JP2016170428A (ja) 2016-09-23
US20180166086A1 (en) 2018-06-14
RU2013146688A (ru) 2015-05-27
ES2765527T3 (es) 2020-06-09
EP3594943B1 (en) 2024-02-21
KR20140022813A (ko) 2014-02-25
TWI598872B (zh) 2017-09-11
JP5937064B2 (ja) 2016-06-22
KR20180055917A (ko) 2018-05-25
KR101959698B1 (ko) 2019-03-20
US10204632B2 (en) 2019-02-12
US20190122682A1 (en) 2019-04-25
CN103415884B (zh) 2015-06-10
WO2012144127A1 (ja) 2012-10-26
CN104485111A (zh) 2015-04-01
EP3096315A2 (en) 2016-11-23
TW201246187A (en) 2012-11-16
EP3096315A3 (en) 2017-02-15
EP4322161A2 (en) 2024-02-14
EP3594943A1 (en) 2020-01-15
CA2832032A1 (en) 2012-10-26

Similar Documents

Publication Publication Date Title
RU2585990C2 (ru) Устройство и способ для выполнения кодирования методом хаффмана
JP2023169294A (ja) 符号化及び復号化のための符号化装置、復号化装置、システム及び方法
CN103069484A (zh) 时/频二维后处理
US20220130402A1 (en) Encoding device, decoding device, encoding method, decoding method, and non-transitory computer-readable recording medium
JP2019070823A (ja) 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法