RU2678487C2 - Устройство аудиокодера и устройство аудиодекодера, имеющие эффективное кодирование усиления при управлении динамическим диапазоном - Google Patents

Устройство аудиокодера и устройство аудиодекодера, имеющие эффективное кодирование усиления при управлении динамическим диапазоном Download PDF

Info

Publication number
RU2678487C2
RU2678487C2 RU2016141556A RU2016141556A RU2678487C2 RU 2678487 C2 RU2678487 C2 RU 2678487C2 RU 2016141556 A RU2016141556 A RU 2016141556A RU 2016141556 A RU2016141556 A RU 2016141556A RU 2678487 C2 RU2678487 C2 RU 2678487C2
Authority
RU
Russia
Prior art keywords
dynamic range
range control
dfr
nodes
dfs
Prior art date
Application number
RU2016141556A
Other languages
English (en)
Other versions
RU2016141556A (ru
RU2016141556A3 (ru
Inventor
Фабиан КЮХ
Кристиан УЛЕ
Михаэль КРАЧМЕР
Бернхард НОЙГЕБАУЭР
Михаэль МАЙЕР
Штефан ШРАЙНЕР
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2016141556A publication Critical patent/RU2016141556A/ru
Publication of RU2016141556A3 publication Critical patent/RU2016141556A3/ru
Application granted granted Critical
Publication of RU2678487C2 publication Critical patent/RU2678487C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

Изобретение относится к средствам для кодирования и декодирования аудио. Технический результат заключается в повышении эффективности кодирования. Формируют кодированный поток (ABS) битов аудио из аудиосигнала (AS), содержащего последовательные аудиокадры (AFP, AFR, AFS). Формируют кодированный поток (DBS) битов управления динамическим диапазоном из последовательности (DS) управления динамическим диапазоном, соответствующей аудиосигналу (AS) и содержащей последовательные кадры (DFP, DFR, DFS) управления динамическим диапазоном. Каждый кадр (DFP, DFR, DFS) управления динамическим диапазоном содержит один или более узлов (A...A; B...B; C), при этом каждый узел содержит информацию усиления для аудиосигнала и информацию времени, указывающую то, какому моменту времени соответствует информация усиления. Кодированный поток битов управления динамическим диапазоном содержит для каждого кадра управления динамическим диапазоном соответствующую часть потока битов. Выполняют процедуру сдвига, при этом один или более узлов из узлов одного опорного кадра управления динамическим диапазоном выбираются в качестве сдвинутых узлов. 7 н. и 19 з.п. ф-лы, 2 табл., 9 ил.

Description

Управление динамическим диапазоном (DRC) в контексте этого документа означает технологию обработки цифровых сигналов для того, чтобы уменьшать динамический диапазон аудиосигналов управляемым способом [1]. Требуемое уменьшение динамического диапазона достигается посредством сокращения уровня громких компонентов звука и/или усиления мягких частей аудиосигналов.
Типичный вариант применения для DRC заключается в том, чтобы адаптировать динамические свойства аудиосигнала к окружению прослушивания. Например, при прослушивании музыки в зашумленном окружении, динамический диапазон должен уменьшаться для получения возможности полного усиления сигнала без перевода результирующего усиленного сигнала в режим отсечения. В этом случае, высокие пики сигнала должны быть ослаблены, например, посредством ограничителя. Дополнительно, мягкие компоненты сигнала должны усиливаться относительно громких частей, чтобы повышать их понятность в зашумленном окружении прослушивания.
Задача настоящего изобретения заключается в том, чтобы предоставлять усовершенствованный принцип для управления динамическим диапазоном в контексте аудиопередачи.
Это задача решается посредством устройства аудиокодера, содержащего:
- аудиокодер, выполненный с возможностью формирования кодированного потока битов аудио из аудиосигнала, содержащего последовательные аудиокадры;
- кодер для управления динамическим диапазоном, выполненный с возможностью формирования кодированного потока битов управления динамическим диапазоном из последовательности управления динамическим диапазоном, соответствующей аудиосигналу и содержащей последовательные кадры управления динамическим диапазоном, при этом каждый кадр управления динамическим диапазоном из кадров управления динамическим диапазоном содержит один или более узлов, при этом каждый узел из одного или более узлов содержит информацию усиления для аудиосигнала и информацию времени, указывающую то, какому моменту времени соответствует информация усиления;
- при этом кодер для управления динамическим диапазоном сконфигурирован таким образом, что кодированный поток битов управления динамическим диапазоном содержит для каждого кадра управления динамическим диапазоном из кадров управления динамическим диапазоном соответствующую часть потока битов;
- при этом кодер для управления динамическим диапазоном выполнен с возможностью выполнения процедуры сдвига, при этом один или более узлов из узлов одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном выбираются в качестве сдвинутых узлов, при этом битовое представление каждого из одного или более сдвинутых узлов одного опорного кадра управления динамическим диапазоном встраивается в часть потока битов, соответствующую кадру управления динамическим диапазоном, следующему после одного опорного кадра управления динамическим диапазоном, при этом битовое представление каждого оставшегося узла из узлов одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном встраивается в часть потока битов, соответствующую одному опорному кадру управления динамическим диапазоном.
Изобретение разрешает ситуацию аудиопередачи с использованием кодирования аудиосигнала, при этом информация усиления непосредственно не применяется к аудиосигналу, но также кодируется и передается вместе с кодированным аудиосигналом. В декодере, как аудиосигнал, так и информация усиления могут декодироваться, и информация усиления может применяться к соответствующему аудиосигналу. Как подробнее пояснено ниже, изобретение достигает эффективного кодирования информации усиления. Более точно, оно исключает пики скорости передачи битов в кодированном потоке битов управления динамическим диапазоном.
Процесс применения управления динамическим диапазоном в аудиосигнал может выражаться посредством простого умножения аудиосигнала x(k) на зависимое от времени значение g(k) усиления:
Figure 00000001
, (1)
где k обозначает временной индекс выборки. Значение усиления g(k) может вычисляться, например, на основе кратковременной оценки среднеквадратического значения аудиосигнала x(k). Дополнительные сведения по стратегиям для того, чтобы определять подходящие значения усилений, пояснены в [1]. Далее зависимые от времени усиления g(k) обозначаются в качестве последовательности усилений.
Далее поясняется кодирование последовательностей усилений управления динамическим диапазоном. Во-первых, последовательность усилений управления динамическим диапазоном разделяется на так называемые кадры управления динамическим диапазоном выборок усилений, содержащие фиксированное число выборок усилений. Обычно, временной размер кадра для кадров управления динамическим диапазоном выбирается таким образом, что он равен временному размеру аудиокадра соответствующего аудиокодера. В каждом кадре управления динамическим диапазоном, так называемые узлы выбираются, предпочтительно на равномерной временной сетке.
Разнесение этой сетки задает наибольшее доступное временное разрешение, т.е. минимальное расстояние в выборках между двумя узлами равно выборкам, имеющим наибольшее доступное временное разрешение. Каждый узел представлен посредством позиции выборки в кадре управления динамическим диапазоном, информации усиления, которая может выражаться как значение усиления для этой позиции, и необязательно информации относительно наклона значений усиления в позициях узла. В нижеприведенном пояснении, полезно задавать максимальное число узлов, которые могут выбираться в одном кадре.
Кодер для управления динамическим диапазоном кодирует информацию усиления из узлов, например, посредством использования квантованных дифференциальных значений пар последовательных узлов усиления. В декодере, исходная последовательность усилений восстанавливается максимально возможно хорошо посредством использования сплайн-интерполяции или линейной интерполяции на основе передаваемой информации узлов (значения усиления, позиции выборки в кадре управления динамическим диапазоном и информации наклона, если применимо).
Эффективный подход для кодирования последовательности усилений управления динамическим диапазоном заключается в том, чтобы использовать квантованное значение разности усилений (типично в дБ) пар последовательных узлов, а также разности времен позиций выборок этих узлов в рассматриваемом кадре управления динамическим диапазоном. Информация наклона обычно не представляется в качестве разности между двумя узлами. Поскольку отсутствует предыдущий узел для первого узла в кадре, его значение усиления не кодируется дифференциальным способом, а значения кодируются явно. Разность времен первого узла обычно определяется в качестве смещения в начало кадра управления динамическим диапазоном.
Кодер затем может назначать фиксированное кодовое слово, например, предварительно заданной таблицы Хаффмана (таблицы кодирования) для каждой из разностей усилений и времен пар узлов.
В декодере для управления динамическим диапазоном, декодируется поток битов управления динамическим диапазоном, и восстанавливается релевантная информация (значение усиления, позиция выборки в кадре управления динамическим диапазоном и информации наклона, если применимо) в позициях передаваемых узлов. Значения усиления для оставшихся выборок усилений в кадре получаются посредством интерполяции между парами передаваемых и декодированных узлов. Интерполяция может быть основана на сплайнах, если информация наклона узлов усиления передана, или альтернативно, с использованием линейной интерполяции, если только разности усилений между парами узлов доступны, и информация наклона отбрасывается.
В принципе, цепочки кодера/декодера для управления динамическим диапазоном могут работать в двух режимах. Так называемый полнокадровый режим означает случай, в котором после декодирования принимаемого потока битов управления динамическим диапазоном, соответствующего опорному кадру управления динамическим диапазоном, усиления в каждой позиции выборки опорного кадра управления динамическим диапазоном могут немедленно определяться после интерполяции на основе декодированных узлов. Это подразумевает то, что узел должен передаваться на каждой границе кадра, т.е. в позиции выборки, соответствующей последней выборке опорного кадра управления динамическим диапазоном. Если длина кадра управления динамическим диапазоном составляет N, это означает то, что последний передаваемый узел должен быть расположен в позиции N выборки в опорном кадре управления динамическим диапазоном.
Изобретение исключает этот недостаток, поскольку оно основано на втором режиме, который упоминается в качестве "режима задержки". В этом случае, нет необходимости в передаче узла для позиции последней выборки в опорном кадре управления динамическим диапазоном. Следовательно, декодер для управления динамическим диапазоном должен ожидать декодирования кадра управления динамическим диапазоном, следующего после опорного кадра управления динамическим диапазоном, чтобы выполнять требуемую интерполяцию всех значений усиления после последнего узла в опорном кадре управления динамическим диапазоном. Это обусловлено тем, что информация первого узла последующего кадра управления динамическим диапазоном должна быть известна для того, чтобы выполнять интерполяцию между последним узлом опорного кадра управления динамическим диапазоном и первым узлом последующего кадра управления динамическим диапазоном, чтобы определять значение усиления в промежутке через интерполяцию.
На практике, задержка, вызываемая посредством использования режима задержки для кодирования информации управления динамическим диапазоном, не представляет собой проблему. Это обусловлено тем, что аудиокодеки, которые обычно соответствуют схеме кодирования для управления динамическим диапазоном, также вводят внутренне присущую задержку одного аудиокадра при последующем применении этапов кодирования и декодирования. Важные примеры таких аудиокодеков представляют собой стандарты ISO/IEC 13818-7, усовершенствованное кодирование аудио (AAC MPEG-2), ISO/IEC 14496-3, подчасть 4 (MPEG-4 AAC) или ISO/IEC 23003-3, часть 3, стандартизированное кодирование речи и аудио (USAC). Такие схемы кодирования аудио требуют опорного аудиокадра и аудиокадра, следующего после опорного аудиокадра, для того чтобы вычислять (с использованием структуры суммирования с перекрытием) корректные аудиовыборки, соответствующие опорному аудиокадру управления динамическим диапазоном.
Важно отметить, что число узлов, которые требуются для того, чтобы достаточно аппроксимировать исходную последовательность усилений управления динамическим диапазоном, существенно варьируется в зависимости от кадра управления динамическим диапазоном. Это вытекает из того факта, что большее число узлов требуется для того, чтобы представлять сильно зависимые от времени усиления по сравнению со случаем, в котором должны кодироваться только медленно изменяющиеся значения усиления. Это наблюдение подразумевает то, что требуемая скорость передачи битов для того, чтобы передавать последовательности усилений, может существенно варьироваться между кадрами. Некоторые кадры могут требовать кодирования большого числа узлов, приводя к высоким пикам скорости передачи битов. Это является нежелательным, в частности, когда аудиосигнал и последовательность усилений управления динамическим диапазоном передаются в объединенном потоке битов, содержащем кодированный поток битов управления динамическим диапазоном и кодированный поток битов аудио, который должен иметь почти постоянную скорость передачи битов. Затем пик в связанной с управлением динамическим диапазоном скорости передачи битов уменьшает доступную скорость передачи битов для аудиокодера, что зачастую приводит к ухудшению качества звука после декодирования. Тем не менее, за счет способов современного уровня техники для кодирования последовательностей усилений управления динамическим диапазоном, уменьшение связанной с управлением динамическим диапазоном скорости передачи битов в определенном кадре достигается только посредством уменьшения числа узлов, которые выбираются, чтобы представлять последовательность усилений в этом кадре. Это снова может приводить к большим ошибкам между исходной последовательностью усилений и последовательностью усилений, которая восстановлена после процесса декодирования для управления динамическим диапазоном. Изобретение преодолевает эти недостатки посредством уменьшения пиковых скоростей передачи битов кодированного потока битов управления динамическим диапазоном без увеличения ошибки между исходной и восстановленной последовательностью управления динамическим диапазоном.
В этом разделе, представляется кодирование последовательностей усилений управления динамическим диапазоном согласно изобретению. Изобретение обеспечивает возможность управления пиковой скоростью передачи битов, требуемой для опорного кадра управления динамическим диапазоном, без изменения результирующей последовательности потока битов по сравнению со случаем, в котором не используется предложенный способ. Предложенный подход использует внутренне присущую задержку одного кадра, вводимую посредством аудиокодеров предшествующего уровня техники, чтобы уменьшать пики числа узлов в одном кадре посредством распределения передачи некоторых узлов в непосредственно последующий кадр управления динамическим диапазоном. Далее представлены подробности предложенного способа.
Как пояснено выше, при комбинировании со схемой кодирования аудио, которая вводит кадровую задержку относительно усилений управления динамическим диапазоном, декодированные усиления управления динамическим диапазоном задерживаются на один кадр перед применением к аудиосигналу. Это означает то, что узлы опорного кадра управления динамическим диапазоном применяются к допустимому выводу аудиодекодера в кадре управления динамическим диапазоном, следующем после опорного кадра управления динамическим диапазоном. Это подразумевает то, что в режиме задержки по умолчанию, достаточно передавать узлы опорного кадра управления динамическим диапазоном вместе с узлами кадра управления динамическим диапазоном, следующего после опорного кадра управления динамическим диапазоном, и применять соответствующие усиления управления динамическим диапазоном без задержки непосредственно к соответствующему выходному аудиосигналу в декодере.
Этот факт использован в изобретении для того, чтобы сокращать максимальное число узлов, передаваемых в одном кадре управления динамическим диапазоном. Согласно изобретению, некоторые узлы опорного кадра управления динамическим диапазоном сдвигаются в последующий кадр управления динамическим диапазоном, что может осуществляться перед кодированием. Как поясняется далее, сдвинутые узлы могут "предшествовать" первому узлу в последующем кадре управления динамическим диапазоном только для кодирования разностей усилений и информации наклона. Для кодирования информации разности времен может применяться другой способ.
Согласно предпочтительному варианту осуществления изобретения, процедура сдвига инициируется в случае, если число узлов опорного кадра управления динамическим диапазоном превышает предварительно заданное пороговое значение.
Согласно предпочтительному варианту осуществления изобретения, процедура сдвига инициируется в случае, если сумма числа узлов опорного кадра управления динамическим диапазоном и числа сдвинутых узлов из кадра управления динамическим диапазоном, предшествующего опорному кадру управления динамическим диапазоном, которые должны встраиваться в часть потока битов, соответствующую опорному кадру управления динамическим диапазоном, превышает предварительно заданное пороговое значение.
Согласно предпочтительному варианту осуществления изобретения, процедура сдвига инициируется в случае, если сумма числа узлов опорного кадра управления динамическим диапазоном и числа сдвинутых узлов из кадра управления динамическим диапазоном, предшествующего опорному кадру управления динамическим диапазоном, которые должны встраиваться в часть потока битов, соответствующую опорному кадру управления динамическим диапазоном, превышает число узлов кадра управления динамическим диапазоном, следующего после опорного кадра управления динамическим диапазоном.
Независимый от заданных условий, при которых инициируется процедура сдвига, первый узел опорного кадра управления динамическим диапазоном не должен сдвигаться в последующий кадр управления динамическим диапазоном, поскольку его значение требуется для интерполяции значений регулировки усиления в начале опорного кадра управления динамическим диапазоном. Кроме того, узел должен сдвигаться только один раз во избежание задержки при декодировании потока битов.
Согласно предпочтительному варианту осуществления изобретения, информация времени одного или более узлов представлена таким образом, что один или более сдвинутых узлов могут идентифицироваться посредством использования информации времени.
Согласно предпочтительному варианту осуществления изобретения, информация времени одного или более сдвинутых узлов представлена посредством суммы разности времен от начала кадра управления динамическим диапазоном, которому принадлежит соответствующий узел, до временной позиции соответствующего узла в кадре управления динамическим диапазоном, которому принадлежит соответствующий узел, и значения смещения, равного или превышающего временной размер кадра управления динамическим диапазоном, следующего после соответствующего кадра управления динамическим диапазоном.
Согласно предпочтительному варианту осуществления изобретения, информация усиления битового представления сдвинутого узла, который находится в первой позиции части потока битов, соответствующей кадру управления динамическим диапазоном, следующему после опорного кадра управления динамическим диапазоном, представлена посредством значения абсолютного усиления, при этом информация усиления каждого битового представления сдвинутых узлов в позиции после битового представления узла, который находится в первой позиции части потока битов, соответствующей кадру управления динамическим диапазоном, следующему после опорного кадра управления динамическим диапазоном, представлена посредством значения относительного усиления, которое равно разности значения усиления битового представления соответствующего сдвинутого узла и значения усиления битового представления узла, которое предшествует битовому представлению соответствующего узла.
Согласно предпочтительному варианту осуществления изобретения, в случае если битовые представления одного или более сдвинутых узлов опорного кадра управления динамическим диапазоном встраиваются в часть потока битов, соответствующую кадру управления динамическим диапазоном, следующему после опорного кадра управления динамическим диапазоном, информация усиления битового представления узла последующего кадра управления динамическим диапазоном в первой позиции части потока битов, соответствующей кадру управления динамическим диапазоном, следующему после опорного кадра управления динамическим диапазоном после одной или более позиций битовых представлений одного или более сдвинутых узлов, представлена посредством значения относительного усиления, которое равно разности значения усиления битового представления соответствующего узла и значения усиления битового представления сдвинутого узла, которое предшествует битовому представлению соответствующего узла.
Согласно предпочтительному варианту осуществления изобретения, временной размер аудиокадров равен временному размеру кадров управления динамическим диапазоном.
Согласно предпочтительному варианту осуществления изобретения, один или более узлов одного из кадра управления динамическим диапазоном выбираются из равномерной временной сетки.
Согласно предпочтительному варианту осуществления изобретения, каждый узел из одного или более узлов содержит информацию наклона.
Согласно предпочтительному варианту осуществления изобретения, кодер для управления динамическим диапазоном выполнен с возможностью кодирования узлов с использованием технологии энтропийного кодирования, такой как кодирование методом Хаффмана или арифметическое кодирование.
Кодер может назначать фиксированное кодовое слово, например, из предварительно заданной таблицы Хаффмана (таблицы кодирования) для каждой из разностей усилений и времен пар узлов. Примеры подходящих таблиц Хаффмана для кодирования разностей времен пар последовательных узлов приведены в таблице 1 и таблице 2, соответственно.
ТАБЛИЦА 1
Пример таблицы Хаффмана для кодирования разностей времен узлов DRC-усиления
Размер кодового слова [биты] Разность времен – двоичное кодирование Разность tDrcDelta времен в кратных числах deltaTmin
1 0×000 nNodesMax
3 0×004 1
5 0×014+(a-2) a=[2...5]
6 0×030+(a-6) a=[6...13]
12 0×E00+(a-14) a=[14...2*nNodesMax-1]
ТАБЛИЦА 2
Пример таблицы Хаффмана для кодирования разностей времен узлов DRC-усиления, где Z=ceil(log2(2*nNodesMax))
Кодирование Размер Разность времен в кратных числах deltaTmin Диапазон
00 2 бита tDrcDelta=1 1
{01,µ} {2 бита, 2 бита} tDrcDelta=µ+2 2...5
{10,µ} {2 бита, 3 бита} tDrcDelta=µ+6 6...13
{11,µ} {2 бита, Z битов} tDrcDelta=µ+14 14... 2*nNodesMax
В дополнительном аспекте изобретения, задача решается посредством устройства аудиодекодера, содержащего:
- аудиодекодер, выполненный с возможностью декодирования кодированного потока битов аудио для того, чтобы воспроизводить аудиосигнал, содержащий последовательные аудиокадры;
- декодер для управления динамическим диапазоном, выполненный с возможностью декодирования кодированного потока битов управления динамическим диапазоном, чтобы воспроизводить последовательность управления динамическим диапазоном, соответствующую аудиосигналу и содержащую последовательные кадры управления динамическим диапазоном;
- при этом кодированный поток битов управления динамическим диапазоном содержит для каждого кадра управления динамическим диапазоном из кадров управления динамическим диапазоном соответствующую часть потока битов;
- при этом кодированный поток битов управления динамическим диапазоном содержит битовые представления узлов, при этом каждое битовое представление одного узла из узлов содержит информацию усиления для аудиосигнала AS и информацию времени, указывающую то, какому моменту времени соответствует информация усиления;
- при этом кодированный поток битов управления динамическим диапазоном содержит битовые представления сдвинутых узлов, выбранных из узлов одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном, которые встраиваются в часть потока битов, соответствующую кадру управления динамическим диапазоном, следующему после одного опорного кадра управления динамическим диапазоном, при этом битовое представление каждого оставшегося узла из узлов одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном встраивается в часть потока битов, соответствующую одному опорному кадру управления динамическим диапазоном; и
- при этом декодер для управления динамическим диапазоном выполнен с возможностью декодирования битового представления каждого оставшегося узла из оставшихся узлов одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном, чтобы воспроизводить каждый оставшийся узел одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном, декодирования битового представления каждого сдвинутого узла из сдвинутых узлов, выбранных из узлов одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном, чтобы воспроизводить каждый сдвинутый узел из сдвинутых узлов, выбранных из узлов одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном, и комбинирования воспроизведенных оставшихся узлов и воспроизведенных сдвинутых узлов, чтобы восстанавливать опорный кадр управления динамическим диапазоном.
Декодер для управления динамическим диапазоном принимает поток битов управления динамическим диапазоном. Поток битов управления динамическим диапазоном, который соответствует информации узла (позиции выборки, значению усиления и информации наклона, если применимо), может декодироваться следующим образом:
Значение для разности времен между двумя узлами (например, в качестве целого кратного минимального расстояния между двумя узлами) определяется из принимаемого кодового слова, например, на основе правил, показанных в таблице кодирования Хаффмана. Соответствующая позиция выборки текущего декодированного узла получается посредством суммирования значения разности времен со значением позиции выборки, вычисленным для предыдущего узла.
После декодирования узлов опорного кадра управления динамическим диапазоном, декодируются узлы последующего кадра управления динамическим диапазоном.
Если определенная позиция выборки в последующем кадре управления динамическим диапазоном соответствует значению, которое превышает длину последующего кадра управления динамическим диапазоном, декодер для управления динамическим диапазоном знает то, что текущая временная информация узла ссылается на узел, первоначально расположенный в опорном кадре управления динамическим диапазоном.
Чтобы получать корректную позицию выборки в опорном кадре управления динамическим диапазоном, смещение вычитается из вычисленной позиции выборки. Практический пример заключается в том, чтобы вычитать значение, которое соответствует длине кадра управления динамическим диапазоном (что подразумевает то, что кодер суммирует идентичное значение с исходной позицией выборки). Типичный пример для значения смещения представляет собой временной размер кадра управления динамическим диапазоном.
После декодирования и, если применимо, коррекции информации времени всех узлов во всем последующем кадре управления динамическим диапазоном, декодер знает то, сколько узлов сдвинуто назад в опорный кадр управления динамическим диапазоном (без явного предоставления этой информации в кодере), и то, в какой позиции выборки они расположены в опорном кадре управления динамическим диапазоном.
Декодер для управления динамическим диапазоном дополнительно определяет информацию значений усиления всех узлов принимаемого кадра посредством декодирования информации дифференциального усиления в потоке битов.
Из этапа декодирования информации времени декодер знает то, сколько из декодированных значений усиления должны назначаться узлам опорного кадра управления динамическим диапазоном (и какой позиции выборки), и какие значения усиления назначаются узлам в опорном кадре управления динамическим диапазоном.
Декодирование информации наклона и назначения корректным узлам выполняется аналогично процессу декодирования значений усиления.
После декодирования всех узлов последующего кадра управления динамическим диапазоном, можно обеспечивать то, что доступны все узлы, требуемые для вычисления значений усиления для каждой выборки опорного кадра управления динамическим диапазоном через интерполяцию. После этапа интерполяции, значения усиления управления динамическим диапазоном для каждой выборки могут применяться к соответствующим корректным аудиовыборкам.
Согласно предпочтительному варианту осуществления изобретения, декодер для управления динамическим диапазоном выполнен с возможностью идентификации одного или более сдвинутых узлов посредством использования информации времени.
Согласно предпочтительному варианту осуществления изобретения, декодер для управления динамическим диапазоном выполнен с возможностью декодирования информации времени одного или более сдвинутых узлов, которая представлена посредством суммы времени от начала кадра управления динамическим диапазоном, которому принадлежит соответствующий узел, до временной позиции соответствующего узла в кадре управления динамическим диапазоном, которому принадлежит соответствующий узел, и значения смещения, равного или превышающего временной размер кадра управления динамическим диапазоном, следующего после соответствующего кадра управления динамическим диапазоном.
Согласно предпочтительному варианту осуществления изобретения, декодер для управления динамическим диапазоном выполнен с возможностью декодирования информации усиления битового представления сдвинутого узла, который находится в первой позиции части потока битов, соответствующей кадру управления динамическим диапазоном, следующему после опорного кадра управления динамическим диапазоном, которая представлена посредством значения абсолютного усиления, при этом информация усиления каждого битового представления сдвинутых узлов в позиции после битового представления узла, который находится в первой позиции части потока битов, соответствующей кадру управления динамическим диапазоном, следующему после опорного кадра управления динамическим диапазоном, представлена посредством значения относительного усиления, которое равно разности значения усиления битового представления соответствующего сдвинутого узла и значения усиления битового представления узла, которое предшествует битовому представлению соответствующего узла.
Согласно предпочтительному варианту осуществления изобретения, декодер для управления динамическим диапазоном выполнен с возможностью декодирования информации усиления битового представления узла последующего кадра управления динамическим диапазоном в первой позиции части потока битов, соответствующей кадру управления динамическим диапазоном, следующему после опорного кадра управления динамическим диапазоном после одной или более позиций битовых представлений одного или более сдвинутых узлов, которая представлена посредством значения относительного усиления, которое равно разности значения усиления битового представления соответствующего узла и значения усиления битового представления сдвинутого узла, которое предшествует битовому представлению соответствующего узла.
Согласно предпочтительному варианту осуществления изобретения, временной размер аудиокадров равен временному размеру кадров управления динамическим диапазоном.
Согласно предпочтительному варианту осуществления изобретения, один или более узлов одного из кадров управления динамическим диапазоном выбираются из равномерной временной сетки.
Согласно предпочтительному варианту осуществления изобретения, каждый узел из одного или более узлов содержит информацию наклона.
Согласно предпочтительному варианту осуществления изобретения, декодер для управления динамическим диапазоном выполнен с возможностью декодирования битовых представлений узлов с использованием технологии энтропийного декодирования.
Цель дополнительно достигается посредством системы, содержащей устройство аудиокодера согласно изобретению и устройство аудиодекодера согласно изобретению.
Изобретение дополнительно предоставляет способ для управления аудиокодером, способ содержит этапы:
- формирования кодированного потока битов аудио из аудиосигнала, содержащего последовательные аудиокадры;
- формирования кодированного потока битов управления динамическим диапазоном из последовательности управления динамическим диапазоном, соответствующей аудиосигналу и содержащей последовательные кадры управления динамическим диапазоном, при этом каждый кадр управления динамическим диапазоном из кадров управления динамическим диапазоном содержит один или более узлов, при этом каждый узел из одного или более узлов содержит информацию усиления для аудиосигнала и информацию времени, указывающую то, какому моменту времени соответствует информация усиления;
- при этом кодированный поток битов управления динамическим диапазоном содержит для каждого кадра управления динамическим диапазоном из кадров управления динамическим диапазоном соответствующую часть потока битов;
- выполнения процедуры сдвига, при этом один или более узлов из узлов одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном выбираются в качестве сдвинутых узлов, при этом битовое представление каждого из одного или более сдвинутых узлов одного опорного кадра управления динамическим диапазоном встраивается в часть потока битов, соответствующую кадру управления динамическим диапазоном, следующему после одного опорного кадра управления динамическим диапазоном, при этом битовое представление каждого оставшегося узла из узлов одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном встраивается в часть потока битов, соответствующую одному опорному кадру управления динамическим диапазоном.
Изобретение дополнительно предоставляет способ для управления аудиодекодером, способ содержит этапы:
- декодирования кодированного потока битов аудио для того, чтобы воспроизводить аудиосигнал, содержащий последовательные аудиокадры;
- декодирования кодированного потока битов управления динамическим диапазоном, чтобы воспроизводить последовательность управления динамическим диапазоном, соответствующую аудиосигналу и содержащую последовательные кадры управления динамическим диапазоном;
- при этом кодированный поток битов управления динамическим диапазоном содержит для каждого кадра управления динамическим диапазоном из кадров управления динамическим диапазоном соответствующую часть потока битов;
- при этом кодированный поток битов управления динамическим диапазоном содержит битовые представления узлов, при этом каждое битовое представление одного узла из узлов содержит информацию усиления для аудиосигнала AS и информацию времени, указывающую то, какому моменту времени соответствует информация усиления;
- при этом кодированный поток битов управления динамическим диапазоном содержит битовые представления сдвинутых узлов, выбранных из узлов одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном, которые встраиваются в часть потока битов, соответствующую кадру управления динамическим диапазоном, следующему после одного опорного кадра управления динамическим диапазоном, при этом битовое представление каждого оставшегося узла из узлов одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном встраивается в часть потока битов, соответствующую одному опорному кадру управления динамическим диапазоном; и
- при этом битовое представление каждого оставшегося узла из оставшихся узлов одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном декодируется, чтобы воспроизводить каждый оставшийся узел одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном;
- при этом битовое представление каждого сдвинутого узла из сдвинутых узлов, выбранных из узлов одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном, декодируется, чтобы воспроизводить каждый сдвинутый узел из сдвинутых узлов, выбранных из узлов одного опорного кадра управления динамическим диапазоном из кадров управления динамическим диапазоном; и
- при этом воспроизведенные оставшиеся узлы и воспроизведенные сдвинутые узлы комбинируются, чтобы восстанавливать опорный кадр управления динамическим диапазоном.
В другом аспекте, изобретение предоставляет программу, при выполнении на процессоре, для осуществления способа согласно изобретению.
Далее поясняются предпочтительные варианты осуществления изобретения со ссылками на прилагаемые чертежи, на которых:
Фиг. 1 в схематичном виде иллюстрирует вариант осуществления устройства аудиокодера согласно изобретению;
Фиг. 2 в схематичном виде иллюстрирует принцип управления динамическим диапазоном, применяемого в контексте кодирования аудио;
Фиг. 3 в схематичном виде иллюстрирует различные режимы для кодирования последовательностей усилений управления динамическим диапазоном;
Фиг. 4 в схематичном виде иллюстрирует применение управления динамическим диапазоном в контексте кодирования аудио;
Фиг. 5 в схематичном виде иллюстрирует процедуру сдвига для узлов согласно изобретению;
Фиг. 6 в схематичном виде иллюстрирует кодирование информации времени согласно изобретению;
Фиг. 7 в схематичном виде иллюстрирует кодирование информации усиления согласно изобретению;
Фиг. 8 в схематичном виде иллюстрирует кодирование информации наклона согласно изобретению; и
Фиг. 9 в схематичном виде иллюстрирует вариант осуществления устройства аудиодекодера согласно изобретению.
Фиг. 1 в схематичном виде иллюстрирует вариант осуществления устройства 1 аудиокодера согласно изобретению. Устройство 1 аудиокодера содержит:
- аудиокодер 2, выполненный с возможностью формирования кодированного потока ABS битов аудио из аудиосигнала AS, содержащего последовательные аудиокадры AFP, AFR, AFS;
- кодер 3 для управления динамическим диапазоном, выполненный с возможностью формирования кодированного потока DBS битов управления динамическим диапазоном из последовательности DS управления динамическим диапазоном, соответствующей аудиосигналу AS и содержащей последовательные кадры DFP, DFR, DFS управления динамическим диапазоном, при этом каждый кадр DFP, DFR, DFS управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном содержит один или более узлов A0...A5; B0...B2; C0, при этом каждый узел из одного или более узлов A0...A5; B0...B2; C0 содержит информацию GA0...GA5; GB0...GB2; GC0 усиления для аудиосигнала AS и информацию TA0...TA5; TB0...TB2; TC0 времени, указывающую то, какому моменту времени соответствует информация GA0...GA5; GB0...GB2; GC0 усиления;
- при этом кодер 3 для управления динамическим диапазоном сконфигурирован таким образом, что кодированный поток DBS битов управления динамическим диапазоном содержит для каждого кадра DFP, DFR, DFS управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном соответствующую часть DFP', DFR', DFS' потока битов;
- при этом кодер для управления динамическим диапазоном 2 выполнен с возможностью выполнения процедуры сдвига, при этом один или более узлов B1, B2 из узлов B0...B2 одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном выбираются в качестве сдвинутых узлов B1, B2, при этом битовое представление B'1, B'2 каждого из одного или более сдвинутых узлов B1, B2 одного опорного кадра DFR управления динамическим диапазоном встраивается в часть DFS' потока битов, соответствующую кадру DFS управления динамическим диапазоном, следующему после одного опорного кадра DFR управления динамическим диапазоном, при этом битовое представление B'0 каждого оставшегося узла B0 из узлов B0...B2 одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном встраивается в часть DFR' потока битов, соответствующую одному опорному кадру DFR управления динамическим диапазоном.
Изобретение обеспечивает возможность управления пиковой скоростью передачи битов, требуемой для опорного кадра DFR управления динамическим диапазоном, без изменения результирующей последовательности DBS потока битов по сравнению со случаем, в котором не используется предложенный способ. Предложенный подход использует внутренне присущую задержку одного кадра, вводимую посредством аудиокодеров предшествующего уровня техники, чтобы уменьшать пики числа узлов в одном кадре посредством распределения передачи некоторых узлов в непосредственно последующий кадр управления динамическим диапазоном. Далее представлены подробности предложенного способа.
Как пояснено выше, при комбинировании со схемой кодирования аудио, которая вводит кадровую задержку относительно усилений управления динамическим диапазоном, декодированные усиления управления динамическим диапазоном задерживаются на один кадр перед применением к аудиосигналу. Это означает то, что узлы опорного кадра управления динамическим диапазоном применяются к допустимому выводу аудиодекодера в кадре управления динамическим диапазоном, следующем после опорного кадра управления динамическим диапазоном. Это подразумевает то, что в режиме задержки по умолчанию, достаточно передавать узлы опорного кадра управления динамическим диапазоном вместе с узлами кадра управления динамическим диапазоном, следующего после опорного кадра управления динамическим диапазоном, и применять соответствующие усиления управления динамическим диапазоном без задержки непосредственно к соответствующему выходному аудиосигналу в декодере.
Этот факт использован в изобретении для того, чтобы сокращать максимальное число узлов, передаваемых в одном кадре управления динамическим диапазоном. Согласно изобретению, некоторые узлы опорного кадра управления динамическим диапазоном сдвигаются в последующий кадр управления динамическим диапазоном, что может осуществляться перед кодированием. Как поясняется далее, сдвинутые узлы могут "предшествовать" первому узлу в последующем кадре управления динамическим диапазоном только для кодирования разностей усилений и информации наклона. Для кодирования информации разности времен может применяться другой способ.
В примере, показанном на фиг. 1, предыдущий кадр DFP управления динамическим диапазоном содержит шесть узлов A0...A5, из которых узлы A4, A5 сдвигаются в часть DFR' потока битов. Кроме того, опорный кадр DFR управления динамическим диапазоном содержит три узла B0...B2. Сумма числа сдвинутых узлов A4, A5 и узлов B0...B2 опорного кадра DFR управления динамическим диапазоном равна пяти, что больше числа узлов C0 последующего кадра DFS управления динамическим диапазоном, так что процедура сдвига инициируется таким образом, что узлы B1, B2 сдвигаются в часть DFS' потока битов. Хотя максимальное число узлов в кадрах DFS, DFR, DFP управления динамическим диапазоном равно шести, максимальное число узлов в частях DFS', DFR', DFP' потока битов равно четырем, так что исключается пик потока битов.
Согласно предпочтительному варианту осуществления изобретения, временной размер аудиокадров AFP, AFR, AFS равен временному размеру кадров DFP, DFR, DFS управления динамическим диапазоном.
Согласно предпочтительному варианту осуществления изобретения, один или более узлов A0...A5; B0...B2; C0 одного из кадра DFP, DFR, DFS управления динамическим диапазоном выбираются из равномерной временной сетки.
Согласно предпочтительному варианту осуществления изобретения, кодер 3 для управления динамическим диапазоном выполнен с возможностью кодирования узлов A0...A5; B0...B2; C0 с использованием технологии энтропийного кодирования.
В дополнительном аспекте, изобретение предоставляет способ для управления аудиокодером 1, способ содержит этапы:
- формирования кодированного потока ABS битов аудио из аудиосигнала AS, содержащего последовательные аудиокадры AFP, AFR, AFS;
- формирования кодированного потока DBS битов управления динамическим диапазоном из последовательности DS управления динамическим диапазоном, соответствующей аудиосигналу AS и содержащей последовательные кадры DFP, DFR, DFS управления динамическим диапазоном, при этом каждый кадр DFP, DFR, DFS управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном содержит один или более узлов A0...A5; B0...B2; C0, при этом каждый узел из одного или более узлов A0...A5; B0...B2; C0 содержит информацию GA0...GA5; GB0...GB2; GC0 усиления для аудиосигнала AS и информацию TA0...TA5; TB0...TB2; TC0 времени, указывающую то, какому моменту времени соответствует информация усиления;
- при этом кодированный поток DBS битов управления динамическим диапазоном содержит для каждого кадра DFP, DFR, DFS управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном соответствующую часть DFP', DFR', DFS' потока битов;
- выполнения процедуры сдвига, при этом один или более узлов B1, B2 из узлов B0...B2 одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном выбираются в качестве сдвинутых узлов B1, B2, при этом битовое представление B'1, B'2 каждого из одного или более сдвинутых узлов B1, B2 одного опорного кадра DFR управления динамическим диапазоном встраивается в часть DFS' потока битов, соответствующую кадру DFS управления динамическим диапазоном, следующему после одного опорного кадра DFR управления динамическим диапазоном, при этом битовое представление B'0 каждого оставшегося узла B0 из узлов B0...B2 одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном встраивается в часть DFR' потока битов, соответствующую одному опорному кадру DFR управления динамическим диапазоном.
Фиг. 2 в схематичном виде иллюстрирует принцип управления динамическим диапазоном, применяемого в контексте кодирования аудио.
Процесс применения DRC к сигналу может выражаться посредством простого умножения аудиосигнала x(k) на зависимое от времени значение g(k) усиления:
Figure 00000001
, (1)
где k обозначает временной индекс выборки. Значение усиления g(k) вычисляется, например, на основе кратковременной оценки среднеквадратического значения входного сигнала x(k). Дополнительные сведения по стратегиям для того, чтобы определять подходящие значения усилений, пояснены в [1]. Далее зависимые от времени усиления g(k) обозначаются в качестве последовательности усилений.
Изобретение ссылается на сценарий применения, в котором как аудиосигнал AS, так и последовательность DS управления динамическим диапазоном кодируются и передаются. В этом случае, усиления управления динамическим диапазоном не применяются непосредственно к аудиосигналу AS, а кодируются и передаются вместе с кодированным аудиосигналом ABS. В декодере 4, как аудиосигнал AS, так и последовательность DS управления динамическим диапазоном декодируются, и информация управления динамическим диапазоном применяется к соответствующему аудиосигналу AS.
В одном аспекте, изобретение предоставляет систему, содержащую устройство 1 аудиокодера согласно изобретению и устройство 4 аудиодекодера согласно изобретению.
Фиг. 3 в схематичном виде иллюстрирует различные режимы для кодирования последовательностей усилений управления динамическим диапазоном, а именно, полнокадровый режим (A) и режим (B) задержки. Узлы усиления, принимаемые в кадре n, показаны как окружности, и узлы усиления, принимаемые в кадре n+1, показаны как квадраты. Сплошная линия иллюстрирует интерполированное DRC-усиление вплоть до DRC-кадра n+1.
В принципе, цепочка кодера/декодера для управления динамическим диапазоном может работать в двух режимах. Так называемый полнокадровый режим означает случай, в котором после декодирования принимаемого потока битов управления динамическим диапазоном, соответствующего управляющему кадру конкретного динамического диапазона, усиления в каждой позиции выборки кадра управления динамическим диапазоном могут немедленно определяться после интерполяции на основе декодированных узлов. Это подразумевает то, что узел должен передаваться на каждой границе кадра, т.е. в позиции выборки, соответствующей последней выборке кадра управления динамическим диапазоном. Если длина кадра управления динамическим диапазоном составляет N, это означает то, что последний передаваемый узел должен быть расположен в позиции N выборки в этом кадре. Это проиллюстрировано в верхней части фиг. 3, обозначаемой посредством "A". Как показано, усиления управления динамическим диапазоном n-ого кадра могут сразу применяться к соответствующему аудиокадру.
Второй режим упоминается в качестве "режима задержки", и он проиллюстрирован в нижней части "B" фиг. 3. В этом случае, не передаются узлы для позиции последней выборки в кадре n. Следовательно, DRC-декодер должен ожидать декодирования DRC-кадра n+1, чтобы выполнять требуемую интерполяцию всех значений усиления после последнего узла в кадре n. Это обусловлено тем, что информация первого узла кадра n+1 должна быть известна для того, чтобы выполнять интерполяцию между последним узлом кадра n и первым узлом в кадре n+1, чтобы определять значение усиления в промежутке через интерполяцию.
Фиг. 4 в схематичном виде иллюстрирует применение управления динамическим диапазоном в контексте кодирования аудио, в котором аудиокодер вводит одну кадровую задержку относительно схемы кодирования динамического диапазона.
Фиг. 5 в схематичном виде иллюстрирует процедуру сдвига для узлов согласно изобретению. Левая сторона показывает ситуацию при использовании подхода предшествующего уровня техники, тогда как правая сторона показывает предложенный способ, в котором каждый квадрат соответствует узлу A0...A5; B0...B2; C0.
Согласно предпочтительному варианту осуществления изобретения, процедура сдвига инициируется в случае, если число узлов B0...B2 опорного кадра DFR управления динамическим диапазоном превышает предварительно заданное пороговое значение.
Согласно предпочтительному варианту осуществления изобретения, процедура сдвига инициируется в случае, если сумма числа узлов B0...B2 опорного кадра DFR управления динамическим диапазоном и числа сдвинутых узлов A4, A5 из кадра DFP управления динамическим диапазоном, предшествующего опорному кадру DFR управления динамическим диапазоном, которые должны встраиваться в часть DFR' потока битов, соответствующую опорному кадру DFR управления динамическим диапазоном, превышает предварительно заданное пороговое значение.
Согласно предпочтительному варианту осуществления изобретения, процедура сдвига инициируется в случае, если сумма числа узлов B0...B2 опорного кадра DFR управления динамическим диапазоном и числа сдвинутых узлов A4, A5 из кадра DFP управления динамическим диапазоном, предшествующего опорному кадру DFR управления динамическим диапазоном, которые должны встраиваться в часть DFR' потока битов, соответствующую опорному кадру DFR управления динамическим диапазоном, превышает число узлов C0 кадра DFS управления динамическим диапазоном, следующего после опорного кадра DFR управления динамическим диапазоном.
Как пояснено выше, при комбинировании со схемой кодирования аудио, которая вводит кадровую задержку относительно кадров управления динамическим диапазоном, декодированные усиления управления динамическим диапазоном задерживаются на один кадр перед применением к аудиосигналу. Если рассматривать левую сторону на фиг. 5, это означает то, что узлы Ai n-ого кадра применяются к допустимому выводу аудиодекодера в кадре n+1. Это подразумевает то, что в режиме задержки по умолчанию, достаточно передавать узлы Ai вместе с узлом B0 в кадре n+1 и применять соответствующие DRC-усиления без задержки непосредственно к соответствующему выходному аудиосигналу в декодере.
Этот факт использован в предложенном способе для того, чтобы сокращать максимальное число узлов, передаваемых в одном кадре. Это проиллюстрировано в правой стороне на фиг. 4. Узлы A4 и A5 сдвигаются в кадр n+1 до кодирования, т.е. максимальное число узлов в кадре n уменьшается с 6 до 4 в данном примере. Как поясняется далее, узлы A4 и A5 "предшествуют" первому узлу в кадре n+1, т.е. B0 только для кодирования разностей усилений и информации наклона. Для кодирования информации разности времен должен применяться другой способ.
Фиг. 6 в схематичном виде иллюстрирует кодирование информации времени согласно изобретению.
Согласно предпочтительному варианту осуществления изобретения, информация TA0...TA5; TB0...TB2; TC0 времени одного или более узлов A0...A5; B0...B2; C0 представлена таким образом, что один или более сдвинутых узлов A4, A5; B1, B2 могут идентифицироваться посредством использования информации TA4, TA5; TB1, TB2 времени.
Согласно предпочтительному варианту осуществления изобретения, информация TA4, TA5; TB1, TB2 времени одного или более сдвинутых узлов A4, A5; B1, B2 представлена посредством суммы разности t_A4, t_A5; t_B1, t_B2 времен от начала кадра DFP; DFR управления динамическим диапазоном, которому принадлежит соответствующий узел A4, A5; B1, B2, до временной позиции соответствующего узла A4, A5; B1, B2 в кадре DFP; DFR управления динамическим диапазоном, которому принадлежит соответствующий узел A4, A5; B1, B2, и значения drcFrameSize смещения, превышающего или равного временному размеру кадра DFR; DFS управления динамическим диапазоном, следующего после соответствующего кадра DFP; DFR управления динамическим диапазоном.
Сначала рассматривается кодирование разностей времен между парами узлов. На фиг. 6, ситуация для определения разностей времен для пар узлов проиллюстрирована для примера согласно фиг. 4, где t_Ai обозначает позицию выборки узла Ai на сетке возможных позиций узла в кадре. Как пояснено выше, узлы могут выбираться на равномерной временной сетке, причем разнесение этой сетки задает наибольшее доступное временное разрешение deltaTmin. Таким образом, информация t_Ai времени приводится в выборках, причем разности времен между двумя узлами всегда являются целыми кратными deltaTmin.
Информация временной позиции узла кодируется дифференциальным способом, т.е. относительно позиции предыдущего узла. Если узел является первым узлом в кадре, разность времен определяется относительно начала кадра. Левая сторона по фиг. 6 иллюстрирует ситуацию, если сдвиг узлов не применяется. В этом случае, информация tDrcDelta_A4 дифференциального времени узла A4 вычисляется в качестве tDrcDelta_A4=t_A4-t_A3. Это значение дифференциального времени затем кодируется с использованием соответствующей записи в надлежащей таблице Хаффмана, например, согласно таблице 1 или 2. В качестве другого примера, рассматривается кодированная разность времен узла B0. Поскольку он представляет собой первый узел кадра n+1, соответствующая разность времен определяется относительно начала кадра, т.е. tDrcDelta_B0=t_B0.
Теперь следует рассматривать кодирование позиции узла для предложенной технологии на основе хранилища узлов с использованием сдвига узлов. Для примера, показанного в правой стороне по фиг. 6, узлы A4 и A5 сдвинуты в следующий кадр для кодирования. Представление узлов A0 в A3 не изменено, и кодированные разности времен, следовательно, также не изменены. То же является истинным для кодированной информации позиции узла B0. Тем не менее, информация времени узла A4 и узла A5 теперь обрабатывается по-другому. Как показано на фиг. 6, исходное значение t_A4, указывающее позицию выборки узла A4, модифицируется в кодере посредством прибавления смещения drcFrameSize. Поскольку результирующая информация позиции превышает максимальное значение, что должно быть возможным в случае регулярного кодирования, смещение указывает декодеру то, что соответствующий узел должен дополнительно обрабатываться в контексте предыдущего кадра. Кроме того, декодер знает то, что исходная позиция t_A4 выборки получается посредством вычитания смещения drcFrameSize из декодированного значения.
Ниже рассматривается вычисление информации разности времен, которая фактически кодируется для ситуации, показанной в правой стороне по фиг. 6. По причинам эффективности кодирования, дифференциальная информация позиции для узла A4 вычисляется относительно узла B0. В отличие от ситуации, ранее поясненной для левой стороны по фиг. 6, информация дифференциального времени теперь вычисляется согласно tDrcDelta_A4=t_A4+drcFrameSize-t_B0, т.е. посредством включения смещения. Аналогично, для узла A5, получается tDrcDelta_A5=t_A5+drcFrameSize-t_A4-drcFrameSize, что, очевидно, является идентичным tDrcDelta_A5=t_A5-t_A4. Эти значения дифференциального времени кодируются с использованием соответствующей записи кодового слова корректной таблицы Хаффмана, например, согласно таблице 1 или 2.
Способ для декодирования информации временной позиции может обобщаться следующим образом. Декодер извлекает информацию разности времен узла на основе соответствующего кодового слова из потока битов. Информация времени получается посредством суммирования информации разности времен с информацией времени предыдущего узла. Если результирующая позиция выборки превышает drcFrameSize, декодер знает то, что настоящий узел должен обрабатываться, как если он представляет собой последний узел в предыдущем кадре, т.е. он должен добавляться к узлам, декодированным в предыдущем кадре. Корректная позиция выборки определяется посредством вычитания значения drcFrameSize смещения из декодированного значения времени. Идентичные этапы обработки применяются аналогичным способом, если большее число сдвинутых узлов возникает в декодированном кадре.
После декодирования и коррекции информации времени всего кадра, декодер знает то, сколько узлов сдвинуто назад в предыдущий кадр (без явного предоставления этой информации в кодере), и то, в какой позиции выборки они расположены в предыдущем кадре. Информация относительно числа сдвинутых узлов дополнительно должна быть использована в контексте декодирования информации усиления и наклона, описанной ниже.
Фиг. 7 в схематичном виде иллюстрирует кодирование информации усиления согласно изобретению.
Согласно предпочтительному варианту осуществления изобретения, информация GB1 усиления битового представления B'1 сдвинутого узла B1, который находится в первой позиции части DFS' потока битов, соответствующей кадру DFS управления динамическим диапазоном, следующему после опорного кадра DFR управления динамическим диапазоном, представлена посредством значения g_B1 абсолютного усиления, при этом информация GB2 усиления каждого битового представления B'2 сдвинутых узлов B2 в позиции после битового представления B'1 узла B1, который находится в первой позиции части DFS' потока битов, соответствующей кадру DFS управления динамическим диапазоном, следующему после опорного кадра DFR управления динамическим диапазоном, представлена посредством значения относительного усиления, которое равно разности значения g_B2 усиления битового представления B'2 соответствующего сдвинутого узла B2 и значения g_B1 усиления битового представления B'1 узла B1, которое предшествует битовому представлению B'2 соответствующего узла B2.
Согласно предпочтительному варианту осуществления изобретения, в случае если битовые представления B'1, B'2 одного или более сдвинутых узлов B1, B2 опорного кадра DFR управления динамическим диапазоном встраиваются в часть DFS' потока битов, соответствующую кадру DFS управления динамическим диапазоном, следующему после опорного кадра DFR управления динамическим диапазоном, информация GC0 усиления битового представления C'0 узла C0 последующего кадра DFS управления динамическим диапазоном в первой позиции части DFS' потока битов, соответствующей кадру DFS управления динамическим диапазоном, следующему после опорного кадра DFR управления динамическим диапазоном после одной или более позиций битовых представлений B'1, B'2 одного или более сдвинутых узлов B1, B2 представлена посредством значения относительного усиления, которое равно разности значения g_C0 усиления битового представления C'0 соответствующего узла C0 и значения g_B2 усиления битового представления B'2 сдвинутого узла B2, которое предшествует битовому представлению C'0 соответствующего узла C0.
На фиг. 7, ситуация для определения разностей усилений для пар узлов проиллюстрирована для примера согласно фиг. 5, где g_Ai обозначает значение усиления узла Ai.
Во-первых, рассматриваются значения дифференциального усиления для узла A4. Для подхода без хранилища узлов, проиллюстрированного в левой стороне по фиг. 7, значение gainDelta_A4 дифференциального усиления вычисляется из разности значения усиления (в дБ) предыдущего узла A3 и узла A4, т.е. gainDelta_A4=g_A4-g_A3. Это значение дифференциального усиления затем кодируется с использованием соответствующей записи в надлежащей таблице Хаффмана. Кроме того, рассматривается первый узел кадра n+1 в левой стороне по фиг. 7. Поскольку B0 является первым узлом этого кадра, его значение усиления кодируется не дифференциальным способом, а согласно конкретному кодированию начальных значений gainInitial усиления, т.е. значение усиления кодируется как его фактическое значение: gainDelta_B0=g_B0.
Для ситуации, показанной в правой стороне, когда узел A4 сдвинут в следующий кадр n+1, значения кодированной информации усиления отличаются. Как можно видеть, после сдвига, узел A4 становится первым узлом в кадре n+1 относительно кодирования разностей усилений. Таким образом, его значение усиления не кодируется дифференциальным способом, а применяется конкретное кодирование начальных значений усиления, как описано выше. Значение дифференциального усиления A5 должно оставаться идентичным для обеих ситуаций, показанных в левой и в правой стороне. Поскольку узел B0 теперь следует после узла A5, если хранилище узлов используется, то его информация усиления должна определяться из разности усилений узла B0 и A5, т.е. gainDelta_B0=g_B0-g_A5. Следует отметить, что изменяется только способ, которым определяются разности усилений при применении технологии на основе хранилища узлов, тогда как восстановленные значения усилений остаются идентичными для каждого узла. Очевидно, что после декодирования всей связанной с усилением информации кадров n и n+1, полученные значения усиления для узлов A0-B0 являются идентичными значениям усиления, полученным в левой стороне, и узлы могут вычисляться "вовремя" для применения DRC-усилений к соответствующему аудиокадру.
Как пояснено в предыдущем параграфе, число сдвинутых узлов и их позиция выборки в предыдущем кадре известны после декодирования информации разности времен. Как проиллюстрировано в правой стороне по фиг. 6, значения усиления сдвинутых узлов из кадра n начинаются сразу от начала принимаемой информации усиления кадра n+1. Следовательно, информация относительно числа сдвинутых узлов является достаточной для декодера, чтобы назначать каждое значение усиления корректной позиции выборки в корректном кадре. Если рассматривать пример, показанный в правой стороне на фиг. 6, декодер знает то, что первые два декодированных значения усиления кадра n+1 должны добавляться к последним значениям усиления предыдущего кадра, тогда как третье значение усиления соответствует корректному значению усиления первого узла в текущем кадре.
Фиг. 8 в схематичном виде иллюстрирует кодирование информации наклона согласно изобретению.
Согласно предпочтительному варианту осуществления изобретения, каждый узел A0...A5; B0...B2; C0 из одного или более узлов содержит информацию SA0...SA5; SB0...SB2; SC0 наклона для A0...A5; B0...B2; C0.
Ниже рассматривается кодирование информации наклона, которое проиллюстрировано на фиг. 8. Информация наклона узлов кодируется не дифференциальным способом между парами узлов, а для каждого узла независимо. Следовательно, связанная с наклоном информация остается неизменной в обоих случаях с/без использования хранилища узлов. Аналогично случаю кодирования значений усиления, таблицы Хаффмана для формирования кодовых слов для получения информации наклона остаются идентичными для обоих случаев, с/без использования предложенного сдвига узлов. Назначение информации наклона корректной позиции выборки в корректном кадре выполняется аналогично случаю декодирования значений усиления.
После того, как вся информация узлов, принимаемая для кадра n+1, декодирована и, если применимо, сдвинута назад в предшествующий кадр n, интерполяция усиления для кадра n с использованием сплайнов либо линейная интерполяция может выполняться стандартным способом, и значения усиления применяются к соответствующему аудиокадру.
Фиг. 9 в схематичном виде иллюстрирует вариант осуществления устройства аудиодекодера согласно изобретению. Устройство 4 аудиодекодера содержит:
- аудиодекодер 5, выполненный с возможностью декодирования кодированного потока ABS битов аудио для того, чтобы воспроизводить аудиосигнал AS, содержащий последовательные аудиокадры AFP, AFR, AFS;
- декодер 6 для управления динамическим диапазоном, выполненный с возможностью декодирования кодированного потока DBS битов управления динамическим диапазоном, чтобы воспроизводить последовательность DS управления динамическим диапазоном, соответствующую аудиосигналу AS и содержащую последовательные кадры DFP, DFR, DFS управления динамическим диапазоном;
- при этом кодированный поток DBS битов управления динамическим диапазоном содержит для каждого кадра DFP, DFR, DFS управления динамическим диапазоном из кадров управления динамическим диапазоном соответствующую часть DFP', DFR', DFS' потока битов;
- при этом кодированный поток DBS битов управления динамическим диапазоном содержит битовые представления A'0...A'5; B'0...B'2; C'0 узлов A0...A5; B0...B2; C0, при этом каждое битовое представление одного узла из узлов содержит информацию GA0...GA5; GB0...GB2; GC0 усиления для аудиосигнала AS и информацию TA0...TA5; TB0...TB2; TC0 времени, указывающую то, какому моменту времени соответствует информация GA0...GA5; GB0...GB2; GC0 усиления;
- при этом кодированный DBS потока битов управления динамическим диапазоном содержит битовые представления B'1, B'2 сдвинутых узлов B1, B2, выбранных из узлов B0...B2 одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном, которые встраиваются в часть потока битов, соответствующую кадру DFS управления динамическим диапазоном, следующему после одного опорного кадра DFR управления динамическим диапазоном, при этом битовое представление B'0 каждого оставшегося узла B0 из узлов B0...B2 одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном встраивается в часть DFR' потока битов, соответствующую одному опорному кадру DFR управления динамическим диапазоном; и
- при этом декодер 6 для управления динамическим диапазоном выполнен с возможностью декодирования битового представления B'0 каждого оставшегося узла B0 из оставшихся узлов B'0 одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном, чтобы воспроизводить каждый оставшийся узел B0 одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном, декодирования битового представления B'1, B'2 каждого сдвинутого узла B1, B2 из сдвинутых узлов B1, B2, выбранных из узлов B0...B2 одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном, чтобы воспроизводить каждый сдвинутый узел B1, B2 из сдвинутых узлов B1, B2, выбранных из узлов одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном, и комбинирования воспроизведенных оставшихся узлов B0 и воспроизведенных сдвинутых узлов B1, B2, чтобы восстанавливать опорный кадр DFR управления динамическим диапазоном.
Согласно предпочтительному варианту осуществления изобретения, декодер 6 для управления динамическим диапазоном выполнен с возможностью идентификации одного или более сдвинутых узлов A4, A5; B1, B2 посредством использования информации TA4, TA5; TB1, TB2 времени.
Согласно предпочтительному варианту осуществления изобретения, декодер 6 для управления динамическим диапазоном выполнен с возможностью декодирования информации TA4, TA5; TB1, TB2 времени одного или более сдвинутых узлов A4, A5; B1, B2, которая представлена посредством суммы разности t_A4, t_A5; t_B1, t_B2 времен от начала кадра DFP; DFR управления динамическим диапазоном, которому принадлежит соответствующий узел A4, A5; B1, B2, до временной позиции соответствующего узла A4, A5; B1, B2 в кадре DFP; DFR управления динамическим диапазоном, которому принадлежит соответствующий узел A4, A5; B1, B2, и значения drcFrameSize смещения, превышающего или равного временному размеру кадра DFR; DFS управления динамическим диапазоном, следующего после соответствующего кадра DFP; DFR управления динамическим диапазоном.
Согласно предпочтительному варианту осуществления изобретения, декодер 6 для управления динамическим диапазоном выполнен с возможностью декодирования информации GB1 усиления битового представления B'1 сдвинутого узла B1, который находится в первой позиции части DFS' потока битов, соответствующей кадру DFS управления динамическим диапазоном, следующему после опорного кадра DFR управления динамическим диапазоном, которая представлена посредством значения g_B1 абсолютного усиления, при этом информация GB2 усиления каждого битового представления B'2 сдвинутых узлов B2 в позиции после битового представления B'1 узла B1, который находится в первой позиции части DFS' потока битов, соответствующей кадру DFS управления динамическим диапазоном, следующему после опорного кадра DFR управления динамическим диапазоном, представлена посредством значения относительного усиления, которое равно разности значения g_B2 усиления битового представления B'2 соответствующего сдвинутого узла B2 и значения g_B1 усиления битового представления B'1 узла B1, которое предшествует битовому представлению B'2 соответствующего узла B2
Согласно предпочтительному варианту осуществления изобретения, декодер 6 для управления динамическим диапазоном выполнен с возможностью декодирования информации GC0 усиления битового представления C'0 узла C0 последующего кадра DFS управления динамическим диапазоном в первой позиции части DFS' потока битов, соответствующей кадру DFS управления динамическим диапазоном, следующему после опорного кадра DFR управления динамическим диапазоном после одной или более позиций битовых представлений B'1, B'2 одного или более сдвинутых узлов B1, B2, которая представлена посредством значения относительного усиления, которое равно разности значения g_C0 усиления битового представления C'0 соответствующего узла C0 и значения g_B2 усиления битового представления B'2 сдвинутого узла B2, которое предшествует битовому представлению C'0 соответствующего узла C0.
Согласно предпочтительному варианту осуществления изобретения, временной размер аудиокадров AFP, AFR, AFS равен временному размеру кадров AFP, AFR, AFS управления динамическим диапазоном.
Согласно предпочтительному варианту осуществления изобретения, один или более узлов A0...A5; B0...B2; C0 одного из кадров DFP, DFR, DFS управления динамическим диапазоном выбираются из равномерной временной сетки.
Согласно предпочтительному варианту осуществления изобретения, каждый узел A0...A5; B0...B2; C0 из одного или более узлов A0...A5; B0...B2; C0 содержит информацию SA0...SA5; SB0...SB2; SC0 наклона.
Согласно предпочтительному варианту осуществления изобретения, декодер 6 для управления динамическим диапазоном выполнен с возможностью декодирования битовых представлений узлов A'0...A'5; B'0...B'2; C'0 с использованием технологии энтропийного декодирования.
В другом аспекте, изобретение предоставляет способ для управления аудиодекодером, способ содержит этапы:
- декодирования кодированного потока ABS битов аудио для того, чтобы воспроизводить аудиосигнал AS, содержащий последовательные аудиокадры AFP, AFR, AFS;
- декодирования кодированного потока DBS битов управления динамическим диапазоном, чтобы воспроизводить последовательность DS управления динамическим диапазоном, соответствующую аудиосигналу AS и содержащую последовательные кадры DFP, DFR, DFS управления динамическим диапазоном;
- при этом кодированный поток DBS битов управления динамическим диапазоном содержит для каждого кадра DFP, DFR, DFS управления динамическим диапазоном из кадров управления динамическим диапазоном соответствующую часть DFP', DFR', DFS' потока битов;
- при этом кодированный поток DBS битов управления динамическим диапазоном содержит битовые представления A'0...A'5; B'0...B'2; C'0 узлов A0...A5; B0...B2; C0, при этом каждое битовое представление одного узла из узлов содержит информацию GA0...GA5; GB0...GB2; GC0 усиления для аудиосигнала AS и информацию TA0...TA5; TB0...TB2; TC0 времени, указывающую то, какому моменту времени соответствует информация GA0...GA5; GB0...GB2; GC0 усиления;
- при этом кодированный DBS потока битов управления динамическим диапазоном содержит битовые представления B'1, B'2 сдвинутых узлов B1, B2, выбранных из узлов B0...B2 одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном, которые встраиваются в часть потока битов, соответствующую кадру DFS управления динамическим диапазоном, следующему после одного опорного кадра DFR управления динамическим диапазоном, при этом битовое представление B'0 каждого оставшегося узла B0 из узлов B0...B2 одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном встраивается в часть DFR' потока битов, соответствующую одному опорному кадру DFR управления динамическим диапазоном; и
- при этом битовое представление B'0 каждого оставшегося узла B0 из оставшихся узлов B'0 одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном декодируется, чтобы воспроизводить каждый оставшийся узел B0 одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном;
- при этом битовое представление B'1, B'2 каждого сдвинутого узла B1, B2 из сдвинутых узлов B1, B2, выбранных из узлов B0...B2 одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном, декодируется, чтобы воспроизводить каждый сдвинутый узел B1, B2 из сдвинутых узлов B1, B2, выбранных из узлов одного опорного кадра DFR управления динамическим диапазоном из кадров DFP, DFR, DFS управления динамическим диапазоном; и
- при этом воспроизведенные оставшиеся узлы B0 и воспроизведенные сдвинутые узлы B1, B2 комбинируются, чтобы восстанавливать опорный кадр DFR управления динамическим диапазоном.
Относительно декодера, кодера и способов описанных вариантов осуществления, необходимо упомянуть следующее.
Хотя некоторые аспекты описаны в контексте устройства, очевидно, что эти аспекты также представляют описание соответствующего способа, при этом блок или устройство соответствует этапу способа либо признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента, или признака соответствующего устройства.
В зависимости от определенных требований к реализации, варианты осуществления изобретения могут быть реализованы в аппаратных средствах или в программном обеспечении. Реализация может выполняться с использованием цифрового носителя хранения данных, например, гибкого диска, DVD, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, имеющего сохраненные электронночитаемые управляющие сигналы, которые взаимодействуют (или допускают взаимодействие) с программируемой компьютерной системой таким образом, что осуществляется соответствующий способ.
Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий электронночитаемые управляющие сигналы, которые допускают взаимодействие с программируемой компьютерной системой таким образом, что осуществляется один из способов, описанных в данном документе.
В общем, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, при этом программный код выполнен с возможностью осуществления одного из способов, когда компьютерный программный продукт работает на компьютере. Программный код, например, может быть сохранен на машиночитаемом носителе.
Другие варианты осуществления содержат компьютерную программу для осуществления одного из способов, описанных в данном документе, которая сохраняется на машиночитаемом носителе или на энергонезависимом носителе хранения данных.
Другими словами, следовательно, вариант осуществления изобретаемого способа представляет собой компьютерную программу, имеющую программный код для осуществления одного из способов, описанных в данном документе, когда компьютерная программа работает на компьютере.
Следовательно, дополнительный вариант осуществления изобретаемых способов представляет собой носитель хранения данных (цифровой носитель хранения данных или компьютерно-читаемый носитель), содержащий записанную компьютерную программу для осуществления одного из способов, описанных в данном документе.
Следовательно, дополнительный вариант осуществления изобретаемого способа представляет собой поток данных или последовательность сигналов, представляющих компьютерную программу для осуществления одного из способов, описанных в данном документе. Поток данных или последовательность сигналов может быть выполнена с возможностью передачи через соединение для передачи данных, например, через Интернет.
Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное или адаптированное с возможностью осуществлять один из способов, описанных в данном документе.
Дополнительный вариант осуществления содержит компьютер, имеющий установленную компьютерную программу для осуществления одного из способов, описанных в данном документе.
В некоторых вариантах осуществления, программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано для того, чтобы выполнять часть или все из функциональностей способов, описанных в данном документе. В некоторых вариантах осуществления, программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы осуществлять один из способов, описанных в данном документе. В общем, способы предпочтительно осуществляются посредством любого устройства.
Хотя это изобретение описано с точки зрения нескольких вариантов осуществления, возникают изменения, перестановки и эквиваленты, которые попадают в пределы объема этого изобретения. Также следует отметить, что предусмотрено множество альтернативных способов реализации способов и структур настоящего изобретения. Следовательно, нижеприведенная прилагаемая формула изобретения должна интерпретироваться как включающая в себя все такие изменения, перестановки и эквиваленты, которые попадают в пределы истинной сущности и объема настоящего изобретения.
СПИСОК УСЛОВНЫХ ОБОЗНАЧЕНИЙ
1 – устройство аудиокодера
2 – аудиокодер
3 – кодер для управления динамическим диапазоном
4 – устройство аудиодекодера
5 – аудиодекодер
6 – декодер для управления динамическим диапазоном
ABS – кодированный поток битов аудио
AS – аудиосигнал
AFP – предыдущий аудиокадр
AFR – опорный аудиокадр
AFS – последующий аудиокадр
DBS – кодированный поток битов управления динамическим диапазоном
DS – последовательность управления динамическим диапазоном
DFP – предыдущий кадр управления динамическим диапазоном
DFR – опорный кадр управления динамическим диапазоном
DFS – последующий кадр управления динамическим диапазоном
A0...A5 – узлы предыдущего кадра управления динамическим диапазоном
B0...B2 – узлы опорного кадра управления динамическим диапазоном
C0 – узел последующего кадра управления динамическим диапазоном
DFP' – часть потока битов, соответствующая предыдущему кадру управления динамическим диапазоном
DFR' – часть потока битов, соответствующая опорному кадру управления динамическим диапазоном
DFS' – часть потока битов, соответствующая последующему кадру управления динамическим диапазоном
TA0...TA5 – информация времени узлов предыдущего кадра управления динамическим диапазоном
TB0...TB2 – информация времени узлов опорного кадра управления динамическим диапазоном
TC0 – информация времени узла последующего кадра управления динамическим диапазоном
t_A0...t_A5 – разность времен узлов предыдущего кадра управления динамическим диапазоном
t_B0...t_B2 – разность времен узлов опорного кадра управления динамическим диапазоном
t_C0 – разность времен узла последующего кадра управления динамическим диапазоном
GA0...GA5 – информация усиления узлов предыдущего кадра управления динамическим диапазоном
GB0...GB2 – информация усиления узлов опорного кадра управления динамическим диапазоном
GC0 – информация усиления узла последующего кадра управления динамическим диапазоном
g_A0...g_A5 – значение усиления узлов предыдущего кадра управления динамическим диапазоном
g_B0...g_B2 – значение усиления узлов опорного кадра управления динамическим диапазоном
g_C0 – значение усиления узла последующего кадра управления динамическим диапазоном
SA0...SA5 – информация наклона узлов предыдущего кадра управления динамическим диапазоном
SB0...SB2 – информация наклона узлов опорного кадра управления динамическим диапазоном
SC0 – информация наклона узла последующего кадра управления динамическим диапазоном
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
[1] D. Giannoulis, M. Massberg, J. D. Reiss, "Digital Dynamic Range Compressor Design – A Tutorial and Analysis" J. Audio Engineering Society, том 60, номер 6, июнь 2012 года

Claims (48)

1. Устройство аудиокодера, содержащее:
- аудиокодер (2), выполненный с возможностью формирования кодированного потока (ABS) битов аудио из аудиосигнала (AS), содержащего последовательные аудиокадры (AFP, AFR, AFS);
- кодер (3) для управления динамическим диапазоном, выполненный с возможностью формирования кодированного потока (DBS) битов управления динамическим диапазоном из последовательности (DS) управления динамическим диапазоном, соответствующей аудиосигналу (AS) и содержащей последовательные кадры (DFP, DFR, DFS) управления динамическим диапазоном, при этом каждый кадр (DFP, DFR, DFS) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном содержит один или более узлов (A0...A5; B0...B2; C0), при этом каждый узел из одного или более узлов (A0...A5; B0...B2; C0) содержит информацию (GA0...GA5; GB0...GB2; GC0) усиления для аудиосигнала (AS) и информацию (TA0...TA5; TB0...TB2; TC0) времени, указывающую то, какому моменту времени соответствует информация (GA0...GA5; GB0...GB2; GC0) усиления;
- при этом кодер (3) для управления динамическим диапазоном сконфигурирован таким образом, что кодированный поток (DBS) битов управления динамическим диапазоном содержит для каждого кадра (DFP, DFR, DFS) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном соответствующую часть (DFP', DFR', DFS') потока битов;
- при этом кодер (2) для управления динамическим диапазоном выполнен с возможностью выполнения процедуры сдвига, при этом один или более узлов (B1, B2) из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном выбираются в качестве сдвинутых узлов (B1, B2), при этом битовое представление (B'1, B'2) каждого из одного или более сдвинутых узлов (B1, B2) одного опорного кадра (DFR) управления динамическим диапазоном встраивается в часть (DFS') потока битов, соответствующую кадру (DFS) управления динамическим диапазоном, следующему после одного опорного кадра (DFR) управления динамическим диапазоном, при этом битовое представление (B'0) каждого оставшегося узла (B0) из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном встраивается в часть (DFR') потока битов, соответствующую одному опорному кадру (DFR) управления динамическим диапазоном.
2. Устройство аудиокодера по п. 1, в котором процедура сдвига инициируется в случае, если число узлов опорного кадра управления динамическим диапазоном превышает предварительно заданное пороговое значение.
3. Устройство аудиокодера по п. 1, в котором процедура сдвига инициируется в случае, если сумма числа узлов опорного кадра управления динамическим диапазоном и числа сдвинутых узлов из кадра управления динамическим диапазоном, предшествующего опорному кадру управления динамическим диапазоном, которые должны встраиваться в часть потока битов, соответствующую опорному кадру управления динамическим диапазоном, превышает предварительно заданное пороговое значение.
4. Устройство аудиокодера по п. 1, в котором процедура сдвига инициируется в случае, если сумма числа узлов (B0...B2) опорного кадра (DFR) управления динамическим диапазоном и числа сдвинутых узлов (A4, A5) из кадра (DFP) управления динамическим диапазоном, предшествующего опорному кадру (DFR) управления динамическим диапазоном, которые должны встраиваться в часть (DFR') потока битов, соответствующую опорному кадру (DFR) управления динамическим диапазоном, превышает число узлов (C0) кадра (DFS) управления динамическим диапазоном, следующего после опорного кадра (DFR) управления динамическим диапазоном.
5. Устройство аудиокодера по п. 1, в котором информация (TA0...TA5; TB0...TB2; TC0) времени одного или более узлов (A0...A5; B0...B2; C0) представлена таким образом, что один или более сдвинутых узлов (A4, A5; B1, B2) могут идентифицироваться посредством использования информации (TA4, TA5; TB1, TB2) времени.
6. Устройство аудиокодера по предшествующему пункту, в котором информация (TA4, TA5; TB1, TB2) времени одного или более сдвинутых узлов (A4, A5; B1, B2) представлена посредством суммы разности (t_A4, t_A5; t_B1, t_B2) времен от начала кадра (DFP; DFR) управления динамическим диапазоном, которому принадлежит соответствующий узел (A4, A5; B1, B2), до временной позиции соответствующего узла (A4, A5; B1, B2) в кадре (DFP; DFR) управления динамическим диапазоном, которому принадлежит соответствующий узел (A4, A5; B1, B2), и значения (drcFrameSize) смещения, превышающего или равного временному размеру кадра (DFR; DFS) управления динамическим диапазоном, следующего после соответствующего кадра (DFP; DFR) управления динамическим диапазоном.
7. Устройство аудиокодера по п. 1, в котором информация (GB1) усиления битового представления (B'1) сдвинутого узла (B1), который находится в первой позиции части (DFS') потока битов, соответствующей кадру (DFS) управления динамическим диапазоном, следующему после опорного кадра (DFR) управления динамическим диапазоном, представлена посредством значения (g_B1) абсолютного усиления, при этом информация (GB2) усиления каждого битового представления (B'2) сдвинутых узлов (B2) в позиции после битового представления (B'1) узла (B1), который находится в первой позиции части (DFS') потока битов, соответствующей кадру (DFS) управления динамическим диапазоном, следующему после опорного кадра (DFR) управления динамическим диапазоном, представлена посредством значения относительного усиления, которое равно разности значения (g_B2) усиления битового представления (B'2) соответствующего сдвинутого узла (B2) и значения (g_B1) усиления битового представления (B'1) узла (B1), которое предшествует битовому представлению (B'2) соответствующего узла (B2).
8. Устройство аудиокодера по п. 1, в котором, в случае если битовые представления (B'1, B'2) одного или более сдвинутых узлов (B1, B2) опорного кадра (DFR) управления динамическим диапазоном встраиваются в часть (DFS') потока битов, соответствующую кадру (DFS) управления динамическим диапазоном, следующему после опорного кадра (DFR) управления динамическим диапазоном, информация (GC0) усиления битового представления (C'0) узла (C0) последующего кадра (DFS) управления динамическим диапазоном в первой позиции части (DFS') потока битов, соответствующей кадру (DFS) управления динамическим диапазоном, следующему после опорного кадра (DFR) управления динамическим диапазоном после одной или более позиций битовых представлений (B'1, B'2) одного или более сдвинутых узлов (B1, B2), представлена посредством значения относительного усиления, которое равно разности значения (g_C0) усиления битового представления (C'0) соответствующего узла (C0) и значения (g_B2) усиления битового представления (B'2) сдвинутого узла (B2), которое предшествует битовому представлению (C'0) соответствующего узла (C0).
9. Устройство аудиокодера по п. 1, в котором временной размер аудиокадров (AFP, AFR, AFS) равен временному размеру кадров (DFP, DFR, DFS) управления динамическим диапазоном.
10. Устройство аудиокодера по п. 1, в котором один или более узлов (A0...A5; B0...B2; C0) одного из кадра (DFP, DFR, DFS) управления динамическим диапазоном выбираются из равномерной временной сетки.
11. Устройство аудиокодера по п. 1, в котором каждый узел (A0...A5; B0...B2; C0) из одного или более узлов содержит информацию (SA0...SA5; SB0...SB2; SC0) наклона для (A0...A5; B0...B2; C0).
12. Устройство аудиокодера по п. 1, в котором кодер (3) для управления динамическим диапазоном выполнен с возможностью кодирования узлов (A0...A5; B0...B2; C0) с использованием технологии энтропийного кодирования.
13. Устройство аудиодекодера, содержащее:
- аудиодекодер (5), выполненный с возможностью декодирования кодированного потока (ABS) битов аудио для того, чтобы воспроизводить аудиосигнал (AS), содержащий последовательные аудиокадры (AFP, AFR, AFS);
- декодер (6) для управления динамическим диапазоном, выполненный с возможностью декодирования кодированного потока (DBS) битов управления динамическим диапазоном, чтобы воспроизводить последовательность (DS) управления динамическим диапазоном, соответствующую аудиосигналу (AS) и содержащую последовательные кадры (DFP, DFR, DFS) управления динамическим диапазоном;
- при этом кодированный поток (DBS) битов управления динамическим диапазоном содержит для каждого кадра (DFP, DFR, DFS) управления динамическим диапазоном из кадров управления динамическим диапазоном соответствующую часть (DFP', DFR', DFS') потока битов;
- при этом кодированный поток (DBS) битов управления динамическим диапазоном содержит битовые представления (A'0...A'5; B'0...B'2; C'0) узлов (A0...A5; B0...B2; C0), при этом каждое битовое представление одного узла из узлов содержит информацию (GA0...GA5; GB0...GB2; GC0) усиления для аудиосигнала (AS) и информацию (TA0...TA5; TB0...TB2; TC0) времени, указывающую то, какому моменту времени соответствует информация (GA0...GA5; GB0...GB2; GC0) усиления;
- при этом кодированный поток (DBS) битов управления динамическим диапазоном содержит битовые представления (B'1, B'2) сдвинутых узлов (B1, B2), выбранных из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном, которые встраиваются в часть потока битов, соответствующую кадру (DFS) управления динамическим диапазоном, следующему после одного опорного кадра (DFR) управления динамическим диапазоном, при этом битовое представление (B'0) каждого оставшегося узла (B0) из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном встраивается в часть (DFR') потока битов, соответствующую одному опорному кадру (DFR) управления динамическим диапазоном; и
- при этом декодер (6) для управления динамическим диапазоном выполнен с возможностью декодирования битового представления (B'0) каждого оставшегося узла (B0) из оставшихся узлов (B'0) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном, чтобы воспроизводить каждый оставшийся узел (B0) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном, декодирования битового представления (B'1, B'2) каждого сдвинутого узла (B1, B2) из сдвинутых узлов (B1, B2), выбранных из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном, чтобы воспроизводить каждый сдвинутый узел (B1, B2) из сдвинутых узлов (B1, B2), выбранных из узлов одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном, и комбинирования воспроизведенных оставшихся узлов (B0) и воспроизведенных сдвинутых узлов (B1, B2), чтобы восстанавливать опорный кадр (DFR) управления динамическим диапазоном.
14. Устройство аудиодекодера по п. 13, в котором декодер (6) для управления динамическим диапазоном выполнен с возможностью идентификации одного или более сдвинутых узлов (A4, A5; B1, B2) посредством использования информации (TA4, TA5; TB1, TB2) времени.
15. Устройство аудиодекодера по п. 13, в котором декодер (6) для управления динамическим диапазоном выполнен с возможностью декодирования информации (TA4, TA5; TB1, TB2) времени одного или более сдвинутых узлов (A4, A5; B1, B2), которая представлена посредством суммы разности (t_A4, t_A5; t_B1, t_B2) времен от начала кадра (DFP; DFR) управления динамическим диапазоном, которому принадлежит соответствующий узел (A4, A5; B1, B2), до временной позиции соответствующего узла (A4, A5; B1, B2) в кадре (DFP; DFR) управления динамическим диапазоном, которому принадлежит соответствующий узел (A4, A5; B1, B2), и значения (drcFrameSize) смещения, превышающего или равного временному размеру кадра (DFR; DFS) управления динамическим диапазоном, следующего после соответствующего кадра (DFP; DFR) управления динамическим диапазоном.
16. Устройство аудиодекодера по п. 13, в котором декодер (6) для управления динамическим диапазоном выполнен с возможностью декодирования информации (GB1) усиления битового представления (B'1) сдвинутого узла (B1), который находится в первой позиции части (DFS') потока битов, соответствующей кадру (DFS) управления динамическим диапазоном, следующему после опорного кадра (DFR) управления динамическим диапазоном, представленной посредством значения (g_B1) абсолютного усиления, при этом информация (GB2) усиления каждого битового представления (B'2) сдвинутых узлов (B2) в позиции после битового представления (B'1) узла (B1), который находится в первой позиции части (DFS') потока битов, соответствующей кадру (DFS) управления динамическим диапазоном, следующему после опорного кадра (DFR) управления динамическим диапазоном, представлена посредством значения относительного усиления, которое равно разности значения (g_B2) усиления битового представления B'2 соответствующего сдвинутого узла B2 и значения (g_B1) усиления битового представления (B'1) узла (B1), которое предшествует битовому представлению (B'2) соответствующего узла (B2)
17. Устройство аудиодекодера по п. 13, в котором декодер (6) для управления динамическим диапазоном выполнен с возможностью декодирования информации (GC0) усиления битового представления (C'0) узла (C0) последующего кадра (DFS) управления динамическим диапазоном в первой позиции части (DFS') потока битов, соответствующей кадру (DFS) управления динамическим диапазоном, следующему после опорного кадра (DFR) управления динамическим диапазоном после одной или более позиций битовых представлений (B'1, B'2) одного или более сдвинутых узлов (B1, B2), которая представлена посредством значения относительного усиления, которое равно разности значения (g_C0) усиления битового представления (C'0) соответствующего узла (C0) и значения (g_B2) усиления битового представления (B'2) сдвинутого узла (B2), которое предшествует битовому представлению (C'0) соответствующего узла (C0).
18. Устройство аудиодекодера по п. 13, в котором временной размер аудиокадров (AFP, AFR, AFS) равен временному размеру кадров (AFP, AFR, AFS) управления динамическим диапазоном.
19. Устройство аудиодекодера по п. 13, в котором один или более узлов (A0...A5; B0...B2; C0) одного из кадров (DFP, DFR, DFS) управления динамическим диапазоном выбираются из равномерной временной сетки.
20. Устройство аудиодекодера по п. 13, в котором каждый узел (A0...A5; B0...B2; C0) из одного или более узлов (A0...A5; B0...B2; C0) содержит информацию (SA0...SA5; SB0...SB2; SC0) наклона.
21. Устройство аудиодекодера по п. 13, в котором декодер (6) для управления динамическим диапазоном выполнен с возможностью декодирования битовых представлений узлов (A'0...A'5; B'0...B'2; C'0) с использованием технологии энтропийного декодирования.
22. Система кодирования и декодирования аудио, содержащая устройство (1) аудиокодера по одному из пп. 1-12 и устройство (4) аудиодекодера по одному из пп. 13-21.
23. Способ для управления аудиокодером, при этом способ содержит этапы, на которых:
- формируют кодированный поток (ABS) битов аудио из аудиосигнала (AS), содержащего последовательные аудиокадры (AFP, AFR, AFS);
- формируют кодированный поток (DBS) битов управления динамическим диапазоном из последовательности (DS) управления динамическим диапазоном, соответствующей аудиосигналу (AS) и содержащей последовательные кадры (DFP, DFR, DFS) управления динамическим диапазоном, при этом каждый кадр (DFP, DFR, DFS) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном содержит один или более узлов (A0...A5; B0...B2; C0), при этом каждый узел из одного или более узлов (A0...A5; B0...B2; C0) содержит информацию (GA0...GA5; GB0...GB2; GC0) усиления для аудиосигнала (AS) и информацию (TA0...TA5; TB0...TB2; TC0) времени, указывающую то, какому моменту времени соответствует информация усиления;
- при этом кодированный поток (DBS) битов управления динамическим диапазоном содержит для каждого кадра (DFP, DFR, DFS) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном соответствующую часть (DFP', DFR', DFS') потока битов;
- выполняют процедуру сдвига, при этом один или более узлов (B1, B2) из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном выбираются в качестве сдвинутых узлов (B1, B2), при этом битовое представление (B'1, B'2) каждого из одного или более сдвинутых узлов (B1, B2) одного опорного кадра (DFR) управления динамическим диапазоном встраивается в часть (DFS') потока битов, соответствующую кадру (DFS) управления динамическим диапазоном, следующему после одного опорного кадра (DFR) управления динамическим диапазоном, при этом битовое представление (B'0) каждого оставшегося узла (B0) из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном встраивается в часть (DFR') потока битов, соответствующую одному опорному кадру (DFR) управления динамическим диапазоном.
24. Способ для управления аудиодекодером, при этом способ содержит этапы, на которых:
- декодируют кодированный поток (ABS) битов аудио для того, чтобы воспроизводить аудиосигнал (AS), содержащий последовательные аудиокадры (AFP, AFR, AFS);
- декодируют кодированный поток (DBS) битов управления динамическим диапазоном, чтобы воспроизводить последовательность (DS) управления динамическим диапазоном, соответствующую аудиосигналу (AS) и содержащую последовательные кадры (DFP, DFR, DFS) управления динамическим диапазоном;
- при этом кодированный поток (DBS) битов управления динамическим диапазоном содержит для каждого кадра (DFP, DFR, DFS) управления динамическим диапазоном из кадров управления динамическим диапазоном соответствующую часть (DFP', DFR', DFS') потока битов;
- при этом кодированный поток (DBS) битов управления динамическим диапазоном содержит битовые представления (A'0...A'5; B'0...B'2; C'0) узлов (A0...A5; B0...B2; C0), при этом каждое битовое представление одного узла из узлов содержит информацию (GA0...GA5; GB0...GB2; GC0) усиления для аудиосигнала (AS) и информацию (TA0...TA5; TB0...TB2; TC0) времени, указывающую то, какому моменту времени соответствует информация (GA0...GA5; GB0...GB2; GC0) усиления;
- при этом кодированный поток (DBS) битов управления динамическим диапазоном содержит битовые представления (B'1, B'2) сдвинутых узлов (B1, B2), выбранных из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном, которые встраиваются в часть потока битов, соответствующую кадру (DFS) управления динамическим диапазоном, следующему после одного опорного кадра (DFR) управления динамическим диапазоном, при этом битовое представление (B'0) каждого оставшегося узла (B0) из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном встраивается в часть (DFR') потока битов, соответствующую одному опорному кадру (DFR) управления динамическим диапазоном; и
- при этом битовое представление (B'0) каждого оставшегося узла (B0) из оставшихся узлов (B'0) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном декодируется, чтобы воспроизводить каждый оставшийся узел (B0) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном;
- при этом битовое представление (B'1, B'2) каждого сдвинутого узла (B1, B2) из сдвинутых узлов (B1, B2), выбранных из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном, декодируется, чтобы воспроизводить каждый сдвинутый узел (B1, B2) из сдвинутых узлов (B1, B2), выбранных из узлов одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном; и
- при этом воспроизведенные оставшиеся узлы (B0) и воспроизведенные сдвинутые узлы (B1, B2) комбинируются, чтобы восстанавливать опорный кадр (DFR) управления динамическим диапазоном.
25. Цифровое запоминающее устройство, содержащее компьютерную программу для осуществления способа по п. 23 при выполнении на процессоре.
26. Цифровое запоминающее устройство, содержащее компьютерную программу для осуществления способа по п. 24 при выполнении на процессоре.
RU2016141556A 2014-03-25 2015-03-20 Устройство аудиокодера и устройство аудиодекодера, имеющие эффективное кодирование усиления при управлении динамическим диапазоном RU2678487C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14161605 2014-03-25
EP14161605.2 2014-03-25
PCT/EP2015/055945 WO2015144587A1 (en) 2014-03-25 2015-03-20 Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control

Publications (3)

Publication Number Publication Date
RU2016141556A RU2016141556A (ru) 2018-04-25
RU2016141556A3 RU2016141556A3 (ru) 2018-04-25
RU2678487C2 true RU2678487C2 (ru) 2019-01-29

Family

ID=52727126

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016141556A RU2678487C2 (ru) 2014-03-25 2015-03-20 Устройство аудиокодера и устройство аудиодекодера, имеющие эффективное кодирование усиления при управлении динамическим диапазоном

Country Status (20)

Country Link
US (3) US10074377B2 (ru)
EP (1) EP3123469B1 (ru)
JP (1) JP6259930B2 (ru)
KR (1) KR101890216B1 (ru)
CN (2) CN111326165B (ru)
AR (1) AR099836A1 (ru)
AU (1) AU2015238519B2 (ru)
BR (1) BR112016021382B1 (ru)
CA (1) CA2942743C (ru)
ES (1) ES2678068T3 (ru)
MX (1) MX355089B (ru)
MY (1) MY186155A (ru)
PL (1) PL3123469T3 (ru)
PT (1) PT3123469T (ru)
RU (1) RU2678487C2 (ru)
SG (1) SG11201607940WA (ru)
TR (1) TR201809427T4 (ru)
TW (1) TWI585751B (ru)
WO (1) WO2015144587A1 (ru)
ZA (1) ZA201607193B (ru)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2262108B1 (en) 2004-10-26 2017-03-01 Dolby Laboratories Licensing Corporation Adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI447709B (zh) 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
EP2850612B1 (en) 2012-05-18 2019-04-10 Dolby Laboratories Licensing Corporation System for maintaining reversible dynamic range control information associated with parametric audio coders
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
RU2665873C1 (ru) 2013-01-21 2018-09-04 Долби Лэборетериз Лайсенсинг Корпорейшн Оптимизация громкости и динамического диапазона через различные устройства воспроизведения
BR122020020608B1 (pt) 2013-01-21 2022-05-10 Dolby Laboratories Licensing Corporation Unidade de processamento de áudio
EP2959479B1 (en) 2013-02-21 2019-07-03 Dolby International AB Methods for parametric multi-channel encoding
CN107093991B (zh) 2013-03-26 2020-10-09 杜比实验室特许公司 基于目标响度的响度归一化方法和设备
US9635417B2 (en) 2013-04-05 2017-04-25 Dolby Laboratories Licensing Corporation Acquisition, recovery, and matching of unique information from file-based media for automated file detection
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
WO2015038522A1 (en) 2013-09-12 2015-03-19 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
JP6476192B2 (ja) 2013-09-12 2019-02-27 ドルビー ラボラトリーズ ライセンシング コーポレイション 多様な再生環境のためのダイナミックレンジ制御
AU2014371411A1 (en) * 2013-12-27 2016-06-23 Sony Corporation Decoding device, method, and program
CA2942743C (en) 2014-03-25 2018-11-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
CN110808723A (zh) 2014-05-26 2020-02-18 杜比实验室特许公司 音频信号响度控制
CN112164406B (zh) 2014-10-10 2024-06-25 杜比实验室特许公司 基于发送无关的表示的节目响度

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2144222C1 (ru) * 1998-12-30 2000-01-10 Гусихин Артур Владимирович Способ сжатия звуковой информации и система для его реализации
US6785655B1 (en) * 2000-05-15 2004-08-31 Lsi Logic Corporation Method for independent dynamic range control
US20100083344A1 (en) * 2008-09-30 2010-04-01 Dolby Laboratories Licensing Corporation Transcoding of audio metadata
US20110208528A1 (en) * 2008-10-29 2011-08-25 Dolby International Ab Signal clipping protection using pre-existing audio gain metadata
US20120310654A1 (en) * 2010-02-11 2012-12-06 Dolby Laboratories Licensing Corporation System and Method for Non-destructively Normalizing Loudness of Audio Signals Within Portable Devices
EP1588498B1 (en) * 2003-01-09 2013-06-12 RealNetworks, Inc. Preprocessing for variable rate audio encoding
WO2013173080A1 (en) * 2012-05-18 2013-11-21 Dolby Laboratories Licensing Corporation System for maintaining reversible dynamic range control information associated with parametric audio coders
WO2013181115A1 (en) * 2012-05-31 2013-12-05 Dts, Inc. Audio depth dynamic range enhancement

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP4575609B2 (ja) * 2001-03-13 2010-11-04 旭化成エレクトロニクス株式会社 データ変換装置
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
CN1993700B (zh) * 2004-07-02 2012-03-14 尼尔逊媒介研究股份有限公司 用于进行压缩数字位流的混合的方法及装置
CN101055719B (zh) * 2004-09-17 2011-02-02 广州广晟数码技术有限公司 编码和发送多声道数字音频信号的方法
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US8521314B2 (en) * 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
CN101587711B (zh) * 2008-05-23 2012-07-04 华为技术有限公司 基音后处理方法、滤波器以及基音后处理***
KR101336891B1 (ko) * 2008-12-19 2013-12-04 한국전자통신연구원 G.711 코덱의 음질 향상을 위한 부호화 장치 및 복호화 장치
US8861879B2 (en) * 2009-09-17 2014-10-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding image based on skip mode
US9443534B2 (en) * 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
CN103003877B (zh) * 2010-08-23 2014-12-31 松下电器产业株式会社 声音信号处理装置及声音信号处理方法
CN103827965B (zh) * 2011-07-29 2016-05-25 Dts有限责任公司 自适应语音可理解性处理器
US20140369527A1 (en) * 2011-09-22 2014-12-18 Earsoft Limited Dynamic range control
EP2898506B1 (en) * 2012-09-21 2018-01-17 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
US9607624B2 (en) * 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
CA2942743C (en) 2014-03-25 2018-11-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2144222C1 (ru) * 1998-12-30 2000-01-10 Гусихин Артур Владимирович Способ сжатия звуковой информации и система для его реализации
US6785655B1 (en) * 2000-05-15 2004-08-31 Lsi Logic Corporation Method for independent dynamic range control
EP1588498B1 (en) * 2003-01-09 2013-06-12 RealNetworks, Inc. Preprocessing for variable rate audio encoding
US20100083344A1 (en) * 2008-09-30 2010-04-01 Dolby Laboratories Licensing Corporation Transcoding of audio metadata
US20110208528A1 (en) * 2008-10-29 2011-08-25 Dolby International Ab Signal clipping protection using pre-existing audio gain metadata
US20120310654A1 (en) * 2010-02-11 2012-12-06 Dolby Laboratories Licensing Corporation System and Method for Non-destructively Normalizing Loudness of Audio Signals Within Portable Devices
WO2013173080A1 (en) * 2012-05-18 2013-11-21 Dolby Laboratories Licensing Corporation System for maintaining reversible dynamic range control information associated with parametric audio coders
WO2013181115A1 (en) * 2012-05-31 2013-12-05 Dts, Inc. Audio depth dynamic range enhancement

Also Published As

Publication number Publication date
TWI585751B (zh) 2017-06-01
MY186155A (en) 2021-06-28
USRE49107E1 (en) 2022-06-14
AU2015238519A1 (en) 2016-11-10
CN106165014A (zh) 2016-11-23
KR20160136390A (ko) 2016-11-29
BR112016021382B1 (pt) 2021-02-09
RU2016141556A (ru) 2018-04-25
US20170011749A1 (en) 2017-01-12
WO2015144587A1 (en) 2015-10-01
US10074377B2 (en) 2018-09-11
PT3123469T (pt) 2018-07-06
CN111326165A (zh) 2020-06-23
CA2942743A1 (en) 2015-10-01
ZA201607193B (en) 2018-08-30
KR101890216B1 (ko) 2018-08-22
JP6259930B2 (ja) 2018-01-10
US20220277756A1 (en) 2022-09-01
TW201543470A (zh) 2015-11-16
MX2016012421A (es) 2016-12-16
SG11201607940WA (en) 2016-10-28
EP3123469B1 (en) 2018-04-18
JP2017517020A (ja) 2017-06-22
EP3123469A1 (en) 2017-02-01
RU2016141556A3 (ru) 2018-04-25
TR201809427T4 (tr) 2018-07-23
AU2015238519B2 (en) 2017-11-23
CN106165014B (zh) 2020-01-24
PL3123469T3 (pl) 2018-09-28
CA2942743C (en) 2018-11-13
AR099836A1 (es) 2016-08-24
CN111326165B (zh) 2023-12-12
MX355089B (es) 2018-04-04
ES2678068T3 (es) 2018-08-08

Similar Documents

Publication Publication Date Title
RU2678487C2 (ru) Устройство аудиокодера и устройство аудиодекодера, имеющие эффективное кодирование усиления при управлении динамическим диапазоном
JP6753499B2 (ja) 復号化装置および方法、並びにプログラム
RU2586874C1 (ru) Устройство, способ и компьютерная программа для устранения артефактов амплитудного ограничения
KR101942913B1 (ko) 메타데이터 구동된 동적 범위 제어
JP2018151639A (ja) オーディオ装置のための組合せダイナミックレンジ圧縮および誘導クリッピング防止のための概念
WO2015041070A1 (ja) 符号化装置および方法、復号化装置および方法、並びにプログラム
JP2016509260A (ja) パラメトリック・マルチチャネル・エンコードのための方法