RU2526745C2 - Низведение параметров последовательности битов sbr - Google Patents

Низведение параметров последовательности битов sbr Download PDF

Info

Publication number
RU2526745C2
RU2526745C2 RU2012124827/08A RU2012124827A RU2526745C2 RU 2526745 C2 RU2526745 C2 RU 2526745C2 RU 2012124827/08 A RU2012124827/08 A RU 2012124827/08A RU 2012124827 A RU2012124827 A RU 2012124827A RU 2526745 C2 RU2526745 C2 RU 2526745C2
Authority
RU
Russia
Prior art keywords
final
sbr
source
frequency
channels
Prior art date
Application number
RU2012124827/08A
Other languages
English (en)
Other versions
RU2012124827A (ru
Inventor
Кристофер ЧОЭРЛИНГ
Робин Тезинг
Original Assignee
Долби Интернешнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Интернешнл Аб filed Critical Долби Интернешнл Аб
Publication of RU2012124827A publication Critical patent/RU2012124827A/ru
Application granted granted Critical
Publication of RU2526745C2 publication Critical patent/RU2526745C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Optical Filters (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

Изобретение относится к средствам декодирования и/или транскодирования звука. Технический результат заключается в уменьшении сложности процесса уменьшения числа каналов при сохранении релевантной высокочастотной информации о каналах. Объединяют первый и второй исходные наборы параметров воспроизведения полосы спектра (SBR) в конечный набор параметров SBR. Первый и второй исходные наборы включают первое и второе разбиения полосы частот соответственно, которые отличны друг от друга. Первый исходный набор включает первый набор энергозависимых значений, связанных с полосами частот первого разбиения полосы частот. Второй исходный набор включает второй набор энергозависимых значений, связанных с полосами частот второго разбиения полосы частот. Конечный набор включает конечный набор энергозависимых значений, связанных с элементарной полосой частот. Способ включает этапы разделения первого и второго разбиений полосы частот в объединенную координатную сетку, включающую элементарную полосу частот; назначение первого значения первого набора энергозависимых значений в элементарную полосу частот; назначение второго значения второго набора энергозависимых значений в элементарную полосу частот; и объединение первого и второго значений для получения конечного энергозависимого значения элементарной полосы частот. 9 н. и 23 з.п. ф-лы, 9 ил.

Description

ОБЛАСТЬ ТЕХНИКИ
Настоящий документ относится к декодированию и/или транскодированию звука. В частности, настоящий документ относится к схеме для эффективного декодирования числа М звуковых каналов из последовательности битов, содержащей большее число N звуковых каналов.
УРОВЕНЬ ТЕХНИКИ
Декодер звука, соответствующий стандарту высокоэффективного перспективного звукового кодирования (High-Efficiency Advanced Audio Coding, HE-AAC), в основном предназначен для декодирования и вывода числа N каналов звуковых данных, которые должны быть воспроизведены отдельными динамиками, установленными на заранее определенных позициях. Обычно последовательность битов, закодированная с помощью HE-AAC, включает данные, относящиеся к числу N сигналов низкочастотного диапазона, соответствующему числу N звуковых сигналов, а также закодированные параметры SBR (Spectral Band Replication, воспроизведение полосы спектра) для восстановления числа N сигналов высокочастотного диапазона, соответствующих сигналам низкочастотного диапазона.
При определенных обстоятельствах может потребоваться, чтобы декодер HE-AAC снизил число выходных каналов до значения М (М меньше N), сохраняя при этом звуковые события из всех N каналов. Один пример использования такого уменьшения каналов представляет собой мобильное устройство, которое может воспроизводить число N каналов при подключении к многоканальной системе домашнего кинотеатра, но которое ограничено встроенным моно- или стереовыходом при автономном использовании.
Возможный способ получения числа M выходов или конечных каналов из выхода N или исходных каналов заключается в уменьшении числа каналов временной области декодированного сигнала N-каналов. В таких системах закодированная последовательность битов, представляющая число N каналов, сначала декодируется в N выходных звуковых сигналов временной области, которые затем принудительно уменьшаются во временной области до M звуковых сигналов, соответствующих числу M каналов. Недостатком такого подхода является величина вычислительных ресурсов и ресурсов памяти, необходимых для первого декодирования всех N звуковых сигналов, соответствующих числу N каналов, и затем уменьшение N декодированных звуковых сигналов в M уменьшенных звуковых сигналов.
Технический стандарт ETSI (TS) 126 402 (3GPP TS 26.402) в разделе 6 описывает способ, называемый «Уменьшение каналов стереопараметра в монопараметр SBR». Этот документ включен в настоящую заявку посредством ссылки. Технический стандарт ETSI описывает процесс соединения параметров SBR для извлечения моноканала SBR из пары каналов SBR. Указанный способ, однако, ограничен принудительным уменьшением стереосигнала в моносигнал, где каналы представлены в виде элемента канальной пары (CPE).
На основании вышеизложенного необходимо иметь схему низкой сложности, предназначенную для уменьшения числа каналов из произвольного числа каналов N в произвольное число каналов M. В частности, необходимо иметь схему уменьшения числа каналов для параметров SBR, связанных с N каналами, в параметры SBR, связанные с М каналами, в которых схема уменьшения числа каналов сохраняет релевантную высокочастотную информацию о различных каналах.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
В настоящем документе описываются способы и системы, которые обеспечивают эффективный способ снижения выходных или конечных каналов в декодере HE-AAC, в то же время предохраняя звуковые события от всех входов или исходных каналов. Способы и системы обеспечивают уменьшение числа каналов от произвольного числа каналов N в произвольное число каналов М, где M меньше N. Способы и системы могут быть реализованы при сниженной вычислительной сложности в сравнении с уменьшением каналов во временной области. Следует отметить, что описанные способы и системы применимы к любым многоканальным декодерам, использующим SBR для высокочастотного восстановления. В частности, описанные способы и системы не ограничены закодированными последовательностями битов HE-AAC. К тому же, следует отметить, что следующие аспекты описаны для соединения первого и второго исходных каналов в конечный канал. Эти термины следует понимать как «минимум первый», «минимум второй» и «минимум конечный» каналы и, следовательно, применяются для соединения произвольного числа N исходных каналов в произвольное число М конечных каналов.
В соответствии с этим аспектом описывается способ для объединения первого и второго исходных наборов параметров воспроизведения полосы спектра (SBR) в конечный набор параметров SBR. Исходный набор параметров SBR может соответствовать параметрам SBR, связанным со звуковыми каналами последовательности битов HE-AAC. Исходный и/или конечный наборы параметров SBR могут соответствовать параметрам SBR цикла звукового сигнала отдельного звукового канала. В этом качестве первый исходный набор может соответствовать первому звуковому сигналу первого звукового канала, второй исходный набор может соответствовать второму звуковому сигналу второго звукового канала, а конечный набор может соответствовать конечному звуковому сигналу конечного канала. Исходный и/или конечный наборы параметров SBR могут содержать информацию, которая используется для формирования высокочастотной составляющей соответствующего звукового сигнала из низкочастотной составляющей соответствующего звукового сигнала. В частности, набор параметров SBR может содержать информацию относительно огибающей спектра высокочастотной составляющей в пределах предварительно назначенного временного интервала цикла соответствующего звукового сигнала. Спектральная информация, содержащаяся в таком временном интервале, обычно называется «огибающая».
Первый и второй исходные наборы, и, в частности, огибающие первого и второго исходных наборов, могут включать первое и второе разбиения полосы частот соответственно. Эти первое и второе разбиения полосы частот могут отличаться друг от друга. Первый исходный набор может включать первый набор энергозависимых значений, связанных с полосами частот первого разбиения полосы частот; а второй исходный набор может включать второй набор энергозависимых значений, связанных с полосами частот второго разбиения полосы частот. Конечный набор может включать конечный набор энергозависимых значений, связанных с элементарной полосой частот.
Такие энергозависимые значения могут быть энергиями коэффициента масштабирования, а полосы частот могут быть полосами коэффициента масштабирования. В ином случае или в дополнение, энергозависимые значения могут быть энергиями коэффициента масштабирования уровня собственных шумов, а полосы частот могут быть полосами коэффициента масштабирования уровня собственных шумов.
Этот способ может включать этап разделения первого и второго разбиений полосы частот на объединенной координатной сетке, включающей элементарную полосу частот. Первое и второе разбиения полосы частот могут перекрывать частотный диапазон высокочастотной составляющей соответствующего звукового сигнала. Этот частотный диапазон может быть разделен на объединенную координатную сетку частот. Объединенная координатная сетка может быть связана с набором квадратурных зеркальных фильтров (набор QMF), который применяется для определения параметров SBR. В частности, набор QMF может применяться на стадии анализа для определения спектральной сегментации высокочастотной составляющей соответствующего звукового сигнала в поддиапазоны QMF. Такой поддиапазон QMF может являться элементарной полосой частот объединенной координатной сетки частот.
Следует отметить, что первое разбиение полосы частот может перекрывать другой частотный диапазон, а не второе разбиение полосы частот. В частности, начальная частота первого разбиения полосы частот, то есть нижняя граница первого разбиения полосы частот, может отличаться от начальной частоты второго разбиения полосы частот, то есть нижней границы второго разбиения полосы частот. Обычно объединенная координатная сетка частот покрывает перекрывающийся диапазон первого и второго разбиений полосы частот. В частности, полосы частот или одна или несколько частей полосы частот, которые находятся ниже самой высокой из начальных частот, не могут рассматриваться.
Способ может включать назначение первого значения первого набора энергозависимых значений в элементарную полосу частот; и/или назначение второго значения второго набора энергозависимых значений в элементарную полосу частот. Первый этап назначения может быть выполнен таким образом, что первое значение соответствует энергозависимому значению, связанному с полосой частот первого разбиения полосы частот, которая включает элементарную полосу частот. Второй этап назначения может быть выполнен таким образом, что второе значение соответствует энергозависимому значению, связанному с полосой частот второго разбиения полосы частот, которая включает элементарную полосу частот.
Способ может включать этап суммирования, например добавления и/или масштабирования, первого и второго значений для получения конечного энергозависимого значения для элементарной полосы частот. К тому же, конечное энергозависимое значение может быть нормировано с помощью числа используемых исходных наборов. Например, конечное энергозависимое значение может быть поделено на число используемых исходных наборов с целью определения среднего значения используемых энергозависимых значений исходных наборов.
Вышеописанный способ был указан для отдельной элементарной полосы частот. Способ может включать дополнительный этап повторения этапов назначения и этап суммирования всех элементарных полос частот объединенной координатной сетки, и для получения таким образом набора конечных энергозависимых значений конечного набора.
Конечный набор может включать конечное разбиение полосы частот с помощью предварительно назначенной конечной полосы частот. Обычно такая конечная полоса частот имеет одно соответствующее конечное энергозависимое значение. Для определения этого соответствующего конечного энергозависимого значения способ может включать этап усреднения набора конечных энергозависимых значений, связанных с элементарными полосами частот, которые содержатся в конечной полосе частот. Усредненное значение может быть назначено как конечное энергозависимое значение конечной полосы частот.
Первый исходный набор может быть связан с первым сигналом первого исходного канала; и/или второй исходный набор может быть связан со вторым сигналом второго исходного канала; и/или конечный набор может быть связан с конечным сигналом конечного канала. Обычно исходные наборы и конечные наборы связаны с определенным временным интервалом соответствующего сигнала. Такие временные интервалы могут определяться с помощью так называемых огибающих.
В частности, конечное энергозависимое значение конечного набора может быть связано с конечным временным интервалом конечного сигнала; и/или первый набор энергозависимых значений первого исходного набора может быть связан с первым временным интервалом первого сигнала, в котором первый временной интервал может перекрывать конечный временной интервал. В этих случаях вышеупомянутый этап суммирования может включать этап масштабирования первого значения первого набора энергозависимых значений в соответствии с отношением, представленным длиной перекрытия первого временного интервала и конечного временного интервала, а также длиной конечного временного интервала. Вследствие этого масштабированные первое и второе значения могут суммироваться, например добавляться для получения конечного энергозависимого значения.
К тому же первый исходный набор может включать третье разбиение полосы частот; и/или первый исходный набор может включать третий набор энергозависимых значений, связанных с полосами частот третьего разбиения полосы частот; и/или третий набор энергозависимых значений может быть связан с третьим временным интервалом первого сигнала нижнего диапазона, в котором третий временной интервал может перекрывать конечный временной интервал. Следует отметить, что третье разбиение полосы частот может соответствовать, в частности может быть равно, первому разбиению полосы частот. В таких случаях способ может далее включать этап разделения третьего разбиения полосы частот на объединенную координатную сетку, включающую элементарную полосу частот; и/или назначение элементарной полосе частот третьего значения третьего набора энергозависимых значений. В этих случаях вышеупомянутый этап суммирования может включать этап масштабирования третьего значения в соответствии с отношением, представленным длиной перекрытия третьего временного интервала и конечного временного интервала, а также длиной конечного временного интервала. Вследствие этого масштабированные первое, второе и третье значения могут суммироваться, например добавляться для получения конечного энергозависимого значения.
В соответствии с этим аспектом описывается способ для объединения первого и второго исходных наборов параметров воспроизведения полосы спектра (SBR) в конечный набор параметров SBR. Первый исходный набор может быть связан с первым сигналом нижнего диапазона первого исходного канала и может включать первый набор энергии коэффициента масштабирования. Второй исходный набор может быть связан со вторым сигналом нижнего диапазона второго исходного канала и может включать второй набор энергий коэффициента масштабирования. Конечный набор может быть связан с конечным сигналом нижнего диапазона конечного канала, полученным из уменьшения числа каналов временной области первого и второго сигналов нижнего диапазона. Кроме того, конечный набор может включать конечный набор энергий коэффициента масштабирования.
Способ может включать этап взвешивания первого и второго коэффициентов уменьшения числа каналов, выполняемый с помощью коэффициента компенсации энергии; где первый коэффициент уменьшения числа каналов может быть связан с первым исходным каналом; где второй коэффициент уменьшения числа каналов может быть связан со вторым исходным каналом; и где коэффициент компенсации энергии может быть связан с взаимодействием первого и второго сигналов нижнего диапазона во время уменьшения числа каналов временной области. Такое взаимодействие может включать ослабление и/или усиление первого и второго сигналов нижнего диапазона, которые могут быть обусловлены синфазным или противофазным режимом первого и второго сигналов нижнего диапазона. В частности, коэффициент компенсации энергии может быть связан с отношением энергии конечного сигнала нижнего диапазона и энергии первого и второго сигналов нижнего диапазона или суммарной энергии первого и второго сигналов нижнего диапазона.
Например, в случае, когда объединены N исходных каналов, то при N ≥2 для получения М конечных каналов с M<N и M≥1 коэффициент компенсации энергии f c o m p   
Figure 00000001
может быть представлен с помощью:
f c o m p = c h o u t = 0 M 1 n x d m x 2 [ c h o u t ] [ n ] c h i n = 0 N 1 n ( c c h i n x i n [ c h i n ] [ n ] ) 2
Figure 00000002
где x i n [ c h i n ] [ n ]
Figure 00000003
- сигнал нижнего диапазона временной области в исходном канале c h i n
Figure 00000004
, c chin
Figure 00000005
- коэффициент уменьшения числа каналов для исходного канала c h i n
Figure 00000006
, x d m x [ c h o u t ] [ n ]
Figure 00000007
- сигнал нижнего диапазона временной области конечного канала c h o u t
Figure 00000008
, а n = 0,...,1023
Figure 00000009
- выборочный указатель импульсного сигнала в цикле сигналов временной области. Следует отметить, что f c o m p   
Figure 00000001
может быть определен на основе подмножества импульсных сигналов в цикле сигналов временной области. В таком качестве вышеприведенные суммы могут быть вычислены по всему подмножеству выборок, например, с помощью каждой выборки P-th цикла, при P как целое, то есть n = 0, P ,2 P ,3 P ,...
Figure 00000010
Далее способ может включать этапы масштабирования первого набора энергий коэффициента масштабирования с помощью первого весового коэффициента уменьшения числа каналов; и/или масштабирование второго набора энергий с помощью второго весового коэффициента уменьшения числа каналов. Конечный набор энергий коэффициента масштабирования может быть определен из масштабированного первого и второго наборов энергий коэффициента масштабирования. В частности, конечный набор энергий коэффициента масштабирования может быть определен в соответствии с любым способом, описанным в данном документе.
В соответствии с другим аспектом описывается способ для объединения первого и второго исходных наборов параметров воспроизведения полосы спектра (SBR) в конечный набор параметров SBR. Первый исходный набор может включать первую начальную частоту. Второй исходный набор может включать вторую начальную частоту. Первая и вторая начальные частоты могут отличаться и могут быть связаны с более низкими пределами полосы частот первого и второго сигналов верхнего диапазона, связанного с первым и вторым исходными наборами параметров SBR соответственно. В частности, первая и вторая начальные частоты могут быть связаны с более низкими пределами первого и второго разбиений полосы частот.
Способ может включать этап сравнения первой и второй начальных частот; и/или этап выбора более высокой или более низкой первой и второй начальной частоты в качестве начальной частоты конечного набора. В общих чертах начальная частота конечного набора может быть выбрана на основе уровня начальных частот используемых исходных наборов, например первого и второго исходных наборов.
Выбор начальной частоты может применяться для определения заголовка элемента SBR конечного набора. Первый исходный набор может включать первый заголовок элемента SBR, включая первую начальную частоту. Второй исходный набор может включать второй заголовок элемента SBR, включая вторую начальную частоту. В этом случае способ может включать этап выбора заголовка элемента SBR конечного набора на основе первого или второго заголовка элемента SBR в соответствии с выбранной начальной частотой конечного набора. В частности, заголовок элемента SBR, включающий более высокую или более низкую начальную частоту, может быть выбран в качестве основы для определения заголовка элемента SBR конечного набора.
В дальнейшем выбор начальной частоты может быть ограничен до исходных наборов с помощью особых свойств, например выбор начальной частоты может исключительно или предпочтительно включать определенные исходные каналы. В частности, выбор начальной частоты может давать привилегии исходным наборам исходных каналов, которые представляют связь друг с другом, которая похожа на требуемую связь конечных наборов конечных каналов.
Например, если конечный набор представляет собой элемент канальной пары и, по меньшей мере, один из исходных наборов включает элемент канальной пары, то заголовок элемента SBR конечного набора может быть выбран из одного из исходных наборов, который включает элемент канальной пары. Если конечный набор является элементом канальной пары, и ни один из исходных наборов не включает элемент канальной пары, то заголовок элемента SBR исходного набора, включающий самую верхнюю или самую нижнюю начальную частоту, может быть выбран в качестве основы для заголовка элемента SBR конечного набора. Если конечный набор представляет собой одиночный элемент канальной пары и, по меньшей мере, один из исходных наборов включает одиночный элемент канальной пары, то заголовок элемента SBR конечного набора может быть выбран как заголовок элемента SBR одного из исходных наборов, который включает одиночный элемент канальной пары. Если конечный набор является одиночным элементом канальной пары, и все исходные наборы являются элементами канальной пары, то заголовок элемента SBR исходного набора, включающий самую верхнюю или самую нижнюю начальную частоту, может использоваться в качестве основы для заголовка элемента SBR конечного набора.
В соответствии с другим аспектом описывается способ для объединения первого и второго исходных наборов параметров воспроизведения полосы спектра SBR в конечный набор параметров SBR. Первый исходный набор может включать показатель первой динамической огибающей; при этом показатель первой динамической огибающей идентифицирует первую динамическую огибающую с первым пределом начального времени. Второй исходный набор может включать показатель второй динамической огибающей; при этом показатель второй динамической огибающей идентифицирует вторую динамическую огибающую со вторым пределом начального времени. Конечный набор может включать множество конечных огибающих, при этом каждая из них имеет предел начального времени.
Как указано выше, огибающие, а именно первая динамическая огибающая, вторая динамическая огибающая и множество конечных огибающих, могут быть связаны с одним или несколькими временными интервалами соответствующего звукового сигнала, а именно первого звукового сигнала, второго звукового сигнала и конечного сигнала соответственно. В частности, огибающие могут быть связаны с одним или несколькими временными интервалами в пределах цикла соответствующего звукового сигнала. Показатель динамической огибающей может использоваться для идентификации огибающей, которая включает информацию об акустическом переходном процессе.
Способ может включать этап выбора одного более раннего первого или второго предела начального времени; и/или этап определения в качестве конечной динамической огибающей из множества конечных огибающих, для которых предел начального времени ближе всех к самому раннему из первого и второго пределов начального времени; и/или этап установки показателя конечной динамической огибающей для ее идентификации. В варианте воплощения изобретения способ может включать этап определения в качестве конечной динамической огибающей из множества конечных огибающих, для которых предел начального времени ближе всех к самому раннему из первого и второго пределов начального времени, но не позже более раннего первого или второго предела начального времени. В соответствии с другим аспектом описывается способ для объединения N исходных наборов параметров воспроизведения полосы спектра (SBR) в M конечных наборов параметров SBR. N может быть больше 2, а M может быть меньше N. Способ может включать этап объединения пары исходных наборов для получения промежуточного набора; и/или этап объединения промежуточного набора с исходным или другим промежуточным набором для получения конечного набора. По существу, способ может включать следующие этапы объединения и посредством этого обеспечить иерархический способ объединения N исходных наборов параметров SBR в M конечных наборов параметров SBR. Этапы объединения могут быть выполнены в соответствии с любыми способами и аспектами, описанными в данном документе. В варианте воплощения изобретения исходные наборы, соответствующие исходным каналам более высокой звуковой релевантности, объединяются менее часто, чем исходные наборы, соответствующие исходным каналам более низкой звуковой релевантности.
Согласно следующему аспекту описывается системная программа. Эта системная программа может быть приспособлена для ее выполнения на процессоре и для выполнения любого этапа способа, описанного в этом документе при выполнении на вычислительном устройстве.
Согласно следующему аспекту описывается носитель данных. Этот носитель данных может включать системную программу для ее выполнения на процессоре и для выполнения любого этапа способа, описанного в этом документе при выполнении на вычислительном устройстве.
Согласно еще одному аспекту описывается компьютерная программа. Компьютерная программа может включать выполняемые команды для выполнения любого этапа способа, описанного в этом документе при выполнении на компьютере.
Согласно еще одному аспекту описывается блок объединения параметров SBR. Блок объединения SBR может быть сконфигурирован для обеспечения M конечных наборов параметров SBR от N исходных наборов параметров SBR, где N>M≥1. Блок объединения параметров SBR может включать процессор, сконфигурированный для выполнения любых аспектов и этапов способов, описанных в этом документе.
Согласно следующему аспекту описывается декодер звукового канала, сконфигурированный для декодирования последовательности битов HE-AAC N звуковых каналов. Декодер звукового канала может включать декодер ААС, сконфигурированный для приема последовательности битов HE-AAC и для обеспечения отдельной последовательности битов SBR; и/или декодер SBR, сконфигурированный для обеспечения N исходных наборов параметров SBR, соответствующих числу N звуковых каналов из последовательности битов SBR; и/или блок объединения параметров SBR, как описано выше, сконфигурированный для обеспечения числа М конечных наборов параметров SBR из N исходных наборов параметров SBR, где N>M≥1.
Декодер ААС может быть сконфигурирован для обеспечения N звуковых сигналов нижнего диапазона временной области, соответствующих числу N звуковых каналов. Звуковой декодер может включать блок уменьшения числа каналов временной области, сконфигурированный для обеспечения звуковых сигналов нижнего диапазона временной области М из числа N звуковых сигналов нижнего диапазона временной области; и/или блок SBR, сконфигурированный для формирования M звуковых сигналов верхнего диапазона из числа М звуковых сигналов нижнего диапазона и конечных наборов М параметров SBR. Таким образом, звуковой декодер может быть сконфигурирован для обеспечения М звуковых сигналов, содержащих М звуковых сигналов нижнего диапазона и М звуковых сигналов верхнего диапазона соответственно.
Согласно следующему аспекту описывается звуковой транскодер, сконфигурированный для обеспечения последовательности битов HE-AAC, включающей М звуковых сигналов из последовательности битов HE-AAC, включающей N звуковых каналов, где N>M≥1. Звуковой транскодер может включать блок объединения параметров SBR, как описано выше.
Согласно следующему аспекту описывается электронное устройство, сконфигурированное для передачи М звуковых сигналов, соответствующих числу М каналов из последовательности битов HE-AAC, включающей N звуковых каналов, где N>M≥1. Электронное устройство может быть, например, медиаплеером, декодером каналов кабельного телевидения или смартфоном. Электронное устройство может включать средства передачи звука, сконфигурированные для выполнения акустической передачи М звуковых сигналов; и/или приемник, сконфигурированный для приема последовательности битов HE-AAC; и/или звуковой декодер, сконфигурированный для получения М звуковых сигналов из последовательности битов HE-AAC в соответствии с любым аспектом, приведенным в данном документе.
Следует отметить, что варианты воплощения изобретения и аспекты, описанные в этом документе, могут произвольно объединяться. В частности, следует отметить, что аспекты и характеристики, описанные применительно к системе, также применимы в контексте соответствующего способа и наоборот. К тому же следует отметить, что раскрытие настоящего документа также охватывает другие комбинации формулы изобретения помимо тех, которые явным образом даны с помощью обратных ссылок в зависимых пунктах формулы изобретения, т. е. пункты формулы изобретения и их технические характеристики могут быть объединены в любом порядке и в любом формировании.
КРАТКОЕ ОПИСАНИЕ чертежей
Настоящее изобретение описывается с помощью наглядных примеров, не ограничивающих объем и сущность запатентованного изобретения, с учетом прилагаемых чертежей, на которых:
Фигура 1 иллюстрирует пример блок-схемы системы уменьшения числа каналов для N-канальной последовательности битов HE-AAC в звуковой стереосигнал;
Фигура 2 иллюстрирует пример блок-схемы блока объединения параметров SBR, включающего пять входных каналов и два выходных канала.
Фигура 3 иллюстрирует пример блок-схемы блока объединения параметров SBR, включающего два входных канала и один выходной канал.
Фигура 4 иллюстрирует пример объединения временных пределов огибающей, выполняемых блоком объединения параметров SBR, изображенным на фигуре 3;
Фигуры 5A, B, C и D иллюстрируют пример процесса определения энергий коэффициента масштабирования конечного канала из двух исходных каналов; и
Фигура 6 иллюстрирует пример схемы взвешивания исходных каналов с помощью коэффициентов уменьшения числа каналов.
ПОДРОБНОЕ ОПИСАНИЕ
Декодер HE-AAC можно разделить на основной декодер AAC, который декодирует нижний диапазон декодированного звукового сигнала, и алгоритм воспроизведения полосы спектра (SBR), который восстанавливает верхний диапазон звукового сигнала с помощью декодированного сигнала нижнего диапазона и параметрической информации, передаваемой в последовательности битов. Обычно алгоритм SBR требует больше вычислительных ресурсов, чем основной декодер AAC. Это обусловлено наличием блоков фильтров, используемых на стадиях анализа и синтеза восстановления высокой частоты, т. е. воспроизведения полосы спектра. К примеру, в типовом варианте воплощения изобретения вычислительные ресурсы, требуемые для ААС-декодирования, составляют примерно 1/3, тогда как вычислительные ресурсы, требуемые для декодирования параметров SBR и для восстановления высокой частоты, составляют примерно 2/3 от общих вычислительных ресурсов, необходимых для декодирования последовательности битов HE-AAC.
Декодер может принимать последовательность битов HE-AAC, которая представляет собой N-канальный звуковой сигнал. Однако, вследствие различных причин, например ограничений устройства передачи звука, декодеру может потребоваться выходной сигнал, который включает только М звуковых сигналов (при M меньше N). В альтернативном сценарии использования транскодер может принимать входную последовательность битов HE-AAC, представляющую N-канальный звуковой сигнал, и может обеспечить выходную последовательность битов HE-AAC, представляющую М-канальный звуковой сигнал.
Принимая во внимание высокую вычислительную сложность восстановления высокочастотной составляющей или верхнего диапазона звукового сигнала с помощью параметров SBR, может оказаться полезным уменьшение числа каналов от N до M в закодированной области перед дополнительным декодированием низведенной последовательности битов и формированием М высокочастотных звуковых сигналов, соответствующих числу М каналов. Ниже описывается способ, позволяющий эффективное объединение параметров SBR N входных или исходных каналов в параметры SBR M выходных или конечных каналов. Объединение параметров SBR выполняется таким образом, что информация относительно определенных звуковых событий сохраняется.
Предлагаемый способ может включать этап декодирования параметров SBR для N входных каналов, обеспечивая таким образом N наборов параметров SBR, соответствующих числу N исходных каналов. Затем выполняется этап объединения параметров SBR для получения М наборов параметров SBR, соответствующих М конечных каналов. Для обеспечения выходных сигналов М каналов способ может включать этап декодирования ААС-кодированного низкочастотного сигнала для всех N входных каналов с последующим уменьшением числа каналов временной области с целью получения М выходных каналов. Кроме того, восстановление полосы спектра для М каналов можно выполнить с помощью уменьшенного числа М каналов, полученного из ААС-кодированного низкочастотного сигнала, и соответствующего новому набору параметров SBR, полученному в вышеописанном этапе объединения SBR.
На фигуре 1 приведен пример декодера HE-AAC 100, обеспечивающего два выходных звуковых сигнала 107, 108, которые соответствуют двум выходным или конечным каналам из входной последовательности битов HE-AAC 101, представляющей N звуковых каналов. Декодер ААС 110 выполняет декодирование битов HE-AAC 101 в N звуковых каналов 103, включающих низкочастотные составляющие N звуковых каналов, именуемых также низкочастотными сигналами 103. N низкочастотных звуковых сигналов 103 снижается до двух низкочастотных звуковых сигналов 106 в блоке уменьшения каналов временной области 113. Затем декодер ААС обеспечивает последовательность битов SBR 102, включая параметры SBR для N звуковых каналов. Последовательность битов SBR 102 декодируется в декодере SBR 111 для получения N наборов параметров SBR 104, один набор параметров SBR 104 для каждого из N звуковых каналов. Извлечение и декодирование параметров может выполняться в соответствии со стандартом ISO/IEC 14496-3, подразделы 4.4.2.8 и 4.5.2.8, которые включены в настоящую заявку посредством ссылки. N наборов параметров SBR 104 объединяются в два набора параметров SBR 105 в блоке объединения параметров SBR 112. В итоге репликация полосы спектра или восстановление высокой частоты двух выходных звуковых сигналов 107, 108 выполняется в блоке SBR 114. Блок SBR 114 формирует высокочастотные компоненты двух звуковых сигналов с помощью низкочастотных звуковых сигналов 106 и наборов объединенных параметров SBR 105 и обеспечивает в качестве выхода два звуковых сигнала 107, 108, которые включают соответствующие низко- и высокочастотную составляющие.
Фигура 2 иллюстрирует блок-схему блока объединения параметров SBR 112. Изображенный блок объединения параметров SBR 112 имеет иерархическую структуру для объединения пяти наборов параметров SBR 201, 202, 203, 204, 205 на входе в два набора параметров SBR 208, 209 на выходе. Блок объединения параметров SBR 112 включает блоки объединения параметров SBR «два в один» 210, 211, 212, 213, которые объединяют два набора параметров SBR 201, 202 на входе в один набор параметров SBR 206 на выходе. Блоки объединения параметров SBR «два в один» 210, 211, 212, 213 называются «элементарными блоками объединения». С помощью иерархически организованных элементарных блоков объединения 210 можно обеспечить гибкий и адаптивный блок объединения параметров SBR 112, который способен объединять произвольное число N наборов параметров SBR 201 на входе в произвольное число М наборов параметров SBR 208 на выходе. Путем добавления или удаления элементарных блоков объединения 210 общий блок объединения параметров SBR 112 может быть приспособлен в изменяющееся число N входных каналов и/или изменяющееся число М выходных каналов.
Фигура 2 иллюстрирует пример блока объединения параметров SBR 112, который объединяет параметры SBR входного сигнала 5.1 в параметры SBR выходного стереосигнала. Сигнал 5.1 включает пять полнодиапазонных каналов, называемых левый (L), правый (R), «окружающий» левый (LS), «окружающий» правый (RS) и центральный (C) каналы, а также канал низкочастотных эффектов (LFE). На приведенном примере канал LFE не рассматривается. Обычно содержание такого канала LFE сохраняется только в том случае, если канал LFE также доступен в качестве одного из выходных каналов.
В проиллюстрированном варианте воплощения изобретения набор параметров SBR 201, соответствующий каналу C, объединяется в первом элементарном блоке объединения 210 с набором параметров SBR 202 канала LS, и во втором элементарном блоке объединения 211 с набором параметров SBR 203 канала RS. Он получает два набора объединенных параметров SBR 206 и 207 соответственно. Эти наборы объединенных параметров SBR 206, 207 могут именоваться промежуточными наборами параметров SBR. Затем набор объединенных параметров SBR 206 объединяется с набором параметров SBR 204 канала L в элементарном блоке объединения 212, чтобы получить набор объединенных параметров SBR 208, соответствующий левому каналу (L´) выходного стереосигнала. Набор объединенных параметров SBR 207 объединяется с набором параметров SBR 205 канала R в элементарном блоке объединения 213, чтобы получить набор объединенных параметров SBR 209, соответствующий левому каналу (R´) выходного стереосигнала.
Проиллюстрированная иерархическая схема объединения является единственной возможностью для объединения множества наборов параметров SBR на входе. Эти наборы параметров SBR могут также объединяться в другом порядке. Однако следует отметить, что обычно каждый этап объединения в элементарном блоке объединения 210 приводит к размыванию информации, содержащейся в наборах параметров SBR. Затем может оказаться предпочтительным преобразовать каналы с более высоким акустическим значением или более высокой акустической релевантностью в меньшее количество этапов объединения, чем каналы с меньшим акустическим значением или акустической релевантностью. Например, каналы L и R могут быть представлены меньшим количеством этапов объединения, чем канал C. В качестве дополнительного примера в случае звуковой дорожки к фильму, в котором канал С передает диалоги, имеющие более высокое акустическое значение, канал С может быть представлен меньшим числом этапов объединения, чем каналы L и R.
В альтернативном варианте воплощения изобретения блок объединения параметров SBR 112 может быть реализован в качестве общей матрицы, которая напрямую объединяет N наборов параметров SBR 201 на входе в M наборов параметров SBR 208 на выходе.
Далее описывается объединение двух наборов параметров SBR 201, 202 в элементарном блоке объединения 210 в один набор объединенных параметров SBR 206. Описываемые способы и системы можно обобщить, рассматривая не менее чем два набора параметров SBR на входе.
На фигуре 3 представлен пример блок-схемы элементарного блока объединения 210. Элементарный блок объединения 210 обеспечивает набор объединенных параметров SBR 206, именуемый также конечным набором, из двух наборов параметров SBR 201, 202, именуемых также исходными наборами. Обычно иллюстрированный элементарный блок объединения 210 выполняет объединение параметров SBR на поцикловой основе, то есть параметры SBR цикла входных сигналов, относящихся к соответствующим входным каналам, объединяются, чтобы обеспечить параметры SBR соответствующего цикла выходного сигнала выходного канала. В дальнейшем, для упрощения иллюстрации, набор параметров SBR 201,202, 206 относится к наборам параметров SBR цикла.
Например, цикл входного сигнала может включать набор огибающих, охватывающих номинальную длину 2048 импульсов при частоте выборки выходного сигнала. Если, к примеру, блок фильтров QMF имеет разрешение по частоте 64 поддиапазона, длина цикла 2048 будет соответствовать 32 выборкам поддиапазона QMF в каждом из них. Кроме того, может быть введен дополнительный блок, например, «временной интервал», который объединяет выборки поддиапазона со степенью детализации в две выборки поддиапазона. Другими словами, цикл может включать 32 выборки поддиапазона QMF (на каждый поддиапазон QMF), соответствующие 16 временным интервалам.
Проиллюстрированный элементарный блок объединения 210 включает блок определения временного предела огибающей 301, который определяет временные пределы огибающих конечного набора 206 по временным пределам огибающих двух исходных наборов 201, 202. Более подробно блок определения временного предела огибающей 301 описан на фигуре 4. Затем в блоке определения энергий коэффициента масштабирования 302 энергии коэффициента масштабирования конечного набора 206 определяются из энергий коэффициента масштабирования исходных наборов 201, 202. Подробное описание блока определения энергий коэффициента масштабирования 302 приведено на фигурах 5A, 5B, 5C и 5D.
В дополнение к объединению параметров временного предела огибающей и энергий коэффициента масштабирования блок объединения параметров SBR 112 или элементарный блок объединения 210 могут выполнять объединение дополнительных параметров SBR. Параметр SBR «Inverse filtering levels» (Уровни обратной фильтрации) может быть объединен в соответствии со стандартом ETSI TS 126 402, раздел 6.1, который включен в настоящую заявку посредством ссылки. Параметр SBR «additional harmonics» (дополнительные гармоники) может быть объединен в соответствии со стандартом ETSI TS 126 402, раздел 6.2, который включен в настоящую заявку посредством ссылки.
Кроме того, может потребоваться параметр SBR "frequency resolution per envelope" (частотное разрешение на огибающую). В этот параметр входит параметр "bs_freq_res", который представляет собой двоичный переключатель, предназначенный для выбора одной из двух таблиц частот. Значение bs_freq_res==0 выбирает таблицу низкого разрешения, а bs_freq_res==1 - таблицу высокого разрешения. Обычно эти таблицы извлекаются из таблицы задающей частоты с помощью выбора подмножества полос частот. Частотное разрешение таблицы задающей частоты определяется с помощью параметра bs_freq_scale. Значение bs_freq_scale==0 является наиболее точным разрешением с одним поддиапазоном QMF на полосу частот. Более высокие значения параметра bs_freq_scale приводят к более грубым разрешениям 8-12 полос частот на октаву. Подробную информацию об этом параметре можно найти в стандарте ISO/IEC 14496-3, подраздел 4.6.18.3.2, который включен в настоящую заявку посредством ссылки. Обычно параметр bs_freq_scale включается в заголовок элемента SBR. Объединение заголовков элементов SBR обсуждается ниже. Для объединенного канала параметр bs_freq_res может быть установлен в 1, указывая этим, что следует использовать таблицы с высокой разрешающей способностью.
Параметры «SBR element headers» (Заголовки элементов SBR) могут объединяться согласно следующему процессу:
1) Могут быть определены начальная и конечная частоты всех элементов исходных каналов. При наличии блока объединения параметров SBR 112 возможными исходными каналами являются каналы 201, 202, 203, 204, 205.
2) Заголовок элемента исходного канала с наибольшей начальной частотой выбирается в качестве заголовка элемента того конечного канала, который является его частью. При использовании элемента конечного канала 208 рассматриваются заголовки элементов исходных каналов 201, 202 и 204. При использовании элемента конечного канала 209 рассматриваются заголовки элементов исходных каналов 201, 203 и 205. Следует отметить, что в альтернативных вариантах воплощения изобретения может оказаться полезным выбор заголовка элемента исходного канала с наименьшей начальной частотой в качестве заголовка элемента того конечного канала, который является его частью.
3) В дальнейшем выбор заголовка конечного канала может быть ограничен для соответствия типа элемента канала элементу конечного канала. Если элементом конечного канала является CPE (элемент канальной пары), то заголовок исходного CPE с наибольшей начальной частотой, которая является частью соединения, выбирается в качестве заголовка элемента конечного канала. В случае если исходный CPE отсутствует, выбирается заголовок исходного SCE (элемент одиночного канала) с наибольшей начальной частотой, и с его помощью создается заголовок CPE для элемента конечного канала. Если элементом конечного канала является SCE, то в качестве заголовка элемента конечного канала выбирается заголовок исходного SCE с наибольшей начальной частотой, который является частью соединения. В случае если исходный SCE отсутствует, выбирается заголовок исходного CPE с наибольшей начальной частотой, и с его помощью создается заголовок SCE для элемента конечного канала.
Следует отметить, что обычно начальная и конечная частоты первого и второго исходных наборов 201, 202 различаются. Обычно начальная и конечная частоты определяются в заголовке элемента SBR соответствующих исходных наборов 201, 202. Начальная частота звукового канала, называемая также переходной частотой, определяет максимальную частоту низкочастотной составляющей и/или минимальную частоту высокочастотной составляющей. При объединении определенного числа звуковых каналов следует предусмотреть, чтобы объединенная высокочастотная составляющая не пересекалась с низкочастотной составляющей. Причиной этого является тот факт, что декодированная с помощью ААС низкочастотная составляющая обычно содержит более достоверную акустическую информацию, чем декодированная с помощью SBR высокочастотная составляющая. Поэтому необходимо избегать вмешательства низкочастотной составляющей в высокочастотную составляющую, извлеченную из объединенных параметров SBR. Это можно обеспечить с помощью выбора начальной частоты конечного набора 206 или конечного канала, которая является максимальной начальной частотой исходных наборов 201, 202, входящих в конечный набор 206. В частности, вышеописанный риск помех между объединенными низкочастотной и высокочастотной составляющими можно предотвратить с помощью выбора заголовка элемента SBR конечного набора, как описано выше.
Далее описывается объединение параметров SBR, которые относятся к временным пределам. Следует отметить, что даже если следующее описание относится к объединению временных пределов огибающих, его можно также применять и к временным пределам огибающих шума. Кроме того, дана ссылка на стандарт ETSI TS 126 402, раздел 6.4, который включен в настоящую заявку посредством ссылки, и в котором описывается схема для объединения временных пределов огибающих шума.
HE-AAC позволяет определить до пяти огибающих в одном цикле. Эти огибающие определяют огибающую спектра высокочастотной составляющей кодированного звукового сигнала в определенном временном интервале цикла. Временные пределы различных огибающих могут быть определены по временной оси в соответствии с установленной временной сеткой. Обычно длина цикла, например, 24 мс, подразделяется на ряд временных квантов (например, 16 временных квантов), каждый из которых определяет возможный временной предел для огибающей. Временные пределы огибающих исходных наборов 201, 202 могут объединяться в соответствии со стандартом ETSI TS 126 402, раздел 6.3, который включен в настоящую заявку посредством ссылки.
На фигуре 4 проиллюстрированы огибающие спектра, определенные двумя исходными наборами 201, 202. Огибающие спектра показаны в виде ячеек на диаграмме время/частота, где время t 401 представляет длину цикла, а частота f 402 представляет частоты высокочастотной составляющей соответствующего звукового сигнала. Исходный набор 201 на приведенном примере определяет четыре огибающие 411, 412, 413, 414 с промежуточными временными пределами 415, 416, 417. Исходный набор 202 на приведенном примере определяет четыре огибающие 421, 422, 423, 424 с промежуточными временными пределами 425, 426, 427. Промежуточные временные пределы представляют собой начальные временные пределы для следующей огибающей и конечные временные пределы для предыдущей огибающей. В дополнение на фигуре 4 показан начальный временной предел 403 первой огибающей и конечный временной предел 404 последней огибающей.
Блок определения временного предела огибающей 301 способен обеспечить временную структуру, то есть начальные и конечные временные пределы огибающих конечного набора 206 из временной структуры огибающих 411, 412, 413, 414, 421, 422, 423, 424 исходных наборов 201, 202. Для этого временная структура, то есть начальные и конечные временные пределы исходных наборов 201, 202, перекрывается, как изображено на фигуре 4. В результате такого перекрытия огибающих двух исходных наборов 201, 202 получается временная структура, включающая семь временных интервалов для конечного набора 206, где эти временные интервалы определяются временными пределами [403, 425], [425, 415], [415, 416], [416, 426], [426, 417], [417, 427] и [427, 404]. Эти временные интервалы можно понимать как временные интервалы соответствующих огибающих конечного набора 206. Если полученные временные интервалы конечного набора 206 не превышают максимального количества допустимых огибающих, полученные временные пределы могут поддерживаться. Максимальное количество допустимых огибающих может задаваться основной схемой кодирования. При использовании HE-AAC максимальное количество допустимых огибающих на цикл ограничено до пяти.
Однако если количество допустимых временных интервалов превышено, то определенное количество временных интервалов конечного набора 206 следует объединить. Это можно выполнить путем объединения всех временных квантов, меньших чем два временных кванта с напрямую предшествующим или продолжающим временным интервалом. Это достигается с помощью запуска от начала временной оси 401, отображенной начальным временным пределом 403, и удалением всех конечных временных пределов, которые распложены ближе 2 от соответствующего начального временного предела. На приведенном примере конечный временной предел 426 может быть удален, тем самым создавая новый временной интервал с временными пределами [416, 417]. Если после такой операции количество временных интервалов превышает максимально допустимое количество огибающих (например, пять), то количество временных интервалов можно уменьшить. Это достигается с помощью запуска от начала временной оси 401, отображенной начальным временным пределом 404, и поиска в направлении временной оси 401, указываемой с помощью ссылочной позиции 403, временного интервала, меньшего 4 временных интервалов, и удаления начального временного предела этого временного кванта. Этот поиск может продолжаться до тех пор, пока не будет достигнуто то количество временных интервалов, которое соответствует максимальному числу допустимых огибающих. В приведенном примере будет удален начальный временной предел 417, тем самым создавая новый временной интервал с временными пределами [416, 427].
Используя вышеописанный процесс объединения временных интервалов, можно обеспечить, что количество временных интервалов конечного набора 206 не превышает максимальное количество допустимых огибающих. В примере, приведенном выше, количество временных квантов составляет 16, а максимальное количество допустимых огибающих - 5. Средний временной интервал огибающих конечного набора 206 не должен быть меньше чем 16/5=3,2 временных кванта, что может быть получено путем объединения временных интервалов с помощью постепенно возрастающего порога (как описано выше). В общем можно сформулировать, что средняя длина временных интервалов должна быть равной, по меньшей мере, отношению количества временных квантов на цикл к максимальному количеству допустимых огибающих.
В качестве выхода блока определения временного предела огибающей 301 могут быть получены временные интервалы, определяемые временными пределами 403, 425, 415, 416, 427, 404 огибающих спектра конечного набора 206. Число временных пределов было снижено таким образом, что количество временных интервалов не превышает максимально допустимого числа огибающих спектра.
Вышеописанный процесс определения временных интервалов огибающих конечного набора 206 может быть обобщен до произвольного числа исходных наборов 201. В этом случае все временные пределы исходных наборов 201 могут перекрываться, как показано на фигуре 4 и описано выше. Используя последующий процесс объединения временных интервалов, можно определить предварительно назначенное число временных интервалов огибающих конечного набора 206.
Следует отметить, что огибающая цикла может быть обозначена как переходная огибающая спектра, отображая таким образом наличие перехода в звуковом сигнале в определенном временном интервале в пределах цикла. Обычно число переходных огибающих спектра в цикле и в канале ограничено одним. Переходная огибающая спектра обычно обозначается индексом l A
Figure 00000011
, указывая число огибающих спектра. Если максимальное число допустимых огибающих спектра равно 5, индекс l A
Figure 00000011
может, например, принимать любое из значений от 0 до 4. Индекс переходной огибающей исходных наборов может быть объединен следующим образом:
i. Для каждого исходного набора 201, 202 он определяется, если индекс переходной огибающей l A
Figure 00000011
текущего цикла отображает, что переход существует, то есть l A 1
Figure 00000012
.
ii. Для каждого l A 1
Figure 00000013
начальный временной предел такой огибающей определен.
iii. Если в различных исходных наборах 201, 202 переходы присутствуют и, следовательно, было определено несколько начальных временных пределов, то может быть выбран наименьший начальный временной предел (т. е. самый ранний).
iv. В конечном наборе 206 идентифицируется тот временной предел, который находится ближе всех к начальному временному пределу, определенному на этапах i-i.
v. В качестве переходной огибающей l A
Figure 00000014
объединенного канала выбирается временной интервал или огибающая конечного набора 206, для которого начальный временной предел соответствует пределу, идентифицированному на этапе iv.
Если в примере, изображенном на фигуре 4, допускается, что исходный набор 201 включает переходную огибающую 414, а исходный набор 202 включает переходную огибающую 423, то этап iii выбирает начальный временной предел 426. Затем на этапе iv определяется тот начальный временной предел 416 конечного набора 206, который находится ближе всех к начальному временному пределу 426, и временной интервал [416, 427] отмечается как переходная огибающая с помощью индекса переходной огибающей l A
Figure 00000014
в 2. Применяя вышеописанный способ, переход стремится к перемещению в более ранние из возможных временных интервалов. Это может иметь психоакустические преимущества при выборе более позднего начального временного интервала, благодаря, например, эффектам временного маскирования более раннего перехода. Более того, вышеописанный способ обычно гарантирует, что переходная огибающая конечного набора 206 охватывает множество временных квантов переходных огибающих 414, 423 исходных наборов 201, 203. Однако следует отметить, что в качестве дальнейшего или альтернативного ограничения переходная огибающая конечного набора 206 может быть выбрана таким образом, что ее начальный временной предел появляется не позднее, чем любой из начальных временных пределов переходных огибающих 414, 423 исходных наборов 201, 202.
Вышеописанный процесс определения индекса переходной огибающей конечного набора 206 из одного или нескольких индексов переходной огибающей исходных наборов 201, 202 может быть обобщен в произвольное число индексов произвольного числа исходных наборов. С этой целью этапы ii, iii, iv и v выполняются для произвольного числа индексов переходной огибающей.
Далее описывается объединение огибающих спектра двух исходных наборов 201, 202 в блоке определения энергий коэффициента масштабирования 302. Огибающая спектра включает один или несколько полос коэффициентов масштабирования и коэффициент масштабирования для каждой полосы коэффициентов масштабирования. Другими словами, огибающая спектра определяет спектральное распределение энергии высокочастотного сигнала соответствующего канала в пределах временного интервала огибающей спектра.
Как сказано выше, временные интервалы огибающих спектра конечного набора 206 были определены в блоке определения временного предела огибающей 301. Блок определения энергий коэффициента масштабирования 302 способен определять полосы коэффициента масштабирования и соответствующие коэффициенты масштабирования огибающих спектра конечного набора 206 из огибающих спектра исходных наборов 201, 202.
На фигуре 5 представлен основной принцип объединения энергий коэффициента масштабирования, находящихся в огибающих спектра двух исходных наборов 201, 202. В блоке определения временного предела огибающей 301 определяются временные пределы 403, 425 огибающей 532 конечного набора 206. Эта огибающая 532 перекрывает временной интервал 503, определенный с помощью соответствующих временных пределов 403, 425. Временной интервал 503 прикладывается к огибающим спектра исходных наборов 201, 202, определяя таким образом огибающие спектра исходных наборов 201, 202, которые входят в огибающую спектра 532 конечного набора. На изображенном примере можно видеть, что огибающая спектра 411 исходного набора 201 попадает во временной интервал 503 и, следовательно, входит в огибающую спектра 532 конечного набора 206. К тому же можно видеть, что огибающая спектра 421 исходного набора 202 попадает во временной интервал 503 и, следовательно, входит в огибающую спектра 532 конечного набора 206.
Следует, в общем, отметить, что одна или несколько огибающих спектра 411 исходного набора 201 может попасть во временной интервал 503 огибающей спектра 532 конечного набора 206. Следовательно, несколько огибающих спектра 411 исходного набора 201 может попасть в огибающую спектра 532 конечного набора 206. Этот аспект множества участвующих огибающих спектра будет описан на последнем этапе. Для упрощения иллюстрации объединение двух огибающих спектра исходных наборов 201, 202 будет описано на первом этапе. Эти огибающие спектра называются первой исходной огибающей 512 и второй исходной огибающей 522 и связаны с огибающими спектра 411, 421 исходных наборов 201, 202 соответственно. В варианте воплощения изобретения первая и вторая исходные огибающие 512, 522 могут соответствовать огибающим спектра 411, 421 исходных наборов 201, 202 соответственно.
К тому же следует отметить, что начальные частоты используемых исходных огибающих 411, 421 могут отличаться друг от друга. Как указано выше, начальная частота конечного набора 206 обычно выбирается так, чтобы она была наибольшей начальной частотой используемых исходных наборов 201, 202. В варианте воплощения изобретения начальная частота конечного набора 206 может быть выбрана такой, чтобы она была наибольшей начальной частотой используемых исходных наборов 201, 202, 204, которые входят в последний конечный набор 208 блока объединения параметров SBR 112 (как указано выше в контексте объединения заголовка элемента SBR). В результате не весь частотный диапазон огибающих спектра 411, 421 исходных наборов 201, 202 может входить в огибающую спектра 532 конечного набора 206, которая также называется конечной огибающей 532. Это изображено на фигуре 5B, на которой показаны огибающие спектра 411, 421 исходных наборов 201, 202. На приведенном примере огибающая спектра 411 имеет начальную частоту 551, которая ниже начальной частоты 552 огибающей спектра 421. Если в качестве начальной частоты 553 конечной огибающей 532 выбирается более высокая начальная частота 552, то огибающая спектра 411 может быть усечена. Это обусловлено тем фактом, что полосы коэффициентов масштабирования в диапазоне частот между более низкой начальной частотой 551 и более высокой начальной частотой 552 обычно не попадают в конечную огибающую 532. По существу, «усечение» огибающей спектра 411 может быть достигнуто с помощью игнорирования частотного диапазона между более низкой начальной частотой 551 и более высокой начальной частотой 552 во время объединения.
В общем можно сказать, что исходные огибающие 512, 522, попадающие в конечную огибающую 532, могут быть усечены таким образом, что их частотный диапазон будет соответствовать частотному диапазону конечной огибающей 532. В частности, могут быть усечены полосы частот или одна или несколько частей частотных диапазонов, лежащих ниже начальной частоты и выше конечной частоты конечной огибающей 532. Далее допускается, что участие исходных огибающих 512, 522 было усечено, как отмечено выше, таким образом, что их начальные и/или конечные частоты соответствуют их начальным и/или конечным частотам конечной огибающей 532.
Обычно разбиение полосы коэффициента масштабирования первой исходной огибающей 512 не соответствует разбиению полосы коэффициента масштабирования второй исходной огибающей 522. Другими словами, полосы частот с постоянной энергией, то есть полосы частот с постоянными энергиями коэффициента масштабирования, для разных исходных огибающих 512, 522 являются разными. Это показано на фигуре 5A, где граничные частоты 513, 514 первой исходной огибающей 512 отличаются от граничных частот 523, 524, 525 второй исходной огибающей 522. В дополнение, количество полос коэффициента масштабирования в первой исходной огибающей 512 (три на приведенном примере) может отличаться от количества полос коэффициента масштабирования во второй исходной огибающей 512 (четыре на приведенном примере). К тому же исходные огибающие 512, 522 в зависимости от частот могут включать различные уровни энергий. Блок определения энергий коэффициента масштабирования 302 способен определять конечную огибающую 532 из используемых исходных огибающих 512, 522, при этом конечная огибающая 532 включает одну или несколько полос коэффициента масштабирования и соответствующие энергии коэффициента масштабирования.
Далее описывается объединение энергий коэффициента масштабирования, соответствующих полосам коэффициента масштабирования исходных огибающих 512, 522. Основная идея заключается в том, чтобы обеспечить объединенную координатную сетку частот между множеством исходных огибающих 512, 522 и конечной огибающей 532. Такая объединенная координатная сетка частот может быть создана с помощью поддиапазонов QMF (квадратурный зеркальный фильтр) блоков фильтров анализа/синтеза, используемых в кодеках, работающих на основе SBR. С помощью объединенной координатной сетки, например, поддиапазонов QMF, добавляются коэффициенты масштабирования используемых исходных огибающих, которые соответствуют тому же поддиапазону QMF, обеспечивая накопленную энергию коэффициента масштабирования соответствующего поддиапазона QMF конечной огибающей. В итоге накопленная энергия коэффициента масштабирования может быть разделена на количество используемых исходных огибающих с целью обеспечения среднего коэффициента масштабирования в качестве энергии коэффициента масштабирования соответствующего поддиапазона QMF конечной огибающей.
Этот процесс объединения энергий коэффициента масштабирования изображен на фигурах 5C и 5D. Фигура 5C показывает множество энергий коэффициента масштабирования 515, 516 и 517, связанных с исходной огибающей 512, так же как и энергии коэффициента масштабирования 526, 527, 528 и 529, связанные с исходной огибающей 522. Для каждой исходной огибающей 512, 522, которые микшируются в конечную огибающую, выполняются следующие этапы. Эти этапы приведены для определенной полосы коэффициента масштабирования 511. В частности, приведены этапы для определенного поддиапазона QMF 541 в полосе коэффициента масштабирования 511. Эти этапы должны быть выполнены для всех поддиапазонов QMF 541, которые лежат в пределах частотного диапазона конечной огибающей 532.
На первом этапе энергия коэффициента масштабирования 517 каждой полосы коэффициента масштабирования 511 может быть масштабирована с помощью соответствующего компенсированного энергией коэффициента уменьшения числа каналов для канала, соответствующего исходному набору 201. Определение компенсированного энергией коэффициента уменьшения числа каналов описано ниже.
Как указано выше, каждая исходная полоса коэффициента масштабирования 511 разбита на поддиапазоны QMF 541, то есть полосы коэффициента масштабирования 511 разбиты в объединенную координатную сетку. Каждому поддиапазону QMF 541 полосы коэффициента масштабирования 511 назначена энергия коэффициента масштабирования 517 соответствующей полосы коэффициента масштабирования 511. Другими словами, поддиапазону QMF 541 назначена энергия коэффициента масштабирования 517 полосы коэффициента масштабирования 511, в пределах которой он лежит. Представление полос коэффициента масштабирования 511 и соответствующих энергий коэффициента масштабирования 517 на сетке поддиапазонов QMF 541 далее называется «представление QMF».
На следующем этапе исходное представление QMF добавляется к конечному представлению QMF конечного канала. В примере, изображенном на фигуре 5C, энергия коэффициента масштабирования 517 поддиапазона QMF 541 исходного набора 201 добавляется к энергии коэффициента масштабирования 533 соответствующего поддиапазона QMF 543 конечной огибающей 532.
Аналогичным образом энергия коэффициента масштабирования 529 поддиапазона QMF 542 исходного набора 202 добавляется к энергии коэффициента масштабирования 533 соответствующего поддиапазона QMF 543 конечной огибающей 532. В итоге накопленная энергия коэффициента масштабирования 533 может быть разделена на число используемых исходных наборов 201, 202 для получения усредненной энергии коэффициента масштабирования 533.
Следует отметить, что в результате удаления начального/конечного временных пределов во время определения временных пределов огибающей в блоке 301 может случиться, что временной интервал 503 конечной огибающей 532 охватывает несколько огибающих первого и/или второго исходного набора 201, 202. Этот аспект многократных используемых огибающих 411 исходного набора 201 уже был отражен выше. Далее описывается, как эти многократные исходные огибающие могут быть рассмотрены в блоке определения энергий коэффициента масштабирования 302. Основная идея заключается в использовании исходной огибающей исходного набора 201 в соответствии с ее частичным использованием. Исходная огибающая исходного набора может перекрывать только частично с временным интервалом конечной огибающей. Другими словами, временной интервал конечной огибающей может перекрывать несколько огибающих исходного набора с тем, чтобы каждая огибающая исходного набора покрывала только часть времени временного интервала конечной огибающей. Такое частичное использование может быть принято во внимание с помощью масштабирования энергий коэффициента масштабирования используемых огибающих исходного набора в соответствии с частью времени, в которое они входят во временной интервал конечной огибающей. Если временная ось подразделяется на временные кванты, масштабирование энергий коэффициента масштабирования может быть выполнено в соответствии с отношением перекрывающихся временных интервалов, то есть перекрывающихся временных интервалов соответствующих исходной и конечной огибающих, к числу временных интервалов, включенных во временной интервал конечной огибающей.
Частичное использование может быть показано на фигуре 4. Временной интервал [416, 427] конечного набора 206 включает исходные огибающие 413, 414 первого исходного набора 201 и исходные огибающие 422, 423 второго исходного набора 202. В этих случаях все исходные огибающие 413, 414, 422, 423 первого и второго исходных наборов 201 и 202, которые используют конечную огибающую 531 конечного набора 206, должны быть рассмотрены для объединения энергий коэффициента масштабирования. Энергии коэффициента масштабирования в пределах полос коэффициентов масштабирования различных исходных огибающих 413, 414, 422, 423 должны использоваться частично в соответствии с отношением, данным с помощью числа перекрывающихся временных квантов используемой огибающей 413, 414, 422, 423 и временного интервала [416, 427] конечной огибающей, а также количества временных квантов [416, 427] конечной огибающей. Этот аспект включения частичного использования исходных огибающих 413, 414, 422, 423 для конечной огибающей может быть использован в процессе объединения энергий коэффициента масштабирования, описанном выше. В частности, масштабированные энергии коэффициента масштабирования используемых исходных огибающих 413, 414, 422, 423 могут быть добавлены для определения накопленной энергии коэффициента масштабирования 533 поддиапазона QMF конечной огибающей 532.
В результате описанного выше процесса получаются конечные полосы коэффициента масштабирования для конечной огибающей 532. В зависимости от числа используемых исходных огибающих 512, числа полос коэффициента масштабирования 511, включенных в исходные огибающие 512, и позиции пределов частоты 513 между полосами коэффициента масштабирования 511 число полос коэффициента масштабирования для конечной огибающей 532 может быть относительно высоким. Полезно уменьшить число полос коэффициента масштабирования в конечной огибающей 532, например, из-за ограничений основной схемы кодирования и/или из-за предварительного разбиения или структуры полосы коэффициента масштабирования.
Например, если конечный набор 206 использует заголовок элемента SBR одного из исходных наборов 201, 202, то может быть использована структура полосы коэффициента масштабирования соответствующего исходного набора 201, 202. Как было описано в контексте способа объединения заголовков элементов SBR множества исходных наборов, заголовок элемента SBR конечного набора может соответствовать или основываться на заголовке элемента SBR одного из исходных наборов. В дополнение к назначению начальной и/или конечной частот огибающих спектра, включенных в соответствующий набор параметров SBR, заголовок элемента SBR может также определять структуру полосы коэффициента масштабирования огибающих спектра. Эта структура полосы коэффициента масштабирования может быть использована для конечной огибающей, определенной в процессе объединения энергии коэффициента масштабирования, описанном выше. Далее описывается способ, при помощи которого структура полосы коэффициента масштабирования, полученная из процесса объединения, которая также называется первой структурой полосы коэффициента масштабирования, может быть преобразована в структуру полосы коэффициента масштабирования, назначенную предварительно, например, структуру, данную заголовком элемента SBR конечного набора 206, который называется второй структурой полосы коэффициента масштабирования.
Для преобразования из первой структуры полосы коэффициента масштабирования во вторую можно использовать процесс, приведенный со ссылкой на фигура 5D. Этот процесс приведен для определенной полосы коэффициента масштабирования второй структуры полосы коэффициента масштабирования и должен быть выполнен для всех полос коэффициента масштабирования второй структуры полосы коэффициента масштабирования. Процесс основан на координатной сетке частот, например поддиапазонах QMF 543.
На первом этапе суммируются энергии коэффициента масштабирования 533 всех поддиапазонов QMF 543 в полосе коэффициента масштабирования второй структуры полосы коэффициента масштабирования. Как уже указано выше, конечное разбиение полосы коэффициента масштабирования, то есть вторая структура полосы коэффициента масштабирования, может быть определена с помощью заголовка элемента SBR, который был выбран во время объединения заголовков элемента SBR.
Сумма энергий поддиапазона QMF, вычисленных на первом этапе, делится на количество суммированных поддиапазонов QMF. Другими словами, определяется усредненная энергия коэффициента масштабирования 534 полосы коэффициента масштабирования второй структуры полосы коэффициента масштабирования. Результатом является конечная энергия коэффициента масштабирования 534 соответствующей полосы коэффициента масштабирования. Этот процесс повторяется для остальных полос коэффициента масштабирования второй структуры полосы коэффициента масштабирования.
Подводя итог вышесказанного, выше был описан процесс определения энергий коэффициента масштабирования в конечной структуре полосы коэффициента масштабирования конечной огибающей 532. Используя вышеописанный процесс объединения всех конечных огибающих 532 конечного набора 206, может быть получен полный набор объединенных энергий коэффициента масштабирования огибающих конечного набора 206. Описанный процесс может быть обобщен в произвольное число исходных наборов 201. В этих случаях произвольное число исходных огибающих может входить в конечную огибающую 532. Используемые исходные огибающие разбиваются с помощью объединенной координатной сетки частот, например, поддиапазонов QMF, и исходные энергии коэффициента масштабирования соответствующих поддиапазонов QMF суммируются с целью определения конечной энергии коэффициента масштабирования соответствующего поддиапазона QMF. Конечная энергия коэффициента масштабирования может быть нормирована с помощью числа используемых исходных наборов. Если исходная огибающая исходного набора используется только частично, энергии коэффициента масштабирования могут быть масштабированы в соответствии с способом, описанным выше. К тому же энергии коэффициента масштабирования могут быть взвешены с помощью компенсированных энергией коэффициентов уменьшения числа каналов. В итоге определенные энергии коэффициента масштабирования и структура полосы коэффициента масштабирования могут быть преобразованы в структуру полосы коэффициента масштабирования, назначенную предварительно.
Следует отметить, что исходные наборы 201, 202 могут определять уровни собственных шумов. Эти уровни собственных шумов различных исходных каналов могут быть объединены способом, аналогичным объединению энергий коэффициента масштабирования. В этих случаях энергии коэффициента масштабирования соответствуют уровням собственных шумов, а временные пределы огибающих соответствуют пределам собственных шумов. Однако следует отметить, что количество временных интервалов для шума обычно ниже числа огибающих. В варианте воплощения изобретения с помощью начального, конечного и промежуточного пределов могут быть определены только два временных интервала шума. В пределах этих временных интервалов шума могут быть назначены один или несколько уровней собственных шумов и соответствующая структура частотного диапазона (или структура полосы коэффициента масштабирования собственных шумов). Начальный, конечный и промежуточный пределы множества исходных наборов 201 могут быть объединены с помощью процесса, приведенного на фигуре 4. Один или несколько уровней собственных шумов множества исходных наборов 201 могут быть объединены с помощью процесса, приведенного на фигурах 5A-5D.
Однако следует отметить, что обычно уровни собственных шумов с помощью компенсированных энергией коэффициентов уменьшения числа каналов не масштабируются. Тем не менее, используемые исходные и/или конечные уровни собственных шумов могут масштабироваться с целью тонкой настройки субъективного качества звука объединенных звуковых каналов.
В контексте способа объединения энергий коэффициента масштабирования было указано, что в исходные каналы полезно добавлять коэффициенты уменьшения числа каналов. Обычно эти коэффициенты уменьшения числа каналов применяются для низкочастотных сигналов, чтобы обеспечить защиту от искажения сигналов для уменьшенных каналов. На фигуре 6 показано применение коэффициентов уменьшения числа каналов до низкочастотных сигналов соответствующих звуковых каналов. Можно видеть, что С-канал взвешен или масштабирован с помощью коэффициента уменьшения числа каналов c0, R- и L-каналы взвешены с помощью коэффициента уменьшения числа каналов c1, а LS- и RS-каналы взвешены с помощью коэффициента уменьшения числа каналов c2. В контексте уменьшения числа каналов с пяти до двух коэффициенты уменьшения числа каналов могут быть назначены следующим образом: c 0 = 0.7 / s c a l e
Figure 00000015
, c 1 = 1.0 / s c a l e
Figure 00000016
, c 2 = 0.5 / s c a l e
Figure 00000017
, где s c a l e = 0.7 + 1.0 + 0.5 = 2.2
Figure 00000018
. Значения этих коэффициентов соответствуют рекомендации Международного союза телекоммуникаций (ITU) для уменьшения числа каналов сигнала канала 5.1. Кроме того, эти коэффициенты могут быть использованы в случае, когда уменьшается меньше пяти каналов (например, только левый, правый и центральный каналы).
Аналогично низкочастотному сигналу, полезно взвесить с помощью коэффициентов уменьшения числа каналов энергии коэффициента масштабирования исходных каналов или исходных наборов 201, 202. Большое значение имеет поддержка отношения между низкочастотной и высокочастотной составляющими звукового сигнала. В частности, важно поддерживать отношение энергии низкочастотной составляющей и высокочастотной составляющей. В этом смысле на фигуре 6 показано одноэтапное уменьшение числа каналов с пяти до двух. Коэффициенты уменьшения числа каналов применяются непосредственно к входным каналам. В варианте воплощения изобретения может использоваться иерархическое уменьшение числа каналов, как показано на фигуре 2, в соответствии с чем коэффициенты уменьшения числа каналов применяются непосредственно к входным каналам 202, 203, 204, 205.
Тем не менее, следует отметить, что исходные каналы во временной области могут быть синфазными или находиться в противофазе, чтобы низведенный конечный сигнал во временной области мог быть усилен или ослаблен в зависимости от соотношения фаз. Для учета этого эффекта при объединении энергий коэффициента масштабирования вышеуказанные коэффициенты уменьшения числа каналов могут быть умножены на коэффициент компенсации энергии, который учитывает синфазный и/или противофазный режим звуковых сигналов используемых исходных каналов. В частности, коэффициент компенсации энергии учитывает ослабление или усиление низведенного низкочастотного звукового сигнала, перемещаемого относительно используемых низкочастотных звуковых сигналов. Для заданного цикла звукового сигнала коэффициент компенсации энергии может быть рассчитан в соответствии с уравнением, приведенным ниже:
f c o m p = c h o u t = 0 M 1 n = 0 1023 x d m x 2 [ c h o u t ] [ n ] c h i n = 0 N 1 n = 0 1023 ( c c h i n x i n [ c h i n ] [ n ] ) 2
Figure 00000019
где f c o m p   
Figure 00000020
- коэффициент компенсации энергии для коэффициентов уменьшения числа каналов, x i n [ c h i n ] [ n ]
Figure 00000021
- низкочастотный сигнал временной области в исходном канале c h i n
Figure 00000022
(channel in), c chin
Figure 00000023
- коэффициент уменьшения числа каналов (например, c 0 , c 1 , c 2
Figure 00000024
на фигуре 6) для канала c h i n
Figure 00000025
, x d m x [ c h o u t ] [ n ]
Figure 00000026
- низкочастотный сигнал временной области в конечном канале c h o u t
Figure 00000027
(channel out), а n = 0,...,1023
Figure 00000028
- выборочный указатель выборок в цикле. Уравнение вычисляет энергию доступных выборок одного цикла. В частности, уравнение определяет отношение между энергией конечных каналов и энергией исходных каналов, где исходные каналы взвешены с помощью соответствующих коэффициентов уменьшения числа каналов. Во многих случаях оценка энергии со сниженной точностью, например с использованием только части доступных выборок, может быть важна для определения соответствующего коэффициента компенсации энергии.
С помощью коэффициента компенсации энергии можно поддерживать энергетический баланс между низкочастотной и высокочастотной составляющими звуковых сигналов различных звуковых каналов. Это может быть достигнуто с помощью учета положительного и/или отрицательного вноса сигналов исходных каналов в низведенный сигнал низведенного канала. Следует отметить, что в низведенных системах, которые обеспечивают М выходных каналов из N входных каналов, можно использовать один коэффициент компенсации энергии для всей системы. С другой стороны или в дополнение может быть назначено несколько коэффициентов компенсации энергии. К примеру, для каждого из М низведенных выходных каналов может быть определен особый коэффициент компенсации энергии. Это может быть выполнено с помощью учета только входных каналов, которые вносятся в соответствующий выходной канал. В следующем примере особый коэффициент компенсации энергии может быть определен для каждого элементарного блока объединения 210.
Коэффициенты уменьшения каналов c
Figure 00000029
, которые были использованы для низведения временной области выхода декодера AAC, например c0, c1 и c2, назначенные выше, могут быть умножены на коэффициент компенсации энергии f c o m p
Figure 00000030
для получения компенсированных энергией коэффициентов уменьшения числа каналов. Перед объединением энергий коэффициента масштабирования исходных наборов 201, 202 энергии коэффициента масштабирования 517 могут быть взвешены или масштабированы с помощью соответствующего компенсированного энергией коэффициента уменьшения числа каналов, как описано выше. Учитывая, что коэффициенты уменьшения числа каналов c
Figure 00000031
были назначены для сигналов временной области, энергии коэффициента масштабирования 517 должны быть масштабированы с помощью коэффициента уменьшения числа каналов, возведенного в квадрат, то есть ( f c o m p *c chin ) 2  
Figure 00000032
соответствующего исходного канала. Поэтому следует помнить, что вычисление ( f c o m p ) 2  
Figure 00000033
может быть важным. Обычно это должно быть более эффективным, когда извлечение корня для определения f c o m p
Figure 00000034
может быть опущено.
Обычно коэффициенты уменьшения числа каналов c
Figure 00000035
масштабируются или нормируются, как указано выше, чтобы они составляли в сумме постоянное значение, например один. При масштабировании к значению один диапазон масштабированных коэффициентов уменьшения числа каналов ограничивается до [0.01; 1]. Однако, учитывая, что коэффициенты уменьшения числа каналов используются для определения относительного взвешивания различных исходных каналов, для нормирования может быть использовано другое постоянное значение. Следовательно, вышеуказанные предельные значения могут быть увеличены или уменьшены в соответствии с постоянным значением нормализации при условии, что поддерживается относительный показатель между коэффициентами уменьшения числа каналов.
Следует отметить, что в альтернативном варианте воплощения изобретения компенсация энергии может быть приложена к низкочастотному низведенному сигналу. Это обусловлено тем фактом, что коэффициент компенсации энергии применяется для поддержки баланса между сигналами высокого и низкого диапазонов. Этот баланс может также поддерживаться с помощью применения инверсии коэффициента компенсации энергии на стадии низведения сигнала. В таком варианте воплощения изобретения коэффициенты уменьшения числа каналов, используемые для энергий коэффициента масштабирования, могут оставаться неизменными, т. е. они могут быть ограничены любой компенсацией низведения.
В настоящем документе описываются способы и системы для низведения параметров SBR. Описываемые способы и системы позволяют реализовать общий процесс для формирования параметров SBR для M каналов из параметров SBR N каналов, где M<N. В частности, способы и системы позволяют объединение параметров SBR каналов с различными начальными и конечными частотами. К тому же способы и системы позволяют объединение параметров SBR каналов с различным разбиением полосы коэффициента масштабирования. Кроме того, описывается схема для точного объединения информации переходной огибающей. К тому же описывается иерархический процесс объединения, который обеспечивает возможность адаптивно управлять конфигурациями многих каналов. В дополнение, описывается схема адаптивной компенсации энергии, которая ослабляет или усиливает энергии SBR с целью согласования энергии восстановленного высокочастотного сигнала с энергией низкочастотного сигнала низведенного сигнала. С помощью такой схемы компенсации синфазный и/или противофазный режим различных звуковых сигналов на стадии низведения во временной области может быть компенсирован напрямую в кодированной области.
Способы и системы для уменьшения числа каналов, описанные в данном документе, могут быть реализованы программно, микропрограммно или аппаратно. Некоторые компоненты, например, могут быть реализованы в качестве программного обеспечения, работающего на цифровом процессоре сигналов или микропроцессоре. Другие компоненты могут, например, быть реализованы аппаратно или в виде специализированных интегральных схем. Сигналы, встречающиеся в описываемых способах и системах, могут храниться на носителях, таких как память с произвольной выборкой или средства оптического хранения информации. Они могут передаваться по сетям, таким как радиосети, спутниковые сети, беспроводные или проводные сети, например Интернет. К типовым устройствам, использующим способы и системы, описанные в данном документе, относятся портативные электронные устройства или другая бытовая аппаратура, используемая для хранения и/или передачи звуковых сигналов. Способы и системы могут также быть использованы на компьютерных системах, например Интернет веб-серверах, которые хранят и передают звуковые сигналы, например музыку, для закачки.

Claims (32)

1. Способ объединения первого (201, 512) и второго (202, 522) исходных наборов параметров репликации полосы спектра, далее именуемых как параметры SBR, в конечный набор (206, 532) параметров SBR, в котором:
- первый (201, 512) и второй (202, 522) исходные наборы включают первое (513, 514) и второе (523, 524, 525) разбиения полосы частот соответственно, которые отличны друг от друга;
- первый исходный набор (201, 512) включает первый набор энергозависимых значений (515, 516, 517), связанных с полосами частот (511) первого разбиения полосы частот (513, 514);
- второй исходный набор (202, 522) включает второй набор энергозависимых значений (526, 527, 528, 529), связанных с полосами частот второго разбиения полосы частот (523, 524, 525);
и
- конечный набор (206, 532) включает конечный набор энергозависимых значений, связанных с элементарной полосой частот (543);
включающий:
- разделение первого (513, 514) и второго (523, 524, 525) разбиений полосы частот на объединенную координатную сетку (541, 542), включающую элементарную полосу частот (543);
- назначение элементарной полосе (543) частот первого значения (517) первого набора энергозависимых значений (515, 516, 517);
- назначение элементарной полосе частот (543) второго значения (529) второго набора энергозависимых значений;
- объединение первого (517) и второго (519) значений для получения конечного энергозависимого значения (533) элементарной полосы частот (543).
2. Способ по п.1, отличающийся тем, что:
- первое значение (517) соответствует энергозависимому значению, связанному с полосой частот (511) первого разбиения полосы частот (513, 514), которая включает элементарную полосу частот (543); и
- второе значение (529) соответствует энергозависимому значению, связанному с полосой частот второго разбиения полосы частот (523, 524, 525), которая включает элементарную полосу частот (543).
3. Способ по п.2, отличающийся тем, что:
- объединенная координатная сетка (541, 542) с набором квадратурных зеркальных фильтров, именуемым далее набором QMF, используемая для определения параметров SBR; и
- элементарная полоса частот (543) является поддиапазоном QMF.
4. Способ по п.3, отличающийся тем, что дополнительно включает:
- нормирование конечного энергозависимого значения (543) с помощью числа используемых исходных наборов.
5. Способ по п.4, в котором конечный набор (206, 532) включает набор конечных энергозависимых значений (533), отличающийся тем, что дополнительно включает:
- повторение этапов назначения и этапов объединения для всех элементарных полос частот (543) объединенной координатной сетки (541, 542), получая таким образом набор конечных энергозависимых значений (533).
6. Способ по п.5, в котором конечный набор (206, 532) включает конечное разбиение полосы частот с помощью предварительно назначенной полосы частот; и отличающийся тем, что дополнительно включает:
- усреднение набора конечных энергозависимых значений (533), связанных с элементарными полосами частот (543), включенного в конечную полосу частот; и
- назначение усредненного значения в качестве конечного энергозависимого значения конечной полосы частот.
7. Способ по п.6, отличающийся тем, что:
- энергозависимые значения являются энергиями коэффициента масштабирования, а полосы частот являются полосами коэффициента масштабирования; и/или
- энергозависимые значения являются полосами коэффициента масштабирования собственных шумов, а полосы частот являются полосами коэффициента масштабирования уровня собственных шумов.
8. Способ по п.7, отличающийся тем, что:
- первый исходный набор (201, 512) связан с первым низкочастотным сигналом первого исходного канала;
- второй исходный набор (202, 522) связан со вторым низкочастотным сигналом второго исходного канала; и
- конечный набор (206, 532) связан с конечным сигналом нижнего диапазона конечного канала, полученным из уменьшения числа каналов временной области первого и второго сигналов нижнего диапазона.
9. Способ по п.8, отличающийся тем, что:
- конечное энергозависимое значение (533) связано с конечным временным интервалом конечного сигнала нижнего диапазона;
- первый набор энергозависимых значений (515, 516, 517) связан с первым временным интервалом первого сигнала нижнего диапазона, в котором первый временной интервал перекрывает конечный временной интервал; и
- при этом этап объединения включает: масштабирование первого значения (517) в соответствии с отношением, представленным длиной перекрытия первого временного интервала и конечного временного интервала, а также длиной конечного временного интервала; и объединение масштабированного первого (517) и второго значений (529).
10. Способ по п.9, в котором:
- первый исходный набор (201, 512) включает третье разбиение полосы частот;
- первый исходный набор (201, 512) включает третий набор энергозависимых значений, связанных с полосами частот третьего разбиения полосы частот;
- третий набор энергозависимых значений связан с третьим временным интервалом первого сигнала нижнего диапазона, в котором третий временной интервал перекрывает конечный временной интервал;
отличающийся тем, что дополнительно включает:
- разделение третьего разбиения полосы частот на объединенную координатную сетку (541, 542), включающую элементарную полосу частот (543);
- назначение элементарной полосе частот (543) третьего значения третьего набора энергозависимых значений; и
где включен этап объединения:
- масштабирование третьего значения в соответствии с отношением, представленным длиной перекрытия третьего временного интервала и конечного временного интервала и длиной конечного временного интервала; и
- объединение масштабированного первого значения (517), второго значения (529) и масштабированного третьего значения.
11. Способ по п.8, отличающийся тем, что дополнительно включает:
- масштабирование первого набора энергозависимых значений (515, 516, 517) с помощью первого коэффициента уменьшения числа каналов; и
- масштабирование второго набора энергозависимых значений (526, 527, 528, 529) с помощью второго коэффициента уменьшения числа каналов;
при этом первый и второй коэффициенты уменьшения числа каналов связаны с первым и вторым исходными каналами соответственно.
12. Способ по п.11, отличающийся тем, что до этапов масштабирования выполняют:
- взвешивание первого и второго коэффициентов уменьшения числа каналов с помощью коэффициента компенсации энергии; в котором коэффициент компенсации энергии связан с взаимодействием первого и второго низкочастотных сигналов в течение временного низведения.
13. Способ по п.12, отличающийся тем, что:
- коэффициент компенсации энергии связан с отношением энергии конечного низкочастотного сигнала к объединенной энергии первого и второго низкочастотных сигналов.
14. Способ по п.13, отличающийся тем, что:
- выполняют объединение N исходных каналов, где N≥2, для получения M конечных каналов, где M<N и M≥1;
- коэффициент компенсации энергии fcomp дан с помощью:
Figure 00000036

- xin[chin][n] - сигнал нижнего диапазона временной области в исходном канале chin, cchin - коэффициент уменьшения числа каналов для исходного канала chin,
- xdmx[chout][n] - сигнал нижнего диапазона временной области конечного канала chout, а n - выборочный указатель импульсного сигнала в цикле сигналов временной области.
15. Способ по п.14, в котором:
- первый исходный набор (201, 512) включает первую начальную частоту (551);
- второй исходный набор (202, 522) включает вторую начальную частоту (552);
- первая (551) и вторая (552) начальные частоты различаются и связаны с нижними границами первого (513, 514) и второго (523, 524, 525) разбиений полосы частот соответственно; и
отличающийся тем, что дополнительно включает:
- сравнение первой (551) и второй (552) начальных частот;
- выбор более высокой или более низкой из первой (551) и второй (552) начальных частот в качестве начальной частоты (553) конечного набора.
16. Способ по п.15, отличающийся тем, что:
- первый исходный набор (201, 512) включает первый заголовок элемента SBR, включая первую начальную частоту(551);
- второй исходный набор (202, 522) включает второй заголовок элемента SBR, включая вторую начальную частоту (552);
в котором способ далее включает:
- выбор заголовка элемента SBR конечного набора (206, 532) на основе первого или второго заголовка элемента SBR в соответствии с выбранной начальной частотой (553) конечного набора (206, 532).
17. Способ по п.16, отличающийся тем, что:
- если конечный набор (206, 532) является элементом канальной пары и исходные наборы (201, 512, 202, 522) включают, по меньшей мере, один элемент канальной пары, то заголовок элемента SBR конечного набора (206, 532) выбирается из одного из исходных наборов (201, 512, 202, 522), который включает элемент канальной пары;
- если конечный набор (206, 532) является элементом канальной пары и ни один из исходных наборов (201, 512, 202, 522) не включает элемент канальной пары, то заголовок элемента SBR исходного набора, включающий самую верхнюю или самую нижнюю начальную частоту, выбирается в качестве основы для заголовка элемента SBR конечного набора;
- если конечный набор (206, 532) представляет собой одиночный элемент канальной пары и, по меньшей мере, один из исходных наборов (201, 512, 202, 522) включает одиночный элемент канальной пары, то заголовок элемента SBR конечного набора (206, 532) выбирается как заголовок элемента SBR одного из исходных наборов, который включает одиночный элемент канальной пары; и/или
- если конечный набор (206, 532) является одиночным элементом канальной пары и все исходные наборы (201, 512, 202, 522) являются элементами канальной пары, то заголовок элемента SBR исходного набора, включающий самую верхнюю или самую нижнюю начальную частоту, может использоваться в качестве основы для заголовка элемента SBR конечного набора (206, 532).
18. Способ по любому из предшествующих пунктов, в котором:
- первый исходный набор (201) включает показатель первой динамической огибающей; где показатель первой динамической огибающей идентифицирует первую динамическую огибающую (414) с первым пределом начального времени (417);
- второй исходный набор (202) включает показатель второй динамической огибающей; где показатель второй динамической огибающей идентифицирует вторую динамическую огибающую (423) со вторым пределом начального времени (426);
- конечный набор (206) включает множество конечных огибающих, при этом каждая из них имеет предел начального времени;
- первая динамическая огибающая (414), вторая динамическая огибающая (423) и множество конечных огибающих могут быть связаны с одним или несколькими временными интервалами первого звукового сигнала, второго звукового сигнала и конечного сигнала соответственно;
отличающийся тем, что дополнительно включает:
- выбор более раннего первого (426) или второго (417) предела начального времени;
- определение в качестве конечной динамической огибающей из множества конечных огибающих, для которых предел начального времени ближе всех к самому раннему (426) из первого (417) и второго (426) пределов начального времени; и
- установку показателя конечной динамической огибающей для ее идентификации.
19. Способ объединения первого (201, 512) и второго (202, 522) исходных наборов параметров SBR в конечный набор (206, 532) параметров SBR, в котором
- первый исходный набор (201, 512) включает первую начальную частоту (551);
- второй исходный набор (202, 522) включает вторую начальную частоту (552);
- первая (551) и вторая (552) начальные частоты отличаются и связаны с более низкими пределами полосы частот первого и второго сигналов верхнего диапазона, связанного с первым (201, 512) и вторым (202, 522) исходными наборами параметров SBR соответственно; и
при этом включающий:
- сравнение первой (551) и второй (552) начальных частот;
- выбор более высокой или более низкой из первой (551) и второй (552) начальных частот в качестве начальной частоты (553) конечного набора (206, 532).
20. Способ по п.19, в котором:
- первый исходный набор (201, 512) может включать первый заголовок элемента SBR, включая первую начальную частоту (551);
- второй исходный набор (202, 522) может включать второй заголовок элемента SBR, включая вторую начальную частоту (552);
отличающийся тем, что дополнительно включает:
- выбор заголовка элемента SBR конечного набора (206, 532) на основе первого или второго заголовка элемента SBR в соответствии с выбранной начальной частотой (553) конечного набора (206, 532).
21. Способ объединения первого (201, 512) и второго (202, 522) исходных наборов параметров SBR в конечный набор (206, 532) параметров SBR, в котором:
- первый исходный набор (201, 512) связан с первым сигналом нижнего диапазона первого исходного канала и включает первый набор энергий коэффициента масштабирования (515, 516, 517);
- второй исходный набор (202, 522) связан со вторым сигналом нижнего диапазона второго исходного канала и включает второй набор энергий коэффициента масштабирования (526, 527, 528, 529);
- конечный набор (206, 532) связан с конечным сигналом нижнего диапазона конечного канала, полученным из уменьшения числа каналов временной области первого и второго сигналов нижнего диапазона; и
- конечный набор (206, 532) включает конечный набор энергий коэффициента масштабирования (533);
и при этом включающий:
- взвешивание первого и второго коэффициентов уменьшения числа каналов с помощью коэффициента компенсации энергии; где первый коэффициент уменьшения числа каналов связан с первым исходным каналом; где второй коэффициент уменьшения числа каналов связан со вторым исходным каналом; и где коэффициент компенсации энергии связан с взаимодействием первого и второго сигналов нижнего диапазона во время уменьшения числа каналов временной области;
- масштабирование первого набора энергий коэффициента масштабирования (515, 516, 517), используя первый коэффициент уменьшения числа каналов;
- масштабирование второго набора энергий коэффициента масштабирования (526, 527, 528, 529), используя второй коэффициент уменьшения числа каналов; и
- определение конечного набора энергий коэффициента масштабирования (533) из масштабированных первого (515, 516, 517) и второго (526, 527, 528, 529) наборов энергий коэффициента масштабирования.
22. Способ по п.21, отличающийся тем, что коэффициент компенсации энергии связан с отношением энергии конечного низкочастотного сигнала к объединенной энергии первого и второго низкочастотных сигналов.
23. Способ объединения первого (201) и второго (202) исходных наборов параметров SBR в конечный набор (206) параметров SBR, в котором:
- первый исходный набор (201) включает показатель первой динамической огибающей; где показатель первой динамической огибающей идентифицирует первую динамическую огибающую (414) с первым пределом начального времени (417);
- второй исходный набор (202) включает показатель второй динамической огибающей; где показатель второй динамической огибающей идентифицирует вторую динамическую огибающую (423) со вторым пределом начального времени (426);
- конечный набор включает множество конечных огибающих, при этом каждая из них имеет предел начального времени;
- первая динамическая огибающая (414), вторая динамическая огибающая (423) и множество конечных огибающих могут быть связаны с одним или несколькими временными интервалами первого звукового сигнала, второго звукового сигнала и конечного сигнала соответственно;
и при этом включающий:
- выбор более раннего первого (417) или второго (426) предела начального времени;
- определение в качестве конечной динамической огибающей из множества конечных огибающих, для которых предел начального времени ближе всех к самому раннему (426) из первого (417) и второго (426) пределов начального времени; и
- установку показателя конечной динамической огибающей для ее идентификации.
24. Способ по п.23, отличающийся тем, что включает этап определения в качестве конечной динамической огибающей из множества конечных огибающих, для которых предел начального времени (426) ближе всех к самому раннему из первого (417) и второго (426) пределов начального времени, но не позже более раннего первого или второго предела начального времени.
25. Способ по п.24, отличающийся тем, что каждый исходный набор параметров SBR соответствует параметрам SBR, связанным с каналом последовательности битов HE-AAC.
26. Способ объединения N исходных наборов (201, 202, 203, 204, 205) параметров SBR в М конечных наборов (208, 209) параметров SBR, при этом
- N больше 2;
- M меньше N; включающий:
- объединение пары (201, 202) исходных наборов для получения промежуточного набора (206); и
- объединение промежуточного набора (206) с исходным (204) или другим промежуточным набором для получения конечного набора (208),
отличающийся тем, что этапы объединения выполняют в соответствии со способом по любому из пп.1-25.
27. Способ по п.26, отличающийся тем, что исходные наборы, соответствующие исходным каналам более высокой звуковой релевантности, объединяются менее часто, чем исходные наборы, соответствующие исходным каналам более низкой звуковой релевантности.
28. Блок объединения параметров SBR (112), сконфигурированный для обеспечения M конечных наборов (208, 209) параметров SBR от N исходных наборов (201, 202, 203, 204, 205) параметров SBR, где N>M≥1, блок объединения параметров SBR, включающий процессор, сконфигурированный для выполнения любого этапа способа по пп.1-27.
29. Декодер звукового канала, сконфигурированный для декодирования последовательности битов НЕ-ААС, включающей N звуковых каналов, и включающий:
- декодер ААС, сконфигурированный для приема последовательности битов НЕ-ААС и для обеспечения отдельной последовательности битов SBR;
- декодер SBR, сконфигурированный для обеспечения N исходных наборов параметров SBR, соответствующих числу N звуковых каналов из последовательности битов SBR; и
- блок объединения SBR (112), сконфигурированный для обеспечения М конечных наборов параметров SBR от N исходных наборов параметров SBR, где N>M≥1.
30. Декодер звукового канала по п.29, в котором декодер AAC сконфигурирован для обеспечения N звуковых сигналов нижнего диапазона временной области, соответствующих числу N звуковых каналов; и в котором декодер звукового канала далее включает:
- блок уменьшения каналов временной области, сконфигурированный для обеспечения звуковых сигналов нижнего диапазона временной области из числа N звуковых сигналов нижнего диапазона временной области; и
- блок SBR, сконфигурированный для формирования звуковых сигналов верхнего диапазона из числа М звуковых сигналов нижнего диапазона и конечных наборов М параметров SBR;
отличающийся тем, что декодер звукового сигнала сконфигурирован для обеспечения М звуковых сигналов, содержащих М звуковых сигналов нижнего диапазона и М звуковых сигналов верхнего диапазона соответственно.
31. Звуковой транскодер, сконфигурированный для обеспечения последовательности битов НЕ-AAC, включающей М звуковых сигналов из последовательности битов НЕ-ААС, включающей N звуковых каналов, где N>M≥1, и включающий:
- блок объединения параметров SBR (112) по п.28.
32. Электронное устройство, сконфигурированное для выдачи М звуковых сигналов, соответствующих числу М каналов из последовательности битов НЕ-ААС, включающей N звуковых каналов, где N>M≥1, и включающее:
- средства передачи звука, сконфигурированные для выполнения акустической передачи М звуковых сигналов;
- приемник, сконфигурированный для приема последовательности битов НЕ-ААС; и
- звуковой декодер, сконфигурированный для получения М звуковых сигналов из последовательности битов НЕ-ААС по любому из пп.29-30.
RU2012124827/08A 2009-12-16 2010-12-14 Низведение параметров последовательности битов sbr RU2526745C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US28691209P 2009-12-16 2009-12-16
US61/286,912 2009-12-16
PCT/EP2010/069651 WO2011073201A2 (en) 2009-12-16 2010-12-14 Sbr bitstream parameter downmix

Publications (2)

Publication Number Publication Date
RU2012124827A RU2012124827A (ru) 2014-01-27
RU2526745C2 true RU2526745C2 (ru) 2014-08-27

Family

ID=43733150

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012124827/08A RU2526745C2 (ru) 2009-12-16 2010-12-14 Низведение параметров последовательности битов sbr

Country Status (14)

Country Link
US (1) US9508351B2 (ru)
EP (1) EP2513899B1 (ru)
JP (2) JP5298245B2 (ru)
KR (1) KR101370870B1 (ru)
CN (2) CN102667920B (ru)
AU (1) AU2010332925B2 (ru)
BR (1) BR112012014856B1 (ru)
CA (1) CA2779388C (ru)
IL (1) IL219506A (ru)
MX (1) MX2012006823A (ru)
MY (1) MY166998A (ru)
RU (1) RU2526745C2 (ru)
UA (1) UA101291C2 (ru)
WO (1) WO2011073201A2 (ru)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
TWI501580B (zh) 2009-08-07 2015-09-21 Dolby Int Ab 資料串流的鑑別
TWI413110B (zh) 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
US9105300B2 (en) 2009-10-19 2015-08-11 Dolby International Ab Metadata time marking information for indicating a section of an audio object
EP3998606B8 (en) * 2009-10-21 2022-12-07 Dolby International AB Oversampling in a combined transposer filter bank
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
TWI462087B (zh) * 2010-11-12 2014-11-21 Dolby Lab Licensing Corp 複數音頻信號之降混方法、編解碼方法及混合系統
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
US9070361B2 (en) * 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
US10178489B2 (en) 2013-02-08 2019-01-08 Qualcomm Incorporated Signaling audio rendering information in a bitstream
CN110047496B (zh) 2013-04-05 2023-08-04 杜比国际公司 立体声音频编码器和解码器
BR112015025022B1 (pt) * 2013-04-05 2022-03-29 Dolby International Ab Método de decodificação, decodificador em um sistema de processamento de áudio, método de codificação, e codificador em um sistema de processamento de áudio
US8804971B1 (en) * 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
RU2665281C2 (ru) * 2013-09-12 2018-08-28 Долби Интернэшнл Аб Временное согласование данных обработки на основе квадратурного зеркального фильтра
US10839824B2 (en) 2014-03-27 2020-11-17 Pioneer Corporation Audio device, missing band estimation device, signal processing method, and frequency band estimation device

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005001813A1 (en) * 2003-06-25 2005-01-06 Coding Technologies Ab Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal
WO2007007263A2 (en) * 2005-07-14 2007-01-18 Koninklijke Philips Electronics N.V. Audio encoding and decoding
EP2057625A1 (de) * 2006-10-18 2009-05-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Kodierung eines informationssignals
RU2010112889A (ru) * 2007-10-17 2011-11-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. (DE) Аудиокодирование с использованием повышающего микширования

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
BR122018007834B1 (pt) * 2003-10-30 2019-03-19 Koninklijke Philips Electronics N.V. Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador
KR101079066B1 (ko) * 2004-03-01 2011-11-02 돌비 레버러토리즈 라이쎈싱 코오포레이션 멀티채널 오디오 코딩
WO2005093717A1 (en) 2004-03-12 2005-10-06 Nokia Corporation Synthesizing a mono audio signal based on an encoded miltichannel audio signal
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
TWI462086B (zh) * 2005-09-14 2014-11-21 Lg Electronics Inc 音頻訊號之解碼方法及其裝置
CN101292285B (zh) * 2005-10-20 2012-10-10 Lg电子株式会社 编码和解码多声道音频信号的方法及其装置
KR101165640B1 (ko) * 2005-10-20 2012-07-17 엘지전자 주식회사 오디오 신호의 디코딩 및 인코딩 방법 및 그 장치
CN101484936B (zh) * 2006-03-29 2012-02-15 皇家飞利浦电子股份有限公司 音频解码
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
KR101413968B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
EP2250641B1 (en) 2008-03-04 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for mixing a plurality of input data streams
WO2017018841A1 (ko) 2015-07-28 2017-02-02 주식회사 엘지화학 가소제 조성물, 수지 조성물 및 이들의 제조 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005001813A1 (en) * 2003-06-25 2005-01-06 Coding Technologies Ab Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal
WO2007007263A2 (en) * 2005-07-14 2007-01-18 Koninklijke Philips Electronics N.V. Audio encoding and decoding
EP2057625A1 (de) * 2006-10-18 2009-05-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Kodierung eines informationssignals
RU2010112889A (ru) * 2007-10-17 2011-11-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. (DE) Аудиокодирование с использованием повышающего микширования

Also Published As

Publication number Publication date
KR101370870B1 (ko) 2014-03-07
KR20120089333A (ko) 2012-08-09
JP5298245B2 (ja) 2013-09-25
CA2779388C (en) 2015-11-10
EP2513899A2 (en) 2012-10-24
CN102667920B (zh) 2014-03-12
CN102667920A (zh) 2012-09-12
US9508351B2 (en) 2016-11-29
RU2012124827A (ru) 2014-01-27
AU2010332925B2 (en) 2013-07-11
BR112012014856A2 (ru) 2021-11-03
JP5539573B2 (ja) 2014-07-02
CA2779388A1 (en) 2011-06-23
UA101291C2 (ru) 2013-03-11
AU2010332925A1 (en) 2012-05-31
MY166998A (en) 2018-07-27
MX2012006823A (es) 2012-07-23
IL219506A0 (en) 2012-06-28
WO2011073201A2 (en) 2011-06-23
CN103854651A (zh) 2014-06-11
EP2513899B1 (en) 2018-02-14
US20120275607A1 (en) 2012-11-01
JP2013511752A (ja) 2013-04-04
JP2013210674A (ja) 2013-10-10
WO2011073201A3 (en) 2011-10-06
CN103854651B (zh) 2017-04-12
BR112012014856B1 (pt) 2022-10-18
IL219506A (en) 2014-09-30

Similar Documents

Publication Publication Date Title
RU2526745C2 (ru) Низведение параметров последовательности битов sbr
US10607629B2 (en) Methods and apparatus for decoding based on speech enhancement metadata
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
RU2449387C2 (ru) Способ и устройство для обработки сигнала
US8843378B2 (en) Multi-channel synthesizer and method for generating a multi-channel output signal
RU2439720C1 (ru) Способ и устройство для обработки звукового сигнала
US8634577B2 (en) Audio decoder
JP2019080347A (ja) パラメトリック・マルチチャネル・エンコードのための方法
EP2750131A1 (en) Encoding device and method, decoding device and method, and program
US20240161755A1 (en) Inter-Channel Phase Difference Parameter Extraction Method and Apparatus
US20020154041A1 (en) Coding device and method, decoding device and method, and recording medium
US20120163608A1 (en) Encoder, encoding method, and computer-readable recording medium storing encoding program
JP6061121B2 (ja) オーディオ符号化装置、オーディオ符号化方法、およびプログラム
AU2013242852B2 (en) Sbr bitstream parameter downmix