RU2379768C2 - Устройство и способ генерирования кодированного многоканального сигнала и устройство и способ декодирования кодированного многоканального сигнала - Google Patents

Устройство и способ генерирования кодированного многоканального сигнала и устройство и способ декодирования кодированного многоканального сигнала Download PDF

Info

Publication number
RU2379768C2
RU2379768C2 RU2007112113/09A RU2007112113A RU2379768C2 RU 2379768 C2 RU2379768 C2 RU 2379768C2 RU 2007112113/09 A RU2007112113/09 A RU 2007112113/09A RU 2007112113 A RU2007112113 A RU 2007112113A RU 2379768 C2 RU2379768 C2 RU 2379768C2
Authority
RU
Russia
Prior art keywords
parameters
data stream
parameter set
parameter
information
Prior art date
Application number
RU2007112113/09A
Other languages
English (en)
Other versions
RU2007112113A (ru
Inventor
Юрген ХЕРРЕ (DE)
Юрген ХЕРРЕ
Ральф ШПЕРШНАЙДЕР (DE)
Ральф ШПЕРШНАЙДЕР
Йоханнес ХИЛЬПЕРТ (DE)
Йоханнес ХИЛЬПЕРТ
Карстен ЛИНЦМАЙЕР (DE)
Карстен ЛИНЦМАЙЕР
Харальд ПОПП (DE)
Харальд ПОПП
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2007112113A publication Critical patent/RU2007112113A/ru
Application granted granted Critical
Publication of RU2379768C2 publication Critical patent/RU2379768C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)
  • Error Detection And Correction (AREA)

Abstract

Изобретение относится к методам параметрической многоканальной обработки аудио, в частности к эффективному размещению параметрической информации управления декодером, когда имеется несколько различных наборов параметров, доступных для восстановления. В многоканальном кодере, генерирующем несколько различных наборов параметров для восстановления многоканального выходного сигнала с использованием, по меньшей мере, одного канала передачи, поток данных записывают так, что два набора параметров являются декодируемыми независимо друг от друга, и многоканальному декодеру предоставляется возможность пропуска набора параметров, который обозначается как необязательный и/или имеет более высокий номер версии при считывании потока данных, и все же выполнения достоверного многоканального восстановления с использованием набора данных, обозначенного как обязательный, или набор данных, имеющий достаточно низкий номер версии. Технический результат - обеспечение гибкого принципа кодера/декодера, пригодного для будущих обновлений, характеризуемых обратной совместимостью и надежностью. 6 н. и 13 з.п. ф-лы, 8 ил.

Description

Настоящее изобретение относится к методам параметрической многоканальной обработки аудио и, в частности, к эффективному размещению параметрической информации управления декодером, когда имеется несколько различных наборов параметров, доступных для восстановления.
В дополнение к двум стереоканалам рекомендуемое многоканальное окружающее воспроизведение включает в себя центральный канал С и два окружающих канала, т.е. левый окружающий канал Ls и правый окружающий канал Rs, и, дополнительно, если применимо, низкочастотный канал, также упоминаемый как канал улучшения низких частот (улучшение низких частот - УНЧ, LFE). Этот упоминаемый формат звука также упоминается как 3/2 (плюс УНЧ) стерео и недавно также как 5.1 многоканальный, что означает, что имеется три передних канала, два канала окружающего звука и один канал УНЧ. Вообще говоря, для этого рекомендуемого многоканального окружающего воспроизведения требуется пять или шесть каналов передачи. В среде воспроизведения требуется по меньшей мере пять громкоговорителей в соответствующих пяти различных расположениях для получения оптимальной так называемой зоны наилучшего восприятия на определенном расстоянии от пяти правильно расположенных громкоговорителей. Однако в отношении их расположения низкочастотный громкоговоритель может использоваться относительно свободным образом.
Существует несколько методов снижения количества данных, необходимых для передачи многоканального аудиосигнала. Такие методы также называются методами квазистерео. С этой целью ссылка делается на фиг.5. Фиг.5 изображает устройство 60 квазистерео. Это устройство может представлять собой устройство, реализующее, например, метод интенсивного стерео (метод ИС, IS) или бинауральное кодирование управляющих сигналов (БКУС, BCC). Такое устройство, как правило, принимает по меньшей мере два канала (CH1, CH2, … CHn) в качестве входного сигнала и выводит по меньшей мере один-единственный канал несущей (преобразование с уменьшением числа каналов) и параметрические данные, т.е. один или несколько наборов параметров. Параметрические данные определяются так, что аппроксимация каждого исходного канала (CH1, CH2, … CHn) может вычисляться в декодере.
Обычно канал несущей включает в себя выборки поддиапазона, спектральные коэффициенты или выборки временной области и т. д., которые обеспечивают относительно высококачественное представление лежащего в основе сигнала, в то же время параметрические данные и/или наборы параметров не включают в себя никакие такие выборки или спектральные коэффициенты. Вместо этого параметрические данные включают в себя параметры управления для управления установленным алгоритмом восстановления, таким как взвешивание посредством умножения, сдвиг во времени, сдвиг по частоте, …. Параметрические данные, таким образом, включают в себя только сравнительно грубое представление сигнала или связанного с ним канала. Выражаясь в числах, количество данных, требуемое каналом несущей, находится в диапазоне 60-70 Кбит/с, тогда как количество данных, требуемое параметрической информацией управления декодером, составляет порядка от 1,5 Кбит/с на канал. Одним примером параметрических данных являются известные масштабные коэффициенты, информация об интенсивном стерео или параметры бинауральных управляющих сигналов, как описано ниже.
Метод кодирования интенсивного стерео описан в препринте 3799 Общества инженеров-звукотехников (ОИЗ, AES), озаглавленном “Intensity stereo coding” J. Herre, K. H. Brandenburg, D. Lederer, февраль 1994 г., г. Амстердам. В общих чертах, принцип интенсивного стерео основан на преобразовании главной оси, которое должно применяться к данным двух стереофонических аудиоканалов. Если большинство точек данных размещается вокруг первой главной оси, улучшение кодирования может достигаться посредством поворота обоих сигналов на определенный угол до кодирования. Однако это не всегда применяется к реальным методам стереофонического воспроизведения. Восстановленные сигналы для левого и правого каналов состоят из различно взвешенных или масштабированных вариантов одного и того же переданного сигнала. Тем не менее, восстановленные сигналы отличаются по амплитуде, но они идентичны в отношении информации об их фазе. Огибающие энергии во времени обоих исходных аудиоканалов, однако, сохраняются при помощи операции селективного масштабирования, обычно действующей частотно-селективным образом. Это соответствует звуковосприятию человеком на высоких частотах, где преобладающие пространственные управляющие сигналы определяются огибающими энергии.
Кроме того, в практических реализациях переданный сигнал, т.е. канал несущей, формируется из суммарного сигнала левого канала и правого канала вместо поворота обоих компонентов. Кроме того, эта обработка, т.е. генерирование параметров интенсивного стерео для выполнения операции масштабирования, выполняется частотно-селективном образом, т.е. независимо друг от друга для каждого диапазона масштабных коэффициентов, т.е. для каждого частотного разбиения кодера. Предпочтительно, чтобы оба канала объединялись для формирования объединенного канала или канала «несущей». В дополнение к объединенному каналу определяется информация об интенсивном стерео, которая зависит от энергии первого канала, энергии второго канала и энергии объединенного или суммарного канала.
Метод БКУС описан в докладе 5574 на съезде ОИЗ, озаглавленном “Binaural cue coding applied to stereo and multi-channel audio compression”, C. Faller, F. Baumgarte, Май 2002 г., г. Мюнхен. При кодировании БКУС некоторое количество входных аудиоканалов преобразуется в спектральное представление, используя дискретное преобразование Фурье (ДПФ, DFT) с перекрывающимися окнами. Результирующий спектр разделяется на неперекрывающиеся разделы. Каждый раздел имеет ширину полосы частот, пропорциональную эквивалентной прямоугольной ширине полосы частот (ЭПШП, ERB). Так называемые межканальные разности уровней (МКРУ, ICLD), а также так называемые межканальные временные разности (МКВР, ICTD) вычисляются для каждого раздела, т.е. для каждого диапазона и для каждого кадра k, т.е. блока временных выборок. Параметры МКРУ и МКВР квантуются и кодируются для получения потока битов БКУС. Межканальные разности уровней и межканальные временные разности определяются для каждого канала относительно опорного канала. В частности, параметры вычисляются по предварительно определенным формулам в зависимости от конкретных разделений сигнала, подлежащего обработке.
На стороне декодера декодер принимает монофонический сигнал и поток битов БКУС, т.е. первый набор параметров для межканальных временных разностей и второй набор параметров для межканальных разностей уровней. Монофонический сигнал преобразуется в частотную область и вводится в блок синтеза, также принимающий декодированные значения МКРУ и МКВР. В блоке синтеза или блоке восстановления параметры БКУС (МКРУ и МКВР) используются для выполнения операции взвешивания монофонического сигнала для восстановления многоканального сигнала, который затем, после частотно/временного преобразования, представляет восстановление исходного многоканального аудиосигнала.
В случае БКУС модуль 60 квазистерео служит для вывода канальной информации управления декодером, так что параметрические канальные данные представляют собой квантованные и кодированные параметры МКРУ и МКВР, причем один из исходных каналов может использоваться в качестве опорного канала для кодирования канальной информации управления декодером. Обычно канал несущей формируется из суммы участвующих исходных каналов.
Конечно, вышеупомянутый метод обеспечивает только монофоническое представление для декодера, который может декодировать только канал несущей, но который не может генерировать параметрические данные для генерирования одной или нескольких аппроксимаций более чем одного входного канала.
Метод звукового кодирования, упоминаемый как метод БКУС, дополнительно описан в заявках на патент США 2003/0219130 А1, 2003/0026441 А1 и 2003/0035553 А1. Кроме того, дополнительно смотрите “Binaural Cue Coding. Part II: Schemes and Applications”, C. Faller and F. Baumgarte, IEEE: Transactions on Audio and Speech Proc., Vol. 11, No. 6, November 1993. Далее, также смотрите C. Faller and F. Baumgarte “Binaural Cue Coding applied to Stereo and Multi-Channel Audio compression”, препринт 112-ого съезда Общества инженеров-звукотехников (ОИЗ), Май 2002 г., и J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, C. Spenger “MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio”, 116-ый съезд ОИЗ, г. Берлин, 2004 г., препринт 6049. Ниже более подробно представлена типовая общая схема БКУС для многоканального звукового кодирования в отношении фиг.6-8. Фиг.6 изображает общую схему кодирования БКУС для кодирования/передачи многоканальных аудиосигналов. Многоканальный входной аудиосигнал подается на вход 110 кодера 112 БКУС и «преобразуется с уменьшением числа каналов» в так называемом блоке 114 преобразования с уменьшением числа каналов, т.е. преобразуется в единственный суммарный канал. В настоящем примере сигнал на входе 110 представляет собой 5-канальный окружающий сигнал, имеющий передний левый канал и передний правый канал, левый окружающий канал и правый окружающий канал и центральный канал. Обычно блок преобразования с уменьшением числа каналов генерирует суммарный сигнал простым сложением этих пяти каналов в монофонический сигнал. Известны другие схемы преобразования с уменьшением числа каналов в технике, в которых все приводится к генерированию, используя многоканальный входной сигнал, сигнала с помощью преобразования с уменьшением числа каналов, имеющего единственный канал или имеющего несколько каналов, количество которых, в любом случае, меньше, чем количество исходных входных каналов. В настоящем примере операция преобразования с уменьшением числа каналов уже достигается тогда, когда четыре канала несущей генерировались из пяти входных каналов. Единственный выходной канал и/или несколько выходных каналов выводятся по линии 115 суммарного сигнала.
Информация управления декодером, получаемая блоком 116 анализа БКУС, выводится по линии 117 информации управления декодером. В блоке анализа БКУС могут вычисляться наборы параметров для МКРУ, МКВР или значений межканальной корреляции (МКК, ICC). Таким образом, имеется до трех различных наборов параметров (МКРУ, МКВР и МКК) для восстановления в блоке 122 синтеза БКУС.
Суммарный сигнал и информация управления декодером с наборами параметров обычно передаются на декодер 120 БКУС в квантованном и кодированном формате. Декодер БКУС разделяет переданный суммарный сигнал на несколько поддиапазонов и выполняет масштабирование, задержки и дополнительную обработку для генерирования поддиапазонов нескольких каналов, подлежащих восстановлению. Эта обработка выполняется так, что параметры МКРУ, МКВР и МКК (управляющие сигналы) восстановленного многоканального сигнала на выходе 121 аналогичны соответствующим управляющим сигналам для исходного многоканального сигнала на входе 110 кодера 112 БКУС. С этой целью декодер 120 БКУС включает в себя блок 122 синтеза БКУС и блок 123 обработки информации управления декодером.
Нижеследующее иллюстрирует внутреннюю структуру блока 122 синтеза БКУС в отношении фиг.7. Суммарный сигнал на линии 115 вводится в блок преобразования времени/частоты, обычно выполняемый в виде банка 125 фильтров БФ(FB). На выходе блока 125 присутствует несколько N сигналов поддиапазонов или, в максимальном случае, блок спектральных коэффициентов, если банк 125 звуковых фильтров выполняет преобразование, генерирующее N спектральных коэффициентов из N выборок временной области.
Блок 122 синтеза БКУС дополнительно включает в себя каскад 126 задержки, каскад 127 модифицирования уровня, каскад 128 обработки корреляции и каскад 129 БОФ(IFB) (банк обратных фильтров), представляющий банк обратных фильтров. На выходе каскада 129 восстановленный многоканальный аудиосигнал, имеющий, например, пять каналов в случае 5-канальной окружающей системы, может выводиться на группу громкоговорителей 124, как показано на фиг.6.
Фиг.7 дополнительно изображает, что входной сигнал s(n) преобразуется в частотную область или область банка фильтров посредством элемента 125. Сигнал, выводимый элементом 125, умножается, так что получается несколько версий одного и того же сигнала, как указано узлом 130. Количество версий исходного сигнала равно количеству выходных каналов в выходном сигнале, подлежащем восстановлению. Если каждая версия исходного сигнала подвергается определенной задержке d1, d2, … di, dN в узле 130, то результатом является такой случай на выходе блоков 126, который включает в себя версии одного и того же сигнала, но с различными задержками. Параметры задержки вычисляются блоком 123 обработки информации управления декодером на фиг.6 и выводятся из межканальных временных разностей, которые были определены блоком 116 анализа БКУС.
Это же применимо к параметрам умножения а1, а2 … ai, aN, которые также вычисляются блоком 123 обработки информации управления декодером на основании межканальных разностей уровней, определенных блоком 116 анализа БКУС.
Параметры МКК вычисляются блоком 116 анализа БКУС и используются для управления функциональными возможностями блока 128, так что определенные значения корреляции между задержанными и манипулированными по уровню сигналами получаются на выходе блока 128. Необходимо заметить, что порядок каскадов 126, 127, 128 может отличаться от того, который представлен на фиг.7.
Далее необходимо заметить, что при поблочной обработке аудиосигнала анализ БКУС также выполняется поблочно. Кроме того, анализ БКУС также выполняется по частоте, т.е. частотно-селективным образом. Это означает то, что для каждого спектрального диапазона имеется параметр МКРУ, параметр МКВР и параметр МКК. Параметры МКВР для по меньшей мере одного канала по всем диапазонам, таким образом, представляют набор параметров МКВР. Это же применяется к набору параметров МКРУ, представляющему все параметры МКРУ для всех частотных диапазонов, для восстановления по меньшей мере одного выходного канала. Это же применяется, в свою очередь, к набору параметров МКК, который и в этом случае включает в себя несколько индивидуальных параметров МКК для различных диапазонов для восстановления по меньшей мере одного выходного канала на основе входного канала или суммарного канала.
Ниже ссылка делается на фиг.8, изображающую случай, из которого можно понять определение параметров БКУС. Обычно параметры МКРУ, МКВР и МКК могут определяться между парами каналов. Является типичным, однако, что определение параметров МКРУ и МКВР выполняется между опорным каналом и каждым другим входным каналом, так что существует отдельный набор параметров для каждого входного канала. Это также иллюстрируется на фиг.8В.
Однако параметры МКК могут определяться иным образом. Вообще говоря, параметры МКК могут генерироваться в кодере между любыми парами каналов, что также схематически изображено на фиг.8В. В этом случае декодер будет выполнять синтез МКК так, что получается примерно такой же результат, что и тот, который присутствовал в исходном сигнале между любыми парами каналов. Однако было предположение для вычисления только параметров МКК между двумя самыми сильными каналами в любой момент времени, т.е. для каждого временного кадра. Эта схема представлена на фиг.8С, которая изображает пример, в котором в один момент времени вычисляется и передается параметр МКК между каналами 1 и 2 и в котором в другой момент времени вычисляется параметр МКК между каналами 1 и 5. Декодер тогда синтезирует межканальную корреляцию между двумя самыми сильными каналами в декодере и исполняет дополнительные обычно эвристические правила для синтезирования межканальной когерентности для остальных пар каналов.
В отношении вычисления, например, параметров умножения а1, … aN, основанных на переданных параметрах МКРУ, ссылка делается на противопоставленный доклад 5574 на съезде ОИЗ. Параметры МКРУ представляют распределение энергии в исходном многоканальном сигнале. Без потери всеобщности фиг.8А изображает то, что имеется четыре параметра МКРУ, представляющих разность энергий между всеми другими каналами и передним левым каналом. В блоке 123 обработки информации управления декодером параметры умножения а1, … aN выводятся из параметров МКРУ, так что полная энергия всех восстановленных выходных каналов представляет собой такую же энергию, что и та, которая присутствует для переданного суммарного сигнала, или, по меньшей мере, пропорциональна этой энергии. Одним путем определения этих параметров является двухэтапный процесс, в котором на первом этапе коэффициент умножения для левого переднего канала устанавливается равным 1, в то время как коэффициенты умножения для других каналов на фиг.8С устанавливаются равными переданным значениям МКРУ. Тогда, на втором этапе, энергия всех пяти каналов вычисляется и сравнивается с энергией переданного суммарного сигнала. Затем все каналы масштабируются вниз, а именно используя масштабный коэффициент, который равен для всех каналов, в котором масштабный коэффициент выбирается так, что полная энергия всех восстановленных выходных каналов после масштабирования равна полной энергии переданного суммарного сигнала и/или переданных суммарных сигналов.
В отношении показателя межканальной когерентности МКК, переданного с кодера БКУС на декодер БКУС в качестве дополнительного набора параметров, необходимо отметить, что манипулирование когерентностью может выполняться посредством модифицирования коэффициентов умножения, например, посредством умножения весовых коэффициентов всех поддиапазонов на случайные числа, имеющие значения между 20 log10-6 и 20 log106. Псевдослучайная последовательность обычно выбирается так, что дисперсия для всех критических диапазонов примерно равна и что среднее значение в каждом критическом диапазоне равно нулю. Одинаковая последовательность используется для спектральных коэффициентов каждого различного кадра или блока. Таким образом, ширина звуковой сцены управляется посредством модифицирования дисперсий псевдослучайной последовательности. Большая дисперсия генерирует большую ширину слышимости. Модифицирование дисперсии может выполняться в индивидуальных диапазонах, имеющих ширину критического диапазона. Это делает возможным одновременное существование нескольких объектов в сцене слышимости, в которой каждый объект имеет различную ширину слышимости. Подходящим распределением амплитуды для псевдослучайной последовательности является равномерное распределение по логарифмической шкале, например, представленное в публикации патента США 2002/0219130 А1.
Чтобы передавать пять каналов совместимым образом, например, в формате потока битов, который также подходит для нормального стереофонического декодера, может использоваться так называемый метод матрицирования, описанный в “MUSICAM Surround: A universal multi-channel coding system compatible with ISO/IEC 11172-3”, G. Theile и G. Stoll, препринт ОИЗ, октябрь 1992г., г. Сан-Франциско.
Кроме того, смотрите дополнительные методы многоканального кодирования, описанные в публикации “Improved MPEG 2 Audio multi-channel encoding”, B. Grill, J. Herre, K. H. Brandenburg, I. Eberlein, J. Koller, J. Miller, препринт 3865 ОИЗ, февраль 1994 г., г. Амстердам, в которой используется матрица совместимости для получения каналов, посредством преобразования с уменьшением числа каналов, из исходных входных каналов.
Итак, можно сказать, что метод БКУС делает возможным эффективное и также обратно-совместимое кодирование многоканального звукового материала, как также описано, например, в публикации специалиста E. Schuijer, J. Breebaart, H. Purnhagen, J. Engdegard, озаглавленной “Low-Complexity Parametric Stereo Coding”, 119-ый съезд ОИЗ, г. Берлин, 2004 г., препринт 6073. В этом контексте необходимо также упомянуть стандарт MPEG-4 (Экспертная группа по вопросам движущегося изображения) и, в частности, расширение на методы параметрического аудио, в которых эта часть стандарта также известна по обозначению ISO/IEC 14496-3: 2001/FDAM 2 (Parametric Audio). В этом отношении необходимо упомянуть, в частности, синтаксис в таблице 8.9 стандарта MPEG-4, озаглавленной “syntax of the ps_data()”. В этом примере заявители упоминают элементы синтаксиса “enable_icc” и “enable_ipdopd”, при этом эти элементы синтаксиса используются для включения и выключения передачи параметра МКК и фазы, соответствующей межканальным временным разностям. Также необходимо упомянуть элементы синтаксиса “icc_data()”, “ipd_data()” и “opd_data()”.
Вкратце необходимо отметить, что, как правило, такие параметрические многоканальные методы используются с применением одного или нескольких переданных каналов несущей, причем М переданных каналов формируются из N исходных каналов для восстановления снова N выходных каналов или количества K выходных каналов, причем K равно или меньше, чем количество исходных каналов N.
Во всех описанных до настоящего времени методах является проблематичным вопрос того, как может быть создана совместимость форматов между различными типами декодеров для многоканального декодирования, например, для декодеров БКУС и для других версий параметрической информации управления декодером. В частности, возникают две проблемы, когда на рынке существуют различные многоканальные декодеры наряду с тем, что в то же время на рынке присутствует информация управления декодером, имеющая различные наборы параметров, генерируемые различными многоканальными декодерами, и, таким образом, доступная для пользователя, который имеет только единственный декодер.
Во-первых, желательно иметь декодеры с высокой вычислительной возможностью, обеспечивающие оптимальное качество многоканального звука при декодировании. В то же время, однако, также будут декодеры, которые работают в условиях ограниченных ресурсов, такие как декодеры в мобильных устройствах, таких как мобильные телефоны. Конечно, такие декодеры должны обеспечивать многоканальный выход, имеющий качество, которое все же является максимально хорошим, но также должны иметь только ограниченный объем вычислительной работы. Это приводит к вопросу, могут ли быть форматы потока битов с наборами параметров для пространственного восстановления, которые поддерживают этот вид масштабируемости, т.е. которые предоставляют возможность как декодирования с высокой сложностью и, таким образом, оптимальным качеством, так и декодирования с уменьшенной сложностью, но также с соответствующим пониженным качеством.
Следующим аспектом, который следует рассмотреть при введении новых поколений/версий декодеров БКУС и, таким образом, потоков битов БКУС, является вопрос, как может быть сохранена совместимость между различными версиями потоков битов БКУС и декодерами БКУС. Другими словами, желательно, чтобы новые наборы параметров БКУС и также обновленные старые наборы параметров были обратно-совместимыми. Таким образом, конечно, желательно обеспечить направление обновления для пользователей БКУС, давая возможность представления новых улучшенных многоканальных схем, когда они станут доступны вследствие технического прогресса. С другой стороны, новые форматы потоков битов БКУС обычно приводят к несовместимости между этими потоками битов и различными (более старыми) версиями декодеров БКУС.
В частности, необходимо отметить, что многоканальные кодеры/декодеры должны использоваться во все возрастающем количестве областей применения, в которых необязательно является доступным максимальные вычислительные возможности, но которые также не всегда обязательно требуют полного качества звука.
Задачей настоящего изобретения является предоставление идеи, которая является эффективной и гибкой, т.е. которая дает возможность, например, выполнить интеграцию новых наборов параметров или обновление старых наборов параметров и которая в то же самое время может гибко использоваться в многочисленных различных применениях.
Эта задача достигается устройством для генерирования кодированного многоканального сигнала по п.1 формулы изобретения, устройством для декодирования кодированного многоканального сигнала по п.15 формулы изобретения, способом генерирования кодированного многоканального сигнала по п.21 формулы изобретения, способом декодирования многоканального сигнала по п.22 формулы изобретения или компьютерной программой по п.23 формулы изобретения.
Настоящее изобретение основано на том факте, что эффективное и обратно-совместимое декодирование кодированных многоканальных сигналов достигается тогда, когда кодированный многоканальный сигнал записывается в виде потока данных, который, в дополнение к по меньшей мере одному каналу передачи или каналу несущей, включает в себя по меньшей мере два различных набора параметров, причем два набора параметров записываются в поток данных, так что восстановление выходных каналов может выполняться при помощи менее чем по меньшей мере двух наборов параметров. Согласно изобретению поток данных записывается так, что декодер может идентифицировать, какой из наборов параметров требуется для восстановления и какой набор параметров необязательно является необходимым для восстановления. В этом случае декодер может использовать только набор параметров, который является необходимым (т.е. обязательным) для восстановления, и просто игнорировать необязательные наборы параметров, если этого требуют внешние обстоятельства. В результате этого декодер является быстродействующим и обходится ограниченной вычислительной возможностью при использовании только обязательного набора параметров для восстановления наряду с тем, что в то же самое время другой декодер может выполнять высококачественное многоканальное восстановление на основе этого же потока данных, представляющего кодированный многоканальный сигнал, которое, однако, также требует больше времени и/или большей вычислительной возможности и/или, вообще говоря, больших ресурсов декодера.
В предпочтительном варианте осуществления настоящего изобретения обязательным набором параметров является тот, который включает в себя межканальные разности уровней. Как было обнаружено в соответствии с изобретением, эти межканальные разности уровней являются очень важными для определения базового распределения многоканального звука между выходными каналами для всех типов случаев воспроизведения. Межканальные временные разности могут классифицироваться как необязательные наборы параметров, так как они, главным образом, уместны тогда, когда должно быть представление или при помощи наушников, т.е. два выходных канала из одного переданного канала, или когда происходит многоканальное звуковое представление в так называемой относительно «сухой» акустической ситуации, т.е. акустической ситуации, включающей в себя немногочисленное эхо. Межканальные временные разности, таким образом, уже могут классифицироваться как необязательный набор параметров.
Значения межканальной корреляции важны для предоставления ширины источников звука и для дополнительного создания впечатления у слушателя, что он или она находятся на сцене со смешанными источниками звука, например, классический оркестр, который включает в себя много некоррелированных звуковых компонентов. Набор параметров МКК, таким образом, также может классифицироваться как необязательный набор параметров, так как он очевидно имеет важное влияние на качество, но при восстановлении часто приводит к относительно большому объему работ по вычислению, который, например, не является настолько важным в обязательном наборе параметров межканальных разностей уровней, так как, по существу, требуется только операция взвешивания, т.е. умножения, которая может выполняться эффективно по отношению к вычислению.
Что касается проблемы обратной совместимости кодированных многоканальных сигналов с наборами параметров в потоках данных, то набор параметров, имеющий, например, более высокий номер версии, записывается в поток данных, так что восстановление декодером может выполняться без этого набора параметров, в результате декодер будет использовать только первый набор параметров для восстановления и просто пропустит второй набор параметров, когда он установит, что он не может обрабатывать этот второй набор параметров.
На стороне декодера это означает, что декодер должен полностью считывать набор параметров и обрабатывать его, когда он идентифицирует этот набор параметров как обязательный набор параметров, что, однако, декодер просто пропустит биты в потоке битов, принадлежащие набору параметров, когда он встретит набор параметров, который не является обязательным для восстановления, т.е. который обозначен как необязательный. Декодеру, таким образом, не нужно иметь никаких сведений о синтаксисе второго набора параметров, чтобы он мог иметь дело с кодированным многоканальным сигналом, но он может просто пропустить его и просто перейти к последующим областям кодированного многоканального сигнала, которые могут быть еще необходимы для восстановления.
Предпочтительно, чтобы информация о длине, таким образом, вставлялась в поток данных для наборов параметров, обозначенных как необязательные, которые дают возможность декодеру просто пропустить биты, связанные с этим набором параметров, быстрым и эффективным образом и взять только наборы параметров, обозначенные как обязательные для декодирования. Что касается обратной совместимости, то также предпочтительно, чтобы номер версии ассоциировался с по меньшей мере каждым необязательным набором параметров, который задает, какой версией кодера генерировался этот набор параметров. Таким образом, например, набор параметров для межканальных разностей уровней самой низшей версии будет обозначаться как обязательный в потоке данных, тогда как набор параметров для межканальных разностей уровней более поздней версии кодера получает другой номер версии, так что декодер будет просто использовать соответствующий набор параметров с более низшим номером версии для восстановления, когда он установит, что он не может обрабатывать набор параметров, имеющий более высокий номер версии.
Наконец, необходимо отметить, что поток данных, представляющий многоканальный сигнал, необязательно должен также содержать каналы передачи. Вместо этого они могли генерироваться и передаваться отдельно, как, например, в том случае, когда параметры БКУС записываются впоследствии на компакт-диск в соответствующий канал, причем компакт-диск уже содержит М (= равный или больше 1) каналов передачи.
Предпочтительные варианты осуществления настоящего изобретения подробно объясняются ниже в отношении прилагаемых чертежей, на которых:
фиг.1А представляет собой общий вид кодированного многоканального сигнала, имеющего определенный синтаксис потока данных согласно варианту осуществления настоящего изобретения;
фиг.1B представляет собой подробное представление блока управления по фиг.1A согласно варианту осуществления настоящего изобретения;
фиг.2A представляет собой блок-схему кодера согласно варианту осуществления настоящего изобретения;
фиг.2B представляет собой блок-схему декодера согласно варианту осуществления настоящего изобретения;
фиг.3A-3D изображают предпочтительную реализацию для конфигурации набора параметров согласно настоящему изобретению;
фиг.4A-4C изображают предпочтительную реализацию данных набора параметров согласно настоящему изобретению;
фиг.5 изображает общее представление многоканального кодера;
фиг.6 представляет собой схематическую блок-схему тракта кодера БКУС/декодера БКУС;
фиг.7 представляет собой блок-схему блока синтеза БКУС по фиг.6; и
фиг.8А-8С изображают представление типовых планов действий для вычисления наборов параметров МКРУ, МКВР и МКК.
Фиг.2A изображает предпочтительную реализацию устройства для генерирования кодированного многоканального сигнала, представляющего некодированный многоканальный сигнал, содержащий N исходных каналов, которые подаются на вход 20 средства 22 для предоставления как М каналов передачи, так и параметрической информации с по меньшей мере двумя наборами параметров. В частности, количество М каналов передачи, выводимых на выходе 23 средства 22, меньше количества N исходных аудиоканалов. Индивидуальные наборы параметров, которые вместе представляют параметрическую информацию для восстановления К выходных каналов, подаются на выходы 24а, 24b, 24с средства 22 для предоставления М каналов передачи, причем М равно или больше 1 и меньше N, подаются на средство 25 для записи потока данных на выходной стороне, которые подаются на выход 26, точно как и наборы параметров на выходах 24а, 24b, 24с.
Как описано выше, информация о преобразовании с уменьшением числа каналов (М каналов передачи) также может передаваться/храниться отдельно от параметрической информации.
Средство 25 для записи потока данных, представляющего кодированный многоканальный сигнал, выполнено с возможностью записи М каналов передачи в поток данных и дополнительно записи первого, второго и третьего набора параметров в поток данных, так что восстановление К выходных каналов может выполняться без использования одного из трех наборов параметров и, предпочтительно, даже без использования по меньшей мере двух из трех наборов параметров. В этом отношении наборы параметров на выходах 24а-24с средства 22 для предоставления обозначаются так, что один набор параметров, такой как первый набор параметров, абсолютно необходим для восстановления, тогда как два других набора параметров, т.е. второй набор параметров и третий набор параметров, определяются так, что они только необязательно требуются для восстановления.
Средство 25 для записи затем записывает первый набор параметров в качестве обязательного набора параметров в поток данных и записывает второй набор параметров и третий набор параметров только в качестве необязательных наборов параметров в поток данных, как описано ниже.
Поток данных на выходе 26 на фиг.2A подается на вход 27 потока данных многоканального декодера, изображенного на фиг.2B. Данные потока данных подаются на средство 28 для считывания потока данных, в котором средство 28 для считывания потока данных, точно как и кодер, показанный на фиг.2A, снова содержит логический выход 29 для М каналов передачи, извлеченных из потока данных, и дополнительные логические выходы 30а, 30b для наборов параметров, содержащихся в потоке данных. В предпочтительном варианте осуществления настоящего изобретения, в котором первый набор параметров обозначается как обязательный или абсолютно необходимый для восстановления, средство 28 для считывания подает этот первый набор параметров на средство 31 для восстановления при помощи логического выхода 30а. Если средство 28 для считывания, например, фиксировано установлено на считывание только обязательных наборов параметров и подачи их на средство 31 для восстановления, то средство 28 просто пропустит второй набор параметров в потоке данных на входе 27, что символически представлено логическим выходом 30b с обрывом на фиг.2B.
Сигнал управления, извлекаются ли только обязательные наборы параметров или дополнительно также необязательные наборы параметров из потока данных и подаются ли на средство 31, также может подаваться на средство 28 при помощи управляющего входа 32, причем информация о доступности ресурсов и/или управляющая информация, извлеченная из нее, поступает по управляющему входу 32.
Информация о доступности ресурсов, например, может заключаться в том, что питаемый от батарей декодер устанавливает, что имеется еще достаточное количество доступной энергии батарей, так что средство 28 для считывания потока данных инструктируется на извлечение не только обязательных наборов параметров, но также необязательных наборов параметров и подачу их на средство 31 для восстановления при помощи соответствующих логических выходов, так что, в свою очередь, это средство обеспечивает К выходных каналов на выходе 33, причем К равно или меньше, чем исходное количество N исходных входных каналов на входе 20 на фиг.2A. Необходимо заметить, что предпочтительно, чтобы количество К было равно количеству N, так как декодер, возможно, будет стремиться генерировать все выходные каналы, кодированные в потоке данных.
Средство 28 считывания потока данных для считывания потока данных также служит для считывания по меньшей мере первого набора параметров и для возможности пропуска по меньшей мере одного набора параметров, такого как второй набор параметров, когда используется масштабируемость в потоке данных, т.е. когда набор параметров в потоке данных не используется для восстановления. Средство 31 восстановления тогда служит для восстановления K выходных каналов, используя М каналов передачи и первый набор параметров, но не используя второй набор параметров.
В варианте осуществления настоящего изобретения средство 22 для предоставления представляет собой кодер БКУС, принимающий N исходных каналов и на выходной стороне предоставляющий М каналов передачи и индивидуальные наборы параметров. Альтернативно, средство 22 для предоставления также может представлять собой так называемый транскодер потока битов, который на входной стороне принимает информацию, уже записанную в немасштабируемом формате (только наборы параметров или наборы параметров вместе с каналами передачи), когда они генерируются элементами 114 и 116 на фиг.7, например, и который инструктирует средство 25 для записи соответственно на перезапись потока битов, таким образом записывая наборы параметров в поток данных в масштабируемом виде. Это означает то, что, для того чтобы иметь возможность понимать поток данных, декодеру необязательно считывать и выполнять синтаксический анализ всех данных потока данных, но он может пропустить данные, связанные с необязательным набором параметров при обнаружении необязательного набора параметров.
Таким образом, имеются различные возможности для фактической записи потока данных с масштабируемыми наборами параметров. В одном варианте осуществления начало данных для набора параметров может быть установлено в соответствии с фиксированным растром потока данных. В этом случае передача информации о длине, связанная с необязательным набором параметров, не является обязательной. Этот фиксированный растр, однако, может являться результатом искусственного расширения количества данных в потоке данных посредством битов заполнения. Таким образом, предпочтительно ассоциировать информацию о длине с каждым необязательным набором параметров, так что, когда он имеет информацию, декодер пропускает необязательный набор параметров, т.е. просто пропускает некоторое количество битов в предпочтительно последовательном потоке данных на основе информации о длине, затем возобновляет считывание и анализ в надлежащем месте потока данных, т.е. когда начинаются данные для нового набора параметров и/или для новой информации.
Альтернативная возможность сигнализирования начала нового набора параметров заключается, например, в том, что имеется синхрокомбинация перед фактическими данными, которые имеют некоторую битовую комбинацию, т.е. которые могут идентифицироваться без фактического анализа данных просто на основе поиска битовой комбинации, сигнализируя декодеру, что здесь начинаются данные для набора параметров и заканчиваются при последующей синхрокомбинации. В этом случае, когда набор параметров был идентифицирован как необязательный набор параметров, декодер выполняет поиск синхрокомбинации, связанной с началом необязательного набора параметров, чтобы затем выполнить поиск комбинации с битами, следующими за синхрокомбинацией, без синтаксического анализа до тех пор, пока он не встретит следующую синхрокомбинацию. Биты между двумя синхрокомбинациями тогда не будут использоваться для восстановления, но просто будут игнорироваться, тогда как данные при последующей синхрокомбинации, сигнализирующие окончание необязательного набора параметров, могут использоваться в качестве заданных в соответствии с синтаксисом потока битов, если эти данные не принадлежат другому необязательному набору параметров.
В предпочтительном варианте осуществления настоящего изобретения по меньшей мере два набора параметров, необходимых для восстановления нескольких каналов, классифицируются в отношении их важности для восприятия. Набор параметров, наиболее важный для восприятия, т.е. для качества восстановленного многоканального сигнала, обозначается как обязательный набор параметров в потоке данных, тогда как другие наборы параметров обозначаются только как необязательные наборы параметров. Дальнейшая классификация на обязательный, необязательный и, например, наборы параметров, необходимые только для студийного восстановления, также может выполняться для достижения, например, трех этапов масштабирования вместо только двух этапов масштабирования. Необходимо отметить, что достаточно обозначить или обязательные или, предпочтительно, необязательные наборы параметров, так как тип соответственно необозначенного набора параметров автоматически следует из отсутствия обозначения.
Фиг.1A изображает схематическое представление потока данных, который в варианте осуществления, показанном на фиг.1A, включает в себя, прежде всего, блок 10 управления, блок, в котором находятся данные М каналов передачи, который обозначается 11, и блоки 12а, 12b, … 12с для каждого набора параметров. В предпочтительном варианте осуществления настоящего изобретения блок 10 управления включает в себя различные индивидуальные части информации, схематически изображенные на фиг.1B. Таким образом, введенные данные 100 в блоке 10 управления сигнализируют о количестве обязательных наборов параметров при помощи поля с названием “numBccDataMand”. Кроме того, поле 101 сигнализирует, имеются ли необязательные наборы параметров. Поле, обозначенное “OptBccDataPresent”, используется для этой цели. Другое поле блока 10 управления дополнительно сигнализирует о количестве необязательных наборов параметров с переменной “numBccDataOpt”. Другие блоки 103, 104, 105 сигнализируют тип и/или номер версии набора i параметров для каждого набора параметров. Поле с названием “BccDataId” используется для этого. Дополнительная необязательная последовательность полей 106, 107, 108 дает необязательную информацию о длине, обозначенную “Lengthinfo” для каждого набора параметров, обозначенного как необязательный, т.е. который включается в количество необязательных наборов параметров. Эта информация о длине дает длину в битах соответствующего связанного, например i-ого, набора параметров. Как описано ниже, “Lengthinfo” также может включать в себя информацию о количестве битов, необходимых для сигнализирования о длине или, альтернативно, также о фактическом определении длины.
Фиг.3A-3D изображают предпочтительный вид конфигурации набора параметров. Конфигурация набора параметров может выполняться для каждого кадра, но также может выполняться, например, только один раз для группы кадров, например, в начале файла, содержащего многие кадры. Таким образом, фиг.3A предоставляет определение присутствия и количество необязательных наборов параметров в псевдокоде, в котором “uimsbf” означает «целое число без знака и с самым старшим битом впереди», т.е. целое число, которое не включает в себя никакого знака и самые старшие биты которого находятся впереди в потоке данных. Таким образом, переменная numBccData, задающая количество данных БКУС, представлена первой, например, в поле 100 блока 10 управления.
Кроме того, поле 101 используется для установления, имеются ли вообще какие-либо необязательные наборы параметров (optBccDataPresent). После этого количество (numBccDataOpt) необязательных наборов параметров считывается для получения дополнительной информации по необязательным наборам параметров или так называемые «порции» (OptChunkInfo), когда это будет выполнено. Переменная numBccDataOptM1 содержит суффикс «М1», означающий «минус 1». Это снова уравновешивается добавлением «+1» на фиг.3D.
Фиг.3B изображает общий вид значения, которое, в варианте осуществления, идентификатор данных набора параметров может иметь в полях 103-105. Таким образом, переменная “BccDataId”, прежде всего, может включать в себя имя, т.е. тип параметра, т.е. МКРУ, МКВР и МКК, и одновременно номер V1 или V2 версии соответственно. Таким образом, на фиг.3B должно быть видно, что поток данных фактически может содержать межканальные разности уровней первой версии V1 и более поздней второй версии V2 одновременно, причем выполненный соответствующим образом декодер для первой версии может просто считывать ICLD_V1 в качестве обязательного набора параметров и может игнорировать ICLD_V2, тогда как декодер с более высоким номером версии может просто считывать ICLD_V2 именно в качестве обязательного набора параметров, игнорируя, однако, ICLD_V1 в качестве набора параметров, только необязательно требуемого в данном сценарии. Альтернативно, набор данных может быть записан, так что обязательные наборы данных всегда присутствуют только в одной версии в потоке данных.
Фиг.3C изображает идентификацию необязательных наборов параметров. Таким образом, в информации о необязательных наборах параметров идентификатор 103-105 набора параметров на фиг.1B считывается для каждого набора параметров для получения информации о каждом наборе параметров, который является необязательным. Кроме того, длина набора параметров считывается для каждого необязательного набора параметров, если она была передана в потоке битов, представленная командой “OptChunkLen()” на фиг.3C.
Что касается определения информации о длине для необязательных наборов параметров, смотрите фиг.3D, которая иллюстрирует то, как в предпочтительном варианте осуществления настоящего изобретения длина в битах считывается для каждого набора параметров из данных, связанных с каждым необязательным набором параметров.
Цикл считывания набора параметров, выполняемый декодером, схематически изображается на фиг.4A. Таким образом, фактические данные набора параметров, которые находятся в блоках 12а-12с на фиг.1, считываются при помощи BccData().
Считывание информации о длине иллюстрируется на фиг.4B. Например, BccDataLenBits описывает количество битов, необходимых для сигнализировании о фактической длине битов порции. BccDataLen затем фактически дает длину в битах, которую имеет порция. Эта двухступенчатая система является гибкой, с одной стороны, и экономит данные, с другой стороны, так как она особенно эффективна, когда порции имеют сильно изменяющуюся длину в битах, которая конкретно применяется к наборам параметров очень различающихся типов и, таким образом, длины. Это дает возможность выполнять определение в будущем других порций, имеющих почти любую длину.
Фиг.4C, наконец, представляет переключатель наборов параметров, в котором оценивается идентификатор набора параметров, как изображено на фиг.3B, так что наборы параметров связываются с соответствующими алгоритмами восстановления, так что не имеет место случай, что, например, межканальные разности уровней принимаются за межканальные временные разности, и наоборот.
Фиг.4C также изображает, что, когда набор параметров был идентифицирован как необязательный и не является желательным декодирование с использованием необязательного набора параметров, количество битов этого набора параметров пропускается («пропустить и продолжить») для начала вывода без учета дополнительных необязательных наборов параметров, когда все обязательные наборы параметров были считаны (или имеются данные, неизвестные для декодера, например, наборы параметров) («остановить синтаксический анализ, начать вывод»). Такой декодер, таким образом, начинает вывод, когда он уже считал по меньшей мере одну обязательную порцию, и он не может выполнить синтаксический анализ дальнейшей информации в потоке данных. Таким образом, декодер не склоняется к полной ошибке, выводимой содержимым потока данных, который он не понимает. Это создает очень устойчивый к ошибкам декодер.
Ниже более подробно описываются функциональные возможности настоящего изобретения на основании предпочтительных вариантов осуществления настоящего изобретения. Например, параметрическая информация различных типов, такая как МКРУ, МКВР, МКК и другая информация наборов параметров, которая может быть определена в будущем, размещается в различных и отдельных частях данных, т.е. на различных уровнях масштабирования. С этой целью смотрите снова фиг.4A-4C. Наборы параметров дифференцируются на обязательные (или необходимые) наборы параметров, такие как наборы параметров с межканальными разностями уровней, и необязательные наборы параметров, такие как наборы параметров с межканальными временными разностями и наборы параметров со значениями межканальной корреляции.
Предусматривается информация о количестве обязательных наборов параметров (numBccDataMand) и присутствии (OptBccDataPresent) и о количестве необязательных наборов параметров (numBccDataOpt). Обычно информация о количестве обязательных наборов параметров (numBccDataMand) зависит от технических требований на систему и, таким образом, необязательно ее явно передавать, но она может быть фиксированно установлена между кодером и декодером. В противоположность этому предпочтительно явно передавать количество необязательных наборов параметров (numBccDataOpt). Когда параметр присутствия (OptBccDataPresent) указывает присутствие необязательных наборов параметров, как изображено на фиг.3A, начинается соответствующая оценка информации о необязательных наборах параметров.
В предпочтительном варианте осуществления настоящего изобретения дополнительно предусмотрен идентификатор (BccDataId) для каждого набора параметров. Этот идентификатор предоставляет информацию о типе набора параметров, таком как МКРУ, МКВР или МКК и/или версии синтаксиса некоторого набора параметров, что также изображено на фиг.3B. Обычно идентификатор для обязательных наборов параметров сигнализируется неявно, тогда как идентификатор для необязательных параметров сигнализируется явно. В этом случае, однако, должно быть установлено между кодером и декодером, что, например, первый встреченный набор параметров является обязательным набором параметров, который в фиксировано установленном сценарии включает в себя, например, наборы параметров с межкадровыми разностями уровней. Альтернативно, информация о типе набора параметров также может определяться неявно посредством задания порядка типов наборов параметров.
Наборы параметров предпочтительно включают в себя информацию о длине набора параметров. Предоставление такой информации о длине набора параметров дает возможность декодеру игнорировать этот набор параметров простым пропуском связанных с ним битов даже без необходимости знания декодером точного синтаксиса потока битов набора параметров. С этой целью смотрите фиг.4B.
В предпочтительном варианте осуществления настоящего изобретения обязательные наборы параметров, таким образом, не включают в себя информацию о длине набора параметров, так как декодер так или иначе должен выполнить синтаксический анализ и обработать данные обязательного набора параметров в любом случае вместо возможности простого их отбрасывания. Таким образом, декодер может быть реализован так, чтобы предполагать, когда он находит набор параметров, и он не содержит никакой связанной с ним дополнительной информации, что набор параметров (например, МКРУ) представляет собой из числа установленных доступных наборов параметров и что, вследствие того факта, что он не включает в себя никакую соответствующую информацию, этот набор параметров представляет собой обязательный набор параметров.
Для необязательных наборов параметров информация о длине набора параметров может передаваться или не зависеть от случая применения. Простым примером может быть то, что для повышения возможности взаимодействия между кодером и декодером все необязательные наборы параметров включают в себя информацию о длине набора параметров. Однако для экономии битов информация о длине может не передаваться для последнего набора параметров, так как больше нет необходимости пропускать эти данные и получать доступ к последующему набору параметров, так как набор параметров так или иначе представляет собой последний набор параметров. Эта процедура, очевидно, является полезной, когда блок данных, как изображено на фиг.1A, фактически завершается i-ым набором 12с параметров и когда впоследствии, например, больше нет управляющей информации и т. д. для блока суммарного сигнала и/или М каналов передачи, только что обработанных.
Явное сигнализирование может быть, например, в соответствии с информацией 32 о доступности ресурсов (фиг.2B), передача информации о длине параметров может сигнализироваться кодером при помощи элемента потока битов, который информирует декодер о присутствии/длине информации о длине набора параметров, как уже изображено на основе фиг.3D.
Ниже обсуждается предпочтительный вариант осуществления для процесса декодирования декодера, показанного на фиг.2B. Предпочтительный декодер сначала проверяет доступность обязательного (необходимого) набора параметров, которым, предпочтительно, будет набор параметров с межканальными разностями уровней. Если, кроме того, номер версии синтаксиса набора параметров МКРУ выше номера версии, который сам декодер может декодировать, причем декодер, например, поддерживает версии синтаксиса с 1 по n, восстановление не может быть выполнено средством 31 для восстановления по фиг.2B. Во всех других случаях определенный вид процесса достоверного декодирования может выполняться посредством декодирования обязательного набора параметров, и, когда не используются необязательные наборы параметров, выполнения многоканального синтеза, используя только обязательный набор параметров.
Однако, когда декодер обнаруживает необязательный набор параметров, он может использовать его или отбросить его содержимое. Какая одна из двух возможностей выбирается, зависит, например, от описанного ниже сценария.
Если номер версии синтаксиса необязательного набора параметров выше, чем возможности установленной версии синтаксиса самого декодера для этого типа набора параметров, то этот тип набора параметров не может быть обработан декодером и будет пропущен. В этом случае, однако, все же достигается достоверное декодирование без выполнения улучшенного многоканального восстановления, используя тип необязательного набора параметров. Однако, если содержимое необязательного набора параметров может учитываться, в зависимости от возможностей декодера, восстановление будет более высокого качества.
Например, необходимо отметить, что синтез, использующий значения межканальной когерентности, может занимать значительное количество вычислительных ресурсов. Таким образом, декодер малой сложности, например, может игнорировать этот набор параметров в зависимости от информации об управлении ресурсами, тогда как декодер, который может предоставить более высокое качество вывода, для восстановления будет извлекать и использовать все наборы параметров, т.е. как обязательные, так и необязательные наборы параметров. В предпочтительном варианте осуществления решение об использовании/отбрасывании набора параметров принимается на основе доступности вычислительных ресурсов в соответствующий момент времени, т.е. динамически.
Идея изобретения предоставляет возможность совместимого обновления формата потока битов для необязательных, т.е. дополнительных типов наборов параметров, без создания помех декодируемости существующими декодерами, т.е. обратной совместимости. Кроме того, настоящее изобретение гарантирует в любом случае, что более старые декодеры будут генерировать недостоверный выходной сигнал, который в наихудшем случае даже может приводить к разрушению громкоговорителей, когда обновление синтаксиса выполняется посредством повышения номера версии синтаксиса обязательного набора параметров, т.е. информации МКРУ, или необязательно, как изображено, например, полем “BccDataId” №4 на фиг.3B.
Идея изобретения, таким образом, отличается от классического синтаксиса потока битов, в котором декодер должен знать весь синтаксис каждого набора параметров, который может использоваться в потоке битов, чтобы иметь возможность сначала считать все наборы параметров в первом месте, затем иметь возможность запустить соответствующие элементы процессора, такие как те, которые изображены на фиг.7, с соответствующими параметрами. Обладающий признаками изобретения декодер будет пропускать блоки 126 и 128, когда только межканальные разности уровней были извлечены в качестве обязательного набора параметров, для выполнения многоканального восстановления, хотя и худшего качества.
Итак, ниже еще раз будут представлены существенные признаки кодера, которые могут выгодно использоваться декодером для достижения эффективного и высококачественного декодирования с потоком данных с низкой скоростью передачи данных.
Если набор параметров менее важен, чем другой набор параметров при восстановлении К выходных каналов в отношении качества восстановленного многоканального сигнала, то средство 25 для записи выполняется с возможностью записи набора данных, так что возможно восстановление без использования менее важного набора данных.
Предпочтительно, чтобы средство 25 для записи дополнительно было выполнено с возможностью предоставления набора параметров со связанным с ним идентификатором 100-105, в котором идентификатор для набора параметров указывает, что набор параметров безусловно должен использоваться для восстановления, или в котором идентификатор для другого набора параметров указывает, что набор параметров может использоваться только необязательно для восстановления.
Предпочтительно, чтобы средство 25 для записи дополнительно было выполнено с возможностью записи М каналов передачи в часть 11 каналов передачи набора данных потока данных, записи первого набора параметров в часть 12а первого набора параметров и записи второго набора параметров в часть 12b второго набора параметров, так что декодер может восстанавливать К выходных каналов без считывания и интерпретирования части (12b) второго набора параметров.
Если наборы параметров выбираются из следующей группы, включающей в себя межканальные разности уровней, межканальные временные разности, межканальные разности фаз или информацию о межканальной когерентности, средство 25 для записи выполняется с возможностью обозначения набора параметров с межканальными разностями уровней в качестве обязательного для декодирования и обозначения по меньшей мере одного другого набора параметров из группы в качестве необязательного для декодирования.
Предпочтительно, чтобы средство 25 для записи было выполнено с возможностью предоставления второго набора параметров с информацией 106-108 о длине, указывающей, какое количество данных в наборе данных принадлежит второму набору параметров, так что декодер способен пропустить количество данных, основанное на информации о длине, в котором информация о длине предпочтительно содержит первое поле для сигнализирования о длине в битах поля длины и в котором поле длины содержит длину в битах, посредством которой определяется количество битов второго набора параметров.
Предпочтительно, чтобы средство 25 для записи дополнительно было выполнено с возможностью записи информации 102 о количестве в поток данных, указывающей количество необязательных наборов параметров, без которых декодером может выполняться восстановление К выходных каналов.
Предпочтительно, чтобы средство 25 для записи дополнительно было выполнено с возможностью связывания информации 103-105 о версии синтаксиса с наборами параметров, так что декодер будет выполнять восстановление, используя соответствующий набор параметров только тогда, когда информация о версии синтаксиса имеет предварительно определенное состояние.
Предпочтительно, чтобы имелась информация о версии синтаксиса дополнительно только для второго набора параметров и дополнительных необязательных наборов параметров, если применимо.
Кроме того, последний необязательный набор параметров в последовательности наборов параметров в потоке данных может не содержать никакой связанной с ним информации о длине.
Кроме того, средство 25 для записи может быть выполнено с возможностью сигнализирования о присутствии и длине информации о длине набора параметров динамически в потоке данных.
Средство 25 для предоставления может быть выполнено с возможностью предоставления последовательности блоков данных для М каналов передачи, которая основана на последовательности блоков временных выборок по меньшей мере одного исходного канала.
В зависимости от обстоятельств обладающий признаками изобретения способ генерирования и/или декодирования может быть реализован аппаратными средствами или программными средствами. Реализация может быть выполнена на носителе цифровых данных, в частности на гибком диске или компакт-диске, имеющем сигналы управления, которые могут считываться электронным образом, которые могут взаимодействовать с программируемой компьютерной системой так, что исполняется способ. В общих чертах, изобретение, таким образом, также заключается в компьютерном программном продукте, имеющем программный код, хранимый на считываемом машиной носителе, для выполнения способа, когда компьютерный программный продукт выполняется на компьютере. Другими словами, изобретение, таким образом, может быть реализовано в виде компьютерной программы, имеющей программный код для выполнения способа, когда компьютерная программа выполняется на компьютере.

Claims (19)

1. Устройство для генерирования кодированного многоканального сигнала, представляющего некодированный многоканальный сигнал, содержащий N исходных каналов, причем N равно или больше 2, содержащее
средство (22) для предоставления параметрической информации (24а, 24b, 24с) для восстановления К выходных каналов из М каналов (23) передачи, причем М равно или больше 1 и равно или меньше N, причем К больше М и равно или меньше N, при этом параметрическая информация содержит, по меньшей мере, один первый набор параметров и другой второй набор параметров для восстановления одного и того же выходного канала, причем второй набор параметров содержит связанный с ним идентификатор (103-105) набора параметров; и
средство (25) для записи потока (26) данных, причем средство (25) для записи выполнено с возможностью записи первого и второго наборов параметров в поток данных, так что восстановление, по меньшей мере, одного из К выходных каналов выполняют, если декодируют кодированный многоканальный сигнал, с использованием первого набора параметров, с возможностью пропуска второго набора параметров и с использованием, по меньшей мере, одного из М каналов (23) передачи.
2. Устройство для декодирования кодированного многоканального сигнала, представляющего некодированный многоканальный сигнал, содержащий N исходных каналов, причем кодированный многоканальный сигнал представлен потоком данных, содержащим параметрическую информацию для восстановления К выходных каналов из М каналов передачи, причем М равно или больше 1 и равно или меньше N, причем К больше М и равно или меньше N, при этом параметрическая информация содержит, по меньшей мере, два различных набора параметров для восстановления одного и того же выходного канала, и первый и второй наборы параметров записаны в поток данных, так что восстановление К выходных каналов выполняют, если декодируют кодированный многоканальный сигнал, с использованием первого набора параметров и с возможностью пропуска второго набора параметров, причем второй набор параметров содержит связанный с ним идентификатор (103-105) набора параметров, содержащее
средство (28) считывания потока данных, предназначенное для считывания потока данных для считывания первого набора (30а) параметров и пропуска второго набора (30b) параметров, когда идентификатор набора параметров, связанный со вторым набором параметров, не совместим с данным идентификатором набора параметров устройства для декодирования, и для считывания второго набора параметров, когда идентификатор набора параметров совместим с данным идентификатором набора параметров.
3. Устройство по п.2, дополнительно содержащее
средство (31) восстановления, предназначенное для восстановления К выходных каналов с использованием М каналов передачи и первого набора параметров, но с возможностью пропуска второго набора параметров.
4. Устройство по п.2, в котором первый набор параметров содержит связанный с ним идентификатор (103-105) набора параметров, и
в котором средство (28) считывания выполнено с возможностью считывания связанного с ним идентификатора набора параметров и запуска средства (31) восстановления, так что восстановление выполняется посредством средства восстановления только тогда, когда считанный идентификатор набора параметров совместим с данным идентификатором набора параметров устройства для декодирования.
5. Устройство по п.2, в котором второй набор параметров содержит информацию о длине, указывающую количество данных связанного с ней второго набора параметров, и в котором средство (28) считывания выполнено с возможностью пропуска количества данных в наборе данных, указанного информацией о длине, на основании информации о длине, без синтаксического анализа данных второго набора параметров.
6. Устройство по п.2, в котором средство (28) считывания является управляемым (32) для получения информации о доступности ресурсов, и
в котором средство (28) считывания дополнительно выполнено с возможностью считывания второго набора параметров, когда информация о доступности ресурсов указывает достаточные ресурсы, и пропуска второго набора параметров, когда информация о доступности ресурсов указывает недостаточные ресурсы.
7. Устройство по п.2, в котором один набор параметров является менее важным, чем другой набор параметров при восстановлении К выходных каналов в отношении качества восстановленного многоканального сигнала, и в котором средство (28) считывания потока данных выполнено с возможностью пропуска менее важного набора данных.
8. Устройство по п.2, в котором поток данных содержит набор параметров со связанным с ним идентификатором (100-105), причем идентификатор для набора параметров указывает, что набор параметров безусловно используется для восстановления, или идентификатор для другого набора параметров указывает, что набор параметров необязательно используется только для восстановления, при этом средство (28) считывания потока данных выполнено с возможностью обнаружения идентификатора и считывания обязательного набора параметров и пропуска необязательного набора параметров, на основании обнаруженного идентификатора.
9. Устройство по п.2, в котором поток данных содержит первый набор параметров в части (12а) первого набора параметров и второй набор параметров в части (12b) второго набора параметров, при этом средство считывания потока данных выполнено с возможностью интерпретирования потока данных в отношении частей набора параметров и считывания части первого набора параметров и пропуска части второго набора параметров.
10. Устройство по п.2, в котором наборы параметров выбраны из следующей группы, включающей в себя межканальные разности уровней, межканальные временные разности, межканальные разности фазы или информацию о межканальной когерентности, причем в потоке данных набор параметров с межканальными разностями уровней обозначается как безусловно необходимый для декодирования, и при этом, по меньшей мере, один другой набор параметров из группы обозначается как необязательный для декодирования, и в котором средство (28) считывания потока данных выполнено с возможностью считывания набора параметров с межканальными разностями уровней и пропуска другого набора параметров из группы.
11. Устройство по п.2, в котором поток данных содержит информацию (102) о количестве, указывающую количество необязательных наборов параметров, без которых декодером выполняется восстановление К выходных каналов, при этом средство считывания потока данных выполнено с возможностью считывания, по меньшей мере, одного необязательного набора параметров, на основании информации о количестве.
12. Устройство по п.2, в котором в потоке данных имеется связанный с ним идентификатор набора параметров для второго набора параметров и дополнительных необязательных наборов параметров, если применимы, при этом нет идентификатора набора параметров для первого набора параметров.
13. Устройство по п.1 или 2, в котором последний необязательный набор параметров в последовательности наборов параметров в потоке данных не содержит никакой связанной с ним информации о длине, при этом средство (28) считывания потока данных выполнено с возможностью не считывания и интерпретирования никакой информации о длине перед считыванием последнего необязательного набора параметров.
14. Устройство по п.2, в котором присутствие и длина информации о длине набора параметров сигнализированы динамически в потоке данных, и в котором средство (28) считывания потока данных выполнено с возможностью обнаружения сначала присутствия информации о длине набора параметров в потоке данных, а затем извлечения длины информации о длине набора параметров из потока данных на основании обнаруженного присутствия.
15. Устройство по п.3, в котором М каналов передачи представляют собой каналы бинаурального кодирования управляющих сигналов (БКУС) с преобразованием с уменьшением числа каналов, и наборы параметров включают в себя параметры БКУС, и в котором средство (32) восстановления выполнено с возможностью выполнения синтеза БКУС.
16. Способ генерирования кодированного многоканального сигнала, представляющего некодированный многоканальный сигнал, содержащий N исходных каналов, причем N равно или больше 2, заключающийся в том, что:
предоставляют (22) параметрическую информацию (24а, 24b, 24с) для восстановления К выходных каналов из М каналов (23) передачи, причем М равно или больше 1 и равно или меньше N, причем К больше М и равно или меньше N, при этом параметрическая информация содержит, по меньшей мере, два различных набора параметров для восстановления одного и того же выходного канала; и
записывают (25) поток (26) данных посредством записи первого и второго наборов параметров в поток данных, так что восстановление, по меньшей мере, одного из К выходных каналов выполняют, если декодируют кодированный многоканальный сигнал, с использованием первого набора параметров, с возможностью пропуска второго набора параметров и с использованием, по меньшей мере, одного из М каналов (23) передачи, причем второй набор параметров содержит связанный с ним идентификатор (103-105) набора параметров.
17. Способ декодирования кодированного многоканального сигнала, представляющего некодированный многоканальный сигнал, содержащий N исходных каналов, причем кодированный многоканальный сигнал представляют потоком данных, содержащим параметрическую информацию для восстановления К выходных каналов из М каналов передачи, причем М равно или больше 1 и равно или меньше N, причем К больше М и равно или меньше N, при этом параметрическая информация содержит, по меньшей мере, два различных набора параметров для восстановления одного и того же выходного канала, и первый и второй наборы параметров записывают в поток данных, так что восстановление К выходных каналов выполняют, если декодируют кодированный многоканальный сигнал, с использованием первого набора параметров и с возможностью пропуска второго набора параметров, причем второй набор параметров содержит связанный с ним идентификатор (103-105) набора параметров, заключающийся в том, что
считывают (28) поток данных для считывания первого набора (30а) параметров и пропуска второго набора (30b) параметров, когда идентификатор набора параметров, связанный со вторым набором параметров, не является совместимым с данным идентификатором набора параметров устройства для декодирования, и для считывания второго набора параметров, когда идентификатор набора параметров является совместимым с данным идентификатором набора параметров.
18. Машиночитаемый носитель, на котором сохранен программный код, считываемый компьютером для выполнения способа по п.16.
19. Машиночитаемый носитель, на котором сохранен программный код, считываемый компьютером для выполнения способа по п.17.
RU2007112113/09A 2004-09-03 2005-08-29 Устройство и способ генерирования кодированного многоканального сигнала и устройство и способ декодирования кодированного многоканального сигнала RU2379768C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004042819A DE102004042819A1 (de) 2004-09-03 2004-09-03 Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
DE102004042819.0 2004-09-03

Publications (2)

Publication Number Publication Date
RU2007112113A RU2007112113A (ru) 2008-10-20
RU2379768C2 true RU2379768C2 (ru) 2010-01-20

Family

ID=35094601

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2007112113/09A RU2379768C2 (ru) 2004-09-03 2005-08-29 Устройство и способ генерирования кодированного многоканального сигнала и устройство и способ декодирования кодированного многоканального сигнала

Country Status (17)

Country Link
US (1) US8145498B2 (ru)
EP (1) EP1763870B1 (ru)
JP (1) JP4856641B2 (ru)
KR (1) KR100908081B1 (ru)
CN (1) CN101044550B (ru)
AU (1) AU2005281937B2 (ru)
BR (1) BRPI0515623B1 (ru)
CA (1) CA2578190C (ru)
DE (1) DE102004042819A1 (ru)
ES (1) ES2454670T3 (ru)
HK (1) HK1107174A1 (ru)
IL (1) IL181469A (ru)
MX (1) MX2007002569A (ru)
NO (1) NO338928B1 (ru)
PL (1) PL1763870T3 (ru)
RU (1) RU2379768C2 (ru)
WO (1) WO2006027138A1 (ru)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP2008542816A (ja) 2005-05-26 2008-11-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の符号化及び復号化方法
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1974347B1 (en) * 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
WO2007091850A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
US8126152B2 (en) * 2006-03-28 2012-02-28 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for a decoder for multi-channel surround sound
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
CN101529898B (zh) 2006-10-12 2014-09-17 Lg电子株式会社 用于处理混合信号的装置及其方法
DE102007007830A1 (de) * 2007-02-16 2008-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms
US8612237B2 (en) * 2007-04-04 2013-12-17 Apple Inc. Method and apparatus for determining audio spatial quality
EP2083584B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
KR100998913B1 (ko) * 2008-01-23 2010-12-08 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
US8615316B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal
EP2169664A3 (en) * 2008-09-25 2010-04-07 LG Electronics Inc. A method and an apparatus for processing a signal
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2169665B1 (en) * 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
KR101600352B1 (ko) * 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
KR20100137159A (ko) * 2009-06-22 2010-12-30 삼성전자주식회사 방송 수신기 및 그의 채널 전환 방법
KR101751559B1 (ko) * 2009-10-30 2017-06-27 선 페이턴트 트러스트 복호방법, 복호장치, 부호화 방법 및 부호화 장치
EP2544465A1 (en) * 2011-07-05 2013-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral weights generator
US9451252B2 (en) 2012-01-14 2016-09-20 Qualcomm Incorporated Coding parameter sets and NAL unit headers for video coding
WO2013149670A1 (en) * 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Method for parametric spatial audio coding and decoding, parametric spatial audio coder and parametric spatial audio decoder
CA2870067C (en) * 2012-04-16 2017-01-17 Nokia Corporation Video coding and decoding using multiple parameter sets which are identified in video unit headers
US9602827B2 (en) 2012-07-02 2017-03-21 Qualcomm Incorporated Video parameter set including an offset syntax element
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
EP2717261A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
US20150340043A1 (en) * 2013-01-14 2015-11-26 Koninklijke Philips N.V. Multichannel encoder and decoder with efficient transmission of position information
JP6250071B2 (ja) 2013-02-21 2017-12-20 ドルビー・インターナショナル・アーベー パラメトリック・マルチチャネル・エンコードのための方法
KR20230020553A (ko) 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
US9565437B2 (en) 2013-04-08 2017-02-07 Qualcomm Incorporated Parameter set designs for video coding extensions
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
WO2016171002A1 (ja) * 2015-04-24 2016-10-27 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
FR3045915A1 (fr) * 2015-12-16 2017-06-23 Orange Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal
US10356800B2 (en) * 2016-05-09 2019-07-16 Qualcomm Incorporated Scalable numerology with symbol boundary alignment for uniform and non-uniform symbol duration in wireless communication
WO2019088863A1 (ru) * 2017-10-30 2019-05-09 Общество С Ограниченной Ответственностью "Теквел Разработка" Способ и компьютерное устройство для автоматического определения топологии связей
CN108039175B (zh) 2018-01-29 2021-03-26 北京百度网讯科技有限公司 语音识别方法、装置及服务器
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
US11528574B2 (en) 2019-08-30 2022-12-13 Sonos, Inc. Sum-difference arrays for audio playback devices

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
KR100335611B1 (ko) 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
JP2000151413A (ja) * 1998-11-10 2000-05-30 Matsushita Electric Ind Co Ltd オーディオ符号化における適応ダイナミック可変ビット割り当て方法
US6266782B1 (en) * 1998-11-30 2001-07-24 Siemens Information And Communication Networks, Inc. Apparatus and methods for inband protocol correction in distributed object networking
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
JP4244492B2 (ja) * 2000-03-24 2009-03-25 ソニー株式会社 情報処理装置、情報配信システム、情報処理方法、及び記録媒体
JP2001339311A (ja) * 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
US6718507B1 (en) * 2000-09-12 2004-04-06 At&T Corp. System and method for representing compressed information
JP2002175097A (ja) 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
DE60207731T2 (de) * 2001-08-03 2006-08-10 Koninklijke Philips Electronics N.V. Datenschutzsystem und -verfahren für audio-video übertragung
US8498422B2 (en) 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
ES2323294T3 (es) 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
KR101049751B1 (ko) 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US6903669B1 (en) * 2003-10-03 2005-06-07 Cirrus Logic, Inc. Systems and methods for decoding compressed data
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec

Also Published As

Publication number Publication date
CA2578190A1 (en) 2006-03-16
RU2007112113A (ru) 2008-10-20
US8145498B2 (en) 2012-03-27
NO338928B1 (no) 2016-10-31
IL181469A0 (en) 2007-07-04
MX2007002569A (es) 2007-07-05
HK1107174A1 (en) 2008-03-28
WO2006027138A1 (de) 2006-03-16
EP1763870B1 (de) 2014-03-05
PL1763870T3 (pl) 2014-08-29
EP1763870A1 (de) 2007-03-21
KR100908081B1 (ko) 2009-07-15
US20070219808A1 (en) 2007-09-20
NO20070903L (no) 2007-04-03
DE102004042819A1 (de) 2006-03-23
JP4856641B2 (ja) 2012-01-18
AU2005281937A1 (en) 2006-03-16
BRPI0515623A8 (pt) 2018-07-31
JP2008511848A (ja) 2008-04-17
ES2454670T3 (es) 2014-04-11
CN101044550B (zh) 2011-05-11
CA2578190C (en) 2012-09-11
IL181469A (en) 2011-09-27
BRPI0515623B1 (pt) 2019-05-21
AU2005281937B2 (en) 2008-10-09
KR20070051875A (ko) 2007-05-18
BRPI0515623A (pt) 2008-07-29
CN101044550A (zh) 2007-09-26

Similar Documents

Publication Publication Date Title
RU2379768C2 (ru) Устройство и способ генерирования кодированного многоканального сигнала и устройство и способ декодирования кодированного многоканального сигнала
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
RU2381570C2 (ru) Стереофонически совместимое кодирование многоканального звука
RU2327304C2 (ru) Совместимое многоканальное кодирование/декодирование
JP4519919B2 (ja) コンパクトなサイド情報を用いたマルチチャネルの階層的オーディオ符号化
EP1738356B1 (en) Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
JP4685925B2 (ja) 適応残差オーディオ符号化
TWI406267B (zh) 一種音頻解碼器、一種用於對多音頻物件信號進行解碼的方法、以及執行該方法的具有程式碼的程式
JP5366104B2 (ja) マルチチャネル・オーディオ信号の空間合成
US20070168183A1 (en) Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
JP2005517987A (ja) パラメトリックオーディオ符号化
JP2004046179A (ja) 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置
JP2005521921A (ja) 信号処理
TWI281356B (en) Device and method for generate a coded multi-channels signal and device and method for decode a coded multi-channels signal and recordable medium
Aggrawal et al. New Enhancements for Improved Image Quality and Channel Separation in the Immersive Sound Field Rendition (ISR) Parametric Multichannel Audio Coding System