RU2388176C2 - Почти прозрачная или прозрачная схема многоканального кодера/декодера - Google Patents

Почти прозрачная или прозрачная схема многоканального кодера/декодера Download PDF

Info

Publication number
RU2388176C2
RU2388176C2 RU2007135178/09A RU2007135178A RU2388176C2 RU 2388176 C2 RU2388176 C2 RU 2388176C2 RU 2007135178/09 A RU2007135178/09 A RU 2007135178/09A RU 2007135178 A RU2007135178 A RU 2007135178A RU 2388176 C2 RU2388176 C2 RU 2388176C2
Authority
RU
Russia
Prior art keywords
channel
signal
parameters
channels
residual
Prior art date
Application number
RU2007135178/09A
Other languages
English (en)
Other versions
RU2007135178A (ru
Inventor
Йонас ЛИНДБЛОМ (SE)
Йонас ЛИНДБЛОМ
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф
Publication of RU2007135178A publication Critical patent/RU2007135178A/ru
Application granted granted Critical
Publication of RU2388176C2 publication Critical patent/RU2388176C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Error Detection And Correction (AREA)
  • Dc Digital Transmission (AREA)
  • Glass Compositions (AREA)
  • Optical Measuring Cells (AREA)
  • Structure Of Printed Boards (AREA)
  • Piezo-Electric Transducers For Audible Bands (AREA)
  • Electroluminescent Light Sources (AREA)
  • Devices For Indicating Variable Information By Combining Individual Elements (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

Изобретение относится к схемам многоканального кодировани, и, в частности, к схемам параметрического кодирования. Схема многоканального кодера/декодера дополнительно предпочтительно формирует остаточный сигнал (16) волновой формы. Этот остаточный сигнал (18) передается с одним или более многоканальных параметров (14) в декодер. Технический результат, достигаемый при реализации изобретения, состоит в том, что в отличие от чисто параметрического многоканального декодера предлагаемый декодер формирует многоканальный выходной сигнал, имеющий более оптимальное выходное качество благодаря дополнительному остаточному сигналу. 13 н. и 16 з.п. ф-лы, 14 ил.

Description

Область техники, к которой относится изобретение
Настоящее изобретение относится к схемам многоканального кодирования и, в частности, к схемам параметрического многоканального кодирования.
Уровень техники
Сегодня две методики доминируют для использования стереоизбыточности и нерелевантности, содержащихся в стереофонических звуковых сигналах. Стереофоническое кодирование с выделением центрального и бокового канала (M/S) [1] в первую очередь направлено на уменьшение избыточности и основано на том факте, что поскольку зачастую два канала достаточно коррелированны, лучше кодировать сумму и разность между ними. В таком случае большее (относительно) число битов может быть расходовано на суммирующий сигнал большой мощности, чем на боковой (или разностный) сигнал. Стереофоническое кодирование по интенсивности [2, 3], с другой стороны, добивается уменьшения избыточности посредством замены, в каждом поддиапазоне, двух сигналов на суммирующий сигнал и азимутальный угол. В декодере азимутальный параметр используется для того, чтобы управлять пространственным расположением слухового события, представляемого посредством суммирующего сигнала поддиапазона. Кодирование с выделением центрального и разностного канала и по интенсивности используются в значительной степени в существующих стандартах аудиокодирования [4].
Проблема M/S-подхода касательно использования избыточности заключается в том, что если два компонента не совпадают по фазе (один задерживается относительно другого), эффективность M/S-кодирования значительно снижается. Это концептуальная проблема, поскольку временные задержки часто встречаются в реальных аудиосигналах. Например, пространственный порог слышимости базируется во многом на разности времен сигналов (особенно на низких частотах) [5]. В аудиозаписях задержки времен могут возникать как из настроек стереофонического микрофона, так и из искусственной пост-обработки (звуковых эффектов). При кодировании с разнесением центрального и разностного канала специализированное решение зачастую используется для вопроса задержки времен. M/S-кодирование часто используется, когда мощность разностного сигнала меньше постоянного множителя мощности суммирующего сигнала [1]. Проблема выравнивания лучше разрешается в [6], где один из компонентов сигнала прогнозируется из другого. Фильтры прогнозирования выводятся на покадровой основе в кодере и передаются как дополнительная информация. В [7] рассматривается обратная адаптивная альтернатива. Отметим, что прирост производительности очень сильно зависит от типа сигнала, но для определенных типов сигналов достигается существенный прирост в сравнении с M/S-стереокодированием.
В последнее время значительное внимание уделялось параметрическому стереокодированию [8-11]. На основе основного монокодера (одноканального) эти параметрические схемы извлекают стереокомпонент (многоканальный) и кодируют его отдельно на низкой скорости передачи битов. Это можно рассматривать как обобщение стереокодирования по интенсивности. Способы параметрического стереокодирования, в частности, пригодны в диапазоне аудиокодирования с низкой скоростью передачи битов, где они приводят к существенному повышению качества расходования только небольшой части общего битового бюджета для стереокомпонента. Параметрические способы также являются привлекательными, поскольку они расширяемы для многоканального случая (более двух каналов) и могут предоставлять обратную совместимость. Объемное MP3-звучание [12] является одним подобным примером, где многоканальные данные кодируются и передаются во вспомогательном поле потока данных. Это позволяет приемным устройствам без многоканальных возможностей декодировать обычный стереосигнал, тогда как приемные устройства с поддержкой объемного звучания могут использовать многоканальный звук. Параметрические способы зачастую основываются на извлечении и кодировании различных психоакустических меток, главным образом, межканальных уровневых разностей (ICLD) и межканальных временных разностей (ICTD). В [11] сообщается, что параметр когерентности важен для результата естественного звучания. Тем не менее, параметрические способы ограничены в том смысле, что при более высоких скоростях передачи битов кодеры не могут достигать прозрачного качества вследствие внутреннего ограничения моделирования.
Проблемы, связанные с параметрическими многоканальными кодерами, заключаются в том, что их достижимое значение качества ограничено порогом, который значительно ниже их прозрачного качества. Параметрический порог качества показан как 1100 на фиг.11. Как можно видеть из схематичной кривой, представляющей зависимость "качество/скорость передачи битов" улучшенного BCC-монокодера (1102), качество не может пересекать параметрический порог 1100 качества независимо от скорости передачи битов. Это означает, что при увеличенной скорости передачи битов качество этого параметрического многоканального кодера не может увеличиваться в любом случае.
Улучшенный BCC-монокодер является примером используемых в настоящее время стереокодеров или многоканальных кодеров, в которых выполняется стереофоническое понижающее микширование или многоканальное понижающее микширование. Дополнительно, извлекаются параметры, описывающие межканальные уровневые взаимосвязи, межканальные временные взаимосвязи, межканальные взаимосвязи когерентности и т.д.
Параметры отличаются от волновой формы сигнала, такого как боковой сигнал кодера с выделением центрального и разностного канала, поскольку боковой сигнал описывает разность между двумя каналами в формате волновой формы в сравнении с параметрическим представлением, которое описывает сходства и различия между двумя каналами посредством задания определенного параметра вместо представления волновой формы по выборкам. Хотя параметры требуют небольшого числа битов для передачи от кодера в декодер, описания волновой формы, т.е. остаточные сигналы, извлекаемые в виде волновой формы, требуют большего числа битов и предоставляют возможность, в принципе, прозрачного восстановления.
Фиг.11 иллюстрирует типичную зависимость "качество/скорость передачи битов" этого традиционного основанного на волновой форме стереофонического кодера (1104). Из фиг.11 становится очевидным, что посредством все большего увеличения скорости передачи в битах качество традиционного стереофонического кодера, такого как стереофонический кодер с выделением центрального и разностного канала, возрастает все в большей степени до тех пор, пока качество не достигнет прозрачного качества. Предусмотрен тип "переходной скорости передачи битов", при которой характеристическая кривая 1102 для параметрического многоканального кодера и кривая 1104 для традиционного основанного на волновой форме сигнала пересекают друг друга.
Ниже этой переходной скорости передачи битов параметрический многоканальный кодер гораздо более оптимален, чем традиционный стереофонический кодер. Когда рассматривается одинаковая скорость передачи битов для обоих кодеров, параметрический многоканальный кодер предоставляет качество, которое выше качества традиционного основанного на волновой форме стереофонического кодера на разность 1108 качества. Иными словами, когда необходимо иметь определенное качество 1110, это качество может быть достигнуто с помощью параметрического кодера посредством скорости передачи битов, которая уменьшена на разностную скорость 1112 передачи битов в сравнении с традиционным основанным на волновой форме стереофоническим кодером.
Выше этой переходной скорости передачи битов ситуация полностью отличается. Поскольку параметрический кодер находится при максимальном пороге 1100 качества параметрического кодера, лучшее качество может быть получено посредством использования традиционного основанного на волновой форме стереофонического кодера с помощью такого же числа битов, что и в параметрическом кодере.
Сущность изобретения
Цель настоящего изобретения заключается в том, чтобы предоставить схему кодирования/декодирования, предоставляющую более высокое качество и меньшую скорость передачи битов по сравнению с используемыми схемами многоканального кодирования.
В соответствии с первым аспектом настоящего изобретения эта цель достигается посредством многоканального кодера для кодирования исходного многоканального сигнала, имеющего, по меньшей мере, два канала, содержащего: поставщик параметров для предоставления одного или более параметров, при этом один или более параметров сформированы таким образом, что восстановленный многоканальный сигнал может быть сформирован с помощью одного или более каналов понижающего микширования, извлеченных из многоканального сигнала, и одного или более параметров; остаточный кодер для формирования закодированного остаточного сигнала на основе исходного многоканального сигнала, одного или более каналов понижающего микширования или одного или более параметров, так чтобы восстановленный многоканальный сигнал, когда сформирован с помощью остаточного сигнала, был в большей степени аналогичен исходному многоканальному сигналу, чем когда сформирован без использования остаточного сигнала; и формирователь потоков данных для формирования потока данных, имеющего остаточный сигнал и один или более параметров.
В соответствии со вторым аспектом настоящего изобретения эта цель достигается посредством многоканального декодера для декодирования закодированного многоканального сигнала, имеющего один или более каналов понижающего микширования, один или более параметров и закодированный остаточный сигнал, содержащего: остаточный декодер для формирования декодированного остаточного сигнала на основе закодированного остаточного сигнала; и многоканальный декодер для формирования первого восстановленного многоканального сигнала с помощью одного или более каналов понижающего микширования и одного или более параметров, при этом многоканальный декодер дополнительно функционирует для формирования второго восстановленного многоканального сигнала с помощью одного или более каналов понижающего микширования и декодированного остаточного сигнала вместо первого восстановленного многоканального сигнала или в дополнение к первому многоканальному сигналу, причем второй восстановленный многоканальный сигнал в большей степени аналогичен исходному многоканальному сигналу, чем первый восстановленный многоканальный сигнал.
В соответствии с третьим аспектом настоящего изобретения эта цель достигается посредством многоканального кодера для кодирования исходного многоканального сигнала, имеющего, по меньшей мере, два канала, содержащего: блок выравнивания по времени для выравнивания первого канала и второго канала из, по меньшей мере, двух каналов с помощью параметра выравнивания; блок понижающего микширования для формирования канала понижающего микширования с помощью выровненных каналов; блок вычисления усиления для вычисления параметра усиления, не равного единице, для взвешивания выровненного канала, так чтобы разность между выровненными каналами была уменьшена в сравнении со значением усиления в единицу; и формирователь потоков данных для формирования потока данных, имеющего информацию канала понижающего микширования, информацию параметра выравнивания и информацию параметра усиления.
В соответствии с четвертым аспектом настоящего изобретения эта цель достигается посредством многоканального декодера для декодирования закодированного многоканального сигнала, имеющего информацию одного или более каналов понижающего микширования, информацию параметра усиления и информацию параметра выравнивания, содержащего: декодер каналов понижающего микширования для формирования декодированного сигнала понижающего микширования; и процессор для обработки декодированного канала понижающего микширования с помощью параметра усиления, чтобы получить первый декодированный выходной канал, и для обработки декодированного канала понижающего микширования с помощью параметра усиления и для того, чтобы рассогласовать с помощью параметра выравнивания, чтобы получить второй декодированный выходной канал.
Дополнительные аспекты настоящего изобретения включают в себя соответствующие способы, потоки данных/файлы и вычислительные программы.
Настоящее изобретение основано на обнаружении того, что проблемы, связанные с традиционными параметрическими кодерами и кодерами на основании волновой формы, разрешаются посредством комбинирования параметрического кодирования и кодирования на основе волновой формы. Такой изобретаемый кодер формирует масштабируемый поток данных, имеющий, в качестве первого улучшающего уровня, закодированное представление параметров и имеющий, в качестве второго улучшающего уровня, закодированный остаточный сигнал, которым предпочтительно является сигнал в виде волновой формы. Как правило, дополнительный остаточный сигнал, который не предоставляется в чисто параметрическом многоканальном кодере, позволяет повышать достижимое качество, в частности, между переходной скоростью передачи битов на фиг.11 и максимальным прозрачным качеством. Как можно видеть на фиг.11, даже ниже переходной скорости передачи битов алгоритм изобретаемого кодера превосходит чистый параметрический многоканальный кодер в отношении качества при сравнимых скоростях передачи битов. Тем не менее, в сравнении с полностью основанным на волновой форме традиционным стереофоническим кодером, изобретаемая комбинированная параметрическая/основанная на волновой форме схема кодирования/декодирования является гораздо более эффективной по битам. Иными словами, изобретаемые устройства оптимально комбинируют преимущества параметрического кодирования и основанного на волновой форме кодирования, так что даже выше переходной скорости передачи битов изобретаемый кодер извлекает выгоду из параметрической концепции, но превосходит традиционный параметрический кодер.
В зависимости от конкретных вариантов осуществления, преимущества настоящего изобретения превосходят параметрический кодер предшествующего уровня техники или традиционный основанный на волновой форме многоканальный кодер в большей или меньшей степени. Более усовершенствованные варианты осуществления предоставляют более оптимальную характеристику качества/скорости передачи битов, тогда как низкоуровневые варианты осуществления настоящего изобретения требуют меньшей вычислительной мощности на стороне кодера и/или декодера, но благодаря дополнительным закодированным остаточным сигналам обеспечивают более высокое качество, чем чистый параметрический кодер, поскольку качество чистого параметрического кодера ограничено пороговым качеством 1100 на фиг.11.
Предлагаемая схема кодирования/декодирования имеет преимущество в том, то она позволяет плавно перейти от чистого параметрического кодирования к аппроксимирующему волновую форму или совершенному прозрачному кодированию на основе волновой формы.
Предпочтительно параметрическое стереофоническое кодирование и стереофоническое кодирование с выделением центрального и разностного каналов комбинируются в схему, которая имеет возможность стремиться к прозрачному качеству. В этой предпочтительной стереосхеме с выделением центрального и разностного каналов корреляция между компонентами сигналов, т.е. левым каналом и правым каналом, используется более эффективно.
В общем, идея изобретения может быть применена в нескольких вариантах осуществления к параметрическому многоканальному кодеру. В одном варианте осуществления остаточный сигнал извлекается из исходного сигнала без использования информации параметров, также доступной в кодере. Этот вариант осуществления предпочтителен в случаях, когда вычислительная мощность и, возможно, энергопотребление процессора являются важными вопросами. Такой случай может возникать в "карманных" устройствах, имеющих ограниченные возможности по мощности, таких как мобильные телефоны, "наладонники" и т.д. Остаточный сигнал извлекается только из исходного сигнала и не базируется на понижающем микшировании или параметрах. Следовательно, на стороне декодера первый восстановленный многоканальный сигнал, который формируется с помощью канала понижающего микширования и параметров, не используется для формирования второго восстановленного многоканального сигнала.
Тем не менее, имеется некоторая избыточность в параметрах, с одной стороны, и в остаточном сигнале, с другой стороны. Снижение избыточности может быть достигнуто посредством других систем кодера/декодера, которые для вычисления закодированного остаточного сигнала используют информацию параметров, доступную в кодере, и, необязательно, канал понижающего микширования, который также может быть доступен в кодере.
В зависимости от конкретной ситуации, остаточный кодер может быть устройством анализа посредством синтеза, вычисляющим полный восстановленный многоканальный сигнал с помощью канала понижающего микширования и информации параметров. Затем на основе восстановленного сигнала может быть сформирован разностный сигнал для каждого канала, так что получается многоканальное представление ошибок, которое может быть обработано различными способами. Одним способом должно быть то, чтобы применять другую схему параметрического многоканального кодирования к многоканальному представлению ошибок. Другой возможностью должно быть то, чтобы осуществлять схему матрицирования для понижающего микширования многоканального представления ошибок. Еще одной возможностью должно быть то, чтобы удалять сигналы ошибки из левого и правого каналов объемного звучания, чтобы кодировать только сигнал ошибки центрального канала или, в дополнение, также кодировать сигнал ошибки левого канала и сигнал ошибки правого канала.
Таким образом, предусмотрено множество возможностей для реализации остаточного процессора на основе представления ошибок.
Вышеупомянутый вариант осуществления предоставляет большую гибкость для масштабируемого кодирования остаточного сигнала. Тем не менее, он является достаточно ресурсоемким в отношении вычислительной мощности, поскольку полное многоканальное восстановление выполняется в кодере, и представление ошибок для каждого канала многоканального сигнала должно быть сформировано и введено в остаточный процессор. На стороне декодера необходимо сначала вычислить первый восстановленный многоканальный сигнал, а затем на основе декодированного остаточного сигнала, который является любым представлением сигнала ошибки, должен быть сформирован второй восстановленный сигнал. Таким образом, вне зависимости от того факта, должен или нет быть выведен первый восстановленный сигнал, он должен быть вычислен на стороне декодера.
В другом предпочтительном варианте осуществления изобретения, подход анализа посредством синтеза на стороне кодера и вычисление первого восстановленного многоканального сигнала вне зависимости от того, должен или нет он быть выведен, заменен на прямое вычисление остаточного сигнала на стороне кодера. Оно основано на взвешенном исходном канале, который зависит от многоканального параметра, или основано на типе модифицированного понижающего микширования, которое также зависит от параметра выравнивания. В этой схеме дополнительная информация, т.е. остаточный сигнал, вычисляется неитеративно с помощью параметров и исходных сигналов, но без помощи одного или более каналов понижающего микширования.
Эта схема очень эффективная на стороне кодера и декодера. Когда остаточный сигнал не передается или выведен из масштабированного потока данных вследствие требований по пропускной способности, декодер в соответствии с изобретением автоматически формирует первый восстановленный многоканальный сигнал на основе канала понижающего микширования и параметров усиления и выравнивания, тогда как, когда вводится остаточный сигнал, не равный нулю, многоканальный блок восстановления не вычисляет первый восстановленный многоканальный сигнал, а вычисляет только второй восстановленный многоканальный сигнал. Таким образом, эта схема кодера/декодера выгодна в том, что она предоставляет более эффективное вычисление на стороне кодера, а также на стороне декодера, и использует представление параметров для уменьшения избыточности в остаточном сигнале, так что достигается высокоэффективная по вычислительной мощности и скорости передачи битов схема кодирования/декодирования.
Краткое описание чертежей
Предпочтительные варианты осуществления настоящего изобретения подробно описываются далее со ссылками на прилагаемые чертежи, из которых:
Фиг.1 - это блок-схема общего представления многоканального кодера в соответствии с изобретением;
Фиг.2 - это блок-схема общего представления многоканального декодера;
Фиг.3 - это блок-схема варианта осуществления на стороне кодера с низкой вычислительной мощностью;
Фиг.4 - это блок-схема варианта осуществления декодера для системы кодера по фиг.3;
Фиг.5 - это блок-схема варианта осуществления кодера, основанного на анализе посредством синтеза;
Фиг.6 - это блок-схема варианта осуществления декодера, соответствующего варианту осуществления кодера по фиг.5;
Фиг.7 - это общая блок-схема варианта осуществления прямого кодера, имеющего уменьшенную избыточность в закодированном остаточном сигнале;
Фиг.8 - это предпочтительный вариант осуществления декодера, соответствующего кодеру по фиг.7;
Фиг.9a - это предпочтительный вариант осуществления схемы кодера/декодера на основе концепции фиг.7 и фиг.8;
Фиг.9b - это предпочтительный вариант осуществления для варианта осуществления по фиг.9a, когда нет остаточного сигнала, а передаются только параметры выравнивания и усиления;
Фиг.9c - это набор уравнений, используемых на стороне кодера на фиг.9a и фиг.9b;
Фиг.9d - это набор уравнений, используемых на стороне декодера на фиг.9a и фиг.9b;
Фиг.10 - это вариант осуществления на основе гребенки фильтров анализа/гребенки фильтров синтеза для схемы по фиг.9a-9d; и
Фиг.11 иллюстрирует сравнение типичной производительности параметрических и традиционных основанных на волновой форме кодеров и кодера в соответствии с изобретением.
Подробное описание предпочтительных вариантов осуществления изобретения
Фиг.1 иллюстрирует предпочтительный вариант осуществления многоканального кодера для кодирования исходного многоканального сигнала, имеющего, по меньшей мере, два канала. Первым каналом может быть левый канал 10a, а вторым каналом может быть правый канал 10b в стереоокружении. Хотя варианты осуществления описываются в контексте стереосхемы, расширение до многоканальной схемы является прямым, поскольку многоканальное представление, имеющее, например, пять каналов, содержит несколько пар первого канала и второго канала. В контексте схемы объемного звучания 5.1 первым каналом может быть передний левый канал, а вторым каналом может быть передний правый канал. Альтернативно, первым каналом может быть передний левый канал, а вторым каналом может быть центральный канал. Альтернативно, первым каналом может быть центральный канал, а вторым каналом может быть передний правый канал. Альтернативно, первым каналом может быть задний левый канал (левый канал объемного звучания), а вторым каналом может быть задний правый канал (правый канал объемного звучания).
Предлагаемый кодер может включать в себя блок 12 понижающего микширования для формирования одного или более каналов понижающего микширования. В стереоокружении блок 12 понижающего микширования формирует один канал понижающего микширования. Тем не менее, в многоканальном окружении блок 12 понижающего микширования может формировать несколько каналов понижающего микширования. Тем не менее, в многоканальном окружении 5.1 блок 13 понижающего микширования предпочтительно формирует два канала понижающего микширования. Как правило, число каналов понижающего микширования меньше числа каналов в исходном многоканальном сигнале.
Предлагаемый многоканальный кодер также включает в себя поставщик 14 параметров для предоставления одного или более параметров, причем один или более параметров формируются таким образом, что восстановленный многоканальный сигнал может быть сформирован с помощью одного или более каналов понижающего микширования, извлеченных из многоканального сигнала и одного или более параметров.
Существенно, что многоканальный кодер в соответствии с изобретением дополнительно включает в себя остаточный кодер 16 для формирования закодированного остаточного сигнала. Закодированный остаточный сигнал формируется на основе исходного многоканального сигнала, одного или более каналов понижающего микширования или одного или более параметров. В общем, закодированный остаточный сигнал формируется таким образом, чтобы восстановленный многоканальный сигнал, когда сформирован с помощью остаточного сигнала, в большей степени был аналогичен исходному многоканальному сигналу, чем когда сформирован без остаточного сигнала. Таким образом, закодированный остаточный сигнал предоставляет возможность того, что декодер формирует восстановленный многоканальный сигнал, имеющий более высокое качество, чем порог 1100 качества, показанный на фиг.11. Один или более параметров и закодированный остаточный сигнал вводятся в формирователь 18 потоков данных, который формирует поток данных, имеющий остаточный сигнал и один или более параметров. Предпочтительно, поток данных, выводимый посредством формирователя 18 потоков данных, является масштабированным потоком данных, имеющим первый улучшающий уровень, включающий в себя информацию по одному или более параметрам, и второй улучшающий уровень, включающий в себя информацию по закодированному остаточному сигналу. Как известно в данной области техники, различные уровни масштабирования в масштабированном потоке данных могут декодироваться отдельно, так что низкоуровневое устройство, такое как чистый параметрический кодер, находится в такой позиции, чтобы декодировать поток данных посредством простого игнорирования второго улучшающего уровня.
В одном варианте осуществления настоящего изобретения масштабированный поток данных также включает в себя, в качестве базового уровня, один или более каналов понижающего микширования. Тем не менее, настоящее изобретение также применимо в окружении, в котором пользователь уже обладает каналом понижающего микширования. Эта ситуация может возникать тогда, когда каналом понижающего микширования является моно- или стереофонический сигнал, который пользователь уже принял посредством другого канала передачи или посредством того же канала передачи в сравнении с приемом первого улучшающего уровня и второго улучшающего уровня. Когда имеется отдельная передача канала(ов) понижающего микширования и первого и второго улучшающих уровней, кодер необязательно должен включать в себя блок 12 понижающего микширования. Эта ситуация показана пунктирной линией блока понижающего микширования.
Дополнительно, поставщик 14 параметров необязательно должен вычислять параметры на основе первого и второго исходных каналов. В ситуациях, когда параметры для определенного сигнала канала уже существуют, достаточно предоставить уже сформированные параметры в кодер по фиг.1, с тем чтобы эти параметры предоставлялись в формирователь 18 потоков данных и в остаточный кодер, чтобы необязательно быть использованными для вычисления остаточного сигнала, а также чтобы быть введенными в масштабированный поток данных. Тем не менее, предпочтительно, остаточный кодер дополнительно использует параметры, как показано пунктирной соединительной линией 19.
В предпочтительном варианте осуществления настоящего изобретения остаточный кодер 16 может контролироваться посредством отдельного входного сигнала управления скоростью передачи в битах. В этом случае остаточный кодер содержит определенный кодер с потерями, такой как квантователь, имеющий управляемый размер шага квантователя. Когда большой размер шага квантователя передается посредством блока управления скоростью передачи битов, закодированный остаточный сигнал имеет меньший диапазон значений (наибольший индекс квантования, выведенный посредством квантователя) в сравнении со случаем, когда меньший размер шага квантователя передается посредством блока управления скоростью передачи битов. Большой размер шага квантователя приводит к меньшему требованию по битам для закодированного остаточного сигнала, а следовательно, приводит к масштабированному потоку данных, имеющему сниженную скорость передачи битов в сравнении со случаем, когда квантователь в остаточном кодере 16 имеет меньший размер шага квантователя, приводящий к закодированному остаточному сигналу, требующему большее число битов.
Собственно говоря, вышеприведенные замечания применимы к масштабированному квантованию. Тем не менее, вообще говоря, предпочтительно использовать кодер, имеющий управляемое разрешение, который основан на методике векторного квантования. Когда разрешение высокое, большее число битов требуется для кодирования остаточного сигнала в сравнении со случаем, в котором разрешение низкое.
Фиг.2 иллюстрирует предпочтительный вариант осуществления изобретаемого многоканального декодера, который может быть использован в связи с кодером по фиг.1. В частности, фиг.2 иллюстрирует многоканальный декодер для декодирования закодированного многоканального сигнала, имеющего один или более каналов понижающего микширования, один или более параметров и закодированный остаточный сигнал. Вся эта информация, т.е. канал понижающего микширования, параметры и закодированные остаточные сигналы, включается в масштабированный поток 20 данных, вводимый в анализатор потоков данных, который извлекает закодированный остаточный сигнал из масштабированного потока 20 данных и перенаправляет закодированный остаточный сигнал в остаточный декодер 22. Аналогично, один или более предпочтительно закодированных каналов понижающего микширования предоставляются в декодер 24 понижающего микширования. Дополнительно, предпочтительно закодированные один или более параметров предоставляются в декодер 23 параметров, чтобы предоставить один или более параметров в декодированной форме. Информация, выводимая посредством блоков 22, 23 и 24, вводится в многоканальный декодер 25 для формирования первого восстановленного многоканального сигнала 26 или второго восстановленного многоканального сигнала 27. Первый восстановленный многоканальный сигнал формируется посредством многоканального декодера 25 с использованием одного или более каналов понижающего микширования и одного или более параметров, но без использования остаточного сигнала. Тем не менее, второй восстановленный многоканальный сигнал 27 формируется с помощью одного или более каналов понижающего микширования и декодированного остаточного сигнала. Поскольку остаточный сигнал включает в себя дополнительную информацию и, предпочтительно, информацию волновой формы, второй восстановленный многоканальный сигнал 27 в большей степени аналогичен исходному многоканальному сигналу (такому как каналы 10a и 10b на фиг.1), чем первый восстановленный многоканальный сигнал.
В зависимости от конкретной реализации многоканального декодера 25, многоканальный декодер 25 выводит либо первый восстановленный сигнал 26, либо второй восстановленный многоканальный сигнал 27. Альтернативно, многоканальный декодер 25 вычисляет первый восстановленный многоканальный сигнал в дополнение ко второму восстановленному многоканальному сигналу. Разумеется, во всех реализациях многоканальный декодер 25 выводит только первый восстановленный многоканальный сигнал, когда масштабированный поток данных включает в себя закодированный остаточный сигнал. Тем не менее, когда масштабированный поток данных - это процессы на пути от кодера к декодеру посредством отсечения второго улучшающего уровня, многоканальный декодер 25 выводит только первый восстановленный многоканальный сигнал. Это отсечение первого и второго улучшающего уровня может выполняться, когда был канал передачи на пути между кодером и декодером, который имел очень ограниченные ресурсы по полосе пропускания, так что передача масштабированного потока данных была возможна только без второго улучшающего уровня.
Фиг.3 и фиг.4 иллюстрируют один вариант осуществления изобретаемой концепции, который требует только меньшей вычислительной мощности на стороне кодера (фиг.3), а также на стороне декодера (фиг.4). Кодер по фиг.3 включает в себя стереофонический кодер 30 по интенсивности, который выводит монофонический сигнал понижающего микширования, с одной стороны, и параметрическую информацию стереонаправления интенсивности, с другой стороны. Монофоническое понижающее микширование, которое предпочтительно формируется посредством добавления первого и второго входного канала, вводится в блок 31 уменьшения скорости передачи данных. Для моноканала понижающего микширования блок 31 уменьшения скорости передачи данных может включать в себя любые из известных аудиокодеров, такие как MP3-кодер, AAC-кодер или любой другой аудиокодер моносигналов. Для параметрической информации направления блок 31 уменьшения скорости передачи данных может включать в себя любые из известных кодеров параметрической информации, например, разностный кодер, квантователь и/или кодер по энтропии, такой как кодер Хаффмана или арифметический кодер. Таким образом, блоки 30 и 31 на фиг.3 предоставляют функциональности, схематично проиллюстрированные посредством блоков 12 и 14 кодера по фиг.1.
Остаточный кодер 16 включает в себя блок 32 вычисления бокового сигнала и применяемый после него блок 33 уменьшения скорости передачи данных. Блок 32 вычисления бокового сигнала выполняет вычисление бокового сигнала, известное из стереокодеров с выделением центрального и разностного канала предшествующего уровня. Одним предпочтительным примером является вычисление разности по выборкам между первым каналом 10a и вторым каналом 10b, чтобы получить боковой сигнал волновой формы, который затем вводится в блок 33 уменьшения скорости передачи данных для сжатия по скорости передачи данных. Блок 33 уменьшения скорости передачи данных может включать в себя те же элементы, что и указанные выше относительно блока 31 уменьшения скорости передачи данных. На выходе блока 33 получается закодированный остаточный сигнал, который вводится в формирователь 18 потоков данных, так что получается предпочтительно масштабированный поток данных.
Поток данных, выводимый посредством блока 18, теперь включает в себя, в дополнение к монофоническому понижающему микшированию, параметрическую информацию стереонаправления интенсивности, а также закодированный остаточный сигнал волновой формы.
Блок 31 уменьшения скорости передачи данных может управляться посредством входного сигнала управления скоростью передачи битов, как уже описано в связи с фиг.1. В другом варианте осуществления блок 33 уменьшения скорости передачи данных выполнен с возможностью формирования масштабированного выходного потока данных, который имеет на своем базовом уровне остаток, закодированный с помощью небольшого числа битов на выборку, и который имеет на своем улучшающем уровне остаток, закодированный с помощью среднего числа битов на выборку, и который имеет на своем следующем улучшающем уровне остаток, закодированный с помощью также большего числа битов на выборку. Для базового уровня вывода блока уменьшения скорости передачи данных можно, например, использовать 0,5 битов на выборку. Для первого улучшающего уровня можно использовать, например, 4 бита на выборку, а для второго улучшающего уровня можно использовать, например, 16 битов на выборку.
Соответствующий декодер показан на фиг.4. Поток данных, входящий в анализатор 21 потоков данных, анализируется, чтобы отдельно выводить информацию выходных параметров в декомпрессор 23. Закодированная информация понижающего микширования вводится в декомпрессор 24, и закодированный остаточный сигнал вводится в остаточный декомпрессор 22. Декодер по фиг.4 дополнительно включает в себя прямой стереодекодер 40 по интенсивности и, помимо этого, декодер 41 с выделением центрального и разностного канала. Оба декодера 40 и 41 выполняют функции многоканального декодера 25, чтобы выводить первый восстановленный многоканальный сигнал 26, который формируется только посредством стереодекодера 40 по интенсивности, и выводить второй восстановленный многоканальный сигнал 27, который формируется посредством MS-декодера 41.
Когда поток данных включает в себя закодированный остаточный сигнал, прямая реализация по фиг.4 должна выводить первый восстановленный многоканальный сигнал 26, а также второй восстановленный многоканальный сигнал. Разумеется, только более оптимальный второй восстановленный многоканальный сигнал 27 интересует пользователя в данной ситуации. Следовательно, управление 42 декодером может быть предоставлено для измерения того, существует ли закодированный остаточный сигнал в потоке данных. Когда определено, что нет закодированного остаточного сигнала в потоке данных, управление 42 декодером функционирует так, чтобы деактивировать декодер 40 с выделением центрального и разностного канала, чтобы сэкономить вычислительную мощность, а следовательно, и мощность аккумуляторов, что особенно выгодно в "карманном" устройстве, таком как мобильный телефон и т.д.
Фиг.5 иллюстрирует еще один вариант осуществления настоящего изобретения, в котором закодированный остаточный сигнал формируется на основе подхода анализа посредством синтеза. Также первый и второй каналы 10a, 10b вводятся в блок 50 понижающего микширования, за которым следует блок 51 уменьшения скорости передачи данных. На выходе блока 51 предпочтительно сжатый сигнал понижающего микширования, имеющий один или более каналов понижающего микширования, получается и предоставляется в формирователь 18 потоков данных. Таким образом, блоки 50 и 51 предоставляют функциональность устройства 12 блока понижающего микширования по фиг.1. Дополнительно, первый и второй каналы 10a, 10b предоставляются в блок 53 вычисления параметров, и параметры, выводимые посредством блока вычисления параметров, перенаправляются в другой блок 54 уменьшения скорости передачи данных для сжатия одного или более параметров. Таким образом, блоки 53 и 54 предоставляют такую же функциональность, что и поставщик 14 параметров на фиг.1.
Тем не менее, в отличие от варианта осуществления по фиг.3, остаточный кодер 16 является более сложным. В частности, остаточный кодер 16 включает в себя параметрический многоканальный блок 55 восстановления. Многоканальный блок восстановления формирует, для примера с двумя каналами, первый восстановленный канал и второй восстановленный канал. Поскольку параметрический многоканальный блок восстановления использует только каналы понижающего микширования и параметры, качество восстановленного многоканального сигнала, выводимого посредством блока 55, соответствует кривой 1102 на фиг.11 и всегда ниже параметрического порога 1100 на фиг.11.
Восстановленный многоканальный сигнал вводится в блок 56 вычисления ошибок. Блок 56 вычисления ошибок функционирует так, чтобы также принимать первый и второй входной канал 10a и 10b, и выводит первый сигнал ошибки и второй сигнал ошибки. Предпочтительно, блок вычисления ошибок вычисляет разность по выборкам между исходным каналом и соответствующим восстановленным каналом (выходной блок 55). Эта процедура выполняется для каждой пары исходного канала и восстановленного канала. Выходной сигнал блока 56 вычисления ошибок, кроме того, является многоканальным представлением, но теперь, в отличие от исходного многоканального сигнала, многоканальным сигналом ошибки. Этот многоканальный сигнал ошибки, имеющий такое же число каналов, как и исходный многоканальный сигнал, вводится в остаточный процессор 57 для формирования закодированного остаточного сигнала.
Существует множество реализаций остаточного процессора 57, которые, все, зависят от требований по полосе пропускания, требуемой степени масштабирования, требований по качеству и т.д.
В одной предпочтительной реализации остаточный процессор 57 также реализован как многоканальный кодер, формирующий один или более каналов понижающего микширования ошибок и параметров понижающего микширования ошибок. Этот вариант осуществления может рассматриваться как тип итеративного многоканального кодера, поскольку остаточный процессор 57 может включать в себя блоки 50, 51, 53 и 54.
Альтернативно, остаточный процессор 57 может работать так, чтобы выбирать только один или два канала ошибок из своего входного сигнала, которые имеют наибольшую энергию, и обрабатывать только сигнал ошибки с наибольшей энергией, чтобы получить закодированный остаточный сигнал. В дополнение или вместо этого критерия более усовершенствованный критерий может быть использован, который основан на перцепционно более обоснованных показателях ошибки. Альтернативно, остаточный процессор может использовать схему матрицирования для понижающего микширования входных каналов в один или более каналов понижающего микширования, с тем чтобы соответствующее устройство декодера выполнило аналогичную процедуру обратного матрицирования. В таком случае один или более каналов понижающего микширования могут быть обработаны с помощью элементов известного моно- или стереокодера или могут быть полностью обработаны с помощью одного из вышеупомянутых моно-/стереокодеров, чтобы получить закодированный остаточный сигнал.
Декодер для кодера по фиг.5 показан на фиг.6. В сравнении с вариантом осуществления по фиг.2, фиг.6 раскрывает то, что многоканальный декодер 25 включает в себя параметрический многоканальный блок 60 восстановления и блок 61 объединения. Параметрический многоканальный блок 60 восстановления формирует первый восстановленный многоканальный сигнал 26 только на основе декодированного понижающего микширования и информации декодированных параметров. Первый восстановленный сигнал 26 может быть выведен, когда закодированный остаточный сигнал не включен в поток данных. Тем не менее, когда закодированный остаточный сигнал включен в поток данных, первый восстановленный сигнал не выводится, а вводится в блок 61 объединения для объединения параметрического восстановленного многоканального сигнала 26 с декодированным остаточным сигналом, которой является одним из представлений ошибки на выходе блока 56 вычисления ошибок по фиг.5, как описано выше. Блок 61 объединения объединяет декодированный остаточный сигнал, т.е. любое представление сигнала ошибки, и параметрически восстановленный многоканальный сигнал, чтобы вывести второй восстановленный сигнал 27. Когда декодер по фиг.6 рассматривается относительно фиг.11, становится очевидным, что для определенной скорости передачи битов первый восстановленный сигнал имеет качество, определенное посредством линии 1102, тогда как второй восстановленный сигнал 27 имеет более высокое качество, определенное посредством линии 1114, для той же скорости передачи битов.
Вариант осуществления по фиг.5/фиг.6 предпочтительнее варианта осуществления по фиг.3/фиг.4, поскольку избыточность в закодированном остаточном сигнале уменьшена. Тем не менее, вариант осуществления по фиг.5/фиг.6 требует большей вычислительной мощности, запоминающего устройства, ресурсов аккумулятора и алгоритмической задержки.
Предпочтительный компромисс между вариантом осуществления по фиг.3/фиг.4 и вариантом осуществления по фиг.5/фиг.6 описывается ниже со ссылкой на фиг.7 в отношении кодера и фиг.8 в отношении декодера. Кодер включает в себя определенный блок 74 понижающего микширования для выполнения понижающего микширования, используя первый и второй входные каналы 10a, 10b. В отличие от простого понижающего микширования, которое формируется посредством добавления только обоих исходных каналов 10a, 10b, чтобы получить монофонический сигнал, блок 70 понижающего микширования управляется посредством параметра выравнивания, формируемого блоком 71 вычисления параметров. При этом оба входных канала 10a, 10b согласуются по времени друг с другом до того, как оба сигнала суммируются друг с другом. Таким образом, специальный монофонический сигнал получается на выходе блока 70 понижающего микширования, причем этот монофонический сигнал отличается от монофонического сигнала, формируемого, например, посредством низкоуровневого кодера по интенсивности, как показано посредством 30 на фиг.3.
В дополнение к параметру выравнивания или вместо параметра выравнивания, блок 71 вычисления параметров функционирует так, чтобы формировать параметр усиления. Параметр усиления вводится в устройство 72 взвешивания, чтобы предпочтительно взвешивать второй канал 10b с помощью параметра усиления до того, как выполняется вычисление бокового сигнала. Взвешивание второго канала до вычисления разности в виде волновой формы между результатами первого и второго канала приводит к меньшему остаточному сигналу, который показан как специальный боковой сигнал, вводимый в любой надлежащий блок 33 уменьшения скорости передачи данных. Блок 33 уменьшения скорости передачи данных, показанный на фиг.7, может быть реализован точно как блок 33 уменьшения скорости передачи данных, показанный на фиг.3.
Вариант осуществления по фиг.7 отличается от варианта осуществления по фиг.3 тем, что информация параметров учитывается предпочтительно в блоке 70 понижающего микширования, так же как и вычисление остаточного сигнала, так чтобы остаточный сигнал, выводимый посредством блока 33 уменьшения скорости передачи данных на фиг.7, мог быть представлен посредством меньшего числа битов, чем сигнал, выводимый посредством блока 33 уменьшения скорости передачи данных. Это обусловлено тем, что остаточный сигнал по фиг.7 включает в себя меньше избыточности, чем остаточный сигнал по фиг.3.
Фиг.8 иллюстрирует предпочтительный вариант осуществления реализации декодера, соответствующей реализации кодера на фиг.7. В отличие от декодера по фиг.6, многоканальный блок 25 восстановления функционирует так, чтобы автоматически выводить первый восстановленный многоканальный сигнал 26, когда боковой сигнал, т.е. остаточный сигнал, равен нулю, или автоматически выводить второй восстановленный многоканальный сигнал 27, когда остаточный сигнал не равен нулю. Таким образом, многоканальный блок 25 восстановления по фиг.8 не может выводить оба сигнала 26 и 27 одновременно, а может выводить только первый из двух сигналов или второй из двух сигналов. Таким образом, вариант осуществления по фиг.8 не требует никакого управления декодера, как, к примеру, показанное на фиг.4.
В частности, декодер 22 остаточного сигнала на фиг.8 выводит специальный боковой сигнал, формируемый посредством элемента 72 соответствующего кодера на фиг.7. Дополнительно, декодер 24 понижающего микширования выводит специальный монофонический сигнал, формируемый посредством блока 70 понижающего микширования на фиг.7.
Затем специальный боковой сигнал и специальный монофонический сигнал вводятся в многоканальный декодер вместе с параметром усиления и параметром выравнивания по времени. Параметр усиления функционирует так, чтобы управлять фазой 84 усиления, применяющей усиление в соответствии с первым правилом усиления. Дополнительно, параметр усиления управляет дополнительными фазами 82, 83 усиления для применения усиления в соответствии с другим, вторым, правилом усиления. Дополнительно, многоканальный блок восстановления включает в себя блок 84 вычитания и блок 85 суммирования, а также блок 86 рассогласования по времени, чтобы сформировать восстановленный первый канал и восстановленный второй канал.
Далее выполняется ссылка на предпочтительный вариант осуществления схемы кодера/декодера по фиг.7 и фиг.8. Фиг.9a иллюстрирует полную схему кодера/декодера в соответствии с аспектом настоящего изобретения, в которой остаточный сигнал d(n) не равен нулю. Дополнительно, фиг.9b показывает масштабируемый кодер/декодер по фиг.9a, когда разностный сигнал d(n) не вычислен, или когда поток данных отсечен, чтобы уменьшить остаточный сигнал, к примеру, вследствие связанного с полосой пропускания передачи требования. В случае отсечения закодированного остаточного сигнала из потока данных, передаваемого из кодера в декодер в варианте осуществления по фиг.9a, вариант осуществления по фиг.9a становится чистым параметрическим многоканальным сценарием, в котором параметр выравнивания и параметр усиления являются многоканальными параметрами, а специальный монофонический сигнал является каналом понижающего микширования, передаваемым со стороны декодера на сторону кодера.
Многоканальное восстановление на стороне декодера выполняется только с помощью параметров выравнивания и усиления, поскольку остаточный сигнал не принимается на стороне декодера, т.е. d(n) равен нулю.
Фиг.9c иллюстрирует уравнения, лежащие в основе изобретаемого кодера, тогда как фиг.9d иллюстрирует уравнения, лежащие в основе изобретаемого декодера.
В частности, изобретаемый кодер включает в себя, в качестве поставщика 14 параметров с фиг.1, блок 71 вычисления параметров. Блок 71 вычисления параметров функционирует так, чтобы вычислять параметр выравнивания по времени для выравнивания правого канала r(n) с левым каналом l(n). На фиг.9a-9d выровненный правый канал указывается посредством ra(n). Параметр выравнивания предпочтительно извлекается из перекрывающихся блоков входного сигнала. Параметр выравнивания соответствует задержке по времени между левым каналом и правым каналом и оценивается предпочтительно с помощью методик взаимной корреляции временной области. Для случая, когда в поддиапазоне отсутствует усиление выравнивания, например, в случае независимых сигналов, параметру задержки присваивается значение нуль. Предпочтительно, один параметр задержки (выравнивания по времени) оценивается на поддиапазон в структуре поддиапазонов. В предпочтительном варианте осуществления использованы фиксированная скорость анализа в 46 мс и 50%-ные перекрывающиеся окна Хэмминга.
Блок 71 вычисления параметров дополнительно вычисляет значение усиления. Значение усиления также предпочтительно извлекается из перекрывающихся блоков сигнала. Обычно параметр усиления идентичен параметру разности уровней, как правило, используемому в параметрическом кодировании, таком как хорошо известная схема бинаурального кодирования сигнала. Альтернативно, значение усиления может быть вычислено с помощью итеративного подхода, при котором разностный сигнал отправляется в блок вычисления параметров, а значение усиления задается таким образом, что разностный сигнал достигает минимального значения, как показано посредством пунктирной линии 90 на фиг.9a. Как только выравнивание и усиление параметров вычислено, блок 70 понижающего микширования на фиг.7, а также остаточный кодер 16 на фиг.7 могут быть запущены. В частности, блок 70 понижающего микширования на фиг.7 включает в себя блок 91 выравнивания для задержки одного канала на вычисленный параметр выравнивания по времени. Задержанный второй канал ra(n) затем прибавляется к первому каналу с помощью устройства 92 суммирования. На выходе блока 92 суммирования присутствует канал понижающего микширования. Таким образом, блок 70 понижающего микширования на фиг.7 включает в себя блоки 91 и 92, чтобы сформировать специальный монофонический сигнал.
Остаточный кодер 16 на фиг.7 дополнительно включает в себя блок 93 взвешивания и последующий блок 94 вычисления бокового сигнала, который вычисляет разность между исходным первым каналом и выровненным и взвешенным вторым каналом. В частности, для взвешивания выровненного второго канала выполняется первое правило взвешивания, используемое в соответствующем блоке 80 на стороне декодера. Таким образом, остаточный кодер 16 включает в себя устройство 91 выравнивания, устройство 93 взвешивания и блок 94 вычисления бокового сигнала. Поскольку выровненный второй канал используется для понижающего микширования, а также для вычисления остатка, достаточно вычислить выровненный правый канал только один раз и перенаправить результат в блок 70 понижающего микширования, а также в блок взвешивания/блок 72 вычисления бокового сигнала на фиг.7.
Предпочтительно, коэффициенты выравнивания и усиления выбираются так, чтобы процесс был обратим, с тем чтобы уравнения по фиг.9d были четко определены и хорошо обусловлены.
Общий монофонический кодер может быть использован для монофонического кодера 51, чтобы кодировать суммирующий сигнал, и предпочтительно специальный остаточный кодер 33 используется для остатка.
Когда монофонический кодер 51 является монофоническим кодером без потерь, т.е. когда монофонический сигнал не квантуется дополнительно, и либо остаточный кодер также является кодером без потерь, либо модель сигнала выравнивания точно совпадает с исходным сигналом, то изобретаемая структура кодирования, показанная на фиг.9a, имеет отличное свойство восстановления, при условии также, что параметры выравнивания и усиления подвергаются только схеме кодирования без потерь.
Изобретаемая система на фиг.9a предоставляет основу для схемы, которая может работать с постепенным снижением производительности в рамках множества диапазонов, как показано на фиг.11, линия 1114. В частности, без остаточного кодирования, т.е. d(n)=0, схема сокращается до параметрического стереофонического кодирования посредством передачи только параметров выравнивания и усиления (в качестве многоканальных параметров) в дополнение к монофоническому сигналу (в качестве канала понижающего микширования). Эта ситуация проиллюстрирована на фиг.9b. Дополнительно, изобретаемая система имеет преимущество в том, что способ выравнивания автоматически разрешает проблему монофонического понижающего микширования.
Далее выполняется ссылка на фиг.10, иллюстрирующую реализацию изобретаемого варианта осуществления, проиллюстрированного на фиг.9a-9d, в структуре кодирования по поддиапазонам. Исходный левый и правый канал вводятся в гребенку 1000 фильтров анализа для получения сигналов нескольких поддиапазонов. Для каждого сигнала поддиапазона используется схема кодирования/декодирования, показанная на фиг.9a-9d. На стороне декодера восстановленные сигналы поддиапазонов объединяются в гребенке 1010 фильтров синтеза, чтобы в итоге прийти в полнодиапазонные восстановленные многоканальные сигналы. Естественно, для каждого поддиапазона параметр выравнивания и параметр усиления должны быть переданы со стороны кодера на сторону декодера, как проиллюстрировано посредством стрелки 1020 на фиг.10.
Предпочтительная реализация структуры кодирования по поддиапазонам на фиг.10 основана на косинусоидальной модулированной гребенке фильтров с двумя каскадами, чтобы добиться неравных полос пропускания поддиапазонов (на перцепционно обоснованной шкале). Первый каскад разделяет сигнал на M диапазонов. M сигналов поддиапазона критически прореживаются и предоставляются в гребенку фильтров второго каскада. k-й фильтр второго каскада, k ∈ {1, ..., M}, имеет Mk диапазонов. В предпочтительной реализации используется M=8 диапазонов, и структура поддиапазонов, приведенная в таблице на фиг.10, дающая в результате 36 действующих поддиапазонов после двух каскадов, является предпочтительной. Прототипы фильтров разрабатываются согласно [13] с затуханием, по меньшей мере, в 100 дБ в полосе затухания. Порядок фильтров в первом каскаде составляет 116, а максимальный порядок фильтров во втором каскаде составляет 256. Затем структура кодирования применяется к парам поддиапазонов (соответствующим левому и правому каналам поддиапазонов).
Соответствующая группировка поддиапазонов между гребенкой фильтров первого и второго каскада показана в таблице справа на фиг.10, которая проясняет то, что первый поддиапазон k включает в себя 16 подподдиапазонов. Дополнительно, второй поддиапазон включает в себя 8 подподдиапазонов и т.д.
Эффективное параметрическое кодирование достигается с помощью методик векторного квантования (VQ) по Гауссовому смешиванию (GM). Квантование на основе GM-моделей популярно в области техники кодирования речи [14-16] и упрощает реализацию низкой сложности VQ большой размерности. В предпочтительной реализации выполняется векторное квантование 36-мерных векторов параметров усиления и задержки. Все GM-модели имеют 16 компонентов смешивания и обучаются на базе данных параметров, извлеченных из 60 минут аудиоданных (с варьирующимся содержимым и отдельно от последующих оценочных испытательных сигналов). Способы, основанные на явных статистических моделях, менее часто используются в аудиокодировании, чем в кодировании речи. Одна причина этого заключается в недоверии к способности статистических моделей фиксировать всю значимую информацию, содержащуюся в обычном аудио. В предпочтительном случае предварительная оценка с помощью процедур открытых и закрытых испытаний для параметрических моделей, тем не менее, показывает, что в данном случае нет проблем. Результирующая скорость передачи битов для параметров усиления и задержки составляет 2,3 кбит/с.
Структура поддиапазонов используется для кодирования остаточных сигналов. С помощью такой же блочной обработки, что и описанная выше, дисперсия в каждом поддиапазоне оценивается, и дисперсии подвергаются векторному квантованию с помощью GM VQ по поддиапазонам (т.е. один 36-мерный вектор кодируется за один раз). Дисперсии упрощают распределение битов по поддиапазонам с помощью поглощающего алгоритма распределения битов [17, стр. 234]. Сигналы поддиапазонов затем кодируются с помощью скалярных квантователей с постоянным шагом.
Мгновенное усиление g(n) и задержка τ(n) получается посредством линейной интерполяции блочных оценок. Изменяющаяся во времени задержка реализована с помощью дробного фильтра задержки 73-го порядка на основе усеченной и обработанной с помощью взвешенной функции Хэмминга синусоидальной импульсной характеристики [18]. Коэффициенты фильтрации обновляются по выборкам с помощью интерполированного параметра задержки.
Предлагается основа для гибкого кодирования стереокартины в обычном аудио. С помощью новой структуры можно плавно перейти от параметрического стереорежима к аппроксимирующему волновую форму кодированию. Примерная реализация этих идей испытана с помощью некодированного остатка, чтобы оценить эффект от повышения скорости передачи битов остаточного кодера, и с помощью основного MP3-кодера, чтобы оценить схему в более реалистичном сценарии.
Для стабилизации стереоизображения предпочтительно подвергать низкочастотной фильтрации параметры в чистой параметрической системе или в масштабируемой системе, имеющей чистую параметрическую часть, которая может быть использована посредством декодера без обработки остаточного сигнала, как выполнено в примере [9]. Это снижает усиление выравнивания системы. Посредством кодирования остатка с помощью скалярного кодирования по поддиапазонам качество дополнительно повышается и достигает прозрачного качества. В частности, добавление битов в остаток стабилизирует стереокартину, и стереоохват также увеличивается. Более того, гибкие методики временной сегментации и переменной скорости (к примеру, накопителя битов) предпочтительны, чтобы более оптимально использовать динамический характер обычного аудио. Параметр когерентности предпочтительно включен в фильтр выравнивания, чтобы улучшить параметрический режим. Улучшенное остаточное кодирование с помощью маскировки восприятия, векторного квантования и дифференциального кодирования приводит к более надежному уменьшению нерелевантности и избыточности.
Хотя изобретаемая система описана в контексте стереофонического кодирования и в контексте параметрически усовершенствованной схемы кодирования с выделением центрального и разностного канала, здесь следует отметить, что каждая схема параметрического кодирования/декодирования, такая как обобщенное стереофоническое кодирование по интенсивности, может извлекать выгоду из дополнительно включенного бокового компонента, чтобы в итоге достигать отличного свойства восстановления. Хотя предпочтительный вариант осуществления схемы кодера/декодера в соответствии с изобретением описан с использованием временного выравнивания на стороне кодера, передачи параметра выравнивания и с использованием рассогласования во времени на стороне декодера, существуют дополнительные альтернативы, которые выполняют выравнивание во времени на стороне кодера для формирования небольшого разностного сигнала, но которые не выполняют рассогласование во времени на стороне кодера, с тем чтобы параметр выравнивания не должен был передаваться от кодера к декодеру. В этом варианте осуществления отбрасывание рассогласования во времени, разумеется, включает в себя искажение. Тем не менее, искажение в большинстве случаев несерьезно, так что этот вариант осуществления особенно подходит для недорогих многоканальных декодеров.
Следовательно, настоящее изобретение может рассматриваться как расширение предпочтительной BCC-схемы параметрического кодера или любой другой схемы многоканального кодирования, которая полностью откатывается к чистой параметрической схеме, когда закодированный остаточный сигнал отсекается. В соответствии с настоящим изобретением, чистая параметрическая система модернизируется посредством передачи различных типов дополнительной информации, которая предпочтительно включает в себя остаточный сигнал в волновой форме, параметр усиления и/или параметр выравнивания по времени. Таким образом, операция декодирования с помощью дополнительной информации приводит к более высокому качеству, чем было бы доступное с помощью только параметрических методик.
В зависимости от требований, предложенные способы кодирования и декодирования могут быть реализованы в аппаратных средствах, программном обеспечении или в микропрограммном обеспечении. Следовательно, изобретение также относится к машиночитаемому носителю, хранящему программный код, который при выполнении на вычислительной машине приводит к одному из предлагаемых способов. Таким образом, настоящее изобретение - это вычислительная программа, имеющая программный код, который при выполнении на вычислительной машине приводит к осуществлению способа в соответствии с изобретением.
ЛИТЕРАТУРА
[1] J.D. Johnston and A.J. Ferreira, .Sum-difference stereo transform coding," in Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing (ICASSP), 1992, vol. 2, pp. 569.572.
[2] R. Waal and R. Veldhuis, .Subband coding of stereophonic digital audio signals," in Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing (ICASSP), 1991, pp. 3601.3604.
[3] J. Herre, K. Brandenburg, and D. Lederer, .Intensity stereo coding," in Preprint 3799, 96th AES Convention, 1994.
[4] K. Brandenburg, .MP3 and AAC explained," in Proc. of the AES 17th International Conference, paper no. 17-009, 1999.
[5] J. Blauert, Spatial hearing: the psychophysics of human sound localization, The MIT Press, Cambridge, Massachusetts, 1997.
[6] H. Fuchs, .Improving joint stereo audio coding by adaptive inter-channel prediction," in Proc. of IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 1993, pp. 39.42.
[7] H. Fuchs, .Improving MPEG audio coding by backward adaptive linear stereo prediction," in Preprint 4086, 99th AES Convention, 1995.
[8] F. Baumgarte and C. Faller, .Binaural cue coding. part I: Psychoacoustic fundamentals and design principles," IEEE Trans. Speech Audio Processing, vol. 11, no. 6, pp. 509.519, 2003.
[9] C. Faller and F. Baumgarte, .Binaural cue coding. part II: Schemes and applications," IEEE Trans. Speech Audio Processing, vol. 11, no. 6, pp. 520.531, 2003.
[10] C. Faller, Parametric Coding of Spatial Audio, Ph.D. thesis, Ecole Polytechnique Federale de Lausanne, 2004.
[11] J. Breebaart, S. van de Par, A. Kohlrausch, and E. Schuijers, "High-quality parametric spatial audio coding at low bitrates," in Preprint 6072, 116th AES Convention, 2004.
[12] J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, and C. Spenger, .MP3 surround: Efficient and compatible coding of multi-channel audio," in Preprint 6049, 116th AES Convention, 2004.
[13] Y-P. Lin and P.P. Vaidyanaythan, .A Kaiser window approach for the design of prototype filters of cosine modulated filterbanks," IEEE Signal Processing Letters, vol. 5, no. 6, pp. 132.134, 1998.
[14] P. Hedelin and J. Skoglund, "Vector quantization based on Gaussian mixture models," IEEE Trans. Speech Audio Processing, vol. 8, no. 4, pp. 385.401, 2000.
[15] A.D. Subramaniam and B.D. Rao, .PDF optimized parametric vector quantization of speech line spectral frequencies," IEEE Trans. Speech Audio Processing, vol. 11, no. 2, pp. 130.142, 2003.
[16] J. Lindblom and P. Hedelin, .Variable-dimension quantization of sinusoidal amplitudes using Gaussian mixture models," in Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing (ICASSP), 2004, vol. 1, pp. 153.156.
[17] A. Gersho and R.M. Gray, Vector Quantization and Signal Compression, Kluwer Academic Publishers, Boston, 1992.
[18] T.I. Laakso, V. http://Va.lima.ki, M. Karjalainen, and U.K. Laine, "Tools for fractional delay filter design," IEEE Signal Processing Magazine, pp. 30.60, January 1996.
[19] ITU-R Recommendation BS.1534, Method for the Subjective Assessment of Intermediate Quality Level of Coding Systems, ITU-T, 2001.
[20] The LAME project," http://lame.sourceforge.net/, July 2004, V3.96.1.

Claims (29)

1. Многоканальный кодер для кодирования исходного многоканального сигнала, имеющего, по меньшей мере, два канала, содержащий:
поставщик параметров для предоставления одного или более параметров, причем один или более параметров формируются таким образом, что восстановленный многоканальный сигнал может быть сформирован с помощью одного или более каналов понижающего микширования, извлеченных из многоканального сигнала, и одного или более параметров;
остаточный кодер для формирования закодированного остаточного сигнала на основе исходного многоканального сигнала, одного или более каналов понижающего микширования или одного или более параметров, так чтобы восстановленный многоканальный сигнал, когда сформирован с помощью остаточного сигнала, был в большей степени аналогичен исходному многоканальному сигналу, чем когда сформирован без использования остаточного сигнала; при этом остаточный кодер включает в себя многоканальный декодер для формирования декодированного многоканального сигнала с помощью одного или более каналов понижающего микширования и одного или более параметров; блок вычисления ошибок для вычисления многоканального представления сигнала ошибки на основе декодированного многоканального сигнала ошибки и исходного многоканального сигнала; и остаточный процессор для обработки многоканального представления сигнала ошибки, чтобы получить закодированный остаточный сигнал; и
формирователь потоков данных для формирования потока данных, имеющего остаточный сигнал и один или более параметров.
2. Многоканальный кодер по п.1, в котором формирователь потоков данных функционирует так, чтобы формировать масштабируемый поток данных, в котором один или более параметров и остаточный сигнал находятся на различных уровнях масштабирования.
3. Многоканальный кодер по п.1, в котором остаточный кодер функционирует так, чтобы вычислять закодированный остаточный сигнал как остаточный сигнал волновой формы.
4. Многоканальный кодер по п.1, в котором остаточный кодер функционирует так, чтобы формировать остаточный сигнал на основе одного или более параметров и исходного многоканального сигнала без одного или более каналов понижающего микширования, так чтобы остаточный сигнал имел меньшую энергию в сравнении с формированием остаточного сигнала без использования одного или более параметров.
5. Многоканальный кодер по п.4, в котором поставщик параметров содержит:
блок вычисления выравнивания для вычисления параметра выравнивания по времени, который должен быть предоставлен в блок выравнивания по времени для выравнивания первого канала и второго канала из, по меньшей мере, двух каналов; или
блок вычисления усиления для вычисления усиления, не равного единице, для взвешивания канала, с тем чтобы разность между двумя каналами была меньше в сравнении со значением усиления в единицу.
6. Многоканальный кодер по п.5, в котором остаточный кодер функционирует так, чтобы вычислять и кодировать сигнал разности, извлеченный из первого канала и выровненного и взвешенного второго канала.
7. Многоканальный кодер по п.5, содержащий также блок понижающего микширования для формирования канала понижающего микширования с помощью выровненных каналов.
8. Многоканальный кодер по п.1, содержащий также гребенку фильтров анализа для разделения многоканального сигнала на множество частотных диапазонов,
в котором поставщик параметров и остаточный кодер функционируют так, чтобы работать с сигналами поддиапазонов, и
в котором формирователь потоков данных функционирует так, чтобы собирать закодированные остаточные сигналы и параметры для множества частотных диапазонов.
9. Многоканальный кодер по п.1, в котором остаточный процессор включает в себя многоканальный кодер для формирования многоканального представления для многоканального представления сигнала ошибки.
10. Многоканальный кодер по п.9, в котором остаточный процессор функционирует так, чтобы также формировать один или более каналов понижающего микширования многоканального представления сигнала ошибки.
11. Многоканальный кодер по п.1, в котором поставщик параметров функционирует так, чтобы предоставить параметры бинаурального кодирования сигнала (ВСС), такие как межканальные разности уровней, параметры межканальной когерентности, межканальные разности времени или сигналы огибающих канала.
12. Способ кодирования исходного многоканального сигнала, имеющего, по меньшей мере, два канала, содержащий этапы, на которых:
предоставляют один или более параметров, причем один или более параметров формируются таким образом, что восстановленный многоканальный сигнал может быть сформирован с помощью одного или более каналов понижающего микширования, извлеченных из многоканального сигнала, и одного или более параметров;
формируют закодированный остаточный сигнал на основе исходного многоканального сигнала, одного или более каналов понижающего микширования или одного или более параметров, так чтобы восстановленный многоканальный сигнал, когда сформирован с помощью остаточного сигнала, был в большей степени аналогичен исходному многоканальному сигналу, чем когда сформирован без использования остаточного сигнала, причем этап формирования включает в себя этапы, на которых формируют декодированный многоканальный сигнал с помощью одного или более каналов понижающего микширования и одного или более параметров, вычисляют многоканальное представление сигнала ошибки на основе декодированного многоканального сигнала и исходного многоканального сигнала; и
обрабатывают многоканальное представление сигнала ошибки, чтобы получить закодированный остаточный сигнал; и
формируют поток данных, имеющий закодированный остаточный сигнал и один или более параметров.
13. Многоканальный декодер для декодирования закодированного многоканального сигнала, имеющего один или более каналов понижающего микширования, один или более параметров и закодированный остаточный сигнал, один или более каналов понижающего микширования зависят от параметра выравнивания или параметра усиления, декодер содержит:
остаточный декодер для формирования декодированного остаточного сигнала на основе закодированного остаточного сигнала; и
многоканальный декодер для формирования первого восстановленного многоканального сигнала с помощью одного или более каналов понижающего микширования и одного или более параметров,
при этом многоканальный декодер также функционирует так, чтобы формировать второй восстановленный многоканальный сигнал с помощью одного или более каналов понижающего микширования и декодированного остаточного сигнала,
при этом многоканальный декодер также функционирует для взвешивания канала понижающего микширования с помощью параметра усиления, для добавления декодированного остаточного сигнала к взвешенному каналу понижающего микширования, и для вторичного взвешивания получившегося канала, чтобы получить первый восстановленный многоканальный сигнал, и вычитания декодированного остаточного сигнала из канала понижающего микширования и взвешивания канала, получившегося от вычитания, с помощью параметра усиления, или рассогласования разности между каналом понижающего микширования и декодированным остаточным сигналом при получении второго восстановленного многоканального сигнала.
14. Многоканальный декодер по п.13, в котором закодированный многоканальный сигнал представляется посредством масштабированного потока данных, причем масштабированный поток данных имеет первый уровень масштабирования, включающий в себя один или более параметров, и второй уровень масштабирования, включающий в себя закодированный остаточный сигнал, при этом многоканальный декодер также содержит
анализатор потоков данных для извлечения первого уровня масштабирования или второго уровня масштабирования.
15. Многоканальный декодер по п.13,
в котором закодированный остаточный сигнал зависит от одного или более параметров, и
при этом многоканальный декодер функционирует так, чтобы использовать один или более каналов понижающего микширования, один или более параметров и декодированный остаточный сигнал для формирования второго восстановленного многоканального сигнала.
16. Многоканальный декодер по п.13,
в котором канал понижающего микширования зависит от параметра выравнивания или параметра усиления, и
в котором многоканальный декодер функционирует так, чтобы взвешивать канал понижающего микширования с помощью первого правила взвешивания на основе параметра усиления и взвешивать канал понижающего микширования с помощью второго правила взвешивания с помощью параметра усиления, или
рассогласовывать один выходной канал относительно другого выходного канала с помощью параметра выравнивания.
17. Многоканальный декодер по п.13, в котором параметры включают в себя параметры бинаурального кодирования сигнала (ВСС), такие как межканальные разности уровней, параметры межканальной когерентности, межканальные разности времени или сигналы огибающих канала, и
при этом многоканальный декодер функционирует так, чтобы выполнять операцию многоканального декодирования с помощью схемы бинаурального кодирования сигнала.
18. Многоканальный декодер по п.13, в котором один или более каналов понижающего микширования, один или более параметров и закодированный остаточный сигнал представляются посредством заданных поддиапазоном данных, также содержащий
гребенку фильтров синтеза для объединения восстановленных данных поддиапазонов, формируемых посредством многоканального декодера, чтобы получить полнодиапазонное представление первого или второго восстановленного многоканального сигнала.
19. Способ декодирования закодированного многоканального сигнала, имеющего один или более каналов понижающего микширования, один или более параметров и закодированный остаточный сигнал, содержащий этапы, на которых:
формируют декодированный остаточный сигнал на основе закодированного остаточного сигнала; и
формируют первый восстановленный многоканальный сигнал с помощью одного или более каналов понижающего микширования и одного или более параметров и формируют второй восстановленный многоканальный сигнал с помощью одного или более каналов понижающего микширования и декодированного остаточного сигнала, этап формирования включает в себя этапы, на которых взвешивают канал понижающего микширования с помощью параметра усиления, добавляют декодированный остаточный сигнал к взвешенному каналу понижающего микширования и повторно взвешивают получившийся канал для того, чтобы получить первый восстановленный многоканальный сигнал, и вычитают декодированный остаточный сигнал из канала понижающего микширования и взвешивают канал, получившийся в результате вычитания, с помощью параметра усиления, или рассогласовывают разницу между каналом понижающего микширования и декодированным остаточным сигналом при получении второго восстановленного многоканального сигнала.
20. Многоканальный кодер для кодирования исходного многоканального сигнала, имеющего, по меньшей мере, два канала, содержащий:
блок вычисления параметров для вычисления параметра выравнивания;
блок выравнивания по времени для выравнивания первого канала и второго канала из, по меньшей мере, двух каналов с помощью параметра выравнивания;
блок понижающего микширования для формирования канала понижающего микширования с помощью выровненных каналов;
блок вычисления усиления для вычисления параметра усиления, не равного единице, для взвешивания выровненного канала, так чтобы разность между выровненными каналами была уменьшена в сравнении со значением усиления в единицу; и
формирователь потоков данных для формирования потока данных, имеющего информацию канала понижающего микширования, информацию параметра выравнивания и информацию параметра усиления.
21. Многоканальный кодер по п.20, содержащий также остаточный кодер для вычисления и кодирования сигнала разности, извлеченного из первого канала и выровненного и взвешенного второго канала,
при этом формирователь потоков данных также функционирует так, чтобы включать закодированный остаточный сигнал в поток данных.
22. Многоканальный декодер для декодирования закодированного многоканального сигнала, имеющего информацию одного или более каналов понижающего микширования, информацию параметра усиления, информацию параметра выравнивания и закодированный остаточный сигнал, содержащий:
декодер каналов понижающего микширования для формирования декодированного канала понижающего микширования; и
процессор для обработки декодированного канала понижающего микширования с помощью параметра усиления, чтобы получить первый декодированный выходной канал, и для обработки декодированного канала понижающего микширования с помощью параметра усиления и для того, чтобы рассогласовать с помощью параметра выравнивания, чтобы получить второй декодированный выходной канал; и
остаточный декодер для формирования декодированного остаточного сигнала,
при этом процессор функционирует для первичного взвешивания канала понижающего микширования с помощью параметра усиления, для добавления декодированного остаточного сигнала, и для вторичного взвешивания с помощью параметра усиления, чтобы получить первый восстановленный канал, и вычитания декодированного остаточного сигнала из канала понижающего микширования до взвешивания и рассогласовывания, чтобы получить восстановленный второй канал.
23. Способ кодирования исходного многоканального сигнала, имеющего, по меньшей мере, два канала, содержащий этапы, на которых:
вычисляют параметр выравнивания;
выравнивают по времени первый канал и второй канал из, по меньшей мере, двух каналов с помощью параметра выравнивания;
формируют канал понижающего микширования с помощью выровненных каналов;
вычисляют параметр усиления, не равный единице, для взвешивания выровненного канала, так чтобы разность между выровненными каналами была уменьшена в сравнении со значением усиления в единицу; и
формируют поток данных, имеющий информацию канала понижающего микширования, информацию параметра выравнивания и информацию параметра усиления.
24. Способ декодирования закодированного многоканального сигнала, имеющего информацию одного или более каналов понижающего микширования, информацию параметра усиления, информацию параметра выравнивания и закодированный остаточный сигнал, содержащий этапы, на которых:
формируют декодированный канал понижающего микширования;
обрабатывают декодированный канал понижающего микширования с помощью параметра усиления, чтобы получить первый декодированный выходной канал, и обрабатывают декодированный канал понижающего микширования с помощью параметра усиления и рассогласовывания на основе параметра выравнивания, чтобы получить второй декодированный выходной канал; и
декодируют закодированный остаточный сигнал для того, чтобы получить декодированный остаточный сигнал,
причем этап обработки включает в себя этапы, на которых первично взвешивают канал понижающего микширования с помощью параметра усиления, добавляют декодированный остаточный сигнал и вторично взвешивают с помощью параметра усиления, чтобы получить первый восстановленный канал, и вычитают декодированный остаточный сигнал из канала понижающего микширования до взвешивания и рассогласовывания, чтобы получить восстановленный второй канал.
25. Машиночитаемый носитель, хранящий программный код, который при выполнении на вычислительной машине приводит к осуществлению представления кодированного многоканального сигнала, имеющего информацию одного или более каналов понижающего микширования, одного или более параметров, который при объединении с одним или более каналов понижающего микширования имеет результатом первый восстановленный многоканальный сигнал, и закодированный остаточный сигнал, который при объединении с одним или более каналов понижающего микширования имеет результатом второй восстановленный многоканальный сигнал, причем второй восстановленный многоканальный сигнал в большей степени аналогичен исходному многоканальному сигналу, чем первый восстановленный многоканальный сигнал, причем закодированный многоканальный сигнал является масштабируемым потоком данных, в котором один или более параметров и остаточный сигнал находятся на разных уровнях масштабирования, или один или более параметров включают в себя параметры бинаурального кодирования сигнала (ВСС), такие как межканальные разности уровней, параметры межканальной когерентности, межканальные разности времени или сигналы огибающих канала.
26. Машиночитаемый носитель, содержащий команды для вычислительной машины, которые при их выполнении вычислительной машиной обуславливают осуществление вычислительной машиной способа по п.12.
27. Машиночитаемый носитель, содержащий команды для вычислительной машины, которые при их выполнении вычислительной машиной обуславливают осуществление вычислительной машиной способа по п.19.
28. Машиночитаемый носитель, содержащий команды для вычислительной машины, которые при их выполнении вычислительной машиной обуславливают осуществление вычислительной машиной способа по п.23.
29. Машиночитаемый носитель, содержащий команды для вычислительной машины, которые при их выполнении вычислительной машиной обуславливают осуществление вычислительной машиной способа по п.24.
RU2007135178/09A 2005-02-22 2005-10-04 Почти прозрачная или прозрачная схема многоканального кодера/декодера RU2388176C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US65521605P 2005-02-22 2005-02-22
US60/655,216 2005-02-22
US11/080,775 US7573912B2 (en) 2005-02-22 2005-03-14 Near-transparent or transparent multi-channel encoder/decoder scheme
US11/080,775 2005-03-14

Publications (2)

Publication Number Publication Date
RU2007135178A RU2007135178A (ru) 2009-03-27
RU2388176C2 true RU2388176C2 (ru) 2010-04-27

Family

ID=35519868

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2007135178/09A RU2388176C2 (ru) 2005-02-22 2005-10-04 Почти прозрачная или прозрачная схема многоканального кодера/декодера

Country Status (19)

Country Link
US (1) US7573912B2 (ru)
EP (1) EP1851997B1 (ru)
JP (1) JP4887307B2 (ru)
KR (1) KR100954179B1 (ru)
CN (2) CN101120615B (ru)
AT (1) ATE406076T1 (ru)
AU (1) AU2005328264B2 (ru)
BR (1) BRPI0520053B1 (ru)
CA (1) CA2598541C (ru)
DE (1) DE602005009262D1 (ru)
ES (1) ES2312025T3 (ru)
HK (1) HK1107495A1 (ru)
IL (1) IL185304A0 (ru)
MX (1) MX2007009887A (ru)
NO (1) NO339907B1 (ru)
PL (1) PL1851997T3 (ru)
PT (1) PT1851997E (ru)
RU (1) RU2388176C2 (ru)
WO (1) WO2006089570A1 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2581782C1 (ru) * 2013-04-30 2016-04-20 Долби Лабораторис Лайсэнзин Корпорейшн Гибридное кодирование многоканального звука
RU2730548C2 (ru) * 2015-09-25 2020-08-24 Войсэйдж Корпорейшн Способ и система для кодирования левого и правого каналов стереофонического звукового сигнала с выбором между моделями двух и четырех подкадров в зависимости от битового бюджета

Families Citing this family (116)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1735778A1 (en) * 2004-04-05 2006-12-27 Koninklijke Philips Electronics N.V. Stereo coding and decoding methods and apparatuses thereof
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
PL2175671T3 (pl) * 2004-07-14 2012-10-31 Koninl Philips Electronics Nv Sposób, urządzenie, urządzenie kodujące, urządzenie dekodujące i system audio
MX2007005261A (es) * 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
CN101147191B (zh) * 2005-03-25 2011-07-13 松下电器产业株式会社 语音编码装置和语音编码方法
JP4943418B2 (ja) * 2005-03-30 2012-05-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スケーラブルマルチチャネル音声符号化方法
EP1866913B1 (en) * 2005-03-30 2008-08-27 Koninklijke Philips Electronics N.V. Audio encoding and decoding
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
US8090586B2 (en) * 2005-05-26 2012-01-03 Lg Electronics Inc. Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126844A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
WO2007004828A2 (en) * 2005-06-30 2007-01-11 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP5227794B2 (ja) * 2005-06-30 2013-07-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
US8185403B2 (en) * 2005-06-30 2012-05-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
JP5173811B2 (ja) * 2005-08-30 2013-04-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
ATE455348T1 (de) * 2005-08-30 2010-01-15 Lg Electronics Inc Vorrichtung und verfahren zur dekodierung eines audiosignals
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
US8577483B2 (en) * 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
CN101253556B (zh) * 2005-09-02 2011-06-22 松下电器产业株式会社 能量整形装置以及能量整形方法
KR100857118B1 (ko) * 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
BRPI0616945A2 (pt) * 2005-10-05 2011-07-05 Lg Eletronics Inc método e aparelho para processamento de sinal
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7716043B2 (en) * 2005-10-24 2010-05-11 Lg Electronics Inc. Removing time delays in signal paths
US8112286B2 (en) * 2005-10-31 2012-02-07 Panasonic Corporation Stereo encoding device, and stereo signal predicting method
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
US7752053B2 (en) * 2006-01-13 2010-07-06 Lg Electronics Inc. Audio signal processing using pilot based coding
TWI333642B (en) * 2006-01-19 2010-11-21 Lg Electronics Inc Method and apparatus for processing a media signal
WO2007089131A1 (en) * 2006-02-03 2007-08-09 Electronics And Telecommunications Research Institute Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue
JP5054035B2 (ja) * 2006-02-07 2012-10-24 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
EP1987594B1 (en) * 2006-02-23 2013-05-08 LG Electronics, Inc. Method and apparatus for processing an audio signal
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
KR100773562B1 (ko) * 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
US7676374B2 (en) * 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
KR20090013178A (ko) 2006-09-29 2009-02-04 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
EP2437257B1 (en) * 2006-10-16 2018-01-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Saoc to mpeg surround transcoding
UA94117C2 (ru) * 2006-10-16 2011-04-11 Долби Свиден Ав Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов
US8571875B2 (en) 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
WO2008069584A2 (en) * 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
JP2010518460A (ja) * 2007-02-13 2010-05-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
WO2008114985A1 (en) 2007-03-16 2008-09-25 Lg Electronics Inc. A method and an apparatus for processing an audio signal
GB0705328D0 (en) * 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
EP3712888B1 (en) * 2007-03-30 2024-05-08 Electronics and Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
KR101049144B1 (ko) * 2007-06-08 2011-07-18 엘지전자 주식회사 오디오 신호 처리방법 및 장치
PL2201566T3 (pl) * 2007-09-19 2016-04-29 Ericsson Telefon Ab L M Połączone, wielokanałowe kodowanie/dekodowanie audio
GB2453117B (en) * 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
CN101821799B (zh) * 2007-10-17 2012-11-07 弗劳恩霍夫应用研究促进协会 使用上混合的音频编码
CN101836250B (zh) * 2007-11-21 2012-11-28 Lg电子株式会社 用于处理信号的方法及装置
US8566108B2 (en) * 2007-12-03 2013-10-22 Nokia Corporation Synchronization of multiple real-time transport protocol sessions
WO2009081567A1 (ja) * 2007-12-21 2009-07-02 Panasonic Corporation ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
ES2401817T3 (es) * 2008-01-31 2013-04-24 Agency For Science, Technology And Research Procedimiento y dispositivo de distribución/truncado de la velocidad de transmisión de bits para codificación de audio escalable
US9111525B1 (en) * 2008-02-14 2015-08-18 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Apparatuses, methods and systems for audio processing and transmission
BRPI0908630B1 (pt) 2008-05-23 2020-09-15 Koninklijke Philips N.V. Aparelho de 'upmix' estéreo paramétrico, decodificador estéreo paramétrico, método para a geração de um sinal esquerdo e de um sinal direito a partir de um sinal de 'downmix' mono com base em parâmetros espaciais, dispositivo de execução de áudio, aparelho de 'downmix' estéreo paramétrico, codificador estéreo paramétrico, método para a geração de um sinal residual de previsão para um sinal de diferença a partir de um sinal esquerdo e de um sinal direito com base nos parâmetros espaciais, e, produto de programa de computador
US8355921B2 (en) * 2008-06-13 2013-01-15 Nokia Corporation Method, apparatus and computer program product for providing improved audio processing
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
US8315396B2 (en) * 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
AU2013200578B2 (en) * 2008-07-17 2015-07-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
US8817992B2 (en) 2008-08-11 2014-08-26 Nokia Corporation Multichannel audio coder and decoder
CN102177542B (zh) * 2008-10-10 2013-01-09 艾利森电话股份有限公司 能量保留多通道音频编码
MX2011011399A (es) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
WO2010091555A1 (zh) * 2009-02-13 2010-08-19 华为技术有限公司 一种立体声编码方法和装置
US20120121091A1 (en) * 2009-02-13 2012-05-17 Nokia Corporation Ambience coding and decoding for audio applications
CN101826326B (zh) * 2009-03-04 2012-04-04 华为技术有限公司 一种立体声编码方法、装置和编码器
AU2015246158B2 (en) * 2009-03-17 2017-10-26 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding.
EP2626855B1 (en) 2009-03-17 2014-09-10 Dolby International AB Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
AU2013206557B2 (en) * 2009-03-17 2015-11-12 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
KR101313116B1 (ko) 2009-03-24 2013-09-30 후아웨이 테크놀러지 컴퍼니 리미티드 신호 지연을 전환하기 위한 방법 및 장치
CN101533641B (zh) 2009-04-20 2011-07-20 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法和装置
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
US9105264B2 (en) * 2009-07-31 2015-08-11 Panasonic Intellectual Property Management Co., Ltd. Coding apparatus and decoding apparatus
KR101613975B1 (ko) * 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
JP5345024B2 (ja) * 2009-08-28 2013-11-20 日本放送協会 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
WO2011029984A1 (en) * 2009-09-11 2011-03-17 Nokia Corporation Method, apparatus and computer program product for audio coding
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
WO2011080916A1 (ja) * 2009-12-28 2011-07-07 パナソニック株式会社 音声符号化装置および音声符号化方法
JP5333257B2 (ja) * 2010-01-20 2013-11-06 富士通株式会社 符号化装置、符号化システムおよび符号化方法
EP2369861B1 (en) * 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
BR122019026166B1 (pt) * 2010-04-09 2021-01-05 Dolby International Ab sistema decodificador, aparelho e método para emitir um sinal de áudio estereofônico tendo um canal esquerdo e um canal direito e meio legível por computador não transitório
RU2562422C2 (ru) 2010-07-02 2015-09-10 Долби Интернешнл Аб Избирательный басовый постфильтр
US8948403B2 (en) * 2010-08-06 2015-02-03 Samsung Electronics Co., Ltd. Method of processing signal, encoding apparatus thereof, decoding apparatus thereof, and signal processing system
EP2609592B1 (en) * 2010-08-24 2014-11-05 Dolby International AB Concealment of intermittent mono reception of fm stereo radio receivers
JP5681290B2 (ja) 2010-09-28 2015-03-04 ホアウェイ・テクノロジーズ・カンパニー・リミテッド デコードされたマルチチャネルオーディオ信号またはデコードされたステレオ信号を後処理するためのデバイス
JP5949270B2 (ja) * 2012-07-24 2016-07-06 富士通株式会社 オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
KR20140017338A (ko) * 2012-07-31 2014-02-11 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
EP2883225B1 (en) 2012-08-10 2017-06-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder, system and method employing a residual concept for parametric audio object coding
US20150243289A1 (en) * 2012-09-14 2015-08-27 Dolby Laboratories Licensing Corporation Multi-Channel Audio Content Analysis Based Upmix Detection
EP2757559A1 (en) * 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
CN110047496B (zh) 2013-04-05 2023-08-04 杜比国际公司 立体声音频编码器和解码器
CN105393304B (zh) * 2013-05-24 2019-05-28 杜比国际公司 音频编码和解码方法、介质以及音频编码器和解码器
SG11201510162WA (en) 2013-06-10 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for audio signal envelope encoding, processing and decoding by modelling a cumulative sum representation employing distribution quantization and coding
JP6224233B2 (ja) 2013-06-10 2017-11-01 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 分配量子化及び符号化を使用したオーディオ信号包絡の分割によるオーディオ信号包絡符号化、処理及び復号化の装置と方法
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
BR122020017207B1 (pt) * 2013-08-28 2022-12-06 Dolby International Ab Método, sistema de processamento de mídia, aparelho e meio de armazenamento legível por computador não transitório
EP2854133A1 (en) * 2013-09-27 2015-04-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generation of a downmix signal
PT3149955T (pt) 2014-05-28 2019-08-05 Fraunhofer Ges Forschung Processador de dados e transporte de dados de controlo do utilizador para descodificadores e renderizadores de áudio
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
SG11201806241QA (en) 2016-01-22 2018-08-30 Fraunhofer Ges Forschung Apparatus and method for estimating an inter-channel time difference
US10210871B2 (en) * 2016-03-18 2019-02-19 Qualcomm Incorporated Audio processing for temporally mismatched signals
CN106162180A (zh) * 2016-06-30 2016-11-23 北京奇艺世纪科技有限公司 一种图像编解码方法及装置
JP6817433B2 (ja) * 2016-11-08 2021-01-20 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. 少なくとも2つのチャンネルをダウンミックスするためのダウンミキサおよび方法ならびにマルチチャンネルエンコーダおよびマルチチャンネルデコーダ
AU2017357453B2 (en) * 2016-11-08 2021-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain
CN109215667B (zh) * 2017-06-29 2020-12-22 华为技术有限公司 时延估计方法及装置
JP7204774B2 (ja) 2018-04-05 2023-01-16 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン チャネル間時間差を推定するための装置、方法またはコンピュータプログラム
CN114708874A (zh) * 2018-05-31 2022-07-05 华为技术有限公司 立体声信号的编码方法和装置
CN110403582B (zh) * 2019-07-23 2021-12-03 宏人仁医医疗器械设备(东莞)有限公司 一种用于分析脉波波形品质的方法
GB2623516A (en) * 2022-10-17 2024-04-24 Nokia Technologies Oy Parametric spatial audio encoding

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970005131B1 (ko) * 1994-01-18 1997-04-12 대우전자 주식회사 인간의 청각특성에 적응적인 디지탈 오디오 부호화장치
JP2852862B2 (ja) * 1994-02-01 1999-02-03 株式会社グラフィックス・コミュニケーション・ラボラトリーズ Pcmオーディオ信号の変換方法と装置
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
EP1500092B1 (en) 2002-04-09 2007-06-06 Koninklijke Philips Electronics N.V. Compound objective lens with fold mirror
DE60331535D1 (de) * 2002-04-10 2010-04-15 Koninkl Philips Electronics Nv Kodierung und Dekodierung für mehrkanalige Signale
BR0304541A (pt) * 2002-04-22 2004-07-20 Koninkl Philips Electronics Nv Método e arranjo para sintetizar um primeiro e um segundo sinal de saìda a partir de um sinal de entrada, aparelho para prover um sinal de áudio decodificado, sinal de multicanal decodificado, e, meio de armazenamento
ES2300567T3 (es) * 2002-04-22 2008-06-16 Koninklijke Philips Electronics N.V. Representacion parametrica de audio espacial.
BRPI0304542B1 (pt) 2002-04-22 2018-05-08 Koninklijke Philips Nv “Método e codificador para codificar um sinal de áudio de multicanal, sinal de áudio multicanal codificado, e, método e decodificador para decodificar um sinal de áudio de multicanal codificado”
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
US7542896B2 (en) 2002-07-16 2009-06-02 Koninklijke Philips Electronics N.V. Audio coding/decoding with spatial parameters and non-uniform segmentation for transients
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
WO2005081229A1 (ja) * 2004-02-25 2005-09-01 Matsushita Electric Industrial Co., Ltd. オーディオエンコーダ及びオーディオデコーダ
ATE390683T1 (de) * 2004-03-01 2008-04-15 Dolby Lab Licensing Corp Mehrkanalige audiocodierung
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2581782C1 (ru) * 2013-04-30 2016-04-20 Долби Лабораторис Лайсэнзин Корпорейшн Гибридное кодирование многоканального звука
RU2730548C2 (ru) * 2015-09-25 2020-08-24 Войсэйдж Корпорейшн Способ и система для кодирования левого и правого каналов стереофонического звукового сигнала с выбором между моделями двух и четырех подкадров в зависимости от битового бюджета
US10839813B2 (en) 2015-09-25 2020-11-17 Voiceage Corporation Method and system for decoding left and right channels of a stereo sound signal
US10984806B2 (en) 2015-09-25 2021-04-20 Voiceage Corporation Method and system for encoding a stereo sound signal using coding parameters of a primary channel to encode a secondary channel
US11056121B2 (en) 2015-09-25 2021-07-06 Voiceage Corporation Method and system for encoding left and right channels of a stereo sound signal selecting between two and four sub-frames models depending on the bit budget
RU2764287C1 (ru) * 2015-09-25 2022-01-17 Войсэйдж Корпорейшн Способ и система для кодирования левого и правого каналов стереофонического звукового сигнала с выбором между моделями двух и четырех подкадров в зависимости от битового бюджета

Also Published As

Publication number Publication date
IL185304A0 (en) 2008-02-09
AU2005328264A1 (en) 2006-08-31
NO20074829L (no) 2007-09-21
MX2007009887A (es) 2007-09-07
DE602005009262D1 (de) 2008-10-02
CA2598541C (en) 2012-08-14
PL1851997T3 (pl) 2009-01-30
EP1851997B1 (en) 2008-08-20
CN102270452B (zh) 2013-11-13
WO2006089570A1 (en) 2006-08-31
US20060190247A1 (en) 2006-08-24
PT1851997E (pt) 2008-12-04
CN102270452A (zh) 2011-12-07
ATE406076T1 (de) 2008-09-15
JP2008530616A (ja) 2008-08-07
ES2312025T3 (es) 2009-02-16
KR100954179B1 (ko) 2010-04-21
US7573912B2 (en) 2009-08-11
HK1107495A1 (en) 2008-04-03
CN101120615A (zh) 2008-02-06
RU2007135178A (ru) 2009-03-27
NO339907B1 (no) 2017-02-13
AU2005328264B2 (en) 2009-03-26
KR20070098930A (ko) 2007-10-05
BRPI0520053B1 (pt) 2019-02-19
EP1851997A1 (en) 2007-11-07
CA2598541A1 (en) 2006-08-31
BRPI0520053A2 (pt) 2009-04-14
CN101120615B (zh) 2012-05-23
JP4887307B2 (ja) 2012-02-29

Similar Documents

Publication Publication Date Title
RU2388176C2 (ru) Почти прозрачная или прозрачная схема многоканального кодера/декодера
JP7161564B2 (ja) チャネル間時間差を推定する装置及び方法
EP1649723B1 (en) Multi-channel synthesizer and method for generating a multi-channel output signal
RU2497204C2 (ru) Устройство параметрического стереофонического повышающего микширования, параметрический стереофонический декодер, устройство параметрического стереофонического понижающего микширования, параметрический стереофонический кодер
RU2550525C2 (ru) Аппаратный блок, способ и компьютерная программа для преобразования расширения сжатого аудио сигнала с помощью сглаженного значения фазы
RU2555221C2 (ru) Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой
CN112262433B (zh) 用于估计通道间时间差的装置、方法或计算机程序
TWI792006B (zh) 音訊合成器、訊號產生方法及儲存單元
CN118283489A (zh) 用于估计通道间时间差的装置、方法或计算机程序