RU2396608C2 - Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема - Google Patents

Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема Download PDF

Info

Publication number
RU2396608C2
RU2396608C2 RU2006139068/09A RU2006139068A RU2396608C2 RU 2396608 C2 RU2396608 C2 RU 2396608C2 RU 2006139068/09 A RU2006139068/09 A RU 2006139068/09A RU 2006139068 A RU2006139068 A RU 2006139068A RU 2396608 C2 RU2396608 C2 RU 2396608C2
Authority
RU
Russia
Prior art keywords
processing
signals
signal
channel
stereo
Prior art date
Application number
RU2006139068/09A
Other languages
English (en)
Other versions
RU2006139068A (ru
Inventor
ЛОН Махиль В. ВАН (NL)
ЛОН Махиль В. ВАН
Герард Х. ХОТО (NL)
Герард Х. ХОТО
Дирк Й. БРЕБАРТ (NL)
Дирк Й. БРЕБАРТ
Original Assignee
Конинклейке Филипс Электроникс Н.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Конинклейке Филипс Электроникс Н.В. filed Critical Конинклейке Филипс Электроникс Н.В.
Publication of RU2006139068A publication Critical patent/RU2006139068A/ru
Application granted granted Critical
Publication of RU2396608C2 publication Critical patent/RU2396608C2/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к обработке стереосигнала, полученного от кодировщика. Способ обработки стереосигнала включает в себя этапы, на которых кодируют N-канальный аудиосигнал в стереосигнал (L0, R0) и пространственные параметры (w1, wr), обрабатывают стереосигнал с использованием пространственных параметров для генерации обработанного стереосигнала (L0w, R0w). Матрица обработанного стереосигнала может быть описана как матрица стереосигнала, умноженная на фильтр-матрицу (Н), элементы которой являются фильтр-функциями (Н1, Н2, Н3, Н4), работающими с пространственными параметрами (w1, wr) и константой (а). Фильтр-функции не зависят от времени и выбираются так, чтобы матрица была обратимой. Технический результат - улучшение понижающего микширования в плане качества восприятия или его пространственных свойств. 7 н. и 13 з.п. ф-лы, 4 ил.

Description

Область техники, к которой относится изобретение
Настоящее изобретение относится к способу и устройству для обработки стереосигнала, полученного от кодировщика, который кодирует N-канальный аудиосигнал в левый и правый сигналы и пространственные параметры. Изобретение также относится к кодирующему устройству, содержащему такой кодировщик и такое устройство.
Настоящее изобретение также относится к способу и устройству для обработки стереосигнала, полученного таким способом и таким устройством для обработки стереосигнала, полученного от кодировщика. Изобретение также относится к декодирующему устройству, содержащему такое устройство для обработки стереосигнала.
Настоящее изобретение также относится к аудиосистеме, содержащей такое кодирующее устройство и такое декодирующее устройство.
Предшествующий уровень техники
В течение долгого времени доминировало стереовоспроизведение музыки, например, в домашних условиях. В семидесятые годы были предприняты некоторые эксперименты по четырехканальному воспроизведению музыки в домашних условиях.
В больших помещениях, таких как кинотеатры, многоканальное воспроизведение звука существует уже давно. Были разработаны Dolby Digital® и другие системы для реалистичного и выразительного воспроизведения в больших помещениях.
Такие многоканальные системы представлены в домашних кинотеатрах и вызывают большой интерес. Таким образом, системы, имеющие пять полнодиапазонных каналов и один усеченный канал или канал низкочастотных эффектов (LFE), так называемые системы 5.1, в настоящее время широко представлены на рынке. Также существуют другие системы, такие как 2.1, 4.1, 7.1 и даже 8.1.
С появлением SACD и DVD многоканальное воспроизведение аудио вызвало еще больший интерес. Многие потребители уже имеют возможность многоканального воспроизведения в своих домах, и исходные материалы с многоканальным звуком становятся все более популярными.
Из-за возросшей популярности многоканальных материалов эффективное кодирование многоканальных материалов становиться более важным, что также понимают организации по стандартам, такие как MPEG.
Известные ранее кодировщики часто не применяли эффективные способы кодирования для кодирования многоканального аудио. Входные каналы могли быть просто кодированы индивидуально (возможно после матрицирования), что требует высокой скорости передачи битов из-за большого числа каналов.
Тем не менее многоканальные аудиокодировщики могут создавать продукт двухканального смешения (микширования), которое совместимо с двухканальными системами воспроизведения, при этом оставляя возможным высококачественную многоканальную реконструкцию декодером. Высококачественная реконструкция управляется переданными параметрами P, которые управляют обратным процессом преобразования от стереосигнала к многоканальному сигналу. Эти параметры содержат информацию, описывающую, помимо прочего, отношение фронтального сигнала к сигналу окружения, которые представлены в двухканальном микшировании. Используя такой подход, декодер может управлять соотношением между фронтальным сигналом и сигналом окружения при процессе обратного преобразования от стереосигнала к многоканальному сигналу. Другими словами, параметры описывают важные свойства пространственного звукового поля, которое присутствует в исходном многоканальном сигнале, но которые теряются в стереосигнале из-за микширования.
Настоящее изобретение относится к возможности использования этой параметризованной пространственной информации для применения, зависящей от параметров, предпочтительно обратимой, последующей обработки двухканального понижающего миктирования, для улучшения понижающего микширования в плане качества восприятия или его пространственных свойств.
Сущность изобретения
Цель настоящего изобретения заключается в том, чтобы сделать возможной последующую обработку понижающего микширования после кодирования, на основе параметров, определенных в многоканальном кодировщике, с сохранением возможности многоканального декодирования без влияния последующей обработки.
Эта цель достигается с помощью способа и устройства для обработки стереосигнала, полученного от кодировщика, этот кодировщик кодирует N-канальный сигнал (N>2) в сигналы левого и правого каналов и пространственные параметры. Способ включает в себя этап, на котором обрабатывают упомянутые сигналы левого и правого каналов для того, чтобы получить обработанные сигналы. Обработка управляется в зависимости от упомянутых пространственных параметров. Основная идея заключается в использовании пространственных параметров, полученных от кодировщика N-каналов в стерео, для управления которым алгоритмом последующей обработки. Таким образом, стереосигнал, полученный от кодировщика, может быть обработан, например, для улучшения пространственных эффектов.
В реализации настоящего изобретения обработка управляется первым параметром для каждого входного канала, то есть для каждого из сигналов левого и правого каналов, где первый параметр зависит от пространственных параметров. Первый параметр может быть функцией времени и/или частоты. Таким образом, система может иметь переменную величину последующей обработки, в которой реальная величина последующей обработки зависит от пространственных параметров. Последующая обработка может выполняться индивидуально для различных полос частот. Кодировщик доставляет независимые пространственные параметры, описывающие пространственную картину для набора полос частот. В этом случае первый параметр может зависеть от частоты.
В другой реализации настоящего изобретения последующая обработка включает в себя добавление первого, второго и третьего сигналов для получения упомянутых обработанных сигналов каналов. Первый сигнал включает в себя первый входной сигнал, то есть сигнал левого или правого канала, измененный первой функцией преобразования, второй сигнал включает в себя первый входной сигнал, измененный второй функцией преобразования, и третий сигнал включает в себя второй входной сигнал, то есть сигнал левого или правого канала, измененный третьей функцией преобразования. Вторая функция преобразования может содержать упомянутый первый параметр и первую фильтр-функцию. Первая функция преобразования может содержать второй параметр, соответственно сумма упомянутого первого параметра и упомянутого второго параметра может быть равна единице. Третья функция преобразования может содержать упомянутый первый параметр для второго входного сигнала и вторую фильтр-функцию.
Фильтр-функции могут быть не зависящими от времени.
В одной определенной реализации сигналы могут быть описаны с помощью уравнения
Figure 00000001
, где
Figure 00000002
,
где
Figure 00000003
- постоянная.
Используя это отношение, эффект фильтрации фильтр-функций H1, H2, H3 и H4 изменяется при изменении параметров w и wr. Если оба параметра имеют значения, равные нулю, сигналы LOw, ROw после последующей обработки равны паре LO, RO входных стереосигналов. С другой стороны, если параметры равны +1, то пара сигналов LOw, ROw после последующей обработки полностью обрабатывается фильтр-функциями H1, H2, H3 и H4. Настоящее изобретение делает возможным управлять реальной величиной фильтрации, то есть значениями параметров w и wr, с помощью пространственных параметров P.
В соответствии с реализацией фильтр-функции и параметры выбираются так, чтобы матрица функции преобразования была обратимой. Это делает возможным восстановление исходного стереосигнала.
В другом аспекте настоящего изобретения оно содержит устройство для обработки стереосигнала, в соответствии с упомянутыми выше способами, и кодирующее устройство, содержащее такое устройство.
В другом аспекте настоящего изобретения обеспечивается способ и устройство для инвертирования обработки в соответствии с упомянутыми выше способами, и декодирующее устройство, содержащее такое инвертирующее устройство.
В еще одном аспекте настоящего изобретения обеспечивается аудиосистема, содержащая такое кодирующее устройство и декодирующее устройство.
Краткое описание чертежей
Дополнительные цели, особенности и преимущества настоящего изобретения станут понятны из следующего подробного описания изобретения со ссылками на его реализации и со ссылкой на сопроводительные чертежи:
Фиг.1 - схематическая блок-схема кодирующей/декодирующей аудиосистемы, содержащей последующую обработку и обратную последующую обработку в соответствии с настоящим изобретением.
Фиг.2 - подробная блок-схема реализации устройства для последующей обработки стереосигнала, полученного от многоканального кодировщика.
Фиг.3 - блок-схема другой реализации устройства для последующей обработки стереосигнала, полученного от многоканального декодера.
Фиг.4 - блок-схема реализации для обратной последующей обработки стереосигнала, содержащего сигналы левого и правого каналов.
Предпочтительные варианты реализации изобретения
На Фиг.1 представлена блок-схема кодирующей/декодирующей системы, в которой используется настоящее изобретение. В аудиосистеме 1 N-канальный аудиосигнал передается кодировщику 2, где N целое число, которое больше 2. Кодировщик 2 преобразует N-канальные аудиосигналы в сигналы L0 и R0 и параметрическую информацию P декодера, с помощью которой декодер может декодировать информацию и определить исходные N-канальные сигналы для вывода от декодера. Предпочтительно, чтобы набор P пространственных параметров зависел от времени и/или частоты. N-канальные сигналы могут быть сигналами для системы 5.1, содержащей центральный канал, два фронтальных канала, два канала окружения и LFE канал.
Кодированная пара стереосигналов L0 и R0 и пространственная информация P декодера передаются пользователю подходящим способом, таким как посредством CD, DVD, VHS Hi-Fi, радиовещанием, лазерным диском, DBS, цифровым кабелем, Интернет или с помощью любой другой системы передачи или распределения, что обозначено круговой линией 4 на Фиг.1. Так как передаются левый и правый сигналы, система совместима с большим количеством принимающего оборудования, которое может воспроизводить только стереосигналы. Если принимающее оборудование содержит декодер, декодер может декодировать N-канальные сигналы и обеспечить их оценку, на основе информации в паре стереосигналов L0 и R0 и сигналах пространственной информации декодера или пространственных параметрах P.
Тем не менее, из-за уменьшения количества каналов воспроизведения, у стереосигналов не хватает пространственной информации, по сравнению с N-канальными сигналами, или других свойств, которые могут быть желательны в некоторых ситуациях. Таким образом, в соответствии с настоящим изобретением обеспечивается процессор 5 последующей обработки, который обрабатывает стереосигнал перед передачей/распределением к приемнику. Последующая обработка может быть добавлением нижних звуковых частот в определенных местах или реверберацией, или удалением голосов (караоке с голосами в центральном канале).
Другими примерами последующей обработки являются уширение стереобазы, что может быть выполнено с использованием информации о составе первоначального смешения окружения (микширования объемного звучания), такого как фронт/тыл, так как распределение индивидуальных входных сигналов известно из сигналов P информации декодера. В принципе стереоуширение может быть применено уже в кодировщике, но это, как правило, необратимо, так как только два сигнала доступно декодеру, вместо N, обратное преобразование в общем случае невозможно. Но кроме стереоуширения, возможны другие методики последующей обработки индивидуального многоканального распределения.
В соответствии с изобретением сигналы после последующей обработки передаются к приемнику, как показано окружностью 6 на Фиг.1. Изобретенное устройство для обработки стереосигнала, полученного от кодировщика, содержит процессор 5 последующей обработки. Кодирующее устройство в соответствии с настоящим изобретением состоит из кодировщика 2 и процессора 5 последующей обработки.
Принятый сигнал может быть использован непосредственно, например, если преемник не содержит многоканальный декодер. Это может быть в случае компьютера, принимающего сигнал 6 через сеть Интернет, или приемника, имеющего только два громкоговорителя. Такой принятый сигнал воспринимается как высококачественный сигнал, так как он имеет улучшенное пространственное восприятие или другие характеристики, как определяется в процессе его обработки кодировщиком и процессором последующей обработки.
Если сигнал должен быть использован для декодирования в традиционном N-канальном декодере 3, он должен быть сначала обработан процессором 7 обратной последующей обработки для того, чтобы восстановить первоначальную пару стереосигналов L0 и R0, которая вместе с информацией декодера или пространственными параметрами P образует оценку для N-канального сигнала. В соответствии с изобретением такое восстановление возможно для многоканального смешения (микширования), причем на восстановление сильно влияет последующая обработка. Также возможна последующая обработка в декодере для стереовоспроизведения, как выбираемая пользователем функция, без необходимости определения многоканального сигнала перед этим. Изобретенное устройство для обработки стереосигнала, содержащего сигналы левого и правого каналов, содержит процессор 7 обратной последующей обработки. Декодирующее устройство в соответствии с настоящим изобретением содержит декодер 3 и процессор 7 обратной последующей обработки. Без последующей обработки понижающее микширование совместимо со стандартным ITU понижающим микшированием. Изобретенный способ тем не менее может значительно улучшить понижающее микширование.
Изобретенный способ способен определить вклад в понижающее микширование от исходных каналов в многоканальном микшировании с помощью определенных пространственных параметров P в кодировщике. Таким образом, последующая обработка может быть применена к конкретным каналам многоканального микширования, например, уширение стереобазы тыловых каналов, когда другие каналы не меняются. Последующая обработка не влияет на окончательное многоканальное восстановление, если последующая обработка обратима. Она также может быть применена для улучшенного стереовоспроизведения без необходимости восстановления многоканального микширования перед этим.
Этот способ отличается от существующих методик последующей обработки потому, что он использует знание исходного многоканального микширования, то есть определенные пространственные параметры P.
Кодировщик 2 работает следующим образом.
Предположим, что N-канальный аудиосигнал является входным сигналом для кодировщика 2, где z1[n], z2[n],… zN[n] описывают дискретные волновые формы во временной области для N каналов. Эти N сигналов сегментированы с использованием общей сегментации, предпочтительно с использованием окна анализа с перекрытием. Затем каждый сегмент конвертируется в частотную область с помощью комплексного преобразования (например, быстрого преобразования Фурье, FFT). Тем не менее комплексные гребенки фильтров также могут подходить для получения временных/частотных образцов. Этот процесс приводит к сегментированным поддиапазонным представлениям входных сигналов, которые будут обозначены как Z1[k], Z2[k],…, ZN[k], где k обозначает индекс частоты.
Из этих N каналов создаются 2 канала понижающего микширования, L0[k] и R0[k]. Каждый канал понижающего микширования является линейной комбинацией N входных сигналов
Figure 00000004
Figure 00000005
Параметры
Figure 00000006
и
Figure 00000007
выбираются так, что стереосигнал, состоящий из L0[k] и R0[k], имеет хорошее стереоизображение. В случае 5-канального входного сигнала, состоящего из Lf, Rf, C, Ls и Rs (для фронтального левого, фронтального правого, центрального, левого окружения, правого окружения каналов соответственно), подходящее понижающее микширование может быть получено в соответствии с
Figure 00000008
Сигналы L и R могут быть получены в соответствии с уравнениями
Figure 00000010
Figure 00000011
Соответственно извлекаются пространственные параметры P, делающие возможным перцепционное восстановление сигналов Lf, Rf, C, Ls и Rs из L0 и R0.
В одном варианте реализации набор параметров P включает в себя значения межканальных разностей интенсивностей (IIDs) и возможных межканальных кросс-корреляций (ICCs) между парам сигналов (Lf, Ls) и (Rf, Rs). IID и ICC между парой Lf, Ls получаются в соответствии с уравнениями
Figure 00000012
Figure 00000013
Здесь (*) означает комплексное сопряжение. Для других пар сигналов могут быть использованы аналогичные уравнения. Таким образом, параметр IDDL описывает относительное количество энергии между фронтальным левым каналом и левым каналом окружения и параметр ICCL описывает величину взаимной корреляции между фронтальным левым каналом и левым каналом окружения. Эти параметры по существу описывают относящиеся к восприятию параметры между фронтальными каналами и каналами окружения.
Параметризация центрального канала, который представлен в L0, R0, может быть получена с помощью оценки двух предсказательных параметров c1 и c2. Эти два предсказательных параметра определяют матрицу 2·3, которая управляет декодирующим процессом восстановления (повышающим микшированием) L, C и R из L0, R0
Figure 00000014
Реализация матрицы M повышающего микширования записывается как
Figure 00000015
Для приведенного выше примера набор P параметров включает в себя {c1, c2, IDDL, ICCL, IDDR, ICCR} для каждого временного/частотного сегмента.
К результирующей паре стереосигналов (L0, R0) может быть применена последующая обработка таким образом, что она в основном влияет на вклад в Zi[k], например Ls и Rs в стереомикшировании. На Фиг.1 показано положение этого блока в кодеке.
На Фиг.2 представлен детальный вид процессора 5 последующей обработки по Фиг.1 в соответствии с вариантом реализации изобретения. Левый сигнал L0w после последующей обработки есть сумма трех сигналов, а именно левого сигнала L0, измененного функцией HA преобразования, левого сигнала L0, измененного функцией HB преобразования, и правого сигнала R0, измененного функцией HD преобразования. Аналогичным образом правый сигнал R0w после последующей обработки есть сумма трех сигналов, а именно правого сигнала R0, измененного функцией HF преобразования, правого сигнала R0, измененного функцией HE преобразования, и левого сигнала L0, измененного функцией HC преобразования. Функции HA-HF преобразования могут быть реализованы как фильтры FIR или IIR типа, или могут быть просто комплексными масштабирующими множителями, которые могут зависеть от частоты. Более того, функция HA преобразования может быть умножением со вторым параметром (1-wl) и функция HB преобразования может включать в себя первый параметр wl, где этот параметр w1 определяет величину последующей обработки стереосигнала.
Это показано на Фиг.3. Параметр wl определяет величину последующей обработки L0[k], а wr - R0[k]. Когда wl равен 0, L0[k] не изменяется, и когда wl равен 1, изменения в L0[k] максимальны. То же самое можно сказать о wr и R0[k].
Следующие уравнения справедливы для параметров wl и wr последующей обработки:
W l = f l (IID l , ICC l , c1,c2)
W r = f r (IID r , ICC r , c1,c2)
Блоки H1, H2, H3 и H4 на Фиг.3 являются фильтр-функциями, которые могут быть фильтрами разных типов, например фильтрами уширения стерео, как показано ниже.
Результирующий выход
Figure 00000001
, где
Figure 00000002
,
где
Figure 00000016
произвольная константа (например, +1).
Если фильтр-функции H1, H2, H3 и H4 выбраны правильно, матрица H функции преобразования может быть обращена. Более того, для того чтобы сделать возможным вычисление обратной матрицы декодером, фильтр-функции H1, H2, H3 и H4 и параметры wl и wr должны быть известны декодеру. Это возможно, так как wl и wr могут быть вычислены из переданных параметров. Таким образом, исходный стереосигнал L0, R0 будет доступен снова, что необходимо для декодирования многоканального миктирования.
Другая возможность заключается в передаче исходного стереосигнала и применении последующей обработки декодером, что делает возможным улучшенное стереовоспроизведение без необходимости сначала определять многоканальное миктирование.
Ниже подробно описана реализация последующей обработки. Тем не менее изобретение не ограничивается этими конкретными деталями, и они могут варьироваться в пределах объема изобретения, определенного нижеследующей формулой.
Параметры последующей обработки или весовые коэффициенты wl и wr являются функциями переданных пространственных параметров
(w l ,w r ) = f(P)
Функция f спроектирована таким образом, что wl увеличивается, если сигнал L0 содержит больше энергии от левого сигнала окружения, по сравнению с левым фронтальным или центральным сигналами. Аналогичным образом wr увеличивается с увеличением относительной энергии правого сигнала окружения, представленного в R0. Удобное выражение для wl и wr может быть записано как
Figure 00000017
Figure 00000018
где
Figure 00000019
и
Figure 00000020
Для фильтр-функций H1, H2, H3 и H4 были выбраны следующие примерные функции (в z-области):
H 1 (z) = H 4 (z) = 0,8(1,0 + 0,2z -1 + 0,2z -2 )
H 2 (z) = H 3 (z) = 0,8(-1,0z -1 - 0,2z -2 )
Это изобретение может быть использовано в многоканальном аудиокодирующем устройстве, которое осуществляет понижающее микширование, совместимое со стерео. Общая схема такого многоканального параметрического аудиокодировщика, который улучшен с помощью схемы последующей обработки, как описано выше, может быть представлено следующим образом:
- преобразование многоканального входного сигнала в частотную область, или с помощью сегментации и трансформации, или с помощью блока фильтров;
- извлечение пространственных параметров P и генерация понижающего микширования в частотной области;
- применение алгоритма последующей обработки в частотной области;
- преобразование сигналов после последующей обработки во временную область;
- кодирование стереосигнала с использованием традиционных методик кодирования, таких как определены в MPEG;
- мультиплексирование стереопотока битов с кодированными параметрами P для образования полного выходного потока битов.
Соответствующее многоканальное декодирующее устройство (то есть декодер с применяемой обратной последующей обработкой) может быть представлено следующим образом:
- демультиплексирование потока битов параметров для получения параметров P и кодированного стереосигнала;
- декодирование стереосигнала;
- преобразование декодированного стереосигнала в частотную область;
- применение обратной последующей обработки на основе параметров P;
- повышающее микширование из стереосигнала в многоканальный выходной сигнал на основе параметров P;
- преобразование многоканального выходного сигнала во временную область.
Так как последующая обработка и обратная последующая обработка выполняются в частотной области, фильтр-функции H1 - H4 предпочтительно конвертируются или аппроксимируются в частотной области простыми (вещественными или комплексными) масштабирующими множителями, которые могут зависеть от частоты.
Специалисту в данной области техники должно быть понятно, что один или более из описанных выше этапов обработки могут быть скомбинированы как один этап обработки.
Другим применением изобретения является применение последующей обработки к стереосигналу только на стороне декодера (то есть без последующей обработки кодировщиком). Используя такой подход, декодер может генерировать улучшенный стереосигнал из неулучшенного стереосигнала.
Дополнительная информация может быть предоставлена в потоке битов, которая сигнализирует о том, была ли выполнена последующая обработка и какие параметрические функции f1 и f2, которые являются фильтр-функциями H1, H2, H3 и H4, были использованы, что делает возможным обратную последующую обработку.
Фильтр-функции могут быть описаны как умножение в частотной области. Так как параметры представлены для отдельных полос частот, изобретение может быть реализовано в виде простых, комплексных коэффициентов усиления вместо фильтров, которые применяются индивидуально в различных полосах частот. В этом случае частотные полосы для L0w, R0w получаются простым умножением на матрицу (2·2) из соответствующих полос частот из (L0, R0). Реальные элементы матрицы определяются параметрами и представлениями частотной области для фильтр-функции H, таким образом, образуя независящие от времени коэффициенты усиления H и зависящие от времени/частоты, управляемые параметрами коэффициенты усиления wl и wr. Так как фильтры являются скалярами для каждой полосы, обратное преобразование возможно.
Последующая обработка в кодировщике может быть описана с помощью следующего матричного уравнения:
Figure 00000021
,
где
Figure 00000022
Это матричное уравнение применяется для каждой полосы частот. Матрица H содержит только скалярные величины. Использование скаляров делает последующую обработку и обратную последующую обработку относительно простыми.
Параметры
Figure 00000023
и
Figure 00000024
являются скалярами и функциями набора P параметров. Эти два параметра определяют величину последующей обработки для входных каналов.
Параметры H1....H4 являются комплексными фильтр-функциями.
Обращение данного процесса также может быть выполнено с помощью простого матричного умножения по полосам частот. Следующее уравнение применяется по полосам частот:
Figure 00000025
где
Figure 00000026
Матрица H -1 содержит только скалярные величины. Элементы
Figure 00000027
,
Figure 00000028
также являются функциями набора P параметров. Когда функции в матрице H,
Figure 00000029
и параметры P известны декодеру, то последующая обработка может быть инвертирована.
Блок-схема процессора 3 обратной последующей обработки, который выполняет такую обратную последующую обработку, показана на Фиг.4.
Это обращение возможно, когда определитель матрицы H не равен нулю. Определитель матрицы H равен
Figure 00000030
Когда выбраны подходящие функции
Figure 00000031
det(H) будет не равен нулю, и процесс обратим.
Следует отметить, что термин «содержит» не исключает других элементов или этапов и единственное число не исключает множества элементов. Более того, знаки ссылки в формуле изобретения не должны рассматриваться как ограничивающие объем изобретения.
Изобретение было описано со ссылкой на определенные реализации. Тем не менее изобретение не ограничивается различными описанными реализациями, но может быть изменено и скомбинировано различными способами, как понятно специалисту в данной области техники, прочитавшему данное описание.

Claims (20)

1. Способ обработки стереосигнала, полученного от кодировщика, причем кодировщик кодирует N-канальный аудиосигнал в сигналы (L0; R0) левого и правого каналов и пространственные параметры (Р), отличающийся тем, что включает в себя этап, на котором:
обрабатывают упомянутые сигналы левого и правого каналов, для того чтобы обеспечить обработанный стереосигнал (L0w; R0w), причем упомянутой обработкой управляют в зависимости от упомянутых пространственных параметров (Р).
2. Способ по п.1, в котором упомянутой обработкой управляют первым параметром (wl; wr) для каждого из упомянутых сигналов левого и правого каналов, причем упомянутый первый параметр зависит от пространственных параметров (Р).
3. Способ по п.2, в котором упомянутый первый параметр (wl; wr) является функцией времени и/или частоты.
4. Способ по п.1, в котором упомянутая обработка включает в себя фильтрацию, по меньшей мере, одного из упомянутых сигналов левого и правого каналов функцией преобразования, которая зависит от пространственных параметров (Р).
5. Способ по п.1, в котором упомянутая обработка включает в себя этапы, на которых:
складывают первый, второй и третий сигнал для того, чтобы получить упомянутые обработанные сигналы (L0w; R0w) канала, причем первый сигнал включает в себя стереосигнал, модифицированный первой функцией преобразования (L0*HA; R0*HF), второй сигнал включает в себя стереосигнал от того же одного канала, модифицированный второй функцией преобразования (L0*HB; R0*HE), и третий сигнал включает в себя стереосигнал от другого канала, модифицированный третьей функцией преобразования (R0*HD; L0*HC).
6. Способ по п.5, в котором упомянутая вторая функция преобразования (HB; HE) содержит умножение на упомянутый первый параметр (Wl; Wr) с последующим умножением на первую фильтр-функцию (H1; H4).
7. Способ по п.5, в котором упомянутая первая функция преобразования (НA; НF) содержит умножение на второй параметр.
8. Способ по п.5, в котором упомянутая первая функция преобразования (НA; НF) содержит умножение на второй параметр, причем упомянутый первый параметр является функцией упомянутого второго параметра.
9. Способ по п.5, в котором упомянутая третья функция преобразования (НC; НD) содержит умножение сигналов (L0; R0) левого или правого каналов на упомянутый первый параметр (W1; Wr), за которым следует вторая фильтр-функция (Н2; Н3).
10. Способ по п.6, в котором упомянутые фильтр-функции (H1, H2, Н3, Н4) не зависят от времени.
11. Способ по п.1, в котором упомянутые сигналы описываются уравнением:
Figure 00000032

в котором матрица функции преобразования (Н) является функцией пространственных параметров (Р).
12. Способ по п.11, в котором упомянутая матрица функции преобразования (Н) описывается уравнением:
Figure 00000033

где а постоянная.
13. Способ по п.12, в котором упомянутые фильтр-функции (H1, H2, Н3, Н4) и параметры (w1, wr) выбирают так, чтобы матрица функции преобразования (Н) была обратимой.
14. Способ по любому из предшествующих пунктов, в котором упомянутые пространственные параметры (Р) содержат информацию, описывающую уровни сигналов в N-канальном сигнале.
15. Устройство для обработки стереосигнала, полученного от кодировщика, причем кодировщик кодирует N-канальный аудиосигнал в сигналы (L0; R0) левого и правого каналов и пространственные параметры (Р), отличающееся тем, что содержит процессор (5) последующей обработки для последующей обработки упомянутых сигналов левого и правого каналов, для того чтобы обеспечить обработанный стереосигнал (L0w; R0w), причем упомянутая последующая обработка управляется в зависимости от упомянутых пространственных параметров (Р).
16. Кодирующее устройство, содержащее: кодировщик (2) для кодирования N-канального аудиосигнала в сигналы (L0; R0) левого и правого каналов и пространственные параметры (Р), и устройство (5) в соответствии с п.15 для обработки упомянутых сигналов (L0; R0) левого и правого каналов в зависимости от упомянутых пространственных параметров (Р).
17. Способ обработки стереосигнала, содержащего сигналы (L0w; R0w), левого и правого каналов, в выходной стереосигнал, отличающийся тем, что включает в себя этап, на котором обрабатывают упомянутые сигналы левого и правого каналов, для того чтобы обеспечить выходной стереосигнал, причем упомянутой обработкой управляют в зависимости от упомянутых пространственных параметров (Р), причем упомянутая обработка является обратной по отношении к обработке по п.1.
18. Устройство (7) для обработки стереосигнала, содержащего сигналы (L0w; R0w), левого и правого каналов, в выходной стереосигнал, отличающееся тем, что содержит процессор обратной последующей обработки для обратной последующей обработки упомянутых сигналов левого и правого каналов, для того чтобы обеспечить выходной стереосигнал, причем упомянутая обработка управляется в зависимости от упомянутых пространственных параметров (Р), причем упомянутая обработка является обратной по отношении к обработке по п.17.
19. Декодирующее устройство, содержащее устройство (7) по п.18 для обработки стереосигнала, содержащего сигналы (L0w; R0w), левого и правого каналов, и декодер для декодирования обработанных стереосигналов (L0; R0) в N-канальный аудиосигнал.
20. Аудиосистема (1), содержащая кодирующее устройство по п.16 и декодирующее устройство по п.19.
RU2006139068/09A 2004-04-05 2005-03-30 Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема RU2396608C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP04101405 2004-04-05
EP04101405.1 2004-04-05
EP04103367 2004-07-14
EP04103367.1 2004-07-14

Publications (2)

Publication Number Publication Date
RU2006139068A RU2006139068A (ru) 2008-05-20
RU2396608C2 true RU2396608C2 (ru) 2010-08-10

Family

ID=34962191

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2006139068/09A RU2396608C2 (ru) 2004-04-05 2005-03-30 Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема

Country Status (12)

Country Link
US (1) US9992599B2 (ru)
EP (1) EP1735779B1 (ru)
JP (1) JP5284638B2 (ru)
KR (1) KR101183862B1 (ru)
CN (1) CN1947172B (ru)
BR (1) BRPI0509110B1 (ru)
ES (1) ES2426917T3 (ru)
MX (1) MXPA06011397A (ru)
PL (1) PL1735779T3 (ru)
RU (1) RU2396608C2 (ru)
TW (1) TWI455614B (ru)
WO (1) WO2005098826A1 (ru)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2461078C2 (ru) * 2005-07-14 2012-09-10 Конинклейке Филипс Электроникс Н.В. Кодирование и декодирование звука
US8626503B2 (en) 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
RU2556390C2 (ru) * 2010-12-03 2015-07-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ основанного на геометрии кодирования пространственного звука
RU2646375C2 (ru) * 2013-05-13 2018-03-02 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Выделение аудиообъекта из сигнала микширования с использованием характерных для объекта временно-частотных разрешений

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE557552T1 (de) 2004-07-14 2012-05-15 Koninkl Philips Electronics Nv Verfahren, vorrichtung, kodierer, dekodierer und audiosystem
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
BRPI0615899B1 (pt) * 2005-09-13 2019-07-09 Koninklijke Philips N.V. Unidade decodificadora espacial, dispositivo decodificador espacial, sistema de áudio, dispositivo de consumidor, e método para produzir um par de canais de saída binaurais
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
TWI469133B (zh) 2006-01-19 2015-01-11 Lg Electronics Inc 媒體訊號處理方法及裝置
KR20080110920A (ko) 2006-02-07 2008-12-19 엘지전자 주식회사 부호화/복호화 장치 및 방법
ATE456261T1 (de) 2006-02-21 2010-02-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
UA94117C2 (ru) 2006-10-16 2011-04-11 Долби Свиден Ав Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов
AU2007312597B2 (en) 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
WO2008063035A1 (en) * 2006-11-24 2008-05-29 Lg Electronics Inc. Method for encoding and decoding object-based audio signal and apparatus thereof
US8855795B2 (en) 2007-01-09 2014-10-07 Mediatek Inc. Multiple output audio system
US8615088B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning
EP2083585B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
KR100998913B1 (ko) * 2008-01-23 2010-12-08 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
WO2011080916A1 (ja) 2009-12-28 2011-07-07 パナソニック株式会社 音声符号化装置および音声符号化方法
CN102280107B (zh) * 2010-06-10 2013-01-23 华为技术有限公司 边带残差信号生成方法及装置
CN103262158B (zh) * 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
EP2661905B1 (en) * 2011-01-05 2020-08-12 Koninklijke Philips N.V. An audio system and method of operation therefor
EP2830046A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal to obtain modified output signals
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4095049A (en) * 1976-03-15 1978-06-13 National Research Development Corporation Non-rotationally-symmetric surround-sound encoding system
US4236039A (en) * 1976-07-19 1980-11-25 National Research Development Corporation Signal matrixing for directional reproduction of sound
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
JPH06165079A (ja) * 1992-11-25 1994-06-10 Matsushita Electric Ind Co Ltd マルチチャンネルステレオ用ダウンミキシング装置
DE4409368A1 (de) 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
US5642423A (en) 1995-11-22 1997-06-24 Sony Corporation Digital surround sound processor
US6697491B1 (en) 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
SG54379A1 (en) 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
DE69712230T2 (de) 1997-05-08 2002-10-31 St Microelectronics Asia Verfahren und gerät zur frequenzdomäneabwärtsumsetzung mit zwangblockschaltung für audiodekoderfunktionen
US6173061B1 (en) * 1997-06-23 2001-01-09 Harman International Industries, Inc. Steering of monaural sources of sound using head related transfer functions
US6067361A (en) * 1997-07-16 2000-05-23 Sony Corporation Method and apparatus for two channels of sound having directional cues
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
DE60317203T2 (de) * 2002-07-12 2008-08-07 Koninklijke Philips Electronics N.V. Audio-kodierung
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
JPWO2005081229A1 (ja) * 2004-02-25 2007-10-25 松下電器産業株式会社 オーディオエンコーダ及びオーディオデコーダ
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US20050247756A1 (en) 2004-03-31 2005-11-10 Frazer James T Connection mechanism and method
WO2005098821A2 (en) 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
ATE557552T1 (de) * 2004-07-14 2012-05-15 Koninkl Philips Electronics Nv Verfahren, vorrichtung, kodierer, dekodierer und audiosystem

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2461078C2 (ru) * 2005-07-14 2012-09-10 Конинклейке Филипс Электроникс Н.В. Кодирование и декодирование звука
US8626503B2 (en) 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
RU2556390C2 (ru) * 2010-12-03 2015-07-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ основанного на геометрии кодирования пространственного звука
US9396731B2 (en) 2010-12-03 2016-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Sound acquisition via the extraction of geometrical information from direction of arrival estimates
US10109282B2 (en) 2010-12-03 2018-10-23 Friedrich-Alexander-Universitaet Erlangen-Nuernberg Apparatus and method for geometry-based spatial audio coding
RU2646375C2 (ru) * 2013-05-13 2018-03-02 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Выделение аудиообъекта из сигнала микширования с использованием характерных для объекта временно-частотных разрешений
US10089990B2 (en) 2013-05-13 2018-10-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio object separation from mixture signal using object-specific time/frequency resolutions

Also Published As

Publication number Publication date
BRPI0509110B1 (pt) 2019-07-09
TWI455614B (zh) 2014-10-01
BRPI0509110A8 (pt) 2016-02-10
CN1947172B (zh) 2011-08-03
EP1735779B1 (en) 2013-06-19
JP5284638B2 (ja) 2013-09-11
EP1735779A1 (en) 2006-12-27
TW200611588A (en) 2006-04-01
KR20070001205A (ko) 2007-01-03
BRPI0509110A (pt) 2007-08-28
KR101183862B1 (ko) 2012-09-20
JP2007531916A (ja) 2007-11-08
US9992599B2 (en) 2018-06-05
ES2426917T3 (es) 2013-10-25
MXPA06011397A (es) 2006-12-20
CN1947172A (zh) 2007-04-11
RU2006139068A (ru) 2008-05-20
WO2005098826A1 (en) 2005-10-20
US20070183601A1 (en) 2007-08-09
PL1735779T3 (pl) 2014-01-31

Similar Documents

Publication Publication Date Title
RU2396608C2 (ru) Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема
US11621005B2 (en) Parametric joint-coding of audio sources
EP2175671B1 (en) Method, device, encoder apparatus, decoder apparatus and audio system
US20090240505A1 (en) Audio decoding
EP1706865A1 (en) Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
MX2007004726A (es) Formacion de canal individual para esquemas de bcc y los semejantes.