RU2374703C2 - Кодирование или декодирование аудиосигнала - Google Patents

Кодирование или декодирование аудиосигнала Download PDF

Info

Publication number
RU2374703C2
RU2374703C2 RU2006118682/09A RU2006118682A RU2374703C2 RU 2374703 C2 RU2374703 C2 RU 2374703C2 RU 2006118682/09 A RU2006118682/09 A RU 2006118682/09A RU 2006118682 A RU2006118682 A RU 2006118682A RU 2374703 C2 RU2374703 C2 RU 2374703C2
Authority
RU
Russia
Prior art keywords
sub
signals
subband
sampled
audio
Prior art date
Application number
RU2006118682/09A
Other languages
English (en)
Other versions
RU2006118682A (ru
Inventor
Ларс Ф. ВИЛЛЕМОЕС (DE)
Ларс Ф. ВИЛЛЕМОЕС
Пер ЭКСТРАНД (DE)
Пер ЭКСТРАНД
Хейко ПУРНХАГЕН (DE)
Хейко ПУРНХАГЕН
Эрик Г.П. СХЕЙЕРС (NL)
Эрик Г.П. СХЕЙЕРС
БОНТ Франсискус М.Й. ДЕ (NL)
БОНТ Франсискус М.Й. ДЕ
Original Assignee
Конинклейке Филипс Электроникс Н.В.
Коудинг Текнолоджиз Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34530779&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=RU2374703(C2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Конинклейке Филипс Электроникс Н.В., Коудинг Текнолоджиз Аб filed Critical Конинклейке Филипс Электроникс Н.В.
Publication of RU2006118682A publication Critical patent/RU2006118682A/ru
Application granted granted Critical
Publication of RU2374703C2 publication Critical patent/RU2374703C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0266Filter banks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Stereophonic System (AREA)
  • Insulated Conductors (AREA)

Abstract

Изобретение относится к кодированию аудиосигнала или декодированию кодированного аудиосигнала. Технический результат - обеспечение аудио кодирования или декодирования с использованием пространственных параметров. Аудиосигнал включает в себя первый аудиоканал и второй аудиоканал, при этом кодирование содержит фильтрование в поддиапазонах каждого из первого аудиоканала и второго аудиоканала в комплексно модулированном банке фильтров для обеспечения первого множества поддиапазонных сигналов для первого аудиоканала и второе множество поддиапазонных сигналов для второго аудиоканала, дискретизацию с понижением частоты каждого из поддиапазонных сигналов для обеспечения первого множества дискретизированных с понижением частоты поддиапазонных сигналов и второго множества дискретизированных с понижением частоты поддиапазонных сигналов, дополнительную фильтрацию в поддиапазонах, по меньшей мере, одного из дискретизированных с понижением частоты поддиапазонных сигналов в дополнительном банке фильтров для обеспечения множества под-поддиапазонных сигналов, получение пространственных параметров из под-поддиапазонных сигналов и из тех дискретизированных с понижением частоты поддиапазонных сигналов, которые не подвергаются дополнительной фильтрации в поддиапазонах, и получение одноканального аудиосигнала, содержащего поддиапазонные сигналы, получение из первого множества дискретизированных с понижением частоты поддиапазонных сигналов и второго множества дискретизированных с понижением частоты поддиапазонных сигналов. Дополнительно предложено декодирование, при котором кодированный ауд

Description

Изобретение относится к кодированию аудиосигнала или декодированию кодированного аудиосигнала.
В работе Erik Schuijers, Werner Oomen, Bert den Brinker and Jeroen Breebaart, "Advances in Parametric Coding for High-Quality Audio", Preprint 5852, 114th AES Convention, Amsterdam, The Netherlands, 22-25 March 2003 раскрыта схема параметрического кодирования с использованием рационального параметрического представления для стереоизображения. Два входных сигнала совмещаются в один монофонический аудиосигнал. Перцентуально, значимые пространственные метки моделируются явным образом, как показано на фиг.1. Объединенный сигнал кодируется с использованием монофонического параметрического кодера. Стереофонические параметры: межканальная разница мощности (IID), межканальная разница времени (ITD) и межканальная взаимная корреляция (ICC) - подвергаются квантованию, кодируются и мультиплексируются в битовый поток вместе с квантованным монофоническим аудиосигналом. На стороне декодера битовый поток демультиплексируется в кодированный монофонический сигнал и стереофонические параметры. Кодированный монофонический аудиосигнал декодируется для получения декодированного монофонического аудиосигнала m' (см. фиг.2). Из монофонического сигнала временной области декоррелированный сигнал вычисляется с использованием фильтра D, формирующего перцепционную декорреляцию. Как монофонический сигнал m' временной области, так и декоррелированный сигнал d преобразуются в частотную область. Затем стереофонический сигнал частотной области обрабатывается с параметрами IID, ITD и ICC посредством масштабирования, фазовых компенсаций и смешивания, соответственно, в узле обработки параметров для получения декодированной стереофонической пары l' и r'. Результирующие представления частотной области преобразуются обратно во временную область.
Цель изобретения состоит в обеспечении предпочтительного аудиокодирования или декодирования с использованием пространственных параметров. С этой целью изобретение предусматривает способ кодирования, аудиокодер, устройство для передачи или сохранения, способ декодирования, аудиодекодер, устройство воспроизведения и компьютерный программный продукт, которые определены в независимых пунктах формулы изобретения. Предпочтительные варианты осуществления определены в зависимых пунктах формулы изобретения.
Согласно первому аспекту изобретения, аудиосигнал кодируется, причем аудиосигнал включает в себя первый аудиоканал и второй аудиоканал, кодирование содержит фильтрацию в поддиапазонах каждого из первого аудиоканала и второго аудиоканала в комплексно модулированном банке фильтров для обеспечения первого множества поддиапазонных сигналов для первого аудиоканала и второе множество поддиапазонных сигналов для второго аудиоканала, дискретизирование с понижением частоты каждого из поддиапазонных сигналов для обеспечения первого множества дискретизированных с понижением частоты поддиапазонных сигналов и второго множества дискретизированных с понижением частоты поддиапазонных сигналов, дополнительную фильтрацию в поддиапазонах, по меньшей мере, одного из дискретизированных с понижением частоты поддиапазонных сигналов в дополнительном банке фильтров для обеспечения множества под-поддиапазонных сигналов получения пространственных параметров из под-поддиапазонных сигналов и из тех дискретизированных с понижением частоты поддиапазонных сигналов, которые не подвергаются дополнительной фильтрации в поддиапазонах, и получение одноканального аудиосигнала, содержащего поддиапазонные сигналы, полученные из первого множества дискретизированных с понижением частоты поддиапазонных сигналов и второго множества дискретизированных с понижением частоты поддиапазонных сигналов. Посредством обеспечения дополнительной фильтрации в поддиапазонах, частотное разрешение упомянутого поддиапазона повышается. Такое повышенное частотное разрешение обладает тем преимуществом, что становится возможным достижение более высокого качества аудиосигнала (ширина полосы единственного поддиапазонного сигнала в типовом случае является более высокой, чем у критических диапазонов в слуховой системе человека) в рациональной реализации (потому что должно быть преобразовано лишь небольшое количество диапазонов). Параметрический пространственный кодер пытается смоделировать бинауральные метки, которые воспринимаются по неравномерной частотной шкале, аналогичной шкале эквивалентных прямоугольных диапазонов (ERB). Одноканальный аудиосигнал может быть получен непосредственно из первого множества дискретизированных с понижением частоты поддиапазонных сигналов и второго множества дискретизированных с понижением частоты поддиапазонных сигналов. Однако, одноканальный аудиосигнал преимущественно извлекается из под-поддиапазонных сигналов для тех дискретизированных с понижением частоты поддиапазонов, которые должны подвергаться дополнительной фильтрации в поддиапазонах, в этом случае под-поддиапазонные сигналы каждого поддиапазона суммируются для формирования новых поддиапазонных сигналов, и при этом одноканальный аудиосигнал получается из этих новых поддиапазонных сигналов и поддиапазонов из первого и второго множества поддиапазонов, которые не подвергаются дополнительной фильтрации.
Согласно другому главному аспекту изобретения, предусмотрено аудио декодирование кодированного аудиосигнала, причем кодированный аудиосигнал содержит кодированный одноканальный аудиосигнал и набор пространственных параметров, аудиодекодирование содержит декодирование кодированного одноканального аудиоканала для получения множества дискретизированных с понижением частоты поддиапазонных сигналов, дополнительную фильтрацию в поддиапазонах, по меньшей мере, одного из дискретизированных с понижением частоты поддиапазонных сигналов в дополнительном банке фильтров для обеспечения множества под-поддиапазонных сигналов, и получение двух аудиоканалов из пространственных параметров, под-поддиапазонных сигналов и дискретизированных с понижением частоты поддиапазонных сигналов, которые не подвергаются дополнительной фильтрации в поддиапазонах. Посредством обеспечения дополнительной фильтрации в поддиапазонах в пределах полосы, частотное разрешение упомянутого поддиапазона повышается и, следовательно, может быть достигнуто более высококачественное аудиодекодирование.
Одно из главных преимуществ этих аспектов изобретения состоит в том, что параметрическое пространственное кодирование может быть легко объединено с методами спектральной репликации диапазона («SBR»). Метод SBR известен из работы: Martin Dietz, Lars Liljeryd, Kristofer Kjцrling and Oliver Kunz, «Spectral Band Replication, a novel approach in audio coding», Preprint 5553, 112th AES Convention, Munich, Germany, 10-13 May 2002 и из работы: Per Ekstrand, «Bandwidth extension of audio signals by spectral band replication», Proc. 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002), pp. 53-58, Leuven, Belgium, November 15, 2002. Дополнительная ссылка может быть сделана на стандарт MPEG-4 (стандарт сжатия видеоизображения и звука) ISO/DEC 14496-3:2001/FDAM1, JTC1/SC29/WG11, «Кодирование движущихся изображений и звука, растягивание ширины спектра», которая описывает аудиокодек, использующий метод SBR.
Метод SBR основан на представлении, что типично имеется значительная корреляция между низкими и высокими частотами в аудиосигнале. Как таковая, последовательность операций SBR состоит из копирования нижней части(ей) спектра в более высокую часть(и), после которого огибающая спектра корректируется для высокой части(ей) спектра с использованием небольшого количества информации, закодированной в битовом потоке. Упрощенная структурная схема такого усовершенствованного SBR-декодера показана на фиг.3. Битовый поток демультиплексируется и декодируется в основные данные (например, усовершенствованное аудио кодирование (ААС) MPEG-2/4) и данные SBR. С использованием основных данных сигнал декодируется при половине частоты дискретизации сигнала полной ширины полосы. Выходной сигнал основного декодера анализируется посредством 32-диапазонного комплексного банка (псевдо) квадратурных зеркальных фильтров (QMF). Эти 32 диапазона затем расширяются до полной ширины полосы, то есть 64 диапазонов, в которых высокочастотный (ВЧ) контент формируется посредством копирования части(ей) нижних диапазонов. Огибающая диапазонов, для которых формируется ВЧ-контент, корректируется согласно данным SBR. В заключение, посредством 64-диапазонного комплексного банка QMF-фильтров синтеза восстанавливается выходной сигнал импульсно-кодовой модуляции (ИКМ).
SBR-декодер, который показан на фиг.3, является так называемым двухскоростным декодером. Это означает, что основной декодер работает при половине частоты дискретизации и, следовательно, используется только 32-диапазонный банк QMF-фильтров анализа. Односкоростные декодеры, где основной декодер работает при полной частоте дискретизации и банк QMF-фильтров анализа состоит из 64 диапазонов, также возможны. На практике восстановление выполняется посредством (псевдо) комплексного банка QMF-фильтров. Так как комплексный банк QMF-фильтров дискретизируется не критическим образом, не требуется предпринимать никаких дополнительных мер для того, чтобы учитывать наложение спектров. Заметим, что в SBR-декодере, который раскрыт Экстрандом, банк QMF-фильтров анализа состоит только из 32 диапазонов, тогда как банк QMF-фильтров синтеза состоит из 64 диапазонов, так как основной декодер работает при половине частоты дискретизации в сравнении с декодером полного аудиосигнала. В соответствующем кодере, однако, используется 64-диапазонный банк QMF-фильтров анализа, чтобы покрыть весь частотный диапазон.
Хотя изобретение является особенно полезным для стереофонического аудиокодирования, изобретение также полезно для кодирования сигналов с более чем двумя аудиоканалами.
Эти и другие аспекты изобретения очевидны и поясняются со ссылкой на варианты осуществления, описанные ниже.
На чертежах показано следующее:
Фиг.1 - структурная схема узла для извлечения стереофонических параметров в качестве используемого в параметрическом стереофоническом («PS») кодере;
Фиг.2 - структурная схема узла для восстановаления стереофонического сигнала в качестве используемого в PS-декодере;
Фиг.3 - структурная схема декодера со спектральной репликацией диапазона(«SBR»);
Фиг.4 - структурная схема комбинированного усовершенствованного PS- и SBR-кодера согласно варианту осуществления изобретения;
Фиг.5 - структурная схема комбинированного усовершенствованного PS- и SBR-кодера согласно варианту осуществления изобретения;
Фиг.6 - M-диапазонный дискретизированный с понижением частоты комплексный банк QMF-фильтров анализа (слева) и синтеза (справа);
Фиг.7 - амплитудно-частотная характеристика в дБ фильтра прототипа;
Фиг.8 - амплитудно-частотные характеристики в дБ первых четырех из 64 недискретизированных с понижением частоты комплексно модулированных фильтров анализа;
Фиг.9 - структурная схема Q-диапазонного банка фильтров с тривиальным синтезом;
Фиг.10 - комбинированная амплитудно-частотная характеристика в дБ первого недискретизированного с понижением частоты модулированного QMF-фильтра и 8-диапазонного комплексно модулированного банка фильтров;
Фиг.11 - стилизованная амплитудно-частотная характеристика 4-диапазонного банка четных фильтров (сверху) и банка нечетных фильтров (снизу) согласно варианту осуществления изобретения;
Фиг.12 - 77-диапазонный неоднородный банк гибридных фильтров анализа, основанный на 64-диапазонном комплексном QMF-анализе согласно варианту осуществления изобретения;
Фиг.13 - 71-диапазонный неоднородный банк гибридных фильтров анализа, основанный на 64-диапазонном комплексном QMF-анализе для использования в аудиодекодере;
Фиг.14 - структурная схема рациональной реализации комплексно модулированного банка фильтров анализа.
Чертежи показывают только те элементы, которые необходимы для понимания изобретения.
Комбинирование SBR c PS потенциально дает в результате чрезвычайно эффективный кодек. Оба, SBR и PS, являются алгоритмами постобработки в декодере, состоящем из в некоторой степени подобной структуры, то есть некоторой разновидностью время-частотного преобразования, обработки и, в заключение, частотно-временного преобразования. При комбинировании обоих алгоритмов требуется, чтобы оба алгоритма могли работать одновременно, например в приложении цифрового сигнального процессора (DSP). Отсюда, выгодно повторно использовать, насколько это возможно, вычисленные промежуточные результаты одного кодека для другого. В случае комбинирования PS с SBR, это ведет к повторному использованию комплексных (псевдо) QMF-сигналов поддиапазонов для PS-обработки. В комбинированном кодере (см. фиг.4) стереофонический входной сигнал анализируется посредством двух 64-диапазонных банков фильтров анализа. С использованием комплексного представления области поддиапазонов, блок вычисления PS оценивает стереофонические параметры и формирует результат монофонического (поддиапазонного) микширования с понижением частоты, который создается. Этот результат монофонического микширования с понижением частоты затем подается в блок оценки SBR-параметров. В заключение, результат монофонического микширования с понижением частоты конвертируется обратно во временную область посредством 32-диапазонного банка фильтров синтеза так, что он может кодироваться основным декодером (основному декодеру требуется только половина ширины полосы).
В комбинированном декодере, как показано на фиг.5, независимо от того, используется двухскоростная или односкоростная система, поддиапазонные сигналы области с полной шириной спектра (64 диапазона) после коррекции огибающей конвертируются в стереофонический набор поддиапазонных сигналов области согласно стереофоническим параметрам. Эти два набора поддиапазонных сигналов, в заключение, конвертируются во временную область посредством 64-диапазонного банка QMF-фильтров синтеза. Если бы можно было непосредственно комбинировать PS с SBR, ширина полосы низкочастотных диапазонов QMF-фильтров была бы большей, чем требуемая для высококачественного стереофонического представления. Таким образом, для обеспечения высококачественного представления стереоизображения выполняется дополнительное подразбиение сигналов нижних поддиапазонов в соответствии с предпочтительными вариантами осуществления изобретения.
Для лучшего понимания аспектов изобретения сначала разъяснена теория, на которой основаны комплексные QMF-фильтры поддиапазонов.
QMF-фильтры поддиапазонов
Поддиапазонный QMF-фильтр анализа может быть описан, как изложено ниже. Если задан фильтр p(ν) прототипа с имеющей вещественное значение линейной фазой, М-диапазонный комплексно модулированный банк фильтров анализа может быть определен фильтрами анализа
Figure 00000001
(1)
для k=0,1,…,M-1. Фазовый параметр θ не важен для последующего анализа, но типичным результатом выбора является (N + M)/2, где N - порядок фильтра прототипа. При условии дискретного временного сигнал x(ν) с действительным значением, поддиапазонные сигналы νk(n) получены посредством фильтрации (свертки) x(ν) c hk(ν), а затем дискретизации с понижением частоты результата с коэффициентом M (см. слева на фиг.6).
Операция синтеза состоит, во-первых, из дискретизации с повышением частоты поддиапазонных QMF-сигналов с коэффициентом M, сопровождаемой фильтрацией посредством комплексно модулированных фильтров типа (1), сложением результатов и, в заключение, удвоением действительной части (см. справа на фиг.6). Затем, почти идеальное восстановление сигналов с вещественным значением может быть получено посредством подходящего проектирования фильтра p(ν) прототипа с вещественной линейной фазой. Амплитудно-частотная характеристика фильтра прототипа, который используется в SBR-системе стандарта MPEG-4 (упомянутого выше) в случае с 64 диапазонами, показана на фиг.7. Амплитудно-частотные характеристики 64 комплексно модулированных фильтров анализа получены сдвигом амплитудно-частотной характеристики фильтра прототипа p(ν) на
Figure 00000002
.
Часть этих характеристик показана на фиг.8. Заметим, что фильтруются только положительные частоты, за исключением k = 0 и k = M-1. Как результат, поддиапазонные сигналы до дискретизации с понижением частоты близки к аналитическим, обеспечивая простые амплитудные и фазовые применения вещественных синусоид. Фазовые компенсации также возможны для первого и последнего диапазона, если синусоиды, находящиеся в этих диапазонах, имеют частоту больше π/2M или меньше π-π/2M соответственно. Для частот вне этой зоны характеристика фазовой компенсации быстро ухудшается из-за взаимных помех отрицательных частот.
Начиная с QMF-фильтров анализа, которые описаны выше, в вариантах осуществления изобретения, лучшее частотное разрешение получается дополнительной фильтрацией каждого дискретизированного с понижением частоты поддиапазонного сигнала νk(n) в подполосы Qk. Далее выведены свойства дополнительной фильтрации в поддиапазонах.
Преобразование сигнала в области поддиапазонов комплексного QMF.
В последующем, пусть
Figure 00000003
будет дискретным временным преобразованием Фурье дискретного временного сигнала z(n). При условии свойства почти идеального восстановления, которое упоминалось выше, а также схемы, где P(ω), являющееся преобразованием Фурье от p(ν), по существу стремится к нулю вне частотного интервала
Figure 00000004
, что имеет место для фильтра p(ν) прототипа, как проиллюстрировано выше, следующим этапом является рассмотрение системы, где поддиапазонные сигналы νk(n) преобразуются перед синтезом. Далее, пусть каждая полоса k преобразуется посредством фильтрации фильтром Bk(ω). При условии
Figure 00000005
Figure 00000006
для
Figure 00000007
(2)
где звездочка обозначает комплексное сопряжение, может быть показано (пренебрегая общей задержкой, при условии вещественного входного сигнала и односкоростной системы), что результирующая система, включающая в себя банк фильтров синтеза, соответствует фильтрации фильтром
Figure 00000008
(3)
Согласно гипотезе относительно свойств P(ω), подстановка Bk(ω) = 1 для всех k в (3), приводит к B(ω) = 1, а тождество квадратичной суммы следует смещенным частотным характеристикам фильтра прототипа. Выбирая вещественные постоянные Bk(ω)=bk ≥ 0, система действует как корректор, который интерполирует значения bk коэффициента усиления на частотах π(k+1/2)/M. Привлекательным признаком является то, что система в целом инвариантна ко времени, то есть свободна от наложения спектров, несмотря на использование дискретизации с понижением и повышением частоты. Это конечно будет верным только вплоть до величины отклонения от принятых гипотез фильтра прототипа.
Для получения монофонического аудиосигнала дополнительная фильтрация в поддиапазонах комплексных поддиапазонных сигналов должна не только сохранять эти свойства, но также распространять эти свойства на манипулирование фильтрованными поддиапазонными сигналами. Фильтрация в поддиапазонах, сохраняющая эти свойства, может выполняться с использованием преобразования так называемых M-диапазонных фильтров, известных из работы: P.P. Vaidyanathan, «Multirate systems and filter banks», Prentice Hall Signal Processing Series, 1993, sections 4.6.1-4.6.2.
Модулированные банки фильтров с тривиальным синтезом
Дискретный временной сигнал ν(n) может быть разложен на Q разных сигналов банком фильтров с импульсными частотными характеристиками gq(n), q=0,1,…,Q-1. Это проиллюстрировано на фиг.9. Допустим, что соответствующими выходными сигналами анализа являются yq(n), и рассмотрим операцию тривиального синтеза
Figure 00000009
(4)
Идеальное восстановление, y(n) = ν(n), в таком случае, получается посредством выбора фильтров из условия, чтобы
Figure 00000010
(5)
где δ(n) = 1, если n = 0, и δ(n)≠0, если n ≠ 0. Для каузальных фильтров правая сторона в (5) должна быть замещена на δ(n-d), где d - положительная задержка, но это простое преобразование опущено для ясности представления.
Фильтры gq(n) могут быть выбраны в качестве комплексных модуляций фильтра g(n) прототипа посредством
Figure 00000011
(6)
В этом предпочтительном варианте осуществления изобретения фильтры упорядочены нечетным образом (коэффициент q+1/2). Преимущество этого предпочтительного варианта осуществления описано позже. Идеальное восстановление (5) получается, если и только если
Figure 00000012
(7)
Вариантом этого является вещественная косинусоидальная модуляция, к примеру
Figure 00000013
, (8)
при вещественном фильтре g(m) прототипа, удовлетворяющем
Figure 00000014
(9)
(Это легко получается при принятии во внимание gq(n)+gQ-1-q(n) в (6)).
Фильтрация в поддиапазонах комплексно-экспоненциальным модулированным банком фильтров
Начиная с QMF-фильтров анализа, которые описаны выше, лучшее частотное разрешение получается посредством дополнительной фильтрации каждого дискретизированного с понижением частоты поддиапазонного сигнала νk(n) в поддиапазоне Qk посредством использования одной из модулированных структур (6) или (8), приведенных выше. Обозначим результирующие выходные сигналы как
Figure 00000015
, и пусть
Figure 00000016
описывает банк фильтров, применяемый в поддиапазоне k. Если Qk = 1, фильтрация отсутствует, а
Figure 00000016
=δ(n). Типичным примером применения является случай, где M=64, Q0=8, Qk=4 для k = 1,2, и Qk=1 для k>2.
Комбинированный результат двух банков фильтров от x(ν) до
Figure 00000015
может быть описан как фильтация фильтрами
Figure 00000017
(ω) с последующей дискретизацией с понижением частоты с коэффициентом М, где
Figure 00000018
Figure 00000019
(10)
Если частотная характеристика P(ω) фильтра прототипа, по существу, является нулевой вне интервала [-π/M,π/M], что имеет место для SBR-фильтров анализа (см. фиг.7), то фильтр
Figure 00000017
(ω) имеет единственную номинальную центральную частоту, определенную в комплексно-модулированном случае согласно
Figure 00000020
(11)
где s - целое число, выбранное из условия, что Qk(k-
Figure 00000021
)≤ 2(q + Qks) +1 ≤ Qk(k+
Figure 00000022
). Например, как проиллюстрировано на фиг.10, если k = 0, а Q0 = 8, значениями ω0,00,1,ω0,7 являются
Figure 00000023
Преобразование сигнала с неравномерным частотным разрешением
Введение банков фильтров поддиапазонов, которые описаны выше, не привносит дополнительной дискретизации с понижением частоты, так что сохраняется свободное от наложения спектров преобразование сигнала, которое показано выше только в случае комплексного QMF. Рассмотрим общую комбинированную операцию M- поддиапазонного анализа, дополнительную фильтрацию в поддиапазонах с использованием поддиапазонов Qk в пределах поддиапазона k, фильтрацию каждого поддиапазонного сигнала
Figure 00000015
посредством фильтра Ak,q(ω), синтез в пределах каждого поддиапазона k посредством суммирования и, в заключение, синтез посредством M-диапазонного банка фильтров синтеза. Полная функция преобразования такой системы задана согласно (3), для k ≥ 0,
Figure 00000024
(12)
Для ω>π/(2M) это дает
Figure 00000025
(13)
значит, характеристикой пропускной способности поддиапазона (k,q) является
Figure 00000026
. Для |ω|≤π/(2M) должно быть уделено некоторое внимание, обусловленное (2). В этом интервале частот справедливо
Figure 00000027
(14)
а при условии вещественных коэффициентов поддиапазонных фильтров прототипа справедливо
Figure 00000028
(15)
значит, если преобразующие фильтры выбраны так, что
Figure 00000029
(16),
то B0(-Mω)* = B0(Mω) и тождество квадратичной суммы, упомянутое в связи с (3), приводит к
Figure 00000030
(17)
для |ω|≤π/(2M), соответствующего характеристике
Figure 00000031
пропускной способности для поддиапазона (0,q).
Равенства с (15) по (17) показывают желательность провести различие между положительными и отрицательными частотами. Это является причиной того, почему нечетные (комплексные) фильтры используются для фильтрации в поддиапазонах поддиапазонных QMF-сигналов взамен четных (комплексных) фильтров (см. фиг.11). Для четных фильтров невозможно применять фазовые компенсации синусоид, соответствующих центральному фильтру, то есть фильтру с центральной частотой, равной нулю, так как здесь отсутствует различие между положительной и отрицательной частотами. При условии фильтра прототипа с диапазоном частотной характеристики G(ω), ограниченным до [-2π/Q,2π/Q], при количестве диапазонов Q, для четного случая нижним пределом, до которого приблизительно могут применяться фазовые компенсации, является 2π/Q, тогда как для нечетного случая нижним пределом, до которого приблизительно могут применяться фазовые компенсации, является π/Q.
Как упомянуто выше, для PS-синтеза отдельными важными случаями вышеизложенного являются коррекция и фазовая компенсация. Касательно коррекции, Ak,q(ω)=ak,q≥0 и условие (16) вырождается в
Figure 00000032
(18)
Случай фазовой компенсации соответствует Ak,q(ω)=exp(iαk,q)≥0, в этом случае условие (16) удовлетворено, если
Figure 00000033
(19)
Оценка стереофонических параметров
Неравномерный комплексный банк фильтров, то есть QMF-банк, с последующей дополнительной фильтрацией в поддиапазонах, как описано выше, может применяться для оценки стереофонических параметров: межканальных разностей мощности (IID), межканальных разностей фаз (IPD) и межканальной взаимной корреляции (ICC), которые показаны ниже. Заметим, что в этом практическом варианте осуществления IPD используется в качестве практически эквивалентной замены ITD, которая использовалась в работе Schuijers et al. В комбинированном PS-кодере (см. фиг.4) первые три канала комплексного QMF-фильтра фильтруются в поддиапазонах таким образом, что в итоге получаются 77 комплексных сигналов (см. фиг.12).
С этого момента заданные по 77 комплексных выровненных по времени сигналов левых и правых поддиапазонов обозначаются как
Figure 00000034
и
Figure 00000035
соответственно, согласно индексированию
Figure 00000015
.
Чтобы оценить стереофонические параметры в определенной позиции поддиапазонной выборки n', левый, правый и ненормализованный межканальный управляющий сигнал рассчитываются как:
Figure 00000036
Figure 00000037
(20)
Figure 00000038
для каждого стереофонического элемента кодированного сигнала b h(n) является окном полосной области с протяженностью L, ε - крайне малое значение, препятствующее делению на ноль (например, ε = 1e-10), а
Figure 00000034
и
Figure 00000035
- левый и правый поддиапазонные сигналы области. В случае 20 стереофонических элементов кодированного сигнала суммирование по k, от kl вплоть до kh включительно, и q, от ql вплоть до qh включительно, происходит как показано в таблице 1. Заметим, что «отрицательные» частоты (например, k = 0 с q = 4…7) не включены в оценку параметра по (20).
Таблица 1
Индексы начала и остановки суммирования по k и q
b kl Kh ql qh Частотный интервал полосы пропускания
0 0 0 0 0 0 - π/256
1 0 0 1 1 π/256 - 2π/256
2 0 0 2 2 2π/256 - 3π/256
3 0 0 3 3 3π/256 - π/64
4 1 1 2 2 π/64 - 3π/128
5 1 1 3 3 3π/128 - 2π/64
6 2 2 0 0 2π/64 - 5π/128
7 2 2 1 1 5π/128 - 3π/64
8 3 3 0 0 3π/64 - 4π/64
9 4 4 0 0 4π/64 - 5π/64
10 5 5 0 0 5π/64 - 6π/64
11 6 6 0 0 6π/64 - 7π/64
12 7 7 0 0 7π/64 - 8π/64
13 8 8 0 0 8π/64 - 9π/64
14 9 10 0 0 9π/64 - 11π/64
15 11 13 0 0 11π/64 - 14π/64
16 14 17 0 0 14π/64 - 18π/64
17 18 22 0 0 18π/64 - 23π/64
18 23 34 0 0 23π/64 - 35π/64
19 35 63 0 0 35π/64 - π
Суммирования для вычисления el(b), er(b) и eR(b) выстроены так, что средняя точка этих сигналов в суммировании совпадает с позицией параметра, отсюда смещение на
Figure 00000039
. Как понятно из таблицы 1, только под-поддиапазонные сигналы и поддиапазонные сигналы с положительной центральной частотой используются для оценки стереофонических параметров. IID, обозначенная как I(b), ICC, обозначенная как C(b), и IPD, обозначенная как P(b), для каждого стереофонического компонента b кодированного сигнала рассчитываются как:
Figure 00000040
Figure 00000041
(21)
Figure 00000042
Угол в уравнении P(b) = ∠eR(b) рассчитывается с использованием четырехквадрантной функции арктангенса, дающей значения между -π и π. В зависимости от целевой битовой скорости и применения эти параметры или подмножество этих параметров квантуются и кодируются в PS-часть битового потока.
Синтез стереофонического сигнала
Для того, чтобы удержать вычислительные затраты (в показателях использования ОЗУ) в декодере по возможности низкими, используется подобная структура анализа. Однако первый диапазон является комплексным только частично (см. фиг.13). Это получено суммированием средних пар диапазона
Figure 00000043
и
Figure 00000044
, и
Figure 00000045
и
Figure 00000046
. Более того, второй и третий диапазон являются двухдиапазонными вещественными банками фильтров, которые получаются суммированием выходных сигналов
Figure 00000047
и
Figure 00000048
, и суммированием выходных сигналов
Figure 00000049
и
Figure 00000050
(см. описание в разделе о модулированных банках фильтров). С использованием этого упрощения структуры банка фильтров декодера отличительный признак между положительными и отрицательными частотами по-прежнему обеспечивается подразбиением первого фильтра поддиапазона. Банк фильтров анализа декодера показан на фиг.13. Заметим, что индексирование первых отфильтрованных (под-)поддиапазонных QMF-сигналов отсортировано по частоте. Стереофонические (под-)поддиапазонные сигналы одного кадра конструируются как:
Figure 00000051
Figure 00000052
(22)
Figure 00000053
Figure 00000054
(23)
с sk(n) монофоническими (под-)поддиапазонными сигналами и dk(n) монофоническими декоррелированными (под-)поддиапазонными сигналами, которые выводятся из монофонических (под-)поддиапазонных сигналов sk(n) для учета синтеза параметров ICC, k=0,…,K-1 - индекс поддиапазона (К является общим количеством поддиапазонов, то есть K=71), индекс n=0,…,N-1 QMF-отсчета поддиапазона, где N - количество отсчетов поддиапазона для кадра, Λ11, Λ12, Λ21, Λ22 - матрицы обработки масштабных коэффициентов, а Prl - матрица обработки фазового поворота. Матрицы обработки определены в качестве функции времени и частоты, и могут быть выведены непосредственно из векторов обработки, как описано в стандарте MPEG-4 ISO/IEC 14496-3:2001/FPDAM2, JTC1/SC29/WG11, Coding of Moving Pictures and Audio, Extension 2 (ISO/IEC 14496-3:2001/FPDAM2, JTC1/SC29/WG11, Кодирование движущихся изображений и звука, расширение 2).
sk(n) определено согласно фиг.12 с получением результата, показанного на фиг.13
Figure 00000055
Figure 00000056
Figure 00000057
Figure 00000058
Figure 00000059
Figure 00000060
(24)
Figure 00000061
Figure 00000062
Figure 00000063
Figure 00000064
Figure 00000065
Figure 00000066
Синтез стереофонических параметров осуществляется согласно индексированию по таблице 2.
Таблица 2
Таблица индексирования параметров
k i(k) Частотный интервал полосы пропускания
0 1* -2π/256 - π/256
1 0* -π/256 - 0
2 0 0 - π/256
3 1 π/256 - 2π/256
4 2 2π/256 - 3π/256
5 3 3π/256 - π/64
6 5 3π/128 - 2π/64
7 4 2π/128 - 3π/128
8 6 4π/128 - 5π/128
9 7 5π/128 - 6π/128
10 8 3π/64 - 4π/64
11 9 4π/64 - 5π/64
12 10 5π/64 - 6π/64
13 11 6π/64 - 7π/64
14 12 7π/64 - 8π/64
15 13 8π/64 - 9π/64
16-17 14 9π/64 - 11π/64
18-20 15 11π/64 - 14π/64
21-24 16 14π/64 - 18π/64
25-29 17 18π/64 - 23π/64
30-41 18 23π/64 - 35π/64
42-70 19 35π/64 - π
Уравнения синтеза, следовательно, выглядят подобным образом:
Figure 00000067
Figure 00000068
(25)
Figure 00000069
Figure 00000070
(26)
Заметим, что знак Prt меняется в уравнениях, приведенных выше, если в таблице встречается *. Это соответствует равенству (19), то есть для отрицательных частот должен быть применен обратный поворот фазы.
Рациональная реализация модулированных банков фильтров с тривиальным синтезом
При условии модулированного банка фильтров с фильтром прототипа длиной L прямая реализация могла бы потребовать QL операций на входной отсчет, но тот факт, что модуляция в (6) является антипериодической, с периодом Q, может быть использован, чтобы разделить фильтрацию на многофазное кадрирование из L операций с последующим преобразованием размера Q для каждого входного отсчета. Многофазное представление, как таковое, известно из P.P. Vaidyanathan, «Multirate systems and filter banks», Prentice Hall Signal Processing Series, 1993, section 4.3. Ниже приведено полезное применение такого многофазного представления согласно предпочтительному варианту осуществления изобретения.
Преобразованием является дискретное преобразование Фурье (ДПФ), сопровождаемое фазовым вращением, которое является порядком Qlog2Q, когда Q - степень двух. Значит, значительная экономия получается в типичных случаях, где L много больше, чем log2Q. В случае (8) вещественной модуляции антипериодичность с периодом 2Q, комбинированная с четной/нечетной симметрией в окрестности n = 0 и n = Q, снова может быть использована для многофазного кадрирования, а ядром преобразования является дискретное косинусное преобразование (ДКП) типа III. Подробное описание для случая комплексной модуляции представлено ниже.
Рациональная реализация фильтрации в под-поддиапазонах с использованием основной обработки БПФ может быть осуществлена с использованием многофазной декомпозиции фильтра прототипа с последующей модуляцией. Пусть фильтр g(n) прототипа имеет порядок N, где N=mQ, а m - положительное целое число. Это условие не является ограничительным, поскольку фильтр прототипа произвольного порядка может быть дополнен нулями, чтобы реализовать ограничение. Z-преобразованием фильтра прототипа, сконструированного для использования в комплексно модулированной системе (6), является
Figure 00000071
(27)
Это может быть выражено в многофазной записи, как
Figure 00000072
(28)
где
Figure 00000073
(29)
Все фильтры банка фильтров являются частотно-модулированными вариантами фильтра прототипа. Z-преобразование фильтра gq(n) задано согласно
Figure 00000074
(30)
где
Figure 00000075
(31)
Выражением для выходного сигнала из одного фильтра является
Figure 00000076
(32)
Посредством идентификации компонентов последней суммы можно видеть, что многофазные компоненты обрабатывают задержанные варианты входного сигнала, которые затем умножаются на комплексную экспоненциальную функцию. В заключение, все выходные сигналы Yq(z), q = 0..Q-1 находятся посредством применения БПФ (без масштабирующего коэффициента). Фиг.14 показывает топологию для банка фильтров анализа. Поскольку многофазные фильтры в (29) являются некаузальными, надлежащая величина задержки должна быть добавлена ко всем многофазным компонентам.
Следует отметить, что вышеупомянутые варианты осуществления иллюстрируют, но не ограничивают изобретение, и что специалистам в данной области техники будут очевидны многочисленные альтернативные варианты осуществления, реализуемые без изменения объема формулы изобретения. В формуле изобретения любые обозначения ссылочных позиций в скобках не должны истолковываться как ограничивающие пункт формулы изобретения. Слово «содержащий» не исключает присутствия иных элементов или этапов, чем перечисленные в пункте формулы изобретения. Изобретение может быть реализовано посредством аппаратных средств, содержащих отдельные элементы, и посредством подходящим образом запрограммированного компьютера. В пункте формулы изобретения об устройстве, перечисляющем различные средства, некоторые из этих средств могут быть осуществлены одним и тем же элементом аппаратных средств. Простое обстоятельство, что определенные признаки повторяются в разных зависимых пунктах формулы изобретения, не служит признаком того, что сочетание этих признаков не может быть использовано предпочтительным образом.

Claims (24)

1. Способ кодирования аудиосигнала, причем аудиосигнал включает в себя первый аудиоканал и второй аудиоканал, при этом способ содержит этапы, на которых:
осуществляют фильтрацию в поддиапазонах каждого из первого аудиоканала и второго аудиоканала в комплексно модулированном банке фильтров для обеспечения первого множества поддиапазонных сигналов для первого аудиоканала и второго множества поддиапазонных сигналов для второго аудиоканала,
дискретизируют с понижением частоты каждый из поддиапазонных сигналов для обеспечения первого множества дискретизированных с понижением частоты поддиапазонных сигналов и второе множество дискретизированных с понижением частоты поддиапазонных сигналов,
осуществляют дополнительную поддиапазонную фильтрацию, по меньшей мере, одного из дискретизированных с понижением частоты поддиапазонных сигналов в дополнительном банке фильтров для обеспечения множества под-поддиапазонных сигналов,
получают пространственные параметры из под-поддиапазонных сигналов и из тех дискретизированных с понижением частоты поддиапазонных сигналов, которые не подвергнуты дополнительной фильтрации в поддиапазонах, и
получают одноканальный аудиосигнал, содержащий поддиапазонные сигналы, полученные из первого множества дискретизированных с понижением частоты поддиапазонных сигналов и второго множества дискретизированных с понижением частоты поддиапазонных сигналов.
2. Способ по п.1, в котором для каждого поддиапазона, который подвергается дополнительной фильтрации в поддиапазонах, под-поддиапазонные сигналы суммируются вместе после масштабирования и/или поворота фазы для формирования нового поддиапазонного сигнала, и при этом одноканальный аудиосигнал получают из этих новых поддиапазонных сигналов и дискретизированных с понижением частоты поддиапазонных сигналов, которые не подвергнуты дополнительной фильтрации.
3. Способ по п.1, в котором дополнительная фильтрация в поддиапазонах выполняется над, по меньшей мере, поддиапазонным сигналом наименьшей частоты из первого множества дискретизированных с понижением частоты поддиапазонных сигналов и над поддиапазонным сигналом наименьшей частоты из второго множества дискретизированных с понижением частоты поддиапазонных сигналов.
4. Способ по п.3, в котором дополнительная фильтрация в поддиапазонах выполняется дополнительно над, по меньшей мере, поддиапазонным сигналом следующей наименьшей частоты из первого множества дискретизированных с понижением частоты поддиапазонных сигналов и над поддиапазонным сигналом следующей наименьшей частоты из второго множества дискретизированных с понижением частоты поддиапазонных сигналов.
5. Способ по п.4, в котором количество под-поддиапазонов в поддиапазонных сигналах наименьшей частоты больше, чем количество под-поддиапазонов в поддиапазонных сигналах следующей наименьшей частоты.
6. Способ по п.1, в котором дополнительный банк фильтров поддиапазонов, по меньшей мере, частично является комплексно модулированным банком фильтров.
7. Способ по п.1, в котором дополнительный банк фильтров поддиапазонов, по меньшей мере, частично является вещественным косинусно модулированным банком фильтров.
8. Способ по п.1, в котором дополнительный банк фильтров поддиапазонов является банком нечетно упорядоченных фильтров.
9. Способ по п.1, в котором под-поддиапазонные сигналы не подвергаются дополнительной дискретизации с понижением частоты.
10. Способ по п.1, в котором одноканальный аудиосигнал ограничен по ширине полосы и дополнительно кодирован, и при этом параметры спектральной репликации диапазона извлекаются из первого множества дискретизированных с понижением частоты поддиапазонных сигналов и/или второго множества дискретизированных с понижением частоты поддиапазонных сигналов.
11. Аудиокодер для кодирования аудиосигнала, причем аудиосигнал включает в себя первый аудиоканал и второй аудиоканал, при этом кодер содержит
первый комплексно модулированный банк фильтров для фильтрации в поддиапазонах первого аудиоканала для обеспечения первого множества поддиапазонных сигналов для первого аудиоканала,
второй комплексно модулированный банк фильтров для фильтрации в поддиапазонах второго аудиоканала для обеспечения второго множества поддиапазонных сигналов для второго аудиоканала,
средство для дискретизации с понижением частоты каждого из поддиапазонных сигналов для обеспечения первого множества дискретизированных с понижением частоты поддиапазонных сигналов и второго множества дискретизированных с понижением частоты поддиапазонных сигналов,
дополнительный банк фильтров для дополнительной фильтрации в поддиапазонах, по меньшей мере, одного из дискретизированных с понижением частоты поддиапазонных сигналов для обеспечения множества под-поддиапазонных сигналов,
средство для получения пространственных параметров из под-поддиапазонных сигналов и из тех дискретизированных с понижением частоты поддиапазонных сигналов, которые не подвергаются дополнительной фильтрации в поддиапазонах, и
средство для получения одноканального аудиосигнала, содержащего поддиапазонные сигналы, полученные из первого множества дискретизированных с понижением частоты поддиапазонных сигналов и второго множества дискретизированных с понижением частоты поддиапазонных сигналов.
12. Устройство для передачи или сохранения кодированного аудиосигнала, основанного на входном аудиосигнале, причем устройство содержит
блок ввода для приема входного аудиосигнала,
аудиокодер по п.11 для кодирования входного аудиосигнала для получения кодированного аудиосигнала,
канальный кодер для дополнительного кодирования кодированного аудиосигнала в формат, подходящий для передачи и хранения.
13. Способ декодирования кодированного аудиосигнала, причем кодированный аудиосигнал содержит кодированный одноканальный аудиосигнал и набор пространственных параметров, при этом способ декодирования содержит этапы, на которых
декодируют кодированный одноканальный аудиосигнал для получения множества дискретизированных с понижением частоты поддиапазонных сигналов,
осуществляют дополнительную фильтрацию в поддиапазонах, по меньшей мере, одного из дискретизированных с понижением частоты поддиапазонных сигналов в дополнительном банке фильтров для обеспечения множества под-поддиапазонных сигналов, и
получают два аудиоканала из пространственных параметров, под-поддиапазонных сигналов и тех дискретизированных с понижением частоты поддиапазонных сигналов, которые не подвергнуты дополнительной фильтрации в поддиапазонах.
14. Способ по п.13, в котором дополнительная фильтрация в поддиапазонах выполняется над, по меньшей мере, поддиапазонным сигналом наименьшей частоты из множества дискретизированных с понижением частоты поддиапазонных сигналов.
15. Способ по п.14, в котором дополнительная фильтрация в поддиапазонах выполняется над, по меньшей мере, поддиапазонным сигналом следующей наименьшей частоты из множества дискретизированных с понижением частоты поддиапазонных сигналов.
16. Способ по п.15, в котором количество под-поддиапазонов в поддиапазонных сигналах наименьшей частоты больше, чем количество под-поддиапазонов в поддиапазонных сигналах следующей наименьшей частоты.
17. Способ по п.13, в котором дополнительный банк фильтров поддиапазонов, по меньшей мере, частично является комплексно модулированым банком фильтров.
18. Способ по п.13, в котором дополнительный банк фильтров поддиапазонов, по меньшей мере, частично является вещественным косинусно модулированным банком фильтров.
19. Способ по п.13, в котором дополнительный банк фильтров поддиапазонов является банком нечетно упорядоченных фильтров.
20. Способ по п.13, в котором в поддиапазоне наименьшей частоты изменения фазы для под-поддиапазонных сигналов, имеющих отрицательную центральную частоту во временной области, определяются отрицательным значением изменения фазы для поддиапазонного сигнала, имеющего положительную центральную частоту, которая по абсолютному значению является ближайшей к упомянутой отрицательной центральной частоте.
21. Способ по п.13, в котором кодированный аудиосигнал содержит параметры спектральной репликации диапазона, и в котором высокочастотный компонент извлекается из множества дискретизированных с понижением частоты поддиапазонных сигналов и параметров спектральной репликации диапазона, и при этом два аудиоканала получают из пространственных параметров, под-поддиапазонных сигналов, тех дискретизированных с понижением частоты поддиапазонных сигналов, которые не подвергаются дополнительной фильтрации в поддиапазонах, и высокочастотного компонента.
22. Аудиодекодер для декодирования кодированного аудиосигнала, причем кодированный аудиосигнал содержит кодированный одноканальный аудиосигнал и набор пространственных параметров, при этом аудиодекодер содержит:
декодер для декодирования кодированного одноканального аудиоканала для получения множества дискретизированных с понижением частоты поддиапазонных сигналов,
дополнительный банк фильтров для дополнительной фильтрации в поддиапазонах, по меньшей мере, одного из дискретизированных с понижением частоты поддиапазонных сигналов в дополнительном банке фильтров для обеспечения множества под-поддиапазонных сигналов,
средство для получения двух аудиоканалов из пространственных параметров, под-поддиапазонных сигналов и тех дискретизированных с понижением частоты поддиапазонных сигналов, которые не подвергаются дополнительной фильтрации в поддиапазонах.
23. Устройство для воспроизведения выходного аудиосигнала, причем устройство содержит блок ввода для приема кодированного аудиосигнала, аудиодекодер по п.22 для декодирования кодированного аудиосигнала для получения выходного аудиосигнала, и блок воспроизведения, такой как выходной каскад динамиков или наушников, для воспроизведения выходного аудиосигнала.
24. Машиночитаемый носитель, содержащий программный код, который при исполнении компьютером обеспечивает команды компьютеру для выполнения этапов способа по п.1 или 13.
RU2006118682/09A 2003-10-30 2004-10-28 Кодирование или декодирование аудиосигнала RU2374703C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03104034.8 2003-10-30
EP03104034 2003-10-30

Publications (2)

Publication Number Publication Date
RU2006118682A RU2006118682A (ru) 2007-12-10
RU2374703C2 true RU2374703C2 (ru) 2009-11-27

Family

ID=34530779

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2006118682/09A RU2374703C2 (ru) 2003-10-30 2004-10-28 Кодирование или декодирование аудиосигнала

Country Status (12)

Country Link
US (3) US7519538B2 (ru)
EP (1) EP1683133B1 (ru)
JP (4) JP4966013B2 (ru)
KR (2) KR101106026B1 (ru)
CN (2) CN1875402B (ru)
AT (1) ATE354160T1 (ru)
BR (2) BR122018007834B1 (ru)
DE (1) DE602004004818T2 (ru)
ES (1) ES2282899T3 (ru)
PL (1) PL1683133T3 (ru)
RU (1) RU2374703C2 (ru)
WO (1) WO2005043511A1 (ru)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2560788C2 (ru) * 2011-02-14 2015-08-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки декодированного аудиосигнала в спектральной области
US9153236B2 (en) 2011-02-14 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
RU2676233C2 (ru) * 2013-07-22 2018-12-26 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Многоканальный аудиодекодер, многоканальный аудиокодер, способы и компьютерная программа с использованием регулирования доли декоррелированного сигнала на основании остаточных сигналов
RU2691231C2 (ru) * 2015-03-09 2019-06-11 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Декодер для декодирования кодированного аудиосигнала и кодер для кодирования аудиосигнала
RU2793832C2 (ru) * 2010-12-03 2023-04-06 Долби Лабораторис Лайсэнзин Корпорейшн Способ аудиокодирования и способ аудиодекодирования
US11810582B2 (en) 2010-04-09 2023-11-07 Dolby International Ab MDCT-based complex prediction stereo coding
US11817110B2 (en) 2010-09-16 2023-11-14 Dolby International Ab Cross product enhanced subband block based harmonic transposition

Families Citing this family (103)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
EP1914722B1 (en) 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
WO2006048814A1 (en) * 2004-11-02 2006-05-11 Koninklijke Philips Electronics N.V. Encoding and decoding of audio signals using complex-valued filter banks
BRPI0516658A (pt) * 2004-11-30 2008-09-16 Matsushita Electric Ind Co Ltd aparelho de codificação de estéreo, aparelho de decodificação de estéreo e seus métodos
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126859A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
WO2007004833A2 (en) * 2005-06-30 2007-01-11 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
JP5227794B2 (ja) 2005-06-30 2013-07-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
US8073702B2 (en) * 2005-06-30 2011-12-06 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
CN101248483B (zh) 2005-07-19 2011-11-23 皇家飞利浦电子股份有限公司 多声道音频信号的生成
WO2007027051A1 (en) * 2005-08-30 2007-03-08 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8577483B2 (en) * 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
JP4568363B2 (ja) * 2005-08-30 2010-10-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
KR100857111B1 (ko) * 2005-10-05 2008-09-08 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
WO2007040364A1 (en) * 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US8068569B2 (en) * 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7653533B2 (en) * 2005-10-24 2010-01-26 Lg Electronics Inc. Removing time delays in signal paths
WO2007083952A1 (en) * 2006-01-19 2007-07-26 Lg Electronics Inc. Method and apparatus for processing a media signal
KR100885700B1 (ko) 2006-01-19 2009-02-26 엘지전자 주식회사 신호 디코딩 방법 및 장치
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
EP1984913A4 (en) 2006-02-07 2011-01-12 Lg Electronics Inc DEVICE AND METHOD FOR CODING / DECODING A SIGNAL
KR100754220B1 (ko) 2006-03-07 2007-09-03 삼성전자주식회사 Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법
US7676374B2 (en) 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
CN101484936B (zh) 2006-03-29 2012-02-15 皇家飞利浦电子股份有限公司 音频解码
US7612275B2 (en) * 2006-04-18 2009-11-03 Nokia Corporation Method, apparatus and computer program product for providing rhythm information from an audio signal
US7818079B2 (en) * 2006-06-09 2010-10-19 Nokia Corporation Equalization based on digital signal processing in downsampled domains
US20080004866A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Artificial Bandwidth Expansion Method For A Multichannel Signal
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
JP4704499B2 (ja) * 2006-07-04 2011-06-15 ドルビー インターナショナル アクチボラゲット 圧縮サブバンド・フィルタ・インパルス応答を作るためのフィルタ・コンプレッサおよび方法
US7876904B2 (en) 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
JP2008076847A (ja) * 2006-09-22 2008-04-03 Matsushita Electric Ind Co Ltd 復号器及び信号処理システム
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
KR101016224B1 (ko) 2006-12-12 2011-02-25 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 인코더, 디코더 및 시간 영역 데이터 스트림을 나타내는 데이터 세그먼트를 인코딩하고 디코딩하는 방법
US7783478B2 (en) * 2007-01-03 2010-08-24 Alexander Goldin Two stage frequency subband decomposition
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
EP2202729B1 (en) * 2007-10-26 2017-03-15 D&M Holdings, Inc. Audio signal interpolation device and audio signal interpolation method
US20110282674A1 (en) * 2007-11-27 2011-11-17 Nokia Corporation Multichannel audio coding
EP2229677B1 (en) 2007-12-18 2015-09-16 LG Electronics Inc. A method and an apparatus for processing an audio signal
EP2077551B1 (en) * 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
JP5302980B2 (ja) * 2008-03-04 2013-10-02 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 複数の入力データストリームのミキシングのための装置
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
CN101630509B (zh) * 2008-07-14 2012-04-18 华为技术有限公司 一种编解码方法、装置及***
TWI618350B (zh) * 2009-02-18 2018-03-11 杜比國際公司 用於高頻重建或參數立體聲之複指數調變濾波器組
AU2016262695B2 (en) * 2009-02-18 2017-11-09 Dolby International Ab Low Delay Modulated Filter Bank
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
AU2012204068B2 (en) * 2009-04-03 2013-12-19 Ntt Docomo, Inc. Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program
CN101556799B (zh) 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
JP5365363B2 (ja) * 2009-06-23 2013-12-11 ソニー株式会社 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム
US9055374B2 (en) * 2009-06-24 2015-06-09 Arizona Board Of Regents For And On Behalf Of Arizona State University Method and system for determining an auditory pattern of an audio segment
EP3998606B8 (en) 2009-10-21 2022-12-07 Dolby International AB Oversampling in a combined transposer filter bank
KR101370870B1 (ko) * 2009-12-16 2014-03-07 돌비 인터네셔널 에이비 Sbr 비트스트림 파라미터 다운믹스
EP4120263B1 (en) 2010-01-19 2023-08-09 Dolby International AB Improved subband block based harmonic transposition
CN102157149B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码***
JP5554876B2 (ja) 2010-04-16 2014-07-23 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. ガイドされた帯域幅拡張およびブラインド帯域幅拡張を用いて広帯域信号を生成するため装置、方法およびコンピュータプログラム
HUE028738T2 (en) * 2010-06-09 2017-01-30 Panasonic Ip Corp America Bandwidth Extension Procedure, Bandwidth Extension Device, Program, Integrated Circuit, and Audio Decoder
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
BR112012024360B1 (pt) * 2010-07-19 2020-11-03 Dolby International Ab sistema configurado para gerar uma pluralidade de sinais de áudio de sub-banda de alta frequência, decodificador de áudio, codificador, método para gerar uma pluralidade de sinais de sub-banda de alta frequência, método para decodificar um fluxo de bits, método para gerar dados de controle a partir de um sinal de áudio e meio de armazenamento
JP5665987B2 (ja) 2010-08-12 2015-02-04 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Qmfベースのオーディオコーデックの出力信号のリサンプリング
KR20120038311A (ko) 2010-10-13 2012-04-23 삼성전자주식회사 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
TWI483245B (zh) 2011-02-14 2015-05-01 Fraunhofer Ges Forschung 利用重疊變換之資訊信號表示技術
EP3503098B1 (en) 2011-02-14 2023-08-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
AU2012217215B2 (en) 2011-02-14 2015-05-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding (USAC)
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
EP2676270B1 (en) 2011-02-14 2017-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding a portion of an audio signal using a transient detection and a quality result
EP3544006A1 (en) * 2011-11-11 2019-09-25 Dolby International AB Upsampling using oversampled sbr
WO2013142723A1 (en) 2012-03-23 2013-09-26 Dolby Laboratories Licensing Corporation Hierarchical active voice detection
US9552818B2 (en) * 2012-06-14 2017-01-24 Dolby International Ab Smooth configuration switching for multichannel audio rendering based on a variable number of received channels
EP4300488A3 (en) 2013-04-05 2024-02-28 Dolby International AB Stereo audio encoder and decoder
KR101632238B1 (ko) 2013-04-05 2016-06-21 돌비 인터네셔널 에이비 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
EP2830052A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
EP3155617B1 (en) * 2014-06-10 2022-01-05 MQA Limited Digital encapsulation of audio signals
EP2963649A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
WO2016040623A1 (en) * 2014-09-12 2016-03-17 Dolby Laboratories Licensing Corporation Rendering audio objects in a reproduction environment that includes surround and/or height speakers
US9837065B2 (en) 2014-12-08 2017-12-05 Ford Global Technologies, Llc Variable bandwidth delayless subband algorithm for broadband active noise control system
TW202242853A (zh) * 2015-03-13 2022-11-01 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10672408B2 (en) * 2015-08-25 2020-06-02 Dolby Laboratories Licensing Corporation Audio decoder and decoding method
US20180308507A1 (en) * 2016-01-15 2018-10-25 Dolby Laboratories Licensing Corporation Audio signal processing with low latency
EP3203472A1 (en) * 2016-02-08 2017-08-09 Oticon A/s A monaural speech intelligibility predictor unit
TWI807562B (zh) * 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
CN111316353B (zh) * 2017-11-10 2023-11-17 诺基亚技术有限公司 确定空间音频参数编码和相关联的解码
CN107918710B (zh) * 2017-11-22 2020-11-06 桂林电子科技大学 基于凸优化的非下采样图滤波器组的设计方法
CN108806705A (zh) * 2018-06-19 2018-11-13 合肥凌极西雅电子科技有限公司 音频处理方法和处理***
US11195543B2 (en) * 2019-03-22 2021-12-07 Clear Peaks LLC Systems, devices, and methods for synchronizing audio
CN113314132B (zh) * 2021-05-17 2022-05-17 武汉大学 交互式音频***中的音频对象编码方法、解码方法及装置
CN117292694B (zh) * 2023-11-22 2024-02-27 中国科学院自动化研究所 基于时不变编码的少令牌神经语音编解码方法和***

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3211752C2 (de) * 1982-03-30 1985-09-26 Siemens AG, 1000 Berlin und 8000 München Verfahren zum selektiven Abscheiden von aus Siliziden hochschmelzender Metalle bestehenden Schichtstrukturen auf im wesentlichen aus Silizium bestehenden Substraten und deren Verwendung
JPS621228A (ja) 1985-06-26 1987-01-07 Fujitsu Ltd タングステンシリサイドの選択成長方法
US4692343A (en) * 1985-08-05 1987-09-08 Spectrum Cvd, Inc. Plasma enhanced CVD
US4737474A (en) * 1986-11-17 1988-04-12 Spectrum Cvd, Inc. Silicide to silicon bonding process
US4902645A (en) * 1987-08-24 1990-02-20 Fujitsu Limited Method of selectively forming a silicon-containing metal layer
DE69127842T2 (de) * 1990-03-09 1998-01-29 At & T Corp Hybride wahrnehmungsgebundene Kodierung von Audiosignalen
JPH0410429A (ja) 1990-04-26 1992-01-14 Matsushita Electron Corp 半導体装置
JP2892451B2 (ja) 1990-07-13 1999-05-17 住友重機械工業株式会社 電気―空気サーボアクチュエータ
NL9100173A (nl) 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US5392037A (en) 1991-05-21 1995-02-21 Matsushita Electric Industrial Co., Ltd. Method and apparatus for encoding and decoding
JP2778324B2 (ja) * 1992-01-24 1998-07-23 日本電気株式会社 サブバンド分割方式
JPH05235701A (ja) * 1992-02-25 1993-09-10 Nippon Steel Corp 環状畳み込みによるディジタルフィルタバンク処理方法及び装置
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
US5926791A (en) * 1995-10-26 1999-07-20 Sony Corporation Recursively splitting the low-frequency band with successively fewer filter taps in methods and apparatuses for sub-band encoding, decoding, and encoding and decoding
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5852806A (en) * 1996-03-19 1998-12-22 Lucent Technologies Inc. Switched filterbank for use in audio signal coding
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
KR100354531B1 (ko) 1998-05-06 2005-12-21 삼성전자 주식회사 실시간 복호화를 위한 무손실 부호화 및 복호화 시스템
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP2001339311A (ja) * 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
US6996198B2 (en) * 2000-10-27 2006-02-07 At&T Corp. Nonuniform oversampled filter banks for audio signal processing
US7469206B2 (en) * 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction
JP4431568B2 (ja) * 2003-02-11 2010-03-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
IEEE SOUTHEASTCON. NEW YORK, NY: IEEE, US, 30.03.2001, p.271-275, XP010542621 ISBN: 0-7803-6748-0, paragraph 11.A!; fig.1, 2b. *
WEN JIN et al. A scalable subband audio coding scheme for ATM environments. PROCEEDINGS IEEE SOUTHEASTCON 2001. ENGINEERING THE FUTURE. CLEMSON, *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2798024C1 (ru) * 2010-04-09 2023-06-14 Долби Интернешнл Аб Устройство повышающего микширования звука, выполненное с возможностью работы в режиме с предсказанием или в режиме без предсказания
US11810582B2 (en) 2010-04-09 2023-11-07 Dolby International Ab MDCT-based complex prediction stereo coding
RU2822612C1 (ru) * 2010-09-16 2024-07-09 Долби Интернешнл Аб Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2810281C1 (ru) * 2010-09-16 2023-12-25 Долби Интернешнл Аб Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
US11817110B2 (en) 2010-09-16 2023-11-14 Dolby International Ab Cross product enhanced subband block based harmonic transposition
RU2801960C1 (ru) * 2010-09-16 2023-08-21 Долби Интернешнл Аб Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2793832C2 (ru) * 2010-12-03 2023-04-06 Долби Лабораторис Лайсэнзин Корпорейшн Способ аудиокодирования и способ аудиодекодирования
RU2560788C2 (ru) * 2011-02-14 2015-08-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки декодированного аудиосигнала в спектральной области
US9153236B2 (en) 2011-02-14 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
RU2676233C2 (ru) * 2013-07-22 2018-12-26 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Многоканальный аудиодекодер, многоканальный аудиокодер, способы и компьютерная программа с использованием регулирования доли декоррелированного сигнала на основании остаточных сигналов
US11335354B2 (en) 2015-03-09 2022-05-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Decoder for decoding an encoded audio signal and encoder for encoding an audio signal
US10706864B2 (en) 2015-03-09 2020-07-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Decoder for decoding an encoded audio signal and encoder for encoding an audio signal
RU2691231C2 (ru) * 2015-03-09 2019-06-11 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Декодер для декодирования кодированного аудиосигнала и кодер для кодирования аудиосигнала
US11854559B2 (en) 2015-03-09 2023-12-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Decoder for decoding an encoded audio signal and encoder for encoding an audio signal
US12033645B2 (en) 2023-10-05 2024-07-09 Dolby International Ab Cross product enhanced subband block based harmonic transposition

Also Published As

Publication number Publication date
US8073685B2 (en) 2011-12-06
CN101540171A (zh) 2009-09-23
US7519538B2 (en) 2009-04-14
ATE354160T1 (de) 2007-03-15
US20110178810A1 (en) 2011-07-21
JP5335015B2 (ja) 2013-11-06
BRPI0415951A8 (pt) 2018-05-02
DE602004004818D1 (de) 2007-03-29
CN101540171B (zh) 2013-11-06
JP2009163257A (ja) 2009-07-23
US20090216544A1 (en) 2009-08-27
DE602004004818T2 (de) 2007-12-06
KR101106026B1 (ko) 2012-01-17
CN1875402A (zh) 2006-12-06
JP5192424B2 (ja) 2013-05-08
JP5889828B2 (ja) 2016-03-22
WO2005043511A1 (en) 2005-05-12
KR101217649B1 (ko) 2013-01-02
RU2006118682A (ru) 2007-12-10
CN1875402B (zh) 2012-03-21
PL1683133T3 (pl) 2007-07-31
JP2007514962A (ja) 2007-06-07
JP2011128649A (ja) 2011-06-30
BRPI0415951B1 (pt) 2018-08-28
EP1683133A1 (en) 2006-07-26
KR20060131745A (ko) 2006-12-20
US8260607B2 (en) 2012-09-04
JP2013167908A (ja) 2013-08-29
KR20110113765A (ko) 2011-10-18
BRPI0415951A (pt) 2007-01-02
US20070067162A1 (en) 2007-03-22
JP4966013B2 (ja) 2012-07-04
BR122018007834B1 (pt) 2019-03-19
ES2282899T3 (es) 2007-10-16
EP1683133B1 (en) 2007-02-14

Similar Documents

Publication Publication Date Title
RU2374703C2 (ru) Кодирование или декодирование аудиосигнала
RU2705007C1 (ru) Устройство и способ для кодирования или декодирования многоканального сигнала с использованием сихронизации управления кадрами
EP1621047B1 (en) Audio signal generation
JP4834539B2 (ja) オーディオ信号合成
EP2431971B1 (en) Audio decoding method and audio decoder
US9167367B2 (en) Optimized low-bit rate parametric coding/decoding
CN103329197A (zh) 用于反相声道的改进的立体声参数编码/解码
MX2008012324A (es) Metodo mejorado para la modulacion de señales en la reconstruccion de audio multicanal.
US20140365231A1 (en) Upsampling using oversampled sbr
Liutkus et al. Informed audio source separation: A comparative study
KR100891668B1 (ko) 믹스 신호 처리 방법 및 장치
Zhang et al. Informed Audio Source Separation: A Comparative Study

Legal Events

Date Code Title Description
PD4A Correction of name of patent owner