EA001087B1 - Многоканальный прогнозирующий кодировщик поддиапазона, использующий психоакустическое адаптивное распределение бит - Google Patents

Многоканальный прогнозирующий кодировщик поддиапазона, использующий психоакустическое адаптивное распределение бит Download PDF

Info

Publication number
EA001087B1
EA001087B1 EA199800505A EA199800505A EA001087B1 EA 001087 B1 EA001087 B1 EA 001087B1 EA 199800505 A EA199800505 A EA 199800505A EA 199800505 A EA199800505 A EA 199800505A EA 001087 B1 EA001087 B1 EA 001087B1
Authority
EA
Eurasian Patent Office
Prior art keywords
audio
channel
subband
frequency
block
Prior art date
Application number
EA199800505A
Other languages
English (en)
Other versions
EA199800505A1 (ru
Inventor
Стефен М. Смит
Майкл Х. Смит
Уильям Пол Смит
Original Assignee
Диджитал Театр Системз, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Диджитал Театр Системз, Инк. filed Critical Диджитал Театр Системз, Инк.
Publication of EA199800505A1 publication Critical patent/EA199800505A1/ru
Publication of EA001087B1 publication Critical patent/EA001087B1/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Color Television Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

Настоящее изобретение относится к высококачественному кодированию и декодированию многоканальных аудиосигналов и, более конкретно, к кодировщику поддиапазона, который использует фильтры полного/неполного восстановления, прогнозирующее/непрогнозирующее кодирование поддиапазона, анализ переходного процесса и психоакустическое/минимальной среднеквадратической ошибки (МСКО) распределение бит во времени, по частоте и множественным аудиоканалам для генерации потока данных с ограниченной вычислительной нагрузкой декодирования.
Описание предшествующего уровня техники Известные высококачественные аудио и музыкальные кодировщики могут быть разделены на два класса схем. Первый включает в себя кодировщики поддиапазона/преобразования от среднего до высокочастотного разрешения, которые адаптивно квантуют поддиапазон или выборки коэффициентов внутри кадра анализа в соответствии с вычислением психоакустической маски. Второй включает в себя кодировщики поддиапазона низкого разрешения, которые компенсируют свое плохое частотное разрешение обработкой выборок поддиапазона, используя адаптивную дифференциальную импульснокодовую модуляцию (АДИКМ).
Первый класс кодировщиков использует большие краткосрочные спектральные изменения обычных музыкальных сигналов, путем адаптации распределений бит в соответствии со спектральной мощностью сигнала. Высокое разрешение этих кодировщиков позволяет подавать частотно преобразованные сигналы непосредственно в психоакустическую модель, которая основана на теории критического диапазона частот слуха (предела слышимости). Аудиокодировщик АС-3 Долби, Тодд и др. «АС 3: гибкое кодирование восприятия для аудиопередачи и запоминания», Съезд общества аудиоинженеров, февраль, 1994, обычно вычисляет 1024 быстрых преобразований Фурье (БПФ) на соответствующих сигналах импульсно кодовой модуляции (ИКМ) и подает психоаналитическую модель в 1 024 частотных коэффициента в каждом канале для определения скорости бит для каждого коэффициента. Система Долби использует анализ импульсной помехи, который уменьшает размер кадра до 256 выборок для выделения коротких импульсов. Кодировщик АС-3 использует ранее запатентованный алгоритм обратной адаптации для декодирования распределения бит. Это уменьшает количество информации распределения бит, которую посылают вместе с закодированными аудиоданными. В результате ширина полосы частот для аудиосигнала увеличивается больше прямых адаптивных схем, что приводит к улучшению качества звука.
Во втором классе кодировщиков квантование дифференциальных сигналов поддиапазона является либо фиксированным, либо адаптируется для минимизации мощности шума квантования на всех или некоторых из поддиапазонов без какого-либо явного отношения к теории психоакустической маскировки. Общепринято, что прямой порог психоакустического искажения не может быть применен к прогнозирующим/дифференциальным сигналам поддиапазона из-за трудности оценки эффективности прогнозатора перед процессом распределения бит. Проблема дополнительно усложняется воздействием шума квантования на процесс прогнозирования.
Эти кодировщики работают, поскольку воспринимаемые критические аудиосигналы являются обычно периодическими в течение длительных периодов времени. Эта периодичность используется прогнозирующим дифференциальным квантованием. Разделение сигнала на небольшое число поддиапазонов уменьшает слышимые эффекты модуляции шума и допускает использование длительных спектральных изменений в аудиосигналах. Если число поддиапазонов увеличивается, выигрыш прогнозирования внутри каждого поддиапазона уменьшается и в некоторой точке выигрыш прогнозирования будет стремиться к нулю.
Цифровые театральные системы, Ь.Р. (ЦТС) используют аудиокодировщик, в котором каждый аудиоканал ИКМ фильтруют в четыре поддиапазона, и каждый поддиапазон кодируют с использованием обратного кодировщика АДИКМ, который адаптирует коэффициенты прогнозатора к данным поддиапазона. Распределение бит является фиксированным и одинаковым для каждого канала, причем более низким частотным поддиапазонам назначается больше бит, чем более высоким частотным поддиапазонам. Распределение бит обеспечивает фиксированную степень сжатия, например, 4:1 . Кодировщик ЦТС описан Майком Смитом и Стефаном Смитом, «АРТ-Х100: аудиокодировщик АДИКМ поддиапазона малой задержки, низкой скорости бит для радиовещания», Труды 1 0-ой международной конференции общества аудиоинженеров, 1991, с. 41-56.
Оба типа аудиокодировщиков имеют другие общие ограничения. Во-первых, известные аудиокодировщики кодируют/декодируют с фиксированным размером блока, т.е. число выборок или период времени, представляемый блоком является фиксированным. В результате, когда скорость закодированной передачи увеличивается относительно скорости выборки, количество данных (байтов) в блоке также увеличивается. Следовательно, размер буфера декодировщика должен быть спроектирован с учетом наихудшего случая для избежания переполнения данных. Это увеличивает величину памяти с произвольной выборкой (ППВ), которая являет3 ся наиболее дорогой компонентой декодировщика. Во-вторых, известные аудиокодировщики являются трудно расширяемыми для частот выборки больше, чем 48 кГц. Это сделало бы существующие декодировщики несовместимыми с форматом, требуемым для новых кодировщиков. Это отсутствие будущей совместимости является серьезным ограничением. Кроме того, известные форматы, используемые для кодирования данных ИКМ, требуют, чтобы весь блок был считан декодировщиком перед тем, как начнется воспроизведение. Это требует, чтобы размер буфера был ограничен приблизительно до блоков данных 100 мс, таких, чтобы задержка или время ожидания не раздражала слушателя.
Несмотря на то, что эти кодировщики имеют способность кодирования до 24 кГц, часто более высокие поддиапазоны отбрасывают. Это уменьшает высокочастотную достоверность или окружение восстановленного сигнала. Известные кодировщики обычно используют одну из двух типов схем обнаружения ошибки. Наиболее распространенным является кодирование Рида Соломона, в котором кодировщик добавляет биты обнаружения ошибки к вспомогательной информации в потоке данных. Это облегчает обнаружение и коррекцию любых ошибок в вспомогательной информации. Однако ошибки в аудиоданных проходят необнаруженными. Другим подходом является проверка блока и аудиозаголовков для неправильных состояний кода. Например, конкретный 3-битовый параметр может иметь только 3 правильных состояния. Если идентифицируют одно из других 5 состояний, возникает ошибка. Это обеспечивает только способность обнаружения и не обнаруживает ошибки в аудиоданных.
Краткое изложение изобретения
Принимая во внимание вышеупомянутые проблемы, настоящим изобретением предложен многоканальный аудиокодировщик с гибкостью приспосабливания широкого диапазона уровней сжатия с лучшим качеством, чем компакт-диск, на высоких скоростях бит и улучшенным качеством восприятия на низких скоростях бит, с уменьшенным временем ожидания воспроизведениия, упрощенным обнаружением ошибок, улучшенным искажением предэха и дополнительной расширяемостью в более высокие частоты выборки.
Это достигается кодировщиком поддиапазона, который кадрирует каждый аудиоканал в последовательность аудиоблоков, фильтрует блоки в диапазон основной полосы частот и высокочастотный диапазон и разделяет каждый сигнал основной полосы частот на множество поддиапазонов. Кодировщик поддиапазона обычно выбирает неполный фильтр для разделения сигнала основной полосы частот, когда скорость бит является низкой, но выбирает полный фильтр, когда скорость бит является достаточно высокой. Высокочастотный каскад кодирования кодирует высокочастотный сигнал независимо от сигнала основной полосы частот. Каскад кодирования основной полосы частот содержит кодировщик векторного кодирования (ВК) и кодировщик адаптивной дифференциальной импульсно-кодовой модуляции (АДИКМ), которые кодируют более высокие и более низкие частотные поддиапазоны, соответственно. Каждый блок поддиапазона содержит по меньшей мере один подблок, каждый из которых дополнительно подразделяется на множество подподблоков. Каждый подблок анализируют для оценки выигрыша прогнозирования кодировщика АДИКМ, причем способность прогнозирования блокируют, когда выигрыш прогнозирования является низким, и для обнаружения переходных процессов для регулировки масштабных коэффициентов (МК) перед и после переходным процессом.
Система глобального управления битами (ГУБ) распределяет биты в каждый подблок, используя разности между множественными аудиоканалами, множественными поддиапазонами и подблоками внутри текущего блока. Система ГУБ первоначально распределяет биты в каждый подблок вычислением его отношения сигнала к маске (ОСМ), модифицированного прогнозируемым коэффициентом передачи для соответствия психоакустической модели. Затем система ГУБ распределяет оставшиеся биты в соответствии с подходом минимальной среднеквадратической ошибки (МСКО) для того, чтобы либо немедленно переключиться в распределение МСКО, ниже общего минимального уровня шума, либо постепенно морфировать в распределение МСКО.
Мультиплексор генерирует выходные блоки, которые содержат слово синхронизации, заголовок блока, аудиозаголовок и, по меньшей мере, один подблок, и которые мультиплексируют в поток данных со скоростью передачи. Заголовок блока содержит размер кадра текущего выходного блока. Аудиозаголовок указывает устройство упаковки и формат кодирования для аудиоблока. Каждый аудиоподблок содержит вспомогательную информацию для декодирования аудиоподблока без ссылки на другой подблок, коды высокочастотного ВК, множество аудиоподподблоков основной полосы частот, в которых аудиоданные для низкочастотных поддиапазонов каждого канала упаковывают и мультиплексируют с другими каналами, высокочастотный аудиоблок, в котором аудиоданные в высокочастотном диапазоне для каждого канала упаковывают и мультиплексируют с другими каналами так, что многоканальный аудиосигнал является декодируемым на множестве частот выборок декодирования, и синхронизацию распаковки для проверки конца подблока.
Размер кадра выбирают как функцию отношения скорости передачи к частоте выборки кодировщика так, что размер выходного блока ограничен, чтобы находиться в требуемом диапазоне. Когда величина сжатия относительно низкая, размер кадра уменьшают так, чтобы он не превышал верхнего максимума. В результате декодировщик может использовать входной буфер с фиксированной, относительно малой величиной памяти с произвольной выборкой (ПИВ). Когда величина сжатия относительно высока, размер кадра увеличивается. В результате система ГУБ может распределять биты относительно большего временного кадра, таким образом улучшая эффективность кодировщика.
Эти и другие особенности и преимущества изобретения станут очевидны специалистам в данной области техники из нижеследующего подробного описания предпочтительных вариантов осуществления со ссылками на сопровождающие чертежи и таблицы.
Краткое описание чертежей
Фиг. 1 - блок-схема 5-канального аудиокодировщика в соответствии с настоящим изобретением;
фиг. 2 - блок-схема многоканального кодировщика;
фиг. 3 - блок-схема кодировщика и декодировщика основной полосы частот;
фиг. 4а и фиг. 4Ь - блок-схемы кодировщика и декодировщика высокой частоты выборки;
фиг. 5 - блок-схема простого кодировщика канала;
фиг. 6 - график байтов на блок относительно размера блока для переменных скоростей передачи;
фиг. 7 - график амплитудной характеристики для фильтров неполного и полного восстановления (НИВ и ИВ);
фиг. 8 - график эффекта наложения поддиапазона для фильтра восстановления;
фиг. 9 - график кривых искажения для фильтров НИВ и ИВ;
фиг. 10 - принципиальная схема кодировщика одного поддиапазона;
фиг. 11а и фиг. 11Ь - обнаружение переходного процесса и вычисление масштабного коэффициента, соответственно, для подблока;
фиг. 1 2 - процесс кодирования энтропии для квантованных значений ΤΜΘΌΕ;
фиг. 13 - процесс квантования масштабного коэффициента;
фиг. 1 4 - свертывание маски сигнала с частотной характеристикой сигнала для генерации отношений сигнала к маске (ОСМ);
фиг. 1 5 - график слуховой реакции человека;
фиг. 1 6 - график значений ОСМ для поддиапазонов;
фиг. 1 7 - график сигнала ошибки для психоакустического распределения бит и распределения бит с минимальной среднеквадратической ошибкой (мско);
фиг. 18а и фиг. 18Ь - график уровней мощности поддиапазона и инвертированный график, соответственно, представляющие процесс распределения бит с «заполнением водой» мско;
фиг. 1 9 - блок-схема одного блока в потоке данных;
фиг. 20 - принципиальная схема декодировщика;
фиг. 21 - блок-схема аппаратурной реализации кодировщика;
фиг. 22 - блок-схема аппаратурной реализации декодировщика.
Краткое описание таблиц
Таблица 1 представляет максимальный размер блока относительно частоты выборки и скорости передачи;
таблица 2 представляет максимально допустимый размер блока (байты) относительно частоты выборки и скорости передачи;
таблица 3 представляет зависимость между значением индекса ΑΒΙΤ, числом уровней квантования и результирующим ОСШ.
Подробное описание изобретения
Многоканальная система аудиокодирования.
Как показано на фиг. 1 , настоящее изобретение объединяет особенности обеих известных схем кодирования и дополнительные особенности в едином многоканальном кодировщике 1 0. Алгоритм кодирования разработан для выполнения на качественных студийных уровнях, т.е. качестве «лучше, чем компакт-диска», и обеспечивает широкий диапазон применений для различных уровней сжатия, частот выборки, длин слов, числа каналов и качества восприятия.
Кодировщик 12 кодирует множественные каналы аудиоданных 14 импульсно-кодовой модуляции (ИКМ), обычно выбираемые при 48 кГц с длинами слов между 1 6 и 24 битами, в поток 16 данных при известной скорости передачи, предпочтительно в диапазоне 32-4096 кбит/с. В отличие от известных аудиокодировщиков настоящая архитектура может быть распространена на более высокие частоты выборки (48-192 кГц) с обеспечением совместимости с существующими декодировщиками, которые были разработаны для частоты выборки основной полосы частот или любой промежуточной частоты выборки. Кроме того, данные 1 4 ИКМ кадрируют и кодируют по одному блоку, где каждый блок предпочтительно разбивают на 1 -4 подблока. Размер аудиокадра, т.е. число выборок ИКМ, основан на относительных значениях частоты выборки и скорости передачи, так что размер выходного блока, т. е. число байтов, считываемых кодировщиком на блок, ограничено, предпочтительно между 5,3 и 8 кбайтами.
В результате величину памяти с произвольной выборкой (ПИВ), требуемую в декодировщике для буферизации входящего потока данных, поддерживают сравнительной малой, что снижает стоимость декодировщика. Ири низких скоростях могут быть использованы большие размеры кадра для разделения на блоки данных ИКМ, что улучшает эффективность кодирования. При более высоких скоростях бит могут быть использованы меньшие размеры кадра для удовлетворения ограничений данных. Это снижает эффективность кодирования, но при более высоких скоростях такое снижение незначительно. Такой способ, в котором данные ИКМ разбивают на блоки, позволяет декодировщику 18 начать воспроизведение до того, как весь выходной блок считан в буфер. Это уменьшает задержку или время ожидания аудиокодировщика.
Кодировщик 12 использует группу фильтров высокого разрешения, которую предпочтительно переключают между фильтрами неполного восстановления и полного восстановления (НПВ и ПВ) на основе скорости бит, для декомпозиции каждого аудиоканала 14 на ряд сигналов поддиапазона. Прогнозирующие кодировщики и кодировщики векторного квантования (ВК) используют для кодирования нижних и верхних частотных поддиапазонов, соответственно. Начальный поддиапазон ВК может быть зафиксирован или может быть определён динамически как функция параметров текущего сигнала. Совместное кодирование частоты может быть использовано при низких скоростях бит для одновременного кодирования множественных каналов в более высоких частотных поддиапазонах.
Прогнозирующий кодировщик предпочтительно переключают между режимами адаптивной импульсно-кодовой модуляции (АИКМ) и адаптивной дифференциальной импульснокодовой модуляции (АДИКМ) на основе выигрыша прогнозирования поддиапазона. Анализатор импульсной помехи сегментирует каждый подблок поддиапазона на сигналы предэха и постэха (подподблоки) и вычисляет соответствующие масштабные коэффициенты для подподблоков предэхо и постэхо, таким образом уменьшая предэхо искажения. Кодировщик адаптивно распределяет имеющуюся скорость бит по всем каналам ИКМ и поддиапазонам для текущего блока в соответствии с их соответствующими требованиями (психоакустическими или среднеквадратической ошибки) для оптимизации эффективности кодирования. При комбинировании прогнозирующего кодирования и психоакустического моделирования эффективность кодирования с низкой скоростью бит увеличивается, таким образом понижая скорость бит, при которой достигается субъективная прозрачность. Программируемый контроллер 19, как, например, компьютер или клавиатура, сопрягают с кодировщиком 1 2 для передачи информации аудиорежима, включая такие параметры, как, например, требуемая скорость бит, число каналов, полное или неполное восстановление, частота выборки и скорость передачи.
Кодированные сигналы и дополнительную информацию упаковывают и мультиплексируют в поток 16 данных, чтобы вычислительная нагрузка декодирования была ограничена для нахождения в требуемом диапазоне. Поток 1 6 данных кодируют или транслируют через носитель 20 передачи, как, например, компакт-диск (КД), цифровой видеодиск (ЦВД) или прямой спутник ретрансляции. Декодировщик 1 8 декодирует отдельные сигналы поддиапазона и выполняет операцию обратной фильтрации для генерации многоканального аудиосигнала 22, который субъективно эквивалентен исходному многоканальному аудиосигналу 1 4. Аудиосистема 24, например, система домашнего театра или мультимедийный компьютер воспроизводят аудиосигналы для пользователя.
Многоканальный кодировщик.
Как показано на фиг. 2, кодировщик 12 содержит множество отдельных кодировщиков 26 канала, предпочтительно пять (левый передний, центральный, правый передний, левый задний и правый задний), которые вырабатывают соответствующие множества кодированных сигналов 28 поддиапазона, приемлемо 32 сигнала поддиапазона на канал. Кодировщик 1 2 использует глобальную систему 30 управления битами (ГУБ), которая динамически распределяет биты из общего пула (буферной области) бит между каналами, между поддиапазонами внутри канала и внутри отдельного блока в данном поддиапазоне. Кодировщик 12 может также использовать способы совместного кодирования частоты, чтобы использовать междуканальные корреляции в высокочастотных поддиапазонах. Кроме того, кодировщик может использовать ВК на более высоких частотных под-диапазонах, которые не являются особенно воспринимаемыми, для обеспечения основной высокочастотной достоверности или окружения при очень низкой скорости бит для текущего блока. Таким образом, кодировщик использует несопоставимые требования к сигналу, например, среднеквадратические значения поддиапазонов и психоакустические уровни маскировки, множественных каналов и неравномерное распределение мощности сигнала относительно частоты в каждом канале и относительно времени в данном блоке.
Обзор распределения бит.
Система 30 ГУБ сначала решает, какие поддиапазоны каналов будут кодировать совместно по частоте и усредняет эти данные, а затем определяет, какие поддиапазоны будут кодировать с использованием ВК и вычитает эти биты из имеющейся скорости бит. Решение, какие поддиапазоны будут подвергнуты ВК, может быть принято априори, что все поддиапазоны выше пороговой частоты являются ВК, или принято на основе психоакустических маскирующих эффектов отдельных поддиапазонов в каждом блоке. После чего система 30 ГУБ распределяет биты, используя психоакустическую маскировку в оставшихся поддиапазонах для оптимизации субъективного качества декодированного аудиосигнала. Если имеются дополнительные биты, кодировщик может переключиться в чистую схему мско, т.е. «заполнения водой», и перераспределить все биты на основе поддиапазонов относительно среднеквадратических величин для минимизации значения среднеквадратической величины сигнала ошибки. Это применимо при очень высоких скоростях бит. Предпочтительным подходом является сохранение психоакустического распределения бит и распределение только дополнительных бит в соответствии со схемой мско. Это поддерживает форму сигнала шума, создаваемого психоакустической маскировкой, но равномерно сдвигает минимальный уровень шума вниз.
Альтернативно предпочтительный подход может быть модифицирован таким образом, что дополнительные биты распределяют в соответствии с разностью между среднеквадратическим и психоакустическим уровнями. В результате психоакустическое распределение морфирует в распределение мско, когда скорость бит увеличивается, таким образом обеспечивая плавный переход между двумя способами. Вышеупомянутые способы особенно применимы для систем с фиксированной скоростью бит. Альтернативно кодировщик 12 может установить уровень искажения, субъективный или среднеквадратической ошибки, и дать возможность предельной скорости бит изменяться для поддержания уровня искажения. Мультиплексор 32 мультиплексирует сигналы поддиапазона и вспомогательную информацию в поток 16 данных в соответствии с конкретным форматом данных. Детали формата данных представлены на фиг. 20 ниже.
Кодирование основной полосы частот.
Для частот выборки в диапазоне 8-48 кГц кодировщик 26 канала, как показано на фиг. 3, использует однородную 512-отводную 32полосную группу 34 фильтров анализа, работающую с частотой выборки 48 кГц для разбиения аудиоспектра 0-24 кГц каждого канала на 32 поддиапазона, имеющих ширину полосы частот 750 Гц на поддиапазон. Кодирующий каскад 36 кодирует каждый сигнал поддиапазона и мультиплексирует 38 их в поток 16 сжатых данных. Декодировщик 1 8 принимает поток сжатых данных, выделяет кодированные данные каждого поддиапазона, используя распаковщик 40, декодирует каждый сигнал 42 поддиапазона и восстанавливает цифровые аудиосигналы ИКМ (частота выборки =48 кГц), используя однородную 512 - отводную 32 - полосную группу 44 фильтров интерполяции каждого канала.
В настоящей архитектуре все стратегии кодирования, например частот выборки 48, 96 или 192 кГц, используют 32-полосный процесс кодирования/декодирования на нижних (основной полосы частот) аудиочастотах, например, между 0-24 кГц. Таким образом, кодировщики, которые спроектированы и созданы в настоящее время, основаны на частоте выборки 48 кГц, будут совместимы с будущими кодировщиками, которые проектируют для использования более высокочастотных компонентов. Существующие декодировщики считывали бы сигнал основной полосы частот (0-24 кГц) и игнорировали закодированные данные для более высоких частот.
Кодирование с высокой частотой выборки.
Для частот выборки в диапазоне 48-96 кГц кодировщик 26 канала предпочтительно разделяет аудиоспектр на два и использует однородную 32-полосную группу фильтров анализа для нижней половины и 8-полосную группу фильтров анализа для верхней половины. Как показано на фиг. 4а и фиг. 4Ь, аудиоспектр 0-48 кГц первоначально разделяют с использованием 256-отводной 2-полосной группы 46 предварительных фильтров прореживания, дающей ширину полосы аудиочастот 24 кГц на диапазон. Нижний диапазон (0-24 кГц) разделяют и кодируют в 32 равномерных диапазонах таким образом, как представлено выше на фиг. 3. Однако верхний диапазон (24-48 кГц) разделяют и кодируют в 8 равномерных диапазонах. Если задержка 8-полосной группы 48 фильтров прореживания/интерполяции не равна задержке 32полосной группы фильтров, то каскад 50 компенсации задержки должен быть использован на пути сигнала 24-48 кГц для гарантии того, что обе временные формы сигнала линейно возрастают перед 2-полосной группой фильтров рекомбинации в декодировщике. В системе кодирования с частотой выборки 96 кГц аудиодиапазон 24-48 кГц задерживают на 384 выборки, а затем разбивают на 8 равномерных диапазонов, с использованием 128-отводной группы фильтров интерполяции. Каждый из поддиапазонов 3 кГц кодируют 52 и упаковывают 54 с закодированными данными из диапазона 0-24 кГц для формирования потока 1 6 сжатых данных.
После поступления в декодировщик 18, поток 16 сжатых данных распаковывают 56 и коды, как для 32-полосового декодировщика (область 0-24 кГц), так и для 8-полосового декодировщика (24-48 кГц) выделяют и подают в соответствующие декодирующие каскады 42 и 58. Восемь и 32 закодированных поддиапазона восстанавливают с использованием однородных 128-отводной и 512-отводной групп 60 и 64 фильтров интерполяции, соответственно. Декодированные поддиапазоны в результате рекомбинируют с использованием однородной 256отводной группы 63 2-полосовых фильтров интерполяции для создания одного цифрового аудиосигнала ИКМ с частотой выборки 96 кГц. В случае, когда для декодировщика желательно работать при половине частоты выборки потока сжатых данных, это может быть выполнено отбрасыванием кодированных данных верхнего диапазона (24-48 кГц) и декодированием только 32 поддиапазонов в аудиодиапазоне 0-24 кГц.
Кодировщик канала.
Во всех описанных стратегиях кодирования процесс 32-диапазонного кодирования/декодирования выполняют для части основной полосы частот аудиодиапазона, между 0-24 кГц. Как показано на фиг. 3, устройство захвата 64 блока кадрирует аудиоканал ИКМ 14 для сегментирования его в последовательные блоки 66 данных. Аудиокадр ИКМ определяет ряд смежных входных выборок, для которых кодирующий процесс генерирует выходной блок в потоке данных. Размер кадра устанавливают на основе величины сжатия, т.е. отношения скорости передачи к частоте выборки, так что количество данных, закодированных в каждом блоке ограничено. Каждый последовательный блок 66 данных разбивают на 32 равномерных частотных диапазона 68 32 - полосной 512 - отводной группой 34 фильтров прореживания конечной импульсной характеристики. Выборки, выведенные из каждого поддиапазона, буферизируют и подают в 32-полосовой кодирующий каскад 36.
Каскад 70 анализа (описанный подробно на фиг. 10 - фиг. 19) генерирует оптимальные коэффициенты прогнозатора, распределения бит дифференциального квантователя и оптимальные масштабные коэффициенты квантователя для буферизированных выборок поддиапазона. Каскад 70 анализа может также решать, какие поддиапазоны будут подвергнуты ВК и какие будут совместно кодируемыми по частоте, если эти решения не являются фиксированными. Эти данные или вспомогательная информация подают в выбранный каскад 72 АДИКМ, каскад 73 ВК или каскад 74 совместного кодирования частоты (СКЧ) и в мультиплексор 32 данных (упаковщик). Выборки поддиапазона затем кодируют процессом АДИКМ или ВК и коды квантования вводят в мультиплексор. Каскад 74 СКЧ фактически не кодирует выборки поддиапазона, а генерирует коды, которые указывают, какие поддиапазоны канала совмещают и где их размещают в потоке данных. Коды квантования и вспомогательную информацию из каждого поддиапазона упаковывают в поток 1 6 данных и передают в декодировщик.
После поступления на декодировщик 18, поток данных демультипликсируют 40 или распаковывают обратно в отдельные поддиапазоны. Масштабные коэффициенты и распределения бит устанавливают в обратные квантователи 75 вместе с коэффициентами прогнозатора для каждого поддиапазона. Дифференциальные коды затем восстанавливают с использованием либо процесса 76 АДИКМ, либо процесса 77 обратного ВК непосредственно, либо процесса 78 обратного СКЧ для определенных поддиапазонов. Наконец, поддиапазоны объединяют обратно в единый аудиосигнал 22 КИМ с использованием 32-полосной группы 44 фильтров интерполяции.
Кадрирование сигнала ИКМ.
Как показано на фиг. 6, устройство захвата блока, показанное на фиг. 5, изменяет размер кадра 79, когда скорость передачи изменяется для данной частоты выборки так, что число байтов на выходной блок 80 ограничивается для того, чтобы находиться между, например, 5,3 кбайт и 8 кбайт. Таблицы 1 и 2 являются проектировочными таблицами, которые позволяют проектировщику выбрать оптимальный размер кадра и размер буфера декодировщика (размер блока), соответственно, для данной частоты выборки и скорости передачи. При низких скоростях передачи размер блока может быть относительно большим. Это позволяет кодировщику использовать неплоское распределение изменения аудиосигнала во времени и улучшить эффективность аудиокодировщика. При высоких скоростях размер блока уменьшают так, что общее число байтов не переполняет буфер декодировщика. В результате проектировщик может обеспечить декодировщик с 8 кбайтами ППВ для соответствия скоростям передачи. Это снижает стоимость декодировщика. Вообще размер аудиокадра задают как:
Аудиокадр = (Размер блока) Р §ашр--, (Т га!е) где Размер блока - размер буфера декодировщика, Р 8ашр - частота выборки, а Т та!е - скорость передачи. Размер аудиокадра не зависит от числа аудиоканалов. Однако, когда число каналов увеличивается, величина сжатия должна также увеличиваться для поддержания требуемой скорости передачи.
Таблица 1
Р §ашр (кГ ц)
Тга!е 8-12 16-24 32-48 64-96 128-192
<512 кбит/с 1024 2048 4096 * *
<1024 кбит/с * 1024 2048 * *
<2048 кбит/с * * 1024 2048 *
<4096 кбит/с * * * 1024 2048
Таблица 2
Р §ашр (кГ ц)
Тга!е 8-12 16-24 32-48 64-96 128-192
<512 кбит/с 8-5,3К 8-5,3К 8-5,3К * *
<1024 кбит/с * 8-5,3К 8-5,3К * *
<2048 кбит/с * * 8-5,3К 8-5,3К *
<4096 кбит/с * * * 8-5,3К 8-5,3К
Фильтрация поддиапазона.
32-полосная 512-отводная равномерная группа 34 фильтров прореживания выбирает из двух многофазных групп фильтров для разбиения блоков 66 данных на 32 равномерных поддиапазона 68, показанных на фиг. 5. Две группы фильтров имеют различные свойства восстановления, которыми достигают компромисс между коэффициентом передачи кодирования поддиапазона и точностью восстановления. Один класс фильтров называется фильтрами полного вос13 становления (ПВ). Когда фильтр прореживания (кодирования) ПВ и фильтр интерполяции (декодирования) располагают друг за другом, восстановленный сигнал является «полным», где полный определяется как находящийся в пределах 0,5 самого младшего двоичного разряда при разрешении 24 бита. Другой класс фильтров называется фильтрами неполного восстановления (НПВ), т.к. восстановленный сигнал имеет ненулевой минимальный уровень шума, который связан со свойствами процесса фильтрации неполного подавления помехи дискретизации (побочной низкочастотной составляющей).
Передаточные функции 82 и 84 фильтров НПВ и ПВ, соответственно, для одного поддиапазона показаны на фиг. 7. Поскольку фильтры НПВ не ограничивают, чтобы обеспечивать полное восстановление, они показывают значительно большие отношения подавления около полосы задерживания (ПОПЗ), т.е. отношение полосы пропускания к первому побочному максимуму, чем фильтры ПВ (110 децибел, см. 85 децибел). Как показано на фиг. 8, побочные максимумы фильтра вызывают сигнал 86, который, естественно, находится в третьем поддиапазоне и создает помеху дискретизации в соседних поддиапазонах. Коэффициент передачи поддиапазона измеряет подавление сигнала в соседних поддиапазонах и, следовательно, показывает способность фильтра декоррелировать (развязывать) аудиосигнал. Поскольку фильтры НПВ имеют значительно большее отношение ПОПЗ, чем фильтры ПВ, они будут также иметь значительно больший коэффициент передачи. В результате фильтры НПВ обеспечивают лучшую эффективность кодирования.
Как показано на фиг. 9, полное искажение в потоке сжатых данных уменьшается, когда общая скорость бит увеличивается, как для фильтров ПВ, так и НПВ. Однако, при низких скоростях разница в характеристике коэффициента передачи поддиапазона между двумя типами фильтров больше, чем минимальный уровень шума, связанный с фильтром НПВ. Таким образом, связанная с фильтром НПВ кривая 90 искажения находится ниже связанной с фильтром ПВ кривой 92 искажения. Следовательно, при низких скоростях аудиокодировщик выбирает блок фильтра НПВ. В некоторой точке 94 ошибка квантования кодировщика падает ниже минимального уровня шума фильтра НПВ, так что добавление дополнительных битов в кодировщик АДИКМ не обеспечивает дополнительных преимуществ. В этой точке аудиокодировщик переключают в блок фильтра ПВ.
Кодирование АДИКМ.
Кодировщик 72 АДИКМ генерирует прогнозируемую выборку р(п) из линейной комбинации Н предыдущих восстановленных выборок. Эту прогнозируемую выборку затем вычитают из входа х(п), получая разностную выборку б(п). Разностные выборки масштабируют делением их на среднеквадратический (СК) (или максимальный (РЕАК)) весовой коэффициент для согласования среднеквадратических амплитуд разностной выборки с амплитудой характеристики О квантователя. Масштабированную разностную выборку иб(п) подают в характеристику квантователя с Ь уровнями размера шага 8Ζ, как определяется числом бит, распределенных для текущей выборки АВ1Т. Квантователь вырабатывает код уровня ЦЬ(п) для каждой масштабированной разностной выборки иб(п). Эти коды уровня в конечном счете передают в каскад АДИКМ декодировшика. Для корректировки предыстории прогнозатора коды уровня ЦЬ(п) квантователя локально декодируют с использованием обратного квантователя 1/0 с идентичными квантователю О характеристиками для создания квантованной масштабированной разностной выборки иб(п). Квантованный вариант х(п) исходной входной выборки х(п) восстанавливают добавлением начальной прогнозируемой выборки р(п) к квантованной разностной выборке б(п). Эту выборку затем используют для корректировки предыстории прогнозатора.
Векторное квантование.
Коэффициенты прогнозатора и высокочастотные выборки поддиапазона кодируют с использованием векторного квантования (ВК). ВК прогнозатора имеет размерность вектора из 4 выборок и скорость бит 3 бита на выборку. Окончательная книга кодов, таким образом, состоит из 4096 векторов кодов размерности 4. Поиск соответствующих векторов структурирован как двухуровневое дерево с каждым узлом в дереве, имеющим 64 ветви. Верхний уровень содержит 64 узла векторов кодов, которые требуются в кодировщике только для помощи процессу поиска. Нижний уровень контактирует с 4096 конечными векторами кодов, которые требуются как в кодировщике, так и в декодировщике. Для каждого поиска требуется 1 28 вычислений среднеквадратической ошибки размерности 4. Книга кодов и векторы узлов на верхнем уровне сгруппированы в последовательность с использованием способа логической двоичной группировки с более чем 5 миллионами последовательных векторов коэффициентов прогнозирования. Последовательные векторы накапливают для всего поддиапазона, который показывает положительный выигрыш прогнозирования при кодировании широкого диапазона аудиоматериала. Для контрольных векторов в упорядоченном множестве получают средние отношения сигнал/шум приблизительно 30 децибел.
Высокочастотное ВК имеет размерность вектора 32 выборки (длина подблока) и скорость бит 0,3125 битов на выборку. Конечная книга кодов поэтому состоит из 1 024 векторов кодов размерности 32. Поиск подходящих векторов структурирован как двухуровневое дерево с каждым узлом в дереве, имеющим 32 ветви. Верхний уровень содержит 32 узла векторов кодов, которые требуются только в кодировщике, нижний уровень содержит 1024 конечных векторов кодов, которые требуются как в кодировщике, так и в декодировщике. Для каждого поиска требуется 64 вычислений среднеквадратической ошибки размерности 32. Книга кодов и узлы векторов на верхнем уровне упорядочены с использованием способа логической двоичной группировки с более чем 7 миллионами последовательных векторов выборки высокочастотного поддиапазона. Выборки, которые составляют векторы, накапливают из выходов поддиапазонов 16 по 32 для частоты выборки 48 кГц для широкого диапазона аудиоматериала. При частоте выборки 48 кГц последовательные выборки представляют аудиочастоты в диапазоне от 1 2 до 24 кГц. Для контрольных векторов в упорядоченном множестве ожидается среднее отношение сигнал/шум около 3 децибел. Несмотря на то, что 3 децибела является малым отношением сигнал/шум, оно достаточно для обеспечения высокочастотной достоверности или окружения на таких высоких частотах. Это значительно лучше для восприятия, чем известные способы с простым игнорированием высокочастотных поддиапазонов.
Совместное кодирование частоты.
В приложениях с очень низкой скоростью бит общая достоверность восстановления может быть улучшена кодированием только совокупности высокочастотного поддиапазона из двух или более аудиоканалов вместо их независимого кодирования. Совместное кодирование частоты возможно, поскольку высокочастотные поддиапазоны часто имеют похожие распределения мощности и поскольку слуховая система человека чувствительна к «интенсивности» высокочастотных составляющих, больше чем к их тонкой структуре. Таким образом, восстановленный средний сигнал обеспечивает хорошую общую достоверность, поскольку при любой скорости бит имеется больше бит для кодирования более важных для восприятия низких частот. Индексы совместного кодирования частоты (1ΟΙΝΧ) передают непосредственно в кодировщик для указания, какие каналы и поддиапазоны совмещены и где расположен закодированный сигнал в потоке данных. Декодировщик восстанавливает сигнал в назначенном канале, а затем копирует его в каждый из других каналов. Каждый канал затем масштабируются в соответствии с его конкретным среднеквадратическим масштабным коэффициентом. Поскольку совместное кодирование частоты усредняет временные сигналы на основе подобности их распределений мощности, достоверность восстановления уменьшается. Поэтому его применение обычно ограничено применениями с низкой скоростью бит и в основном сигналами 1 0 20 кГц. В применениях со скоростями бит ОТ средней до высокой, совместное кодирование частоты обычно непригодно.
Кодировщик поддиапазона.
Процесс кодирования для одного поддиапазона, который кодируют с использованием процессов АДИКМ/АИКМ и особенно взаимодействие каскада 70 анализа и кодировщика 72 АДИКМ, показанных на фиг. 5, и глобальной системой управления битами, показанной на фиг. 2, подробно представлено на фиг. 10. Фиг. 11 - фиг. 19 детализируют составляющие процессы, показанные на фиг. 13. Группа 34 фильтра разбивает аудиосигнал 14 ИКМ на 32 сигнала х(п) поддиапазона, которые записывают в соответствующие буферы 96 выборки поддиапазона. Предположим, размер аудиокадра составляет 4096 выборок, каждый буфер 96 выборки поддиапазона хранит полный блок из 1 28 выборок, которые разделены на 432 подблока выборки. Размер кадра из 1024 выборок создавал бы один подблок из 32 выборок. Выборки х(п) направляют в каскад 70 анализа для определения коэффициентов прогнозирования, режима прогнозатора (РМОИЕ), режима переходного процесса (ТМОИЕ) масштабных коэффициентов (8Р) для каждого подблока. Выборки х(п) также подают в систему 30 ГУБ, которая определяет распределение бит (ΑΒΙΤ) для каждого подблока на поддиапазон на аудиоканал. После чего выборки х(п) передают в кодировщик 72 АДИКМ по одному подблоку.
Оценка оптимальных коэффициентов прогнозирования
Для Н, предпочтительно 4-го порядка, коэффициенты прогнозирования генерируют отдельно для каждого подблока с использованием стандартного способа 98 автокорреляции, оптимизируемого относительно блока выборок х(п) поддиапазона, т.е. уравнения Вейнера-Хопфа или Юли-Уолкера.
Квантование оптимальных коэффициентов прогнозирования
Каждое множество из четырех коэффициентов прогнозатора предпочтительно квантуют с использованием книги кодов с 1 2-битовыми векторами, 4-элементным деревом поиска, описанной выше. Книга кодов с 1 2-битовыми векторами содержит 4096 векторов коэффициентов, которые оптимизируют для требуемого распределения вероятности с использованием стандартного алгоритма кластеризации. Поиск ОМ 100 векторного квантования (ВК) выбирают вектор коэффициентов, который показывает наименьшую взвешенную среднеквадратическую ошибку между ним и оптимальными коэффициентами. Оптимальные коэффициенты для каждого подблока затем замещают этими «квантованными» векторами. Обратный табличный поиск 101 ВК используют для подачи квантованных коэффициентов прогнозатора в кодировщик 72 АДИКМ.
Оценка разностного сигнала ά(η) прогнозирования
Важным затруднением с АДИКМ является то, что последовательность разностной выборки ά(η) не может быть легко спрогнозирована перед фактическим рекурсивным процессом 72. Основным требованием прямой адаптивной АДИКМ поддиапазона является то, что мощность разностного сигнала должна быть известна перед кодированием АДИКМ для того, чтобы вычислить подходящее распределение бит для квантователя, который будет создавать известную ошибку квантования, или уровень шума в восстановленных выборках. Знание мощности разностного сигнала также требуется для того, чтобы определить оптимальный разностный масштабный коэффициент перед кодированием.
К сожалению, мощность разностного сигнала зависит не только от параметров входного сигнала, но также от работы прогнозатора. Кроме известных ограничений, как например, порядок прогнозатора и оптимальность коэффициентов прогнозатора, на работу прогнозатора также влияет уровень ошибки квантования или шум, создаваемый в восстановленных выборках. Поскольку шум квантования определяет конечное распределение бит (ΑΒΙΤ) и среднеквадратические (или максимальные) значения масштабного коэффициента, оценка мощности разностного сигнала должна поступать итеративно 102.
Шаг 1. Предположение нулевой ошибки квантования.
Первую оценку разностного сигнала выполняют пропусканием буферизованных выборок х(п) поддиапазона через процесс АДИКМ, который не квантует разностный сигнал. Это выполняют блокировкой квантования и среднеквадратического масштабирования в цикле кодирования АДИКМ. При оценке разностного сигнала таким образом действия значений масштабного коэффициента и распределения бит удаляют из вычисления. Однако, действие ошибки квантования на коэффициенты прогнозатора принимают во внимание процессом при использовании векторных квантованных коэффициентов прогнозирования. Обратный табличный поиск 104 ВК используют для обеспечения квантованных коэффициентов прогнозирования. Для дополнительного повышения точности оценочного прогнозатора, выборки предыстории из фактического прогнозатора АДИКМ, которые были накоплены в конце предыдущего блока, копируют в прогнозатор перед вычислением. Это гарантирует то, что прогнозатор стартует оттуда, где реальный прогнозатор АДИКМ финишировал в конце предыдущего входного буфера.
Основным различием между этой оценкой еб(п) и фактическим процессом ά(η) является то, что действие шума квантования на восстановление выборки х(п) и на сниженную точность прогнозирования игнорируют. Для квантователей с большим числом уровней уровень шума будет вообще малым (при предположении подходящего масштабирования) и поэтому фактическая мощность разностного сигнала будет практически соответствовать мощности, вычисленной в оценке. Однако, когда число уровней квантования мало, как обстоит дело для типичных аудиокодировщиков с низкой скоростью бит, фактический прогнозируемый сигнал и, следовательно, мощность разностного сигнала, может значительно отличаться от оцениваемой мощности. Это создает минимальные уровни шума кодирования, которые отличаются от спрогнозированных ранее в процессе адаптивного распределения бит.
Несмотря на это, изменение в эффективности прогноза может быть незначительным для применения или скорости бит. Таким образом, оценка может быть использована непосредственно для вычисления распределений бит и масштабных коэффициентов без итерации. Дополнительное усовершенствование состоит в компенсации потери эффективности преднамеренной переоценкой мощности разностного сигнала, если вероятно, что квантователь с малым числом уровней должен быть назначен в этот поддиапазон. Переоценка может также быть сортирована в соответствии с изменяющимся числом уровней квантования для повышения точности.
Шаг 2. Повторное вычисление с использованием оценочных распределений бит и масштабных коэффициентов.
Если распределения бит (ΑΒΙΤ) и масштабные коэффициенты (8Р) сгенерированы с использованием разностного сигнала первой оценки, их оптимальность может быть проверена выполнением дополнительного процесса АДИКМ оценки с использованием оценочных значений ΑΒΙΤ и среднеквадратических (или максимальных) значений в цикле 72 АДИКМ. Также как в первой оценке, предысторию оценки прогнозатора копируют из фактического прогнозатора АДИКМ перед началом вычислений для гарантии того, что оба прогнозатора стартуют с одной и той же точки. Если все буферизированные входные выборки прошли через этот второй цикл оценки, результирующий минимальный уровень шума в каждом поддиапазоне сравнивают с допустимым минимальным уровнем шума в процессе адаптивного распределения бит. Любые существенные различия могут быть компенсированы модификацией распределения бит и/или масштабных коэффициентов.
Шаг 2 может быть повторен для усовершенствования подходящим образом распределенного минимального уровня шума в поддиапазонах, каждый раз используя последнюю оценку разностного сигнала для вычисления следующего множества распределений бит и масштабных коэффициентов. Вообще, если масштабные коэффициенты изменяются на бо19 лее чем 2-3 децибела, их повторно вычисляют. Иначе распределение бит может нарушить отношения сигнала к маске, генерируемые процессом психоакустической маскировки или альтернативно процессом минимальной среднеквадратической ошибки. Обычно достаточно одной итерации.
Вычисление режимов прогнозирования (РМОИЕ) поддиапазона
Для улучшения эффективности кодирования контроллер 106 может произвольно выключать процесс прогнозирования, когда выигрыш прогнозирования в текущем подблоке падает ниже порога, установкой флага РМОИЕ. Флаг РМОИЕ устанавливают на единицу, когда выигрыш прогнозирования (отношение мощности входного сигнала и оцененной мощности разностного сигнала), измеренный во время стадии оценки для блока входных выборок, превышает некоторый определенный барьер. Наоборот, если измеренный выигрыш прогнозирования меньше, чем определенный барьер, коэффициенты прогнозатора АДИКМ устанавливают на ноль как в кодировщике, так и в декодировщике для этого поддиапазона, и соответствующий РМОИЕ устанавливают на ноль. Порог выигрыша прогноза устанавливают равным коэффициенту искажения передаваемого вектора коэффициентов прогнозатора. Это делают для того, чтобы гарантировать, что когда РМОИЕ=1, выигрыш кодирования для процесса АДИКМ всегда больше, чем или равен выигрышу прямого адаптивного процесса кодирования ИКМ (АИКМ). Иначе при установке РМОИЕ на ноль и перезадании коэффициентов прогнозатора процесс АДИКМ просто возвращается в АИКМ.
Значения РМОИЕ могут быть установлены высокими в некотором или во всех поддиапазонах, если изменения выигрыша кодирования АДИКМ не важны для применения. Наоборот, значения РМОИЕ могут быть установлены низкими, если, например, определенные поддиапазоны не собираются кодировать совсем, скорость бит применения достаточно высока, когда выигрыши прогнозирования не требуются для поддержания субъективного качества аудио, переходная составляющая сигнала высока или склеивание характеристики закодированного АДИКМ аудио просто не желательно, как могло бы быть для приложений редактирования аудио.
Отдельные режимы прогнозирования (значения РМОИЕ) передают для каждого поддиапазона со скоростью, равной скорости корректировки линейных прогнозаторов в процессах АДИКМ кодировщика и декодировщика. Назначением параметра РМОИЕ является указание в декодировщик, будет ли конкретный поддиапазон иметь некоторый адрес вектора коэффициентов прогнозирования, связанный с его закодированным блоком аудиоданных. Когда РМОИЕ=1 в некотором поддиапазоне, адрес вектора коэффициентов прогнозатора будет всегда включен в поток данных. Когда РМОИЕ=0 в некотором поддиапазоне, тогда адрес вектора коэффициентов прогнозатора никогда не будет включен в поток данных и коэффициенты прогнозатора устанавливают на ноль на стадиях АДИКМ как кодировщика, так и декодировщика.
Вычисление значений РМОИЕ начинается анализом буферизованных мощностей входного сигнала поддиапазона относительно соответствующих мощностей буферизованного оцененного разностного сигнала, полученных на первой стадии оценки, т. е. при допущении отсутствия ошибки квантования. Как входные выборки х(п), так и оцененные разностные выборки еб(и) буферизируют для каждого поддиапазона отдельно. Размер буфера равняется числу выборок, содержащихся в каждом периоде корректировки прогнозатора, например, размеру подблока. Выигрыш прогнозирования затем вычисляют как:
Рбаш(децибел)=20,0· 1од (КМ§х(и)/КМ§еЦ(и)), где КМ§Х(И) = среднеквадратическое значение буферизованных входных выборок х(и), а
РМЗе,|Н1, = среднеквадратическое значение буферизованных оцененных разностных выборок еб.(и).
Для положительных выигрышей прогнозирования разностный сигнал в среднем меньше, чем входной сигнал и, следовательно, уменьшенный минимальный уровень шума восстановления может быть достигнут с использованием процесса АДИКМ относительно АИКМ для той же самой скорости бит. Для отрицательных выигрышей кодировщик АЛИКМ создает разностный сигнал, в среднем больший, чем входной сигнал, который приводит к более высоким минимальным уровням шума, чем АДИКМ для той же самой скорости бит. Обычно порог выигрыша прогнозирования, который включает РМОИЕ, будет положительным и будет иметь значение, которое учитывает дополнительную емкость канала, потребляемую при передаче адреса вектора коэффициентов прогнозатора.
Вычисление режимов импульсной помехи (ТМОИЕ) поддиапазона
Контроллер вычисляет режимы импульсной помехи (ТМОИЕ) для каждого подблока в каждом поддиапазоне. Значения ТМОИЕ указывают число масштабных коэффициентов и выборок в буфере оценочного разностного сигнала еб(и), когда РМОИЕ=1 или в буфере входного сигнала х(и) поддиапазона, когда РМОИЕ=0, для которых они достоверны. Значения ТМОИЕ корректируют с той же самой частотой, что и адреса вектора коэффициентов прогнозирования и передают в декодировщик. Назначением режимов импульсной помехи является уменьшение слышимых кодируемых «предэхо» искусст21 венных объектов кодирования при наличии переходных процессов сигнала.
Переходный процесс определяют как быстрый переход между сигналом малой амплитуды и сигналом большой амплитуды. Поскольку масштабные коэффициенты усредняют на блоке разностных выборок поддиапазона, если происходит быстрое изменение амплитуды сигнала в блоке, т. е. происходит переходный процесс, вычисленный масштабный коэффициент стремится быть больше, чем было бы оптимально для выборок малых амплитуд, предшествующих переходному процессу. Следовательно, ошибка квантования в выборках, предшествующих переходным процессам может быть очень большой. Этот шум воспринимают как искажение предэхо.
На практике режим импульсной помехи используют для модификации длины блока усредняемого масштабного коэффициента поддиапазона для ограничения влияния переходного процесса на масштабирование дифференциальных выборок, непосредственно предшествующих ему. Мотивацией для этого является свойство предварительной маскировки, присущее человеческой слуховой системе, которая предполагает, что при наличии переходного процесса шум может быть замаскирован перед переходным процессом при условии, что его продолжительность остается постоянной.
В зависимости от значения ΡΜΟΌΕ, либо содержимое, т.е. подблок, буфера еб(и) выборки поддиапазона, либо содержимое буфера еб(и) оцененной разности копируют в буфер анализа импульсной помехи. Здесь содержимое буфера разделяют одинаково на 2, 3, или 4 подподблока, в зависимости от размера выборки буфера анализа. Например, если буфер анализа содержит 32 выборки поддиапазона (21,3 миллисек 1500 Гц), буфер разделяют на 4 подподблока, каждый из 8 выборок, давая временное разрешения 5,3 мс для частоты выборки поддиапазона 1500 Гц. Альтернативно, если кадр анализа был сконфигурирован при 16 выборках поддиапазона, тогда требуется разделить буфер только на два подподблока для того, чтобы обеспечить то же самое временное разрешение.
Сигнал в каждом подподблоке анализируют и определяют статус каждого, кроме первого, переходного процесса. Если любые подподблоки объявляют с переходным процессом, два отдельных масштабных коэффициента генерируют для буфера анализа, т.е. текущего подблока. Первый масштабный коэффициент вычисляют из выборок в подподблоках, предшествующих подподблоку с переходным процессом. Второй масштабный коэффициент вычисляют из выборок в подподблоке с переходным процессом вместе со всеми предшествующими подподблоками.
Статус переходного процесса первого подподблока не вычисляют, т.к. шум квантования автоматически ограничивают началом кадра анализа. Если более, чем один подподблок объявляют с переходным процессом, тогда рассматривают только один, который появляется первым. Если не обнаруживают подподблоков с переходным процессом, тогда вычисляют только один масштабный коэффициент с использованием всех выборок в буфере анализа. Таким образом значения масштабного коэффициента, которые содержат выборки с переходным процессом, не используют для масштабирования предыдущих выборок, более чем на период времени подподблока ранее. Следовательно, шум квантования перед переходным процессом ограничивают периодом подподблока.
Объявление переходного процесса.
Подподблок объявляют с переходным процессом, если отношение его мощности к предшествующему подбуферу превышает порог переходного процесса (ТТ), а мощность в предшествующем подподблоке ниже порога перед переходным процессом (РТТ). Значения ТТ и РТТ будут зависеть от скорости бит и степени требуемого подавления перед эхом. Их обычно изменяют до тех пор, пока воспринимаемая помеха перед эхом согласуется с уровнем других искусственных объектов кодирования, если они существуют. Увеличение значения ТТ и/или уменьшение значения РТТ будет уменьшать вероятность объявления подподблока с переходным процессом и, следовательно, будет уменьшать скорость бит, связанную с передачей масштабных коэффициентов. Наоборот, уменьшение значения ТТ и/или увеличение значения РТТ будет увеличивать вероятность объявления подподблока с переходным процессом и, следовательно, будет увеличивать скорость бит, связанную с передачей масштабных коэффициентов.
Поскольку ТТ и РТТ индивидуально устанавливают для каждого поддиапазона, чувствительность обнаружения импульсной помехи в кодировщике может быть произвольно установлена для каждого поддиапазона. Например, если обнаруживают, что предэхо в высокочастотном поддиапазоне менее воспринимаемо, чем в низкочастотных поддиапазонах, тогда пороги могут быть установлены для уменьшения вероятности объявления импульсных помех в более высоких поддиапазонах. Более того, поскольку значения ΤΜΟΌΕ вставляют в поток сжатых данных, не требуется, чтобы декодировщик содержал алгоритм обнаружения переходного процесса, используемый кодировщиком, чтобы правильно декодировать информацию ΤΜΟΌΕ.
Четырёхподбуферная конфигурация.
Как показано на фиг. 11а, если первый подблок 108 в буфере 109 анализа поддиапазона с переходным процессом, или если не обнаруживают подподблоки с импульсной помехой, тогда ΤΜΟΌΕ=0. Если второй подподблок с переходным процессом, но не первый, тогда ΤΜΟΌΕ=1.
Если третий подподблок с переходным процессом, но не первый или второй, тогда ΤΜΘΌΕ=2. Если только четвёртый под-подблок с переходным процессом, тогда ΤΜΘΌΕ=3.
Вычисление масштабных коэффициентов.
Как показано на фиг. 11в, когда ΤΜΘΌΕ=0, масштабные коэффициенты 110 вычисляют относительно всех подподблоков. Когда ΤΜΘΌΕ=1, первый масштабный коэффициент вычисляют относительно первого подподблока, а второй масштабный коэффициент относительно всех предшествующих подподблоков. Когда ΤΜΘΌΕ=2, первый масштабный коэффициент вычисляют относительно первого и второго подподблоков, а второй масштабный коэффициент относительно всех предшествующих подподблоков. Когда ΤΜΘΌΕ=3, первый масштабный коэффициент вычисляют относительно первого, второго и третьего подподблоков, а второй масштабный коэффициент - относительно четвёртого подподблока.
Кодирование и декодирование АДИКМ с использованием ΤΜΘΌΕ.
Когда ΤΜΘΌΕ=0, один масштабный коэффициент используют для масштабирования разностных выборок поддиапазона в течение продолжительности всего буфера анализа, т.е. подблока, и передают в декодировщик для обеспечения обратного масштабирования. Когда ΤΜΘΌΕ>0, используют два масштабных коэффициента для масштабирования разностных выборок поддиапазона и обе передают в декодировщик. Для любого ΤΜΘΌΕ каждый масштабный коэффициент используют для масштабирования дифференциальных выборок, используемых для генерации его на первом месте.
Вычисление масштабных коэффициентов поддиапазона (среднеквадратических или максимальных).
В зависимости от значения ΡΜΟΌΕ для этого диапазона либо оцененные разностные выборки еД(п), либо входные выборки х(п) поддиапазона используют для вычисления соответствующего масштабного коэффициента (коэффициентов). Значения ΤΜΟΌΕ используют в этом вычислении для определения как числа масштабных коэффициентов, так и для идентификации соответствующих подподблоков в буфере.
Вычисление среднеквадратического (ΡΜδ) масштабного коэффициента.
Для _)-го поддиапазона среднеквадратические масштабные коэффициенты вычисляют следующим образом:
Когда ΤΜΟΌΕ=0, тогда единственное среднеквадратическое значение равно:
Ь
ΡΜδί=(ΣΌά(η)2/Ρ)0'5 п=1 где Ь - число выборок в подблоке
Когда ΤΜΟΌΕ>0, тогда два среднеквадратических значения равны:
к
ΡΜδ 1_)=^еД(п)2/Е)0·5 п=1 к+1
ΡΜδ 2_)=(Σ еД(п)2/Ь)0·5 п=1 где к = (ΤΜΟΌΕ) · Ь/ΝδΒ) и ΝδΒ - число одинаковых подподблоков.
Если ΡΜΟΌΕ=0, тогда выборки еП|(п) заменяют входными выборками х|(п).
Вычисление максимального (ΡΕΑΚ) масштабного коэффициента.
Для _)-го поддиапазона максимальный масштабный коэффициент вычисляют следующим образом:
Когда ΤΜΟΌΕ=0, то единственное максимальное значение равно:
ΡΕΑΙ<ί=ΜΑΧ(ΑΒίΆάί(π)) для: п=1, Ь
Когда ΤΜΟΌΕ>0, то два максимальных значения равны:
ΡΕΑΚ 1)=ΜΑΧ(ΑΒίΆάί(π)) для п=1, (ΤΜΟΌΕ· Ь/ΝδΒ) ΡΕΑΚ2ί=ΜΑΧ(ΑΒίΆάί)) для п=( 1+ΤΜΟΟΕΕ/ΝδΒ), Ь
Если ΡΜΟΌΕ=0, то выборки еф(п) заменяют входными выборками х|(п).
Квантование ΡΜΟΌΕ, ΤΜΟΌΕ и масштабных коэффициентов.
Квантование значений ΡΜΟΌΕ.
Флаги режима прогнозирования имеют только два значения: включено или выключено, и их передают непосредственно в декодировщик как 1 -битовые коды.
Квантование значений ΤΜΟΌΕ.
Флаги режима импульсной помехи имеют максимум 4 значения: 0,1,2 и 3, и их либо передают в кодировщик непосредственно с использованием 2-битовых целочисленных кодовых слов без знака, или альтернативно через 4уровневую таблицу энтропии для уменьшения средней длины слова значений ΤΜΟΌΕ ниже 2 битов. Обычно альтернативное кодирование энтропии используют для применений с малой скоростью бит для того, чтобы сохранить биты.
Процесс 112 кодирования энтропии, представленный подробно на фиг. 1 2, является следующим: коды режима импульсной помехи ΤΜΟΌΕ(ί) для _) поддиапазонов отображают в ряд (р) 4-уровневой с надстрочным элементом переменной длины книги кодов, где каждую книгу кодов оптимизируют для различной входной статистической характеристики. Значения ΤΜΟΌΕ отображают в 4-уровневые таблицы 114 и вычисляют 116 полное использование бит, связанное с каждой таблицей (ΝΒρ). Таблицу, которая обеспечивает самое низкое использование бит в процессе отображения, выбирают 118 с использованием индекса ΤΗυΡΡ. Отображенные коды νΤΜΟΌΕ(ί) извлекают из этой таблицы, упаковывают и передают в декодировщик вместе с индексным словом ΤΗυΡΡ.
Декодировщик, который хранит то же самое множество 4-уровневых обратных таблиц, использует индекс ТНИРР для направления входящих кодов переменной длины νΤΜΟΌΕ(ί) в подходящую таблицу для декодирования в индексы ΤΜΟΌΕ.
Квантование масштабных коэффициентов поддиапазона.
Для передачи масштабных коэффициентов в декодировщик они должны быть квантованы в известный формат кода. В этой системе их квантуют с использованием либо одинаковой 64-уровневой логарифмической характеристики, 128-уровневой логарифмической характеристики, либо переменной скорости кодирования одинаковой 64-уровневой логарифмической характеристики 1 20. 64-уровневый квантователь показывает размер шага 2,25 децибел в обоих случаях, а 128-уровневый - размер шага 1,25 децибел. 64-Уровневое квантование используют для скоростей бит от низких до средних, дополнительное кодирование с переменной скоростью используют для применений с низкой скоростью бит, а 118-уровневое обычно используют для высоких скоростей бит.
Процесс 1 20 квантования представлен на фиг. 13. Масштабные коэффициенты ΚΜ3 или ΡΕΑΚ считывают из буфера 121, преобразуют в логарифмический интервал 1 22, а затем подают либо в 64-уровневый, либо в 128-уровневый равномерные квантователи 1 24, 1 26, как определено управлением 1 28 режимом кодировщика. Логарифмически квантованные масштабные коэффициенты затем записывают в буфер 130. Диапазон 1 28 и 64-уровневых квантователей достаточен для покрытия масштабных коэффициентов с динамическим диапазоном приблизительно 1 60 децибел и 1 44 децибела, соответственно, 128-уровневый верхний предел устанавливают для покрытия динамического диапазона 24-битовых входных цифровых ИКМ аудиосигналов. 64-уровневый верхний предел устанавливают для покрытия динамического диапазона 20-битовых входных цифровых ИКМ аудиосигналов.
Логарифмические масштабные коэффициенты отображают в квантователь и масштабный коэффициент заменяют ближайшим кодом уровня квантователя КМ8рЪ (или РЕАК.,,.). В случае 64-уровневого квантователя эти коды имеют длину 64 бита и находятся в диапазоне между 0-63. В случае 128-уровневого квантователя, коды имеют длину 7 битов и находятся в диапазоне между 0-127.
Обратное квантование 131 достигается просто отображением кодов уровней в соответствующую обратную характеристику квантования для получения значений КМ§§ (или ΡΕΑΚ§). Квантованные масштабные коэффициенты используют как в кодировщике, так и в декодировщике для масштабирования АДИКМ (или АИКМ, если ΡΜΟΌΕ=0) дифференциальной выборки, таким образом обеспечивая идентичность процессов масштабирования и обратного масштабирования.
Если скорость бит кодов 64-уровневого квантователя требуется уменьшить, выполняют дополнительное кодирование энтропии или кодирование переменной длины. 64-уровневые коды сначала кодируют 132 дифференциально первого порядка в _) поддиапазонах, начиная со второго диапазона 0=2) до самого высокого активного поддиапазона. Процесс также может быть использован для кодирования максимальных (ΡΕΑΚ) масштабных коэффициентов. Дифференциальные коды ΌΚΜδρΣ(]), (ΌΡΕΑΚρΣ(ί)) со знаком имеют максимальный диапазон +/- 63 и их запоминают в буфере 134. Для уменьшения их скорости бит относительно исходных 6битовых кодов дифференциальные коды отображают в число (р) 127-уровневых книг кодов со средним надстрочным элементом переменой длины. Каждую книгу кодов оптимизируют для различной входной статистической характеристики.
Процесс кодирования энтропии дифференциальных кодов со знаком является таким же, как процесс кодирования энтропии для режимов импульсной помехи, представленный на фиг. 1 2, за исключением того, что используют р 1 27уровневые таблицы кодов переменной длины. Таблицу, которая обеспечивает самое малое потребление бит в процессе отображения выбирают с использованием индекса ЗНИРР. Отображенные коды νΌΡΜδχι|,(ί) извлекают из этой таблицы, упаковывают и передают в декодировщик вместе с индексным словом ЗНИРР. Декодировщик, который хранит то же самое множество из (р) 127-уровневых обратных таблиц, использует индекс ЗНИРР для направления входящих кодов переменной длины в подходящую таблицу для декодирования в дифференциальные уровни кодов квантователя. Дифференциальные уровни кодов возвращают в абсолютные значения с использованием следующих операций:
ΚΜ3ΡΣ(1) = ΌΚΜ3ρς(1)
ΚΜ3ρΣ(ί) = ΌΚΜ3ρΣ(ί) + ΚΜ3ρΣ(ί-1) .)=2..., К, а максимальные (ΡΕΑΚ) уровни кодов возвращают в абсолютные значения с использованием следующих операций:
ΡΕΑΚρΣ(1) = ΌΡΕΑΚρς(1)
ΡΕΑΚρς(]) = ΌΡΕΑΚρΣ(ί) + ΡΕΑΚς,^-Ι) для 1=2,..., К, где в обоих случаях К = числу активных поддиапазонов.
Глобальное распределение бит
Глобальная система 30 управления битами, показанная на фиг. 1 0, управляет распределением бит (ΑΒΙΤ), определяет число активных поддиапазонов и стратегию совместной частоты и стратегию ВК для многоканального аудиокодировщика для обеспечения субъективно прозрач27 ного кодирования при уменьшенной скорости бит. Это увеличивает число аудиоканалов и/или время проигрывания, которые могут быть закодированы и запомнены на фиксированном носителе, при поддержке или улучшении аудиодостоверности. Вообще, система 30 ГУБ сначала распределяет биты в каждый поддиапазон в соответствии с психоакустическим анализом, модифицированным выигрышем прогнозирования кодировщика. Оставшиеся биты затем распределяют в соответствии со схемой минимальной средне-квадратической ошибки бит для снижения общего уровня шума. Для оптимизации эффективности кодирования система ГУБ одновременно распределяет биты по всем аудиоканалам, по всем поддиапазонам и во всем блоке. Кроме того, может быть использована стратегия совместного кодирования частоты. Таким образом, система использует неравномерное распределение мощности сигнала между аудиоканалами по частоте и во времени.
Психоакустический анализ.
Психоакустические измерения используют для определения нерелевантной воспринимаемой информации в аудиосигнале. Нерелевантная воспринимаемая информация - это те составляющие аудиосигнала, которые не могут быть восприняты слушателями и могут быть измерены в интервале времени, в частотном интервале или в некотором другом базисе. Дж. Д.Джонсон: «Преобразование кодирования аудиосигнала с использованием критерия восприятия шума», «Журнал общества инженеров по электронике по избранным областям в системах связи», том 18АС-6, с. 314-323, февраль 1988, описывает общие принципы психоакустического кодирования.
Два основных фактора влияют на психоакустическое измерение. Одним является зависящий от частоты абсолютный порог слышимости, применимый к людям. Другим является маскирующий эффект, который оказывает один звук на способность людей слышать второй звук, проигрываемый одновременно или даже после первого звука. Другими словами, первый звук мешает нам слышать второй звук, то есть маскирует его.
В кодировщике поддиапазона конечным результатом психоакустического вычисления является множество чисел, которые определяют неслышимый уровень шума для каждого поддиапазона в этот момент. Это вычисление хорошо известно и содержится в стандарте сжатия экспертной группы по кинофильмам 1 1δΘ/ΙΕδ ΌΙδ 11172 «Информационная технология - Кодирование кинофильмов и связанного звука для цифрового запоминающего носителя приблизительно до 1,5 Мбит/сек», 1992. Эти числа изменяются динамически с аудиосигналом. Кодировщик регулирует минимальный шум квантования в поддиапазонах путем процесса распределения бит так, чтобы шум квантования в этих поддиапазонах был меньше, чем слышимый уровень.
Точное психоакустическое вычисление обычно требует высокочастотного разрешения в преобразовании времени в частоту. Это предполагает большой кадр анализа для преобразования времени в частоту. Стандартный размер кадра анализа равен 1 024 выборкам, который соответствует подблоку сжатых аудиоданных. Частотное разрешение длины 1024 быстрых преобразований Фурье приблизительно соответствует временному разрешению человеческого уха.
Выходом психоакустической модели является отношение сигнала к маске (ОСМ) для каждого из 32 поддиапазонов. ОСМ показывает величину шума квантования, которую может переносить конкретный поддиапазон, и, следовательно, также показывает число битов, требуемых для квантования выборок в поддиапазоне. В частности, большое ОСМ (>>1) показывает, что требуется большое число битов, а малое ОСМ (>0) показывает, что требуется меньше битов. Если ОСМ <0, тогда аудиосигнал находится ниже порога маски шума и не требуются никакие биты для квантования.
Как показано на фиг. 14 отношения СМ генерируют для каждого последовательного блока вообще 1 ) вычислением быстрого преобразования Фурье, предпочтительно длины 1 024, на аудиовыборках ИКМ для создания последовательности частотных коэффициентов 142, 2) свертыванием частотных коэффициентов с частотно зависимыми тональными и шумовыми психоакустическими масками 1 44 для каждого поддиапазона, 3) усреднением результирующих коэффициентов в каждом поддиапазоне для создания уровней ОСМ, и 4) выборочно нормализацией отношений СМ в соответствии со слуховой характеристикой 1 46 человека, представленной на фиг. 15.
Чувствительность уха человека максимальна на частотах около 4 кГц и уменьшается, когда частота увеличивается или уменьшается. Таким образом, для того, чтобы быть воспринимаемым на некотором уровне, сигнал 20 кГц должен быть значительно сильнее, чем сигнал 4 кГц. Поэтому, отношения СМ на частотах около 4 кГц сравнительно более важны, чем отдаленные частоты. Однако, точная форма кривой зависит от средней мощности сигнала, идущего слушателю. Когда уровень громкости увеличивают, слуховая характеристика 1 46 сжимается. Таким образом, система, оптимизированная для конкретного уровня громкости, будет субоптимальной при других уровнях громкости. В результате, либо номинальный уровень мощности выбирают для нормализации отношений СМ, либо нормализацию блокируют. Результирующие отношения СМ 148 для 32 поддиапазонов представлены на фиг. 1 6.
Стандартная процедура распределения бит.
Система 30 ГУБ сначала выбирает подходящую стратегию кодирования поддиапазонов, которые будут кодировать с алгоритмами ВК и АДИКМ, а также будет ли разрешен СКЧ. После чего система ГУБ выбирает либо психоакустический подход, либо подход распределения бит с минимальной среднеквадратической ошибкой. Например, при высоких скоростях бит система может блокировать психоаккустическое моделирование и использовать правильную схему распределения с минимальной среднеквадратической ошибкой. Это уменьшает сложность вычисления без какого-либо заметного изменения в восстановленном аудиосигнале. Наоборот, при низких скоростях система может активизировать схему совместного кодирования частоты, обсужденную выше, для улучшения достоверности восстановления на низких частотах. Система ГУБ может переключаться между нормальным психоакустическим распределением и распределением с минимальной среднеквадратической ошибкой на основе содержания переходного процесса сигнала на поблочной основе. Когда содержание импульсной помехи высоко, предположение стационарности, которое используют для вычисления значений ОСМ не правильно и, следовательно, схема минимальной среднеквадратической ошибки обеспечивает большую эффективность.
Для психоакустического распределения система ГУБ сначала распределяет имеющиеся биты для обеспечения психоакустических эффектов, а затем распределяет оставшиеся биты для снижения общего минимального уровня шума. Первым шагом является определение значений ОСМ для каждого поддиапазона текущего блока, как описано выше. Следующим шагом является корректировка значений ОСМ для выигрыша прогнозирования (Р§ат) в соответствующих поддиапазонах для генерации отношений маски к шуму (значений ОМС). Причем, принцип заключается в том, что кодировщик АДИКМ будет обеспечивать часть требуемого ОСМ. В результате неслышимые психоаккустические уровни шума могут быть обеспечены меньшими битами.
ОМШ для )-го поддиапазона, при допущении ΡΜΘΌΕ=1 равно: ΜΝΚ(ΐ) = 8ΜΚ(ΐ) РдашО) · ΡΕΓ (ΑΒΙΤ), где ΡΕΓ (ΑΒΙΤ) показатель эффективности прогнозирования квантователя. Для вычисления ΜΝΚ(ΐ) разработчик должен иметь оценку распределения бит (ΑΒΙΤ), которая может быть сгенерирована либо при распределении битов только на основании 8ΜΚ(ΐ), либо при предположении, что ΡΕΓ (ΑΒΙΤ) = 1 . При скоростях бит от средних до высоких действительный выигрыш прогнозирования приблизительно равен вычисленному выигрышу прогнозирования. Однако при низких скоростях бит действительный выигрыш прогнозирования уменьшается. Действительный выигрыш прогнозирования, который достигают, например, 5-уровневым квантователем, равен приблизительно 0,7 от оцененного выигрыша прогнозирования, в то время как 65-уровневый квантователь дает возможность действительному выигрышу прогнозирования быть равным оцененному выигрышу прогнозирования ΡΕΓ = 1 ,0. В пределе, когда скорость бит равна нулю, прогнозируемое кодирование, по существу, непригодно и действительный выигрыш прогнозирования равен нулю.
На следующем шаге система 30 ГУБ генерирует схему распределения бит, которая обеспечивает ОМШ для каждого поддиапазона. Это выполняют с использованием аппроксимации, что 1 бит равняется 6 децибелам сигнала помехи. Для гарантии того, что помеха кодирования меньше, чем психоакустически слышимый порог, назначенная скорость бит равна наибольшему целому числу ΜΝΚ, деленному на 6 децибел, то есть:
АВ1Т(3)
ΜΝΚ(0 ) децибел
При распределении битов таким образом уровень 156 шума в восстановленном сигнале будет стремиться следовать самому сигналу 157, показанному на фиг. 17. Таким образом, на частотах, где сигнал очень сильный, уровень шума будет относительно высоким, но останется неслышимым. На частотах, где сигнал относительно слабый, минимальный уровень шума будет очень малым и неслышимым. Средняя ошибка, связанная с этим типом психоакустического моделирования, будет всегда больше, чем минимальная среднеквадратическая ошибка уровня 158 шума, но слышимая эффективность может быть лучше, особенно при низких скоростях бит.
В случае, когда сумма распределенных битов для каждого поддиапазона по всем аудиоканалам больше или меньше, чем целевая скорость бит, стандартная процедура ГУБ будет итеративно уменьшать или увеличивать распределение бит для отдельных поддиапазонов. Альтернативно, целевая скорость бит может быть вычислена для каждого аудиоканала. Это субоптимально, но проще, особенно при реализации аппаратного обеспечения. Например, имеющиеся биты могут быть распределены равномерно между аудиоканалами или могут быть распределены пропорционально среднему ОСМ или СК каждого канала.
В случае, когда целевая скорость бит выше на сумму локальных распределений бит, включая биты кода ВК и вспомогательной информации, стандартная процедура глобального управления битами будет постепенно уменьшать локальные распределения бит поддиапазона. Имеется ряд конкретных способов для уменьшения средней скорости бит. Прежде всего, скорости бит, которые были округлены наибольшей целочисленной функцией, могут быть восстановлены. Далее, один бит может быть изъят из поддиапазонов, имеющих наименьшие значения ОМШ. Кроме того, высокочастотные поддиапазоны могут быть выключены или может быть обеспечена возможность совместного кодирования частоты. Все стратегии уменьшения скорости бит следуют основному принципу постепенного плавного уменьшения разрешения кодирования с наименее агрессивно воспринимаемой стратегией, применяемой первой и наиболее агрессивной стратегией, используемой последней.
В случае, когда целевая скорость бит больше, чем сумма локальных распределений бит, включая биты кодов ВК и вспомогательной информации, стандартная процедура глобального управления битами будет постепенно и итеративно увеличивать локальное распределение бит поддиапазона для уменьшения общего минимального уровня шума восстановленного сигнала. Это может вызвать кодирование поддиапазонов, которым ранее были распределены нулевые биты. Издержки бит в «включаемых» поддиапазонах, таким образом, могут требоваться для отражения стоимости передачи любых коэффициентов прогнозатора, если разрешают режим прогнозирования (ΡΜΘΌΕ).
Стандартная процедура ГУБ может выбирать одну из трех различных схем для распределения оставшихся битов. Одним вариантом является использование подхода минимальной среднеквадратической ошибки, при котором перераспределяют все биты так, что результирующий минимальный уровень шума является приблизительно ровным. Это эквивалентно первоначальному блокированию психоакустического моделирования. Для достижения минимального уровня шума с минимальной среднеквадратической ошибкой график 160 среднеквадратических значений поддиапазонов, показанный на фиг. 18а переворачивают на 180°, как показано на фиг. 18Ь и «наполняют водой», пока не исчерпают все биты. Этот хорошо известный способ называется «наполнение водой», поскольку уровень искажения падает равномерно при увеличении числа распределенных битов. В показанном примере первый бит назначают в поддиапазон 1 , второй и третий биты назначают в поддиапазоны 1 и 2, биты с четвертого по седьмой назначают в поддиапазоны 1,2,4 и 7 и так далее. Альтернативно один бит может быть назначен в каждый поддиапазон, чтобы гарантировать, что каждый поддиапазон будет закодирован, а затем оставшиеся биты «заполняют водой».
Вторым и предпочтительным вариантом является распределение оставшихся битов в соответствии с подходом минимальной среднеквадратической ошибки и среднеквадратическим графиком, описанным выше. Эффектом этого способа является равномерное снижение минимального уровня шума 157, показанного на фиг. 1 7, с одновременной поддержкой формы, связанной с психоакустической маскировкой. Это обеспечивает хороший компромисс между психоакустическим искажением и искажением среднеквадратической ошибки.
Третьим подходом является распределение оставшихся битов с использованием подхода минимальной среднеквадратической ошибки, применяемого к графику разности между среднеквадратической и ОМШ значениями для поддиапазонов. Эффектом этого подхода является плавное преобразование формы минимального уровня шума из оптимальной психоакустической формы 157 в оптимальную (гладкую) форму 158 минимальной среднеквадратической ошибки, при увеличении скорости бит. В любой из этих схем, если ошибка кодирования в любом поддиапазоне падает ниже 0,5 самого младшего двоичного разряда относительно исходного ИКМ, то биты больше не распределяют в этот диапазон. Выборочно могут быть использованы фиксированные максимальные значения распределений бит поддиапазона для ограничения максимального числа битов, распределяемых в конкретный диапазон.
В системе кодирования, раскрытой выше, предполагалось что средняя скорость бит на выборку является фиксированной и распределение бит генерировали для максимизации достоверности восстановленного аудиосигнала. Альтернативно уровень искажения, среднеквадратический или воспринимаемый, может быть зафиксирован, а скорость бит может быть изменена для соответствия уровню искажения. В подходе минимальной среднеквадратической ошибки, среднеквадратический график просто «наполняют водой» до соответствия уровня искажения. Требуемую скорость бит изменяют на основе среднеквадратических уровней поддиапазонов. В психоакустическом подходе биты распределяют для удовлетворения индивидуальным значениям ОМШ. В результате скорость бит будет меняться на основе индивидуальных значений ОМШ и выигрышей прогнозирования. Этот тип распределения в настоящее время не используют, поскольку современные декодировщики работают при фиксированных скоростях. Однако, альтернативные системы доставки, например, асинхронной передачи данных или носитель с произвольным доступом к памяти могут сделать кодирование с переменной скоростью осуществимым в ближайшем будущем.
Квантование индексов распределения бит (ΑΒΙΤ).
Индексы распределения бит (ΑΒΠ) генерируют для каждого поддиапазона и каждого аудиоканала стандартной процедурой адаптивного распределения бит в процессе глобального управления битами. Назначением индексов ко33 дировщике является указание числа уровней 162, показанных на фиг. 10, которые необходимы для квантования разностного сигнала для получения субъективно оптимального минимального уровня шума восстановления в декодировщике звука. В декодировщике они указывают число уровней, необходимых для обратного квантования. Индексы генерируют для каждого буфера анализа, и их значения могут находиться в диапазоне от 0 до 27. Зависимость между значением индекса, числом уровней квантователя и приблизительным результирующим дифференциальным поддиапазоном представлены в таблице 3. Поскольку разностный сигнал нормализуют, размер шага 164 задают равным единице.
Таблица 3
Индекс ΑΒΙΤ N О Уровней Длина кода (биты) 8ΝρΚ (децибелы)
0 0 0 -
1 3 Переменная 8
2 5 Переменная 12
3 7(или 8) Переменная(или 3) 16
4 9 Переменная 19
5 13 Переменная 21
6 17 (или 16) Переменная(или 4) 24
7 25 Переменная 27
8 33 (или 32) Переменная(или 5) 30
9 65 (или 64) Переменная(или 6) 36
10 129 (или 128) Переменная (или 7) 42
11 256 8 48
12 512 9 54
13 1024 10 60
14 2048 11 66
15 4096 12 72
16 8192 13 78
17 16384 14 84
18 32768 15 90
19 65536 16 96
20 131072 17 102
21 262144 18 108
22 524268 19 114
23 1048576 20 120
24 2097152 21 126
25 4194304 22 132
26 8388608 23 138
27 16777216 24 144
Индексы распределения бит (ΑΒΙΤ) передают в декодировщик непосредственно либо с использованием 4-битовых целочисленных кодовых слов без знака, 5-битовых целочисленных кодовых слов без знака, либо с использованием 12-уровневой таблицы энтропии. Обычно кодирование энтропии применяют при низкой скорости бит для сохранения битов. Способ кодирования ΑΒΙΤ устанавливают управлением режимом в кодировщике и передают в декодировщик. Кодировщик энтропии отображает 166 индексы ΑΒΙΤ в конкретную книгу кодов, идентифицируемую индексом ΒΗϋΡΡ и специальным кодом νΑΒΙΤ в книге кодов, с использованием процесса, показанного на фиг. 1 2 с 1 2уровневыми таблицами ΑΒΙΤ.
Г лобальное управление скоростью бит.
Поскольку как вспомогательная информация, так и дифференциальные выборки поддиапазона могут быть выборочно кодированы с использованием книг кодов переменной длины энтропии, необходимо применить некоторый механизм для регулировки результирующей скорости бит кодировщика, когда сжатый поток бит передают при фиксированной скорости. Поскольку обычно не желательно модифицировать вспомогательную информацию, вычисленную однажды, регулировки скорости бит лучше всего достигают итеративным изменением процесса квантования дифференциальной выборки поддиапазона внутри кодировщика АДИКМ до соответствия ограничению скорости.
В описываемой системе система 178 глобального управления скоростью (ГУС) на фиг. 1 0 регулирует скорость бит, которую получают в результате процесса отображения кодов уровней квантователя в таблицу энтропии, изменением статистического распределения значений кода уровня. Предполагается, что все таблицы энтропии имеют одинаковую тенденцию больших длин кода для больших значений кода уровня. В этом случае средняя скорость бит уменьшается, когда вероятность малого значения кода уровней увеличивается и наоборот. В процессе квантования АДИКМ (или АИКМ), величина масштабного коэффициента определяет распределение или использование значений кода уровня. Например, когда величина масштабного коэффициента увеличивается, дифференциальные выборки квантуют более низкими уровнями, следовательно, значения кода постепенно станут меньше. Это, в свою очередь, приводит к меньшей длине кодового слова энтропии и более низкой скорости бит.
Недостатком этого способа является то, что при увеличении величины масштабного коэффициента шум восстановления в выборках поддиапазона также повышается на тот же порядок. Однако, на практике регулировка масштабных коэффициентов обычно не более, чем 1-3 децибел. Если требуется большая регулировка, то предпочтительно уменьшить общее распределение бит, поскольку имеет место вероятность появления слышимого шума квантования в поддиапазонах, которые используют неровный масштабный коэффициент.
Для регулировки распределения бит энтропии, закодированной АДИКМ, выборки предыстории прогнозатора для каждого поддиапазона запоминают во временном буферном регистре, пока повторяют цикл кодирования АДИКМ. Далее все буферы выборки поддиапазона кодируют полным процессом АДИКМ с использованием коэффициентов А прогнозирования, полученных из анализа методом линейного прогнозирования поддиапазона вместе с масштабными коэффициентами, среднеквадратическими (или максимальными), распределениями бит квантователя (ΑΒΙΤ), режимами импульсной помехи ΤΜΟΌΕ и режимами прогнозирования ΡΜΟΌΕ, полученными из оцененного разностного сигнала. Результирующие коды уровня квантователя буферизируют и отображают в книгу кодов переменной длины энтропии, которая показывает наименьшее потребление бит, используя индекс распределения бит для определения размеров книги кодов.
Система ГУС затем анализирует число битов, использованных для каждого поддиапазона с использованием того же индекса распределения бит из всех индексов. Например, когда АВ1Т=1, вычисление распределения бит в глобальном управлении битами допускает среднюю скорость 1,4 на выборку поддиапазона (т.е., средняя скорость для книги кодов энтропии при допущении оптимального распределения амплитуды уровня кода). Если полное потребление бит всех диапазонов для каждого АВ1Т=1 больше, чем 1,4/ (полное число выборок поддиапазона), то масштабные коэффициенты могут быть увеличены во всех этих поддиапазонах для уменьшения скорости бит. Решение регулировать масштабные коэффициенты поддиапазона предпочтительно откладывают, пока не выбраны все скорости индекса ΑΒΙΤ. В результате индексы со скоростями бит ниже, чем предполагаемые в процессе распределения бит могут быть компенсированы индексами со скоростями бит выше этого уровня. Эта оценка может также быть расширена для покрытия всех подходящих аудиоканалов.
Рекомендуемой процедурой уменьшения общей скорости бит является выполнение с самой нижней скорости бит индекса ΑΒΙΤ, которая превышает порог, увеличения масштабных коэффициентов в каждом из поддиапазонов, которые имеют это распределение бит. Действительное потребление бит уменьшается на число бит, которые в этих поддиапазонах были выше номинальной скорости для этого распределения. Если модифицированное потребление бит превышает допустимый максимум, тогда масштабные коэффициенты для следующего самого высокого индекса ΑΒΙΤ, для которого потребление бит превышает номинал, увеличивают. Этот процесс продолжают до тех пор, пока модифицированное потребление бит не станет ниже максимума.
Если это достигнуто, данные предыстории загружают в прогнозатор и процесс 72 кодирования АДИКМ повторяют для тех поддиапазонов, в которых были модифицированы масштабные коэффициенты. После этого коды уровней опять отображают в книги кодов с наиболее оптимальной энтропией и потребление бит вычисляют повторно. Если любое из потреблений бит превышает номинальные скорости, то масштабные коэффициенты дополнительно увеличивают и цикл повторяют.
Модификация масштабных коэффициентов может быть выполнена двумя способами. Первый состоит в передаче в декодировщик коэффициента регулировки для каждого индекса ΑΒΙΤ. Например, 2-битовое слово может передавать сигнал регулировки в диапазоне, например, 0, 1 , 2 и 3 децибела. Поскольку тот же коэффициент регулировки используют для всех поддиапазонов, которые используют индекс ΑΒΙΤ и только индексы 1 -1 0 могут использовать кодирование энтропии, максимальное число коэффициентов регулировки, которые необходимо передавать для всех поддиапазонов, равно 1 0. Альтернативно, масштабный коэффициент может быть изменен в каждом поддиапазоне при выборе более высокого уровня квантования. Однако, поскольку квантователи масштабного коэффициента имеют размеры шагов 1,25 и 2,25 децибел, соответственно, регулировка масштабного коэффициента ограничена этими шагами. Более того, при использовании этого способа необходимо повторно вычислять дифференциальное кодирование масштабных коэффициентов и результирующего потребления бит, если разрешено кодирование энтропии.
Вообще говоря, та же процедура может быть использована для увеличения скорости бит, т.е. когда скорость бит ниже требуемой. В этом случае масштабные коэффициенты уменьшали бы, чтобы дифференциальные выборки больше использовали внешние уровни квантователя и, следовательно, использовали более длинные кодовые слова в таблице энтропии.
Если потребление бит для индексов распределения бит не может быть уменьшено в пределах разумного числа итераций, или в случае, когда передают коэффициенты регулировки масштабного коэффициента, число шагов регулировки достигло предела, тогда возможны два средства. Первое, масштабные коэффициенты поддиапазонов, которые находятся в пределах номинальной скорости, могут быть увеличены, таким образом снижая общую скорость бит. Альтернативно весь процесс кодирования АДИКМ может быть прекращен и повторно вычислены адаптивные распределения бит по диапазонам, с использованием меньшего количества.
Формат потока данных.
Мультиплексор 32, показанный на фиг. 10 упаковывает данные для каждого канала, а затем мультиплексирует упакованные данные для каждого канала в выходной блок для формирования потока 16 данных. Способ упаковки и мультиплексирования данных, т.е. формат 186 блока, показанный на фиг. 19, разработан так, что аудиокодировщик может быть использован в широком диапазоне применений и может быть расширен до более высоких частот дискретизации, количество данных в каждом блоке ограничивают, проигрывание может быть инициировано на каждом подподблоке независимо, для уменьшения времени ожидания, и ошибки декодирование снижаются.
Как показано, один блок 186 (4096 выборок ИКМ/канал) определяет границы потока данных, в которых находится достаточно информации для того, чтобы правильно декодировать блок звука, и состоит из 4 подблоков 188 (1024 выборок ИКМ/канал), каждый из которых, в свою очередь, состоит из 4 подподблоков 190 (256 выборок ИКМ/канал). Слово 192 синхронизации блока помещают в начале каждого аудио блока. Информация 194 заголовка блока в первую очередь дает информацию относительно структуры блока 186, конфигурацию кодировщика, который генерирует поток и различные дополнительные операционные особенности, например, управление вложенным динамическим диапазоном и временной код. Дополнительная информация 196 заголовка сообщает декодировщику, требуется ли смешение сигнала, если была сделана компенсация динамического диапазона и если вспомогательные байты данных включают в поток данных. Заголовки 198 аудиокодирования указывают компоновку упаковки и форматы кодирования, используемые в кодировщике для сборки «вспомогательной информации кодирования», т.е. распределение бит, масштабные коэффициенты, значения ΡΜΘΌΕ, значения ΤΜΘΌΕ, книги кодов и т.д. Остаток блока составлен из подблоков последовательных подблоков 188.
Каждый подблок начинается с вспомогательной информации 200 аудиокодирования, которая передает информацию относительно числа ключевых систем кодирования, используемых для сжатия звука в декодировщик. Они содержат выявление импульсной помехи, прогнозирующее кодирование, адаптивное распределение бит, высокочастотное векторное квантование, кодирование интенсивности и адаптивное масштабирование. Многие из этих данных распаковывают из потока данных с использованием вышеупомянутой информации заголовка аудиокодирования. Массив 202 высокочастотного кода ВК состоит из 10-битовых индексов на высокочастотный поддиапазон, указываемый индексами УЦЗИВ. Массив 204 низкочастотных эффектов является дополнительным и представляет данные очень низкой частоты, которые могут быть использованы для запуска, например, динамика низкого тона.
Аудиомассив 206 декодируют с использованием обратного квантователя Хафмана/фиксированного обратного квантователя и разделяют на ряд подподблоков (88С), причем каждый декодируют до 256 выборок ИКМ на аудиоканал. Массив 208 повышенной дискретизации аудиоприсутствует только, если частота выборки больше, чем 48 кГц. Для того, чтобы оставаться совместимыми, декодировщики, которые не могут работать на частотах выборки больше, чем 48 кГц, должны пропускать этот массив аудиоданных. Распакованную синхронизацию (ΌδΥΝΟ) 210 используют для проверки конца позиции подблока в аудиоблоке. Если позиция не проверяется, звук, декодированный в подблоке, объявляют ненадежным. В результате этот блок приглушают либо повторяют предыдущий блок.
Декодировщик поддиапазона.
Фиг. 20 представляет блок схему декодировщика 1 8 выборки поддиапазона. Декодировщик достаточно прост по сравнению с кодировщиком и не предполагает выполнения вычислений, которые существенно важны в качестве восстанавливаемого звука, например распределения бит. После синхронизации распаковщик 40 распаковывает поток 1 6 сжатых аудиоданных, обнаруживает и, если необходимо, корректирует ошибки, происходящие при передаче и демультиплексирует данные в отдельные аудиоканалы. Разностные сигналы поддиапазона повторно квантуют в сигналы ИКМ и каждый аудиоканал фильтруют для преобразования сигнала назад в интервал времени.
Прием аудиоблока и распаковка заголовков.
Закодированный поток данных упаковывают (или разбивают на блоки) в кодировщике, он содержит в каждом блоке дополнительные данные для синхронизации декодировщика, выявления и коррекции ошибки, флаги аудиокодирования и вспомогательную информацию кодирования, а также сами фактические аудиокоды. Распаковщик обнаруживает слово синхронизации и извлекает размер блока ΡδΙΖΕ.
Закодированный поток бит состоит из последовательных аудиоблоков, причем каждый начинается с 32-битового (Ох7ГГе8001) слова синхронизации (δΥΝΟ). Физический размер аудиоблока ΡδΙΖΕ извлекают из байтов, следующих после слова синхронизации. Это позволяет программисту задать таймер «конца блока» для уменьшения издержек программного обеспечения. Затем извлекают параметр ΝΒΓ-кк (число блоков), который позволяет декодировщику вычислить размер аудиоокна (32 (ΝΒΠ1<5+1)). Это сообщает декодировщику, какую дополнительную информацию извлекать и сколько восстановленных выборок генерировать.
Как только приняты байты заголовка блока (купс, йуре, кигр, пЫ1кк, Пй/с. атобе, кГгед, га1с. Ш1х1, бу η Г, буиср О те, аихси?, 1ГГ, Ьйад), достоверность первых 12 байтов можно проверить с использованием контрольных байтов Рида Соломона НСКС. Они будут корректировать 1 ошибочный байт из 1 4 байтов или 2 ошибочных данных флага. После того, как завершена проверка ошибок, информацию заголовка используют для корректировки флагов декодировщика.
Заголовки (ГШк, уетиит, сЫкр рстг, ипкрес), следующие после НСКС и до дополнительной информации могут быть извлечены и использованы для корректировки флагов деко39 дировщика. Поскольку эта информация не будет изменяться от блока к блоку, большинство схем мажоритарной выборки могут быть использованы для компенсации ошибок бит. Дополнительные данные заголовка (Дте8, тсоеГГ, ДсоеГГ, аихД, осгс) извлекают в соответствии с заголовками пй.хсЕ ДупГ, тте и аихсп!. Дополнительные данные могут быть проверены с использованием дополнительных байтов Рида Соломона НСКС. Заголовки блока аудиокодирования (киЬГк, 8иЬ8, сЙ8, уд8иЬ, )отх, ДшГГ, 8Йи£Г, ЫшГГ, 8е15, 8е17, 8е19, 8е113, 8е117, 8е125, 8е133, 8е165, 8е1129, айсгс) передают один раз в каждом блоке. Они могут быть проверены с использованием контрольных аудиобайтов Рида Соломона (контроля по избыточности) (ЛНСКС). Большинство заголовков повторяют для каждого аудиоканала, как определено СНЗ.
Распаковка вспомогательной информации кодирования подблока
Блок аудиокодирования разделяют на ряд подблоков (ЗИВРЗ). Вся необходимая вспомогательная информация (ртоЬе, руд, !тоДе, 8са1е8, аЬЙ8, ЬГгед) включается для того, чтобы правильно декодировать каждый подблок аудиосигнала без ссылки на любые другие подблоки. Каждый последовательный подблок декодируют сначала распаковкой его вспомогательной информации.
-битовый флаг режима прогнозирования (ΡΜΟΌΕ) передают для каждого активного поддиапазона и по всем аудиоканалам. Флаги ΡΜΟΌΕ справедливы для текущего подблока. ΡΜΟΌΕ=1 означает, что коэффициенты прогнозатора не включают в аудиоблок для этого поддиапазона. В этом случае коэффициенты прогнозатора в этой полосе устанавливают в ноль в течение длительности подблока. ΡΜΟΌΕ=1 означает, что вспомогательная информация содержит коэффициенты прогнозатора для этого поддиапазона. В этом случае коэффициенты прогнозатора извлекают и устанавливают в прогнозатор на продолжительность подблока.
Для каждого ΡΜΟΌΕ=1 в массиве ртоДе соответствующий индекс адреса УО (ВК) загружают в массив Ρνρ. Эти индексы являются фиксированными 12-битовыми целочисленными словами без знака и 4 коэффициента прогнозирования извлекают из поисковой таблицы отображением 1 2-битовой целочисленной в векторную таблицу 266.
Индексы распределения бит (АВ1Т) указывают число уровней в обратном квантователе, который будет преобразовывать аудиокоды поддиапазона назад в абсолютные значения. Формат распаковки отличается для индексов АВ1Т в каждом аудиоканале, в зависимости от индекса ВНИРР и специфического кода 256 УАВГГ.
Вспомогательную информацию режима импульсной помехи (ΤΜΟΌΕ) используют для указания позиции импульсных помех в каждом поддиапазоне относительно подблока. Каждый подблок разделяют на 1 -4 подподблока. В терминах выборок поддиапазона каждый подподблок состоит из 8 выборок. Максимальный размер подблока равен 32 выборкам поддиапазона. Если импульсная помеха появляется в первом подподблоке, тогда 1тоДе=0. Импульсная помеха указывается во втором подблоке, когда 1тоДе= 1 и т.д. Для управления искажением типа импульсной помехи, как например, предэхо, два масштабных коэффициента передают для поддиапазонов подблока, где ΤΜΟΌΕ больше, чем 0. Индексы ВНИРР, извлекаемые из аудиозаголовков, определяют способ, требуемый для декодирования значений ΤΜΘΌΕ. Когда ВНИРР=3, значения ΤΜΘΌΕ распаковывают как 2-битовые целочисленные без знака.
Индексы масштабных коэффициентов передают, чтобы обеспечить правильное масштабирование аудиокодов поддиапазона внутри каждого подблока. Если ΤΜΟΌΕ равно нулю, тогда передают один масштабный коэффициент. Если ΤΜΟΌΕ больше, чем ноль для любого поддиапазона, тогда два масштабных коэффициента передают вместе. Индексы 240 ЗНИРР, извлекаемые из аудиозаголовков, определяют способ, требуемый для декодирования ЗСАБРЗ для каждого отдельного аудиоканала. Индексы νΌΡΜδ^,, определяют значение среднеквадратического масштабного коэффициента.
В определенных режимах индексы ЗСАБРЗ распаковывают с использованием выбора из пяти 129-уровневых со знаком обратных квантователей Хафмана. Однако результирующие обратно квантованные индексы дифференциально кодируют и преобразуют в абсолютное значение следующим образом:
АВЗ_ЗСА^Ε (п+1) = ЗСА1.НЗ (п) ЗСАБРЗ (п+1) , где п - п-ый дифференциальный масштабный коэффициент в аудиоканале, начиная с первого поддиапазона.
В режимах аудиокодирования с низкой скоростью бит аудиокодировщик непосредственно использует векторное квантование для эффективного кодирования аудиовыборок высокочастотного поддиапазона. Дифференциальное кодирование не используют в этих поддиапазонах, и все массивы, относящиеся к обычным процессам АДИКМ, должны храниться в состоянии «0». Первый поддиапазон, который кодируют с использованием ВК, указывают с помощью УЦЗИВ, и все поддиапазоны до ЗИВЗ кодируют таким же образом.
Высокочастотные индексы (НРИБЦ) распаковывают 248 как фиксированные 10-битовые целые числа без знака. 32 выборки, требуемые для каждого подблока поддиапазона, извлекают из Θ4 дробной двоичной поисковой таблицы, подачей подходящих индексов. Это повторяют для каждого канала, в котором режим высокочастотного ВК является активным.
Коэффициент прореживания для эффектов каналов всегда равен Х128. Число 8-битовых выборок эффекта, присутствующих в ЬРЕ (низкочастотный эффект), определен выражением 88С· 2, когда Р8С=0 или (88С+1) · 2, когда Р8С не равно нулю. Дополнительный 7-битовый масштабный коэффициент (целочисленный без знака) также включают в конце массива ЬРЕ, который преобразуют в среднеквадратическое значение с использованием 7-битовой поисковой таблицы.
Распаковка массива аудиокодов подподблока.
Процессом извлечения аудиокодов поддиапазона управляют с помощью индексов ΑΒΙΤ и в случае, когда АВ1Т<11, также индексами 8ЕЬ. Аудиокоды форматируют либо с использованием кодов Хафмана переменной длины, либо фиксированных линейных кодов. Вообще, индексы АВ1Т=10 или меньше предполагают коды Хафмана переменной длины, которые выбирают кодами УОБ (п) 258, тогда как ΑΒΙΤ выше 10 всегда означают фиксированные коды. Все квантователи имеют среднешаговую равномерную характеристику. Для квантователей с фиксированным кодом (Υ2) наиболее отрицательный уровень удаляют. Аудиокоды упаковывают в подподблоки, каждый представляющий максимум 8 выборок поддиапазона, и эти подподблоки повторяют до четырех раз в текущем подблоке.
Если флаг частоты выборки указывает частоты выше, чем 48 кГц, тогда массив избыточных аудиоданных присутствует в аудиоблоке. Первые два байта в этом массиве будут указывать размер байта избыточных аудиоданных. Кроме того, частота выборки аппаратуры декодера должна быть установлена для работы при частоте выборки 8РКЕО/2 или 8РКЕО/4, в зависимости от высокочастотной частоты выборки.
Распаковка проверки синхронизации.
Данные распаковки слова проверки синхронизации Ό8ΥΝ С=0хГГГГ выявляют в конце каждого подблока, чтобы дать возможность проверить целостность распаковки. Использование переменных кодовых слов в вспомогательной информации и аудиокодах, что имеет место для низких скоростей аудиобит, может приводить к несовмещению распаковки, если заголовки, либо вспомогательная информация, либо аудиомассивы испорчены ошибками бит. Если указатель распаковки не указывает на начало Ό8ΥΝΟ то можно предположить, что предыдущий аудиоподблок является ненадежным.
Когда вспомогательная информация и аудиоданные распакованы, декодировщик восстанавливает многоканальный аудиосигнал по одному подблоку. На фиг. 20 представлена часть декодировщика основной полосы частот для одного поддиапазона в одном канале.
Восстановление среднеквадратических масштабных коэффициентов.
Декодировщик восстанавливает среднеквадратические масштабные коэффициенты (8САЬЕ8) для алгоритмов АДИКМ, ВК и СКЧ. В частности, индексы УТМОИЕ и ТНИРР обратно отображены для идентификации режима переходного процесса (ТМОИЕ) для текущего подблока. После чего индекс 8НИРР, коды УИК.М87)|, и ТМОИЕ обратно отображают для восстановления дифференциального среднеквадратического кода. Дифференциальный среднеквадратический код обратно дифференциально кодируют 242 для выбора среднеквадратического кода, который затем обратно квантуют 242 для создания среднеквадратического масштабного коэффициента.
Обратное квантование высокочастотных векторов.
Декодировщик обратно квантует высокочастотные векторы для восстановления аудиосигналов поддиапазона. В частности, выделенные высокочастотные выборки (НРКЕО), которые являются 8-битовыми дробными (04) двоичными числами со знаком, идентифицируемыми началом У О поддиапазона (УО8иВ8) отображают в обратную поисковую таблицу 248УО. Выбираемое значение таблицы обратно квантуют 250 и масштабируют 252 среднеквадратическим масштабным коэффициентом.
Обратное квантование аудиокодов.
Перед выходом в цикл АДИКМ аудиокоды обратно квантуют и масштабируют для создания восстановленных разностных выборок поддиапазона. Обратное квантование обеспечивают обратным отображением индексов УАВ1Т и ВНИРР для спецификации индекса АВ1Т, который определяет размер шага и число уровней квантования, и обратным отображением индекса 8ЕЬ и аудиокодов УОНп), которые создают коды уровня квантования ОИ(п). После чего кодовые слова ОБ/п) отображают в поисковую таблицу 260 обратного квантователя, специфицируемую индексами АВ1Т и 8ЕЬ. Несмотря на то, что коды упорядочивают с помощью АВ1Т, каждый отдельный аудиоканал будет иметь отдельный спецификатор 8ЕЬ. Процесс поиска выполняют для нахождения номера со знаком уровня квантователя, который может быть преобразован в среднеквадратическую величину умножением на размер шага квантователя. Значения среднеквадратической величины затем преобразовывают в полные разностные выборки умножением на обозначенный среднеквадратический масштабный коэффициент (8САЕЕ8) 262.
1. рЬ[п] = 1/0[собе[п]], где 1О - поисковая таблица обратного квантователя
2. Υ|π| = ОЕ|п| · 81ер8|/е|аЫ15|
3. Кб[п] = Υ|π| · 8са1е_Гас!ог, где Кб равен восстановленным разностным выборкам.
Обратная АДИКМ
Процесс АДИКМ декодирования выполняют для каждой разностной выборки поддиапазона следующим образом;
1. Загружают коэффициенты прогнозирования из поисковой таблицы обратного ВК.
2. Генерируют выборку прогнозирования свертыванием текущих коэффициентов прогнозатора с предыдущими 4 восстановленными выборками поддиапазона, хранимыми в массиве 268 предыстории прогнозаторов. Р[п]=8ит(сое££ [ί] · К[п - ί] для ί=1, 4, где п=текущему периоду выборки.
3. Ирибавляют выборку прогнозирования к восстановленной разностной выборке для формирования восстановленной выборки 270 поддиапазона. К[п]=КД[п]+Р[п].
4. Корректируют предысторию прогнозатора, то есть копируют текущую восстановленную выборку поддиапазона вверху списка предыстории К[п-1]=К[п - ί + 1] для 1=4,1.
В случае, когда ΡΜΘΌΕ=0, коэффициенты прогнозатора равны нулю, выборка прогнозирования - нулю, а восстановленная выборка поддиапазона равна дифференциальной выборке поддиапазона. Хотя в этом случае не требуется вычисление прогнозирования, существенно, что предысторию сохраняют скорректированной в случае, если ΡΜΘΌΕ должна стать активной в будущих подблоках. Кроме того, если НРЬАС активен в текущем аудиоблоке, предыстория прогнозатора должна быть очищена перед декодированием самого первого подподблока в блоке. Иредыстория должна быть скорректирована, как обычно, от этой точки.
В случае поддиапазонов высокочастотного ВК или, когда поддиапазоны не выбирают (т.е. выше предела 8ИВ§), предыстория должна оставаться очищенной до того времени, пока прогнозатор поддиапазона станет активным.
Выбор управления декодированием АДИКМ, ВК и СК4.
Иервый «переключатель» управляет выбором либо выхода АДИКМ, либо выхода ВК. Индекс УЦЗиВЗ идентифицирует начальный поддиапазон для кодирования ВК. Иоэтому, если текущий поддиапазон ниже, чем УЦ§ИВ§, переключатель выбирает выход АДИКМ. Иначе он выбирает выход ВК. Второй «переключатель» 278 управляет выбором либо выхода непосредственного канала, либо выходом кодирования СК4. Индекс 1ΌΙΝΧ идентифицирует, какие каналы совмещают и в каком канале генерируют восстановленный сигнал. Восстановленный сигнал СК4 образует источник интенсивности для входов СК4 в других каналах. Иоэтому, если текущий поддиапазон является частью СК4 и не назначенным каналом, тогда переключатель выбирает выход СК4. Обычно переключатель выбирает выход канала.
Дешифрация.
Режим аудиокодирования для потока данных указывает значение ΑΜΘΌΕ. Декодированные аудиоканалы могут быть перенаправлены для согласования с физическим устройством выходного канала в аппаратуре 280 декодировщика.
Данные управления динамическим диапазоном
Коэффициенты динамического диапазона ΌΟΘΕΡΡ могут быть выборочно вставлены в аудиоблок на стадии 282 кодирования. Целью этой особенности является обеспечение возможности удобного сжатия аудиодинамического диапазона на выходе декодировщика. Сжатие динамического диапазона особенно важно при условиях прослушивания, где высокие уровни окружающего шума не дают возможности различить сигналы низкого уровня без риска повредить динамики во время прохождений громких сигналов. Эта проблема дополнительно осложняется возрастающим использованием 20битовых ИКМ аудиозаписей, которые имеют динамические высокие диапазоны 110 децибел.
В зависимости от размера кадра блока (ΝΒΡΚδ) передают один, два, либо четыре коэффициента на аудиоканал для любого режима кодирования (ΌΥΝΡ). Если передают один коэффициент, его используют для всего блока. Ири двух коэффициентах первый используют для первой половины блока, а второй - для второй половины блока. Четыре коэффициента распределяют на каждый квадрант блока. Более высокое временное разрешение возможно при локальной интерполяции между передаваемыми значениями.
Каждый коэффициент является 8-битовым дробным Ц2 двоичным числом со знаком и представляет логарифмическое значение коэффициента передачи, как показано в таблице, давая диапазон +/-31,75 децибел при шагах 0,25 децибел. Коэффициенты упорядочивают по номеру канала. На сжатие динамического диапазона воздействуют умножением декодированных аудиовыборок на линейные коэффициенты.
Степень сжатия может быть изменена подходящей регулировкой значений коэффициентов в декодировщике или может быть полностью выключена игнорированием коэффициентов.
32-полосная группа фильтров интерполяции.
32-Иолосная группа 44 фильтров интерполяции преобразует 32 поддиапазона для каждого аудиоканала в один ИКМ сигнал временного интервала. Коэффициенты не полного восстановления (512 -выводные конечной импульсной характеристики фильтры) используют, когда Р1ЬТ§=1. Обычно косинусные коэффициенты модуляции вычисляют заранее и хранят в постоянной памяти. Ироцедура интерполяции может быть расширена для восстановления больших блоков данных для уменьшения непроизводительных издержек цикла. Однако в случае конечных блоков минимальное разрешение, которое может требоваться, равно 32 выборкам ИКМ. Алгоритм интерполяции является следующим: создают косинусные коэффициенты модуляции, считывают 32 новых выборки поддиапазона в массив ΧΙΝ, умножают на косинусные коэффициенты модуляции и создают временные массивы §ИМ и ΌΙΡΡ, сохраняют предысторию, умножают на коэффициенты фильтра, создают 32 выходные выборки ИКМ, корректируют рабочие массивы и выводят 32 новые выборки ИКМ.
В зависимости от скорости бит и действующей схемы кодирования, поток бит будет специфицировать коэффициенты интерполяции блока фильтра (Р1ЬТ§) неполного, либо полного восстановления. Поскольку группы фильтров прореживания декодировщика рассчитывают с 40-битовой точностью с плавающей запятой, способность декодировщика достигнуть максимальной теоретической точности восстановления будет зависеть от исходной длины слова ИКМ и точности ферритовой памяти, используемой для вычисления свёрток и способа, которым масштабируют операции.
Интерполяция низкочастотных эффектов ИКМ.
Аудиоданные, связанные с каналом низкочастотных эффектов, не зависят от основных аудиоканалов. Этот канал кодируют с использованием процесса 8-битовой АДИКМ на Х128 прореженном (полоса частот 120 гц) входе 20битовой ИКМ. Аудиоданные прореженных эффектов согласованы во времени с аудиоданными текущего подблока в основных аудиоканалах. Следовательно, поскольку задержка на 32полосной группе фильтров интерполяции равна 256 выборкам (512 отводов), должны быть приняты меры предосторожности, чтобы гарантировать, что интерполированный канал низкочастотного эффекта также согласуется с остальными аудиоканалами перед выходом. Компенсация не требуется, если фильтр (конечная импульсная характеристика) интерполяции эффектов является также 512 отводным. Алгоритм ЬРТ (низкочастотного преобразования) использования 512-отводного фильтра интерполяции 128Х (отводной конечной импульсной характеристики) следующий: отображают 7-битовый масштабный коэффициент в среднеквадратический, умножают на размер шага 7-битового квантователя, генерируют значения подвыборок из нормализованных значений и интерполируют на 128, используя фильтр нижних частот, такой как задан для каждой подвыборки.
Аппаратная реализация.
На фигурах 21 и 22 представлена основная функциональная структура аппаратной реализации шестиканальной версии кодировщика и декодировщика для работы с частотами выборки 32, 44,1 и 48 кГц. Как представлено на фиг, 21, восемь аналоговых устройств ΆΌδΡ21020, микросхем 296 40-битового процессора цифрового сигнала (ПЦС) с плавающей запятой используют для реализации шестиканального цифрового аудиокодировщика 298. Шесть ПЦС используют для кодирования каждого из каналов, в то время как седьмой и восьмой используют для реализации функций глобального распределения бит, управления и форматера потока данных и кодирования ошибки, соответственно. Каждую ΆΌδΡ21020 тактируют с 33 мгц, она использует внешнюю 48 бит Х 32 К программную память с произвольной выборкой (1111В) 300, 40 бит Х 32 К память данных с произвольной выборкой (статистическая ППВ) 302 для выполнения алгоритмов. В случае кодировщиков 8 бит Х 512 К стираемую программируемую постоянную память (СППП) 304 также используют для хранения фиксированных постоянных величин, например, книги кодов энтропии переменной длины. Форматирование потока данных использует микросхему 306 контроля по избыточности СКС Рида Соломона для облегчения обнаружения ошибок и защиты от ошибок в декодировщике. Связь между процессорами ЦС кодировщика и глобального распределения бит и управления реализуется двухпортовой статической ППВ 308.
Осуществляют процесс кодирования следующим образом. 2-канальный поток 310 цифровых аудиоданных ИКМ извлекают на выходе каждого из трех цифровых аудиоприемников с (ПАЭ) переключением аудиоэмуляции (ВЕС) вещания европейского союза. Первый канал каждой пары направляют в канал 1 , 3 и 5 процессоров ЦС кодировщика, соответственно, в то время как второй канал каждой пары направляют в канал 2, 4 и 6, соответственно. Выборки ИКМ считывают в процессоры ЦС преобразованием последовательных слов ИКМ в параллельные (посл./парал.). Каждый кодировщик накапливает блок выборок ИКМ и продолжает кодировать данные блока, как описано ранее. Информацию, относящуюся к оценочному разностному сигналу (еб(п)) и выборкам поддиапазона (ч(п)) для каждого канала, передают в ПЦС глобального распределения бит и управления через двухпортовую ППВ. Стратегии распределения бит для каждого кодировщика затем считывают таким же образом. Если процесс кодирования завершен, закодированные данные и вспомогательную информацию для шести каналов передают в ПЦС форматера потока данных через ПЦС глобального распределения бит и управления. На этой стадии контрольные байты СКС генерируют выборочно и добавляют к закодированным данным с целью обеспечения защиты от ошибок в декодировщике. Наконец, весь пакет 16 данных собирают и выводят.
Аппаратурная реализация шестиканального декодировщика описана на фиг. 22. Одно аналоговое устройство Α08Ρ21020, микросхему 324 40-битового процессора цифрового сигнала (ПЦС) с плавающей запятой, используют для реализации шестиканального цифрового аудиодекодировщика. ЛИ§Р21020 тактируют с 33 мгц, оно использует внешнюю 48 бит Х 32 К программную память с произвольной выборкой (ППВ) 326, 40 бит Х 32 К память данных с произвольной выборкой (статистическая ППВ) 328 для выполнения алгоритмов декодирования. Дополнительную 8 бит Х 512 К стираемую программируемую постоянную память (СППП) 330 также используют для хранения фиксированных постоянных величин, например, книги кодов энтропии и вектора прогнозируемых коэффициентов переменной длины.
Поток процесса кодирования является следующим. Поток 1 6 сжатых данных вводят в ПЦС через последовательно-параллельный преобразователь (посл./парал.) 332. Данные распаковывают и декодируют, как описано ранее. Выборки поддиапазона восстанавливают в единый поток 22 данных ИКМ для каждого канала и выводят на микросхемы 334 цифрового аудиопередатчика с переключением аудиоэмуляции/вещания европейского союза через три параллельно-последовательных преобразователя (парал./посл.) 335.
Несмотря на то, что показано и описано несколько конкретных вариантов осуществления изобретения, многочисленные изменения и альтернативные варианты осуществления очевидны для специалистов в данной области техники. Например, при увеличении скорости процессоров и уменьшении стоимости памяти, частоты выборки, скорости передачи и размер буфера, наиболее вероятно, увеличатся. Такие изменения и альтернативные варианты осуществления могут быть выполнены без выхода за рамки объема и сущности изобретения, которые определены в прилагаемой формуле изобретения.

Claims (10)

  1. ФОРМУЛА ИЗОБРЕТЕНИЯ
    1 . Многоканальный аудиокодировщик, содержащий:
    устройство захвата блока, которое подает аудиокадр в каждый канал многоканального аудиосигнала, дискретизированного с частотой выборки, для создания соответствующей последовательности аудиоблоков, множество фильтров, которые разделяют аудиоблоки каналов на соответствующие множества частотных поддиапазонов относительно частотного диапазона основной полосы частот, причем каждый из упомянутых частотных поддиапазонов содержит последовательность блоков поддиапазона, которые имеют, по меньшей мере, один подблок аудиоданных на блок поддиапазона, множество кодировщиков поддиапазона, которые кодируют аудиоданные в соответствующих частотных поддиапазонах по одному подблоку в закодированные сигналы поддиапазона, мультиплексор, который упаковывает и мультиплексирует закодированные сигналы поддиапазона в выходной блок для каждого последовательного блока данных, таким образом формируя поток данных со скоростью передачи, и контроллер, который задает размер аудиокадра на основе частоты выборки и скорости передачи так, что размер упомянутых выходных блоков ограничен, чтобы находиться в требуемом диапазоне.
  2. 2. Многоканальный аудиокодировщик по п.1 , отличающийся тем, что контроллер задает размер аудиокадра как наибольшее кратное двум, которое меньше, чем (Ргаше к/е) · ΡΜΐηρ · (-), Т А га1е где Ргаше δί/е - максимальный размер выходного блока, Р8атр - частота выборки, а Т|а1е - скорость передачи.
  3. 3. Многоканальный аудиокодировщик по п.1 , отличающийся тем, что многоканальный аудиосигнал кодируют с целевой скоростью бит, а кодировщики поддиапазона содержат прогнозирующие кодировщики, причем сам многоканальный аудиокодировщик содержит глобальный диспетчер бит, который вычисляет психоакустическое отношение сигнала к маске и оценивает выигрыш прогнозирования Рда1и для каждого подблока, вычисляет отношения маски к шуму при уменьшении значений отношения сигнала к шуму на соответствующие части связанных с ними прогнозируемых коэффициентов передачи, распределяет скорость бит относительно всех поддиапазонов и регулирует отдельные распределения так, что фактическая скорость бит приблизительно равна целевой скорости бит.
  4. 4. Многоканальный аудиокодировщик по п. 1 или 3, отличающийся тем, что кодировщик поддиапазона разделяет каждый подблок на множество подподблоков, причем каждый кодировщик поддиапазона содержит прогнозирующий кодировщик, который генерирует и квантует сигнал ошибки для каждого подблока, и что дополнительно содержит анализатор, который генерирует оценочный сигнал ошибки перед кодированием для каждого подблока, выявляет переходные процессы в каждом подподблоке оценочного сигнала ошибки, генерирует код переходного процесса, который показывает, имеется ли переходный процесс в каком-либо подподблоке, отличном от первого, и в каком подблоке происходит переходный процесс, и когда обнаруживает переходный процесс, генерирует масштабный коэффициент предпереходного процесса для подподблоков перед переходным процессом и масштабный коэффициент после переходного про49 цесса для подподблоков переходного процесса и после переходного процесса, и иначе генерирует однородный масштабный коэффициент для подблока, причем упомянутый прогнозирующий кодировщик использует упомянутые масштабные коэффициенты предпереходного процесса, послепереходного процесса и однородный масштабный коэффициент для масштабирования сигнала ошибки перед кодированием для уменьшения ошибки кодирования в подподблоках, соответствующих масштабным коэффициентам предпереходного процесса.
  5. 5. Многоканальный аудиокодировщик по п. 1 , отличающийся тем, что упомянутый частотный диапазон основной полосы частот имеет максимальную частоту, и что дополнительно содержит предварительный фильтр, который разделяет каждый из упомянутых аудиоблоков на сигнал основной полосы частот и сигнал высокой частоты выборки на частотах в частотном диапазоне основной полосы частот и выше максимальной частоты, соответственно, причем упомянутый глобальный диспетчер бит распределяет биты в сигнал высокой частоты выборки для удовлетворения выбранному фиксированному искажению, и кодировщик высокой частоты выборки, который кодирует сигналы высокой частоты выборки аудиоканалов в соответствующие закодированные сигналы высокой частоты выборки, причем упомянутый мультиплексор упаковывает закодированные сигналы высокой частоты выборки каналов в соответствующие выходные блоки так, что часть основной полосы частот и часть высокой частоты выборки многоканального аудиосигнала являются независимо декодируемыми.
  6. 6. Многоканальный аудиодекодировщик для восстановления множественных аудиоканалов до частоты выборки декодировщика из потока данных, в котором каждый аудиоканал дискретизирован с частотой выборки кодировщика, которая, по меньшей мере, так высока, как частота выборки декодировщика, подразделенная на множество частотных поддиапазонов, сжатых и мультиплексированных в поток данных со скоростью передачи, содержащий:
    входной буфер для считывания и запоминания потока данных по одному блоку, причем каждый из упомянутых блоков содержит слово синхронизации, заголовок блока, аудиозаголовок и, по меньшей мере, один подблок, который содержит аудиовспомогательную информацию, множество подподблоков, имеющих аудиокоды основной полосы частот выше, чем частотный диапазон основной полосы частот, блок аудиокодов высокой частоты выборки выше частотного диапазона высокой частоты выборки и синхронизацию распаковки, демультиплексор, который распознает слово синхронизации, распаковывает заголовок блока для извлечения размера кадра, который указывает число аудиовыборок в блоке, и размер блока, который указывает число байтов в блоке, причем упомянутый размер кадра задан как функция отношения скорости передачи к скорости выборки кодировщика так, что размер блока ограничен, чтобы быть меньше, чем размер входного буфера, распаковывает аудиозаголовок для извлечения числа подблоков в блоке и числа закодированных аудиоканалов и последовательно распаковывает каждый подблок для извлечения аудиовспомогательной информации, демультиплексирует аудиокоды основной полосы частот в каждом подподблоке в множественные аудиоканалы и распаковывает каждый аудиоканал в его аудиокоды поддиапазона, демультиплексирует аудиокоды высокой частоты выборки в множественные аудиоканалы до частоты выборки декодировщика и пропускает оставшиеся аудиокоды высокой частоты выборки до частоты выборки кодировщика и распознает синхронизацию распаковки для проверки конца подблока, декодировщик основной полосы частот, который использует вспомогательную информацию для декодирования аудиокодов поддиапазона в восстановленные сигналы поддиапазона по одному подблоку без ссылки на любые другие подблоки, фильтр восстановления основной полосы частот, который объединяет восстановленные сигналы поддиапазона каждого канала в восстановленный сигнал основной полосы частот по одному подблоку, декодировщик высокой частоты выборки для декодирования аудиокодов высокой частоты выборки в восстановленный сигнал высокой частоты выборки для каждого аудиоканала по одному подблоку, и фильтр восстановления канала, который объединяет восстановленный сигнал основной полосы частот и сигнал высокой частоты выборки в восстановленный многоканальный аудиосигнал по одному блоку.
  7. 7. Многоканальный аудиодекодировщик по п.6, отличающийся тем, что фильтр восстановления основной полосы частот содержит группу фильтров неполного восстановления и группу фильтров полного восстановления, а упомянутый заголовок блока содержит код фильтра, который выбирает одну из упомянутых групп фильтров неполного восстановления и полного восстановления.
  8. 8. Многоканальный аудиодекодировщик по п.6, отличающийся тем, что декодировщик основной полосы частот содержит множество обратных кодировщиков адаптивной дифференциальной импульсно-кодовой модуляции для декодирования соответствующих аудиокодов поддиапазона, причем упомянутая вспомога51 тельная информация содержит прогнозируемые коэффициенты для соответствующих кодировщиков адаптивной дифференциальной импульсно-кодовой модуляции и прогнозируемый режим для управления применением прогнозируемых коэффициентов к соответствующим кодировщикам адаптивной дифференциальной импульсно-кодовой модуляции, чтобы выборочно разрешать или блокировать их возможности прогноза.
  9. 9. Многоканальный аудиодекодировщик по п.6, отличающийся тем, что упомянутая вспомогательная информация содержит:
    таблицу распределения бит для каждого поддиапазона канала, в котором каждую скорость бит поддиапазона фиксируют относительно подблока;
    по меньшей мере, один масштабный коэффициент для каждого поддиапазона в каждом канале, режим переходного процесса для каждого поддиапазона в каждом канале, который идентифицирует число масштабных коэффициентов и их связанных подподблоков, причем упомянутый декодировщик основной полосы частот масштабирует аудиокоды поддиапазонов соответствующими масштабными коэффициентами в соответствии с их значениями режима переходного процесса для облегчения декодирования.
  10. 10. Портативный, считываемый вычислительной машиной носитель информации, содержащий поток цифровых данных, представляющий многоканальный аудиосигнал, дискретизированный с частотой выборки, закодированный относительно диапазона основной полосы частот, который подразделен на отдельные частотные поддиапазоны относительно частотного диапазона высокой частоты выборки и записан на упомянутый портативный считываемый вычислительной машиной запоминающий носитель как последовательность аудиоблоков со скоростью передачи, причем каждый из упомянутых аудиоблоков содержит последовательно слово синхронизации, заголовок блока, который содержит размер кадра, который указывает число аудиовыборок в аудиоблоке, и размер блока, который указывает число байтов в аудиоблоке, причем размер аудиокадра задан как функция отношения скорости передачи к частоте выборки так, что размер блока ограничен, чтобы быть меньше, чем максимальный размер, аудиозаголовок, который указывает устройство упаковки и формат кодирования для аудиоблока, по меньшей мере, один аудиоподблок, причем каждый аудиоподблок содержит:
    вспомогательную информацию для декодирования аудиоподблока без ссылки на другие подблоки, множество аудиоподподблоков основной полосы частот, в которых аудиоданные для каждых частотных поддиапазонов канала упаковывают и мультиплексируют с другими каналами, аудиоблок высокой частоты выборки, в котором аудиоданные в частотном диапазоне высокой частоты выборки для каждого канала упаковывают и мультиплексируют с другими каналами так, что многоканальный аудиосигнал является декодируемым с множеством частот выборок декодирования, и синхронизацию распаковки для проверки конца подблока.
EA199800505A 1995-12-01 1996-11-21 Многоканальный прогнозирующий кодировщик поддиапазона, использующий психоакустическое адаптивное распределение бит EA001087B1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US789695P 1995-12-01 1995-12-01
US08/642,254 US5956674A (en) 1995-12-01 1996-05-02 Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
PCT/US1996/018764 WO1997021211A1 (en) 1995-12-01 1996-11-21 Multi-channel predictive subband coder using psychoacoustic adaptive bit allocation

Publications (2)

Publication Number Publication Date
EA199800505A1 EA199800505A1 (ru) 1998-12-24
EA001087B1 true EA001087B1 (ru) 2000-10-30

Family

ID=26677495

Family Applications (1)

Application Number Title Priority Date Filing Date
EA199800505A EA001087B1 (ru) 1995-12-01 1996-11-21 Многоканальный прогнозирующий кодировщик поддиапазона, использующий психоакустическое адаптивное распределение бит

Country Status (18)

Country Link
US (4) US5956674A (ru)
EP (1) EP0864146B1 (ru)
JP (1) JP4174072B2 (ru)
KR (1) KR100277819B1 (ru)
CN (5) CN1132151C (ru)
AT (1) ATE279770T1 (ru)
AU (1) AU705194B2 (ru)
BR (1) BR9611852A (ru)
CA (2) CA2238026C (ru)
DE (1) DE69633633T2 (ru)
DK (1) DK0864146T3 (ru)
EA (1) EA001087B1 (ru)
ES (1) ES2232842T3 (ru)
HK (4) HK1015510A1 (ru)
MX (1) MX9804320A (ru)
PL (3) PL182240B1 (ru)
PT (1) PT864146E (ru)
WO (1) WO1997021211A1 (ru)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2560788C2 (ru) * 2011-02-14 2015-08-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки декодированного аудиосигнала в спектральной области
US9153236B2 (en) 2011-02-14 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
CN108449704A (zh) * 2013-10-22 2018-08-24 韩国电子通信研究院 生成用于音频信号的滤波器的方法及其参数化装置
RU2682340C1 (ru) * 2010-09-16 2019-03-19 Долби Интернешнл Аб Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
US12033645B2 (en) 2023-10-05 2024-07-09 Dolby International Ab Cross product enhanced subband block based harmonic transposition

Families Citing this family (541)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1126264C (zh) * 1996-02-08 2003-10-29 松下电器产业株式会社 宽频带声音信号编码装置和宽频带声音信号编码解码装置
US8306811B2 (en) * 1996-08-30 2012-11-06 Digimarc Corporation Embedding data in audio and detecting embedded data in audio
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
JPH10271082A (ja) * 1997-03-21 1998-10-09 Mitsubishi Electric Corp 音声データ復号装置
US6449227B1 (en) 1997-03-25 2002-09-10 Samsung Electronics Co., Ltd. DVD-audio disk, and apparatus and method for playing the same
US7110662B1 (en) 1997-03-25 2006-09-19 Samsung Electronics Co., Ltd. Apparatus and method for recording data on a DVD-audio disk
US6741796B1 (en) 1997-03-25 2004-05-25 Samsung Electronics, Co., Ltd. DVD-Audio disk, and apparatus and method for playing the same
JP3339054B2 (ja) * 1997-03-28 2002-10-28 ソニー株式会社 データ符号化方法及び装置、データ復号方法及び装置、並びに記録媒体
US6298025B1 (en) 1997-05-05 2001-10-02 Warner Music Group Inc. Recording and playback of multi-channel digital audio having different resolutions for different channels
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6636474B1 (en) * 1997-07-16 2003-10-21 Victor Company Of Japan, Ltd. Recording medium and audio-signal processing apparatus
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
US6574602B1 (en) * 1997-12-19 2003-06-03 Stmicroelectronics Asia Pacific Pte Limited Dual channel phase flag determination for coupling bands in a transform coder for high quality audio
EP1050113B1 (en) * 1997-12-27 2002-03-13 STMicroelectronics Asia Pacific Pte Ltd. Method and apparatus for estimation of coupling parameters in a transform coder for high quality audio
JP3802219B2 (ja) * 1998-02-18 2006-07-26 富士通株式会社 音声符号化装置
US6089714A (en) * 1998-02-18 2000-07-18 Mcgill University Automatic segmentation of nystagmus or other complex curves
JPH11234136A (ja) * 1998-02-19 1999-08-27 Sanyo Electric Co Ltd デジタルデータの符号化方法及び符号化装置
US6253185B1 (en) * 1998-02-25 2001-06-26 Lucent Technologies Inc. Multiple description transform coding of audio using optimal transforms of arbitrary dimension
KR100304092B1 (ko) 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
US6400727B1 (en) * 1998-03-27 2002-06-04 Cirrus Logic, Inc. Methods and system to transmit data acquired at a variable rate over a fixed rate channel
US6385345B1 (en) * 1998-03-31 2002-05-07 Sharp Laboratories Of America, Inc. Method and apparatus for selecting image data to skip when encoding digital video
JPH11331248A (ja) * 1998-05-08 1999-11-30 Sony Corp 送信装置および送信方法、受信装置および受信方法、並びに提供媒体
US6141645A (en) * 1998-05-29 2000-10-31 Acer Laboratories Inc. Method and device for down mixing compressed audio bit stream having multiple audio channels
US6141639A (en) * 1998-06-05 2000-10-31 Conexant Systems, Inc. Method and apparatus for coding of signals containing speech and background noise
EP0966109B1 (en) * 1998-06-15 2005-04-27 Matsushita Electric Industrial Co., Ltd. Audio coding method and audio coding apparatus
US6061655A (en) * 1998-06-26 2000-05-09 Lsi Logic Corporation Method and apparatus for dual output interface control of audio decoder
US6301265B1 (en) * 1998-08-14 2001-10-09 Motorola, Inc. Adaptive rate system and method for network communications
US7457415B2 (en) 1998-08-20 2008-11-25 Akikaze Technologies, Llc Secure information distribution system utilizing information segment scrambling
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
CA2246532A1 (en) * 1998-09-04 2000-03-04 Northern Telecom Limited Perceptual audio coding
GB9820655D0 (en) * 1998-09-22 1998-11-18 British Telecomm Packet transmission
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
JP4193243B2 (ja) * 1998-10-07 2008-12-10 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6345100B1 (en) 1998-10-14 2002-02-05 Liquid Audio, Inc. Robust watermark method and apparatus for digital signals
US6219634B1 (en) * 1998-10-14 2001-04-17 Liquid Audio, Inc. Efficient watermark method and apparatus for digital signals
US6320965B1 (en) 1998-10-14 2001-11-20 Liquid Audio, Inc. Secure watermark method and apparatus for digital signals
US6330673B1 (en) 1998-10-14 2001-12-11 Liquid Audio, Inc. Determination of a best offset to detect an embedded pattern
US6754241B1 (en) * 1999-01-06 2004-06-22 Sarnoff Corporation Computer system for statistical multiplexing of bitstreams
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6357029B1 (en) * 1999-01-27 2002-03-12 Agere Systems Guardian Corp. Joint multiple program error concealment for digital audio broadcasting and other applications
US6378101B1 (en) * 1999-01-27 2002-04-23 Agere Systems Guardian Corp. Multiple program decoding for digital audio broadcasting and other applications
US6931372B1 (en) * 1999-01-27 2005-08-16 Agere Systems Inc. Joint multiple program coding for digital audio broadcasting and other applications
TW477119B (en) * 1999-01-28 2002-02-21 Winbond Electronics Corp Byte allocation method and device for speech synthesis
FR2791167B1 (fr) 1999-03-17 2003-01-10 Matra Nortel Communications Procedes de codage, de decodage et de transcodage audio
JP3739959B2 (ja) * 1999-03-23 2006-01-25 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
DE19914742A1 (de) * 1999-03-31 2000-10-12 Siemens Ag Verfahren zum Übertragen von Daten
US8270479B2 (en) * 1999-04-06 2012-09-18 Broadcom Corporation System and method for video and audio encoding on a single chip
JP2001006291A (ja) * 1999-06-21 2001-01-12 Fuji Film Microdevices Co Ltd オーディオ信号の符号化方式判定装置、及びオーディオ信号の符号化方式判定方法
US7283965B1 (en) * 1999-06-30 2007-10-16 The Directv Group, Inc. Delivery and transmission of dolby digital AC-3 over television broadcast
US6553210B1 (en) * 1999-08-03 2003-04-22 Alliedsignal Inc. Single antenna for receipt of signals from multiple communications systems
US6581032B1 (en) * 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
US7181297B1 (en) 1999-09-28 2007-02-20 Sound Id System and method for delivering customized audio data
US6496798B1 (en) * 1999-09-30 2002-12-17 Motorola, Inc. Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message
US6732061B1 (en) * 1999-11-30 2004-05-04 Agilent Technologies, Inc. Monitoring system and method implementing a channel plan
US6741947B1 (en) * 1999-11-30 2004-05-25 Agilent Technologies, Inc. Monitoring system and method implementing a total node power test
US7792681B2 (en) * 1999-12-17 2010-09-07 Interval Licensing Llc Time-scale modification of data-compressed audio information
US6842735B1 (en) * 1999-12-17 2005-01-11 Interval Research Corporation Time-scale modification of data-compressed audio information
JP4842483B2 (ja) * 1999-12-24 2011-12-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャネルオーディオ信号処理装置及び方法
EP1226578A4 (en) * 1999-12-31 2005-09-21 Octiv Inc TECHNIQUES TO IMPROVE THE CLARITY AND UNDERSTANDING OF AUDIO-REDUCED AUDIO SIGNALS IN A DIGITAL NETWORK
US6499010B1 (en) * 2000-01-04 2002-12-24 Agere Systems Inc. Perceptual audio coder bit allocation scheme providing improved perceptual quality consistency
TW499672B (en) * 2000-02-18 2002-08-21 Intervideo Inc Fast convergence method for bit allocation stage of MPEG audio layer 3 encoders
EP1176824B1 (en) * 2000-02-29 2010-04-07 Sony Corporation Data processing device and method, and recording medium and program
US7168031B2 (en) * 2000-04-14 2007-01-23 Siemens Aktiengesellschaft Method for channel decoding a data stream containing useful data and redundant data, device for channel decoding, computer-readable storage medium and computer program element
US6782366B1 (en) * 2000-05-15 2004-08-24 Lsi Logic Corporation Method for independent dynamic range control
US7136810B2 (en) * 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
US6725110B2 (en) * 2000-05-26 2004-04-20 Yamaha Corporation Digital audio decoder
JP2003535425A (ja) * 2000-05-30 2003-11-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Cdオーディオ上のコード化された情報
US7110953B1 (en) * 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
US6778953B1 (en) * 2000-06-02 2004-08-17 Agere Systems Inc. Method and apparatus for representing masked thresholds in a perceptual audio coder
US6678647B1 (en) * 2000-06-02 2004-01-13 Agere Systems Inc. Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution
US6754618B1 (en) * 2000-06-07 2004-06-22 Cirrus Logic, Inc. Fast implementation of MPEG audio coding
US6748363B1 (en) * 2000-06-28 2004-06-08 Texas Instruments Incorporated TI window compression/expansion method
US6678648B1 (en) 2000-06-14 2004-01-13 Intervideo, Inc. Fast loop iteration and bitstream formatting method for MPEG audio encoding
US6601032B1 (en) * 2000-06-14 2003-07-29 Intervideo, Inc. Fast code length search method for MPEG audio encoding
US6542863B1 (en) 2000-06-14 2003-04-01 Intervideo, Inc. Fast codebook search method for MPEG audio encoding
US6745162B1 (en) * 2000-06-22 2004-06-01 Sony Corporation System and method for bit allocation in an audio encoder
JP2002014697A (ja) * 2000-06-30 2002-01-18 Hitachi Ltd ディジタルオーディオ装置
FI109393B (fi) 2000-07-14 2002-07-15 Nokia Corp Menetelmä mediavirran enkoodaamiseksi skaalautuvasti, skaalautuva enkooderi ja päätelaite
US6931371B2 (en) * 2000-08-25 2005-08-16 Matsushita Electric Industrial Co., Ltd. Digital interface device
SE519981C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
US20020075965A1 (en) * 2000-12-20 2002-06-20 Octiv, Inc. Digital signal processing techniques for improving audio clarity and intelligibility
CN100499817C (zh) * 2000-10-11 2009-06-10 皇家菲利浦电子有限公司 多媒体目标的可伸缩编码
US20030023429A1 (en) * 2000-12-20 2003-01-30 Octiv, Inc. Digital signal processing techniques for improving audio clarity and intelligibility
US7526348B1 (en) * 2000-12-27 2009-04-28 John C. Gaddy Computer based automatic audio mixer
CN1205540C (zh) * 2000-12-29 2005-06-08 深圳赛意法微电子有限公司 含有解码器的电路、时分寻址的方法和一个微控制器
EP1223696A3 (en) * 2001-01-12 2003-12-17 Matsushita Electric Industrial Co., Ltd. System for transmitting digital audio data according to the MOST method
GB0103242D0 (en) * 2001-02-09 2001-03-28 Radioscape Ltd Method of analysing a compressed signal for the presence or absence of information content
GB0108080D0 (en) * 2001-03-30 2001-05-23 Univ Bath Audio compression
EP1386308B1 (en) * 2001-04-09 2006-04-12 Koninklijke Philips Electronics N.V. Adpcm speech coding system with specific step-size adaptation
ATE323935T1 (de) * 2001-04-09 2006-05-15 Koninkl Philips Electronics Nv Adpcm sprachkodiersystem mit phasenfaltungs und - entfaltungsfiltern
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
EP1382035A1 (en) * 2001-04-18 2004-01-21 Koninklijke Philips Electronics N.V. Audio coding
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7047201B2 (en) * 2001-05-04 2006-05-16 Ssi Corporation Real-time control of playback rates in presentations
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7447321B2 (en) 2001-05-07 2008-11-04 Harman International Industries, Incorporated Sound processing system for configuration of audio signals in a vehicle
US6804565B2 (en) 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
US7451006B2 (en) 2001-05-07 2008-11-11 Harman International Industries, Incorporated Sound processing system using distortion limiting techniques
JP4591939B2 (ja) * 2001-05-15 2010-12-01 Kddi株式会社 適応的符号化伝送装置および受信装置
US6661880B1 (en) 2001-06-12 2003-12-09 3Com Corporation System and method for embedding digital information in a dial tone signal
EP1271470A1 (en) * 2001-06-25 2003-01-02 Alcatel Method and device for determining the voice quality degradation of a signal
US7460629B2 (en) 2001-06-29 2008-12-02 Agere Systems Inc. Method and apparatus for frame-based buffer control in a communication system
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP3463752B2 (ja) * 2001-07-25 2003-11-05 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法および音響復号化方法
JP3469567B2 (ja) * 2001-09-03 2003-11-25 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法及び音響復号化方法
US7062429B2 (en) * 2001-09-07 2006-06-13 Agere Systems Inc. Distortion-based method and apparatus for buffer control in a communication system
US7333929B1 (en) 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
US6944474B2 (en) * 2001-09-20 2005-09-13 Sound Id Sound enhancement for mobile phones and other products producing personalized audio for users
US6732071B2 (en) * 2001-09-27 2004-05-04 Intel Corporation Method, apparatus, and system for efficient rate control in audio encoding
JP4245288B2 (ja) * 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
MXPA03005133A (es) * 2001-11-14 2004-04-02 Matsushita Electric Ind Co Ltd Dispositivo de codificacion, dispositivo de decodificacion y sistema de los mismos.
BR0206446A (pt) * 2001-11-16 2003-12-30 Koninkl Philips Electronics Nv Método e arranjo para ajustar um sinal de dados suplementares a ser embutido em um sinal de informação, dispositivo para embutir um sinal de dados suplementares em um sinal de informação, sinal de informação tendo embutido no mesmo um sinal de dados suplementares, e, meio de armazenamento
WO2003046891A1 (en) 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US6697076B1 (en) 2001-12-31 2004-02-24 Apple Computer, Inc. Method and apparatus for address re-mapping
US7114058B1 (en) 2001-12-31 2006-09-26 Apple Computer, Inc. Method and apparatus for forming and dispatching instruction groups based on priority comparisons
US6877020B1 (en) 2001-12-31 2005-04-05 Apple Computer, Inc. Method and apparatus for matrix transposition
US7681013B1 (en) 2001-12-31 2010-03-16 Apple Inc. Method for variable length decoding using multiple configurable look-up tables
US7015921B1 (en) 2001-12-31 2006-03-21 Apple Computer, Inc. Method and apparatus for memory access
US7558947B1 (en) 2001-12-31 2009-07-07 Apple Inc. Method and apparatus for computing vector absolute differences
US7034849B1 (en) 2001-12-31 2006-04-25 Apple Computer, Inc. Method and apparatus for image blending
US6822654B1 (en) 2001-12-31 2004-11-23 Apple Computer, Inc. Memory controller chipset
US7305540B1 (en) 2001-12-31 2007-12-04 Apple Inc. Method and apparatus for data processing
US7467287B1 (en) 2001-12-31 2008-12-16 Apple Inc. Method and apparatus for vector table look-up
US6573846B1 (en) 2001-12-31 2003-06-03 Apple Computer, Inc. Method and apparatus for variable length decoding and encoding of video streams
US7055018B1 (en) 2001-12-31 2006-05-30 Apple Computer, Inc. Apparatus for parallel vector table look-up
US6693643B1 (en) 2001-12-31 2004-02-17 Apple Computer, Inc. Method and apparatus for color space conversion
US6931511B1 (en) 2001-12-31 2005-08-16 Apple Computer, Inc. Parallel vector table look-up with replicated index element vector
US7848531B1 (en) * 2002-01-09 2010-12-07 Creative Technology Ltd. Method and apparatus for audio loudness and dynamics matching
US6618128B2 (en) * 2002-01-23 2003-09-09 Csi Technology, Inc. Optical speed sensing system
EP1479071B1 (en) * 2002-02-18 2006-01-11 Koninklijke Philips Electronics N.V. Parametric audio coding
US20030161469A1 (en) * 2002-02-25 2003-08-28 Szeming Cheng Method and apparatus for embedding data in compressed audio data stream
US20100042406A1 (en) * 2002-03-04 2010-02-18 James David Johnston Audio signal processing using improved perceptual model
US7313520B2 (en) * 2002-03-20 2007-12-25 The Directv Group, Inc. Adaptive variable bit rate audio compression encoding
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US20040125707A1 (en) * 2002-04-05 2004-07-01 Rodolfo Vargas Retrieving content of various types with a conversion device attachable to audio outputs of an audio CD player
US7225135B2 (en) * 2002-04-05 2007-05-29 Lectrosonics, Inc. Signal-predictive audio transmission system
US7428440B2 (en) * 2002-04-23 2008-09-23 Realnetworks, Inc. Method and apparatus for preserving matrix surround information in encoded audio/video
WO2003092327A1 (en) * 2002-04-25 2003-11-06 Nokia Corporation Method and device for reducing high frequency error components of a multi-channel modulator
JP4016709B2 (ja) * 2002-04-26 2007-12-05 日本電気株式会社 オーディオデータの符号変換伝送方法と符号変換受信方法及び装置とシステムならびにプログラム
WO2003093775A2 (en) * 2002-05-03 2003-11-13 Harman International Industries, Incorporated Sound detection and localization system
US7096180B2 (en) * 2002-05-15 2006-08-22 Intel Corporation Method and apparatuses for improving quality of digitally encoded speech in the presence of interference
US7050965B2 (en) * 2002-06-03 2006-05-23 Intel Corporation Perceptual normalization of digital audio signals
JP4554361B2 (ja) * 2002-06-21 2010-09-29 トムソン ライセンシング シリアル・ディジタル・オーディオ・データ・ストリーム復号器を有するブロードキャスト・ルータ
US7325048B1 (en) * 2002-07-03 2008-01-29 3Com Corporation Method for automatically creating a modem interface for use with a wireless device
KR100462615B1 (ko) * 2002-07-11 2004-12-20 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
US8228849B2 (en) * 2002-07-15 2012-07-24 Broadcom Corporation Communication gateway supporting WLAN communications in multiple communication protocols and in multiple frequency bands
AU2003281128A1 (en) 2002-07-16 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
CN100481734C (zh) * 2002-08-21 2009-04-22 广州广晟数码技术有限公司 用于从音频数据码流中解码重建多声道音频信号的解码器
CN1783726B (zh) * 2002-08-21 2010-05-12 广州广晟数码技术有限公司 用于从音频数据码流中解码重建多声道音频信号的解码器
EP1394772A1 (en) * 2002-08-28 2004-03-03 Deutsche Thomson-Brandt Gmbh Signaling of window switchings in a MPEG layer 3 audio data stream
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
ATE543179T1 (de) 2002-09-04 2012-02-15 Microsoft Corp Entropische kodierung mittels anpassung des kodierungsmodus zwischen niveau- und lauflängenniveau-modus
TW573293B (en) * 2002-09-13 2004-01-21 Univ Nat Central Nonlinear operation method suitable for audio encoding/decoding and an applied hardware thereof
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
FR2846179B1 (fr) 2002-10-21 2005-02-04 Medialive Embrouillage adaptatif et progressif de flux audio
US6707397B1 (en) 2002-10-24 2004-03-16 Apple Computer, Inc. Methods and apparatus for variable length codeword concatenation
US6781529B1 (en) 2002-10-24 2004-08-24 Apple Computer, Inc. Methods and apparatuses for variable length encoding
US6707398B1 (en) 2002-10-24 2004-03-16 Apple Computer, Inc. Methods and apparatuses for packing bitstreams
US6781528B1 (en) 2002-10-24 2004-08-24 Apple Computer, Inc. Vector handling capable processor and run length encoding
US7650625B2 (en) * 2002-12-16 2010-01-19 Lsi Corporation System and method for controlling audio and video content via an advanced settop box
US7555017B2 (en) * 2002-12-17 2009-06-30 Tls Corporation Low latency digital audio over packet switched networks
US7272566B2 (en) * 2003-01-02 2007-09-18 Dolby Laboratories Licensing Corporation Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique
KR100547113B1 (ko) * 2003-02-15 2006-01-26 삼성전자주식회사 오디오 데이터 인코딩 장치 및 방법
TW594674B (en) * 2003-03-14 2004-06-21 Mediatek Inc Encoder and a encoding method capable of detecting audio signal transient
CN100339886C (zh) * 2003-04-10 2007-09-26 联发科技股份有限公司 可以检测声音信号的暂态位置的编码器及编码方法
FR2853786B1 (fr) * 2003-04-11 2005-08-05 Medialive Procede et equipement de distribution de produits videos numeriques avec une restriction de certains au moins des droits de representation et de reproduction
EP1621047B1 (en) * 2003-04-17 2007-04-11 Koninklijke Philips Electronics N.V. Audio signal generation
WO2004093495A1 (en) * 2003-04-17 2004-10-28 Koninklijke Philips Electronics N.V. Audio signal synthesis
US8073684B2 (en) * 2003-04-25 2011-12-06 Texas Instruments Incorporated Apparatus and method for automatic classification/identification of similar compressed audio files
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
CN100546233C (zh) * 2003-04-30 2009-09-30 诺基亚公司 用于支持多声道音频扩展的方法和设备
US7739105B2 (en) * 2003-06-13 2010-06-15 Vixs Systems, Inc. System and method for processing audio frames
US7657429B2 (en) * 2003-06-16 2010-02-02 Panasonic Corporation Coding apparatus and coding method for coding with reference to a codebook
KR100556365B1 (ko) * 2003-07-07 2006-03-03 엘지전자 주식회사 음성 인식장치 및 방법
CA2475189C (en) * 2003-07-17 2009-10-06 At&T Corp. Method and apparatus for window matching in delta compressors
US7289680B1 (en) * 2003-07-23 2007-10-30 Cisco Technology, Inc. Methods and apparatus for minimizing requantization error
TWI220336B (en) * 2003-07-28 2004-08-11 Design Technology Inc G Compression rate promotion method of adaptive differential PCM technique
US7996234B2 (en) * 2003-08-26 2011-08-09 Akikaze Technologies, Llc Method and apparatus for adaptive variable bit rate audio encoding
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
WO2005027096A1 (en) * 2003-09-15 2005-03-24 Zakrytoe Aktsionernoe Obschestvo Intel Method and apparatus for encoding audio
SG120118A1 (en) * 2003-09-15 2006-03-28 St Microelectronics Asia A device and process for encoding audio data
US20050083808A1 (en) * 2003-09-18 2005-04-21 Anderson Hans C. Audio player with CD mechanism
US7325023B2 (en) * 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
US7349842B2 (en) * 2003-09-29 2008-03-25 Sony Corporation Rate-distortion control scheme in audio encoding
US7426462B2 (en) * 2003-09-29 2008-09-16 Sony Corporation Fast codebook selection method in audio encoding
US7283968B2 (en) 2003-09-29 2007-10-16 Sony Corporation Method for grouping short windows in audio encoding
DE602004030594D1 (de) * 2003-10-07 2011-01-27 Panasonic Corp Verfahren zur entscheidung der zeitgrenze zur codierung der spektro-hülle und frequenzauflösung
TWI226035B (en) * 2003-10-16 2005-01-01 Elan Microelectronics Corp Method and system improving step adaptation of ADPCM voice coding
EP1683133B1 (en) * 2003-10-30 2007-02-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
KR20050050322A (ko) * 2003-11-25 2005-05-31 삼성전자주식회사 직교주파수다중화방식의 이동통신시스템에서 적응변조 방법
KR100571824B1 (ko) * 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
JPWO2005057550A1 (ja) * 2003-12-15 2007-12-13 松下電器産業株式会社 音声圧縮伸張装置
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP2005217486A (ja) * 2004-01-27 2005-08-11 Matsushita Electric Ind Co Ltd ストリーム復号装置
DE102004009949B4 (de) * 2004-03-01 2006-03-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
EP1914722B1 (en) 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
TWI231656B (en) * 2004-04-08 2005-04-21 Univ Nat Chiao Tung Fast bit allocation algorithm for audio coding
US8032360B2 (en) * 2004-05-13 2011-10-04 Broadcom Corporation System and method for high-quality variable speed playback of audio-visual media
US7512536B2 (en) * 2004-05-14 2009-03-31 Texas Instruments Incorporated Efficient filter bank computation for audio coding
DE602004012165T2 (de) * 2004-05-28 2009-06-18 The Tc Group A/S Impulsbreitenmodulatorsystem
ES2336558T3 (es) * 2004-06-10 2010-04-14 Panasonic Corporation Sistema y metodo para la reconfiguracion en el tiempo de funcionamiento.
WO2005124722A2 (en) * 2004-06-12 2005-12-29 Spl Development, Inc. Aural rehabilitation system and method
KR100634506B1 (ko) * 2004-06-25 2006-10-16 삼성전자주식회사 저비트율 부호화/복호화 방법 및 장치
CN102833539B (zh) * 2004-06-27 2015-03-25 苹果公司 多通路视频编码
US20050285935A1 (en) * 2004-06-29 2005-12-29 Octiv, Inc. Personal conferencing node
US20050286443A1 (en) * 2004-06-29 2005-12-29 Octiv, Inc. Conferencing system
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
US20060015329A1 (en) * 2004-07-19 2006-01-19 Chu Wai C Apparatus and method for audio coding
US7391434B2 (en) * 2004-07-27 2008-06-24 The Directv Group, Inc. Video bit stream test
US7706415B2 (en) * 2004-07-29 2010-04-27 Microsoft Corporation Packet multiplexing multi-channel audio
US7508947B2 (en) * 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
CN101010724B (zh) * 2004-08-27 2011-05-25 松下电器产业株式会社 音频编码器
US20070250308A1 (en) * 2004-08-31 2007-10-25 Koninklijke Philips Electronics, N.V. Method and device for transcoding
US7725313B2 (en) * 2004-09-13 2010-05-25 Ittiam Systems (P) Ltd. Method, system and apparatus for allocating bits in perceptual audio coders
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
CN101055721B (zh) * 2004-09-17 2011-06-01 广州广晟数码技术有限公司 多声道数字音频编码设备及其方法
US7937271B2 (en) * 2004-09-17 2011-05-03 Digital Rise Technology Co., Ltd. Audio decoding using variable-length codebook application ranges
US7895034B2 (en) * 2004-09-17 2011-02-22 Digital Rise Technology Co., Ltd. Audio encoding system
JP4809234B2 (ja) * 2004-09-17 2011-11-09 パナソニック株式会社 オーディオ符号化装置、復号化装置、方法、及びプログラム
BRPI0516201A (pt) * 2004-09-28 2008-08-26 Matsushita Electric Ind Co Ltd aparelho de codificação escalonável e método de codificação escalonável
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
US7061405B2 (en) * 2004-10-15 2006-06-13 Yazaki North America, Inc. Device and method for interfacing video devices over a fiber optic link
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
JP4815780B2 (ja) * 2004-10-20 2011-11-16 ヤマハ株式会社 オーバーサンプリングシステム、デコードlsi、およびオーバーサンプリング方法
SE0402651D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7761304B2 (en) 2004-11-30 2010-07-20 Agere Systems Inc. Synchronizing parametric coding of spatial audio with externally provided downmix
WO2006060279A1 (en) * 2004-11-30 2006-06-08 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
JPWO2006067988A1 (ja) * 2004-12-22 2008-06-12 松下電器産業株式会社 Mpegオーディオデコード方法
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
WO2006075079A1 (fr) * 2005-01-14 2006-07-20 France Telecom Procede d’encodage de pistes audio d’un contenu multimedia destine a une diffusion sur terminaux mobiles
KR100707177B1 (ko) * 2005-01-19 2007-04-13 삼성전자주식회사 디지털 신호 부호화/복호화 방법 및 장치
US7208372B2 (en) * 2005-01-19 2007-04-24 Sharp Laboratories Of America, Inc. Non-volatile memory resistor cell with nanotip electrode
KR100765747B1 (ko) * 2005-01-22 2007-10-15 삼성전자주식회사 트리 구조 벡터 양자화를 이용한 스케일러블 음성 부호화장치
BRPI0607246B1 (pt) * 2005-01-31 2019-12-03 Skype método para gerar uma seqüência de amostras de encobrimento com relação à transmissão de um sinal de áudio digitalizado, dispositivo de armazenamento de programa, e, arranjo para receber um sinal de áudio digitalizado
US7672742B2 (en) * 2005-02-16 2010-03-02 Adaptec, Inc. Method and system for reducing audio latency
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
WO2006091139A1 (en) * 2005-02-23 2006-08-31 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
DE102005010057A1 (de) * 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
JP5461835B2 (ja) * 2005-05-26 2014-04-02 エルジー エレクトロニクス インコーポレイティド オーディオ信号の符号化/復号化方法及び符号化/復号化装置
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1899958B1 (en) 2005-05-26 2013-08-07 LG Electronics Inc. Method and apparatus for decoding an audio signal
CN101185117B (zh) * 2005-05-26 2012-09-26 Lg电子株式会社 解码音频信号的方法和装置
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
KR100718132B1 (ko) * 2005-06-24 2007-05-14 삼성전자주식회사 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치
JP5006315B2 (ja) * 2005-06-30 2012-08-22 エルジー エレクトロニクス インコーポレイティド オーディオ信号のエンコーディング及びデコーディング方法及び装置
JP2009500656A (ja) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
WO2007004830A1 (en) * 2005-06-30 2007-01-11 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8108219B2 (en) 2005-07-11 2012-01-31 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7684981B2 (en) * 2005-07-15 2010-03-23 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
US8225392B2 (en) * 2005-07-15 2012-07-17 Microsoft Corporation Immunizing HTML browsers and extensions from known vulnerabilities
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7693709B2 (en) * 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US7599840B2 (en) 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7539612B2 (en) 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
CN1909066B (zh) * 2005-08-03 2011-02-09 昆山杰得微电子有限公司 音频编码码量控制和调整的方法
US9237407B2 (en) * 2005-08-04 2016-01-12 Summit Semiconductor, Llc High quality, controlled latency multi-channel wireless digital audio distribution system and methods
US7933337B2 (en) 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
US7565018B2 (en) 2005-08-12 2009-07-21 Microsoft Corporation Adaptive coding and decoding of wide-range coefficients
JP4859925B2 (ja) * 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
WO2007027050A1 (en) * 2005-08-30 2007-03-08 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
KR100880642B1 (ko) * 2005-08-30 2009-01-30 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
KR20070025905A (ko) * 2005-08-30 2007-03-08 엘지전자 주식회사 멀티채널 오디오 코딩에서 효과적인 샘플링 주파수비트스트림 구성방법
US8319791B2 (en) * 2005-10-03 2012-11-27 Sharp Kabushiki Kaisha Display
US8068569B2 (en) * 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
KR100857115B1 (ko) 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
WO2007040360A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
DE102005048581B4 (de) * 2005-10-06 2022-06-09 Robert Bosch Gmbh Teilnehmerschnittstelle zwischen einem FlexRay-Kommunikationsbaustein und einem FlexRay-Teilnehmer und Verfahren zur Übertragung von Botschaften über eine solche Schnittstelle
KR100851972B1 (ko) * 2005-10-12 2008-08-12 삼성전자주식회사 오디오 데이터 및 확장 데이터 부호화/복호화 방법 및 장치
JP4954080B2 (ja) * 2005-10-14 2012-06-13 パナソニック株式会社 変換符号化装置および変換符号化方法
US20070094035A1 (en) * 2005-10-21 2007-04-26 Nokia Corporation Audio coding
US7653533B2 (en) * 2005-10-24 2010-01-26 Lg Electronics Inc. Removing time delays in signal paths
TWI307037B (en) * 2005-10-31 2009-03-01 Holtek Semiconductor Inc Audio calculation method
US20080162862A1 (en) * 2005-12-02 2008-07-03 Yoshiki Matsumoto Signal Processing Apparatus and Signal Processing Method
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
CA2636494C (en) 2006-01-19 2014-02-18 Lg Electronics Inc. Method and apparatus for processing a media signal
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
JP5173840B2 (ja) 2006-02-07 2013-04-03 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
JP2007249075A (ja) * 2006-03-17 2007-09-27 Toshiba Corp 音声再生装置および高域補間処理方法
JP4193865B2 (ja) * 2006-04-27 2008-12-10 ソニー株式会社 デジタル信号切換え装置及びその切換え方法
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8150065B2 (en) * 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8326609B2 (en) * 2006-06-29 2012-12-04 Lg Electronics Inc. Method and apparatus for an audio signal processing
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
WO2008004649A1 (en) * 2006-07-07 2008-01-10 Nec Corporation Audio encoding device, audio encoding method, and program thereof
US7797155B2 (en) * 2006-07-26 2010-09-14 Ittiam Systems (P) Ltd. System and method for measurement of perceivable quantization noise in perceptual audio coders
US7907579B2 (en) * 2006-08-15 2011-03-15 Cisco Technology, Inc. WiFi geolocation from carrier-managed system geolocation of a dual mode device
CN100531398C (zh) * 2006-08-23 2009-08-19 中兴通讯股份有限公司 一种移动多媒体广播***的多音轨实现方法
US7882462B2 (en) 2006-09-11 2011-02-01 The Mathworks, Inc. Hardware definition language generation for frame-based processing
US8745557B1 (en) 2006-09-11 2014-06-03 The Mathworks, Inc. Hardware definition language generation for data serialization from executable graphical models
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
JP4823001B2 (ja) * 2006-09-27 2011-11-24 富士通セミコンダクター株式会社 オーディオ符号化装置
JP5174027B2 (ja) * 2006-09-29 2013-04-03 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びミックス信号処理方法
CN101529898B (zh) 2006-10-12 2014-09-17 Lg电子株式会社 用于处理混合信号的装置及其方法
EP2328364B1 (en) * 2006-10-13 2020-07-01 Auro Technologies NV A method and encoder for combining digital data sets, a decoding method and decoder for such combined digital data sets and a record carrier for storing such combined digital data set
DE602006015328D1 (de) * 2006-11-03 2010-08-19 Psytechnics Ltd Abtastfehlerkompensation
US7616568B2 (en) * 2006-11-06 2009-11-10 Ixia Generic packet generation
CN101536086B (zh) * 2006-11-15 2012-08-08 Lg电子株式会社 用于解码音频信号的方法和装置
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
KR101062353B1 (ko) 2006-12-07 2011-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 그 장치
CN101568958B (zh) * 2006-12-07 2012-07-18 Lg电子株式会社 用于处理音频信号的方法和装置
US7508326B2 (en) * 2006-12-21 2009-03-24 Sigmatel, Inc. Automatically disabling input/output signal processing based on the required multimedia format
US8255226B2 (en) * 2006-12-22 2012-08-28 Broadcom Corporation Efficient background audio encoding in a real time system
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
MX2009007412A (es) * 2007-01-10 2009-07-17 Koninkl Philips Electronics Nv Decodificador de audio.
US8275611B2 (en) * 2007-01-18 2012-09-25 Stmicroelectronics Asia Pacific Pte., Ltd. Adaptive noise suppression for digital speech signals
US20100121470A1 (en) * 2007-02-13 2010-05-13 Lg Electronics Inc. Method and an apparatus for processing an audio signal
WO2008100068A1 (en) * 2007-02-13 2008-08-21 Lg Electronics Inc. A method and an apparatus for processing an audio signal
TWI396187B (zh) * 2007-02-14 2013-05-11 Lg Electronics Inc 用於將以物件為主之音訊信號編碼與解碼之方法與裝置
US8184710B2 (en) 2007-02-21 2012-05-22 Microsoft Corporation Adaptive truncation of transform coefficient data in a transform-based digital media codec
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
KR101149449B1 (ko) * 2007-03-20 2012-05-25 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
CN101272209B (zh) * 2007-03-21 2012-04-25 大唐移动通信设备有限公司 一种对多通道复用数据进行滤波的方法及设备
US9466307B1 (en) * 2007-05-22 2016-10-11 Digimarc Corporation Robust spectral encoding and decoding methods
EP2171713B1 (fr) * 2007-06-15 2011-03-16 France Telecom Codage de signaux audionumériques
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7944847B2 (en) * 2007-06-25 2011-05-17 Efj, Inc. Voting comparator method, apparatus, and system using a limited number of digital signal processor modules to process a larger number of analog audio streams without affecting the quality of the voted audio stream
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8285554B2 (en) * 2007-07-27 2012-10-09 Dsp Group Limited Method and system for dynamic aliasing suppression
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
US8521540B2 (en) * 2007-08-17 2013-08-27 Qualcomm Incorporated Encoding and/or decoding digital signals using a permutation value
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
GB2454208A (en) * 2007-10-31 2009-05-06 Cambridge Silicon Radio Ltd Compression using a perceptual model and a signal-to-mask ratio (SMR) parameter tuned based on target bitrate and previously encoded data
US8199927B1 (en) 2007-10-31 2012-06-12 ClearOnce Communications, Inc. Conferencing system implementing echo cancellation and push-to-talk microphone detection using two-stage frequency filter
US8577485B2 (en) 2007-12-06 2013-11-05 Lg Electronics Inc. Method and an apparatus for processing an audio signal
CN101903944B (zh) * 2007-12-18 2013-04-03 Lg电子株式会社 用于处理音频信号的方法和装置
US8239210B2 (en) * 2007-12-19 2012-08-07 Dts, Inc. Lossless multi-channel audio codec
US20090164223A1 (en) * 2007-12-19 2009-06-25 Dts, Inc. Lossless multi-channel audio codec
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
WO2009084226A1 (ja) * 2007-12-28 2009-07-09 Panasonic Corporation ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
EP2248263B1 (en) * 2008-01-31 2012-12-26 Agency for Science, Technology And Research Method and device of bitrate distribution/truncation for scalable audio coding
KR101441898B1 (ko) * 2008-02-01 2014-09-23 삼성전자주식회사 주파수 부호화 방법 및 장치와 주파수 복호화 방법 및 장치
US20090210222A1 (en) * 2008-02-15 2009-08-20 Microsoft Corporation Multi-Channel Hole-Filling For Audio Compression
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
KR20090110242A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 신호를 처리하는 방법 및 장치
KR101599875B1 (ko) * 2008-04-17 2016-03-14 삼성전자주식회사 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 부호화 방법 및 장치, 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 복호화 방법 및 장치
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
KR101238731B1 (ko) * 2008-04-18 2013-03-06 돌비 레버러토리즈 라이쎈싱 코오포레이션 서라운드 경험에 최소한의 영향을 미치는 멀티-채널 오디오에서 음성 가청도를 유지하는 방법과 장치
US8179974B2 (en) 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients
US8630848B2 (en) 2008-05-30 2014-01-14 Digital Rise Technology Co., Ltd. Audio signal transient detection
CN101605017A (zh) * 2008-06-12 2009-12-16 华为技术有限公司 编码比特的分配方法和装置
US8909361B2 (en) * 2008-06-19 2014-12-09 Broadcom Corporation Method and system for processing high quality audio in a hardware audio codec for audio transmission
US8583424B2 (en) * 2008-06-26 2013-11-12 France Telecom Spatial synthesis of multichannel audio signals
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
WO2010005224A2 (en) * 2008-07-07 2010-01-14 Lg Electronics Inc. A method and an apparatus for processing an audio signal
CA2729752C (en) * 2008-07-10 2018-06-05 Voiceage Corporation Multi-reference lpc filter quantization and inverse quantization device and method
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
TWI427619B (zh) * 2008-07-21 2014-02-21 Realtek Semiconductor Corp 音效混波裝置與方法
US8406307B2 (en) 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
MX2011003824A (es) * 2008-10-08 2011-05-02 Fraunhofer Ges Forschung Esquema de codificacion/decodificacion de audio conmutado de resolucion multiple.
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8121830B2 (en) * 2008-10-24 2012-02-21 The Nielsen Company (Us), Llc Methods and apparatus to extract data encoded in media content
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
AT509439B1 (de) * 2008-12-19 2013-05-15 Siemens Entpr Communications Verfahren und mittel zur skalierbaren verbesserung der qualität eines signalcodierverfahrens
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
AU2010242814B2 (en) 2009-05-01 2014-07-31 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
JP5539992B2 (ja) * 2009-08-20 2014-07-02 トムソン ライセンシング レート制御装置、レート制御方法及びレート制御プログラム
GB0915766D0 (en) * 2009-09-09 2009-10-07 Apt Licensing Ltd Apparatus and method for multidimensional adaptive audio coding
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8861742B2 (en) * 2010-01-26 2014-10-14 Yamaha Corporation Masker sound generation apparatus and program
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
DE102010006573B4 (de) * 2010-02-02 2012-03-15 Rohde & Schwarz Gmbh & Co. Kg IQ-Datenkompression für Breitbandanwendungen
EP2365630B1 (en) * 2010-03-02 2016-06-08 Harman Becker Automotive Systems GmbH Efficient sub-band adaptive fir-filtering
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8374858B2 (en) * 2010-03-09 2013-02-12 Dts, Inc. Scalable lossless audio codec and authoring tool
JP5850216B2 (ja) * 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法***及瞬态信号可分层编解码方法
US9378754B1 (en) 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
CN103262158B (zh) 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
EP2450880A1 (en) 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
JP5609591B2 (ja) * 2010-11-30 2014-10-22 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
US9436441B1 (en) 2010-12-08 2016-09-06 The Mathworks, Inc. Systems and methods for hardware resource sharing
CN103370705B (zh) * 2011-01-05 2018-01-02 谷歌公司 用于便利文本输入的方法和***
US10515643B2 (en) 2011-04-05 2019-12-24 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder, decoder, program, and recording medium
KR101859246B1 (ko) * 2011-04-20 2018-05-17 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 허프만 부호화를 실행하기 위한 장치 및 방법
GB2490879B (en) * 2011-05-12 2018-12-26 Qualcomm Technologies Int Ltd Hybrid coded audio data streaming apparatus and method
MX2013013261A (es) 2011-05-13 2014-02-20 Samsung Electronics Co Ltd Asignacion de bits, codificacion y decodificacion de audio.
US8731949B2 (en) * 2011-06-30 2014-05-20 Zte Corporation Method and system for audio encoding and decoding and method for estimating noise level
US9355000B1 (en) 2011-08-23 2016-05-31 The Mathworks, Inc. Model level power consumption optimization in hardware description generation
US8781023B2 (en) * 2011-11-01 2014-07-15 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth expanded channel
US8774308B2 (en) * 2011-11-01 2014-07-08 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth mismatched channel
FR2984579B1 (fr) * 2011-12-14 2013-12-13 Inst Polytechnique Grenoble Procede de traitement numerique sur un ensemble de pistes audio avant mixage
EP2702587B1 (en) * 2012-04-05 2015-04-01 Huawei Technologies Co., Ltd. Method for inter-channel difference estimation and spatial audio coding device
JP5998603B2 (ja) * 2012-04-18 2016-09-28 ソニー株式会社 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム
TWI505262B (zh) 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
GB201210373D0 (en) * 2012-06-12 2012-07-25 Meridian Audio Ltd Doubly compatible lossless audio sandwidth extension
CN102752058B (zh) * 2012-06-16 2013-10-16 天地融科技股份有限公司 音频数据传输***、音频数据传输装置及电子签名工具
AR091515A1 (es) * 2012-06-29 2015-02-11 Sony Corp Dispositivo y metodo para el procesamiento de imagenes
JP6065452B2 (ja) 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
JP5447628B1 (ja) * 2012-09-28 2014-03-19 パナソニック株式会社 無線通信装置及び通信端末
ES2970676T3 (es) 2012-12-13 2024-05-30 Fraunhofer Ges Forschung Dispositivo de codificación de audio vocal, dispositivo de decodificación de audio vocal, procedimiento decodificación de audio vocal, y procedimiento de decodificación de audio vocal
US9659567B2 (en) 2013-01-08 2017-05-23 Dolby International Ab Model based prediction in a critically sampled filterbank
JP6179122B2 (ja) * 2013-02-20 2017-08-16 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
US9093064B2 (en) 2013-03-11 2015-07-28 The Nielsen Company (Us), Llc Down-mixing compensation for audio watermarking
WO2014164361A1 (en) 2013-03-13 2014-10-09 Dts Llc System and methods for processing stereo audio content
JP6146069B2 (ja) * 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
EP2981961B1 (en) 2013-04-05 2017-05-10 Dolby International AB Advanced quantizer
EP2800401A1 (en) 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
US9495968B2 (en) 2013-05-29 2016-11-15 Qualcomm Incorporated Identifying sources from which higher order ambisonic audio data is generated
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
EP3660843B1 (en) * 2013-09-13 2022-11-09 Samsung Electronics Co., Ltd. Lossless coding method
RU2641463C2 (ru) * 2013-10-21 2018-01-17 Долби Интернэшнл Аб Структура декоррелятора для параметрического восстановления звуковых сигналов
US10078717B1 (en) 2013-12-05 2018-09-18 The Mathworks, Inc. Systems and methods for estimating performance characteristics of hardware implementations of executable models
US10261760B1 (en) 2013-12-05 2019-04-16 The Mathworks, Inc. Systems and methods for tracing performance information from hardware realizations to models
CN105849801B (zh) 2013-12-27 2020-02-14 索尼公司 解码设备和方法以及程序
US8977376B1 (en) 2014-01-06 2015-03-10 Alpine Electronics of Silicon Valley, Inc. Reproducing audio signals with a haptic apparatus on acoustic headphones and their calibration and measurement
US10986454B2 (en) 2014-01-06 2021-04-20 Alpine Electronics of Silicon Valley, Inc. Sound normalization and frequency remapping using haptic feedback
US8767996B1 (en) 2014-01-06 2014-07-01 Alpine Electronics of Silicon Valley, Inc. Methods and devices for reproducing audio signals with a haptic apparatus on acoustic headphones
EP3111560B1 (en) * 2014-02-27 2021-05-26 Telefonaktiebolaget LM Ericsson (publ) Method and apparatus for pyramid vector quantization indexing and de-indexing of audio/video sample vectors
US9564136B2 (en) * 2014-03-06 2017-02-07 Dts, Inc. Post-encoding bitrate reduction of multiple object audio
CN109087653B (zh) * 2014-03-24 2023-09-15 杜比国际公司 对高阶高保真立体声信号应用动态范围压缩的方法和设备
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device
FR3020732A1 (fr) * 2014-04-30 2015-11-06 Orange Correction de perte de trame perfectionnee avec information de voisement
US9997171B2 (en) * 2014-05-01 2018-06-12 Gn Hearing A/S Multi-band signal processor for digital audio signals
US10115410B2 (en) * 2014-06-10 2018-10-30 Peter Graham Craven Digital encapsulation of audio signals
JP6432180B2 (ja) * 2014-06-26 2018-12-05 ソニー株式会社 復号装置および方法、並びにプログラム
EP2960903A1 (en) * 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
CN113793617A (zh) * 2014-06-27 2021-12-14 杜比国际公司 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法
EP2980795A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2988300A1 (en) * 2014-08-18 2016-02-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Switching of sampling rates at audio processing devices
CN111951814A (zh) * 2014-09-04 2020-11-17 索尼公司 传输设备、传输方法、接收设备以及接收方法
DE112015004185T5 (de) 2014-09-12 2017-06-01 Knowles Electronics, Llc Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten
CN113257273A (zh) * 2014-10-01 2021-08-13 杜比国际公司 高效drc配置文件传输
CN105632503B (zh) * 2014-10-28 2019-09-03 南宁富桂精密工业有限公司 信息隐藏方法及***
US9659578B2 (en) * 2014-11-27 2017-05-23 Tata Consultancy Services Ltd. Computer implemented system and method for identifying significant speech frames within speech signals
WO2016135329A1 (en) * 2015-02-27 2016-09-01 Auro Technologies Encoding and decoding digital data sets
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
EP3067886A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
CN106161313A (zh) * 2015-03-30 2016-11-23 索尼公司 无线通信***中的电子设备、无线通信***和方法
US10043527B1 (en) * 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation
CN111970629B (zh) 2015-08-25 2022-05-17 杜比实验室特许公司 音频解码器和解码方法
EP3353786B1 (en) * 2015-09-25 2019-07-31 Dolby Laboratories Licensing Corporation Processing high-definition audio data
US10423733B1 (en) 2015-12-03 2019-09-24 The Mathworks, Inc. Systems and methods for sharing resources having different data types
US10395664B2 (en) 2016-01-26 2019-08-27 Dolby Laboratories Licensing Corporation Adaptive Quantization
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
US10770088B2 (en) * 2016-05-10 2020-09-08 Immersion Networks, Inc. Adaptive audio decoder system, method and article
US10699725B2 (en) * 2016-05-10 2020-06-30 Immersion Networks, Inc. Adaptive audio encoder system, method and article
US20170330575A1 (en) * 2016-05-10 2017-11-16 Immersion Services LLC Adaptive audio codec system, method and article
KR20190011742A (ko) * 2016-05-10 2019-02-07 이멀젼 서비시즈 엘엘씨 적응형 오디오 코덱 시스템, 방법, 장치 및 매체
US10756755B2 (en) * 2016-05-10 2020-08-25 Immersion Networks, Inc. Adaptive audio codec system, method and article
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
CN105869648B (zh) * 2016-05-19 2019-11-22 日立楼宇技术(广州)有限公司 混音方法及装置
JP7039494B2 (ja) 2016-06-17 2022-03-22 ディーティーエス・インコーポレイテッド 近/遠距離レンダリングを用いた距離パニング
US10375498B2 (en) 2016-11-16 2019-08-06 Dts, Inc. Graphical user interface for calibrating a surround sound system
MX2019005805A (es) * 2016-11-23 2019-08-12 Ericsson Telefon Ab L M Metodo y aparato para el control adaptativo de filtros de descorrelacion.
JP2018092012A (ja) * 2016-12-05 2018-06-14 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
US10362269B2 (en) * 2017-01-11 2019-07-23 Ringcentral, Inc. Systems and methods for determining one or more active speakers during an audio or video conference session
US10339947B2 (en) * 2017-03-22 2019-07-02 Immersion Networks, Inc. System and method for processing audio data
US10699721B2 (en) * 2017-04-25 2020-06-30 Dts, Inc. Encoding and decoding of digital audio signals using difference data
CN109427338B (zh) * 2017-08-23 2021-03-30 华为技术有限公司 立体声信号的编码方法和编码装置
US11227615B2 (en) * 2017-09-08 2022-01-18 Sony Corporation Sound processing apparatus and sound processing method
CN112262585B (zh) 2018-04-08 2022-05-13 Dts公司 环境立体声深度提取
EP3775821A1 (en) 2018-04-11 2021-02-17 Dolby Laboratories Licensing Corporation Perceptually-based loss functions for audio encoding and decoding based on machine learning
CN109243471B (zh) * 2018-09-26 2022-09-23 杭州联汇科技股份有限公司 一种快速编码广播用数字音频的方法
US10763885B2 (en) 2018-11-06 2020-09-01 Stmicroelectronics S.R.L. Method of error concealment, and associated device
CN111341303B (zh) * 2018-12-19 2023-10-31 北京猎户星空科技有限公司 一种声学模型的训练方法及装置、语音识别方法及装置
CN109831280A (zh) * 2019-02-28 2019-05-31 深圳市友杰智新科技有限公司 一种声波通讯方法、装置及可读存储介质
KR20200123531A (ko) * 2019-04-22 2020-10-30 주식회사 쏠리드 통신 신호를 처리하는 방법 및 이를 이용하는 통신 노드
US11361772B2 (en) 2019-05-14 2022-06-14 Microsoft Technology Licensing, Llc Adaptive and fixed mapping for compression and decompression of audio data
US10681463B1 (en) 2019-05-17 2020-06-09 Sonos, Inc. Wireless transmission to satellites for multichannel audio system
WO2020232631A1 (zh) * 2019-05-21 2020-11-26 深圳市汇顶科技股份有限公司 一种语音分频传输方法、源端、播放端、源端电路和播放端电路
CN113950845B (zh) 2019-05-31 2023-08-04 Dts公司 凹式音频渲染
CN110365342B (zh) * 2019-06-06 2023-05-12 中车青岛四方机车车辆股份有限公司 波形解码方法及装置
EP3751567B1 (en) * 2019-06-10 2022-01-26 Axis AB A method, a computer program, an encoder and a monitoring device
US11380343B2 (en) 2019-09-12 2022-07-05 Immersion Networks, Inc. Systems and methods for processing high frequency audio signal
GB2587196A (en) * 2019-09-13 2021-03-24 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
CN112530444B (zh) * 2019-09-18 2023-10-03 华为技术有限公司 音频编码方法和装置
US20210224024A1 (en) * 2020-01-21 2021-07-22 Audiowise Technology Inc. Bluetooth audio system with low latency, and audio source and audio sink thereof
US20230113561A1 (en) * 2020-03-13 2023-04-13 Immersion Networks, Inc. Loudness equalization system
CN111261194A (zh) * 2020-04-29 2020-06-09 浙江百应科技有限公司 一种基于pcm技术的音量分析方法
CN112037802B (zh) * 2020-05-08 2022-04-01 珠海市杰理科技股份有限公司 基于语音端点检测的音频编码方法及装置、设备、介质
CN111583942B (zh) * 2020-05-26 2023-06-13 腾讯科技(深圳)有限公司 语音会话的编码码率控制方法、装置和计算机设备
CN112187397B (zh) * 2020-09-11 2022-04-29 烽火通信科技股份有限公司 一种通用的多通道数据同步方法和装置
CN112885364B (zh) * 2021-01-21 2023-10-13 维沃移动通信有限公司 音频编码方法和解码方法、音频编码装置和解码装置
CN113485190B (zh) * 2021-07-13 2022-11-11 西安电子科技大学 一种多通道数据采集***及采集方法
US20230154474A1 (en) * 2021-11-17 2023-05-18 Agora Lab, Inc. System and method for providing high quality audio communication over low bit rate connection
WO2024012666A1 (en) * 2022-07-12 2024-01-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding ar/vr metadata with generic codebooks
CN115171709B (zh) * 2022-09-05 2022-11-18 腾讯科技(深圳)有限公司 语音编码、解码方法、装置、计算机设备和存储介质
US11935550B1 (en) * 2023-03-31 2024-03-19 The Adt Security Corporation Audio compression for low overhead decompression

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3171990D1 (en) * 1981-04-30 1985-10-03 Ibm Speech coding methods and apparatus for carrying out the method
JPS5921039B2 (ja) * 1981-11-04 1984-05-17 日本電信電話株式会社 適応予測符号化方式
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
US4547816A (en) 1982-05-03 1985-10-15 Robert Bosch Gmbh Method of recording digital audio and video signals in the same track
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
US4757536A (en) * 1984-10-17 1988-07-12 General Electric Company Method and apparatus for transceiving cryptographically encoded digital data
US5051991A (en) * 1984-10-17 1991-09-24 Ericsson Ge Mobile Communications Inc. Method and apparatus for efficient digital time delay compensation in compressed bandwidth signal processing
US4622680A (en) * 1984-10-17 1986-11-11 General Electric Company Hybrid subband coder/decoder method and apparatus
US4817146A (en) * 1984-10-17 1989-03-28 General Electric Company Cryptographic digital signal transceiver method and apparatus
US4675863A (en) * 1985-03-20 1987-06-23 International Mobile Machines Corp. Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels
JPS62154368A (ja) 1985-12-27 1987-07-09 Canon Inc 記録装置
US4815074A (en) * 1986-08-01 1989-03-21 General Datacomm, Inc. High speed bit interleaved time division multiplexer for multinode communication systems
US4899384A (en) * 1986-08-25 1990-02-06 Ibm Corporation Table controlled dynamic bit allocation in a variable rate sub-band speech coder
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
US4881224A (en) 1988-10-19 1989-11-14 General Datacomm, Inc. Framing algorithm for bit interleaved time division multiplexer
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
DE69017977T2 (de) 1989-07-29 1995-08-03 Sony Corp 4-Kanal-PCM-Signalverarbeitungsgerät.
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
US5235623A (en) * 1989-11-14 1993-08-10 Nec Corporation Adaptive transform coding by selecting optimum block lengths according to variatons between successive blocks
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
JP2841765B2 (ja) * 1990-07-13 1998-12-24 日本電気株式会社 適応ビット割当て方法及び装置
JPH04127747A (ja) * 1990-09-19 1992-04-28 Toshiba Corp 可変レート符号化方式
US5365553A (en) * 1990-11-30 1994-11-15 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit need determiner for subband coding a digital signal
US5136377A (en) * 1990-12-11 1992-08-04 At&T Bell Laboratories Adaptive non-linear quantizer
US5123015A (en) * 1990-12-20 1992-06-16 Hughes Aircraft Company Daisy chain multiplexer
DE69210689T2 (de) * 1991-01-08 1996-11-21 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
NL9100285A (nl) * 1991-02-19 1992-09-16 Koninkl Philips Electronics Nv Transmissiesysteem, en ontvanger te gebruiken in het transmissiesysteem.
ZA921988B (en) * 1991-03-29 1993-02-24 Sony Corp High efficiency digital data encoding and decoding apparatus
EP0506394A2 (en) * 1991-03-29 1992-09-30 Sony Corporation Coding apparatus for digital signals
JP3134338B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル音声信号符号化方法
DE69232202T2 (de) * 1991-06-11 2002-07-25 Qualcomm Inc Vocoder mit veraendlicher bitrate
JP3508138B2 (ja) 1991-06-25 2004-03-22 ソニー株式会社 信号処理装置
KR100268623B1 (ko) * 1991-06-28 2000-10-16 이데이 노부유끼 압축 데이타 기록 재생 장치 및 신호 처리 방법
DE69232251T2 (de) * 1991-08-02 2002-07-18 Sony Corp Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung
KR100263599B1 (ko) * 1991-09-02 2000-08-01 요트.게.아. 롤페즈 인코딩 시스템
JP3226945B2 (ja) * 1991-10-02 2001-11-12 キヤノン株式会社 マルチメディア通信装置
FR2685593B1 (fr) * 1991-12-20 1994-02-11 France Telecom Dispositif de demultiplexage en frequence a filtres numeriques.
US5642437A (en) * 1992-02-22 1997-06-24 Texas Instruments Incorporated System decoder circuit with temporary bit storage and method of operation
EP0559348A3 (en) * 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
CA2090052C (en) * 1992-03-02 1998-11-24 Anibal Joao De Sousa Ferreira Method and apparatus for the perceptual coding of audio signals
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
TW235392B (ru) * 1992-06-02 1994-12-01 Philips Electronics Nv
US5436940A (en) * 1992-06-11 1995-07-25 Massachusetts Institute Of Technology Quadrature mirror filter banks and method
JP2976701B2 (ja) * 1992-06-24 1999-11-10 日本電気株式会社 量子化ビット数割当方法
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
US5396489A (en) * 1992-10-26 1995-03-07 Motorola Inc. Method and means for transmultiplexing signals between signal terminals and radio frequency channels
US5381145A (en) * 1993-02-10 1995-01-10 Ricoh Corporation Method and apparatus for parallel decoding and encoding of data
US5657423A (en) * 1993-02-22 1997-08-12 Texas Instruments Incorporated Hardware filter circuit and address circuitry for MPEG encoded data
TW272341B (ru) * 1993-07-16 1996-03-11 Sony Co Ltd
US5451954A (en) * 1993-08-04 1995-09-19 Dolby Laboratories Licensing Corporation Quantization noise suppression for encoder/decoder system
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
JPH07202820A (ja) * 1993-12-28 1995-08-04 Matsushita Electric Ind Co Ltd ビットレート制御システム
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
JP2778482B2 (ja) * 1994-09-26 1998-07-23 日本電気株式会社 帯域分割符号化装置
US5748903A (en) * 1995-07-21 1998-05-05 Intel Corporation Encoding images using decode rate control
ES2201929B1 (es) * 2002-09-12 2005-05-16 Araclon Biotech, S.L. Anticuerpos policlonales, metodo de preparacion y uso de los mismos.

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2682340C1 (ru) * 2010-09-16 2019-03-19 Долби Интернешнл Аб Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
US10446161B2 (en) 2010-09-16 2019-10-15 Dolby International Ab Cross product enhanced subband block based harmonic transposition
US10706863B2 (en) 2010-09-16 2020-07-07 Dolby International Ab Cross product enhanced subband block based harmonic transposition
US11355133B2 (en) 2010-09-16 2022-06-07 Dolby International Ab Cross product enhanced subband block based harmonic transposition
US11817110B2 (en) 2010-09-16 2023-11-14 Dolby International Ab Cross product enhanced subband block based harmonic transposition
RU2560788C2 (ru) * 2011-02-14 2015-08-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки декодированного аудиосигнала в спектральной области
US9153236B2 (en) 2011-02-14 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
CN108449704A (zh) * 2013-10-22 2018-08-24 韩国电子通信研究院 生成用于音频信号的滤波器的方法及其参数化装置
US12033645B2 (en) 2023-10-05 2024-07-09 Dolby International Ab Cross product enhanced subband block based harmonic transposition

Also Published As

Publication number Publication date
BR9611852A (pt) 2000-05-16
DE69633633T2 (de) 2005-10-27
AU1058997A (en) 1997-06-27
CN1303583C (zh) 2007-03-07
ES2232842T3 (es) 2005-06-01
CA2238026A1 (en) 1997-06-12
CA2331611A1 (en) 1997-06-12
EA199800505A1 (ru) 1998-12-24
US5974380A (en) 1999-10-26
HK1149979A1 (en) 2011-10-21
CN1848242B (zh) 2012-04-18
HK1092270A1 (en) 2007-02-02
US5956674A (en) 1999-09-21
JP4174072B2 (ja) 2008-10-29
US6487535B1 (en) 2002-11-26
CA2238026C (en) 2002-07-09
EP0864146B1 (en) 2004-10-13
CN1132151C (zh) 2003-12-24
CN1848242A (zh) 2006-10-18
CN101872618A (zh) 2010-10-27
CA2331611C (en) 2001-09-11
KR19990071708A (ko) 1999-09-27
EP0864146A4 (en) 2001-09-19
CN1848241B (zh) 2010-12-15
PL183498B1 (pl) 2002-06-28
CN1495705A (zh) 2004-05-12
AU705194B2 (en) 1999-05-20
DK0864146T3 (da) 2005-02-14
ATE279770T1 (de) 2004-10-15
PL327082A1 (en) 1998-11-23
DE69633633D1 (de) 2004-11-18
MX9804320A (es) 1998-11-30
JP2000501846A (ja) 2000-02-15
PL182240B1 (pl) 2001-11-30
WO1997021211A1 (en) 1997-06-12
CN1848241A (zh) 2006-10-18
HK1092271A1 (en) 2007-02-02
CN101872618B (zh) 2012-08-22
KR100277819B1 (ko) 2001-01-15
PL183092B1 (pl) 2002-05-31
US5978762A (en) 1999-11-02
CN1208489A (zh) 1999-02-17
PT864146E (pt) 2005-02-28
EP0864146A1 (en) 1998-09-16
HK1015510A1 (en) 1999-10-15

Similar Documents

Publication Publication Date Title
EA001087B1 (ru) Многоканальный прогнозирующий кодировщик поддиапазона, использующий психоакустическое адаптивное распределение бит
US11308969B2 (en) Methods and apparatus for reconstructing audio signals with decorrelation and differentially coded parameters
AU2012208987B2 (en) Multichannel Audio Coding

Legal Events

Date Code Title Description
TC4A Change in name of a patent proprietor in a eurasian patent

Designated state(s): RU

MK4A Patent expired

Designated state(s): AM AZ BY KZ KG MD TJ TM RU