EA001087B1 - Многоканальный прогнозирующий кодировщик поддиапазона, использующий психоакустическое адаптивное распределение бит - Google Patents
Многоканальный прогнозирующий кодировщик поддиапазона, использующий психоакустическое адаптивное распределение бит Download PDFInfo
- Publication number
- EA001087B1 EA001087B1 EA199800505A EA199800505A EA001087B1 EA 001087 B1 EA001087 B1 EA 001087B1 EA 199800505 A EA199800505 A EA 199800505A EA 199800505 A EA199800505 A EA 199800505A EA 001087 B1 EA001087 B1 EA 001087B1
- Authority
- EA
- Eurasian Patent Office
- Prior art keywords
- audio
- channel
- subband
- frequency
- block
- Prior art date
Links
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 18
- 238000005070 sampling Methods 0.000 claims abstract description 102
- 230000001052 transient effect Effects 0.000 claims abstract description 45
- 239000000872 buffer Substances 0.000 claims abstract description 38
- 230000005540 biological transmission Effects 0.000 claims abstract description 37
- 230000005236 sound signal Effects 0.000 claims abstract description 36
- 238000012856 packing Methods 0.000 claims abstract description 4
- 238000011045 prefiltration Methods 0.000 claims abstract description 3
- 238000000034 method Methods 0.000 claims description 98
- 230000008569 process Effects 0.000 claims description 73
- 238000011084 recovery Methods 0.000 claims description 17
- 230000007704 transition Effects 0.000 claims description 14
- 230000002441 reversible effect Effects 0.000 claims description 8
- 230000006837 decompression Effects 0.000 claims description 4
- 230000036961 partial effect Effects 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000004806 packaging method and process Methods 0.000 claims description 3
- 238000013139 quantization Methods 0.000 description 51
- 238000009826 distribution Methods 0.000 description 48
- 239000013598 vector Substances 0.000 description 41
- 239000000523 sample Substances 0.000 description 34
- 238000004458 analytical method Methods 0.000 description 26
- 230000000694 effects Effects 0.000 description 19
- 238000004364 calculation method Methods 0.000 description 18
- 238000013459 approach Methods 0.000 description 13
- 230000007423 decrease Effects 0.000 description 13
- 230000006835 compression Effects 0.000 description 12
- 238000007906 compression Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 10
- 230000002829 reductive effect Effects 0.000 description 10
- 238000001514 detection method Methods 0.000 description 9
- 230000000873 masking effect Effects 0.000 description 9
- 238000012546 transfer Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 238000013507 mapping Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 238000003491 array Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 230000001629 suppression Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000012723 sample buffer Substances 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000958041 Homo sapiens Musculin Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004026 adhesive bonding Methods 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 102000046949 human MSC Human genes 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 229910000859 α-Fe Inorganic materials 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Stereo-Broadcasting Methods (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Color Television Systems (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
Настоящее изобретение относится к высококачественному кодированию и декодированию многоканальных аудиосигналов и, более конкретно, к кодировщику поддиапазона, который использует фильтры полного/неполного восстановления, прогнозирующее/непрогнозирующее кодирование поддиапазона, анализ переходного процесса и психоакустическое/минимальной среднеквадратической ошибки (МСКО) распределение бит во времени, по частоте и множественным аудиоканалам для генерации потока данных с ограниченной вычислительной нагрузкой декодирования.
Описание предшествующего уровня техники Известные высококачественные аудио и музыкальные кодировщики могут быть разделены на два класса схем. Первый включает в себя кодировщики поддиапазона/преобразования от среднего до высокочастотного разрешения, которые адаптивно квантуют поддиапазон или выборки коэффициентов внутри кадра анализа в соответствии с вычислением психоакустической маски. Второй включает в себя кодировщики поддиапазона низкого разрешения, которые компенсируют свое плохое частотное разрешение обработкой выборок поддиапазона, используя адаптивную дифференциальную импульснокодовую модуляцию (АДИКМ).
Первый класс кодировщиков использует большие краткосрочные спектральные изменения обычных музыкальных сигналов, путем адаптации распределений бит в соответствии со спектральной мощностью сигнала. Высокое разрешение этих кодировщиков позволяет подавать частотно преобразованные сигналы непосредственно в психоакустическую модель, которая основана на теории критического диапазона частот слуха (предела слышимости). Аудиокодировщик АС-3 Долби, Тодд и др. «АС 3: гибкое кодирование восприятия для аудиопередачи и запоминания», Съезд общества аудиоинженеров, февраль, 1994, обычно вычисляет 1024 быстрых преобразований Фурье (БПФ) на соответствующих сигналах импульсно кодовой модуляции (ИКМ) и подает психоаналитическую модель в 1 024 частотных коэффициента в каждом канале для определения скорости бит для каждого коэффициента. Система Долби использует анализ импульсной помехи, который уменьшает размер кадра до 256 выборок для выделения коротких импульсов. Кодировщик АС-3 использует ранее запатентованный алгоритм обратной адаптации для декодирования распределения бит. Это уменьшает количество информации распределения бит, которую посылают вместе с закодированными аудиоданными. В результате ширина полосы частот для аудиосигнала увеличивается больше прямых адаптивных схем, что приводит к улучшению качества звука.
Во втором классе кодировщиков квантование дифференциальных сигналов поддиапазона является либо фиксированным, либо адаптируется для минимизации мощности шума квантования на всех или некоторых из поддиапазонов без какого-либо явного отношения к теории психоакустической маскировки. Общепринято, что прямой порог психоакустического искажения не может быть применен к прогнозирующим/дифференциальным сигналам поддиапазона из-за трудности оценки эффективности прогнозатора перед процессом распределения бит. Проблема дополнительно усложняется воздействием шума квантования на процесс прогнозирования.
Эти кодировщики работают, поскольку воспринимаемые критические аудиосигналы являются обычно периодическими в течение длительных периодов времени. Эта периодичность используется прогнозирующим дифференциальным квантованием. Разделение сигнала на небольшое число поддиапазонов уменьшает слышимые эффекты модуляции шума и допускает использование длительных спектральных изменений в аудиосигналах. Если число поддиапазонов увеличивается, выигрыш прогнозирования внутри каждого поддиапазона уменьшается и в некоторой точке выигрыш прогнозирования будет стремиться к нулю.
Цифровые театральные системы, Ь.Р. (ЦТС) используют аудиокодировщик, в котором каждый аудиоканал ИКМ фильтруют в четыре поддиапазона, и каждый поддиапазон кодируют с использованием обратного кодировщика АДИКМ, который адаптирует коэффициенты прогнозатора к данным поддиапазона. Распределение бит является фиксированным и одинаковым для каждого канала, причем более низким частотным поддиапазонам назначается больше бит, чем более высоким частотным поддиапазонам. Распределение бит обеспечивает фиксированную степень сжатия, например, 4:1 . Кодировщик ЦТС описан Майком Смитом и Стефаном Смитом, «АРТ-Х100: аудиокодировщик АДИКМ поддиапазона малой задержки, низкой скорости бит для радиовещания», Труды 1 0-ой международной конференции общества аудиоинженеров, 1991, с. 41-56.
Оба типа аудиокодировщиков имеют другие общие ограничения. Во-первых, известные аудиокодировщики кодируют/декодируют с фиксированным размером блока, т.е. число выборок или период времени, представляемый блоком является фиксированным. В результате, когда скорость закодированной передачи увеличивается относительно скорости выборки, количество данных (байтов) в блоке также увеличивается. Следовательно, размер буфера декодировщика должен быть спроектирован с учетом наихудшего случая для избежания переполнения данных. Это увеличивает величину памяти с произвольной выборкой (ППВ), которая являет3 ся наиболее дорогой компонентой декодировщика. Во-вторых, известные аудиокодировщики являются трудно расширяемыми для частот выборки больше, чем 48 кГц. Это сделало бы существующие декодировщики несовместимыми с форматом, требуемым для новых кодировщиков. Это отсутствие будущей совместимости является серьезным ограничением. Кроме того, известные форматы, используемые для кодирования данных ИКМ, требуют, чтобы весь блок был считан декодировщиком перед тем, как начнется воспроизведение. Это требует, чтобы размер буфера был ограничен приблизительно до блоков данных 100 мс, таких, чтобы задержка или время ожидания не раздражала слушателя.
Несмотря на то, что эти кодировщики имеют способность кодирования до 24 кГц, часто более высокие поддиапазоны отбрасывают. Это уменьшает высокочастотную достоверность или окружение восстановленного сигнала. Известные кодировщики обычно используют одну из двух типов схем обнаружения ошибки. Наиболее распространенным является кодирование Рида Соломона, в котором кодировщик добавляет биты обнаружения ошибки к вспомогательной информации в потоке данных. Это облегчает обнаружение и коррекцию любых ошибок в вспомогательной информации. Однако ошибки в аудиоданных проходят необнаруженными. Другим подходом является проверка блока и аудиозаголовков для неправильных состояний кода. Например, конкретный 3-битовый параметр может иметь только 3 правильных состояния. Если идентифицируют одно из других 5 состояний, возникает ошибка. Это обеспечивает только способность обнаружения и не обнаруживает ошибки в аудиоданных.
Краткое изложение изобретения
Принимая во внимание вышеупомянутые проблемы, настоящим изобретением предложен многоканальный аудиокодировщик с гибкостью приспосабливания широкого диапазона уровней сжатия с лучшим качеством, чем компакт-диск, на высоких скоростях бит и улучшенным качеством восприятия на низких скоростях бит, с уменьшенным временем ожидания воспроизведениия, упрощенным обнаружением ошибок, улучшенным искажением предэха и дополнительной расширяемостью в более высокие частоты выборки.
Это достигается кодировщиком поддиапазона, который кадрирует каждый аудиоканал в последовательность аудиоблоков, фильтрует блоки в диапазон основной полосы частот и высокочастотный диапазон и разделяет каждый сигнал основной полосы частот на множество поддиапазонов. Кодировщик поддиапазона обычно выбирает неполный фильтр для разделения сигнала основной полосы частот, когда скорость бит является низкой, но выбирает полный фильтр, когда скорость бит является достаточно высокой. Высокочастотный каскад кодирования кодирует высокочастотный сигнал независимо от сигнала основной полосы частот. Каскад кодирования основной полосы частот содержит кодировщик векторного кодирования (ВК) и кодировщик адаптивной дифференциальной импульсно-кодовой модуляции (АДИКМ), которые кодируют более высокие и более низкие частотные поддиапазоны, соответственно. Каждый блок поддиапазона содержит по меньшей мере один подблок, каждый из которых дополнительно подразделяется на множество подподблоков. Каждый подблок анализируют для оценки выигрыша прогнозирования кодировщика АДИКМ, причем способность прогнозирования блокируют, когда выигрыш прогнозирования является низким, и для обнаружения переходных процессов для регулировки масштабных коэффициентов (МК) перед и после переходным процессом.
Система глобального управления битами (ГУБ) распределяет биты в каждый подблок, используя разности между множественными аудиоканалами, множественными поддиапазонами и подблоками внутри текущего блока. Система ГУБ первоначально распределяет биты в каждый подблок вычислением его отношения сигнала к маске (ОСМ), модифицированного прогнозируемым коэффициентом передачи для соответствия психоакустической модели. Затем система ГУБ распределяет оставшиеся биты в соответствии с подходом минимальной среднеквадратической ошибки (МСКО) для того, чтобы либо немедленно переключиться в распределение МСКО, ниже общего минимального уровня шума, либо постепенно морфировать в распределение МСКО.
Мультиплексор генерирует выходные блоки, которые содержат слово синхронизации, заголовок блока, аудиозаголовок и, по меньшей мере, один подблок, и которые мультиплексируют в поток данных со скоростью передачи. Заголовок блока содержит размер кадра текущего выходного блока. Аудиозаголовок указывает устройство упаковки и формат кодирования для аудиоблока. Каждый аудиоподблок содержит вспомогательную информацию для декодирования аудиоподблока без ссылки на другой подблок, коды высокочастотного ВК, множество аудиоподподблоков основной полосы частот, в которых аудиоданные для низкочастотных поддиапазонов каждого канала упаковывают и мультиплексируют с другими каналами, высокочастотный аудиоблок, в котором аудиоданные в высокочастотном диапазоне для каждого канала упаковывают и мультиплексируют с другими каналами так, что многоканальный аудиосигнал является декодируемым на множестве частот выборок декодирования, и синхронизацию распаковки для проверки конца подблока.
Размер кадра выбирают как функцию отношения скорости передачи к частоте выборки кодировщика так, что размер выходного блока ограничен, чтобы находиться в требуемом диапазоне. Когда величина сжатия относительно низкая, размер кадра уменьшают так, чтобы он не превышал верхнего максимума. В результате декодировщик может использовать входной буфер с фиксированной, относительно малой величиной памяти с произвольной выборкой (ПИВ). Когда величина сжатия относительно высока, размер кадра увеличивается. В результате система ГУБ может распределять биты относительно большего временного кадра, таким образом улучшая эффективность кодировщика.
Эти и другие особенности и преимущества изобретения станут очевидны специалистам в данной области техники из нижеследующего подробного описания предпочтительных вариантов осуществления со ссылками на сопровождающие чертежи и таблицы.
Краткое описание чертежей
Фиг. 1 - блок-схема 5-канального аудиокодировщика в соответствии с настоящим изобретением;
фиг. 2 - блок-схема многоканального кодировщика;
фиг. 3 - блок-схема кодировщика и декодировщика основной полосы частот;
фиг. 4а и фиг. 4Ь - блок-схемы кодировщика и декодировщика высокой частоты выборки;
фиг. 5 - блок-схема простого кодировщика канала;
фиг. 6 - график байтов на блок относительно размера блока для переменных скоростей передачи;
фиг. 7 - график амплитудной характеристики для фильтров неполного и полного восстановления (НИВ и ИВ);
фиг. 8 - график эффекта наложения поддиапазона для фильтра восстановления;
фиг. 9 - график кривых искажения для фильтров НИВ и ИВ;
фиг. 10 - принципиальная схема кодировщика одного поддиапазона;
фиг. 11а и фиг. 11Ь - обнаружение переходного процесса и вычисление масштабного коэффициента, соответственно, для подблока;
фиг. 1 2 - процесс кодирования энтропии для квантованных значений ΤΜΘΌΕ;
фиг. 13 - процесс квантования масштабного коэффициента;
фиг. 1 4 - свертывание маски сигнала с частотной характеристикой сигнала для генерации отношений сигнала к маске (ОСМ);
фиг. 1 5 - график слуховой реакции человека;
фиг. 1 6 - график значений ОСМ для поддиапазонов;
фиг. 1 7 - график сигнала ошибки для психоакустического распределения бит и распределения бит с минимальной среднеквадратической ошибкой (мско);
фиг. 18а и фиг. 18Ь - график уровней мощности поддиапазона и инвертированный график, соответственно, представляющие процесс распределения бит с «заполнением водой» мско;
фиг. 1 9 - блок-схема одного блока в потоке данных;
фиг. 20 - принципиальная схема декодировщика;
фиг. 21 - блок-схема аппаратурной реализации кодировщика;
фиг. 22 - блок-схема аппаратурной реализации декодировщика.
Краткое описание таблиц
Таблица 1 представляет максимальный размер блока относительно частоты выборки и скорости передачи;
таблица 2 представляет максимально допустимый размер блока (байты) относительно частоты выборки и скорости передачи;
таблица 3 представляет зависимость между значением индекса ΑΒΙΤ, числом уровней квантования и результирующим ОСШ.
Подробное описание изобретения
Многоканальная система аудиокодирования.
Как показано на фиг. 1 , настоящее изобретение объединяет особенности обеих известных схем кодирования и дополнительные особенности в едином многоканальном кодировщике 1 0. Алгоритм кодирования разработан для выполнения на качественных студийных уровнях, т.е. качестве «лучше, чем компакт-диска», и обеспечивает широкий диапазон применений для различных уровней сжатия, частот выборки, длин слов, числа каналов и качества восприятия.
Кодировщик 12 кодирует множественные каналы аудиоданных 14 импульсно-кодовой модуляции (ИКМ), обычно выбираемые при 48 кГц с длинами слов между 1 6 и 24 битами, в поток 16 данных при известной скорости передачи, предпочтительно в диапазоне 32-4096 кбит/с. В отличие от известных аудиокодировщиков настоящая архитектура может быть распространена на более высокие частоты выборки (48-192 кГц) с обеспечением совместимости с существующими декодировщиками, которые были разработаны для частоты выборки основной полосы частот или любой промежуточной частоты выборки. Кроме того, данные 1 4 ИКМ кадрируют и кодируют по одному блоку, где каждый блок предпочтительно разбивают на 1 -4 подблока. Размер аудиокадра, т.е. число выборок ИКМ, основан на относительных значениях частоты выборки и скорости передачи, так что размер выходного блока, т. е. число байтов, считываемых кодировщиком на блок, ограничено, предпочтительно между 5,3 и 8 кбайтами.
В результате величину памяти с произвольной выборкой (ПИВ), требуемую в декодировщике для буферизации входящего потока данных, поддерживают сравнительной малой, что снижает стоимость декодировщика. Ири низких скоростях могут быть использованы большие размеры кадра для разделения на блоки данных ИКМ, что улучшает эффективность кодирования. При более высоких скоростях бит могут быть использованы меньшие размеры кадра для удовлетворения ограничений данных. Это снижает эффективность кодирования, но при более высоких скоростях такое снижение незначительно. Такой способ, в котором данные ИКМ разбивают на блоки, позволяет декодировщику 18 начать воспроизведение до того, как весь выходной блок считан в буфер. Это уменьшает задержку или время ожидания аудиокодировщика.
Кодировщик 12 использует группу фильтров высокого разрешения, которую предпочтительно переключают между фильтрами неполного восстановления и полного восстановления (НПВ и ПВ) на основе скорости бит, для декомпозиции каждого аудиоканала 14 на ряд сигналов поддиапазона. Прогнозирующие кодировщики и кодировщики векторного квантования (ВК) используют для кодирования нижних и верхних частотных поддиапазонов, соответственно. Начальный поддиапазон ВК может быть зафиксирован или может быть определён динамически как функция параметров текущего сигнала. Совместное кодирование частоты может быть использовано при низких скоростях бит для одновременного кодирования множественных каналов в более высоких частотных поддиапазонах.
Прогнозирующий кодировщик предпочтительно переключают между режимами адаптивной импульсно-кодовой модуляции (АИКМ) и адаптивной дифференциальной импульснокодовой модуляции (АДИКМ) на основе выигрыша прогнозирования поддиапазона. Анализатор импульсной помехи сегментирует каждый подблок поддиапазона на сигналы предэха и постэха (подподблоки) и вычисляет соответствующие масштабные коэффициенты для подподблоков предэхо и постэхо, таким образом уменьшая предэхо искажения. Кодировщик адаптивно распределяет имеющуюся скорость бит по всем каналам ИКМ и поддиапазонам для текущего блока в соответствии с их соответствующими требованиями (психоакустическими или среднеквадратической ошибки) для оптимизации эффективности кодирования. При комбинировании прогнозирующего кодирования и психоакустического моделирования эффективность кодирования с низкой скоростью бит увеличивается, таким образом понижая скорость бит, при которой достигается субъективная прозрачность. Программируемый контроллер 19, как, например, компьютер или клавиатура, сопрягают с кодировщиком 1 2 для передачи информации аудиорежима, включая такие параметры, как, например, требуемая скорость бит, число каналов, полное или неполное восстановление, частота выборки и скорость передачи.
Кодированные сигналы и дополнительную информацию упаковывают и мультиплексируют в поток 16 данных, чтобы вычислительная нагрузка декодирования была ограничена для нахождения в требуемом диапазоне. Поток 1 6 данных кодируют или транслируют через носитель 20 передачи, как, например, компакт-диск (КД), цифровой видеодиск (ЦВД) или прямой спутник ретрансляции. Декодировщик 1 8 декодирует отдельные сигналы поддиапазона и выполняет операцию обратной фильтрации для генерации многоканального аудиосигнала 22, который субъективно эквивалентен исходному многоканальному аудиосигналу 1 4. Аудиосистема 24, например, система домашнего театра или мультимедийный компьютер воспроизводят аудиосигналы для пользователя.
Многоканальный кодировщик.
Как показано на фиг. 2, кодировщик 12 содержит множество отдельных кодировщиков 26 канала, предпочтительно пять (левый передний, центральный, правый передний, левый задний и правый задний), которые вырабатывают соответствующие множества кодированных сигналов 28 поддиапазона, приемлемо 32 сигнала поддиапазона на канал. Кодировщик 1 2 использует глобальную систему 30 управления битами (ГУБ), которая динамически распределяет биты из общего пула (буферной области) бит между каналами, между поддиапазонами внутри канала и внутри отдельного блока в данном поддиапазоне. Кодировщик 12 может также использовать способы совместного кодирования частоты, чтобы использовать междуканальные корреляции в высокочастотных поддиапазонах. Кроме того, кодировщик может использовать ВК на более высоких частотных под-диапазонах, которые не являются особенно воспринимаемыми, для обеспечения основной высокочастотной достоверности или окружения при очень низкой скорости бит для текущего блока. Таким образом, кодировщик использует несопоставимые требования к сигналу, например, среднеквадратические значения поддиапазонов и психоакустические уровни маскировки, множественных каналов и неравномерное распределение мощности сигнала относительно частоты в каждом канале и относительно времени в данном блоке.
Обзор распределения бит.
Система 30 ГУБ сначала решает, какие поддиапазоны каналов будут кодировать совместно по частоте и усредняет эти данные, а затем определяет, какие поддиапазоны будут кодировать с использованием ВК и вычитает эти биты из имеющейся скорости бит. Решение, какие поддиапазоны будут подвергнуты ВК, может быть принято априори, что все поддиапазоны выше пороговой частоты являются ВК, или принято на основе психоакустических маскирующих эффектов отдельных поддиапазонов в каждом блоке. После чего система 30 ГУБ распределяет биты, используя психоакустическую маскировку в оставшихся поддиапазонах для оптимизации субъективного качества декодированного аудиосигнала. Если имеются дополнительные биты, кодировщик может переключиться в чистую схему мско, т.е. «заполнения водой», и перераспределить все биты на основе поддиапазонов относительно среднеквадратических величин для минимизации значения среднеквадратической величины сигнала ошибки. Это применимо при очень высоких скоростях бит. Предпочтительным подходом является сохранение психоакустического распределения бит и распределение только дополнительных бит в соответствии со схемой мско. Это поддерживает форму сигнала шума, создаваемого психоакустической маскировкой, но равномерно сдвигает минимальный уровень шума вниз.
Альтернативно предпочтительный подход может быть модифицирован таким образом, что дополнительные биты распределяют в соответствии с разностью между среднеквадратическим и психоакустическим уровнями. В результате психоакустическое распределение морфирует в распределение мско, когда скорость бит увеличивается, таким образом обеспечивая плавный переход между двумя способами. Вышеупомянутые способы особенно применимы для систем с фиксированной скоростью бит. Альтернативно кодировщик 12 может установить уровень искажения, субъективный или среднеквадратической ошибки, и дать возможность предельной скорости бит изменяться для поддержания уровня искажения. Мультиплексор 32 мультиплексирует сигналы поддиапазона и вспомогательную информацию в поток 16 данных в соответствии с конкретным форматом данных. Детали формата данных представлены на фиг. 20 ниже.
Кодирование основной полосы частот.
Для частот выборки в диапазоне 8-48 кГц кодировщик 26 канала, как показано на фиг. 3, использует однородную 512-отводную 32полосную группу 34 фильтров анализа, работающую с частотой выборки 48 кГц для разбиения аудиоспектра 0-24 кГц каждого канала на 32 поддиапазона, имеющих ширину полосы частот 750 Гц на поддиапазон. Кодирующий каскад 36 кодирует каждый сигнал поддиапазона и мультиплексирует 38 их в поток 16 сжатых данных. Декодировщик 1 8 принимает поток сжатых данных, выделяет кодированные данные каждого поддиапазона, используя распаковщик 40, декодирует каждый сигнал 42 поддиапазона и восстанавливает цифровые аудиосигналы ИКМ (частота выборки =48 кГц), используя однородную 512 - отводную 32 - полосную группу 44 фильтров интерполяции каждого канала.
В настоящей архитектуре все стратегии кодирования, например частот выборки 48, 96 или 192 кГц, используют 32-полосный процесс кодирования/декодирования на нижних (основной полосы частот) аудиочастотах, например, между 0-24 кГц. Таким образом, кодировщики, которые спроектированы и созданы в настоящее время, основаны на частоте выборки 48 кГц, будут совместимы с будущими кодировщиками, которые проектируют для использования более высокочастотных компонентов. Существующие декодировщики считывали бы сигнал основной полосы частот (0-24 кГц) и игнорировали закодированные данные для более высоких частот.
Кодирование с высокой частотой выборки.
Для частот выборки в диапазоне 48-96 кГц кодировщик 26 канала предпочтительно разделяет аудиоспектр на два и использует однородную 32-полосную группу фильтров анализа для нижней половины и 8-полосную группу фильтров анализа для верхней половины. Как показано на фиг. 4а и фиг. 4Ь, аудиоспектр 0-48 кГц первоначально разделяют с использованием 256-отводной 2-полосной группы 46 предварительных фильтров прореживания, дающей ширину полосы аудиочастот 24 кГц на диапазон. Нижний диапазон (0-24 кГц) разделяют и кодируют в 32 равномерных диапазонах таким образом, как представлено выше на фиг. 3. Однако верхний диапазон (24-48 кГц) разделяют и кодируют в 8 равномерных диапазонах. Если задержка 8-полосной группы 48 фильтров прореживания/интерполяции не равна задержке 32полосной группы фильтров, то каскад 50 компенсации задержки должен быть использован на пути сигнала 24-48 кГц для гарантии того, что обе временные формы сигнала линейно возрастают перед 2-полосной группой фильтров рекомбинации в декодировщике. В системе кодирования с частотой выборки 96 кГц аудиодиапазон 24-48 кГц задерживают на 384 выборки, а затем разбивают на 8 равномерных диапазонов, с использованием 128-отводной группы фильтров интерполяции. Каждый из поддиапазонов 3 кГц кодируют 52 и упаковывают 54 с закодированными данными из диапазона 0-24 кГц для формирования потока 1 6 сжатых данных.
После поступления в декодировщик 18, поток 16 сжатых данных распаковывают 56 и коды, как для 32-полосового декодировщика (область 0-24 кГц), так и для 8-полосового декодировщика (24-48 кГц) выделяют и подают в соответствующие декодирующие каскады 42 и 58. Восемь и 32 закодированных поддиапазона восстанавливают с использованием однородных 128-отводной и 512-отводной групп 60 и 64 фильтров интерполяции, соответственно. Декодированные поддиапазоны в результате рекомбинируют с использованием однородной 256отводной группы 63 2-полосовых фильтров интерполяции для создания одного цифрового аудиосигнала ИКМ с частотой выборки 96 кГц. В случае, когда для декодировщика желательно работать при половине частоты выборки потока сжатых данных, это может быть выполнено отбрасыванием кодированных данных верхнего диапазона (24-48 кГц) и декодированием только 32 поддиапазонов в аудиодиапазоне 0-24 кГц.
Кодировщик канала.
Во всех описанных стратегиях кодирования процесс 32-диапазонного кодирования/декодирования выполняют для части основной полосы частот аудиодиапазона, между 0-24 кГц. Как показано на фиг. 3, устройство захвата 64 блока кадрирует аудиоканал ИКМ 14 для сегментирования его в последовательные блоки 66 данных. Аудиокадр ИКМ определяет ряд смежных входных выборок, для которых кодирующий процесс генерирует выходной блок в потоке данных. Размер кадра устанавливают на основе величины сжатия, т.е. отношения скорости передачи к частоте выборки, так что количество данных, закодированных в каждом блоке ограничено. Каждый последовательный блок 66 данных разбивают на 32 равномерных частотных диапазона 68 32 - полосной 512 - отводной группой 34 фильтров прореживания конечной импульсной характеристики. Выборки, выведенные из каждого поддиапазона, буферизируют и подают в 32-полосовой кодирующий каскад 36.
Каскад 70 анализа (описанный подробно на фиг. 10 - фиг. 19) генерирует оптимальные коэффициенты прогнозатора, распределения бит дифференциального квантователя и оптимальные масштабные коэффициенты квантователя для буферизированных выборок поддиапазона. Каскад 70 анализа может также решать, какие поддиапазоны будут подвергнуты ВК и какие будут совместно кодируемыми по частоте, если эти решения не являются фиксированными. Эти данные или вспомогательная информация подают в выбранный каскад 72 АДИКМ, каскад 73 ВК или каскад 74 совместного кодирования частоты (СКЧ) и в мультиплексор 32 данных (упаковщик). Выборки поддиапазона затем кодируют процессом АДИКМ или ВК и коды квантования вводят в мультиплексор. Каскад 74 СКЧ фактически не кодирует выборки поддиапазона, а генерирует коды, которые указывают, какие поддиапазоны канала совмещают и где их размещают в потоке данных. Коды квантования и вспомогательную информацию из каждого поддиапазона упаковывают в поток 1 6 данных и передают в декодировщик.
После поступления на декодировщик 18, поток данных демультипликсируют 40 или распаковывают обратно в отдельные поддиапазоны. Масштабные коэффициенты и распределения бит устанавливают в обратные квантователи 75 вместе с коэффициентами прогнозатора для каждого поддиапазона. Дифференциальные коды затем восстанавливают с использованием либо процесса 76 АДИКМ, либо процесса 77 обратного ВК непосредственно, либо процесса 78 обратного СКЧ для определенных поддиапазонов. Наконец, поддиапазоны объединяют обратно в единый аудиосигнал 22 КИМ с использованием 32-полосной группы 44 фильтров интерполяции.
Кадрирование сигнала ИКМ.
Как показано на фиг. 6, устройство захвата блока, показанное на фиг. 5, изменяет размер кадра 79, когда скорость передачи изменяется для данной частоты выборки так, что число байтов на выходной блок 80 ограничивается для того, чтобы находиться между, например, 5,3 кбайт и 8 кбайт. Таблицы 1 и 2 являются проектировочными таблицами, которые позволяют проектировщику выбрать оптимальный размер кадра и размер буфера декодировщика (размер блока), соответственно, для данной частоты выборки и скорости передачи. При низких скоростях передачи размер блока может быть относительно большим. Это позволяет кодировщику использовать неплоское распределение изменения аудиосигнала во времени и улучшить эффективность аудиокодировщика. При высоких скоростях размер блока уменьшают так, что общее число байтов не переполняет буфер декодировщика. В результате проектировщик может обеспечить декодировщик с 8 кбайтами ППВ для соответствия скоростям передачи. Это снижает стоимость декодировщика. Вообще размер аудиокадра задают как:
Аудиокадр = (Размер блока) Р §ашр--, (Т га!е) где Размер блока - размер буфера декодировщика, Р 8ашр - частота выборки, а Т та!е - скорость передачи. Размер аудиокадра не зависит от числа аудиоканалов. Однако, когда число каналов увеличивается, величина сжатия должна также увеличиваться для поддержания требуемой скорости передачи.
Таблица 1
Р §ашр (кГ ц)
Тга!е | 8-12 | 16-24 | 32-48 | 64-96 | 128-192 |
<512 кбит/с | 1024 | 2048 | 4096 | * | * |
<1024 кбит/с | * | 1024 | 2048 | * | * |
<2048 кбит/с | * | * | 1024 | 2048 | * |
<4096 кбит/с | * | * | * | 1024 | 2048 |
Таблица 2
Р §ашр (кГ ц)
Тга!е | 8-12 | 16-24 | 32-48 | 64-96 | 128-192 |
<512 кбит/с | 8-5,3К | 8-5,3К | 8-5,3К | * | * |
<1024 кбит/с | * | 8-5,3К | 8-5,3К | * | * |
<2048 кбит/с | * | * | 8-5,3К | 8-5,3К | * |
<4096 кбит/с | * | * | * | 8-5,3К | 8-5,3К |
Фильтрация поддиапазона.
32-полосная 512-отводная равномерная группа 34 фильтров прореживания выбирает из двух многофазных групп фильтров для разбиения блоков 66 данных на 32 равномерных поддиапазона 68, показанных на фиг. 5. Две группы фильтров имеют различные свойства восстановления, которыми достигают компромисс между коэффициентом передачи кодирования поддиапазона и точностью восстановления. Один класс фильтров называется фильтрами полного вос13 становления (ПВ). Когда фильтр прореживания (кодирования) ПВ и фильтр интерполяции (декодирования) располагают друг за другом, восстановленный сигнал является «полным», где полный определяется как находящийся в пределах 0,5 самого младшего двоичного разряда при разрешении 24 бита. Другой класс фильтров называется фильтрами неполного восстановления (НПВ), т.к. восстановленный сигнал имеет ненулевой минимальный уровень шума, который связан со свойствами процесса фильтрации неполного подавления помехи дискретизации (побочной низкочастотной составляющей).
Передаточные функции 82 и 84 фильтров НПВ и ПВ, соответственно, для одного поддиапазона показаны на фиг. 7. Поскольку фильтры НПВ не ограничивают, чтобы обеспечивать полное восстановление, они показывают значительно большие отношения подавления около полосы задерживания (ПОПЗ), т.е. отношение полосы пропускания к первому побочному максимуму, чем фильтры ПВ (110 децибел, см. 85 децибел). Как показано на фиг. 8, побочные максимумы фильтра вызывают сигнал 86, который, естественно, находится в третьем поддиапазоне и создает помеху дискретизации в соседних поддиапазонах. Коэффициент передачи поддиапазона измеряет подавление сигнала в соседних поддиапазонах и, следовательно, показывает способность фильтра декоррелировать (развязывать) аудиосигнал. Поскольку фильтры НПВ имеют значительно большее отношение ПОПЗ, чем фильтры ПВ, они будут также иметь значительно больший коэффициент передачи. В результате фильтры НПВ обеспечивают лучшую эффективность кодирования.
Как показано на фиг. 9, полное искажение в потоке сжатых данных уменьшается, когда общая скорость бит увеличивается, как для фильтров ПВ, так и НПВ. Однако, при низких скоростях разница в характеристике коэффициента передачи поддиапазона между двумя типами фильтров больше, чем минимальный уровень шума, связанный с фильтром НПВ. Таким образом, связанная с фильтром НПВ кривая 90 искажения находится ниже связанной с фильтром ПВ кривой 92 искажения. Следовательно, при низких скоростях аудиокодировщик выбирает блок фильтра НПВ. В некоторой точке 94 ошибка квантования кодировщика падает ниже минимального уровня шума фильтра НПВ, так что добавление дополнительных битов в кодировщик АДИКМ не обеспечивает дополнительных преимуществ. В этой точке аудиокодировщик переключают в блок фильтра ПВ.
Кодирование АДИКМ.
Кодировщик 72 АДИКМ генерирует прогнозируемую выборку р(п) из линейной комбинации Н предыдущих восстановленных выборок. Эту прогнозируемую выборку затем вычитают из входа х(п), получая разностную выборку б(п). Разностные выборки масштабируют делением их на среднеквадратический (СК) (или максимальный (РЕАК)) весовой коэффициент для согласования среднеквадратических амплитуд разностной выборки с амплитудой характеристики О квантователя. Масштабированную разностную выборку иб(п) подают в характеристику квантователя с Ь уровнями размера шага 8Ζ, как определяется числом бит, распределенных для текущей выборки АВ1Т. Квантователь вырабатывает код уровня ЦЬ(п) для каждой масштабированной разностной выборки иб(п). Эти коды уровня в конечном счете передают в каскад АДИКМ декодировшика. Для корректировки предыстории прогнозатора коды уровня ЦЬ(п) квантователя локально декодируют с использованием обратного квантователя 1/0 с идентичными квантователю О характеристиками для создания квантованной масштабированной разностной выборки иб(п). Квантованный вариант х(п) исходной входной выборки х(п) восстанавливают добавлением начальной прогнозируемой выборки р(п) к квантованной разностной выборке б(п). Эту выборку затем используют для корректировки предыстории прогнозатора.
Векторное квантование.
Коэффициенты прогнозатора и высокочастотные выборки поддиапазона кодируют с использованием векторного квантования (ВК). ВК прогнозатора имеет размерность вектора из 4 выборок и скорость бит 3 бита на выборку. Окончательная книга кодов, таким образом, состоит из 4096 векторов кодов размерности 4. Поиск соответствующих векторов структурирован как двухуровневое дерево с каждым узлом в дереве, имеющим 64 ветви. Верхний уровень содержит 64 узла векторов кодов, которые требуются в кодировщике только для помощи процессу поиска. Нижний уровень контактирует с 4096 конечными векторами кодов, которые требуются как в кодировщике, так и в декодировщике. Для каждого поиска требуется 1 28 вычислений среднеквадратической ошибки размерности 4. Книга кодов и векторы узлов на верхнем уровне сгруппированы в последовательность с использованием способа логической двоичной группировки с более чем 5 миллионами последовательных векторов коэффициентов прогнозирования. Последовательные векторы накапливают для всего поддиапазона, который показывает положительный выигрыш прогнозирования при кодировании широкого диапазона аудиоматериала. Для контрольных векторов в упорядоченном множестве получают средние отношения сигнал/шум приблизительно 30 децибел.
Высокочастотное ВК имеет размерность вектора 32 выборки (длина подблока) и скорость бит 0,3125 битов на выборку. Конечная книга кодов поэтому состоит из 1 024 векторов кодов размерности 32. Поиск подходящих векторов структурирован как двухуровневое дерево с каждым узлом в дереве, имеющим 32 ветви. Верхний уровень содержит 32 узла векторов кодов, которые требуются только в кодировщике, нижний уровень содержит 1024 конечных векторов кодов, которые требуются как в кодировщике, так и в декодировщике. Для каждого поиска требуется 64 вычислений среднеквадратической ошибки размерности 32. Книга кодов и узлы векторов на верхнем уровне упорядочены с использованием способа логической двоичной группировки с более чем 7 миллионами последовательных векторов выборки высокочастотного поддиапазона. Выборки, которые составляют векторы, накапливают из выходов поддиапазонов 16 по 32 для частоты выборки 48 кГц для широкого диапазона аудиоматериала. При частоте выборки 48 кГц последовательные выборки представляют аудиочастоты в диапазоне от 1 2 до 24 кГц. Для контрольных векторов в упорядоченном множестве ожидается среднее отношение сигнал/шум около 3 децибел. Несмотря на то, что 3 децибела является малым отношением сигнал/шум, оно достаточно для обеспечения высокочастотной достоверности или окружения на таких высоких частотах. Это значительно лучше для восприятия, чем известные способы с простым игнорированием высокочастотных поддиапазонов.
Совместное кодирование частоты.
В приложениях с очень низкой скоростью бит общая достоверность восстановления может быть улучшена кодированием только совокупности высокочастотного поддиапазона из двух или более аудиоканалов вместо их независимого кодирования. Совместное кодирование частоты возможно, поскольку высокочастотные поддиапазоны часто имеют похожие распределения мощности и поскольку слуховая система человека чувствительна к «интенсивности» высокочастотных составляющих, больше чем к их тонкой структуре. Таким образом, восстановленный средний сигнал обеспечивает хорошую общую достоверность, поскольку при любой скорости бит имеется больше бит для кодирования более важных для восприятия низких частот. Индексы совместного кодирования частоты (1ΟΙΝΧ) передают непосредственно в кодировщик для указания, какие каналы и поддиапазоны совмещены и где расположен закодированный сигнал в потоке данных. Декодировщик восстанавливает сигнал в назначенном канале, а затем копирует его в каждый из других каналов. Каждый канал затем масштабируются в соответствии с его конкретным среднеквадратическим масштабным коэффициентом. Поскольку совместное кодирование частоты усредняет временные сигналы на основе подобности их распределений мощности, достоверность восстановления уменьшается. Поэтому его применение обычно ограничено применениями с низкой скоростью бит и в основном сигналами 1 0 20 кГц. В применениях со скоростями бит ОТ средней до высокой, совместное кодирование частоты обычно непригодно.
Кодировщик поддиапазона.
Процесс кодирования для одного поддиапазона, который кодируют с использованием процессов АДИКМ/АИКМ и особенно взаимодействие каскада 70 анализа и кодировщика 72 АДИКМ, показанных на фиг. 5, и глобальной системой управления битами, показанной на фиг. 2, подробно представлено на фиг. 10. Фиг. 11 - фиг. 19 детализируют составляющие процессы, показанные на фиг. 13. Группа 34 фильтра разбивает аудиосигнал 14 ИКМ на 32 сигнала х(п) поддиапазона, которые записывают в соответствующие буферы 96 выборки поддиапазона. Предположим, размер аудиокадра составляет 4096 выборок, каждый буфер 96 выборки поддиапазона хранит полный блок из 1 28 выборок, которые разделены на 432 подблока выборки. Размер кадра из 1024 выборок создавал бы один подблок из 32 выборок. Выборки х(п) направляют в каскад 70 анализа для определения коэффициентов прогнозирования, режима прогнозатора (РМОИЕ), режима переходного процесса (ТМОИЕ) масштабных коэффициентов (8Р) для каждого подблока. Выборки х(п) также подают в систему 30 ГУБ, которая определяет распределение бит (ΑΒΙΤ) для каждого подблока на поддиапазон на аудиоканал. После чего выборки х(п) передают в кодировщик 72 АДИКМ по одному подблоку.
Оценка оптимальных коэффициентов прогнозирования
Для Н, предпочтительно 4-го порядка, коэффициенты прогнозирования генерируют отдельно для каждого подблока с использованием стандартного способа 98 автокорреляции, оптимизируемого относительно блока выборок х(п) поддиапазона, т.е. уравнения Вейнера-Хопфа или Юли-Уолкера.
Квантование оптимальных коэффициентов прогнозирования
Каждое множество из четырех коэффициентов прогнозатора предпочтительно квантуют с использованием книги кодов с 1 2-битовыми векторами, 4-элементным деревом поиска, описанной выше. Книга кодов с 1 2-битовыми векторами содержит 4096 векторов коэффициентов, которые оптимизируют для требуемого распределения вероятности с использованием стандартного алгоритма кластеризации. Поиск ОМ 100 векторного квантования (ВК) выбирают вектор коэффициентов, который показывает наименьшую взвешенную среднеквадратическую ошибку между ним и оптимальными коэффициентами. Оптимальные коэффициенты для каждого подблока затем замещают этими «квантованными» векторами. Обратный табличный поиск 101 ВК используют для подачи квантованных коэффициентов прогнозатора в кодировщик 72 АДИКМ.
Оценка разностного сигнала ά(η) прогнозирования
Важным затруднением с АДИКМ является то, что последовательность разностной выборки ά(η) не может быть легко спрогнозирована перед фактическим рекурсивным процессом 72. Основным требованием прямой адаптивной АДИКМ поддиапазона является то, что мощность разностного сигнала должна быть известна перед кодированием АДИКМ для того, чтобы вычислить подходящее распределение бит для квантователя, который будет создавать известную ошибку квантования, или уровень шума в восстановленных выборках. Знание мощности разностного сигнала также требуется для того, чтобы определить оптимальный разностный масштабный коэффициент перед кодированием.
К сожалению, мощность разностного сигнала зависит не только от параметров входного сигнала, но также от работы прогнозатора. Кроме известных ограничений, как например, порядок прогнозатора и оптимальность коэффициентов прогнозатора, на работу прогнозатора также влияет уровень ошибки квантования или шум, создаваемый в восстановленных выборках. Поскольку шум квантования определяет конечное распределение бит (ΑΒΙΤ) и среднеквадратические (или максимальные) значения масштабного коэффициента, оценка мощности разностного сигнала должна поступать итеративно 102.
Шаг 1. Предположение нулевой ошибки квантования.
Первую оценку разностного сигнала выполняют пропусканием буферизованных выборок х(п) поддиапазона через процесс АДИКМ, который не квантует разностный сигнал. Это выполняют блокировкой квантования и среднеквадратического масштабирования в цикле кодирования АДИКМ. При оценке разностного сигнала таким образом действия значений масштабного коэффициента и распределения бит удаляют из вычисления. Однако, действие ошибки квантования на коэффициенты прогнозатора принимают во внимание процессом при использовании векторных квантованных коэффициентов прогнозирования. Обратный табличный поиск 104 ВК используют для обеспечения квантованных коэффициентов прогнозирования. Для дополнительного повышения точности оценочного прогнозатора, выборки предыстории из фактического прогнозатора АДИКМ, которые были накоплены в конце предыдущего блока, копируют в прогнозатор перед вычислением. Это гарантирует то, что прогнозатор стартует оттуда, где реальный прогнозатор АДИКМ финишировал в конце предыдущего входного буфера.
Основным различием между этой оценкой еб(п) и фактическим процессом ά(η) является то, что действие шума квантования на восстановление выборки х(п) и на сниженную точность прогнозирования игнорируют. Для квантователей с большим числом уровней уровень шума будет вообще малым (при предположении подходящего масштабирования) и поэтому фактическая мощность разностного сигнала будет практически соответствовать мощности, вычисленной в оценке. Однако, когда число уровней квантования мало, как обстоит дело для типичных аудиокодировщиков с низкой скоростью бит, фактический прогнозируемый сигнал и, следовательно, мощность разностного сигнала, может значительно отличаться от оцениваемой мощности. Это создает минимальные уровни шума кодирования, которые отличаются от спрогнозированных ранее в процессе адаптивного распределения бит.
Несмотря на это, изменение в эффективности прогноза может быть незначительным для применения или скорости бит. Таким образом, оценка может быть использована непосредственно для вычисления распределений бит и масштабных коэффициентов без итерации. Дополнительное усовершенствование состоит в компенсации потери эффективности преднамеренной переоценкой мощности разностного сигнала, если вероятно, что квантователь с малым числом уровней должен быть назначен в этот поддиапазон. Переоценка может также быть сортирована в соответствии с изменяющимся числом уровней квантования для повышения точности.
Шаг 2. Повторное вычисление с использованием оценочных распределений бит и масштабных коэффициентов.
Если распределения бит (ΑΒΙΤ) и масштабные коэффициенты (8Р) сгенерированы с использованием разностного сигнала первой оценки, их оптимальность может быть проверена выполнением дополнительного процесса АДИКМ оценки с использованием оценочных значений ΑΒΙΤ и среднеквадратических (или максимальных) значений в цикле 72 АДИКМ. Также как в первой оценке, предысторию оценки прогнозатора копируют из фактического прогнозатора АДИКМ перед началом вычислений для гарантии того, что оба прогнозатора стартуют с одной и той же точки. Если все буферизированные входные выборки прошли через этот второй цикл оценки, результирующий минимальный уровень шума в каждом поддиапазоне сравнивают с допустимым минимальным уровнем шума в процессе адаптивного распределения бит. Любые существенные различия могут быть компенсированы модификацией распределения бит и/или масштабных коэффициентов.
Шаг 2 может быть повторен для усовершенствования подходящим образом распределенного минимального уровня шума в поддиапазонах, каждый раз используя последнюю оценку разностного сигнала для вычисления следующего множества распределений бит и масштабных коэффициентов. Вообще, если масштабные коэффициенты изменяются на бо19 лее чем 2-3 децибела, их повторно вычисляют. Иначе распределение бит может нарушить отношения сигнала к маске, генерируемые процессом психоакустической маскировки или альтернативно процессом минимальной среднеквадратической ошибки. Обычно достаточно одной итерации.
Вычисление режимов прогнозирования (РМОИЕ) поддиапазона
Для улучшения эффективности кодирования контроллер 106 может произвольно выключать процесс прогнозирования, когда выигрыш прогнозирования в текущем подблоке падает ниже порога, установкой флага РМОИЕ. Флаг РМОИЕ устанавливают на единицу, когда выигрыш прогнозирования (отношение мощности входного сигнала и оцененной мощности разностного сигнала), измеренный во время стадии оценки для блока входных выборок, превышает некоторый определенный барьер. Наоборот, если измеренный выигрыш прогнозирования меньше, чем определенный барьер, коэффициенты прогнозатора АДИКМ устанавливают на ноль как в кодировщике, так и в декодировщике для этого поддиапазона, и соответствующий РМОИЕ устанавливают на ноль. Порог выигрыша прогноза устанавливают равным коэффициенту искажения передаваемого вектора коэффициентов прогнозатора. Это делают для того, чтобы гарантировать, что когда РМОИЕ=1, выигрыш кодирования для процесса АДИКМ всегда больше, чем или равен выигрышу прямого адаптивного процесса кодирования ИКМ (АИКМ). Иначе при установке РМОИЕ на ноль и перезадании коэффициентов прогнозатора процесс АДИКМ просто возвращается в АИКМ.
Значения РМОИЕ могут быть установлены высокими в некотором или во всех поддиапазонах, если изменения выигрыша кодирования АДИКМ не важны для применения. Наоборот, значения РМОИЕ могут быть установлены низкими, если, например, определенные поддиапазоны не собираются кодировать совсем, скорость бит применения достаточно высока, когда выигрыши прогнозирования не требуются для поддержания субъективного качества аудио, переходная составляющая сигнала высока или склеивание характеристики закодированного АДИКМ аудио просто не желательно, как могло бы быть для приложений редактирования аудио.
Отдельные режимы прогнозирования (значения РМОИЕ) передают для каждого поддиапазона со скоростью, равной скорости корректировки линейных прогнозаторов в процессах АДИКМ кодировщика и декодировщика. Назначением параметра РМОИЕ является указание в декодировщик, будет ли конкретный поддиапазон иметь некоторый адрес вектора коэффициентов прогнозирования, связанный с его закодированным блоком аудиоданных. Когда РМОИЕ=1 в некотором поддиапазоне, адрес вектора коэффициентов прогнозатора будет всегда включен в поток данных. Когда РМОИЕ=0 в некотором поддиапазоне, тогда адрес вектора коэффициентов прогнозатора никогда не будет включен в поток данных и коэффициенты прогнозатора устанавливают на ноль на стадиях АДИКМ как кодировщика, так и декодировщика.
Вычисление значений РМОИЕ начинается анализом буферизованных мощностей входного сигнала поддиапазона относительно соответствующих мощностей буферизованного оцененного разностного сигнала, полученных на первой стадии оценки, т. е. при допущении отсутствия ошибки квантования. Как входные выборки х(п), так и оцененные разностные выборки еб(и) буферизируют для каждого поддиапазона отдельно. Размер буфера равняется числу выборок, содержащихся в каждом периоде корректировки прогнозатора, например, размеру подблока. Выигрыш прогнозирования затем вычисляют как:
Рбаш(децибел)=20,0· 1од (КМ§х(и)/КМ§еЦ(и)), где КМ§Х(И) = среднеквадратическое значение буферизованных входных выборок х(и), а
РМЗе,|Н1, = среднеквадратическое значение буферизованных оцененных разностных выборок еб.(и).
Для положительных выигрышей прогнозирования разностный сигнал в среднем меньше, чем входной сигнал и, следовательно, уменьшенный минимальный уровень шума восстановления может быть достигнут с использованием процесса АДИКМ относительно АИКМ для той же самой скорости бит. Для отрицательных выигрышей кодировщик АЛИКМ создает разностный сигнал, в среднем больший, чем входной сигнал, который приводит к более высоким минимальным уровням шума, чем АДИКМ для той же самой скорости бит. Обычно порог выигрыша прогнозирования, который включает РМОИЕ, будет положительным и будет иметь значение, которое учитывает дополнительную емкость канала, потребляемую при передаче адреса вектора коэффициентов прогнозатора.
Вычисление режимов импульсной помехи (ТМОИЕ) поддиапазона
Контроллер вычисляет режимы импульсной помехи (ТМОИЕ) для каждого подблока в каждом поддиапазоне. Значения ТМОИЕ указывают число масштабных коэффициентов и выборок в буфере оценочного разностного сигнала еб(и), когда РМОИЕ=1 или в буфере входного сигнала х(и) поддиапазона, когда РМОИЕ=0, для которых они достоверны. Значения ТМОИЕ корректируют с той же самой частотой, что и адреса вектора коэффициентов прогнозирования и передают в декодировщик. Назначением режимов импульсной помехи является уменьшение слышимых кодируемых «предэхо» искусст21 венных объектов кодирования при наличии переходных процессов сигнала.
Переходный процесс определяют как быстрый переход между сигналом малой амплитуды и сигналом большой амплитуды. Поскольку масштабные коэффициенты усредняют на блоке разностных выборок поддиапазона, если происходит быстрое изменение амплитуды сигнала в блоке, т. е. происходит переходный процесс, вычисленный масштабный коэффициент стремится быть больше, чем было бы оптимально для выборок малых амплитуд, предшествующих переходному процессу. Следовательно, ошибка квантования в выборках, предшествующих переходным процессам может быть очень большой. Этот шум воспринимают как искажение предэхо.
На практике режим импульсной помехи используют для модификации длины блока усредняемого масштабного коэффициента поддиапазона для ограничения влияния переходного процесса на масштабирование дифференциальных выборок, непосредственно предшествующих ему. Мотивацией для этого является свойство предварительной маскировки, присущее человеческой слуховой системе, которая предполагает, что при наличии переходного процесса шум может быть замаскирован перед переходным процессом при условии, что его продолжительность остается постоянной.
В зависимости от значения ΡΜΟΌΕ, либо содержимое, т.е. подблок, буфера еб(и) выборки поддиапазона, либо содержимое буфера еб(и) оцененной разности копируют в буфер анализа импульсной помехи. Здесь содержимое буфера разделяют одинаково на 2, 3, или 4 подподблока, в зависимости от размера выборки буфера анализа. Например, если буфер анализа содержит 32 выборки поддиапазона (21,3 миллисек 1500 Гц), буфер разделяют на 4 подподблока, каждый из 8 выборок, давая временное разрешения 5,3 мс для частоты выборки поддиапазона 1500 Гц. Альтернативно, если кадр анализа был сконфигурирован при 16 выборках поддиапазона, тогда требуется разделить буфер только на два подподблока для того, чтобы обеспечить то же самое временное разрешение.
Сигнал в каждом подподблоке анализируют и определяют статус каждого, кроме первого, переходного процесса. Если любые подподблоки объявляют с переходным процессом, два отдельных масштабных коэффициента генерируют для буфера анализа, т.е. текущего подблока. Первый масштабный коэффициент вычисляют из выборок в подподблоках, предшествующих подподблоку с переходным процессом. Второй масштабный коэффициент вычисляют из выборок в подподблоке с переходным процессом вместе со всеми предшествующими подподблоками.
Статус переходного процесса первого подподблока не вычисляют, т.к. шум квантования автоматически ограничивают началом кадра анализа. Если более, чем один подподблок объявляют с переходным процессом, тогда рассматривают только один, который появляется первым. Если не обнаруживают подподблоков с переходным процессом, тогда вычисляют только один масштабный коэффициент с использованием всех выборок в буфере анализа. Таким образом значения масштабного коэффициента, которые содержат выборки с переходным процессом, не используют для масштабирования предыдущих выборок, более чем на период времени подподблока ранее. Следовательно, шум квантования перед переходным процессом ограничивают периодом подподблока.
Объявление переходного процесса.
Подподблок объявляют с переходным процессом, если отношение его мощности к предшествующему подбуферу превышает порог переходного процесса (ТТ), а мощность в предшествующем подподблоке ниже порога перед переходным процессом (РТТ). Значения ТТ и РТТ будут зависеть от скорости бит и степени требуемого подавления перед эхом. Их обычно изменяют до тех пор, пока воспринимаемая помеха перед эхом согласуется с уровнем других искусственных объектов кодирования, если они существуют. Увеличение значения ТТ и/или уменьшение значения РТТ будет уменьшать вероятность объявления подподблока с переходным процессом и, следовательно, будет уменьшать скорость бит, связанную с передачей масштабных коэффициентов. Наоборот, уменьшение значения ТТ и/или увеличение значения РТТ будет увеличивать вероятность объявления подподблока с переходным процессом и, следовательно, будет увеличивать скорость бит, связанную с передачей масштабных коэффициентов.
Поскольку ТТ и РТТ индивидуально устанавливают для каждого поддиапазона, чувствительность обнаружения импульсной помехи в кодировщике может быть произвольно установлена для каждого поддиапазона. Например, если обнаруживают, что предэхо в высокочастотном поддиапазоне менее воспринимаемо, чем в низкочастотных поддиапазонах, тогда пороги могут быть установлены для уменьшения вероятности объявления импульсных помех в более высоких поддиапазонах. Более того, поскольку значения ΤΜΟΌΕ вставляют в поток сжатых данных, не требуется, чтобы декодировщик содержал алгоритм обнаружения переходного процесса, используемый кодировщиком, чтобы правильно декодировать информацию ΤΜΟΌΕ.
Четырёхподбуферная конфигурация.
Как показано на фиг. 11а, если первый подблок 108 в буфере 109 анализа поддиапазона с переходным процессом, или если не обнаруживают подподблоки с импульсной помехой, тогда ΤΜΟΌΕ=0. Если второй подподблок с переходным процессом, но не первый, тогда ΤΜΟΌΕ=1.
Если третий подподблок с переходным процессом, но не первый или второй, тогда ΤΜΘΌΕ=2. Если только четвёртый под-подблок с переходным процессом, тогда ΤΜΘΌΕ=3.
Вычисление масштабных коэффициентов.
Как показано на фиг. 11в, когда ΤΜΘΌΕ=0, масштабные коэффициенты 110 вычисляют относительно всех подподблоков. Когда ΤΜΘΌΕ=1, первый масштабный коэффициент вычисляют относительно первого подподблока, а второй масштабный коэффициент относительно всех предшествующих подподблоков. Когда ΤΜΘΌΕ=2, первый масштабный коэффициент вычисляют относительно первого и второго подподблоков, а второй масштабный коэффициент относительно всех предшествующих подподблоков. Когда ΤΜΘΌΕ=3, первый масштабный коэффициент вычисляют относительно первого, второго и третьего подподблоков, а второй масштабный коэффициент - относительно четвёртого подподблока.
Кодирование и декодирование АДИКМ с использованием ΤΜΘΌΕ.
Когда ΤΜΘΌΕ=0, один масштабный коэффициент используют для масштабирования разностных выборок поддиапазона в течение продолжительности всего буфера анализа, т.е. подблока, и передают в декодировщик для обеспечения обратного масштабирования. Когда ΤΜΘΌΕ>0, используют два масштабных коэффициента для масштабирования разностных выборок поддиапазона и обе передают в декодировщик. Для любого ΤΜΘΌΕ каждый масштабный коэффициент используют для масштабирования дифференциальных выборок, используемых для генерации его на первом месте.
Вычисление масштабных коэффициентов поддиапазона (среднеквадратических или максимальных).
В зависимости от значения ΡΜΟΌΕ для этого диапазона либо оцененные разностные выборки еД(п), либо входные выборки х(п) поддиапазона используют для вычисления соответствующего масштабного коэффициента (коэффициентов). Значения ΤΜΟΌΕ используют в этом вычислении для определения как числа масштабных коэффициентов, так и для идентификации соответствующих подподблоков в буфере.
Вычисление среднеквадратического (ΡΜδ) масштабного коэффициента.
Для _)-го поддиапазона среднеквадратические масштабные коэффициенты вычисляют следующим образом:
Когда ΤΜΟΌΕ=0, тогда единственное среднеквадратическое значение равно:
Ь
ΡΜδί=(ΣΌά(η)2/Ρ)0'5 п=1 где Ь - число выборок в подблоке
Когда ΤΜΟΌΕ>0, тогда два среднеквадратических значения равны:
к
ΡΜδ 1_)=^еД(п)2/Е)0·5 п=1 к+1
ΡΜδ 2_)=(Σ еД(п)2/Ь)0·5 п=1 где к = (ΤΜΟΌΕ) · Ь/ΝδΒ) и ΝδΒ - число одинаковых подподблоков.
Если ΡΜΟΌΕ=0, тогда выборки еП|(п) заменяют входными выборками х|(п).
Вычисление максимального (ΡΕΑΚ) масштабного коэффициента.
Для _)-го поддиапазона максимальный масштабный коэффициент вычисляют следующим образом:
Когда ΤΜΟΌΕ=0, то единственное максимальное значение равно:
ΡΕΑΙ<ί=ΜΑΧ(ΑΒίΆάί(π)) для: п=1, Ь
Когда ΤΜΟΌΕ>0, то два максимальных значения равны:
ΡΕΑΚ 1)=ΜΑΧ(ΑΒίΆάί(π)) для п=1, (ΤΜΟΌΕ· Ь/ΝδΒ) ΡΕΑΚ2ί=ΜΑΧ(ΑΒίΆάί)) для п=( 1+ΤΜΟΟΕΕ/ΝδΒ), Ь
Если ΡΜΟΌΕ=0, то выборки еф(п) заменяют входными выборками х|(п).
Квантование ΡΜΟΌΕ, ΤΜΟΌΕ и масштабных коэффициентов.
Квантование значений ΡΜΟΌΕ.
Флаги режима прогнозирования имеют только два значения: включено или выключено, и их передают непосредственно в декодировщик как 1 -битовые коды.
Квантование значений ΤΜΟΌΕ.
Флаги режима импульсной помехи имеют максимум 4 значения: 0,1,2 и 3, и их либо передают в кодировщик непосредственно с использованием 2-битовых целочисленных кодовых слов без знака, или альтернативно через 4уровневую таблицу энтропии для уменьшения средней длины слова значений ΤΜΟΌΕ ниже 2 битов. Обычно альтернативное кодирование энтропии используют для применений с малой скоростью бит для того, чтобы сохранить биты.
Процесс 112 кодирования энтропии, представленный подробно на фиг. 1 2, является следующим: коды режима импульсной помехи ΤΜΟΌΕ(ί) для _) поддиапазонов отображают в ряд (р) 4-уровневой с надстрочным элементом переменной длины книги кодов, где каждую книгу кодов оптимизируют для различной входной статистической характеристики. Значения ΤΜΟΌΕ отображают в 4-уровневые таблицы 114 и вычисляют 116 полное использование бит, связанное с каждой таблицей (ΝΒρ). Таблицу, которая обеспечивает самое низкое использование бит в процессе отображения, выбирают 118 с использованием индекса ΤΗυΡΡ. Отображенные коды νΤΜΟΌΕ(ί) извлекают из этой таблицы, упаковывают и передают в декодировщик вместе с индексным словом ΤΗυΡΡ.
Декодировщик, который хранит то же самое множество 4-уровневых обратных таблиц, использует индекс ТНИРР для направления входящих кодов переменной длины νΤΜΟΌΕ(ί) в подходящую таблицу для декодирования в индексы ΤΜΟΌΕ.
Квантование масштабных коэффициентов поддиапазона.
Для передачи масштабных коэффициентов в декодировщик они должны быть квантованы в известный формат кода. В этой системе их квантуют с использованием либо одинаковой 64-уровневой логарифмической характеристики, 128-уровневой логарифмической характеристики, либо переменной скорости кодирования одинаковой 64-уровневой логарифмической характеристики 1 20. 64-уровневый квантователь показывает размер шага 2,25 децибел в обоих случаях, а 128-уровневый - размер шага 1,25 децибел. 64-Уровневое квантование используют для скоростей бит от низких до средних, дополнительное кодирование с переменной скоростью используют для применений с низкой скоростью бит, а 118-уровневое обычно используют для высоких скоростей бит.
Процесс 1 20 квантования представлен на фиг. 13. Масштабные коэффициенты ΚΜ3 или ΡΕΑΚ считывают из буфера 121, преобразуют в логарифмический интервал 1 22, а затем подают либо в 64-уровневый, либо в 128-уровневый равномерные квантователи 1 24, 1 26, как определено управлением 1 28 режимом кодировщика. Логарифмически квантованные масштабные коэффициенты затем записывают в буфер 130. Диапазон 1 28 и 64-уровневых квантователей достаточен для покрытия масштабных коэффициентов с динамическим диапазоном приблизительно 1 60 децибел и 1 44 децибела, соответственно, 128-уровневый верхний предел устанавливают для покрытия динамического диапазона 24-битовых входных цифровых ИКМ аудиосигналов. 64-уровневый верхний предел устанавливают для покрытия динамического диапазона 20-битовых входных цифровых ИКМ аудиосигналов.
Логарифмические масштабные коэффициенты отображают в квантователь и масштабный коэффициент заменяют ближайшим кодом уровня квантователя КМ8рЪ (или РЕАК.,,.). В случае 64-уровневого квантователя эти коды имеют длину 64 бита и находятся в диапазоне между 0-63. В случае 128-уровневого квантователя, коды имеют длину 7 битов и находятся в диапазоне между 0-127.
Обратное квантование 131 достигается просто отображением кодов уровней в соответствующую обратную характеристику квантования для получения значений КМ§§ (или ΡΕΑΚ§). Квантованные масштабные коэффициенты используют как в кодировщике, так и в декодировщике для масштабирования АДИКМ (или АИКМ, если ΡΜΟΌΕ=0) дифференциальной выборки, таким образом обеспечивая идентичность процессов масштабирования и обратного масштабирования.
Если скорость бит кодов 64-уровневого квантователя требуется уменьшить, выполняют дополнительное кодирование энтропии или кодирование переменной длины. 64-уровневые коды сначала кодируют 132 дифференциально первого порядка в _) поддиапазонах, начиная со второго диапазона 0=2) до самого высокого активного поддиапазона. Процесс также может быть использован для кодирования максимальных (ΡΕΑΚ) масштабных коэффициентов. Дифференциальные коды ΌΚΜδρΣ(]), (ΌΡΕΑΚρΣ(ί)) со знаком имеют максимальный диапазон +/- 63 и их запоминают в буфере 134. Для уменьшения их скорости бит относительно исходных 6битовых кодов дифференциальные коды отображают в число (р) 127-уровневых книг кодов со средним надстрочным элементом переменой длины. Каждую книгу кодов оптимизируют для различной входной статистической характеристики.
Процесс кодирования энтропии дифференциальных кодов со знаком является таким же, как процесс кодирования энтропии для режимов импульсной помехи, представленный на фиг. 1 2, за исключением того, что используют р 1 27уровневые таблицы кодов переменной длины. Таблицу, которая обеспечивает самое малое потребление бит в процессе отображения выбирают с использованием индекса ЗНИРР. Отображенные коды νΌΡΜδχι|,(ί) извлекают из этой таблицы, упаковывают и передают в декодировщик вместе с индексным словом ЗНИРР. Декодировщик, который хранит то же самое множество из (р) 127-уровневых обратных таблиц, использует индекс ЗНИРР для направления входящих кодов переменной длины в подходящую таблицу для декодирования в дифференциальные уровни кодов квантователя. Дифференциальные уровни кодов возвращают в абсолютные значения с использованием следующих операций:
ΚΜ3ΡΣ(1) = ΌΚΜ3ρς(1)
ΚΜ3ρΣ(ί) = ΌΚΜ3ρΣ(ί) + ΚΜ3ρΣ(ί-1) .)=2..., К, а максимальные (ΡΕΑΚ) уровни кодов возвращают в абсолютные значения с использованием следующих операций:
ΡΕΑΚρΣ(1) = ΌΡΕΑΚρς(1)
ΡΕΑΚρς(]) = ΌΡΕΑΚρΣ(ί) + ΡΕΑΚς,^-Ι) для 1=2,..., К, где в обоих случаях К = числу активных поддиапазонов.
Глобальное распределение бит
Глобальная система 30 управления битами, показанная на фиг. 1 0, управляет распределением бит (ΑΒΙΤ), определяет число активных поддиапазонов и стратегию совместной частоты и стратегию ВК для многоканального аудиокодировщика для обеспечения субъективно прозрач27 ного кодирования при уменьшенной скорости бит. Это увеличивает число аудиоканалов и/или время проигрывания, которые могут быть закодированы и запомнены на фиксированном носителе, при поддержке или улучшении аудиодостоверности. Вообще, система 30 ГУБ сначала распределяет биты в каждый поддиапазон в соответствии с психоакустическим анализом, модифицированным выигрышем прогнозирования кодировщика. Оставшиеся биты затем распределяют в соответствии со схемой минимальной средне-квадратической ошибки бит для снижения общего уровня шума. Для оптимизации эффективности кодирования система ГУБ одновременно распределяет биты по всем аудиоканалам, по всем поддиапазонам и во всем блоке. Кроме того, может быть использована стратегия совместного кодирования частоты. Таким образом, система использует неравномерное распределение мощности сигнала между аудиоканалами по частоте и во времени.
Психоакустический анализ.
Психоакустические измерения используют для определения нерелевантной воспринимаемой информации в аудиосигнале. Нерелевантная воспринимаемая информация - это те составляющие аудиосигнала, которые не могут быть восприняты слушателями и могут быть измерены в интервале времени, в частотном интервале или в некотором другом базисе. Дж. Д.Джонсон: «Преобразование кодирования аудиосигнала с использованием критерия восприятия шума», «Журнал общества инженеров по электронике по избранным областям в системах связи», том 18АС-6, с. 314-323, февраль 1988, описывает общие принципы психоакустического кодирования.
Два основных фактора влияют на психоакустическое измерение. Одним является зависящий от частоты абсолютный порог слышимости, применимый к людям. Другим является маскирующий эффект, который оказывает один звук на способность людей слышать второй звук, проигрываемый одновременно или даже после первого звука. Другими словами, первый звук мешает нам слышать второй звук, то есть маскирует его.
В кодировщике поддиапазона конечным результатом психоакустического вычисления является множество чисел, которые определяют неслышимый уровень шума для каждого поддиапазона в этот момент. Это вычисление хорошо известно и содержится в стандарте сжатия экспертной группы по кинофильмам 1 1δΘ/ΙΕδ ΌΙδ 11172 «Информационная технология - Кодирование кинофильмов и связанного звука для цифрового запоминающего носителя приблизительно до 1,5 Мбит/сек», 1992. Эти числа изменяются динамически с аудиосигналом. Кодировщик регулирует минимальный шум квантования в поддиапазонах путем процесса распределения бит так, чтобы шум квантования в этих поддиапазонах был меньше, чем слышимый уровень.
Точное психоакустическое вычисление обычно требует высокочастотного разрешения в преобразовании времени в частоту. Это предполагает большой кадр анализа для преобразования времени в частоту. Стандартный размер кадра анализа равен 1 024 выборкам, который соответствует подблоку сжатых аудиоданных. Частотное разрешение длины 1024 быстрых преобразований Фурье приблизительно соответствует временному разрешению человеческого уха.
Выходом психоакустической модели является отношение сигнала к маске (ОСМ) для каждого из 32 поддиапазонов. ОСМ показывает величину шума квантования, которую может переносить конкретный поддиапазон, и, следовательно, также показывает число битов, требуемых для квантования выборок в поддиапазоне. В частности, большое ОСМ (>>1) показывает, что требуется большое число битов, а малое ОСМ (>0) показывает, что требуется меньше битов. Если ОСМ <0, тогда аудиосигнал находится ниже порога маски шума и не требуются никакие биты для квантования.
Как показано на фиг. 14 отношения СМ генерируют для каждого последовательного блока вообще 1 ) вычислением быстрого преобразования Фурье, предпочтительно длины 1 024, на аудиовыборках ИКМ для создания последовательности частотных коэффициентов 142, 2) свертыванием частотных коэффициентов с частотно зависимыми тональными и шумовыми психоакустическими масками 1 44 для каждого поддиапазона, 3) усреднением результирующих коэффициентов в каждом поддиапазоне для создания уровней ОСМ, и 4) выборочно нормализацией отношений СМ в соответствии со слуховой характеристикой 1 46 человека, представленной на фиг. 15.
Чувствительность уха человека максимальна на частотах около 4 кГц и уменьшается, когда частота увеличивается или уменьшается. Таким образом, для того, чтобы быть воспринимаемым на некотором уровне, сигнал 20 кГц должен быть значительно сильнее, чем сигнал 4 кГц. Поэтому, отношения СМ на частотах около 4 кГц сравнительно более важны, чем отдаленные частоты. Однако, точная форма кривой зависит от средней мощности сигнала, идущего слушателю. Когда уровень громкости увеличивают, слуховая характеристика 1 46 сжимается. Таким образом, система, оптимизированная для конкретного уровня громкости, будет субоптимальной при других уровнях громкости. В результате, либо номинальный уровень мощности выбирают для нормализации отношений СМ, либо нормализацию блокируют. Результирующие отношения СМ 148 для 32 поддиапазонов представлены на фиг. 1 6.
Стандартная процедура распределения бит.
Система 30 ГУБ сначала выбирает подходящую стратегию кодирования поддиапазонов, которые будут кодировать с алгоритмами ВК и АДИКМ, а также будет ли разрешен СКЧ. После чего система ГУБ выбирает либо психоакустический подход, либо подход распределения бит с минимальной среднеквадратической ошибкой. Например, при высоких скоростях бит система может блокировать психоаккустическое моделирование и использовать правильную схему распределения с минимальной среднеквадратической ошибкой. Это уменьшает сложность вычисления без какого-либо заметного изменения в восстановленном аудиосигнале. Наоборот, при низких скоростях система может активизировать схему совместного кодирования частоты, обсужденную выше, для улучшения достоверности восстановления на низких частотах. Система ГУБ может переключаться между нормальным психоакустическим распределением и распределением с минимальной среднеквадратической ошибкой на основе содержания переходного процесса сигнала на поблочной основе. Когда содержание импульсной помехи высоко, предположение стационарности, которое используют для вычисления значений ОСМ не правильно и, следовательно, схема минимальной среднеквадратической ошибки обеспечивает большую эффективность.
Для психоакустического распределения система ГУБ сначала распределяет имеющиеся биты для обеспечения психоакустических эффектов, а затем распределяет оставшиеся биты для снижения общего минимального уровня шума. Первым шагом является определение значений ОСМ для каждого поддиапазона текущего блока, как описано выше. Следующим шагом является корректировка значений ОСМ для выигрыша прогнозирования (Р§ат) в соответствующих поддиапазонах для генерации отношений маски к шуму (значений ОМС). Причем, принцип заключается в том, что кодировщик АДИКМ будет обеспечивать часть требуемого ОСМ. В результате неслышимые психоаккустические уровни шума могут быть обеспечены меньшими битами.
ОМШ для )-го поддиапазона, при допущении ΡΜΘΌΕ=1 равно: ΜΝΚ(ΐ) = 8ΜΚ(ΐ) РдашО) · ΡΕΓ (ΑΒΙΤ), где ΡΕΓ (ΑΒΙΤ) показатель эффективности прогнозирования квантователя. Для вычисления ΜΝΚ(ΐ) разработчик должен иметь оценку распределения бит (ΑΒΙΤ), которая может быть сгенерирована либо при распределении битов только на основании 8ΜΚ(ΐ), либо при предположении, что ΡΕΓ (ΑΒΙΤ) = 1 . При скоростях бит от средних до высоких действительный выигрыш прогнозирования приблизительно равен вычисленному выигрышу прогнозирования. Однако при низких скоростях бит действительный выигрыш прогнозирования уменьшается. Действительный выигрыш прогнозирования, который достигают, например, 5-уровневым квантователем, равен приблизительно 0,7 от оцененного выигрыша прогнозирования, в то время как 65-уровневый квантователь дает возможность действительному выигрышу прогнозирования быть равным оцененному выигрышу прогнозирования ΡΕΓ = 1 ,0. В пределе, когда скорость бит равна нулю, прогнозируемое кодирование, по существу, непригодно и действительный выигрыш прогнозирования равен нулю.
На следующем шаге система 30 ГУБ генерирует схему распределения бит, которая обеспечивает ОМШ для каждого поддиапазона. Это выполняют с использованием аппроксимации, что 1 бит равняется 6 децибелам сигнала помехи. Для гарантии того, что помеха кодирования меньше, чем психоакустически слышимый порог, назначенная скорость бит равна наибольшему целому числу ΜΝΚ, деленному на 6 децибел, то есть:
АВ1Т(3)
ΜΝΚ(0 ) децибел
При распределении битов таким образом уровень 156 шума в восстановленном сигнале будет стремиться следовать самому сигналу 157, показанному на фиг. 17. Таким образом, на частотах, где сигнал очень сильный, уровень шума будет относительно высоким, но останется неслышимым. На частотах, где сигнал относительно слабый, минимальный уровень шума будет очень малым и неслышимым. Средняя ошибка, связанная с этим типом психоакустического моделирования, будет всегда больше, чем минимальная среднеквадратическая ошибка уровня 158 шума, но слышимая эффективность может быть лучше, особенно при низких скоростях бит.
В случае, когда сумма распределенных битов для каждого поддиапазона по всем аудиоканалам больше или меньше, чем целевая скорость бит, стандартная процедура ГУБ будет итеративно уменьшать или увеличивать распределение бит для отдельных поддиапазонов. Альтернативно, целевая скорость бит может быть вычислена для каждого аудиоканала. Это субоптимально, но проще, особенно при реализации аппаратного обеспечения. Например, имеющиеся биты могут быть распределены равномерно между аудиоканалами или могут быть распределены пропорционально среднему ОСМ или СК каждого канала.
В случае, когда целевая скорость бит выше на сумму локальных распределений бит, включая биты кода ВК и вспомогательной информации, стандартная процедура глобального управления битами будет постепенно уменьшать локальные распределения бит поддиапазона. Имеется ряд конкретных способов для уменьшения средней скорости бит. Прежде всего, скорости бит, которые были округлены наибольшей целочисленной функцией, могут быть восстановлены. Далее, один бит может быть изъят из поддиапазонов, имеющих наименьшие значения ОМШ. Кроме того, высокочастотные поддиапазоны могут быть выключены или может быть обеспечена возможность совместного кодирования частоты. Все стратегии уменьшения скорости бит следуют основному принципу постепенного плавного уменьшения разрешения кодирования с наименее агрессивно воспринимаемой стратегией, применяемой первой и наиболее агрессивной стратегией, используемой последней.
В случае, когда целевая скорость бит больше, чем сумма локальных распределений бит, включая биты кодов ВК и вспомогательной информации, стандартная процедура глобального управления битами будет постепенно и итеративно увеличивать локальное распределение бит поддиапазона для уменьшения общего минимального уровня шума восстановленного сигнала. Это может вызвать кодирование поддиапазонов, которым ранее были распределены нулевые биты. Издержки бит в «включаемых» поддиапазонах, таким образом, могут требоваться для отражения стоимости передачи любых коэффициентов прогнозатора, если разрешают режим прогнозирования (ΡΜΘΌΕ).
Стандартная процедура ГУБ может выбирать одну из трех различных схем для распределения оставшихся битов. Одним вариантом является использование подхода минимальной среднеквадратической ошибки, при котором перераспределяют все биты так, что результирующий минимальный уровень шума является приблизительно ровным. Это эквивалентно первоначальному блокированию психоакустического моделирования. Для достижения минимального уровня шума с минимальной среднеквадратической ошибкой график 160 среднеквадратических значений поддиапазонов, показанный на фиг. 18а переворачивают на 180°, как показано на фиг. 18Ь и «наполняют водой», пока не исчерпают все биты. Этот хорошо известный способ называется «наполнение водой», поскольку уровень искажения падает равномерно при увеличении числа распределенных битов. В показанном примере первый бит назначают в поддиапазон 1 , второй и третий биты назначают в поддиапазоны 1 и 2, биты с четвертого по седьмой назначают в поддиапазоны 1,2,4 и 7 и так далее. Альтернативно один бит может быть назначен в каждый поддиапазон, чтобы гарантировать, что каждый поддиапазон будет закодирован, а затем оставшиеся биты «заполняют водой».
Вторым и предпочтительным вариантом является распределение оставшихся битов в соответствии с подходом минимальной среднеквадратической ошибки и среднеквадратическим графиком, описанным выше. Эффектом этого способа является равномерное снижение минимального уровня шума 157, показанного на фиг. 1 7, с одновременной поддержкой формы, связанной с психоакустической маскировкой. Это обеспечивает хороший компромисс между психоакустическим искажением и искажением среднеквадратической ошибки.
Третьим подходом является распределение оставшихся битов с использованием подхода минимальной среднеквадратической ошибки, применяемого к графику разности между среднеквадратической и ОМШ значениями для поддиапазонов. Эффектом этого подхода является плавное преобразование формы минимального уровня шума из оптимальной психоакустической формы 157 в оптимальную (гладкую) форму 158 минимальной среднеквадратической ошибки, при увеличении скорости бит. В любой из этих схем, если ошибка кодирования в любом поддиапазоне падает ниже 0,5 самого младшего двоичного разряда относительно исходного ИКМ, то биты больше не распределяют в этот диапазон. Выборочно могут быть использованы фиксированные максимальные значения распределений бит поддиапазона для ограничения максимального числа битов, распределяемых в конкретный диапазон.
В системе кодирования, раскрытой выше, предполагалось что средняя скорость бит на выборку является фиксированной и распределение бит генерировали для максимизации достоверности восстановленного аудиосигнала. Альтернативно уровень искажения, среднеквадратический или воспринимаемый, может быть зафиксирован, а скорость бит может быть изменена для соответствия уровню искажения. В подходе минимальной среднеквадратической ошибки, среднеквадратический график просто «наполняют водой» до соответствия уровня искажения. Требуемую скорость бит изменяют на основе среднеквадратических уровней поддиапазонов. В психоакустическом подходе биты распределяют для удовлетворения индивидуальным значениям ОМШ. В результате скорость бит будет меняться на основе индивидуальных значений ОМШ и выигрышей прогнозирования. Этот тип распределения в настоящее время не используют, поскольку современные декодировщики работают при фиксированных скоростях. Однако, альтернативные системы доставки, например, асинхронной передачи данных или носитель с произвольным доступом к памяти могут сделать кодирование с переменной скоростью осуществимым в ближайшем будущем.
Квантование индексов распределения бит (ΑΒΙΤ).
Индексы распределения бит (ΑΒΠ) генерируют для каждого поддиапазона и каждого аудиоканала стандартной процедурой адаптивного распределения бит в процессе глобального управления битами. Назначением индексов ко33 дировщике является указание числа уровней 162, показанных на фиг. 10, которые необходимы для квантования разностного сигнала для получения субъективно оптимального минимального уровня шума восстановления в декодировщике звука. В декодировщике они указывают число уровней, необходимых для обратного квантования. Индексы генерируют для каждого буфера анализа, и их значения могут находиться в диапазоне от 0 до 27. Зависимость между значением индекса, числом уровней квантователя и приблизительным результирующим дифференциальным поддиапазоном представлены в таблице 3. Поскольку разностный сигнал нормализуют, размер шага 164 задают равным единице.
Таблица 3
Индекс ΑΒΙΤ | N О Уровней | Длина кода (биты) | 8ΝρΚ (децибелы) |
0 | 0 | 0 | - |
1 | 3 | Переменная | 8 |
2 | 5 | Переменная | 12 |
3 | 7(или 8) | Переменная(или 3) | 16 |
4 | 9 | Переменная | 19 |
5 | 13 | Переменная | 21 |
6 | 17 (или 16) | Переменная(или 4) | 24 |
7 | 25 | Переменная | 27 |
8 | 33 (или 32) | Переменная(или 5) | 30 |
9 | 65 (или 64) | Переменная(или 6) | 36 |
10 | 129 (или 128) | Переменная (или 7) | 42 |
11 | 256 | 8 | 48 |
12 | 512 | 9 | 54 |
13 | 1024 | 10 | 60 |
14 | 2048 | 11 | 66 |
15 | 4096 | 12 | 72 |
16 | 8192 | 13 | 78 |
17 | 16384 | 14 | 84 |
18 | 32768 | 15 | 90 |
19 | 65536 | 16 | 96 |
20 | 131072 | 17 | 102 |
21 | 262144 | 18 | 108 |
22 | 524268 | 19 | 114 |
23 | 1048576 | 20 | 120 |
24 | 2097152 | 21 | 126 |
25 | 4194304 | 22 | 132 |
26 | 8388608 | 23 | 138 |
27 | 16777216 | 24 | 144 |
Индексы распределения бит (ΑΒΙΤ) передают в декодировщик непосредственно либо с использованием 4-битовых целочисленных кодовых слов без знака, 5-битовых целочисленных кодовых слов без знака, либо с использованием 12-уровневой таблицы энтропии. Обычно кодирование энтропии применяют при низкой скорости бит для сохранения битов. Способ кодирования ΑΒΙΤ устанавливают управлением режимом в кодировщике и передают в декодировщик. Кодировщик энтропии отображает 166 индексы ΑΒΙΤ в конкретную книгу кодов, идентифицируемую индексом ΒΗϋΡΡ и специальным кодом νΑΒΙΤ в книге кодов, с использованием процесса, показанного на фиг. 1 2 с 1 2уровневыми таблицами ΑΒΙΤ.
Г лобальное управление скоростью бит.
Поскольку как вспомогательная информация, так и дифференциальные выборки поддиапазона могут быть выборочно кодированы с использованием книг кодов переменной длины энтропии, необходимо применить некоторый механизм для регулировки результирующей скорости бит кодировщика, когда сжатый поток бит передают при фиксированной скорости. Поскольку обычно не желательно модифицировать вспомогательную информацию, вычисленную однажды, регулировки скорости бит лучше всего достигают итеративным изменением процесса квантования дифференциальной выборки поддиапазона внутри кодировщика АДИКМ до соответствия ограничению скорости.
В описываемой системе система 178 глобального управления скоростью (ГУС) на фиг. 1 0 регулирует скорость бит, которую получают в результате процесса отображения кодов уровней квантователя в таблицу энтропии, изменением статистического распределения значений кода уровня. Предполагается, что все таблицы энтропии имеют одинаковую тенденцию больших длин кода для больших значений кода уровня. В этом случае средняя скорость бит уменьшается, когда вероятность малого значения кода уровней увеличивается и наоборот. В процессе квантования АДИКМ (или АИКМ), величина масштабного коэффициента определяет распределение или использование значений кода уровня. Например, когда величина масштабного коэффициента увеличивается, дифференциальные выборки квантуют более низкими уровнями, следовательно, значения кода постепенно станут меньше. Это, в свою очередь, приводит к меньшей длине кодового слова энтропии и более низкой скорости бит.
Недостатком этого способа является то, что при увеличении величины масштабного коэффициента шум восстановления в выборках поддиапазона также повышается на тот же порядок. Однако, на практике регулировка масштабных коэффициентов обычно не более, чем 1-3 децибел. Если требуется большая регулировка, то предпочтительно уменьшить общее распределение бит, поскольку имеет место вероятность появления слышимого шума квантования в поддиапазонах, которые используют неровный масштабный коэффициент.
Для регулировки распределения бит энтропии, закодированной АДИКМ, выборки предыстории прогнозатора для каждого поддиапазона запоминают во временном буферном регистре, пока повторяют цикл кодирования АДИКМ. Далее все буферы выборки поддиапазона кодируют полным процессом АДИКМ с использованием коэффициентов А прогнозирования, полученных из анализа методом линейного прогнозирования поддиапазона вместе с масштабными коэффициентами, среднеквадратическими (или максимальными), распределениями бит квантователя (ΑΒΙΤ), режимами импульсной помехи ΤΜΟΌΕ и режимами прогнозирования ΡΜΟΌΕ, полученными из оцененного разностного сигнала. Результирующие коды уровня квантователя буферизируют и отображают в книгу кодов переменной длины энтропии, которая показывает наименьшее потребление бит, используя индекс распределения бит для определения размеров книги кодов.
Система ГУС затем анализирует число битов, использованных для каждого поддиапазона с использованием того же индекса распределения бит из всех индексов. Например, когда АВ1Т=1, вычисление распределения бит в глобальном управлении битами допускает среднюю скорость 1,4 на выборку поддиапазона (т.е., средняя скорость для книги кодов энтропии при допущении оптимального распределения амплитуды уровня кода). Если полное потребление бит всех диапазонов для каждого АВ1Т=1 больше, чем 1,4/ (полное число выборок поддиапазона), то масштабные коэффициенты могут быть увеличены во всех этих поддиапазонах для уменьшения скорости бит. Решение регулировать масштабные коэффициенты поддиапазона предпочтительно откладывают, пока не выбраны все скорости индекса ΑΒΙΤ. В результате индексы со скоростями бит ниже, чем предполагаемые в процессе распределения бит могут быть компенсированы индексами со скоростями бит выше этого уровня. Эта оценка может также быть расширена для покрытия всех подходящих аудиоканалов.
Рекомендуемой процедурой уменьшения общей скорости бит является выполнение с самой нижней скорости бит индекса ΑΒΙΤ, которая превышает порог, увеличения масштабных коэффициентов в каждом из поддиапазонов, которые имеют это распределение бит. Действительное потребление бит уменьшается на число бит, которые в этих поддиапазонах были выше номинальной скорости для этого распределения. Если модифицированное потребление бит превышает допустимый максимум, тогда масштабные коэффициенты для следующего самого высокого индекса ΑΒΙΤ, для которого потребление бит превышает номинал, увеличивают. Этот процесс продолжают до тех пор, пока модифицированное потребление бит не станет ниже максимума.
Если это достигнуто, данные предыстории загружают в прогнозатор и процесс 72 кодирования АДИКМ повторяют для тех поддиапазонов, в которых были модифицированы масштабные коэффициенты. После этого коды уровней опять отображают в книги кодов с наиболее оптимальной энтропией и потребление бит вычисляют повторно. Если любое из потреблений бит превышает номинальные скорости, то масштабные коэффициенты дополнительно увеличивают и цикл повторяют.
Модификация масштабных коэффициентов может быть выполнена двумя способами. Первый состоит в передаче в декодировщик коэффициента регулировки для каждого индекса ΑΒΙΤ. Например, 2-битовое слово может передавать сигнал регулировки в диапазоне, например, 0, 1 , 2 и 3 децибела. Поскольку тот же коэффициент регулировки используют для всех поддиапазонов, которые используют индекс ΑΒΙΤ и только индексы 1 -1 0 могут использовать кодирование энтропии, максимальное число коэффициентов регулировки, которые необходимо передавать для всех поддиапазонов, равно 1 0. Альтернативно, масштабный коэффициент может быть изменен в каждом поддиапазоне при выборе более высокого уровня квантования. Однако, поскольку квантователи масштабного коэффициента имеют размеры шагов 1,25 и 2,25 децибел, соответственно, регулировка масштабного коэффициента ограничена этими шагами. Более того, при использовании этого способа необходимо повторно вычислять дифференциальное кодирование масштабных коэффициентов и результирующего потребления бит, если разрешено кодирование энтропии.
Вообще говоря, та же процедура может быть использована для увеличения скорости бит, т.е. когда скорость бит ниже требуемой. В этом случае масштабные коэффициенты уменьшали бы, чтобы дифференциальные выборки больше использовали внешние уровни квантователя и, следовательно, использовали более длинные кодовые слова в таблице энтропии.
Если потребление бит для индексов распределения бит не может быть уменьшено в пределах разумного числа итераций, или в случае, когда передают коэффициенты регулировки масштабного коэффициента, число шагов регулировки достигло предела, тогда возможны два средства. Первое, масштабные коэффициенты поддиапазонов, которые находятся в пределах номинальной скорости, могут быть увеличены, таким образом снижая общую скорость бит. Альтернативно весь процесс кодирования АДИКМ может быть прекращен и повторно вычислены адаптивные распределения бит по диапазонам, с использованием меньшего количества.
Формат потока данных.
Мультиплексор 32, показанный на фиг. 10 упаковывает данные для каждого канала, а затем мультиплексирует упакованные данные для каждого канала в выходной блок для формирования потока 16 данных. Способ упаковки и мультиплексирования данных, т.е. формат 186 блока, показанный на фиг. 19, разработан так, что аудиокодировщик может быть использован в широком диапазоне применений и может быть расширен до более высоких частот дискретизации, количество данных в каждом блоке ограничивают, проигрывание может быть инициировано на каждом подподблоке независимо, для уменьшения времени ожидания, и ошибки декодирование снижаются.
Как показано, один блок 186 (4096 выборок ИКМ/канал) определяет границы потока данных, в которых находится достаточно информации для того, чтобы правильно декодировать блок звука, и состоит из 4 подблоков 188 (1024 выборок ИКМ/канал), каждый из которых, в свою очередь, состоит из 4 подподблоков 190 (256 выборок ИКМ/канал). Слово 192 синхронизации блока помещают в начале каждого аудио блока. Информация 194 заголовка блока в первую очередь дает информацию относительно структуры блока 186, конфигурацию кодировщика, который генерирует поток и различные дополнительные операционные особенности, например, управление вложенным динамическим диапазоном и временной код. Дополнительная информация 196 заголовка сообщает декодировщику, требуется ли смешение сигнала, если была сделана компенсация динамического диапазона и если вспомогательные байты данных включают в поток данных. Заголовки 198 аудиокодирования указывают компоновку упаковки и форматы кодирования, используемые в кодировщике для сборки «вспомогательной информации кодирования», т.е. распределение бит, масштабные коэффициенты, значения ΡΜΘΌΕ, значения ΤΜΘΌΕ, книги кодов и т.д. Остаток блока составлен из подблоков последовательных подблоков 188.
Каждый подблок начинается с вспомогательной информации 200 аудиокодирования, которая передает информацию относительно числа ключевых систем кодирования, используемых для сжатия звука в декодировщик. Они содержат выявление импульсной помехи, прогнозирующее кодирование, адаптивное распределение бит, высокочастотное векторное квантование, кодирование интенсивности и адаптивное масштабирование. Многие из этих данных распаковывают из потока данных с использованием вышеупомянутой информации заголовка аудиокодирования. Массив 202 высокочастотного кода ВК состоит из 10-битовых индексов на высокочастотный поддиапазон, указываемый индексами УЦЗИВ. Массив 204 низкочастотных эффектов является дополнительным и представляет данные очень низкой частоты, которые могут быть использованы для запуска, например, динамика низкого тона.
Аудиомассив 206 декодируют с использованием обратного квантователя Хафмана/фиксированного обратного квантователя и разделяют на ряд подподблоков (88С), причем каждый декодируют до 256 выборок ИКМ на аудиоканал. Массив 208 повышенной дискретизации аудиоприсутствует только, если частота выборки больше, чем 48 кГц. Для того, чтобы оставаться совместимыми, декодировщики, которые не могут работать на частотах выборки больше, чем 48 кГц, должны пропускать этот массив аудиоданных. Распакованную синхронизацию (ΌδΥΝΟ) 210 используют для проверки конца позиции подблока в аудиоблоке. Если позиция не проверяется, звук, декодированный в подблоке, объявляют ненадежным. В результате этот блок приглушают либо повторяют предыдущий блок.
Декодировщик поддиапазона.
Фиг. 20 представляет блок схему декодировщика 1 8 выборки поддиапазона. Декодировщик достаточно прост по сравнению с кодировщиком и не предполагает выполнения вычислений, которые существенно важны в качестве восстанавливаемого звука, например распределения бит. После синхронизации распаковщик 40 распаковывает поток 1 6 сжатых аудиоданных, обнаруживает и, если необходимо, корректирует ошибки, происходящие при передаче и демультиплексирует данные в отдельные аудиоканалы. Разностные сигналы поддиапазона повторно квантуют в сигналы ИКМ и каждый аудиоканал фильтруют для преобразования сигнала назад в интервал времени.
Прием аудиоблока и распаковка заголовков.
Закодированный поток данных упаковывают (или разбивают на блоки) в кодировщике, он содержит в каждом блоке дополнительные данные для синхронизации декодировщика, выявления и коррекции ошибки, флаги аудиокодирования и вспомогательную информацию кодирования, а также сами фактические аудиокоды. Распаковщик обнаруживает слово синхронизации и извлекает размер блока ΡδΙΖΕ.
Закодированный поток бит состоит из последовательных аудиоблоков, причем каждый начинается с 32-битового (Ох7ГГе8001) слова синхронизации (δΥΝΟ). Физический размер аудиоблока ΡδΙΖΕ извлекают из байтов, следующих после слова синхронизации. Это позволяет программисту задать таймер «конца блока» для уменьшения издержек программного обеспечения. Затем извлекают параметр ΝΒΓ-кк (число блоков), который позволяет декодировщику вычислить размер аудиоокна (32 (ΝΒΠ1<5+1)). Это сообщает декодировщику, какую дополнительную информацию извлекать и сколько восстановленных выборок генерировать.
Как только приняты байты заголовка блока (купс, йуре, кигр, пЫ1кк, Пй/с. атобе, кГгед, га1с. Ш1х1, бу η Г, буиср О те, аихси?, 1ГГ, Ьйад), достоверность первых 12 байтов можно проверить с использованием контрольных байтов Рида Соломона НСКС. Они будут корректировать 1 ошибочный байт из 1 4 байтов или 2 ошибочных данных флага. После того, как завершена проверка ошибок, информацию заголовка используют для корректировки флагов декодировщика.
Заголовки (ГШк, уетиит, сЫкр рстг, ипкрес), следующие после НСКС и до дополнительной информации могут быть извлечены и использованы для корректировки флагов деко39 дировщика. Поскольку эта информация не будет изменяться от блока к блоку, большинство схем мажоритарной выборки могут быть использованы для компенсации ошибок бит. Дополнительные данные заголовка (Дте8, тсоеГГ, ДсоеГГ, аихД, осгс) извлекают в соответствии с заголовками пй.хсЕ ДупГ, тте и аихсп!. Дополнительные данные могут быть проверены с использованием дополнительных байтов Рида Соломона НСКС. Заголовки блока аудиокодирования (киЬГк, 8иЬ8, сЙ8, уд8иЬ, )отх, ДшГГ, 8Йи£Г, ЫшГГ, 8е15, 8е17, 8е19, 8е113, 8е117, 8е125, 8е133, 8е165, 8е1129, айсгс) передают один раз в каждом блоке. Они могут быть проверены с использованием контрольных аудиобайтов Рида Соломона (контроля по избыточности) (ЛНСКС). Большинство заголовков повторяют для каждого аудиоканала, как определено СНЗ.
Распаковка вспомогательной информации кодирования подблока
Блок аудиокодирования разделяют на ряд подблоков (ЗИВРЗ). Вся необходимая вспомогательная информация (ртоЬе, руд, !тоДе, 8са1е8, аЬЙ8, ЬГгед) включается для того, чтобы правильно декодировать каждый подблок аудиосигнала без ссылки на любые другие подблоки. Каждый последовательный подблок декодируют сначала распаковкой его вспомогательной информации.
-битовый флаг режима прогнозирования (ΡΜΟΌΕ) передают для каждого активного поддиапазона и по всем аудиоканалам. Флаги ΡΜΟΌΕ справедливы для текущего подблока. ΡΜΟΌΕ=1 означает, что коэффициенты прогнозатора не включают в аудиоблок для этого поддиапазона. В этом случае коэффициенты прогнозатора в этой полосе устанавливают в ноль в течение длительности подблока. ΡΜΟΌΕ=1 означает, что вспомогательная информация содержит коэффициенты прогнозатора для этого поддиапазона. В этом случае коэффициенты прогнозатора извлекают и устанавливают в прогнозатор на продолжительность подблока.
Для каждого ΡΜΟΌΕ=1 в массиве ртоДе соответствующий индекс адреса УО (ВК) загружают в массив Ρνρ. Эти индексы являются фиксированными 12-битовыми целочисленными словами без знака и 4 коэффициента прогнозирования извлекают из поисковой таблицы отображением 1 2-битовой целочисленной в векторную таблицу 266.
Индексы распределения бит (АВ1Т) указывают число уровней в обратном квантователе, который будет преобразовывать аудиокоды поддиапазона назад в абсолютные значения. Формат распаковки отличается для индексов АВ1Т в каждом аудиоканале, в зависимости от индекса ВНИРР и специфического кода 256 УАВГГ.
Вспомогательную информацию режима импульсной помехи (ΤΜΟΌΕ) используют для указания позиции импульсных помех в каждом поддиапазоне относительно подблока. Каждый подблок разделяют на 1 -4 подподблока. В терминах выборок поддиапазона каждый подподблок состоит из 8 выборок. Максимальный размер подблока равен 32 выборкам поддиапазона. Если импульсная помеха появляется в первом подподблоке, тогда 1тоДе=0. Импульсная помеха указывается во втором подблоке, когда 1тоДе= 1 и т.д. Для управления искажением типа импульсной помехи, как например, предэхо, два масштабных коэффициента передают для поддиапазонов подблока, где ΤΜΟΌΕ больше, чем 0. Индексы ВНИРР, извлекаемые из аудиозаголовков, определяют способ, требуемый для декодирования значений ΤΜΘΌΕ. Когда ВНИРР=3, значения ΤΜΘΌΕ распаковывают как 2-битовые целочисленные без знака.
Индексы масштабных коэффициентов передают, чтобы обеспечить правильное масштабирование аудиокодов поддиапазона внутри каждого подблока. Если ΤΜΟΌΕ равно нулю, тогда передают один масштабный коэффициент. Если ΤΜΟΌΕ больше, чем ноль для любого поддиапазона, тогда два масштабных коэффициента передают вместе. Индексы 240 ЗНИРР, извлекаемые из аудиозаголовков, определяют способ, требуемый для декодирования ЗСАБРЗ для каждого отдельного аудиоканала. Индексы νΌΡΜδ^,, определяют значение среднеквадратического масштабного коэффициента.
В определенных режимах индексы ЗСАБРЗ распаковывают с использованием выбора из пяти 129-уровневых со знаком обратных квантователей Хафмана. Однако результирующие обратно квантованные индексы дифференциально кодируют и преобразуют в абсолютное значение следующим образом:
АВЗ_ЗСА^Ε (п+1) = ЗСА1.НЗ (п) ЗСАБРЗ (п+1) , где п - п-ый дифференциальный масштабный коэффициент в аудиоканале, начиная с первого поддиапазона.
В режимах аудиокодирования с низкой скоростью бит аудиокодировщик непосредственно использует векторное квантование для эффективного кодирования аудиовыборок высокочастотного поддиапазона. Дифференциальное кодирование не используют в этих поддиапазонах, и все массивы, относящиеся к обычным процессам АДИКМ, должны храниться в состоянии «0». Первый поддиапазон, который кодируют с использованием ВК, указывают с помощью УЦЗИВ, и все поддиапазоны до ЗИВЗ кодируют таким же образом.
Высокочастотные индексы (НРИБЦ) распаковывают 248 как фиксированные 10-битовые целые числа без знака. 32 выборки, требуемые для каждого подблока поддиапазона, извлекают из Θ4 дробной двоичной поисковой таблицы, подачей подходящих индексов. Это повторяют для каждого канала, в котором режим высокочастотного ВК является активным.
Коэффициент прореживания для эффектов каналов всегда равен Х128. Число 8-битовых выборок эффекта, присутствующих в ЬРЕ (низкочастотный эффект), определен выражением 88С· 2, когда Р8С=0 или (88С+1) · 2, когда Р8С не равно нулю. Дополнительный 7-битовый масштабный коэффициент (целочисленный без знака) также включают в конце массива ЬРЕ, который преобразуют в среднеквадратическое значение с использованием 7-битовой поисковой таблицы.
Распаковка массива аудиокодов подподблока.
Процессом извлечения аудиокодов поддиапазона управляют с помощью индексов ΑΒΙΤ и в случае, когда АВ1Т<11, также индексами 8ЕЬ. Аудиокоды форматируют либо с использованием кодов Хафмана переменной длины, либо фиксированных линейных кодов. Вообще, индексы АВ1Т=10 или меньше предполагают коды Хафмана переменной длины, которые выбирают кодами УОБ (п) 258, тогда как ΑΒΙΤ выше 10 всегда означают фиксированные коды. Все квантователи имеют среднешаговую равномерную характеристику. Для квантователей с фиксированным кодом (Υ2) наиболее отрицательный уровень удаляют. Аудиокоды упаковывают в подподблоки, каждый представляющий максимум 8 выборок поддиапазона, и эти подподблоки повторяют до четырех раз в текущем подблоке.
Если флаг частоты выборки указывает частоты выше, чем 48 кГц, тогда массив избыточных аудиоданных присутствует в аудиоблоке. Первые два байта в этом массиве будут указывать размер байта избыточных аудиоданных. Кроме того, частота выборки аппаратуры декодера должна быть установлена для работы при частоте выборки 8РКЕО/2 или 8РКЕО/4, в зависимости от высокочастотной частоты выборки.
Распаковка проверки синхронизации.
Данные распаковки слова проверки синхронизации Ό8ΥΝ С=0хГГГГ выявляют в конце каждого подблока, чтобы дать возможность проверить целостность распаковки. Использование переменных кодовых слов в вспомогательной информации и аудиокодах, что имеет место для низких скоростей аудиобит, может приводить к несовмещению распаковки, если заголовки, либо вспомогательная информация, либо аудиомассивы испорчены ошибками бит. Если указатель распаковки не указывает на начало Ό8ΥΝΟ то можно предположить, что предыдущий аудиоподблок является ненадежным.
Когда вспомогательная информация и аудиоданные распакованы, декодировщик восстанавливает многоканальный аудиосигнал по одному подблоку. На фиг. 20 представлена часть декодировщика основной полосы частот для одного поддиапазона в одном канале.
Восстановление среднеквадратических масштабных коэффициентов.
Декодировщик восстанавливает среднеквадратические масштабные коэффициенты (8САЬЕ8) для алгоритмов АДИКМ, ВК и СКЧ. В частности, индексы УТМОИЕ и ТНИРР обратно отображены для идентификации режима переходного процесса (ТМОИЕ) для текущего подблока. После чего индекс 8НИРР, коды УИК.М87)|, и ТМОИЕ обратно отображают для восстановления дифференциального среднеквадратического кода. Дифференциальный среднеквадратический код обратно дифференциально кодируют 242 для выбора среднеквадратического кода, который затем обратно квантуют 242 для создания среднеквадратического масштабного коэффициента.
Обратное квантование высокочастотных векторов.
Декодировщик обратно квантует высокочастотные векторы для восстановления аудиосигналов поддиапазона. В частности, выделенные высокочастотные выборки (НРКЕО), которые являются 8-битовыми дробными (04) двоичными числами со знаком, идентифицируемыми началом У О поддиапазона (УО8иВ8) отображают в обратную поисковую таблицу 248УО. Выбираемое значение таблицы обратно квантуют 250 и масштабируют 252 среднеквадратическим масштабным коэффициентом.
Обратное квантование аудиокодов.
Перед выходом в цикл АДИКМ аудиокоды обратно квантуют и масштабируют для создания восстановленных разностных выборок поддиапазона. Обратное квантование обеспечивают обратным отображением индексов УАВ1Т и ВНИРР для спецификации индекса АВ1Т, который определяет размер шага и число уровней квантования, и обратным отображением индекса 8ЕЬ и аудиокодов УОНп), которые создают коды уровня квантования ОИ(п). После чего кодовые слова ОБ/п) отображают в поисковую таблицу 260 обратного квантователя, специфицируемую индексами АВ1Т и 8ЕЬ. Несмотря на то, что коды упорядочивают с помощью АВ1Т, каждый отдельный аудиоканал будет иметь отдельный спецификатор 8ЕЬ. Процесс поиска выполняют для нахождения номера со знаком уровня квантователя, который может быть преобразован в среднеквадратическую величину умножением на размер шага квантователя. Значения среднеквадратической величины затем преобразовывают в полные разностные выборки умножением на обозначенный среднеквадратический масштабный коэффициент (8САЕЕ8) 262.
1. рЬ[п] = 1/0[собе[п]], где 1О - поисковая таблица обратного квантователя
2. Υ|π| = ОЕ|п| · 81ер8|/е|аЫ15|
3. Кб[п] = Υ|π| · 8са1е_Гас!ог, где Кб равен восстановленным разностным выборкам.
Обратная АДИКМ
Процесс АДИКМ декодирования выполняют для каждой разностной выборки поддиапазона следующим образом;
1. Загружают коэффициенты прогнозирования из поисковой таблицы обратного ВК.
2. Генерируют выборку прогнозирования свертыванием текущих коэффициентов прогнозатора с предыдущими 4 восстановленными выборками поддиапазона, хранимыми в массиве 268 предыстории прогнозаторов. Р[п]=8ит(сое££ [ί] · К[п - ί] для ί=1, 4, где п=текущему периоду выборки.
3. Ирибавляют выборку прогнозирования к восстановленной разностной выборке для формирования восстановленной выборки 270 поддиапазона. К[п]=КД[п]+Р[п].
4. Корректируют предысторию прогнозатора, то есть копируют текущую восстановленную выборку поддиапазона вверху списка предыстории К[п-1]=К[п - ί + 1] для 1=4,1.
В случае, когда ΡΜΘΌΕ=0, коэффициенты прогнозатора равны нулю, выборка прогнозирования - нулю, а восстановленная выборка поддиапазона равна дифференциальной выборке поддиапазона. Хотя в этом случае не требуется вычисление прогнозирования, существенно, что предысторию сохраняют скорректированной в случае, если ΡΜΘΌΕ должна стать активной в будущих подблоках. Кроме того, если НРЬАС активен в текущем аудиоблоке, предыстория прогнозатора должна быть очищена перед декодированием самого первого подподблока в блоке. Иредыстория должна быть скорректирована, как обычно, от этой точки.
В случае поддиапазонов высокочастотного ВК или, когда поддиапазоны не выбирают (т.е. выше предела 8ИВ§), предыстория должна оставаться очищенной до того времени, пока прогнозатор поддиапазона станет активным.
Выбор управления декодированием АДИКМ, ВК и СК4.
Иервый «переключатель» управляет выбором либо выхода АДИКМ, либо выхода ВК. Индекс УЦЗиВЗ идентифицирует начальный поддиапазон для кодирования ВК. Иоэтому, если текущий поддиапазон ниже, чем УЦ§ИВ§, переключатель выбирает выход АДИКМ. Иначе он выбирает выход ВК. Второй «переключатель» 278 управляет выбором либо выхода непосредственного канала, либо выходом кодирования СК4. Индекс 1ΌΙΝΧ идентифицирует, какие каналы совмещают и в каком канале генерируют восстановленный сигнал. Восстановленный сигнал СК4 образует источник интенсивности для входов СК4 в других каналах. Иоэтому, если текущий поддиапазон является частью СК4 и не назначенным каналом, тогда переключатель выбирает выход СК4. Обычно переключатель выбирает выход канала.
Дешифрация.
Режим аудиокодирования для потока данных указывает значение ΑΜΘΌΕ. Декодированные аудиоканалы могут быть перенаправлены для согласования с физическим устройством выходного канала в аппаратуре 280 декодировщика.
Данные управления динамическим диапазоном
Коэффициенты динамического диапазона ΌΟΘΕΡΡ могут быть выборочно вставлены в аудиоблок на стадии 282 кодирования. Целью этой особенности является обеспечение возможности удобного сжатия аудиодинамического диапазона на выходе декодировщика. Сжатие динамического диапазона особенно важно при условиях прослушивания, где высокие уровни окружающего шума не дают возможности различить сигналы низкого уровня без риска повредить динамики во время прохождений громких сигналов. Эта проблема дополнительно осложняется возрастающим использованием 20битовых ИКМ аудиозаписей, которые имеют динамические высокие диапазоны 110 децибел.
В зависимости от размера кадра блока (ΝΒΡΚδ) передают один, два, либо четыре коэффициента на аудиоканал для любого режима кодирования (ΌΥΝΡ). Если передают один коэффициент, его используют для всего блока. Ири двух коэффициентах первый используют для первой половины блока, а второй - для второй половины блока. Четыре коэффициента распределяют на каждый квадрант блока. Более высокое временное разрешение возможно при локальной интерполяции между передаваемыми значениями.
Каждый коэффициент является 8-битовым дробным Ц2 двоичным числом со знаком и представляет логарифмическое значение коэффициента передачи, как показано в таблице, давая диапазон +/-31,75 децибел при шагах 0,25 децибел. Коэффициенты упорядочивают по номеру канала. На сжатие динамического диапазона воздействуют умножением декодированных аудиовыборок на линейные коэффициенты.
Степень сжатия может быть изменена подходящей регулировкой значений коэффициентов в декодировщике или может быть полностью выключена игнорированием коэффициентов.
32-полосная группа фильтров интерполяции.
32-Иолосная группа 44 фильтров интерполяции преобразует 32 поддиапазона для каждого аудиоканала в один ИКМ сигнал временного интервала. Коэффициенты не полного восстановления (512 -выводные конечной импульсной характеристики фильтры) используют, когда Р1ЬТ§=1. Обычно косинусные коэффициенты модуляции вычисляют заранее и хранят в постоянной памяти. Ироцедура интерполяции может быть расширена для восстановления больших блоков данных для уменьшения непроизводительных издержек цикла. Однако в случае конечных блоков минимальное разрешение, которое может требоваться, равно 32 выборкам ИКМ. Алгоритм интерполяции является следующим: создают косинусные коэффициенты модуляции, считывают 32 новых выборки поддиапазона в массив ΧΙΝ, умножают на косинусные коэффициенты модуляции и создают временные массивы §ИМ и ΌΙΡΡ, сохраняют предысторию, умножают на коэффициенты фильтра, создают 32 выходные выборки ИКМ, корректируют рабочие массивы и выводят 32 новые выборки ИКМ.
В зависимости от скорости бит и действующей схемы кодирования, поток бит будет специфицировать коэффициенты интерполяции блока фильтра (Р1ЬТ§) неполного, либо полного восстановления. Поскольку группы фильтров прореживания декодировщика рассчитывают с 40-битовой точностью с плавающей запятой, способность декодировщика достигнуть максимальной теоретической точности восстановления будет зависеть от исходной длины слова ИКМ и точности ферритовой памяти, используемой для вычисления свёрток и способа, которым масштабируют операции.
Интерполяция низкочастотных эффектов ИКМ.
Аудиоданные, связанные с каналом низкочастотных эффектов, не зависят от основных аудиоканалов. Этот канал кодируют с использованием процесса 8-битовой АДИКМ на Х128 прореженном (полоса частот 120 гц) входе 20битовой ИКМ. Аудиоданные прореженных эффектов согласованы во времени с аудиоданными текущего подблока в основных аудиоканалах. Следовательно, поскольку задержка на 32полосной группе фильтров интерполяции равна 256 выборкам (512 отводов), должны быть приняты меры предосторожности, чтобы гарантировать, что интерполированный канал низкочастотного эффекта также согласуется с остальными аудиоканалами перед выходом. Компенсация не требуется, если фильтр (конечная импульсная характеристика) интерполяции эффектов является также 512 отводным. Алгоритм ЬРТ (низкочастотного преобразования) использования 512-отводного фильтра интерполяции 128Х (отводной конечной импульсной характеристики) следующий: отображают 7-битовый масштабный коэффициент в среднеквадратический, умножают на размер шага 7-битового квантователя, генерируют значения подвыборок из нормализованных значений и интерполируют на 128, используя фильтр нижних частот, такой как задан для каждой подвыборки.
Аппаратная реализация.
На фигурах 21 и 22 представлена основная функциональная структура аппаратной реализации шестиканальной версии кодировщика и декодировщика для работы с частотами выборки 32, 44,1 и 48 кГц. Как представлено на фиг, 21, восемь аналоговых устройств ΆΌδΡ21020, микросхем 296 40-битового процессора цифрового сигнала (ПЦС) с плавающей запятой используют для реализации шестиканального цифрового аудиокодировщика 298. Шесть ПЦС используют для кодирования каждого из каналов, в то время как седьмой и восьмой используют для реализации функций глобального распределения бит, управления и форматера потока данных и кодирования ошибки, соответственно. Каждую ΆΌδΡ21020 тактируют с 33 мгц, она использует внешнюю 48 бит Х 32 К программную память с произвольной выборкой (1111В) 300, 40 бит Х 32 К память данных с произвольной выборкой (статистическая ППВ) 302 для выполнения алгоритмов. В случае кодировщиков 8 бит Х 512 К стираемую программируемую постоянную память (СППП) 304 также используют для хранения фиксированных постоянных величин, например, книги кодов энтропии переменной длины. Форматирование потока данных использует микросхему 306 контроля по избыточности СКС Рида Соломона для облегчения обнаружения ошибок и защиты от ошибок в декодировщике. Связь между процессорами ЦС кодировщика и глобального распределения бит и управления реализуется двухпортовой статической ППВ 308.
Осуществляют процесс кодирования следующим образом. 2-канальный поток 310 цифровых аудиоданных ИКМ извлекают на выходе каждого из трех цифровых аудиоприемников с (ПАЭ) переключением аудиоэмуляции (ВЕС) вещания европейского союза. Первый канал каждой пары направляют в канал 1 , 3 и 5 процессоров ЦС кодировщика, соответственно, в то время как второй канал каждой пары направляют в канал 2, 4 и 6, соответственно. Выборки ИКМ считывают в процессоры ЦС преобразованием последовательных слов ИКМ в параллельные (посл./парал.). Каждый кодировщик накапливает блок выборок ИКМ и продолжает кодировать данные блока, как описано ранее. Информацию, относящуюся к оценочному разностному сигналу (еб(п)) и выборкам поддиапазона (ч(п)) для каждого канала, передают в ПЦС глобального распределения бит и управления через двухпортовую ППВ. Стратегии распределения бит для каждого кодировщика затем считывают таким же образом. Если процесс кодирования завершен, закодированные данные и вспомогательную информацию для шести каналов передают в ПЦС форматера потока данных через ПЦС глобального распределения бит и управления. На этой стадии контрольные байты СКС генерируют выборочно и добавляют к закодированным данным с целью обеспечения защиты от ошибок в декодировщике. Наконец, весь пакет 16 данных собирают и выводят.
Аппаратурная реализация шестиканального декодировщика описана на фиг. 22. Одно аналоговое устройство Α08Ρ21020, микросхему 324 40-битового процессора цифрового сигнала (ПЦС) с плавающей запятой, используют для реализации шестиканального цифрового аудиодекодировщика. ЛИ§Р21020 тактируют с 33 мгц, оно использует внешнюю 48 бит Х 32 К программную память с произвольной выборкой (ППВ) 326, 40 бит Х 32 К память данных с произвольной выборкой (статистическая ППВ) 328 для выполнения алгоритмов декодирования. Дополнительную 8 бит Х 512 К стираемую программируемую постоянную память (СППП) 330 также используют для хранения фиксированных постоянных величин, например, книги кодов энтропии и вектора прогнозируемых коэффициентов переменной длины.
Поток процесса кодирования является следующим. Поток 1 6 сжатых данных вводят в ПЦС через последовательно-параллельный преобразователь (посл./парал.) 332. Данные распаковывают и декодируют, как описано ранее. Выборки поддиапазона восстанавливают в единый поток 22 данных ИКМ для каждого канала и выводят на микросхемы 334 цифрового аудиопередатчика с переключением аудиоэмуляции/вещания европейского союза через три параллельно-последовательных преобразователя (парал./посл.) 335.
Несмотря на то, что показано и описано несколько конкретных вариантов осуществления изобретения, многочисленные изменения и альтернативные варианты осуществления очевидны для специалистов в данной области техники. Например, при увеличении скорости процессоров и уменьшении стоимости памяти, частоты выборки, скорости передачи и размер буфера, наиболее вероятно, увеличатся. Такие изменения и альтернативные варианты осуществления могут быть выполнены без выхода за рамки объема и сущности изобретения, которые определены в прилагаемой формуле изобретения.
Claims (10)
- ФОРМУЛА ИЗОБРЕТЕНИЯ1 . Многоканальный аудиокодировщик, содержащий:устройство захвата блока, которое подает аудиокадр в каждый канал многоканального аудиосигнала, дискретизированного с частотой выборки, для создания соответствующей последовательности аудиоблоков, множество фильтров, которые разделяют аудиоблоки каналов на соответствующие множества частотных поддиапазонов относительно частотного диапазона основной полосы частот, причем каждый из упомянутых частотных поддиапазонов содержит последовательность блоков поддиапазона, которые имеют, по меньшей мере, один подблок аудиоданных на блок поддиапазона, множество кодировщиков поддиапазона, которые кодируют аудиоданные в соответствующих частотных поддиапазонах по одному подблоку в закодированные сигналы поддиапазона, мультиплексор, который упаковывает и мультиплексирует закодированные сигналы поддиапазона в выходной блок для каждого последовательного блока данных, таким образом формируя поток данных со скоростью передачи, и контроллер, который задает размер аудиокадра на основе частоты выборки и скорости передачи так, что размер упомянутых выходных блоков ограничен, чтобы находиться в требуемом диапазоне.
- 2. Многоканальный аудиокодировщик по п.1 , отличающийся тем, что контроллер задает размер аудиокадра как наибольшее кратное двум, которое меньше, чем (Ргаше к/е) · ΡΜΐηρ · (-), Т А га1е где Ргаше δί/е - максимальный размер выходного блока, Р8атр - частота выборки, а Т|а1е - скорость передачи.
- 3. Многоканальный аудиокодировщик по п.1 , отличающийся тем, что многоканальный аудиосигнал кодируют с целевой скоростью бит, а кодировщики поддиапазона содержат прогнозирующие кодировщики, причем сам многоканальный аудиокодировщик содержит глобальный диспетчер бит, который вычисляет психоакустическое отношение сигнала к маске и оценивает выигрыш прогнозирования Рда1и для каждого подблока, вычисляет отношения маски к шуму при уменьшении значений отношения сигнала к шуму на соответствующие части связанных с ними прогнозируемых коэффициентов передачи, распределяет скорость бит относительно всех поддиапазонов и регулирует отдельные распределения так, что фактическая скорость бит приблизительно равна целевой скорости бит.
- 4. Многоканальный аудиокодировщик по п. 1 или 3, отличающийся тем, что кодировщик поддиапазона разделяет каждый подблок на множество подподблоков, причем каждый кодировщик поддиапазона содержит прогнозирующий кодировщик, который генерирует и квантует сигнал ошибки для каждого подблока, и что дополнительно содержит анализатор, который генерирует оценочный сигнал ошибки перед кодированием для каждого подблока, выявляет переходные процессы в каждом подподблоке оценочного сигнала ошибки, генерирует код переходного процесса, который показывает, имеется ли переходный процесс в каком-либо подподблоке, отличном от первого, и в каком подблоке происходит переходный процесс, и когда обнаруживает переходный процесс, генерирует масштабный коэффициент предпереходного процесса для подподблоков перед переходным процессом и масштабный коэффициент после переходного про49 цесса для подподблоков переходного процесса и после переходного процесса, и иначе генерирует однородный масштабный коэффициент для подблока, причем упомянутый прогнозирующий кодировщик использует упомянутые масштабные коэффициенты предпереходного процесса, послепереходного процесса и однородный масштабный коэффициент для масштабирования сигнала ошибки перед кодированием для уменьшения ошибки кодирования в подподблоках, соответствующих масштабным коэффициентам предпереходного процесса.
- 5. Многоканальный аудиокодировщик по п. 1 , отличающийся тем, что упомянутый частотный диапазон основной полосы частот имеет максимальную частоту, и что дополнительно содержит предварительный фильтр, который разделяет каждый из упомянутых аудиоблоков на сигнал основной полосы частот и сигнал высокой частоты выборки на частотах в частотном диапазоне основной полосы частот и выше максимальной частоты, соответственно, причем упомянутый глобальный диспетчер бит распределяет биты в сигнал высокой частоты выборки для удовлетворения выбранному фиксированному искажению, и кодировщик высокой частоты выборки, который кодирует сигналы высокой частоты выборки аудиоканалов в соответствующие закодированные сигналы высокой частоты выборки, причем упомянутый мультиплексор упаковывает закодированные сигналы высокой частоты выборки каналов в соответствующие выходные блоки так, что часть основной полосы частот и часть высокой частоты выборки многоканального аудиосигнала являются независимо декодируемыми.
- 6. Многоканальный аудиодекодировщик для восстановления множественных аудиоканалов до частоты выборки декодировщика из потока данных, в котором каждый аудиоканал дискретизирован с частотой выборки кодировщика, которая, по меньшей мере, так высока, как частота выборки декодировщика, подразделенная на множество частотных поддиапазонов, сжатых и мультиплексированных в поток данных со скоростью передачи, содержащий:входной буфер для считывания и запоминания потока данных по одному блоку, причем каждый из упомянутых блоков содержит слово синхронизации, заголовок блока, аудиозаголовок и, по меньшей мере, один подблок, который содержит аудиовспомогательную информацию, множество подподблоков, имеющих аудиокоды основной полосы частот выше, чем частотный диапазон основной полосы частот, блок аудиокодов высокой частоты выборки выше частотного диапазона высокой частоты выборки и синхронизацию распаковки, демультиплексор, который распознает слово синхронизации, распаковывает заголовок блока для извлечения размера кадра, который указывает число аудиовыборок в блоке, и размер блока, который указывает число байтов в блоке, причем упомянутый размер кадра задан как функция отношения скорости передачи к скорости выборки кодировщика так, что размер блока ограничен, чтобы быть меньше, чем размер входного буфера, распаковывает аудиозаголовок для извлечения числа подблоков в блоке и числа закодированных аудиоканалов и последовательно распаковывает каждый подблок для извлечения аудиовспомогательной информации, демультиплексирует аудиокоды основной полосы частот в каждом подподблоке в множественные аудиоканалы и распаковывает каждый аудиоканал в его аудиокоды поддиапазона, демультиплексирует аудиокоды высокой частоты выборки в множественные аудиоканалы до частоты выборки декодировщика и пропускает оставшиеся аудиокоды высокой частоты выборки до частоты выборки кодировщика и распознает синхронизацию распаковки для проверки конца подблока, декодировщик основной полосы частот, который использует вспомогательную информацию для декодирования аудиокодов поддиапазона в восстановленные сигналы поддиапазона по одному подблоку без ссылки на любые другие подблоки, фильтр восстановления основной полосы частот, который объединяет восстановленные сигналы поддиапазона каждого канала в восстановленный сигнал основной полосы частот по одному подблоку, декодировщик высокой частоты выборки для декодирования аудиокодов высокой частоты выборки в восстановленный сигнал высокой частоты выборки для каждого аудиоканала по одному подблоку, и фильтр восстановления канала, который объединяет восстановленный сигнал основной полосы частот и сигнал высокой частоты выборки в восстановленный многоканальный аудиосигнал по одному блоку.
- 7. Многоканальный аудиодекодировщик по п.6, отличающийся тем, что фильтр восстановления основной полосы частот содержит группу фильтров неполного восстановления и группу фильтров полного восстановления, а упомянутый заголовок блока содержит код фильтра, который выбирает одну из упомянутых групп фильтров неполного восстановления и полного восстановления.
- 8. Многоканальный аудиодекодировщик по п.6, отличающийся тем, что декодировщик основной полосы частот содержит множество обратных кодировщиков адаптивной дифференциальной импульсно-кодовой модуляции для декодирования соответствующих аудиокодов поддиапазона, причем упомянутая вспомога51 тельная информация содержит прогнозируемые коэффициенты для соответствующих кодировщиков адаптивной дифференциальной импульсно-кодовой модуляции и прогнозируемый режим для управления применением прогнозируемых коэффициентов к соответствующим кодировщикам адаптивной дифференциальной импульсно-кодовой модуляции, чтобы выборочно разрешать или блокировать их возможности прогноза.
- 9. Многоканальный аудиодекодировщик по п.6, отличающийся тем, что упомянутая вспомогательная информация содержит:таблицу распределения бит для каждого поддиапазона канала, в котором каждую скорость бит поддиапазона фиксируют относительно подблока;по меньшей мере, один масштабный коэффициент для каждого поддиапазона в каждом канале, режим переходного процесса для каждого поддиапазона в каждом канале, который идентифицирует число масштабных коэффициентов и их связанных подподблоков, причем упомянутый декодировщик основной полосы частот масштабирует аудиокоды поддиапазонов соответствующими масштабными коэффициентами в соответствии с их значениями режима переходного процесса для облегчения декодирования.
- 10. Портативный, считываемый вычислительной машиной носитель информации, содержащий поток цифровых данных, представляющий многоканальный аудиосигнал, дискретизированный с частотой выборки, закодированный относительно диапазона основной полосы частот, который подразделен на отдельные частотные поддиапазоны относительно частотного диапазона высокой частоты выборки и записан на упомянутый портативный считываемый вычислительной машиной запоминающий носитель как последовательность аудиоблоков со скоростью передачи, причем каждый из упомянутых аудиоблоков содержит последовательно слово синхронизации, заголовок блока, который содержит размер кадра, который указывает число аудиовыборок в аудиоблоке, и размер блока, который указывает число байтов в аудиоблоке, причем размер аудиокадра задан как функция отношения скорости передачи к частоте выборки так, что размер блока ограничен, чтобы быть меньше, чем максимальный размер, аудиозаголовок, который указывает устройство упаковки и формат кодирования для аудиоблока, по меньшей мере, один аудиоподблок, причем каждый аудиоподблок содержит:вспомогательную информацию для декодирования аудиоподблока без ссылки на другие подблоки, множество аудиоподподблоков основной полосы частот, в которых аудиоданные для каждых частотных поддиапазонов канала упаковывают и мультиплексируют с другими каналами, аудиоблок высокой частоты выборки, в котором аудиоданные в частотном диапазоне высокой частоты выборки для каждого канала упаковывают и мультиплексируют с другими каналами так, что многоканальный аудиосигнал является декодируемым с множеством частот выборок декодирования, и синхронизацию распаковки для проверки конца подблока.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US789695P | 1995-12-01 | 1995-12-01 | |
US08/642,254 US5956674A (en) | 1995-12-01 | 1996-05-02 | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
PCT/US1996/018764 WO1997021211A1 (en) | 1995-12-01 | 1996-11-21 | Multi-channel predictive subband coder using psychoacoustic adaptive bit allocation |
Publications (2)
Publication Number | Publication Date |
---|---|
EA199800505A1 EA199800505A1 (ru) | 1998-12-24 |
EA001087B1 true EA001087B1 (ru) | 2000-10-30 |
Family
ID=26677495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EA199800505A EA001087B1 (ru) | 1995-12-01 | 1996-11-21 | Многоканальный прогнозирующий кодировщик поддиапазона, использующий психоакустическое адаптивное распределение бит |
Country Status (18)
Country | Link |
---|---|
US (4) | US5956674A (ru) |
EP (1) | EP0864146B1 (ru) |
JP (1) | JP4174072B2 (ru) |
KR (1) | KR100277819B1 (ru) |
CN (5) | CN1132151C (ru) |
AT (1) | ATE279770T1 (ru) |
AU (1) | AU705194B2 (ru) |
BR (1) | BR9611852A (ru) |
CA (2) | CA2238026C (ru) |
DE (1) | DE69633633T2 (ru) |
DK (1) | DK0864146T3 (ru) |
EA (1) | EA001087B1 (ru) |
ES (1) | ES2232842T3 (ru) |
HK (4) | HK1015510A1 (ru) |
MX (1) | MX9804320A (ru) |
PL (3) | PL182240B1 (ru) |
PT (1) | PT864146E (ru) |
WO (1) | WO1997021211A1 (ru) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2560788C2 (ru) * | 2011-02-14 | 2015-08-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для обработки декодированного аудиосигнала в спектральной области |
US9153236B2 (en) | 2011-02-14 | 2015-10-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio codec using noise synthesis during inactive phases |
CN108449704A (zh) * | 2013-10-22 | 2018-08-24 | 韩国电子通信研究院 | 生成用于音频信号的滤波器的方法及其参数化装置 |
RU2682340C1 (ru) * | 2010-09-16 | 2019-03-19 | Долби Интернешнл Аб | Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями |
US12033645B2 (en) | 2023-10-05 | 2024-07-09 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
Families Citing this family (541)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1126264C (zh) * | 1996-02-08 | 2003-10-29 | 松下电器产业株式会社 | 宽频带声音信号编码装置和宽频带声音信号编码解码装置 |
US8306811B2 (en) * | 1996-08-30 | 2012-11-06 | Digimarc Corporation | Embedding data in audio and detecting embedded data in audio |
JP3622365B2 (ja) * | 1996-09-26 | 2005-02-23 | ヤマハ株式会社 | 音声符号化伝送方式 |
JPH10271082A (ja) * | 1997-03-21 | 1998-10-09 | Mitsubishi Electric Corp | 音声データ復号装置 |
US6449227B1 (en) | 1997-03-25 | 2002-09-10 | Samsung Electronics Co., Ltd. | DVD-audio disk, and apparatus and method for playing the same |
US7110662B1 (en) | 1997-03-25 | 2006-09-19 | Samsung Electronics Co., Ltd. | Apparatus and method for recording data on a DVD-audio disk |
US6741796B1 (en) | 1997-03-25 | 2004-05-25 | Samsung Electronics, Co., Ltd. | DVD-Audio disk, and apparatus and method for playing the same |
JP3339054B2 (ja) * | 1997-03-28 | 2002-10-28 | ソニー株式会社 | データ符号化方法及び装置、データ復号方法及び装置、並びに記録媒体 |
US6298025B1 (en) | 1997-05-05 | 2001-10-02 | Warner Music Group Inc. | Recording and playback of multi-channel digital audio having different resolutions for different channels |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6636474B1 (en) * | 1997-07-16 | 2003-10-21 | Victor Company Of Japan, Ltd. | Recording medium and audio-signal processing apparatus |
US5903872A (en) * | 1997-10-17 | 1999-05-11 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries |
US6574602B1 (en) * | 1997-12-19 | 2003-06-03 | Stmicroelectronics Asia Pacific Pte Limited | Dual channel phase flag determination for coupling bands in a transform coder for high quality audio |
EP1050113B1 (en) * | 1997-12-27 | 2002-03-13 | STMicroelectronics Asia Pacific Pte Ltd. | Method and apparatus for estimation of coupling parameters in a transform coder for high quality audio |
JP3802219B2 (ja) * | 1998-02-18 | 2006-07-26 | 富士通株式会社 | 音声符号化装置 |
US6089714A (en) * | 1998-02-18 | 2000-07-18 | Mcgill University | Automatic segmentation of nystagmus or other complex curves |
JPH11234136A (ja) * | 1998-02-19 | 1999-08-27 | Sanyo Electric Co Ltd | デジタルデータの符号化方法及び符号化装置 |
US6253185B1 (en) * | 1998-02-25 | 2001-06-26 | Lucent Technologies Inc. | Multiple description transform coding of audio using optimal transforms of arbitrary dimension |
KR100304092B1 (ko) | 1998-03-11 | 2001-09-26 | 마츠시타 덴끼 산교 가부시키가이샤 | 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치 |
US6400727B1 (en) * | 1998-03-27 | 2002-06-04 | Cirrus Logic, Inc. | Methods and system to transmit data acquired at a variable rate over a fixed rate channel |
US6385345B1 (en) * | 1998-03-31 | 2002-05-07 | Sharp Laboratories Of America, Inc. | Method and apparatus for selecting image data to skip when encoding digital video |
JPH11331248A (ja) * | 1998-05-08 | 1999-11-30 | Sony Corp | 送信装置および送信方法、受信装置および受信方法、並びに提供媒体 |
US6141645A (en) * | 1998-05-29 | 2000-10-31 | Acer Laboratories Inc. | Method and device for down mixing compressed audio bit stream having multiple audio channels |
US6141639A (en) * | 1998-06-05 | 2000-10-31 | Conexant Systems, Inc. | Method and apparatus for coding of signals containing speech and background noise |
EP0966109B1 (en) * | 1998-06-15 | 2005-04-27 | Matsushita Electric Industrial Co., Ltd. | Audio coding method and audio coding apparatus |
US6061655A (en) * | 1998-06-26 | 2000-05-09 | Lsi Logic Corporation | Method and apparatus for dual output interface control of audio decoder |
US6301265B1 (en) * | 1998-08-14 | 2001-10-09 | Motorola, Inc. | Adaptive rate system and method for network communications |
US7457415B2 (en) | 1998-08-20 | 2008-11-25 | Akikaze Technologies, Llc | Secure information distribution system utilizing information segment scrambling |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
CA2246532A1 (en) * | 1998-09-04 | 2000-03-04 | Northern Telecom Limited | Perceptual audio coding |
GB9820655D0 (en) * | 1998-09-22 | 1998-11-18 | British Telecomm | Packet transmission |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
JP4193243B2 (ja) * | 1998-10-07 | 2008-12-10 | ソニー株式会社 | 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体 |
US6463410B1 (en) * | 1998-10-13 | 2002-10-08 | Victor Company Of Japan, Ltd. | Audio signal processing apparatus |
US6345100B1 (en) | 1998-10-14 | 2002-02-05 | Liquid Audio, Inc. | Robust watermark method and apparatus for digital signals |
US6219634B1 (en) * | 1998-10-14 | 2001-04-17 | Liquid Audio, Inc. | Efficient watermark method and apparatus for digital signals |
US6320965B1 (en) | 1998-10-14 | 2001-11-20 | Liquid Audio, Inc. | Secure watermark method and apparatus for digital signals |
US6330673B1 (en) | 1998-10-14 | 2001-12-11 | Liquid Audio, Inc. | Determination of a best offset to detect an embedded pattern |
US6754241B1 (en) * | 1999-01-06 | 2004-06-22 | Sarnoff Corporation | Computer system for statistical multiplexing of bitstreams |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6357029B1 (en) * | 1999-01-27 | 2002-03-12 | Agere Systems Guardian Corp. | Joint multiple program error concealment for digital audio broadcasting and other applications |
US6378101B1 (en) * | 1999-01-27 | 2002-04-23 | Agere Systems Guardian Corp. | Multiple program decoding for digital audio broadcasting and other applications |
US6931372B1 (en) * | 1999-01-27 | 2005-08-16 | Agere Systems Inc. | Joint multiple program coding for digital audio broadcasting and other applications |
TW477119B (en) * | 1999-01-28 | 2002-02-21 | Winbond Electronics Corp | Byte allocation method and device for speech synthesis |
FR2791167B1 (fr) | 1999-03-17 | 2003-01-10 | Matra Nortel Communications | Procedes de codage, de decodage et de transcodage audio |
JP3739959B2 (ja) * | 1999-03-23 | 2006-01-25 | 株式会社リコー | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
DE19914742A1 (de) * | 1999-03-31 | 2000-10-12 | Siemens Ag | Verfahren zum Übertragen von Daten |
US8270479B2 (en) * | 1999-04-06 | 2012-09-18 | Broadcom Corporation | System and method for video and audio encoding on a single chip |
JP2001006291A (ja) * | 1999-06-21 | 2001-01-12 | Fuji Film Microdevices Co Ltd | オーディオ信号の符号化方式判定装置、及びオーディオ信号の符号化方式判定方法 |
US7283965B1 (en) * | 1999-06-30 | 2007-10-16 | The Directv Group, Inc. | Delivery and transmission of dolby digital AC-3 over television broadcast |
US6553210B1 (en) * | 1999-08-03 | 2003-04-22 | Alliedsignal Inc. | Single antenna for receipt of signals from multiple communications systems |
US6581032B1 (en) * | 1999-09-22 | 2003-06-17 | Conexant Systems, Inc. | Bitstream protocol for transmission of encoded voice signals |
US7181297B1 (en) | 1999-09-28 | 2007-02-20 | Sound Id | System and method for delivering customized audio data |
US6496798B1 (en) * | 1999-09-30 | 2002-12-17 | Motorola, Inc. | Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message |
US6732061B1 (en) * | 1999-11-30 | 2004-05-04 | Agilent Technologies, Inc. | Monitoring system and method implementing a channel plan |
US6741947B1 (en) * | 1999-11-30 | 2004-05-25 | Agilent Technologies, Inc. | Monitoring system and method implementing a total node power test |
US7792681B2 (en) * | 1999-12-17 | 2010-09-07 | Interval Licensing Llc | Time-scale modification of data-compressed audio information |
US6842735B1 (en) * | 1999-12-17 | 2005-01-11 | Interval Research Corporation | Time-scale modification of data-compressed audio information |
JP4842483B2 (ja) * | 1999-12-24 | 2011-12-21 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | マルチチャネルオーディオ信号処理装置及び方法 |
EP1226578A4 (en) * | 1999-12-31 | 2005-09-21 | Octiv Inc | TECHNIQUES TO IMPROVE THE CLARITY AND UNDERSTANDING OF AUDIO-REDUCED AUDIO SIGNALS IN A DIGITAL NETWORK |
US6499010B1 (en) * | 2000-01-04 | 2002-12-24 | Agere Systems Inc. | Perceptual audio coder bit allocation scheme providing improved perceptual quality consistency |
TW499672B (en) * | 2000-02-18 | 2002-08-21 | Intervideo Inc | Fast convergence method for bit allocation stage of MPEG audio layer 3 encoders |
EP1176824B1 (en) * | 2000-02-29 | 2010-04-07 | Sony Corporation | Data processing device and method, and recording medium and program |
US7168031B2 (en) * | 2000-04-14 | 2007-01-23 | Siemens Aktiengesellschaft | Method for channel decoding a data stream containing useful data and redundant data, device for channel decoding, computer-readable storage medium and computer program element |
US6782366B1 (en) * | 2000-05-15 | 2004-08-24 | Lsi Logic Corporation | Method for independent dynamic range control |
US7136810B2 (en) * | 2000-05-22 | 2006-11-14 | Texas Instruments Incorporated | Wideband speech coding system and method |
US6725110B2 (en) * | 2000-05-26 | 2004-04-20 | Yamaha Corporation | Digital audio decoder |
JP2003535425A (ja) * | 2000-05-30 | 2003-11-25 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Cdオーディオ上のコード化された情報 |
US7110953B1 (en) * | 2000-06-02 | 2006-09-19 | Agere Systems Inc. | Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction |
US6778953B1 (en) * | 2000-06-02 | 2004-08-17 | Agere Systems Inc. | Method and apparatus for representing masked thresholds in a perceptual audio coder |
US6678647B1 (en) * | 2000-06-02 | 2004-01-13 | Agere Systems Inc. | Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution |
US6754618B1 (en) * | 2000-06-07 | 2004-06-22 | Cirrus Logic, Inc. | Fast implementation of MPEG audio coding |
US6748363B1 (en) * | 2000-06-28 | 2004-06-08 | Texas Instruments Incorporated | TI window compression/expansion method |
US6678648B1 (en) | 2000-06-14 | 2004-01-13 | Intervideo, Inc. | Fast loop iteration and bitstream formatting method for MPEG audio encoding |
US6601032B1 (en) * | 2000-06-14 | 2003-07-29 | Intervideo, Inc. | Fast code length search method for MPEG audio encoding |
US6542863B1 (en) | 2000-06-14 | 2003-04-01 | Intervideo, Inc. | Fast codebook search method for MPEG audio encoding |
US6745162B1 (en) * | 2000-06-22 | 2004-06-01 | Sony Corporation | System and method for bit allocation in an audio encoder |
JP2002014697A (ja) * | 2000-06-30 | 2002-01-18 | Hitachi Ltd | ディジタルオーディオ装置 |
FI109393B (fi) | 2000-07-14 | 2002-07-15 | Nokia Corp | Menetelmä mediavirran enkoodaamiseksi skaalautuvasti, skaalautuva enkooderi ja päätelaite |
US6931371B2 (en) * | 2000-08-25 | 2005-08-16 | Matsushita Electric Industrial Co., Ltd. | Digital interface device |
SE519981C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
US20020075965A1 (en) * | 2000-12-20 | 2002-06-20 | Octiv, Inc. | Digital signal processing techniques for improving audio clarity and intelligibility |
CN100499817C (zh) * | 2000-10-11 | 2009-06-10 | 皇家菲利浦电子有限公司 | 多媒体目标的可伸缩编码 |
US20030023429A1 (en) * | 2000-12-20 | 2003-01-30 | Octiv, Inc. | Digital signal processing techniques for improving audio clarity and intelligibility |
US7526348B1 (en) * | 2000-12-27 | 2009-04-28 | John C. Gaddy | Computer based automatic audio mixer |
CN1205540C (zh) * | 2000-12-29 | 2005-06-08 | 深圳赛意法微电子有限公司 | 含有解码器的电路、时分寻址的方法和一个微控制器 |
EP1223696A3 (en) * | 2001-01-12 | 2003-12-17 | Matsushita Electric Industrial Co., Ltd. | System for transmitting digital audio data according to the MOST method |
GB0103242D0 (en) * | 2001-02-09 | 2001-03-28 | Radioscape Ltd | Method of analysing a compressed signal for the presence or absence of information content |
GB0108080D0 (en) * | 2001-03-30 | 2001-05-23 | Univ Bath | Audio compression |
EP1386308B1 (en) * | 2001-04-09 | 2006-04-12 | Koninklijke Philips Electronics N.V. | Adpcm speech coding system with specific step-size adaptation |
ATE323935T1 (de) * | 2001-04-09 | 2006-05-15 | Koninkl Philips Electronics Nv | Adpcm sprachkodiersystem mit phasenfaltungs und - entfaltungsfiltern |
US7610205B2 (en) * | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
US7711123B2 (en) | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
EP1382035A1 (en) * | 2001-04-18 | 2004-01-21 | Koninklijke Philips Electronics N.V. | Audio coding |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US7047201B2 (en) * | 2001-05-04 | 2006-05-16 | Ssi Corporation | Real-time control of playback rates in presentations |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7447321B2 (en) | 2001-05-07 | 2008-11-04 | Harman International Industries, Incorporated | Sound processing system for configuration of audio signals in a vehicle |
US6804565B2 (en) | 2001-05-07 | 2004-10-12 | Harman International Industries, Incorporated | Data-driven software architecture for digital sound processing and equalization |
US7451006B2 (en) | 2001-05-07 | 2008-11-11 | Harman International Industries, Incorporated | Sound processing system using distortion limiting techniques |
JP4591939B2 (ja) * | 2001-05-15 | 2010-12-01 | Kddi株式会社 | 適応的符号化伝送装置および受信装置 |
US6661880B1 (en) | 2001-06-12 | 2003-12-09 | 3Com Corporation | System and method for embedding digital information in a dial tone signal |
EP1271470A1 (en) * | 2001-06-25 | 2003-01-02 | Alcatel | Method and device for determining the voice quality degradation of a signal |
US7460629B2 (en) | 2001-06-29 | 2008-12-02 | Agere Systems Inc. | Method and apparatus for frame-based buffer control in a communication system |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
JP3463752B2 (ja) * | 2001-07-25 | 2003-11-05 | 三菱電機株式会社 | 音響符号化装置、音響復号化装置、音響符号化方法および音響復号化方法 |
JP3469567B2 (ja) * | 2001-09-03 | 2003-11-25 | 三菱電機株式会社 | 音響符号化装置、音響復号化装置、音響符号化方法及び音響復号化方法 |
US7062429B2 (en) * | 2001-09-07 | 2006-06-13 | Agere Systems Inc. | Distortion-based method and apparatus for buffer control in a communication system |
US7333929B1 (en) | 2001-09-13 | 2008-02-19 | Chmounk Dmitri V | Modular scalable compressed audio data stream |
US6944474B2 (en) * | 2001-09-20 | 2005-09-13 | Sound Id | Sound enhancement for mobile phones and other products producing personalized audio for users |
US6732071B2 (en) * | 2001-09-27 | 2004-05-04 | Intel Corporation | Method, apparatus, and system for efficient rate control in audio encoding |
JP4245288B2 (ja) * | 2001-11-13 | 2009-03-25 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
MXPA03005133A (es) * | 2001-11-14 | 2004-04-02 | Matsushita Electric Ind Co Ltd | Dispositivo de codificacion, dispositivo de decodificacion y sistema de los mismos. |
BR0206446A (pt) * | 2001-11-16 | 2003-12-30 | Koninkl Philips Electronics Nv | Método e arranjo para ajustar um sinal de dados suplementares a ser embutido em um sinal de informação, dispositivo para embutir um sinal de dados suplementares em um sinal de informação, sinal de informação tendo embutido no mesmo um sinal de dados suplementares, e, meio de armazenamento |
WO2003046891A1 (en) | 2001-11-29 | 2003-06-05 | Coding Technologies Ab | Methods for improving high frequency reconstruction |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US6697076B1 (en) | 2001-12-31 | 2004-02-24 | Apple Computer, Inc. | Method and apparatus for address re-mapping |
US7114058B1 (en) | 2001-12-31 | 2006-09-26 | Apple Computer, Inc. | Method and apparatus for forming and dispatching instruction groups based on priority comparisons |
US6877020B1 (en) | 2001-12-31 | 2005-04-05 | Apple Computer, Inc. | Method and apparatus for matrix transposition |
US7681013B1 (en) | 2001-12-31 | 2010-03-16 | Apple Inc. | Method for variable length decoding using multiple configurable look-up tables |
US7015921B1 (en) | 2001-12-31 | 2006-03-21 | Apple Computer, Inc. | Method and apparatus for memory access |
US7558947B1 (en) | 2001-12-31 | 2009-07-07 | Apple Inc. | Method and apparatus for computing vector absolute differences |
US7034849B1 (en) | 2001-12-31 | 2006-04-25 | Apple Computer, Inc. | Method and apparatus for image blending |
US6822654B1 (en) | 2001-12-31 | 2004-11-23 | Apple Computer, Inc. | Memory controller chipset |
US7305540B1 (en) | 2001-12-31 | 2007-12-04 | Apple Inc. | Method and apparatus for data processing |
US7467287B1 (en) | 2001-12-31 | 2008-12-16 | Apple Inc. | Method and apparatus for vector table look-up |
US6573846B1 (en) | 2001-12-31 | 2003-06-03 | Apple Computer, Inc. | Method and apparatus for variable length decoding and encoding of video streams |
US7055018B1 (en) | 2001-12-31 | 2006-05-30 | Apple Computer, Inc. | Apparatus for parallel vector table look-up |
US6693643B1 (en) | 2001-12-31 | 2004-02-17 | Apple Computer, Inc. | Method and apparatus for color space conversion |
US6931511B1 (en) | 2001-12-31 | 2005-08-16 | Apple Computer, Inc. | Parallel vector table look-up with replicated index element vector |
US7848531B1 (en) * | 2002-01-09 | 2010-12-07 | Creative Technology Ltd. | Method and apparatus for audio loudness and dynamics matching |
US6618128B2 (en) * | 2002-01-23 | 2003-09-09 | Csi Technology, Inc. | Optical speed sensing system |
EP1479071B1 (en) * | 2002-02-18 | 2006-01-11 | Koninklijke Philips Electronics N.V. | Parametric audio coding |
US20030161469A1 (en) * | 2002-02-25 | 2003-08-28 | Szeming Cheng | Method and apparatus for embedding data in compressed audio data stream |
US20100042406A1 (en) * | 2002-03-04 | 2010-02-18 | James David Johnston | Audio signal processing using improved perceptual model |
US7313520B2 (en) * | 2002-03-20 | 2007-12-25 | The Directv Group, Inc. | Adaptive variable bit rate audio compression encoding |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US20040125707A1 (en) * | 2002-04-05 | 2004-07-01 | Rodolfo Vargas | Retrieving content of various types with a conversion device attachable to audio outputs of an audio CD player |
US7225135B2 (en) * | 2002-04-05 | 2007-05-29 | Lectrosonics, Inc. | Signal-predictive audio transmission system |
US7428440B2 (en) * | 2002-04-23 | 2008-09-23 | Realnetworks, Inc. | Method and apparatus for preserving matrix surround information in encoded audio/video |
WO2003092327A1 (en) * | 2002-04-25 | 2003-11-06 | Nokia Corporation | Method and device for reducing high frequency error components of a multi-channel modulator |
JP4016709B2 (ja) * | 2002-04-26 | 2007-12-05 | 日本電気株式会社 | オーディオデータの符号変換伝送方法と符号変換受信方法及び装置とシステムならびにプログラム |
WO2003093775A2 (en) * | 2002-05-03 | 2003-11-13 | Harman International Industries, Incorporated | Sound detection and localization system |
US7096180B2 (en) * | 2002-05-15 | 2006-08-22 | Intel Corporation | Method and apparatuses for improving quality of digitally encoded speech in the presence of interference |
US7050965B2 (en) * | 2002-06-03 | 2006-05-23 | Intel Corporation | Perceptual normalization of digital audio signals |
JP4554361B2 (ja) * | 2002-06-21 | 2010-09-29 | トムソン ライセンシング | シリアル・ディジタル・オーディオ・データ・ストリーム復号器を有するブロードキャスト・ルータ |
US7325048B1 (en) * | 2002-07-03 | 2008-01-29 | 3Com Corporation | Method for automatically creating a modem interface for use with a wireless device |
KR100462615B1 (ko) * | 2002-07-11 | 2004-12-20 | 삼성전자주식회사 | 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 |
US8228849B2 (en) * | 2002-07-15 | 2012-07-24 | Broadcom Corporation | Communication gateway supporting WLAN communications in multiple communication protocols and in multiple frequency bands |
AU2003281128A1 (en) | 2002-07-16 | 2004-02-02 | Koninklijke Philips Electronics N.V. | Audio coding |
CN100481734C (zh) * | 2002-08-21 | 2009-04-22 | 广州广晟数码技术有限公司 | 用于从音频数据码流中解码重建多声道音频信号的解码器 |
CN1783726B (zh) * | 2002-08-21 | 2010-05-12 | 广州广晟数码技术有限公司 | 用于从音频数据码流中解码重建多声道音频信号的解码器 |
EP1394772A1 (en) * | 2002-08-28 | 2004-03-03 | Deutsche Thomson-Brandt Gmbh | Signaling of window switchings in a MPEG layer 3 audio data stream |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4676140B2 (ja) | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
ATE543179T1 (de) | 2002-09-04 | 2012-02-15 | Microsoft Corp | Entropische kodierung mittels anpassung des kodierungsmodus zwischen niveau- und lauflängenniveau-modus |
TW573293B (en) * | 2002-09-13 | 2004-01-21 | Univ Nat Central | Nonlinear operation method suitable for audio encoding/decoding and an applied hardware thereof |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
FR2846179B1 (fr) | 2002-10-21 | 2005-02-04 | Medialive | Embrouillage adaptatif et progressif de flux audio |
US6707397B1 (en) | 2002-10-24 | 2004-03-16 | Apple Computer, Inc. | Methods and apparatus for variable length codeword concatenation |
US6781529B1 (en) | 2002-10-24 | 2004-08-24 | Apple Computer, Inc. | Methods and apparatuses for variable length encoding |
US6707398B1 (en) | 2002-10-24 | 2004-03-16 | Apple Computer, Inc. | Methods and apparatuses for packing bitstreams |
US6781528B1 (en) | 2002-10-24 | 2004-08-24 | Apple Computer, Inc. | Vector handling capable processor and run length encoding |
US7650625B2 (en) * | 2002-12-16 | 2010-01-19 | Lsi Corporation | System and method for controlling audio and video content via an advanced settop box |
US7555017B2 (en) * | 2002-12-17 | 2009-06-30 | Tls Corporation | Low latency digital audio over packet switched networks |
US7272566B2 (en) * | 2003-01-02 | 2007-09-18 | Dolby Laboratories Licensing Corporation | Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique |
KR100547113B1 (ko) * | 2003-02-15 | 2006-01-26 | 삼성전자주식회사 | 오디오 데이터 인코딩 장치 및 방법 |
TW594674B (en) * | 2003-03-14 | 2004-06-21 | Mediatek Inc | Encoder and a encoding method capable of detecting audio signal transient |
CN100339886C (zh) * | 2003-04-10 | 2007-09-26 | 联发科技股份有限公司 | 可以检测声音信号的暂态位置的编码器及编码方法 |
FR2853786B1 (fr) * | 2003-04-11 | 2005-08-05 | Medialive | Procede et equipement de distribution de produits videos numeriques avec une restriction de certains au moins des droits de representation et de reproduction |
EP1621047B1 (en) * | 2003-04-17 | 2007-04-11 | Koninklijke Philips Electronics N.V. | Audio signal generation |
WO2004093495A1 (en) * | 2003-04-17 | 2004-10-28 | Koninklijke Philips Electronics N.V. | Audio signal synthesis |
US8073684B2 (en) * | 2003-04-25 | 2011-12-06 | Texas Instruments Incorporated | Apparatus and method for automatic classification/identification of similar compressed audio files |
SE0301273D0 (sv) * | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
CN100546233C (zh) * | 2003-04-30 | 2009-09-30 | 诺基亚公司 | 用于支持多声道音频扩展的方法和设备 |
US7739105B2 (en) * | 2003-06-13 | 2010-06-15 | Vixs Systems, Inc. | System and method for processing audio frames |
US7657429B2 (en) * | 2003-06-16 | 2010-02-02 | Panasonic Corporation | Coding apparatus and coding method for coding with reference to a codebook |
KR100556365B1 (ko) * | 2003-07-07 | 2006-03-03 | 엘지전자 주식회사 | 음성 인식장치 및 방법 |
CA2475189C (en) * | 2003-07-17 | 2009-10-06 | At&T Corp. | Method and apparatus for window matching in delta compressors |
US7289680B1 (en) * | 2003-07-23 | 2007-10-30 | Cisco Technology, Inc. | Methods and apparatus for minimizing requantization error |
TWI220336B (en) * | 2003-07-28 | 2004-08-11 | Design Technology Inc G | Compression rate promotion method of adaptive differential PCM technique |
US7996234B2 (en) * | 2003-08-26 | 2011-08-09 | Akikaze Technologies, Llc | Method and apparatus for adaptive variable bit rate audio encoding |
US7724827B2 (en) * | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
WO2005027096A1 (en) * | 2003-09-15 | 2005-03-24 | Zakrytoe Aktsionernoe Obschestvo Intel | Method and apparatus for encoding audio |
SG120118A1 (en) * | 2003-09-15 | 2006-03-28 | St Microelectronics Asia | A device and process for encoding audio data |
US20050083808A1 (en) * | 2003-09-18 | 2005-04-21 | Anderson Hans C. | Audio player with CD mechanism |
US7325023B2 (en) * | 2003-09-29 | 2008-01-29 | Sony Corporation | Method of making a window type decision based on MDCT data in audio encoding |
US7349842B2 (en) * | 2003-09-29 | 2008-03-25 | Sony Corporation | Rate-distortion control scheme in audio encoding |
US7426462B2 (en) * | 2003-09-29 | 2008-09-16 | Sony Corporation | Fast codebook selection method in audio encoding |
US7283968B2 (en) | 2003-09-29 | 2007-10-16 | Sony Corporation | Method for grouping short windows in audio encoding |
DE602004030594D1 (de) * | 2003-10-07 | 2011-01-27 | Panasonic Corp | Verfahren zur entscheidung der zeitgrenze zur codierung der spektro-hülle und frequenzauflösung |
TWI226035B (en) * | 2003-10-16 | 2005-01-01 | Elan Microelectronics Corp | Method and system improving step adaptation of ADPCM voice coding |
EP1683133B1 (en) * | 2003-10-30 | 2007-02-14 | Koninklijke Philips Electronics N.V. | Audio signal encoding or decoding |
KR20050050322A (ko) * | 2003-11-25 | 2005-05-31 | 삼성전자주식회사 | 직교주파수다중화방식의 이동통신시스템에서 적응변조 방법 |
KR100571824B1 (ko) * | 2003-11-26 | 2006-04-17 | 삼성전자주식회사 | 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치 |
FR2867649A1 (fr) * | 2003-12-10 | 2005-09-16 | France Telecom | Procede de codage multiple optimise |
JPWO2005057550A1 (ja) * | 2003-12-15 | 2007-12-13 | 松下電器産業株式会社 | 音声圧縮伸張装置 |
US7725324B2 (en) * | 2003-12-19 | 2010-05-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Constrained filter encoding of polyphonic signals |
SE527670C2 (sv) * | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Naturtrogenhetsoptimerad kodning med variabel ramlängd |
US7809579B2 (en) * | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
JP2005217486A (ja) * | 2004-01-27 | 2005-08-11 | Matsushita Electric Ind Co Ltd | ストリーム復号装置 |
DE102004009949B4 (de) * | 2004-03-01 | 2006-03-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes |
EP1914722B1 (en) | 2004-03-01 | 2009-04-29 | Dolby Laboratories Licensing Corporation | Multichannel audio decoding |
US20090299756A1 (en) * | 2004-03-01 | 2009-12-03 | Dolby Laboratories Licensing Corporation | Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
US7805313B2 (en) * | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
US7272567B2 (en) * | 2004-03-25 | 2007-09-18 | Zoran Fejzo | Scalable lossless audio codec and authoring tool |
TWI231656B (en) * | 2004-04-08 | 2005-04-21 | Univ Nat Chiao Tung | Fast bit allocation algorithm for audio coding |
US8032360B2 (en) * | 2004-05-13 | 2011-10-04 | Broadcom Corporation | System and method for high-quality variable speed playback of audio-visual media |
US7512536B2 (en) * | 2004-05-14 | 2009-03-31 | Texas Instruments Incorporated | Efficient filter bank computation for audio coding |
DE602004012165T2 (de) * | 2004-05-28 | 2009-06-18 | The Tc Group A/S | Impulsbreitenmodulatorsystem |
ES2336558T3 (es) * | 2004-06-10 | 2010-04-14 | Panasonic Corporation | Sistema y metodo para la reconfiguracion en el tiempo de funcionamiento. |
WO2005124722A2 (en) * | 2004-06-12 | 2005-12-29 | Spl Development, Inc. | Aural rehabilitation system and method |
KR100634506B1 (ko) * | 2004-06-25 | 2006-10-16 | 삼성전자주식회사 | 저비트율 부호화/복호화 방법 및 장치 |
CN102833539B (zh) * | 2004-06-27 | 2015-03-25 | 苹果公司 | 多通路视频编码 |
US20050285935A1 (en) * | 2004-06-29 | 2005-12-29 | Octiv, Inc. | Personal conferencing node |
US20050286443A1 (en) * | 2004-06-29 | 2005-12-29 | Octiv, Inc. | Conferencing system |
US8843378B2 (en) * | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
KR100773539B1 (ko) * | 2004-07-14 | 2007-11-05 | 삼성전자주식회사 | 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치 |
US20060015329A1 (en) * | 2004-07-19 | 2006-01-19 | Chu Wai C | Apparatus and method for audio coding |
US7391434B2 (en) * | 2004-07-27 | 2008-06-24 | The Directv Group, Inc. | Video bit stream test |
US7706415B2 (en) * | 2004-07-29 | 2010-04-27 | Microsoft Corporation | Packet multiplexing multi-channel audio |
US7508947B2 (en) * | 2004-08-03 | 2009-03-24 | Dolby Laboratories Licensing Corporation | Method for combining audio signals using auditory scene analysis |
US7930184B2 (en) * | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
KR100608062B1 (ko) * | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
CN101010724B (zh) * | 2004-08-27 | 2011-05-25 | 松下电器产业株式会社 | 音频编码器 |
US20070250308A1 (en) * | 2004-08-31 | 2007-10-25 | Koninklijke Philips Electronics, N.V. | Method and device for transcoding |
US7725313B2 (en) * | 2004-09-13 | 2010-05-25 | Ittiam Systems (P) Ltd. | Method, system and apparatus for allocating bits in perceptual audio coders |
US7630902B2 (en) * | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
CN101055721B (zh) * | 2004-09-17 | 2011-06-01 | 广州广晟数码技术有限公司 | 多声道数字音频编码设备及其方法 |
US7937271B2 (en) * | 2004-09-17 | 2011-05-03 | Digital Rise Technology Co., Ltd. | Audio decoding using variable-length codebook application ranges |
US7895034B2 (en) * | 2004-09-17 | 2011-02-22 | Digital Rise Technology Co., Ltd. | Audio encoding system |
JP4809234B2 (ja) * | 2004-09-17 | 2011-11-09 | パナソニック株式会社 | オーディオ符号化装置、復号化装置、方法、及びプログラム |
BRPI0516201A (pt) * | 2004-09-28 | 2008-08-26 | Matsushita Electric Ind Co Ltd | aparelho de codificação escalonável e método de codificação escalonável |
JP4892184B2 (ja) * | 2004-10-14 | 2012-03-07 | パナソニック株式会社 | 音響信号符号化装置及び音響信号復号装置 |
US7061405B2 (en) * | 2004-10-15 | 2006-06-13 | Yazaki North America, Inc. | Device and method for interfacing video devices over a fiber optic link |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
US7720230B2 (en) * | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
JP4815780B2 (ja) * | 2004-10-20 | 2011-11-16 | ヤマハ株式会社 | オーバーサンプリングシステム、デコードlsi、およびオーバーサンプリング方法 |
SE0402651D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods for interpolation and parameter signalling |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
US7787631B2 (en) * | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
US7761304B2 (en) | 2004-11-30 | 2010-07-20 | Agere Systems Inc. | Synchronizing parametric coding of spatial audio with externally provided downmix |
WO2006060279A1 (en) * | 2004-11-30 | 2006-06-08 | Agere Systems Inc. | Parametric coding of spatial audio with object-based side information |
JPWO2006067988A1 (ja) * | 2004-12-22 | 2008-06-12 | 松下電器産業株式会社 | Mpegオーディオデコード方法 |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
WO2006075079A1 (fr) * | 2005-01-14 | 2006-07-20 | France Telecom | Procede d’encodage de pistes audio d’un contenu multimedia destine a une diffusion sur terminaux mobiles |
KR100707177B1 (ko) * | 2005-01-19 | 2007-04-13 | 삼성전자주식회사 | 디지털 신호 부호화/복호화 방법 및 장치 |
US7208372B2 (en) * | 2005-01-19 | 2007-04-24 | Sharp Laboratories Of America, Inc. | Non-volatile memory resistor cell with nanotip electrode |
KR100765747B1 (ko) * | 2005-01-22 | 2007-10-15 | 삼성전자주식회사 | 트리 구조 벡터 양자화를 이용한 스케일러블 음성 부호화장치 |
BRPI0607246B1 (pt) * | 2005-01-31 | 2019-12-03 | Skype | método para gerar uma seqüência de amostras de encobrimento com relação à transmissão de um sinal de áudio digitalizado, dispositivo de armazenamento de programa, e, arranjo para receber um sinal de áudio digitalizado |
US7672742B2 (en) * | 2005-02-16 | 2010-03-02 | Adaptec, Inc. | Method and system for reducing audio latency |
US9626973B2 (en) * | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
WO2006091139A1 (en) * | 2005-02-23 | 2006-08-31 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
DE102005010057A1 (de) * | 2005-03-04 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms |
JP5461835B2 (ja) * | 2005-05-26 | 2014-04-02 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の符号化/復号化方法及び符号化/復号化装置 |
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
EP1899958B1 (en) | 2005-05-26 | 2013-08-07 | LG Electronics Inc. | Method and apparatus for decoding an audio signal |
CN101185117B (zh) * | 2005-05-26 | 2012-09-26 | Lg电子株式会社 | 解码音频信号的方法和装置 |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
KR100718132B1 (ko) * | 2005-06-24 | 2007-05-14 | 삼성전자주식회사 | 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치 |
JP5006315B2 (ja) * | 2005-06-30 | 2012-08-22 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のエンコーディング及びデコーディング方法及び装置 |
JP2009500656A (ja) * | 2005-06-30 | 2009-01-08 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
WO2007004830A1 (en) * | 2005-06-30 | 2007-01-11 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US8108219B2 (en) | 2005-07-11 | 2012-01-31 | Lg Electronics Inc. | Apparatus and method of encoding and decoding audio signal |
KR100851970B1 (ko) * | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7684981B2 (en) * | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US8225392B2 (en) * | 2005-07-15 | 2012-07-17 | Microsoft Corporation | Immunizing HTML browsers and extensions from known vulnerabilities |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7693709B2 (en) * | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
US7599840B2 (en) | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
CN1909066B (zh) * | 2005-08-03 | 2011-02-09 | 昆山杰得微电子有限公司 | 音频编码码量控制和调整的方法 |
US9237407B2 (en) * | 2005-08-04 | 2016-01-12 | Summit Semiconductor, Llc | High quality, controlled latency multi-channel wireless digital audio distribution system and methods |
US7933337B2 (en) | 2005-08-12 | 2011-04-26 | Microsoft Corporation | Prediction of transform coefficients for image compression |
US7565018B2 (en) | 2005-08-12 | 2009-07-21 | Microsoft Corporation | Adaptive coding and decoding of wide-range coefficients |
JP4859925B2 (ja) * | 2005-08-30 | 2012-01-25 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
WO2007027050A1 (en) * | 2005-08-30 | 2007-03-08 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US7788107B2 (en) * | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
KR100880642B1 (ko) * | 2005-08-30 | 2009-01-30 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 장치 |
KR20070025905A (ko) * | 2005-08-30 | 2007-03-08 | 엘지전자 주식회사 | 멀티채널 오디오 코딩에서 효과적인 샘플링 주파수비트스트림 구성방법 |
US8319791B2 (en) * | 2005-10-03 | 2012-11-27 | Sharp Kabushiki Kaisha | Display |
US8068569B2 (en) * | 2005-10-05 | 2011-11-29 | Lg Electronics, Inc. | Method and apparatus for signal processing and encoding and decoding |
US7646319B2 (en) * | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
KR100857115B1 (ko) | 2005-10-05 | 2008-09-05 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7696907B2 (en) * | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
WO2007040360A1 (en) | 2005-10-05 | 2007-04-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7751485B2 (en) * | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
US7672379B2 (en) * | 2005-10-05 | 2010-03-02 | Lg Electronics Inc. | Audio signal processing, encoding, and decoding |
DE102005048581B4 (de) * | 2005-10-06 | 2022-06-09 | Robert Bosch Gmbh | Teilnehmerschnittstelle zwischen einem FlexRay-Kommunikationsbaustein und einem FlexRay-Teilnehmer und Verfahren zur Übertragung von Botschaften über eine solche Schnittstelle |
KR100851972B1 (ko) * | 2005-10-12 | 2008-08-12 | 삼성전자주식회사 | 오디오 데이터 및 확장 데이터 부호화/복호화 방법 및 장치 |
JP4954080B2 (ja) * | 2005-10-14 | 2012-06-13 | パナソニック株式会社 | 変換符号化装置および変換符号化方法 |
US20070094035A1 (en) * | 2005-10-21 | 2007-04-26 | Nokia Corporation | Audio coding |
US7653533B2 (en) * | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
TWI307037B (en) * | 2005-10-31 | 2009-03-01 | Holtek Semiconductor Inc | Audio calculation method |
US20080162862A1 (en) * | 2005-12-02 | 2008-07-03 | Yoshiki Matsumoto | Signal Processing Apparatus and Signal Processing Method |
US8345890B2 (en) | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
US8332216B2 (en) * | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
CA2636494C (en) | 2006-01-19 | 2014-02-18 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US8194880B2 (en) | 2006-01-30 | 2012-06-05 | Audience, Inc. | System and method for utilizing omni-directional microphones for speech enhancement |
US8204252B1 (en) | 2006-10-10 | 2012-06-19 | Audience, Inc. | System and method for providing close microphone adaptive array processing |
US8744844B2 (en) * | 2007-07-06 | 2014-06-03 | Audience, Inc. | System and method for adaptive intelligent noise suppression |
US9185487B2 (en) * | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
JP5173840B2 (ja) | 2006-02-07 | 2013-04-03 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
JP2007249075A (ja) * | 2006-03-17 | 2007-09-27 | Toshiba Corp | 音声再生装置および高域補間処理方法 |
JP4193865B2 (ja) * | 2006-04-27 | 2008-12-10 | ソニー株式会社 | デジタル信号切換え装置及びその切換え方法 |
EP1853092B1 (en) * | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
DE102006022346B4 (de) * | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
US8849231B1 (en) | 2007-08-08 | 2014-09-30 | Audience, Inc. | System and method for adaptive power control |
US8150065B2 (en) * | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
US8204253B1 (en) | 2008-06-30 | 2012-06-19 | Audience, Inc. | Self calibration of audio device |
US8934641B2 (en) | 2006-05-25 | 2015-01-13 | Audience, Inc. | Systems and methods for reconstructing decomposed audio signals |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US8326609B2 (en) * | 2006-06-29 | 2012-12-04 | Lg Electronics Inc. | Method and apparatus for an audio signal processing |
US8682652B2 (en) | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
WO2008004649A1 (en) * | 2006-07-07 | 2008-01-10 | Nec Corporation | Audio encoding device, audio encoding method, and program thereof |
US7797155B2 (en) * | 2006-07-26 | 2010-09-14 | Ittiam Systems (P) Ltd. | System and method for measurement of perceivable quantization noise in perceptual audio coders |
US7907579B2 (en) * | 2006-08-15 | 2011-03-15 | Cisco Technology, Inc. | WiFi geolocation from carrier-managed system geolocation of a dual mode device |
CN100531398C (zh) * | 2006-08-23 | 2009-08-19 | 中兴通讯股份有限公司 | 一种移动多媒体广播***的多音轨实现方法 |
US7882462B2 (en) | 2006-09-11 | 2011-02-01 | The Mathworks, Inc. | Hardware definition language generation for frame-based processing |
US8745557B1 (en) | 2006-09-11 | 2014-06-03 | The Mathworks, Inc. | Hardware definition language generation for data serialization from executable graphical models |
US7461106B2 (en) | 2006-09-12 | 2008-12-02 | Motorola, Inc. | Apparatus and method for low complexity combinatorial coding of signals |
JP4823001B2 (ja) * | 2006-09-27 | 2011-11-24 | 富士通セミコンダクター株式会社 | オーディオ符号化装置 |
JP5174027B2 (ja) * | 2006-09-29 | 2013-04-03 | エルジー エレクトロニクス インコーポレイティド | ミックス信号処理装置及びミックス信号処理方法 |
CN101529898B (zh) | 2006-10-12 | 2014-09-17 | Lg电子株式会社 | 用于处理混合信号的装置及其方法 |
EP2328364B1 (en) * | 2006-10-13 | 2020-07-01 | Auro Technologies NV | A method and encoder for combining digital data sets, a decoding method and decoder for such combined digital data sets and a record carrier for storing such combined digital data set |
DE602006015328D1 (de) * | 2006-11-03 | 2010-08-19 | Psytechnics Ltd | Abtastfehlerkompensation |
US7616568B2 (en) * | 2006-11-06 | 2009-11-10 | Ixia | Generic packet generation |
CN101536086B (zh) * | 2006-11-15 | 2012-08-08 | Lg电子株式会社 | 用于解码音频信号的方法和装置 |
JP5103880B2 (ja) * | 2006-11-24 | 2012-12-19 | 富士通株式会社 | 復号化装置および復号化方法 |
KR101062353B1 (ko) | 2006-12-07 | 2011-09-05 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 그 장치 |
CN101568958B (zh) * | 2006-12-07 | 2012-07-18 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
US7508326B2 (en) * | 2006-12-21 | 2009-03-24 | Sigmatel, Inc. | Automatically disabling input/output signal processing based on the required multimedia format |
US8255226B2 (en) * | 2006-12-22 | 2012-08-28 | Broadcom Corporation | Efficient background audio encoding in a real time system |
FR2911020B1 (fr) * | 2006-12-28 | 2009-05-01 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
FR2911031B1 (fr) * | 2006-12-28 | 2009-04-10 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
MX2009007412A (es) * | 2007-01-10 | 2009-07-17 | Koninkl Philips Electronics Nv | Decodificador de audio. |
US8275611B2 (en) * | 2007-01-18 | 2012-09-25 | Stmicroelectronics Asia Pacific Pte., Ltd. | Adaptive noise suppression for digital speech signals |
US20100121470A1 (en) * | 2007-02-13 | 2010-05-13 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
WO2008100068A1 (en) * | 2007-02-13 | 2008-08-21 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
TWI396187B (zh) * | 2007-02-14 | 2013-05-11 | Lg Electronics Inc | 用於將以物件為主之音訊信號編碼與解碼之方法與裝置 |
US8184710B2 (en) | 2007-02-21 | 2012-05-22 | Microsoft Corporation | Adaptive truncation of transform coefficient data in a transform-based digital media codec |
US8259926B1 (en) | 2007-02-23 | 2012-09-04 | Audience, Inc. | System and method for 2-channel and 3-channel acoustic echo cancellation |
KR101149449B1 (ko) * | 2007-03-20 | 2012-05-25 | 삼성전자주식회사 | 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치 |
CN101272209B (zh) * | 2007-03-21 | 2012-04-25 | 大唐移动通信设备有限公司 | 一种对多通道复用数据进行滤波的方法及设备 |
US9466307B1 (en) * | 2007-05-22 | 2016-10-11 | Digimarc Corporation | Robust spectral encoding and decoding methods |
EP2171713B1 (fr) * | 2007-06-15 | 2011-03-16 | France Telecom | Codage de signaux audionumériques |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7944847B2 (en) * | 2007-06-25 | 2011-05-17 | Efj, Inc. | Voting comparator method, apparatus, and system using a limited number of digital signal processor modules to process a larger number of analog audio streams without affecting the quality of the voted audio stream |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8189766B1 (en) | 2007-07-26 | 2012-05-29 | Audience, Inc. | System and method for blind subband acoustic echo cancellation postfiltering |
US8285554B2 (en) * | 2007-07-27 | 2012-10-09 | Dsp Group Limited | Method and system for dynamic aliasing suppression |
KR101403340B1 (ko) * | 2007-08-02 | 2014-06-09 | 삼성전자주식회사 | 변환 부호화 방법 및 장치 |
US8521540B2 (en) * | 2007-08-17 | 2013-08-27 | Qualcomm Incorporated | Encoding and/or decoding digital signals using a permutation value |
US8576096B2 (en) * | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
US8209190B2 (en) * | 2007-10-25 | 2012-06-26 | Motorola Mobility, Inc. | Method and apparatus for generating an enhancement layer within an audio coding system |
US8249883B2 (en) | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
GB2454208A (en) * | 2007-10-31 | 2009-05-06 | Cambridge Silicon Radio Ltd | Compression using a perceptual model and a signal-to-mask ratio (SMR) parameter tuned based on target bitrate and previously encoded data |
US8199927B1 (en) | 2007-10-31 | 2012-06-12 | ClearOnce Communications, Inc. | Conferencing system implementing echo cancellation and push-to-talk microphone detection using two-stage frequency filter |
US8577485B2 (en) | 2007-12-06 | 2013-11-05 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
CN101903944B (zh) * | 2007-12-18 | 2013-04-03 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
US8239210B2 (en) * | 2007-12-19 | 2012-08-07 | Dts, Inc. | Lossless multi-channel audio codec |
US20090164223A1 (en) * | 2007-12-19 | 2009-06-25 | Dts, Inc. | Lossless multi-channel audio codec |
US8143620B1 (en) | 2007-12-21 | 2012-03-27 | Audience, Inc. | System and method for adaptive classification of audio sources |
US8180064B1 (en) | 2007-12-21 | 2012-05-15 | Audience, Inc. | System and method for providing voice equalization |
WO2009084226A1 (ja) * | 2007-12-28 | 2009-07-09 | Panasonic Corporation | ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法 |
EP2248263B1 (en) * | 2008-01-31 | 2012-12-26 | Agency for Science, Technology And Research | Method and device of bitrate distribution/truncation for scalable audio coding |
KR101441898B1 (ko) * | 2008-02-01 | 2014-09-23 | 삼성전자주식회사 | 주파수 부호화 방법 및 장치와 주파수 복호화 방법 및 장치 |
US20090210222A1 (en) * | 2008-02-15 | 2009-08-20 | Microsoft Corporation | Multi-Channel Hole-Filling For Audio Compression |
US8194882B2 (en) | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
US20090234642A1 (en) * | 2008-03-13 | 2009-09-17 | Motorola, Inc. | Method and Apparatus for Low Complexity Combinatorial Coding of Signals |
US8355511B2 (en) | 2008-03-18 | 2013-01-15 | Audience, Inc. | System and method for envelope-based acoustic echo cancellation |
US8639519B2 (en) * | 2008-04-09 | 2014-01-28 | Motorola Mobility Llc | Method and apparatus for selective signal coding based on core encoder performance |
KR20090110242A (ko) * | 2008-04-17 | 2009-10-21 | 삼성전자주식회사 | 오디오 신호를 처리하는 방법 및 장치 |
KR101599875B1 (ko) * | 2008-04-17 | 2016-03-14 | 삼성전자주식회사 | 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 부호화 방법 및 장치, 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 복호화 방법 및 장치 |
KR20090110244A (ko) * | 2008-04-17 | 2009-10-21 | 삼성전자주식회사 | 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치 |
KR101238731B1 (ko) * | 2008-04-18 | 2013-03-06 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 서라운드 경험에 최소한의 영향을 미치는 멀티-채널 오디오에서 음성 가청도를 유지하는 방법과 장치 |
US8179974B2 (en) | 2008-05-02 | 2012-05-15 | Microsoft Corporation | Multi-level representation of reordered transform coefficients |
US8630848B2 (en) | 2008-05-30 | 2014-01-14 | Digital Rise Technology Co., Ltd. | Audio signal transient detection |
CN101605017A (zh) * | 2008-06-12 | 2009-12-16 | 华为技术有限公司 | 编码比特的分配方法和装置 |
US8909361B2 (en) * | 2008-06-19 | 2014-12-09 | Broadcom Corporation | Method and system for processing high quality audio in a hardware audio codec for audio transmission |
US8583424B2 (en) * | 2008-06-26 | 2013-11-12 | France Telecom | Spatial synthesis of multichannel audio signals |
US8774423B1 (en) | 2008-06-30 | 2014-07-08 | Audience, Inc. | System and method for controlling adaptivity of signal modification using a phantom coefficient |
US8521530B1 (en) | 2008-06-30 | 2013-08-27 | Audience, Inc. | System and method for enhancing a monaural audio signal |
WO2010005224A2 (en) * | 2008-07-07 | 2010-01-14 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
CA2729752C (en) * | 2008-07-10 | 2018-06-05 | Voiceage Corporation | Multi-reference lpc filter quantization and inverse quantization device and method |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
TWI427619B (zh) * | 2008-07-21 | 2014-02-21 | Realtek Semiconductor Corp | 音效混波裝置與方法 |
US8406307B2 (en) | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
MX2011003824A (es) * | 2008-10-08 | 2011-05-02 | Fraunhofer Ges Forschung | Esquema de codificacion/decodificacion de audio conmutado de resolucion multiple. |
US9667365B2 (en) | 2008-10-24 | 2017-05-30 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US8121830B2 (en) * | 2008-10-24 | 2012-02-21 | The Nielsen Company (Us), Llc | Methods and apparatus to extract data encoded in media content |
US8359205B2 (en) | 2008-10-24 | 2013-01-22 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
GB2466201B (en) * | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
US9947340B2 (en) * | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
AT509439B1 (de) * | 2008-12-19 | 2013-05-15 | Siemens Entpr Communications | Verfahren und mittel zur skalierbaren verbesserung der qualität eines signalcodierverfahrens |
US8200496B2 (en) * | 2008-12-29 | 2012-06-12 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8219408B2 (en) * | 2008-12-29 | 2012-07-10 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8140342B2 (en) * | 2008-12-29 | 2012-03-20 | Motorola Mobility, Inc. | Selective scaling mask computation based on peak detection |
US8175888B2 (en) | 2008-12-29 | 2012-05-08 | Motorola Mobility, Inc. | Enhanced layered gain factor balancing within a multiple-channel audio coding system |
AU2010242814B2 (en) | 2009-05-01 | 2014-07-31 | The Nielsen Company (Us), Llc | Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content |
JP5539992B2 (ja) * | 2009-08-20 | 2014-07-02 | トムソン ライセンシング | レート制御装置、レート制御方法及びレート制御プログラム |
GB0915766D0 (en) * | 2009-09-09 | 2009-10-07 | Apt Licensing Ltd | Apparatus and method for multidimensional adaptive audio coding |
EP2323130A1 (en) * | 2009-11-12 | 2011-05-18 | Koninklijke Philips Electronics N.V. | Parametric encoding and decoding |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
US8861742B2 (en) * | 2010-01-26 | 2014-10-14 | Yamaha Corporation | Masker sound generation apparatus and program |
US9008329B1 (en) | 2010-01-26 | 2015-04-14 | Audience, Inc. | Noise reduction using multi-feature cluster tracker |
US8718290B2 (en) | 2010-01-26 | 2014-05-06 | Audience, Inc. | Adaptive noise reduction using level cues |
DE102010006573B4 (de) * | 2010-02-02 | 2012-03-15 | Rohde & Schwarz Gmbh & Co. Kg | IQ-Datenkompression für Breitbandanwendungen |
EP2365630B1 (en) * | 2010-03-02 | 2016-06-08 | Harman Becker Automotive Systems GmbH | Efficient sub-band adaptive fir-filtering |
US8428936B2 (en) * | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
US8374858B2 (en) * | 2010-03-09 | 2013-02-12 | Dts, Inc. | Scalable lossless audio codec and authoring tool |
JP5850216B2 (ja) * | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法***及瞬态信号可分层编解码方法 |
US9378754B1 (en) | 2010-04-28 | 2016-06-28 | Knowles Electronics, Llc | Adaptive spatial classifier for multi-microphone systems |
US9236063B2 (en) | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
CN103262158B (zh) | 2010-09-28 | 2015-07-29 | 华为技术有限公司 | 对解码的多声道音频信号或立体声信号进行后处理的装置和方法 |
EP2450880A1 (en) | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
JP5609591B2 (ja) * | 2010-11-30 | 2014-10-22 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
US9436441B1 (en) | 2010-12-08 | 2016-09-06 | The Mathworks, Inc. | Systems and methods for hardware resource sharing |
CN103370705B (zh) * | 2011-01-05 | 2018-01-02 | 谷歌公司 | 用于便利文本输入的方法和*** |
US10515643B2 (en) | 2011-04-05 | 2019-12-24 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoder, decoder, program, and recording medium |
KR101859246B1 (ko) * | 2011-04-20 | 2018-05-17 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 허프만 부호화를 실행하기 위한 장치 및 방법 |
GB2490879B (en) * | 2011-05-12 | 2018-12-26 | Qualcomm Technologies Int Ltd | Hybrid coded audio data streaming apparatus and method |
MX2013013261A (es) | 2011-05-13 | 2014-02-20 | Samsung Electronics Co Ltd | Asignacion de bits, codificacion y decodificacion de audio. |
US8731949B2 (en) * | 2011-06-30 | 2014-05-20 | Zte Corporation | Method and system for audio encoding and decoding and method for estimating noise level |
US9355000B1 (en) | 2011-08-23 | 2016-05-31 | The Mathworks, Inc. | Model level power consumption optimization in hardware description generation |
US8781023B2 (en) * | 2011-11-01 | 2014-07-15 | At&T Intellectual Property I, L.P. | Method and apparatus for improving transmission of data on a bandwidth expanded channel |
US8774308B2 (en) * | 2011-11-01 | 2014-07-08 | At&T Intellectual Property I, L.P. | Method and apparatus for improving transmission of data on a bandwidth mismatched channel |
FR2984579B1 (fr) * | 2011-12-14 | 2013-12-13 | Inst Polytechnique Grenoble | Procede de traitement numerique sur un ensemble de pistes audio avant mixage |
EP2702587B1 (en) * | 2012-04-05 | 2015-04-01 | Huawei Technologies Co., Ltd. | Method for inter-channel difference estimation and spatial audio coding device |
JP5998603B2 (ja) * | 2012-04-18 | 2016-09-28 | ソニー株式会社 | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム |
TWI505262B (zh) | 2012-05-15 | 2015-10-21 | Dolby Int Ab | 具多重子流之多通道音頻信號的有效編碼與解碼 |
GB201210373D0 (en) * | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
CN102752058B (zh) * | 2012-06-16 | 2013-10-16 | 天地融科技股份有限公司 | 音频数据传输***、音频数据传输装置及电子签名工具 |
AR091515A1 (es) * | 2012-06-29 | 2015-02-11 | Sony Corp | Dispositivo y metodo para el procesamiento de imagenes |
JP6065452B2 (ja) | 2012-08-14 | 2017-01-25 | 富士通株式会社 | データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム |
US9129600B2 (en) | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
JP5447628B1 (ja) * | 2012-09-28 | 2014-03-19 | パナソニック株式会社 | 無線通信装置及び通信端末 |
ES2970676T3 (es) | 2012-12-13 | 2024-05-30 | Fraunhofer Ges Forschung | Dispositivo de codificación de audio vocal, dispositivo de decodificación de audio vocal, procedimiento decodificación de audio vocal, y procedimiento de decodificación de audio vocal |
US9659567B2 (en) | 2013-01-08 | 2017-05-23 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
JP6179122B2 (ja) * | 2013-02-20 | 2017-08-16 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム |
US9093064B2 (en) | 2013-03-11 | 2015-07-28 | The Nielsen Company (Us), Llc | Down-mixing compensation for audio watermarking |
WO2014164361A1 (en) | 2013-03-13 | 2014-10-09 | Dts Llc | System and methods for processing stereo audio content |
JP6146069B2 (ja) * | 2013-03-18 | 2017-06-14 | 富士通株式会社 | データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム |
EP2981961B1 (en) | 2013-04-05 | 2017-05-10 | Dolby International AB | Advanced quantizer |
EP2800401A1 (en) | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
US9495968B2 (en) | 2013-05-29 | 2016-11-15 | Qualcomm Incorporated | Identifying sources from which higher order ambisonic audio data is generated |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
EP3660843B1 (en) * | 2013-09-13 | 2022-11-09 | Samsung Electronics Co., Ltd. | Lossless coding method |
RU2641463C2 (ru) * | 2013-10-21 | 2018-01-17 | Долби Интернэшнл Аб | Структура декоррелятора для параметрического восстановления звуковых сигналов |
US10078717B1 (en) | 2013-12-05 | 2018-09-18 | The Mathworks, Inc. | Systems and methods for estimating performance characteristics of hardware implementations of executable models |
US10261760B1 (en) | 2013-12-05 | 2019-04-16 | The Mathworks, Inc. | Systems and methods for tracing performance information from hardware realizations to models |
CN105849801B (zh) | 2013-12-27 | 2020-02-14 | 索尼公司 | 解码设备和方法以及程序 |
US8977376B1 (en) | 2014-01-06 | 2015-03-10 | Alpine Electronics of Silicon Valley, Inc. | Reproducing audio signals with a haptic apparatus on acoustic headphones and their calibration and measurement |
US10986454B2 (en) | 2014-01-06 | 2021-04-20 | Alpine Electronics of Silicon Valley, Inc. | Sound normalization and frequency remapping using haptic feedback |
US8767996B1 (en) | 2014-01-06 | 2014-07-01 | Alpine Electronics of Silicon Valley, Inc. | Methods and devices for reproducing audio signals with a haptic apparatus on acoustic headphones |
EP3111560B1 (en) * | 2014-02-27 | 2021-05-26 | Telefonaktiebolaget LM Ericsson (publ) | Method and apparatus for pyramid vector quantization indexing and de-indexing of audio/video sample vectors |
US9564136B2 (en) * | 2014-03-06 | 2017-02-07 | Dts, Inc. | Post-encoding bitrate reduction of multiple object audio |
CN109087653B (zh) * | 2014-03-24 | 2023-09-15 | 杜比国际公司 | 对高阶高保真立体声信号应用动态范围压缩的方法和设备 |
US9685164B2 (en) * | 2014-03-31 | 2017-06-20 | Qualcomm Incorporated | Systems and methods of switching coding technologies at a device |
FR3020732A1 (fr) * | 2014-04-30 | 2015-11-06 | Orange | Correction de perte de trame perfectionnee avec information de voisement |
US9997171B2 (en) * | 2014-05-01 | 2018-06-12 | Gn Hearing A/S | Multi-band signal processor for digital audio signals |
US10115410B2 (en) * | 2014-06-10 | 2018-10-30 | Peter Graham Craven | Digital encapsulation of audio signals |
JP6432180B2 (ja) * | 2014-06-26 | 2018-12-05 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
EP2960903A1 (en) * | 2014-06-27 | 2015-12-30 | Thomson Licensing | Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
CN113793617A (zh) * | 2014-06-27 | 2021-12-14 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2988300A1 (en) * | 2014-08-18 | 2016-02-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Switching of sampling rates at audio processing devices |
CN111951814A (zh) * | 2014-09-04 | 2020-11-17 | 索尼公司 | 传输设备、传输方法、接收设备以及接收方法 |
DE112015004185T5 (de) | 2014-09-12 | 2017-06-01 | Knowles Electronics, Llc | Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten |
CN113257273A (zh) * | 2014-10-01 | 2021-08-13 | 杜比国际公司 | 高效drc配置文件传输 |
CN105632503B (zh) * | 2014-10-28 | 2019-09-03 | 南宁富桂精密工业有限公司 | 信息隐藏方法及*** |
US9659578B2 (en) * | 2014-11-27 | 2017-05-23 | Tata Consultancy Services Ltd. | Computer implemented system and method for identifying significant speech frames within speech signals |
WO2016135329A1 (en) * | 2015-02-27 | 2016-09-01 | Auro Technologies | Encoding and decoding digital data sets |
EP3067885A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding a multi-channel signal |
EP3067886A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
CN106161313A (zh) * | 2015-03-30 | 2016-11-23 | 索尼公司 | 无线通信***中的电子设备、无线通信***和方法 |
US10043527B1 (en) * | 2015-07-17 | 2018-08-07 | Digimarc Corporation | Human auditory system modeling with masking energy adaptation |
CN111970629B (zh) | 2015-08-25 | 2022-05-17 | 杜比实验室特许公司 | 音频解码器和解码方法 |
EP3353786B1 (en) * | 2015-09-25 | 2019-07-31 | Dolby Laboratories Licensing Corporation | Processing high-definition audio data |
US10423733B1 (en) | 2015-12-03 | 2019-09-24 | The Mathworks, Inc. | Systems and methods for sharing resources having different data types |
US10395664B2 (en) | 2016-01-26 | 2019-08-27 | Dolby Laboratories Licensing Corporation | Adaptive Quantization |
US9820042B1 (en) | 2016-05-02 | 2017-11-14 | Knowles Electronics, Llc | Stereo separation and directional suppression with omni-directional microphones |
US10770088B2 (en) * | 2016-05-10 | 2020-09-08 | Immersion Networks, Inc. | Adaptive audio decoder system, method and article |
US10699725B2 (en) * | 2016-05-10 | 2020-06-30 | Immersion Networks, Inc. | Adaptive audio encoder system, method and article |
US20170330575A1 (en) * | 2016-05-10 | 2017-11-16 | Immersion Services LLC | Adaptive audio codec system, method and article |
KR20190011742A (ko) * | 2016-05-10 | 2019-02-07 | 이멀젼 서비시즈 엘엘씨 | 적응형 오디오 코덱 시스템, 방법, 장치 및 매체 |
US10756755B2 (en) * | 2016-05-10 | 2020-08-25 | Immersion Networks, Inc. | Adaptive audio codec system, method and article |
JP6763194B2 (ja) * | 2016-05-10 | 2020-09-30 | 株式会社Jvcケンウッド | 符号化装置、復号装置、通信システム |
CN105869648B (zh) * | 2016-05-19 | 2019-11-22 | 日立楼宇技术(广州)有限公司 | 混音方法及装置 |
JP7039494B2 (ja) | 2016-06-17 | 2022-03-22 | ディーティーエス・インコーポレイテッド | 近/遠距離レンダリングを用いた距離パニング |
US10375498B2 (en) | 2016-11-16 | 2019-08-06 | Dts, Inc. | Graphical user interface for calibrating a surround sound system |
MX2019005805A (es) * | 2016-11-23 | 2019-08-12 | Ericsson Telefon Ab L M | Metodo y aparato para el control adaptativo de filtros de descorrelacion. |
JP2018092012A (ja) * | 2016-12-05 | 2018-06-14 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
US10362269B2 (en) * | 2017-01-11 | 2019-07-23 | Ringcentral, Inc. | Systems and methods for determining one or more active speakers during an audio or video conference session |
US10339947B2 (en) * | 2017-03-22 | 2019-07-02 | Immersion Networks, Inc. | System and method for processing audio data |
US10699721B2 (en) * | 2017-04-25 | 2020-06-30 | Dts, Inc. | Encoding and decoding of digital audio signals using difference data |
CN109427338B (zh) * | 2017-08-23 | 2021-03-30 | 华为技术有限公司 | 立体声信号的编码方法和编码装置 |
US11227615B2 (en) * | 2017-09-08 | 2022-01-18 | Sony Corporation | Sound processing apparatus and sound processing method |
CN112262585B (zh) | 2018-04-08 | 2022-05-13 | Dts公司 | 环境立体声深度提取 |
EP3775821A1 (en) | 2018-04-11 | 2021-02-17 | Dolby Laboratories Licensing Corporation | Perceptually-based loss functions for audio encoding and decoding based on machine learning |
CN109243471B (zh) * | 2018-09-26 | 2022-09-23 | 杭州联汇科技股份有限公司 | 一种快速编码广播用数字音频的方法 |
US10763885B2 (en) | 2018-11-06 | 2020-09-01 | Stmicroelectronics S.R.L. | Method of error concealment, and associated device |
CN111341303B (zh) * | 2018-12-19 | 2023-10-31 | 北京猎户星空科技有限公司 | 一种声学模型的训练方法及装置、语音识别方法及装置 |
CN109831280A (zh) * | 2019-02-28 | 2019-05-31 | 深圳市友杰智新科技有限公司 | 一种声波通讯方法、装置及可读存储介质 |
KR20200123531A (ko) * | 2019-04-22 | 2020-10-30 | 주식회사 쏠리드 | 통신 신호를 처리하는 방법 및 이를 이용하는 통신 노드 |
US11361772B2 (en) | 2019-05-14 | 2022-06-14 | Microsoft Technology Licensing, Llc | Adaptive and fixed mapping for compression and decompression of audio data |
US10681463B1 (en) | 2019-05-17 | 2020-06-09 | Sonos, Inc. | Wireless transmission to satellites for multichannel audio system |
WO2020232631A1 (zh) * | 2019-05-21 | 2020-11-26 | 深圳市汇顶科技股份有限公司 | 一种语音分频传输方法、源端、播放端、源端电路和播放端电路 |
CN113950845B (zh) | 2019-05-31 | 2023-08-04 | Dts公司 | 凹式音频渲染 |
CN110365342B (zh) * | 2019-06-06 | 2023-05-12 | 中车青岛四方机车车辆股份有限公司 | 波形解码方法及装置 |
EP3751567B1 (en) * | 2019-06-10 | 2022-01-26 | Axis AB | A method, a computer program, an encoder and a monitoring device |
US11380343B2 (en) | 2019-09-12 | 2022-07-05 | Immersion Networks, Inc. | Systems and methods for processing high frequency audio signal |
GB2587196A (en) * | 2019-09-13 | 2021-03-24 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
CN112530444B (zh) * | 2019-09-18 | 2023-10-03 | 华为技术有限公司 | 音频编码方法和装置 |
US20210224024A1 (en) * | 2020-01-21 | 2021-07-22 | Audiowise Technology Inc. | Bluetooth audio system with low latency, and audio source and audio sink thereof |
US20230113561A1 (en) * | 2020-03-13 | 2023-04-13 | Immersion Networks, Inc. | Loudness equalization system |
CN111261194A (zh) * | 2020-04-29 | 2020-06-09 | 浙江百应科技有限公司 | 一种基于pcm技术的音量分析方法 |
CN112037802B (zh) * | 2020-05-08 | 2022-04-01 | 珠海市杰理科技股份有限公司 | 基于语音端点检测的音频编码方法及装置、设备、介质 |
CN111583942B (zh) * | 2020-05-26 | 2023-06-13 | 腾讯科技(深圳)有限公司 | 语音会话的编码码率控制方法、装置和计算机设备 |
CN112187397B (zh) * | 2020-09-11 | 2022-04-29 | 烽火通信科技股份有限公司 | 一种通用的多通道数据同步方法和装置 |
CN112885364B (zh) * | 2021-01-21 | 2023-10-13 | 维沃移动通信有限公司 | 音频编码方法和解码方法、音频编码装置和解码装置 |
CN113485190B (zh) * | 2021-07-13 | 2022-11-11 | 西安电子科技大学 | 一种多通道数据采集***及采集方法 |
US20230154474A1 (en) * | 2021-11-17 | 2023-05-18 | Agora Lab, Inc. | System and method for providing high quality audio communication over low bit rate connection |
WO2024012666A1 (en) * | 2022-07-12 | 2024-01-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding ar/vr metadata with generic codebooks |
CN115171709B (zh) * | 2022-09-05 | 2022-11-18 | 腾讯科技(深圳)有限公司 | 语音编码、解码方法、装置、计算机设备和存储介质 |
US11935550B1 (en) * | 2023-03-31 | 2024-03-19 | The Adt Security Corporation | Audio compression for low overhead decompression |
Family Cites Families (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3171990D1 (en) * | 1981-04-30 | 1985-10-03 | Ibm | Speech coding methods and apparatus for carrying out the method |
JPS5921039B2 (ja) * | 1981-11-04 | 1984-05-17 | 日本電信電話株式会社 | 適応予測符号化方式 |
US4455649A (en) * | 1982-01-15 | 1984-06-19 | International Business Machines Corporation | Method and apparatus for efficient statistical multiplexing of voice and data signals |
US4547816A (en) | 1982-05-03 | 1985-10-15 | Robert Bosch Gmbh | Method of recording digital audio and video signals in the same track |
US4535472A (en) * | 1982-11-05 | 1985-08-13 | At&T Bell Laboratories | Adaptive bit allocator |
US4757536A (en) * | 1984-10-17 | 1988-07-12 | General Electric Company | Method and apparatus for transceiving cryptographically encoded digital data |
US5051991A (en) * | 1984-10-17 | 1991-09-24 | Ericsson Ge Mobile Communications Inc. | Method and apparatus for efficient digital time delay compensation in compressed bandwidth signal processing |
US4622680A (en) * | 1984-10-17 | 1986-11-11 | General Electric Company | Hybrid subband coder/decoder method and apparatus |
US4817146A (en) * | 1984-10-17 | 1989-03-28 | General Electric Company | Cryptographic digital signal transceiver method and apparatus |
US4675863A (en) * | 1985-03-20 | 1987-06-23 | International Mobile Machines Corp. | Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels |
JPS62154368A (ja) | 1985-12-27 | 1987-07-09 | Canon Inc | 記録装置 |
US4815074A (en) * | 1986-08-01 | 1989-03-21 | General Datacomm, Inc. | High speed bit interleaved time division multiplexer for multinode communication systems |
US4899384A (en) * | 1986-08-25 | 1990-02-06 | Ibm Corporation | Table controlled dynamic bit allocation in a variable rate sub-band speech coder |
DE3639753A1 (de) * | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
NL8700985A (nl) * | 1987-04-27 | 1988-11-16 | Philips Nv | Systeem voor sub-band codering van een digitaal audiosignaal. |
JPH0783315B2 (ja) * | 1988-09-26 | 1995-09-06 | 富士通株式会社 | 可変レート音声信号符号化方式 |
US4881224A (en) | 1988-10-19 | 1989-11-14 | General Datacomm, Inc. | Framing algorithm for bit interleaved time division multiplexer |
US5341457A (en) * | 1988-12-30 | 1994-08-23 | At&T Bell Laboratories | Perceptual coding of audio signals |
DE69017977T2 (de) | 1989-07-29 | 1995-08-03 | Sony Corp | 4-Kanal-PCM-Signalverarbeitungsgerät. |
US5115240A (en) * | 1989-09-26 | 1992-05-19 | Sony Corporation | Method and apparatus for encoding voice signals divided into a plurality of frequency bands |
US5235623A (en) * | 1989-11-14 | 1993-08-10 | Nec Corporation | Adaptive transform coding by selecting optimum block lengths according to variatons between successive blocks |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
US5388181A (en) * | 1990-05-29 | 1995-02-07 | Anderson; David J. | Digital audio compression system |
JP2841765B2 (ja) * | 1990-07-13 | 1998-12-24 | 日本電気株式会社 | 適応ビット割当て方法及び装置 |
JPH04127747A (ja) * | 1990-09-19 | 1992-04-28 | Toshiba Corp | 可変レート符号化方式 |
US5365553A (en) * | 1990-11-30 | 1994-11-15 | U.S. Philips Corporation | Transmitter, encoding system and method employing use of a bit need determiner for subband coding a digital signal |
US5136377A (en) * | 1990-12-11 | 1992-08-04 | At&T Bell Laboratories | Adaptive non-linear quantizer |
US5123015A (en) * | 1990-12-20 | 1992-06-16 | Hughes Aircraft Company | Daisy chain multiplexer |
DE69210689T2 (de) * | 1991-01-08 | 1996-11-21 | Dolby Lab Licensing Corp | Kodierer/dekodierer für mehrdimensionale schallfelder |
NL9100285A (nl) * | 1991-02-19 | 1992-09-16 | Koninkl Philips Electronics Nv | Transmissiesysteem, en ontvanger te gebruiken in het transmissiesysteem. |
ZA921988B (en) * | 1991-03-29 | 1993-02-24 | Sony Corp | High efficiency digital data encoding and decoding apparatus |
EP0506394A2 (en) * | 1991-03-29 | 1992-09-30 | Sony Corporation | Coding apparatus for digital signals |
JP3134338B2 (ja) * | 1991-03-30 | 2001-02-13 | ソニー株式会社 | ディジタル音声信号符号化方法 |
DE69232202T2 (de) * | 1991-06-11 | 2002-07-25 | Qualcomm Inc | Vocoder mit veraendlicher bitrate |
JP3508138B2 (ja) | 1991-06-25 | 2004-03-22 | ソニー株式会社 | 信号処理装置 |
KR100268623B1 (ko) * | 1991-06-28 | 2000-10-16 | 이데이 노부유끼 | 압축 데이타 기록 재생 장치 및 신호 처리 방법 |
DE69232251T2 (de) * | 1991-08-02 | 2002-07-18 | Sony Corp | Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung |
KR100263599B1 (ko) * | 1991-09-02 | 2000-08-01 | 요트.게.아. 롤페즈 | 인코딩 시스템 |
JP3226945B2 (ja) * | 1991-10-02 | 2001-11-12 | キヤノン株式会社 | マルチメディア通信装置 |
FR2685593B1 (fr) * | 1991-12-20 | 1994-02-11 | France Telecom | Dispositif de demultiplexage en frequence a filtres numeriques. |
US5642437A (en) * | 1992-02-22 | 1997-06-24 | Texas Instruments Incorporated | System decoder circuit with temporary bit storage and method of operation |
EP0559348A3 (en) * | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
CA2090052C (en) * | 1992-03-02 | 1998-11-24 | Anibal Joao De Sousa Ferreira | Method and apparatus for the perceptual coding of audio signals |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
DE4209544A1 (de) * | 1992-03-24 | 1993-09-30 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale |
JP2693893B2 (ja) * | 1992-03-30 | 1997-12-24 | 松下電器産業株式会社 | ステレオ音声符号化方法 |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
TW235392B (ru) * | 1992-06-02 | 1994-12-01 | Philips Electronics Nv | |
US5436940A (en) * | 1992-06-11 | 1995-07-25 | Massachusetts Institute Of Technology | Quadrature mirror filter banks and method |
JP2976701B2 (ja) * | 1992-06-24 | 1999-11-10 | 日本電気株式会社 | 量子化ビット数割当方法 |
US5408580A (en) * | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
US5396489A (en) * | 1992-10-26 | 1995-03-07 | Motorola Inc. | Method and means for transmultiplexing signals between signal terminals and radio frequency channels |
US5381145A (en) * | 1993-02-10 | 1995-01-10 | Ricoh Corporation | Method and apparatus for parallel decoding and encoding of data |
US5657423A (en) * | 1993-02-22 | 1997-08-12 | Texas Instruments Incorporated | Hardware filter circuit and address circuitry for MPEG encoded data |
TW272341B (ru) * | 1993-07-16 | 1996-03-11 | Sony Co Ltd | |
US5451954A (en) * | 1993-08-04 | 1995-09-19 | Dolby Laboratories Licensing Corporation | Quantization noise suppression for encoder/decoder system |
US5488665A (en) * | 1993-11-23 | 1996-01-30 | At&T Corp. | Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels |
JPH07202820A (ja) * | 1993-12-28 | 1995-08-04 | Matsushita Electric Ind Co Ltd | ビットレート制御システム |
US5608713A (en) * | 1994-02-09 | 1997-03-04 | Sony Corporation | Bit allocation of digital audio signal blocks by non-linear processing |
JP2778482B2 (ja) * | 1994-09-26 | 1998-07-23 | 日本電気株式会社 | 帯域分割符号化装置 |
US5748903A (en) * | 1995-07-21 | 1998-05-05 | Intel Corporation | Encoding images using decode rate control |
ES2201929B1 (es) * | 2002-09-12 | 2005-05-16 | Araclon Biotech, S.L. | Anticuerpos policlonales, metodo de preparacion y uso de los mismos. |
-
1996
- 1996-05-02 US US08/642,254 patent/US5956674A/en not_active Expired - Lifetime
- 1996-11-21 CA CA002238026A patent/CA2238026C/en not_active Expired - Lifetime
- 1996-11-21 EP EP96941446A patent/EP0864146B1/en not_active Expired - Lifetime
- 1996-11-21 AT AT96941446T patent/ATE279770T1/de active
- 1996-11-21 EA EA199800505A patent/EA001087B1/ru not_active IP Right Cessation
- 1996-11-21 DK DK96941446T patent/DK0864146T3/da active
- 1996-11-21 KR KR1019980703985A patent/KR100277819B1/ko not_active IP Right Cessation
- 1996-11-21 CN CN96199832A patent/CN1132151C/zh not_active Expired - Lifetime
- 1996-11-21 CN CNB031569277A patent/CN1303583C/zh not_active Expired - Lifetime
- 1996-11-21 CN CN2006100817855A patent/CN1848241B/zh not_active Expired - Lifetime
- 1996-11-21 CN CN200610081786XA patent/CN1848242B/zh not_active Expired - Lifetime
- 1996-11-21 CN CN2010101265919A patent/CN101872618B/zh not_active Expired - Lifetime
- 1996-11-21 BR BR9611852-0A patent/BR9611852A/pt not_active IP Right Cessation
- 1996-11-21 PL PL96327082A patent/PL182240B1/pl unknown
- 1996-11-21 PL PL96346687A patent/PL183092B1/pl unknown
- 1996-11-21 PL PL96346688A patent/PL183498B1/pl unknown
- 1996-11-21 AU AU10589/97A patent/AU705194B2/en not_active Expired
- 1996-11-21 CA CA002331611A patent/CA2331611C/en not_active Expired - Lifetime
- 1996-11-21 PT PT96941446T patent/PT864146E/pt unknown
- 1996-11-21 ES ES96941446T patent/ES2232842T3/es not_active Expired - Lifetime
- 1996-11-21 JP JP52131497A patent/JP4174072B2/ja not_active Expired - Lifetime
- 1996-11-21 WO PCT/US1996/018764 patent/WO1997021211A1/en active IP Right Grant
- 1996-11-21 DE DE69633633T patent/DE69633633T2/de not_active Expired - Lifetime
-
1997
- 1997-12-16 US US08/991,533 patent/US5974380A/en not_active Expired - Lifetime
-
1998
- 1998-05-28 US US09/085,955 patent/US5978762A/en not_active Expired - Lifetime
- 1998-05-29 MX MX9804320A patent/MX9804320A/es unknown
- 1998-11-04 US US09/186,234 patent/US6487535B1/en not_active Expired - Lifetime
-
1999
- 1999-02-05 HK HK99100515A patent/HK1015510A1/xx not_active IP Right Cessation
-
2006
- 2006-11-17 HK HK06112652.8A patent/HK1092270A1/xx not_active IP Right Cessation
- 2006-11-17 HK HK06112653.7A patent/HK1092271A1/xx not_active IP Right Cessation
-
2011
- 2011-04-26 HK HK11104134.6A patent/HK1149979A1/xx not_active IP Right Cessation
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2682340C1 (ru) * | 2010-09-16 | 2019-03-19 | Долби Интернешнл Аб | Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями |
US10446161B2 (en) | 2010-09-16 | 2019-10-15 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
US10706863B2 (en) | 2010-09-16 | 2020-07-07 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
US11355133B2 (en) | 2010-09-16 | 2022-06-07 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
US11817110B2 (en) | 2010-09-16 | 2023-11-14 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
RU2560788C2 (ru) * | 2011-02-14 | 2015-08-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для обработки декодированного аудиосигнала в спектральной области |
US9153236B2 (en) | 2011-02-14 | 2015-10-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio codec using noise synthesis during inactive phases |
CN108449704A (zh) * | 2013-10-22 | 2018-08-24 | 韩国电子通信研究院 | 生成用于音频信号的滤波器的方法及其参数化装置 |
US12033645B2 (en) | 2023-10-05 | 2024-07-09 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EA001087B1 (ru) | Многоканальный прогнозирующий кодировщик поддиапазона, использующий психоакустическое адаптивное распределение бит | |
US11308969B2 (en) | Methods and apparatus for reconstructing audio signals with decorrelation and differentially coded parameters | |
AU2012208987B2 (en) | Multichannel Audio Coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TC4A | Change in name of a patent proprietor in a eurasian patent |
Designated state(s): RU |
|
MK4A | Patent expired |
Designated state(s): AM AZ BY KZ KG MD TJ TM RU |