RU2289858C2 - Способ и устройство кодирования аудиосигнала с использованием извлечения гармоник - Google Patents

Способ и устройство кодирования аудиосигнала с использованием извлечения гармоник Download PDF

Info

Publication number
RU2289858C2
RU2289858C2 RU2004138088/09A RU2004138088A RU2289858C2 RU 2289858 C2 RU2289858 C2 RU 2289858C2 RU 2004138088/09 A RU2004138088/09 A RU 2004138088/09A RU 2004138088 A RU2004138088 A RU 2004138088A RU 2289858 C2 RU2289858 C2 RU 2289858C2
Authority
RU
Russia
Prior art keywords
audio data
harmonic components
pcm audio
pcm
received
Prior art date
Application number
RU2004138088/09A
Other languages
English (en)
Other versions
RU2004138088A (ru
Inventor
Хо-Дзин ХА (KR)
Хо-Дзин ХА
Original Assignee
Самсунг Электроникс Ко., Лтд.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Самсунг Электроникс Ко., Лтд. filed Critical Самсунг Электроникс Ко., Лтд.
Publication of RU2004138088A publication Critical patent/RU2004138088A/ru
Application granted granted Critical
Publication of RU2289858C2 publication Critical patent/RU2289858C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Изобретение относится к способу и устройству для эффективного сжатия аудиосигнала в звуковой сигнал уровня III стандарта MPEG-1 с низкой скоростью передачи информации. Сущность изобретения заключается в том, что в способе кодирования аудиосигнала гармонические составляющие извлекают с использованием информации результата быстрого преобразования Фурье (БПФ), которую получают с использованием психоакустической модели 2 к принятым аудиоданным импульсно-кодовой модуляции (ИКМ). Затем извлеченные гармонические составляющие удаляют из принятых аудиоданных ИКМ. После этого аудиоданные, из которых удалены извлеченные гармонические составляющие, подвергают модифицированному дискретному косинусному преобразованию (МДКП) и квантованию. Технический результат - обеспечить эффективное сжатие сигнала при низкой скорости путем сжатия только изменяющейся части сигнала посредством модифицированного дискретного косинусного преобразования. 5 н. и 7 з.п. ф-лы, 11 ил.

Description

Область техники
Настоящее изобретение относится к способу сжатия аудиосигнала, и более конкретно к способу и устройству для эффективного сжатия аудиосигнала в звуковой сигнал уровня 3 стандарта MPEG-1 с низкой скоростью передачи информации в битах.
Предшествующий уровень техники
Стандарт MPEG-1 (группа экспертов по движущимся изображениям-1) устанавливает требование относительно сжатия цифрового видеосигнала и сжатия цифрового аудиосигнала и поддерживается Международной организацией по стандартизации (ISO). Стандарт MPEG-1 аудиосигнала используется для сжатия 16-рзрядного аудиосигнала, дискретизируемого частотой дискретизации 44,1 кГц и записываемого на 60-минутном или 72-мнутном компакт-диске (CD), и классифицируется по 3 уровням в соответствии со способом сжатия и сложностью кодека (кодера-декодера).
Уровень III является наиболее сложным, использует значительно больше фильтров, чем уровень II, и применяет кодирование Хаффмана. При кодировании со скоростью 112 кбит/с может прослушиваться звучание превосходного качества. При кодировании со скоростью 128 кбит/с звучание весьма близко к исходному звучанию. При кодировании со скоростью 160 кбит/с или 192 кбит/с качество звучания таково, что человеческое ухо не может отличить его от исходного звука. Обычно аудиосигнал уровня 3 стандарта MPEG-1 обозначают как аудиосигнал MP3.
Аудиосигнал MP3 формируется посредством дискретного косинусного преобразования (ДКП) распределения битов на основе психоакустической модели 2, квантования и т.п. Более конкретно, хотя количество битов, используемых для сжатия аудиоданных, поддерживается минимальным, модифицированное ДКП (МДКП) выполняется с использованием результата психоакустической модели 2.
В методах сжатия аудиосигнала ухо человека является наиболее важным. Человеческое ухо не может слышать, если интенсивность звука находится на определенном уровне или ниже. Если кто-то громко говорит в офисном помещении, легко можно распознать, кто говорит. Однако, если в этот момент пролетает самолет, разговор услышать невозможно. Даже после того как самолет пролетел, разговор все еще невозможно расслышать из-за задерживающегося звука. Соответственно, в психоакустической модели 2 выбираются данные, имеющие громкость, равную или превышающую пороговый уровень маскирования, среди данных, имеющих громкость, равную или превышающую минимальный предел слышимости, соответствующий спокойной обстановке. Выборка выполняется в каждом поддиапазоне.
Однако, когда аудиосигнал сжимается на низкой скорости передачи информации в битах, которая не превышает 64 кбит/с, психоакустическая модель 2 не подходит, потому что количество битов, используемых для квантования сигнала, типа сигнала опережающего эха, ограничено. Следовательно, чтобы преодолеть эту проблему, вызванную медленным аудиосигналом MP3 низкой скорости, настоящее изобретение обеспечивает способ эффективной обработки аудиосигнала на низкой скорости посредством удаления гармонической составляющей из исходного сигнала с использованием быстрого преобразования Фурье (БПФ), принятого в психоакустической модели 2, и сжатия только изменяющейся составляющей с использованием МДКП.
В процессе БПФ, принятом в обычной психоакустической модели, выполняется только анализ сигнала, а результат БПФ не используется. Поскольку для сжатия сигнала результат БПФ не используется, его можно рассматривать как ненужную трату ресурсов.
В публикации Корейского патента № 1995-022322 описан способ распределения битов с использованием психоакустической модели. Однако известный способ отличается от способа согласно настоящему изобретению повышенной эффективностью сжатия благодаря удалению гармонической составляющей из исходного сигнала с использованием результата БПФ, принятого в психоакустической модели.
В публикации Корейского патента № 1998-072457 описан способ и устройство обработки сигналов в психоакустической модели 2, в которых объем вычислений значительно сокращается за счет сокращения перегрузки вычислений при сжатии аудиосигнала. То есть известный способ обработки сигналов включает в себя этап получения индивидуального маскирующего граничного значения с использованием результата БПФ, этап выбора общего маскирующего граничного значения и этап смещения к следующей частотной позиции. Этот способ сходен с настоящим изобретением в отношении использования значения результата БПФ, но отличается тем, что в нем используется другой способ квантования.
В патенте США № 5930373 описан способ повышения качества аудиосигнала с использованием остаточных гармоник низкочастотного сигнала. Однако известный способ и способ квантования согласно настоящему изобретению различаются использованием разных методов использования остаточных гармоник.
Сущность изобретения
Для решения вышеупомянутых и других проблем аспектом настоящего изобретения является обеспечение способа эффективной обработки аудиосигнала с низкой скоростью посредством удаления гармонической составляющей из исходного аудиосигнала, использования результата быстрого преобразования Фурье (БПФ), используемого в психоакустической модели 2, и сжатия только остаточных изменяющихся составляющих с использованием модифицированного дискретного косинусного преобразования (МДКП).
Вышеупомянутые и другие аспекты настоящего изобретения реализуются в способе кодирования аудиосигнала, использующего гармонические составляющие. В этом способе сначала принимаются аудиоданные импульсно-кодовой модуляции (ИКМ), и из принятых аудиоданных ИКМ извлекаются гармонические составляющие с применением психоакустической модели 2. Затем выполняется модифицированное дискретное косинусное преобразование (МДКП) на принятых аудиоданных ИКМ, из которых удалены извлеченные гармонические составляющие. После этого подвергнутые МДКП аудиоданные квантуются, и из квантованных аудиоданных и извлеченных гармонических составляющих формируется пакет аудиосигналов.
Вышеупомянутые и другие аспекты настоящего изобретения также реализуются в способе кодирования аудиосигнала с использованием гармонических составляющих, в котором аудиоданные ИКМ сначала принимаются и сохраняются. Затем к сохраненным данным применяется психоакустическая модель 2, основанная на характеристиках пределов слышимости человека, чтобы получить результат быстрого преобразования Фурье (БПФ), информацию о перцепционной энергии относительно принятых данных и информацию о распределении битов, используемую для квантования. После этого из принятых аудиоданных ИКМ извлекаются гармонические составляющие с использованием информации результата БПФ. Затем извлеченные гармонические составляющие кодируются, и кодированные гармонические составляющие декодируются. Затем выполняется МДКП на некотором количестве выборок принятых аудиоданных ИКМ, из которых удалены извлеченные гармонические составляющие, которое зависит от значения информации о перцепционной энергии. После этого подвергнутые МДКП аудиоданные квантуются путем распределения битов в соответствии с информацией о распределении битов. Наконец, из квантованных, подвергнутых МДКП аудиоданных и кодированных гармонических составляющих формируется пакет аудиосигналов.
Вышеупомянутые и другие аспекты настоящего изобретения, кроме того, реализуются в устройстве кодирования аудиосигнала с использованием гармонических составляющих. В этом устройстве модуль хранения аудиоданных ИКМ принимает и сохраняет аудиоданные ИКМ. Модуль выполнения психоакустической модели 2 принимает аудиоданные ИКМ от модуля хранения аудиоданных ИКМ и выполняет психоакустическую модель 2 для получения информации результата БПФ, информации о перцепционной энергии относительно принятых данных и информации о распределении битов, используемой для квантования. Модуль извлечения гармоник извлекает гармонические составляющие из принятых аудиоданных ИКМ с использованием информации результата БПФ. Модуль кодирования гармоник кодирует извлеченные гармонические составляющие, давая кодированные гармонические составляющие. Модуль декодирования гармоник декодирует кодированные гармонические составляющие. Модуль МДКП выполняет МДКП на сохраненных аудиоданных ИКМ, из которых удалены декодированные гармонические составляющие, в соответствии с информацией о перцепционной энергии. Модуль квантования квантует подвергнутые МДКП аудиоданные в соответствии с информацией о распределении битов. Модуль формирования битового потока уровня III MPEG преобразует квантованные, подвергнутые МДКП аудиоданные и кодированные гармонические составляющие, полученные от модуля кодирования гармоник, в пакет аудиосигналов уровня III MPEG.
Для реализации вышеупомянутых и других аспектов настоящее изобретение обеспечивает машиночитаемый носитель записи, на котором сохранена компьютерная программа для выполнения вышеупомянутых способов.
Краткое описание чертежей
Фиг.1 - формат аудиопотока уровня III MPEG-1;
фиг.2 - блок-схема устройства для формирования аудиопотока уровня III MPEG-1;
фиг.3 - блок-схема алгоритма, иллюстрирующая процесс вычисления в психоакустической модели;
фиг.4 - блок-схема устройства согласно настоящему изобретению для формирования низкоскоростного аудиопотока уровня III MPEG-1;
фиг.5 - блок-схема алгоритма, иллюстрирующая извлечение гармоник, кодирование гармоник и декодирование гармоник на основе психоакустической модели 2;
фиг.6A, 6B, 6C и 6D - выборки гармонических составляющих, извлекаемые поэтапно для извлечения гармонических составляющих с использованием результата БПФ в психоакустической модели 2;
фиг.7 - таблица, показывающая ограниченные частотные диапазоны, изменяющиеся в соответствии со значениями K; и
фиг.8 - блок-схема алгоритма, иллюстрирующая процесс согласно настоящему изобретению для формирования аудиопотока посредством удаления гармонической составляющей.
Предпочтительный вариант осуществления изобретения
Согласно фиг.1, аудиопоток уровня III стандарта (MPEG)-1 состоит из блоков доступа аудиосигнала (БДАС) 100. БДАС 100 представляет собой минимальный блок, к которому может быть независимо получен доступ, и который сжимает и сохраняет данные с установленным количеством выборок. БДАС 100 включает в себя заголовок 110, биты контроля циклическим избыточным кодом (КЦИК) 120, аудиоданные 130 и вспомогательные данные 140.
Заголовок 110 хранит синхрослово, информацию ИД, информацию уровня, информацию относительно того, существует ли бит защиты, информацию показателя скорости передачи в битах, информацию частоты выборок, информацию относительно того, существует ли бит заполнения, бит конфиденциальности, информацию режима, информацию расширении режима, информацию об авторском праве, информацию относительно того, является ли аудиопоток исходным или копией, и информацию характеристик предыскажения.
КЦИК 120 является необязательным. Присутствие или отсутствие КЦИК 120 определено в заголовке 110, а длина КЦИК 120 составляет 16 битов.
Аудиоданные 130 представляют собой участок, содержащий сжатые аудиоданные.
Вспомогательные данные 140 представляют собой данные, которыми заполнено остающееся пространство, или конец аудиоданных 130 не достигает конца БДАС. Во вспомогательные данные 140 могут быть введены произвольные данные, отличающиеся от аудиосигнала MPEG.
Фиг.2 представляет блок-схему устройства для формирования аудиопотока уровня III MPEG-1. Входной модуль 210 аудиосигнала импульсно-кодовой модуляции (ИКМ) имеет буфер для сохранения аудиоданных ИКМ. Входной модуль 210 аудиосигнала ИКМ принимает, в качестве аудиоданных ИКМ, блоки, каждый из которых состоит из 576 выборок.
Модуль 220 выполнения психоакустической модели 2 принимает аудиоданные ИКМ из буфера входного модуля 210 аудиосигнала ИКМ и выполняет психоакустическую модель 2. Модуль 230 дискретного косинусного преобразования (ДКП) принимает аудиоданные ИКМ в блоках с выборками и выполняет операцию ДКП одновременно с выполнением психоакустической модели 2.
Модуль 240 модифицированного ДКП (МДКП) выполняет МДКП с использованием результата применения психоакустической модели 2 и результата ДКП, выполненного модулем 230 ДКП. Если перцепционная энергия больше, чем предварительно определенное пороговое значение, МДКП выполняется с использованием короткого окна. Если перцепционная энергия меньше, чем предварительно определенное пороговое значение, МДКП выполняется с использованием длинного окна.
В перцепционном кодировании, которое представляет собой метод сжатия аудиосигнала, воспроизводимый сигнал отличается от исходного сигнала. То есть детализированная информация, которую люди не могут воспринимать, используя характеристики человеческого уха, может быть опущена. Перцепционная энергия обозначает энергию, которую человек может воспринимать.
Модуль 250 квантования выполняет квантование с использованием информации о распределении битов, полученной в результате применения психоакустической модели 2, и с использованием результата операции МДКП. Модуль 260 формирования битового потока уровня III MPEG-1 преобразует квантованные данные в данные, подлежащие введению в область аудиоданных битового потока MPEG-1, с использованием кодирования Хаффмана.
Фиг.3 представляет блок-схему алгоритма, иллюстрирующую процесс вычисления в психоакустической модели. Сначала, на этапе 310 аудиоданные ИКМ принимаются в блоках, каждый из которых состоит из 576 выборок. Затем, на этапе 320 с использованием принятых аудиоданных ИКМ формируются длинные окна, каждое из которых состоит из 1024 выборок, или короткие окна, каждое из которых состоит из 256 выборок. То есть один пакет состоит из множества выборок.
После этого, на этапе 330, выполняется быстрое преобразование Фурье (БПФ) на окнах, сформированных на этапе 320, на одном окне одновременно.
Затем, на этапе 340 применяется психоакустическая модель 2.
На этапе 350 получают значение перцепционной энергии с применением психоакустической модели 2, применимое к модулю МДКП, а модуль МДКП выбирает окно, подлежащее применению. Рассчитывается значение отношения сигнала к маскированию (ОСМ) для каждой пороговой ширины полосы, применяемое к модулю квантования, для определения количества битов, подлежащих распределению.
Наконец, на этапе 360 выполняются МДКП и квантование с использованием значения перцепционной энергии и значения ОСМ.
Фиг.4 представляет блок-схему устройства для формирования низкоскоростного аудиопотока уровня III стандарта MPEG-1 согласно настоящему изобретению. Запоминающее устройство 410 аудиосигнала ИКМ имеет буфер для сохранения аудиоданных ИКМ. Модуль 420 выполнения психоакустической модели 2 выполняет БПФ на 1024 выборках или 256 выборках одновременно и выводит информацию о перцепционной энергии и информацию о распределении битов.
Как описано выше со ссылкой на фиг.3, когда применяется психоакустическая модель 2, выводится информация о перцепционной энергии и информация о распределении битов, которая зависит от ОСМ. Поскольку модуль 420 выполнения психоакустической модели 2 выполняет БПФ, модуль 430 извлечения гармоник извлекает гармоническую составляющую из результата БПФ, как описано ниже со ссылкой на фиг.6.
Модуль 440 кодирования гармоник кодирует извлеченную гармоническую составляющую и передает кодированную гармоническую составляющую в модуль 480 формирования битового потока уровня III стандарта MPEG-1. Кодированная гармоническая составляющая формирует аудиосигнал стандарта MPEG-1, вместе с квантованными аудиоданными. Процесс кодирования гармонической составляющей подробно описан ниже.
Модуль 450 декодирования гармоник декодирует кодированную гармоническую составляющую, чтобы получить данные ИКМ во временной области. Модуль 460 МДКП вычитает декодированную гармоническую составляющую из исходного входного сигнала ИКМ и выполняет МДКП на результате вычитания. Если значение информации о перцепционной энергии, принятое от модуля 420 психоакустической модели 2, больше предварительно определенного порогового значения, МДКП выполняется одновременно на 18 выборках. Если значение информации о перцепционной энергии, принятое от модуля 420 выполнения психоакустической модели 2, является равным или меньше, чем предварительно определенное пороговое значение, МДКП одновременно выполняется на 36 выборках.
Извлечение гармонической составляющей выполняется на данных частотной области с использованием условия тонального/нетонального решения и характеристик пределов слышимости, которые определены в психоакустической модели 2, подробно описано ниже.
Модуль 470 квантования выполняет квантование с использованием информации о распределении битов, полученную модулем 420 выполнения психоакустической модели 2. Модуль 480 формирования битового потока уровня III стандарта MPEG-1 пакетирует данные гармонических составляющих, сформированные модулем 440 кодирования гармоник, и квантованные аудиоданные, полученные модулем 470 квантования, для получения сжатых аудиоданных.
Фиг.5 представляет блок-схему алгоритма, иллюстрирующую этап 510 извлечения гармоник, этап 520 кодирования гармоник и этап 530 декодирования гармоник на основании психоакустической модели 2. Этапы, выполняемые в психоакустической модели 2 на фиг.5, такие же, как этапы, выполняемые в психоакустической модели 2 на фиг.3. На этапе 510 извлечения гармонической составляющей используется результат БПФ, выполняемого на основе модуля выполнения психоакустической модели 2. На этапе 520 извлеченная гармоническая составляющая кодируется в битовый поток MPEG-1. Этап 510 извлечения гармоник описан более подробно ниже со ссылкой на фиг.6A-6D.
Фиг.6A, 6B, 6C и 6D иллюстрируют выборки, извлекаемые поэтапно, когда гармонические составляющие извлекаются с использованием результата БПФ, выполненного в психоакустической модели 2. Если вводятся аудиоданные ИКМ, как показано на фиг.6A, БПФ сначала выполняется на принятых данных, чтобы определить звуковое давление для каждого элемента данных. Выбирается одно из множества принятых аудиоданных ИКМ, звуковое давление которого было получено. Если значения аудиоданных ИКМ с левой и правой сторон от выбранных данных меньше, чем выбранное значение аудиоданных ИКМ, извлекаются только выбранные аудиоданные ИКМ. Этот процесс применяется для всех принятых аудиоданных ИКМ.
Звуковое давление представляет собой значение энергии выборки в частотной области. В настоящем изобретении только выборки, имеющие звуковые давления, превышающие предварительно определенный уровень, определяются как гармонические составляющие. Соответственно, извлекаются выборки, показанные на фиг.6B. После этого извлекаются только выборки, имеющие звуковые давления, превышающие предварительно определенный уровень. Например, если предварительно определенный уровень установлен равным 7,0 дБ, выборки, имеющие звуковые давления меньшее 7,0 дБ, не выбираются, и остаются только выборки, показанные на фиг.6C. Не все остающиеся выборки рассматриваются как гармонические составляющие, и из остающихся выборок извлекаются некоторые выборки согласно таблице фиг.7. Следовательно, окончательно остаются выборки, показанные на фиг.6D.
Фиг.7 представляет таблицу, показывающую ограниченный частотный диапазон, который изменяется в соответствии со значением K. При условии, что K - значение, представляющее расположение выборки в частотной области, если значение K меньше 3 или больше 500, значения выборок, представленных в пределах ограниченного частотного диапазона 0, составляют 0 и, соответственно, не выбираются. Аналогично этому, как показано на фиг.7, если значение K равно или больше 3 и меньше 63, соответствующее значение диапазона устанавливается равным 2. Если значение K равно или больше 63 и меньше 127, соответствующее значение диапазона устанавливается равным 3. Если значение K равно или больше 127 и меньше 255, соответствующее значение диапазона устанавливается равным 6. Если значение K равно или больше 255 и меньше 500, соответствующее значение диапазона устанавливается равным 12.
Выбор 500 в качестве предела определяется с учетом предела слышимой частоты человека и основан на предположении, что отсутствует различие в качестве воспроизводимого звучания между тем, когда учитывается значения выборок, соответствующие частоте, равной или превышающей 500, и когда они не учитываются.
Следовательно, только значения выборок, представленные на фиг.6D, извлекаются и определяются как гармонические составляющие.
Кодирование 520 гармоник включает в себя кодирование амплитуд, кодирование частот и кодирование фаз. Эти три способа кодирования используют уравнения 1 и 2:
Figure 00000002
где AmpMax обозначает максимальную амплитуду, Enc_peak-AmpMax обозначает значение результата, полученного при кодировании значения AmpMax, а Amp обозначает амплитуды, отличающиеся от максимальной амплитуды.
При кодировании амплитуды, когда максимальная амплитуда установлена как значение AmpMax, максимальная амплитуда сначала кодируется в 8-битовом логарифмическом масштабе, чтобы получить Enc_peak_AmpMax, как показано в Уравнении (1), а другие амплитуды Amp кодируются в 5-битовом логарифмическом масштабе, чтобы получить Enc-Amp, как показано в Уравнении (2).
При кодировании частот кодируются только выборки, соответствующие значениям K в пределах от 58 (от 2498 Гц) до 372 (16 кГц), с учетом слуховых характеристик человека. Поскольку 314 получено вычитанием 58 из 372, выборки кодируются с использованием 9 битов.
Кодирование фаз осуществляется с использованием 3 битов.
После такого извлечения гармоник и кодирования гармоник кодированные гармонические составляющие декодируются, а затем подвергаются МДКП.
Фиг.8 представляет блок-схему алгоритма, иллюстрирующую процесс формирования аудиопотока посредством удаления гармонических составляющих согласно настоящему изобретению. Сначала на этапе 810 аудиоданные ИКМ принимаются и запоминаются. Затем на этапе 820 к сохраненным данным применяется психоакустическая модель 2 с использованием характеристик пределов слышимости человека, чтобы получить информацию результата БПФ, информацию о перцепционной энергии относительно принятых данных и информацию о распределении битов, используемую для квантования. После этого на этапе 830 из принятых аудиоданных ИКМ извлекаются гармонические составляющие с использованием информации результата БПФ.
Гармонические составляющие извлекаются в следующем процессе. Сначала получают звуковое давление для каждого из множества принятых аудиоданных ИКМ, используя информацию результата БПФ. Затем выбираются одни из множества принятых аудиоданных ИКМ, звуковые давления которых получены. Если значения аудиоданных ИКМ с левой и с правой сторон от выбранных данных меньше, чем значение выбранных аудиоданных ИКМ, извлекаются только выбранные аудиоданные ИКМ. Этот процесс применяется ко всем принятым аудиоданным ИКМ. После этого из аудиоданных ИКМ, извлеченных на предыдущем этапе, извлекаются только аудиоданные ИКМ, каждые из которых имеют звуковое давление больше, чем предварительно определенное значение 7,0 дБ. Наконец, гармонические составляющие извлекаются без учета выбора аудиоданных PCM в предварительно определенном частотном диапазоне из аудиоданных, извлеченных на предыдущем этапе.
После извлечения гармоник на этапе 830 на этапе 840 извлеченные гармонические составляющие кодируются и выводятся. Затем, на этапе 850 кодированные гармонические составляющие декодируются.
Затем, на этапе 860, принятые аудиоданные ИКМ, из которых удалены декодированные гармонические составляющие, подвергаются МДКП согласно информации о перцепционной энергии. При этом, если значение перцепционной энергии больше, чем предварительно определенное пороговое значение, выполняется МДКП с использованием короткого окна, например, одновременно на 18 выборках. Если значение перцепционной энергии меньше, чем предварительно определенное пороговое значение, МДКП выполняется с использованием длинного окна, например, одновременно на 36 выборках.
После этого, на этапе 870, значения результата МДКП квантуются посредством распределения битов в соответствии с информацией о распределении битов.
Наконец, на этапе 880, квантованные аудиоданные и кодированные гармонические составляющие подвергаются кодированию Хаффмана для получения пакета аудиосигналов.
Варианты осуществления настоящего изобретения могут быть записаны в виде компьютерных программ и могут быть реализованы на универсальных цифровых ЭВМ, которые выполняют программы с использованием машиночитаемого носителя записи. Примеры машиночитаемых носителей записи включают в себя магнитные устройства памяти (например, ПЗУ (постоянные запоминающие устройства), гибкие диски, жесткие диски, и т.д.), оптические носители записи (например, CD-ROM (неперезаписываемые компакт-диски) или DVD (многоцелевые цифровые диски)) и носитель данных в виде несущего колебания (например, передача через Интернет).
Хотя настоящее изобретение главным образом было показано и описано со ссылкой на предпочтительные варианты его осуществления, специалистам в данной области техники должно быть понятно, что в них могут осуществляться различные видоизменения по форме и в деталях без отклонения от объема и сущности настоящего изобретения, как определено прилагаемой формулой изобретения. Следовательно, раскрытые варианты осуществления следует рассматривать не как ограничительные, а как иллюстративные. Объем настоящего изобретения определяется не приведенным выше описанием, а формулой изобретения, и все различия в объеме, эквивалентном объему формулы изобретения, следует интерпретировать как включенные в настоящее изобретение.
Промышленная применимость
Как описано выше, в настоящем изобретении количество битов квантования, генерируемых при формировании низкоскоростного аудиопотока уровня III стандарта MPEG-1, снижено до минимума. При использовании результатов БПФ, применяемых в психоакустической модели 2, гармонические составляющие просто удаляются из входного аудиосигнала, и сжимается только изменяющаяся часть с использованием МДКП. Поэтому входной аудиосигнал может быть эффективно сжат при низкой скорости передачи в битах.

Claims (12)

1. Способ кодирования аудиосигнала с использованием гармонических составляющих, содержащий: (а) прием аудиоданных b) извлечение гармонических составляющих из принятых аудиоданных, (c) выполнение преобразования на принятых аудиоданных без извлеченных гармонических составляющих и квантование подвергнутых преобразованию аудиоданных, (d) формирование пакета аудиосигналов из квантованых аудиоданных и извлеченных гармонических составляющих.
2. Способ по п.1, в котором извлечение гармонических составляющих из принятых аудиоданных выполняют с использованием психоакустической модели 2.
3. Способ по п.1, в котором преобразование на принятых аудиоданных без извлеченных гармонических составляющих выполняют посредством модифицированного дискретного косинусного преобразования (МДКП).
4. Способ кодирования аудиосигнала с использованием гармонических составляющих, содержащий: (а) прием и сохранение аудиоданных импульсно-кодовой модуляции (ИКМ) и использование психоакустической модели 2 на основании характеристик пределов слышимости человека к сохраненным данным для получения результата быстрого преобразования Фурье (БПФ), информации о перцепционной энергии относительно принятых данных и информации о распределении битов, используемой для квантования, (b) извлечение гармонических составляющих из принятых аудиоданных ИКМ с использованием информации результата БПФ, (c) кодирование извлеченных гармонических составляющих, выведение кодированных гармонических составляющих и декодирование кодированных гармонических составляющих, (d) выполнение МДКП на выборках принятых аудиоданных ИКМ без декодированых извлеченных гармонических составляющих, причем количество выборок зависит от значения информации о перцепционной энергии относительно предварительно определенного порогового значения, (e) квантование после выполнения МДКП принятых аудиоданных ИКМ без декодированных извлеченных гармонических составляющих посредством распределения битов в соответствии с информацией о распределении битов, и (f) формирование пакета аудиосигналов из квантованых после выполнения МДКП аудиоданных без декодированных извлеченных гармонических составляющих и из выведенных кодированных извлеченных гармонических составляющих.
5. Способ кодирования аудиосигнала по п.4, в котором этап (b) содержит (b1) получение звуковых давлений для множества принятых аудиоданных ИКМ с использованием информации результата БПФ, (b2) выбор элемента из множества аудиоданных ИКМ, для которых получено звуковое давление, и извлечение выбранного элемента аудиоданных ИКМ в том случае, если значение аудиоданных ИКМ с правой и с левой сторон от выбранного элемента аудиоданных ИКМ меньше чем значение выбранного элемента аудиоданных ИКМ, (b3) применение этапа (b2) для всех принятых аудиоданных ИКМ, (b4) извлечение из аудиоданных ИКМ, извлеченных на этапе (b2) или (b3), только тех аудиоданных ИКМ, звуковые давления которых больше чем предварительно определенное звуковое давление, и (b5) удаление аудиоданных ИКМ, которые существуют в пределах предварительно определенного частотного диапазона, в зависимости от частотного расположения, из аудиоданных ИКМ, извлеченных на этапе (b4).
6. Способ кодирования аудиосигнала по п.5, в котором предварительно определенное звуковое давление на этапе (b4) составляет 7,0 дБ.
7. Способ кодирования аудиосигнала по п.4, в котором на этапе (d), если значение информации о перцепционной энергии больше чем предварительно определенное пороговое значение, то МДКП одновременно выполняется на 18 выборках, или если значение информации о перцепционной энергии меньше чем предварительно определенное пороговое значение, то МДКП одновременно выполняется на 36 выборках.
8. Устройство кодирования аудиосигнала с использованием гармонических составляющих, содержащее модуль хранения аудиоданных ИКМ, принимающий и сохраняющий аудиоданные ИКМ, модуль выполнения психоакустической модели 2, принимающий аудиоданные ИКМ от модуля хранения аудиоданных ИКМ и выполняющий психоакустическую модель 2 для получения информации результата БПФ, информации о перцепционной энергии относительно принятых данных и информации о распределении битов, используемой для квантования, модуль извлечения гармоник, извлекающий гармонические составляющие из принятых аудиоданных ИКМ с использованием информации результата БПФ, модуль кодирования гармоник, кодирующий извлеченные гармонические составляющие и выводящий кодированные гармонические составляющие, модуль декодирования гармоник, декодирующий кодированные гармонические составляющие, модуль МДКП, выполняющий МДКП на сохраненных аудиоданных ИКМ без декодированных извлеченных гармонических составляющих, в соответствии с упомянутой инфомацией о перцепционной энергии, модуль квантования, квантующий подвергнутые МДКП аудиоданные в соответствии с информацией о распределении битов, и модуль формирования битового потока уровня III стандарта MPEG, преобразующий квантованные, подвергнутые МДКП аудиоданные и кодированные гармонические составляющие, полученные от модуля кодирования гармоник, в пакет аудиосигналов уровня III стандарта MPEG.
9. Устройство кодирования аудиосигнала по п.8, в котором модуль извлечения гармоник выполняет извлечение гармоник посредством следующих этапов: получение звуковых давлений для множества принятых аудиоданных ИКМ с использованием информации результата БПФ, выбор элемента из множества аудиоданных ИКМ, для которых получены звуковые давления, и извлечение выбранного элемента аудиоданных ИКМ в том случае, если значение аудиоданных ИКМ с правой и с левой сторон от выбранного элемента аудиоданных ИКМ меньше, чем значение выбранного элемента аудиоданных ИКМ, применение упомянутого извлечения ко всем принятым аудиоданным ИКМ и повторное извлечение из извлеченных первыми аудиоданных ИКМ только тех аудиоданных ИКМ, звуковые давления которых больше предварительно определенного звукового давления, и удаление из извлеченных вторыми аудиоданных ИКМ, и тех аудиоданных ИКМ, которые находятся в пределах предварительно определенного частотного диапазона, в зависимости от частотного расположения.
10. Устройство кодирования аудиосигнала по п.8, в котором модуль МДКП выполняет МДКП одновременно на 18 выборках, если значение информации о перцепционной энергии больше чем предварительно определенное пороговое значение, или выполняет МДКП одновременно на 36 выборках, если значение информации о перцепционной энергии меньше чем предварительно определенное пороговое значение.
11. Машиночитаемый носитель записи, предназначенный для хранения компьютерной программы кодирования аудиосигнала с использованием гармонических составляющих, причем упомянутая программа, выполняемая компьютером, предназначена для осуществления этапов способа по п.1.
12. Машиночитаемый носитель записи, предназначенный для хранения компьютерной программы кодирования аудисигнала с использованием гармонических составляющих, причем упомянутая программа, выполняемая компьютером, предназначена для осуществления этапов способа по п.4.
RU2004138088/09A 2002-06-27 2002-12-12 Способ и устройство кодирования аудиосигнала с использованием извлечения гармоник RU2289858C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2002-0036310A KR100462611B1 (ko) 2002-06-27 2002-06-27 하모닉 성분을 이용한 오디오 코딩방법 및 장치
KR2002/36310 2002-06-27

Publications (2)

Publication Number Publication Date
RU2004138088A RU2004138088A (ru) 2005-06-27
RU2289858C2 true RU2289858C2 (ru) 2006-12-20

Family

ID=27607091

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2004138088/09A RU2289858C2 (ru) 2002-06-27 2002-12-12 Способ и устройство кодирования аудиосигнала с использованием извлечения гармоник

Country Status (9)

Country Link
US (1) US20040002854A1 (ru)
JP (1) JP2005531014A (ru)
KR (1) KR100462611B1 (ru)
CN (1) CN1262990C (ru)
CA (1) CA2490064A1 (ru)
DE (1) DE10297751B4 (ru)
GB (1) GB2408184B (ru)
RU (1) RU2289858C2 (ru)
WO (1) WO2003063135A1 (ru)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2464540C2 (ru) * 2007-12-13 2012-10-20 Квэлкомм Инкорпорейтед Быстрые алгоритмы для вычисления 5-точечного dct-ii, dct-iv и dst-iv, и архитектуры
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
RU2487427C2 (ru) * 2008-07-11 2013-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Звуковое кодирующее устройство и звуковое декодирующее устройство
US8631060B2 (en) 2007-12-13 2014-01-14 Qualcomm Incorporated Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures
US8706480B2 (en) 2007-06-11 2014-04-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoding audio signal
RU2519069C2 (ru) * 2008-07-11 2014-06-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство аудио кодирования, устройство аудио декодирования, методы кодирования и декодирования аудио-сигнала, аудио поток и компьютерная программа
RU2573231C2 (ru) * 2011-02-14 2016-01-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для кодирования части аудиосигнала с использованием обнаружения неустановившегося состояния и результата качества
RU2605677C2 (ru) * 2009-10-20 2016-12-27 Франхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Аудио кодер, аудио декодер, способ кодирования аудио информации, способ декодирования аудио информации и компьютерная программа, использующая итеративное уменьшение размера интервала
RU2648595C2 (ru) * 2011-05-13 2018-03-26 Самсунг Электроникс Ко., Лтд. Распределение битов, кодирование и декодирование аудио

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005094183A2 (en) * 2004-03-30 2005-10-13 Guy Fleishman Apparatus and method for digital coding of sound
WO2005096509A1 (en) 2004-03-31 2005-10-13 Intel Corporation Multi-threshold message passing decoding of low-density parity check codes
WO2007075098A1 (en) 2005-12-26 2007-07-05 Intel Corporation Generalized multi-threshold decoder for low-density parity check codes
EP1806736B1 (en) * 2004-10-28 2010-09-08 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus, and methods thereof
US8015468B2 (en) 2004-12-29 2011-09-06 Intel Corporation Channel estimation and fixed thresholds for multi-threshold decoding of low-density parity check codes
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
JP4720302B2 (ja) * 2005-06-07 2011-07-13 トヨタ自動車株式会社 自動変速機のクラッチ装置
KR100684029B1 (ko) * 2005-09-13 2007-02-20 엘지전자 주식회사 푸리에 변환을 이용한 배음 생성 방법 및 이를 위한 장치,다운 샘플링에 의한 배음 생성 방법 및 이를 위한 장치와소리 보정 방법 및 이를 위한 장치
KR100788706B1 (ko) * 2006-11-28 2007-12-26 삼성전자주식회사 광대역 음성 신호의 부호화/복호화 방법
CN101552005A (zh) * 2008-04-03 2009-10-07 华为技术有限公司 编码方法、解码方法、***及装置
CN101751928B (zh) * 2008-12-08 2012-06-13 扬智科技股份有限公司 应用音频帧频谱平坦度简化声学模型分析的方法及其装置
CN103516440B (zh) 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5023910A (en) * 1988-04-08 1991-06-11 At&T Bell Laboratories Vector quantization in a harmonic speech coding arrangement
JPH0364800A (ja) * 1989-08-03 1991-03-20 Ricoh Co Ltd 音声符号化及び復号化方式
JP3266920B2 (ja) * 1991-09-25 2002-03-18 三菱電機株式会社 音声符号化装置及び音声復号化装置並びに音声符号化復号化装置
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
KR100458969B1 (ko) * 1993-05-31 2005-04-06 소니 가부시끼 가이샤 신호부호화또는복호화장치,및신호부호화또는복호화방법
US5765126A (en) * 1993-06-30 1998-06-09 Sony Corporation Method and apparatus for variable length encoding of separated tone and noise characteristic components of an acoustic signal
JPH0736486A (ja) * 1993-07-22 1995-02-07 Matsushita Electric Ind Co Ltd 音声符号化装置
JP3131542B2 (ja) * 1993-11-25 2001-02-05 シャープ株式会社 符号化復号化装置
TW321810B (ru) * 1995-10-26 1997-12-01 Sony Co Ltd
JP2778567B2 (ja) * 1995-12-23 1998-07-23 日本電気株式会社 信号符号化装置及び方法
JPH09246983A (ja) * 1996-03-08 1997-09-19 Nec Eng Ltd ディジタル信号処理装置
JPH10178349A (ja) * 1996-12-19 1998-06-30 Matsushita Electric Ind Co Ltd オーディオ信号の符号化方法および復号方法
KR19980072457A (ko) * 1997-03-05 1998-11-05 이준우 오디오 신호의 압축시 심리음향에서의 신호처리방법 및 그 장치
US5930373A (en) * 1997-04-04 1999-07-27 K.S. Waves Ltd. Method and system for enhancing quality of sound signal
DE19742201C1 (de) * 1997-09-24 1999-02-04 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren von Audiosignalen
CA2246532A1 (en) * 1998-09-04 2000-03-04 Northern Telecom Limited Perceptual audio coding
KR100300887B1 (ko) * 1999-02-24 2001-09-26 유수근 디지털 오디오 데이터의 역방향 디코딩 방법
JP2000267700A (ja) * 1999-03-17 2000-09-29 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置
JP2000276194A (ja) * 1999-03-25 2000-10-06 Yamaha Corp 波形圧縮方法及び波形生成方法
US6377916B1 (en) * 1999-11-29 2002-04-23 Digital Voice Systems, Inc. Multiband harmonic transform coder
DE10000934C1 (de) * 2000-01-12 2001-09-27 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals
JP4055336B2 (ja) * 2000-07-05 2008-03-05 日本電気株式会社 音声符号化装置及びそれに用いる音声符号化方法
KR100348899B1 (ko) * 2000-09-19 2002-08-14 한국전자통신연구원 캡스트럼 분석을 이용한 하모닉 노이즈 음성 부호화기 및부호화 방법
KR100378796B1 (ko) * 2001-04-03 2003-04-03 엘지전자 주식회사 디지탈 오디오 부호화기 및 복호화 방법
US6732071B2 (en) * 2001-09-27 2004-05-04 Intel Corporation Method, apparatus, and system for efficient rate control in audio encoding
KR100472442B1 (ko) * 2002-02-16 2005-03-08 삼성전자주식회사 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8706480B2 (en) 2007-06-11 2014-04-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoding audio signal
US8631060B2 (en) 2007-12-13 2014-01-14 Qualcomm Incorporated Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures
RU2464540C2 (ru) * 2007-12-13 2012-10-20 Квэлкомм Инкорпорейтед Быстрые алгоритмы для вычисления 5-точечного dct-ii, dct-iv и dst-iv, и архитектуры
US10685659B2 (en) 2008-07-11 2020-06-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio entropy encoder/decoder for coding contexts with different frequency resolutions and transform lengths
US11024323B2 (en) 2008-07-11 2021-06-01 Fraunhofer-Gesellschaft zur Fcerderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and a computer program
RU2519069C2 (ru) * 2008-07-11 2014-06-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство аудио кодирования, устройство аудио декодирования, методы кодирования и декодирования аудио-сигнала, аудио поток и компьютерная программа
US8930202B2 (en) 2008-07-11 2015-01-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio entropy encoder/decoder for coding contexts with different frequency resolutions and transform lengths
US8983851B2 (en) 2008-07-11 2015-03-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filer, noise filling parameter calculator encoded audio signal representation, methods and computer program
US9043203B2 (en) 2008-07-11 2015-05-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, and a computer program
US12039985B2 (en) 2008-07-11 2024-07-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio entropy encoder/decoder with coding context and coefficient selection
US9449606B2 (en) 2008-07-11 2016-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, and a computer program
US11942101B2 (en) 2008-07-11 2024-03-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio entropy encoder/decoder with arithmetic coding and coding context
US9711157B2 (en) 2008-07-11 2017-07-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, and a computer program
US11869521B2 (en) 2008-07-11 2024-01-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and a computer program
US11670310B2 (en) 2008-07-11 2023-06-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio entropy encoder/decoder with different spectral resolutions and transform lengths and upsampling and/or downsampling
RU2487427C2 (ru) * 2008-07-11 2013-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Звуковое кодирующее устройство и звуковое декодирующее устройство
US10629215B2 (en) 2008-07-11 2020-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, and a computer program
US10242681B2 (en) 2008-07-11 2019-03-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and audio decoder using coding contexts with different frequency resolutions and transform lengths
US9978380B2 (en) 2009-10-20 2018-05-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a detection of a group of previously-decoded spectral values
US11443752B2 (en) 2009-10-20 2022-09-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a detection of a group of previously-decoded spectral values
RU2605677C2 (ru) * 2009-10-20 2016-12-27 Франхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Аудио кодер, аудио декодер, способ кодирования аудио информации, способ декодирования аудио информации и компьютерная программа, использующая итеративное уменьшение размера интервала
RU2573231C2 (ru) * 2011-02-14 2016-01-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для кодирования части аудиосигнала с использованием обнаружения неустановившегося состояния и результата качества
US10276171B2 (en) 2011-05-13 2019-04-30 Samsung Electronics Co., Ltd. Noise filling and audio decoding
RU2705052C2 (ru) * 2011-05-13 2019-11-01 Самсунг Электроникс Ко., Лтд. Распределение битов, кодирование и декодирование аудио
US10109283B2 (en) 2011-05-13 2018-10-23 Samsung Electronics Co., Ltd. Bit allocating, audio encoding and decoding
RU2648595C2 (ru) * 2011-05-13 2018-03-26 Самсунг Электроникс Ко., Лтд. Распределение битов, кодирование и декодирование аудио
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
US9858934B2 (en) 2011-06-01 2018-01-02 Samsung Electronics Co., Ltd. Audio-encoding method and apparatus, audio-decoding method and apparatus, recoding medium thereof, and multimedia device employing same

Also Published As

Publication number Publication date
CA2490064A1 (en) 2003-07-31
GB0427660D0 (en) 2005-01-19
CN1262990C (zh) 2006-07-05
WO2003063135A1 (en) 2003-07-31
GB2408184B (en) 2006-01-04
JP2005531014A (ja) 2005-10-13
DE10297751T5 (de) 2005-07-07
CN1639769A (zh) 2005-07-13
GB2408184A (en) 2005-05-18
KR100462611B1 (ko) 2004-12-20
RU2004138088A (ru) 2005-06-27
US20040002854A1 (en) 2004-01-01
DE10297751B4 (de) 2005-12-22
KR20040001184A (ko) 2004-01-07

Similar Documents

Publication Publication Date Title
RU2289858C2 (ru) Способ и устройство кодирования аудиосигнала с использованием извлечения гармоник
KR100851970B1 (ko) 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
KR100868763B1 (ko) 오디오 신호의 중요 주파수 성분 추출 방법 및 장치와 이를이용한 오디오 신호의 부호화/복호화 방법 및 장치
JP2006011456A (ja) 低ビット率符号化/復号化方法及び装置並びにコンピュータ可読媒体
JP3354863B2 (ja) ビット率の調節可能なオーディオデータ符号化/復号化方法及び装置
EP1440300B1 (en) Encoding device, decoding device and audio data distribution system
CN103325377B (zh) 音频编码方法
US7835907B2 (en) Method and apparatus for low bit rate encoding and decoding
KR101237413B1 (ko) 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
JP4925671B2 (ja) デジタル信号の符号化/復号化方法及びその装置並びに記録媒体
JP2005338850A (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
JP2005534947A (ja) 心理音響ベースで圧縮する際に形成されるノイズの許容可能な歪みに基づくスケールファクタのフィードフォワード予測
JP5587599B2 (ja) 量子化方法、符号化方法、量子化装置、符号化装置、逆量子化方法、復号化方法、逆量子化装置、復号化装置、処理装置
KR100754389B1 (ko) 음성 및 오디오 신호 부호화 장치 및 방법
KR100928966B1 (ko) 저비트율 부호화/복호화방법 및 장치
JP3348759B2 (ja) 変換符号化方法および変換復号化方法
KR100940532B1 (ko) 저비트율 복호화방법 및 장치
KR20070050035A (ko) 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20191213