RU2426179C2 - Способ и устройство для кодирования и декодирования аудиосигналов - Google Patents

Способ и устройство для кодирования и декодирования аудиосигналов Download PDF

Info

Publication number
RU2426179C2
RU2426179C2 RU2009117663A RU2009117663A RU2426179C2 RU 2426179 C2 RU2426179 C2 RU 2426179C2 RU 2009117663 A RU2009117663 A RU 2009117663A RU 2009117663 A RU2009117663 A RU 2009117663A RU 2426179 C2 RU2426179 C2 RU 2426179C2
Authority
RU
Russia
Prior art keywords
signal
encoder
input signal
domain
time domain
Prior art date
Application number
RU2009117663A
Other languages
English (en)
Other versions
RU2009117663A (ru
Inventor
Венкатеш КРИШНАН (US)
Венкатеш Кришнан
Вивек РАДЖЕНДРАН (US)
Вивек РАДЖЕНДРАН
Анантхападманабхан А. КАНДХАДАЙ (US)
Анантхападманабхан А. КАНДХАДАЙ
Original Assignee
Квэлкомм Инкорпорейтед
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Квэлкомм Инкорпорейтед filed Critical Квэлкомм Инкорпорейтед
Publication of RU2009117663A publication Critical patent/RU2009117663A/ru
Application granted granted Critical
Publication of RU2426179C2 publication Critical patent/RU2426179C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к связи, а более конкретно, к методикам для кодирования и декодирования. Описан обобщенный кодер, который кодирует входной сигнал (например, аудиосигнал) на основе, по меньшей мере, одного детектора и нескольких кодеров. По меньшей мере, один детектор может включать в себя детектор активности сигналов, детектор шумоподобных сигналов, детектор разреженности, какой-либо другой детектор или их комбинацию. Несколько кодеров могут включать в себя кодер молчания, кодер шумоподобных сигналов, кодер временной области, кодер области преобразования, какой-либо другой кодер или их комбинацию. Характеристики входного сигнала могут быть определены на основе, по меньшей мере, одного детектора. Кодер может быть выбран из числа нескольких кодеров на основе характеристик входного сигнала. Входной сигнал может быть кодирован на основе выбранного кодера. Входной сигнал может включать в себя последовательность кадров, и обнаружение и кодирование могут выполняться для каждого кадра. Технический результат - обеспечение эффективного кодирования входного сигнала. 10 н. и 33 з.п. ф-лы, 14 ил.

Description

Настоящая заявка притязает на приоритет предварительной заявки на патент (США) порядковый номер 60/828816, озаглавленной "A FRAMEWORK FOR ENCODING GENERALIZED AUDIO SIGNALS", поданной 10 октября 2006 года, и заявки на патент (США) порядковый номер 60/942984, озаглавленной "METHOD AND APPARATUS FOR ENCODING AND DECODING AUDIO SIGNALS", поданной 8 июня 2007 года, обе из которых назначены правопреемнику этой заявки и содержатся в данном документе по ссылке.
Уровень техники
Область техники, к которой относится изобретение
Настоящее раскрытие, в общем, относится к связи, а более конкретно, к методикам для кодирования и декодирования аудиосигналов.
Уровень техники
Аудиокодеры и декодеры широко используются для различных применений, таких как беспроводная связь, "речь-по-Интернет-протоколу" (VoIP), мультимедиа, цифровое аудио и т.д. Аудиокодер принимает аудиосигнал на входной скорости передачи битов, кодирует аудиосигнал на основе схемы кодирования и формирует кодированный сигнал на выходной скорости передачи битов, которая типично является более низкой (и иногда намного более низкой), чем входная скорость передачи битов. Это дает возможность отправлять или сохранять кодированный сигнал с использованием меньшего числа ресурсов.
Аудиокодер может быть разработан на основе определенных предполагаемых характеристик аудиосигнала и может применять эти характеристики сигнала, чтобы использовать меньшее число битов как возможно, чтобы представлять информацию в аудиосигнале. Эффективность аудиокодера может затем зависеть от того, как близко фактический аудиосигнал соответствует предполагаемым характеристикам, для которых разработан аудиокодер. Производительность аудиокодера может быть относительно плохой, если аудиосигнал имеет отличные характеристики от тех, для которых разработан аудиокодер.
Сущность изобретения
Методики для эффективного кодирования входного сигнала и декодирования кодированного сигнала описываются в данном документе. В одной схеме обобщенный кодер может кодировать входной сигнал (к примеру, аудиосигнал) на основе, по меньшей мере, одного детектора и нескольких кодеров. По меньшей мере, один детектор может содержать детектор активности сигналов, детектор шумоподобных сигналов, детектор разреженности, какой-либо другой детектор или их комбинацию. Несколько кодеров могут содержать кодер молчания, кодер шумоподобных сигналов, кодер временной области, по меньшей мере, один кодер области преобразования, какой-либо другой кодер или их комбинацию. Характеристики входного сигнала могут быть определены на основе, по меньшей мере, одного детектора. Кодер может быть выбран из числа нескольких кодеров на основе характеристик входного сигнала. Входной сигнал затем может быть кодирован на основе выбранного кодера. Входной сигнал может содержать последовательность кадров. Для каждого кадра, могут быть определены характеристики сигнала кадра, кодер может быть выбран для кадра на основе его характеристик и кадр может быть кодирован на основе выбранного кодера.
В другой схеме обобщенный кодер может кодировать входной сигнал на основе детектора разреженности и нескольких кодеров для нескольких областей. Разреженность входного сигнала в каждой из нескольких областей может быть определена. Кодер может быть выбран из числа нескольких кодеров на основе разреженности входного сигнала в нескольких областях. Входной сигнал затем может быть кодирован на основе выбранного кодера. Несколько областей могут включать в себя временную область и область преобразования. Кодер временной области может быть выбран, чтобы кодировать входной сигнал во временной области, если входной сигнал считается более разреженным во временной области, чем области преобразования. Кодер области преобразования может быть выбран, чтобы кодировать входной сигнал в области преобразования (к примеру, частотной области), если входной сигнал считается более разреженным в области преобразования, чем временной области.
В еще одной схеме детектор разреженности может выполнять обнаружение разреженности преобразованием первого сигнала в первой области (к примеру, временную область), чтобы получить второй сигнал во второй области (к примеру, области преобразования). Первый и второй параметры могут быть определены на основе энергии значений/компонентов в первом и втором сигналах. По меньшей мере, один подсчет также может быть определен на основе предшествующих объявлений первого сигнала более разреженным и предшествующих объявлений второго сигнала более разреженным. Является ли первый сигнал или второй сигнал более разреженным, может быть определено на основе первого и второго параметров и, по меньшей мере, одного подсчета, если он используется.
Далее более подробно описаны различные аспекты и признаки изобретения.
Краткое описание чертежей
Фиг.1 показывает блок-схему обобщенного аудиокодера.
Фиг.2 показывает блок-схему детектора разреженности.
Фиг.3 показывает блок-схему другого детектора разреженности.
Фиг.4A и 4B показывают графики речевого сигнала и инструментального музыкального сигнала во временной области и области преобразования.
Фиг.5A и 5B показывают графики для коэффициентов уплотнения временной области и области преобразования для речевого сигнала и инструментального музыкального сигнала.
Фиг.6A и 6B показывают процесс для выбора или кодера временной области, или кодера области преобразования для аудиокадра.
Фиг.7 показывает процесс для кодирования входного сигнала с обобщенным кодером.
Фиг.8 показывает процесс для кодирования входного сигнала с кодерами для нескольких областей.
Фиг.9 показывает процесс для выполнения обнаружения разреженности.
Фиг.10 показывает блок-схему обобщенного аудиодекодера.
Фиг.11 показывает блок-схему устройства беспроводной связи.
Подробное описание изобретения
Различные типы аудиокодеров могут использоваться, чтобы кодировать аудиосигналы. Некоторые аудиокодеры могут допускать кодирование различных классов аудиосигналов, таких как речь, музыка, тоны и т.д. Эти аудиокодеры могут упоминаться как универсальные аудиокодеры. Некоторые другие аудиокодеры могут быть предназначены для конкретных классов аудиосигналов, таких как речь, музыка, фоновый шум и т.д. Эти аудиокодеры могут упоминаться как конкретные для класса сигналов аудиокодеры, специализированные аудиокодеры и т.д. В общем, конкретный для класса сигналов аудиокодер, который предназначен для конкретного класса аудиосигналов, может быть способен более эффективно кодировать аудиосигнал в своем классе, чем универсальный аудиокодер. Конкретные для класса сигналов аудиокодеры могут быть способны достигать улучшенного кодирования источников аудиосигналов конкретных классов на скоростях передачи битов, равных минимум 8 килобитов в секунду (Кбит/с).
Обобщенный аудиокодер может использовать набор конкретных для класса сигналов аудиокодеров для того, чтобы эффективно кодировать обобщенные аудиосигналы. Обобщенные аудиосигналы могут принадлежать различным классам и/или могут динамически изменять класс с течением времени. Например, аудиосигнал может содержать главным образом музыку в некоторых интервалах времени, главным образом речь в некоторых других интервалах времени, главным образом шум в еще некоторых других интервалах времени и т.д. Обобщенный аудиокодер может быть способен эффективно кодировать этот аудиосигнал с различными надлежащим образом выбранными конкретными для класса сигналов аудиокодерами в различных интервалах времени. Обобщенный аудиокодер может быть способен достигать хорошей производительности кодирования для аудиосигналов различных классов и/или динамически изменяющихся классов.
Фиг.1 показывает блок-схему схемы обобщенного аудиокодера 100, который допускает кодирование аудиосигнала с различными и/или изменяющимися характеристиками. Аудиокодер 100 включает в себя набор детекторов 110, селектор 120, набор конкретных для класса сигналов аудиокодеров 130 и мультиплексор (Mux) 140. Детекторы 110 и селектор 120 предоставляют механизм, чтобы выбирать соответствующий конкретный для класса аудиокодер на основе характеристик аудиосигнала. Различные конкретные для класса сигналов аудиокодеры также могут упоминаться как различные режимы кодирования.
В рамках аудиокодера 100, детектор 112 активности сигналов может обнаруживать активность в аудиосигнале. Если активность сигнала не обнаружена, как определено на этапе 122, то аудиосигнал может быть кодирован на основе кодера 132 молчания, который может быть эффективным при кодировании главным образом шума.
Если активность сигнала обнаружена, то детектор 114 может обнаруживать периодические и/или шумоподобные характеристики аудиосигнала. Аудиосигнал может иметь шумоподобные характеристики, если он не является периодическим, не имеет прогнозируемой структуры или шаблона, не имеет фундаментального периода (основного тона) и т.д. Например, звук буквы "s" может рассматриваться как имеющий шумоподобные характеристики. Если аудиосигнал имеет шумоподобные характеристики, как определено на этапе 124, то аудиосигнал может быть кодирован на основе кодера 134 шумоподобных сигналов. Кодер 134 может реализовать методику линейного предсказания с шумовым возбуждением (NELP) и/или какую-либо другую методику кодирования, которая может эффективно кодировать сигнал, имеющий шумоподобные характеристики.
Если аудиосигнал не имеет шумоподобных характеристик, то детектор 116 разреженности может анализировать аудиосигнал, чтобы определять, демонстрирует ли сигнал разреженность во временной области или в одной или более областей преобразования. Аудиосигнал может быть преобразован из временной области в другую область (к примеру, частотную область) на основе преобразования, и область преобразования упоминается как область, в которую преобразовывается аудиосигнал. Аудиосигнал может быть преобразован в различные области преобразования на основе различных типов преобразования. Разреженность упоминается как возможность представлять информацию с малым числом битов. Аудиосигнал может рассматриваться как разреженный в данной области, если только малое число значений или компонентов для сигнала в этой области содержат большую часть энергии или информации сигнала.
Если аудиосигнал разряжен во временной области, как определено на этапе 126, то аудиосигнал может быть кодирован на основе кодера 136 временной области. Кодер 136 может реализовать методику линейного предсказания с шумовым возбуждением (NELP) и/или какую-либо другую методику кодирования, которая может эффективно кодировать сигнал, разряженный во временной области. Кодер 136 может определять и кодировать остатки долгосрочных и краткосрочных предсказаний аудиосигнала. Иначе, если аудиосигнал разрежен в одной из областей преобразования, и/или эффективность кодирования лучше в одной из областей преобразования, чем временной области и других областей преобразования, то аудиосигнал может быть кодирован на основе кодера 138 области преобразования. Кодер области преобразования - это кодер, который кодирует сигнал, представление которого в области преобразования разрежено, в области преобразования. Кодер 138 может реализовать модифицированное дискретное косинусное преобразование (MDCT), набор гребенок фильтров, синусоидальное моделирование и/или какую-либо другую методику кодирования, которая может эффективно представлять разреженные коэффициенты преобразования сигнала.
Мультиплексор 140 может принимать выводы кодеров 132, 134, 136 и 138 и может предоставлять вывод одного кодера как кодированный сигнал. Различные кодеры 132, 134, 136 и 138 могут быть выбраны в различных интервалах времени на основе характеристик аудиосигнала.
Фиг.1 показывает конкретную схему обобщенного аудиокодера 100. В общем, обобщенный аудиокодер может включать в себя любое число детекторов и любой тип детектора, который может использоваться, чтобы обнаруживать любые характеристики аудиосигнала. Обобщенный аудиокодер также может включать в себя любое число кодеров и любой тип кодера, который может использоваться, чтобы кодировать аудиосигнал. Некоторые примерные детекторы и кодеры приведены выше и известны специалистам в данной области техники. Детекторы и кодеры могут быть расположены по-разному. Фиг.1 показывает один примерный набор детекторов и кодеров в одной примерной компоновке. Обобщенный аудиокодер может включать в себя меньшее, большее число и/или другие кодеры и детекторы, чем показано на Фиг.1.
Аудиосигнал может быть обработан в единицах кадров. Кадр может включать в себя данные, собранные за предварительно определенный интервал времени, к примеру 10 миллисекунд (мс), 20 мс и т.д. Кадр также может включать в себя предварительно определенное число выборок с предварительно определенной частотой дискретизации. Кадр также может упоминаться как пакет, блок данных, единица данных и т.д.
Обобщенный аудиокодер 100 может обрабатывать каждый кадр так, как показано на Фиг.1. Для каждого кадра детектор 112 активности сигналов может определять, содержит ли этот кадр молчание или активность. Если кадр молчания обнаружен, то кодер 132 молчания может кодировать кадр и предоставлять кодированный кадр. Иначе, детектор 114 может определять, содержит ли кадр шумоподобный сигнал, и если да, кодер 134 может кодировать кадр. Иначе, любой кодер 136 или 138 может кодировать кадр на основе обнаружения разреженности в кадре детектором 116. Обобщенный аудиокодер 100 может выбирать соответствующий кодер для каждого кадра, чтобы максимизировать эффективность кодирования (к примеру, достигать хорошего качества восстановления при низких скоростях передачи в битах) при активации бесшовного перехода между различными кодерами.
Хотя описание ниже описывает детекторы разреженности, которые активируют выбор между временной областью и областью преобразования, схема ниже может быть обобщена, чтобы выбирать одну область из числа временной области и любого числа областей преобразования. Аналогично, кодеры в обобщенных аудиокодерах могут включать в себя любое число и любой тип кодеров области преобразования, один из которых может быть выбран, чтобы кодировать сигнал или кадр сигнала.
В схеме, показанной на Фиг.1, детектор 116 разреженности может определять, разрежен ли аудиосигнал во временной области или области преобразования. Результат этого определения может использоваться, чтобы выбирать кодер 136 временной области или кодер 138 области преобразования для аудиосигнала. Поскольку разреженная информация может быть представлена с меньшим числом битов, критерий разреженности может использоваться, чтобы выбирать эффективный кодер для аудиосигнала. Разреженность может быть обнаружена по-разному.
Фиг.2 показывает блок-схему детектора 116a разреженности, который является одной схемой детектора 116 разреженности на Фиг.1. В этой схеме детектор 116a разреженности принимает аудиокадр и определяет, является ли аудиокадр более разреженным во временной области или области преобразования.
В схеме, показанной на Фиг.2, блок 210 может выполнять анализ кодирования с линейным предсказанием (LPC) в окрестности текущего аудиокадра и предоставлять кадр остатков. Окрестность типично включает в себя текущий аудиокадр и дополнительно может включать в себя предшествующие и/или будущие кадры. Например, блок 210 может извлекать предсказанный кадр на основе выборок только в текущем кадре или в текущем кадре и одном или более предшествующих кадров, или в текущем кадре и одном или более будущих кадров, или в текущем кадре, одном или более предшествующих кадров и одном или более будущих кадров и т.д. Предсказанный кадр также может быть извлечен на основе одинакового или различного числа выборок в различных кадрах, к примеру, 160 выборок из текущего кадра, 80 выборок из следующего кадра и т.д. В любом случае блок 210 может вычислять разность между текущим аудиокадром и предсказанным кадром, чтобы получать остаточный кадр, содержащий разности между текущими и предсказанными кадрами. Разности также упоминаются как остатки, ошибки предсказания и т.д.
Текущий аудиокадр может содержать K выборок и может быть обработан блоком 210, чтобы получить остаточный кадр, содержащий K остатков, при этом K может быть любым целочисленным значением. Блок 220 может преобразовать остаточный кадр (к примеру, на основе такого же преобразования, используемого кодером 138 области преобразования на Фиг.1), чтобы получить преобразованный кадр, содержащий K коэффициентов.
Блок 212 может вычислять квадратную величину или энергию каждого остатка в остаточном кадре следующим образом:
Figure 00000001
уравнение (1)
где
Figure 00000002
- это k-тый комплекснозначный остаток в остаточном кадре, и
|xk | 2 является квадратной величиной или энергией k-того остатка.
Блок 212 может фильтровать остатки и затем вычислять энергию фильтрованных остатков. Блок 212 также может сглаживать и/или повторно дискретизировать значения остаточной энергии. В любом случае блок 212 может предоставлять N значений остаточной энергии во временной области, где N≤K.
Блок 214 может сортировать N значений остаточной энергии в порядке убывания следующим образом:
Figure 00000003
уравнение (2)
где X 1 - это наибольшее значение |xk | 2, X 2 - это второе по величине значение |xk | 2 и т.д., а X N - это наименьшее значение |xk | 2 из N значений |xk|2 из блока 212.
Блок 216 может суммировать N значений остаточной энергии, чтобы получить полную остаточную энергию. Блок 216 также может накапливать N отсортированных значений остаточной энергии, по одному значению энергии за раз, до тех пор пока накопленная остаточная энергия не превышает предварительно определенный процент полной остаточной энергии, следующим образом:
Figure 00000004
уравнение (3a)
Figure 00000005
уравнение (3b)
где E total,X - это полная энергия всех N значений остаточной энергии, η - это предварительно определенный процент, к примеру, η=70 или какому-либо другому значению, а N T - это минимальное число значений остаточной энергии с накопленной энергией, превышающей η процентов полной остаточной энергии.
Блок 222 может вычислять квадратную величину или энергию каждого коэффициента в преобразованном кадре следующим образом:
Figure 00000006
уравнение (4)
где
Figure 00000007
- это k-тый коэффициент в преобразованном кадре, и
|yk|2 - это квадратная величина или энергия k-того коэффициента.
Блок 222 может оперировать коэффициентами в преобразованном кадре таким же образом, что и блок 212. Например, блок 222 может сглаживать и/или повторно дискретизировать значения энергии коэффициентов. Блок 222 может предоставлять N значений энергии коэффициентов.
Блок 224 может сортировать N значений энергии коэффициентов в порядке убывания, следующим образом:
Figure 00000008
уравнение (5)
где Y - это -наибольшее значение |yk|2, Y 2 - это второе по значение величине |yk|2 и т.д., а YN - это наименьшее значение |yk|2 из N значений |yk|2 из блока 222.
Блок 226 может суммировать N значений энергии коэффициентов, чтобы получить полную энергию коэффициентов. Блок 226 также может накапливать N отсортированных значений энергии коэффициентов, по одному значению энергии за раз, до тех пор пока накопленная энергия коэффициентов не превышает предварительно определенный процент полной энергии коэффициентов, следующим образом:
Figure 00000009
уравнение (6a)
Figure 00000010
уравнение (6b)
где E total,Y - это полная энергия всех N значений энергии коэффициентов, и N M - это минимальное число значений энергии коэффициентов с накопленной энергией, превышающей η процентов полной энергии коэффициентов.
Блоки 218 и 228 могут вычислять коэффициенты уплотнения для временной области и области преобразования, соответственно, следующим образом:
Figure 00000011
уравнение (7a)
Figure 00000012
уравнение (7b)
где C T (i) является коэффициентом уплотнения для временной области, а C M (i) является коэффициентом уплотнения для области преобразования.
C T (i) служит признаком совокупной энергии верхних i значений остаточной энергии. C T (i) может рассматриваться как функция накопленной энергии для временной области. C M (i) служит признаком совокупной энергии верхних i значений энергии коэффициентов. C M (i) может рассматриваться как функция накопленной энергии для области преобразования.
Блок 238 может вычислять параметр D(i) дельты на основе коэффициентов уплотнения следующим образом:
D(i)=C M (i)-C T (i) уравнение (8)
Модуль 240 решения может принимать параметры N T и N M из блоков 216 и 226, соответственно, параметр D(i) дельты из блока 238 и, возможно, другую информацию. Модуль 240 решения может выбирать или кодер 136 временной области или кодер 138 области преобразования для текущего кадра на основе N T , N M , D(i) и/или другой информации.
В одной схеме модуль 240 решения может выбирать кодер 136 временной области или кодер 138 области преобразования для текущего кадра следующим образом:
Если N T <(N M -Q 1 ), то выбрать кодер 136 временной области, уравнение (9a)
Если N M<(N T -Q 2 ), то выбрать кодер 138 области преобразования, уравнение (9b)
где Q 1 и Q 2 - это предварительно определенные пороговые значения, к примеру Q 1 0 и Q 2 0.
N T может служить признаком разреженности остаточного кадра во временной области с меньшим значением N T, соответствующее более разреженному остаточному кадру, и наоборот. Аналогично, N M, может служить признаком разреженности преобразованного кадра в области преобразования с меньшим значением N M, соответствующее более разреженному преобразованному кадру, и наоборот. Уравнение (9a) выбирает кодер 136 временной области, если представление временной области остатков более разрежено, а уравнение (9b) выбирает кодер 138 области преобразования, если представление области преобразования остатков более разрежено.
Выбор в наборе уравнений (9), может быть неопределенным для текущего кадра. Это может иметь место, к примеру, если N T =N M , Q 1 0 и/или Q 2 0. В этом случае один или более дополнительных параметров, таких как D(i), могут использоваться, чтобы определять, выбрать ли кодер 136 временной области или кодер 138 области преобразования для текущего кадра. Например, если одного набора уравнений (9) недостаточно, чтобы выбрать кодер, то кодер 138 области преобразования может быть выбран, если D(i) больше нуля, и кодер 136 временной области может быть выбран в противном случае.
Пороговые значения Q 1 и Q 2 могут использоваться, чтобы достигать различных результатов. Например, пороговые значения Q 1 и/или Q 2 могут быть выбраны, чтобы учитывать разности или смещение (если есть) в вычислении N T и N M . Пороговые значения Q 1 и/или Q 2 также могут быть использованы, чтобы (i) предпочесть кодер 136 временной области кодеру 138 области преобразования использованием небольшого значения Q 1 и/или большого значения Q 2, или (ii) предпочесть кодер 138 области преобразования кодеру 136 временной области использованием небольшого значения Q 2 и/или большого значения Q 1. Пороговые значения Q 1 и/или Q 2 также могут использоваться, чтобы достигать гистерезиса в выборе кодера 136 или 138. Например, если кодер 136 временной области выбран для предыдущего кадра, то кодер 138 области преобразования может быть выбран для текущего кадра, если N M меньше чем N T на Q 2 , где Q 2 - это величина гипотезы в переходе от кодера 136 к кодеру 138. Аналогично, если кодер 138 области преобразования выбран для предыдущего кадра, то кодер 136 временной области может быть выбран для текущего кадра, если N T меньше чем N M на Q 1 , где Q 1 - это величина гипотезы в переходе от кодера 138 к кодеру 136. Гипотеза может использоваться, чтобы изменять кодер только, если характеристики сигнала изменились на достаточную величину, где достаточная величина может быть задана соответствующими вариантами значений Q 1 и Q 2.
В другой схеме модуль 240 решения может выбирать кодер 136 временной области или кодер 138 области преобразования для текущего кадра на основе начальных решений для текущих и предшествующих кадров. В каждом кадре модуль 240 решения может принимать начальное решение использовать кодер 136 временной области или кодер 138 области преобразования для данного кадра, к примеру, как описано выше. Модуль 240 решения затем может переключаться с одного кодера на другой кодер на основе правила выбора. Например, модуль 240 решения может переключаться на другой кодер, только если новые кадры Q 3 предпочитают переключение, если Q 4 из Q 5 новых кадров предпочитают переключение и т.д., где Q 3 , Q 4 и Q 5 могут быть надлежащим образом выбранными значениями. Модуль 240 решения может использовать текущий кодер для текущего кадра, если переключение не делается. Эта схема может предоставлять гипотезу времени и не допустить непрерывного переключения между кодерами в последовательных кадрах.
Фиг.3 показывает блок-схему детектора 116b разреженности, который является другой схемой детектора 116 разреженности на Фиг.1. В этой схеме детектор 116b разреженности включает в себя блоки 210, 212, 214, 218, 220, 222, 224 и 228, которые работают так, как описано выше для Фиг.2, чтобы вычислять коэффициент уплотнения C T (i) для временной области и коэффициент уплотнения C M (i) для области преобразования.
Блок 330 может определять число раз, когда C T (i) ≥C M (i), и число раз, когда C M (i)≥C T (i), для всех значений C T (i) и C M (i) вплоть до предварительно определенного значения следующим образом:
Figure 00000013
уравнение (10a)
Figure 00000014
уравнение (10b)
где K T - это параметр разреженности временной области,
К М - это параметр разреженности области преобразования, и
τ - это процент полной энергии, учитываемой, чтобы определять K T и К М .
Кардинальное число набора - это число элементов в наборе.
В уравнении (10a) каждый коэффициент C T (i) уплотнения временной области сравнивается с соответствующим коэффициентом C M (i) уплотнения области преобразования, для i = 1, ..., N и C T(i)≤τ. Для всех коэффициентов уплотнения временной области, которые сравниваются, число коэффициентов уплотнения временной области, которые больше чем или равны соответствующим коэффициентам уплотнения области преобразования, предоставляется как K T .
В уравнении (10b) каждый коэффициент C M (i) уплотнения области преобразования сравнивается с соответствующим коэффициентом C T (i) уплотнения временной области, для i = 1, ..., N и C M (i)≤τ. Для всех коэффициентов уплотнения области преобразования, которые сравниваются, число коэффициентов уплотнения области преобразования, которые больше чем или равны соответствующим коэффициентам уплотнения временной области, предоставляется как К М .
Блок 332 может определять параметры ΔT и ΔM следующим образом:
Figure 00000015
уравнение (11a)
Figure 00000016
уравнение (11b)
K T служит признаком того, сколько раз C T (i) соответствует или превышает C M (i), а ΔT служит признаком совокупной величины, на которую C T (i) превышает C M (i), когда C T (i)>C M (i). К М служит признаком того, сколько раз C M (i) соответствует или превышает C T (i), и ΔM служит признаком совокупной величины, на которую C M (i) превышает C T (i), когда C M (i)>C T (i).
Модуль 340 решения может принимать параметры KT , K M , Δ T и ΔM от блоков 330 и 332 и может выбирать либо кодер 136 временной области, либо кодер 138 области преобразования для текущего кадра. Модуль 340 решения может сохранять подсчет H T предысторий временной области и подсчет H M предысторий области преобразования. Подсчет H T предысторий временной области может быть увеличен каждый раз, когда кадр считается более разреженным во временной области, и уменьшен каждый раз, когда кадр считается более разреженным в области преобразования. Подсчет H M предысторий области преобразования может быть увеличен каждый раз, когда кадр считается более разреженным в области преобразования, и уменьшен каждый раз, когда кадр считается более разреженным во временной области.
Фиг.4A показывает графики примерного речевого сигнала во временной области и области преобразования, к примеру, области MDCT. В этом примере речевой сигнал имеет относительно немного больших значений во временной области, но много больших значений в области преобразования. Этот речевой сигнал более разрежен во временной области и может быть более эффективно кодирован на основе кодера 136 временной области.
Фиг.4B показывает графики примерного инструментального музыкального сигнала во временной области и области преобразования, к примеру области MDCT. В этом примере инструментальный музыкальный сигнал имеет много больших значений во временной области, но меньше больших значений в области преобразования. Этот инструментальный музыкальный сигнал более разрежен в области преобразования и может быть более эффективно кодирован на основе кодера 138 области преобразования.
Фиг.5A показывает график 510 для коэффициента C T (i) уплотнения временной области и график 512 для коэффициента C M (i) уплотнения области преобразования для речевого сигнала, показанного на Фиг.4A. Графики 510 и 512 указывают, что данный процент полной энергии может быть зафиксирован меньшим числом значений временной области, чем значений области преобразования.
Фиг.5B показывает график 520 для коэффициента C T (i) уплотнения временной области и график 522 для коэффициента C M (i) уплотнения области преобразования для инструментального музыкального сигнала, показанного на Фиг.4B. Графики 520 и 522 указывают, что данный процент полной энергии может быть зафиксирован меньшим числом значений области преобразования, чем значений временной области.
Фиг.6A и 6B показывают блок-схему последовательности операций схемы процесса 600 для выбора или кодера 136 временной области или кодера 138 области преобразования для аудиокадра. Процесс 600 может использоваться для детектора 116b разреженности на Фиг.3. В последующем описании, Z T1 и Z T2 - это пороговые значения, с которыми подсчет H T предысторий временной области сравнивается, а Z M1 , Z M2 , Z M3 - это пороговые значения, с которым подсчет H M предысторий области преобразования сравнивается. U T1 , U T2 и U T3 - это величины приращения для H T, когда выбран кодер 136 временной области, а U M1 , U M2 и U M3 - это величины приращения для H M, когда выбран кодер 138 области преобразования. Величины приращения могут быть одинаковыми или различными значениями. D T1 , D T2 и D T3 - это величины декремента для H T, когда выбран кодер 138 области преобразования, а D M1 , D M2 и D M3 - это величины декремента для H M, когда выбран кодер 136 временной области. Величины декремента могут быть одинаковыми или различными значениями. V 1 , V 2 , V 3 и V 4 - это пороговые значения, используемые, чтобы решать, обновлять ли или нет подсчеты H T и H M предысторий.
На Фиг.6A, аудиокадр, чтобы кодировать, первоначально принимается (этап 612). Совершается определение, являлся ли предыдущий аудиокадр кадром молчания или шумоподобным кадром сигнала (этап 614). Если ответ "Да", то подсчеты предысторий временной области и области преобразования сбрасываются как H T =0 и H M =0 (этап 616). Если ответ "Нет" для этапа 614 и также после этапа 616, параметры KT , К М , Δ T и ΔM вычисляются для текущего аудиокадра так, как описано выше (этап 618).
Затем совершается определение того, что K T М и H M <Z M1 (этап 620). Условие K T М может указывать, что текущий аудиокадр более разрежен во временной области, чем в области преобразования. Условие H M <Z M1 может указывать, что предшествующие аудиокадры не строго разрежены в области преобразования. Если ответ "Да" для этапа 620, то кодер 136 временной области выбирается для текущего аудиокадра (этап 622). Подсчеты предысторий могут затем быть обновлены на этапе 624 следующим образом:
H T =H T +U T1 и H M =H M -D M1 уравнение (12)
Если ответ "Нет" для этапа 620, то совершается определение того, что К М >K T и H M >Z M2 (этап 630). Условие К М >K T может указывать, что текущий аудиокадр более разрежен в области преобразования, чем временной области. Условие H M >Z M2 может указывать, что предшествующие аудиокадры разрежены в области преобразования. Набор условий для этапа 630 помогает смещать решение к выбору кодера 138 временной области более часто. Второе условие на этапе может быть заменено H T >Z T1, чтобы совпасть с этапом 620. Если ответ "Да" для этапа 630, то кодер 138 области преобразования выбирается для текущего аудиокадра (этап 632). Подсчеты предысторий могут затем быть обновлены на этапе 634 следующим образом:
H M =H M +U M1 и H T =H T -D T1 уравнение (13).
После этапов 624 и 634 процесс завершается. Если ответ "Нет" для этапа 630, то процесс переходит к Фиг.6B.
Фиг.6B может быть достигнут, если K T М или если условия подсчета предысторий на этапах 620 и/или 630 не удовлетворяются. Первоначально совершается определение того, что ΔM T и H M >Z M2 (этап 640). Условие ΔM T может указывать, что текущий аудиокадр более разрежен в области преобразования, чем во временной области. Если ответ "Да" для этапа 640, то кодер 138 области преобразования выбирается для текущего аудиокадра (этап 642). Затем совершается определение того, что (ΔMT )>V 1 (этап 644). Если ответ "Да", то подсчеты предысторий могут быть обновлены на этапе 646 следующим образом:
H M =H M +U M2 и H T =H T -D T2 уравнение (14)
Если ответ "Нет" на этапе 640, то совершается определение того, что ΔM T и H T >Z T1 (этап 650). Если ответ "Да" для этапа 650, то кодер 136 временной области выбирается для текущего аудиокадра (этап 652). Затем совершается определение того, что (ΔT M )>V 2 (этап 654). Если ответ "Да", то подсчеты предысторий могут быть обновлены на этапе 656 следующим образом:
H T =H T +U T2 и H M =H M -D M2 уравнение (15)
Если ответ "Нет" для этапа 650, то совершается определение того, что ΔTM и H T >Z T2 (этап 660). Условие ΔT M может указывать, что текущий аудиокадр более разрежен во временной области, чем области преобразования. Если ответ "Да" для этапа 660, то кодер 136 временной области выбирается для текущего аудиокадра (этап 662). Затем совершается определение того, что (ΔTM )>V 3 (этап 664). Если ответ "Да", то подсчеты предысторий могут быть обновлены на этапе 666 следующим образом:
H T =H T +U T3 и H M =H M -D M3 уравнение (16)
Если ответ "Нет" для этапа 660, то совершается определение того, что ΔTM и H M >Z M3 (этап 670). Если ответ "Да" для этапа 670, то кодер 138 области преобразования выбирается для текущего аудиокадра (этап 672). Затем совершается определение того, что (ΔMT)>V 4 (этап 674). Если ответ "Да", то подсчеты предысторий могут быть обновлены на этапе 676 следующим образом:
H M=H M +U M3 и H T =H T -D T3 уравнение (17)
Если ответ "Нет" для этапа 670, то кодер по умолчанию может быть выбран для текущего аудиокадра (этап 682). Кодер по умолчанию может быть кодером, используемым в предыдущем аудиокадре, указанным кодером (к примеру, или кодером 136 временной области или кодером 138 области преобразования) и т.д.
Различные пороговые значения используются в процессе 600, чтобы предоставлять возможность настройки выбора кодера 136 временной области или кодера 138 области преобразования. Пороговые значения могут быть выбраны, чтобы предпочесть один кодер другому кодеру в определенных ситуациях. В одной примерной схеме, Z M1 =Z M2 =Z T1 =Z T2 =4, U T1 =U M1 =2, D T1 =D M1 =1, V 1 =V 2 =V 3 =V 4=1 и U M2 =D T2 =1. Другие пороговые значения также могут использоваться для процесса 600.
Фиг.2-6B показывают несколько схем детектора 116 разреженности на Фиг.1. Обнаружение разреженности также может быть выполнено другими способами, к примеру с другими параметрами. Детектор разреженности может быть разработан со следующими целями:
- Обнаружение разреженности на основе характеристик сигнала, чтобы выбирать кодер 136 временной области или кодер 138 области преобразования.
- Хорошее обнаружение разреженности для кадров вокализованных речевых сигналов, к примеру низкая вероятность выбора кодера 138 области преобразования для кадра вокализованных речевых сигналов.
- Для аудиокадров, извлеченных из музыкальных инструментов, таких как скрипка, кодер 138 области преобразования должен быть выбран в течение высокого процентного отношения по времени.
- Минимизация частых переключений между кодером 136 временной области и кодером 138 области преобразования, чтобы уменьшить артефакты.
- Низкая сложность и предпочтительно операция без обратной связи.
- Надежная производительность через различные характеристики сигнала и условия шума.
Фиг.7 показывает блок-схему последовательности операций процесса 700 для кодирования входного сигнала (к примеру, аудиосигнала) с обобщенным кодером. Характеристики входного сигнала могут быть определены на основе, по меньшей мере, одного детектора, который может содержать детектор активности сигналов, детектор шумоподобных сигналов, детектор разреженности, какой-либо другой детектор или их комбинацию (этап 712). Кодер может быть выбран из числа нескольких кодеров на основе характеристик входного сигнала (этап 714). Несколько кодеров могут содержать кодер молчания, кодер шумоподобных сигналов (к примеру, NELP-кодер), кодер временной области (к примеру, CELP-кодер), по меньшей мере, один кодер области преобразования (к примеру, MDCT-кодер), какой-либо другой кодер или их комбинацию. Входной сигнал может быть кодирован на основе выбранного кодера (этап 716).
Для этапов 712 и 714, может быть обнаружена активность во входном сигнале, и кодер молчания может быть выбран, если активность не обнаружена во входном сигнале. Имеет ли входной сигнал характеристики шумоподобного сигнала, может быть определено, и кодер шумоподобных сигналов может быть выбран, если входной сигнал имеет характеристики шумоподобного сигнала. Разреженность входного сигнала во временной области и, по меньшей мере, одна область преобразования для, по меньшей мере, одного кодера области преобразования может быть определена. Кодер временной области может быть выбран, если входной сигнал считается более разреженным во временной области, чем, по меньшей мере, одной области преобразования. Один из, по меньшей мере, одного кодера области преобразования может быть выбран, если входной сигнал считается более разреженным в соответствующей области преобразования, чем временной области и других областях преобразования, если они имеют место. Обнаружение сигнала и выбор кодера могут быть выполнены в различном порядке.
Входной сигнал может содержать последовательность кадров. Характеристики каждого кадра могут быть определены, и кодер может быть выбран для кадра на основе его характеристик сигнала. Каждый кадр может быть кодирован на основе кодера, выбранного для этого кадра. Конкретный кодер может быть выбран для данного кадра, если этот кадр и предварительно определенное число предшествующих кадров указывают переключение на этот конкретный кодер. В общем, выбор кодера для каждого кадра может быть основан на любых параметрах.
Фиг.8 показывает блок-схему последовательности операций процесса 800 для кодирования входного сигнала, к примеру, аудиосигнала. Разреженность входного сигнала в каждой из нескольких областей может быть определена, к примеру, на основе любой из схем, описанных выше (этап 812). Кодер может быть выбран из числа нескольких кодеров на основе разреженности входного сигнала в нескольких областях (этап 814). Входной сигнал может быть кодирован на основе выбранного кодера (этап 816).
Несколько областей могут содержать временную область и, по меньшей мере, одну область преобразования, к примеру частотную область. Разреженность входного сигнала во временной области и, по меньшей мере, одной области преобразования может быть определена на основе любого из параметров, описанных выше, одного или более подсчетов предысторий, которые могут быть обновлены на основе предшествующих выборов кодера временной области и предшествующих выборов, по меньшей мере, одного кодера области преобразования, и т.д. Кодер временной области может быть выбран, чтобы кодировать входной сигнал во временной области, если входной сигнал определен как более разреженный во временной области, чем, по меньшей мере, одной области преобразования. Один из, по меньшей мере, одного кодера области преобразования может быть выбран, чтобы кодировать входной сигнал в соответствующей области преобразования, если входной сигнал определен как разреженный в этой области преобразования, чем временной области и других областях преобразования, если они имеют место.
Фиг.9 показывает блок-схему последовательности операций процесса 900 для выполнения обнаружения разреженности. Первый сигнал в первой области может быть преобразован (к примеру, на основе MDCT), чтобы получить второй сигнал во второй области (этап 912). Первый сигнал может быть получен выполнением кодирования с линейным предсказанием (LPC) для входного аудиосигнала. Первая область может быть временной областью, а вторая область может быть областью преобразования, к примеру, частотной областью. Первый и второй параметры могут быть определены на основе первого и второго сигналов, к примеру, на основе энергии значений/компонентов в первом и втором сигналах (этап 914). По меньшей мере, один подсчет может быть определен на основе предшествующих объявлений первого сигнала более разреженным и предшествующих объявлений второго сигнала более разреженным (этап 916). Является ли первый сигнал или второй сигнал более разреженным, может быть определено на основе первого и второго параметров и, по меньшей мере, одного подсчета, если он используется (этап 918).
Для схемы, показанной на Фиг.2, первый параметр может соответствовать минимальному числу значений (N T ) в первом сигнале, содержащих, по меньшей мере, конкретный процент полной энергии первого сигнала. Второй параметр может соответствовать минимальному числу значений (NM ) во втором сигнале, содержащих, по меньшей мере, конкретный процент полной энергии второго сигнала. Первый сигнал может считаться более разреженным на основе первого параметра, меньшего, чем второй параметр, на первое пороговое значение, к примеру, как показано в уравнении (9a). Второй сигнал может считаться более разреженным на основе второго параметра, меньшего, чем первый параметр, на второе пороговое значение, к примеру, как показано в уравнении (9b). Третий параметр (к примеру, C T (i)), служащий признаком накопленной энергии первого сигнала, может быть определен. Четвертый параметр (к примеру, C M (i)), служащий признаком накопленной энергии второго сигнала, также может быть определен. Является ли первый сигнал или второй сигнал более разреженным, может быть определено дополнительно на основе третьего и четвертого параметров.
Для схемы, показанной в Фиг.3, 6A и 6B, может быть определена первая функция накопленной энергии (к примеру, C T (i)) для первого сигнала и вторая функция накопленной энергии (к примеру, C M (i)) для второго сигнала. Число раз, когда первая функция накопленной энергии соответствует или превышает вторую функцию накопленной энергии, может быть предоставлено как первый параметр (к примеру, K T ). Число раз, когда вторая функция накопленной энергии соответствует или превышает первую функцию накопленной энергии, может быть предоставлено как второй параметр (к примеру, К М ). Первый сигнал может считаться более разреженным на основе первого параметра, большего, чем второй параметр. Второй сигнал может считаться более разреженным на основе второго параметра, большего, чем первый параметр. Третий параметр (к примеру, ΔT) может быть определен на основе случаев, в которых первая функция накопленной энергии превышает вторую функцию накопленной энергии, к примеру, как показано в уравнении (11a). Четвертый параметр (к примеру, ΔM) может быть определен на основе случаев, в которых вторая функция накопленной энергии превышает первую функцию накопленной энергии, к примеру, как показано в уравнении (11b). Является ли первый сигнал или второй сигнал более разреженным, может быть определено дополнительно на основе третьего и четвертого параметров.
Для обеих схем может быть увеличен первый подсчет (к примеру, H T), и второй подсчет (к примеру, H M ) может быть уменьшен для каждого объявления первого сигнала более разреженным. Первый подсчет может быть уменьшен, а второй подсчет может быть увеличен для каждого объявления второго сигнала более разреженным. Является ли первый сигнал или второй сигнал более разреженным, может быть определено дополнительно на основе первого и второго подсчетов.
Несколько кодеров может использоваться, чтобы кодировать аудиосигнал, как описано выше. Информация о том, как кодирован аудиосигнал, может быть отправлена по-разному. В одной схеме каждый кодированный кадр включает в себя информацию о кодере/кодировании, которая указывает конкретный кодер, используемый для этого кадра. В другой схеме кодированный кадр включает в себя информацию о кодере, только если кодер, используемый для этого кадра, отличается от кодера, используемого для предыдущего кадра. В этой схеме информация о кодере отправляется только каждый раз, когда совершается переключение в кодере, и информация не отправляется, если тот же самый кодер используется. В общем, кодер может включать в себя символы/биты в кодированной информации, которая сообщает декодеру, какой кодер выбран. Альтернативно, эта информация может быть передана отдельно с использованием побочного канала.
Фиг.10 показывает блок-схему схемы обобщенного аудиодекодера 1000, который допускает декодирование аудиосигнала, кодируемого с обобщенным аудиокодером 100 на Фиг.1. Аудиодекодер 1000 включает в себя селектор 1020, набор конкретных для класса сигналов аудиодекодеров 1030 и мультиплексор 1040.
В рамках селектора 1020 этап 1022 может принимать кодированный аудиокадр и определять, является ли принимаемый кадр кадром молчания, к примеру, на основе информации о кодере, включенной в кадр. Если принимаемый кадр является кадром молчания, то декодер 1032 молчания может декодировать принимаемый кадр и предоставить декодированный кадр. Иначе, этап 1024 может определять, является ли принимаемый кадр кадром шумоподобного сигнала. Если ответ "Да", то декодер 1034 шумоподобных сигналов может декодировать принимаемый кадр и предоставить декодированный кадр. Иначе, этап 1026 может определять, является ли принимаемый кадр кадром временной области. Если ответ "Да", то декодер 1036 временной области может декодировать принимаемый кадр и предоставить декодированный кадр. Иначе, декодер 1038 области преобразования может декодировать принимаемый кадр и предоставить декодированный кадр. Декодеры 1032, 1034, 1036 и 1038 могут выполнять декодирование способом, комплементарным кодированию, выполненному кодерами 132, 134, 136 и 138, соответственно, в рамках обобщенного аудиокодера 100 на Фиг.1. Мультиплексор 1040 может принимать выводы декодеров 1032, 1034, 1036 и 1038 и может предоставлять вывод одного декодера как декодированный кадр. Различные декодеры 1032, 1034, 1036 и 1038 могут быть выбраны в различных интервалах времени на основе характеристик аудиосигнала.
Фиг.10 показывает конкретную схему обобщенного аудиодекодера 1000. В общем, обобщенный аудиодекодер может включать в себя любое число декодеров и любой тип декодера, который может быть расположен по-разному. Фиг.10 показывает один примерный набор декодеров в одной примерной компоновке. Обобщенный аудиодекодер может включать в себя меньшее количество, большее количество и/или другие декодеры, которые могут быть расположены другими способами.
Методики кодирования и декодирования, описанные в данном документе, могут использоваться для связи, вычисления, организации сетей, персональной электроники и т.д. Например, методики могут использоваться для устройств беспроводной связи, карманных устройств, игровых устройств, вычислительных устройств, бытовых электронных устройств, персональных компьютеров и т.д. Примерное использование методик для устройства беспроводной связи описывается ниже.
Фиг.11 показывает блок-схему схемы устройства 1100 беспроводной связи в системе беспроводной связи. Беспроводное устройство 1100 может быть сотовым телефоном, терминалом, телефонной трубкой, персональным цифровым устройством (PDA), беспроводным модемом, беспроводным телефоном и т.д. Система беспроводной связи может быть системой с множественным доступом с кодовым разделением каналов (CDMA), глобальной системой мобильной связи (GSM) и т.д.
Беспроводное устройство 1100 допускает предоставление двунаправленной связи через путь приема и путь передачи. В пути приема сигналы, передаваемые базовыми станциями, принимаются антенной 1112 и предоставляются в приемник (RCVR) 1114. Приемник 1114 приводит в определенное состояние и оцифровывает принимаемый сигнал и предоставляет выборки в цифровой участок 1120 для дальнейшей обработки. В пути передачи передатчик (TMTR) 1116 принимает данные, которые должны быть переданы из цифрового участка 1120, обрабатывает и приводит в определенное состояние данные и формирует модулированный сигнал, который передается через антенну 1112 в базовые станции. Приемник 1114 и передатчик 1116 могут быть частью приемопередатчика, который может поддерживать CDMA, GSM и т.д.
Цифровой участок 1120 включает в себя различные блоки обработки, интерфейса и запоминающие устройства, такие как, например, модемный процессор 1122, компьютер с сокращенным набором команд/процессор (RISC/DSP) 1124 цифровых сигналов, контроллер/процессор 1126, внутреннее запоминающее устройство 1128, обобщенный аудиокодер 1132, обобщенный аудиодекодер 1134, графический/дисплейный процессор 1136 и интерфейс (EBI) 1138 внешней шины. Модемный процессор 1122 может выполнять обработку для передачи и приема данных, к примеру, кодирование, модуляцию, демодуляцию и декодирование. RISC/DSP 1124 может выполнять общую и специализированную обработку для беспроводного устройства 1100. Контроллер/процессор 1126 может направлять работу различных блоков обработки и интерфейса в пределах цифрового участка 1120. Внутреннее запоминающее устройство 1128 может хранить данные и/или инструкции для различных блоков в пределах цифрового участка 1120.
Обобщенный аудиокодер 1132 может выполнять кодирование для входных сигналов из звукового источника 1142, микрофона 1143 и т.д. Обобщенный аудиокодер 1132 может быть реализован так, как показано на Фиг.1. Обобщенный аудиодекодер 1134 может выполнять декодирование для кодированных аудиоданных и может предоставлять выходные сигналы в динамик/наушники 1144. Обобщенный аудиодекодер 1134 может быть реализован так, как показано на Фиг.10. Графический/дисплейный процессор 1136 может выполнять обработку для графики, видео, изображений и текстов, которые могут быть представлены на блок 1146 отображения. EBI 1138 может упростить перемещение данных между цифровым участком 1120 и основным запоминающим устройством 1148.
Цифровой участок 1120 может быть реализован с одним или более процессоров, DSP, микропроцессоров, RISC и т.д. Цифровой участок 1120 также может быть изготовлен на одной или более специализированных интегральных схем (ASIC) и/или каком-либо другом типе интегральных схем (IC).
В общем, любое устройство, описанное в данном документе, может представлять различные типы устройств, таких как беспроводной телефон, сотовый телефон, портативный компьютер, беспроводное мультимедийное устройство, плата персонального компьютера (PC) для беспроводной связи, PDA, внешний или внутренний модем, устройство, которое обменивается данными через беспроводной канал, и т.д. Устройство может иметь различные названия, например терминал (AT) доступа, блок доступа, абонентский блок, мобильная станция, мобильное устройство, мобильный блок, мобильный телефон, мобильный, удаленная станция, удаленный терминал, удаленный блок, пользовательское устройство, пользовательское оборудование, карманное устройство и т.д. Любое устройство, описанное в данном документе, может иметь запоминающее устройство для хранения инструкций и данных, а также аппаратные средства, программное обеспечение, микропрограммное обеспечение или их комбинации.
Методики кодирования и декодирования, описанные в данном документе (к примеру, кодер 100 на Фиг.1, детектор 116a разреженности на Фиг.2, детектор 116b разреженности на Фиг.3, декодер 1000 на Фиг.10 и т.д.), могут быть реализованы различными средствами. Например, эти методики могут быть реализованы в аппаратных средствах, микропрограммном обеспечении, программном обеспечении или их комбинации. При реализации в аппаратных средствах блоки обработки, используемые, чтобы выполнять методики, могут быть реализованы в одной или более ASIC, DSP, устройствах (DSPD) цифровой обработки сигналов, программируемых логических устройствах (PLD), программируемых пользователем вентильных матриц (FPGA), процессорах, контроллерах, микроконтроллерах, микропроцессорах, электронных устройствах, других электронных блоках, предназначенных, чтобы выполнять описанные в данном документе функции, или их комбинацию.
Для реализации микропрограммного обеспечения и/или программного обеспечения, методики могут быть осуществлены как инструкции на считываемом процессором носителе, таком как оперативное запоминающее устройство (RAM), постоянное запоминающее устройство (ROM), энергонезависимое оперативное запоминающее устройство (NVRAM), программируемое постоянное запоминающее устройство (PROM), электрически стираемое PROM (EEPROM), флэш-память, компакт-диск, магнитные или оптические устройства хранения данных и т.д. Инструкции могут быть исполнимыми одним или более процессорами и могут побуждать процессор(ы) выполнять определенные аспекты функциональности, описанной в данном документе.
Предшествующее описание раскрытия сущности предоставлено, чтобы дать возможность любому специалисту в данной области техники создавать или использовать раскрытие сущности. Различные модификации в раскрытие сущности должны быть очевидными для специалистов в данной области техники, а описанные в данном документе общие принципы могут быть применены к другим вариантам без отступления от сущности и объема раскрытия сущности. Таким образом, раскрытие сущности не предназначено, чтобы быть ограниченным описанными в данном документе примерами, а должно удовлетворять самому широкому объему, согласованному с принципами и новыми признаками, раскрытыми в данном документе.

Claims (43)

1. Устройство для кодирования сигнала, содержащее:
по меньшей мере, один процессор, выполненный с возможностью определять разреженность входного сигнала, по меньшей мере, во временной области и области преобразования на основе множества параметров входного сигнала, сравнивать разреженность входного сигнала во временной области с разреженностью входного сигнала в области преобразования, выбирать кодер из, по меньшей мере, кодера временной области и кодера области преобразования на основе сравнения, и кодировать входной сигнал на основе выбранного кодера; и
запоминающее устройство, соединенное с, по меньшей мере, одним процессором.
2. Устройство по п.1, в котором входной сигнал - это аудиосигнал.
3. Устройство по п.1, дополнительно содержащее кодер молчания, в котором, по меньшей мере, один процессор выполнен с возможностью обнаруживать активность во входном сигнале и выбирать кодер молчания, если активность не обнаружена во входном сигнале.
4. Устройство по п.1, дополнительно содержащее кодер шумоподобных сигналов, в котором, по меньшей мере, один процессор выполнен с возможностью определять, имеет ли входной сигнал характеристики шумоподобного сигнала, и выбирать кодер шумоподобных сигналов, если входной сигнал имеет характеристики шумоподобного сигнала.
5. Устройство по п.4, в котором кодер шумоподобных сигналов содержит кодер с линейным предсказанием с шумовым возбуждением (NELP).
6. Устройство по п.1, в котором кодер временной области содержит кодер с линейным предсказанием с кодовым возбуждением (CELP), и кодер области преобразования содержит кодер с модифицированным дискретным косинусным преобразованием (MDCT).
7. Устройство по п.1, в котором входной сигнал содержит последовательность кадров, и в котором, по меньшей мере, один процессор выполнен с возможностью определять характеристики каждого кадра в последовательности, выбирать кодер для каждого кадра на основе определенных характеристик кадра и кодировать каждый кадр на основе кодера, выбранного для кадра.
8. Устройство по п.7, в котором, по меньшей мере, один процессор выполнен с возможностью выбирать конкретный кодер для конкретного кадра, если конкретный кадр и предварительно определенное число предшествующих кадров указывают переключение на конкретный кодер.
9. Устройство по п.1, в котором устройство - это мобильный телефон.
10. Устройство по п.1, в котором устройство - это мобильный телефон, содержащий приемопередатчик множественного доступа с кодовым разделением каналов (CDMA).
11. Способ кодирования сигнала, содержащий этапы, на которых:
определяют разреженность входного сигнала, по меньшей мере, во временной области и области преобразования на основе множества параметров входного сигнала;
сравнивают разреженность входного сигнала во временной области с разреженностью входного сигнала в области преобразования;
выбирают кодер из, по меньшей мере, кодера временной области и кодера области преобразования на основе сравнения; и
кодируют входной сигнал на основе выбранного кодера.
12. Способ по п.11, дополнительно содержащий обнаружение активности во входном сигнале, и при этом выбор кодера дополнительно содержит выбор кодера молчания, если активность не обнаружена во входном сигнале.
13. Способ по п.11, дополнительно содержащий определение, имеет ли входной сигнал характеристики шумоподобного сигнала, и при этом выбор кодера дополнительно содержит выбор кодера шумоподобных сигналов, если входной сигнал имеет характеристики шумоподобного сигнала.
14. Устройство для кодирования сигнала, содержащее:
средство для определения разреженности входного сигнала, по меньшей мере, во временной области и области преобразования на основе множества параметров входного сигнала;
средство для сравнения разреженности входного сигнала во временной области с разреженностью входного сигнала в области преобразования;
средство для выбора кодера из, по меньшей мере, кодера временной области и кодера области преобразования на основе сравнения; и
средство для кодирования входного сигнала на основе выбранного кодера.
15. Устройство по п.14, дополнительно содержащее средство для обнаружения активности во входном сигнале и в котором средство для выбора кодера дополнительно содержит средство для выбора кодера молчания, если активность не обнаружена во входном сигнале.
16. Устройство по п.14, дополнительно содержащее средство для определения имеет ли входной сигнал характеристики шумоподобного сигнала, и в котором средство для выбора кодера дополнительно содержит средство для выбора кодера шумоподобных сигналов, если входной сигнал имеет характеристики шумоподобного сигнала.
17. Считываемый процессором носитель для хранения инструкций, чтобы:
определять разреженность входного сигнала, по меньшей мере, во временной области и области преобразования на основе множества параметров входного сигнала;
сравнивать разреженность входного сигнала во временной области с разреженностью входного сигнала в области преобразования;
выбирать кодер из, по меньшей мере, кодера временной области и кодера области преобразования на основе сравнения; и
кодировать входной сигнал на основе выбранного кодера.
18. Устройство для кодирования сигнала, содержащее:
по меньшей мере, один процессор, выполненный с возможностью определять разреженность входного сигнала во временной области и области преобразования, выбирать кодер из числа нескольких кодеров на основе разреженности входного сигнала во временной области и области преобразования и кодировать входной сигнал на основе выбранного кодера; и
запоминающее устройство, соединенное с, по меньшей мере, одним процессором.
19. Устройство по п.18, в котором, по меньшей мере, один процессор выполнен с возможностью выбирать кодер временной области, чтобы кодировать входной сигнал во временной области, если входной сигнал определен как более разреженный во временной области, чем в области преобразования, и выбирать кодер в области преобразования, чтобы кодировать входной сигнал в области преобразования, если входной сигнал определен как более разреженный в области преобразования, чем во временной области.
20. Устройство по п.18, в котором, по меньшей мере, один процессор выполнен с возможностью определять первый параметр, служащий признаком разреженности входного сигнала во временной области, определять второй параметр, служащий признаком разреженности входного сигнала в области преобразования, выбирать кодер временной области, если первый и второй параметры указывают входной сигнал более разреженный во временной области, чем в области преобразования, и выбирать кодер области преобразования, если первый и второй параметры указывают входной сигнал более разреженный в области преобразования, чем во временной области.
21. Устройство по п.20, в котором, по меньшей мере, один процессор выполнен с возможностью определять, по меньшей мере, один подсчет на основе предшествующих выборов кодера временной области и предшествующих выборов кодера области преобразования и выбирать кодер временной области или кодер области преобразования дополнительно на основе, по меньшей мере, одного подсчета.
22. Способ кодирования сигнала, содержащий этапы, на которых:
определяют разреженность входного сигнала во временной области и области преобразования;
выбирают кодер из числа нескольких кодеров на основе разреженности входного сигнала во временной области и области преобразования; и
кодируют входной сигнал на основе выбранного кодера.
23. Способ по п.22, в котором определение разреженности входного сигнала содержит этапы, на которых:
определяют первый параметр, служащий признаком разреженности входного сигнала во временной области, и
определяют второй параметр, служащий признаком разреженности входного сигнала в области преобразования, и
при этом выбор кодера содержит этапы, на которых:
выбирают кодер временной области, если первый и второй параметры указывают входной сигнал, являющийся более разреженным во временной области, чем в области преобразования, и
выбирают кодер области преобразования, если первый и второй параметры указывают входной сигнал, являющийся более разреженным в области преобразования, чем во временной области.
24. Способ по п.23, дополнительно содержащий этап, на котором:
определяют, по меньшей мере, один подсчет на основе предшествующих выборов кодера временной области и предшествующих выборов кодера области преобразования, и
при этом выбор кодера содержит выбор кодера временной области или кодера области преобразования дополнительно на основе, по меньшей мере, одного подсчета.
25. Устройство для кодирования сигнала, содержащее:
по меньшей мере, один процессор, выполненный с возможностью преобразовывать первый сигнал во временной области, чтобы получить второй сигнал в области преобразования, определять первый и второй параметры на основе значений энергии первого и второго сигналов и определять, является ли первый сигнал или второй сигнал более разреженным, на основе первого и второго параметров; и
запоминающее устройство, соединенное с, по меньшей мере, одним процессором.
26. Устройство по п.25, в котором, по меньшей мере, один процессор выполнен с возможностью преобразовывать первый сигнал на основе модифицированного дискретного косинусного преобразования (MDCT), чтобы получать второй сигнал.
27. Устройство по п.25, в котором, по меньшей мере, один процессор выполнен с возможностью выполнять кодирование с линейным предсказанием (LPC) на входном сигнале, чтобы получать остатки в первом сигнале, преобразовывать остатки в первом сигнале, чтобы получать коэффициенты во втором сигнале, определять значения энергии для остатков в первом сигнале, определять значения энергии для коэффициентов во втором сигнале и определять первый и второй параметры на основе значений энергии для остатков и значений энергии для коэффициентов.
28. Устройство по п.25, в котором, по меньшей мере, один процессор выполнен с возможностью определять первый параметр на основе минимального числа значений в первом сигнале, содержащих, по меньшей мере, конкретный процент полной энергии первого сигнала, и определять второй параметр, на основе минимального числа значений во втором сигнале, содержащих, по меньшей мере, конкретный процент полной энергии второго сигнала.
29. Устройство по п.28, в котором, по меньшей мере, один процессор выполнен с возможностью определять, что первый сигнал более разрежен, на основе первого параметра, меньшего, чем второй параметр по первому пороговому значению, и определять, что второй сигнал более разрежен, на основе второго параметра, меньшего, чем первый параметр по второму пороговому значению.
30. Устройство по п.28, в котором, по меньшей мере, один процессор выполнен с возможностью определять третий параметр, служащий признаком накопленной энергии первого сигнала, определять четвертый параметр, служащий признаком накопленной энергии второго сигнала, и определять, является ли первый сигнал или второй сигнал более разреженным, дополнительно на основе третьего и четвертого параметров.
31. Устройство по п.25, в котором, по меньшей мере, один процессор выполнен с возможностью определять первую функцию накопленной энергии для первого сигнала, определять вторую функцию накопленной энергии для второго сигнала, определять первый параметр на основе числа раз, когда первая функция накопленной энергии соответствует или превышает вторую функцию накопленной энергии, и определять второй параметр на основе числа раз, когда вторая функция накопленной энергии соответствует или превышает первую функцию накопленной энергии.
32. Устройство по п.31, в котором, по меньшей мере, один процессор выполнен с возможностью определять, что первый сигнал более разрежен, на основе первого параметра, большего, чем второй параметр, и определять, что второй сигнал более разрежен, на основе второго параметра, большего, чем первый параметр.
33. Устройство по п.31, в котором, по меньшей мере, один процессор выполнен с возможностью определять третий параметр на основе случаев, в которых первая функция накопленной энергии превышает вторую функцию накопленной энергии, определять четвертый параметр на основе случаев, в которых вторая функция накопленной энергии превышает первую функцию накопленной энергии, и определять, является ли первый сигнал или второй сигнал более разреженным, дополнительно на основе третьего и четвертого параметров.
34. Устройство по п.25, в котором, по меньшей мере, один процессор выполнен с возможностью определять, по меньшей мере, один подсчет на основе предшествующих объявлений первого сигнала более разреженным и предшествующих объявлений второго сигнала более разреженным, и определять, является ли первый сигнал или второй сигнал более разреженным, дополнительно на основе, по меньшей мере, одного подсчета.
35. Устройство по п.25, в котором, по меньшей мере, один процессор выполнен с возможностью увеличивать первый подсчет и уменьшать второй подсчет для каждого объявления первого сигнала более разреженным, уменьшать первый подсчет и увеличивать второй подсчет для каждого объявления второго сигнала более разреженным и определять, является ли первый сигнал или второй сигнал более разреженным на основе первого и второго подсчетов.
36. Способ кодирования сигнала, содержащий этапы, на которых:
преобразуют первый сигнал во временной области, чтобы получить
второй сигнал в области преобразования;
определяют первый и второй параметры на основе значений энергии первого и второго сигналов; и
определяют, является ли первый сигнал или второй сигнал более разреженным на основе первого и второго параметров.
37. Способ по п.36, в котором определение первого и второго параметров содержит этапы, на которых:
определяют первый параметр на основе минимального числа значений в первом сигнале, содержащих, по меньшей мере, конкретный процент полной энергии первого сигнала, и
определяют второй параметр на основе минимального числа значений во втором сигнале, содержащих, по меньшей мере, конкретный процент полной энергии второго сигнала.
38. Способ по п.36, дополнительно содержащий этапы, на которых:
определяют первую функцию накопленной энергии для первого сигнала; и
определяют вторую функцию накопленной энергии для второго сигнала, и в котором определение первого и второго параметров содержит этапы, на которых:
определяют первый параметр на основе числа раз, когда первая функция накопленной энергии соответствует или превышает вторую функцию накопленной энергии, и
определяют второй параметр на основе числа раз, когда вторая функция накопленной энергии соответствует или превышает первую функцию накопленной энергии.
39. Способ по п.38, дополнительно содержащий этапы, на которых:
определяют третий параметр на основе случаев, в которых первая функция накопленной энергии превышает вторую функцию накопленной энергии; и
определяют четвертый параметр на основе случаев, в которых вторая функция накопленной энергии превышает первую функцию накопленной энергии, и при этом является ли первый сигнал или второй сигнал более разреженным определяют дополнительно на основе третьего и четвертого параметров.
40. Способ по п.36, дополнительно содержащий этап, на котором:
определяют, по меньшей мере, один подсчет на основе предшествующих объявлений первого сигнала более разреженным и предшествующих объявлений второго сигнала более разреженным, и в котором является ли первый сигнал или второй сигнал более разреженным определяют дополнительно на основе, по меньшей мере, одного подсчета.
41. Устройство для кодирования сигнала, содержащее:
по меньшей мере, один процессор, выполненный с возможностью определять, был ли использован кодер временной области или кодер области преобразования для формирования кодированного сигнала, и декодировать кодированный сигнал на основе декодера, комплементарного кодеру, используемому для формирования кодированного сигнала, при этом для формирования кодированного сигнала был использован кодер временной области, если было определено, что входной сигнал был более разреженным во временной области, чем в области преобразования, и при этом для формирования кодированного сигнала был использован кодер области преобразования, если было определено, что входной сигнал был более разреженным в области преобразования, чем во временной области; и
запоминающее устройство, соединенное с, по меньшей мере, одним процессором.
42. Устройство по п.41, в котором, по меньшей мере, один процессор выполнен с возможностью определять кодер, используемый, чтобы формировать кодированный сигнал, на основе информации о кодере, отправленной с кодированным сигналом.
43. Способ декодирования кодированного сигнала, содержащий этапы, на которых:
определяют, был ли использован кодер временной области или кодер области преобразования для формирования кодированного сигнала, при этом для формирования кодированного сигнала был использован кодер временной области, если было определено, что входной сигнал был более разреженный во временной области, чем в области преобразования, и при этом для формирования кодированного сигнала был использован кодер области преобразования, если было определено, что входной сигнал более разреженный в области преобразования, чем во временной области; и
декодируют кодированный сигнал на основе декодера, комплементарного кодеру, используемому, чтобы формировать кодированный сигнал.
RU2009117663A 2006-10-10 2007-10-08 Способ и устройство для кодирования и декодирования аудиосигналов RU2426179C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US82881606P 2006-10-10 2006-10-10
US60/828,816 2006-10-10
US94298407P 2007-06-08 2007-06-08
US60/942,984 2007-06-08

Publications (2)

Publication Number Publication Date
RU2009117663A RU2009117663A (ru) 2010-11-20
RU2426179C2 true RU2426179C2 (ru) 2011-08-10

Family

ID=38870234

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2009117663A RU2426179C2 (ru) 2006-10-10 2007-10-08 Способ и устройство для кодирования и декодирования аудиосигналов

Country Status (10)

Country Link
US (1) US9583117B2 (ru)
EP (2) EP2458588A3 (ru)
JP (1) JP5096474B2 (ru)
KR (1) KR101186133B1 (ru)
CN (1) CN101523486B (ru)
BR (1) BRPI0719886A2 (ru)
CA (1) CA2663904C (ru)
RU (1) RU2426179C2 (ru)
TW (1) TWI349927B (ru)
WO (1) WO2008045846A1 (ru)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070077652A (ko) * 2006-01-24 2007-07-27 삼성전자주식회사 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법
EP2198424B1 (en) * 2007-10-15 2017-01-18 LG Electronics Inc. A method and an apparatus for processing a signal
WO2009059633A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
EP2220646A1 (en) * 2007-11-06 2010-08-25 Nokia Corporation Audio coding apparatus and method thereof
WO2009059632A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
KR20100006492A (ko) * 2008-07-09 2010-01-19 삼성전자주식회사 부호화 방식 결정 방법 및 장치
AU2009267507B2 (en) * 2008-07-11 2012-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and discriminator for classifying different segments of a signal
KR101227729B1 (ko) * 2008-07-11 2013-01-29 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 샘플 오디오 신호의 프레임을 인코딩하기 위한 오디오 인코더 및 디코더
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
WO2010008173A2 (ko) * 2008-07-14 2010-01-21 한국전자통신연구원 오디오 신호의 상태결정 장치
KR101230183B1 (ko) * 2008-07-14 2013-02-15 광운대학교 산학협력단 오디오 신호의 상태결정 장치
KR20100007738A (ko) 2008-07-14 2010-01-22 한국전자통신연구원 음성/오디오 통합 신호의 부호화/복호화 장치
US10008212B2 (en) * 2009-04-17 2018-06-26 The Nielsen Company (Us), Llc System and method for utilizing audio encoding for measuring media exposure with environmental masking
CN102142924B (zh) * 2010-02-03 2014-04-09 中兴通讯股份有限公司 一种多用途语音频编码传输方法和装置
US9112591B2 (en) 2010-04-16 2015-08-18 Samsung Electronics Co., Ltd. Apparatus for encoding/decoding multichannel signal and method thereof
US9224398B2 (en) * 2010-07-01 2015-12-29 Nokia Technologies Oy Compressed sampling audio apparatus
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US20130066638A1 (en) * 2011-09-09 2013-03-14 Qnx Software Systems Limited Echo Cancelling-Codec
EP2761616A4 (en) * 2011-10-18 2015-06-24 Ericsson Telefon Ab L M IMPROVED METHOD AND DEVICE FOR AN ADAPTIVE MULTIRATE CODEC
SG11201503788UA (en) * 2012-11-13 2015-06-29 Samsung Electronics Co Ltd Method and apparatus for determining encoding mode, method and apparatus for encoding audio signals, and method and apparatus for decoding audio signals
BR112016007515B1 (pt) * 2013-10-18 2021-11-16 Telefonaktiebolaget Lm Ericsson (Publ) Método de codificação de segmento de sinal de áudio, codificador de segmento de sinal de áudio, e, terminal de usuário.
KR102354331B1 (ko) * 2014-02-24 2022-01-21 삼성전자주식회사 신호 분류 방법 및 장치, 및 이를 이용한 오디오 부호화방법 및 장치
CN107452390B (zh) * 2014-04-29 2021-10-26 华为技术有限公司 音频编码方法及相关装置
CN107424622B (zh) * 2014-06-24 2020-12-25 华为技术有限公司 音频编码方法和装置
EP2980797A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
US10186276B2 (en) * 2015-09-25 2019-01-22 Qualcomm Incorporated Adaptive noise suppression for super wideband music
KR101728047B1 (ko) 2016-04-27 2017-04-18 삼성전자주식회사 부호화 방식 결정 방법 및 장치
AU2021479158A1 (en) * 2021-12-15 2024-07-04 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive predictive encoding
CN113948085B (zh) * 2021-12-22 2022-03-25 中国科学院自动化研究所 语音识别方法、***、电子设备和存储介质

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5109417A (en) 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
CA2483322C (en) 1991-06-11 2008-09-23 Qualcomm Incorporated Error masking in a variable rate vocoder
KR0166722B1 (ko) * 1992-11-30 1999-03-20 윤종용 부호화 및 복호화방법 및 그 장치
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
TW271524B (ru) 1994-08-05 1996-03-01 Qualcomm Inc
KR100419545B1 (ko) * 1994-10-06 2004-06-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 다른코딩원리들을이용한전송시스템
JP3158932B2 (ja) * 1995-01-27 2001-04-23 日本ビクター株式会社 信号符号化装置及び信号復号化装置
JP3707116B2 (ja) 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
US5978756A (en) * 1996-03-28 1999-11-02 Intel Corporation Encoding audio signals using precomputed silence
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
GB2326572A (en) * 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
DE69819460T2 (de) 1997-07-11 2004-08-26 Koninklijke Philips Electronics N.V. Übertrager mit verbessertem sprachkodierer und dekodierer
ES2247741T3 (es) * 1998-01-22 2006-03-01 Deutsche Telekom Ag Metodo para conmutacion controlada por señales entre esquemas de codificacion de audio.
JP3273599B2 (ja) * 1998-06-19 2002-04-08 沖電気工業株式会社 音声符号化レート選択器と音声符号化装置
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
US6463407B2 (en) 1998-11-13 2002-10-08 Qualcomm Inc. Low bit-rate coding of unvoiced segments of speech
US6456964B2 (en) 1998-12-21 2002-09-24 Qualcomm, Incorporated Encoding of periodic speech using prototype waveforms
US6640209B1 (en) 1999-02-26 2003-10-28 Qualcomm Incorporated Closed-loop multimode mixed-domain linear prediction (MDLP) speech coder
JP2000267699A (ja) * 1999-03-19 2000-09-29 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
US6697430B1 (en) * 1999-05-19 2004-02-24 Matsushita Electric Industrial Co., Ltd. MPEG encoder
JP2000347693A (ja) * 1999-06-03 2000-12-15 Canon Inc オーディオ符号化復号化システム、符号化装置、復号化装置及びこれらの方法並びに記憶媒体
US6324505B1 (en) * 1999-07-19 2001-11-27 Qualcomm Incorporated Amplitude quantization scheme for low-bit-rate speech coders
US6397175B1 (en) 1999-07-19 2002-05-28 Qualcomm Incorporated Method and apparatus for subsampling phase spectrum information
US7039581B1 (en) * 1999-09-22 2006-05-02 Texas Instruments Incorporated Hybrid speed coding and system
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US6438518B1 (en) 1999-10-28 2002-08-20 Qualcomm Incorporated Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions
FR2802329B1 (fr) * 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
WO2001082293A1 (en) * 2000-04-24 2001-11-01 Qualcomm Incorporated Method and apparatus for predictively quantizing voiced speech
SE519981C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
US7085711B2 (en) * 2000-11-09 2006-08-01 Hrl Laboratories, Llc Method and apparatus for blind separation of an overcomplete set mixed signals
US7472059B2 (en) * 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
US6694293B2 (en) 2001-02-13 2004-02-17 Mindspeed Technologies, Inc. Speech coding system with a music classifier
US6785646B2 (en) * 2001-05-14 2004-08-31 Renesas Technology Corporation Method and system for performing a codebook search used in waveform coding
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
KR100748313B1 (ko) 2001-06-28 2007-08-09 매그나칩 반도체 유한회사 이미지센서의 제조방법
US6785645B2 (en) * 2001-11-29 2004-08-31 Microsoft Corporation Real-time speech and music classifier
JP4399185B2 (ja) * 2002-04-11 2010-01-13 パナソニック株式会社 符号化装置および復号化装置
JP4022111B2 (ja) * 2002-08-23 2007-12-12 株式会社エヌ・ティ・ティ・ドコモ 信号符号化装置及び信号符号化方法
US7698132B2 (en) * 2002-12-17 2010-04-13 Qualcomm Incorporated Sub-sampled excitation waveform codebooks
KR100604032B1 (ko) 2003-01-08 2006-07-24 엘지전자 주식회사 복수 코덱을 지원하는 장치와 방법
US20050096898A1 (en) * 2003-10-29 2005-05-05 Manoj Singhal Classification of speech and music using sub-band energy
CN1312946C (zh) * 2004-11-11 2007-04-25 向为 话音的自适应多速率编码和传输方法
US7386445B2 (en) * 2005-01-18 2008-06-10 Nokia Corporation Compensation of transient effects in transform coding
JP4699117B2 (ja) * 2005-07-11 2011-06-08 株式会社エヌ・ティ・ティ・ドコモ 信号符号化装置、信号復号化装置、信号符号化方法、及び信号復号化方法。
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
KR20070077652A (ko) * 2006-01-24 2007-07-27 삼성전자주식회사 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법

Also Published As

Publication number Publication date
KR20090074070A (ko) 2009-07-03
EP2458588A3 (en) 2012-07-04
WO2008045846A1 (en) 2008-04-17
TWI349927B (en) 2011-10-01
CN101523486B (zh) 2013-08-14
EP2458588A2 (en) 2012-05-30
BRPI0719886A2 (pt) 2014-05-06
US9583117B2 (en) 2017-02-28
US20090187409A1 (en) 2009-07-23
CA2663904C (en) 2014-05-27
JP5096474B2 (ja) 2012-12-12
CA2663904A1 (en) 2008-04-17
JP2010506239A (ja) 2010-02-25
CN101523486A (zh) 2009-09-02
EP2092517B1 (en) 2012-07-18
RU2009117663A (ru) 2010-11-20
KR101186133B1 (ko) 2012-09-27
EP2092517A1 (en) 2009-08-26
TW200839741A (en) 2008-10-01

Similar Documents

Publication Publication Date Title
RU2426179C2 (ru) Способ и устройство для кодирования и декодирования аудиосигналов
CN101681627B (zh) 使用音调规则化及非音调规则化译码的信号编码方法及设备
KR101070207B1 (ko) 오디오 신호와 관련된 프레임으로 윈도우를 변형하는 시스템 및 방법
EP1736967B1 (en) Speech speed converting device and speech speed converting method
DK2803068T3 (en) Classification of signals with multiple kodningsmodi
KR20020093943A (ko) 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치
WO2008044164A2 (en) Pitch lag estimation
JP4511094B2 (ja) 音声コーダにおける線スペクトル情報量子化方法を交錯するための方法および装置
US20060015329A1 (en) Apparatus and method for audio coding
RU2682851C2 (ru) Усовершенствованная коррекция потери кадров с помощью речевой информации
KR101083945B1 (ko) 스피치 프레임의 모델 획득 방법 및 장치, 스피치 프레임의 모델 합성 방법 및 장치와, 컴퓨터 판독가능 매체
JP5511839B2 (ja) トーン判定装置およびトーン判定方法
Edwards Advanced signal processing techniques for pitch synchronous sinusoidal speech coders
KR20000013870A (ko) 음성 부호화기에서 피치 예측을 이용한 오류 프레임 처리 방법및 그를 이용한 음성 부호화 방법