RU2752520C1 - Управление полосой частот в кодерах и/или декодерах - Google Patents
Управление полосой частот в кодерах и/или декодерах Download PDFInfo
- Publication number
- RU2752520C1 RU2752520C1 RU2020118947A RU2020118947A RU2752520C1 RU 2752520 C1 RU2752520 C1 RU 2752520C1 RU 2020118947 A RU2020118947 A RU 2020118947A RU 2020118947 A RU2020118947 A RU 2020118947A RU 2752520 C1 RU2752520 C1 RU 2752520C1
- Authority
- RU
- Russia
- Prior art keywords
- encoder
- frequency band
- decoder
- tools
- bandwidth
- Prior art date
Links
- 238000000034 method Methods 0.000 claims description 64
- 238000001514 detection method Methods 0.000 claims description 48
- 230000003595 spectral effect Effects 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 24
- 238000007493 shaping process Methods 0.000 claims description 23
- 230000002123 temporal effect Effects 0.000 claims description 11
- 230000011664 signaling Effects 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 abstract description 6
- 239000000126 substance Substances 0.000 abstract 1
- 238000001228 spectrum Methods 0.000 description 41
- 238000013139 quantization Methods 0.000 description 27
- 238000004590 computer program Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000002085 persistent effect Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 6
- 238000005311 autocorrelation function Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3059—Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
- H03M7/3062—Compressive sampling or sensing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3066—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction by means of a mask or a bit-map
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6005—Decoder aspects
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6011—Encoder aspects
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Изобретение относится к средствам для управления полосой частот в кодерах и декодерах. Технический результат заключается в повышении эффективности кодирования. Кодирующее устройство содержит множество инструментов кодера частотной области, FD, для кодирования информационного сигнала, причем информационный сигнал представляет множество кадров. Дополнительно кодирующее устройство содержит средство обнаружения и управления полосы частот кодера, выполненное с возможностью выбора полосы частот по меньшей мере для подгруппы из множества инструментов кодера FD. Причем указанная подгруппа включает в себя меньше инструментов кодера FD, чем множество инструментов кодера FD, на основании характеристик информационного сигнала таким образом, что по меньшей мере один из инструментов кодера FD из указанной подгруппы имеет другую полосу частот относительно по меньшей мере одного из инструментов кодера FD, которые не находятся в указанной подгруппе. 5 н. и 27 з.п. ф-лы, 13 ил.
Description
1. УРОВЕНЬ ТЕХНИКИ
Настоящие примеры относятся к кодерам и декодерам и к способам для этих устройств, в особенности для информационных сигналов, таких как аудиосигналы.
Общие кодеки аудио должны передавать сигналы музыки и речи в очень хорошем качестве. Такие кодеки аудио, например, используются в Bluetooth, где аудиосигналы передаются от мобильного телефона к гарнитуре или наушникам и наоборот.
Квантование частей спектра в нули часто приводит к воспринимаемому ухудшению качества. Таким образом, существует возможность заменить квантованные в нули спектральные линии с шумом с использованием инструмента заполнения шума, работающего в частотной области (FD).
Формирование временного шума (TNS) использует линейное предсказание разомкнутой цепи в частотной области (FD). Этот процесс кодирования/декодирования с предсказанием над частотой эффективно адаптирует временную структуру шума квантования к структуре временного сигнала, тем самым эффективно используя сигнал, чтобы замаскировать эффекты шума. В стандарте улучшенного кодера аудио (AAC) MPEG2, TNS в текущий момент осуществляется путем определения одного фильтра для некоторой заданной полосы частот и затем переключения на другой фильтр для смежной полосы частот, когда структура сигнала в смежной полосе отлична от структуры сигнала в предыдущей полосе.
В особенности для сигналов речи содержимое аудио может иметь ограниченную полосу, что означает, что полоса частот аудио содержит только 4 кГц (узкая полоса, NB), 8 кГц (широкая полоса, WB) или 16 кГц (сверхширокая полоса, SWB). Кодеки аудио должны обнаруживать активную полосу частот аудио и управлять инструментами кодирования соответственно. Поскольку обнаружение полосы частот не на 100% надежно, могут возникать технические проблемы.
Некоторые инструменты кодирования аудио, например формирование временного шума (TNS) или заполнение шума (NF), могут вызывать раздражающие артефакты при работе над файлами аудиоданных ограниченной полосы, например, если инструмент не осведомлен об активной части сигнала. Предполагая, что сигнал WB кодируется на 32 кГц, инструменты могут заполнять верхний спектр (8-16 кГц) искусственным шумом.
Фиг. 1 изображает искусственный шум, генерируемый неконтролируемыми инструментами: линия 11 является активным сигналом вплоть до WB, в то время как сигнал 12 искусственно генерируется параметрическим инструментом, например путем заполнения шума, который не осведомлен об активной полосе частот аудио.
Таким образом, инструменты должны быть ограничены таким образом, чтобы работать только над активными частотными областями.
Некоторые кодеки, такие как AAC, выполнены с возможностью отправки информации об активном спектре для каждой полосы коэффициента масштабирования. Эта информация также используется для управления инструментами кодирования. Это обеспечивает точные результаты, но требует существенного количества дополнительной информации, которая должна быть передана. Поскольку речь обычно передается просто в NB, WB, SWB и FB, этот ограниченный набор возможных активных полос частот предпочтительно используется для ограничения дополнительной информации.
Средство обнаружения полосы частот с неизбежностью время от времени возвращает неверные результаты. Например, средство обнаружения может видеть затухание сигнала музыки и интерпретирует это как случай низкой полосы частот. Для кодеков, которые переключаются между различными режимами полосы частот (NB, WB, SWB, FB) жестким образом, например кодека EVS 3GPP [1], это дает в результате прямоугольную спектральную дыру. Переключение жестким образом означает, что полная операция кодирования ограничена обнаруженной полосой частот. Такое жесткое переключение может давать в результате слышимые артефакты. Фиг. 2 обрисовывает спектральную дыру 22, возникшую в результате неверного обнаружения.
Фиг. 2 изображает схематичный чертеж неверного обнаружения полосы частот: все инструменты кодирования работают на нижней полосе частот аудио, что приводит к прямоугольной спектральной дыре 22.
Существует необходимость преодоления или уменьшения таких недостатков, как те что определены выше.
1.1. Источники
[1] 3GPP EVS Codec, http://www.3gpp.org/ftp//Specs/archive/26_series/26.445/26445-e10.zip, раздел 5.1.6 "Bandwidth detection"
2. РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
В соответствии с примерами, обеспечено кодирующее устройство, содержащее:
- множество инструментов кодера частотной области, FD, для кодирования информационного сигнала, причем информационный сигнал представляет множество кадров; и
- средство обнаружения и управления полосы частот кодера, выполненное с возможностью выбора полосы частот по меньшей мере для подгруппы из множества инструментов кодера FD, причем подгруппа включает в себя меньше инструментов кодера FD, чем множество инструментов кодера FD, на основании характеристик информационного сигнала таким образом, что по меньшей мере один из инструментов кодера FD из подгруппы имеет другую полосу частот относительно по меньшей мере одного из инструментов кодера FD, которые не находятся в подгруппе.
Соответственно, существует возможность избежать спектральных дыр при обслуживании в случае неверного обнаружения полосы частот.
В соответствии с примерами, по меньшей мере один инструмент кодера FD из подгруппы может быть инструментом формирования временного шума, TNS, и/или инструментом средства оценки уровня шума.
В соответствии с примерами, по меньшей мере один инструмент кодера FD, который не находится в подгруппе, выбирается из по меньшей мере одного из спектрального средства формирования на основе линейного кодирования с предсказанием, LPC, инструмента средства формирования спектрального шума, SNS, спектрального квантизатора и остаточного кодера.
В соответствии с примерами, средство обнаружения и управления полосы частот кодера выполнено с возможностью выбора полосы частот по меньшей мере одного инструмента кодера FD из подгруппы между по меньшей мере первой полосы частот, общей для по меньшей мере одного из инструментов кодера FD, который не находятся в подгруппе, и второй полосы частот, отличной от полосы частот по меньшей мере одного из инструментов кодера FD, которые не находятся в подгруппе.
В соответствии с примерами, средство обнаружения и управления полосы частот кодера выполнено с возможностью выбора полосы частот по меньшей мере одного из множества инструментов кодера FD на основании по меньшей мере одной оценки энергии над информационным сигналом.
В соответствии с примерами, средство обнаружения и управления полосы частот кодера выполнено с возможностью сравнения по меньшей мере одной оценки энергии, ассоциированной с полосой частот информационного сигнала, с соответствующей пороговой величиной для управления полосой частот для по меньшей мере одного из множества инструментов кодера FD.
В соответствии с примерами, по меньшей мере один из множества инструментов кодера FD из подгруппы содержит TNS, выполненный с возможностью автокорреляции входного сигнала TNS внутри полосы частот, выбранной средством обнаружения и управления полосы частот кодера.
В соответствии с примерами, по меньшей мере один из инструментов кодера FD, который не находятся в подгруппе, выполнен с возможностью работы в полной полосе частот.
Таким образом, выбор полосы частот работает только для инструментов из подгруппы (например, TNS, инструмента средства оценки шума).
В соответствии с примерами, средство обнаружения и управления полосы частот кодера выполнено с возможностью выбора по меньшей мере одной полосы частот, которая находится внутри полной полосы частот, в которой по меньшей мере один из инструментов кодера FD, которые не находятся в подгруппе, выполнен с возможностью работы.
В соответствии с примерами, по меньшей мере один из остальных инструментов кодера FD из множества инструментов кодера FD выполнен с возможностью работы в открытой цепи относительно полосы частот, выбранной средством обнаружения и управления полосы частот кодера.
В соответствии с примерами, средство обнаружения и управления полосы частот кодера выполнено с возможностью выбора полосы частот из конечного количества полос частот и/или из набора заданных полос частот.
Таким образом, выбор ограничен, и нет необходимости кодирования слишком сложных и/или длинных параметров. В примерах только один параметр (например, кодированный в 0-3 битах) может быть использован для битового потока.
В соответствии с примерами, средство обнаружения и управления полосы частот кодера выполнено с возможностью выполнения выбора из по меньшей мере одного или сочетания из: 8 кГц, 16 кГц, 24 кГц, 32 кГц и 48 кГц и/или NB, WB, SSWB, SWB, FB и т. д.
В соответствии с примерами, средство обнаружения и управления полосы частот кодера выполнено с возможностью управления сигнализацией полосы частот декодеру.
Таким образом, также полосой частот сигналов, обработанных некоторыми инструментами в декодере, может осуществляться управление (например, с использованием той же самой полосы частот).
В соответствии с примерами, кодирующее устройство выполнено с возможностью кодирования поля управляющих данных, включающего в себя информацию, относящуюся к выбранной полосе частот.
В соответствии с примерами, кодирующее устройство выполнено с возможностью определения поля управляющих данных, включающего в себя:
- 0 бит данных, соответствующих полосе частот NB;
- 1 бит данных, соответствующий полосе частот NB, WB;
- 2 бита данных, соответствующих полосе частот NB, WB, SSWB;
- 2 бита данных, соответствующих полосе частот NB, WB, SSWB, SWB;
- 3 бита данных, соответствующих полосе частот NB, WB, SSWB, SWB, FB.
В соответствии с примерами, по меньшей мере одна оценка энергии кодирующего устройства выполняется следующим образом:
где X(k) - коэффициенты MDCT (или MDST...), N B - количество полос, и - индексы, ассоциированные с полосой.
В соответствии с примерами, кодирующее устройство содержит инструмент TNS, который может быть выполнен с возможностью выполнения операции фильтрации, включающую в себя вычисление автокорреляционной функции. Одна из возможных функций автокорреляции может иметь следующую форму:
для каждого k=0..8
где
и
где X(k) - коэффициенты MDCT, sub_start(f, s) и sub_stop(f, s) ассоциированы с конкретной полосой частот, обнаруженной средством обнаружения и управления полосы частот кодера.
В соответствии с примерами, кодирующее устройство может содержать инструмент средства оценки шума, который может быть выполнен с возможностью оценки уровня шума. Одна из процедур, используемых для такой оценки, может иметь форму
где gg указывает на глобальное усиление, INF(k) - на идентификацию спектральных линий, на которых уровень шума должен оцениваться, и Xf(k) - сигнал (например, MDCT или MDST или другой спектр FD после TNS).
В примерах INF(k) может быть получен как:
где bw stop зависит от полосы частот, обнаруженной средством обнаружения и управления полосы частот кодера.
В соответствии с примерами, может быть обеспечено декодирующее устройство, содержащее множество инструментов декодера FD для декодирования информационного сигнала, кодированного в битовом потоке, причем:
инструменты декодера FD подразделяются:
- на подгруппу, содержащую по меньшей мере один инструмент декодера FD;
- на остальные инструменты декодера FD, содержащие по меньшей мере один инструмент декодера FD;
причем декодирующее устройство выполнено таким образом, что по меньшей мере один из множества инструментов декодера из подгруппы выполняет обработку сигналов для другой полосы частот относительно по меньшей мере одного из остальных инструментов декодера FD из множества инструментов декодера.
В соответствии с примерами, декодирующее устройство может содержать средство управления полосы частот, выполненное с возможностью выбора полосы частот на основании информации полосы частот.
В соответствии с примерами, декодирующее устройство может быть таким, что подгруппа содержит по меньшей мере один из инструмента средства оценки шума декодера и/или декодера формы временного шума, TNS.
В соответствии с примерами, по меньшей мере один из остальных инструментов декодера FD является по меньшей мере одним из инструмента декодера линейного кодирования с предсказанием, LPC, инструмента декодера средства формирования спектрального шума, SNS, инструмента декодера глобального усиления, инструмента формирования MDCT или MDST.
В соответствии с примерами, декодирующее устройство может быть выполнено с возможностью управления полосой частот по меньшей мере одного из множества инструментов декодера в подгруппе между:
по меньшей мере первой полосой частот, общей для по меньшей мере одного из остальных инструментов декодера FD; и
по меньшей мере второй полосой частот, отличной от первой полосы частот.
В соответствии с примерами, по меньшей мере один из остальных инструментов декодера FD выполнен с возможностью работы в полной полосе частот.
В соответствии с примерами, по меньшей мере один из остальных инструментов декодера FD выполнен с возможностью работы в открытой цепи относительно полосы частот (например, выбранной средством управления полосы частот).
В соответствии с примерами, средство управления полосы частот выполнено с возможностью выбора полосы частот из конечного количества полос частот и/или из набора заданных полос частот.
В соответствии с примерами, средство управления полосы частот выполнено с возможностью выполнения выбора из по меньшей мере одного или сочетания из: 8 кГц, 16 кГц, 24 кГц, 32 кГц и 48 кГц и/или NB, WB, SSWB, SWB, FB.
В соответствии с примерами, декодер может дополнительно содержать инструмент (46) заполнения шума, выполненный с возможностью применения уровня шума с использованием индексов. Методика получения индексов может обеспечивать, например:
где bw stop получается на основании информации полосы частот в битовом потоке.
В соответствии с примерами, декодирующее устройство может содержать инструмент декодера TNS, выполненный с возможностью выполнения по меньшей мере некоторых из следующих операций:
где - выходные данные из декодера TNS, и - входные данные декодера TNS, num_tns_filters, start_freq, stop_freq получаются на основании информации полосы частот в битовом потоке.
Инструменты кодирования, такие как TNS или заполнение шума, могут создавать нежелательный искусственный шум в тихих сегментах сигналов с ограниченной полосой. Таким образом, средства обнаружения полосы частот обычно взаимодействуют, чтобы управлять полосой частот, на которой должны работать все инструменты кодирования. Поскольку обнаружение полосы частот может приводить к неясным результатам, такое неверное обнаружение может приводить к звуковым артефактам, таким как внезапное ограничение полосы частот аудио.
Чтобы преодолеть эту проблему, в некоторых примерах некоторыми инструментами, например квантизатором, не управляет средство обнаружения полосы частот. В случае ошибочного обнаружения квантизатор может кодировать верхний спектр - пусть и в низком качестве - чтобы компенсировать проблему.
3. КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
фиг. 1 изображает искусственный шум, генерируемый неконтролируемыми инструментами;
фиг. 2 изображает схематический чертеж неверного обнаружения полосы частот;
фиг. 3 и 3a изображают кодирующее устройство согласно примерам;
фиг. 4 и 4a изображают декодирующее устройство согласно примерам;
фиг. 5 изображает схему в случае неверного обнаружения полосы частот;
фиг. 6a-6c изображают способы согласно примерам;
фиг. 7 изображает способ TNS в кодере согласно одному примеру;
фиг. 8a и 8b изображают устройство согласно примерам.
4. ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
Изобретение, описанное в этом документе, позволяет избежать возникновения спектральных дыр, даже когда средство обнаружения полосы частот возвращает неверный результат. В частности, может быть получено мягкое переключение полосы для применений в аудиокодировании.
Ключевым аспектом является то, что параметрическими инструментами кодирования, например TNS и NF, может строго осуществляться управление посредством средства 39 обнаружения и управления полосы частот, в то время как остальное кодирование, т.е. спектральное средство формирования на основании LPC или средство формирования спектрального шума, SNS, спектральный квантизатор и остаточный кодер, все еще работают над полной полосой частот аудио вплоть до предельной частоты.
Фиг. 3 и 3a обрисовывают примеры кодирующих устройств 30 и 30a, где средство 39 обнаружения и управления полосы частот (BW) оценивает текущую полосу частот аудио в кадре на основании энергий, найденных из спектра MDCT или MDST (или другого спектра FD).
На стороне декодера (фиг. 4 и 4a) направляющая информация полосы частот для TNS и NF извлекается из битового потока, и инструментами осуществляется управление соответственно.
В результате искусственно генерируемый шум в неактивных спектральных областях избегается ввиду параметра полосы частот, используемого, чтобы управлять инструментами кодирования TNS и NF (неконтролируемыми инструментами). Инструмент просто работает над активной частью аудио и, таким образом, не генерирует какого-либо искусственного шума.
С другой стороны, слышимый эффект неверных обнаружений (ложного обнаружения полосы частот) может быть существенно уменьшен, поскольку остальные инструменты кодирования, например спектральный квантизатор, средство формирования LPC или SNS (средство формирования спектрального шума) и остаточный кодер, все еще работают вплоть до предельной частоты. В случае неверных обнаружений эти инструменты могут кодировать верхнюю частоту - по меньшей мере с некоторыми дополнительными искажениями по сравнению с обычным кодированием - и, таким образом, избегать более сильного впечатления, что полоса частот аудио внезапно снижается.
Фиг. 5 изображает новую схему в случае неверного обнаружения полосы частот: спектральная дыра квантуется слабо, но избегает слышимого снижения полосы частот.
В случае если область, обрисованная на чертеже выше, содержит преимущественно нулевые значения, арифметическому кодеру не обязательно кодировать их, поскольку информация над последним ненулевым спектральным кортежем передается в качестве дополнительной информации для арифметического кодера. Это означает, что никакого служебного сигнализирования не требуется для арифметического кодера.
Требуемая дополнительная информация для передаваемой полосы частот также минимизируется. Ввиду устойчивого поведения переключения, сигнализирование обычно используемых полос частот аудио передачи, т. е. NB, WB, SSWB и SWB, является подходящим.
Эта методика также обеспечивает возможность построить менее сложные средства обнаружения полосы частот, которые не используют зависимостей кадра и средств памяти долгой истории, чтобы получить стабильные решения, см. кодек EVS [1], раздел 5.1.6. Это означает, что новая методика обеспечивает возможность средству 39 обнаружения и управления полосы частот реагировать очень быстро при любом изменении полосы частот аудио.
Соответственно, информация полосы частот используется только для того, чтобы управлять конкретными инструментами кодека (например, кодека аудио), при этом сохраняя остальные инструменты в другом режиме операции (например, полной полосе частот).
5. ПРИМЕРЫ
5.1. Обнаружение и управление полосы частот инструментов
Информационный сигнал (например, аудиосигнал) может быть описан во временной области, TD, в виде последовательности выборок (например, x(n)), полученных в различные дискретные моменты времени (n). Представление TD может состоять из множества кадров, каждый из которых ассоциирован с множеством выборок (например, 2048 выборок на кадр). В частотной области, FD, кадр может быть представлен в виде последовательности интервалов (например, X(k)), каждый из которых ассоциирован с конкретной частотой (каждая частота ассоциирована с индексом k).
Фиг. 3 и 3a изображают кодирующие устройства 30 и 30a, соответственно, каждое из которых содержит средство 39 обнаружения и управления полосы частот кодера, которые имеют возможность выбора полосы частот для некоторых инструментов (подгруппы в кодере) кодирующего устройства 30 или 30a так, чтобы другие инструменты работали в другой полосе частот. Средство 39 обнаружения и управления полосы частот кодера также имеет возможность выбора полосы частот для по меньшей мере некоторых из инструментов декодера (подгруппы в декодере). 39a указывает на информацию выбора полосы частот, обеспеченную средством 39 обнаружения и управления полосы частот кодера инструментам из подгруппы (например, 33, 36) и/или декодеру.
Каждое из кодирующих устройств 30 и 30a может содержать инструмент 31 модифицированного дискретного косинусного преобразования, MDCT, низкой задержки или инструмент 31 модифицированного дискретного синусного преобразования, MDST, низкой задержки (или инструмент на основании другого преобразования, такого как преобразование с перекрытием), который может конвертировать информационный сигнал (например, аудиосигнал) из представления во временной области, TD, в представление в частотной области, FD, (например, чтобы получить коэффициенты MDCT, MDST или, в более общем случае, FD).
Кодирующее устройство 30 может содержать инструмент 32 линейного кодирования с предсказанием, LPC, для выполнения анализа LPC в FD.
Кодирующее устройство 30a может содержать инструмент 32a SNS для выполнения анализа SNS в FD.
Каждое из кодирующих устройств 30 и 30a может содержать инструмент 33 формирования временного шума, TNS, чтобы управлять временной формой шума внутри каждого окна информационного сигнала (например, выводимого инструментом MDCT или MDST) в FD.
Каждое из кодирующих устройств 30 и 30a может содержать спектральный квантизатор 34, обрабатывающий сигналы в FD. Сигнал, выводимый инструментом 33 TNS, может квантоваться, например, с использованием мертвой зоны плюс скалярного квантования однородной пороговой величины. Индекс усиления может быть выбран таким образом, чтобы количество битов, необходимых для кодирования квантованного сигнала FD, было максимально близким к доступному запасу битов.
Каждое из кодирующих устройств 30 и 30a может содержать кодер 35, обрабатывающий сигналы в FD, например, чтобы выполнять энтропийное кодирование, например, чтобы сжать битовый поток. Кодер 35 может, например, выполнять остаточное кодирование и/или арифметическое кодирование.
Каждое из кодирующих устройств 30 и 30a может содержать, например, инструмент 36 средства оценки уровня шума, обрабатывающий сигналы в FD, чтобы оценить шум, квантовать его и/или передать его в битовом потоке.
В примерах инструмент 36 средства оценки уровня может быть размещен раньше или позже кодера 35 по ходу потока.
Каждое из кодирующих устройств 30 и 30a может содержать инструменты, которые обрабатывают сигналы во временной области, TD. Например, кодирующее устройство 30 или 30a может содержать инструмент 38a повторной дискретизации (например, средство дискретизации с понижением) и/или инструмент 38b долговременной вторичной фильтрации, LTPF, для управления LTPF, активной в TD в декодере.
Каждое из кодирующих устройств 30 и 30a может содержать инструмент 37 средства мультиплексирования битового потока, чтобы подготовить битовый поток с данными, полученными от инструментыов TD и/или FD, размещенных раньше по ходу потока. Битовый поток может содержать цифровое представление информационного сигнала вместе с управляющими данными (включающими в себя, например, информацию полосы частот для выбора полосы частот в некоторых инструментах декодера), которые должны быть использованы в декодере. Битовый поток может быть сжат или включать в себя части, которые сжаты.
Таким образом, каждое из кодирующих устройств 30 и 30a может содержать инструменты FD (например, 31-36) и, в некотором случае, инструменты TD (например, 38a, 38b).
Средство 39 обнаружения и управления полосы частот кодера может управлять полосой частот инструментов FD, формирующих первую группу (подгруппу), таких как инструмент 33 формирования временного шума, TNS, и/или инструмент 36 средства оценки шума. Инструмент 33 TNS может быть использован, чтобы управлять шумом квантования. Полоса частот, в которой инструменты FD, которые не находятся в подгруппе (такие как по меньшей мере один из инструмента 32 LPC и/или инструмента 32a SNS, квантизатор 34 спектра и кодер 35), выполняют обработку сигналов, может, таким образом, отличаться от полосы частот, в которой инструменты из подгруппы (например 33, 36) выполняют обработку сигналов. Например, полоса частот для инструментов FD, которые не находятся в подгруппе, может быть больше, например может быть полной полосой частот.
В примерах средство 39 обнаружения и управления полосы частот кодера может входить в состав процессора цифровых сигналов, который, например, осуществляет также другие инструменты кодирующего устройства.
Фиг. 4 и 4a изображают декодирующие устройства 40 и 40a, соответственно, каждое из которых может декодировать цифровое представление информационного сигнала, кодированного, например, кодером 30 или 30a. Каждое из декодирующих устройств 40 и 40a может содержать инструменты FD и, в некотором случае, инструменты TD.
Каждое из декодирующих устройств 40 и 40a может содержать инструмент 41 мультиплексирования битового потока, чтобы получать битовый поток (например, путем передачи) от кодирующего устройства (например, устройства 30 или 30a). Например, выходной сигнал от кодирующего устройства 30 или 30a может быть обеспечен в качестве входного сигнала для декодирующего устройства 40 или 40a.
Каждое из декодирующих устройств 40 и 40a может содержать декодер 42, который может, например, распаковывать данные в битовом потоке. Арифметическое декодирование может выполняться. Остаточное декодирование может выполняться.
Каждое из декодирующих устройств 40 и 40a может содержать инструмент 43 заполнения шума, обрабатывающий сигналы в FD.
Каждое из декодирующих устройств 40 и 40a может содержать инструмент 44 глобального усиления, обрабатывающий сигналы в FD.
Каждое из декодирующих устройств 40 и 40a может содержать инструмент 45 декодера TNS, обрабатывающий сигналы в FD. TNS может быть кратко описано следующим образом. На стороне кодера и перед квантованием сигнал фильтруется в частотной области (FD) с использованием линейного предсказания, LP, для того, чтобы выровнять сигнал во временной области. На стороне декодера и после обратного квантования сигнал фильтруется обратно в частотную область с использованием обратного фильтра предсказания для того, чтобы сформировать шум квантования во временной области так, чтобы он был замаскирован сигналом.
Каждое из декодирующих устройств 40 и 40a может содержать инструмент формирования 46 MDCT или MDST (другие виды инструментов формирования могут быть использованы). В частности, инструмент формирования 46 MDCT или MDST может обрабатывать сигналы путем применения коэффициентов масштабирования (или квантованных коэффициентов масштабирования), полученных от инструмента 32a SNS кодера, или коэффициентов усиления, вычисленных из декодированных коэффициентов фильтра LP (полученных от инструмента 47 декодирования LPC), преобразованных в спектр MDCT или MDST.
Каждое из декодирующих устройств 40 и 40a может содержать обратный инструмент 48a обратного MDCT или MDST низкой задержки, чтобы преобразовывать представления сигналов из FD в TD (инструменты на основании других видов обратного преобразования могут быть использованы).
Каждое из декодирующих устройств 40 и 40a может содержать инструмент 48b LTPF для выполнения постфильтра в TD, например, на основании параметров, обеспеченных компонентом 38b в декодере.
Каждое из декодирующих устройств 40 и 40a может содержать средство 49 управления полосы частот декодера, выполненное с возможностью выбора полосы частот по меньшей мере одного из инструментов FD. В частности, полосой частот подгруппы (например, формируемой инструментами 43 и 45) может осуществляться управление для того, чтобы она отличалась от полосы частот, в которой другие инструменты FD (42, 44, 46, 47) обрабатывают сигналы. Средство 49 управления полосы частот может получать входной сигнал 39a, который был подготовлен на стороне кодера (например, средством 39 обнаружения и управления полосы частот), чтобы указывать выбранную полосу частот для по меньшей мере одной из подгрупп (33, 36, 43, 45).
В примерах средство 49 управления полосы частот декодера может выполнять операции, подобные обрабатываемым средством 39 обнаружения и управления полосы частот кодера. Однако в некоторых примерах средство 49 управления полосы частот декодера может предполагаться как компонент, который получает управляющие данные (например, кодированные в битовом потоке) от средства 39 обнаружения и управления полосы частот кодера и обеспечивает управляющие данные (например, информацию полосы частот) инструментам из подгруппы (например, инструменту 43 заполнения шума декодера и/или инструменту 45 декодера TNS). В примерах средство 39 управления является ведущим, а средство 49 управления является ведомым. В примерах средство 49 управления полосы частот декодера может быть частью или секцией процессора цифровых сигналов, который, например, осуществляет также другие инструменты декодера.
В общем, средства 39 и 49 управления полосы частот могут работать таким образом, что инструменты FD подгрупп (например, 33 и 36 для кодирующего устройства и/или 43 и 45 для декодирующего устройства) имеют одну и ту же полосу частот, в то время как другие инструменты FD декодера и/или кодера имеют другую полосу частот (например, более широкую полосу).
Было замечено, в сущности, что соответственно существует возможность уменьшить недостатки уровня техники. В то время как для некоторых инструментов FD (например, инструментов TNS, инструментов заполнения шума) может быть предпочтительно фактически выполнять выбор полосы, для других инструментов FD (например, 32, 34, 35, 42, 44, 46, 47) может быть предпочтительно обрабатывать сигналы в более широкой полосе (например, полной полосе). Соответственно, существует возможность избежать спектральных дыр, которые могут присутствовать в случае жесткого выбора полосы частот для всех инструментов (в частности, когда неверная полоса выбирается).
В примерах полоса частот, которая выбирается средством 49 управления полосы частот декодера, может быть одной из конечного количества вариантов (например, конечного количества полос частот). В примерах существует возможность выбрать из узкой полосы NB (например, 4 кГц), широкой полосы WB (например, 8 кГц), полусверхширокой полосы SSWB (например, 12 кГц), сверхширокой полосы SWB (например, 16 кГц) или полной полосы FB (например, 20 кГц).
Выбор может кодироваться в поле данных кодирующим устройством так, что декодирующему устройству известно, какие полосы частот были выбраны (например, согласно выбору, выполняемому средством 39 обнаружения и управления полосы частот кодера).
Фиг. 6a изображает способ 60. Способ 60 может содержать этапы, которые могут выполняться, по меньшей мере частично, по меньшей мере одним из средств 39 и 49 управления. Способ 60 может быть циклическим для того, чтобы выполнять операции в ассоциации с каждым кадром информационного сигнала.
На этапе S61 энергия для каждой полосы может оцениваться (например, средством 39 обнаружения и управления полосы частот).
На этапе S62 полоса частот может быть обнаружена (например, средством 39 обнаружения и управления полосы частот).
На этапе S63 обнаруженная полоса частот может быть выбрана для по меньшей мере одного из инструмента 33 TNS и инструмента 36 оценки шума: эти инструменты будут выполнять свои процессы в полосе частот, обнаруженной на этапе S62.
В качестве дополнения или альтернативы, на этапе S64 параметры могут быть определены (и/или кодированы) в битовом потоке для сохранения и/или передачи и использования декодером. Среди параметров информация выбора полосы частот (например, 39a) может быть кодирована таким образом, что декодеру будет известна обнаруженная и выбранная полоса частот для подгруппы (например, TNS и заполнения/оценки шума).
Затем новый кадр информационного сигнала может быть проверен. Способ 60 может, таким образом, осуществлять цикл путем перехода к этапу S61. Таким образом, решение может осуществляться покадровым образом.
В частности, в соответствии с обнаруженной полосой частот, другое количество битов может быть кодировано в битовом потоке. В примерах, если обнаруживается полоса частот 8 кГц (NB), никакие биты не будут кодированы в битовом потоке. Однако декодер поймет, что полосой частот является 8 кГц.
Каждое из кодирующих устройств 30 и 30a с фиг. 3 и 3a может содержать:
- множество инструментов кодера частотной области, FD, (31-36) для кодирования информационного сигнала, причем информационный сигнал представляет множество кадров; и
- средство 39 обнаружения и управления полосы частот кодера, выполненное с возможностью выбора полосы частот (например, на этапе S63) по меньшей мере для подгруппы (например, инструмента 33 TNS и инструмента 36 средства оценки уровня шума) из множества инструментов кодера FD на основании характеристик информационного сигнала так, что по меньшей мере один (например, 33, 36) из инструментов кодера FD из подгруппы имеет другую полосу частот относительно по меньшей мере одного из инструментов кодера FD (например, 31, 32, 34, 35), которые не находятся в подгруппе.
В частности, средство 39 обнаружения и управления полосы частот кодера может быть выполнено с возможностью выбора полосы частот по меньшей мере одного инструмента кодера FD из подгруппы (33, 36) между по меньшей мере первой полосой частот (например, предельной частотой), общей для по меньшей мере одного (или более) из инструментов кодера FD, которые не находятся в подгруппе, и второй полосой частот (например, NB, WB, SSWB, SWB), отличной от полосы частот по меньшей мере одного (или более) из инструментов кодера FD, которые не находятся в подгруппе.
Таким образом, некоторые инструменты могут работать в полосах частот, отличных друг от друга, и/или выполнять обработку сигналов с использованием полос частот, отличных друг от друга.
Инструменты, которые не находятся в подгруппе (например, глобальное усиление, спектральное формирование шума и так далее), могут работать в открытой цепи относительно выбора полосы частот.
В примерах средство 39 обнаружения и управления полосы частот кодера выполнено с возможностью выбора (например, на этапе S62) полосы частот по меньшей мере одного из множества инструментов (31-36) кодера FD на основании по меньшей мере одной оценки энергии (например, на этапе S61) над информационным сигналом.
Декодирующее устройство 40 с фиг. 4 содержит множество инструментов декодера FD (43-48a) для декодирования информационного сигнала, кодированного в битовом потоке, причем:
инструменты декодера FD разделены:
- на подгруппу, содержащую по меньшей мере один инструмент декодера FD (например, 43, 45);
- на остальные инструменты декодера FD, содержащие по меньшей мере один инструмент декодера FD (например, 44, 46, 48a);
причем декодирующее устройство 40 или 40a выполнено с возможностью выбора полосы частот для по меньшей мере одного из множества инструментов декодера из подгруппы (например, 43, 45) на основании информации полосы частот, включенной в битовый поток, так, что по меньшей мере один из множества инструментов декодера из подгруппы (например, 43, 45) выполняет обработку сигналов в другой полосе частот относительно по меньшей мере одного из остальных инструментов декодера FD из множества инструментов декодера (например, 44, 46, 48a).
Фиг. 6b изображает способ 60b. Способ 60b может быть способом для кодирования информационного сигнала согласно по меньшей мере множеству операций в частотной области, FD, причем способ содержит этапы, на которых:
выбирают полосу частот для подгруппы операций FD (например, S61b);
выполняют первые операции обработки сигналов в полосе частот для подгруппы операций FD (например, S62b);
выполняют вторые операции обработки сигналов в другой полосе частот для операций FD, которые не находятся в подгруппе (например, S63b).
Нет необходимости, например, выполнять этапы S61b и S62b в этом порядке по времени. Например, S62b может выполняться до S61b. S61b и S62b могут также выполняться параллельно (например, с использованием методик разделения времени или подобных).
Фиг. 6c изображает способ 60c. Способ 60c может быть способом для декодирования битового потока с информационным сигналом и управляющими данными (например, 39a), причем способ содержит множество операций обработки сигналов в частотной области, FD, причем способ содержит этапы, на которых:
выбирают вариант полосы частот для подгруппы операций FD на основании управляющих данных (S61c);
выполняют первые операции обработки сигналов в полосе частот для подгруппы операций FD (S62c);
выполняют вторые операции обработки сигналов в другой полосе частот для операций FD, которые не находятся в подгруппе (S63c).
Нет необходимости, например, выполнять этапы S61c и S62c в этом временном порядке. Например, S62c может выполняться до S61c. S61c и S62c могут также выполняться параллельно (например, с использованием методик разделения времени или подобных).
Согласно одному примеру, средство 39 обнаружения и управления полосы частот кодера может обнаруживать энергию для каждой полосы, например, с использованием уравнения, такого как:
где X(k) - коэффициенты MDCT или MDST (или любое другое представление сигнала в FD), N B (например, 64) - количество полос, и - индексы, ассоциированные с полосой (причем каждый индекс ассоциирован с интервалом).
Таким образом, существует возможность обнаруживать (например, на этапе S62) полосу частот (например, из конечного количества полос частот). Средство 39 обнаружения и управления полосы частот кодера может иметь возможность обнаруживать обычно используемую полосу частот в передаче речи, т. е. 4 кГц, 8 кГц, 12 кГц и 16 кГц. Например, существует возможность обнаруживать тишину каждой полосы частот. В случае положительного обнаружения тишины для полосы частот специализированные характеристики отсечения на спектре дополнительно обнаруживаются. Например, флаг (или в любом случае данные), касающийся обнаружения тишины, может быть получен следующим образом:
F Q (bw) - двоичное значение, которое равно 1, если суммирование меньше T Q (bw), и 0, если суммирование больше T Q (bw). F Q (bw), ассоциированное с конкретной полосой частот bw, указывает тишину (например, с логическим значением «1»), когда суммирование значений энергии меньше пороговой величины для конкретной полосы частот bw (и «0» в остальных случаях). Суммирование относится к сумме значений энергии на различных индексах (например, энергия для каждого интервала или полосы), например, для n от первого индекса полосы частот, ассоциированной с индексом I bw start (bw), до последнего индекса полосы частот, ассоциированной с индексом I bw st op (bw). Количество проверенных полос частот равно N bw .
Процедура может останавливаться, когда F Q (bw)==0 (энергия больше пороговой величины для полосы частот bw). В случае, когда F Q (bw+1)==1, флаги F C (b), указывающие характеристику отсечения спектра, могут быть обнаружены следующим образом
где D определяет расстояние между полосами, где характеристика отсечения должна быть проверена, т. е. D(bw).
Затем существует возможность определить окончательную информацию (информацию полосы частот или информацию выбора полосы частот), которая должна быть использована, чтобы управлять подгруппой (например, инструментом 33 TNS, и/или инструментом 36 оценки уровня шума, и/или инструментом 45 декодера TNS, и/или инструментом 43 заполнения шума). Окончательная информация может быть, например, кодирована в некоторых битах и может принимать такую форму, как
Параметр полосы частот Pbw (информация выбора полосы частот) может быть использован, чтобы управлять TNS и инструментом заполнения шума, например в декодере, и осуществлять сигнал 39a. Параметр Pbw может сохраняться и/или передаваться в битовом потоке с использованием количества битов nbitsbw. В частности, количество битов не обязательно является постоянным и может варьироваться согласно выбранному шагу дискретизации f s , таким образом уменьшая полезную информацию для битового потока, где в ней нет необходимости.
Таблица, такая как следующая далее, моет быть использована:
Таблица 1
f s - некоторая заданная частота дискретизации (например, 8 кГц, 16 кГц, 24 кГц, 32 кГц и/или 48 кГц), и, для каждой f s , количество возможных режимов равно N bw +1.
Таким образом, существует возможность кодировать поле управляющих данных, включающее в себя:
- 0 бит данных, соответствующих (сигнализирующих выбор) полосе частот NB;
- 1 бит данных, соответствующий (сигнализирующий выбор одной из) полосе частот NB и WB;
- 2 бита данных, соответствующих (сигнализирующих выбор одной из) полосе частот NB, WB и SSWB;
- 2 бита данных, соответствующих (сигнализирующих выбор одной из) полосе частот NB, WB, SSWB и SWB;
- 3 бита данных, соответствующих (сигнализирующих выбор одной из) полосе частот NB, WB, SSWB, SWB и FB.
Электронная версия по меньшей мере некоторых частей таблицы 1 может сохраняться в кодере и/или кодере. Соответственно, при параметре полосы частот Pbw существует возможность автоматически узнавать управляющую информацию для операций TNS и заполнения шума. Например, I bw start может указывать на начальный индекс, ассоциированный с нижним концом полосы частот, I bw stop может указывать на последний индекс, ассоциированный с верхним концом полосы частот. Выбор полосы частот и параметры на основании этого выбора могут, таким образом, быть найдены из таблицы, такой как таблица 1.
В примерах, когда fs=8000, средство обнаружения полосы частот не является необходимым, и мы имеем Pbw=0 и nbitsbw=0, т. е. параметр Pbw не размещается в битовом потоке. Однако декодер поймет, что выбранной полосой частот является NB (например, на основе электронных инструментов, таких как электронная версия таблицы 1).
Другие способы могут быть использованы. Одна из полос частот NB, WB, SSWB, SWB, FB может быть идентифицирована и передана к инструментам FD подгруппы кодера, таким как инструмент 33 формирования TNS и инструмент 36 средства оценки шума. Информация, такая как параметр Pbw (39a), может быть кодирована и передана декодирующему устройству 40 или 40a так, что инструмент 43 средства оценки шума декодера и инструмент 45 декодера TNS используют информацию, касающуюся выбранной полосы частот.
В общем виде характеристики информационного сигнала, которые составляют основу для выбора полосы частот, могут содержать, помимо прочего, одно или несколько из полосы частот сигнала, по меньшей мере одной оценки энергии информационного сигнала, характеристик отсечения на спектре, информации об обнаружении тишины в некоторых конкретных полосах, F Q (bw) и т. д.
Примеры выше позволяют получить мягкое переключение полосы частот.
5.2. MDCT или MDST (или другое преобразование) в кодере
Инструмент 31 модифицированного дискретного косинусного преобразования (MDCT) или модифицированного дискретного синусного преобразования (MDST) (или другого модулированного преобразования с перекрытием) может конвертировать цифровое представление в TD в цифровое представление в FD. Другие примеры (возможно основанные на других преобразованиях, таких как преобразования с перекрытием) могут, однако, быть использованы. Пример обеспечен здесь.
Входной сигнал x(n) текущего кадра b в TD может состоять из N F аудиовыборок, где новейший расположен на x(N F -1). К аудиовыборкам прошлых кадров осуществляется доступ путем отрицательного индексирования, например x(-1) является новейшим их предыдущих кадров.
Входной буфер времени для MDCT t может обновляться согласно
Блок N F временных выборок может быть преобразован в коэффициенты частоты X(k) с использованием следующего уравнения:
где w N - окно MDCT низкой задержки согласно используемому размеру кадра. Окно может быть оптимизировано для N F =480, и другие версии для различных размеров кадров могут генерироваться посредством интерполяции. Форма окна может быть результатом процедуры оптимизации и может быть обеспечена поточечно.
Также возможно применить MDST или другие преобразования.
5.3.1. LPC в кодере
Анализ линейного кодирования с предсказанием (LPC) может выполняться инструментом 32 LPC. LPC представляет спектральную огибающую цифрового сигнала в сжатой форме, использующую информацию линейной предсказательной модели.
Фильтр LPC может выводиться в искривленной частотной области и, таким образом, быть психоакустически оптимизированным. Чтобы получить автокорреляционную функцию, энергия E B (b), как определено выше, может быть предыскажена следующим образом
где
f s | g tilt |
16000 | 18 |
24000 | 22 |
32000 | 26 |
48000 | 30 |
и преобразована во временную область с использованием, например, обратного нечетного DFT
В случае R Pre (0)=0 установить R Pre (0)=1 и R Pre (1..N B -1)=0. Первые N L выборок извлекаются в вектор R L =R Pre (0..N L -1), где N L означает порядок фильтра LP, т. е. N L =16.
Коэффициенты фильтра LP могут быть вычислены, например, на основании вектора R L посредством процедуры Левинсона-Дурбина. Эта процедура может быть описана следующим псевдокодом:
Коэффициенты LPC могут быть взвешены, в примерах, посредством уравнения, такого как:
Коэффициенты LPC могут быть квантованы.
Например, взвешенные коэффициенты LPC a w (k) сначала свертываются с коэффициентами b(i) с использованием
где
и
Коэффициенты a c (k) затем могут быть преобразованы в частотную область с использованием
где N T =256 - длина преобразования. Следует заметить, что это преобразование может эффективно осуществляться с использованием усеченного FFT. Действительная и мнимая части A(k) затем извлекаются
LSF могут быть получены путем поиска с переходом через нуль A r (k) и A i (k), который может быть описан следующим псевдокодом
Если найдено меньше 16 LSF, LSF устанавливаются согласно
Формирование LPC может выполняться в области MDCT или MDST (FD) путем применения коэффициентов усиления, вычисленных из взвешенных и квантованных коэффициентов фильтра LP, преобразованных в спектр MDCT или MDST.
Чтобы вычислить N B =64 усилений формирования LPC, взвешенные коэффициенты фильтра LP ã сначала преобразуются в частотную область с использованием нечетного DFT.
Усиления формирования LPC g LPC (b) затем могут быть получены в виде абсолютных значений G LPC (b).
Усиления формирования LPC gLPC(b) могут применяться на частотных линиях MDCT или MDST для каждой полосы отдельно для того, чтобы генерировать сформированный спектр Xs(k), как описано следующим кодом.
Как можно увидеть выше, инструментом LPC, для выполнения анализа LPC, не управляет средство 39 управления: например, нет выбора конкретной полосы частот.
5.3.2. SNS в кодере
Обращаясь к фиг. 4a, существует возможность использовать инструмент 32a средства формирования спектрального шума.
Формирование спектрального шума (SNS) формирует шум квантования в частотной области таким образом, чтобы он минимально воспринимался человеческим ухом, максимизируя качество восприятия декодированного выходного сигнала.
Формирование спектрального шума может выполняться с использованием, например, 16 параметров масштабирования. Эти параметры могут быть получены в кодере путем, во-первых, вычисления энергии спектра MDCT (или MDST, или другого преобразования) в 64 неоднородных полосах, затем путем применения некоторой обработки к 64 энергиям (сглаживание, предыскажение, пороговая величина шума, логарифмическое преобразование), затем путем понижающей дискретизации 64 обработанных энергий с коэффициентом 4, чтобы получить 16 параметров, которые наконец нормализованы и масштабированы. Эти 16 параметров затем могут быть квантованы с использованием вектора. Квантованные параметры затем могут быть интерполированы, чтобы получить 64 интерполированных параметра масштабирования. Эти 64 параметра масштабирования затем используются, чтобы непосредственно сформировать спектр MDCT (или MDST...) в 64 неоднородных полосах. Масштабированные коэффициенты MDCT (или MDST...) затем могут быть квантованы с использованием скалярного квантизатора с размером шага, управляемым глобальным усилением. В декодере обратное масштабирование выполняется в каждых 64 полосах, формируя шум квантования, внесенный скалярным квантизатором. Методика SNS, раскрываемая здесь, может использовать, например, только 16+1 параметров в качестве дополнительной информации, и параметры могут быть эффективно кодированы с низким количеством битов с использованием векторного квантования. Следовательно, количество битов дополнительной информации уменьшается, что может приводить к существенному преимуществу при низкой скорости передачи битов и/или низкой задержке. Нелинейное частотное масштабирование может быть использовано. В этих примерах ни одна из относящихся к LPC функций не используется, чтобы уменьшить сложность. Требуемые функции обработки (сглаживание, предыскажение, пороговая величина шума, логарифмическое преобразование, нормализация, масштабирование, интерполяция) требуют сравнительно очень малой сложности. Только векторное квантование все еще имеет относительно высокую сложность. Однако некоторые методики векторного квантования низкой сложности могут быть использованы с малой потерей в производительности (подходы множественного разделения/множественных этапов). Эта методика SNS не полагается на фильтр восприятия на основе LPC. Она использует 16 параметров масштабирования, которые могут быть вычислены с большим количеством свободы. Гибкость, таким образом, увеличивается.
В кодере 30a инструмент 32 SNS может выполнять по меньшей мере один из следующих этапов:
Этап 1: Энергия для каждой полосы
Энергия для каждой полосы E B (n) может быть вычислена следующим образом
где X(k) - коэффициенты MDCT (или MDST, или другого преобразования), N B =64 - количество полос, и - индексы полос. Полосы могут быть неоднородными и следовать относящемуся к восприятию масштабу барка (меньше на низких частотах, больше на высоких частотах).
Этап 2: Сглаживание
Энергия для каждой полосы E B (b) сглаживается с использованием
Этот этап может главным образом использоваться, чтобы сгладить возможные неустойчивости, которые могут возникать в векторе E B (b). Без сглаживания эти неустойчивости усиливаются при конвертировании в логарифмическую область (см. этап 5), в особенности в минимумах, где энергия близка к 0.
Этап 3: Предыскажение
Сглаженная энергия для каждой полосы E S (b) затем предыскажается с использованием
где g tilt управляет наклоном предыскажения и зависит от частоты дискретизации. Оно равно, например, 18 при 16 кГц и 30 при 48 кГц. Предыскажение, используемое на этом этапе, имеет ту же самую цель, что и предыскажение, используемое в фильтре восприятия на основе LPC из уровня техники 2, оно увеличивает амплитуду формируемого спектра на низких частотах, что в результате приводит к уменьшенному шуму квантования на низких частотах.
Этап 4: Пороговая величина шума
Пороговая величина шума на -40 дБ добавляется к E P (b) с использованием
где пороговая величина шума вычисляется как
Этот этап улучшает качество сигналов, содержащих очень высокие спектральные динамики, таких как, например, колокольчики, путем ограничения усиления амплитуды формируемого спектра в минимумах, что имеет косвенный эффект уменьшения шума квантования в пиках (увеличение шума квантования в минимумах неощутимо).
Этап 5: Логарифм
Преобразование в логарифмическую область затем выполняется с использованием
Этап 6: Понижающая дискретизация
Вектор E L (b) затем дискретизируется с понижением с коэффициентом 4 с использованием
где
Этот этап применяет фильтр низких частот (w(k)) к вектору E L (b) перед прореживанием. Этот фильтр низких частот имеет эффект, подобный функции рассеивания, используемой в психоакустических моделях: он уменьшает шум квантования в пиках ценой увеличения шума квантования вокруг пиков, где его восприятие уже маскируется.
Этап 7: Удаление среднего и масштабирование
Окончательные коэффициенты масштабирования получаются после удаления среднего и масштабирования с коэффициентом 0,85
Поскольку кодек имеет дополнительное глобальное усиление, удаление среднего может осуществляться без какой-либо потери информации. Удаление среднего также обеспечивает возможность более эффективного векторного квантования. Масштабирование на 0,85 немного сжимает амплитуду кривой формирования шума. Это имеет эффект восприятия, подобный функции рассеивания, упомянутой на этапе 6: уменьшенный шум квантования в пиках и увеличенный шум квантования в минимумах.
Этап 8: Квантование
Коэффициенты масштабирования квантуются с использованием векторного квантования, производя индексы, которые затем упаковываются в битовый поток и посылаются декодеру, и квантованные коэффициенты масштабирования scfQ(n).
Этап 9: Интерполяция
Квантованные коэффициенты масштабирования scfQ(n) интерполируются с использованием:
и преобразуются обратно в линейную область с использованием
Интерполяция может быть использована, чтобы получить гладкую кривую формирования шума и, таким образом, избежать каких-либо больших скачков амплитуды между смежными полосами.
Этап 10: Спектральное формирование
Коэффициенты масштабирования SNS g SNS (b) применяются к частотным линиям MDCT (или MDST, или другого преобразования) для каждой полосы отдельно для того, чтобы генерировать сформированный спектр X s (k)
5.4. TNS в кодере
Фиг. 7 изображает способ 70, указывающий операции инструмента TNS, такого как инструмент 33 TNS, кодера 30 или 30a.
На этапе S71 выбор информации, относящейся к выбранной полосе частот (например, параметру Pbw), может быть получен, например, от средства 39 обнаружения и управления полосы частот кодера.
Согласно информации выбора (информации полосы частот), поведение TNS различно для различных полос частот (NB, WB, SSWB, SWB, FB). Пример обеспечен следующей таблицей:
Таблица 2
Например, когда информацией выбора является SWB, TNS будет выполнять фильтрацию дважды (см. num_tns_filters). Как можно увидеть из таблиц, различные индексы ассоциированы с различными полосами частот (например, для NB частота остановки отлична от частоты остановки для WB и так далее).
Таким образом, как можно увидеть, инструмент 33 TNS может работать в другой полосе частот на основании выбора, определенного средством 39 управления. В частности, другие инструменты FD того же самого декодирующего устройства 40 или 40a могут продолжать выполнять процессы на другой частоте.
Этапы кодирования TNS описаны ниже. Прежде всего анализ оценивает набор коэффициентов отражения для каждого фильтра TNS (этап S72). Затем эти коэффициенты отражения квантуются (этап S73). И, наконец, MDCT- или MDST-спектр фильтруется с использованием квантованных коэффициентов отражения (этап S73).
Обращаясь к этапу S72, полный анализ TNS, описанный ниже, может повторяться для каждого фильтра TNS f, где f=0..num_tns_filters-1 (num_filters дается в таблице 2). Другие операции анализа TNS могут выполняться, которые обеспечивают коэффициенты отражения.
Инструмент TNS может быть выполнен с возможностью выполнения автокорреляции для входного значения TNS. Нормализованная автокорреляционная функция может быть вычислена следующим образом для каждого k=0..8 (например)
где
и
гдк sub_start(f, s) и sub_stop(f, s) даны в таблице 2. e(s) - сумма энергий над спектральной подсекцией (коэффициент нормализации между частотой начала и остановки каждого фильтра).
Для нормализованной автокорреляционной функции может осуществляться корреляционное окно с использованием, например:
В некоторых примерах существует возможность выполнить решение включить/выключить фильтр TNS f в текущем кадре на основании усиления предсказания
Если predGain>thresh, то включить фильтр TNS f
где thresh=1,5, и усиление предсказания может быть вычислено как
Дополнительные этапы, описанные ниже, выполняются только в случае, если фильтр TNS f включен (или в примере, который не использует включение/выключение).
В некоторых примерах весовой коэффициент может быть вычислен как
где thresh2=2, γmin=0,85 и
Коэффициенты LPC могут быть взвешены с использованием коэффициента γ
Взвешенные коэффициенты LPC могут быть преобразованы в коэффициенты отражения с использованием следующей процедуры:
где rc(k, f)=rc(k) - окончательные оцененные коэффициенты отражения для фильтра TNS f.
Если фильтр TNS f выключен, то коэффициенты отражения могут быть просто установлены как 0: rc(k, f)=0, k=0..8.
На этапе S73 этап квантования может выполняться. Например, для каждого фильтра TNS f коэффициенты отражения (например, полученные на этапе S72) могут квантоваться. Например, скалярное однородное квантование в области арксинуса может быть использовано:
и/или
rc i (k, f) - выходные индексы квантизатора; и rc q (k, f) - квантованные коэффициенты отражения.
Порядок квантованных коэффициентов отражения может быть вычислен с использованием
Полное количество битов, занятых TNS в текущем кадре, может быть вычислено следующим образом
где
и/или
Таблицы tab_nbits_TNS_order и tab_nbits_TNS_coef могут быть заданными.
На этапе S74 цифровое представление информационного сигнала в FD (например, обеспеченное инструментом 32 LPC или инструментом 32a SNS) может фильтроваться. Это представление может, в примерах, иметь форму модифицированного дискретного косинусного или синусного преобразования (MDCT или MDST). Спектр MDCT X s (n) может фильтроваться с использованием следующего алгоритма, например:
где X f (n) - TNS-фильтрованный спектр MDCT или MDST.
Другие методики фильтрации могут быть использованы. Однако можно увидеть, что TNS применяется к конкретной полосе частот (например, NB, WB, SSWB, SWB, FB), выбранной средством 39 управления на основании характеристик сигнала.
5.5. Спектральное квантование в кодере
Здесь рассматривается инструмент 34 квантизатора спектра. Спектр MDCT или MDST после фильтрации TNS (Xf(n)) может квантоваться с использованием мертвой зоны плюс скалярного квантования однородной пороговой величины, и квантованный спектр MDCT или MDST Xq(n) может затем кодироваться с использованием арифметического кодирования. Глобальное усиление gg может управлять размером шага квантизатора. Это глобальное усиление квантуется с 7 битами, и квантованный индекс глобального усиления ggind тогда является целым, например между 0 и 127. индекс глобального усиления может быть выбран так, чтобы количество битов, необходимых для кодирования квантованного спектра MDCT или MDST, было максимально близко к доступному запасу битов.
В одном примере количество битов, доступных для кодирования спектра, может быть дано как
где nbits - количество битов, доступных в одном кадре TD для исходного информационного сигнала, nbits bw обеспеченно в таблице 1, nbits TNS обеспечено из TNS (полное количество битов, занятых TNS в текущем кадре), nbits LTPF ассоциировано, например, с LTPF 38b (количество битов, занятых LTPF), nbits LPC / SNS =38, nbits gain =7 и nbits nf =3. В примерах также могут учитываться биты защиты (например, биты циклического избыточного кода, CRC).
Смещение может сначала быть вычислено с использованием
где nbitsoffset old - значение nbitsoffset в предыдущем кадре, nbitsspec old - значение nbitsspec в предыдущем кадре, и nbitsest old - значение nbitsest в предыдущем кадре.
Это смещение может затем быть использовано, чтобы регулировать количество битов, доступных для кодирования спектра
Индекс глобального усиления может затем оцениваться так, чтобы количество битов, необходимых, чтобы кодировать квантованный спектр MDCT или MDST, было максимально близко к доступному запасу битов. Эта оценка основана на дихотомическом поиске низкой сложности, который грубо аппроксимирует количество битов, необходимых, чтобы кодировать квантованный спектр. Алгоритм может быть описан следующим образом
где E[k] - энергия (в дБ) блоков 4 коэффициентов MDCT или MDST, обеспеченная как
Индекс глобального усиления выше первым деквантуется с использованием
Спектр Xf может затем квантоваться с использованием, например:
Количество битов nbitsest, необходимых, чтобы кодировать квантованный спектр MDCT или MDST (или, в любом случае, FD) Xq(n), может быть точно оценено с использованием алгоритма ниже.
Флаг скорости передачи битов первым вычисляется с использованием, например:
Затем индекс последнего ненулевого 2-кортежа получается как
Количество битов nbitsest может быть затем вычислено следующим образом
где aclookup и acbits - таблицы, которые могут быть заданы.
Количество битов nbits est может сравниваться с доступным запасом битов nbits spec . Если они далеки друг от друга, то квантованный индекс глобального усиления gg ind регулируется, и спектр повторно квантуется. Процедура, используемая, чтобы регулировать квантованный индекс глобального усиления gg ind , дана ниже
Как можно увидеть выше, спектральным квантованием не управляет средство 39 управления: нет никакого ограничения для конкретной полосы.
5.6. Энтропийное кодирование
Все или часть кодированных данных (данных TNS, данных LTPF, глобального усиления, квантованного спектра...) могут быть энтропийно кодированы, например, путем сжатия согласно любому алгоритму.
Часть этих данных может быть составлена чистыми битами, которые непосредственно помещаются в битовом потоке, начиная с конца битового потока по ходу назад.
Остальные данные могут быть кодированы с использованием арифметического кодирования, начиная с начала битового потока по ходу вперед.
Два поля данных выше могут меняться местами в плане исходной точки и направления считывания/записи битового потока.
Примером в псевдокоде может быть:
5.7. Оценка шума в кодере
Инструмент 36 оценки шума (средство оценки уровня шума) может управлять заполнением шума на стороне декодера. На стороне кодера параметр уровня шума может оцениваться, квантоваться и передаваться или сохраняться в битовом потоке.
Уровень шума может оцениваться на основании спектральных коэффициентов, которые были квантованы в ноль, т. е. X q (k)==0. Индексы для актуальных спектральных коэффициентов даны как
где bw stop может зависеть от полосы частот, обнаруженной на этапе S62 и/или средством 39 обнаружения и управления полосы частот, как определено, например, в следующей таблице:
Полоса частот ( P bw , 39a) | |||||
NB | WB | SSWB | SWB | FB | |
bw_stop | 80 | 160 | 240 | 320 | 400 |
Таблица 3
Для идентифицированных индексов средний уровень отсутствующих коэффициентов оценивается на основе спектра после фильтрации TNS (Xf(k)), например, и нормализуется глобальным усилением.
Окончательный уровень шума может быть квантован в восемь шагов:
Таким образом, инструментом 36 средства оценки уровня шума может управлять средство 39 управления, например, на основании информации 39a полосы частот.
Например, электронная версия таблицы 3 может сохраняться в блоке хранения так, что, когда выбор полосы частот для конкретной полосы частот получается, параметр bw stop легко выводится.
5.8. Энтропийное декодирование в декодере
Все кодированные данные (данные TNS, данные LTPF, глобальное усиление, квантованный спектр...) могут быть энтропийно декодированы на стороне декодера, например, с использованием инструмента 42 декодера. Битовый поток, обеспеченный кодером, может, таким образом, быть развернут согласно любому алгоритму.
5.9. Заполнение шума в декодере
Здесь рассматривается инструмент 43 заполнения шума декодера. Инструментом 43 заполнения шума декодера может управлять, помимо прочего, средство 49 управления полосы частот декодера (и/или средство 39 управления через информацию 39a, кодированную в битовом потоке, такую как поле управляющих данных Nbw и/или Pwb из таблицы 1).
Индексы для актуальных спектральных коэффициентов могут быть даны как
где bw stop может быть дано в таблице 3.
Заполнение шума может применяться над идентифицированными актуальными спектральными линиями INF(k) с использованием переданного коэффициента шума FNF, полученного от кодера. FNF может быть вычислен в средстве оценки шума на стороне кодера. FNF может быть трехбитным значением, кодированным в качестве дополнительной информации в битовом потоке. FNF может быть получен, например, с использованием следующей процедуры:
Здесь обеспечена процедура:
Как получить nf_seed, может быть описано, например, следующим псевдокодом:
Как можно увидеть выше, инструмент 43 фильтра шума декодера может использовать параметр bw stop .
В некоторых примерах параметр bw stop явным образом получается в виде значения в битовом потоке. В примерах параметр bw stop получается средством 49 управления на основании информации 39a полосы частот (Pbw) в управляющем поле битового потока, кодированного кодером. Декодер может иметь электронную версию таблицы 3, сохраненную в постоянном блоке хранения. Соответственно, длина битового потока уменьшается.
Таким образом, средство 49 управления полосы частот (и/или средство 39 обнаружения и управления полосы частот декодера через управляющие данные 39a) может управлять инструментом 43 заполнения шума декодера.
5.9. Глобальное усиление в декодере
Глобальное усиление может применяться над спектром после того, как заполнение шума было применено, с использованием, например, формулы, такой как
где ggind - индекс глобального усиления, например, полученный от кодера.
5.10. TNS в декодере
Здесь рассматривается инструмент 45 декодера TNS. Квантованные коэффициенты отражения могут быть получены для каждого фильтра TNS f с использованием
где rci(k, f) - выходные индексы квантизатора.
Спектр MDCT или MDST (например, генерируемый инструментом глобального усиления) может затем фильтроваться с использованием следующей процедуры, такой как:
Параметры num_tns_filters, start_freq и stop_freq могут быть обеспечены на основании управляющей информации, обеспеченной кодером.
В некоторых примерах num_tns_filters, start_freq и/или stop_freq не обеспечены явным образом в битовом потоке. В примерах num_tns_filters, start_freq и stop_freq выводятся на основании значения Nbw в управляющем поле битового потока, кодированного кодером. Например, декодер может иметь электронную версию таблицы 2 (или по меньшей мере ее часть), сохраненную в нем. Соответственно, длина битового потока уменьшается.
Таким образом, инструментом 45 декодера TNS может осуществляться управление посредством полосы частот, обнаруженной на стороне кодера.
5.11.1. Формирование MDCT или MDST в декодере
Здесь рассматривается инструмент 46 формирования MDCT или MDST. Формирование LPC или SNS может выполняться в области MDCT (FD) путем применения коэффициентов усиления, вычисленных из декодированных коэффициентов фильтра LP, преобразованных в спектр MDCT или MDST.
Чтобы вычислить NB усилений формирования LPC, декодированные коэффициенты фильтра LP могут быть сначала преобразованы в частотную область с использованием нечетного DFT.
Усиления формирования LPC gLPC(b) затем могут быть вычислены как обратные абсолютные значения GLPC(b).
Усиления формирования LPC gLPC(b) могут применяться над TNS-фильтрованными частотными линиями MDCT для каждой полосы отдельно, как описано, для того, чтобы генерировать формированный спектр , как описано, например, посредством следующего кода:
Как можно увидеть выше, инструмент 46 формирования MDCT или MDST не обязательно должен быть ограничен конкретной полосой частот, и, таким образом, им не обязательно должно управлять средство 49 или 39 управления.
5.11.2. SNS в декодере
Следующие этапы могут выполняться в инструменте 46a декодера средства формирования шума, SNS:
Этап 1: Квантование
Индексы квантизатора вектора, произведенные на этапе 8 кодера (см. раздел 5.3.2), считываются из битового потока и используются, чтобы декодировать квантованные коэффициенты масштабирования scfQ(n).
Этап 2: Интерполяция
То же самое, что и этап 9 в разделе 5.3.2.
Этап 3: Спектральное формирование
Коэффициенты масштабирования SNS g SNS (b) применяются над квантованными частотными линиями MDCT (или MDST, или другого преобразования) для каждой полосы отдельно для того, чтобы генерировать декодированный спектр , как описано следующим кодом.
5.12. Синтез MDCT или MDST в декодере
Здесь рассматривается инструмент 48a обратного MDCT или MDST (другие инструменты на основе других преобразований, таких как преобразования с перекрытием, могут быть использованы).
2. Осуществление окна для наложенного по времени буфера
3. Провести операцию суммирования с перекрытием, чтобы получить реконструированные временные выборки
причем mem_ola_add(n) инициализируется как 0 перед декодированием первого кадра.
Обращаясь к этапу 1, MDST может выполняться путем замены функции косинуса функцией синуса, например, чтобы получить:
Как можно увидеть выше, инструментом 48a обратного MDCT или MDST не осуществляется управление на основании полосы частот, определенной на стороне кодера.
6. ДРУГИЕ ПРИМЕРЫ
Фиг. 8a изображает устройство 110, которое может осуществлять по меньшей мере некоторые инструменты кодирующего устройства 30 или 30a и/или выполнять по меньшей мере некоторые этапы способа 60 и/или 70. Устройство 110 может содержать процессор 111 и постоянный блок 112 памяти, хранящий инструкции, которые, при исполнении процессором 111, могут побуждать процессор 111 осуществлять по меньшей мере один из инструментов TD и/или FD кодирующего устройства 30 или 30a. В частности, инструкции могут осуществлять подгруппу инструментов FD (например, TNS и/или заполнение шума) и других инструментов FD, которые не находятся в подгруппе (например, 31, 32, 34, 35). Инструкции могут также содержать инструкции, которые, при исполнении процессором 111, выполняют выбор полосы частот так, что полоса частот сигналов, обработанных инструментами в подгруппе инструментов FD (например, TNS и/или заполнение шума), отличается от полосы частот сигналов, обработанных другими инструментами FD, которые не находятся в подгруппе (например, 31, 32, 34, 35). Инструкции могут быть такими, чтобы управлять выбором полосы частот на основании обнаружений энергии, ассоциированных с различными полосами частот. Инструкции могут также содержать инструкции, которые, при исполнении процессором 111, позволяют управлять декодером и, в частности, позволяют управлять полосой частот подгруппы инструментов FD (например, 43, 45), которая может отличаться от полосы частот других инструментов FD. Полоса частот, выбранная для подгруппы в кодере, может быть той же самой, что и выбранная для подгруппы в декодере. Постоянный блок 112 памяти может также содержать другие данные, такие как по меньшей мере части электронных версий таблиц 1, 2 и/или 3. Устройство 110 может содержать место 118 хранения для хранения, например, битового потока, полученного из информационного сигнала (например, аудиосигнала). Устройство 110 может содержать блок 117 вывода для передачи данных, например, беспроводным образом, например, с использованием конкретного протокола, такого как Bluetooth. Например, устройство 110 может определять, путем исполнения инструкций, сохраненных в постоянном блоке 112 памяти, битовый поток, который должен быть передан декодеру. Устройство 110 может также содержать блок 116 ввода для получения данных, например, беспроводным образом, например, с использованием конкретного протокола, такого как Bluetooth.
Фиг. 8b изображает устройство 120, которое может осуществлять по меньшей мере некоторые инструменты декодирующего устройства 40 или 40a. Устройство 120 может содержать процессор 121 и постоянный блок 122 памяти, хранящий инструкции, которые, при исполнении процессором 121, могут побуждать процессор 121 осуществлять по меньшей мере один из инструментов TD и/или FD декодирующего устройства 40 или 40a. В частности, инструкции могут осуществлять подгруппу инструментов FD (например, TNS и/или заполнение шума) и другие инструменты FD, которые не находятся в подгруппе (например, 44, 46 и т. д.). Инструкции могут также содержать инструкции, которые, при исполнении процессором 121, выполняют выбор полосы частот так, что полоса частот сигналов, обработанных инструментами в подгруппе инструментов FD (например, TNS и/или заполнение шума), отличается от полосы частот сигналов, обработанных другими инструментами FD, которые не находятся в подгруппе (например, 44, 46 и т. д.). Инструкции могут быть такими, чтобы управлять выбором полосы частот на основании обнаружений энергии, ассоциированных с различными полосами частот, как, например, выполняемые кодером. Инструкции могут также содержать инструкции, которые, при исполнении процессором 121, позволяют работать в качестве кодера и, в частности, позволяют управлять полосой частот подгруппы инструментов FD (например, 43, 45), которая может отличаться от полосы частот других инструментов FD. Полоса частот, выбранная для подгруппы в кодере, может быть той же самой, что и выбранная для подгруппы в декодере. Постоянный блок 122 памяти может также содержать другие данные, такие как по меньшей мере части электронных версий таблиц 1, 2 и/или 3. Устройство 120 может содержать место 128 хранения для хранения, например, битового потока, полученного из информационного сигнала (например, аудиосигнала). Устройство 120 может содержать блок 127 вывода для передачи данных, например, беспроводным образом, например, с использованием конкретного протокола, такого как Bluetooth. Устройство 120 может также содержать блок 126 ввода для получения данных, например, беспроводным образом, например, с использованием конкретного протокола, такого как Bluetooth. Например, устройство 120 может получить, путем исполнения инструкций, сохраненных в постоянном блоке 122 памяти, битовый поток, переданный декодером.
В примерах устройства 110 и 120 могут быть одним и тем же устройством. В примерах композиция различных устройств 110 и 120 формируют систему.
В зависимости от конкретных требований осуществления, примеры могут осуществляться в аппаратных средствах. Осуществление может выполняться с использованием цифрового носителя данных, например гибкого диска, универсального цифрового диска (DVD), диска Blu-Ray, компакт-диска (CD), постоянного запоминающего устройства (ROM), программируемого постоянного запоминающего устройства (PROM), стираемого и программируемого постоянного запоминающего устройства (EPROM), электрически стираемого программируемого постоянного запоминающего устройства (EEPROM) или флэш-памяти, имеющего электронно читаемые управляющие сигналы, сохраненные на нем, которые взаимодействуют (или имеют возможность взаимодействия) с программируемой компьютерной системой так, чтобы выполнялся соответствующий способ. Таким образом, цифровой носитель данных может быть машиночитаемым.
В общем случае примеры могут осуществляться в качестве компьютерного программного продукта с программными инструкциями, причем программные инструкции имеют возможность работать для выполнения одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программные инструкции могут, например, сохраняться на машиночитаемом носителе.
Другие примеры содержат компьютерную программу для выполнения одного из способов, описанных здесь, сохраненную на машиночитаемом носителе. Иными словами, пример способа является, таким образом, компьютерной программой, имеющей программные инструкции для выполнения одного из способов, описанных здесь, когда компьютерная программа запущена на компьютере.
Дополнительный пример способов представляет собой, таким образом, носитель данных (или цифровой носитель данных или машиночитаемый носитель), содержащий записанную на нем компьютерную программу для выполнения одного из способов, описанных здесь. Носитель данных, цифровой носитель данных или носитель записи являются материальными и/или постоянными, а не сигналами, которые нематериальны и кратковременны.
Дополнительный пример содержит блок обработки, например компьютер, или программируемое логическое устройство, выполняющее один из способов, описанных здесь.
Дополнительный пример содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных здесь.
Дополнительный пример содержит устройство или систему, переносящую (например, электронным или оптическим образом) компьютерную программу для выполнения одного из способов, описанных здесь, к приемнику. Приемник может, например, быть компьютером, мобильным устройством, устройством памяти или подобным. Устройство или система может, например, содержать файловый сервер для переноса компьютерной программы к приемнику.
В некоторых примерах программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано, чтобы выполнять некоторые или все из функциональных возможностей способов, описанных здесь. В некоторых примерах программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для того, чтобы выполнять один из способов, описанных здесь. В общем случае способы могут выполняться любым надлежащим аппаратным устройством.
Вышеописанные примеры являются иллюстративными для принципов, рассмотренных выше. Следует понимать, что модификации и вариации компоновок и подробностей, описанных здесь, будут очевидны. Намерением, таким образом, является ограничение объемом дальнейшей патентной формулы, а не конкретными подробностями, представленными здесь в форме описания и объяснения примеров.
Claims (86)
1. Кодирующее устройство, содержащее:
множество инструментов кодера частотной области, FD, для кодирования информационного сигнала, причем информационный сигнал представляет множество кадров; и
средство (39) обнаружения и управления полосы частот кодера, выполненное с возможностью выбора полосы частот по меньшей мере для подгруппы (33, 36) из множества инструментов кодера FD, причем подгруппа (33, 36) включает в себя меньше инструментов кодера FD, чем множество инструментов кодера FD, на основании характеристик информационного сигнала таким образом, что по меньшей мере один из инструментов кодера FD из подгруппы (33, 36) имеет другую полосу частот относительно по меньшей мере одного из инструментов кодера FD, которые не находятся в подгруппе (33, 36).
2. Кодирующее устройство по п.1, в котором:
по меньшей мере один инструмент кодера FD из подгруппы является инструментом формирования временного шума, TNS, (33) и/или инструментом средства оценки уровня шума (36).
3. Кодирующее устройство по п.1, в котором:
по меньшей мере один инструмент кодера FD, который не находится в подгруппе (33, 36), выбран из по меньшей мере одного спектрального средства формирования на основе линейного кодирования с предсказанием, LPC, инструмента формирования спектрального шума, SNS, спектрального квантизатора и остаточного кодера.
4. Кодирующее устройство по п.1, в котором:
средство (39) обнаружения и управления полосы частот кодера выполнено с возможностью выбора полосы частот по меньшей мере одного инструмента кодера FD из подгруппы (33, 36) между по меньшей мере первой полосой частот, общей для по меньшей мере одного из инструментов кодера FD, которые не находятся в подгруппе, и второй полосой частот, отличной от полосы частот по меньшей мере одного из инструментов кодера FD, которые не находятся в подгруппе.
5. Кодирующее устройство по п.1, в котором:
средство (39) обнаружения и управления полосы частот кодера выполнено с возможностью выбора полосы частот по меньшей мере одного из множества инструментов кодера FD на основании по меньшей мере одной оценки энергии для информационного сигнала.
6. Кодирующее устройство по п.1, в котором:
средство (39) обнаружения и управления полосы частот кодера выполнено с возможностью сравнения по меньшей мере одной оценки энергии, ассоциированной с полосой частот информационного сигнала, с соответствующей пороговой величиной для управления полосой частот для по меньшей мере одного из множества инструментов кодера FD.
7. Кодирующее устройство по п.1, в котором:
по меньшей мере один из множества инструментов кодера FD из подгруппы (33, 36) содержит TNS, выполненное с возможностью автокорреляции входного сигнала TNS внутри полосы частот, выбранной средством (39) обнаружения и управления полосы частот кодера.
8. Кодирующее устройство по п.1, в котором по меньшей мере один из инструментов кодера FD, которые не находятся в подгруппе, выполнен с возможностью работы на полной полосе частот.
9. Кодирующее устройство по п.1, в котором средство (39) обнаружения и управления полосы частот кодера выполнено с возможностью выбора по меньшей мере одной полосы частот, которая находится внутри полной полосы частот, в которой по меньшей мере один из инструментов кодера FD, которые не находятся в подгруппе, выполнен с возможностью работы.
10. Кодирующее устройство по п.1, в котором по меньшей мере один из остальных инструментов кодера FD из множества инструментов кодера FD выполнен с возможностью работы в открытой цепи относительно полосы частот, выбранной средством (39) обнаружения и управления полосы частот кодера.
11. Кодирующее устройство по п.1, в котором:
средство (39) обнаружения и управления полосы частот кодера выполнено с возможностью выбора полосы частот из конечного количества полос частот и/или из набора заданных полос частот.
12. Кодирующее устройство по п.1, в котором:
средство (39) обнаружения и управления полосы частот кодера выполнено с возможностью выполнения выбора из по меньшей мере одной или из сочетания следующих полос частот: 4 кГц, 8 кГц, 12 кГц, 16 кГц и 24 кГц и/или NB, WB, SSWB, SWB, FB.
13. Кодирующее устройство по п.1, в котором:
средство (39) обнаружения и управления полосы частот кодера выполнено с возможностью управления сигнализацией полосы частот в декодер.
14. Кодирующее устройство по любому из предыдущих пунктов, дополнительно выполненное с возможностью:
кодирования поля управляющих данных, включающего в себя информацию, касающуюся выбранной полосы частот.
15. Кодирующее устройство по п.1, дополнительно выполненное с возможностью:
кодирования поля управляющих данных, включающего в себя:
- 0 бит данных, соответствующих полосе частот NB;
- 1 бит данных, соответствующий полосе частот NB, WB;
- 2 бита данных, соответствующих полосе частот NB, WB, SSWB;
- 2 бита данных, соответствующих полосе частот NB, WB, SSWB, SWB;
- 3 бита данных, соответствующих полосе частот NB, WB, SSWB, SWB, FB.
16. Кодирующее устройство по п.5, в котором по меньшей мере одна оценка энергии выполняется следующим образом:
17. Кодирующее устройство по п.1, дополнительно содержащее инструмент (33) TNS, выполненный с возможностью выполнения операции фильтрации, включающей в себя вычисление операции фильтрации:
для каждого k=0..8
где
и
где X(k) - коэффициенты MDCT, или MDST, или FD, sub_start(f, s) и sub_stop(f, s) ассоциированы с конкретной полосой частот, обнаруженной средством (39) обнаружения и управления полосы частот кодера.
18. Кодирующее устройство по п.1, дополнительно содержащее средство (36) оценки шума, выполненное с возможностью оценки уровня шума с использованием
где gg указывает на глобальное усиление, INF(k) - на идентификацию спектральных линий, на которых уровень шума должен оцениваться, и Xf(k) - сигнал.
19. Декодирующее устройство (40, 40a), содержащее множество инструментов (43-48a) декодера FD для декодирования информационного сигнала, кодированного в битовом потоке, причем
инструменты декодера FD разделены:
- на подгруппу, содержащую по меньшей мере один инструмент (43, 45) декодера FD;
- на остальные инструменты декодера FD, содержащие по меньшей мере один инструмент (44, 46, 48a) декодера FD;
причем декодирующее устройство (40, 40a) выполнено таким образом, что по меньшей мере один из множества инструментов декодера из подгруппы (43, 45) выполняет обработку сигналов для другой полосы частот относительно по меньшей мере одного из остальных инструментов декодера FD из множества инструментов (44, 46, 48a) декодера.
20. Декодирующее устройство по п.19, дополнительно содержащее средство (49) управления полосы частот, выполненное с возможностью:
выбора полосы частот на основании информации полосы частот.
21. Декодирующее устройство по п.19, в котором:
подгруппа содержит по меньшей мере одно из инструмента (43) заполнения шума декодера и/или декодера (45) формы временного шума, TNS.
22. Декодирующее устройство по п.19, в котором:
по меньшей мере один из остальных инструментов декодера FD является по меньшей мере одним из инструмента линейного кодирования с предсказанием, LPC, декодера, инструмента формирования спектрального шума, SNS, инструмента глобального усиления декодера, инструмента формирования MDCT или MDST или другого инструмента формирования на основе другого преобразования.
23. Декодирующее устройство по п.19, дополнительно выполненное с возможностью:
управления полосой частот по меньшей мере одного из множества инструментов декодера в подгруппе между:
по меньшей мере первой полосой частот, общей для по меньшей мере одного из остальных инструментов декодера FD; и
по меньшей мере второй полосой частот, отличной от первой полосы частот.
24. Декодирующее устройство по п.19, в котором по меньшей мере один из остальных инструментов декодера FD выполнен с возможностью работы на полной полосе частот.
25. Декодирующее устройство по п.19, в котором по меньшей мере один из остальных инструментов декодера FD выполнен с возможностью работы в открытой цепи относительно выбранной полосы частот.
26. Декодирующее устройство по п.19, дополнительно выполненное с возможностью:
выбора полосы частот из конечного количества полос частот и/или из набора заданных полос частот.
27. Декодирующее устройство по п.19, дополнительно выполненное с возможностью:
выполнения выбора из по меньшей мере одной или комбинации из: 8 кГц, 16 кГц, 24 кГц, 32 кГц и 48 кГц и/или NB, WB, SSWB, SWB, FB.
28. Декодирующее устройство по п.19, дополнительно содержащее инструмент (43) заполнения шума, выполненный с возможностью применения уровня шума с использованием индексов, обеспеченных формулой
где bw stop получается на основании информации полосы частот в битовом потоке.
29. Декодирующее устройство по п.19, дополнительно содержащее декодер (45) TNS, выполненный с возможностью выполнения:
30. Система, содержащая кодирующее устройство и декодирующее устройство, причем кодирующее устройство соответствует п.1 и/или декодирующее устройство соответствует п.19.
31. Способ кодирования информационного сигнала согласно по меньшей мере множеству операций в частотной области, FD, причем способ содержит этапы, на которых:
выбирают полосу частот для подгруппы операций FD;
выполняют первые операции обработки сигналов в полосе частот для подгруппы операций FD;
выполняют вторые операции обработки сигналов в другой полосе частот для операций FD, которые не находятся в подгруппе.
32. Способ декодирования битового потока с информационным сигналом и управляющими данными (39a), причем способ содержит множество операций обработки сигналов в частотной области, FD, причем способ содержит этапы, на которых:
выбирают вариант полосы частот для подгруппы операций FD на основании управляющих данных (39a);
выполняют первые операции обработки сигналов в полосе частот для подгруппы операций FD;
выполняют вторые операции обработки сигналов в другой полосе частот для операций FD, которые не находятся в подгруппе.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17201082.9A EP3483882A1 (en) | 2017-11-10 | 2017-11-10 | Controlling bandwidth in encoders and/or decoders |
EP17201082.9 | 2017-11-10 | ||
PCT/EP2018/080335 WO2019091977A1 (en) | 2017-11-10 | 2018-11-06 | Controlling bandwidth in encoders and/or decoders |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2752520C1 true RU2752520C1 (ru) | 2021-07-28 |
Family
ID=60301903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2020118947A RU2752520C1 (ru) | 2017-11-10 | 2018-11-06 | Управление полосой частот в кодерах и/или декодерах |
Country Status (18)
Country | Link |
---|---|
US (1) | US11462226B2 (ru) |
EP (2) | EP3483882A1 (ru) |
JP (1) | JP7003253B2 (ru) |
KR (1) | KR102426033B1 (ru) |
CN (1) | CN111344784B (ru) |
AR (1) | AR113479A1 (ru) |
AU (1) | AU2018363698B2 (ru) |
BR (1) | BR112020009034A2 (ru) |
CA (1) | CA3080907C (ru) |
ES (1) | ES2898281T3 (ru) |
MX (1) | MX2020004779A (ru) |
PL (1) | PL3707713T3 (ru) |
PT (1) | PT3707713T (ru) |
RU (1) | RU2752520C1 (ru) |
SG (1) | SG11202004171WA (ru) |
TW (1) | TWI691954B (ru) |
WO (1) | WO2019091977A1 (ru) |
ZA (1) | ZA202002082B (ru) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112530444B (zh) * | 2019-09-18 | 2023-10-03 | 华为技术有限公司 | 音频编码方法和装置 |
CN113643713B (zh) * | 2021-10-13 | 2021-12-24 | 北京百瑞互联技术有限公司 | 一种蓝牙音频编码方法、装置及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101140759B (zh) * | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及*** |
US8473301B2 (en) * | 2007-11-02 | 2013-06-25 | Huawei Technologies Co., Ltd. | Method and apparatus for audio decoding |
US8554549B2 (en) * | 2007-03-02 | 2013-10-08 | Panasonic Corporation | Encoding device and method including encoding of error transform coefficients |
WO2016142337A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US20170103769A1 (en) * | 2014-03-21 | 2017-04-13 | Nokia Technologies Oy | Methods, apparatuses for forming audio signal payload and audio signal payload |
US20170221495A1 (en) * | 2011-04-21 | 2017-08-03 | Samsung Electronics Co., Ltd. | Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefore |
RU2016105619A (ru) * | 2013-07-22 | 2017-08-23 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для декодирования или кодирования звукового сигнала с использованием значений информации энергии для полосы частот восстановления |
Family Cites Families (176)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3639753A1 (de) | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
US5233660A (en) | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JPH05281996A (ja) | 1992-03-31 | 1993-10-29 | Sony Corp | ピッチ抽出装置 |
IT1270438B (it) | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
US5581653A (en) | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
JP3402748B2 (ja) | 1994-05-23 | 2003-05-06 | 三洋電機株式会社 | 音声信号のピッチ周期抽出装置 |
JPH0811644A (ja) | 1994-06-27 | 1996-01-16 | Nissan Motor Co Ltd | ルーフモール取付構造 |
US6167093A (en) | 1994-08-16 | 2000-12-26 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission |
EP0732687B2 (en) | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
US5781888A (en) | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
WO1997027578A1 (en) | 1996-01-26 | 1997-07-31 | Motorola Inc. | Very low bit rate time domain speech analyzer for voice messaging |
US5812971A (en) | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
JPH1091194A (ja) | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
US6570991B1 (en) | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
GB2326572A (en) | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
AU9404098A (en) | 1997-09-23 | 1999-04-12 | Voxware, Inc. | Scalable and embedded codec for speech and audio signals |
JP3344962B2 (ja) | 1998-03-11 | 2002-11-18 | 松下電器産業株式会社 | オーディオ信号符号化装置、及びオーディオ信号復号化装置 |
US6507814B1 (en) | 1998-08-24 | 2003-01-14 | Conexant Systems, Inc. | Pitch determination using speech classification and prior pitch estimation |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US7302396B1 (en) | 1999-04-27 | 2007-11-27 | Realnetworks, Inc. | System and method for cross-fading between audio streams |
US6735561B1 (en) | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
EP1139665A1 (en) | 2000-03-29 | 2001-10-04 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for changing the output delay of audio or video data encoding |
US7099830B1 (en) | 2000-03-29 | 2006-08-29 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US6665638B1 (en) | 2000-04-17 | 2003-12-16 | At&T Corp. | Adaptive short-term post-filters for speech coders |
US7395209B1 (en) | 2000-05-12 | 2008-07-01 | Cirrus Logic, Inc. | Fixed point audio decoding system and method |
WO2002101717A2 (en) | 2001-06-11 | 2002-12-19 | Ivl Technologies Ltd. | Pitch candidate selection method for multi-channel pitch detectors |
US7512535B2 (en) | 2001-10-03 | 2009-03-31 | Broadcom Corporation | Adaptive postfiltering methods and systems for decoding speech |
US6785645B2 (en) | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7433824B2 (en) | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4287637B2 (ja) | 2002-10-17 | 2009-07-01 | パナソニック株式会社 | 音声符号化装置、音声符号化方法及びプログラム |
ES2273216T3 (es) | 2003-02-11 | 2007-05-01 | Koninklijke Philips Electronics N.V. | Codificacion de audio. |
KR20030031936A (ko) | 2003-02-13 | 2003-04-23 | 배명진 | 피치변경법을 이용한 단일 음성 다중 목소리 합성기 |
US20040162866A1 (en) | 2003-02-19 | 2004-08-19 | Malvar Henrique S. | System and method for producing fast modulated complex lapped transforms |
JP2006527864A (ja) | 2003-06-17 | 2006-12-07 | 松下電器産業株式会社 | 受信機器、送信機器および伝送システム |
EP1642265B1 (en) | 2003-06-30 | 2010-10-27 | Koninklijke Philips Electronics N.V. | Improving quality of decoded audio by adding noise |
US7620545B2 (en) | 2003-07-08 | 2009-11-17 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
KR100550003B1 (ko) | 2003-07-11 | 2006-02-08 | 학교법인연세대학교 | 상호부호화기에서 개회로 피치 추정 방법 및 그 장치 |
AU2003302486A1 (en) | 2003-09-15 | 2005-04-06 | Zakrytoe Aktsionernoe Obschestvo Intel | Method and apparatus for encoding audio |
US7009533B1 (en) | 2004-02-13 | 2006-03-07 | Samplify Systems Llc | Adaptive compression and decompression of bandlimited signals |
KR20050087956A (ko) | 2004-02-27 | 2005-09-01 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
DE602005005640T2 (de) | 2004-03-01 | 2009-05-14 | Dolby Laboratories Licensing Corp., San Francisco | Mehrkanalige audiocodierung |
DE102004009949B4 (de) | 2004-03-01 | 2006-03-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes |
DE102004009954B4 (de) | 2004-03-01 | 2005-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals |
EP1722359B1 (en) | 2004-03-05 | 2011-09-07 | Panasonic Corporation | Error conceal device and error conceal method |
US7392195B2 (en) | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
CA2603246C (en) | 2005-04-01 | 2012-07-17 | Qualcomm Incorporated | Systems, methods, and apparatus for anti-sparseness filtering |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US7546240B2 (en) | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
KR20070037945A (ko) | 2005-10-04 | 2007-04-09 | 삼성전자주식회사 | 오디오 신호의 부호화/복호화 방법 및 장치 |
US20070118361A1 (en) | 2005-10-07 | 2007-05-24 | Deepen Sinha | Window apparatus and method |
KR100888474B1 (ko) | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
US7805297B2 (en) | 2005-11-23 | 2010-09-28 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
WO2007070007A1 (en) | 2005-12-14 | 2007-06-21 | Matsushita Electric Industrial Co., Ltd. | A method and system for extracting audio features from an encoded bitstream for audio classification |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
US8345890B2 (en) | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
EP1991986B1 (en) | 2006-03-07 | 2019-07-31 | Telefonaktiebolaget LM Ericsson (publ) | Methods and arrangements for audio coding |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
US20090204397A1 (en) | 2006-05-30 | 2009-08-13 | Albertus Cornelis Den Drinker | Linear predictive coding of an audio signal |
CN1983909B (zh) | 2006-06-08 | 2010-07-28 | 华为技术有限公司 | 一种丢帧隐藏装置和方法 |
US8015000B2 (en) | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
JP5096468B2 (ja) | 2006-08-15 | 2012-12-12 | ドルビー ラボラトリーズ ライセンシング コーポレイション | サイド情報なしの時間的ノイズエンベロープの自由な整形 |
FR2905510B1 (fr) | 2006-09-01 | 2009-04-10 | Voxler Soc Par Actions Simplif | Procede d'analyse en temps reel de la voix pour le controle en temps reel d'un organe numerique et dispositif associe |
US7752038B2 (en) | 2006-10-13 | 2010-07-06 | Nokia Corporation | Pitch lag estimation |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
KR101292771B1 (ko) | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
JPWO2008072701A1 (ja) | 2006-12-13 | 2010-04-02 | パナソニック株式会社 | ポストフィルタおよびフィルタリング方法 |
FR2912249A1 (fr) | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
CN101308658B (zh) * | 2007-05-14 | 2011-04-27 | 深圳艾科创新微电子有限公司 | 一种基于片上***的音频解码器及其解码方法 |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
US20110022924A1 (en) | 2007-06-14 | 2011-01-27 | Vladimir Malenovsky | Device and Method for Frame Erasure Concealment in a PCM Codec Interoperable with the ITU-T Recommendation G. 711 |
JP4928366B2 (ja) | 2007-06-25 | 2012-05-09 | 日本電信電話株式会社 | ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 |
JP4572218B2 (ja) | 2007-06-27 | 2010-11-04 | 日本電信電話株式会社 | 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体 |
US10795949B2 (en) | 2007-07-26 | 2020-10-06 | Hamid Hatami-Hanza | Methods and systems for investigation of compositions of ontological subjects and intelligent systems therefrom |
WO2009027606A1 (fr) | 2007-08-24 | 2009-03-05 | France Telecom | Codage/decodage par plans de symboles, avec calcul dynamique de tables de probabilites |
EP2186087B1 (en) | 2007-08-27 | 2011-11-30 | Telefonaktiebolaget L M Ericsson (PUBL) | Improved transform coding of speech and audio signals |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
WO2009066869A1 (en) | 2007-11-21 | 2009-05-28 | Electronics And Telecommunications Research Institute | Frequency band determining method for quantization noise shaping and transient noise shaping method using the same |
KR101162275B1 (ko) | 2007-12-31 | 2012-07-04 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US8386271B2 (en) | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
AU2009256551B2 (en) | 2008-06-13 | 2015-08-13 | Nokia Technologies Oy | Method and apparatus for error concealment of encoded audio data |
EP2346030B1 (en) | 2008-07-11 | 2014-10-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method for encoding an audio signal and computer program |
KR101227729B1 (ko) | 2008-07-11 | 2013-01-29 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 샘플 오디오 신호의 프레임을 인코딩하기 위한 오디오 인코더 및 디코더 |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
RU2520402C2 (ru) | 2008-10-08 | 2014-06-27 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Переключаемая аудио кодирующая/декодирующая схема с мультиразрешением |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
MX2011007925A (es) | 2009-01-28 | 2011-08-17 | Dten Forschung E V Fraunhofer Ges Zur Foeerderung Der Angewan | Codificador de audio, decodificador de audio, información de audio codificada, métodos para la codificación y decodificación de una señal de audio y programa de computadora. |
JP4945586B2 (ja) | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
US20100223061A1 (en) | 2009-02-27 | 2010-09-02 | Nokia Corporation | Method and Apparatus for Audio Coding |
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
FR2944664A1 (fr) | 2009-04-21 | 2010-10-22 | Thomson Licensing | Dispositif et procede de traitement d'images |
US8428938B2 (en) | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
US8352252B2 (en) | 2009-06-04 | 2013-01-08 | Qualcomm Incorporated | Systems and methods for preventing the loss of information within a speech frame |
KR20100136890A (ko) | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
ES2441069T3 (es) * | 2009-10-08 | 2014-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación |
WO2011044700A1 (en) | 2009-10-15 | 2011-04-21 | Voiceage Corporation | Simultaneous time-domain and frequency-domain noise shaping for tdac transforms |
ES2533098T3 (es) | 2009-10-20 | 2015-04-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de señal de audio, decodificador de señal de audio, método para proveer una representación codificada de un contenido de audio, método para proveer una representación decodificada de un contenido de audio y programa de computación para su uso en aplicaciones de bajo retardo |
MX2012004569A (es) | 2009-10-20 | 2012-06-08 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio, metodo para codificar informacion de audio, metodo para decodificar informacion de audio y programa de computacion que usa la deteccion de un grupo de valores espectrales previamente decodificados. |
US8207875B2 (en) | 2009-10-28 | 2012-06-26 | Motorola Mobility, Inc. | Encoder that optimizes bit allocation for information sub-parts |
US7978101B2 (en) | 2009-10-28 | 2011-07-12 | Motorola Mobility, Inc. | Encoder and decoder using arithmetic stage to compress code space that is not fully utilized |
WO2011065741A2 (ko) | 2009-11-24 | 2011-06-03 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
WO2011086066A1 (en) | 2010-01-12 | 2011-07-21 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a modification of a number representation of a numeric previous context value |
US20110196673A1 (en) | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Concealing lost packets in a sub-band coding decoder |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
FR2961980A1 (fr) | 2010-06-24 | 2011-12-30 | France Telecom | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique |
CA3160488C (en) | 2010-07-02 | 2023-09-05 | Dolby International Ab | Audio decoding with selective post filtering |
CA2806000C (en) | 2010-07-20 | 2016-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using an optimized hash table |
US9082416B2 (en) | 2010-09-16 | 2015-07-14 | Qualcomm Incorporated | Estimating a pitch lag |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
EP2676266B1 (en) | 2011-02-14 | 2015-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Linear prediction based coding scheme using spectral domain noise shaping |
US9270807B2 (en) | 2011-02-23 | 2016-02-23 | Digimarc Corporation | Audio localization using audio signal encoding and recognition |
KR101767175B1 (ko) | 2011-03-18 | 2017-08-10 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 코딩에서의 프레임 요소 길이 전송 |
WO2012152764A1 (en) | 2011-05-09 | 2012-11-15 | Dolby International Ab | Method and encoder for processing a digital stereo audio signal |
FR2977439A1 (fr) | 2011-06-28 | 2013-01-04 | France Telecom | Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard. |
FR2977969A1 (fr) | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
US9363339B2 (en) | 2011-07-12 | 2016-06-07 | Hughes Network Systems, Llc | Staged data compression, including block level long range compression, for data streams in a communications system |
JP5600822B2 (ja) | 2012-01-20 | 2014-10-08 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 正弦波置換を用いた音声符号化および復号化のための装置および方法 |
EP2834814B1 (en) | 2012-04-05 | 2016-03-02 | Huawei Technologies Co., Ltd. | Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder |
US20130282372A1 (en) | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
US9026451B1 (en) | 2012-05-09 | 2015-05-05 | Google Inc. | Pitch post-filter |
WO2013183977A1 (ko) | 2012-06-08 | 2013-12-12 | 삼성전자 주식회사 | 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치 |
GB201210373D0 (en) | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
FR2992766A1 (fr) | 2012-06-29 | 2014-01-03 | France Telecom | Attenuation efficace de pre-echos dans un signal audionumerique |
CN106941004B (zh) | 2012-07-13 | 2021-05-18 | 华为技术有限公司 | 音频信号的比特分配的方法和装置 |
CN102779526B (zh) | 2012-08-07 | 2014-04-16 | 无锡成电科大科技发展有限公司 | 语音信号中基音提取及修正方法 |
US9406307B2 (en) | 2012-08-19 | 2016-08-02 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
US9293146B2 (en) | 2012-09-04 | 2016-03-22 | Apple Inc. | Intensity stereo coding in advanced audio coding |
CN107731237B (zh) | 2012-09-24 | 2021-07-20 | 三星电子株式会社 | 时域帧错误隐藏设备 |
CN103714821A (zh) | 2012-09-28 | 2014-04-09 | 杜比实验室特许公司 | 基于位置的混合域数据包丢失隐藏 |
US9401153B2 (en) | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
US9318116B2 (en) | 2012-12-14 | 2016-04-19 | Disney Enterprises, Inc. | Acoustic data transmission based on groups of audio receivers |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
FR3001593A1 (fr) | 2013-01-31 | 2014-08-01 | France Telecom | Correction perfectionnee de perte de trame au decodage d'un signal. |
EP3125239B1 (en) | 2013-02-05 | 2019-07-17 | Telefonaktiebolaget LM Ericsson (publ) | Method and appartus for controlling audio frame loss concealment |
TWI530941B (zh) | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
MX352092B (es) | 2013-06-21 | 2017-11-08 | Fraunhofer Ges Forschung | Aparato y método para mejorar el ocultamiento del libro de códigos adaptativo en la ocultación similar a acelp empleando una resincronización de pulsos mejorada. |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
CN111009249B (zh) | 2013-10-18 | 2021-06-04 | 弗劳恩霍夫应用研究促进协会 | 编码器/解码器、编码/解码方法和非瞬时性存储介质 |
US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
CA2984562C (en) | 2013-10-31 | 2020-01-14 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
ES2755166T3 (es) | 2013-10-31 | 2020-04-21 | Fraunhofer Ges Forschung | Decodificador de audio y método para proporcionar una información de audio decodificada usando una ocultación de error que modifica una señal de excitación de dominio de tiempo |
BR112016009563B1 (pt) * | 2013-10-31 | 2021-12-21 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Extensão de largura de banda de áudio através da inserção de ruído temporal pré- formado no domínio de frequência |
MX356164B (es) | 2013-11-13 | 2018-05-16 | Fraunhofer Ges Forschung | Codificador para codificar una señal de audio, sistema de audio de transmisión y método para determinar valores de corrección. |
ES2827278T3 (es) | 2014-04-17 | 2021-05-20 | Voiceage Corp | Método, dispositivo y memoria no transitoria legible por ordenador para codificación y decodificación predictiva linealde señales sonoras en la transición entre tramas que tienen diferentes tasas de muestreo |
US9396733B2 (en) | 2014-05-06 | 2016-07-19 | University Of Macau | Reversible audio data hiding |
NO2780522T3 (ru) | 2014-05-15 | 2018-06-09 | ||
EP2963645A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Calculator and method for determining phase correction data for an audio signal |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
EP2980798A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
CN110444219B (zh) | 2014-07-28 | 2023-06-13 | 弗劳恩霍夫应用研究促进协会 | 选择第一编码演算法或第二编码演算法的装置与方法 |
EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP3176781A4 (en) * | 2014-07-28 | 2017-12-27 | Samsung Electronics Co., Ltd. | Method and apparatus for packet loss concealment, and decoding method and apparatus employing same |
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
EP2988300A1 (en) | 2014-08-18 | 2016-02-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Switching of sampling rates at audio processing devices |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US10296959B1 (en) | 2015-03-30 | 2019-05-21 | Audible, Inc. | Automated recommendations of audio narrations |
US9886963B2 (en) | 2015-04-05 | 2018-02-06 | Qualcomm Incorporated | Encoder selection |
US10049684B2 (en) * | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
JP6422813B2 (ja) | 2015-04-13 | 2018-11-14 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法及びプログラム |
US9978400B2 (en) | 2015-06-11 | 2018-05-22 | Zte Corporation | Method and apparatus for frame loss concealment in transform domain |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
KR20170000933A (ko) | 2015-06-25 | 2017-01-04 | 한국전기연구원 | 시간 지연 추정을 이용한 풍력 터빈의 피치 제어 시스템 |
US9830921B2 (en) | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
EP3343558A2 (en) * | 2015-09-04 | 2018-07-04 | Samsung Electronics Co., Ltd. | Signal processing methods and apparatuses for enhancing sound quality |
US9978381B2 (en) | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10219147B2 (en) * | 2016-04-07 | 2019-02-26 | Mediatek Inc. | Enhanced codec control |
US10283143B2 (en) | 2016-04-08 | 2019-05-07 | Friday Harbor Llc | Estimating pitch of harmonic signals |
CN107103908B (zh) | 2017-05-02 | 2019-12-24 | 大连民族大学 | 复调音乐多音高估计方法及伪双谱在多音高估计中的应用 |
-
2017
- 2017-11-10 EP EP17201082.9A patent/EP3483882A1/en not_active Withdrawn
-
2018
- 2018-11-06 BR BR112020009034-4A patent/BR112020009034A2/pt unknown
- 2018-11-06 ES ES18796674T patent/ES2898281T3/es active Active
- 2018-11-06 PT PT187966742T patent/PT3707713T/pt unknown
- 2018-11-06 EP EP18796674.2A patent/EP3707713B1/en active Active
- 2018-11-06 KR KR1020207016100A patent/KR102426033B1/ko active IP Right Grant
- 2018-11-06 AU AU2018363698A patent/AU2018363698B2/en active Active
- 2018-11-06 WO PCT/EP2018/080335 patent/WO2019091977A1/en unknown
- 2018-11-06 JP JP2020524579A patent/JP7003253B2/ja active Active
- 2018-11-06 PL PL18796674T patent/PL3707713T3/pl unknown
- 2018-11-06 RU RU2020118947A patent/RU2752520C1/ru active
- 2018-11-06 CA CA3080907A patent/CA3080907C/en active Active
- 2018-11-06 SG SG11202004171WA patent/SG11202004171WA/en unknown
- 2018-11-06 CN CN201880072654.1A patent/CN111344784B/zh active Active
- 2018-11-06 MX MX2020004779A patent/MX2020004779A/es unknown
- 2018-11-07 TW TW107139532A patent/TWI691954B/zh active
- 2018-11-09 AR ARP180103271A patent/AR113479A1/es active IP Right Grant
-
2020
- 2020-05-04 ZA ZA2020/02082A patent/ZA202002082B/en unknown
- 2020-05-04 US US16/866,280 patent/US11462226B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101140759B (zh) * | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及*** |
US8554549B2 (en) * | 2007-03-02 | 2013-10-08 | Panasonic Corporation | Encoding device and method including encoding of error transform coefficients |
US8473301B2 (en) * | 2007-11-02 | 2013-06-25 | Huawei Technologies Co., Ltd. | Method and apparatus for audio decoding |
US20170221495A1 (en) * | 2011-04-21 | 2017-08-03 | Samsung Electronics Co., Ltd. | Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefore |
RU2016105619A (ru) * | 2013-07-22 | 2017-08-23 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для декодирования или кодирования звукового сигнала с использованием значений информации энергии для полосы частот восстановления |
US20170103769A1 (en) * | 2014-03-21 | 2017-04-13 | Nokia Technologies Oy | Methods, apparatuses for forming audio signal payload and audio signal payload |
WO2016142337A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
Also Published As
Publication number | Publication date |
---|---|
PL3707713T3 (pl) | 2022-01-31 |
CN111344784B (zh) | 2023-08-08 |
CA3080907C (en) | 2023-12-19 |
AR113479A1 (es) | 2020-05-06 |
TWI691954B (zh) | 2020-04-21 |
EP3707713A1 (en) | 2020-09-16 |
MX2020004779A (es) | 2020-08-13 |
US11462226B2 (en) | 2022-10-04 |
AU2018363698B2 (en) | 2020-12-17 |
ZA202002082B (en) | 2021-07-28 |
BR112020009034A2 (pt) | 2020-10-27 |
AU2018363698A1 (en) | 2020-05-21 |
TW201923747A (zh) | 2019-06-16 |
US20200265852A1 (en) | 2020-08-20 |
CN111344784A (zh) | 2020-06-26 |
EP3483882A1 (en) | 2019-05-15 |
EP3707713B1 (en) | 2021-09-22 |
SG11202004171WA (en) | 2020-06-29 |
CA3080907A1 (en) | 2019-05-16 |
PT3707713T (pt) | 2021-12-03 |
KR20200077591A (ko) | 2020-06-30 |
ES2898281T3 (es) | 2022-03-04 |
WO2019091977A1 (en) | 2019-05-16 |
JP7003253B2 (ja) | 2022-01-20 |
JP2021502591A (ja) | 2021-01-28 |
KR102426033B1 (ko) | 2022-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11854561B2 (en) | Low-frequency emphasis for LPC-based coding in frequency domain | |
US11335355B2 (en) | Estimating noise of an audio signal in the log2-domain | |
RU2762301C2 (ru) | Устройство и способ для кодирования и декодирования аудиосигнала с использованием понижающей дискретизации или интерполяции масштабных параметров | |
CA2899080A1 (en) | Apparatus and method for generating a frequency enhancement signal using an energy limitation operation | |
RU2752520C1 (ru) | Управление полосой частот в кодерах и/или декодерах | |
TWI793666B (zh) | 對多頻道音頻信號的頻道使用比例參數的聯合編碼的音頻解碼器、音頻編碼器和相關方法以及電腦程式 | |
TWI841856B (zh) | 音頻量化器和音頻去量化器及相關方法以及電腦程式 |