RU2012119260A - Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров) - Google Patents

Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров) Download PDF

Info

Publication number
RU2012119260A
RU2012119260A RU2012119260/08A RU2012119260A RU2012119260A RU 2012119260 A RU2012119260 A RU 2012119260A RU 2012119260/08 A RU2012119260/08 A RU 2012119260/08A RU 2012119260 A RU2012119260 A RU 2012119260A RU 2012119260 A RU2012119260 A RU 2012119260A
Authority
RU
Russia
Prior art keywords
aliasing
signal
audio content
audio
linear prediction
Prior art date
Application number
RU2012119260/08A
Other languages
English (en)
Other versions
RU2591011C2 (ru
Inventor
Бруно БЕССЕТТ
Макс НУЕНДОРФ
Ральф ГАЙГЕР
Филипп ГУРНЕЙ
Рох ЛЕФЕБВРЕ
Бернхард ГРИЛЛ
Джереми ЛЕКОМТЕ
Стефан БАЙЕР
Николаус РЕТТЕЛБАХ
Ларс ВИЛЛЕМОЕС
Редван САЛАМИ
Альбертус С. Ден БРИНКЕР
Original Assignee
Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.
Войсэйдж Корпорэйшн.
Конинкляйке Филипс Электроникс Н.В.
Долби Интернэшионал АБ.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф., Войсэйдж Корпорэйшн., Конинкляйке Филипс Электроникс Н.В., Долби Интернэшионал АБ. filed Critical Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.
Publication of RU2012119260A publication Critical patent/RU2012119260A/ru
Application granted granted Critical
Publication of RU2591011C2 publication Critical patent/RU2591011C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • G10L2019/0008Algebraic codebooks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

1. Декодер аудиосигнала (200; 360; 900), формирующий декодированное представление (212; 399; 998) аудиоконтента на основе кодированного представления (210; 361; 901) аудиоконтента, включающий в себя: тракт области трансформанты (230, 240, 242, 250, 260; 270, 280; 380; 930), формирующий представление во временной области (212; 386; 938) фрагмента аудиоконтента, закодированного в режиме трансформанты на базе первого набора (220; 382; 944а) спектральных коэффициентов, представления (224; 936) сигнала стимуляции антиалиасинга и множества параметров области линейного предсказания (LPD) (222; 384; 950а); при этом тракт области трансформанты включает в себя спектральный процессор (230; 380е; 945), выполненный с возможностью применения операции формирования спектра к первому набору (944а) спектральных коэффициентов, исходя из, по меньшей мере, подмножества параметров области линейного предсказания, с выведением рассчитанного по форме спектра варианта (232; 380g; 945a) первого набора спектральных коэффициентов; одновременно тракт области трансформанты включает в себя первый преобразователь из частотной области во временную область (частотно-временной преобразователь) (240; 380h; 946), выполненный с возможностью формирования представления аудиоконтента во временной области на основе рассчитанного по форме спектра варианта первого набора спектральных коэффициентов; кроме того, тракт области трансформанты включает в себя фильтр сигнала стимуляции антиалиасинга (250; 964), генерирующий сигнал возбуждения компенсации наложения спектров (антиалиасинга) (224; 963а) в зависимости от, по меньшей мере, подмножества параметров области линейного предсказания (222; 384; 934) с выводом сигнала, синтезированного бе

Claims (17)

1. Декодер аудиосигнала (200; 360; 900), формирующий декодированное представление (212; 399; 998) аудиоконтента на основе кодированного представления (210; 361; 901) аудиоконтента, включающий в себя: тракт области трансформанты (230, 240, 242, 250, 260; 270, 280; 380; 930), формирующий представление во временной области (212; 386; 938) фрагмента аудиоконтента, закодированного в режиме трансформанты на базе первого набора (220; 382; 944а) спектральных коэффициентов, представления (224; 936) сигнала стимуляции антиалиасинга и множества параметров области линейного предсказания (LPD) (222; 384; 950а); при этом тракт области трансформанты включает в себя спектральный процессор (230; 380е; 945), выполненный с возможностью применения операции формирования спектра к первому набору (944а) спектральных коэффициентов, исходя из, по меньшей мере, подмножества параметров области линейного предсказания, с выведением рассчитанного по форме спектра варианта (232; 380g; 945a) первого набора спектральных коэффициентов; одновременно тракт области трансформанты включает в себя первый преобразователь из частотной области во временную область (частотно-временной преобразователь) (240; 380h; 946), выполненный с возможностью формирования представления аудиоконтента во временной области на основе рассчитанного по форме спектра варианта первого набора спектральных коэффициентов; кроме того, тракт области трансформанты включает в себя фильтр сигнала стимуляции антиалиасинга (250; 964), генерирующий сигнал возбуждения компенсации наложения спектров (антиалиасинга) (224; 963а) в зависимости от, по меньшей мере, подмножества параметров области линейного предсказания (222; 384; 934) с выводом сигнала, синтезированного без алиасинга (252; 964а), производного от сигнала, стимулирующего антиалиасинг; а также тракт области трансформанты включает в себя комбинатор (260; 978), предназначенный для сведения представления аудиоконтента во временной области (242; 940а) и сигнала, синтезированного с устранением алиасинга (252; 964), или его варианта, прошедшего построцессинг, с формированием на выходе сигнала временной области с компенсированным алиасингом.
2. Декодер аудиосигнала по п.1, представляющий собой мультирежимный аудиодекодер, выполненный с возможностью коммутации между множеством режимов кодирования, в составе которого ветвь (тракт) области трансформанты (230; 240, 250, 260, 270, 280; 380; 930) скомпонована с возможностью селективного синтеза безалиасингового сигнала (252; 964а) для сегмента (1020) аудиоконтента, следующего за сегментом (1010) аудиоконтента, который не предусматривает возможность выполнения операции сложения наложением с нейтрализацией алиасинга, или для сегмента аудиоконтента, за которым следует очередной сегмент (1030) аудиоконтента, который не предусматривает операцию сложения наложением с нейтрализацией алиасинга.
3. Декодер аудиосигнала по п.1, выполненный с возможностью коммутации между режимом области линейного предсказания с возбуждением, закодированным в трансформанте (TCX-LPD), для работы в котором используют информацию о кодах возбуждения в трансформанте (932) и информацию о параметрах области линейного предсказания (934), и режимом частотной области, для работы в котором используют информацию о спектральных коэффициентах (912) и информацию о коэффициентах масштабирования (914); при этом тракт области трансформанты (930) в составе декодера аудиосигнала формирует на основе информации о кодированном в трансформанте возбуждении (932) первый набор (944а) спектральных коэффициентов, и на основе информации о параметрах области линейного предсказания (934) выводит параметры области линейного предсказания (950а); кроме этого, декодер аудиосигнала включает в себя тракт частотной области (910), предназначенный для формирования представления во временной области (918) аудиоконтента, закодированного в режиме частотной области на основе набора спектральных коэффициентов в режиме частотной области (921а), описанных посредством информации о спектральных коэффициентах (912), и исходя из набора (922а) масштабных коэффициентов (922), описанных посредством информации о масштабных коэффициентах (914); при этом в тракт частотной области (910) введен спектральный процессор (923), предназначенный для приложения формы спектра к набору спектральных коэффициентов в режиме частотной области (921а) или к их предобработанной версии в зависимости от набора (922а) коэффициентов масштабирования с выведением рассчитанного по форме спектра набора (923а) спектральных коэффициентов в режиме частотной области, а кроме этого, в тракт частотной области (910) введен частотно-временной преобразователь (924а), предназначенный для формирования представления аудиоконтента во временной области (924) на основе рассчитанного по форме спектра набора спектральных коэффициентов в режиме частотной области (923а); при этом указанный декодер аудиосигнала формирует представления во временной области двух последовательных фрагментов аудиоконтента с временным наложением, которое нейтрализует во временной области алиасинг, возникающий при преобразовании из частотной области во временную область, причем, один из двух названных последовательных фрагментов закодирован в режиме линейного предсказания с кодовым возбуждением из трансформанты (TCX-LPD), а второй фрагмент закодирован в режиме частотной области.
4. Декодер аудиосигнала по п.1, выполненный с возможностью коммутации между режимом области линейного предсказания с возбуждением, закодированным в трансформанте, для работы в котором используют информацию о кодах возбуждения в трансформанте (932) и информацию о параметрах области линейного предсказания (934), и режимом линейного предсказания с возбуждением алгебраическим кодом (ACELP), для работы в котором используют информацию о возбуждении алгебраическим кодом (982) и информацию о параметрах области линейного предсказания (984); в составе которого тракт области трансформанты (930) выполнен с возможностью выведения первого набора (944а) спектральных коэффициентов на основе информация о кодах возбуждения в трансформанте (932) и извлечения параметров области линейного предсказания (950а) из информации о параметрах области линейного предсказания (934); кроме того, декодер аудиосигнала включает в свою схему тракт линейного предсказания с алгебраическим кодовым возбуждением (980), предназначенный для формирования представления во временной области (986) аудиоконтента, закодированного в режиме ACELP, на основе информации об алгебраических кодах возбуждения (982) и информации о параметрах области линейного предсказания (984); при этом тракт ACELP (980) имеет в своем составе процессор возбуждения ACELP (988, 989), генерирующий сигнал возбуждения во временной области (989а) на основе информации о алгебраических кодах возбуждения (982) и с использованием фильтра синтеза (991), вырабатывающего во временной области сигнал возбуждения во временной области для формирования реконструированного сигнала на основе сигнала возбуждения во временной области (989а) и с учетом коэффициентов пропускания фильтра области линейного предсказания (990а), рассчитанных, исходя из информации о параметрах области линейного предсказания (984); далее, тракт области трансформанты (930) в составе декодера аудиосигнала выполнен с возможностью селективно синтезировать безалиасинговый сигнал (964) для фрагмента аудиоконтента, закодированного в режиме области линейного предсказания с кодовым возбуждением из трансформанты (TCX-LPD), следующего за фрагментом аудиоконтента, закодированным в режиме ACELP, и для фрагмента аудиоконтента, закодированного в режиме TCX-LPD, предшествующего фрагменту аудиоконтента, закодированному в режиме ACELP.
5. Декодер аудиосигнала по п.4, в составе которого фильтр стимуляции антиалиасинга (964) генерирует задающий сигнал компенсации наложения спектров (963а), исходя из параметров фильтра области линейного предсказания (950а; LPC1), которые соответствуют левой точке свертывания алиасинга первого частотно-временного преобразователя (946), для фрагмента аудиоконтента, закодированного в режиме TCX-LPD, следующего за фрагментом аудиоконтента, закодированным в режиме ACELP; и в составе которого фильтр стимуляции антиалиасинга (964) генерирует сигналы активации нейтрализации алиасинга (963а), исходя из параметров фильтра области линейного предсказания (950а; LPC2), которые соответствуют правосторонней точке свертывания алиасинга первого частотно-временного преобразователя (946), для фрагмента аудиоконтента, закодированного в режиме TCX-LPD, предшествующего фрагменту аудиоконтента, закодированному в режиме ACELP.
6. Декодер аудиосигнала по п.4, предусматривающий перезагрузку памяти фильтра стимуляции антиалиасинга (964) путем обнуления его значений для обеспечения синтеза безалиасингового сигнала, ввод М отсчетов сигнала стимуляции антиалиасинга в фильтр стимуляции антиалиасинга (964), получение соответствующего отклика на ненулевой ввод в виде отсчетов сигнала безалиасингового синтеза (964а) и последующее получение отклика на нулевой ввод в виде множества отсчетов сигнала безалиасингового синтеза; в составе которого комбинатор предназначен для сведения сигналов представления во временной области (940а) аудиоконтента, содержащего отсчеты отклика на ненулевой входной сигнал и последующие отсчеты отклика на нулевой входной сигнал с выведением сигнала временной области с компенсированным алиасингом на переходе от фрагмента аудиоконтента, закодированного в режиме ACELP к последующему фрагменту аудиоконтента, закодированному в режиме TCX-LPD.
7. Декодер аудиосигнала по п.4, предусматривающий совмещение взвешенного и свернутого варианта (973а; 1060), по меньшей мере, фрагмента представления во временной области, сформированного в режиме ACELP, с представлением во временной области (940; 1050а) следующего фрагмента аудиоконтена, сформированного в режиме TCX-LPD, с целью, по меньшей мере, частичной компенсации наложения спектров (алиасинга).
8. Декодер аудиосигнала по п.4, предусматривающий совмещение взвешенного варианта (976а; 1062) отклика синтезирующего фильтра ветви ACELP на нулевой ввод и представления во временной области (940а; 1058) очередного фрагмента аудиоконтента, сформированного в режиме TCX-LPD, с целью, по меньшей мере, частичной компенсации алиасинга.
9. Декодер аудиосигнала по п.4, выполняющий коммутацию между режимом области линейного предсказания с возбуждением, кодированным в трансформанте, в котором используют частотно-временное преобразование с перекрытием, режимом частотной области, в котором используют частотно-временное преобразование с перекрытием, и режимом линейного предсказания с алгебраическим кодовым возбуждением (ACELP), при этом декодер аудиосигнала, по меньшей мере, частично компенсирует алиасинг на переходе между сегментом аудиоконтента, закодированным в режиме TCX-LPD, и сегментом аудиоконтента, закодированным в режиме частотной области, выполняя операцию сложения наложением временных отсчетов последовательно перекрывающихся фрагментов аудиоконтента; и при этом декодер аудиосигнала, по меньшей мере, частично компенсирует алиасинг на переходе между сегментом аудиоконтента, закодированным в режиме TCX-LPD, и сегментом аудиоконтента, закодированным в режиме области ACELP, используя сигнал антиалиасингового синтеза (964а).
10. Декодер аудиосигнала по п.1, предусматривающий применение общего значения коэффициента усиления (g) для масштабирования усиления (947) представления во временной области (946а), сформированного первым частотно-временным преобразователем (946) в составе тракта области трансформанты (930), и для масштабирования усиления (961) сигнала стимуляции антиалиасинга (963а) или сигнала безалиасингового синтеза (964а).
11. Декодер аудиосигнала по п.1, предусматривающий в дополнение к формированию спектра в соответствии с, по меньшей мере, подмножеством параметров области линейного предсказания деформирование (деконфигурирование) спектра (944) в соответствии с, по меньшей мере, подмножеством из первого набора спектральных коэффициентов, при этом декодер аудиосигнала выполнен с возможностью применения деформирования спектра (962), по меньшей мере, к подмножеству из набора антиалиасинговых спектральных коэффициентов, из которого формируется производный сигнал стимуляции антиалиасинга (963а).
12. Декодер аудиосигнала по п.1, включающий в свой состав второй преобразователь из частотной области во временную область (частотно-временной преобразователь) (963), предназначенный для формирования представления во временной области сигнала, стимулирующего антиалиасинг (963а) в зависимости от набора спектральных коэффициентов (960а), представляющих сигнал стимуляции антиалиасинга, при этом первый частотно-временной преобразователь выполняет преобразование с перекрытием, которое захватывает алиасинг во временной области, и при этом второй частотно-временной преобразователь выполняет преобразование без перекрытия.
13. Декодер аудиосигнала по п.1, который предусматривает применение формирования спектра в отношении первого набора спектральных коэффициентов, исходя из тех же параметров области линейного предсказания, которые используют для настройки фильтрации сигнала стимуляции устранения эффекта наложения спектров (антиалиасинга).
14. Кодер аудиосигнала (100; 800), формирующий кодированное представление (112; 812) звуковых данных, которое включает в себя первый набор (112а; 852) спектральных коэффициентов, представление сигнала стимуляции антиалиасинга (112с; 856) и множество параметров области линейного предсказания (112b; 854) на основе входного представления (110; 810) звуковых данных, имеющий в своем составе: преобразователь из временной области в частотную область (время-частотный преобразователь) (120; 860), предназначенный для обработки представления входящих звуковых данных с формированием представления аудиоконтента в частотной области (112; 861); спектральный процессор (130; 866), предназначенный для применения операции формирования спектра к представлению аудиоконтента в частотной области или к его предварительно обработанной модификации, исходя из набора параметров области линейного предсказания (140; 863) для фрагмента аудиоконтента, кодируемого в области линейного предсказания, с формированием частотного представления аудиоконтента, рассчитанного по форме спектра (132; 867); и драйвер доступа к данным (источник информации) антиалиасинга (150, 870, 874, 875, 876), предназначенный для формирования представления (112с; 856) сигнала стимуляции антиалиасинга таким образом, что в результате фильтрования сигнала стимуляции антиалиасинга в зависимости от, по меньшей мере, подмножества параметров области линейного предсказания синтезируется интиалиасинговый сигнал с устранением артефактов алиасинга на стороне декодера аудиосигнала.
15. Способ формирования декодированного представления аудиоконтента на основе кодированного представления аудиоконтента, включающий в себя: формирование представления во временной области фрагмента аудиоконтента, закодированного в режиме трансформанты с использованием первого набора спектральных коэффициентов, представления сигнала стимуляции антиалиасинга и множества параметров области линейного предсказания, при этом первому набору спектральных коэффициентов задают форму спектра в зависимости от, по меньшей мере, подмножества параметров области линейного предсказания с получением рассчитанного по форме спектра варианта первого набора спектральных коэффициентов, и при этом представление аудиоконтента во временной области формируют, используя частотно-временное преобразование на основе рассчитанного по форме спектра варианта первого набора спектральных коэффициентов, и при этом сигнал стимуляции антиалиасинга фильтруют в зависимости, по меньшей мере, от подмножества параметров области линейного предсказания для синтеза антиалиасингового сигнала, производного от сигнала стимуляции антиалиасинга, и при этом представление аудиоконтента во временной области совмещают с сигналом антиалиасингового синтеза или с его постобработанной версией, получая на выходе сигнал временной области с компенсированным алиасингом.
16. Способ формирования кодированного представления аудиоконтента, состоящего из первого набора спектральных коэффициентов, представления сигнала стимуляции антиалиасинга и множества параметров области линейного предсказания, на основе представления входящих звуковых данных, включающий в себя: преобразование из временной области в частотную область представления входных звуковых данных с формированием в частотной области представления аудиоконтента; формирование спектра частотного представления аудиоконтента или его предварительно обработанной модификации в зависимости от набора параметров области линейного предсказания для фрагмента аудиоконтента, кодируемого в области линейного предсказания, с получением частотного представления аудиоконтента, рассчитанного по форме спектра; и формирование представления сигнала стимуляции антиалиасинга с получением в результате фильтрации сигнала стимуляции антиалиасинга при учете, по меньшей мере, некоторого множества параметров области линейного предсказания сигнала безалиасингового синтеза с нейтрализацией артефактов наложения спектров (алиасинга) на стороне аудиодекодера.
17. Компьютерная программа для осуществления способа по п.15 или 16 при условии ее выполнения на компьютере.
RU2012119260/08A 2009-10-20 2010-10-19 Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров) RU2591011C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US25346809P 2009-10-20 2009-10-20
US61/253,468 2009-10-20
PCT/EP2010/065752 WO2011048117A1 (en) 2009-10-20 2010-10-19 Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation

Publications (2)

Publication Number Publication Date
RU2012119260A true RU2012119260A (ru) 2013-11-20
RU2591011C2 RU2591011C2 (ru) 2016-07-10

Family

ID=43447730

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012119260/08A RU2591011C2 (ru) 2009-10-20 2010-10-19 Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)

Country Status (15)

Country Link
US (1) US8484038B2 (ru)
EP (3) EP2491556B1 (ru)
JP (1) JP5247937B2 (ru)
KR (1) KR101411759B1 (ru)
CN (1) CN102884574B (ru)
AR (1) AR078704A1 (ru)
AU (1) AU2010309838B2 (ru)
BR (1) BR112012009447B1 (ru)
CA (1) CA2778382C (ru)
MX (1) MX2012004648A (ru)
MY (1) MY166169A (ru)
RU (1) RU2591011C2 (ru)
TW (1) TWI430263B (ru)
WO (1) WO2011048117A1 (ru)
ZA (1) ZA201203608B (ru)

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
MX2011000369A (es) * 2008-07-11 2011-07-29 Ten Forschung Ev Fraunhofer Codificador y decodificador de audio para codificar marcos de señales de audio muestreadas.
PL3002750T3 (pl) * 2008-07-11 2018-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder i dekoder audio do kodowania i dekodowania próbek audio
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
JP4977157B2 (ja) 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
EP2446539B1 (en) * 2009-06-23 2018-04-11 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
ES2441069T3 (es) * 2009-10-08 2014-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación
EP3723090B1 (en) * 2009-10-21 2021-12-15 Dolby International AB Oversampling in a combined transposer filter bank
EP2524374B1 (en) * 2010-01-13 2018-10-31 Voiceage Corporation Audio decoding with forward time-domain aliasing cancellation using linear-predictive filtering
EP3422346B1 (en) * 2010-07-02 2020-04-22 Dolby International AB Audio encoding with decision about the application of postfiltering when decoding
JP6100164B2 (ja) * 2010-10-06 2017-03-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法
US8868432B2 (en) * 2010-10-15 2014-10-21 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
PT3239978T (pt) 2011-02-14 2019-04-02 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
PT2676270T (pt) 2011-02-14 2017-05-02 Fraunhofer Ges Forschung Codificação de uma parte de um sinal de áudio utilizando uma deteção de transiente e um resultado de qualidade
KR101424372B1 (ko) 2011-02-14 2014-08-01 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 랩핑 변환을 이용한 정보 신호 표현
BR112013020324B8 (pt) 2011-02-14 2022-02-08 Fraunhofer Ges Forschung Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio
PL2676268T3 (pl) * 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
AR085794A1 (es) 2011-02-14 2013-10-30 Fraunhofer Ges Forschung Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral
JP5762620B2 (ja) 2011-03-28 2015-08-12 ドルビー ラボラトリーズ ライセンシング コーポレイション 低周波数エフェクトチャネルのための複雑さが低減された変換
TWI470622B (zh) * 2012-03-19 2015-01-21 Dolby Lab Licensing Corp 用於低頻效應頻道降低複雜度之轉換
CN103548080B (zh) * 2012-05-11 2017-03-08 松下电器产业株式会社 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法
RU2633107C2 (ru) * 2012-12-21 2017-10-11 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Добавление комфортного шума для моделирования фонового шума при низких скоростях передачи данных
CN105976830B (zh) * 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
RU2612589C2 (ru) 2013-01-29 2017-03-09 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
MX347080B (es) * 2013-01-29 2017-04-11 Fraunhofer Ges Forschung Llenado con ruido sin informacion secundaria para celp (para codificadores tipo celp).
ES2834929T3 (es) * 2013-01-29 2021-06-21 Fraunhofer Ges Forschung Llenado con ruido en la codificación de audio por transformada perceptual
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
HUE054780T2 (hu) * 2013-03-04 2021-09-28 Voiceage Evs Llc Kvantálási zaj csökkentésére szolgáló eszköz és módszer idõtartomány dekóderben
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
BR112015032013B1 (pt) * 2013-06-21 2021-02-23 Fraunhofer-Gesellschaft zur Förderung der Angewandten ForschungE.V. Método e equipamento para a obtenção de coeficientes do espectropara um quadro de substituição de um sinal de áudio, descodificador de áudio,receptor de áudio e sistema para transmissão de sinais de áudio
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
PL3028275T3 (pl) 2013-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób przetwarzania sygnału audio z użyciem kombinacji w zakresie nakładania
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
BR112016010197B1 (pt) 2013-11-13 2021-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador para codificar um sinal áudio, sistema de transmissão de áudio e método para determinar os valores de correção
EP2887350B1 (en) 2013-12-19 2016-10-05 Dolby Laboratories Licensing Corporation Adaptive quantization noise filtering of decoded audio data
EP2916319A1 (en) * 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
EP2980795A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980796A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
EP2980791A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
EP2980797A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
PT3000110T (pt) * 2014-07-28 2017-02-15 Fraunhofer Ges Forschung Seleção de um de entre um primeiro algoritmo de codificação e um segundo algoritmo de codificação com o uso de redução de harmônicos.
CN106448688B (zh) * 2014-07-28 2019-11-05 华为技术有限公司 音频编码方法及相关装置
FR3024582A1 (fr) * 2014-07-29 2016-02-05 Orange Gestion de la perte de trame dans un contexte de transition fd/lpd
FR3024581A1 (fr) * 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
EP2988300A1 (en) * 2014-08-18 2016-02-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Switching of sampling rates at audio processing devices
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
BR112017006325B1 (pt) * 2014-10-02 2023-12-26 Dolby International Ab Método de decodificação e decodificador para o realce de diálogo
EP3067886A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
EP3107096A1 (en) 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
WO2017050398A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
CA2997334A1 (en) * 2015-09-25 2017-03-30 Voiceage Corporation Method and system for encoding left and right channels of a stereo sound signal selecting between two and four sub-frames models depending on the bit budget
WO2020094263A1 (en) 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
CN111210831B (zh) * 2018-11-22 2024-06-04 广州广晟数码技术有限公司 基于频谱拉伸的带宽扩展音频编解码方法及装置
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
WO2020164751A1 (en) 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment
CN117499644A (zh) * 2019-03-14 2024-02-02 北京字节跳动网络技术有限公司 环路整形信息的信令和语法
CN110297357B (zh) 2019-06-27 2021-04-09 厦门天马微电子有限公司 一种曲面背光模组的制备方法、曲面背光模组及显示装置
US11488613B2 (en) * 2019-11-13 2022-11-01 Electronics And Telecommunications Research Institute Residual coding method of linear prediction coding coefficient based on collaborative quantization, and computing device for performing the method
KR20210158108A (ko) 2020-06-23 2021-12-30 한국전자통신연구원 양자화 잡음을 줄이는 오디오 신호의 부호화 및 복호화 방법과 이를 수행하는 부호화기 및 복호화기
KR20220117019A (ko) 2021-02-16 2022-08-23 한국전자통신연구원 학습 모델을 이용한 오디오 신호의 부호화 및 복호화 방법과 그 학습 모델의 트레이닝 방법 및 이를 수행하는 부호화기 및 복호화기
CN115050377A (zh) * 2021-02-26 2022-09-13 腾讯科技(深圳)有限公司 音频转码方法、装置、音频转码器、设备以及存储介质
CN117977635B (zh) * 2024-03-27 2024-06-11 西安热工研究院有限公司 熔盐耦合火电机组的调频方法、装置、电子设备及介质

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
AU2003208517A1 (en) * 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
WO2004097797A1 (en) * 2003-05-01 2004-11-11 Nokia Corporation Method and device for gain quantization in variable bit rate wideband speech coding
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
EP1873753A1 (en) * 2004-04-01 2008-01-02 Beijing Media Works Co., Ltd Enhanced audio encoding/decoding device and method
KR101220621B1 (ko) * 2004-11-05 2013-01-18 파나소닉 주식회사 부호화 장치 및 부호화 방법
RU2351024C2 (ru) * 2005-04-28 2009-03-27 Сименс Акциенгезелльшафт Способ и устройство для подавления шумов
DK1869671T3 (da) * 2005-04-28 2009-10-19 Siemens Ag Fremgangsmåde og anordning til stöjundertrykkelse
CN101589623B (zh) * 2006-12-12 2013-03-13 弗劳恩霍夫应用研究促进协会 对表示时域数据流的数据段进行编码和解码的编码器、解码器以及方法
CN101231850B (zh) * 2007-01-23 2012-02-29 华为技术有限公司 编解码方法及装置
PL2165328T3 (pl) * 2007-06-11 2018-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie i dekodowanie sygnału audio zawierającego część impulsową i część stacjonarną
MY152252A (en) * 2008-07-11 2014-09-15 Fraunhofer Ges Forschung Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
EP2446539B1 (en) * 2009-06-23 2018-04-11 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain

Also Published As

Publication number Publication date
AU2010309838B2 (en) 2014-05-08
AR078704A1 (es) 2011-11-30
CN102884574A (zh) 2013-01-16
US20120271644A1 (en) 2012-10-25
TWI430263B (zh) 2014-03-11
CA2778382C (en) 2016-01-05
RU2591011C2 (ru) 2016-07-10
BR112012009447A2 (pt) 2020-12-01
JP2013508765A (ja) 2013-03-07
AU2010309838A1 (en) 2012-05-31
WO2011048117A1 (en) 2011-04-28
CA2778382A1 (en) 2011-04-28
EP2491556C0 (en) 2024-04-10
MX2012004648A (es) 2012-05-29
EP4358082A1 (en) 2024-04-24
MY166169A (en) 2018-06-07
KR101411759B1 (ko) 2014-06-25
TW201129970A (en) 2011-09-01
ZA201203608B (en) 2013-01-30
EP4362014A1 (en) 2024-05-01
KR20120128123A (ko) 2012-11-26
BR112012009447B1 (pt) 2021-10-13
US8484038B2 (en) 2013-07-09
CN102884574B (zh) 2015-10-14
JP5247937B2 (ja) 2013-07-24
EP2491556A1 (en) 2012-08-29
EP2491556B1 (en) 2024-04-10

Similar Documents

Publication Publication Date Title
RU2012119260A (ru) Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)
RU2012118782A (ru) Кодер аудиосигнала, декодер аудиосигнала, способ кодированного представления аудиоконтента, способ декодированного представления аудиоконтента и компьютерная программа для приложений с малой задержкой
JP2011527446A5 (ru)
JP6173288B2 (ja) マルチモードオーディオコーデックおよびそれに適応されるcelp符号化
RU2011117699A (ru) Переключаемая аудиокодирующая/декодирующая схема с мультиразрешением
RU2015117332A (ru) Избирательный басовый постфильтр
RU2016105613A (ru) Аудиокодер, аудиодекодер и связанные способы с использованием двухканальной обработки в инфраструктуре интеллектуального заполнения интервалов отсутствия сигнала
CN105723452B (zh) 音频信号的频谱的频谱系数的解码方法及解码器
RU2017103100A (ru) Декодер и способ для декодирования аудиосигнала, кодер и способ для кодирования аудиосигнала
JP5749462B2 (ja) オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム
RU2017105448A (ru) Кодер и декодер аудиосигнала, использующие процессор частотной области с заполнением промежутка в полной полосе и процессор временной области
EP2373014A2 (en) Unified speech/audio codec (usac) processing windows sequence based mode switching
RU2012119291A (ru) Многорежимный декодировщик аудиосигнала, многорежимный кодировщик аудио сигналов, способы и компьютерные программы с использованием кодирования с линейным предсказанием на основе ограничения шума
EP2584561A4 (en) DECODING DEVICE, CODING DEVICE AND METHOD THEREFOR
RU2017106099A (ru) Кодер и декодер аудиосигнала , использующие процессор частотной области, процессор временной области и кросспроцессор для непрерывной инициализации
JP2012521012A (ja) 適応的に選択可能な左/右又はミッド/サイド・ステレオ符号化及びパラメトリック・ステレオ符号化の組み合わせに基づいた高度ステレオ符号化
TW200926147A (en) Audio coding using downmix
US11922962B2 (en) Unified speech/audio codec (USAC) processing windows sequence based mode switching
KR20080104065A (ko) 주 구성요소 분석에 의해 다중채널 오디오 신호를 인코딩하기 위한 장치 및 방법
WO2011059254A3 (en) An apparatus for processing a signal and method thereof
RU2014138820A (ru) Управление фазовой когерентностью для гармонических сигналов в перцепционных аудиокодеках
JP2015184470A5 (ru)
CN108053830B (zh) 解码方法、解码装置、和计算机可读取的记录介质
RU2016105704A (ru) Аудиокодирование в частотной области, поддерживающее переключение длины преобразования
EP2862167B1 (en) Method and arrangement for scalable low-complexity audio coding