RU2012119260A

RU2012119260A - Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)

Info

Publication number: RU2012119260A
Application number: RU2012119260/08A
Authority: RU
Inventors: Бруно БЕССЕТТ; Макс НУЕНДОРФ; Ральф ГАЙГЕР; Филипп ГУРНЕЙ; Рох ЛЕФЕБВРЕ; Бернхард ГРИЛЛ; Джереми ЛЕКОМТЕ; Стефан БАЙЕР; Николаус РЕТТЕЛБАХ; Ларс ВИЛЛЕМОЕС; Редван САЛАМИ; Альбертус С. Ден БРИНКЕР
Original assignee: Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.; Войсэйдж Корпорэйшн.; Конинкляйке Филипс Электроникс Н.В.; Долби Интернэшионал АБ.
Priority date: 2009-10-20
Filing date: 2010-10-19
Publication date: 2013-11-20
Also published as: AU2010309838B2; AR078704A1; CN102884574A; US20120271644A1; TWI430263B; CA2778382C; RU2591011C2; BR112012009447A2; JP2013508765A; AU2010309838A1; WO2011048117A1; CA2778382A1; EP2491556C0; MX2012004648A; EP4358082A1; MY166169A; KR101411759B1; TW201129970A; ZA201203608B; EP4362014A1

Abstract

1. Декодер аудиосигнала (200; 360; 900), формирующий декодированное представление (212; 399; 998) аудиоконтента на основе кодированного представления (210; 361; 901) аудиоконтента, включающий в себя: тракт области трансформанты (230, 240, 242, 250, 260; 270, 280; 380; 930), формирующий представление во временной области (212; 386; 938) фрагмента аудиоконтента, закодированного в режиме трансформанты на базе первого набора (220; 382; 944а) спектральных коэффициентов, представления (224; 936) сигнала стимуляции антиалиасинга и множества параметров области линейного предсказания (LPD) (222; 384; 950а); при этом тракт области трансформанты включает в себя спектральный процессор (230; 380е; 945), выполненный с возможностью применения операции формирования спектра к первому набору (944а) спектральных коэффициентов, исходя из, по меньшей мере, подмножества параметров области линейного предсказания, с выведением рассчитанного по форме спектра варианта (232; 380g; 945a) первого набора спектральных коэффициентов; одновременно тракт области трансформанты включает в себя первый преобразователь из частотной области во временную область (частотно-временной преобразователь) (240; 380h; 946), выполненный с возможностью формирования представления аудиоконтента во временной области на основе рассчитанного по форме спектра варианта первого набора спектральных коэффициентов; кроме того, тракт области трансформанты включает в себя фильтр сигнала стимуляции антиалиасинга (250; 964), генерирующий сигнал возбуждения компенсации наложения спектров (антиалиасинга) (224; 963а) в зависимости от, по меньшей мере, подмножества параметров области линейного предсказания (222; 384; 934) с выводом сигнала, синтезированного бе

Claims

1. Декодер аудиосигнала (200; 360; 900), формирующий декодированное представление (212; 399; 998) аудиоконтента на основе кодированного представления (210; 361; 901) аудиоконтента, включающий в себя: тракт области трансформанты (230, 240, 242, 250, 260; 270, 280; 380; 930), формирующий представление во временной области (212; 386; 938) фрагмента аудиоконтента, закодированного в режиме трансформанты на базе первого набора (220; 382; 944а) спектральных коэффициентов, представления (224; 936) сигнала стимуляции антиалиасинга и множества параметров области линейного предсказания (LPD) (222; 384; 950а); при этом тракт области трансформанты включает в себя спектральный процессор (230; 380е; 945), выполненный с возможностью применения операции формирования спектра к первому набору (944а) спектральных коэффициентов, исходя из, по меньшей мере, подмножества параметров области линейного предсказания, с выведением рассчитанного по форме спектра варианта (232; 380g; 945a) первого набора спектральных коэффициентов; одновременно тракт области трансформанты включает в себя первый преобразователь из частотной области во временную область (частотно-временной преобразователь) (240; 380h; 946), выполненный с возможностью формирования представления аудиоконтента во временной области на основе рассчитанного по форме спектра варианта первого набора спектральных коэффициентов; кроме того, тракт области трансформанты включает в себя фильтр сигнала стимуляции антиалиасинга (250; 964), генерирующий сигнал возбуждения компенсации наложения спектров (антиалиасинга) (224; 963а) в зависимости от, по меньшей мере, подмножества параметров области линейного предсказания (222; 384; 934) с выводом сигнала, синтезированного без алиасинга (252; 964а), производного от сигнала, стимулирующего антиалиасинг; а также тракт области трансформанты включает в себя комбинатор (260; 978), предназначенный для сведения представления аудиоконтента во временной области (242; 940а) и сигнала, синтезированного с устранением алиасинга (252; 964), или его варианта, прошедшего построцессинг, с формированием на выходе сигнала временной области с компенсированным алиасингом.

2. Декодер аудиосигнала по п.1, представляющий собой мультирежимный аудиодекодер, выполненный с возможностью коммутации между множеством режимов кодирования, в составе которого ветвь (тракт) области трансформанты (230; 240, 250, 260, 270, 280; 380; 930) скомпонована с возможностью селективного синтеза безалиасингового сигнала (252; 964а) для сегмента (1020) аудиоконтента, следующего за сегментом (1010) аудиоконтента, который не предусматривает возможность выполнения операции сложения наложением с нейтрализацией алиасинга, или для сегмента аудиоконтента, за которым следует очередной сегмент (1030) аудиоконтента, который не предусматривает операцию сложения наложением с нейтрализацией алиасинга.

3. Декодер аудиосигнала по п.1, выполненный с возможностью коммутации между режимом области линейного предсказания с возбуждением, закодированным в трансформанте (TCX-LPD), для работы в котором используют информацию о кодах возбуждения в трансформанте (932) и информацию о параметрах области линейного предсказания (934), и режимом частотной области, для работы в котором используют информацию о спектральных коэффициентах (912) и информацию о коэффициентах масштабирования (914); при этом тракт области трансформанты (930) в составе декодера аудиосигнала формирует на основе информации о кодированном в трансформанте возбуждении (932) первый набор (944а) спектральных коэффициентов, и на основе информации о параметрах области линейного предсказания (934) выводит параметры области линейного предсказания (950а); кроме этого, декодер аудиосигнала включает в себя тракт частотной области (910), предназначенный для формирования представления во временной области (918) аудиоконтента, закодированного в режиме частотной области на основе набора спектральных коэффициентов в режиме частотной области (921а), описанных посредством информации о спектральных коэффициентах (912), и исходя из набора (922а) масштабных коэффициентов (922), описанных посредством информации о масштабных коэффициентах (914); при этом в тракт частотной области (910) введен спектральный процессор (923), предназначенный для приложения формы спектра к набору спектральных коэффициентов в режиме частотной области (921а) или к их предобработанной версии в зависимости от набора (922а) коэффициентов масштабирования с выведением рассчитанного по форме спектра набора (923а) спектральных коэффициентов в режиме частотной области, а кроме этого, в тракт частотной области (910) введен частотно-временной преобразователь (924а), предназначенный для формирования представления аудиоконтента во временной области (924) на основе рассчитанного по форме спектра набора спектральных коэффициентов в режиме частотной области (923а); при этом указанный декодер аудиосигнала формирует представления во временной области двух последовательных фрагментов аудиоконтента с временным наложением, которое нейтрализует во временной области алиасинг, возникающий при преобразовании из частотной области во временную область, причем, один из двух названных последовательных фрагментов закодирован в режиме линейного предсказания с кодовым возбуждением из трансформанты (TCX-LPD), а второй фрагмент закодирован в режиме частотной области.

4. Декодер аудиосигнала по п.1, выполненный с возможностью коммутации между режимом области линейного предсказания с возбуждением, закодированным в трансформанте, для работы в котором используют информацию о кодах возбуждения в трансформанте (932) и информацию о параметрах области линейного предсказания (934), и режимом линейного предсказания с возбуждением алгебраическим кодом (ACELP), для работы в котором используют информацию о возбуждении алгебраическим кодом (982) и информацию о параметрах области линейного предсказания (984); в составе которого тракт области трансформанты (930) выполнен с возможностью выведения первого набора (944а) спектральных коэффициентов на основе информация о кодах возбуждения в трансформанте (932) и извлечения параметров области линейного предсказания (950а) из информации о параметрах области линейного предсказания (934); кроме того, декодер аудиосигнала включает в свою схему тракт линейного предсказания с алгебраическим кодовым возбуждением (980), предназначенный для формирования представления во временной области (986) аудиоконтента, закодированного в режиме ACELP, на основе информации об алгебраических кодах возбуждения (982) и информации о параметрах области линейного предсказания (984); при этом тракт ACELP (980) имеет в своем составе процессор возбуждения ACELP (988, 989), генерирующий сигнал возбуждения во временной области (989а) на основе информации о алгебраических кодах возбуждения (982) и с использованием фильтра синтеза (991), вырабатывающего во временной области сигнал возбуждения во временной области для формирования реконструированного сигнала на основе сигнала возбуждения во временной области (989а) и с учетом коэффициентов пропускания фильтра области линейного предсказания (990а), рассчитанных, исходя из информации о параметрах области линейного предсказания (984); далее, тракт области трансформанты (930) в составе декодера аудиосигнала выполнен с возможностью селективно синтезировать безалиасинговый сигнал (964) для фрагмента аудиоконтента, закодированного в режиме области линейного предсказания с кодовым возбуждением из трансформанты (TCX-LPD), следующего за фрагментом аудиоконтента, закодированным в режиме ACELP, и для фрагмента аудиоконтента, закодированного в режиме TCX-LPD, предшествующего фрагменту аудиоконтента, закодированному в режиме ACELP.

5. Декодер аудиосигнала по п.4, в составе которого фильтр стимуляции антиалиасинга (964) генерирует задающий сигнал компенсации наложения спектров (963а), исходя из параметров фильтра области линейного предсказания (950а; LPC1), которые соответствуют левой точке свертывания алиасинга первого частотно-временного преобразователя (946), для фрагмента аудиоконтента, закодированного в режиме TCX-LPD, следующего за фрагментом аудиоконтента, закодированным в режиме ACELP; и в составе которого фильтр стимуляции антиалиасинга (964) генерирует сигналы активации нейтрализации алиасинга (963а), исходя из параметров фильтра области линейного предсказания (950а; LPC2), которые соответствуют правосторонней точке свертывания алиасинга первого частотно-временного преобразователя (946), для фрагмента аудиоконтента, закодированного в режиме TCX-LPD, предшествующего фрагменту аудиоконтента, закодированному в режиме ACELP.

6. Декодер аудиосигнала по п.4, предусматривающий перезагрузку памяти фильтра стимуляции антиалиасинга (964) путем обнуления его значений для обеспечения синтеза безалиасингового сигнала, ввод М отсчетов сигнала стимуляции антиалиасинга в фильтр стимуляции антиалиасинга (964), получение соответствующего отклика на ненулевой ввод в виде отсчетов сигнала безалиасингового синтеза (964а) и последующее получение отклика на нулевой ввод в виде множества отсчетов сигнала безалиасингового синтеза; в составе которого комбинатор предназначен для сведения сигналов представления во временной области (940а) аудиоконтента, содержащего отсчеты отклика на ненулевой входной сигнал и последующие отсчеты отклика на нулевой входной сигнал с выведением сигнала временной области с компенсированным алиасингом на переходе от фрагмента аудиоконтента, закодированного в режиме ACELP к последующему фрагменту аудиоконтента, закодированному в режиме TCX-LPD.

7. Декодер аудиосигнала по п.4, предусматривающий совмещение взвешенного и свернутого варианта (973а; 1060), по меньшей мере, фрагмента представления во временной области, сформированного в режиме ACELP, с представлением во временной области (940; 1050а) следующего фрагмента аудиоконтена, сформированного в режиме TCX-LPD, с целью, по меньшей мере, частичной компенсации наложения спектров (алиасинга).

8. Декодер аудиосигнала по п.4, предусматривающий совмещение взвешенного варианта (976а; 1062) отклика синтезирующего фильтра ветви ACELP на нулевой ввод и представления во временной области (940а; 1058) очередного фрагмента аудиоконтента, сформированного в режиме TCX-LPD, с целью, по меньшей мере, частичной компенсации алиасинга.

9. Декодер аудиосигнала по п.4, выполняющий коммутацию между режимом области линейного предсказания с возбуждением, кодированным в трансформанте, в котором используют частотно-временное преобразование с перекрытием, режимом частотной области, в котором используют частотно-временное преобразование с перекрытием, и режимом линейного предсказания с алгебраическим кодовым возбуждением (ACELP), при этом декодер аудиосигнала, по меньшей мере, частично компенсирует алиасинг на переходе между сегментом аудиоконтента, закодированным в режиме TCX-LPD, и сегментом аудиоконтента, закодированным в режиме частотной области, выполняя операцию сложения наложением временных отсчетов последовательно перекрывающихся фрагментов аудиоконтента; и при этом декодер аудиосигнала, по меньшей мере, частично компенсирует алиасинг на переходе между сегментом аудиоконтента, закодированным в режиме TCX-LPD, и сегментом аудиоконтента, закодированным в режиме области ACELP, используя сигнал антиалиасингового синтеза (964а).

10. Декодер аудиосигнала по п.1, предусматривающий применение общего значения коэффициента усиления (g) для масштабирования усиления (947) представления во временной области (946а), сформированного первым частотно-временным преобразователем (946) в составе тракта области трансформанты (930), и для масштабирования усиления (961) сигнала стимуляции антиалиасинга (963а) или сигнала безалиасингового синтеза (964а).

11. Декодер аудиосигнала по п.1, предусматривающий в дополнение к формированию спектра в соответствии с, по меньшей мере, подмножеством параметров области линейного предсказания деформирование (деконфигурирование) спектра (944) в соответствии с, по меньшей мере, подмножеством из первого набора спектральных коэффициентов, при этом декодер аудиосигнала выполнен с возможностью применения деформирования спектра (962), по меньшей мере, к подмножеству из набора антиалиасинговых спектральных коэффициентов, из которого формируется производный сигнал стимуляции антиалиасинга (963а).

12. Декодер аудиосигнала по п.1, включающий в свой состав второй преобразователь из частотной области во временную область (частотно-временной преобразователь) (963), предназначенный для формирования представления во временной области сигнала, стимулирующего антиалиасинг (963а) в зависимости от набора спектральных коэффициентов (960а), представляющих сигнал стимуляции антиалиасинга, при этом первый частотно-временной преобразователь выполняет преобразование с перекрытием, которое захватывает алиасинг во временной области, и при этом второй частотно-временной преобразователь выполняет преобразование без перекрытия.

13. Декодер аудиосигнала по п.1, который предусматривает применение формирования спектра в отношении первого набора спектральных коэффициентов, исходя из тех же параметров области линейного предсказания, которые используют для настройки фильтрации сигнала стимуляции устранения эффекта наложения спектров (антиалиасинга).

14. Кодер аудиосигнала (100; 800), формирующий кодированное представление (112; 812) звуковых данных, которое включает в себя первый набор (112а; 852) спектральных коэффициентов, представление сигнала стимуляции антиалиасинга (112с; 856) и множество параметров области линейного предсказания (112b; 854) на основе входного представления (110; 810) звуковых данных, имеющий в своем составе: преобразователь из временной области в частотную область (время-частотный преобразователь) (120; 860), предназначенный для обработки представления входящих звуковых данных с формированием представления аудиоконтента в частотной области (112; 861); спектральный процессор (130; 866), предназначенный для применения операции формирования спектра к представлению аудиоконтента в частотной области или к его предварительно обработанной модификации, исходя из набора параметров области линейного предсказания (140; 863) для фрагмента аудиоконтента, кодируемого в области линейного предсказания, с формированием частотного представления аудиоконтента, рассчитанного по форме спектра (132; 867); и драйвер доступа к данным (источник информации) антиалиасинга (150, 870, 874, 875, 876), предназначенный для формирования представления (112с; 856) сигнала стимуляции антиалиасинга таким образом, что в результате фильтрования сигнала стимуляции антиалиасинга в зависимости от, по меньшей мере, подмножества параметров области линейного предсказания синтезируется интиалиасинговый сигнал с устранением артефактов алиасинга на стороне декодера аудиосигнала.

15. Способ формирования декодированного представления аудиоконтента на основе кодированного представления аудиоконтента, включающий в себя: формирование представления во временной области фрагмента аудиоконтента, закодированного в режиме трансформанты с использованием первого набора спектральных коэффициентов, представления сигнала стимуляции антиалиасинга и множества параметров области линейного предсказания, при этом первому набору спектральных коэффициентов задают форму спектра в зависимости от, по меньшей мере, подмножества параметров области линейного предсказания с получением рассчитанного по форме спектра варианта первого набора спектральных коэффициентов, и при этом представление аудиоконтента во временной области формируют, используя частотно-временное преобразование на основе рассчитанного по форме спектра варианта первого набора спектральных коэффициентов, и при этом сигнал стимуляции антиалиасинга фильтруют в зависимости, по меньшей мере, от подмножества параметров области линейного предсказания для синтеза антиалиасингового сигнала, производного от сигнала стимуляции антиалиасинга, и при этом представление аудиоконтента во временной области совмещают с сигналом антиалиасингового синтеза или с его постобработанной версией, получая на выходе сигнал временной области с компенсированным алиасингом.

16. Способ формирования кодированного представления аудиоконтента, состоящего из первого набора спектральных коэффициентов, представления сигнала стимуляции антиалиасинга и множества параметров области линейного предсказания, на основе представления входящих звуковых данных, включающий в себя: преобразование из временной области в частотную область представления входных звуковых данных с формированием в частотной области представления аудиоконтента; формирование спектра частотного представления аудиоконтента или его предварительно обработанной модификации в зависимости от набора параметров области линейного предсказания для фрагмента аудиоконтента, кодируемого в области линейного предсказания, с получением частотного представления аудиоконтента, рассчитанного по форме спектра; и формирование представления сигнала стимуляции антиалиасинга с получением в результате фильтрации сигнала стимуляции антиалиасинга при учете, по меньшей мере, некоторого множества параметров области линейного предсказания сигнала безалиасингового синтеза с нейтрализацией артефактов наложения спектров (алиасинга) на стороне аудиодекодера.

17. Компьютерная программа для осуществления способа по п.15 или 16 при условии ее выполнения на компьютере.