ES2821025T3

ES2821025T3 - Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada

Info

Publication number: ES2821025T3
Application number: ES16709331T
Authority: ES
Inventors: Bernd Edler; Christian Helmrich; Max Neuendorf; Benjamin Schubert
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2015-03-09
Filing date: 2016-03-07
Publication date: 2021-04-23
Anticipated expiration: 2036-03-07
Also published as: AR122486A2; MX365267B; ZA202204768B; ZA201706604B; JP7078592B2; TWI613644B; RU2017134620A3; WO2016142002A1; EP4297027A3; US10600428B2; JP2020038380A; BR112017019185B1; CA2978815A1; PL3268960T3; MX2017011494A; TW201637002A; RU2707151C2; ZA202204765B; KR102151728B1; ZA202204764B

Abstract

Un codificador (100) para codificar una señal de audio (102), donde el codificador (100) está configurado para codificar la señal de audio (102) en el dominio de la transformada o en el dominio de banco de filtros (104), donde el codificador está configurado para determinar coeficientes espectrales (106_t0_f1:106_t0_f6; 106_t-1_f1:106_t-1_f6) de la señal de audio (102) correspondientes a una trama actual (108_t0) y al menos una trama anterior (108_t-1), donde el codificador (100) está configurado para aplicar selectivamente la codificación predictiva a una pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5), donde el codificador (100) está configurado para determinar un valor de espaciamiento, donde el codificador (100) está configurado para seleccionar la pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) a los cuales se aplica la codificación predictiva sobre la base del valor de espaciamiento; caracterizado porque el valor de espaciamiento es un valor de espaciamiento de armónicos que describe un espaciamiento entre armónicos de la señal de audio (102).

Description

DESCRIPCIÓN

Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada

[0001] Las realizaciones se refieren a la codificación de audio; en particular, a un procedimiento y aparato para codificar una señal de audio empleando la codificación predictiva y a un procedimiento y aparato para decodificar una señal de audio codificada empleando la decodificación predictiva. Las realizaciones preferidas se refieren a procedimientos y aparatos para la predicción espectral adaptada al tono. Otras realizaciones preferidas se refieren a la codificación perceptual de señales de audio tonal por medio de codificación por transformadas con herramientas de predicción en el dominio espectral entre tramas.

[0002] Para mejorar la calidad de las señales tonales codificadas especialmente a bajas tasas de bits, los codificadores de audio por transformada modernos emplean transformadas muy largas y/o predicción a largo plazo o pre/post-filtrado. Sin embargo, una transformada larga implica un largo retraso algorítmico, lo que es inadmisible para situaciones de comunicaciones con bajo retardo. Por consiguiente, los indicadores con muy bajo retardo basados en el tono fundamental instantáneo han cobrado popularidad últimamente. El códec Opus de IETF (del inglés, Internet Engineering Task Force, Fuerza de Tareas de Ingenieros de Internet) utiliza pre- y post-filtrado adaptativo al tono en su trayecto de codificación por CELT (del inglés, Constrained-Energy Lapped Transform, Transformada Traslapada con Energía Restringida en el dominio de la frecuencia [J. M. Valin, K. Vos, y T. Terriberry, “Definition of the Opus audio codec,” 2012, IETF RFC 6716. http://tools.ietf.org/html/rfc67161.], y el códec de 3GPP (del inglés, 3rd Generation Partnership Project, Proyecto Conjunto de Tercera Generación) de EVS (del inglés, Enhanced Voice Services, Servicios de Voz Mejorados) ofrece un post-filtro de armónicos a largo plazo para la mejora perceptual de las señales decodificadas por transformadas [3GPP TS 26.443, “Codec for Enhanced Voice Services (EVS),” Publicación 12, Dic.

2014.]. Estas dos estrategias operan en el dominio del tiempo sobre la forma de onda de la señal completamente decodificada, haciendo que su aplicación sea difícil y/o costosa desde el punto de vista informático de manera selectiva de la frecuencia (ambos esquemas solo ofrecen un simple filtro de paso bajo para cierta selectividad de la frecuencia). Por consiguiente se ofrece una alternativa bienvenida a la predicción a largo plazo en el dominio del tiempo (LTP, del inglés Long Term Prediction) o pre-/post-filtrado (PPF, del inglés Pre-/post-filtering) mediante la predicción en el dominio de la frecuencia (FDP, por sus siglas en inglés Frequency Domain Prediction) como la propuesta en MPEG-2 AAC (por sus siglas en inglés, Moving Picture Expert Group Advanced Audio Coding/Codificación Avanzada de Audio del Grupo de Expertos en Imágenes en Movimiento 2) [ISO/IEC 13818-7, “ Information technology - Part 7: Advanced Audio Coding (AAC),” 2006.]. Este procedimiento, aunque facilita la selectividad de la frecuencia, tiene sus propias desventajas, como se describe a continuación.

[0003] El procedimiento de FDP antes citado tiene dos desventajas con respecto a las demás herramientas. En primer lugar, el procedimiento de FDP requiere una elevada complejidad informática. En detalle, la codificación por predicción lineal de un orden de al menos dos (es decir de los bins de transformación de canales de las dos últimas tramas) se aplica a cientos de bins espectrales por cada trama y canal en el peor de los casos de predicción en todas las bandas de factores de escala [ISO/IEC 13818-7, “ Information technology - Part 7: Advanced Audio Coding (AAC),” 2006.]. En segundo lugar, el procedimiento de FDP comprende una ganancia de predicción total limitada. Más precisamente, la eficiencia de la predicción es limitada porque los componentes ruidos entre las partes espectrales tonales predecibles armónicas, se someten también a la predicción, introduciendo errores, ya que estas partes ruidosas por lo general no son predecibles.

[0004] La elevada complejidad se debe a la retroadaptabilidad de los indicadores. Esto significa que se tienen que calcular los coeficientes de predicción correspondientes a cada bin sobre la base de bins ya transmitidos. Por lo tanto, las imprecisiones numéricas entre el codificador y el decodificador pueden dar lugar a errores debido a los coeficientes de predicción divergentes. Para superar este problema, se debe garantizar una adaptación idéntica con los bits exactos. Además, incluso si se deshabilitan grupos de indicadores en ciertas tramas, siempre se tiene que realizar la adaptación para mantener actualizados los coeficientes de predicción.

[0005] El documento US 2007/0016415 A1 describe técnicas y herramientas para la predicción de coeficientes espectrales en la codificación y decodificación. El espectro completo de una subtrama se divide en múltiples segmentos de tamaño uniforme y la predicción se puede aplicar de forma selectiva sobre una base de segmento.

[0006] Por lo tanto, el objeto de la presente invención es dar a conocer un concepto para la codificación de una señal de audio y/o la decodificación de una señal de audio codificada que evita al menos uno (por ejemplo, ambos) de los problemas antes mencionados y da lugar a una implementación más eficiente y económica desde el punto de vista informático.

[0007] Este objeto se resuelve en las reivindicaciones independientes.

[0008] Las implementaciones ventajosas son abordadas por las reivindicaciones dependientes.

[0009] Según el concepto de la presente invención, la codificación predictiva se aplica (solamente) a coeficientes espectrales seleccionados. Los coeficientes espectrales a los cuales se aplica la codificación predictiva pueden ser seleccionados de conformidad con las características de la señal. Por ejemplo, no aplicando la codificación predictiva a los componentes ruidosos de la señal se evitan los errores antes citados que se introducen por la predicción de componentes ruidosos no predecibles de la señal. Al mismo tiempo se puede reducir la complejidad informática, puesto que solo se aplica la codificación predictiva a componentes espectrales seleccionados.

[0010] Por ejemplo, la codificación perceptual de señales de audio tonal puede ser ejecutada (por ejemplo, por el codificador) por medio de codificación por transformada con procedimientos de predicción entre tramas guiados/adaptativos en el dominio espectral. Se puede incrementar la eficiencia de la predicción en el dominio de la frecuencia (FDP, por sus siglas en inglés) y se puede reducir la complejidad informática aplicando la predicción solo a los coeficientes espectrales, por ejemplo, alrededor de los componentes armónicos de la señal situados en múltiplos enteros de una frecuencia fundamental o tono, lo que puede ser señalizado en un flujo de bits apropiado de un codificador a un decodificador, por ejemplo en forma de valor de espaciamiento. Las realizaciones de la presente invención se pueden implementar o integrar preferentemente en el códec de audio 3D de MPEG-H (por sus siglas en inglés Moving Picture Expert Group-H [High Efficiency]/Grupo de Expertos en Imágenes en Movimiento de Alta Eficiencia), aunque son aplicables a cualquier sistema de codificación de audio por transformadas como, por ejemplo, MPEG-2 AAC (por sus siglas en inglés, Moving Picture Expert Group-2 Advanced Audio Coding/Codificación Avanzada de Audio del Grupo de Expertos en Imágenes en Movimiento-2).

[0011] En este documento se describen las realizaciones de la presente invención haciendo referencia a los dibujos adjuntos, en los cuales:

Fig. 1 ilustra un diagrama esquemático de bloques de un codificador para codificar una señal de audio, según una realización;

Fig. 2 ilustra en un diagrama la amplitud de una señal de audio trazada en la frecuencia correspondiente a una trama actual y los correspondientes coeficientes espectrales seleccionados a los cuales se aplica la codificación predictiva, según una realización;

Fig. 3 ilustra en un diagrama la amplitud de una señal de audio trazada en la frecuencia correspondiente a una trama actual y los correspondientes coeficientes espectrales que son objeto de predicción según MPEG-2 AAC (por sus siglas en inglés, Moving Picture Expert Group-2 Advanced Audio Coding/Codificación Avanzada de Audio del Grupo de Expertos en Imágenes en Movimiento-2);

Fig. 4 ilustra un diagrama esquemático de bloques de un decodificador para decodificar una señal de audio codificada, según una realización;

Fig. 5 ilustra un gráfico de flujo de un procedimiento para codificar una señal de audio, según una realización y Fig. 6 ilustra un gráfico de flujo de un procedimiento para decodificar una señal de audio codificada, según una realización.

[0012] Los elementos iguales o equivalentes con igual o equivalente funcionalidad están indicados en la siguiente descripción por números de referencia iguales o equivalentes.

[0013] En la siguiente descripción, se expone una pluralidad de detalles con el fin de proporcionar una explicación más exhaustiva de las realizaciones de la presente invención. Sin embargo, será evidente para el experto en la materia que la invención puede ser puesta en práctica sin estos detalles específicos. En otros casos, se exponen en forma de diagrama de bloques y no en detalle las estructuras y dispositivos muy conocidos para no complicar las realizaciones de la presente invención. Además, las características de las diferentes realizaciones descritas a continuación pueden combinarse entre sí a menos que se indique específicamente lo contrario.

[0014] La Fig. 1 ilustra un diagrama esquemático de bloques de un codificador 100 para codificar una señal de audio 102, según una realización. El codificador 100 está configurado para codificar la señal de audio 102 en el dominio de la transformada o en el dominio de banco de filtros 104 (por ejemplo, dominio de la frecuencia o dominio espectral), donde el codificador 100 está configurado para determinar coeficientes espectrales 106_t0_f1 a 106_t0_f6 de la señal de audio 102 correspondientes a una trama actual 108_t0 y coeficientes espectrales 106_t-1_f1 a 106_t-1_f6 de la señal de audio correspondientes al menos a una trama anterior 108_t-1. Además, el codificador 100 está configurado para aplicar selectivamente la codificación predictiva a una pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5, donde el codificador 100 está configurado para determinar un valor de espaciamiento, donde el codificador 100 está configurado para seleccionar la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 a los cuales se aplica la codificación predictiva sobre la base del valor de espaciamiento.

[0015] En otras palabras, el codificador 100 está configurado para aplicar selectivamente la codificación predictiva a una pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 seleccionados sobre la base de un único valor de espaciamiento transmitido en forma de información lateral.

[0016] Este valor de espaciamiento puede corresponder a una frecuencia (por ejemplo, una frecuencia fundamental de un tono armónico (de la señal de audio 102)), que define, junto con sus múltiplos enteros, los centros de todos los grupos de coeficientes espectrales a los cuales se aplica la predicción: el primer grupo se puede centrar alrededor de esta frecuencia, el segundo grupo se puede centrar alrededor de esta frecuencia multiplicada por dos, el tercer grupo se puede centrar alrededor de esta frecuencia multiplicada por tres, y así sucesivamente. El conocimiento de estas frecuencias centrales permite el cálculo de los coeficientes de predicción para predecir los correspondientes componentes sinusoides de la señal (por ejemplo, fundamentales y sobretonos de las señales armónicas). Por lo tanto, ya no es necesaria la complicada retroadaptación propensa a errores de los coeficientes de predicción.

[0017] En algunas realizaciones, el codificador 100 puede estar configurado para determinar un valor de espaciamiento por trama.

[0018] En algunas realizaciones, la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 pueden estar separados por al menos un coeficiente espectral 106_t0_f3.

[0019] En algunas realizaciones, el codificador 100 puede estar configurado para aplicar la codificación predictiva a una pluralidad de coeficientes espectrales individuales que están separados por al menos un coeficiente espectral, como por ejemplo dos coeficientes espectrales individuales que están separados por al menos un coeficiente espectral. Además, el codificador 100 puede estar configurado para aplicar la codificación predictiva a una pluralidad de grupos de coeficientes espectrales (donde cada uno de los grupos comprende al menos dos coeficientes espectrales) que están separados por al menos un coeficiente espectral, como por ejemplo dos grupos de coeficientes espectrales que están separados por al menos un coeficiente espectral. Además, el codificador 100 puede estar configurado para aplicar la codificación predictiva a una pluralidad de coeficientes espectrales individuales y/o grupos de coeficientes espectrales que están separados por al menos un coeficiente espectral, como por ejemplo, al menos un coeficiente espectral individual y al menos un grupo de coeficientes espectrales que están separados por al menos un coeficiente espectral.

[0020] En el ejemplo ilustrado en la Fig. 1, el codificador 100 está configurado para determinar seis coeficientes espectrales 106_t0_f1 a 106_t0_f6 correspondientes a la trama actual 108_t0 y seis coeficientes espectrales 106_t-1_f1 a 106_t-1_f6 correspondientes a la trama anterior 108_t-1. Por consiguiente, el codificador 100 está configurado para aplicar selectivamente la codificación predictiva al segundo coeficiente espectral individual 106_t0_f2 de la trama actual y al grupo de coeficientes espectrales que consiste en el cuarto y quinto coeficientes espectrales 106_t0_f4 y 106_t0_f5 de la trama actual 108_t0. Como se puede apreciar, el segundo coeficiente espectral individual 106_t0_f2 y el grupo de coeficientes espectrales que consiste en el cuarto y quinto coeficientes espectrales 106_t0_f4 y 106_t0_f5 están separados entre sí por el tercer coeficiente espectral 106_t0_f3.

[0021] Cabe observar que el término “selectivamente” utilizado en el presente contexto se refiere a la aplicación de la codificación predictiva (solo) a coeficientes espectrales seleccionados. En otras palabras, la codificación predictiva no se aplica necesariamente a todos los coeficientes espectrales, sino solo a coeficientes espectrales individuales o grupos de coeficientes espectrales seleccionados, coeficientes espectrales individuales y/o grupos de coeficientes espectrales seleccionados que pueden estar separados entre sí por al menos un coeficiente espectral. En otras palabras, la codificación predictiva puede ser deshabilitada para al menos un coeficiente espectral por el cual está separada la pluralidad seleccionada de coeficientes espectrales individuales o grupos de coeficientes espectrales.

[0022] En algunas realizaciones, el codificador 100 puede estar configurado para aplicar de manera selectiva la codificación predictiva a una pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 de la trama actual 108_t0 sobre la base de al menos una correspondiente pluralidad de coeficientes espectrales individuales 106_t-1_f2 o grupos de coeficientes espectrales 106_t-1_f4 y 106_t-1_f5 de la trama anterior 108_t-1.

[0023] Por ejemplo, el codificador 100 puede estar configurado para codificar por predicción la pluralidad de coeficientes espectrales individuales 106_t0_f2 o los grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 de la trama actual 108_t0, mediante la codificación de los errores de predicción entre una pluralidad de coeficientes espectrales pronosticados individuales 110_t0_f2 o grupos de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 de la trama actual 108_t0 y la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 de la trama actual (o versiones cuantificadas de los mismos).

[0024] En la Fig. 1, el codificador 100 codifica el coeficiente espectral individual 106_t0_f2 y el grupo de coeficientes espectrales que consiste en los coeficientes espectrales 106_t0_f4 y 106_t0_f5, mediante la codificación de un error de predicción entre el coeficiente espectral individual pronosticado 110_t0_f2 de la trama actual 108_t0 y el coeficiente espectral individual 106_t0_f2 de la trama actual 108_t0 y entre el grupo de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 de la trama actual y el grupo de coeficientes espectrales 106_t0_f4 y 106_t0_f5 de la trama actual.

[0025] En otras palabras, el segundo coeficiente espectral 106_t0_f2 se codifica mediante la codificación del error de predicción (o diferencia) entre el segundo coeficiente espectral pronosticado 110_t0_f2 y el segundo coeficiente espectral (real o determinado) 106_t0_f2, donde el cuarto coeficiente espectral 106_t0_f4 se codifica mediante la codificación del error de predicción (o diferencia) entre el cuarto coeficiente espectral pronosticado 110_t0_f4 y el cuarto coeficiente espectral (real o determinado) 106_t0_f4 y donde el quinto coeficiente espectral 106_t0_f5 se codifica mediante la codificación del error de predicción (o diferencia) entre el quinto coeficiente espectral pronosticado 110_t0_f5 y el quinto coeficiente espectral (real o determinado) 106_t0_f5.

[0026] En una realización, el codificador 100 puede estar configurado para determinar la pluralidad de coeficientes espectrales pronosticados individuales 110_t0_f2 o grupos de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 correspondientes a la trama actual 108_t0 por medio de las correspondientes versiones reales de la pluralidad de coeficientes espectrales individuales 106_t-1_f2 o de los grupos de coeficientes espectrales 106_t-1_f4 y 106_t-1_f5 de la trama anterior 108_t-1.

[0027] En otras palabras, el codificador 100 puede, en el procedimiento de determinación anteriormente descrito, utilizar directamente la pluralidad de coeficientes espectrales individuales reales 106_t-1_f2 o los grupos de coeficientes espectrales reales 106_t-1_f4 y 106_t-1_f5 de la trama anterior 108_t-1, donde 106_t-1_f2, 106_t-1_f4 y 106_t-1_f5 representan los coeficientes espectrales o grupos de coeficientes espectrales originales, aún no cuantificados, respectivamente, tal como son obtenidos por el codificador 100 de tal manera que dicho codificador pueda operar en el dominio de la transformada o en el dominio de banco de filtros 104.

[0028] Por ejemplo, el codificador 100 puede estar configurado para determinar el segundo coeficiente espectral pronosticado 110_t0_f2 de la trama actual 108_t0 sobre la base de una versión correspondiente aún no cuantificada del segundo coeficiente espectral 106_t-1_f2 de la trama anterior 10 108_t-1, el cuarto coeficiente espectral pronosticado 110_t0_f4 de la trama actual 108_t0 sobre la base de una versión correspondiente aún no cuantificada del cuarto coeficiente espectral 106_t-1_f4 de la trama anterior 108_t-1, y el quinto coeficiente espectral pronosticado 110_t0_f5 de la trama actual 108_t0 sobre la base de una versión correspondiente aún no cuantificada del quinto coeficiente espectral 106_t-1_f5 de la trama anterior.

[0029] En virtud de esta estrategia, el esquema de codificación y decodificación predictiva puede exhibir un tipo de modelado armónico del ruido de cuantificación, puesto que un decodificador correspondiente, una realización del cual se describe más adelante con respecto a la Fig. 4, solo puede emplear, en la etapa de determinación antes citada, las versiones cuantificadas transmitidas de la pluralidad de coeficientes espectrales individuales 106_t-1_f2 o de la pluralidad de grupos de coeficientes espectrales 106_t-1_f4 y 106_t-1_f5 de la trama anterior 108_t-1, para una decodificación predictiva.

[0030] Aunque ese tipo de modelado de ruido armónico que se ejecuta tradicionalmente, por ejemplo, por predicción a largo plazo (LTP, por sus siglas en inglés Long-Term Prediction) en el dominio del tiempo, puede ser subjetivamente ventajoso para la codificación predictiva, en algunos casos puede ser desventajoso, puesto que puede llevar a una cantidad excesiva no buscada de tonalidad introducida en una señal de audio decodificada. Por esta razón, en adelante se describe un esquema alternativo de codificación predictiva, que se sincroniza por completo con la correspondiente decodificación y, por ello, solo aprovecha toda ganancia posible de predicción sin llevar al modelado de ruido de cuantificación. Según esta realización de codificación alternativa, el codificador 100 puede estar configurado para determinar la pluralidad de coeficientes espectrales pronosticados individuales 110_t0_f2 o grupos de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 correspondientes a la trama actual 108_t0 usando las versiones cuantificadas correspondientes de la pluralidad de coeficientes espectrales individuales 106_t-1_f2 o los grupos de coeficientes espectrales 106_t-1_f4 y 106_t-1_f5 de la trama anterior 108_t-1.

[0031] Por ejemplo, el codificador 100 puede estar configurado para determinar el segundo coeficiente espectral pronosticado 110_t0_f2 de la trama actual 108_t0 basándose en una versión cuantificada correspondiente del segundo coeficiente espectral 106_t-1_f2 de la trama anterior 108_t-1, el cuarto coeficiente espectral pronosticado 110_t0_f4 de la trama actual 108_t0 sobre la base de una versión cuantificada correspondiente del cuarto coeficiente espectral 106_t-1_f4 de la trama anterior 108_t-1, y el quinto coeficiente espectral pronosticado 110_t0_f5 de la trama actual 108_t0 sobre la base de una versión cuantificada correspondiente del quinto coeficiente espectral 106_t-1_f5 de la trama anterior.

[0032] Asimismo, el codificador 100 puede estar configurado para derivar los coeficientes de predicción 112_f2, 114_f2, 112_f4, 114_f4, 112_f5 y 114_f5 del valor de espaciamiento, y para calcular la pluralidad de coeficientes espectrales pronosticados individuales 110_t0_f2 o grupos de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 correspondientes a la trama actual 108_t0 usando las versiones cuantificadas correspondientes de la pluralidad de coeficientes espectrales individuales 106_t-1_f2 y 106_t-2_f2 o grupos de coeficientes espectrales 106_t-1_f4, 106_t-2_f4, 106_t-1_f5, y 106_t-2_f5 de al menos dos tramas anteriores 108_t-1 y 108_t-2 y utilizando los coeficientes de predicción derivados 112_f2, 114_f2, 112_f4, 114_f4, 112_f5 y 114_f5.

[0033] Por ejemplo, el codificador 100 puede estar configurado para derivar los coeficientes de predicción 112_f2 y 114_f2 correspondientes al segundo coeficiente espectral 106_t0_f2 del valor de espaciamiento, para derivar los coeficientes de predicción 112_f4 y 114_f4 correspondientes al cuarto coeficiente espectral 106_t0_f4 del valor de espaciamiento, y para derivar los coeficientes de predicción 112_f5 y 114_f5 correspondientes al quinto coeficiente espectral 106_t0_f5 del valor de espaciamiento.

[0034] Por ejemplo, la derivación de coeficientes de predicción se puede realizar de la siguiente manera: si el valor de espaciamiento corresponde a una frecuencia f0 o a una versión codificada de la misma, la frecuencia central del k° grupo de coeficientes espectrales para el cual se habilita la predicción es fc=K*f0. Si la frecuencia de muestreo es fs el tamaño del salto de la transformada (desplazamiento entre tramas sucesivas) es N, los coeficientes de predicción ideales del K° grupo, tomando como suposición una señal sinusoide con la frecuencia fc son:

p1 = 2*cos(N*2*pi*fc/fs) y p2 = -1.

[0035] Si, por ejemplo, ambos coeficientes espectrales 106_t0_f4 y 106_t0_f5 están dentro de este grupo, los coeficientes de predicción son:

112_f4 = 112_f5 = 2*cos(N*2*pi*fc/fs) y 114_f4 = 114_f5 = -1.

[0036] Por razones de estabilidad, se puede introducir un factor de atenuación d que da lugar a coeficientes de predicción modificados:

112_f4' = 112_f5' = d*2*cos(N*2*pi*fc/fs), 114_f4' = 114_f5' = d2

[0037] Dado que el valor de espaciamiento se transmite en la señal de audio codificada 120, el decodificador puede derivar exactamente los mismos coeficientes de predicción 212_f4 = 212_f5 = 2*cos(N*2*pi*fc/fs) y 114_f4 = 114_f5 = -1. Si se utiliza un factor de atenuación, se pueden modificar los coeficientes de manera acorde.

[0038] Como se indica en la Fig. 1, el codificador 100 puede estar configurado para emitir una señal de audio codificada 120. Por consiguiente, el codificador 100 puede estar configurado para incluir en la señal de audio codificada 120 versiones cuantificadas de los errores de predicción correspondientes a la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 a los cuales se aplica la codificación predictiva. Además, el codificador 100 puede estar configurado para no incluir los coeficientes de predicción 112_f2 a 114_f5 en la señal de audio codificada 120.

[0039] De este modo, el codificador 100 puede utilizar solo los coeficientes de predicción 112_f2 a 114_f5 para calcular la pluralidad de coeficientes espectrales pronosticados individuales 110_t0_f2 o grupos de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 y de estos los errores de predicción entre el coeficiente espectral individual pronosticado 110_t0_f2 o grupo de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 y el coeficiente espectral individual 106_t0_f2 o grupo de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 de la trama actual, pero no emitir los coeficientes espectrales individuales 106_t0_f4 (o una versión cuantificada de los mismos) o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 (o versiones cuantificadas de los mismos) ni los coeficientes de predicción 112_f2 a 114_f5 en la señal de audio codificada 120. Por consiguiente, un decodificador, una realización del cual se describe más adelante con respecto a la Fig. 4, puede derivar los coeficientes de predicción 112_f2 a 114_f5 para calcular la pluralidad de coeficientes espectrales pronosticados individuales o grupos de coeficientes espectrales pronosticados correspondientes a la trama actual del valor de espaciamiento.

[0040] En otras palabras, el codificador 100 puede estar configurado para emitir la señal de audio codificada 120 que incluye versiones cuantificadas de los errores de predicción en lugar de versiones cuantificadas de la pluralidad de coeficientes espectrales individuales 106_t0_f2 o de los grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 para la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 a los cuales se aplica la codificación predictiva.

[0041] Asimismo, el codificador 100 puede estar configurado para emitir la señal de audio codificada 102 que incluye versiones cuantificadas de los coeficientes espectrales 106_t0_f3 por los cuales está separada la pluralidad de coeficientes espectrales individuales 106_t0_f2 o los grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5, de tal manera que haya una alternancia de los coeficientes espectrales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 de los cuales se incluyen versiones cuantificadas de los errores de predicción en la señal de audio codificada 120 y coeficientes espectrales 106_t0_f3 o grupos de coeficientes espectrales de los cuales se emiten versiones cuantificadas sin emplear la codificación predictiva.

[0042] En algunas realizaciones, el codificador 100 puede estar configurado además para codificar por entropía las versiones cuantificadas de los errores de predicción y las versiones cuantificadas de los coeficientes espectrales 106_t0_f3 por los cuales la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 están separados, y para incluir las versiones codificadas por entropía en la señal de audio codificada 120 (en lugar de las versiones no codificadas por entropía de los mismos).

[0043] La Fig. 2 ilustra, en un diagrama, la amplitud de la señal de audio 102 trazada en la frecuencia correspondiente a una trama actual 108_t0. Además, en la Fig. 2, se indican los coeficientes espectrales en el dominio de la transformada o en el dominio de banco de filtros determinados por el codificador 100 correspondientes a la trama actual 108_t0 de la señal de audio 102.

[0044] Como se ilustra en la Fig. 2, el codificador 100 puede estar configurado para aplicar de manera selectiva la codificación predictiva a una pluralidad de grupos 116_1 a 116_6 de coeficientes espectrales que están separados por al menos un coeficiente espectral. En detalle, en la realización mostrada en la Fig. 2, el codificador 100 aplica selectivamente la codificación predictiva a seis grupos 116_1 a 116_6 de coeficientes espectrales, donde cada uno de los primeros cinco grupos 116_1 a 116_5 de coeficientes espectrales incluye tres coeficientes espectrales (por ejemplo, el segundo grupo 116_2 incluye los coeficientes espectrales 106_t0_f8, 106_t0_f9 y 106_t0_f10), donde el sexto grupo 116_6 de coeficientes espectrales incluye dos coeficientes espectrales. De esa manera, los seis grupos 116_1 a 116_6 de coeficientes espectrales están separados por (cinco) grupos 118_1 a 118_5 de coeficientes espectrales a los cuales no se aplica la codificación predictiva.

[0045] En otras palabras, como se indica en la Fig. 2, el codificador 100 puede estar configurado para aplicar de manera selectiva la codificación predictiva a los grupos 116_1 a 110_6 de coeficientes espectrales, de tal manera que haya una alternancia de los grupos 116_1 a 116_6 de coeficientes espectrales a los cuales se aplica la codificación predictiva y los grupos 118_1 a 118_5 de coeficientes espectrales a los cuales no se aplica la codificación predictiva.

[0046] En algunas realizaciones, el codificador 100 puede estar configurado para determinar un valor de espaciamiento (indicado en la Fig. 2 por las flechas 122_1 y 122_2), donde el codificador 100 puede estar configurado para seleccionar la pluralidad de grupos 116_1 a 116_6 de coeficientes espectrales (o la pluralidad de coeficientes espectrales individuales) a los cuales se aplica la codificación predictiva sobre la base del valor de espaciamiento.

[0047] El valor de espaciamiento puede ser, por ejemplo, un espaciamiento (o distancia) entre dos frecuencias características de la señal de audio 102, tales como los picos 124_1 y 124_2 de la señal de audio. Además, el valor de espaciamiento puede ser un número entero de coeficientes espectrales (o índices de coeficientes espectrales) que aproxima el espaciamiento entre las dos frecuencias características de la señal de audio. Naturalmente, el valor de espaciamiento puede ser también un número real o una fracción o múltiplo del número entero de coeficientes espectrales que describe el espaciamiento entre las dos frecuencias características de la señal de audio.

[0048] En algunas realizaciones, el codificador 100 puede estar configurado para determinar una frecuencia fundamental instantánea de la señal de audio (102) y para derivar el valor de espaciamiento de la frecuencia fundamental instantánea o una fracción o un múltiplo de la misma.

[0049] Por ejemplo, el primer pico 124_1 de la señal de audio 102 puede ser una frecuencia fundamental instantánea (o tono, o primer armónico) de la señal de audio 102. Por lo tanto, el codificador 100 puede estar configurado para determinar la frecuencia fundamental instantánea de la señal de audio 102 y para derivar el valor de espaciamiento de la frecuencia fundamental instantánea o una fracción o un múltiplo de la misma. En ese caso, el valor de espaciamiento puede ser un número entero (o una fracción, o un múltiplo de la misma) de coeficientes espectrales que aproxima el espaciamiento entre la frecuencia fundamental instantánea 124_1 y un segundo armónico 124_2 de la señal de audio 102.

[0050] Naturalmente, la señal de audio 102 puede comprender más de dos armónicos. Por ejemplo, la señal de audio 102 expuesta en la Fig. 2 comprende seis armónicos 124_1 a 124_6 espectralmente distribuidos de tal manera que la señal de audio 102 comprenda un armónico en cada múltiplo entero de la frecuencia fundamental instantánea. Naturalmente, también es posible que la señal de audio 102 no comprenda la totalidad sino algunos de los armónicos, tales como el primero, tercero y quinto armónicos.

[0051] En algunas realizaciones, el codificador 100 puede estar configurado para seleccionar grupos 116_1 a 116_6 de coeficientes espectrales (o coeficientes espectrales individuales) espectralmente dispuestos según una red de armónicos definida por el valor de espaciamiento correspondiente a la codificación predictiva. De esa manera, la red de armónicos definida por el valor de espaciamiento describe la distribución espectral periódica (espaciamiento equidistante) de armónicos en la señal de audio 102. En otras palabras, la red de armónicos definida por el valor de espaciamiento puede ser una secuencia de valores de espaciamiento que describe el espaciamiento equidistante de armónicos de la señal de audio.

[0052] Además, el codificador 100 puede estar configurado para seleccionar coeficientes espectrales (por ejemplo, solo esos coeficientes espectrales), los índices espectrales de los cuales son iguales o se encuentran dentro de un intervalo (por ejemplo, predeterminado o variable) alrededor de una pluralidad de índices espectrales derivados sobre la base del valor de espaciamiento, para una codificación predictiva.

[0053] Del valor de espaciamiento se pueden derivar los índices (o números) de los coeficientes espectrales que representan los armónicos de la señal de audio 102. Por ejemplo, suponiendo que un cuarto coeficiente espectral 106_t0_f4 represente la frecuencia fundamental instantánea de la señal de audio 102 y suponiendo que el valor de espaciamiento sea cinco, se pueden derivar los coeficientes espectrales que tienen el índice nueve sobre la base del valor de espaciamiento. Como se puede apreciar en la Fig. 2, el coeficiente espectral así derivado, que tiene el índice nueve, es decir el noveno coeficiente espectral 106_t0_f9, representa el segundo armónico. De manera similar, se pueden derivar los coeficientes espectrales que tienen los índices 14, 19, 24 y 29, que representan el tercero a sexto armónicos 124_3 a 124_6. Sin embargo, no solo los coeficientes espectrales que tienen los índices iguales a la pluralidad de índices espectrales derivados sobre la base del valor de espaciamiento pueden ser objeto de codificación predictiva, sino también los coeficientes espectrales que tienen los índices dentro de un intervalo dado alrededor de la pluralidad de índices espectrales derivados sobre la base del valor de espaciamiento. Por ejemplo, como se ilustra en la Fig. 2, el intervalo puede ser tres, por lo que no se selecciona una pluralidad de coeficientes espectrales individuales para la codificación predictiva, sino más bien una pluralidad de grupos de coeficientes espectrales.

[0054] Asimismo, el codificador 100 puede estar configurado para seleccionar los grupos 116_1 a 116_6 de coeficientes espectrales (o la pluralidad de coeficientes espectrales individuales) a los cuales se aplica la codificación predictiva de tal manera que haya una alternancia periódica, periódica con una tolerancia de /-1 coeficiente espectral, entre los grupos 116_1 a 116_6 de coeficientes espectrales (o la pluralidad de coeficientes espectrales individuales) a los cuales se aplica la codificación predictiva y los coeficientes espectrales por los cuales están separados los grupos de coeficientes espectrales (o la pluralidad de coeficientes espectrales individuales) a los cuales se aplica la codificación predictiva. La tolerancia de /-1 coeficiente espectral puede ser indispensable cuando una distancia entre dos armónicos de la señal de audio 102 no es igual a un valor de espaciamiento entero (entero con respecto a los índices o números de coeficientes espectrales) sino, por el contrario, a una fracción o múltiplo del mismo. Esto se puede ver asimismo en la Fig. 2 puesto que las flechas 122_1 a 122_6 no siempre apuntan exactamente al centro o punto medio de los correspondientes coeficientes espectrales.

[0055] En otras palabras, la señal de audio 102 puede comprender al menos dos componentes armónicos de la señal 124_1 a 124_6, donde el codificador 100 puede estar configurado para aplicar de manera selectiva la codificación predictiva a la pluralidad de grupos 116_1 a 116_6 de coeficientes espectrales (o coeficientes espectrales individuales) que representan dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 o entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 de la señal de audio 102. Los entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 pueden ser, por ejemplo, /-1, 2, 3, 4 o 5 componentes espectrales.

[0056] Por consiguiente, el codificador 100 puede estar configurado para no aplicar la codificación predictiva a los grupos 118_1 a 118_5 de coeficientes espectrales (o pluralidad de coeficientes espectrales individuales) que no representan dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 o entornos espectrales de dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 de la señal de audio 102. En otras palabras, el codificador 100 puede estar configurado para no aplicar la codificación predictiva a la pluralidad de grupos 118_1 a 118_5 de coeficientes espectrales (o coeficientes espectrales individuales) que pertenecen a un ruido de fondo no tonal entre los armónicos de la señal 124_1 a 124_6.

[0057] Además, el codificador 100 puede estar configurado para determinar un valor de espaciamiento de armónicos que indica un espaciamiento espectral entre dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 de la señal de audio 102, el valor de espaciamiento de los armónicos que indica la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales que representan dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 de la señal de audio 102.

[0058] Por otra parte, el codificador 100 puede estar configurado para proporcionar la señal de audio codificada 120 de tal manera que la señal de audio codificada 120 incluya el valor de espaciamiento (por ejemplo, un valor de espaciamiento por trama) o (de lo contrario) un parámetro a partir del cual se pueda derivar directamente el valor de espaciamiento.

[0059] Las realizaciones de la presente invención abordan los dos problemas antes citados del procedimiento de FDP (por sus siglas en inglés, Frequency Domain Prediction, Predicción en el Dominio de la Frecuencia) mediante la introducción de un valor de espaciamiento de armónicos en el procedimiento de FDP, señalizado desde el codificador (transmisor) 100 a un decodificador respectivo (receptor) de tal manera que ambos puedan operar en forma totalmente sincronizada. Dicho valor de espaciamiento de armónicos puede servir como indicador de una frecuencia fundamental instantánea (o tono) de uno o más espectros asociados a una trama que se va a codificar e identifica qué bins espectrales (coeficientes espectrales) se deben predecir. Más específicamente, solo los coeficientes espectrales que rodean a los componentes armónicos de la señal situados (en función de su indexación) en múltiplos enteros del tono fundamental (definidos por el valor de espaciamiento de los armónicos) se van a someter a la predicción. Las Figs. 2 y 3 ilustran la estrategia de predicción adaptativa al tono por medio de un sencillo ejemplo, en el cual la Fig. 3 ilustra el funcionamiento del indicador del estado actual de la técnica de MPEG-2 AAC (por sus siglas en inglés, Moving Picture Expert Group-2 Advanced Audio Coding/Codificación Avanzada de Audio del Grupo de Expertos en Imágenes en Movimiento-2), que no predice solo alrededor de una red de armónicos sino que somete a cada bin espectral por debajo de una determinada frecuencia final a predicción y donde la Fig. 2 ilustra el mismo indicador con una modificación según una realización integrada para ejecutar la predicción solo de los bins “tonales” que están cerca de la red de espaciamiento de armónicos.

[0060] La comparación de las Figs. 2 y 3 revela dos ventajas de la modificación según una realización, es decir (1) se incluyen muchos menos bins espectrales en el procedimiento de predicción, lo que reduce la complejidad (en el ejemplo dado aproximadamente un 40 %, puesto que solo se predicen tres quintos de los bins) y (2) los bins pertenecientes al ruido de fondo no tonal entre los armónicos de las señales no resultan afectados por la predicción, lo que debe aumentar la eficiencia de la predicción.

[0061] Cabe observar que el valor de espaciamiento de los armónicos no necesariamente debe corresponder al tono instantáneo real de la señal de entrada, sino que podría representar una fracción o múltiplo del tono real si esto ofrece una mejora general de la eficiencia del procedimiento de predicción. Además, se debe hacer hincapié en que el valor de espaciamiento de los armónicos no tiene que reflejar un múltiplo entero de la indexación de bins o unidades de ancho de banda sino que puede incluir una fracción de dichas unidades.

[0062] A continuación, se describe una implementación preferida de un codificador de audio al estilo MPEG (por sus siglas en inglés, Moving Picture Expert Group, Grupo de Expertos en Imágenes en Movimiento).

[0063] La predicción adaptativa al tono está preferentemente integrada a la MPEG-2 AAC (por sus siglas en inglés, Moving Picture Expert Group Advanced Audio Coding/Codificación Avanzada de Audio del Grupo de Expertos en Imágenes en Movimiento 2) [ISO/IEC 13818-7, “Information technology - Part 7: Advanced Audio Coding (AAC),” 2006.] o, utilizando un indicador similar al de la AAC, al códec de audio 3D de MPEG-H (por sus siglas en inglés, Moving Picture Expert Group-High efficiency coding [ISO/IEC 23008-3, “Information technology - High efficiency coding, part 3: 3D audio,” 2015.]. En particular, se puede escribir una bandera de un bit y leerla en un respectivo flujo de bits por cada trama y canal que no sea codificado de manera independiente (correspondiente a canales de tramas independientes, la bandera puede no transmitirse dado que la predicción puede ser deshabilitada para garantizar la independencia). Si se ajusta la bandera a uno, se pueden escribir y leer 8 bits más. Estos 8 bits representan una versión cuantificada (por ejemplo un índice) del valor de espaciamiento de armónicos correspondiente a la trama y canal dados. Empleando el valor de espaciamiento de armónicos derivado de la versión cuantificada mediante el uso de una función de mapeo lineal o no lineal, el procedimiento de predicción se puede llevar a cabo según una realización expuesta en la Fig. 2. De preferencia, solo los bins situados dentro de una distancia máxima de 1,5 bins alrededor de la red de armónicos se someten a la predicción. Por ejemplo, si el valor de espaciamiento de los armónicos indica una línea de armónicos en el índice de bin 47.11, se predicen solamente los bins que están en los índices 46, 47 y 48. Dicha distancia máxima, sin embargo, podría ser especificada de manera diferente, ya sea fijada a-priori para todos los canales y tramas o, por separado, para cada trama y canal sobre la base del valor de espaciamiento de los armónicos. La Fig. 4 ilustra un diagrama esquemático de bloques de un decodificador 200 para decodificar una señal codificada 120. El decodificador 200 está configurado para decodificar la señal de audio codificada 120 en el dominio de la transformada o en el dominio de banco de filtros 204, donde el decodificador 200 está configurado para analizar la señal de audio codificada 120 con el fin de obtener coeficientes espectrales codificados 206_t0_f1 a 206_t0_f6 de la señal de audio correspondientes a una trama actual 208_t0 y coeficientes espectrales codificados 206_t-1_f0 a 206_t-1_f6 correspondientes al menos a una trama anterior 208_t-1 y donde el decodificador 200 está configurado para aplicar selectivamente la decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que están separados por al menos un coeficiente espectral codificado.

[0064] En algunas realizaciones, el decodificador 200 puede estar configurado para aplicar la decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales que están separados por al menos un coeficiente espectral codificado, como por ejemplo dos coeficientes espectrales codificados individuales que están separados por al menos un coeficiente espectral codificado. Además, el decodificador 200 puede estar configurado para aplicar la decodificación predictiva a una pluralidad de grupos de coeficientes espectrales codificados (donde cada uno de los grupos comprende al menos dos coeficientes espectrales codificados) que están separados por al menos un coeficiente espectral codificado, como por ejemplo dos grupos de coeficientes espectrales codificados que están separados por al menos un coeficiente espectral codificado. Además, el decodificador 200 puede estar configurado para aplicar la decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales y/o grupos de coeficientes espectrales codificados que están separados por al menos un coeficiente espectral codificado como, por ejemplo, al menos un coeficiente espectral codificado individual y al menos un grupo de coeficientes espectrales codificados que están separados por al menos un coeficiente espectral codificado.

[0065] En el ejemplo ilustrado en la Fig. 4, el decodificador 200 está configurado para determinar seis coeficientes espectrales codificados 206_t0_f1 a 206_t0_f6 correspondientes a la trama actual 208_t0 y seis coeficientes espectrales codificados 206_t-1_f1 a 206_t-1_f6 correspondientes a la trama anterior 208_t-1. Por consiguiente, el decodificador 200 está configurado para aplicar selectivamente decodificación predictiva al segundo coeficiente espectral codificado individual 206_t0_f2 de la trama actual y al grupo de coeficientes espectrales codificados que consiste en el cuarto y quinto coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 de la trama actual 208_t0. Como se puede apreciar, el segundo coeficiente espectral codificado individual 206_t0_f2 y el grupo de coeficientes espectrales codificados que consiste en el cuarto y quinto coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 están separados entre sí por el tercer coeficiente espectral codificado 206_t0_f3.

[0066] Cabe observar que el término “selectivamente” utilizado en este contexto se refiere a la aplicación de la decodificación predictiva (solo) a coeficientes espectrales codificados seleccionados. En otras palabras, la decodificación predictiva no se aplica a todos los coeficientes espectrales codificados, sino por el contrario solo a coeficientes espectrales individuales o grupos de coeficientes espectrales codificados seleccionados, donde los coeficientes espectrales individuales y/o grupos de coeficientes espectrales codificados seleccionados están separados entre sí por al menos un coeficiente espectral codificado. En otras palabras, no se aplica la decodificación predictiva a dicho al menos un coeficiente espectral codificado por el cual están separados la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados seleccionados.

[0067] En algunas realizaciones el decodificador 200 puede estar configurado para no aplicar la decodificación predictiva a dicho al menos un coeficiente espectral codificado 206_t0_f3 por el cual están separados los coeficientes espectrales codificados individuales 206_t0_f2 o el grupo de coeficientes espectrales 206_t0_f4 y 206_t0_f5.

[0068] El decodificador 200 puede estar configurado para decodificar por entropía los coeficientes espectrales codificados, para obtener errores de predicción cuantificados correspondientes a los coeficientes espectrales 206_t0_f2, 2016_t0_f4 y 206_t0_f5 a los cuales se va a aplicar la decodificación predictiva y coeficientes espectrales cuantificados 206_t0_f3 correspondientes a dicho al menos un coeficiente espectral a los cuales no se va a aplicar la decodificación predictiva. Por lo tanto, el decodificador 200 puede estar configurado para aplicar los errores de predicción cuantificados a una pluralidad de coeficientes espectrales pronosticados individuales 210_t0_f2 o grupos de coeficientes espectrales pronosticados 210_t0_f4 y 210_t0_f5, para obtener, con respecto a la trama actual 208_t0, coeficientes espectrales decodificados asociados a los coeficientes espectrales codificados 206_t0_f2, 206_t0_f4 y 206_t0_f5 a los cuales se aplica la decodificación predictiva.

[0069] Por ejemplo, el decodificador 200 puede estar configurado para obtener un segundo error de predicción cuantificado para un segundo coeficiente espectral cuantificado 206_t0_f2 y para aplicar el segundo error de predicción cuantificado al segundo coeficiente espectral pronosticado 210_t0_f2, para obtener un segundo coeficiente espectral decodificado asociado al segundo coeficiente espectral codificado 206_t0_f2, donde el decodificador 200 puede estar configurado para obtener un cuarto error de predicción cuantificado correspondiente a un cuarto coeficiente espectral cuantificado 206_t0_f4 y para aplicar el cuarto error de predicción cuantificado al cuarto coeficiente espectral pronosticado 210_t0_f4, para obtener un cuarto coeficiente espectral decodificado asociado al cuarto coeficiente espectral codificado 206_t0_f4 y donde el decodificador 200 puede estar configurado para obtener un quinto error de predicción cuantificado correspondiente a un quinto coeficiente espectral cuantificado 206_t0_f5 y para aplicar el quinto error de predicción cuantificado al quinto coeficiente espectral pronosticado 210_t0_f5, para obtener un quinto coeficiente espectral decodificado asociado al quinto coeficiente espectral codificado 206_t0_f5.

[0070] Además, el decodificador 200 puede estar configurado para determinar la pluralidad de coeficientes espectrales pronosticados individuales 210_t0_f2 o grupos de coeficientes espectrales pronosticados 210_t0_f4 y 210_t0_f5 correspondientes a la trama actual 208_t0 basándose en una correspondiente pluralidad de los coeficientes espectrales codificados individuales 206_t-1_f2 (por ejemplo, usando una pluralidad de coeficientes espectrales anteriormente decodificados asociados a la pluralidad de los coeficientes espectrales codificados individuales 206_t-1_f2) o grupos de coeficientes espectrales codificados 206_t-1_f4 y 206_t-1_f5 (por ejemplo, usando grupos de coeficientes espectrales antes decodificados asociados a los grupos de coeficientes espectrales codificados 206_t-1_f4 y 206_t-1_f5) de la trama anterior 208_t-1.

[0071] Por ejemplo, el decodificador 200 puede estar configurado para determinar el segundo coeficiente espectral pronosticado 210_t0_f2 de la trama actual 208_t0 utilizando un segundo coeficiente espectral anteriormente decodificado (cuantificado) asociado al segundo coeficiente espectral codificado 206_t-1_f2 de la trama anterior 208_t-1, al cuarto coeficiente espectral pronosticado 210_t0_f4 de la trama actual 208_t0 usando un cuarto coeficiente espectral anteriormente decodificado (cuantificado) asociado al cuarto coeficiente espectral codificado 206_t-1_f4 de la trama anterior 208_t-1, y al quinto coeficiente espectral pronosticado 210_t0_f5 de la trama actual 208_t0 usando un quinto coeficiente espectral anteriormente decodificado (cuantificado) asociado al quinto coeficiente espectral codificado 206_t-1_f5 de la trama anterior 208_t-1.

[0072] Por otra parte, el decodificador 200 puede estar configurado para derivar los coeficientes de predicción del valor de espaciamiento y donde el decodificador 200 puede estar configurado para calcular la pluralidad de coeficientes espectrales pronosticados individuales 210_t0_f2 o grupos de coeficientes espectrales pronosticados 210_t0_f4 y 210_t0_f5 correspondientes a la trama actual 208_t0 utilizando una correspondiente pluralidad de coeficientes espectrales individuales anteriormente decodificados o grupos de coeficientes espectrales anteriormente decodificados de al menos dos tramas anteriores 208_t-1 y 208_t-2 y utilizando los coeficientes de predicción derivados.

[0073] Por ejemplo, el decodificador 200 puede estar configurado para derivar los coeficientes de predicción 212_f2 y 214_f2 correspondientes al segundo coeficiente espectral codificado 206_t0_f2 del valor de espaciamiento, para derivar coeficientes de predicción 212_f4 y 214_f4 correspondientes al cuarto coeficiente espectral codificado 206_t0_f4 del valor de espaciamiento, y para derivar coeficientes de predicción 212_f5 y 214_f5 correspondientes al quinto coeficiente espectral codificado 206_t0_f5 del valor de espaciamiento.

[0074] Cabe observar que el decodificador 200 puede estar configurado para decodificar la señal de audio codificada 120 con el fin de obtener errores de predicción cuantificados en lugar de una pluralidad de coeficientes espectrales cuantificados individuales o grupos de coeficientes espectrales cuantificados correspondientes a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados a los cuales se aplica la decodificación predictiva.

[0075] Además, el decodificador 200 puede estar configurado para decodificar la señal de audio codificada 120 con el fin de obtener coeficientes espectrales cuantificados por los cuales la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales están separados, de tal manera que haya una alternancia de los coeficientes espectrales codificados 206_t0_f2 o grupos de coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 con respecto a los cuales se obtienen errores de predicción cuantificados y los coeficientes espectrales codificados 206_t0_f3 o grupos de coeficientes espectrales codificados para los cuales se obtienen coeficientes espectrales cuantificados.

[0076] El decodificador 200 puede estar configurado para proporcionar una señal de audio decodificada 220 utilizando los coeficientes espectrales decodificados asociados a los coeficientes espectrales codificados 206_t0_f2, 206_t0_f4 y 206_t0_f5 a los cuales se aplica la decodificación predictiva, y usando los coeficientes espectrales decodificados por entropía asociados a los coeficientes espectrales codificados 206_t0_f1,206_t0_f3 y 206_t0_f6 a los cuales no se aplica la decodificación predictiva.

[0077] En algunas realizaciones, el decodificador 200 puede estar configurado para obtener un valor de espaciamiento, donde el decodificador 200 puede estar configurado para seleccionar la pluralidad de coeficientes espectrales codificados individuales 206_t0_f2 o grupos de coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 a los cuales se aplica la decodificación predictiva sobre la base del valor de espaciamiento.

[0078] Como ya se mencionara anteriormente con respecto a la descripción del correspondiente codificador 100, el valor de espaciamiento puede ser, por ejemplo, un espaciamiento (o distancia) entre dos frecuencias características de la señal de audio. Además, el valor de espaciamiento puede ser un número entero de coeficientes espectrales (o índices de coeficientes espectrales) que aproximan el espaciamiento entre las dos frecuencias características de la señal de audio. Naturalmente, el valor de espaciamiento puede ser también una fracción o múltiplo del número entero de coeficientes espectrales que describe el espaciamiento entre las dos frecuencias características de la señal de audio.

[0079] El decodificador 200 puede estar configurado para seleccionar coeficientes espectrales individuales o grupos de coeficientes espectrales espectralmente dispuestos según una red de armónicos definida por el valor de espaciamiento para una decodificación predictiva. La red de armónicos definida por el valor de espaciamiento puede describir la distribución espectral periódica (espaciamiento equidistante) de armónicos en la señal de audio 102. En otras palabras, la red de armónicos definida por el valor de espaciamiento puede ser una secuencia de valores de espaciamiento que describen el espaciamiento equidistante de los armónicos de la señal de audio 102.

[0080] Por otra parte, el decodificador 200 puede estar configurado para seleccionar coeficientes espectrales (por ejemplo, solo los coeficientes espectrales), cuyos índices espectrales son iguales o se encuentran dentro de un intervalo (por ejemplo, un intervalo predeterminado o variable) alrededor de una pluralidad de índices espectrales derivada sobre la base del valor de espaciamiento, para una decodificación predictiva. Por lo tanto, el decodificador 200 puede estar configurado para establecer una amplitud del intervalo dependiendo del valor de espaciamiento.

[0081] En algunas realizaciones, la señal de audio codificada puede comprender el valor de espaciamiento o una versión codificada del mismo (por ejemplo, un parámetro del cual se deriva directamente el valor de espaciamiento), donde el decodificador 200 puede estar configurado para extraer el valor de espaciamiento o la versión codificada del mismo de la señal de audio codificada para obtener el valor de espaciamiento.

[0082] Por otro lado, el decodificador 200 puede estar configurado para determinar el valor de espaciamiento por sí mismo, es decir que la señal de audio codificada no incluye el valor de espaciamiento. En ese caso, el decodificador 200 puede estar configurado para determinar una frecuencia fundamental instantánea (de la señal de audio codificada 120 que representa la señal de audio 102) y para derivar el valor de espaciamiento de la frecuencia fundamental instantánea o una fracción o un múltiplo de la misma.

[0083] En algunas realizaciones, el decodificador 200 puede estar configurado para seleccionar la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales a los cuales se aplica la decodificación predictiva de tal manera que haya una alternancia periódica, periódica con una tolerancia de /-1 coeficiente espectral, entre la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales a los cuales se aplica la decodificación predictiva y los coeficientes espectrales por los cuales la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales a los cuales se aplica la decodificación predictiva están separados.

[0084] En algunas realizaciones, la señal de audio 102 representada por la señal de audio codificada 120 comprende al menos dos componentes armónicos de la señal, donde el decodificador 200 está configurado para aplicar selectivamente decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales 206_t0_f2 o grupos de coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 que representa dichos al menos dos componentes armónicos de la señal o entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal de la señal de audio 102. Los entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal pueden ser, por ejemplo, /-1, 2, 3, 4 o 5 componentes espectrales.

[0085] Por consiguiente, el decodificador 200 puede estar configurado para identificar dichos al menos dos componentes armónicos de la señal, y para aplicar de manera selectiva la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales 206_t0_f2 o de grupos de coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 que está asociada a los componentes armónicos identificados de la señal, por ejemplo, que representan los componentes armónicos identificados de la señal o que están alrededor de los componentes armónicos identificados de la señal).

[0086] Por otro lado, la señal de audio codificada 120 puede comprender una información (por ejemplo, el valor de espaciamiento) que identifica dichos al menos dos componentes armónicos de la señal. En ese caso, el decodificador 200 puede estar configurado para aplicar de manera selectiva la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales 206_t0_f2 o grupos de coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 que está asociada a los componentes armónicos identificados de la señal, por ejemplo, que representan los componentes armónicos identificados de la señal o que están alrededor de los componentes armónicos identificados de la señal).

[0087] En las dos alternativas mencionadas anteriormente, el decodificador 200 puede estar configurado para no aplicar la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales 206_t0_f3, 206_t0_f1 y 206_t0_f6 o grupos de coeficientes espectrales codificados que no representan dichos al menos dos componentes armónicos de la señal o entornos espectrales de dichos al menos dos componentes armónicos de la señal de la señal de audio 102.

[0088] En otras palabras, el decodificador 200 puede estar configurado para no aplicar la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales 206_t0_f3, 206_t0_f1,206_t0_f6 o grupos de coeficientes espectrales codificados que pertenecen a un ruido de fondo no tonal entre los armónicos de señal de la señal de audio 102.

[0089] La Fig. 5 ilustra un gráfico de flujo de un procedimiento 300 para codificar una señal de audio, según una realización. El procedimiento 300 comprende una etapa 302 de determinación de coeficientes espectrales de la señal de audio correspondientes a una trama actual y al menos una trama anterior, y una etapa 304 de aplicación de manera selectiva de la codificación predictiva a una pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales que están separados por al menos un coeficiente espectral.

[0090] La Fig. 6 ilustra un gráfico de flujo de un procedimiento 400 para decodificar una señal de audio codificada, según una realización. El procedimiento 400 comprende una etapa 402 de análisis de la señal de audio codificada para obtener coeficientes espectrales codificados de la señal de audio correspondientes a una trama actual y al menos una trama anterior, y una etapa 404 de aplicación de manera selectiva de la decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que están separados por al menos un coeficiente espectral codificado.

[0091] Aunque se han descrito algunos aspectos en el contexto de un aparato, es obvio que estos aspectos también representan una descripción del procedimiento correspondiente, en el cual un bloque o dispositivo corresponde a una etapa del procedimiento o a una característica de una etapa del procedimiento. De manera análoga, los aspectos descritos en el contexto de una etapa del procedimiento también representan una descripción de un bloque o elemento correspondiente o de una característica de un aparato correspondiente. En algunas realizaciones, una cualquiera o más de las etapas más importantes del procedimiento pueden ser ejecutadas por ese tipo de aparato.

[0092] La señal de audio codificada de la invención puede ser almacenada en un medio de almacenamiento digital o puede ser transmitida por un medio de transmisión tal como un medio de transmisión inalámbrico o un medio de transmisión conectado por cables tal como Internet.

[0093] Dependiendo de ciertos requisitos de implementación, las realizaciones pueden ser implementadas en hardware o en software o al menos parcialmente en software, o al menos parcialmente en hardware. La implementación se puede realizar empleando un medio de almacenamiento digital, por ejemplo un disco flexible, un DVD, un Blu-Ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene almacenadas en la misma señales de control legibles electrónicamente, que cooperan (o tienen capacidad para cooperar) con un sistema informático programable de tal manera que se ejecute el procedimiento respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible por ordenador.

[0094] Algunas realizaciones según la invención un soporte no transitorio de datos que comprende señales de control legibles electrónicamente, con capacidad para cooperar con un sistema informático programable de tal manera que se ejecute uno de los procedimientos descritos en esta invención.

[0095] En general, las realizaciones de la presente invención pueden ser implementadas en forma de producto de programa informático con un código de programa, donde el código de programa cumple la función de ejecutar uno de los procedimientos al ejecutarse el programa informático en un ordenador. El código de programa puede ser almacenado, por ejemplo, en un soporte legible por máquina.

[0096] Otras realizaciones comprenden el programa informático para ejecutar uno de los procedimientos descritos en esta invención, almacenado en un soporte legible por máquina.

[0097] En otras palabras, una realización del procedimiento de la invención consiste, por lo tanto, en un programa informático que consta de un código de programa para poner en práctica uno de los procedimientos descritos en esta invención al ejecutarse el programa informático en un ordenador.

[0098] Otra realización de los procedimientos de la invención consiste, por lo tanto, en un soporte de datos (o medio de almacenamiento digital, o medio legible por ordenador) que comprende, grabado en el mismo, el programa informático para ejecutar uno de los procedimientos descritos en esta invención. El soporte de datos, el medio de almacenamiento digital o el medio grabado son por lo general tangibles y/o no transitorios.

[0099] Otra realización del procedimiento de la invención es, por lo tanto, un flujo de datos o una secuencia de señales que representa el programa informático para ejecutar uno de los procedimientos descritos en esta invención. El flujo de datos o la secuencia de señales pueden estar configurados, por ejemplo, para ser transferidos a través de una conexión de comunicación de datos, por ejemplo, a través de Internet.

[0100] Una realización adicional comprende un medio de procesamiento, por ejemplo, un ordenador, un dispositivo lógico programable, configurado o adaptado para ejecutar uno de los procedimientos descritos en esta invención.

[0101] Otra realización comprende un ordenador en el que se ha instalado el programa informático para ejecutar uno de los procedimientos descritos en esta invención.

[0102] Otra de las realizaciones según la invención comprende un aparato o un sistema configurado para transferir (por ejemplo, por vía electrónica u óptica) un programa informático para ejecutar uno de los procedimientos descritos en esta invención a un receptor. El receptor puede ser, por ejemplo, un ordenador, un dispositivo móvil, un dispositivo de memoria o similar. El aparato o sistema puede comprender, por ejemplo, un servidor de archivos para transferir un programa informático al receptor.

[0103] En algunas realizaciones, se puede utilizar un dispositivo lógico programable (por ejemplo, una matriz de puertas programables en el campo) para ejecutar algunas o todas las funcionalidades de los procedimientos descritos en esta invención. En algunas realizaciones, una matriz de puertas programables en el campo puede cooperar con un microprocesador para ejecutar uno de los procedimientos descritos en esta invención. Por lo general, los procedimientos son ejecutados preferentemente por cualquier aparato de hardware.

[0104] El aparato descrito en esta invención puede ser implementado utilizando un aparato de hardware o utilizando un ordenador, o mediante el uso de una combinación de un aparato de hardware y un ordenador.

[0105] Los procedimientos descritos en esta invención se pueden ejecutar utilizando un aparato de hardware, o utilizando un ordenador, o usando una combinación de un aparato de hardware y un ordenador.

[0106] Las realizaciones anteriormente descritas son meramente ilustrativas de los principios de la presente invención. Se entiende que las modificaciones y variaciones de las disposiciones y detalles descritos en esta invención deben ser evidentes para los expertos en la materia. Por lo tanto, solo se pretende limitarse al alcance de las siguientes reivindicaciones de patente y no a los detalles específicos presentados a modo de descripción y explicación de las realizaciones presentadas en esta invención.

Claims

REIVINDICACIONES

1. Un codificador (100) para codificar una señal de audio (102), donde el codificador (100) está configurado para codificar la señal de audio (102) en el dominio de la transformada o en el dominio de banco de filtros (104), donde el codificador está configurado para determinar coeficientes espectrales (106_t0_f1:106_t0_f6; 106_t-1_f1:106_t-1_f6) de la señal de audio (102) correspondientes a una trama actual (108_t0) y al menos una trama anterior (108_t-1), donde el codificador (100) está configurado para aplicar selectivamente la codificación predictiva a una pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5), donde el codificador (100) está configurado para determinar un valor de espaciamiento, donde el codificador (100) está configurado para seleccionar la pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) a los cuales se aplica la codificación predictiva sobre la base del valor de espaciamiento;

caracterizado porque el valor de espaciamiento es un valor de espaciamiento de armónicos que describe un espaciamiento entre armónicos de la señal de audio (102).

2. El codificador (100) según la reivindicación 1, donde la pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) están separados por al menos un coeficiente espectral (106_t0_f3).

3. El codificador (100) según la reivindicación 2, donde no se aplica la codificación predictiva a dicho al menos un coeficiente espectral (106_t0_f3) por el cual los coeficientes espectrales individuales (106_t0_f2) o los grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) están separados.

4. El codificador (100) según una de las reivindicaciones 1 a 3, donde el codificador (100) está configurado para aplicar la codificación predictiva a la pluralidad de coeficientes espectrales individuales (106_t0_f2) o los grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) de la trama actual (108_t0), mediante la codificación de los errores de predicción entre una pluralidad de coeficientes espectrales pronosticados individuales (110_t0_f2) o grupos de coeficientes espectrales pronosticados (110_t0_f4,110_t0_f5) de la trama actual y la pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) de la trama actual (108_t0).

5. El codificador (100) según la reivindicación 4, donde el codificador (100) está configurado para derivar coeficientes de predicción del valor de espaciamiento y donde el codificador (100) está configurado para calcular la pluralidad de coeficientes espectrales pronosticados individuales (110_t0_f2) o grupos de coeficientes espectrales pronosticados (110_t0_f4,110_t0_f5) correspondientes a la trama actual (108_t0) utilizando una correspondiente pluralidad de coeficientes espectrales individuales (106_t-2_f2,106_t-1_f2) o los grupos de coeficientes espectrales correspondientes (106_t-2_f4,106_t-1_f4; 106_t-2_f5,106_t-1_f5) de al menos dos tramas anteriores (108_t-2,108_t-1) y utilizando los coeficientes de predicción derivados.

6. El codificador (100) según la reivindicación 4, donde el codificador (100) está configurado para determinar la pluralidad de coeficientes espectrales pronosticados individuales (110_t0_f2) o grupos de coeficientes espectrales pronosticados (110_t0_f4,110_t0_f4) correspondientes a la trama actual (108_t0) usando las versiones cuantificadas correspondientes de la pluralidad de coeficientes espectrales individuales (106_t-1_f2) o los grupos de coeficientes espectrales (106_t-1_f4,106_t-1_f5) de la trama anterior (108_t-1).

7. El codificador (100) según la reivindicación 6, donde el codificador (100) está configurado para derivar coeficientes de predicción del valor de espaciamiento y donde el codificador (100) está configurado para calcular la pluralidad de coeficientes espectrales pronosticados individuales (110_t0_f2) o grupos de coeficientes espectrales pronosticados (110_t0_f4,110_t0_f5) correspondientes a la trama actual (108_t0) usando las versiones cuantificadas correspondientes de la pluralidad de coeficientes espectrales individuales (106_t-2_f2,106_t-1_f2) o los grupos de coeficientes espectrales (106_t-2_f4,106_t-1_f4; 106_t-2_f5,106_t-1_f5) de al menos dos tramas anteriores (108_t-2,108_t-1) y utilizando los coeficientes de predicción derivados.

8. El codificador (100) según cualquiera de las reivindicaciones 5 o 7, donde el codificador (100) está configurado para proporcionar una señal de audio codificada (120), no incluyendo la señal de audio codificada (120) los coeficientes de predicción o versiones codificadas de los mismos.

9. El codificador (100) según una de las reivindicaciones 4 a 8, donde el codificador (100) está configurado para proporcionar una señal de audio codificada (120), incluyendo la señal de audio codificada (120) versiones cuantificadas de los errores de predicción en lugar de versiones cuantificadas de la pluralidad de coeficientes espectrales individuales (106_t0_f2) o de los grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) correspondientes a la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales a los cuales se aplica la codificación predictiva.

10. El codificador (100) según la reivindicación 9, donde la señal de audio codificada (120) incluye versiones cuantificadas de los coeficientes espectrales (106_t0_f3) a los cuales no se aplica la codificación predictiva, de tal manera que haya una alternancia de coeficientes espectrales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) de los cuales se incluyen versiones cuantificadas de los errores de predicción en la señal de audio codificada (120) y coeficientes espectrales (106_t0_f1,106_t0_f3,106_t0_f6) o grupos de coeficientes espectrales con respecto a los cuales se proporcionan versiones cuantificadas sin emplear la codificación predictiva.

11. El codificador (100) según una de las reivindicaciones 1 a 10, donde el codificador (100) está configurado para determinar una frecuencia fundamental instantánea de la señal de audio (102) y para derivar el valor de espaciamiento de la frecuencia fundamental instantánea o una fracción o un múltiplo de la misma.

12. El codificador (100) según una de las reivindicaciones 1 a 11, donde el codificador (100) está configurado para seleccionar coeficientes espectrales individuales o grupos (116_1:116_6) de coeficientes espectrales espectralmente dispuestos según una red de armónicos definida por el valor de espaciamiento para la codificación predictiva.

13. El codificador (100) según una de las reivindicaciones 1 a 11, donde el codificador (100) está configurado para seleccionar coeficientes espectrales, cuyos índices espectrales son iguales o se encuentran dentro de un intervalo alrededor de una pluralidad de índices espectrales derivados sobre la base del valor de espaciamiento, para una codificación predictiva.

14. El codificador (100) según la reivindicación 13, donde el codificador (100) está configurado para establecer la amplitud del intervalo dependiendo del valor de espaciamiento.

15. El codificador (100) según una de las reivindicaciones 1 a 14, donde el codificador (100) está configurado para seleccionar la pluralidad de coeficientes espectrales individuales o grupos (116_1:116_6) de coeficientes espectrales a los cuales se aplica la codificación predictiva de tal manera que haya una alternancia periódica, periódica con una tolerancia de /-1 coeficiente espectral, entre la pluralidad de coeficientes espectrales individuales o grupos (116_1:116_6) de coeficientes espectrales a los cuales se aplica la codificación predictiva y los coeficientes espectrales o grupos de coeficientes espectrales (118_1:118_5) a los cuales no se aplica la codificación predictiva.

16. El codificador (100) según la reivindicación 15, donde la señal de audio (102) comprende al menos dos componentes armónicos de la señal (124_1:124_6), donde el codificador (100) está configurado para aplicar selectivamente la codificación predictiva a la pluralidad de coeficientes espectrales individuales o grupos (116_1:116_6) de coeficientes espectrales que representan dichos al menos dos componentes armónicos de la señal (124_1:124_6) o entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio (102).

17. El codificador (100) según la reivindicación 16, donde el codificador (100) está configurado para no aplicar codificación predictiva a aquellos de la pluralidad de coeficientes espectrales individuales o grupos (118_1:118_5) de coeficientes espectrales que no representan los al menos dos componentes de señal armónicos (124_1:124_6) o ambientes espectrales de los al menos dos componentes de señal harmónicos (124_1:124_6) de la señal de audio (102).

18. El codificador (100) según cualquiera de las reivindicaciones 16 o 17, donde el codificador (100) está configurado para no aplicar la codificación predictiva a la pluralidad de coeficientes espectrales individuales o grupos (118_1:118_5) de coeficientes espectrales que pertenecen a un ruido de fondo no tonal entre los armónicos de señal (124_1:124_6).

19. El codificador (100) según una de las reivindicaciones 16 a 18, donde el valor de espaciamiento es un valor de espaciamiento de armónicos que indica un espaciamiento espectral entre dichos al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio (102), indicando el valor de espaciamiento de los armónicos la pluralidad de coeficientes espectrales individuales o grupos (116_1:116_6) de coeficientes espectrales que representa dichos al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio (102).

20. El codificador (100) según una de las reivindicaciones 1 a 19, donde el codificador (100) está configurado para proporcionar una señal de audio codificada (120), donde el codificador (100) está configurado para incluir en la señal de audio codificada (120) el valor de espaciamiento o una versión codificada del mismo.

21. El codificador (100) según una de las reivindicaciones 1 a 20, donde los coeficientes espectrales son bins espectrales.

22. Un decodificador (200) para decodificar una señal de audio codificada (120), donde el decodificador (200) está configurado para decodificar la señal de audio codificada (120) en el dominio de la transformada o en el dominio de banco de filtros (204), donde el decodificador (200) está configurado para analizar la señal de audio codificada (120) para obtener coeficientes espectrales codificados (206_t0_f1:206_t0_f6; 206_t-1_f1:206_t-1_f6) de la señal de audio (120) correspondientes a una trama actual (208_t0) y al menos una trama anterior (208_t-1) y donde el decodificador (200) está configurado para aplicar selectivamente decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales (206_t0_f2) o grupos de coeficientes espectrales codificados (206_t0_f4,206_t0_f5), donde el decodificador (200) está configurado para obtener un valor de espaciamiento, donde el decodificador (200) está configurado para seleccionar la pluralidad de coeficientes espectrales codificados individuales (206_t0_f2) o grupos de coeficientes espectrales codificados (206_t0_f4,206_t0_f5) a los cuales se aplica la decodificación predictiva sobre la base del valor de espaciamiento;

caracterizado porque el valor de espaciamiento es un valor de espaciamiento de armónicos que describe un espaciamiento entre armónicos de la señal de audio codificada (120).

23. El decodificador (200) según la reivindicación 22, donde la pluralidad de coeficientes espectrales codificados individuales (206_t0_f2) o grupos de coeficientes espectrales codificados (206_t0_f4,206_t0_f5) están separados por al menos un coeficiente espectral codificado (206_t0_f3).

24. El decodificador (200) según la reivindicación 23, donde la decodificación predictiva no se aplica a dicho al menos un coeficiente espectral (206_t0_f3) por el cual los coeficientes espectrales individuales (206_t0_f2) o el grupo de coeficientes espectrales (206_t0_f4,206_t0_f5) están separados.

25. El decodificador (200) según una de las reivindicaciones 22 a 24, donde el decodificador (200) está configurado para decodificar por entropía los coeficientes espectrales codificados, para obtener errores de predicción cuantificados correspondientes a los coeficientes espectrales (206_t0_f2,206_t0_f4,206_t0_f5) a los cuales se tiene que aplicar la decodificación predictiva y coeficientes espectrales cuantificados correspondientes a los coeficientes espectrales (206_t0_f3) a los cuales no se tiene que aplicar decodificación predictiva y

donde el decodificador (200) está configurado para aplicar los errores de predicción cuantificados a una pluralidad de coeficientes espectrales pronosticados individuales (210_t0_f2) o grupos de coeficientes espectrales pronosticados (210_t0_f4,210_t0_f5), para obtener, con respecto a la trama actual (208_t0), coeficientes espectrales decodificados asociados a los coeficientes espectrales codificados (206_t0_f2,206_t0_f4,206_t0_f5) a los cuales se aplica la decodificación predictiva.

26. El decodificador (200) según la reivindicación 25, donde el decodificador (200) está configurado para determinar la pluralidad de coeficientes espectrales pronosticados individuales (210_t0_f2) o grupos de coeficientes espectrales pronosticados (210_t0_f4,210_t0_f5) correspondientes a la trama actual (208_t0) basándose en una correspondiente pluralidad de los coeficientes espectrales codificados individuales (206_t-1_f2) o grupos de coeficientes espectrales codificados (206_t-1_f4,206_t-1_f5) de la trama anterior (208_t-1).

27. El decodificador (200) según la reivindicación 26, donde el decodificador (200) está configurado para derivar coeficientes de predicción del valor de espaciamiento y donde el decodificador (200) está configurado para calcular la pluralidad de coeficientes espectrales pronosticados individuales (210_t0_f2) o grupos de coeficientes espectrales pronosticados (210_t0_f4,210_t0_f5) correspondientes a la trama actual (208_t0) utilizando una correspondiente pluralidad de coeficientes espectrales individuales anteriormente decodificados o grupos de coeficientes espectrales anteriormente decodificados de al menos dos tramas anteriores y utilizando los coeficientes de predicción derivados.

28. El decodificador (200) según una de las reivindicaciones 22 a 27, donde el decodificador (200) está configurado para decodificar la señal de audio codificada (120) con el fin de obtener errores de predicción cuantificados en lugar de una pluralidad de coeficientes espectrales cuantificados individuales o grupos de coeficientes espectrales cuantificados correspondientes a la pluralidad de coeficientes espectrales codificados individuales (206_t0_f2) o grupos de coeficientes espectrales codificados (206_t0_f4,206_t0_f5) a los cuales se aplica la decodificación predictiva.

29. El decodificador (200) según la reivindicación 28, donde el decodificador está configurado para decodificar la señal de audio codificada (120) para obtener coeficientes espectrales cuantificados correspondientes a los coeficientes espectrales codificados (206_t0_f3) a los cuales no se aplica la decodificación predictiva, de tal manera ^{que haya una alternancia de coeficientes espectrales codificados (}206^_t0^_f2^{) o grupos de coeficientes espectrales}codificados (206_t0_f4,206_t0_f5) con respecto a los cuales se obtienen los errores de predicción cuantificados y coeficientes espectrales codificados (206_t0_f3) o grupos de coeficientes espectrales codificados con respecto a los cuales se obtienen coeficientes espectrales cuantificados.

30. El decodificador (200) según una de las reivindicaciones 22 a 29, donde el decodificador (200) está configurado para seleccionar coeficientes espectrales individuales (206_t0_f2) o grupos de coeficientes espectrales (206_t0_f4,206_t0_f5) espectralmente dispuestos según una red de armónicos definida por el valor de espaciamiento para una decodificación predictiva.

31. El decodificador (200) según una de las reivindicaciones 22 a 30, donde el decodificador (200) está configurado para seleccionar coeficientes espectrales, los índices espectrales de los cuales son iguales o se encuentran dentro de un intervalo alrededor de una pluralidad de índices espectrales derivada sobre la base del valor de espaciamiento, para una decodificación predictiva.

32. El decodificador (200) según la reivindicación 31, donde el decodificador (200) está configurado para establecer una amplitud del intervalo dependiendo del valor de espaciamiento.

33. El decodificador (200) según una de las reivindicaciones 22 a 32, donde la señal de audio codificada (120) comprende el valor de espaciamiento o una versión codificada del mismo, donde el decodificador (200) está configurado para extraer el valor de espaciamiento o la versión codificada del mismo de la señal de audio codificada (120) para obtener el valor de espaciamiento.

34. El decodificador (200) según una de las reivindicaciones 22 a 32, donde el decodificador (200) está configurado para determinar el valor de espaciamiento.

35. El decodificador (200) según la reivindicación 34, donde el decodificador (200) está configurado para determinar una frecuencia fundamental instantánea y para derivar el valor de espaciamiento de la frecuencia fundamental instantánea o una fracción o un múltiplo de la misma.

36 El decodificador (200) según una de las reivindicaciones 22 a 35, donde la señal de audio (102) representada por la señal de audio codificada (120) comprende al menos dos componentes armónicos de la señal (124_1:124_6), donde el decodificador (200) está configurado para aplicar selectivamente la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que representan dichos al menos dos componentes armónicos de la señal (124_1:124_6) o entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio (102).

37. El decodificador (200) según la reivindicación 36, donde el decodificador (200) está configurado para identificar dichos al menos dos componentes armónicos de la señal (124_1:124_6), y para aplicar de manera selectiva la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que está asociada a los componentes armónicos identificados de la señal (124_1:124_6).

38. El decodificador (200) según la reivindicación 36, donde la señal de audio codificada (120) comprende el valor de espaciamiento o una versión codificada del mismo, donde el valor de espaciamiento identifica dichos al menos dos componentes armónicos de la señal (124_1:124_6), donde el decodificador (200) está configurado para aplicar selectivamente la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que está asociada a los componentes armónicos identificados de la señal (124_1:124_6).

39. El decodificador (200) según una de las reivindicaciones 36 a 38, donde el decodificador (200) está configurado para no aplicar la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que no representan dichos al menos dos componentes armónicos de la señal (124_1:124_6) o entornos espectrales de dichos al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio.

40. El decodificador (200) según una de las reivindicaciones 36 a 39, donde el decodificador (200) está configurado para no aplicar la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que pertenecen a un ruido de fondo no tonal entre los armónicos de señal (124_1:124_6) de la señal de audio.

41. El decodificador (200) según una de las reivindicaciones 22 a 40, donde la señal de audio codificada (120) incluye el valor de espaciamiento o una versión codificada del mismo, donde el valor de espaciamiento es un valor de espaciamiento de armónicos, donde el valor de espaciamiento de los armónicos indica la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que representan al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio (102).

42. El decodificador (200) según una de las reivindicaciones 22 a 41, donde los coeficientes espectrales son bins espectrales.

43. Procedimiento (300) para codificar una señal de audio en un dominio de transformada o dominio de banco de filtros, comprendiendo el procedimiento:

determinar (302) coeficientes espectrales de la señal de audio para una trama actual y al menos una trama anterior; determinar un valor de espaciamiento; y

aplicar selectivamente (304) codificación predictiva a una pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales, donde la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales a los cuales se aplica la codificación predictiva son seleccionados con base en el valor de espaciamiento;

caracterizado porque el valor de espaciamiento es un valor de espaciamiento armónico que describe un espaciamiento entre los armónicos.

44. Procedimiento (400) para decodificar una señal de audio codificada en un dominio de transformada o dominio de banco de filtros, comprendiendo el procedimiento:

analizar (402) la señal de audio codificada para obtener coeficientes espectrales codificados de la señal de audio para una trama actual y al menos una trama anterior;

obtener un valor de espaciamiento; y

aplicar selectivamente (404) decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados, donde la pluralidad de coeficientes espectrales individuales codificados o grupos de coeficientes espectrales codificados a los cuales se aplica la decodificación predictiva son seleccionados con base en el valor de espaciamiento;

caracterizado porque el valor de espaciamiento es un valor de espaciamiento armónico que describe un espaciamiento entre los armónicos de la señal de audio codificada.

45. Programa informático para llevar a cabo un procedimiento según una de las reivindicaciones 43 a 44.