ES2244452T3

ES2244452T3 - Metodo para mejorar la eficacia de codificacion de una señal de audio.

Info

Publication number: ES2244452T3
Application number: ES00944090T
Authority: ES
Inventors: Juha Ojanpera
Original assignee: Nokia Oyj
Current assignee: Nokia Oyj
Priority date: 1999-07-05
Filing date: 2000-07-05
Publication date: 2005-12-16
Anticipated expiration: 2020-07-05
Also published as: WO2001003122A1; BR0012182A; EP1203370B1; AU5832600A; DE60021083T2; JP4142292B2; CA2378435A1; JP4426483B2; DE60041207D1; CN1235190C; KR20020019483A; CA2378435C; DE60021083D1; KR100593459B1; CN1372683A; US7457743B2; KR100545774B1; EP2037451A1; US20060089832A1; JP2005189886A

Abstract

Método para codificar una señal de audio que comprende las siguientes etapas: - examinar una porción de la señal de audio a codificar para encontrar otra porción de la señal de audio que sea la que mejor se corresponda con la porción de la señal de audio a codificar y que se selecciona como secuencia de referencia de muestras; - generar una serie de señales predichas de dicha secuencia de referencia de muestras utilizando una serie de órdenes del elemento de predicción de amplitud tonal; - determinar una eficacia de codificación de, al menos, una de dichas señales predichas; y - utilizar la eficacia de codificación determinada para seleccionar un método de codificación de la porción de la señal de audio a codificar.

Description

Método para mejorar la eficacia de codificación de una señal de audio.

En general, los sistemas de codificación de audio producen señales codificadas a partir de una señal de audio analógica, tal como una señal de voz. Normalmente, las señales codificadas se transmiten a un receptor mediante métodos de transmisión de datos específicos del sistema de transmisión de datos. En el receptor se genera una señal de audio a partir de las señales codificadas. La cantidad de información que debe transmitirse se ve afectada, por ejemplo, por el ancho de banda utilizado en el sistema para la información codificada, así como por la eficacia con la que puede ejecutarse la codificación.

A efectos de codificación, se generan muestras digitales a partir de la señal analógica, por ejemplo a intervalos regulares de 0,125 ms. Las muestras se procesan normalmente en grupos de un tamaño fijo, por ejemplo en grupos con una duración de aproximadamente 20 ms. Estos grupos de muestras se denominan también "tramas". Por lo general, una trama es la unidad básica en la cual se procesan los datos de audio.

La finalidad de los sistemas de codificación de audio consiste en obtener una calidad de sonido que sea la mejor posible dentro del margen del ancho de banda disponible. A estos efectos, puede utilizarse la periodicidad presente en una señal de audio, y especialmente en una señal de voz. La periodicidad de la voz está causada, por ejemplo, por la vibración de las cuerdas vocales. Normalmente, el período de vibración se sitúa dentro de la gama de 2 ms a 20 ms. En numerosos codificadores de voz de acuerdo con la técnica anterior, se utiliza una técnica conocida como predicción a largo plazo (LTP) cuya finalidad consiste en evaluar y utilizar dicha periodicidad para mejorar la eficacia del proceso de codificación. De este modo, durante la codificación, la parte (trama) de la señal a codificar se compara con porciones de la señal previamente codificadas. Si se encuentra una señal similar en la parte codificada anteriormente, la demora (retardo) entre la señal similar y la señal a codificar se somete a examen. Se genera una señal predicha que representa la señal a codificar y que se basa en la señal similar. Además, se genera una señal de error que representa la diferencia entre la señal predicha y la señal a codificar. De este modo, la codificación se lleva a cabo ventajosamente de tal forma que sólo se transmiten la información de retardo y la señal de error. En el receptor se recuperan las muestras correctas de la memoria, se utilizan para predecir la parte de la señal a codificar y se combinan con la señal de error a partir del retardo. Matemáticamente, puede considerarse que este elemento de predicción de amplitud tonal realiza una operación de filtrado que queda ilustrada mediante una función de transferencia como la que se muestra a continuación:

P(z) = \beta z^{-\alpha}

La ecuación que antecede muestra la función de transferencia de un elemento de predicción de amplitud tonal de primer orden, siendo \beta el coeficiente del elemento de predicción de amplitud tonal y \alpha es el retardo que representa la periodicidad. En el caso de filtros elementos de predicción de amplitud tonal de más alto nivel, es posible utilizar una función de transferencia más general:

P(z)= \sum\limits^{m_{1}}_{k=-m_{1}} \beta_{k} z^{-(\alpha+k)}

La finalidad consiste en seleccionar coeficientes \beta_{k} para cada trama de tal forma que el error de codificación, es decir la diferencia entre la señal real y la señal generada utilizando las muestras precedentes sea lo más pequeña posible. Ventajosamente, estos coeficientes se seleccionan para ser utilizados en la codificación con la cual se consiga el menor error, utilizando el método de los mínimos cuadrados. Ventajosamente, los coeficientes se actualizan trama por trama.

La patente US 5.528.629 describe un sistema de codificación de voz perteneciente a la técnica anterior que utiliza la predicción a corto plazo (STP) así como una predicción a largo plazo de primer orden.

Los codificadores de la técnica anterior presentan como desventaja que no se presta atención a la relación entre la frecuencia de la señal de audio y su periodicidad. De este modo, la periodicidad de la señal no se puede utilizar eficazmente en todas las situaciones y la cantidad de información codificada se hace innecesariamente larga, o la calidad del sonido de la señal de audio reconstruida en el receptor se deteriora.

En algunas situaciones, por ejemplo cuando una señal de audio tiene un carácter altamente periódico y experimenta pocas variaciones a lo largo del tiempo, la información de retardo por sí sola facilita una buena base para predecir la señal. En esta situación no es necesario utilizar un elemento de predicción de amplitud tonal de orden superior. En otras situaciones, lo contrario es cierto. El retardo no es necesariamente un múltiplo entero del intervalo de muestreo. Por ejemplo, puede encontrarse entre dos muestras sucesivas de la señal de audio. En esta situación, los elementos de predicción de amplitud tonal de orden superior pueden efectuar interpolaciones entre los tiempos de muestreo discretos a fin de facilitar una representación más precisa de la señal. Además, la respuesta en frecuencia de los elementos de predicción de amplitud tonal de orden superior tiende a disminuir en función de la frecuencia. Esto significa que los elementos de predicción de amplitud tonal de orden superior proporcionan un mejor modelado de los componentes de frecuencias inferiores de la señal de audio. En la codificación de voz esto resulta ventajoso, ya que los componentes de baja frecuencia influyen más significativamente sobre la calidad percibida de la señal de voz que los componentes de frecuencias más elevadas. Por lo tanto, cabe señalar que la capacidad de variación del orden del elemento de predicción de amplitud tonal utilizado para predecir una señal de audio de acuerdo con la evolución de la señal resulta muy deseable. Un codificador que utilice un elemento de predicción de amplitud tonal de orden fijo puede resultar excesivamente complejo en ciertas situaciones, siendo incapaz de modelar suficientemente la señal de audio en
otras.

Una finalidad de la presente invención según se define en las reivindicaciones independientes adjuntas consiste en implementar un método para mejorar la precisión de codificación y la eficiencia de transmisión de las señales de audio en un sistema de transmisión de datos en el cual los datos de audio se generan con una mayor precisión y se transfieren con una mayor eficacia que con los métodos utilizados por la técnica anterior. Un codificador de acuerdo con la invención, su finalidad consiste en predecir la señal de audio a codificar trama por trama con la mayor precisión posible, al mismo tiempo que garantiza que la cantidad de información a transmitir sigue siendo reducida.

La presente invención presenta considerables ventajas cuando se la compara con las soluciones de acuerdo con la técnica anterior. El método de acuerdo con la invención permite que una señal de audio se codifique con mayor precisión que en el caso de los métodos de la técnica anterior, al mismo tiempo que garantiza que la cantidad de información que a transmitir sigue siendo baja. La invención también permite que la codificación de una señal de audio se lleve a cabo de una forma más flexible que con los métodos de acuerdo con la técnica anterior. La invención puede llevarse a cabo de tal forma que de preferencia a la precisión con la cual se predice la señal de audio (maximización cualitativa), que de preferencia a la reducción de la cantidad de información necesaria para representar la señal de audio codificada (minimización cuantitativa), o que se llegue a un compromiso entre las dos. Utilizando el método de acuerdo con la invención, también es posible tener en cuenta más adecuadamente las periodicidades de las diferentes frecuencias que existen en la señal de audio.

En los siguientes párrafos se describirá la invención en mayor detalle, haciendo referencia a los dibujos adjuntos en los cuales:

La figura 1 muestra un codificador de acuerdo con una realización preferida de la invención.

La figura 2 muestra un codificador de acuerdo con una realización preferida de la invención.

La figura 3 es un diagrama de bloques reducido que presenta un sistema de transmisión de datos de acuerdo con una realización preferida de la invención.

La figura 4 es un diagrama de flujo que muestra un método de acuerdo con una realización preferida de la invención.

Las figuras 5a y 5b son ejemplos de tramas de transmisión de datos generadas por el decodificador de acuerdo con una realización preferida de la invención.

La figura 1 es un diagrama de bloques reducido que muestra un codificador 1 de acuerdo con una realización preferida de la invención. La figura 4 es un diagrama de flujo 400 que muestra el método de acuerdo con la invención. El codificador 1 es, por ejemplo, un codificador de voz de un dispositivo inalámbrico de comunicaciones 2 (figura 3) para la conversión de una señal de audio en una señal codificada a transmitir en un sistema de transmisión de datos, tal como una red de comunicaciones móviles o Internet. De este modo, un decodificador 33 se encuentra ventajosamente situado en una estación base de la red de comunicaciones móviles. De igual modo, una señal de audio analógica, por ejemplo una señal generada por un micrófono 29 y amplificada en un bloque de audio 30, si fuera necesario, se convierte mediante un conversor analógico / digital 4 en una señal digital. La precisión de la conversión es, por ejemplo, de 8 o 12 bits, y el intervalo (resolución de tiempo) entre las muestras sucesivas es de, por ejemplo, 0,125 ms. Es evidente que los valores numéricos presentados en esta descripción son tan sólo ejemplos que aclaran la invención y no la limitan.

Las muestras obtenidas a partir de la señal de audio se almacenan en una memoria intermedia de muestras (no representada) que puede llevarse a cabo de una forma conocida como, por ejemplo, en la memoria 5 del dispositivo inalámbrico de comunicaciones 2. Ventajosamente, la codificación de la señal de audio se lleva a cabo trama a trama de forma que se transmite un número predeterminado de muestras al codificador 1 para su codificación, por ejemplo las muestras generadas a lo largo de un período de 20 ms (= 160 muestras suponiendo un intervalo de tiempo de 0,125 ms entre las muestras sucesivas). Las muestras de una trama a codificar se transmiten ventajosamente a un bloque de transformación 6 en el que la señal de audio se transforma del dominio del tiempo a un ámbito de transformación (dominio de la frecuencia) por ejemplo mediante una transformada de coseno discreto modificada (MDCT). La salida del bloque de transformación 6 proporciona un grupo de valores que representan las propiedades de la señal transformada al dominio de la frecuencia. Esta transformación se representa mediante el bloque 404 en el diagrama de flujo de la figura 4.

Una realización alternativa para la transformación de una señal del dominio de tiempo al dominio de la frecuencia consiste en un banco de filtros compuesto por diversos filtros paso-banda. La banda de paso de cada filtro es relativamente estrecha, con lo que las magnitudes de las señales en las salidas de los filtros representan el espectro de frecuencia de la señal a transformar.

Un bloque de retardo 7 determina cuál de las secuencias de muestras precedentes se corresponde mejor con la trama a codificar en un momento dado (bloque 402). Esta etapa de determinación del retardo se lleva a cabo ventajosamente de tal forma que el bloque de retardo 7 compara los valores almacenados en una memoria intermedia de referencia 8 con las muestras de la trama a codificar y calcula el error entre las muestras de la trama a codificar y una secuencia correspondiente de muestras almacenada en la memoria intermedia de referencia, utilizando por ejemplo un método de mínimos cuadrados. Preferiblemente, la secuencia de muestras formada por muestras sucesivas y que tiene el menor error se selecciona como secuencia de referencia de muestras.

Cuando la secuencia de referencia de muestras se selecciona a partir de las muestras almacenadas por el bloque de retardo 7 (bloque 403), el bloque de retardo 7 transfiere la información relativa a esta a un bloque de cálculo de coeficientes 9 a fin de llevar a cabo la evaluación del coeficiente del elemento de predicción de amplitud tonal. Por tanto en el bloque de cálculo de coeficientes 9, se calculan los coeficientes del elemento de predicción de amplitud tonal b(k) para diferentes órdenes del elemento de predicción de amplitud tonal, tal como 1, 3, 5 y 7 basándose en las muestras que contiene la secuencia de referencia de muestras. Los coeficientes calculados b(k) se transfieren a continuación al bloque elemento de predicción de amplitud tonal 10. En el diagrama de flujo de la figura 4, estas etapas se muestran en los bloques 405 a 411. Es evidente que los órdenes presentados aquí funcionan únicamente como ejemplos que aclaran la invención sin limitarla. La invención también puede aplicarse con otros órdenes, y el número de órdenes disponible también puede ser diferente del total de cuatro órdenes presentados en este documento.

Después de haber calculado los coeficientes del elemento de predicción de amplitud tonal, estos se cuantifican, con lo que se obtienen coeficientes del elemento de predicción de amplitud tonal cuantificados. Los coeficientes del elemento de predicción de amplitud tonal se cuantifican preferiblemente de forma que la señal reconstruida generada en el decodificador 33 del receptor se corresponda con la original de la forma más estrecha posible en condiciones de transmisión de datos sin error. Al cuantificar los coeficientes del elemento de predicción de amplitud tonal, resulta ventajoso utilizar la resolución más elevada posible (etapas de cuantificación lo menores posible) a fin de reducir al mínimo los errores provocados por el redondeo.

Las muestras almacenadas en la secuencia de referencia de muestras se transfieren al bloque del elemento de predicción de amplitud tonal 10 en el que se genera una señal predicha, para cada orden del elemento de predicción de amplitud tonal a partir de las muestras de la secuencia de referencia, utilizando los coeficientes de elemento de predicción de amplitud tonal calculados y cuantificados b(k). Cada señal predicha representa la predicción de la señal a codificar, evaluada utilizando el orden del elemento de predicción de amplitud tonal en cuestión. En esta realización preferida de la invención, la señales predichas se transfieren adicionalmente a un segundo bloque de transformación 11, en el que se transforman al dominio de la frecuencia. El bloque de transformación 11 lleva a cabo la transformación utilizando dos o más órdenes diferentes, en los que se generan unas series de valores transformados que se corresponden con las señales predichas por los diferentes órdenes del elemento de predicción de amplitud tonal. El bloque del elemento de predicción de amplitud tonal 10 y el segundo bloque de transformación 11 pueden realizarse de tal forma que lleven a cabo las operaciones necesarias para cada orden del elemento de predicción de amplitud tonal o, alternativamente, pueden llevarse a cabo para cada orden en un bloque independiente del elemento de predicción de amplitud tonal 10 y un segundo bloque de transformación independiente 11.

En el bloque de cálculo 12, los valores de la señal predicha transformados al dominio de la frecuencia se comparan con la representación transformada al dominio de la frecuencia de la señal de audio a codificar obtenida a partir del bloque de transformación 6. Se calcula una señal de error de predicción tomando la diferencia entre el espectro de frecuencias de la señal de audio a codificar y el espectro de frecuencias de la señal predicha utilizando el elemento de predicción de secuencias. Ventajosamente, la señal de error de predicción comprende una serie de valores de error de predicción correspondientes a la diferencia entre los componentes de frecuencia de la señal a codificar y los componentes de frecuencia de la señal predicha. También se calcula un error de codificación que representa, por ejemplo, el promedio de la diferencia entre el espectro de frecuencia de la señal de audio y la señal predicha. Preferiblemente, el error de codificación se calcula utilizando el método de los mínimos cuadrados. Puede utilizarse cualquier otro método apropiado, comprendiendo métodos basados en el modelado psico-acústico de la señal de audio para determinar la señal predicha que mejor represente la señal de audio a codificar.

En el bloque 12 también se calcula una medida de eficacia de codificación (ganancia de predicción) a fin de determinar la información a transmitir al canal de transmisión (bloque 413). La finalidad consiste en reducir al mínimo la cantidad de información (bits) a transmitir (minimización cuantitativa), así como las distorsiones de la señal (maximización cualitativa).

A fin de reconstruir la señal en el receptor en función de las muestras anteriores almacenadas en el dispositivo de recepción, es necesario transmitir al receptor, por ejemplo, los coeficientes del elemento de predicción de amplitud tonal cuantificados correspondientes al orden seleccionado, la información relativa al orden, el retardo, y la información relativa al error de predicción. Ventajosamente, la medida de la eficacia de codificación indica si es posible transmitir la información necesaria para decodificar la señal codificada en el bloque del elemento de predicción de amplitud tonal 10 con un número de bits inferior al necesario para transmitir la información relativa a la señal original. Esta determinación puede llevarse a cabo, por ejemplo, de forma que se defina un primer valor de referencia que representa la cantidad de información a transmitir si se genera la información necesaria para la decodificación utilizando un elemento de predicción de amplitud tonal específico. Adicionalmente, se define un segundo valor de referencia que representa la cantidad de información a transmitir cuando la información necesaria para la decodificación se genera a partir de la señal de audio original. Ventajosamente, la medida de la eficacia de codificación es la relación entre el segundo valor de referencia y el primer valor de referencia. El número de bits necesario para representar la señal predicha depende, por ejemplo, del orden del elemento de predicción de amplitud tonal (es decir, el número de coeficientes que van a transmitirse), de la precisión con la cual se va a representar (cuantificar) cada coeficiente, así como de la cantidad y la precisión de la información sobre error asociada a la señal predicha. Por otra parte, el número de bits necesario para transmitir información relativa a la señal de audio original depende, por ejemplo, de la precisión de la representación de la señal de audio al dominio de la frecuencia.

Si la eficacia de codificación determinada de esta forma es superior a uno, ello indicará que la información necesaria para decodificar la señal predicha podrá transmitirse con un número de bits inferior a la información relativa a la señal original. En el bloque de cálculo 12 se determina el número de bits necesarios para la transmisión de estas diferentes alternativas, seleccionándose la alternativa para la cual el número de bits a transmitir resulta inferior (bloque 414).

De acuerdo con una primera realización de la invención, el orden del elemento de predicción de amplitud tonal con el cual se obtiene el menor error de codificación se selecciona para codificar la señal de audio (bloque 412). Si la medida de la eficacia de codificación del elemento de predicción de amplitud tonal seleccionado es superior a 1, se seleccionará la información relativa a la señal predicha para su transmisión. Si la medida de la eficacia de codificación no es superior a 1, la información a transmitir se generará en función de la señal de audio original. De acuerdo con esta realización de la invención, se da más importancia a la minimización del error de predicción (maximización cualitativa).

De acuerdo con una segunda realización ventajosa de la invención, se calcula una medida de la eficacia de codificación para cada orden del elemento de predicción de amplitud tonal. A continuación se utiliza el orden del elemento de predicción de amplitud tonal que proporcione el menor error de codificación seleccionado de entre aquellos órdenes para los cuales la medida de la eficacia de codificación es superior a 1, a fin de codificar la señal de audio. Si ninguno de los órdenes del elemento de predicción de amplitud tonal proporciona una ganancia de predicción (es decir, ninguna medida de la eficacia de codificación es superior a 1) la información a transmitir se generará entonces ventajosamente a partir de la señal de audio original. Esta realización de la invención permite establecer un compromiso entre el error de predicción y la eficacia de codificación.

De acuerdo con una tercera realización de la invención, se calcula una medida de la eficacia de codificación para cada orden del elemento de predicción de amplitud tonal y se selecciona el orden del elemento de predicción de amplitud tonal que proporcione la mayor eficacia de codificación seleccionado de entre aquellos órdenes para los cuales la medida de la eficacia de codificación es superior a 1, a fin de codificar la señal de audio. Si ninguno de los órdenes del elemento de predicción de amplitud tonal proporciona una ganancia de predicción (es decir, ninguna medida de la eficacia de codificación es superior a 1) la información a transmitir se generará entonces ventajosamente a partir de la señal de audio original. De este modo, esta realización de la invención da más importancia a la maximización de la eficacia de codificación (minimización cuantitativa).

De acuerdo con una cuarta realización de la invención, se calcula una medida de eficacia de codificación para cada orden del elemento de predicción de amplitud tonal y se selecciona el orden de tonos que proporcione la mayor eficacia de codificación de codificar la señal de audio, aun cuando la eficacia de codificación no sea superior a 1.

El cálculo del error de codificación y la selección del orden del elemento de predicción de amplitud tonal se llevan a cabo a intervalos regulares, preferiblemente de forma independiente para cada trama, siendo posible en distintas tramas, utilizar el orden del elemento de predicción de amplitud tonal que mejor se corresponda con las propiedades de la señal de audio en un momento dado.

Como se ha explicado anteriormente, si la eficacia de codificación determinada en el bloque 12 no es superior a 1, ello indicará que resulta ventajoso transmitir el espectro de frecuencia de la señal original, en la que se genera ventajosamente una cadena de bits 501 a transmitir al canal de transmisión de datos de la forma siguiente (bloque 415). La información del bloque de cálculo 12 relativa a la alternativa de transmisión seleccionada se transfiere al bloque de selección 13 (líneas D1 y D4 de la figura 1). En el bloque de selección 13, los valores de la transformada al dominio de la frecuencia que representan la señal de audio original se seleccionan para su transmisión a un bloque de cuantificación 14. La transmisión de los valores de la transformada al dominio de la frecuencia de la señal de audio original al bloque de cuantificación 14 está ilustrada mediante la línea A1 del diagrama de bloques de la figura 1. En el bloque de cuantificación 14, los valores de la señal transformados al dominio de la frecuencia se cuantifican de una forma conocida en sí. Los valores cuantificados se transfieren a un bloque de multiplexado 15, en el cual se genera la cadena de bits a transmitir. Las figuras 5a y 5b muestran un ejemplo de una estructura de cadena de bits que puede aplicarse ventajosamente en relación con la presente invención. La información relativa al método de codificación seleccionado se transfiere desde el bloque de cálculo 12 al bloque de multiplexado 15 (líneas D1 y D3) en el cual se genera la cadena de bits de acuerdo con la alternativa de transmisión. Un primer valor lógico, por ejemplo el estado lógico 0, se utiliza como información sobre el método de codificación 502 para indicar que los valores transformados al dominio de la frecuencia que representan la señal de audio original se transmiten en la cadena de bits en cuestión. Además de la información sobre el método de codificación 502 se transmiten los propios valores en la cadena de bits cuantificados de acuerdo con una precisión dada. El campo utilizado para la transmisión de estos valores está marcado en la figura 5a con el número de referencia 503. El número de valores transmitidos en cada cadena de bits depende de la frecuencia de muestreo y de la longitud de la trama examinada en un momento dado. En esta situación, la información sobre el orden del elemento de predicción de amplitud tonal, los coeficientes del elemento de predicción de amplitud tonal, retardos y errores no se transmite debido a que la señal se reconstruye en el receptor en función de los valores del dominio de la frecuencia de la señal de audio original transmitida en la cadena de bits 501.

Si la eficacia de codificación es superior a uno, resulta ventajoso codificar la señal de audio utilizando el elemento de predicción de amplitud tonal seleccionado y la cadena de bits 501 (figura 5b) a transmitir al canal de transmisión de datos se genera ventajosamente de la forma siguiente (bloque 416): La información relativa a la alternativa de transmisión seleccionada se transmite desde el bloque de cálculo 12 al bloque de selección 13. Esto se ilustra mediante las líneas D1 y D4 en el diagrama de bloques de la figura 1. En el bloque de selección 13, se seleccionan los coeficientes del elemento de predicción de amplitud tonal cuantificado para su transferencia al bloque de multiplexado 15. Esto se ilustra mediante la línea B1 del diagrama de bloques de la figura 1. Es evidente que los coeficientes del elemento de predicción de amplitud tonal también pueden transferirse al bloque de multiplexado 15 de un modo diferente que a través del bloque de selección 13. La cadena de bits a transmitir se genera en el bloque de multiplexado 15. La información relativa al método de codificación seleccionado se transfiere desde el bloque de cálculo 12 al bloque de multiplexado 15 (líneas D1 y D3), en el cual se genera la cadena de bits de acuerdo con la alternativa de transmisión. Un segundo valor lógico, por ejemplo el estado lógico 1, se utiliza como información sobre el método de codificación 502 para indicar que dichos coeficientes del elemento de predicción de amplitud tonal cuantificado se han transmitido en la cadena de bits en cuestión. Los bits de un campo de orden 504 se configuran de acuerdo con el orden del elemento de predicción de amplitud tonal seleccionado. Si, por ejemplo, se dispone de cuatro órdenes diferentes, dos bits (00,01,10,11) serán suficientes para indicar qué orden se ha seleccionado en un momento dado. Además, la información sobre el retardo se transmite en la cadena de bits en un campo de retardo 505. En este ejemplo preferido, el retardo se indica mediante 11 bits, pero es evidente que también pueden aplicarse otras longitudes dentro del ámbito de la invención. Los coeficientes del elemento de predicción de amplitud tonal cuantificados se añaden a la cadena de bits en el campo de coeficientes 506. Si el orden del elemento de predicción de amplitud tonal seleccionado es uno, sólo se transmite un coeficiente, si el orden es tres, se transmiten tres coeficientes, etc. El número de bits utilizados en la transmisión de los coeficientes puede también variar en diversas realizaciones. En una realización ventajosa, el coeficiente de primer orden se representa mediante tres bits, los coeficientes de tercer orden con un total de cinco bits, los coeficientes de quinto orden con un total de nueve bits y los coeficientes de séptimo orden con un total de diez bits. En general, puede afirmarse que cuanto más elevado sea el orden seleccionado, será mayor el número de bits necesarios para la transmisión de los coeficientes del elemento de predicción de amplitud tonal cuantificado.

Además de la información que antecede, cuando la señal de audio se codifica en función del elemento de predicción de amplitud tonal seleccionado, será necesario transmitir la información sobre error de predicción en un campo de error 507. Esta información de error de predicción se genera ventajosamente en el bloque de cálculo 12 como una señal de diferencia que representa la diferencia entre el espectro de frecuencia de la señal de audio a codificar y el espectro de frecuencia de la señal que puede decodificarse (es decir, reconstruirse) utilizando los coeficientes del elemento de predicción de amplitud tonal cuantificado del elemento de predicción de amplitud tonal seleccionado en conjunción con la secuencia de referencia de muestras. De este modo, la señal de error a cuantificar se transfiere, por ejemplo, a través del primer bloque de selección 13 al bloque de cuantificación 14. La señal de error cuantificada se transfiere desde el bloque de cuantificación 14 al bloque de multiplexado 15 donde los valores de error de predicción cuantificados se añaden al campo de error 507 de la cadena de bits.

El codificador 1 de acuerdo con la invención comprende también una función local de decodificación. La señal de audio codificada se transfiere desde el bloque de cuantificación 14 al bloque de cuantificación inversa 17. Como se ha descrito anteriormente, en la situación en la que la eficacia de codificación no es superior a 1, la señal de audio se representa mediante sus valores de espectro de frecuencia cuantificados. En este caso, los valores del espectro de frecuencia cuantificados se transfieren al bloque de cuantificación inversa 17 donde se cuantifican inversamente en una forma conocida en sí a fin de restaurar el espectro de frecuencias original de la señal de audio del modo más preciso posible. Los valores cuantificados inversamente que representan el espectro de frecuencias de la señal de audio original constituyen una salida del bloque 17 al bloque de suma 18.

Si la eficacia de codificación es superior a 1, la señal de audio se representa mediante información del elemento de predicción de amplitud tonal, por ejemplo información del orden del elemento de predicción de amplitud tonal, coeficientes del elemento de predicción de amplitud tonal cuantificados, un valor de retardo e información de error de predicción en forma de valores del dominio de la frecuencia cuantificados. Como se ha descrito anteriormente, la información de error de predicción representa la diferencia entre el espectro de frecuencia de la señal de audio a codificar y el espectro de frecuencias de la señal de audio a reconstruir en función del elemento de predicción de amplitud tonal seleccionado y de la secuencia de referencia de muestras. Por lo tanto, en este caso, los valores del dominio de la frecuencia cuantificados que comprenden la información de predicción de error se transfieren al bloque de cuantificación inversa 17, donde se cuantifican inversamente de tal forma que se restauren los valores del dominio de la frecuencia del error de predicción de la forma más precisa posible. De este modo la salida del bloque 17 comprende valores de error de predicción cuantificados inversamente. Estos valores se aplican como una entrada del bloque de suma 18, donde se suman con los valores del dominio de la frecuencia de la señal predicha utilizando el elemento de predicción de amplitud tonal seleccionado. De esta forma se genera una representación reconstruida del dominio de la frecuencia de la señal de audio original. Los valores del dominio de la frecuencia de la señal predicha están disponibles a partir del bloque de cálculo 12 donde se calculan en relación con la determinación del error de predicción y se transfieren al bloque de suma 18 como se indica mediante la línea C1 en la figura 1.

El funcionamiento del bloque de suma 18 se activa y se desactiva de acuerdo con la información de control proporcionada por el bloque de cálculo 12. La transferencia de información de control que permite esta operación de activación y desactivación se indica mediante la conexión entre el bloque de cálculo 12 y el bloque de suma 18 (líneas D1 y D2 de la figura 1). La operación de activación y desactivación es necesaria para tener en cuenta los diferentes tipos de valores del dominio de la frecuencia cuantificados inversamente proporcionados por el bloque de cuantificación inversa 17. Como se ha descrito anteriormente, si la eficacia de codificación no es superior a 1, la salida del bloque 17 comprende valores del dominio de la frecuencia cuantificados inversamente que representan la señal de audio original. En este caso, no es necesario llevar a cabo ninguna operación de suma y no se precisa ninguna información relativa a los valores del dominio de la frecuencia de ninguna señal de audio predicha construida en el bloque de cálculo 12. En esta situación, la operación del bloque de suma 18 se ve inhibida por la información de control facilitada a partir del bloque de cálculo 12 y los valores del dominio de la frecuencia cuantificados inversamente que representan la señal de audio original pasan a través del bloque de suma 18. Por otra parte, si la eficacia de codificación es superior a 1, la salida del bloque 17 comprende valores de error de predicción cuantificados inversamente. En este caso, es necesario sumar los valores de error de predicción cuantificados inversamente con el espectro de frecuencias de la señal predicha a fin de generar una representación del dominio de la frecuencia reconstruido de la señal de audio original. A continuación, el funcionamiento del bloque de suma 18 se activa mediante la información de control transferida desde el bloque de cálculo 12 haciendo que los valores del error de predicción cuantificados inversamente se sumen con el espectro de frecuencias de la señal predicha. Ventajosamente, la información de control necesaria es facilitada por la información sobre el método de codificación generado en el bloque 12 en relación con la elección de la codificación que va a aplicarse a la señal de audio.

En una realización alternativa, la cuantificación puede llevarse a cabo antes de calcular los valores del error de predicción y de la eficacia de codificación, llevándose a cabo los cálculos del error de predicción y de la eficacia de codificación utilizando valores del dominio de la frecuencia cuantificados que representan la señal original y las señales predichas. Ventajosamente, la cuantificación se lleva a cabo en bloques de cuantificación situados entre los bloques 6 y 12 y los bloques 11 y 12 (no representados). En esta realización, no es necesario el bloque de cuantificación 14 pero se requiere un bloque adicional de cuantificación inversa en la vía indicada por la línea C1.

La salida del bloque de suma 18 consiste en datos de dominio de la frecuencia muestreados que se corresponden con la secuencia de muestras codificada (señal de audio). Estos datos de dominio de la frecuencia muestreados se transforman adicionalmente al dominio del tiempo en un transformador DCT modificado inverso 19 desde el cual la secuencia de muestras decodificada se transfiere a la memoria intermedia 8 para su almacenamiento y utilización en relación con la codificación de las tramas posteriores. La capacidad de almacenamiento de la memoria intermedia de referencia 8 se selecciona en función del número de muestras necesario para conseguir los requisitos de eficacia de codificación de la aplicación en cuestión. En la memoria intermedia de referencia 8 se almacena preferiblemente una nueva secuencia de muestras sobrescribiendo las muestras más antiguas de la memoria intermedia, es decir la memoria intermedia es de las denominadas circulares.

La cadena de bits generada en el codificador 1 se transfiere a un transmisor 16, en el cual se lleva a cabo la modulación de una forma conocida en sí. La señal modulada se transfiere a través del canal de transmisión de datos 3 al receptor, por ejemplo como señales de radio-frecuencia. Ventajosamente, la señal de audio codificada se transmite trama a trama, sustancialmente inmediatamente después de finalizar la codificación de una trama dada. Alternativamente, la señal de audio puede codificarse, almacenarse en la memoria del terminal de transmisión y transmitirse en un momento posterior.

En un dispositivo receptor 31, la señal recibida desde el canal de transmisión de datos es demodulada en una forma conocida en sí en un bloque receptor 20. La información contenida en la trama de datos demodulada se determina en el decodificador 33. En un bloque demultiplexor 21 del decodificador 33 se examina en primer lugar, en función de la información sobre el método de codificación 502 de la cadena de bits, si la información recibida se generó a partir de la señal de audio original. Si el decodificador determina que la cadena de bits 501 generada en el codificador 1 no contiene los valores de la transformada del dominio de la frecuencia de la señal original, la decodificación se lleva a cabo ventajosamente de la forma siguiente. El orden M que va a utilizarse en el bloque elemento de predicción de amplitud tonal 24 se determina a partir del campo de orden 504 y el retardo se determina a partir del campo de retardo 505. Los coeficientes del elemento de predicción de amplitud tonal cuantificados recibidos en el campo coeficientes 506 de la cadena de bits 501 así como la información relativa al orden y al retardo se transfieren al bloque del elemento de predicción de amplitud tonal 24 del decodificador. Esto se ilustra mediante la línea B2 de la figura 2. Los valores cuantificados de la señal de error de predicción recibidos en el campo 507 de la cadena de bits se cuantifican inversamente en un bloque de cuantificación inversa 22 y se transfieren al bloque de suma 23 del decodificador. A partir de la información de retardo, el bloque del elemento de predicción de amplitud tonal 24 del decodificador recupera las muestras a utilizar como secuencia de referencia a partir de una memoria intermedia de muestra 28, y lleva a cabo una predicción de acuerdo con el orden seleccionado M, en el cual el bloque elemento de predicción de amplitud tonal 24 utiliza los coeficientes del elemento de predicción de amplitud tonal recibidos. De este modo, se genera una primera señal de dominio del tiempo reconstruida que se transforma al dominio de la frecuencia en un bloque de transformación 25. Esta señal de dominio de la frecuencia se transfiere al bloque de suma 23 donde se genera una señal de dominio de la frecuencia como una suma de esta señal y de la señal de error de predicción cuantificado inversamente. De este modo, en condiciones de transmisión de datos libre de errores, la señal del dominio de la frecuencia reconstruida se corresponde sustancialmente con la señal codificada original del dominio de la frecuencia. Esta señal del dominio de la frecuencia se transforma al dominio del tiempo mediante una transformación modificada inversa DCT en un bloque de transformación inversa 26 en el que una señal de audio digital se encuentra presente en la salida del bloque de transformación inversa 26. Esta señal se convierte en una señal analógica en el conversor digital / analógico 27, se amplifica si fuese necesario y se transfiere a otras etapas posteriores de procesamiento en una forma conocida en sí. En la figura 3, esto se muestra mediante el bloque de audio
32.

Si la cadena de bits 501 generada en el codificador 1 comprende los valores de la señal original transformada al dominio de la frecuencia, la decodificación se lleva a cabo ventajosamente de la forma siguiente. Los valores de la transformada del dominio de la frecuencia cuantificados se cuantifican inversamente en el bloque de cuantificación inversa 22 y se transfieren a través del bloque de suma 23 al bloque de transformación inversa 26. En el bloque de transformación inversa 26, la señal del dominio de la frecuencia se transforma al dominio del tiempo mediante una transformada modificada inversa DCT en la que una señal de dominio del tiempo correspondiente a la señal de audio original se genera en formato digital. Si fuese necesario, esta señal se transforma en una señal analógica en el conversor digital / analógico 27.

En la figura 2, la referencia A2 muestra la transmisión de la información de control al bloque de suma 23. Esta información de control se utiliza de una manera análoga a la descrita en relación con la función local de decodificador del codificador. Dicho de otro modo, si la información sobre el método de codificación proporcionada en el campo 502 de una cadena de bits recibida 501 indicase que las cadenas de bits contienen valores del dominio de la frecuencia cuantificados obtenidos a partir de la propia señal de audio, se ve inhibido el funcionamiento del bloque de suma 23. Esto permite que los valores del dominio de la frecuencia cuantificados de la señal del audio pasen a través del bloque de suma 23 al bloque de transformación inversa 26. Por otra parte, si la información sobre el método de codificación recuperada a partir del campo 502 de una cadena de bits recibidos indicase que la señal de audio se ha codificado utilizando un elemento de predicción de amplitud tonal, se activará el funcionamiento del bloque de suma 23, permitiendo que se sumen los datos de error de predicción cuantificados inversamente con la representación del dominio de la frecuencia de la señal predicha generada por el bloque de transformación 25.

En el ejemplo de la figura 3, el dispositivo de transmisión es un dispositivo inalámbrico de comunicaciones 2 y el dispositivo de recepción es una estación base 31, en la que la señal transmitida desde el dispositivo inalámbrico de comunicaciones 2 se decodifica en el decodificador 33 de la estación base 31, a partir de la cual la señal de audio analógica se transmite a otras etapas de procesamiento de una forma conocida en sí.

Es evidente que en el presente ejemplo sólo se han presentado las características más esenciales para la aplicación de la invención, pero en aplicaciones prácticas el sistema de transmisión de datos también comprende funciones distintas de las aquí presentadas. También es posible utilizar otros métodos de codificación en relación con la codificación de acuerdo con la invención, como la predicción a corto plazo. Adicionalmente, cuando se transmite la señal codificada de acuerdo con la invención, pueden llevarse a cabo otras etapas de procesamiento, como la codificación de
canal.

También es posible determinar la correspondencia entre la señal predicha y la señal real al dominio del tiempo. De este modo, en una realización alternativa de la invención, no es necesario transformar las señales al dominio de la frecuencia en el que los bloques de transformación 6, 11 no son necesariamente precisos, como tampoco lo son el bloque de transformación inversa 19 del codificador ni el bloque de transformación 25 ni el bloque de transformación inversa 26 del decodificador. La eficacia de codificación y el error de predicción se determinan por tanto en función de señales de dominio del tiempo.

Las etapas de codificación / decodificación de la señal de audio, descritas anteriormente pueden aplicarse a diferentes tipos de sistemas de transmisión de datos, como sistemas de comunicaciones móviles, sistemas de TV vía satélite, sistemas de vídeo a la carta, etc. Por ejemplo, un sistema de comunicaciones móviles en el cual las señales de audio se transmiten en modo full-duplex requiere un par de sistemas de codificador / decodificador tanto en el dispositivo inalámbrico de comunicaciones 2 como en la estación base 31 o similar. En el diagrama de bloques de la figura 3, los bloques funcionales correspondientes del dispositivo inalámbrico de comunicaciones 2 y de la estación base 31, se encuentran marcados básicamente con los mismos números de referencia. Aunque el codificador 1 y el decodificador 33 se muestran como unidades independientes en la figura 3, en aplicaciones prácticas pueden implementarse en una unidad denominada codec (codificador-decodificador) en la cual se implementan todas las funciones necesarias para llevar a cabo la codificación y la decodificación. Si la señal de audio se transmite en formato digital en el sistema de comunicaciones móviles, las conversiones analógico / digital y digital / analógico, respectivamente, no serán necesarias en la estación base. De este modo, dichas transformaciones se llevan a cabo en el dispositivo inalámbrico de comunicaciones y en el interfaz a través del cual la red de comunicaciones móviles se conecta a otra red de telecomunicaciones como una red telefónica pública. No obstante, si esta red telefónica es una red telefónica digital, estas transformaciones también podrán efectuarse, por ejemplo, en un teléfono digital (no mostrado) conectado a dicha red telefónica.

Las etapas de codificación descritas anteriormente no se llevan a cabo necesariamente durante la transmisión, sino que la información codificada puede almacenarse para su posterior transmisión. Además, la señal de audio aplicada al codificador no tiene que ser necesariamente una señal de audio en tiempo real, sino que la señal de audio a codificar puede ser información almacenada previamente a partir de la señal de audio.

En los siguientes párrafos se describirán desde el punto de vista matemático las diferentes etapas de codificación de acuerdo con una realización ventajosa de la invención. La función de transferencia del bloque del elemento de predicción de amplitud tonal se expresa de la forma siguiente:

(1)B(z) = \sum\limits_{k = -m_{1}}^{m_{2}}b(k)z^{-(\alpha+k)}

donde \alpha es el retardo, b(k) son los coeficientes del elemento de predicción de amplitud tonal, y m_{1} y m_{2} dependen del orden (M), ventajosamente de la forma siguiente:

m_{1} = (M-1)/2

m_{2} = M-m1-1

Ventajosamente, la secuencia de muestras que mejor se correspondan (es decir, la secuencia de referencia) se determina utilizando el método de los mínimos cuadrados. Esto puede expresarse de la forma siguiente:

(2)E = \sum\limits_{i=0}^{N-1}\left(x(i)- \sum\limits_{j = -m_{1}}^{m_{2}}b(j) \tilde{x} (i + j - \alpha)\right)^{2}

donde E = error, x() es la señal de entrada en el dominio del tiempo, \tilde{x}() es la señal reconstruida a partir de la secuencia de muestras anterior y N es el número de muestras de la trama examinada. El retardo \alpha puede calcularse fijando la variable m_{1} = 0 y m_{2} = 0 y despejando b en la ecuación 2. Otra alternativa para resolver el retardo \alpha consiste en utilizar el método de correlación normalizado, usando la fórmula:

(3)\alpha = max_{lag} \left\{\frac{\sum\limits^{N-1}_{i=0} (x(i)\tilde{x}(i - lag))}{\sqrt{\sum\limits^{N-1}_{i=0} \tilde{x} (i - lag)^{2}}} , lag = startlag,..., endlag \right\}

Cuando ha sido encontrada la secuencia de muestras que mejor se corresponden (referencia), el bloque de retardo 7 contiene información acerca del retardo, es decir cuanto tiempo antes apareció la secuencia de muestras correspondientes en la señal de audio.

Los coeficientes del elemento de predicción de amplitud tonal b(k) pueden calcularse para cada orden M a partir de la ecuación (2) que puede re-expresarse como sigue:

(4)E = \sum\limits^{N-1}_{i=0} x(i)^{2} - 2 \cdot \sum\limits^{N-1}_{i=0} x(i) \sum\limits^{m_{2}}_{j=-m_{1}} b(j) \tilde{x} (i + j - \alpha) + \sum\limits^{N-1}_{i=0} \left(\sum\limits^{m_{2}}_{j=-m_{1}} b(j)\tilde{x} (i + j - \alpha)\right)^{2}

El valor óptimo para los coeficientes b(k) puede determinarse buscando un coeficiente b(k) para el cual la variación en el error con respecto a b(k) sea lo más reducida posible. Esto puede calcularse fijando a cero la derivada parcial de la relación de error respecto a b (\deltaE/\deltab=0) con lo cual se llega a la siguiente fórmula:

(5)-2 \cdot \sum\limits^{N-1}_{i=0} x(i) \sum\limits^{m_{2}}_{j=-m_{1}} \tilde{x} (i + j - \alpha) + 2 \cdot \sum\limits^{N-1}_{i=0} \left[\left(\sum\limits^{m_{2}}_{j=-m_{1}} b(j) \tilde{x}(i + j - \alpha)\right) \cdot \sum\limits^{m_{2}}_{j=-m_{1}} \tilde{x} (i + j - \alpha)\right] = 0

es decir:

\sum\limits^{N-1}_{i=0} \left[\sum\limits^{m_{2}}_{j=-m_{1}} b(j) \tilde{x} (i + j - \alpha) \cdot \sum\limits^{m_{2}}_{j=-m_{1}} \tilde{x} (i + j - \alpha)\right] = \sum\limits^{N-1}_{i=0} x(i) \ \sum\limits^{m_{2}}_{j=-m_{1}} \tilde{x} (i + j - \alpha)

Esta ecuación se puede escribir en formato matricial, en el que los coeficientes b(k) pueden determinarse resolviendo la ecuación matricial:

\bar{b} = \bar{A}^{-1} \cdot \bar{r}

donde:

1

2

En el método de acuerdo con la invención, el objeto es utilizar la periodicidad de la señal de audio de forma más eficaz que en los sistemas de acuerdo con la técnica anterior. Esto se consigue aumentando la adaptabilidad del codificador a los cambios en la frecuencia de la señal de audio, calculando los coeficientes del elemento de predicción de amplitud tonal para diversos órdenes. El orden del elemento de predicción de amplitud tonal utilizado para codificar la señal de audio puede seleccionarse de forma que se reduzca al mínimo el error de predicción a fin de aumentar al máximo la eficacia de codificación o conseguir un compromiso entre el error de predicción y la eficacia de codificación. La selección se lleva a cabo a ciertos intervalos, preferiblemente de forma independiente para cada trama. Los coeficientes de orden y de elemento de predicción de amplitud tonal pueden, de este modo, cambiar trama por trama. En el método de acuerdo con la invención es posible por lo tanto aumentar la flexibilidad de la codificación en comparación con métodos de codificación de la técnica anterior que utilizaban un orden fijo. Además, en el método de acuerdo con la invención, si la cantidad de información (número de bits) a transmitir para una trama dada no se puede reducir mediante codificación, podrá transmitirse la señal original transformada al dominio de la frecuencia en lugar de los coeficientes del elemento de predicción de amplitud tonal y la señal de error.

Los procedimientos de cálculo previamente presentados utilizados en el método de acuerdo con la invención pueden llevarse a cabo ventajosamente en forma de un programa, como códigos de programa del controlador 34 en una unidad de procesamiento de señales digitales o similar, y/o como una realización de hardware. De acuerdo con la anterior descripción de la invención, cualquier persona versada en la materia podrá llevar a cabo el codificador 1 de acuerdo con la invención y, de este modo, no será necesario comentar en mayor detalle en este contexto los diferentes bloques funcionales del codificador 1.

A fin de transmitir dichos coeficientes del elemento de predicción de amplitud tonal al receptor, es posible utilizar las llamadas tablas de búsqueda. En este tipo de tablas de búsqueda se almacenan distintos valores de coeficientes y en lugar del coeficiente, se transmite el índice de este coeficiente en la tabla de búsquedas. La tabla de búsquedas es conocida tanto para el codificador 1 como para el decodificador 33. En la etapa de recepción es posible determinar el coeficiente del elemento de predicción de amplitud tonal en cuestión a partir del índice transmitido utilizando la tabla de búsquedas. En algunos casos, utilizar la tabla de búsquedas puede reducir el número de bits a transmitir cuando se compara con la transmisión de coeficientes del elemento de predicción de amplitud tonal.

La presente invención no se limita a las realizaciones presentadas anteriormente, ni está limitada en otros aspectos, sino que puede modificarse dentro del ámbito de las reivindicaciones adjuntas.

Claims

1. Método para codificar una señal de audio que comprende las siguientes etapas:

-: examinar una porción de la señal de audio a codificar para encontrar otra porción de la señal de audio que sea la que mejor se corresponda con la porción de la señal de audio a codificar y que se selecciona como secuencia de referencia de muestras;

-: generar una serie de señales predichas de dicha secuencia de referencia de muestras utilizando una serie de órdenes del elemento de predicción de amplitud tonal;

-: determinar una eficacia de codificación de, al menos, una de dichas señales predichas; y

-: utilizar la eficacia de codificación determinada para seleccionar un método de codificación de la porción de la señal de audio a codificar.

2. Método de acuerdo con la reivindicación 1, caracterizado porque los métodos de codificación que pueden seleccionarse comprenden un método en el cual la señal de audio a codificar se codifica de acuerdo con una señal predicha.

3. Método de acuerdo con la reivindicación 2, caracterizado porque los métodos de codificación que pueden seleccionarse comprenden un método en el cual la señal de audio a codificar se codifica de acuerdo con la propia señal de audio.

4. Método de acuerdo con la reivindicación 1, caracterizado porque se determina un error de codificación de cada una de dichas señales predichas.

5. Método de acuerdo con la reivindicación 4, caracterizado porque la eficacia de codificación se define para la señal predicha con el error de codificación menor y porque la codificación se lleva a cabo a partir de la señal predicha que tiene dicho error de codificación menor si la información de eficacia de codificación determinada indica que la cantidad de información codificada es inferior a la que se tendría sí la codificación se realizase a partir de la porción de la señal de audio a codificar.

6. Método de acuerdo con la reivindicación 5, caracterizado porque la porción de la señal de audio a codificar se transforma al dominio de la frecuencia a fin de determinar el espectro de frecuencias de la señal de audio y porque cada señal predicha se transforma al dominio de la frecuencia a fin de determinar el espectro de frecuencias de cada señal predicha y porque dicha eficacia de codificación se determina para dicha señal predicha con el menor error de codificación a partir del espectro de frecuencia de la señal de audio y del espectro de frecuencia de la señal predicha.

7. Método de acuerdo con la reivindicación 1, caracterizado porque la eficacia de codificación se determina para cada una de dichas señales predichas y se determina un error de codificación de aquellas señales predichas respecto a las cuales la información de eficacia de codificación indica que la cantidad de información codificada es inferior a la que se tendría sí la codificación se realizase a partir de la porción de la señal de audio a codificar y la codificación se realiza a partir de la señal predicha que proporciona el menor error de codificación.

8. Método de acuerdo con la reivindicación 1, caracterizado porque una eficacia de codificación se determina para cada una de dichas señales predichas y la codificación se realiza a partir de la señal predicha que proporciona la mayor eficacia de codificación, cuando la eficacia de codificación determinada indica que la cantidad de información codificada es inferior a la que se tendría sí la codificación se realizase a partir de la porción de la señal de audio a codificar.

9. Método de acuerdo con la reivindicación 1, caracterizado porque la eficacia de codificación se determina para cada una de dichas señales predichas y la codificación se realiza a partir de la señal predicha que proporciona mayor eficacia de codificación.

10. Método de acuerdo con las reivindicaciones 7, 8 o 9, caracterizado porque la porción de la señal de audio a codificar se transforma al dominio de la frecuencia para determinar el espectro de frecuencia de la señal de audio, y cada señal predicha se transforma al dominio de la frecuencia a fin de determinar el espectro de frecuencia de cada señal predicha, y porque dicha eficacia de codificación se determina para cada señal predicha a partir del espectro de frecuencia de la señal de audio y al espectro de frecuencia de la señal predicha.

11. Método de acuerdo con las reivindicaciones 5, 6, 7, 8 o 9, caracterizado porque la información relativa al error de predicción se determina para cada una de dichas señales predichas.

12. Método de acuerdo con las reivindicaciones 5, 6, 7, 8 o 9, caracterizado porque dichas señales predichas se generan utilizando un orden de predicción diferente para cada una de dichas señales predichas.

13. Método de acuerdo con las reivindicaciones 6 o 10, caracterizado porque dicha información relativa al error de predicción determinada para cada una de dichas señales predichas se calcula como un espectro de diferencia que representa utilizar dicho espectro de frecuencia de la señal de audio y del espectro de frecuencia de la señal predi-
cha.

14. Método de acuerdo con las reivindicaciones 10 o 13, caracterizado porque la transformación al dominio de la frecuencia se lleva a cabo utilizando una transformación DCT modificada.

15. Método de acuerdo con las reivindicaciones 1 a 14, caracterizado porque la información codificada (501) de la señal predicha comprende, al menos, datos relativos al método de codificación (502), datos relativos al orden seleccionado (504), un retardo (505), coeficientes del elemento de predicción de amplitud tonal (506) y datos relativos al error de predicción (507).

16. Método de acuerdo con las reivindicaciones 1 a 15, caracterizado porque la señal de audio se divide en tramas, y en el que la codificación se lleva a cabo independientemente para cada trama generada a partir de la señal de
audio.

17. Método de acuerdo con las reivindicaciones 1 a 16, caracterizado porque la señal de audio es una señal de voz.

18. Método de acuerdo con las reivindicaciones 4 a 7, caracterizado porque dicho error de codificación se determina utilizando uno de los siguientes métodos:

-: un método de mínimos cuadrados;

-: un método basado en modelado psico-acústico de la señal de audio a codificar.

19. Método de acuerdo con la reivindicación 18, caracterizado porque cuando dicho error de codificación se determina utilizando el método de los mínimos cuadrados, el error de codificación se calcula a partir del error de predicción.

20. Método de acuerdo con cualquiera de las reivindicaciones 1 a 19, caracterizado porque dicha señal de audio codificada se transmite a un dispositivo de recepción.

21. Codificador (1) que comprende medios (16, 20) para codificar una señal de audio, comprendiendo dichos medios de codificación:

-: medios (7) para examinar una porción de la señal de audio a codificar para encontrar otra porción de la señal de audio que sea la que mejor se corresponda con la porción de la señal de audio a codificar, que se ha seleccionado como secuencia de referencia de muestras;

-: medios (9, 10) para utilizar una serie de órdenes de elemento de predicción de amplitud tonal para generar una serie de señales predichas a partir de dicha secuencia de referencia de muestras;

-: medios (12) para determinar una eficacia de codificación de al menos una de dichas señales predichas; y

-: medios (12, 13, 14) para utilizar la eficacia de codificación determinada para seleccionar un método de codificación de la porción de la señal de audio a codificar.

22. Codificador (1) de acuerdo con la reivindicación 21, caracterizado porque comprende medios (4, 6-14) de codificación de la señal de audio a partir de una señal predicha.

23. Codificador (1) de acuerdo con la reivindicación 22, caracterizado porque comprende medios (4, 6, 14) para codificar la propia señal de audio.

24. Sistema para transmisión de datos que comprende:

-: un codificador de acuerdo con la reivindicación 21, y

-: medios (16) para transmitir la señal de audio codificada.

25. Sistema de transmisión de datos de acuerdo con la reivindicación 24, caracterizado porque comprende medios para determinar un error de codificación de, al menos, una de dichas señales predichas.

26. Sistema de transmisión de datos de acuerdo con la reivindicación 24, caracterizado porque comprende medios de transformación de la porción de la señal de audio a codificar al dominio de la frecuencia y medios para transformar cada una de dichas señales predichas al dominio de la frecuencia.

27. Sistema de transmisión de datos de acuerdo con la reivindicación 24, caracterizado porque comprende medios para generar una cadena de bits (15) para su transmisión a un dispositivo receptor, comprendiendo dicha cadena de bits, al menos, información relativa al método de codificación seleccionado.

28. Sistema de transmisión de datos de acuerdo con cualquiera de las reivindicaciones 24 a 27, caracterizado porque comprende medios para dividir la señal de audio en tramas.

29. Sistema de transmisión de datos de acuerdo con cualquiera de las reivindicaciones 24 a 28, caracterizado porque comprende un terminal móvil.

30. Decodificador (33) para decodificar una señal de audio codificada en un codificador de acuerdo con la reivindicación 21, caracterizado porque el decodificador comprende:

-: medios para determinar el método para codificar la señal de audio a decodificar comprendiendo medios para examinar, a partir de la información sobre el método de codificación (502), si la información recibida se generó a partir de la señal de audio original, y medios para examinar el orden del elemento de predicción de amplitud tonal (M) utilizado en la fase de codificación; y

-: medios para decodificar la señal de audio de acuerdo con el método de codificación determinado que comprende medios (21) para recibir información relativa a una señal predicha, medios para decodificar la señal utilizando la información codificada generada a partir de la propia señal de audio, medios para seleccionar el orden del elemento de predicción de amplitud tonal para decodificar la señal y medios para decodificar la señal realizando una predicción de acuerdo con el orden del elemento de predicción de amplitud tonal (M) seleccionado.

31. Decodificador de acuerdo con la reivindicación 30, caracterizado porque el decodificador comprende medios (21) para determinar a partir de dicha información recibida al menos datos relativos a un orden seleccionado (504), un retardo (505), al menos un coeficiente del elemento de predicción de amplitud tonal (506) y datos de error de predicción (507).

32. Decodificador de acuerdo con la reivindicación 31, caracterizado porque comprende medios (24, 28) para generar una señal predicha utilizando dichos datos relativos a un orden seleccionado (504), un retardo (505), y al menos un coeficiente del elemento de predicción de amplitud tonal (506).

33. Decodificador de acuerdo con la reivindicación 31 o 32, caracterizado porque comprende medios (23, 24, 28) para generar una señal de audio reconstruida utilizando dicha señal predicha y dichos datos de error de predicción.

34. Decodificador de acuerdo con la reivindicación 30, caracterizado porque comprende medios (21) para recibir información relativa a la propia señal de audio.

35. Decodificador de acuerdo con la reivindicación 34, caracterizado porque comprende medios (22, 23, 26) para generar una señal de audio reconstruida utilizando dicha información recibida relativa a la propia señal de audio.

36. Método para decodificar una señal de audio codificada de acuerdo con el método de la reivindicación 1, caracterizado porque dicho método comprende la etapa de examinar, a partir de la información del método de codificación (502), si la información recibida se generó a partir de la señal de audio original, en el que la señal se decodifica utilizando la información codificada generada a partir de la propia señal de audio, examinándose en otro caso el orden del elemento de predicción de amplitud tonal (M) utilizado en la etapa de codificación, y efectuándose una predicción de acuerdo con el orden del elemento de predicción de amplitud tonal (M) para recuperar la señal de audio.