ES2244452T3 - Metodo para mejorar la eficacia de codificacion de una señal de audio. - Google Patents

Metodo para mejorar la eficacia de codificacion de una señal de audio.

Info

Publication number
ES2244452T3
ES2244452T3 ES00944090T ES00944090T ES2244452T3 ES 2244452 T3 ES2244452 T3 ES 2244452T3 ES 00944090 T ES00944090 T ES 00944090T ES 00944090 T ES00944090 T ES 00944090T ES 2244452 T3 ES2244452 T3 ES 2244452T3
Authority
ES
Spain
Prior art keywords
signal
audio signal
coding
encoded
predicted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES00944090T
Other languages
English (en)
Inventor
Juha Ojanpera
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Application granted granted Critical
Publication of ES2244452T3 publication Critical patent/ES2244452T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Método para codificar una señal de audio que comprende las siguientes etapas: - examinar una porción de la señal de audio a codificar para encontrar otra porción de la señal de audio que sea la que mejor se corresponda con la porción de la señal de audio a codificar y que se selecciona como secuencia de referencia de muestras; - generar una serie de señales predichas de dicha secuencia de referencia de muestras utilizando una serie de órdenes del elemento de predicción de amplitud tonal; - determinar una eficacia de codificación de, al menos, una de dichas señales predichas; y - utilizar la eficacia de codificación determinada para seleccionar un método de codificación de la porción de la señal de audio a codificar.

Description

Método para mejorar la eficacia de codificación de una señal de audio.
En general, los sistemas de codificación de audio producen señales codificadas a partir de una señal de audio analógica, tal como una señal de voz. Normalmente, las señales codificadas se transmiten a un receptor mediante métodos de transmisión de datos específicos del sistema de transmisión de datos. En el receptor se genera una señal de audio a partir de las señales codificadas. La cantidad de información que debe transmitirse se ve afectada, por ejemplo, por el ancho de banda utilizado en el sistema para la información codificada, así como por la eficacia con la que puede ejecutarse la codificación.
A efectos de codificación, se generan muestras digitales a partir de la señal analógica, por ejemplo a intervalos regulares de 0,125 ms. Las muestras se procesan normalmente en grupos de un tamaño fijo, por ejemplo en grupos con una duración de aproximadamente 20 ms. Estos grupos de muestras se denominan también "tramas". Por lo general, una trama es la unidad básica en la cual se procesan los datos de audio.
La finalidad de los sistemas de codificación de audio consiste en obtener una calidad de sonido que sea la mejor posible dentro del margen del ancho de banda disponible. A estos efectos, puede utilizarse la periodicidad presente en una señal de audio, y especialmente en una señal de voz. La periodicidad de la voz está causada, por ejemplo, por la vibración de las cuerdas vocales. Normalmente, el período de vibración se sitúa dentro de la gama de 2 ms a 20 ms. En numerosos codificadores de voz de acuerdo con la técnica anterior, se utiliza una técnica conocida como predicción a largo plazo (LTP) cuya finalidad consiste en evaluar y utilizar dicha periodicidad para mejorar la eficacia del proceso de codificación. De este modo, durante la codificación, la parte (trama) de la señal a codificar se compara con porciones de la señal previamente codificadas. Si se encuentra una señal similar en la parte codificada anteriormente, la demora (retardo) entre la señal similar y la señal a codificar se somete a examen. Se genera una señal predicha que representa la señal a codificar y que se basa en la señal similar. Además, se genera una señal de error que representa la diferencia entre la señal predicha y la señal a codificar. De este modo, la codificación se lleva a cabo ventajosamente de tal forma que sólo se transmiten la información de retardo y la señal de error. En el receptor se recuperan las muestras correctas de la memoria, se utilizan para predecir la parte de la señal a codificar y se combinan con la señal de error a partir del retardo. Matemáticamente, puede considerarse que este elemento de predicción de amplitud tonal realiza una operación de filtrado que queda ilustrada mediante una función de transferencia como la que se muestra a continuación:
P(z) = \beta z^{-\alpha}
La ecuación que antecede muestra la función de transferencia de un elemento de predicción de amplitud tonal de primer orden, siendo \beta el coeficiente del elemento de predicción de amplitud tonal y \alpha es el retardo que representa la periodicidad. En el caso de filtros elementos de predicción de amplitud tonal de más alto nivel, es posible utilizar una función de transferencia más general:
P(z)= \sum\limits^{m_{1}}_{k=-m_{1}} \beta_{k} z^{-(\alpha+k)}
La finalidad consiste en seleccionar coeficientes \beta_{k} para cada trama de tal forma que el error de codificación, es decir la diferencia entre la señal real y la señal generada utilizando las muestras precedentes sea lo más pequeña posible. Ventajosamente, estos coeficientes se seleccionan para ser utilizados en la codificación con la cual se consiga el menor error, utilizando el método de los mínimos cuadrados. Ventajosamente, los coeficientes se actualizan trama por trama.
La patente US 5.528.629 describe un sistema de codificación de voz perteneciente a la técnica anterior que utiliza la predicción a corto plazo (STP) así como una predicción a largo plazo de primer orden.
Los codificadores de la técnica anterior presentan como desventaja que no se presta atención a la relación entre la frecuencia de la señal de audio y su periodicidad. De este modo, la periodicidad de la señal no se puede utilizar eficazmente en todas las situaciones y la cantidad de información codificada se hace innecesariamente larga, o la calidad del sonido de la señal de audio reconstruida en el receptor se deteriora.
En algunas situaciones, por ejemplo cuando una señal de audio tiene un carácter altamente periódico y experimenta pocas variaciones a lo largo del tiempo, la información de retardo por sí sola facilita una buena base para predecir la señal. En esta situación no es necesario utilizar un elemento de predicción de amplitud tonal de orden superior. En otras situaciones, lo contrario es cierto. El retardo no es necesariamente un múltiplo entero del intervalo de muestreo. Por ejemplo, puede encontrarse entre dos muestras sucesivas de la señal de audio. En esta situación, los elementos de predicción de amplitud tonal de orden superior pueden efectuar interpolaciones entre los tiempos de muestreo discretos a fin de facilitar una representación más precisa de la señal. Además, la respuesta en frecuencia de los elementos de predicción de amplitud tonal de orden superior tiende a disminuir en función de la frecuencia. Esto significa que los elementos de predicción de amplitud tonal de orden superior proporcionan un mejor modelado de los componentes de frecuencias inferiores de la señal de audio. En la codificación de voz esto resulta ventajoso, ya que los componentes de baja frecuencia influyen más significativamente sobre la calidad percibida de la señal de voz que los componentes de frecuencias más elevadas. Por lo tanto, cabe señalar que la capacidad de variación del orden del elemento de predicción de amplitud tonal utilizado para predecir una señal de audio de acuerdo con la evolución de la señal resulta muy deseable. Un codificador que utilice un elemento de predicción de amplitud tonal de orden fijo puede resultar excesivamente complejo en ciertas situaciones, siendo incapaz de modelar suficientemente la señal de audio en
otras.
Una finalidad de la presente invención según se define en las reivindicaciones independientes adjuntas consiste en implementar un método para mejorar la precisión de codificación y la eficiencia de transmisión de las señales de audio en un sistema de transmisión de datos en el cual los datos de audio se generan con una mayor precisión y se transfieren con una mayor eficacia que con los métodos utilizados por la técnica anterior. Un codificador de acuerdo con la invención, su finalidad consiste en predecir la señal de audio a codificar trama por trama con la mayor precisión posible, al mismo tiempo que garantiza que la cantidad de información a transmitir sigue siendo reducida.
La presente invención presenta considerables ventajas cuando se la compara con las soluciones de acuerdo con la técnica anterior. El método de acuerdo con la invención permite que una señal de audio se codifique con mayor precisión que en el caso de los métodos de la técnica anterior, al mismo tiempo que garantiza que la cantidad de información que a transmitir sigue siendo baja. La invención también permite que la codificación de una señal de audio se lleve a cabo de una forma más flexible que con los métodos de acuerdo con la técnica anterior. La invención puede llevarse a cabo de tal forma que de preferencia a la precisión con la cual se predice la señal de audio (maximización cualitativa), que de preferencia a la reducción de la cantidad de información necesaria para representar la señal de audio codificada (minimización cuantitativa), o que se llegue a un compromiso entre las dos. Utilizando el método de acuerdo con la invención, también es posible tener en cuenta más adecuadamente las periodicidades de las diferentes frecuencias que existen en la señal de audio.
En los siguientes párrafos se describirá la invención en mayor detalle, haciendo referencia a los dibujos adjuntos en los cuales:
La figura 1 muestra un codificador de acuerdo con una realización preferida de la invención.
La figura 2 muestra un codificador de acuerdo con una realización preferida de la invención.
La figura 3 es un diagrama de bloques reducido que presenta un sistema de transmisión de datos de acuerdo con una realización preferida de la invención.
La figura 4 es un diagrama de flujo que muestra un método de acuerdo con una realización preferida de la invención.
Las figuras 5a y 5b son ejemplos de tramas de transmisión de datos generadas por el decodificador de acuerdo con una realización preferida de la invención.
La figura 1 es un diagrama de bloques reducido que muestra un codificador 1 de acuerdo con una realización preferida de la invención. La figura 4 es un diagrama de flujo 400 que muestra el método de acuerdo con la invención. El codificador 1 es, por ejemplo, un codificador de voz de un dispositivo inalámbrico de comunicaciones 2 (figura 3) para la conversión de una señal de audio en una señal codificada a transmitir en un sistema de transmisión de datos, tal como una red de comunicaciones móviles o Internet. De este modo, un decodificador 33 se encuentra ventajosamente situado en una estación base de la red de comunicaciones móviles. De igual modo, una señal de audio analógica, por ejemplo una señal generada por un micrófono 29 y amplificada en un bloque de audio 30, si fuera necesario, se convierte mediante un conversor analógico / digital 4 en una señal digital. La precisión de la conversión es, por ejemplo, de 8 o 12 bits, y el intervalo (resolución de tiempo) entre las muestras sucesivas es de, por ejemplo, 0,125 ms. Es evidente que los valores numéricos presentados en esta descripción son tan sólo ejemplos que aclaran la invención y no la limitan.
Las muestras obtenidas a partir de la señal de audio se almacenan en una memoria intermedia de muestras (no representada) que puede llevarse a cabo de una forma conocida como, por ejemplo, en la memoria 5 del dispositivo inalámbrico de comunicaciones 2. Ventajosamente, la codificación de la señal de audio se lleva a cabo trama a trama de forma que se transmite un número predeterminado de muestras al codificador 1 para su codificación, por ejemplo las muestras generadas a lo largo de un período de 20 ms (= 160 muestras suponiendo un intervalo de tiempo de 0,125 ms entre las muestras sucesivas). Las muestras de una trama a codificar se transmiten ventajosamente a un bloque de transformación 6 en el que la señal de audio se transforma del dominio del tiempo a un ámbito de transformación (dominio de la frecuencia) por ejemplo mediante una transformada de coseno discreto modificada (MDCT). La salida del bloque de transformación 6 proporciona un grupo de valores que representan las propiedades de la señal transformada al dominio de la frecuencia. Esta transformación se representa mediante el bloque 404 en el diagrama de flujo de la figura 4.
Una realización alternativa para la transformación de una señal del dominio de tiempo al dominio de la frecuencia consiste en un banco de filtros compuesto por diversos filtros paso-banda. La banda de paso de cada filtro es relativamente estrecha, con lo que las magnitudes de las señales en las salidas de los filtros representan el espectro de frecuencia de la señal a transformar.
Un bloque de retardo 7 determina cuál de las secuencias de muestras precedentes se corresponde mejor con la trama a codificar en un momento dado (bloque 402). Esta etapa de determinación del retardo se lleva a cabo ventajosamente de tal forma que el bloque de retardo 7 compara los valores almacenados en una memoria intermedia de referencia 8 con las muestras de la trama a codificar y calcula el error entre las muestras de la trama a codificar y una secuencia correspondiente de muestras almacenada en la memoria intermedia de referencia, utilizando por ejemplo un método de mínimos cuadrados. Preferiblemente, la secuencia de muestras formada por muestras sucesivas y que tiene el menor error se selecciona como secuencia de referencia de muestras.
Cuando la secuencia de referencia de muestras se selecciona a partir de las muestras almacenadas por el bloque de retardo 7 (bloque 403), el bloque de retardo 7 transfiere la información relativa a esta a un bloque de cálculo de coeficientes 9 a fin de llevar a cabo la evaluación del coeficiente del elemento de predicción de amplitud tonal. Por tanto en el bloque de cálculo de coeficientes 9, se calculan los coeficientes del elemento de predicción de amplitud tonal b(k) para diferentes órdenes del elemento de predicción de amplitud tonal, tal como 1, 3, 5 y 7 basándose en las muestras que contiene la secuencia de referencia de muestras. Los coeficientes calculados b(k) se transfieren a continuación al bloque elemento de predicción de amplitud tonal 10. En el diagrama de flujo de la figura 4, estas etapas se muestran en los bloques 405 a 411. Es evidente que los órdenes presentados aquí funcionan únicamente como ejemplos que aclaran la invención sin limitarla. La invención también puede aplicarse con otros órdenes, y el número de órdenes disponible también puede ser diferente del total de cuatro órdenes presentados en este documento.
Después de haber calculado los coeficientes del elemento de predicción de amplitud tonal, estos se cuantifican, con lo que se obtienen coeficientes del elemento de predicción de amplitud tonal cuantificados. Los coeficientes del elemento de predicción de amplitud tonal se cuantifican preferiblemente de forma que la señal reconstruida generada en el decodificador 33 del receptor se corresponda con la original de la forma más estrecha posible en condiciones de transmisión de datos sin error. Al cuantificar los coeficientes del elemento de predicción de amplitud tonal, resulta ventajoso utilizar la resolución más elevada posible (etapas de cuantificación lo menores posible) a fin de reducir al mínimo los errores provocados por el redondeo.
Las muestras almacenadas en la secuencia de referencia de muestras se transfieren al bloque del elemento de predicción de amplitud tonal 10 en el que se genera una señal predicha, para cada orden del elemento de predicción de amplitud tonal a partir de las muestras de la secuencia de referencia, utilizando los coeficientes de elemento de predicción de amplitud tonal calculados y cuantificados b(k). Cada señal predicha representa la predicción de la señal a codificar, evaluada utilizando el orden del elemento de predicción de amplitud tonal en cuestión. En esta realización preferida de la invención, la señales predichas se transfieren adicionalmente a un segundo bloque de transformación 11, en el que se transforman al dominio de la frecuencia. El bloque de transformación 11 lleva a cabo la transformación utilizando dos o más órdenes diferentes, en los que se generan unas series de valores transformados que se corresponden con las señales predichas por los diferentes órdenes del elemento de predicción de amplitud tonal. El bloque del elemento de predicción de amplitud tonal 10 y el segundo bloque de transformación 11 pueden realizarse de tal forma que lleven a cabo las operaciones necesarias para cada orden del elemento de predicción de amplitud tonal o, alternativamente, pueden llevarse a cabo para cada orden en un bloque independiente del elemento de predicción de amplitud tonal 10 y un segundo bloque de transformación independiente 11.
En el bloque de cálculo 12, los valores de la señal predicha transformados al dominio de la frecuencia se comparan con la representación transformada al dominio de la frecuencia de la señal de audio a codificar obtenida a partir del bloque de transformación 6. Se calcula una señal de error de predicción tomando la diferencia entre el espectro de frecuencias de la señal de audio a codificar y el espectro de frecuencias de la señal predicha utilizando el elemento de predicción de secuencias. Ventajosamente, la señal de error de predicción comprende una serie de valores de error de predicción correspondientes a la diferencia entre los componentes de frecuencia de la señal a codificar y los componentes de frecuencia de la señal predicha. También se calcula un error de codificación que representa, por ejemplo, el promedio de la diferencia entre el espectro de frecuencia de la señal de audio y la señal predicha. Preferiblemente, el error de codificación se calcula utilizando el método de los mínimos cuadrados. Puede utilizarse cualquier otro método apropiado, comprendiendo métodos basados en el modelado psico-acústico de la señal de audio para determinar la señal predicha que mejor represente la señal de audio a codificar.
En el bloque 12 también se calcula una medida de eficacia de codificación (ganancia de predicción) a fin de determinar la información a transmitir al canal de transmisión (bloque 413). La finalidad consiste en reducir al mínimo la cantidad de información (bits) a transmitir (minimización cuantitativa), así como las distorsiones de la señal (maximización cualitativa).
A fin de reconstruir la señal en el receptor en función de las muestras anteriores almacenadas en el dispositivo de recepción, es necesario transmitir al receptor, por ejemplo, los coeficientes del elemento de predicción de amplitud tonal cuantificados correspondientes al orden seleccionado, la información relativa al orden, el retardo, y la información relativa al error de predicción. Ventajosamente, la medida de la eficacia de codificación indica si es posible transmitir la información necesaria para decodificar la señal codificada en el bloque del elemento de predicción de amplitud tonal 10 con un número de bits inferior al necesario para transmitir la información relativa a la señal original. Esta determinación puede llevarse a cabo, por ejemplo, de forma que se defina un primer valor de referencia que representa la cantidad de información a transmitir si se genera la información necesaria para la decodificación utilizando un elemento de predicción de amplitud tonal específico. Adicionalmente, se define un segundo valor de referencia que representa la cantidad de información a transmitir cuando la información necesaria para la decodificación se genera a partir de la señal de audio original. Ventajosamente, la medida de la eficacia de codificación es la relación entre el segundo valor de referencia y el primer valor de referencia. El número de bits necesario para representar la señal predicha depende, por ejemplo, del orden del elemento de predicción de amplitud tonal (es decir, el número de coeficientes que van a transmitirse), de la precisión con la cual se va a representar (cuantificar) cada coeficiente, así como de la cantidad y la precisión de la información sobre error asociada a la señal predicha. Por otra parte, el número de bits necesario para transmitir información relativa a la señal de audio original depende, por ejemplo, de la precisión de la representación de la señal de audio al dominio de la frecuencia.
Si la eficacia de codificación determinada de esta forma es superior a uno, ello indicará que la información necesaria para decodificar la señal predicha podrá transmitirse con un número de bits inferior a la información relativa a la señal original. En el bloque de cálculo 12 se determina el número de bits necesarios para la transmisión de estas diferentes alternativas, seleccionándose la alternativa para la cual el número de bits a transmitir resulta inferior (bloque 414).
De acuerdo con una primera realización de la invención, el orden del elemento de predicción de amplitud tonal con el cual se obtiene el menor error de codificación se selecciona para codificar la señal de audio (bloque 412). Si la medida de la eficacia de codificación del elemento de predicción de amplitud tonal seleccionado es superior a 1, se seleccionará la información relativa a la señal predicha para su transmisión. Si la medida de la eficacia de codificación no es superior a 1, la información a transmitir se generará en función de la señal de audio original. De acuerdo con esta realización de la invención, se da más importancia a la minimización del error de predicción (maximización cualitativa).
De acuerdo con una segunda realización ventajosa de la invención, se calcula una medida de la eficacia de codificación para cada orden del elemento de predicción de amplitud tonal. A continuación se utiliza el orden del elemento de predicción de amplitud tonal que proporcione el menor error de codificación seleccionado de entre aquellos órdenes para los cuales la medida de la eficacia de codificación es superior a 1, a fin de codificar la señal de audio. Si ninguno de los órdenes del elemento de predicción de amplitud tonal proporciona una ganancia de predicción (es decir, ninguna medida de la eficacia de codificación es superior a 1) la información a transmitir se generará entonces ventajosamente a partir de la señal de audio original. Esta realización de la invención permite establecer un compromiso entre el error de predicción y la eficacia de codificación.
De acuerdo con una tercera realización de la invención, se calcula una medida de la eficacia de codificación para cada orden del elemento de predicción de amplitud tonal y se selecciona el orden del elemento de predicción de amplitud tonal que proporcione la mayor eficacia de codificación seleccionado de entre aquellos órdenes para los cuales la medida de la eficacia de codificación es superior a 1, a fin de codificar la señal de audio. Si ninguno de los órdenes del elemento de predicción de amplitud tonal proporciona una ganancia de predicción (es decir, ninguna medida de la eficacia de codificación es superior a 1) la información a transmitir se generará entonces ventajosamente a partir de la señal de audio original. De este modo, esta realización de la invención da más importancia a la maximización de la eficacia de codificación (minimización cuantitativa).
De acuerdo con una cuarta realización de la invención, se calcula una medida de eficacia de codificación para cada orden del elemento de predicción de amplitud tonal y se selecciona el orden de tonos que proporcione la mayor eficacia de codificación de codificar la señal de audio, aun cuando la eficacia de codificación no sea superior a 1.
El cálculo del error de codificación y la selección del orden del elemento de predicción de amplitud tonal se llevan a cabo a intervalos regulares, preferiblemente de forma independiente para cada trama, siendo posible en distintas tramas, utilizar el orden del elemento de predicción de amplitud tonal que mejor se corresponda con las propiedades de la señal de audio en un momento dado.
Como se ha explicado anteriormente, si la eficacia de codificación determinada en el bloque 12 no es superior a 1, ello indicará que resulta ventajoso transmitir el espectro de frecuencia de la señal original, en la que se genera ventajosamente una cadena de bits 501 a transmitir al canal de transmisión de datos de la forma siguiente (bloque 415). La información del bloque de cálculo 12 relativa a la alternativa de transmisión seleccionada se transfiere al bloque de selección 13 (líneas D1 y D4 de la figura 1). En el bloque de selección 13, los valores de la transformada al dominio de la frecuencia que representan la señal de audio original se seleccionan para su transmisión a un bloque de cuantificación 14. La transmisión de los valores de la transformada al dominio de la frecuencia de la señal de audio original al bloque de cuantificación 14 está ilustrada mediante la línea A1 del diagrama de bloques de la figura 1. En el bloque de cuantificación 14, los valores de la señal transformados al dominio de la frecuencia se cuantifican de una forma conocida en sí. Los valores cuantificados se transfieren a un bloque de multiplexado 15, en el cual se genera la cadena de bits a transmitir. Las figuras 5a y 5b muestran un ejemplo de una estructura de cadena de bits que puede aplicarse ventajosamente en relación con la presente invención. La información relativa al método de codificación seleccionado se transfiere desde el bloque de cálculo 12 al bloque de multiplexado 15 (líneas D1 y D3) en el cual se genera la cadena de bits de acuerdo con la alternativa de transmisión. Un primer valor lógico, por ejemplo el estado lógico 0, se utiliza como información sobre el método de codificación 502 para indicar que los valores transformados al dominio de la frecuencia que representan la señal de audio original se transmiten en la cadena de bits en cuestión. Además de la información sobre el método de codificación 502 se transmiten los propios valores en la cadena de bits cuantificados de acuerdo con una precisión dada. El campo utilizado para la transmisión de estos valores está marcado en la figura 5a con el número de referencia 503. El número de valores transmitidos en cada cadena de bits depende de la frecuencia de muestreo y de la longitud de la trama examinada en un momento dado. En esta situación, la información sobre el orden del elemento de predicción de amplitud tonal, los coeficientes del elemento de predicción de amplitud tonal, retardos y errores no se transmite debido a que la señal se reconstruye en el receptor en función de los valores del dominio de la frecuencia de la señal de audio original transmitida en la cadena de bits 501.
Si la eficacia de codificación es superior a uno, resulta ventajoso codificar la señal de audio utilizando el elemento de predicción de amplitud tonal seleccionado y la cadena de bits 501 (figura 5b) a transmitir al canal de transmisión de datos se genera ventajosamente de la forma siguiente (bloque 416): La información relativa a la alternativa de transmisión seleccionada se transmite desde el bloque de cálculo 12 al bloque de selección 13. Esto se ilustra mediante las líneas D1 y D4 en el diagrama de bloques de la figura 1. En el bloque de selección 13, se seleccionan los coeficientes del elemento de predicción de amplitud tonal cuantificado para su transferencia al bloque de multiplexado 15. Esto se ilustra mediante la línea B1 del diagrama de bloques de la figura 1. Es evidente que los coeficientes del elemento de predicción de amplitud tonal también pueden transferirse al bloque de multiplexado 15 de un modo diferente que a través del bloque de selección 13. La cadena de bits a transmitir se genera en el bloque de multiplexado 15. La información relativa al método de codificación seleccionado se transfiere desde el bloque de cálculo 12 al bloque de multiplexado 15 (líneas D1 y D3), en el cual se genera la cadena de bits de acuerdo con la alternativa de transmisión. Un segundo valor lógico, por ejemplo el estado lógico 1, se utiliza como información sobre el método de codificación 502 para indicar que dichos coeficientes del elemento de predicción de amplitud tonal cuantificado se han transmitido en la cadena de bits en cuestión. Los bits de un campo de orden 504 se configuran de acuerdo con el orden del elemento de predicción de amplitud tonal seleccionado. Si, por ejemplo, se dispone de cuatro órdenes diferentes, dos bits (00,01,10,11) serán suficientes para indicar qué orden se ha seleccionado en un momento dado. Además, la información sobre el retardo se transmite en la cadena de bits en un campo de retardo 505. En este ejemplo preferido, el retardo se indica mediante 11 bits, pero es evidente que también pueden aplicarse otras longitudes dentro del ámbito de la invención. Los coeficientes del elemento de predicción de amplitud tonal cuantificados se añaden a la cadena de bits en el campo de coeficientes 506. Si el orden del elemento de predicción de amplitud tonal seleccionado es uno, sólo se transmite un coeficiente, si el orden es tres, se transmiten tres coeficientes, etc. El número de bits utilizados en la transmisión de los coeficientes puede también variar en diversas realizaciones. En una realización ventajosa, el coeficiente de primer orden se representa mediante tres bits, los coeficientes de tercer orden con un total de cinco bits, los coeficientes de quinto orden con un total de nueve bits y los coeficientes de séptimo orden con un total de diez bits. En general, puede afirmarse que cuanto más elevado sea el orden seleccionado, será mayor el número de bits necesarios para la transmisión de los coeficientes del elemento de predicción de amplitud tonal cuantificado.
Además de la información que antecede, cuando la señal de audio se codifica en función del elemento de predicción de amplitud tonal seleccionado, será necesario transmitir la información sobre error de predicción en un campo de error 507. Esta información de error de predicción se genera ventajosamente en el bloque de cálculo 12 como una señal de diferencia que representa la diferencia entre el espectro de frecuencia de la señal de audio a codificar y el espectro de frecuencia de la señal que puede decodificarse (es decir, reconstruirse) utilizando los coeficientes del elemento de predicción de amplitud tonal cuantificado del elemento de predicción de amplitud tonal seleccionado en conjunción con la secuencia de referencia de muestras. De este modo, la señal de error a cuantificar se transfiere, por ejemplo, a través del primer bloque de selección 13 al bloque de cuantificación 14. La señal de error cuantificada se transfiere desde el bloque de cuantificación 14 al bloque de multiplexado 15 donde los valores de error de predicción cuantificados se añaden al campo de error 507 de la cadena de bits.
El codificador 1 de acuerdo con la invención comprende también una función local de decodificación. La señal de audio codificada se transfiere desde el bloque de cuantificación 14 al bloque de cuantificación inversa 17. Como se ha descrito anteriormente, en la situación en la que la eficacia de codificación no es superior a 1, la señal de audio se representa mediante sus valores de espectro de frecuencia cuantificados. En este caso, los valores del espectro de frecuencia cuantificados se transfieren al bloque de cuantificación inversa 17 donde se cuantifican inversamente en una forma conocida en sí a fin de restaurar el espectro de frecuencias original de la señal de audio del modo más preciso posible. Los valores cuantificados inversamente que representan el espectro de frecuencias de la señal de audio original constituyen una salida del bloque 17 al bloque de suma 18.
Si la eficacia de codificación es superior a 1, la señal de audio se representa mediante información del elemento de predicción de amplitud tonal, por ejemplo información del orden del elemento de predicción de amplitud tonal, coeficientes del elemento de predicción de amplitud tonal cuantificados, un valor de retardo e información de error de predicción en forma de valores del dominio de la frecuencia cuantificados. Como se ha descrito anteriormente, la información de error de predicción representa la diferencia entre el espectro de frecuencia de la señal de audio a codificar y el espectro de frecuencias de la señal de audio a reconstruir en función del elemento de predicción de amplitud tonal seleccionado y de la secuencia de referencia de muestras. Por lo tanto, en este caso, los valores del dominio de la frecuencia cuantificados que comprenden la información de predicción de error se transfieren al bloque de cuantificación inversa 17, donde se cuantifican inversamente de tal forma que se restauren los valores del dominio de la frecuencia del error de predicción de la forma más precisa posible. De este modo la salida del bloque 17 comprende valores de error de predicción cuantificados inversamente. Estos valores se aplican como una entrada del bloque de suma 18, donde se suman con los valores del dominio de la frecuencia de la señal predicha utilizando el elemento de predicción de amplitud tonal seleccionado. De esta forma se genera una representación reconstruida del dominio de la frecuencia de la señal de audio original. Los valores del dominio de la frecuencia de la señal predicha están disponibles a partir del bloque de cálculo 12 donde se calculan en relación con la determinación del error de predicción y se transfieren al bloque de suma 18 como se indica mediante la línea C1 en la figura 1.
El funcionamiento del bloque de suma 18 se activa y se desactiva de acuerdo con la información de control proporcionada por el bloque de cálculo 12. La transferencia de información de control que permite esta operación de activación y desactivación se indica mediante la conexión entre el bloque de cálculo 12 y el bloque de suma 18 (líneas D1 y D2 de la figura 1). La operación de activación y desactivación es necesaria para tener en cuenta los diferentes tipos de valores del dominio de la frecuencia cuantificados inversamente proporcionados por el bloque de cuantificación inversa 17. Como se ha descrito anteriormente, si la eficacia de codificación no es superior a 1, la salida del bloque 17 comprende valores del dominio de la frecuencia cuantificados inversamente que representan la señal de audio original. En este caso, no es necesario llevar a cabo ninguna operación de suma y no se precisa ninguna información relativa a los valores del dominio de la frecuencia de ninguna señal de audio predicha construida en el bloque de cálculo 12. En esta situación, la operación del bloque de suma 18 se ve inhibida por la información de control facilitada a partir del bloque de cálculo 12 y los valores del dominio de la frecuencia cuantificados inversamente que representan la señal de audio original pasan a través del bloque de suma 18. Por otra parte, si la eficacia de codificación es superior a 1, la salida del bloque 17 comprende valores de error de predicción cuantificados inversamente. En este caso, es necesario sumar los valores de error de predicción cuantificados inversamente con el espectro de frecuencias de la señal predicha a fin de generar una representación del dominio de la frecuencia reconstruido de la señal de audio original. A continuación, el funcionamiento del bloque de suma 18 se activa mediante la información de control transferida desde el bloque de cálculo 12 haciendo que los valores del error de predicción cuantificados inversamente se sumen con el espectro de frecuencias de la señal predicha. Ventajosamente, la información de control necesaria es facilitada por la información sobre el método de codificación generado en el bloque 12 en relación con la elección de la codificación que va a aplicarse a la señal de audio.
En una realización alternativa, la cuantificación puede llevarse a cabo antes de calcular los valores del error de predicción y de la eficacia de codificación, llevándose a cabo los cálculos del error de predicción y de la eficacia de codificación utilizando valores del dominio de la frecuencia cuantificados que representan la señal original y las señales predichas. Ventajosamente, la cuantificación se lleva a cabo en bloques de cuantificación situados entre los bloques 6 y 12 y los bloques 11 y 12 (no representados). En esta realización, no es necesario el bloque de cuantificación 14 pero se requiere un bloque adicional de cuantificación inversa en la vía indicada por la línea C1.
La salida del bloque de suma 18 consiste en datos de dominio de la frecuencia muestreados que se corresponden con la secuencia de muestras codificada (señal de audio). Estos datos de dominio de la frecuencia muestreados se transforman adicionalmente al dominio del tiempo en un transformador DCT modificado inverso 19 desde el cual la secuencia de muestras decodificada se transfiere a la memoria intermedia 8 para su almacenamiento y utilización en relación con la codificación de las tramas posteriores. La capacidad de almacenamiento de la memoria intermedia de referencia 8 se selecciona en función del número de muestras necesario para conseguir los requisitos de eficacia de codificación de la aplicación en cuestión. En la memoria intermedia de referencia 8 se almacena preferiblemente una nueva secuencia de muestras sobrescribiendo las muestras más antiguas de la memoria intermedia, es decir la memoria intermedia es de las denominadas circulares.
La cadena de bits generada en el codificador 1 se transfiere a un transmisor 16, en el cual se lleva a cabo la modulación de una forma conocida en sí. La señal modulada se transfiere a través del canal de transmisión de datos 3 al receptor, por ejemplo como señales de radio-frecuencia. Ventajosamente, la señal de audio codificada se transmite trama a trama, sustancialmente inmediatamente después de finalizar la codificación de una trama dada. Alternativamente, la señal de audio puede codificarse, almacenarse en la memoria del terminal de transmisión y transmitirse en un momento posterior.
En un dispositivo receptor 31, la señal recibida desde el canal de transmisión de datos es demodulada en una forma conocida en sí en un bloque receptor 20. La información contenida en la trama de datos demodulada se determina en el decodificador 33. En un bloque demultiplexor 21 del decodificador 33 se examina en primer lugar, en función de la información sobre el método de codificación 502 de la cadena de bits, si la información recibida se generó a partir de la señal de audio original. Si el decodificador determina que la cadena de bits 501 generada en el codificador 1 no contiene los valores de la transformada del dominio de la frecuencia de la señal original, la decodificación se lleva a cabo ventajosamente de la forma siguiente. El orden M que va a utilizarse en el bloque elemento de predicción de amplitud tonal 24 se determina a partir del campo de orden 504 y el retardo se determina a partir del campo de retardo 505. Los coeficientes del elemento de predicción de amplitud tonal cuantificados recibidos en el campo coeficientes 506 de la cadena de bits 501 así como la información relativa al orden y al retardo se transfieren al bloque del elemento de predicción de amplitud tonal 24 del decodificador. Esto se ilustra mediante la línea B2 de la figura 2. Los valores cuantificados de la señal de error de predicción recibidos en el campo 507 de la cadena de bits se cuantifican inversamente en un bloque de cuantificación inversa 22 y se transfieren al bloque de suma 23 del decodificador. A partir de la información de retardo, el bloque del elemento de predicción de amplitud tonal 24 del decodificador recupera las muestras a utilizar como secuencia de referencia a partir de una memoria intermedia de muestra 28, y lleva a cabo una predicción de acuerdo con el orden seleccionado M, en el cual el bloque elemento de predicción de amplitud tonal 24 utiliza los coeficientes del elemento de predicción de amplitud tonal recibidos. De este modo, se genera una primera señal de dominio del tiempo reconstruida que se transforma al dominio de la frecuencia en un bloque de transformación 25. Esta señal de dominio de la frecuencia se transfiere al bloque de suma 23 donde se genera una señal de dominio de la frecuencia como una suma de esta señal y de la señal de error de predicción cuantificado inversamente. De este modo, en condiciones de transmisión de datos libre de errores, la señal del dominio de la frecuencia reconstruida se corresponde sustancialmente con la señal codificada original del dominio de la frecuencia. Esta señal del dominio de la frecuencia se transforma al dominio del tiempo mediante una transformación modificada inversa DCT en un bloque de transformación inversa 26 en el que una señal de audio digital se encuentra presente en la salida del bloque de transformación inversa 26. Esta señal se convierte en una señal analógica en el conversor digital / analógico 27, se amplifica si fuese necesario y se transfiere a otras etapas posteriores de procesamiento en una forma conocida en sí. En la figura 3, esto se muestra mediante el bloque de audio
32.
Si la cadena de bits 501 generada en el codificador 1 comprende los valores de la señal original transformada al dominio de la frecuencia, la decodificación se lleva a cabo ventajosamente de la forma siguiente. Los valores de la transformada del dominio de la frecuencia cuantificados se cuantifican inversamente en el bloque de cuantificación inversa 22 y se transfieren a través del bloque de suma 23 al bloque de transformación inversa 26. En el bloque de transformación inversa 26, la señal del dominio de la frecuencia se transforma al dominio del tiempo mediante una transformada modificada inversa DCT en la que una señal de dominio del tiempo correspondiente a la señal de audio original se genera en formato digital. Si fuese necesario, esta señal se transforma en una señal analógica en el conversor digital / analógico 27.
En la figura 2, la referencia A2 muestra la transmisión de la información de control al bloque de suma 23. Esta información de control se utiliza de una manera análoga a la descrita en relación con la función local de decodificador del codificador. Dicho de otro modo, si la información sobre el método de codificación proporcionada en el campo 502 de una cadena de bits recibida 501 indicase que las cadenas de bits contienen valores del dominio de la frecuencia cuantificados obtenidos a partir de la propia señal de audio, se ve inhibido el funcionamiento del bloque de suma 23. Esto permite que los valores del dominio de la frecuencia cuantificados de la señal del audio pasen a través del bloque de suma 23 al bloque de transformación inversa 26. Por otra parte, si la información sobre el método de codificación recuperada a partir del campo 502 de una cadena de bits recibidos indicase que la señal de audio se ha codificado utilizando un elemento de predicción de amplitud tonal, se activará el funcionamiento del bloque de suma 23, permitiendo que se sumen los datos de error de predicción cuantificados inversamente con la representación del dominio de la frecuencia de la señal predicha generada por el bloque de transformación 25.
En el ejemplo de la figura 3, el dispositivo de transmisión es un dispositivo inalámbrico de comunicaciones 2 y el dispositivo de recepción es una estación base 31, en la que la señal transmitida desde el dispositivo inalámbrico de comunicaciones 2 se decodifica en el decodificador 33 de la estación base 31, a partir de la cual la señal de audio analógica se transmite a otras etapas de procesamiento de una forma conocida en sí.
Es evidente que en el presente ejemplo sólo se han presentado las características más esenciales para la aplicación de la invención, pero en aplicaciones prácticas el sistema de transmisión de datos también comprende funciones distintas de las aquí presentadas. También es posible utilizar otros métodos de codificación en relación con la codificación de acuerdo con la invención, como la predicción a corto plazo. Adicionalmente, cuando se transmite la señal codificada de acuerdo con la invención, pueden llevarse a cabo otras etapas de procesamiento, como la codificación de
canal.
También es posible determinar la correspondencia entre la señal predicha y la señal real al dominio del tiempo. De este modo, en una realización alternativa de la invención, no es necesario transformar las señales al dominio de la frecuencia en el que los bloques de transformación 6, 11 no son necesariamente precisos, como tampoco lo son el bloque de transformación inversa 19 del codificador ni el bloque de transformación 25 ni el bloque de transformación inversa 26 del decodificador. La eficacia de codificación y el error de predicción se determinan por tanto en función de señales de dominio del tiempo.
Las etapas de codificación / decodificación de la señal de audio, descritas anteriormente pueden aplicarse a diferentes tipos de sistemas de transmisión de datos, como sistemas de comunicaciones móviles, sistemas de TV vía satélite, sistemas de vídeo a la carta, etc. Por ejemplo, un sistema de comunicaciones móviles en el cual las señales de audio se transmiten en modo full-duplex requiere un par de sistemas de codificador / decodificador tanto en el dispositivo inalámbrico de comunicaciones 2 como en la estación base 31 o similar. En el diagrama de bloques de la figura 3, los bloques funcionales correspondientes del dispositivo inalámbrico de comunicaciones 2 y de la estación base 31, se encuentran marcados básicamente con los mismos números de referencia. Aunque el codificador 1 y el decodificador 33 se muestran como unidades independientes en la figura 3, en aplicaciones prácticas pueden implementarse en una unidad denominada codec (codificador-decodificador) en la cual se implementan todas las funciones necesarias para llevar a cabo la codificación y la decodificación. Si la señal de audio se transmite en formato digital en el sistema de comunicaciones móviles, las conversiones analógico / digital y digital / analógico, respectivamente, no serán necesarias en la estación base. De este modo, dichas transformaciones se llevan a cabo en el dispositivo inalámbrico de comunicaciones y en el interfaz a través del cual la red de comunicaciones móviles se conecta a otra red de telecomunicaciones como una red telefónica pública. No obstante, si esta red telefónica es una red telefónica digital, estas transformaciones también podrán efectuarse, por ejemplo, en un teléfono digital (no mostrado) conectado a dicha red telefónica.
Las etapas de codificación descritas anteriormente no se llevan a cabo necesariamente durante la transmisión, sino que la información codificada puede almacenarse para su posterior transmisión. Además, la señal de audio aplicada al codificador no tiene que ser necesariamente una señal de audio en tiempo real, sino que la señal de audio a codificar puede ser información almacenada previamente a partir de la señal de audio.
En los siguientes párrafos se describirán desde el punto de vista matemático las diferentes etapas de codificación de acuerdo con una realización ventajosa de la invención. La función de transferencia del bloque del elemento de predicción de amplitud tonal se expresa de la forma siguiente:
(1)B(z) = \sum\limits_{k = -m_{1}}^{m_{2}}b(k)z^{-(\alpha+k)}
donde \alpha es el retardo, b(k) son los coeficientes del elemento de predicción de amplitud tonal, y m_{1} y m_{2} dependen del orden (M), ventajosamente de la forma siguiente:
m_{1} = (M-1)/2
m_{2} = M-m1-1
Ventajosamente, la secuencia de muestras que mejor se correspondan (es decir, la secuencia de referencia) se determina utilizando el método de los mínimos cuadrados. Esto puede expresarse de la forma siguiente:
(2)E = \sum\limits_{i=0}^{N-1}\left(x(i)- \sum\limits_{j = -m_{1}}^{m_{2}}b(j) \tilde{x} (i + j - \alpha)\right)^{2}
donde E = error, x() es la señal de entrada en el dominio del tiempo, \tilde{x}() es la señal reconstruida a partir de la secuencia de muestras anterior y N es el número de muestras de la trama examinada. El retardo \alpha puede calcularse fijando la variable m_{1} = 0 y m_{2} = 0 y despejando b en la ecuación 2. Otra alternativa para resolver el retardo \alpha consiste en utilizar el método de correlación normalizado, usando la fórmula:
(3)\alpha = max_{lag} \left\{\frac{\sum\limits^{N-1}_{i=0} (x(i)\tilde{x}(i - lag))}{\sqrt{\sum\limits^{N-1}_{i=0} \tilde{x} (i - lag)^{2}}} , lag = startlag,..., endlag \right\}
Cuando ha sido encontrada la secuencia de muestras que mejor se corresponden (referencia), el bloque de retardo 7 contiene información acerca del retardo, es decir cuanto tiempo antes apareció la secuencia de muestras correspondientes en la señal de audio.
Los coeficientes del elemento de predicción de amplitud tonal b(k) pueden calcularse para cada orden M a partir de la ecuación (2) que puede re-expresarse como sigue:
(4)E = \sum\limits^{N-1}_{i=0} x(i)^{2} - 2 \cdot \sum\limits^{N-1}_{i=0} x(i) \sum\limits^{m_{2}}_{j=-m_{1}} b(j) \tilde{x} (i + j - \alpha) + \sum\limits^{N-1}_{i=0} \left(\sum\limits^{m_{2}}_{j=-m_{1}} b(j)\tilde{x} (i + j - \alpha)\right)^{2}
El valor óptimo para los coeficientes b(k) puede determinarse buscando un coeficiente b(k) para el cual la variación en el error con respecto a b(k) sea lo más reducida posible. Esto puede calcularse fijando a cero la derivada parcial de la relación de error respecto a b (\deltaE/\deltab=0) con lo cual se llega a la siguiente fórmula:
(5)-2 \cdot \sum\limits^{N-1}_{i=0} x(i) \sum\limits^{m_{2}}_{j=-m_{1}} \tilde{x} (i + j - \alpha) + 2 \cdot \sum\limits^{N-1}_{i=0} \left[\left(\sum\limits^{m_{2}}_{j=-m_{1}} b(j) \tilde{x}(i + j - \alpha)\right) \cdot \sum\limits^{m_{2}}_{j=-m_{1}} \tilde{x} (i + j - \alpha)\right] = 0
es decir:
\sum\limits^{N-1}_{i=0} \left[\sum\limits^{m_{2}}_{j=-m_{1}} b(j) \tilde{x} (i + j - \alpha) \cdot \sum\limits^{m_{2}}_{j=-m_{1}} \tilde{x} (i + j - \alpha)\right] = \sum\limits^{N-1}_{i=0} x(i) \ \sum\limits^{m_{2}}_{j=-m_{1}} \tilde{x} (i + j - \alpha)
Esta ecuación se puede escribir en formato matricial, en el que los coeficientes b(k) pueden determinarse resolviendo la ecuación matricial:
\bar{b} = \bar{A}^{-1} \cdot \bar{r}
donde:
1
2
En el método de acuerdo con la invención, el objeto es utilizar la periodicidad de la señal de audio de forma más eficaz que en los sistemas de acuerdo con la técnica anterior. Esto se consigue aumentando la adaptabilidad del codificador a los cambios en la frecuencia de la señal de audio, calculando los coeficientes del elemento de predicción de amplitud tonal para diversos órdenes. El orden del elemento de predicción de amplitud tonal utilizado para codificar la señal de audio puede seleccionarse de forma que se reduzca al mínimo el error de predicción a fin de aumentar al máximo la eficacia de codificación o conseguir un compromiso entre el error de predicción y la eficacia de codificación. La selección se lleva a cabo a ciertos intervalos, preferiblemente de forma independiente para cada trama. Los coeficientes de orden y de elemento de predicción de amplitud tonal pueden, de este modo, cambiar trama por trama. En el método de acuerdo con la invención es posible por lo tanto aumentar la flexibilidad de la codificación en comparación con métodos de codificación de la técnica anterior que utilizaban un orden fijo. Además, en el método de acuerdo con la invención, si la cantidad de información (número de bits) a transmitir para una trama dada no se puede reducir mediante codificación, podrá transmitirse la señal original transformada al dominio de la frecuencia en lugar de los coeficientes del elemento de predicción de amplitud tonal y la señal de error.
Los procedimientos de cálculo previamente presentados utilizados en el método de acuerdo con la invención pueden llevarse a cabo ventajosamente en forma de un programa, como códigos de programa del controlador 34 en una unidad de procesamiento de señales digitales o similar, y/o como una realización de hardware. De acuerdo con la anterior descripción de la invención, cualquier persona versada en la materia podrá llevar a cabo el codificador 1 de acuerdo con la invención y, de este modo, no será necesario comentar en mayor detalle en este contexto los diferentes bloques funcionales del codificador 1.
A fin de transmitir dichos coeficientes del elemento de predicción de amplitud tonal al receptor, es posible utilizar las llamadas tablas de búsqueda. En este tipo de tablas de búsqueda se almacenan distintos valores de coeficientes y en lugar del coeficiente, se transmite el índice de este coeficiente en la tabla de búsquedas. La tabla de búsquedas es conocida tanto para el codificador 1 como para el decodificador 33. En la etapa de recepción es posible determinar el coeficiente del elemento de predicción de amplitud tonal en cuestión a partir del índice transmitido utilizando la tabla de búsquedas. En algunos casos, utilizar la tabla de búsquedas puede reducir el número de bits a transmitir cuando se compara con la transmisión de coeficientes del elemento de predicción de amplitud tonal.
La presente invención no se limita a las realizaciones presentadas anteriormente, ni está limitada en otros aspectos, sino que puede modificarse dentro del ámbito de las reivindicaciones adjuntas.

Claims (36)

1. Método para codificar una señal de audio que comprende las siguientes etapas:
-
examinar una porción de la señal de audio a codificar para encontrar otra porción de la señal de audio que sea la que mejor se corresponda con la porción de la señal de audio a codificar y que se selecciona como secuencia de referencia de muestras;
-
generar una serie de señales predichas de dicha secuencia de referencia de muestras utilizando una serie de órdenes del elemento de predicción de amplitud tonal;
-
determinar una eficacia de codificación de, al menos, una de dichas señales predichas; y
-
utilizar la eficacia de codificación determinada para seleccionar un método de codificación de la porción de la señal de audio a codificar.
2. Método de acuerdo con la reivindicación 1, caracterizado porque los métodos de codificación que pueden seleccionarse comprenden un método en el cual la señal de audio a codificar se codifica de acuerdo con una señal predicha.
3. Método de acuerdo con la reivindicación 2, caracterizado porque los métodos de codificación que pueden seleccionarse comprenden un método en el cual la señal de audio a codificar se codifica de acuerdo con la propia señal de audio.
4. Método de acuerdo con la reivindicación 1, caracterizado porque se determina un error de codificación de cada una de dichas señales predichas.
5. Método de acuerdo con la reivindicación 4, caracterizado porque la eficacia de codificación se define para la señal predicha con el error de codificación menor y porque la codificación se lleva a cabo a partir de la señal predicha que tiene dicho error de codificación menor si la información de eficacia de codificación determinada indica que la cantidad de información codificada es inferior a la que se tendría sí la codificación se realizase a partir de la porción de la señal de audio a codificar.
6. Método de acuerdo con la reivindicación 5, caracterizado porque la porción de la señal de audio a codificar se transforma al dominio de la frecuencia a fin de determinar el espectro de frecuencias de la señal de audio y porque cada señal predicha se transforma al dominio de la frecuencia a fin de determinar el espectro de frecuencias de cada señal predicha y porque dicha eficacia de codificación se determina para dicha señal predicha con el menor error de codificación a partir del espectro de frecuencia de la señal de audio y del espectro de frecuencia de la señal predicha.
7. Método de acuerdo con la reivindicación 1, caracterizado porque la eficacia de codificación se determina para cada una de dichas señales predichas y se determina un error de codificación de aquellas señales predichas respecto a las cuales la información de eficacia de codificación indica que la cantidad de información codificada es inferior a la que se tendría sí la codificación se realizase a partir de la porción de la señal de audio a codificar y la codificación se realiza a partir de la señal predicha que proporciona el menor error de codificación.
8. Método de acuerdo con la reivindicación 1, caracterizado porque una eficacia de codificación se determina para cada una de dichas señales predichas y la codificación se realiza a partir de la señal predicha que proporciona la mayor eficacia de codificación, cuando la eficacia de codificación determinada indica que la cantidad de información codificada es inferior a la que se tendría sí la codificación se realizase a partir de la porción de la señal de audio a codificar.
9. Método de acuerdo con la reivindicación 1, caracterizado porque la eficacia de codificación se determina para cada una de dichas señales predichas y la codificación se realiza a partir de la señal predicha que proporciona mayor eficacia de codificación.
10. Método de acuerdo con las reivindicaciones 7, 8 o 9, caracterizado porque la porción de la señal de audio a codificar se transforma al dominio de la frecuencia para determinar el espectro de frecuencia de la señal de audio, y cada señal predicha se transforma al dominio de la frecuencia a fin de determinar el espectro de frecuencia de cada señal predicha, y porque dicha eficacia de codificación se determina para cada señal predicha a partir del espectro de frecuencia de la señal de audio y al espectro de frecuencia de la señal predicha.
11. Método de acuerdo con las reivindicaciones 5, 6, 7, 8 o 9, caracterizado porque la información relativa al error de predicción se determina para cada una de dichas señales predichas.
12. Método de acuerdo con las reivindicaciones 5, 6, 7, 8 o 9, caracterizado porque dichas señales predichas se generan utilizando un orden de predicción diferente para cada una de dichas señales predichas.
13. Método de acuerdo con las reivindicaciones 6 o 10, caracterizado porque dicha información relativa al error de predicción determinada para cada una de dichas señales predichas se calcula como un espectro de diferencia que representa utilizar dicho espectro de frecuencia de la señal de audio y del espectro de frecuencia de la señal predi-
cha.
14. Método de acuerdo con las reivindicaciones 10 o 13, caracterizado porque la transformación al dominio de la frecuencia se lleva a cabo utilizando una transformación DCT modificada.
15. Método de acuerdo con las reivindicaciones 1 a 14, caracterizado porque la información codificada (501) de la señal predicha comprende, al menos, datos relativos al método de codificación (502), datos relativos al orden seleccionado (504), un retardo (505), coeficientes del elemento de predicción de amplitud tonal (506) y datos relativos al error de predicción (507).
16. Método de acuerdo con las reivindicaciones 1 a 15, caracterizado porque la señal de audio se divide en tramas, y en el que la codificación se lleva a cabo independientemente para cada trama generada a partir de la señal de
audio.
17. Método de acuerdo con las reivindicaciones 1 a 16, caracterizado porque la señal de audio es una señal de voz.
18. Método de acuerdo con las reivindicaciones 4 a 7, caracterizado porque dicho error de codificación se determina utilizando uno de los siguientes métodos:
-
un método de mínimos cuadrados;
-
un método basado en modelado psico-acústico de la señal de audio a codificar.
19. Método de acuerdo con la reivindicación 18, caracterizado porque cuando dicho error de codificación se determina utilizando el método de los mínimos cuadrados, el error de codificación se calcula a partir del error de predicción.
20. Método de acuerdo con cualquiera de las reivindicaciones 1 a 19, caracterizado porque dicha señal de audio codificada se transmite a un dispositivo de recepción.
21. Codificador (1) que comprende medios (16, 20) para codificar una señal de audio, comprendiendo dichos medios de codificación:
-
medios (7) para examinar una porción de la señal de audio a codificar para encontrar otra porción de la señal de audio que sea la que mejor se corresponda con la porción de la señal de audio a codificar, que se ha seleccionado como secuencia de referencia de muestras;
-
medios (9, 10) para utilizar una serie de órdenes de elemento de predicción de amplitud tonal para generar una serie de señales predichas a partir de dicha secuencia de referencia de muestras;
-
medios (12) para determinar una eficacia de codificación de al menos una de dichas señales predichas; y
-
medios (12, 13, 14) para utilizar la eficacia de codificación determinada para seleccionar un método de codificación de la porción de la señal de audio a codificar.
22. Codificador (1) de acuerdo con la reivindicación 21, caracterizado porque comprende medios (4, 6-14) de codificación de la señal de audio a partir de una señal predicha.
23. Codificador (1) de acuerdo con la reivindicación 22, caracterizado porque comprende medios (4, 6, 14) para codificar la propia señal de audio.
24. Sistema para transmisión de datos que comprende:
-
un codificador de acuerdo con la reivindicación 21, y
-
medios (16) para transmitir la señal de audio codificada.
25. Sistema de transmisión de datos de acuerdo con la reivindicación 24, caracterizado porque comprende medios para determinar un error de codificación de, al menos, una de dichas señales predichas.
26. Sistema de transmisión de datos de acuerdo con la reivindicación 24, caracterizado porque comprende medios de transformación de la porción de la señal de audio a codificar al dominio de la frecuencia y medios para transformar cada una de dichas señales predichas al dominio de la frecuencia.
27. Sistema de transmisión de datos de acuerdo con la reivindicación 24, caracterizado porque comprende medios para generar una cadena de bits (15) para su transmisión a un dispositivo receptor, comprendiendo dicha cadena de bits, al menos, información relativa al método de codificación seleccionado.
28. Sistema de transmisión de datos de acuerdo con cualquiera de las reivindicaciones 24 a 27, caracterizado porque comprende medios para dividir la señal de audio en tramas.
29. Sistema de transmisión de datos de acuerdo con cualquiera de las reivindicaciones 24 a 28, caracterizado porque comprende un terminal móvil.
30. Decodificador (33) para decodificar una señal de audio codificada en un codificador de acuerdo con la reivindicación 21, caracterizado porque el decodificador comprende:
-
medios para determinar el método para codificar la señal de audio a decodificar comprendiendo medios para examinar, a partir de la información sobre el método de codificación (502), si la información recibida se generó a partir de la señal de audio original, y medios para examinar el orden del elemento de predicción de amplitud tonal (M) utilizado en la fase de codificación; y
-
medios para decodificar la señal de audio de acuerdo con el método de codificación determinado que comprende medios (21) para recibir información relativa a una señal predicha, medios para decodificar la señal utilizando la información codificada generada a partir de la propia señal de audio, medios para seleccionar el orden del elemento de predicción de amplitud tonal para decodificar la señal y medios para decodificar la señal realizando una predicción de acuerdo con el orden del elemento de predicción de amplitud tonal (M) seleccionado.
31. Decodificador de acuerdo con la reivindicación 30, caracterizado porque el decodificador comprende medios (21) para determinar a partir de dicha información recibida al menos datos relativos a un orden seleccionado (504), un retardo (505), al menos un coeficiente del elemento de predicción de amplitud tonal (506) y datos de error de predicción (507).
32. Decodificador de acuerdo con la reivindicación 31, caracterizado porque comprende medios (24, 28) para generar una señal predicha utilizando dichos datos relativos a un orden seleccionado (504), un retardo (505), y al menos un coeficiente del elemento de predicción de amplitud tonal (506).
33. Decodificador de acuerdo con la reivindicación 31 o 32, caracterizado porque comprende medios (23, 24, 28) para generar una señal de audio reconstruida utilizando dicha señal predicha y dichos datos de error de predicción.
34. Decodificador de acuerdo con la reivindicación 30, caracterizado porque comprende medios (21) para recibir información relativa a la propia señal de audio.
35. Decodificador de acuerdo con la reivindicación 34, caracterizado porque comprende medios (22, 23, 26) para generar una señal de audio reconstruida utilizando dicha información recibida relativa a la propia señal de audio.
36. Método para decodificar una señal de audio codificada de acuerdo con el método de la reivindicación 1, caracterizado porque dicho método comprende la etapa de examinar, a partir de la información del método de codificación (502), si la información recibida se generó a partir de la señal de audio original, en el que la señal se decodifica utilizando la información codificada generada a partir de la propia señal de audio, examinándose en otro caso el orden del elemento de predicción de amplitud tonal (M) utilizado en la etapa de codificación, y efectuándose una predicción de acuerdo con el orden del elemento de predicción de amplitud tonal (M) para recuperar la señal de audio.
ES00944090T 1999-07-05 2000-07-05 Metodo para mejorar la eficacia de codificacion de una señal de audio. Expired - Lifetime ES2244452T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI991537A FI116992B (fi) 1999-07-05 1999-07-05 Menetelmät, järjestelmä ja laitteet audiosignaalin koodauksen ja siirron tehostamiseksi
FI991537 1999-07-05

Publications (1)

Publication Number Publication Date
ES2244452T3 true ES2244452T3 (es) 2005-12-16

Family

ID=8555025

Family Applications (1)

Application Number Title Priority Date Filing Date
ES00944090T Expired - Lifetime ES2244452T3 (es) 1999-07-05 2000-07-05 Metodo para mejorar la eficacia de codificacion de una señal de audio.

Country Status (13)

Country Link
US (2) US7289951B1 (es)
EP (3) EP2037451A1 (es)
JP (2) JP4142292B2 (es)
KR (2) KR100593459B1 (es)
CN (2) CN100568344C (es)
AT (2) ATE418779T1 (es)
AU (1) AU761771B2 (es)
BR (1) BRPI0012182B1 (es)
CA (1) CA2378435C (es)
DE (2) DE60041207D1 (es)
ES (1) ES2244452T3 (es)
FI (1) FI116992B (es)
WO (1) WO2001003122A1 (es)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002173892A (ja) 2000-09-27 2002-06-21 Nippon Paper Industries Co Ltd グラビア印刷用塗工紙
FI118067B (fi) 2001-05-04 2007-06-15 Nokia Corp Menetelmä audiosignaalin pakkauksen purkamisessa, pakkauksen purkulaite, ja elektroniikkalaite
DE10138650A1 (de) * 2001-08-07 2003-02-27 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschlüsseln eines diskreten Signals sowie Verfahren und Vorrichtung zur Entschlüsselung
US7933767B2 (en) * 2004-12-27 2011-04-26 Nokia Corporation Systems and methods for determining pitch lag for a current frame of information
US20070213705A1 (en) * 2006-03-08 2007-09-13 Schmid Peter M Insulated needle and system
US7610195B2 (en) * 2006-06-01 2009-10-27 Nokia Corporation Decoding of predictively coded data using buffer adaptation
JP2008170488A (ja) 2007-01-06 2008-07-24 Yamaha Corp 波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法
EP2077550B8 (en) 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
WO2009132662A1 (en) * 2008-04-28 2009-11-05 Nokia Corporation Encoding/decoding for improved frequency response
KR20090122143A (ko) * 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8380523B2 (en) * 2008-07-07 2013-02-19 Lg Electronics Inc. Method and an apparatus for processing an audio signal
WO2010047566A2 (en) * 2008-10-24 2010-04-29 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
WO2010053287A2 (en) * 2008-11-04 2010-05-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
GB2466672B (en) 2009-01-06 2013-03-13 Skype Speech coding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466671B (en) 2009-01-06 2013-03-27 Skype Speech encoding
KR101614767B1 (ko) * 2009-10-28 2016-04-22 에스케이텔레콤 주식회사 벡터 양자화 기반 2차 예측을 통한 동영상 부호화/복호화 장치, 방법 및 기록 매체
KR101549644B1 (ko) 2010-04-13 2015-09-03 지이 비디오 컴프레션, 엘엘씨 샘플 영역 병합
HUE057597T2 (hu) 2010-04-13 2022-05-28 Ge Video Compression Llc Videó kódolás képek többes fa struktúrájú alosztásainak használatával
KR102481529B1 (ko) 2010-04-13 2022-12-23 지이 비디오 컴프레션, 엘엘씨 평면 간 예측
CN105915924B (zh) * 2010-04-13 2019-12-06 Ge视频压缩有限责任公司 跨平面预测
TWI666882B (zh) 2010-04-13 2019-07-21 美商Ge影像壓縮有限公司 在樣本陣列多元樹細分中之繼承技術
US9268762B2 (en) * 2012-01-16 2016-02-23 Google Inc. Techniques for generating outgoing messages based on language, internationalization, and localization preferences of the recipient
DE102012207750A1 (de) 2012-05-09 2013-11-28 Leibniz-Institut für Plasmaforschung und Technologie e.V. Vorrichtung zur plasmabehandlung von menschlichen, tierischen oder pflanzlichen oberflächen, insbesondere von haut oder schleimhautarealen
EP3252762B1 (en) * 2012-10-01 2019-01-30 Nippon Telegraph and Telephone Corporation Encoding method, encoder, program and recording medium
KR102251833B1 (ko) 2013-12-16 2021-05-13 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
EP2916319A1 (en) 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US36721A (en) * 1862-10-21 Improvement in breech-loading fire-arms
JPH0683443B2 (ja) * 1985-03-05 1994-10-19 富士通株式会社 フレ−ム内フレ−ム間符号化方式
WO1990013112A1 (en) * 1989-04-25 1990-11-01 Kabushiki Kaisha Toshiba Voice encoder
CA2021514C (en) 1989-09-01 1998-12-15 Yair Shoham Constrained-stochastic-excitation coding
NL9001985A (nl) 1990-09-10 1992-04-01 Nederland Ptt Werkwijze voor het coderen van een analoog signaal met een herhalend karakter en een inrichting voor het volgens deze werkwijze coderen.
US5528629A (en) 1990-09-10 1996-06-18 Koninklijke Ptt Nederland N.V. Method and device for coding an analog signal having a repetitive nature utilizing over sampling to simplify coding
NL9002308A (nl) 1990-10-23 1992-05-18 Nederland Ptt Werkwijze voor het coderen en decoderen van een bemonsterd analoog signaal met een herhalend karakter en een inrichting voor het volgens deze werkwijze coderen en decoderen.
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
US6400996B1 (en) * 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
US5784631A (en) * 1992-06-30 1998-07-21 Discovision Associates Huffman decoder
IT1257065B (it) 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
FI95086C (fi) 1992-11-26 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin tehokkaaksi koodaamiseksi
CA2116736C (en) * 1993-03-05 1999-08-10 Edward M. Roney, Iv Decoder selection
JPH06332492A (ja) * 1993-05-19 1994-12-02 Matsushita Electric Ind Co Ltd 音声検出方法および検出装置
IT1270438B (it) 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
US5574825A (en) * 1994-03-14 1996-11-12 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
JP3277692B2 (ja) 1994-06-13 2002-04-22 ソニー株式会社 情報符号化方法、情報復号化方法及び情報記録媒体
JPH08166800A (ja) 1994-12-13 1996-06-25 Hitachi Ltd 複数種類の符号化方法を備える音声符号器および復号器
JP3183072B2 (ja) 1994-12-19 2001-07-03 松下電器産業株式会社 音声符号化装置
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
FR2729247A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
FR2729246A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
US5864798A (en) * 1995-09-18 1999-01-26 Kabushiki Kaisha Toshiba Method and apparatus for adjusting a spectrum shape of a speech signal
TW321810B (es) * 1995-10-26 1997-12-01 Sony Co Ltd
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置
JP3707154B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 音声符号化方法及び装置
JPH10105194A (ja) * 1996-09-27 1998-04-24 Sony Corp ピッチ検出方法、音声信号符号化方法および装置
CN102129862B (zh) * 1996-11-07 2013-05-29 松下电器产业株式会社 降噪装置及包括降噪装置的声音编码装置
JPH10149199A (ja) * 1996-11-19 1998-06-02 Sony Corp 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体
FI964975A (fi) 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
US6252632B1 (en) * 1997-01-17 2001-06-26 Fox Sports Productions, Inc. System for enhancing a video presentation
US6202046B1 (en) * 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
JP3064947B2 (ja) * 1997-03-26 2000-07-12 日本電気株式会社 音声・楽音符号化及び復号化装置
FI973873A (fi) * 1997-10-02 1999-04-03 Nokia Mobile Phones Ltd Puhekoodaus
JP3765171B2 (ja) 1997-10-07 2006-04-12 ヤマハ株式会社 音声符号化復号方式
US6351730B2 (en) * 1998-03-30 2002-02-26 Lucent Technologies Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6014618A (en) * 1998-08-06 2000-01-11 Dsp Software Engineering, Inc. LPAS speech coder using vector quantized, multi-codebook, multi-tap pitch predictor and optimized ternary source excitation codebook derivation
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
WO2000060579A1 (en) * 1999-04-05 2000-10-12 Hughes Electronics Corporation A frequency domain interpolative speech codec system

Also Published As

Publication number Publication date
WO2001003122A1 (en) 2001-01-11
BR0012182A (pt) 2002-04-16
EP1203370B1 (en) 2005-06-29
AU5832600A (en) 2001-01-22
DE60021083T2 (de) 2006-05-18
JP4142292B2 (ja) 2008-09-03
CA2378435A1 (en) 2001-01-11
JP4426483B2 (ja) 2010-03-03
DE60041207D1 (de) 2009-02-05
CN1235190C (zh) 2006-01-04
KR20020019483A (ko) 2002-03-12
CA2378435C (en) 2008-01-08
DE60021083D1 (de) 2005-08-04
KR100593459B1 (ko) 2006-06-28
CN1372683A (zh) 2002-10-02
US7457743B2 (en) 2008-11-25
KR100545774B1 (ko) 2006-01-24
EP2037451A1 (en) 2009-03-18
US20060089832A1 (en) 2006-04-27
JP2005189886A (ja) 2005-07-14
ATE418779T1 (de) 2009-01-15
AU761771B2 (en) 2003-06-12
FI991537A (fi) 2001-01-06
ATE298919T1 (de) 2005-07-15
FI116992B (fi) 2006-04-28
CN1766990A (zh) 2006-05-03
KR20050085977A (ko) 2005-08-29
CN100568344C (zh) 2009-12-09
US7289951B1 (en) 2007-10-30
EP1203370A1 (en) 2002-05-08
JP2003504654A (ja) 2003-02-04
EP1587062B1 (en) 2008-12-24
BRPI0012182B1 (pt) 2017-02-07
EP1587062A1 (en) 2005-10-19

Similar Documents

Publication Publication Date Title
ES2244452T3 (es) Metodo para mejorar la eficacia de codificacion de una señal de audio.
ES2205891T3 (es) Un metodo y un dispositivo para una busqueda adaptativa de tono de ancho de banda al codificar señales de banda ancha.
ES2223591T3 (es) Codificacion eficaz de envolvente especial utilizando una resolucion tiempo/frecuencia variable.
ES2207643T3 (es) Sintesis de señal de excitacion durante borrado de tramas o perdida de paquetes.
ES2358213T3 (es) Flujo redundante de bits de audio y métodos de procesamiento de flujo de bits de audio.
JP3849210B2 (ja) 音声符号化復号方式
US20060173675A1 (en) Switching between coding schemes
US7610195B2 (en) Decoding of predictively coded data using buffer adaptation
KR102229487B1 (ko) 리던던트 프레임 정보를 통신하는 시스템들 및 방법들
ES2302530T3 (es) Procedimiento de codificacion y descodificacion de audio con flujo variable.
ES2628127T3 (es) Cuantificador avanzado
CN104781876A (zh) 音频编码装置、音频编码方法和音频编码程序以及音频解码装置、音频解码方法和音频解码程序
JP2007504503A (ja) 低ビットレートオーディオ符号化
FI118067B (fi) Menetelmä audiosignaalin pakkauksen purkamisessa, pakkauksen purkulaite, ja elektroniikkalaite
CA2551281A1 (en) Voice/musical sound encoding device and voice/musical sound encoding method
KR100215342B1 (ko) 전송시스템 및 그 전송 시스템에서 사용되는 수신기
CA2765523A1 (en) Coding method, decoding method, and device and recording medium using the methods