ES2268340T3 - Representacion de audio parametrico de multiples canales. - Google Patents

Representacion de audio parametrico de multiples canales. Download PDF

Info

Publication number
ES2268340T3
ES2268340T3 ES03712597T ES03712597T ES2268340T3 ES 2268340 T3 ES2268340 T3 ES 2268340T3 ES 03712597 T ES03712597 T ES 03712597T ES 03712597 T ES03712597 T ES 03712597T ES 2268340 T3 ES2268340 T3 ES 2268340T3
Authority
ES
Spain
Prior art keywords
information
audio signal
encoded
signal
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES03712597T
Other languages
English (en)
Inventor
Arnoldus W. J. Oomen
Erik G. P. Schuijers
Dirk J. Breebaart
Steven L. J. D. E. Van De Par
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of ES2268340T3 publication Critical patent/ES2268340T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Un método para codificar una señal de audio de múltiples canales, que comprende al menos dos canales de audio (RI, LI), de tal forma que el método comprende generar (1) una señal de audio (SC ¿"single channel") de un único canal, que comprende una combinación particular de los al menos dos canales de audio (RI, LI), y codificar la señal de audio de canal único (SC) en una corriente de bits (EBS), como una señal de audio de canal único codificada (ESC), generar (2) información (INF) a partir de los al menos dos canales de audio (RI, LI), que permite recuperar, con un nivel de calidad requerido, la señal de audio de múltiples canales a partir de la señal de audio de canal único (SC) y de la información (INF), de tal modo que la generación (2) de la información comprende: - determinar (2) una primera porción de la información (P1), que consiste en un único conjunto de parámetros (S1), determinados para una primera zona de frecuencias (FR1) de la señal de audio de múltiples canales, y codificarla primera porción de la información (P1) en la corriente bits (EBS), como una primera porción codificada de la información (EIN ¿"encoded information"), y - determinar (2) una segunda porción de la información (P2) para una segunda zona de frecuencias (FR2) de la señal de audio de múltiples canales, de tal modo que la segunda zona de frecuencias (FR2) es una porción de la primera zona de frecuencias (FR1), y codificar la segunda porción de la información (P2) dentro de la corriente de bits (EBS), como una segunda porción codificada de la información (EIN).

Description

Representación de audio paramétrico de múltiples canales.
La invención se refiere a un método para codificar una señal de audio de múltiples canales, a un codificador para codificar una señal de audio de múltiples canales, a un aparato para suministrar una señal de audio, a una señal de audio codificada, a un medio de almacenamiento en el que se almacena la señal de audio codificada, a un método para descodificar una señal de audio codificada, a un descodificador para descodificar una señal de audio codificada, y a un aparato para suministrar una señal de audio descodificada.
El documento EP-A-1107232 describe un esquema de codificación paramétrica destinado a generar una representación de una señal de audio estéreo que está compuesta por una señal de canal izquierdo y una señal de canal derecho. Con el fin de utilizar eficazmente la anchura de banda de transmisión, dicha representación contiene información concerniente únicamente a una señal mono-auditiva, o para un único oído, que es, bien la señal del canal izquierdo o bien la señal del canal derecho, e información paramétrica. La otra señal estéreo puede ser recuperada basándose en la señal mono-auditiva, conjuntamente con la información paramétrica. La información paramétrica comprende indicaciones de localización de la señal de audio estéreo, que incluyen características de intensidad y de fase del canal izquierdo y del canal derecho.
La publicación "Codificación en sub-banda de señales de audio digitales estereofónicas" ("Subband Coding of Stereophonic Digital Audio Signals"), de R. van der Waal, R. Veldhuis, Philips Reserch Laboratories, en el IEEE (Instituto de Ingeniería Eléctrica y Electrónica), 1991, vol. 2, páginas 3.601-3.604 (ISBN: 0-7803-0003-3), describe un algoritmo de codificación en sub-banda. En tales algoritmos de codificación en sub-banda, el espectro de frecuencias que se ha de codificar se divide en sub-bandas que no se superponen. La codificación se realiza por cada sub-banda. La codificación por sub-banda incluye una transformación rotacional.
Las soluciones previas que se han sugerido en los codificadores de audio para reducir la velocidad de bits del material de programa estéreo incluyen estéreo de intensidad y estéreo de M/S.
En el algoritmo de estéreo de intensidad, las altas frecuencias (típicamente por encima de 5 kHz) se representan por una única señal de audio (es decir, mono), combinada con factores de escala o factores de intensidad que varían con el tiempo y dependientes de la frecuencia, lo que permite recuperar una señal de audio descodificada que se parece a la señal estéreo original para estas zonas de frecuencia. En el algoritmo de M/S, la señal se descompone en una señal de suma (o media, o común) y una señal de diferencia (o lateral, o no común). Esta descomposición se combina, en ocasiones, con análisis de componentes de principio o con factores de escala que varían con el tiempo. Estas señales se codifican entonces de manera independiente, ya sea por un codificador de transformación o por un codificador de sub-banda [los cuales son, ambos, codificadores de forma o perfil de onda]. La cantidad o magnitud de la reducción de información que se consigue por este algoritmo depende fuertemente de las propiedades espaciales de la señal de fuente. Por ejemplo, si la señal de fuente es mono-auditiva, la señal de diferencia es cero y puede ser desechada. Sin embargo, si la correlación entre las señales de audio izquierda y derecha es baja (lo cual es a menudo el caso para las zonas de frecuencias más bajas), este esquema ofrece tan solo una pequeña reducción de la velocidad de bits. Para las zonas de frecuencias bajas, la codificación de M/S proporciona generalmente un mérito significativo.
Las descripciones paramétricas de las señales de audio han venido ganando interés durante los últimos años, especialmente en el campo de la codificación de audio. Se ha demostrado que la transmisión de parámetros (cuantificada) que describen señales de audio requiere tan solo una pequeña capacidad de transmisión para volver a sintetizar una señal perceptivamente igual en el extremo o terminal receptor. Sin embargo, los codificadores de audio paramétricos actuales se concentran en la codificación de señales mono-auditivas, y las señales estéreo se procesan o tratan como señales mono dobles.
Es un propósito de la invención proporcionar un sistema de audio paramétrico de múltiples canales que sea capaz de regular en escala la calidad de la señal de audio codificada con la velocidad de bits disponible, o de regular en escala la calidad de la señal de audio descodificada, con la complejidad del descodificador o la anchura de banda de trasmisión disponible.
Un primer aspecto de la invención proporciona un método para codificar una señal de audio de múltiples canales, según se reivindica en la reivindicación 1. Un segundo aspecto de la invención proporciona un codificador destinado a codificar una señal de audio de múltiples canales, según se reivindica en la reivindicación 13. Un tercer aspecto de la invención proporciona una señal de audio codificada según se reivindica en la reivindicación 16. Un cuarto aspecto de la invención proporciona un medio de almacenamiento en el que se almacena la señal codificada, y se reivindica en la reivindicación 17. Un quinto aspecto de la invención proporciona un método de descodificación, según se reivindica en la reivindicación 18. Un sexto aspecto de la invención proporciona un descodificador para descodificar una señal de audio codificada, según se reivindica en la reivindicación 19. Realizaciones ventajosas se definen en las reivindicaciones dependientes.
En el método de codificación de una señal de audio de múltiples canales, de acuerdo con el primer aspecto de la invención, se genera una señal de audio de un único canal. Por otra parte, se genera información a partir de la señal de la señal de audio de múltiples canales, que permite la recuperación, con un nivel de calidad requerido, de la señal de audio de múltiples canales a partir de la señal de audio de canal único y de la información. Preferiblemente, la información comprende conjuntos de parámetros, por ejemplo, según se conoce por el documento EP-A-1107232.
De acuerdo con el primer aspecto de la invención, la información se genera determinando una primera porción de la información para una primera zona de frecuencias de la señal de audio de múltiples canales, y determinando una segunda porción de la información para una segunda zona de frecuencias de la señal de audio de múltiples canales. La segunda zona de frecuencias es una porción de la primera zona de frecuencias y, por tanto, constituye un sub-intervalo o intervalo incluido en la primera zona de frecuencias. Ahora, son posibles dos niveles de calidad en la descodificación. Para un nivel de calidad baja de la señal de audio de múltiples canales descodificada, el descodificador se sirve de la señal de audio de canal único codificada, y de la primera porción de la información. Para un nivel de calidad superior, el descodificador utiliza la señal de audio de canal único codificada y tanto la primera como la segunda porciones de la información. Por supuesto, es posible seleccionar la calidad de la descodificación de entre una multiplicidad de niveles, si está presente una multiplicidad de porciones de información de tal manera que cada una de ellas está asociada con una zona de frecuencias diferente. Por ejemplo, la primera porción puede comprender un único conjunto de parámetros determinado, con una zona de frecuencias que cubre la totalidad de la anchura de banda de la señal de audio de múltiples canales. Y la segunda porción puede comprender diversos conjuntos de parámetros, de tal modo que cada conjunto de parámetros está determinado por un sub-intervalo o porción de toda la anchura de banda. Conjuntamente, las porciones cubren, de preferencia, toda la anchura de banda.
Esta representación de la señal de audio codificada permite que la calidad de la señal de audio descodificada dependa de la complejidad del descodificador. Por ejemplo, en un sencillo descodificador portátil puede utilizarse un descodificador de baja complejidad que tenga un consumo de potencia bajo y que, en consecuencia, sea capaz de utilizar tan solo una parte de la información. En una aplicación de tope de gama se utiliza un descodificador complejo que se sirve de toda la información disponible en la señal codificada.
La calidad del audio descodificado puede depender también de la anchura de banda de transmisión disponible. Si la anchura de banda de transmisión es alta, entonces el descodificador puede descodificar todas las capas disponibles, ya que son, todas ellas, transmitidas. Si la anchura de banda de transmisión es baja, entonces el transmisor puede decidir transmitir únicamente un número de capas limitado.
En una realización según se define en la reivindicación 2, el codificador recibe una velocidad de bits máxima permisible de la señal de audio de múltiples canales codificada. Esta velocidad de bits máxima permisible puede estar definida por la velocidad de bits disponible de un canal de transmisión tal como la Internet, o de un medio de almacenamiento. En aplicaciones en las que la anchura de banda de transmisión es variable y, por tanto, la máxima velocidad de bits permisible cambia con el tiempo, es importante ser capaz de adaptarse a estas fluctuaciones de la anchura de banda de transmisión con el fin de evitar una calidad muy baja de la señal de audio descodificada. Normalmente, el codificador codifica todas las capas disponibles. Se decide en el terminal transmisor qué capas de han de transmitir, dependiendo de la capacidad de los canales disponibles. Es posible hacer esto con el codificador en el bucle, pero ello es más complicado que separando o desprendiendo algunas capas antes de la transmisión.
El codificador añade tan solo la segunda porción de la información para la segunda zona de frecuencias de la señal de audio de múltiples canales, a la señal de audio codificada, en el caso de que una velocidad de bits de la señal de audio de múltiples canales codificada, que comprende la señal de audio de canal único, y las primera y segunda porciones de la información no sean superiores a la máxima velocidad de bits permisible. De esta forma, la segunda porción no está presente en la señal de audio codificada si la anchura de banda de transmisión no es lo suficientemente grande como para dar soporte a la transmisión de la segunda porción.
En una realización según se define en la reivindicación 3, la información comprende conjuntos de parámetros, de tal modo que cada una de las porciones de la información está representada por uno o más conjuntos de parámetros. El número de conjuntos de parámetros depende del número de zonas de frecuencias presentes en las porciones de la información.
En una realización según se define en la reivindicación 4, los conjuntos de parámetros comprenden al menos una de las indicaciones de localización.
En una realización según se define en la reivindicación 6, la primera zona de frecuencias cubre sustancialmente toda la anchura de banda de la señal de audio de múltiples canales. De esta forma, basta un conjunto de parámetros para proporcionar la información básica que se requiere para descodificar la señal de audio de único canal en la señal de audio de múltiples canales. Se garantiza de esta forma un nivel básico de calidad de la señal de audio. El segundo intervalo de frecuencias cubre parte de la anchura de banda completa. De este modo, la segunda porción, cuando está presente en la señal de audio codificada, mejora la calidad de la señal de audio descodificada en este intervalo de frecuencias.
En una realización según se define en la reivindicación 7, la segunda porción de la información comprende al menos dos intervalos de frecuencias que, conjuntamente, cubren de manera sustancial toda la anchura de banda de la señal de audio de múltiples canales. De esta forma, la mejora en la calidad proporcionada por la segunda porción está presente a lo largo de la anchura de banda completa.
En una realización según se define en la reivindicación 8, la capa de base que comprende la señal de audio de canal único y la primera porción de la información, está siempre presente en la señal de audio codificada. La capa de mejora que comprende la segunda porción de la información, es codificada únicamente si la velocidad de bits de la segunda señal de audio no excede la velocidad de bits máxima permisible. De esta forma, la calidad de la señal de audio descodificada dependerá de la velocidad de bits máxima permisible. Si la velocidad de bits máxima permisible es demasiado baja como para proporcionar acomodo a la capa de mejora, la señal de audio descodificada se obtendrá a partir de la capa de base, lo que producirá una mejor calidad del audio descodificado que la que se dará en el caso de que partes impredecibles del audio codificado no lleguen al descodificador.
En las realizaciones según se define en una cualquiera de las reivindicaciones 9-11, las porciones de la información (que contienen habitualmente conjuntos de parámetros, un conjunto para cada banda de frecuencias representada) contenidas en una trama siguiente son codificadas basándose en los parámetros de la trama previa. Normalmente, esto reduce la velocidad de bits de las porciones codificadas de la información, debido a que, como consecuencia de la correlación, la información contenida en dos tramas sucesivas no diferirá sustancialmente.
En las realizaciones según se define en la reivindicación 12, la diferencia entre los parámetros de dos tramas sucesivas es codificada en lugar de los parámetros en sí.
Estos y otros aspectos de la invención se pondrán de manifiesto a partir de las realizaciones que se describen en lo que sigue, y se aclararán con referencia a las mismas.
En los dibujos:
la Figura 1 muestra un diagrama de bloques de un codificador de múltiples canales para audio estéreo,
la Figura 2 muestra un diagrama de bloques de un descodificador de múltiples canales para audio estéreo,
la Figura 3 muestra una representación de la corriente de datos codificada,
la Figura 4 ilustra una realización de los intervalos de frecuencias de acuerdo con la invención,
la Figura 5 muestra otra realización de los intervalos de frecuencias de acuerdo con la invención,
la Figura 6 ilustra la determinación de los conjuntos de parámetros basándose en parámetros de una trama previa, de acuerdo con una realización de la invención,
la Figura 7 muestra un conjunto de parámetros,
la Figura 8 muestra la determinación diferencial de los parámetros de la capa de base, y
la Figura 9 ilustra la determinación diferencial de los parámetros correspondientes a una zona de frecuencias de una capa de mejora.
La Figura 1 muestra un diagrama de bloques de un codificador de múltiples canales. El codificador recibe una señal de audio de múltiples canales que se muestra como una señal estéreo RI, LI, el codificador suministra la señal de audio de múltiples canales codificada EBS.
El mezclador de sentido descendente 1 combina la señal estéreo o los canales estéreo RI, LI en una señal de audio de un único canal (a la que se hace también referencia como señal mono-auditiva) SC. Por ejemplo, el mezclador de sentido descendente 1 puede determinar el promedio de las señales de audio de entrada RI, LI.
El codificador 2 codifica la señal mono-auditiva SC para obtener una señal mono-auditiva codificada ESC. El codificador 3 puede ser de un tipo conocido, por ejemplo, un codificador de MPEG (MPEG-LII, MPEG-LIII (mp3), o MPEG2-AAC).
El circuito 2 de determinación de parámetros determina los conjuntos de parámetros S1, S2, ... que caracterizan la información INF, basándose en las señales de audio de entrada RI, LI. Opcionalmente, el circuito 2 de determinación de parámetros recibe la máxima velocidad de bits permisible MBR ("maximum bit rate") con el fin de determinar únicamente los conjuntos de parámetros S1, S2, ..., los cuales, una vez codificados por el codificador 4 de parámetros, conjuntamente con la señal mono-auditiva codificada ESC, no exceden la velocidad de bits máxima permisible MBR. Los parámetros codificados se denotan por EIN.
El dispositivo de formateado 5 combina la señal mono-auditiva codificada SC ("single channel") y los parámetros codificados EIN en una corriente de datos de un formato deseado, a fin de obtener la señal de audio de múltiples canales codificada EBS.
El funcionamiento del codificador se aclara con mayor detalle en lo que sigue a continuación, a modo de ejemplo, con respecto a una realización. La señal de audio de múltiples canales LI, RI se codifica en una única señal mono-auditiva SC (a la que se hace referencia también adicionalmente como señal de audio de canal único). La parametrización o cuantificación en parámetros de atributos espaciales de las señales de audio de múltiples canales LI, RI se lleva a cabo por parte del circuito 2 de determinación de parámetros. Los parámetros contienen información acerca del modo como restaurar o restituir la señal de audio de múltiples canales LI, RI a partir de la señal mono-auditiva SC. Los parámetros son habitualmente codificados por el codificador de parámetros 4, antes de combinarlos con la señal mono-auditiva individual codificada ESC ("encoded single channel"). De esta forma, para las aplicaciones generales de codificación de audio, se transmiten o almacenan estos parámetros, combinados con una única señal de audio mono-auditiva. La señal codificada y combinada es la señal de audio de múltiples canales codificada EBS. La capacidad de transmisión o almacenamiento necesaria para transmitir o almacenar la señal de audio de múltiples canales codificada EBS, se ve fuertemente reducida en comparación con codificadores de audio que procesan o tratan independientemente los múltiples canales. Sin embargo, la impresión espacial original se mantiene por medio de la información INF, que contiene los (conjuntos de) parámetros.
En particular, la descripción paramétrica del audio de múltiples canales RI, LI está relacionada con un modelo de procesamiento bi-auditivo (o de los dos oídos) que se encamina a la descripción del procesamiento de señal efectivo del sistema auditivo de dos oídos.
El modelo divide el audio entrante LI, RI en varias señales limitadas en banda, las cuales, preferiblemente, están separadas linealmente en una escala de velocidades ERB. La anchura de banda de estas señales depende de la frecuencia central, siguiendo a la velocidad ERB. De manera subsiguiente, se analizan, preferiblemente, para cada banda de frecuencias, las siguientes propiedades de las señales entrantes:
- la diferencia de niveles inter-auditivos o entre oídos, o ILD ("interaural level difference"), definida por los niveles relativos de la señal limitada en banda que se origina en los oídos izquierdo y derecho,
- la diferencia de tiempos (o fases) inter-auditivos o entre oídos, ITD ("interaural time difference") (o IPD -"interaural phase difference"), definida por el retardo entre oídos (o desplazamiento de fase) correspondiente al pico de la función de correlación transversal entre oídos, y
- la similitud (disimilitud) de las formas de onda que no es achacable a las ITDs o las ILDs, la cual puede ser cuantificada como parámetro por medio de la máxima correlación transversal entre oídos, IC (por ejemplo, el valor de la correlación transversal en la posición del pico máximo).
Los conjuntos S1, S2, ... de los tres parámetros, una vez establecidos para cada banda de frecuencias FR1, FR2, ..., varían a lo largo del tiempo. Sin embargo, puesto que el sistema auditivo de dos oídos es muy lento en su procesamiento, la velocidad de actualización de estas propiedades es bastante baja (típicamente, de decenas de milisegundos).
Puede suponerse que los parámetros que varían (lentamente) con el tiempo son las únicas propiedades de señal espaciales de las que dispone el sistema auditivo de dos oídos, y que, a partir de estos parámetros dependientes del tiempo y de la frecuencia, el mundo auditivo percibido se reconstruye por los niveles superiores del sistema auditivo.
La Figura 2 muestra un diagrama de bloques de un descodificador de múltiples canales. El descodificador recibe la señal de audio de múltiples canales codificada EBS y suministra la señal de audio de múltiples canales descodificada que ha recuperado, la cual se muestra como una señal estéreo RO, LO.
El dispositivo 6 de supresión de formateado recupera la señal mono-auditiva codificada ESC' y los parámetros codificados EIN' de la corriente de datos EBS. El descodificador 7 descodifica la señal mono-auditiva codificada ESC' para obtener la señal mono-auditiva de salida SCO. El descodificador 7 puede ser de cualquier tipo conocido (por supuesto, en correspondencia con el codificador que se ha utilizado); por ejemplo, el descodificador 7 es un descodificador de MPEG. El descodificador 8 descodifica los parámetros codificados EIN' para obtener parámetros de salida INO.
El desmultiplexador 9 recupera las señales de audio estéreo de salida LO y RO mediante la aplicación de los conjuntos de parámetros S1, S2, ... de los parámetros de salida INO en la señal mono-auditiva de salida SCO.
La Figura 3 muestra una representación de la corriente de datos codificados. Por ejemplo, en cada trama F1, F2, ..., el paquete de datos comienza con un encabezamiento H, seguido de la señal mono-auditiva codificada ECS, ahora indicada por A, una primera porción P1 de la información codificada EIN, una segunda porción P2 de la información codificada EIN, y una tercera porción P3 de la información codificada EIN.
Si la trama F1, F2, ... comprende únicamente el encabezamiento H y la señal mono-auditiva codificada ECS, tan solo se transmite la señal mono-auditiva SC.
Como se ha descrito en el documento EP-A-1107232, la banda de frecuencias completa en la que tiene lugar la señal de audio de entrada, se divide en una pluralidad de sub-bandas de frecuencias, las cuales cubren, conjuntamente, la banda de frecuencias completa. En la terminología de acuerdo con la invención, la información INF de múltiples canales se codifica en una pluralidad de conjuntos de parámetros S1, S2, ..., un conjunto para cada sub-banda de frecuencias FR1, FR2, ... Esta pluralidad de conjuntos de parámetros S1, S2, ... se codifica en la primera porción P1 de la información codificada EIN. De esta forma, con el fin de transmitir una señal de audio de múltiples canales de calidad de nivel básico, la corriente de bits comprende el encabezamiento H, la porción A, que es la señal mono-auditiva codificada, y la primera porción P1.
En la corriente de bits de acuerdo con una realización de la invención, la primera porción P1 consiste, tan solo, en un único conjunto S1 de parámetros. El conjunto único es determinado para la anchura de banda completa FR1. Esta corriente de datos, que comprende el encabezamiento H y las porciones A y P1, proporciona una capa básica de calidad, indicada por BL en la Figura 3.
Con el fin de dar soporte a una calidad mejorada, están presentes en la corriente de datos porciones adicionales de P2, P3 de la información codificada EIN. Estas porciones adicionales forman una capa de mejora EL ("enhancement layer"). La corriente de bits puede comprender una única porción adicional P2 o más de 1 porción adicional. La porción adicional P2 comprende, preferiblemente, una pluralidad de conjuntos de parámetros S2, S3, ..., un conjunto para cada sub-banda de frecuencias FR2, FR3, ..., de tal modo que las sub-bandas de frecuencia FR2, FR3 cubren, preferiblemente, toda la banda de frecuencias FR1. La calidad mejorada puede también estar presente de un modo paso a paso, de manera que un primer nivel de mejora se proporciona por la capa de mejora EL1, que comprende la primera porción. Y una segunda capa de mejora EL comprende la primera capa de mejora EL1 y la segunda capa de mejora EL2, que comprende la porción P3.
La porción adicional P2 puede también comprender un único conjunto S2 de parámetros correspondientes a una única banda de frecuencias FR2, que es una sub-banda de la banda de frecuencias completa FR1. La porción adicional P2 puede comprender también un cierto número de conjuntos de parámetros S2, S3, ... que corresponden a las bandas de frecuencia FR2, FR3, ... que no cubren, conjuntamente, toda la banda de frecuencias FR1 completa.
La porción adicional P3 contiene, preferiblemente, conjuntos de parámetros para bandas de frecuencia que sub-dividen al menos una de las sub-bandas de la porción adicional P2.
Este formato de la corriente de bits de acuerdo con la invención permite regular en escala, en el canal de transmisión o en el descodificador, la calidad de la señal de audio descodificada, con la velocidad de bits del canal de transmisión, o con la complejidad de descodificación del descodificador. Por ejemplo, si el descodificador de audio ha de tener un consumo de potencia bajo, como es importante en las aplicaciones portátiles, el descodificador puede tener una complejidad baja y utiliza únicamente las porciones H, A y P1. Sería posible incluso que el descodificador fuera capaz de llevar a cabo operaciones más complejas con un consumo de potencia más alto, en el caso de que el usuario indicase que desea una calidad más alta del audio descodificado.
Es también posible que el descodificador esté al tanto de la velocidad de bits máxima permisible, MBR, que puede ser transmitida a través del canal de transmisión o que puede ser almacenada en un medio de almacenamiento. Ahora, el codificador es capaz de decidir acerca de cuántas porciones adicionales P1, P2, ..., si es que hay alguna, caben dentro de la máxima velocidad de bits permisible MBR. El codificador codifica únicamente estas porciones permisibles P1, P2, ... de la corriente de bits.
La Figura 4 muestra una realización de los intervalos de frecuencias de acuerdo con la invención. En esta realización, la banda de frecuencias FR1 es igual a la banda de frecuencias completa FBW ("full bandwidth") de la señal de audio de múltiples canales LI, RI, y la banda de frecuencias FR2 es una sub-banda de frecuencias de la anchura de banda completa FBW.
Si éstos son los únicos intervalos de frecuencias para los que se determinan los conjuntos de parámetros S1, S2, ..., se determina un único conjunto de parámetros S1 para la banda de frecuencias FR1 y está presente en la porción P1, y se determina un único conjunto de parámetros S2 para la banda de frecuencias FR2, y está presente en la porción P2. La regulación en escala de la calidad es posible, bien utilizando la porción P2 ó bien no utilizándola.
La Figura 5 muestra otra realización de los intervalos de frecuencias de acuerdo con la invención. En esta realización, la banda de frecuencias FR1 es de nuevo igual a la anchura de banda completa FBW, y las sub-bandas de frecuencias FR2 y FR3 cubren, conjuntamente, la anchura de banda completa FBW. O, dicho en otras palabras, la banda de frecuencias FR1 se subdivide en las sub-bandas de frecuencias FR2 y FR3.
En el caso de que éstos sean los únicos intervalos de frecuencias para los que se determinan los conjuntos de parámetros S1, S2, ..., la porción P1 comprende un único conjunto de parámetros S1, determinado por la banda de frecuencias FR1, y la porción P2 comprende dos conjuntos de parámetros S2 y S3, determinados, respectivamente, por las bandas de frecuencias FR2 y FR3. La regulación en escala de la calidad es posible tanto utilizando la porción P2 como no utilizándola.
La Figura 6 muestra la determinación de los conjuntos de parámetros basándose en parámetros contenidos en una trama previa, de acuerdo con una realización de la invención.
La Figura 6 muestra una corriente de datos que comprende, en cada trama F1, F2, ..., la información codificada EIN, que comprende la porción P1, que es una parte de la capa de base BL, y la porción P2, que forma la capa de mejora EL.
En la trama F1, la porción P1 comprende un único conjunto de parámetros S1 que son determinados para la anchura de banda completa FR1. La porción P2, a modo de ejemplo, comprende cuatro conjuntos de parámetros S2, S3, S4, S5 que se determinan, respectivamente, para las sub-bandas de frecuencias FR2, FR3, FR4, FR5. Las cuatro sub-bandas de frecuencias FR2, FR3, FR4, FR5 sub-dividen la banda de frecuencias FR1.
En la trama F2, que sucede a la trama F1, la porción P1 comprende un único conjunto de parámetros S1' que se determinan para la anchura de banda completa FR1 y forman parte de la capa de base BL'. La porción P2 comprende cuatro conjuntos de parámetros S2', S3', S4', S5' que son de nuevo determinados, respectivamente, para las sub-bandas de frecuencia FR2, FR3, FR4, FR5 y que forman la capa de mejora EL'.
Es posible codificar cada uno de estos conjuntos de parámetros S1, S2, ... para cada una de las tramas F1, F2, ... por separado. Es también posible codificar los conjuntos de parámetros de la porción P2 con respecto a los parámetros de la porción P1. Esto se indica por las flechas que comienzan en S1 y terminan en S2 a S5, en la trama F1. Por supuesto, esto es también posible en otras tramas F2, ... (no mostradas). De la misma manera, es posible codificar el conjunto de parámetros S1' con respecto a S1. Y finalmente, los conjuntos de parámetros S2', S3', S4', S5' pueden ser codificados con respecto a los conjuntos de parámetros S2, S3, S4, S5.
De esta forma, la velocidad de bits de la información codificada EIN puede ser reducida en la medida en que se utiliza la redundancia o correlación entre conjuntos de parámetros Si.
Preferiblemente, los nuevos parámetros de los nuevos conjuntos de parámetros S1', S2', S3', S4', S5' se codifican como la diferencia entre su valor y el valor de los parámetros de los conjuntos de parámetros previos S1, S2, S3, S4, S5.
A intervalos de tiempo uniformes, se ha de codificar al menos el conjunto de parámetros S1 de forma absoluta y no diferencial, a fin de evitar que los errores se propaguen demasiado lejos.
La Figura 7 muestra un conjunto de parámetros. Cada conjunto de parámetros Si puede comprender uno o más parámetros. Habitualmente, los parámetros son indicaciones de localización que proporcionan información acerca de la localización de objetos sonoros en la información de audio. Por lo común, las indicaciones de localización consisten en la diferencia de niveles inter-auditivos, o entre oídos, ILD, en la diferencia de tiempos inter-auditivos o de fases inter-auditivas, ITD o IPD, y en la correlación transversal inter-auditiva, o entre oídos, IC ("interaural cross-correlation"). Una información más detallada acerca de estos parámetros se proporciona en la Publicación de la Convención de la Sociedad de Ingería de Audio ("Audio Engineering Society Convention Paper") 5574, "Codificación de indicaciones bi-auditivas, o de los dos oídos, aplicada a la compresión de audio estéreo y de múltiples canales" ("Binaural Cue Coding Applied to Stereo and Multi-channel Audio Compression"), presentada en la 112ª Convención, del 10 al 13 de mayo de 2002 en Munich, Alemania, por Christof Faller et al.
La Figura 8 muestra la determinación diferencial de un parámetro de la capa de base. El eje horizontal indica tramas sucesivas F1 a F5. El eje vertical muestra el valor PVG de un parámetro del conjunto de parámetros S1 de la capa de base BL ("base layer"). Este parámetro tiene los valores A1 a A5 para las tramas F1 a F5, respectivamente. La contribución de este parámetro a la velocidad de bits de la información codificada EIN disminuirá si no se codifican los valores reales A1 a A5 del parámetro, sino las diferencias, más pequeñas, D1, D2, ...
La Figura 9 muestra la determinación diferencial de los parámetros correspondientes a una zona de frecuencias de una capa de mejora. El eje horizontal indica dos tramas sucesivas F1 y F2. El eje vertical indica los valores de un parámetro particular de la capa de base BL y de la capa de mejora EL. En este ejemplo, la capa de base BL comprende la porción P1 de información INF con un único conjunto de parámetros, determinado para el intervalo de frecuencias completo FBW, de tal manera que el parámetro particular de la porción P1 tiene el valor A1 para la trama F1 y A2 para la trama F2. La capa de mejora EL comprende la porción P2 de información INF con tres conjuntos de parámetros determinados para tres intervalos de frecuencias respectivos FR2, FR3, FR4 que, conjuntamente, llenan el intervalo de frecuencias completo FBW. Los tres parámetros particulares (por ejemplo, el parámetro que representa la ILD) tienen un valor B11, B12, B13 en la trama F1 y un valor B21, B22, B23 en la trama F2.
La contribución de estos parámetros a la velocidad de bits de la información codificada EIN se reducirá si no se codifican los verdaderos valores B11 a B23 del parámetro particular, sino las diferencias D11, D12, ..., debido a que estas diferencias pueden ser codificadas más eficazmente que los verdaderos valores.
En resumen, en una realización preferida de acuerdo con la invención, se propone organizar la información de parámetros estéreo INF de tal manera que una capa de base BL contiene uno de los conjuntos de parámetros (preferiblemente, la diferencia de tiempos/niveles y la correlación) S1, que se determina para la anchura de banda completa FBW de la señal de audio de múltiples canales LI, RI. La capa de mejora EL contiene múltiples conjuntos de parámetros S2, S3, ... que corresponden a intervalos de frecuencia subsiguientes FR2, FR3 dentro de la anchura de banda completa FBW. En aras a la eficacia en cuanto a la velocidad de bits, los conjuntos de parámetros S2, S3, ... de la capa de mejora EL pueden ser codificados de forma diferencial con respecto al conjunto de parámetros S1 situado en la capa de base BL.
\newpage
La información INF se codifica de una manera estructurada en múltiples capas, a fin de permitir una regulación en escala de la calidad de la descodificación frente a la velocidad de bits.
Para concluir, en lo que sigue a continuación, se elucida una realización preferida de acuerdo con la invención, con respecto a un código de programa y a su explicación o aclaración.
En primer lugar se determinan, para todas las tramas subordinadas o sub-tramas (las porciones P1, P2, ...) contenidas en las tramas F1, F2, ..., los datos ESC para la representación mono-auditiva, o de un solo oído, SC, los datos EIN para el conjunto de parámetros estéreo S1 para la anchura de banda completa FBW, y los parámetros estéreo S2, S3, ... para los contenedores (o regiones) de frecuencias FR2, FR3, ...
El código de programa se muestra en el lado izquierdo, y se proporciona, en el lado derecho, una aclaración del código de programa que se describe.
1
En segundo lugar, dependiendo del valor del bit refrescar_estéreo, se codifican de manera absoluta los parámetros estéreo para la anchura de banda completa (se codifica el valor real o verdadero), o bien se codifica la diferencia con los valores previos. El siguiente código es válido para la diferencia de niveles inter-auditivos, o entre ambos oídos, ILD.
2
3
En tercer lugar, dependiendo del valor del bit refrescar_estéreo, se codifican de forma absoluta los parámetros estéreo para todos los contenedores de frecuencias (se codifica el valor real o verdadero), o bien se codifica la diferencia con los parámetros correspondientes para la anchura de banda completa. El siguiente código es válido para la diferencia de niveles inter-auditivos, o entre los dos oídos, ILD.
4
Donde:
La expresión "refrescar_estéreo" es un indicador que denota si se han de refrescar o no los parámetros estéreo (0 = FALSO, 1 = VERDADERO).
\newpage
La expresión "ild_global[sf]" representa el nivel de representación absoluto codificado de Huffman de la ILD para toda el área de frecuencias para la trama f.
La expresión "ild_global_dif[f]" representa el nivel de representación relativo codificado de Huffman de la ILD para toda el área de frecuencias para la trama f.
La expresión "ild_contenedor[f, b]" representa el nivel de representación absoluto codificado de Huffman de la ILD para la trama f y el contenedor b.
La expresión "ild_contenedor_dif[f, b]" representa el nivel de representación relativo codificado de Huffman de la ILD para la trama f y el contenedor b.
Ha de apreciarse que las realizaciones anteriormente mencionadas ilustran la invención en lugar de limitarla, y que los expertos de la técnica serán capaces de diseñar muchas realizaciones alternativas sin apartarse del ámbito de las reivindicaciones que se acompañan.
Si bien la invención se ha elucidado en las figuras en relación con una señal estéreo, la extensión a una señal de audio de más de dos canales puede llevarse a cabo fácilmente por parte de la persona experta.
En las reivindicaciones, cualesquiera símbolos de referencia situados entre paréntesis no se han de interpretar como limitativos de la reivindicación. La expresión "que comprende" no excluye la presencia de elementos o etapas diferentes de los que se listan en una reivindicación. La invención puede llevarse a la práctica por medio de dispositivos físicos o hardware que comprende diversos elementos diferentes, y por medio de una computadora adecuadamente programada. En la reivindicación de dispositivo que enumera diversos medios, varios de estos medios pueden materializarse por medio de un mismo elemento de hardware. El mero hecho de que se mencionan ciertas medidas en reivindicaciones dependientes distancias unas de otras no indica que no se pueda utilizar de forma ventajosa una combinación de estas medidas.
En suma, las señales de audio de múltiples canales se codifican en una señal de audio mono-auditiva, o para un solo oído, y en información, lo que permite recuperar la señal de audio de múltiples canales a partir de la señal de audio mono-auditiva y de la información. La información se genera determinando una primera porción de la información para una primera zona de frecuencias de la señal de audio de múltiples canales, y determinando una segunda porción de la información para una segunda zona de frecuencias de la señal de audio de múltiples canales. La segunda zona de frecuencias es una porción de la primera zona de frecuencias y, por tanto, constituye un sub-intervalo de la primera zona de frecuencias. La información está estructurada en múltiples capas, lo que permite una regulación en escala de la calidad de la descodificación frente a la velocidad de bits.

Claims (20)

1. Un método para codificar una señal de audio de múltiples canales, que comprende al menos dos canales de audio (RI, LI), de tal forma que el método comprende
generar (1) una señal de audio (SC -"single channel") de un único canal, que comprende una combinación particular de los al menos dos canales de audio (RI, LI), y codificar la señal de audio de canal único (SC) en una corriente de bits (EBS), como una señal de audio de canal único codificada (ESC),
generar (2) información (INF) a partir de los al menos dos canales de audio (RI, LI), que permite recuperar, con un nivel de calidad requerido, la señal de audio de múltiples canales a partir de la señal de audio de canal único (SC) y de la información (INF), de tal modo que la generación (2) de la información comprende:
-
determinar (2) una primera porción de la información (P1), que consiste en un único conjunto de parámetros (S1), determinados para una primera zona de frecuencias (FR1) de la señal de audio de múltiples canales, y codificar la primera porción de la información (P1) en la corriente bits (EBS), como una primera porción codificada de la información (EIN -"encoded information"), y
-
determinar (2) una segunda porción de la información (P2) para una segunda zona de frecuencias (FR2) de la señal de audio de múltiples canales, de tal modo que la segunda zona de frecuencias (FR2) es una porción de la primera zona de frecuencias (FR1), y codificar la segunda porción de la información (P2) dentro de la corriente de bits (EBS), como una segunda porción codificada de la información (EIN).
2. Un método para codificar una señal de audio de múltiples canales, de acuerdo con la reivindicación 1, que comprende adicionalmente:
determinar únicamente (2) la segunda porción de la información (P2) para la segunda zona de frecuencias (FR2) de la señal de audio de múltiples canales en el caso de que una velocidad de bits de la señal de audio de múltiples canales codificada, que comprende la señal de audio de canal único (SC), la primera porción de la información (P1) y la segunda porción de la información (P2), no sea superior a una velocidad de bits máxima permisible (MBR).
3. Un método de codificación de acuerdo con la reivindicación 1, caracterizado porque la información (INF) comprende conjuntos de parámetros (S1, S2, ...), la primera porción (P1) comprende al menos un primero (S1) de los conjuntos de parámetros (S1, S2, ...), y la segunda porción (P2) comprende al menos un segundo (S2) de los conjuntos de parámetros (S1, S2, ...), de tal manera que cada conjunto de parámetros está asociado con una zona de frecuencias correspondiente (FR1, FR2, ...).
4. Un método de codificación de acuerdo con la reivindicación 3, caracterizado porque los conjuntos de parámetros comprenden al menos una indicación de localización (ILD, ITD, IPD, IC).
5. Un método de codificación de acuerdo con la reivindicación 4, caracterizado porque la al menos una indicación de localización (ILD, ITD, IPD, IC) se selecciona de entre: una diferencia de niveles inter-auditivos o entre los dos oídos (ILD -"interaural level difference"), una diferencia de tiempos o de fases inter-auditivas, o entre los dos oídos (ITD -"interaural time difference"-, IPD -"interaural phase difference"), o una correlación transversal inter-auditiva, o entre los dos oídos (IC -"interaural cross-correlation").
6. Un método de codificación de acuerdo con la reivindicación 1 ó la reivindicación 2, caracterizado porque la primera zona de frecuencias (FR1) cubre una anchura banda completa (FBW -"full bandwidth") de la señal de audio de múltiples canales.
7. Un método de codificación de acuerdo con la reivindicación 1, caracterizado porque la primera zona de frecuencias (FR1) cubre sustancialmente una anchura de banda completa (FBW) de la señal de audio de múltiples canales, la segunda zona de frecuencias (FR2) cubre una porción de la anchura de banda completa (FBW), y por que determinar (2) la segunda porción de la información (P2) está destinada a determinar conjuntos de parámetros (S2, S3, ...) tanto para la segunda zona de frecuencias (FR2) como para el conjunto de zonas de frecuencias adicionales (FR3, FR4, FR5), de tal manera que la segunda zona de frecuencias (FR2) y el conjunto de zonas de frecuencias adicionales (FR3, FR4, FR5) cubren sustancialmente la anchura de banda completa (FBW), donde el conjunto de zonas de frecuencias adicionales (FR3, FR4, FR5) comprende al menos una zona de frecuencias adicional (FR3).
8. Un método de codificación de acuerdo con la reivindicación 7, caracterizado porque la señal de audio de canal único (SC) y la primera porción (P1) de la información (INF) forman una capa de base de información (BL -"base layer") que está siempre presente en la señal de audio de múltiples canales codificada (EBS), y porque el método comprende recibir (2) una velocidad de bits máxima permisible (MBR -"maximum bit rate") de la señal de audio de múltiples canales codificada (EBS), de tal modo que la segunda porción de la información (P2) forma una capa de mejora de información (EL -"enhancement layer") que es codificada únicamente si la velocidad de bits de la capa de base codificada (DL) y de la capa de mejora (EL) no es más alta que la velocidad de bits máxima permisible (MBR).
9. Un método de codificación de acuerdo con la reivindicación 3, caracterizado porque determinar (2) la primera porción de información (P1) en una trama particular (F2) de información codificada (EIN) comprende determinar (2) el primero de los conjuntos de parámetros (S1') contenido en la trama particular (F2), y codificar el primero de los conjuntos de parámetros (S1') basándose en el primero de los conjuntos de parámetros (S1) de una trama (F1) que precede a la trama particular (F2).
10. Un método de codificación de acuerdo con la reivindicación 7, caracterizado porque determinar (2) la segunda porción de información (P2) contenida en una trama particular (F2) de la información codificada (EIN) comprende determinar (2) los conjuntos de parámetros (S2', S3', ...) de la segunda porción (P2) contenida en la trama particular (F2), y codificar los conjuntos de parámetros (S2', S3', ...) de la segunda porción (P2) contenida en la trama particular (F2) basándose en los conjuntos de parámetros (S2, S3, ...) de una trama (F1) que precede a la trama particular (F2).
11. Un método de codificación de acuerdo con la reivindicación 7, caracterizado porque determinar (2) la segunda porción de información (P2) contenida en una trama particular (F2) de la información codificada (EIN) comprende determinar (2) los conjuntos de parámetros (S2', S3', ...) de la segunda porción (P2) contenida en la trama particular (F2), y codificar los conjuntos de parámetros (S2', S3', ...) de la segunda porción (P2) contenida en la trama particular (F2) basándose en el primero de los conjuntos de parámetros (S1) de una trama (F1) que precede a la trama particular (F2).
12. El método de codificación de acuerdo con una cualquiera de las reivindicaciones 9 a 11, caracterizado porque determinar (2) comprende calcular una diferencia entre los parámetros correspondientes de la trama particular (F2) y de la trama (F1) que precede a la trama particular (F2).
13. Un codificador para codificar una señal de audio de múltiples canales que comprende al menos canales de audio (RI, LI), de tal modo que el codificador comprende:
medios para generar (1) una señal de audio (SC -"single channel") de un único canal, que comprende una combinación particular de los al menos dos canales de audio (RI, LI),
medios para generar (2) información (INF) a partir de los al menos dos canales de audio (RI, LI), que permite recuperar, con un nivel de calidad requerido, la señal de audio de múltiples canales a partir de la señal de audio de canal único (SC) y de la información (INF), de tal modo que los medios para generar (2) la información comprenden:
-
medios para determinar (2) una primera porción de la información (P1), que consiste en un único conjunto de parámetros (S1), determinados para una primera zona de frecuencias (FR1) de la señal de audio de múltiples canales, y
-
medios para determinar (2) una segunda porción de la información (P2) para una segunda zona de frecuencias (FR2) de la señal de audio de múltiples canales, de tal modo que la segunda zona de frecuencias (FR2) es una porción de la primera zona de frecuencias (FR1).
14. Un codificador para codificar una señal de audio de múltiples canales, de acuerdo con la reivindicación 13, que comprende adicionalmente medios para determinar (2) únicamente la segunda porción de la información (P2) para la segunda zona de frecuencias (FR2) de la señal de audio de múltiples canales, en el caso de que una velocidad de bits de la señal de audio de múltiples canales codificada, que comprende la señal de audio de canal único (SC), la primera porción de la información (P1) y la segunda porción de la información (P2), no sea superior a una velocidad de bits máxima permisible (MBR -"maximum bit rate").
15. Un aparato para suministrar una señal de audio, de tal modo que el aparato comprende:
una entrada para recibir una señal de audio de múltiples canales,
un codificador de acuerdo con la reivindicación 13 ó la reivindicación 14, destinado a codificar la señal de audio de múltiples canales con el fin de obtener una señal de audio de múltiples canales codificada, y
una salida para suministrar la señal de audio de múltiples canales codificada.
16. Una señal de audio de múltiples canales codificada, que comprende:
una señal de audio (SC -"single channel") de un único canal, que comprende una combinación particular de al menos dos canales de audio (RI, LI), e información (INF) procedente de los al menos dos canales de audio (RI, LI), lo que permite recuperar, con un nivel de calidad requerido, la señal de audio de múltiples canales a partir de la señal de audio de canal único (SC), y de la información (INF), de tal modo que la información comprende:
-
una primera porción de la información (P1), que consiste en un único conjunto de parámetros (S1) determinados para una primera zona de frecuencias (FR1) de la señal de audio de múltiples canales, y
\newpage
-
una segunda porción de la información (P2) para una segunda zona de frecuencias (FR2) de la señal de audio de múltiples canales, de tal modo que la segunda zona de frecuencias (FR2) es una porción de la primera zona de frecuencias (FR1).
17. Un medio de almacenamiento en el que se ha almacenado la señal de audio codificada de acuerdo con la reivindicación 16.
18. Un método de descodificación de una señal de audio de múltiples canales codificada que se ha codificado de acuerdo con la reivindicación 16, de tal modo que el método de descodificación comprende:
obtener (6, 7) una señal de audio de un único canal descodificada (SCO), que comprende una combinación particular de los al menos dos canales de audio (RI, LI),
obtener (6, 8) información descodificada (INO) a partir de la información (INF), lo que permite recuperar la señal de audio de múltiples canales a partir de la señal de audio de canal único descodificada (SCO) y de la información descodificada (INO), de tal modo que la información descodificada (INO) comprende la primera porción de la información (P1) y la segunda porción de la información (P2), y
aplicar (9), bien la primera porción de la información (P1) o bien la primera porción (P1) y la segunda porción de la información (P2) en la señal de audio de canal único (SCO) con el fin de generar una señal de audio de múltiples canales descodificada (LO, RO).
19. Un descodificador para descodificar una señal de audio de múltiples canales codificada, la cual ha sido codificada de acuerdo con la reivindicación 16, de tal modo que el descodificador comprende:
medios para obtener (6, 7) una señal de audio de un único canal descodificada (SCO), que comprende una combinación particular de los al menos dos canales de audio (RI, LI),
medios para obtener (6, 8) información descodificada (INO) a partir de la información (INF), lo que permite recuperar la señal de audio de múltiples canales a partir de la señal de audio de canal único descodificada (SCO) y de la información descodificada (INO), de tal modo que la información descodificada (INO) comprende la primera porción de la información (P1) y la segunda porción de la información (P2), y
medios para aplicar (9) la primera porción de la información (P1) y la segunda porción de la información (P2) en la señal de audio de canal único (SCO) con el fin de generar una señal de audio de múltiples canales descodificada (LO, RO).
20. Un aparato para suministrar una señal de audio descodificada, de tal modo que el aparato comprende:
una entrada para recibir una señal de audio de múltiples canales codificada,
un descodificador de acuerdo con la reivindicación 19, destinado a descodificar la señal de audio de múltiples canales codificada, con el fin de obtener una señal de salida de múltiples canales, y
una salida para suministrar o reproducir la señal de salida de múltiples canales.
ES03712597T 2002-04-22 2003-04-22 Representacion de audio parametrico de multiples canales. Expired - Lifetime ES2268340T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP02076588 2002-04-22
EP02076588 2002-04-22
EP02077869 2002-07-16
EP02077869 2002-07-16

Publications (1)

Publication Number Publication Date
ES2268340T3 true ES2268340T3 (es) 2007-03-16

Family

ID=29252214

Family Applications (1)

Application Number Title Priority Date Filing Date
ES03712597T Expired - Lifetime ES2268340T3 (es) 2002-04-22 2003-04-22 Representacion de audio parametrico de multiples canales.

Country Status (11)

Country Link
US (1) US8498422B2 (es)
EP (1) EP1500083B1 (es)
JP (1) JP4714415B2 (es)
KR (1) KR101021079B1 (es)
CN (1) CN1647156B (es)
AT (1) ATE332003T1 (es)
AU (1) AU2003216686A1 (es)
BR (2) BR0304542A (es)
DE (1) DE60306512T2 (es)
ES (1) ES2268340T3 (es)
WO (1) WO2003090207A1 (es)

Families Citing this family (115)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
DE60310449T2 (de) 2002-11-28 2007-10-31 Koninklijke Philips Electronics N.V. Audiosignalkodierung
US20040264713A1 (en) * 2003-06-27 2004-12-30 Robert Grzesek Adaptive audio communication code
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US20070168183A1 (en) * 2004-02-17 2007-07-19 Koninklijke Philips Electronics, N.V. Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7756713B2 (en) 2004-07-02 2010-07-13 Panasonic Corporation Audio signal decoding device which decodes a downmix channel signal and audio signal encoding device which encodes audio channel signals together with spatial audio information
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
TWI393121B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
TWI497485B (zh) 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
ATE442644T1 (de) * 2004-08-26 2009-09-15 Panasonic Corp Mehrkanalige signal-dekodierung
CN101010724B (zh) * 2004-08-27 2011-05-25 松下电器产业株式会社 音频编码器
KR20070056081A (ko) * 2004-08-31 2007-05-31 마츠시타 덴끼 산교 가부시키가이샤 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법
DE102004042819A1 (de) 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
EP1792520A1 (en) * 2004-09-06 2007-06-06 Koninklijke Philips Electronics N.V. Audio signal enhancement
DE102004043521A1 (de) * 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
US7860721B2 (en) * 2004-09-17 2010-12-28 Panasonic Corporation Audio encoding device, decoding device, and method capable of flexibly adjusting the optimal trade-off between a code rate and sound quality
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US7720230B2 (en) 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
KR101268218B1 (ko) * 2004-11-29 2013-10-17 내셔널 유니버시티 오브 싱가포르 휴대형 장치용 지각인지 저전력 오디오 디코더
KR101215868B1 (ko) * 2004-11-30 2012-12-31 에이저 시스템즈 엘엘시 오디오 채널들을 인코딩 및 디코딩하는 방법, 및 오디오 채널들을 인코딩 및 디코딩하는 장치
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
JP5017121B2 (ja) * 2004-11-30 2012-09-05 アギア システムズ インコーポレーテッド 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
EP1818911B1 (en) * 2004-12-27 2012-02-08 Panasonic Corporation Sound coding device and sound coding method
WO2006070757A1 (ja) * 2004-12-28 2006-07-06 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
US20080162148A1 (en) * 2004-12-28 2008-07-03 Matsushita Electric Industrial Co., Ltd. Scalable Encoding Apparatus And Scalable Encoding Method
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
WO2006075269A1 (en) * 2005-01-11 2006-07-20 Koninklijke Philips Electronics N.V. Scalable encoding/decoding of audio signals
WO2006082790A1 (ja) 2005-02-01 2006-08-10 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US9626973B2 (en) 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
JP4809370B2 (ja) * 2005-02-23 2011-11-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て
DE102005010057A1 (de) 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
JP4887288B2 (ja) * 2005-03-25 2012-02-29 パナソニック株式会社 音声符号化装置および音声符号化方法
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US8185403B2 (en) * 2005-06-30 2012-05-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
JP5113051B2 (ja) 2005-07-29 2013-01-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法
RU2414741C2 (ru) * 2005-07-29 2011-03-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ создания многоканального сигнала
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
KR101277041B1 (ko) * 2005-09-01 2013-06-24 파나소닉 주식회사 멀티 채널 음향 신호 처리 장치 및 방법
KR100878828B1 (ko) * 2005-10-05 2009-01-14 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
KR20070038439A (ko) 2005-10-05 2007-04-10 엘지전자 주식회사 신호 처리 방법 및 장치
US7761289B2 (en) 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths
US8036900B2 (en) * 2005-11-04 2011-10-11 National University Of Singapore Device and a method of playing audio clips
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
US20090018824A1 (en) * 2006-01-31 2009-01-15 Matsushita Electric Industrial Co., Ltd. Audio encoding device, audio decoding device, audio encoding system, audio encoding method, and audio decoding method
ATE456261T1 (de) 2006-02-21 2010-02-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
TWI447707B (zh) 2006-02-23 2014-08-01 Lg Electronics Inc 音頻訊號之處理方法及其裝置
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US20080004883A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Scalable audio coding
CN101652810B (zh) * 2006-09-29 2012-04-11 Lg电子株式会社 用于处理混合信号的装置及其方法
KR20090013178A (ko) 2006-09-29 2009-02-04 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
JP5232791B2 (ja) 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
US20080269929A1 (en) 2006-11-15 2008-10-30 Lg Electronics Inc. Method and an Apparatus for Decoding an Audio Signal
WO2008069596A1 (en) 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2102855A4 (en) 2006-12-07 2010-07-28 Lg Electronics Inc METHOD AND APPARATUS FOR DECODING AUDIO SIGNAL
EP2632164A3 (en) 2007-01-12 2014-02-26 ActiveVideo Networks, Inc. Interactive encoded content system including object models for viewing on a remote device
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
KR101453732B1 (ko) 2007-04-16 2014-10-24 삼성전자주식회사 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
US8521540B2 (en) * 2007-08-17 2013-08-27 Qualcomm Incorporated Encoding and/or decoding digital signals using a permutation value
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
EP2128856A4 (en) * 2007-10-16 2011-11-02 Panasonic Corp DEVICE FOR PRODUCING A STREAM AND DECODING DEVICE AND CORRESPONDING METHOD
JP5668923B2 (ja) * 2008-03-14 2015-02-12 日本電気株式会社 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
JP5773124B2 (ja) * 2008-04-21 2015-09-02 日本電気株式会社 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
PL2301017T3 (pl) * 2008-05-09 2017-05-31 Nokia Technologies Oy Urządzenie akustyczne
US8233629B2 (en) * 2008-09-04 2012-07-31 Dts, Inc. Interaural time delay restoration system and method
KR101108061B1 (ko) 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
US8258849B2 (en) * 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
US8346380B2 (en) 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
EP2214162A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
US7975063B2 (en) * 2009-05-10 2011-07-05 Vantrix Corporation Informative data streaming server
CN101556799B (zh) 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
US8194862B2 (en) * 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US9378754B1 (en) * 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
EP2628306B1 (en) 2010-10-14 2017-11-22 ActiveVideo Networks, Inc. Streaming digital video between video devices using a cable television system
EP2477418B1 (en) * 2011-01-12 2014-06-04 Nxp B.V. Signal processing method
US9204203B2 (en) 2011-04-07 2015-12-01 Activevideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
KR101930907B1 (ko) * 2011-05-30 2019-03-12 삼성전자주식회사 오디오 신호 처리 방법, 그에 따른 오디오 장치, 및 그에 따른 전자기기
US10409445B2 (en) 2012-01-09 2019-09-10 Activevideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
CN103534753B (zh) * 2012-04-05 2015-05-27 华为技术有限公司 用于信道间差估计的方法和空间音频编码装置
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
TWI505262B (zh) * 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
WO2014013294A1 (en) 2012-07-19 2014-01-23 Nokia Corporation Stereo audio signal encoder
US9460729B2 (en) * 2012-09-21 2016-10-04 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
WO2014145921A1 (en) 2013-03-15 2014-09-18 Activevideo Networks, Inc. A multiple-mode system and method for providing user selectable video content
US10199044B2 (en) * 2013-03-20 2019-02-05 Nokia Technologies Oy Audio signal encoder comprising a multi-channel parameter selector
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
EP3005712A1 (en) 2013-06-06 2016-04-13 ActiveVideo Networks, Inc. Overlay rendering of user interface onto source video
CN106104684A (zh) 2014-01-13 2016-11-09 诺基亚技术有限公司 多通道音频信号分类器
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
WO2016162283A1 (en) * 2015-04-07 2016-10-13 Dolby International Ab Audio coding with range extension
CN107358960B (zh) * 2016-05-10 2021-10-26 华为技术有限公司 多声道信号的编码方法和编码器
CN107358961B (zh) * 2016-05-10 2021-09-17 华为技术有限公司 多声道信号的编码方法和编码器
CN107731238B (zh) 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
US10063612B2 (en) * 2016-09-30 2018-08-28 Amazon Technologies, Inc. Request-based encoding for streaming content portions

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG49883A1 (en) * 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
IT1281001B1 (it) * 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
JPH09274500A (ja) * 1996-04-09 1997-10-21 Matsushita Electric Ind Co Ltd ディジタルオーディオ信号の符号化方法
DE69712230T2 (de) * 1997-05-08 2002-10-31 St Microelectronics Asia Verfahren und gerät zur frequenzdomäneabwärtsumsetzung mit zwangblockschaltung für audiodekoderfunktionen
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ATE338999T1 (de) * 2001-10-19 2006-09-15 Koninkl Philips Electronics Nv Differentielle kodierung im frequenz bereich von sinusmodell parametern
DE60208426T2 (de) * 2001-11-02 2006-08-24 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
DE60307252T2 (de) * 2002-04-11 2007-07-19 Matsushita Electric Industrial Co., Ltd., Kadoma Einrichtungen, verfahren und programme zur kodierung und dekodierung

Also Published As

Publication number Publication date
EP1500083A1 (en) 2005-01-26
KR20040102163A (ko) 2004-12-03
US8498422B2 (en) 2013-07-30
KR101021079B1 (ko) 2011-03-14
AU2003216686A1 (en) 2003-11-03
WO2003090207A1 (en) 2003-10-30
US20050226426A1 (en) 2005-10-13
ATE332003T1 (de) 2006-07-15
EP1500083B1 (en) 2006-06-28
JP2005523479A (ja) 2005-08-04
CN1647156A (zh) 2005-07-27
DE60306512T2 (de) 2007-06-21
CN1647156B (zh) 2010-05-26
JP4714415B2 (ja) 2011-06-29
DE60306512D1 (de) 2006-08-10
BRPI0304542B1 (pt) 2018-05-08
BR0304542A (pt) 2004-07-20

Similar Documents

Publication Publication Date Title
ES2268340T3 (es) Representacion de audio parametrico de multiples canales.
ES2300567T3 (es) Representacion parametrica de audio espacial.
ES2293556T3 (es) Codificacion basada en frecuencia de canales de audio en sistemas de codificacion multicanal parametrica.
ES2658824T3 (es) Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia
EP2140450B1 (en) A method and an apparatus for processing an audio signal
ES2770146T3 (es) Conformación temporal y espacial de señales de audio multicanal
ES2297825T3 (es) Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales.
RU2367033C2 (ru) Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией
ES2294300T3 (es) Codificacion de audio.
ES2292147T3 (es) Reconstruccion multicanal basada en multiparametrizacion.
JP4603037B2 (ja) マルチチャネルオーディオ信号を表示するための装置と方法
ES2682073T3 (es) Codificación conjunta paramétrica de fuentes de audio
ES2391801T3 (es) Procedimiento y aparato para procesar una señal de audio
KR20200091880A (ko) 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩 파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법
TWI404429B (zh) 用於將多頻道音訊信號編碼/解碼之方法與裝置
ES2547232T3 (es) Método y aparato para procesar una señal
JP2024012444A (ja) マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ
US20060147047A1 (en) Coding an audio signal
ES2709117T3 (es) Codificador y decodificador de audio
ES2654792T3 (es) Procedimiento y decodificador para codificación de objeto de audio espacial de multi-instancias que emplea un concepto paramétrico para casos de mezcla descendente/mezcla ascendente de multicanal
US8041041B1 (en) Method and system for providing stereo-channel based multi-channel audio coding
CN104541326A (zh) 一种设备和方法,用于处理音频信号
ES2836682T3 (es) Método y dispositivo para extraer parámetro de diferencia de fase entre canales
JP4809234B2 (ja) オーディオ符号化装置、復号化装置、方法、及びプログラム
US20110019829A1 (en) Stereo signal converter, stereo signal reverse converter, and methods for both