ES2454670T3 - Generación de una señal multicanal codificada y decodificación de una señal multicanal codificada - Google Patents

Generación de una señal multicanal codificada y decodificación de una señal multicanal codificada Download PDF

Info

Publication number
ES2454670T3
ES2454670T3 ES05782459.1T ES05782459T ES2454670T3 ES 2454670 T3 ES2454670 T3 ES 2454670T3 ES 05782459 T ES05782459 T ES 05782459T ES 2454670 T3 ES2454670 T3 ES 2454670T3
Authority
ES
Spain
Prior art keywords
parameters
information
data stream
reconstruction
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES05782459.1T
Other languages
English (en)
Inventor
Jürgen HERRE
Ralph Sperschneider
Johannes Hilpert
Karsten Linzmeier
Harald Popp
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2454670T3 publication Critical patent/ES2454670T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)
  • Error Detection And Correction (AREA)

Abstract

Dispositivo para la generación de una señal multicanal codificada que representa una señal multicanal no codificada que comprende N canales originales, donde N es igual a mayor que 2, con las siguientes características: un dispositivo para proporcionar (22) informaciones de parámetros (24a, 24b, 24c) para la reconstrucción de K canales de salida a partir de M canales de transmisión (23), donde M es igual o mayor que 1 y menor o igual que N, en donde K es mayor que M y menor o igual que N, en donde las informaciones de parámetros comprenden al menos un primer juego de parámetros y un segundo juego de parámetros variable para la reconstrucción de un único canal de salida, en donde el segundo juego de parámetros presenta informaciones de versión de sintaxis (103 a 105) asignadas; y un dispositivo para escribir (25) de una corriente de datos (26), en donde el dispositivo (25) está conformado para la escritura, para escribir el primer y el segundo juego de parámetros en la corriente de datos de tal forma que se pueda realizar una reconstrucción en un decodificador de al menos uno de los K canales de salida mediante la utilización del primer juego de parámetros, sin utilizar el segundo juego de parámetros y mediante la utilización de al menos uno de los M canales de transmisión (23), en donde el dispositivo para escribir (25) está conformado para escribir informaciones de longitud, que indican una cantidad de datos del segundo juego de parámetros asignado, en la corriente de datos.

Description

Generación de una señal multicanal codificada y decodificación de una señal multicanal codificada
[0001] La presente invención se refiere a las técnicas paramétricas de procesamiento de audio multicanal y, en particular, a una disposición eficiente de información paramétrica lateral, cuando existen varios juegos de parámetros diferentes disponibles para su reconstrucción.
[0002] Una representación recomendada circundante multicanal incluye, además de los dos canales estereofónicos, un canal central (o canal Center) C y dos canales circundantes, como son el canal circundante izquierdo Ls y el canal circundante derecho Rs, y, además de ello, eventualmente, un canal de altavoz de subgraves también denominado canal LFE (LFE = Low Frequency Enhacement (mejora de la baja frecuencia)). Este formato de referencia de sonido también se denomina estereofónico 3/2-(plus LFE) y recientemente también multicanal 5.1, lo que significa que existen tres canales frontales, dos canales circundantes y un canal LFE. En general, para esta representación circundante multicanal recomendada se requieren cinco o seis canales de transmisión. En un entorno de reproducción se requieren al menos cinco altavoces en las cinco posiciones respectivas diferentes para obtener un denominado punto óptimo a una distancia determinada de los cinco altavoces colocados de manera correcta. Sin embargo, el altavoz de subgraves puede utilizarse relativamente de una manera libre en lo que respecta a su ubicación.
[0003] Existen varias técnicas para reducir la cantidad de datos requerida para transmitir una señal de audio multi-canal. Tales técnicas que también se denominan técnicas estereofónicas conjuntas. Para este propósito, se hace referencia a la fig. 5. La fig. 5 muestra un dispositivo de estereofonía conjunta 60. Este dispositivo puede ser un dispositivo que implementa, por ejemplo, la técnica de intensidad estereofónica (técnica IS) o la codificación de punto de referencia binaural (BCC). Un dispositivo de este tipo recibe generalmente al menos dos canales (CH1,
CH2,… CHn) como señal de entrada y emite al menos un solo canal portador (combinación de canales) y datos
paramétricos, esto es, uno o varios juegos de parámetros. Los datos paramétricos se definen de tal manera que se puede calcular en un decodificador una aproximación de cada canal original (CH1, CH2,… CHn).
[0004] Normalmente, el canal portador incluirá muestras de subbanda, coeficientes espectrales o muestras de intervalo de tiempo, etc., que proporcionan una representación comparativamente detallada de la señal subyacente, mientras que los datos parámetricos o juegos de parámetros no incluyen ninguna de tales muestras o coeficientes espectrales. En su lugar, los datos paramétricos comprenden parámetros de control para controlar un algoritmo de reconstrucción determinado, como, por ejemplo, ponderación por multiplicación, desplazamiento en el
tiempo, desplazamiento de frecuencia,…. Los datos paramétricos comprenden por ello únicamente una
representación comparativamente basta de la señal o del canal asociado. La cantidad de datos requerida por una canal portador, expresada en números, se encuentra comprendida en el rango de entre 60 y 70 kbit/s, mientras que la cantidad de datos requerida por la información lateral paramétrica se encontrará en el orden de magnitud de 1,5 kbit/s para un canal. Un ejemplo de datos paramétricos son los factores de escala conocidos, información de intensidad estereofónica o los parámetros de punto de referencia binaural, tal y como describirá más adelante.
[0005] La técnica de codificación de intensidad estereofónica está descrita en la prepublicación AES 3799
titulada “Intensity stereo coding” J. Herre, K. H. Brandenburg, D. Lederer, febrero de 1994, Ámsterdam. En general,
el concepto de intensidad estereofónica se basa en una transformación de eje principal que se debe aplicar a los datos de los dos canales de audio estereofónicos. Si la mayoría de los puntos de datos están situados alrededor del primer eje principal, se puede lograr una ganancia de codificación al girar ambas señales en un ángulo determinado antes de la codificación. Sin embargo, esto no siempre es válido para técnicas reales de reproducción estereofónica. Las señales reconstruidas para los canales izquierdo y derecho están compuestas por versiones ponderadas o escaladas de manera diferente de la misma señal transmitida. Si bien las señales reconstruidas se diferencian en su amplitud, en cambio son idénticas con respecto a sus informaciones de fase. Las curvas envolventes energía-tiempo de ambos canales de audio originales se conservan, sin embargo, por medio de la operación de escalado selectivo que trabaja típicamente de una manera selectiva en frecuencia. Esto se corresponde con la percepción humana del sonido a frecuencias altas, en donde los puntos de referencia o las indicaciones espaciales dominantes están determinadas por las curvas envolventes de energía.
[0006] Además, en implementaciones prácticas la señal transmitida, es decir, el canal portador, se forma a partir de la suma de la señal del canal izquierdo y del canal derecho, en lugar de girar ambos componentes. Además, este procesamiento, es decir, la generación de los parámetros de intensidad estereofónica para la realización de la operación de escalado, se realiza de una manera selectiva en frecuencia, es decir, independientemente una de otra para cada banda de factor de escalado, es decir, para cada partición de frecuencia
de codificador. Preferentemente, se combinan ambos canales para formar un canal combinado o “portador”. Además
del canal combinado, se determina la información de intensidad estereofónica que depende de la energía del primer canal, de la energía del segundo canal y de la energía del canal combinado o de suma.
[0007] La técnica BCC está descrita en el documento de convención AES 5574 titulado “Binaural cue coding
applied to stereo and multi-channel audio compression”, C. Faller, F. Baumgarte, mayo de 2002, Munich. En la codificación BCC, se convierte un número de canales de entrada de audio a una representación espectral utilizando una transformación basada en DFT con ventanas solapadas. El espectro resultante se divide en particiones no solapadas. Cada partición tiene un ancho de banda proporcional a un ancho de banda rectangular equivalente (ERB). Para cada partición se calculan las denominadas diferencias de nivel inter-canal (ICLD = Inter-Channel Level Differences (diferencias de nivel inter-canal)) así como las denominadas diferencias de tiempo inter-canal (ICTD; ICTD = Interchannel Time Differences (diferencias de tiempo inter-canal)), es decir para cada banda y para cada trama k, por lo tanto, un bloque de una secuencia de valores de tiempo. Los parámetros ICLD e ICDT se cuantifican y codifican para obtener una corriente de bits BCC. Las diferencias de nivel inter-canal y las diferencias de tiempo inter-canal se dan para cada canal con respecto a un canal de referencia. En particular, los parámetros se calculan de acuerdo con fórmulas predeterminadas que dependen de las divisiones determinadas de la señal a procesar.
[0008] En el lado decodificador, el decodificador recibe una señal monofónica y la corriente de bits BCC, esto es, un primer juego de parámetros para las diferencias de tiempo inter-canal y un segundo juego de parámetros para las diferencias de nivel inter-canal. La señal monofónica se transforma en el dominio de frecuencia y se introduce en un bloque de síntesis que recibe también valores ICLD e ICTD decodificados. En el bloque de síntesis o bloque de reconstrucción se utilizan los parámetros BCC (ICLD e ICTD) para realizar una operación de ponderación de la señal monofónica para reconstruir la señal multicanal, que posteriormente, después de una conversión frecuencia/tiempo, representa una reconstrucción de la señal de audio multicanal original.
En el caso de BCC, el módulo estereofónico conjunto 60 actúa para emitir las informaciones laterales del canal de tal forma que los datos paramétricos del canal están cuantificados y los parámetros ICLD e ICTD están codificados, en donde uno de los canales originales puede utilizarse como canal de referencia para la codificación de la información lateral del canal. Normalmente, el canal portador se forma a partir de la suma de los canales originales participantes. Por supuesto, la técnica anterior sólo proporciona una representación monofónica para un decodificador que solamente es capaz de decodificar el canal portador, pero que sin embargo no está en disposición de generar los datos parámetricos para la generación de una o más aproximaciones de más de un canal de entrada.
[0010] La técnica de codificación de audio referida como técnica BCC se describe adicionalmente en las solicitudes de patente estadounidense US2003/0219130A1, 2003/0026441A1 y 2003/0035553A1. Además, se remite adicionalmente a “Binaural Cue Coding. Part II: Schemes and Applications”, C. Faller y F. Baumgarte, IEEE: Transactions on Audio and Speech Proc, volumen 11, número 6, noviembre de 1993. También se remite a C. Faller y F. Baumgarte “Binaural Cue Codding applied to Stereo and Multi-Channel Audio compression”, prepublicación, 112ª convención de la Sociedad de Ingeniería de Audio (AES), mayo de 2002, y a J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, C. Spenger “MP3 Surround: Efficient and Compatible Coding of Multi-Channel-Audio”, 116ª convención de AES, Berlín, 2004, prepublicación 6049. A continuación se representará un esquema BCC general típico para la codificación de audio multicanal en más detalle con respecto a las fig. 6 a 8. La fig. 6 muestra un esquema general de la codificación BCC para codificación/transmisión de señales de audio multicanal. La señal de
entrada de audio multicanal se introduce en una entrada 110 de una codificador BCC 112 y se “combinan los canales” en un denominado bloque de combinación de canales 114, es decir, se convierten en un solo canal de
suma. En el presente ejemplo, la señal en la entrada 110 es una señal circundante de cinco canales que tiene un canal frontal izquierdo y un canal frontal derecho, un canal circundante izquierdo y un canal circundante derecho y un canal central. Típicamente, el bloque de combinación de canales genera una señal de suma por medio de la simple adición de estos cinco canales en una señal monofónica. Otros esquemas de combinación de canales se conocen en la técnica, dando lugar todos ellos a la generación de una señal de combinación de canales que tiene un único canal o que tiene un número de canales de combinación de canales, utilizando una señal de entrada multicanal, que, en cualquier caso, es menor que el número de canales de entrada originales. En el presente ejemplo, una operación de combinación de canales ya se habría logrado si se hubieran generado cuatro canales portadores a partir de los cinco canales de entrada. El único canal de salida o el número de canales de salida se emiten en una línea de señal de suma 115.
[0011] Las informaciones laterales obtenidas mediante un bloque de análisis BCC 116 se emiten en una línea de información lateral 117. En el bloque de análisis BCC, pueden calcularse los juegos de parámetros para ICLD, ICTD o valores de correlación inter-canal (valores ICC; ICC = Interchannel correlation (correlación inter-canal)). De este modo existen hasta tres juegos de parámetros diferentes (ICLD, ICTD e ICC) para la reconstrucción en el bloque de síntesis BCC 122.
[0012] La señal de suma así como la información lateral con los juegos de parámetros se transmiten típicamente a un decodificador BCC 120 en un formato cuantificado y codificado. El decodificador BCC separa la señal de suma transmitida en un número de subbandas y realiza escalados, retardos y procesamiento adicional para generar las subbandas de los diferentes canales a reconstruir. Este procesamiento se realiza de tal forma que los parámetros ICLD, ICTD e ICC (puntos de referencia) de una señal multicanal reconstruida en la salida 121 sean similares a los puntos de referencia respectivos para la señal multicanal original en la entrada 110 hacia el codificador BCC 112. Para este propósito, el decodificador BCC 120 incluye un bloque de síntesis BCC 122 y un bloque de procesamiento de información lateral 123.
[0013] A continuación se representa la estructura interna del bloque de síntesis BCC 122 con referencia a la fig. 7. La señal de suma en la línea 115 se introduce en un bloque de conversión tiempo/frecuencia que típicamente está realizado como banco de filtro FB 125. A la salida del bloque 125 existe un número N de señales de subbanda o, en un caso extremo, un bloque de coeficientes espectrales, si el banco del filtro de audio 125 realiza una transformación que genera N coeficientes espectrales a partir de N muestras de dominio de tiempo.
[0014] El bloque de síntesis BCC 122 incluye además, una etapa de retardo 126, una etapa de modificación de nivel 127, una etapa de procesamiento de correlación 128 y una etapa IFB 129 que representa un banco de filtro inverso. A la salida de la etapa 129, la señal de audio multicanal reconstruida que tiene, por ejemplo, cinco canales en el caso de un sistema circundante de cinco canales puede emitirse en un conjunto de altavoces 124, tal y como está representado en la fig. 6.
[0015] En la fig. 7 se representa además que la señal de entrada s(n) se convierte en el dominio de frecuencia o dominio de banco de filtro por medio del elemento 125. La señal emitida a través del elemento 125 se multiplica de manera que se obtienen varias versiones de la misma señal, tal y como se indica mediante el nodo
130. El número de versiones de la señal original es igual al número de canales de salida en la señal de salida a reconstruir. Si cada versión de la señal original se somete a un determinado retardo d1, d2 … di, dN en el nodo 130, se obtiene la situación a la salida de los bloques 126, que incluye las versiones de la misma señal, pero con diferentes retardos. Los parámetros de retardo se calculan en la fig. 6 mediante el bloque de procesamiento de información lateral 123 y se derivan a partir de las diferencias de tiempo inter-canal, tal y como se determinaron a través del bloque de análisis BCC 116.
[0016] Lo mismo aplica a los parámetros de multiplicación a1, a2 … ai, aN, que también se calculan mediante el bloque de procesamiento de información lateral 123 en base a las diferencias de nivel inter-canal determinadas a través del bloque de análisis BCC 116.
[0017] Los parámetros ICC se calculan mediante el bloque de análisis BCC 116 y se utilizan para controlar la funcionalidad del bloque 128, de manera que los valores de correlación determinados entre las señales retardadas y manipuladas en su nivel se obtienen a la salida del bloque 128. Se debe de indicar que el orden de las etapas 126, 127, 128 puede ser diferente al representado en la figura 7.
[0018] También se debe de indicar además que, en un procesamiento en bloques de la señal de audio, el análisis BCC se realiza también en bloques. Además, el análisis BCC se realiza también por frecuencia, esto es, de una manera selectiva en frecuencia. Esto significa que, para cada banda espectral, existe un parámetro ICLD un parámetro ICTD y un parámetro ICC. Los parámetros ICTD para al menos un canal a través de todas las bandas representa así el juego de parámetros ICTD. Lo mismo aplica al juego de parámetros ICLD que representa todos los parámetros ICLD para todas las bandas de frecuencia para la reconstrucción de al menos un canal de entrada. Lo mismo aplica, a su vez, al juego de parámetros ICC que incluye de nuevo varios parámetros ICC individuales para diferentes bandas para la reconstrucción de al menos un canal de salida sobre la base del canal de entrada o del canal de suma.
[0019] A continuación se hace referencia a la fig. 8 que muestra una situación de la que puede observarse la determinación de los parámetros BCC. Normalmente, los parámetros ICLD, ICTD e ICC pueden definirse entre pares de canales. Sin embargo, típicamente, se realiza una determinación de los parámetros ICLD e ICTD entre un canal de referencia y cada otro canal de entrada, de manera que existe un juego de parámetros distinto para cada uno de los canales de entrada. Esto está también representado en la fig. 8B.
[0020] Sin embargo, los parámetros ICC pueden definirse de manera diferente. En general, los parámetros ICC pueden generarse en el codificador entre todos los pares de canales posibles, tal y como se representa esquemáticamente también en la fig. 8B. En este caso, un decodificador realizaría una síntesis ICC de manera que se obtendría aproximadamente el mismo resultado como se presentó en la señal original entre todos los pares de canales posibles. Sin embargo se propuso calcular únicamente los parámetros ICC entre los dos canales más fuertes en cualquier instante de tiempo, esto es, para cada trama de tiempo. Este esquema está representado en la fig. 8C, donde se muestra una ejemplo en el cual, en un instante de tiempo, se calcula y se transmite un parámetro ICC entre los canales 1 y 2, y en los cuales, en otro instante de tiempo diferente, se calcula un parámetro ICC entre los canales 1 y 5. El decodificador sintetiza entonces la correlación inter-canal entre los dos canales más fuertes en el decodificador y ejecuta reglas heurísticas típicamente adicionales para sintetizar la coherencia inter-canal para los pares de canal restantes.
[0021] Con referencia al cálculo de, por ejemplo, los parámetros de multiplicación a1, … aN en base a los parámetros ICLD transmitidos, se hace referencia al citado documento de la convención AES 5574. Los parámetros ICLD representan una distribución de energía en una señal multicanal original. Sin pérdida de la generalidad, la fig. 8A muestra que existen cuatro parámetros ICLD que representan la diferencia de energía entre todos los otros canales y el canal frontal izquierdo. En el bloque de procesamiento de informaciones laterales 123, los parámetros de multiplicación a1, … aN se derivan de los parámetros ICLD de manera que la energía total de todos los canales de salida reconstruidos es la misma energía que se presenta para la señal de suma transmitida o es al menos proporcional a esta energía. Una manera para determinar estos parámetros consiste en un proceso de dos etapas en el cual, en una primera etapa, el factor de multiplicación para el canal frontal izquierdo se establece a 1, mientras que los factores de multiplicación para los otros canales en la fig. 8C se establecen a los valores ICLD transmitidos. Entonces, en una segunda etapa, se calcula la energía de todos los cinco canales y se compara con la energía de la señal de suma transmitida. Después, todos los canales se escalan hacia abajo, y concretamente mediante el uso de un factor de escalado que es igual para todos los canales, en donde el factor de escalado se selecciona de manera que el total de la energía de todos los canales de salida reconstruidos después del escalado es igual al total de la energía de la señal de suma transmitida o de las señales de suma transmitidas.
[0022] Con respecto a la medida de coherencia inter-canal ICC transmitida por el codificador BCC al decodificador BCC como otro juego de parámetros adicional, se debe de indicar que se podría realizar una manipulación de coherencia mediante la modificación de los factores de multiplicación, como, por ejemplo, mediante multiplicación de los factores de ponderación de todas las subbandas por números aleatorios que tienen valores comprendidos entre 20 log10-6 y 20 log106. La secuencia pseudoaleatoria se selecciona típicamente de manera que la varianza para todas las bandas críticas sea aproximadamente igual y que el valor medio dentro de cada banda critica sea cero. La misma secuencia se utiliza para los coeficientes espectrales de cada trama o bloque diferente. De este modo se controla la amplitud de la escena de audio mediante modificaciones de las varianzas de la secuencia pseudoaleatoria. Una varianza mayor genera una mayor amplitud auditiva. La modificación de la varianza puede realizarse en bandas individuales que tienen una amplitud de una banda crítica. Esto permite la existencia simultánea de varios objetos en una escena auditiva, en donde cada objeto tiene una amplitud auditiva diferente. Una distribución de amplitud adecuada para la secuencia pseudoaleatoria es una distribución uniforme en una escala logarítmica, tal y como está representado en la publicación de la patente estadounidense 2002/0219130A1.
[0023] A fin de transmitir los cinco canales de una manera compatible, por ejemplo en un formato de corriente de bits que es adecuado también para un decodificador normal estereofónico, puede utilizarse la denominada técnica de matriz descrita en “MUSICAM Surround: A universal multi-channel coding system compatible with ISO/IEC 11172-3”, G. Theile y G. Stoll, prepublicación AES, octubre de 1992, San Francisco.
[0024] Además, también se remite a otras técnicas de codificación multicanal descritas en la publicación “Improved MPEG 2 Audio multi-channel encoding”, B. Grill, J. Herre, K. H. Brandenburg, I. Eberlein, J. Koller, J.Miller, prepublicación AES 3865, febrero de 1994, Ámsterdam, en donde se utiliza una matriz de compatibilidad para obtener los canales de combinación de canales a partir de los canales de entrada originales.
[0025] En resumen, se puede decir por lo tanto que la técnica BCC permite una codificación eficiente y también compatible hacia atrás de material de audio multicanal, tal y como se describe también, por ejemplo, en la publicación especializada de E. Schuijer, J. Breebaart, H. Purnhagen, J. Engdegärd titulada “Low-Complexity Parametric Stereo Coding”, 119ª convención de AES, Berlin, 2004, prepublicación 6073. En este contexto, debe hacerse mención también al estándar MPEG-4 y particularmente a la ampliación a técnicas de audio paramétrico, en donde esta parte estándar se conoce también por la identificación ISO/IEC 14496-3: 2001/FDAM 2 (Audio Paramétrico). A este respecto, debe mencionarse, en particular, la sintaxis en la tabla 8.9 del estándar MPEG-4 titulada “sintaxis de ps-data()”. En este ejemplo, deben mencionarse los elementos de sintaxis “enable-icc” (habilitar icc) y “enable_ipdopd” (habilitar ipdopd), en donde estos elementos de sintaxis se utilizan para encender y apagar una transmisión de un parámetro ICC y de una fase que corresponde a las diferencias de tiempo inter-canal. Deben
mencionarse además los elementos de sintaxis “icc_data()” “ipd_data()” y “opd_data()”.
[0026] En resumen, debe indicarse que, de forma general, este tipo de técnicas multicanal paramétricas se utilizan empleando uno o varios canales portadores transmitidos, en donde los M canales transmitidos se forman a partir de N canales originales para reconstruir de nuevo los N canales de salida o un número K de canales de salida, en donde K es menor o igual que el número de canales originales N.
[0027] Lo que es problemático en todas las técnicas descritas hasta ahora es la cuestión de cómo se puede lograr la compatibilidad de formato entre diferentes tipos de decodificadores para la decodificación multicanal, por ejemplo, para decodificadores BCC así como para diferentes versiones de la información lateral paramétrica. En particular, surgen dos problemas cuando existen diferentes decodificadores multicanal en el mercado, cuando al mismo tiempo se encuentran disponibles en el mercado informaciones laterales al mismo tiempo con diferentes juegos de parámetros que han sido generados por diferentes decodificadores multicanal, y por lo tanto para el usuario que sólo dispone de un único decodificador.
[0028] En primer lugar sería deseable tener decodificadores con alta capacidad de cálculo que proporcionan la mejor calidad de sonido multicanal posible en la decodificación. Al mismo tiempo, sin embargo, existirán también decodificadores que funcionan bajo condiciones de recursos limitados, tales como decodificadores en dispositivos móviles, tales como teléfonos móviles. Por supuesto, tales decodificadores deben proporcionar una salida multicanal todavía con la mejor calidad posible, pero que al mismo tiempo disponen sólo de una capacidad de cálculo limitada. Esto conduce a la pregunta de si puede haber formatos de corriente de bits con juegos de parámetros para la reconstrucción espacial que soporten este tipo de escalabilidad, que hagan posible tanto una decodificación con alta complejidad y con ello una calidad óptima como una decodificación con complejidad reducida, pero también con calidad reducida de manera correspondiente.
[0029] Otro aspecto a considerar cuando se introducen nuevas generaciones/versiones de codificadores BCC y de esta manera de corrientes de bits BCC es la pregunta de cómo puede mantenerse la compatibilidad entre las diferentes versiones de corrientes de bits BCC y decodificadores BCC. En otras palabras, es muy deseable que nuevos juegos de parámetros BCC y también juegos de parámetros antiguos actualizados sean compatibles hacia atrás. De esta manera, es por supuesto deseable proporcionar un recorrido de actualización para los usuarios BCC que haga posible introducir nuevos esquemas multicanal mejorados cuando se encuentren disponibles debido al progreso técnico. Por otra parte, nuevos formatos de corrientes de bits BCC dan lugar habitualmente a incompatibilidades entre estas corrientes de bits y diferentes versiones (más antiguas) de decodificador BCC.
[0030] En particular, se debe de indicar que los codificadores/decodificadores multicanal se deben utilizar en un número continuamente creciente de campos de aplicación en los cuales no se encuentran disponibles necesariamente las máximas capacidades de cálculo, pero que no necesariamente requieren siempre la calidad total de sonido.
[0031] La publicación especializada “MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio”, Jürgen Here, y otros, publicación de convención AES, 116ª convención AES, del 8 al 11 de mayo de 2004, Berlín, Alemania, publica una estructura general de un codificador MP3 circundante con un bloque de combinación de canales, un codificador BCC y un codificador estándar MP3, que codifica una señal estereofónica de combinación de
canales y datos de mejora circundante escritos como “datos auxiliares” en la corriente de bits de MP3 circundante.
Los datos de mejora circundante comprenden un juego de parámetros espaciales (ICLD, ICTD, ICC). En el lado del decodificador se leen los datos de mejora circundante del campo de datos auxiliares y se transmiten a un codificador BCC conectado a continuación del decodificador estándar MP3.
[0032] La publicación especializada “Advances en Parametric Coding for High-Quality Audio”, E. Schuijers et al., IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002), 15 de noviembre de 2002, páginas 73-79 publica un concepto que, en contraposición a estándares tradicionales de codificación en forma de onda que aplican una codificación de subbanda o una codificación de transformación, permite mediante una codificación paramétrica una nueva reducción de los regímenes de bits. En una sintaxis de corriente de bits escalable, los parámetros estereofónicos están distribuidos en una capa de base estereofónica y en una capa de ampliación estereofónica de una forma escalable. La capa de base estereofónica contiene valores que se refieren a todo el intervalo de frecuencia, esto es, a un único parámetro IID, a un único parámetro ITD y a un único parámetro ICC, en donde cada parámetro cubre todo el intervalo de frecuencia. La capa de ampliación estereofónica incluye valores de parámetros para bandas de todo el intervalo de frecuencias, esto es, un juego de parámetros IID, un juego de parámetros ITD y un juego de parámetros ICC que cubren conjuntamente todo el intervalo de frecuencias correspondiente.
[0033] El objetivo de la presente invención es el de proporcionar un concepto que sea eficiente y flexible, que por tanto permita, por ejemplo, la integración de nuevos juegos de parámetros o la actualización de juegos de parámetros antiguos y que, al mismo tiempo, se puedan utilizar de forma flexible en una pluralidad de diferentes aplicaciones.
[0034] Este objetivo se resuelve mediante un dispositivo para la generación de una señal multicanal codificada de acuerdo con la reivindicación 1, un dispositivo para la decodificación de una señal multicanal codificada de acuerdo con la reivindicación 2, un procedimiento para la decodificación de una señal multicanal de acuerdo con la reivindicación 15, un procedimiento para la decodificación de una señal multicanal de acuerdo con la reivindicación 16, o un programa de ordenador de acuerdo con la reivindicación 17.
[0035] La presente invención se basa en el descubrimiento de que una decodificación eficiente y compatible hacia atrás de señales multicanal codificadas se logra cuando la señal multicanal codificada se escribe como corriente de datos que, además del al menos un canal de transmisión o canal portador, incluye al menos dos juegos de parámetros diferentes, en donde los dos juegos de parámetros están escritos en la corriente de datos de manera que pueda realizarse una reconstrucción de los canales de salida con menos que los al menos dos juegos de parámetros. De acuerdo con la invención, la corriente de datos se escribe de manera que un decodificador pueda identificar cuál de los juegos de parámetros se requiere para la reconstrucción y cuál de los juegos de parámetros es opcionalmente necesario para la reconstrucción. En este caso, un decodificador puede utilizar únicamente el juego de parámetros que es indispensable (es decir, obligatorio) para la reconstrucción e ignorar simplemente los juegos de parámetros opcionales, siempre y cuando se den unas circunstancias externas determinadas. Esto da lugar a que el decodificador sea rápido y sea suficiente con una capacidad limitada de cómputo cuando utiliza únicamente el juego de parámetros imprescindiblemente necesario para la reconstrucción, mientras que, al mismo tiempo, otro decodificador puede realizar una reconstrucción multicanal de alta calidad en base a la misma corriente de datos que representa la señal multicanal codificada, que, sin embargo, requiere también más tiempo o más capacidad de cómputo o, dicho de una forma más general, más recursos del decodificador.
[0036] En ejemplo preferido de realización de la presente invención, el juego de parámetros imprescindiblemente necesario es el que incluye las diferencias de nivel inter-canal. Tal y como se ha descubierto de acuerdo con la invención, estas diferencias de nivel inter-canal son extremadamente importantes para definir la distribución de sonido multicanal básica entre los canales de salida para todos los tipos de situaciones de reproducción. Las diferencias de tiempo inter-canal pueden clasificarse como juegos de parámetros opcionales, debido a que son principalmente relevantes cuando debe existir una representación ya sea a través de auriculares, esto es, dos canales de salida a partir de un canal transmitido, o cuando ocurre una representación de audio
multicanal en una denominada situación acústica relativamente “seca”, es decir, una situación acústica que incluye
pocos ecos. Las diferencias de tiempo inter-canal pueden por lo tanto clasificarse como juego de parámetros opcional.
[0037] Los valores de correlación inter-canal son importantes para proporcionar la anchura de fuentes de sonido y para generar adicionalmente la impresión para un oyente de que se encuentra situado en un escenario con fuentes de sonido complejas, como, por ejemplo, una orquesta de música clásica, que incluye muchos componentes de sonidos no correlados. El juego de parámetros ICC puede así clasificarse también como un juego de parámetros opcional, debido a que tiene evidentemente una influencia significativa en la calidad, pero, en la reconstrucción frecuentemente da lugar a un esfuerzo de computación relativamente grande que, por ejemplo, no es tan significativo en el juego de parámetros obligatorio de las diferencias nivel inter-canal, debido a que aquí sólo es necesaria una operación de ponderación, esto es, una multiplicación que puede ejecutarse eficientemente con respecto al cómputo.
[0038] Con respecto al problema de la compatibilidad hacia atrás de señales multicanal codificadas con juegos de parámetros en las corrientes de datos, el juego de parámetros que tiene, por ejemplo, un número de versión superior, se escribe en la corriente de datos de tal manera que pueda hacerse una reconstrucción mediante un decodificador sin este juego de parámetros, lo que conduce a que un decodificador utilizará únicamente el primer juego de parámetros para la reconstrucción cuando éste determine que no puede procesar este segundo juego de parámetros, y simplemente omitirá el segundo juego de parámetros.
[0039] En el lado del decodificador, esto significa que el decodificador tiene que registrar un juego de parámetros y procesarlo en su totalidad cuando haya identificado este juego de parámetros como juego de parámetros imprescindiblemente necesario, que, sin embargo, el decodificador simplemente omitirá los bits en la corriente de bits que pertenecen a un juego de parámetros cuando encuentre un juego de parámetros que no es obligatorio para la reconstrucción, es decir, que está marcado como opcional. El decodificador no necesita por lo tanto disponer de ningún conocimiento acerca de la sintaxis del segundo juego de parámetros para ser capaz de tratar con la señal multicanal codificada, sino que puede simplemente omitirla y continuar simplemente con las zonas adyacentes de la señal multicanal codificada que bajo determinadas circunstancias aún pueden ser necesarias para la reconstrucción.
[0040] Por ello, preferentemente, la información de longitud se inserta de esta manera en la corriente de datos para los juegos de parámetros marcados como opcionales, que permiten al decodificador omitir simplemente de una manera rápida y eficiente los bits pertenecientes a este juego de parámetros y tomar únicamente los juegos de parámetros marcados como obligatorios para la decodificación. Con respecto a la compatibilidad hacia atrás, se prefiere además que un número de versión se asocie con al menos cada juego de parámetros opcional, que indique con qué versión de codificador se generó este juego de parámetros. De esta manera, por ejemplo, el juego de parámetros para las diferencias de nivel inter-canal de la versión menor estaría marcado como obligatorio en una corriente de datos, mientas que un juego de parámetros para las diferencias de nivel inter-canal de una versión de codificador posterior obtiene otro número de versión, de manera que un decodificador utilizará simplemente el juego de parámetros correspondiente con el número de versión menor para la reconstrucción cuando determina que no puede procesar el juego de parámetros que tiene el número de versión mayor.
[0041] Finalmente, se debe de indicar que la corriente de datos que representa la señal multicanal no necesariamente debe contener también los canales de transmisión. Más bien éstos se pueden haber generado y transmitido por separado, como por ejemplo en el caso en el que los parámetros BCC se escriben posteriormente en un CD en un canal correspondiente, en donde el CD ya contiene los M (= mayor o igual que 1) canales de transmisión.
[0042] A continuación se describen de forma detallada ejemplos preferidos de realización de la presente invención con referencia a los dibujos adjuntos. Muestran:
la fig. 1a una vista general de una señal multicanal codificada que tiene una sintaxis de corriente de datos determinada de acuerdo con un ejemplo de realización de la presente invención;
la fig. 1b una representación detallada del bloque de control de la fig. 1a de acuerdo con un ejemplo de realización de la presente invención;
la fig. 2a un diagrama de bloques de un codificador de acuerdo con un ejemplo de realización de la presente invención;
la fig. 2b un diagrama de bloques de un decodificador de acuerdo con un ejemplo de realización de la presente invención;
las fig. 3a a 3d una forma preferida de realización para la configuración del juego de parámetros de acuerdo con la presente invención;
las fig. 4a a 4c una forma preferida de realización de los datos del juego de parámetros de acuerdo con la presente invención;
la fig. 5 una representación general de un codificador multicanal;
la fig. 6 un diagrama de bloques esquemático de un recorrido de codificador BCC/decodificador BCC;
la fig. 7 un diagrama de bloques del bloque de síntesis BCC de la fig. 6; y
las fig. 8A a 8C una representación de escenarios típicos para el cálculo de los juegos de parámetros ICLD, ICTD e ICC.
[0043] La fig. 2a muestra una forma preferida de realización de un dispositivo para la generación de una señal multicanal codificada que representa una señal multicanal no codificada que presenta N canales originales que se alimentan a una entrada 20 de un dispositivo 22 para proporcionar tanto M canales de transmisión como informaciones de parámetros con al menos dos juegos de parámetros. En particular, el número M de canales de transmisión que se emiten en una salida 23 del dispositivo 22 es menor que el número N de canales de audio originales. Los juegos de parámetros individuales que representan juntos las informaciones de parámetros para reconstruir los K canales de salida se encuentran en las salidas 24a, 24b, 24c del dispositivo de provisión 22. Los M canales de transmisión, en donde M es igual o mayor que 1 y menor que N, se suministran a un dispositivo para escribir 25 una corriente de datos a la salida, que se encuentra en la salida 26, al igual que los juegos de parámetros en las salidas 24a, 24b, 24c.
[0044] Tal y como se indicó anteriormente, las informaciones de combinación de canales (M canales de transmisión) se pueden transmitir/almacenar también de manera separada de las informaciones de parámetros.
[0045] El dispositivo para escribir 25 la corriente de datos que representa la señal multicanal codificada está conformado para escribir los M canales de transmisión en la corriente de datos y además para escribir el primer, el segundo y el tercer juego de parámetros en la corriente de datos de tal manera que pueda hacerse una reconstrucción de los K canales de salida sin utilizar uno de los tres juegos de parámetros, y preferentemente incluso sin utilizar al menos dos de los tres juegos de parámetros. A este respecto, los juegos de parámetros están marcados en las salidas 24a a 24c del dispositivo de provisión 22 de tal manera que un juego de parámetros, como, por ejemplo, el primer juego de parámetros, es absolutamente necesario para la reconstrucción, mientras que los dos juegos de parámetros adicionales, como son el segundo juego de parámetros y el tercer juego de parámetros están definidos de tal manera que sólo se requieren de manera opcional para la reconstrucción.
[0046] El dispositivo para escribir 25 escribirá entonces el primer juego de parámetros como el juego de parámetros imprescindiblemente necesario en la corriente de datos, y escribirá en la corriente de datos el segundo juego de parámetros y el tercer juego de parámetros únicamente como juegos de parámetros opcionales, tal y como se explicará a continuación.
[0047] La corriente de datos a la salida 26 de la fig. 2a se alimenta en una entrada de corriente de datos 27 de un decodificador multicanal representado en la fig. 2b. Los datos de la corriente de datos se suministran al dispositivo para leer 28 la corriente de datos, en donde el dispositivo para leer 28 la corriente de datos, al igual que el codificador mostrado en la fig. 2a, de nuevo comprende una salida lógica 29 para los M canales de transmisión extraídos de la corriente de datos así como otras salidas lógicas adicionales 30a, 30b para los juegos de parámetros contenidos en la corriente de datos. En un ejemplo preferido de realización de la presente invención, en el que el primer juego de parámetros se marca como imprescindiblemente necesario para la reconstrucción, el dispositivo para leer 28 proporcionará este primer juego de parámetros a través de la salida lógica 30a de un dispositivo para reconstruir 31. Cuando el dispositivo para leer 28 se encuentra, por ejemplo, establecido de manera fija para leer únicamente los juegos de parámetros obligatorios y suministrarlos al dispositivo para reconstruir 31, el dispositivo 28 simplemente omitirá el segundo juego de parámetros en la corriente de datos a la entrada 27, que está simbólicamente representado mediante la salida lógica interrumpida 30b en la fig. 2b.
[0048] El control de si se extraen únicamente juegos de parámetros imprescindiblemente necesarios o adicionalmente también juegos de parámetros opcionales de la corriente de datos y se suministran a un dispositivo 31, también se puede suministrar al dispositivo 28 a través de una entrada de control 32, en donde a través de la entrada de control 32 se reciben informaciones disponibilidad de recursos o informaciones de control derivadas de las mismas.
[0049] La información de disponibilidad de recursos puede, por ejemplo, consistir en que un decodificador alimentado por batería establece que existe aún suficiente energía de batería disponible de manera que al dispositivo para leer 28 la corriente de datos se le indica que extraiga no únicamente los juegos de parámetros obligatorios, sino también los juegos de parámetros opcionales y suministrarlos al dispositivo 31 para la reconstrucción a través de las salidas lógicas correspondientes, para que éste proporcione de nuevo K canales de salida en una salida 33, en donde K es igual o menor que el número N original de canales de entrada originales en la entrada 20 de la fig. 2a. Se debe de indicar que preferentemente el número K es igual al número N, debido a que un decodificador posiblemente deseará generar todos los canales de salida codificados en la corriente de datos.
[0050] El dispositivo de lectura de corriente de datos 28 para leer la corriente de datos también es por lo tanto eficaz para registrar por lectura al menos el primer juego de parámetros y ser capaz de omitir al menos un juego de parámetros, como por ejemplo el segundo juego de parámetros, cuando se haga uso de la escalabilidad en la corriente de datos, es decir, cuando un juego de parámetros en la corriente de datos no se utiliza para la reconstrucción. El dispositivo de reconstrucción 31 es entonces eficaz para reconstruir los K canales de salida utilizando los M canales de transmisión y el primer juego de parámetros, pero sin utilizar el segundo juego de parámetros.
[0051] En un ejemplo de realización de la presente invención, el dispositivo de provisión 22 es un codificador BCC que recibe los N canales originales y suministra en el lado de salida los M canales de transmisión y los juegos de parámetros individuales. Alternativamente, el dispositivo de provisión 22, puede ser también, un denominado transcodificador de corriente de datos que, en el lado de entrada, recibe la información ya escrita en un formato no escalable (únicamente juegos de parámetros o juegos de parámetros junto con canales de transmisión), tal y como se generan mediante los elementos 114 y 116 de la fig. 7, por ejemplo, y que indican al dispositivo para escribir 25 de manera correspondiente que vuelve a escribir la corriente de bits para de este modo escribir los juegos de parámetros en la corriente de datos en una forma escalable. Esto significa que, a fin de ser capaz de entender la corriente de datos, un decodificador no tiene que registrar y analizar todos los datos de la corriente de datos, sino que puede omitir los datos asociados a un juego de parámetros opcional cuando detecta un juego de parámetros opcional.
[0052] Así, existen varias posibilidades para la escritura real de la corriente de datos con los juegos de parámetros escalados. En un ejemplo de realización, el inicio de los datos puede estar establecido para un juego de parámetros de acuerdo con una trama fija de corriente de datos. En tal caso, la transmisión de información de longitud asociada al juego de parámetros opcional no es estrictamente necesaria. Sin embargo, esta trama fija puede dar lugar a que la cantidad de datos de la corriente de datos se expanda artificialmente mediante bits de relleno. Por ello se prefiere asociar una información de longitud a cada juego de parámetros opcional para que cuando un decodificador tiene la información de omitir un juego de parámetros opcional, omita simplemente un determinado número de bits en el flujo de datos presente preferentemente en serie en base a la información de longitud, para de este modo empezar de nuevo con la lectura y el análisis en el lugar correcto del flujo de datos, esto es, cuando empiezan los datos para un nuevo juego de parámetros o para nuevas informaciones.
[0053] Una posibilidad alternativa para la señalización del inicio de un nuevo juego de parámetros consiste, por ejemplo, en tener un patrón de sincronización que precede a los datos reales, que tiene un determinado patrón de bits, esto es, que se pueden identificar sin el análisis real de los datos solamente a partir de una búsqueda de un patrón de bits, para señalizar a un decodificador que los datos para un juego de parámetros comienzan aquí y finalizan en el siguiente patrón de sincronización. En tal caso, cuando un juego de parámetros se ha identificado como un juego de parámetros opcional, un decodificador buscaría un patrón de sincronización asociado con el inicio del juego de parámetros opcional para realizar entonces una búsqueda de patrón con los bits siguiendo el patrón de sincronización sin análisis sintáctico hasta que encuentre el siguiente patrón de sincronización. Los bits entre los dos patrones de sincronización no se utilizarían entonces para una reconstrucción, sino simplemente se ignorarían, mientras que los datos en el siguiente patrón de sincronización que señalan el final del juego de parámetros opcional pueden utilizarse, tal y como está prescrito de acuerdo con la sintaxis de la corriente de bits, siempre y cuando estos datos no pertenezcan a otro juego de parámetros opcional.
[0054] En un ejemplo preferido de realización de la presente invención, se clasifican los al menos dos juegos de parámetros requeridos para la reconstrucción de los diferentes canales con respecto a su importancia en lo que se refiere a su percepción. El juego de parámetros más significativo para la percepción, esto es, para la calidad de la señal multicanal reconstruida, se marca como el juego de parámetros imprescindiblemente necesario en la corriente de datos, mientras los otros juegos de parámetros se marcan únicamente como juegos de parámetros opcionales. También se pueden realizar otras clasificaciones en imprescindiblemente necesario, opcional y, por ejemplo, juegos de parámetros solamente necesarios para una reconstrucción de estudio, para, por ejemplo, lograr tres niveles de escalado en lugar de tan sólo dos niveles de escalado. Se debe de indicar que es suficiente con marcar ya sea los juegos de parámetros obligatorios o preferentemente los opcionales, debido a que el tipo de juego de parámetros no marcado correspondiente se obtiene automáticamente de la ausencia de un marcado.
[0055] La fig. 1a muestra una representación esquemática de la corriente de datos, que en el ejemplo de realización mostrado en la fig. 1a, comprende en primer lugar un bloque de control 10, un bloque en el que se encuentran los datos de los M canales de transmisión, que está identificado mediante 11, así como un bloque 12a, 12b, … 12 c para cada juego de parámetros. En el ejemplo preferido de realización de la presente invención, el bloque de control 10 comprende varias informaciones individuales, tal y como se representan esquemáticamente en la fig. 1b. De esta manera, en una entrada 100 en el bloque de control 10, el número de juegos de parámetros
imprescindiblemente necesarios está señalizado mediante un campo con el título de “numBccDataMand”. Además,
en un campo 101 se señala si existen juegos de parámetros opcionales. Para ello se utiliza un campo marcado
como “OptBccDataPresent”. En otro campo del bloque de control 10 se señala además el número de juegos de parámetros opcionales mediante la variable “numBccDataOpt”. En otros bloques 103, 104, 105 se señala el tipo y/o
el número de versión de un juego de parámetros i para cada juego de parámetros. Para ello se utiliza el campo con
el nombre “BccDataId”. En otra secuencia opcional adicional de campos 106, 107, 108 se da una información de longitud opcional designada mediante “Lengthinfo” (Información de longitud) para cada juego de parámetros marcado como opcional, esto es, que está contenido en el número de juegos de parámetros opcionales. Estas informaciones de longitud dan la longitud en bits del juego de parámetros correspondiente, por ejemplo, el i-ésimo.
Tal y como se describirá más adelante, la “Lengthinfo” también puede incluir información acerca del número de bits
requeridos para la señalización de la longitud o alternativamente también la propia indicación de longitud.
[0056] Las fig. 3a a 3d muestran una forma preferida de la configuración del juego de parámetros. La configuración del juego de parámetros puede hacerse para cada trama, pero también puede hacerse, por ejemplo, sólo una vez para un grupo de tramas, como, por ejemplo, al comienzo de un archivo que contiene muchas tramas. De esta manera, en la fig. 3a se da una definición de la presencia y del número de juegos de parámetros opcionales en un pseudo-código, en donde “uimsbf” significa “unsigned integer most significant bit first” (primer bit entero más significativo sin signo), esto es, representa un número entero que no incluye ninguna signo y cuyo bit más significativo se encuentra el primero en la corriente de datos. Así, la variable numBccData que especifica el número de datos BCC está representada en primer lugar por ejemplo en el campo 100 del bloque de control 10.
[0057] Además se utiliza el campo 101 para determinar si tan siquiera existen juegos de parámetros opcionales (optBccDataPresent). En base a ello se registra el número de juegos de parámetros opcionales (numBccDataOpt) para, en caso de que haya ocurrido, obtener otras informaciones adicionales acerca de los juegos
de parámetros opcionales o los denominados “chunks” (bloques de información) (OptChunkInfo). La variable numBccDataOptM1 contiene el sufijo “M1” que se refiere a “menos 1”. Esto se compensa de nuevo mediante la adición de “+1” en la fig. 3d.
[0058] La fig. 3b muestra una vista general del valor que en un ejemplo de realización puede tener el identificador de datos del juego de parámetros en los campos 103 a 105. De este modo, la variable “BccDataId” puede contener en primer lugar el nombre, esto es, el tipo del parámetro, es decir, ICLD, ICTD e ICC, y contener al mismo tiempo un número de versión V1 o V2. Así, debe observarse en la fig. 3b que una corriente de datos puede contener realmente al mismo tiempo las diferencias de nivel inter-canal de una primera versión V1 y de una segunda versión posterior V2, en donde un decodificador correspondientemente adecuado para la primera versión puede registrar sencillamente ICLD_V1 como juego de parámetros obligatorio y puede ignorar ICLD_V2, mientras que un decodificador con un número de versión superior puede sencillamente registrar ICLD_V2, y concretamente como juego de parámetros obligatorio, para ignorar, sin embargo, ICLD_V1 como juego de parámetros opcionalmente necesario en este escenario. Alternativamente, el conjunto de datos puede estar escrito de manera que los juegos de datos obligatorios se encuentren siempre presentes únicamente en una versión en la corriente de datos.
[0059] La fig. 3c muestra la identificación de juegos de parámetros opcionales. Así, en las informaciones sobre los juegos de parámetros opcionales, se registra el identificador de juego de parámetros 103 a 105 de la fig. 1b para cada juego de parámetros para obtener informaciones acerca de cada juego de parámetros que es opcional. Además, para cada juego de parámetros opcional se registra la longitud de este juego de parámetros, siempre y cuando ésta se haya transmitido en la corriente de bits, tal y como se representa mediante el comando
“OptChunkLen()” en la fig. 3c.
[0060] Con respecto a la determinación de las informaciones de longitud para juegos de parámetros opcionales se remite a la fig. 3d en la que se representa cómo se registra la longitud en bits para cada juego de parámetros en un ejemplo preferido de realización de la invención a partir de los datos asociados a cada juego de parámetros opcional.
[0061] El ciclo de lectura de juego de parámetros realizado por un decodificador está esquemáticamente representado en la fig. 4a. Así, los datos del juego de parámetros real que se encuentran en los bloques 12a a 12 c de la fig. 1 se registran mediante BccData().
[0062] La lectura de las informaciones de longitud está representada en la fig. 4b. De este modo, BccDataLenBits describe el número de bits necesario para señalizar la longitud de bit real de un bloque de información. BccDataLen da por lo tanto realmente la longitud en bits que tiene un bloque de información. Este sistema de dos etapas es flexible por una parte y ahorra en datos por otra parte, debido a que es particularmente eficiente cuando los bloques de información tienen una longitud en bits que varía mucho, lo que afecta particularmente a juegos de parámetros de tipos muy diferentes y por lo tanto de longitud. Esto permitirá la definición futura de nuevos bloques de información que pueden tener prácticamente cualquier longitud.
[0063] La fig. 4c finalmente representa el conmutador de juego de parámetros, en donde el identificador de juego de parámetros, tal y como se ha representado en la fig. 3b, se evalúa de tal manera que los juegos de parámetros se asocian a los algoritmos de reconstrucción correspondientes, de manera que no ocurra el caso que, por ejemplo, se consideren diferencias de nivel inter-canal como diferencias de tiempo inter-canal y viceversa.
[0064] En la fig. 4c se puede observar además que, cuando se ha identificado un juego de parámetros como opcional y no se desea una decodificación utilizando el juego de parámetros opcional, el número de bits de este
juego de parámetros se omite (“Skip and continue” (omite y continúa)) para posteriormente, una vez que se han
registrado todos los juegos de parámetros imprescindiblemente necesarios (o se presentan datos desconocidos para el decodificador, tales como, ejemplo, juegos de parámetros), comenzar con la emisión sin considerar otros juegos
de parámetros opcionales (“Stop Parsing, Start Output” (detener análisis, iniciar emisión)). Un decodificador de este
tipo comenzará de este modo con la emisión cuando ya haya registrado al menos un bloque de información obligatorio y no pueda analizar información adicional en la corriente de datos. De esta manera, no se induce al decodificador a una salida completamente errónea causada por contenidos de corriente de datos que no entiende. De este modo se logra un decodificador muy robusto.
[0065] A continuación se describirá la funcionalidad de la presente invención en más detalle en base a ejemplos preferidos de realización de la presente invención. De este modo, la información de parámetros de varios tipos, tales como ICLDs, ICTDs, ICCs y otras informaciones de juegos de parámetros, alojadas en secciones de datos diferentes y separadas, esto es, en diferentes capas de escalado. Para este propósito, se remite de nuevo a las fig. 4a a 4c. Los juegos de parámetros se diferencian en juegos de parámetros imprescindiblemente necesarios u (obligatorios), tales como, por ejemplo, juegos de parámetros de diferencias de nivel inter-canal, y juegos de parámetros opcionales tales como, por ejemplo, juegos de parámetros de diferencias de tiempo inter-canal y juegos de parámetros de valor de correlación inter-canal.
[0066] Se proporcionan informaciones acerca del número de juegos de parámetros imprescindiblemente necesarios (numBccDataMand) y la presencia (OptBccDataPresent) y el número de juegos de parámetros opcionales (numBccDataOpt). Normalmente, la información sobre el número de juegos de parámetros imprescindiblemente necesarios (numBccDataMand) depende de la especificación del sistema y por lo tanto no necesariamente tiene que transmitirse explícitamente, sino que puede acordarse de manera fija entre el codificador y el decodificador. En cambio, es preferible transmitir explícitamente el número de juegos de parámetros opcionales (numBccDataOpt). Cuando el parámetro de presencia (OptBccDataPresent) indica la presencia de juegos de parámetros opcionales, tal como está representado en la fig. 3a, se inicia una evaluación correspondiente de la información sobre los juegos de parámetros opcionales.
[0067] Asimismo, en el ejemplo preferido de realización de la presente invención, se proporciona un identificador (BccDataId) para cada juego de parámetros. Este identificador proporciona informaciones acerca del tipo de juego de parámetros, como, por ejemplo, ICLD, ICTD o ICC y/o la versión de sintaxis de un determinado juego de parámetros, tal y como también está representado en la fig. 3b. Normalmente, el identificador para los juegos de parámetros obligatorios se señaliza de forma implícita, mientras que el identificador para los parámetros opcionales se señaliza de forma explícita. En este caso, sin embargo, tiene que estar acordado entre el codificador y el decodificador que, por ejemplo, el primer juego de parámetros que llegue es el juego de parámetros imprescindiblemente necesario, el cual comprende en el escenario establecido de manera fija, por ejemplo, juegos de parámetros de diferencia de nivel inter-canal. Alternativamente, la información del tipo de juego de parámetros puede definirse también de forma implícita mediante especificación del orden de los tipos de juegos de parámetros.
[0068] Los juegos de parámetros comprenderán preferentemente informaciones de longitud de juego de parámetros. La preparación de este tipo de informaciones de longitud de juegos de parámetros le permite al decodificador ignorar este juego de parámetros al omitir simplemente los bits asociados sin que el decodificador tenga que conocer la sintaxis exacta de la corriente de bits del juego de parámetros. A este respecto se remite a la fig. 4b.
[0069] En el ejemplo preferido de realización de la presente invención, los juegos de parámetros imprescindiblemente necesarios no incluyen por lo tanto informaciones de longitud de juego de parámetros, puesto que el decodificador tiene que analizar (parsear) y procesar en todo caso los datos sobre el juego de parámetros imprescindiblemente necesario, en lugar de simplemente descartarlos. De este modo, un decodificador podría estar implementado para asumir, cuando detecta un juego de parámetros y no contiene ninguna información adicional asociada, que el juego de parámetros (por ejemplo ICLD) se encuentra entre los juegos de parámetros determinados disponibles y que este juego de parámetros, debido al hecho de que no incluye ninguna información correspondiente, es un juego de parámetros imprescindiblemente necesario.
[0070] Para juegos de parámetros opcionales, las informaciones de longitud de juegos de parámetros se podría transmitir o no dependiendo del caso de aplicación. Una regla simple puede consistir en que, para mejorar la interoperabilidad entre codificador y decodificador, todos los juegos de parámetros opcionales incluyan informaciones de la longitud del juego de parámetros. Sin embargo, para ahorrar bits, las informaciones de longitud pueden no transmitirse para el último juego de parámetros, puesto que no existe ninguna necesidad de omitir estos datos y acceder al siguiente juego de parámetros, debido a que el juego de parámetros es de todas formas el último juego de parámetros. Este procedimiento tiene sentido evidentemente cuando un bloque de datos, tal y como está representado en la fig. 1a, se encuentra terminado realmente mediante el i-ésimo juego de parámetros 12c y cuando a continuación, por ejemplo, no existen más informaciones de control etc. para el bloque de la señal de suma o de los M canales de transmisión ya procesados.
[0071] Una señalización explícita podría consistir en que, por ejemplo, de acuerdo con la información de disponibilidad de recursos 32 (fig. 2b), la transmisión de informaciones de longitud de parámetros se pueda señalizar dinámicamente mediante el codificador por medio de un elemento de corriente de bits que informa a un decodificador acerca de la presencia/longitud de las informaciones de longitud de juego de parámetros, tal y como se representó anteriormente en base a la fig. 3d.
[0072] A continuación se tratará un ejemplo preferido de realización para un proceso de decodificación de un decodificador mostrado en la fig. 2b. El decodificador preferido verifica en primer lugar la disponibilidad de un juego de parámetros imprescindiblemente necesario (obligatorio), que preferentemente será el juego de parámetros de diferencias de nivel inter-canal. Si además el número de versión de sintaxis del juego de parámetros ILD es mayor que el número de versión que el decodificador por sí mismo puede decodificar, en donde el decodificador por ejemplo, soporta versiones de sintaxis de 1 a n, no se puede realizar ninguna reconstrucción mediante el dispositivo 31 para la reconstrucción de la fig. 2b. En todos los demás casos, se puede realizar una determinada forma de un proceso de decodificación válido, al decodificar el juego de parámetros imprescindiblemente necesario y en el caso de que no se utilicen juegos de parámetros opcionales, realizar una síntesis multicanal utilizando únicamente el juego de parámetros imprescindiblemente necesario.
[0073] Sin embargo, cuando un decodificador detecta un juego de parámetros opcional, puede utilizarlo o descartar su contenido. La elección de una u otra de las dos posibilidades depende, por ejemplo, del escenario representado a continuación.
[0074] Si el número de versión de sintaxis del juego de parámetros opcional es mayor que la capacidad de versión de sintaxis instalada del propio decodificador para ese tipo de juego de parámetros, entonces el decodificador no puede procesar este tipo de juego de parámetros y se omitirá. En este caso, sin embargo, se logra aun así una descodificación válida sin realizar la reconstrucción multicanal mejorada utilizando el tipo de juego de parámetros opcional. Sin embargo, si se puede considerar el contenido del juego de parámetros opcional, dependiendo de las capacidades del decodificador, se producirá una reconstrucción de mayor calidad.
[0075] Por ejemplo, se debe de indicar que la síntesis utilizando valores de coherencia inter-canal puede consumir una considerable cantidad de recursos de computación. Así, un decodificador de baja complejidad puede, por ejemplo, ignorar este juego de parámetros dependiendo de la información de control de recursos, mientras un decodificador que es capaz de proporcionar una mayor calidad de emisión extraerá y utilizará para la reconstrucción todos los juegos de parámetros, esto es, tanto los juegos de parámetros imprescindiblemente necesarios como también los opcionales. En un ejemplo preferido de realización, la decisión de utilizar/descartar un juego de parámetros se basa en la disponibilidad de los recursos de computación en un instante de tiempo determinado, es decir, de forma dinámica.
[0076] El concepto de acuerdo con la invención proporciona la posibilidad de actualizar de manera compatible el formato de corriente de bits para tipos de juegos de parámetros no imprescindiblemente necesarios, esto es, opcionales, sin interferir en la capacidad de decodificación por los decodificadores existentes, esto es, la compatibilidad hacia atrás. Además, de acuerdo con la invención se asegura en cualquier caso que los decodificadores antiguos generarán una salida no válida que, en el peor de los casos, podría dar como resultado incluso una destrucción de los altavoces, cuando se realiza una actualización de sintaxis al incrementar el número de versión de sintaxis de un juego de parámetros imprescindiblemente necesario, esto es, las informaciones ILD, u
opcional, tal y como se representa, por ejemplo, mediante el campo “BccDataId” nº 4 de la fig. 3b.
[0077] El concepto de acuerdo con la invención está de esta manera en contraposición con una sintaxis clásica de corriente de bits en la que un decodificador tiene que conocer la sintaxis completa para cada juego de parámetros que puede utilizarse en una corriente de bits, para ser capaz de poder registrar en primer lugar todos los juegos de parámetros, para a continuación ser capaz de controlar los elementos de procesador correspondientes, tal y como están representados a modo de ejemplo en la fig. 7, junto con los parámetros correspondientes. Un decodificador de acuerdo con la invención omitiría los bloques 126 y 128, cuando únicamente se han extraído las diferencias de nivel inter-canal como juego de parámetros imprescindiblemente necesario, para aun así realizar una reconstrucción multi-canal de baja calidad.
[0078] A modo de resumen, a continuación se representarán una vez más las características esenciales del codificador, que pueden ser ventajosamente utilizadas por el decodificador para lograr una decodificación eficiente y de alta calidad con una corriente de datos de baja tasa de datos.
[0079] Si un juego de parámetros es menos importante que otro juego de parámetros en la reconstrucción de los K canales de salida en lo que respecta a la calidad de una señal multicanal reconstruida, el dispositivo para escribir 25 está conformado para escribir el conjunto de datos de tal forma que sea posible una reconstrucción sin utilizar el conjunto de datos menos importante.
[0080] Preferentemente, el dispositivo para escribir 25 está conformado además para proporcionar un juego de parámetros con un identificador asociado 100 a 105, en donde un identificador para un juego de parámetros indica que el juego de parámetros se tiene que utilizar necesariamente para una reconstrucción o en donde un identificador para otro juego de parámetros indica que el juego de parámetros únicamente se puede utilizar de manera opcional para una reconstrucción.
[0081] Preferentemente, el dispositivo para escribir 25 está conformado además para escribir los M canales de transmisión en una sección 11 de canal de transmisión del conjunto de datos de la corriente de datos, un primer juego de parámetros en una primera sección de juego de parámetros 12a, y para escribir un segundo juego de parámetros en una segunda sección de juego de parámetros 12b de tal forma que un decodificador pueda reconstruir los K canales de salida sin leer ni interpretar la segunda sección del juego de parámetros (12b).
[0082] Si los juegos de parámetros se seleccionan del siguiente grupo que incluye las diferencias de nivel inter-canal, diferencias de tiempo inter-canal, diferencias de fase inter-canal o informaciones de coherencia intercanal, el dispositivo para escribir 25 está conformado para marcar el juego de parámetros de diferencias de nivel inter-canal como imprescindiblemente necesario para la decodificación y para marcar al menos otro juego de parámetros del grupo como opcional para la decodificación.
[0083] Preferentemente, el dispositivo para escribir 25 está conformado para proporcionar al segundo juego de parámetros informaciones de longitud 106 a 108 que indican qué cantidad de datos en el conjunto de datos pertenecen al segundo juego de parámetros, de manera que un decodificador está en disposición de omitir la cantidad de datos en base a la información de longitud, en donde las informaciones de longitud comprenden preferentemente un primer campo para la señalización de una longitud en bits de un campo de longitud y en donde el campo de longitud presenta la longitud en bits mediante la que se indica una cantidad de bits del segundo juego de parámetros.
[0084] Preferentemente, el dispositivo para escribir 25 está además conformado para escribir una información de número 102 en la corriente de datos que indica el número de juegos de parámetros opcionales sin los que el decodificador puede realizar una reconstrucción de los K canales de salida. Preferentemente, el dispositivo para escribir 25 está además conformado para asignar informaciones de versión de sintaxis 103 a 105 a los juegos de parámetros, de tal forma que el decodificador sólo realiza una reconstrucción mediante el uso del juego de parámetros correspondiente cuando una información de versión de sintaxis tiene un determinado estado.
[0085] Preferentemente, están además presentes informaciones de versión de sintaxis únicamente para el segundo juego de parámetros y eventualmente otros juegos de parámetros opcionales.
[0086] Además, un último juego de parámetros opcional en una secuencia de juegos de parámetros en la corriente de datos puede no comprender ninguna información de longitud asociada.
[0087] Además, el dispositivo para escribir 25 puede estar conformado para señalizar la presencia y longitud de las informaciones de longitud del juego de parámetros de manera dinámica en la corriente de datos.
[0088] El dispositivo de provisión 22 puede estar conformado para proporcionar una secuencia de bloques de datos para los M canales de transmisión que se basa en una secuencia de bloques de valores de muestra en el tiempo de al menos un canal original.
[0089] Dependiendo de las circunstancias, el procedimiento de acuerdo con la invención para la generación o la decodificación se puede implementar en hardware o en software. La implementación se puede realizar en un medio de almacenamiento digital, en particular en un disco flexible o en un CD con señales de control que pueden leerse electrónicamente, que pueden actuar conjuntamente con un sistema programable de ordenador de tal forma que se realice el procedimiento. En general, la invención consiste de este modo también en un producto de programa de ordenador con un código de programa almacenado en un soporte legible en máquina para la realización del procedimiento, cuando el producto de programa de ordenador se ejecuta en un ordenador. En otras palabras, la invención puede realizarse así como un programa de ordenador con un código de programa para la realización del procedimiento, cuando el programa de ordenador se ejecuta en un ordenador.

Claims (17)

  1. REIVINDICACIONES
    1.
    Dispositivo para la generación de una señal multicanal codificada que representa una señal multicanal no codificada que comprende N canales originales, donde N es igual a mayor que 2, con las siguientes características: un dispositivo para proporcionar (22) informaciones de parámetros (24a, 24b, 24c) para la reconstrucción de K canales de salida a partir de M canales de transmisión (23), donde M es igual o mayor que 1 y menor o igual que N, en donde K es mayor que M y menor o igual que N, en donde las informaciones de parámetros comprenden al menos un primer juego de parámetros y un segundo juego de parámetros variable para la reconstrucción de un único canal de salida, en donde el segundo juego de parámetros presenta informaciones de versión de sintaxis (103 a 105) asignadas; y un dispositivo para escribir (25) de una corriente de datos (26), en donde el dispositivo (25) está conformado para la escritura, para escribir el primer y el segundo juego de parámetros en la corriente de datos de tal forma que se pueda realizar una reconstrucción en un decodificador de al menos uno de los K canales de salida mediante la utilización del primer juego de parámetros, sin utilizar el segundo juego de parámetros y mediante la utilización de al menos uno de los M canales de transmisión (23), en donde el dispositivo para escribir (25) está conformado para escribir informaciones de longitud, que indican una cantidad de datos del segundo juego de parámetros asignado, en la corriente de datos.
  2. 2.
    Dispositivo para la decodificación de una señal multicanal codificada que representa una señal multicanal no codificada, que comprende N canales originales, en donde la señal multicanal codificada está representada mediante una corriente de datos que presenta informaciones de parámetros para la reconstrucción de K canales de salida a partir de M canales de transmisión, en donde M es mayor o igual que 1 y menor o igual que N, en donde K es mayor que M y menor o igual que N, en donde las informaciones de parámetros presentan al menos dos juegos de parámetros diferentes para la reconstrucción de un único canal de salida, y en donde el primer y segundo juego de parámetros están escritos en la corriente de datos de tal forma que se puede realizar una reconstrucción en un decodificador de los K canales de salida mediante la utilización del primer juego de parámetros y sin utilizar el segundo juego de parámetros, en donde el segundo juego de parámetros presenta informaciones de versión de sintaxis (103 a 105) asignadas, con la siguiente característica: un dispositivo para la lectura de la corriente de datos (28) para la lectura de la corriente de datos, para registrar el primer juego de parámetros (30a), y omitir el segundo juego de parámetros (30b) cuando las informaciones de versión de sintaxis asignadas al segundo juego de parámetros no son compatibles con una información de versión de sintaxis predeterminada para el dispositivo para la decodificación, y para registrar el segundo juego de parámetros cuando las informaciones de versión de sintaxis son compatibles con la información de versión de sintaxis predeterminada, en donde el segundo juego de parámetros presenta informaciones de longitud, que indican una cantidad de datos del segundo juego de parámetros asignado, y en donde el dispositivo para leer (28) está conformado para omitir una cantidad de datos en la corriente de datos en base a las informaciones de longitud, indicada mediante la información de longitud, sin analizar sintácticamente los datos del segundo juego de parámetros.
  3. 3.
    Dispositivo según la reivindicación 2, que presenta además la siguiente característica: un dispositivo para la reconstrucción (32) para la reconstrucción de los K canales de salida mediante la utilización de los M los canales de transmisión y del primer juego de parámetros, pero sin la utilización del segundo juego de parámetros.
  4. 4.
    Dispositivo según la reivindicación 2 o 3, en donde el primer juego de parámetros presenta una información de versión de sintaxis (103 a 105) asociada, y en donde el dispositivo para leer (28) está conformado para leer la información de versión de sintaxis asignada y controlar al dispositivo de reconstrucción (31) de tal forma que sólo se realice una reconstrucción mediante el dispositivo de reconstrucción cuando las informaciones de versión de sintaxis registradas sean compatibles con una información de versión de sintaxis predefinida del dispositivo para la decodificación.
  5. 5.
    Dispositivo según una de las reivindicaciones 2 a 4, en donde el dispositivo para leer (28) se puede controlar (32) para obtener informaciones de disponibilidad de recursos, y en donde el dispositivo para leer (28) está además conformado para, cuando las informaciones de disponibilidad de recursos indican recursos suficientes, registrar el segundo juego de parámetros, y para omitir el segundo juego de parámetros cuando las informaciones de disponibilidad de recursos indican recursos insuficientes.
  6. 6.
    Dispositivo según una de las reivindicaciones 2 a 5, en donde un juego de parámetros es menos importante que otro juego de parámetros diferente para la reconstrucción de los K canales de salida en lo que se refiere a una calidad de la señal multicanal reconstruida, y en donde el dispositivo para la lectura de la corriente de datos (28) está conformado para omitir el juego de datos menos importante.
  7. 7.
    Dispositivo según una de las reivindicaciones 2 a 6, en donde la corriente de datos presenta un juego de parámetros con un identificador (100 a 105) asignado, en donde un identificador indica para un juego de
    parámetros que el juego de parámetros se tiene que utilizar imprescindiblemente para una reconstrucción, o en donde un identificador para otro juego de parámetros indica que el juego de parámetros sólo se puede utilizar de forma opcional para una reconstrucción, en donde el dispositivo para la lectura de la corriente de datos (28) está conformado para detectar el identificador y para leer el juego de parámetros imprescindiblemente necesario y para omitir un juego de parámetros opcional en base al identificador detectado.
  8. 8.
    Dispositivo según una de las reivindicaciones 2 a 7, en donde la corriente de datos presenta un primer juego de parámetros en una primera sección de juego de parámetros (12a) y un segundo juego de parámetros en una segunda sección de juego de parámetros (12b), en donde el dispositivo para la lectura de la corriente de datos está conformado para interpretar la corriente de datos en lo que respecta a las secciones de juegos de parámetros y registrar la primera sección de juego de parámetros y omitir la segunda sección de juego de parámetros.
  9. 9.
    Dispositivo según una de las reivindicaciones 2 a 8, en donde los juegos de parámetros se han seleccionado del siguiente grupo que incluye diferencias de nivel inter-canal, diferencias de tiempo inter-canal, diferencias de fase inter-canal o informaciones de coherencia inter-canal, en donde, en la corriente de datos, el juego de parámetros de diferencias de nivel inter-canal está caracterizado como imprescindiblemente necesario para la decodificación y en donde al menos otro juego de parámetros del grupo está caracterizado como opcional para la decodificación, y en donde el dispositivo para la lectura de la corriente de datos (28) está conformado para registrar el juego de parámetros de diferencias de nivel inter-canal y para omitir otro juego de parámetros del grupo.
  10. 10.
    Dispositivo según una de las reivindicaciones 2 a 9, en donde la corriente de datos presenta una información de número (102), que indica un número de juegos de parámetros opcionales sin los que se puede realizar una reconstrucción de los K canales de salida mediante el decodificador, en donde el dispositivo para la lectura de la corriente de datos está conformado para registrar al menos un juego de parámetros opcional a partir de la información de número.
  11. 11.
    Dispositivo según la reivindicación 2, en el que para el segundo juego de parámetros y eventualmente otros juegos de parámetros opcionales existen informaciones de versión de sintaxis asociadas en la corriente de datos, en donde para el primer juego de parámetros no existe ninguna información de versión de sintaxis.
  12. 12.
    Dispositivo según una de las reivindicaciones anteriores, en el que un último juego de parámetros opcional en una secuencia de juegos de parámetros no presenta ninguna información de longitud asociada en la corriente de datos, en donde el dispositivo para la lectura de la corriente de datos (28) está conformado para no leer ni interpretar ninguna información de longitud antes del registro del último juego de parámetros opcional.
  13. 13.
    Dispositivo según una de las reivindicaciones 2 a 12, en el que se señaliza dinámicamente en la corriente de datos una presencia y longitud de las informaciones de longitud del juego de parámetros, y en donde el dispositivo para la lectura de la corriente de datos (28) está conformado para detectar en primer lugar la presencia de las informaciones de longitud del juego de parámetros en la corriente de datos, para a continuación, en base en a una presencia detectada, extraer la longitud de las informaciones de longitud del juego de parámetros de la corriente de datos.
  14. 14.
    Dispositivo según una de las reivindicaciones 3 a 13, en el que los M canales de transmisión son canales de combinación de canales BCC y los juegos de parámetros comprenden parámetros BCC, y en el que el dispositivo para la reconstrucción (32) está conformado para realizar una síntesis BCC.
  15. 15.
    Procedimiento para la generación de una señal multicanal codificada que representa una señal multicanal no codificada, que presenta N canales originales, en donde N es mayor o igual que 2, con los siguientes pasos: proporcionar (22) informaciones paramétricas (24a, 24b, 24c) para la reconstrucción de K canales de salida a partir de M canales de transmisión (23), en donde M es mayor o igual que 1 y menor o igual que N, en donde K es mayor que M y menor o igual que N, en donde las informaciones de parámetros comprenden al menos dos juegos de parámetros diferentes para la reconstrucción de un único canal de salida; y la escritura (25) de una corriente de datos (26) mediante la escritura del primer y segundo juegos de parámetros en la corriente de datos de tal forma que se puede realizar una reconstrucción en un decodificador de al menos uno de los K canales de salida mediante la utilización del primer juego de parámetros, sin utilizar el segundo juego de parámetros y mediante la utilización de al menos uno de los M canales de transmisión (23), en donde el segundo juego de parámetros presenta informaciones de versión de sintaxis (103 a 105) asignadas, en donde durante la escritura (25) se escriben informaciones de longitud en la corriente de datos que indican una cantidad de datos del segundo juego de parámetros asignado.
  16. 16.
    Procedimiento para la decodificación de una señal multicanal codificada que representa una señal multicanal no codificada que presenta N canales originales, en donde la señal multicanal codificada está representada mediante una corriente de datos que presenta informaciones de parámetros para la reconstrucción de K canales de salida a partir de M canales de transmisión, en donde M es mayor o igual que 1 y menor o igual que N,
    en donde K es mayor que M y menor o igual que N, en donde las informaciones de parámetros presentan al menos dos juegos de parámetros diferentes para la reconstrucción de un único canal de salida, y en donde el primer y el segundo juego de parámetros están escritos en la corriente de datos de tal forma que se puede realizar una reconstrucción en un decodificador de los K canales de salida mediante la utilización del primer juego de parámetros
    5 y sin utilizar el segundo juego de parámetros, en donde el segundo juego de parámetros comprende informaciones de versión de sintaxis (103 a 105) asignadas, mediante el siguiente paso: lectura (28) de la corriente de datos para registrar el primer juego de parámetros (30a), y para omitir el segundo juego de parámetros (30b) cuando las informaciones de versión de sintaxis asignadas al segundo juego de parámetros no son compatibles para la decodificación con una información de versión de sintaxis predeterminada
    10 del dispositivo, y para registrar el segundo juego de parámetros cuando las informaciones de sintaxis son compatibles con la información de versión de sintaxis predeterminada, en donde el segundo juego de parámetros presenta informaciones de longitud, que indican una cantidad de datos del segundo juego de parámetros asignado, y en donde se omite una cantidad de datos durante la lectura (28) en la corriente de datos en base a las informaciones de longitud, indicada a través de la información de longitud, sin que se analicen sintácticamente los datos del
    15 segundo juego de parámetros.
  17. 17. Programa de ordenador con un código de programa para la realización del procedimiento de acuerdo con la reivindicación 15 o 16, cuando se ejecuta el programa de ordenador en un ordenador.
ES05782459.1T 2004-09-03 2005-08-29 Generación de una señal multicanal codificada y decodificación de una señal multicanal codificada Active ES2454670T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102004042819A DE102004042819A1 (de) 2004-09-03 2004-09-03 Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
DE102004042819 2004-09-03
PCT/EP2005/009293 WO2006027138A1 (de) 2004-09-03 2005-08-29 Erzeugung eines codierten multikanalsignals und decodierung eines codierten multikanalsignals

Publications (1)

Publication Number Publication Date
ES2454670T3 true ES2454670T3 (es) 2014-04-11

Family

ID=35094601

Family Applications (1)

Application Number Title Priority Date Filing Date
ES05782459.1T Active ES2454670T3 (es) 2004-09-03 2005-08-29 Generación de una señal multicanal codificada y decodificación de una señal multicanal codificada

Country Status (17)

Country Link
US (1) US8145498B2 (es)
EP (1) EP1763870B1 (es)
JP (1) JP4856641B2 (es)
KR (1) KR100908081B1 (es)
CN (1) CN101044550B (es)
AU (1) AU2005281937B2 (es)
BR (1) BRPI0515623B1 (es)
CA (1) CA2578190C (es)
DE (1) DE102004042819A1 (es)
ES (1) ES2454670T3 (es)
HK (1) HK1107174A1 (es)
IL (1) IL181469A (es)
MX (1) MX2007002569A (es)
NO (1) NO338928B1 (es)
PL (1) PL1763870T3 (es)
RU (1) RU2379768C2 (es)
WO (1) WO2006027138A1 (es)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP2008542816A (ja) 2005-05-26 2008-11-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の符号化及び復号化方法
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1974347B1 (en) * 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
WO2007091850A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
US8126152B2 (en) * 2006-03-28 2012-02-28 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for a decoder for multi-channel surround sound
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
CN101529898B (zh) 2006-10-12 2014-09-17 Lg电子株式会社 用于处理混合信号的装置及其方法
DE102007007830A1 (de) * 2007-02-16 2008-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms
US8612237B2 (en) * 2007-04-04 2013-12-17 Apple Inc. Method and apparatus for determining audio spatial quality
EP2083584B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
KR100998913B1 (ko) * 2008-01-23 2010-12-08 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
US8615316B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal
EP2169664A3 (en) * 2008-09-25 2010-04-07 LG Electronics Inc. A method and an apparatus for processing a signal
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2169665B1 (en) * 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
KR101600352B1 (ko) * 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
KR20100137159A (ko) * 2009-06-22 2010-12-30 삼성전자주식회사 방송 수신기 및 그의 채널 전환 방법
KR101751559B1 (ko) * 2009-10-30 2017-06-27 선 페이턴트 트러스트 복호방법, 복호장치, 부호화 방법 및 부호화 장치
EP2544465A1 (en) * 2011-07-05 2013-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral weights generator
US9451252B2 (en) 2012-01-14 2016-09-20 Qualcomm Incorporated Coding parameter sets and NAL unit headers for video coding
WO2013149670A1 (en) * 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Method for parametric spatial audio coding and decoding, parametric spatial audio coder and parametric spatial audio decoder
CA2870067C (en) * 2012-04-16 2017-01-17 Nokia Corporation Video coding and decoding using multiple parameter sets which are identified in video unit headers
US9602827B2 (en) 2012-07-02 2017-03-21 Qualcomm Incorporated Video parameter set including an offset syntax element
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
EP2717261A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
US20150340043A1 (en) * 2013-01-14 2015-11-26 Koninklijke Philips N.V. Multichannel encoder and decoder with efficient transmission of position information
JP6250071B2 (ja) 2013-02-21 2017-12-20 ドルビー・インターナショナル・アーベー パラメトリック・マルチチャネル・エンコードのための方法
KR20230020553A (ko) 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
US9565437B2 (en) 2013-04-08 2017-02-07 Qualcomm Incorporated Parameter set designs for video coding extensions
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
WO2016171002A1 (ja) * 2015-04-24 2016-10-27 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
FR3045915A1 (fr) * 2015-12-16 2017-06-23 Orange Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal
US10356800B2 (en) * 2016-05-09 2019-07-16 Qualcomm Incorporated Scalable numerology with symbol boundary alignment for uniform and non-uniform symbol duration in wireless communication
WO2019088863A1 (ru) * 2017-10-30 2019-05-09 Общество С Ограниченной Ответственностью "Теквел Разработка" Способ и компьютерное устройство для автоматического определения топологии связей
CN108039175B (zh) 2018-01-29 2021-03-26 北京百度网讯科技有限公司 语音识别方法、装置及服务器
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
US11528574B2 (en) 2019-08-30 2022-12-13 Sonos, Inc. Sum-difference arrays for audio playback devices

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
KR100335611B1 (ko) 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
JP2000151413A (ja) * 1998-11-10 2000-05-30 Matsushita Electric Ind Co Ltd オーディオ符号化における適応ダイナミック可変ビット割り当て方法
US6266782B1 (en) * 1998-11-30 2001-07-24 Siemens Information And Communication Networks, Inc. Apparatus and methods for inband protocol correction in distributed object networking
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
JP4244492B2 (ja) * 2000-03-24 2009-03-25 ソニー株式会社 情報処理装置、情報配信システム、情報処理方法、及び記録媒体
JP2001339311A (ja) * 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
US6718507B1 (en) * 2000-09-12 2004-04-06 At&T Corp. System and method for representing compressed information
JP2002175097A (ja) 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
DE60207731T2 (de) * 2001-08-03 2006-08-10 Koninklijke Philips Electronics N.V. Datenschutzsystem und -verfahren für audio-video übertragung
US8498422B2 (en) 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
ES2323294T3 (es) 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
KR101049751B1 (ko) 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US6903669B1 (en) * 2003-10-03 2005-06-07 Cirrus Logic, Inc. Systems and methods for decoding compressed data
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec

Also Published As

Publication number Publication date
CA2578190A1 (en) 2006-03-16
RU2007112113A (ru) 2008-10-20
US8145498B2 (en) 2012-03-27
NO338928B1 (no) 2016-10-31
IL181469A0 (en) 2007-07-04
MX2007002569A (es) 2007-07-05
HK1107174A1 (en) 2008-03-28
WO2006027138A1 (de) 2006-03-16
EP1763870B1 (de) 2014-03-05
PL1763870T3 (pl) 2014-08-29
EP1763870A1 (de) 2007-03-21
KR100908081B1 (ko) 2009-07-15
US20070219808A1 (en) 2007-09-20
NO20070903L (no) 2007-04-03
DE102004042819A1 (de) 2006-03-23
JP4856641B2 (ja) 2012-01-18
AU2005281937A1 (en) 2006-03-16
BRPI0515623A8 (pt) 2018-07-31
JP2008511848A (ja) 2008-04-17
CN101044550B (zh) 2011-05-11
CA2578190C (en) 2012-09-11
RU2379768C2 (ru) 2010-01-20
IL181469A (en) 2011-09-27
BRPI0515623B1 (pt) 2019-05-21
AU2005281937B2 (en) 2008-10-09
KR20070051875A (ko) 2007-05-18
BRPI0515623A (pt) 2008-07-29
CN101044550A (zh) 2007-09-26

Similar Documents

Publication Publication Date Title
ES2454670T3 (es) Generación de una señal multicanal codificada y decodificación de una señal multicanal codificada
US10455344B2 (en) Compatible multi-channel coding/decoding
ES2682073T3 (es) Codificación conjunta paramétrica de fuentes de audio
ES2306076T3 (es) Aparato y metodo para construir una señal de salida multicanal o para generar una señal de downmix.
ES2674819T3 (es) Transición de coeficientes ambisónicos ambientales de orden superior
ES2297825T3 (es) Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales.
ES2623365T3 (es) Compactación de información secundaria para la codificación paramétrica de audio espacial
ES2398573T3 (es) Número reducido de decodificación de canales
ES2307160T3 (es) Codificador multicanal.
ES2772851T3 (es) Mezcla de matriz basada en multipletes para audio de múltiples canales de alta cantidad de canales
ES2378734T3 (es) Codificación mejorada y representación de parámetros de codificación de objetos de mezcla descendente multicanal
ES2952871T3 (es) Concepto para puentear el espacio entre codificación parámetrica de audio multicanal y codificación multicanal envolvente matricial
ES2770146T3 (es) Conformación temporal y espacial de señales de audio multicanal
BR112016001141B1 (pt) Codificador de áudio, decodificador de áudio e métodos que usam sinais residuais codificados em conjunto
BRPI0605865B1 (pt) codificação hierárquica de áudio multicanais com informações colaterais compactas
BRPI0816557B1 (pt) Codificação de áudio usando upmix
TWI281356B (en) Device and method for generate a coded multi-channels signal and device and method for decode a coded multi-channels signal and recordable medium