ES2268340T3 - Representacion de audio parametrico de multiples canales. - Google Patents
Representacion de audio parametrico de multiples canales. Download PDFInfo
- Publication number
- ES2268340T3 ES2268340T3 ES03712597T ES03712597T ES2268340T3 ES 2268340 T3 ES2268340 T3 ES 2268340T3 ES 03712597 T ES03712597 T ES 03712597T ES 03712597 T ES03712597 T ES 03712597T ES 2268340 T3 ES2268340 T3 ES 2268340T3
- Authority
- ES
- Spain
- Prior art keywords
- information
- audio signal
- encoded
- signal
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 121
- 238000000034 method Methods 0.000 claims abstract description 24
- 210000005069 ears Anatomy 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 description 17
- 230000006872 improvement Effects 0.000 description 12
- 230000033228 biological regulation Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 3
- 238000005352 clarification Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 208000029523 Interstitial Lung disease Diseases 0.000 description 1
- 230000004308 accommodation Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Stereo-Broadcasting Methods (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Un método para codificar una señal de audio de múltiples canales, que comprende al menos dos canales de audio (RI, LI), de tal forma que el método comprende generar (1) una señal de audio (SC ¿"single channel") de un único canal, que comprende una combinación particular de los al menos dos canales de audio (RI, LI), y codificar la señal de audio de canal único (SC) en una corriente de bits (EBS), como una señal de audio de canal único codificada (ESC), generar (2) información (INF) a partir de los al menos dos canales de audio (RI, LI), que permite recuperar, con un nivel de calidad requerido, la señal de audio de múltiples canales a partir de la señal de audio de canal único (SC) y de la información (INF), de tal modo que la generación (2) de la información comprende: - determinar (2) una primera porción de la información (P1), que consiste en un único conjunto de parámetros (S1), determinados para una primera zona de frecuencias (FR1) de la señal de audio de múltiples canales, y codificarla primera porción de la información (P1) en la corriente bits (EBS), como una primera porción codificada de la información (EIN ¿"encoded information"), y - determinar (2) una segunda porción de la información (P2) para una segunda zona de frecuencias (FR2) de la señal de audio de múltiples canales, de tal modo que la segunda zona de frecuencias (FR2) es una porción de la primera zona de frecuencias (FR1), y codificar la segunda porción de la información (P2) dentro de la corriente de bits (EBS), como una segunda porción codificada de la información (EIN).
Description
Representación de audio paramétrico de múltiples
canales.
La invención se refiere a un método para
codificar una señal de audio de múltiples canales, a un codificador
para codificar una señal de audio de múltiples canales, a un aparato
para suministrar una señal de audio, a una señal de audio
codificada, a un medio de almacenamiento en el que se almacena la
señal de audio codificada, a un método para descodificar una señal
de audio codificada, a un descodificador para descodificar una señal
de audio codificada, y a un aparato para suministrar una señal de
audio descodificada.
El documento
EP-A-1107232 describe un esquema de
codificación paramétrica destinado a generar una representación de
una señal de audio estéreo que está compuesta por una señal de canal
izquierdo y una señal de canal derecho. Con el fin de utilizar
eficazmente la anchura de banda de transmisión, dicha representación
contiene información concerniente únicamente a una señal
mono-auditiva, o para un único oído, que es, bien la
señal del canal izquierdo o bien la señal del canal derecho, e
información paramétrica. La otra señal estéreo puede ser recuperada
basándose en la señal mono-auditiva, conjuntamente
con la información paramétrica. La información paramétrica comprende
indicaciones de localización de la señal de audio estéreo, que
incluyen características de intensidad y de fase del canal
izquierdo y del canal derecho.
La publicación "Codificación en
sub-banda de señales de audio digitales
estereofónicas" ("Subband Coding of Stereophonic Digital Audio
Signals"), de R. van der Waal, R. Veldhuis, Philips Reserch
Laboratories, en el IEEE (Instituto de Ingeniería Eléctrica y
Electrónica), 1991, vol. 2, páginas 3.601-3.604
(ISBN:
0-7803-0003-3),
describe un algoritmo de codificación en sub-banda.
En tales algoritmos de codificación en sub-banda, el
espectro de frecuencias que se ha de codificar se divide en
sub-bandas que no se superponen. La codificación se
realiza por cada sub-banda. La codificación por
sub-banda incluye una transformación rotacional.
Las soluciones previas que se han sugerido en
los codificadores de audio para reducir la velocidad de bits del
material de programa estéreo incluyen estéreo de intensidad y
estéreo de M/S.
En el algoritmo de estéreo de intensidad, las
altas frecuencias (típicamente por encima de 5 kHz) se representan
por una única señal de audio (es decir, mono), combinada con
factores de escala o factores de intensidad que varían con el
tiempo y dependientes de la frecuencia, lo que permite recuperar una
señal de audio descodificada que se parece a la señal estéreo
original para estas zonas de frecuencia. En el algoritmo de M/S, la
señal se descompone en una señal de suma (o media, o común) y una
señal de diferencia (o lateral, o no común). Esta descomposición se
combina, en ocasiones, con análisis de componentes de principio o
con factores de escala que varían con el tiempo. Estas señales se
codifican entonces de manera independiente, ya sea por un
codificador de transformación o por un codificador de
sub-banda [los cuales son, ambos, codificadores de
forma o perfil de onda]. La cantidad o magnitud de la reducción de
información que se consigue por este algoritmo depende fuertemente
de las propiedades espaciales de la señal de fuente. Por ejemplo, si
la señal de fuente es mono-auditiva, la señal de
diferencia es cero y puede ser desechada. Sin embargo, si la
correlación entre las señales de audio izquierda y derecha es baja
(lo cual es a menudo el caso para las zonas de frecuencias más
bajas), este esquema ofrece tan solo una pequeña reducción de la
velocidad de bits. Para las zonas de frecuencias bajas, la
codificación de M/S proporciona generalmente un mérito
significativo.
Las descripciones paramétricas de las señales de
audio han venido ganando interés durante los últimos años,
especialmente en el campo de la codificación de audio. Se ha
demostrado que la transmisión de parámetros (cuantificada) que
describen señales de audio requiere tan solo una pequeña capacidad
de transmisión para volver a sintetizar una señal perceptivamente
igual en el extremo o terminal receptor. Sin embargo, los
codificadores de audio paramétricos actuales se concentran en la
codificación de señales mono-auditivas, y las
señales estéreo se procesan o tratan como señales mono dobles.
Es un propósito de la invención proporcionar un
sistema de audio paramétrico de múltiples canales que sea capaz de
regular en escala la calidad de la señal de audio codificada con la
velocidad de bits disponible, o de regular en escala la calidad de
la señal de audio descodificada, con la complejidad del
descodificador o la anchura de banda de trasmisión disponible.
Un primer aspecto de la invención proporciona un
método para codificar una señal de audio de múltiples canales,
según se reivindica en la reivindicación 1. Un segundo aspecto de la
invención proporciona un codificador destinado a codificar una
señal de audio de múltiples canales, según se reivindica en la
reivindicación 13. Un tercer aspecto de la invención proporciona
una señal de audio codificada según se reivindica en la
reivindicación 16. Un cuarto aspecto de la invención proporciona un
medio de almacenamiento en el que se almacena la señal codificada,
y se reivindica en la reivindicación 17. Un quinto aspecto de la
invención proporciona un método de descodificación, según se
reivindica en la reivindicación 18. Un sexto aspecto de la invención
proporciona un descodificador para descodificar una señal de audio
codificada, según se reivindica en la reivindicación 19.
Realizaciones ventajosas se definen en las reivindicaciones
dependientes.
En el método de codificación de una señal de
audio de múltiples canales, de acuerdo con el primer aspecto de la
invención, se genera una señal de audio de un único canal. Por otra
parte, se genera información a partir de la señal de la señal de
audio de múltiples canales, que permite la recuperación, con un
nivel de calidad requerido, de la señal de audio de múltiples
canales a partir de la señal de audio de canal único y de la
información. Preferiblemente, la información comprende conjuntos de
parámetros, por ejemplo, según se conoce por el documento
EP-A-1107232.
De acuerdo con el primer aspecto de la
invención, la información se genera determinando una primera porción
de la información para una primera zona de frecuencias de la señal
de audio de múltiples canales, y determinando una segunda porción
de la información para una segunda zona de frecuencias de la señal
de audio de múltiples canales. La segunda zona de frecuencias es
una porción de la primera zona de frecuencias y, por tanto,
constituye un sub-intervalo o intervalo incluido en
la primera zona de frecuencias. Ahora, son posibles dos niveles de
calidad en la descodificación. Para un nivel de calidad baja de la
señal de audio de múltiples canales descodificada, el
descodificador se sirve de la señal de audio de canal único
codificada, y de la primera porción de la información. Para un
nivel de calidad superior, el descodificador utiliza la señal de
audio de canal único codificada y tanto la primera como la segunda
porciones de la información. Por supuesto, es posible seleccionar la
calidad de la descodificación de entre una multiplicidad de
niveles, si está presente una multiplicidad de porciones de
información de tal manera que cada una de ellas está asociada con
una zona de frecuencias diferente. Por ejemplo, la primera porción
puede comprender un único conjunto de parámetros determinado, con
una zona de frecuencias que cubre la totalidad de la anchura de
banda de la señal de audio de múltiples canales. Y la segunda
porción puede comprender diversos conjuntos de parámetros, de tal
modo que cada conjunto de parámetros está determinado por un
sub-intervalo o porción de toda la anchura de banda.
Conjuntamente, las porciones cubren, de preferencia, toda la
anchura de banda.
Esta representación de la señal de audio
codificada permite que la calidad de la señal de audio descodificada
dependa de la complejidad del descodificador. Por ejemplo, en un
sencillo descodificador portátil puede utilizarse un descodificador
de baja complejidad que tenga un consumo de potencia bajo y que, en
consecuencia, sea capaz de utilizar tan solo una parte de la
información. En una aplicación de tope de gama se utiliza un
descodificador complejo que se sirve de toda la información
disponible en la señal codificada.
La calidad del audio descodificado puede
depender también de la anchura de banda de transmisión disponible.
Si la anchura de banda de transmisión es alta, entonces el
descodificador puede descodificar todas las capas disponibles, ya
que son, todas ellas, transmitidas. Si la anchura de banda de
transmisión es baja, entonces el transmisor puede decidir
transmitir únicamente un número de capas limitado.
En una realización según se define en la
reivindicación 2, el codificador recibe una velocidad de bits máxima
permisible de la señal de audio de múltiples canales codificada.
Esta velocidad de bits máxima permisible puede estar definida por
la velocidad de bits disponible de un canal de transmisión tal como
la Internet, o de un medio de almacenamiento. En aplicaciones en
las que la anchura de banda de transmisión es variable y, por
tanto, la máxima velocidad de bits permisible cambia con el tiempo,
es importante ser capaz de adaptarse a estas fluctuaciones de la
anchura de banda de transmisión con el fin de evitar una calidad muy
baja de la señal de audio descodificada. Normalmente, el
codificador codifica todas las capas disponibles. Se decide en el
terminal transmisor qué capas de han de transmitir, dependiendo de
la capacidad de los canales disponibles. Es posible hacer esto con
el codificador en el bucle, pero ello es más complicado que
separando o desprendiendo algunas capas antes de la
transmisión.
El codificador añade tan solo la segunda porción
de la información para la segunda zona de frecuencias de la señal
de audio de múltiples canales, a la señal de audio codificada, en el
caso de que una velocidad de bits de la señal de audio de múltiples
canales codificada, que comprende la señal de audio de canal único,
y las primera y segunda porciones de la información no sean
superiores a la máxima velocidad de bits permisible. De esta forma,
la segunda porción no está presente en la señal de audio codificada
si la anchura de banda de transmisión no es lo suficientemente
grande como para dar soporte a la transmisión de la segunda
porción.
En una realización según se define en la
reivindicación 3, la información comprende conjuntos de parámetros,
de tal modo que cada una de las porciones de la información está
representada por uno o más conjuntos de parámetros. El número de
conjuntos de parámetros depende del número de zonas de frecuencias
presentes en las porciones de la información.
En una realización según se define en la
reivindicación 4, los conjuntos de parámetros comprenden al menos
una de las indicaciones de localización.
En una realización según se define en la
reivindicación 6, la primera zona de frecuencias cubre
sustancialmente toda la anchura de banda de la señal de audio de
múltiples canales. De esta forma, basta un conjunto de parámetros
para proporcionar la información básica que se requiere para
descodificar la señal de audio de único canal en la señal de audio
de múltiples canales. Se garantiza de esta forma un nivel básico de
calidad de la señal de audio. El segundo intervalo de frecuencias
cubre parte de la anchura de banda completa. De este modo, la
segunda porción, cuando está presente en la señal de audio
codificada, mejora la calidad de la señal de audio descodificada en
este intervalo de frecuencias.
En una realización según se define en la
reivindicación 7, la segunda porción de la información comprende al
menos dos intervalos de frecuencias que, conjuntamente, cubren de
manera sustancial toda la anchura de banda de la señal de audio de
múltiples canales. De esta forma, la mejora en la calidad
proporcionada por la segunda porción está presente a lo largo de la
anchura de banda completa.
En una realización según se define en la
reivindicación 8, la capa de base que comprende la señal de audio
de canal único y la primera porción de la información, está siempre
presente en la señal de audio codificada. La capa de mejora que
comprende la segunda porción de la información, es codificada
únicamente si la velocidad de bits de la segunda señal de audio no
excede la velocidad de bits máxima permisible. De esta forma, la
calidad de la señal de audio descodificada dependerá de la
velocidad de bits máxima permisible. Si la velocidad de bits máxima
permisible es demasiado baja como para proporcionar acomodo a la
capa de mejora, la señal de audio descodificada se obtendrá a
partir de la capa de base, lo que producirá una mejor calidad del
audio descodificado que la que se dará en el caso de que partes
impredecibles del audio codificado no lleguen al descodificador.
En las realizaciones según se define en una
cualquiera de las reivindicaciones 9-11, las
porciones de la información (que contienen habitualmente conjuntos
de parámetros, un conjunto para cada banda de frecuencias
representada) contenidas en una trama siguiente son codificadas
basándose en los parámetros de la trama previa. Normalmente, esto
reduce la velocidad de bits de las porciones codificadas de la
información, debido a que, como consecuencia de la correlación, la
información contenida en dos tramas sucesivas no diferirá
sustancialmente.
En las realizaciones según se define en la
reivindicación 12, la diferencia entre los parámetros de dos tramas
sucesivas es codificada en lugar de los parámetros en sí.
Estos y otros aspectos de la invención se
pondrán de manifiesto a partir de las realizaciones que se describen
en lo que sigue, y se aclararán con referencia a las mismas.
En los dibujos:
la Figura 1 muestra un diagrama de bloques de un
codificador de múltiples canales para audio estéreo,
la Figura 2 muestra un diagrama de bloques de un
descodificador de múltiples canales para audio estéreo,
la Figura 3 muestra una representación de la
corriente de datos codificada,
la Figura 4 ilustra una realización de los
intervalos de frecuencias de acuerdo con la invención,
la Figura 5 muestra otra realización de los
intervalos de frecuencias de acuerdo con la invención,
la Figura 6 ilustra la determinación de los
conjuntos de parámetros basándose en parámetros de una trama previa,
de acuerdo con una realización de la invención,
la Figura 7 muestra un conjunto de
parámetros,
la Figura 8 muestra la determinación diferencial
de los parámetros de la capa de base, y
la Figura 9 ilustra la determinación diferencial
de los parámetros correspondientes a una zona de frecuencias de una
capa de mejora.
La Figura 1 muestra un diagrama de bloques de un
codificador de múltiples canales. El codificador recibe una señal
de audio de múltiples canales que se muestra como una señal estéreo
RI, LI, el codificador suministra la señal de audio de múltiples
canales codificada EBS.
El mezclador de sentido descendente 1 combina la
señal estéreo o los canales estéreo RI, LI en una señal de audio de
un único canal (a la que se hace también referencia como señal
mono-auditiva) SC. Por ejemplo, el mezclador de
sentido descendente 1 puede determinar el promedio de las señales de
audio de entrada RI, LI.
El codificador 2 codifica la señal
mono-auditiva SC para obtener una señal
mono-auditiva codificada ESC. El codificador 3
puede ser de un tipo conocido, por ejemplo, un codificador de MPEG
(MPEG-LII, MPEG-LIII (mp3), o
MPEG2-AAC).
El circuito 2 de determinación de parámetros
determina los conjuntos de parámetros S1, S2, ... que caracterizan
la información INF, basándose en las señales de audio de entrada RI,
LI. Opcionalmente, el circuito 2 de determinación de parámetros
recibe la máxima velocidad de bits permisible MBR ("maximum bit
rate") con el fin de determinar únicamente los conjuntos de
parámetros S1, S2, ..., los cuales, una vez codificados por el
codificador 4 de parámetros, conjuntamente con la señal
mono-auditiva codificada ESC, no exceden la
velocidad de bits máxima permisible MBR. Los parámetros codificados
se denotan por EIN.
El dispositivo de formateado 5 combina la señal
mono-auditiva codificada SC ("single channel")
y los parámetros codificados EIN en una corriente de datos de un
formato deseado, a fin de obtener la señal de audio de múltiples
canales codificada EBS.
El funcionamiento del codificador se aclara con
mayor detalle en lo que sigue a continuación, a modo de ejemplo,
con respecto a una realización. La señal de audio de múltiples
canales LI, RI se codifica en una única señal
mono-auditiva SC (a la que se hace referencia
también adicionalmente como señal de audio de canal único). La
parametrización o cuantificación en parámetros de atributos
espaciales de las señales de audio de múltiples canales LI, RI se
lleva a cabo por parte del circuito 2 de determinación de
parámetros. Los parámetros contienen información acerca del modo
como restaurar o restituir la señal de audio de múltiples canales
LI, RI a partir de la señal mono-auditiva SC. Los
parámetros son habitualmente codificados por el codificador de
parámetros 4, antes de combinarlos con la señal
mono-auditiva individual codificada ESC ("encoded
single channel"). De esta forma, para las aplicaciones generales
de codificación de audio, se transmiten o almacenan estos
parámetros, combinados con una única señal de audio
mono-auditiva. La señal codificada y combinada es la
señal de audio de múltiples canales codificada EBS. La capacidad de
transmisión o almacenamiento necesaria para transmitir o almacenar
la señal de audio de múltiples canales codificada EBS, se ve
fuertemente reducida en comparación con codificadores de audio que
procesan o tratan independientemente los múltiples canales. Sin
embargo, la impresión espacial original se mantiene por medio de la
información INF, que contiene los (conjuntos de) parámetros.
En particular, la descripción paramétrica del
audio de múltiples canales RI, LI está relacionada con un modelo de
procesamiento bi-auditivo (o de los dos oídos) que
se encamina a la descripción del procesamiento de señal efectivo
del sistema auditivo de dos oídos.
El modelo divide el audio entrante LI, RI en
varias señales limitadas en banda, las cuales, preferiblemente,
están separadas linealmente en una escala de velocidades ERB. La
anchura de banda de estas señales depende de la frecuencia central,
siguiendo a la velocidad ERB. De manera subsiguiente, se analizan,
preferiblemente, para cada banda de frecuencias, las siguientes
propiedades de las señales entrantes:
- la diferencia de niveles
inter-auditivos o entre oídos, o ILD ("interaural
level difference"), definida por los niveles relativos de la
señal limitada en banda que se origina en los oídos izquierdo y
derecho,
- la diferencia de tiempos (o fases)
inter-auditivos o entre oídos, ITD ("interaural
time difference") (o IPD -"interaural phase difference"),
definida por el retardo entre oídos (o desplazamiento de fase)
correspondiente al pico de la función de correlación transversal
entre oídos, y
- la similitud (disimilitud) de las formas de
onda que no es achacable a las ITDs o las ILDs, la cual puede ser
cuantificada como parámetro por medio de la máxima correlación
transversal entre oídos, IC (por ejemplo, el valor de la
correlación transversal en la posición del pico máximo).
Los conjuntos S1, S2, ... de los tres
parámetros, una vez establecidos para cada banda de frecuencias FR1,
FR2, ..., varían a lo largo del tiempo. Sin embargo, puesto que el
sistema auditivo de dos oídos es muy lento en su procesamiento, la
velocidad de actualización de estas propiedades es bastante baja
(típicamente, de decenas de milisegundos).
Puede suponerse que los parámetros que varían
(lentamente) con el tiempo son las únicas propiedades de señal
espaciales de las que dispone el sistema auditivo de dos oídos, y
que, a partir de estos parámetros dependientes del tiempo y de la
frecuencia, el mundo auditivo percibido se reconstruye por los
niveles superiores del sistema auditivo.
La Figura 2 muestra un diagrama de bloques de un
descodificador de múltiples canales. El descodificador recibe la
señal de audio de múltiples canales codificada EBS y suministra la
señal de audio de múltiples canales descodificada que ha
recuperado, la cual se muestra como una señal estéreo RO, LO.
El dispositivo 6 de supresión de formateado
recupera la señal mono-auditiva codificada ESC' y
los parámetros codificados EIN' de la corriente de datos EBS. El
descodificador 7 descodifica la señal mono-auditiva
codificada ESC' para obtener la señal mono-auditiva
de salida SCO. El descodificador 7 puede ser de cualquier tipo
conocido (por supuesto, en correspondencia con el codificador que
se ha utilizado); por ejemplo, el descodificador 7 es un
descodificador de MPEG. El descodificador 8 descodifica los
parámetros codificados EIN' para obtener parámetros de salida
INO.
El desmultiplexador 9 recupera las señales de
audio estéreo de salida LO y RO mediante la aplicación de los
conjuntos de parámetros S1, S2, ... de los parámetros de salida INO
en la señal mono-auditiva de salida SCO.
La Figura 3 muestra una representación de la
corriente de datos codificados. Por ejemplo, en cada trama F1, F2,
..., el paquete de datos comienza con un encabezamiento H, seguido
de la señal mono-auditiva codificada ECS, ahora
indicada por A, una primera porción P1 de la información codificada
EIN, una segunda porción P2 de la información codificada EIN, y una
tercera porción P3 de la información codificada EIN.
Si la trama F1, F2, ... comprende únicamente el
encabezamiento H y la señal mono-auditiva codificada
ECS, tan solo se transmite la señal mono-auditiva
SC.
Como se ha descrito en el documento
EP-A-1107232, la banda de
frecuencias completa en la que tiene lugar la señal de audio de
entrada, se divide en una pluralidad de sub-bandas
de frecuencias, las cuales cubren, conjuntamente, la banda de
frecuencias completa. En la terminología de acuerdo con la
invención, la información INF de múltiples canales se codifica en
una pluralidad de conjuntos de parámetros S1, S2, ..., un conjunto
para cada sub-banda de frecuencias FR1, FR2, ...
Esta pluralidad de conjuntos de parámetros S1, S2, ... se codifica
en la primera porción P1 de la información codificada EIN. De esta
forma, con el fin de transmitir una señal de audio de múltiples
canales de calidad de nivel básico, la corriente de bits comprende
el encabezamiento H, la porción A, que es la señal
mono-auditiva codificada, y la primera porción
P1.
En la corriente de bits de acuerdo con una
realización de la invención, la primera porción P1 consiste, tan
solo, en un único conjunto S1 de parámetros. El conjunto único es
determinado para la anchura de banda completa FR1. Esta corriente
de datos, que comprende el encabezamiento H y las porciones A y P1,
proporciona una capa básica de calidad, indicada por BL en la
Figura 3.
Con el fin de dar soporte a una calidad
mejorada, están presentes en la corriente de datos porciones
adicionales de P2, P3 de la información codificada EIN. Estas
porciones adicionales forman una capa de mejora EL ("enhancement
layer"). La corriente de bits puede comprender una única porción
adicional P2 o más de 1 porción adicional. La porción adicional P2
comprende, preferiblemente, una pluralidad de conjuntos de
parámetros S2, S3, ..., un conjunto para cada
sub-banda de frecuencias FR2, FR3, ..., de tal modo
que las sub-bandas de frecuencia FR2, FR3 cubren,
preferiblemente, toda la banda de frecuencias FR1. La calidad
mejorada puede también estar presente de un modo paso a paso, de
manera que un primer nivel de mejora se proporciona por la capa de
mejora EL1, que comprende la primera porción. Y una segunda capa de
mejora EL comprende la primera capa de mejora EL1 y la segunda capa
de mejora EL2, que comprende la porción P3.
La porción adicional P2 puede también comprender
un único conjunto S2 de parámetros correspondientes a una única
banda de frecuencias FR2, que es una sub-banda de la
banda de frecuencias completa FR1. La porción adicional P2 puede
comprender también un cierto número de conjuntos de parámetros S2,
S3, ... que corresponden a las bandas de frecuencia FR2, FR3, ...
que no cubren, conjuntamente, toda la banda de frecuencias FR1
completa.
La porción adicional P3 contiene,
preferiblemente, conjuntos de parámetros para bandas de frecuencia
que sub-dividen al menos una de las
sub-bandas de la porción adicional P2.
Este formato de la corriente de bits de acuerdo
con la invención permite regular en escala, en el canal de
transmisión o en el descodificador, la calidad de la señal de audio
descodificada, con la velocidad de bits del canal de transmisión, o
con la complejidad de descodificación del descodificador. Por
ejemplo, si el descodificador de audio ha de tener un consumo de
potencia bajo, como es importante en las aplicaciones portátiles, el
descodificador puede tener una complejidad baja y utiliza
únicamente las porciones H, A y P1. Sería posible incluso que el
descodificador fuera capaz de llevar a cabo operaciones más
complejas con un consumo de potencia más alto, en el caso de que el
usuario indicase que desea una calidad más alta del audio
descodificado.
Es también posible que el descodificador esté al
tanto de la velocidad de bits máxima permisible, MBR, que puede ser
transmitida a través del canal de transmisión o que puede ser
almacenada en un medio de almacenamiento. Ahora, el codificador es
capaz de decidir acerca de cuántas porciones adicionales P1, P2,
..., si es que hay alguna, caben dentro de la máxima velocidad de
bits permisible MBR. El codificador codifica únicamente estas
porciones permisibles P1, P2, ... de la corriente de bits.
La Figura 4 muestra una realización de los
intervalos de frecuencias de acuerdo con la invención. En esta
realización, la banda de frecuencias FR1 es igual a la banda de
frecuencias completa FBW ("full bandwidth") de la señal de
audio de múltiples canales LI, RI, y la banda de frecuencias FR2 es
una sub-banda de frecuencias de la anchura de banda
completa FBW.
Si éstos son los únicos intervalos de
frecuencias para los que se determinan los conjuntos de parámetros
S1, S2, ..., se determina un único conjunto de parámetros S1 para
la banda de frecuencias FR1 y está presente en la porción P1, y se
determina un único conjunto de parámetros S2 para la banda de
frecuencias FR2, y está presente en la porción P2. La regulación en
escala de la calidad es posible, bien utilizando la porción P2 ó
bien no utilizándola.
La Figura 5 muestra otra realización de los
intervalos de frecuencias de acuerdo con la invención. En esta
realización, la banda de frecuencias FR1 es de nuevo igual a la
anchura de banda completa FBW, y las sub-bandas de
frecuencias FR2 y FR3 cubren, conjuntamente, la anchura de banda
completa FBW. O, dicho en otras palabras, la banda de frecuencias
FR1 se subdivide en las sub-bandas de frecuencias
FR2 y FR3.
En el caso de que éstos sean los únicos
intervalos de frecuencias para los que se determinan los conjuntos
de parámetros S1, S2, ..., la porción P1 comprende un único conjunto
de parámetros S1, determinado por la banda de frecuencias FR1, y la
porción P2 comprende dos conjuntos de parámetros S2 y S3,
determinados, respectivamente, por las bandas de frecuencias FR2 y
FR3. La regulación en escala de la calidad es posible tanto
utilizando la porción P2 como no utilizándola.
La Figura 6 muestra la determinación de los
conjuntos de parámetros basándose en parámetros contenidos en una
trama previa, de acuerdo con una realización de la invención.
La Figura 6 muestra una corriente de datos que
comprende, en cada trama F1, F2, ..., la información codificada
EIN, que comprende la porción P1, que es una parte de la capa de
base BL, y la porción P2, que forma la capa de mejora EL.
En la trama F1, la porción P1 comprende un único
conjunto de parámetros S1 que son determinados para la anchura de
banda completa FR1. La porción P2, a modo de ejemplo, comprende
cuatro conjuntos de parámetros S2, S3, S4, S5 que se determinan,
respectivamente, para las sub-bandas de frecuencias
FR2, FR3, FR4, FR5. Las cuatro sub-bandas de
frecuencias FR2, FR3, FR4, FR5 sub-dividen la banda
de frecuencias FR1.
En la trama F2, que sucede a la trama F1, la
porción P1 comprende un único conjunto de parámetros S1' que se
determinan para la anchura de banda completa FR1 y forman parte de
la capa de base BL'. La porción P2 comprende cuatro conjuntos de
parámetros S2', S3', S4', S5' que son de nuevo determinados,
respectivamente, para las sub-bandas de frecuencia
FR2, FR3, FR4, FR5 y que forman la capa de mejora EL'.
Es posible codificar cada uno de estos conjuntos
de parámetros S1, S2, ... para cada una de las tramas F1, F2, ...
por separado. Es también posible codificar los conjuntos de
parámetros de la porción P2 con respecto a los parámetros de la
porción P1. Esto se indica por las flechas que comienzan en S1 y
terminan en S2 a S5, en la trama F1. Por supuesto, esto es también
posible en otras tramas F2, ... (no mostradas). De la misma manera,
es posible codificar el conjunto de parámetros S1' con respecto a
S1. Y finalmente, los conjuntos de parámetros S2', S3', S4', S5'
pueden ser codificados con respecto a los conjuntos de parámetros
S2, S3, S4, S5.
De esta forma, la velocidad de bits de la
información codificada EIN puede ser reducida en la medida en que
se utiliza la redundancia o correlación entre conjuntos de
parámetros Si.
Preferiblemente, los nuevos parámetros de los
nuevos conjuntos de parámetros S1', S2', S3', S4', S5' se codifican
como la diferencia entre su valor y el valor de los parámetros de
los conjuntos de parámetros previos S1, S2, S3, S4, S5.
A intervalos de tiempo uniformes, se ha de
codificar al menos el conjunto de parámetros S1 de forma absoluta y
no diferencial, a fin de evitar que los errores se propaguen
demasiado lejos.
La Figura 7 muestra un conjunto de parámetros.
Cada conjunto de parámetros Si puede comprender uno o más
parámetros. Habitualmente, los parámetros son indicaciones de
localización que proporcionan información acerca de la localización
de objetos sonoros en la información de audio. Por lo común, las
indicaciones de localización consisten en la diferencia de niveles
inter-auditivos, o entre oídos, ILD, en la
diferencia de tiempos inter-auditivos o de fases
inter-auditivas, ITD o IPD, y en la correlación
transversal inter-auditiva, o entre oídos, IC
("interaural cross-correlation"). Una
información más detallada acerca de estos parámetros se proporciona
en la Publicación de la Convención de la Sociedad de Ingería de
Audio ("Audio Engineering Society Convention Paper") 5574,
"Codificación de indicaciones bi-auditivas, o de
los dos oídos, aplicada a la compresión de audio estéreo y de
múltiples canales" ("Binaural Cue Coding Applied to Stereo and
Multi-channel Audio Compression"), presentada en
la 112ª Convención, del 10 al 13 de mayo de 2002 en Munich,
Alemania, por Christof Faller et al.
La Figura 8 muestra la determinación diferencial
de un parámetro de la capa de base. El eje horizontal indica tramas
sucesivas F1 a F5. El eje vertical muestra el valor PVG de un
parámetro del conjunto de parámetros S1 de la capa de base BL
("base layer"). Este parámetro tiene los valores A1 a A5 para
las tramas F1 a F5, respectivamente. La contribución de este
parámetro a la velocidad de bits de la información codificada EIN
disminuirá si no se codifican los valores reales A1 a A5 del
parámetro, sino las diferencias, más pequeñas, D1, D2, ...
La Figura 9 muestra la determinación diferencial
de los parámetros correspondientes a una zona de frecuencias de una
capa de mejora. El eje horizontal indica dos tramas sucesivas F1 y
F2. El eje vertical indica los valores de un parámetro particular
de la capa de base BL y de la capa de mejora EL. En este ejemplo, la
capa de base BL comprende la porción P1 de información INF con un
único conjunto de parámetros, determinado para el intervalo de
frecuencias completo FBW, de tal manera que el parámetro particular
de la porción P1 tiene el valor A1 para la trama F1 y A2 para la
trama F2. La capa de mejora EL comprende la porción P2 de
información INF con tres conjuntos de parámetros determinados para
tres intervalos de frecuencias respectivos FR2, FR3, FR4 que,
conjuntamente, llenan el intervalo de frecuencias completo FBW. Los
tres parámetros particulares (por ejemplo, el parámetro que
representa la ILD) tienen un valor B11, B12, B13 en la trama F1 y un
valor B21, B22, B23 en la trama F2.
La contribución de estos parámetros a la
velocidad de bits de la información codificada EIN se reducirá si
no se codifican los verdaderos valores B11 a B23 del parámetro
particular, sino las diferencias D11, D12, ..., debido a que estas
diferencias pueden ser codificadas más eficazmente que los
verdaderos valores.
En resumen, en una realización preferida de
acuerdo con la invención, se propone organizar la información de
parámetros estéreo INF de tal manera que una capa de base BL
contiene uno de los conjuntos de parámetros (preferiblemente, la
diferencia de tiempos/niveles y la correlación) S1, que se determina
para la anchura de banda completa FBW de la señal de audio de
múltiples canales LI, RI. La capa de mejora EL contiene múltiples
conjuntos de parámetros S2, S3, ... que corresponden a intervalos de
frecuencia subsiguientes FR2, FR3 dentro de la anchura de banda
completa FBW. En aras a la eficacia en cuanto a la velocidad de
bits, los conjuntos de parámetros S2, S3, ... de la capa de mejora
EL pueden ser codificados de forma diferencial con respecto al
conjunto de parámetros S1 situado en la capa de base BL.
\newpage
La información INF se codifica de una manera
estructurada en múltiples capas, a fin de permitir una regulación
en escala de la calidad de la descodificación frente a la velocidad
de bits.
Para concluir, en lo que sigue a continuación,
se elucida una realización preferida de acuerdo con la invención,
con respecto a un código de programa y a su explicación o
aclaración.
En primer lugar se determinan, para todas las
tramas subordinadas o sub-tramas (las porciones P1,
P2, ...) contenidas en las tramas F1, F2, ..., los datos ESC para
la representación mono-auditiva, o de un solo oído,
SC, los datos EIN para el conjunto de parámetros estéreo S1 para la
anchura de banda completa FBW, y los parámetros estéreo S2, S3, ...
para los contenedores (o regiones) de frecuencias FR2, FR3, ...
El código de programa se muestra en el lado
izquierdo, y se proporciona, en el lado derecho, una aclaración del
código de programa que se describe.
En segundo lugar, dependiendo del valor del bit
refrescar_estéreo, se codifican de manera absoluta los parámetros
estéreo para la anchura de banda completa (se codifica el valor real
o verdadero), o bien se codifica la diferencia con los valores
previos. El siguiente código es válido para la diferencia de niveles
inter-auditivos, o entre ambos oídos, ILD.
En tercer lugar, dependiendo del valor del bit
refrescar_estéreo, se codifican de forma absoluta los parámetros
estéreo para todos los contenedores de frecuencias (se codifica el
valor real o verdadero), o bien se codifica la diferencia con los
parámetros correspondientes para la anchura de banda completa. El
siguiente código es válido para la diferencia de niveles
inter-auditivos, o entre los dos oídos, ILD.
Donde:
La expresión "refrescar_estéreo" es un
indicador que denota si se han de refrescar o no los parámetros
estéreo (0 = FALSO, 1 = VERDADERO).
\newpage
La expresión "ild_global[sf]"
representa el nivel de representación absoluto codificado de Huffman
de la ILD para toda el área de frecuencias para la trama f.
La expresión "ild_global_dif[f]"
representa el nivel de representación relativo codificado de Huffman
de la ILD para toda el área de frecuencias para la trama f.
La expresión "ild_contenedor[f, b]"
representa el nivel de representación absoluto codificado de Huffman
de la ILD para la trama f y el contenedor b.
La expresión "ild_contenedor_dif[f,
b]" representa el nivel de representación relativo codificado de
Huffman de la ILD para la trama f y el contenedor b.
Ha de apreciarse que las realizaciones
anteriormente mencionadas ilustran la invención en lugar de
limitarla, y que los expertos de la técnica serán capaces de
diseñar muchas realizaciones alternativas sin apartarse del ámbito
de las reivindicaciones que se acompañan.
Si bien la invención se ha elucidado en las
figuras en relación con una señal estéreo, la extensión a una señal
de audio de más de dos canales puede llevarse a cabo fácilmente por
parte de la persona experta.
En las reivindicaciones, cualesquiera símbolos
de referencia situados entre paréntesis no se han de interpretar
como limitativos de la reivindicación. La expresión "que
comprende" no excluye la presencia de elementos o etapas
diferentes de los que se listan en una reivindicación. La invención
puede llevarse a la práctica por medio de dispositivos físicos o
hardware que comprende diversos elementos diferentes, y por medio de
una computadora adecuadamente programada. En la reivindicación de
dispositivo que enumera diversos medios, varios de estos medios
pueden materializarse por medio de un mismo elemento de hardware. El
mero hecho de que se mencionan ciertas medidas en reivindicaciones
dependientes distancias unas de otras no indica que no se pueda
utilizar de forma ventajosa una combinación de estas medidas.
En suma, las señales de audio de múltiples
canales se codifican en una señal de audio
mono-auditiva, o para un solo oído, y en
información, lo que permite recuperar la señal de audio de múltiples
canales a partir de la señal de audio mono-auditiva
y de la información. La información se genera determinando una
primera porción de la información para una primera zona de
frecuencias de la señal de audio de múltiples canales, y
determinando una segunda porción de la información para una segunda
zona de frecuencias de la señal de audio de múltiples canales. La
segunda zona de frecuencias es una porción de la primera zona de
frecuencias y, por tanto, constituye un
sub-intervalo de la primera zona de frecuencias. La
información está estructurada en múltiples capas, lo que permite
una regulación en escala de la calidad de la descodificación frente
a la velocidad de bits.
Claims (20)
1. Un método para codificar una señal de
audio de múltiples canales, que comprende al menos dos canales de
audio (RI, LI), de tal forma que el método comprende
generar (1) una señal de audio (SC -"single
channel") de un único canal, que comprende una combinación
particular de los al menos dos canales de audio (RI, LI), y
codificar la señal de audio de canal único (SC) en una corriente de
bits (EBS), como una señal de audio de canal único codificada
(ESC),
generar (2) información (INF) a partir de los al
menos dos canales de audio (RI, LI), que permite recuperar, con un
nivel de calidad requerido, la señal de audio de múltiples canales a
partir de la señal de audio de canal único (SC) y de la información
(INF), de tal modo que la generación (2) de la información
comprende:
- -
- determinar (2) una primera porción de la información (P1), que consiste en un único conjunto de parámetros (S1), determinados para una primera zona de frecuencias (FR1) de la señal de audio de múltiples canales, y codificar la primera porción de la información (P1) en la corriente bits (EBS), como una primera porción codificada de la información (EIN -"encoded information"), y
- -
- determinar (2) una segunda porción de la información (P2) para una segunda zona de frecuencias (FR2) de la señal de audio de múltiples canales, de tal modo que la segunda zona de frecuencias (FR2) es una porción de la primera zona de frecuencias (FR1), y codificar la segunda porción de la información (P2) dentro de la corriente de bits (EBS), como una segunda porción codificada de la información (EIN).
2. Un método para codificar una señal de
audio de múltiples canales, de acuerdo con la reivindicación 1, que
comprende adicionalmente:
determinar únicamente (2) la segunda porción de
la información (P2) para la segunda zona de frecuencias (FR2) de la
señal de audio de múltiples canales en el caso de que una velocidad
de bits de la señal de audio de múltiples canales codificada, que
comprende la señal de audio de canal único (SC), la primera porción
de la información (P1) y la segunda porción de la información (P2),
no sea superior a una velocidad de bits máxima permisible
(MBR).
3. Un método de codificación de acuerdo
con la reivindicación 1, caracterizado porque la información
(INF) comprende conjuntos de parámetros (S1, S2, ...), la primera
porción (P1) comprende al menos un primero (S1) de los conjuntos de
parámetros (S1, S2, ...), y la segunda porción (P2) comprende al
menos un segundo (S2) de los conjuntos de parámetros (S1, S2, ...),
de tal manera que cada conjunto de parámetros está asociado con una
zona de frecuencias correspondiente (FR1, FR2, ...).
4. Un método de codificación de acuerdo
con la reivindicación 3, caracterizado porque los conjuntos
de parámetros comprenden al menos una indicación de localización
(ILD, ITD, IPD, IC).
5. Un método de codificación de acuerdo
con la reivindicación 4, caracterizado porque la al menos una
indicación de localización (ILD, ITD, IPD, IC) se selecciona de
entre: una diferencia de niveles inter-auditivos o
entre los dos oídos (ILD -"interaural level difference"), una
diferencia de tiempos o de fases inter-auditivas, o
entre los dos oídos (ITD -"interaural time difference"-, IPD
-"interaural phase difference"), o una correlación transversal
inter-auditiva, o entre los dos oídos (IC
-"interaural cross-correlation").
6. Un método de codificación de acuerdo
con la reivindicación 1 ó la reivindicación 2, caracterizado
porque la primera zona de frecuencias (FR1) cubre una anchura banda
completa (FBW -"full bandwidth") de la señal de audio de
múltiples canales.
7. Un método de codificación de acuerdo
con la reivindicación 1, caracterizado porque la primera zona
de frecuencias (FR1) cubre sustancialmente una anchura de banda
completa (FBW) de la señal de audio de múltiples canales, la
segunda zona de frecuencias (FR2) cubre una porción de la anchura de
banda completa (FBW), y por que determinar (2) la segunda porción
de la información (P2) está destinada a determinar conjuntos de
parámetros (S2, S3, ...) tanto para la segunda zona de frecuencias
(FR2) como para el conjunto de zonas de frecuencias adicionales
(FR3, FR4, FR5), de tal manera que la segunda zona de frecuencias
(FR2) y el conjunto de zonas de frecuencias adicionales (FR3, FR4,
FR5) cubren sustancialmente la anchura de banda completa (FBW),
donde el conjunto de zonas de frecuencias adicionales (FR3, FR4,
FR5) comprende al menos una zona de frecuencias adicional
(FR3).
8. Un método de codificación de acuerdo
con la reivindicación 7, caracterizado porque la señal de
audio de canal único (SC) y la primera porción (P1) de la
información (INF) forman una capa de base de información (BL
-"base layer") que está siempre presente en la señal de audio
de múltiples canales codificada (EBS), y porque el método comprende
recibir (2) una velocidad de bits máxima permisible (MBR -"maximum
bit rate") de la señal de audio de múltiples canales codificada
(EBS), de tal modo que la segunda porción de la información (P2)
forma una capa de mejora de información (EL -"enhancement
layer") que es codificada únicamente si la velocidad de bits de
la capa de base codificada (DL) y de la capa de mejora (EL) no es
más alta que la velocidad de bits máxima permisible (MBR).
9. Un método de codificación de acuerdo
con la reivindicación 3, caracterizado porque determinar (2)
la primera porción de información (P1) en una trama particular (F2)
de información codificada (EIN) comprende determinar (2) el primero
de los conjuntos de parámetros (S1') contenido en la trama
particular (F2), y codificar el primero de los conjuntos de
parámetros (S1') basándose en el primero de los conjuntos de
parámetros (S1) de una trama (F1) que precede a la trama particular
(F2).
10. Un método de codificación de acuerdo con
la reivindicación 7, caracterizado porque determinar (2) la
segunda porción de información (P2) contenida en una trama
particular (F2) de la información codificada (EIN) comprende
determinar (2) los conjuntos de parámetros (S2', S3', ...) de la
segunda porción (P2) contenida en la trama particular (F2), y
codificar los conjuntos de parámetros (S2', S3', ...) de la segunda
porción (P2) contenida en la trama particular (F2) basándose en los
conjuntos de parámetros (S2, S3, ...) de una trama (F1) que precede
a la trama particular (F2).
11. Un método de codificación de acuerdo con
la reivindicación 7, caracterizado porque determinar (2) la
segunda porción de información (P2) contenida en una trama
particular (F2) de la información codificada (EIN) comprende
determinar (2) los conjuntos de parámetros (S2', S3', ...) de la
segunda porción (P2) contenida en la trama particular (F2), y
codificar los conjuntos de parámetros (S2', S3', ...) de la segunda
porción (P2) contenida en la trama particular (F2) basándose en el
primero de los conjuntos de parámetros (S1) de una trama (F1) que
precede a la trama particular (F2).
12. El método de codificación de acuerdo con
una cualquiera de las reivindicaciones 9 a 11, caracterizado
porque determinar (2) comprende calcular una diferencia entre los
parámetros correspondientes de la trama particular (F2) y de la
trama (F1) que precede a la trama particular (F2).
13. Un codificador para codificar una señal
de audio de múltiples canales que comprende al menos canales de
audio (RI, LI), de tal modo que el codificador comprende:
medios para generar (1) una señal de audio (SC
-"single channel") de un único canal, que comprende una
combinación particular de los al menos dos canales de audio (RI,
LI),
medios para generar (2) información (INF) a
partir de los al menos dos canales de audio (RI, LI), que permite
recuperar, con un nivel de calidad requerido, la señal de audio de
múltiples canales a partir de la señal de audio de canal único (SC)
y de la información (INF), de tal modo que los medios para generar
(2) la información comprenden:
- -
- medios para determinar (2) una primera porción de la información (P1), que consiste en un único conjunto de parámetros (S1), determinados para una primera zona de frecuencias (FR1) de la señal de audio de múltiples canales, y
- -
- medios para determinar (2) una segunda porción de la información (P2) para una segunda zona de frecuencias (FR2) de la señal de audio de múltiples canales, de tal modo que la segunda zona de frecuencias (FR2) es una porción de la primera zona de frecuencias (FR1).
14. Un codificador para codificar una señal
de audio de múltiples canales, de acuerdo con la reivindicación 13,
que comprende adicionalmente medios para determinar (2) únicamente
la segunda porción de la información (P2) para la segunda zona de
frecuencias (FR2) de la señal de audio de múltiples canales, en el
caso de que una velocidad de bits de la señal de audio de múltiples
canales codificada, que comprende la señal de audio de canal único
(SC), la primera porción de la información (P1) y la segunda porción
de la información (P2), no sea superior a una velocidad de bits
máxima permisible (MBR -"maximum bit rate").
15. Un aparato para suministrar una señal de
audio, de tal modo que el aparato comprende:
una entrada para recibir una señal de audio de
múltiples canales,
un codificador de acuerdo con la reivindicación
13 ó la reivindicación 14, destinado a codificar la señal de audio
de múltiples canales con el fin de obtener una señal de audio de
múltiples canales codificada, y
una salida para suministrar la señal de audio de
múltiples canales codificada.
16. Una señal de audio de múltiples canales
codificada, que comprende:
una señal de audio (SC -"single channel")
de un único canal, que comprende una combinación particular de al
menos dos canales de audio (RI, LI), e información (INF) procedente
de los al menos dos canales de audio (RI, LI), lo que permite
recuperar, con un nivel de calidad requerido, la señal de audio de
múltiples canales a partir de la señal de audio de canal único
(SC), y de la información (INF), de tal modo que la información
comprende:
- -
- una primera porción de la información (P1), que consiste en un único conjunto de parámetros (S1) determinados para una primera zona de frecuencias (FR1) de la señal de audio de múltiples canales, y
\newpage
- -
- una segunda porción de la información (P2) para una segunda zona de frecuencias (FR2) de la señal de audio de múltiples canales, de tal modo que la segunda zona de frecuencias (FR2) es una porción de la primera zona de frecuencias (FR1).
17. Un medio de almacenamiento en el que se
ha almacenado la señal de audio codificada de acuerdo con la
reivindicación 16.
18. Un método de descodificación de una
señal de audio de múltiples canales codificada que se ha codificado
de acuerdo con la reivindicación 16, de tal modo que el método de
descodificación comprende:
obtener (6, 7) una señal de audio de un único
canal descodificada (SCO), que comprende una combinación particular
de los al menos dos canales de audio (RI, LI),
obtener (6, 8) información descodificada (INO) a
partir de la información (INF), lo que permite recuperar la señal
de audio de múltiples canales a partir de la señal de audio de canal
único descodificada (SCO) y de la información descodificada (INO),
de tal modo que la información descodificada (INO) comprende la
primera porción de la información (P1) y la segunda porción de la
información (P2), y
aplicar (9), bien la primera porción de la
información (P1) o bien la primera porción (P1) y la segunda porción
de la información (P2) en la señal de audio de canal único (SCO)
con el fin de generar una señal de audio de múltiples canales
descodificada (LO, RO).
19. Un descodificador para descodificar una
señal de audio de múltiples canales codificada, la cual ha sido
codificada de acuerdo con la reivindicación 16, de tal modo que el
descodificador comprende:
medios para obtener (6, 7) una señal de audio de
un único canal descodificada (SCO), que comprende una combinación
particular de los al menos dos canales de audio (RI, LI),
medios para obtener (6, 8) información
descodificada (INO) a partir de la información (INF), lo que permite
recuperar la señal de audio de múltiples canales a partir de la
señal de audio de canal único descodificada (SCO) y de la
información descodificada (INO), de tal modo que la información
descodificada (INO) comprende la primera porción de la información
(P1) y la segunda porción de la información (P2), y
medios para aplicar (9) la primera porción de la
información (P1) y la segunda porción de la información (P2) en la
señal de audio de canal único (SCO) con el fin de generar una señal
de audio de múltiples canales descodificada (LO, RO).
20. Un aparato para suministrar una señal de
audio descodificada, de tal modo que el aparato comprende:
una entrada para recibir una señal de audio de
múltiples canales codificada,
un descodificador de acuerdo con la
reivindicación 19, destinado a descodificar la señal de audio de
múltiples canales codificada, con el fin de obtener una señal de
salida de múltiples canales, y
una salida para suministrar o reproducir la
señal de salida de múltiples canales.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02076588 | 2002-04-22 | ||
EP02076588 | 2002-04-22 | ||
EP02077869 | 2002-07-16 | ||
EP02077869 | 2002-07-16 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2268340T3 true ES2268340T3 (es) | 2007-03-16 |
Family
ID=29252214
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES03712597T Expired - Lifetime ES2268340T3 (es) | 2002-04-22 | 2003-04-22 | Representacion de audio parametrico de multiples canales. |
Country Status (11)
Country | Link |
---|---|
US (1) | US8498422B2 (es) |
EP (1) | EP1500083B1 (es) |
JP (1) | JP4714415B2 (es) |
KR (1) | KR101021079B1 (es) |
CN (1) | CN1647156B (es) |
AT (1) | ATE332003T1 (es) |
AU (1) | AU2003216686A1 (es) |
BR (2) | BR0304542A (es) |
DE (1) | DE60306512T2 (es) |
ES (1) | ES2268340T3 (es) |
WO (1) | WO2003090207A1 (es) |
Families Citing this family (115)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7644003B2 (en) | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US7006636B2 (en) | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
DE60310449T2 (de) | 2002-11-28 | 2007-10-31 | Koninklijke Philips Electronics N.V. | Audiosignalkodierung |
US20040264713A1 (en) * | 2003-06-27 | 2004-12-30 | Robert Grzesek | Adaptive audio communication code |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US20070168183A1 (en) * | 2004-02-17 | 2007-07-19 | Koninklijke Philips Electronics, N.V. | Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore |
US7805313B2 (en) * | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
SE0400997D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
US7756713B2 (en) | 2004-07-02 | 2010-07-13 | Panasonic Corporation | Audio signal decoding device which decodes a downmix channel signal and audio signal encoding device which encodes audio channel signals together with spatial audio information |
KR100773539B1 (ko) * | 2004-07-14 | 2007-11-05 | 삼성전자주식회사 | 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치 |
TWI393121B (zh) | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
TWI497485B (zh) | 2004-08-25 | 2015-08-21 | Dolby Lab Licensing Corp | 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法 |
ATE442644T1 (de) * | 2004-08-26 | 2009-09-15 | Panasonic Corp | Mehrkanalige signal-dekodierung |
CN101010724B (zh) * | 2004-08-27 | 2011-05-25 | 松下电器产业株式会社 | 音频编码器 |
KR20070056081A (ko) * | 2004-08-31 | 2007-05-31 | 마츠시타 덴끼 산교 가부시키가이샤 | 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법 |
DE102004042819A1 (de) | 2004-09-03 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals |
EP1792520A1 (en) * | 2004-09-06 | 2007-06-06 | Koninklijke Philips Electronics N.V. | Audio signal enhancement |
DE102004043521A1 (de) * | 2004-09-08 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes |
US7860721B2 (en) * | 2004-09-17 | 2010-12-28 | Panasonic Corporation | Audio encoding device, decoding device, and method capable of flexibly adjusting the optimal trade-off between a code rate and sound quality |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
US7720230B2 (en) | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
KR101268218B1 (ko) * | 2004-11-29 | 2013-10-17 | 내셔널 유니버시티 오브 싱가포르 | 휴대형 장치용 지각인지 저전력 오디오 디코더 |
KR101215868B1 (ko) * | 2004-11-30 | 2012-12-31 | 에이저 시스템즈 엘엘시 | 오디오 채널들을 인코딩 및 디코딩하는 방법, 및 오디오 채널들을 인코딩 및 디코딩하는 장치 |
US7787631B2 (en) * | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
JP5017121B2 (ja) * | 2004-11-30 | 2012-09-05 | アギア システムズ インコーポレーテッド | 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化 |
KR100682904B1 (ko) * | 2004-12-01 | 2007-02-15 | 삼성전자주식회사 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
EP1818911B1 (en) * | 2004-12-27 | 2012-02-08 | Panasonic Corporation | Sound coding device and sound coding method |
WO2006070757A1 (ja) * | 2004-12-28 | 2006-07-06 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
US20080162148A1 (en) * | 2004-12-28 | 2008-07-03 | Matsushita Electric Industrial Co., Ltd. | Scalable Encoding Apparatus And Scalable Encoding Method |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
WO2006075269A1 (en) * | 2005-01-11 | 2006-07-20 | Koninklijke Philips Electronics N.V. | Scalable encoding/decoding of audio signals |
WO2006082790A1 (ja) | 2005-02-01 | 2006-08-10 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置およびスケーラブル符号化方法 |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
US9626973B2 (en) | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
JP4809370B2 (ja) * | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル音声符号化における適応ビット割り当て |
DE102005010057A1 (de) | 2005-03-04 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms |
JP4887288B2 (ja) * | 2005-03-25 | 2012-02-29 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
US7991610B2 (en) * | 2005-04-13 | 2011-08-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Adaptive grouping of parameters for enhanced coding efficiency |
US8185403B2 (en) * | 2005-06-30 | 2012-05-22 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
US8270439B2 (en) * | 2005-07-08 | 2012-09-18 | Activevideo Networks, Inc. | Video game system using pre-encoded digital audio mixing |
US20070055510A1 (en) * | 2005-07-19 | 2007-03-08 | Johannes Hilpert | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding |
US8074248B2 (en) | 2005-07-26 | 2011-12-06 | Activevideo Networks, Inc. | System and method for providing video content associated with a source image to a television in a communication network |
JP5113051B2 (ja) | 2005-07-29 | 2013-01-09 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法 |
RU2414741C2 (ru) * | 2005-07-29 | 2011-03-20 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ создания многоканального сигнала |
TWI396188B (zh) | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
KR101277041B1 (ko) * | 2005-09-01 | 2013-06-24 | 파나소닉 주식회사 | 멀티 채널 음향 신호 처리 장치 및 방법 |
KR100878828B1 (ko) * | 2005-10-05 | 2009-01-14 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
KR20070038439A (ko) | 2005-10-05 | 2007-04-10 | 엘지전자 주식회사 | 신호 처리 방법 및 장치 |
US7761289B2 (en) | 2005-10-24 | 2010-07-20 | Lg Electronics Inc. | Removing time delays in signal paths |
US8036900B2 (en) * | 2005-11-04 | 2011-10-11 | National University Of Singapore | Device and a method of playing audio clips |
KR100888474B1 (ko) | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
KR101218776B1 (ko) * | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
US20090018824A1 (en) * | 2006-01-31 | 2009-01-15 | Matsushita Electric Industrial Co., Ltd. | Audio encoding device, audio decoding device, audio encoding system, audio encoding method, and audio decoding method |
ATE456261T1 (de) | 2006-02-21 | 2010-02-15 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
TWI447707B (zh) | 2006-02-23 | 2014-08-01 | Lg Electronics Inc | 音頻訊號之處理方法及其裝置 |
ATE527833T1 (de) * | 2006-05-04 | 2011-10-15 | Lg Electronics Inc | Verbesserung von stereo-audiosignalen mittels neuabmischung |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US20080004883A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Scalable audio coding |
CN101652810B (zh) * | 2006-09-29 | 2012-04-11 | Lg电子株式会社 | 用于处理混合信号的装置及其方法 |
KR20090013178A (ko) | 2006-09-29 | 2009-02-04 | 엘지전자 주식회사 | 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치 |
JP5232791B2 (ja) | 2006-10-12 | 2013-07-10 | エルジー エレクトロニクス インコーポレイティド | ミックス信号処理装置及びその方法 |
US20080269929A1 (en) | 2006-11-15 | 2008-10-30 | Lg Electronics Inc. | Method and an Apparatus for Decoding an Audio Signal |
WO2008069596A1 (en) | 2006-12-07 | 2008-06-12 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
EP2102855A4 (en) | 2006-12-07 | 2010-07-28 | Lg Electronics Inc | METHOD AND APPARATUS FOR DECODING AUDIO SIGNAL |
EP2632164A3 (en) | 2007-01-12 | 2014-02-26 | ActiveVideo Networks, Inc. | Interactive encoded content system including object models for viewing on a remote device |
US9826197B2 (en) | 2007-01-12 | 2017-11-21 | Activevideo Networks, Inc. | Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device |
KR101453732B1 (ko) | 2007-04-16 | 2014-10-24 | 삼성전자주식회사 | 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치 |
US8521540B2 (en) * | 2007-08-17 | 2013-08-27 | Qualcomm Incorporated | Encoding and/or decoding digital signals using a permutation value |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
EP2128856A4 (en) * | 2007-10-16 | 2011-11-02 | Panasonic Corp | DEVICE FOR PRODUCING A STREAM AND DECODING DEVICE AND CORRESPONDING METHOD |
JP5668923B2 (ja) * | 2008-03-14 | 2015-02-12 | 日本電気株式会社 | 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム |
JP5773124B2 (ja) * | 2008-04-21 | 2015-09-02 | 日本電気株式会社 | 信号分析制御及び信号制御のシステム、装置、方法及びプログラム |
PL2301017T3 (pl) * | 2008-05-09 | 2017-05-31 | Nokia Technologies Oy | Urządzenie akustyczne |
US8233629B2 (en) * | 2008-09-04 | 2012-07-31 | Dts, Inc. | Interaural time delay restoration system and method |
KR101108061B1 (ko) | 2008-09-25 | 2012-01-25 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치 |
WO2010036059A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
US8258849B2 (en) * | 2008-09-25 | 2012-09-04 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
US8346380B2 (en) | 2008-09-25 | 2013-01-01 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
JP5309944B2 (ja) * | 2008-12-11 | 2013-10-09 | 富士通株式会社 | オーディオ復号装置、方法、及びプログラム |
EP2214162A1 (en) * | 2009-01-28 | 2010-08-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Upmixer, method and computer program for upmixing a downmix audio signal |
US8666752B2 (en) * | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
US7975063B2 (en) * | 2009-05-10 | 2011-07-05 | Vantrix Corporation | Informative data streaming server |
CN101556799B (zh) | 2009-05-14 | 2013-08-28 | 华为技术有限公司 | 一种音频解码方法和音频解码器 |
US8194862B2 (en) * | 2009-07-31 | 2012-06-05 | Activevideo Networks, Inc. | Video game system with mixing of independent pre-encoded digital audio bitstreams |
US8718290B2 (en) | 2010-01-26 | 2014-05-06 | Audience, Inc. | Adaptive noise reduction using level cues |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US9378754B1 (en) * | 2010-04-28 | 2016-06-28 | Knowles Electronics, Llc | Adaptive spatial classifier for multi-microphone systems |
EP2628306B1 (en) | 2010-10-14 | 2017-11-22 | ActiveVideo Networks, Inc. | Streaming digital video between video devices using a cable television system |
EP2477418B1 (en) * | 2011-01-12 | 2014-06-04 | Nxp B.V. | Signal processing method |
US9204203B2 (en) | 2011-04-07 | 2015-12-01 | Activevideo Networks, Inc. | Reduction of latency in video distribution networks using adaptive bit rates |
KR101930907B1 (ko) * | 2011-05-30 | 2019-03-12 | 삼성전자주식회사 | 오디오 신호 처리 방법, 그에 따른 오디오 장치, 및 그에 따른 전자기기 |
US10409445B2 (en) | 2012-01-09 | 2019-09-10 | Activevideo Networks, Inc. | Rendering of an interactive lean-backward user interface on a television |
US9800945B2 (en) | 2012-04-03 | 2017-10-24 | Activevideo Networks, Inc. | Class-based intelligent multiplexing over unmanaged networks |
CN103534753B (zh) * | 2012-04-05 | 2015-05-27 | 华为技术有限公司 | 用于信道间差估计的方法和空间音频编码装置 |
US9123084B2 (en) | 2012-04-12 | 2015-09-01 | Activevideo Networks, Inc. | Graphical application integration with MPEG objects |
TWI505262B (zh) * | 2012-05-15 | 2015-10-21 | Dolby Int Ab | 具多重子流之多通道音頻信號的有效編碼與解碼 |
WO2014013294A1 (en) | 2012-07-19 | 2014-01-23 | Nokia Corporation | Stereo audio signal encoder |
US9460729B2 (en) * | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
WO2014145921A1 (en) | 2013-03-15 | 2014-09-18 | Activevideo Networks, Inc. | A multiple-mode system and method for providing user selectable video content |
US10199044B2 (en) * | 2013-03-20 | 2019-02-05 | Nokia Technologies Oy | Audio signal encoder comprising a multi-channel parameter selector |
US9294785B2 (en) | 2013-06-06 | 2016-03-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
US9219922B2 (en) | 2013-06-06 | 2015-12-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
EP3005712A1 (en) | 2013-06-06 | 2016-04-13 | ActiveVideo Networks, Inc. | Overlay rendering of user interface onto source video |
CN106104684A (zh) | 2014-01-13 | 2016-11-09 | 诺基亚技术有限公司 | 多通道音频信号分类器 |
KR102244612B1 (ko) * | 2014-04-21 | 2021-04-26 | 삼성전자주식회사 | 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법 |
US9788029B2 (en) | 2014-04-25 | 2017-10-10 | Activevideo Networks, Inc. | Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks |
WO2016162283A1 (en) * | 2015-04-07 | 2016-10-13 | Dolby International Ab | Audio coding with range extension |
CN107358960B (zh) * | 2016-05-10 | 2021-10-26 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
CN107358961B (zh) * | 2016-05-10 | 2021-09-17 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
CN107731238B (zh) | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10063612B2 (en) * | 2016-09-30 | 2018-08-28 | Amazon Technologies, Inc. | Request-based encoding for streaming content portions |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG49883A1 (en) * | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
DE4409368A1 (de) * | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
IT1281001B1 (it) * | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
JPH09274500A (ja) * | 1996-04-09 | 1997-10-21 | Matsushita Electric Ind Co Ltd | ディジタルオーディオ信号の符号化方法 |
DE69712230T2 (de) * | 1997-05-08 | 2002-10-31 | St Microelectronics Asia | Verfahren und gerät zur frequenzdomäneabwärtsumsetzung mit zwangblockschaltung für audiodekoderfunktionen |
US5890125A (en) * | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6539357B1 (en) * | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
ATE338999T1 (de) * | 2001-10-19 | 2006-09-15 | Koninkl Philips Electronics Nv | Differentielle kodierung im frequenz bereich von sinusmodell parametern |
DE60208426T2 (de) * | 2001-11-02 | 2006-08-24 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
DE60307252T2 (de) * | 2002-04-11 | 2007-07-19 | Matsushita Electric Industrial Co., Ltd., Kadoma | Einrichtungen, verfahren und programme zur kodierung und dekodierung |
-
2003
- 2003-04-22 CN CN038089777A patent/CN1647156B/zh not_active Expired - Lifetime
- 2003-04-22 KR KR1020047017069A patent/KR101021079B1/ko active IP Right Grant
- 2003-04-22 DE DE60306512T patent/DE60306512T2/de not_active Expired - Lifetime
- 2003-04-22 AT AT03712597T patent/ATE332003T1/de not_active IP Right Cessation
- 2003-04-22 ES ES03712597T patent/ES2268340T3/es not_active Expired - Lifetime
- 2003-04-22 US US10/511,806 patent/US8498422B2/en active Active
- 2003-04-22 AU AU2003216686A patent/AU2003216686A1/en not_active Abandoned
- 2003-04-22 BR BR0304542-0A patent/BR0304542A/pt active Pending
- 2003-04-22 EP EP03712597A patent/EP1500083B1/en not_active Expired - Lifetime
- 2003-04-22 JP JP2003586872A patent/JP4714415B2/ja not_active Expired - Lifetime
- 2003-04-22 BR BRPI0304542A patent/BRPI0304542B1/pt unknown
- 2003-04-22 WO PCT/IB2003/001591 patent/WO2003090207A1/en active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
EP1500083A1 (en) | 2005-01-26 |
KR20040102163A (ko) | 2004-12-03 |
US8498422B2 (en) | 2013-07-30 |
KR101021079B1 (ko) | 2011-03-14 |
AU2003216686A1 (en) | 2003-11-03 |
WO2003090207A1 (en) | 2003-10-30 |
US20050226426A1 (en) | 2005-10-13 |
ATE332003T1 (de) | 2006-07-15 |
EP1500083B1 (en) | 2006-06-28 |
JP2005523479A (ja) | 2005-08-04 |
CN1647156A (zh) | 2005-07-27 |
DE60306512T2 (de) | 2007-06-21 |
CN1647156B (zh) | 2010-05-26 |
JP4714415B2 (ja) | 2011-06-29 |
DE60306512D1 (de) | 2006-08-10 |
BRPI0304542B1 (pt) | 2018-05-08 |
BR0304542A (pt) | 2004-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2268340T3 (es) | Representacion de audio parametrico de multiples canales. | |
ES2300567T3 (es) | Representacion parametrica de audio espacial. | |
ES2293556T3 (es) | Codificacion basada en frecuencia de canales de audio en sistemas de codificacion multicanal parametrica. | |
ES2658824T3 (es) | Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia | |
EP2140450B1 (en) | A method and an apparatus for processing an audio signal | |
ES2770146T3 (es) | Conformación temporal y espacial de señales de audio multicanal | |
ES2297825T3 (es) | Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales. | |
RU2367033C2 (ru) | Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией | |
ES2294300T3 (es) | Codificacion de audio. | |
ES2292147T3 (es) | Reconstruccion multicanal basada en multiparametrizacion. | |
JP4603037B2 (ja) | マルチチャネルオーディオ信号を表示するための装置と方法 | |
ES2682073T3 (es) | Codificación conjunta paramétrica de fuentes de audio | |
ES2391801T3 (es) | Procedimiento y aparato para procesar una señal de audio | |
KR20200091880A (ko) | 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩 파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법 | |
TWI404429B (zh) | 用於將多頻道音訊信號編碼/解碼之方法與裝置 | |
ES2547232T3 (es) | Método y aparato para procesar una señal | |
JP2024012444A (ja) | マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ | |
US20060147047A1 (en) | Coding an audio signal | |
ES2709117T3 (es) | Codificador y decodificador de audio | |
ES2654792T3 (es) | Procedimiento y decodificador para codificación de objeto de audio espacial de multi-instancias que emplea un concepto paramétrico para casos de mezcla descendente/mezcla ascendente de multicanal | |
US8041041B1 (en) | Method and system for providing stereo-channel based multi-channel audio coding | |
CN104541326A (zh) | 一种设备和方法,用于处理音频信号 | |
ES2836682T3 (es) | Método y dispositivo para extraer parámetro de diferencia de fase entre canales | |
JP4809234B2 (ja) | オーディオ符号化装置、復号化装置、方法、及びプログラム | |
US20110019829A1 (en) | Stereo signal converter, stereo signal reverse converter, and methods for both |