ES2280736T3 - Sintetizacion de señal. - Google Patents

Sintetizacion de señal. Download PDF

Info

Publication number
ES2280736T3
ES2280736T3 ES03712593T ES03712593T ES2280736T3 ES 2280736 T3 ES2280736 T3 ES 2280736T3 ES 03712593 T ES03712593 T ES 03712593T ES 03712593 T ES03712593 T ES 03712593T ES 2280736 T3 ES2280736 T3 ES 2280736T3
Authority
ES
Spain
Prior art keywords
signal
signals
output
correlation
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES03712593T
Other languages
English (en)
Inventor
Dirk J. Breebaart
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=29252213&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2280736(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of ES2280736T3 publication Critical patent/ES2280736T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Networks Using Active Elements (AREA)
  • Image Processing (AREA)
  • Control Of Motors That Do Not Use Commutators (AREA)
  • Control Of Charge By Means Of Generators (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Burglar Alarm Systems (AREA)

Abstract

Método de sintetizar una primera y una segunda señal (L, R) de salida de audio a partir de una señal(x) de entrada. comprendiendo el método : filtrar la señal (x) de entrada para generar una señal filtrada, obtener un parámetro (r) de correlación indicativo de una correlación deseada entre las primeras y segundas señales (L, R) de salida; obtener un parámetro (c) de nivel indicativo de una diferencia de nivel deseada entre las primeras y segundas señales (L, R) de salida; y transformar la señal (x) de entrada y la señal filtrada mediante una operación de matrización a las primeras y segundas señales (L, R) de salida, en las que la operación de matrización depende del parámetro (r) de correlación y el parámetro (c) de nivel.

Description

Sintetización de señal.
Esta invención se refiere a la sintetización de una primera y segunda señal de salida a partir de una señal de entrada.
En el campo de la codificación de audio, los codificadores de audio paramétricos han ganado un interés creciente. Se ha mostrado que la transmisión (cuantificada) de parámetros que describen señales de audio precisa sólo una capacidad de transmisión pequeña y que permiten una decodificación en el extremo de recepción que da como resultado una señal de audio que perceptivamente no difiere significativamente de la señal original. Por tanto, el ahorro de tasa de bits puede obtenerse mediante la sola transmisión de un canal de audio combinado con un parámetro de flujo de bits que describe las propiedades espaciales de la señal estéreo y, por tanto, permite a un decodificador reproducir las propiedades espaciales de la señal estéreo.
El artículo "Efficient representation of spatial audio using perceptual parametriazation" (Faller y Baumgarten, taller IEE en aplicaciones de procesamiento de señal para audio y acústicas, 21 de Octubre de 2001) describe una representación de audio espacial que comprende una señal de suma monofónica y la diferencia de nivel interaural y la diferencia de tiempo interaural en cada banda critica. Para sintetizar la señal binaural, las diferencias de nivel y las diferencias de tiempo se aplican a los coeficientes espectrales de la señal monofónica.
Uno de los parámetros espaciales anteriores que es importante para la codificación de una señal estéreo que comprende un canal L y un canal R es la correlación cruzada entre canales entre los canales L y R. Por tanto, en muchos sistemas uno de los parámetros de señal que se analizan mediante un codificador es la correlación cruzada entre canales. La correlación cruzada entonces se transmite junto con una señal mono del codificador a un decodificador correspondiente.
En el decodificador dos señales de salida se reconstruyen que tienen la correlación cruzada deseada. Adicionalmente, se desea que la reconstrucción solo introduzca pequeños artefactos con relación a la señal estéreo original.
Diversos métodos de decorrelacionar señales se conocen como tal. La figura 1 ilustra el denominado dispositivo de descorrelación Lauridsen. El dispositivo de descorrelación Lauridsen comprende un filtro 101 pasa todo, por ejemplo un retardo, que genera y posiblemente atenúa una versión retardada de la forma de onda de la señal x de entrada. La salida H\varotimesx del filtro 101 se suma (102) posteriormente a la entrada dando como resultado en el canal L izquierdo y se resta (103) de la entrada que da como resultado en el canal R derecho.
El anterior dispositivo de descorrelación de la técnica anterior es muy adecuado siempre que las dos señales de salida sean muy similares o incluso iguales en nivel. Sin embargo, los codificadores de audio paramétricos también aplican diferencias de nivel a las señales de salida, la denominada panoramización de amplitud (amplitude panning). El dispositivo de descorrelación anterior implica el problema de que la calidad perceptiva de las señales generadas se deteriora si las diferencias de nivel son grandes.
El anterior y otros problemas se resuelven mediante un método para sintetizar una primera y segunda señal de salida de audio a partir de una señal de entrada, comprendiendo el método:
filtrar la señal de entrada para generar una señal filtrada,
obtener un parámetro de correlación indicativo de una correlación deseada entre las primeras y segundas señales de salida;
obtener un parámetro de nivel indicativo de una diferencia de nivel deseada entre las primeras y segundas señales de salida; y
transformar la señal de salida y la señal filtrada mediante una operación de matrización a las primeras y segundas señales de salida, en las que la operación de matrización depende del parámetro de correlación y el parámetro de nivel.
Por tanto, realizando una operación de matriz que depende tanto de la correlación deseada como de la diferencia de nivel deseada, se consigue un incremento significativo en calidad perceptiva de las señales de salida de un decodificador paramétrico.
En una realización preferida, la operación de matrización comprende una rotación común mediante un ángulo predeterminado de las primeras y segundas señales en un espacio abarcado por la señal de salida y la señal de entrada filtrada; y en el que el ángulo predeterminado depende del parámetro de nivel.
Por tanto, sumando una rotación adicional a la operación de mezcla, el nivel relativo de las señales de salida puede controlarse sin la influencia de la correlación cruzada entre la señales de salida.
\newpage
En una realización preferida adicional, el ángulo predeterminado se selecciona para maximizar una contribución total de la señal de entrada a las primeras y segundas señales de salida. Se sabe que la calidad perceptiva de la señal puede incrementarse, si la cantidad de la señal filtrada presente en las señales de salida se minimiza y, por tanto la cantidad de la señal original se maximiza.
Cuando el método adicionalmente comprende el ajuste a escala de cada una de las primeras y segundas señales de salida a dicha diferencia de nivel deseada entre las señales primeras y segundas de salida, se asegura que el nivel relativo de las señales de salida corresponde al nivel deseado según a un parámetro de nivel determinado por el codificador.
En una realización preferida, la filtración de la señal de entrada comprende filtración de tipo pasa todo de la señal de entrada, por ejemplo un filtro de peine. El espaciado espectral de un filtro de peine se distribuye uniformemente sobre la frecuencia. Por tanto para poder obtener un espaciado denso deseado de los picos y valles en bajas frecuencias, el retardo del dispositivo de descorrelación Lauridsen debería ser muy grande. Esto, sin embargo, tiene la desventaja que en altas frecuencias, pueden percibirse ecos para señales de entrada transitorias.
Este problema puede solventarse cuando el filtro pasa todo comprende un retardo dependiente de la frecuencia. A altas frecuencias, se usas un retardo relativamente pequeño, dando como resultado una resolución de frecuencia aproximada. A bajas frecuencias, un retardo grande da como resultado un espaciado denso del filtro de peine.
La filtración puede realizarse en el ancho de banda completo de la señal. Alternativamente, la filtración puede combinarse con un filtro de limitación de banda, aplicando de ese modo la decorrelación a una o más bandas de frecuencia seleccionadas.
El termino operación de matriz se refiere a una operación que transforma una señal multicanal de entrada en una señal multicanal de salida en la que los componentes de la señal multicanal de salida son combinaciones lineares de los componentes de la señal multicanal de entrada.
La presente invención puede implementarse de maneras diferentes incluyendo el método descrito anteriormente y a continuación, disposiciones para la codificación y decodificación, y medios de producto adicionales, cada uno produciendo uno o más de los beneficios y ventajas descritas en conexión con el método mencionado en primer lugar, y presentando cada uno una o más realizaciones preferidas correspondientes a las realizaciones preferidas descritas en conexión con el método mencionado en primer lugar y descrito en las reivindicaciones dependientes.
Ha de observarse que las características del método descrito anteriormente y a continuación pueden implementarse en software y llevarse a cabo en un sistema de procesamiento de datos u otros medios de procesamiento causados por la ejecución de instrucciones ejecutables por ordenador. Las instrucciones pueden ser medios de código de programa cargados en una memoria, tal como una RAM, desde un medio de almacenamiento o desde otro ordenador a través de una red informática. Alternativamente, las características descritas pueden implementarse mediante un conjunto de circuitos conectados físicamente por cable en lugar de software o una combinación con software.
La invención adicionalmente se refiere a una disposición para sintetizar una primera y segunda señal de salida de audio a partir de una señal de entrada, comprendiendo la disposición:
medios de filtro para filtrar la señal de entrada para generar una señal filtrada,
medios para obtener un parámetro de correlación indicativo de una correlación deseada entre las primeras y segundas señales de entrada;
medios para obtener un parámetro de nivel indicativo de una diferencia de nivel deseada entre las primeras y segundas señales de entrada; y
medios para transformar la señal de entrada y la señal filtrada mediante una operación de matrización a la primeras y segundas señales de salida, en las que la operación de matrización depende del parámetro de correlación y el parámetro de nivel.
La invención adicionalmente se refiere a un aparato para suministrar una señal de audio decodificada, comprendiendo el aparato:
una unidad de entrada para recibir una señal de audio codificada;
un decodificador para decodificar la señal de audio codificada, comprendiendo el decodificador una disposición para sintetizar una primera y segunda señal de audio como se describe anterior y a continuación, y
una unidad de salida para proporcionar la primera y segunda señal de audio decodificada.
\newpage
Estos y otros aspectos de la invención resultarán evidentes y aclaratorios a partir de las reivindicaciones descritas a continuación con referencia a los dibujos en los que:
la figura 1 muestra un dispositivo de descorrelación de Lauridsen de la técnica anterior;
la figura 2 ilustra un dispositivo de descorrelación según una realización de la invención,
las figuras 3a a 3c ilustran la generación de señal según una realización de la invención,
la figura 4 muestra esquemáticamente un sistema para codificación de audio espacial; y
la figura 5 muestra una vista esquemática de un sistema para comunicar señales de audio multicanal;
La figura 2 ilustra un dispositivo de descorrelación según una realización de la invención: El dispositivo de descorrelación comprende un filtro 201 pasa todo que recibe una señal x de entrada, por ejemplo de un codificador de audio paramétrico que genera una señal x de audio mono y un conjunto de parámetros P incluyendo una correlación p cruzada entre canales y un parámetro indicativo de la diferencia c de canal. Preferiblemente, el filtro pasa todo comprende un retardo dependiente de la de frecuencia que proporciona un retardo relativamente más pequeño a altas frecuencias que a bajas frecuencias. Esto puede conseguirse mediante el reemplazo de un retardo fijo del filtro pasa todo por un filtro pasa todo que comprende un periodo de un complejo de fase Schroeder (véase por ejemplo M.R. Schroeder, "Synthesis of low-peak-factor signals and binary sequences with low autocorrelation", IEEE Transact. Inf. Theor., 16:85-89, 1970). El dispositivo de descorrelación adicionalmente comprende un circuito 202 de análisis que recibe parámetros espaciales del decodificador y extrae la correlación p cruzada entre canales y la diferencia c de canal. El circuito 202 determina una matriz M(\alpha, \beta) de mezcla como se describirá en conexión con las figuras 3a a c. Los componentes de la matriz de mezcla se alimentan a un circuito 203 de transformación que adicionalmente recibe la señal x de entrada y la señal H\varotimesx filtrada. El circuito 203 realiza una operación de mezcla según
1
dando como resultado las señales L y R de salida.
Las figuras 3a a c ilustran la generación de señal según una realización de la invención. En la figura 3a la señal x de salida se representa mediante el eje horizontal mientras la señal H\varotimesx filtrada se representa mediante el eje vertical. Como las dos señales no están correlacionadas pueden representarse como vectores ortogonales que abarcan un espacio bidimensional.
Las señales L y R de salida se representan como vectores 301 y 302, respectivamente. En esta representación, la correlación entre las señales L y R viene dada por el ángulo \alpha entre los vectores 301 y 302 según \rho = cos (\alpha), es decir mediante la distancia \alpha angular entre los vectores 301 y 302. Consecuentemente, cualquier par de vectores que exhiben la distancia angular correcta tienen la correlación especificada.
Por tanto, una matriz M de mezcla que transforma las señales x y H\varotimesx en señales L y R con una correlación p predeterminada puede expresarse como sigue:
2
Por tanto, la cantidad de señal filtrada pasa todo depende de la correlación deseada. Adicionalmente, la energía de la componente de señal pasa todo es la misma en ambos canales de salida (pero con un desplazamiento de fase de 180º).
Nótese que el dispositivo de descorrelación Lauridsen de la figura 1 corresponde al caso en el que la matriz M viene dada por
3
es decir \alpha = 90º que corresponde a las señales de salida no correlacionadas (\rho = 0).
\newpage
Con el fin de ilustrar un problema con la matriz de la ecuación (3), se asume una situación con una amplitud extrema distribuyéndose hacia el canal izquierdo, es decir un caso en el que una determinada señal está presente sólo en el canal izquierdo. Se asume adicionalmente que la correlación deseada entre las salidas es cero. En este caso, la salida del canal izquierdo de la transformación de la ecuación (1) con la matriz de mezcla de la ecuación (3) produce L = 1/\surd2(x + H\varotimesx). Por tanto, la salida consiste en la señal x original combinada con toda su versión H\varotimesx filtrada pasa todo.
Sin embargo, esta es una situación no deseada, ya que el filtro pasa todo habitualmente deteriora la calidad perceptiva de la señal. Adicionalmente, la suma de la señal original y la señal filtrada da como resultado efectos de filtro de peine, tales como una coloración percibida de la señal de salida. En este caso extremo asumido, la mejor solución sería que la señal de salida izquierda consistiera en la señal de entrada. De esta manera la correlación de las dos señales de salida aun sería cero.
En situaciones con diferencias de nivel más moderadas, la situación preferida es que el canal de salida con más sonoridad contenga relativamente más de la señal original, y el canal de salida con menos sonoridad contenga relativamente más de la señal filtrada. Por tanto, en general, se prefiere maximizar la cantidad de la señal original presente en las dos salidas conjuntas, y minimizar la cantidad de la señal filtrada.
Según la invención, esto se consigue mediante la introducción de una matriz de mezcla diferente que incluye una rotación común adicional:
4
En este caso \beta es una rotación adicional, y C es una matriz de ajuste a escala que asegura que la diferencia de nivel relativa entre las señales de salida es igual a c, es decir
5
Introduciendo la matriz de la ecuación (4) en la ecuación (1) produce las señales de salida generadas mediante la operación de matrización según la invención:
6
Esta situación se ilustra en la figura 3b. Las señales de salida L y R todavía tienen una diferencia angular \alpha, es decir la correlación entre las señales L y R no se ve afectada por el ajuste a escala de las señales L y R según la diferencia de nivel deseada y la rotación adicional mediante el ángulo \beta de tanto la señal L como la R.
Como se mencionado anteriormente, preferiblemente, la cantidad de la señal x original en la salida sumada de L y R debería maximizarse. Esta condición puede usarse para determinar el ángulo \beta, según
7
\newpage
que produce la condición:
8
Esta situación se ilustra en la figura 3c, en la que la suma de las componentes L y R está alineada con la dirección de x.
La figura 4 muestra esquemáticamente un sistema para codificación de audio espacial. El sistema comprende un codificador 401 y un decodificador 405 correspondiente. El codificador 401 describe los atributos espaciales de una señal de audio multicanal mediante la especificación de una diferencia de nivel interaural, una diferencia de tiempo (o fase) interaural, y una correlación máxima como una función del tiempo y la frecuencia, como se describe en el documento WO-A1-03/090208.
El codificador 401 recibe las componentes L y R de una señal estéreo como entradas. Inicialmente, mediante circuitos 402 y 403 de corte de tiempo/frecuencia, las componentes R y L, respectivamente, se dividen en diversas ranuras de tiempo/frecuencia, por ejemplo mediante la aplicación de ventanas de tiempo seguidas por una operación de transformación.
En una realización, las señales izquierda y derecha de entrada se dividen en varias tramas de tiempo (por ejemplo 2048 muestras a 44,1 kHz de tasa de muestreo) y partidas en ventanas con una ventana de Hanning de raíz cuadrada. Posteriormente, se computan las FFT. Las frecuencias FFT negativas se descartan y las FFT resultantes se subdividen en grupos (subbandas) de intervalos (bin) FFT. El número de intervalos FFT que se combinan es una subbanda depende de la frecuencia: a frecuencias más altas se combinan más intervalos que a frecuencias más bajas. Por ejemplo, los intervalos FFT que corresponden a aproximadamente 1,8 ERB (equivalent rectangular bandwidth, ancho de banda rectangular equivalente) pueden agruparse, dando como resultado por ejemplo 20 subbandas para representar toda la gama de frecuencia audible.
Posteriormente, en el circuito 404 de análisis, para cada ranura de tiempo/frecuencia, se analizan las siguientes propiedades de las señales entrantes:
La diferencia de nivel interaural, o ILD, definido mediante los niveles relativos de las señales limitadas por banda correspondientes que provienen de las dos entradas,
La diferencia (ITD o IPD) de tiempo(o fase) interaural, definida por el retardo interaural (o desplazamiento de fase) que corresponde al pico de la función de correlación cruzada interaural, y
La similitud (o falta de similitud) de las formas de onda que no pueden explicarse mediante las ITD o ILD, que puede parametrizarse mediante el valor máximo de la función de correlación cruzada (es decir, el valor de la función de correlación cruzada en la posición del pico máximo).
Los tres parámetros descritos con anterioridad varían con el tiempo; sin embargo, debido a que sabe que el sistema auditivo binaural s muy lento en su procesamiento, la tasa de actualización de estas propiedades es bastante baja (normalmente decenas de milisegundos).
El circuito 404 de análisis genera adicionalmente una señal S de suma (o dominante) que comprende una combinación de las señales izquierda y derecha. Por tanto, las señales L y R se codifican como una señal S de suma y un conjunto de parámetros P como una función de frecuencia y tiempo, comprendiendo los parámetros P la ILD, la ITD/IPD, y el valor máximo de la función de correlación cruzada.
Debe notarse que el parámetro ILD en esta realización está relacionado con el parámetro c de diferencia de canal en la realización de la figura 2 mediante ILD =k·log(c), en el que k es una constante, es decir que ILD es proporcional al logaritmo de c.
En una realización, para cada subbanda, se computan la correspondiente ILD, ITD y correlación p. La ITD y correlación se computan simplemente estableciendo todos los intervalos FFT que pertenecen a otros grupos a cero, multiplicando las resultantes (limitadas por banda) FFT de los canales izquierdo y derecho, seguidas por una transformada FFT inversa. La función de correlación cruzada resultante se escanea para un pico dentro de un retardo entre canales entre -64 y +63 muestras. El retardo interno que corresponde al pico se usa como valor ITD, y el valor de la función de correlación cruzada en este pico se usa como correlación interaural de esta subbanda. Finalmente, la ILD se computa simplemente tomando la relación de potencia de los canales izquierdo y derecho para cada subbanda.
\newpage
La señal S de suma puede generarse sumando las subbandas izquierda y derecha después de una corrección de fase (alineamiento temporal). Esta corrección de fase continua a partir de la ITD computada para esa subbanda y consiste en retardar la subbanda de canal izquierdo con ITD/2 y la subbanda de canal derecho -ITD/2. El retardo se realiza en el dominio de frecuencia mediante la modificación apropiada de los ángulos de fase de cada intervalo FFT. Posteriormente, la señal de suma se computa mediante la suma de las versiones modificadas en fase de las señales de subbanda izquierda y derecha. Finalmente, para compensar la suma correlacionada y no correlacionada, cada subbanda de la señal de suma se multiplica por \surd(2/(1+\rho)), con \rho siendo la correlación de la subbanda correspondiente. Si fuera necesario, la señal de suma puede convertirse al domino de tiempo mediante (1) introduciendo conjugados complejos a frecuencias negativas, (2) FFT inversa, (3) aplicación de ventanas, y (4) suma de solapamiento.
Preferiblemente, los parámetros espaciales se cuantifican para reducir la tasa de bits para su transmisión.
La señal S de suma y los parámetros P se comunican a un decodificador 405. El decodificador 405 comprende un circuito 406 de dispositivo de descorrelación que modifica la correlación entre las señales izquierda y derecha como se describe en relación con las figura 2. El decodificador adicionalmente comprende circuitos 407 y 408 de retardo que retardan cada subbanda de la señal izquierda mediante -ITD/2 y cada subbanda de la señal derecha mediante ITD/2, respectivamente, dada la ITD (cuantificada) que corresponde a esa subbanda. El decodificador adicionalmente comprende un circuito 409 que ajusta a escala la subbandas según la IID para esa subbanda y convierte las señales de salida al dominio de tiempo, por ejemplo mediante la realización de las siguientes etapas: 1) introducir conjugados complejos a frecuencias negativas, (2) FFT inversa, (3) aplicación de ventanas, y (4) suma de solapamiento.
La figura 5 muestra una vista esquemática de un sistema para comunicar señales de audio estéreo según una realización de la invención. El sistema comprende un dispositivo 501 de codificación para generar una señal de audio codificada y un dispositivo 505 de decodificación para decodificar una señal codificada recibida en una señal estéreo. El dispositivo 501 de codificación y el dispositivo 505 de decodificación pueden ser en cada caso cualquier equipo electrónico o una parte de un equipo de este tipo.
En este caso, el término equipo electrónico comprende ordenadores, tal como PC portátiles y estacionarios, equipos de comunicación por radio portátiles y estacionarios y otros dispositivos portátiles o de mano, tales como teléfonos móviles, localizadores, reproductores de audio, reproductores de multimedia, comunicadores, es decir organizadores electrónicos, teléfonos inteligentes, asistentes digitales personales (PDA), ordenadores portátiles, o similares. Debe notarse que el dispositivo 501 de codificación y el dispositivo de decodificación pueden combinarse en un equipo electrónico en el que las señales de audio se almacenan en un medio legible por ordenador para la reproducción posterior.
El dispositivo 501 de codificación comprende una unidad 511 de entrada para recibir una señal estéreo, un codificador 502 para codificar una señal de audio estéreo que incluye una componente L de señal izquierda y una componente R de señal derecha. El codificador 502 recibe las dos componentes de señal a través de la unidad 511 de entrada y genera una señal T codificada. La señal estéreo puede originarse a partir de un conjunto de micrófonos, por ejemplo a través de equipo electrónico adicional, tal como un equipo de mezcla, etc. Las señales pueden recibirse adicionalmente como una salida de otro reproductor de audio, por el aire como una señal de radio, o por cualquier otro medio adecuado. Un ejemplo de un codificador de este tipo se ha descrito anteriormente en conexión con la figura 4.
Según una realización, el codificador 502 está conectado a un transmisor 503 para transmitir la señal T codificada a través de un canal 509 de comunicaciones al dispositivo 505 de decodificación. El transmisor 503 puede comprender un conjunto de circuitos adecuado para permitir la comunicación de datos, por ejemplo a través de un enlace 509 de datos alámbrico o inalámbrico. Ejemplos de un transmisor de este tipo incluyen una interfaz de red, una tarjeta de red, un radio transmisor, un transmisor para otras señales electromagnéticas adecuadas, tales como un LED para transmitir luz de infrarrojos, por ejemplo a través de un puerto IrDa, comunicaciones basadas en radio, por ejemplo a través de un transceptor Bluetooth, o similares. Ejemplos adicionales de transmisores adecuados incluyen un módem de cable, un módem de teléfono, un adaptador de red digital de servicios integrados (ISDN), un adaptador de línea de abonado digital (DSL), un transceptor de satélite, un adaptador Ethernet, o similares. De manera correspondiente, el canal 509 de comunicaciones puede ser cualquier enlace de datos alámbrico o inalámbrico adecuado, por ejemplo una red de comunicaciones basada en paquetes, tal como Internet u otra red TCP/IP, un enlace de comunicaciones de corto alcance, tal como un enlace de infrarrojos, una conexión Bluetooth u otro enlace basado en
radio.
Ejemplos adicionales del canal de comunicaciones incluyen redes informáticas y redes de telecomunicaciones inalámbricas, tales como una red de datos de paquetes digitales celulares (CDPD, Cellular Digital Packet Data), una red de sistema global para comunicaciones móviles (GSM, Global Sytem for Mobile), una red de acceso múltiple por división de código (CDMA, Code Division Multiple Access), una red de acceso múltiple por división de tiempo (TDMA, Time Division Multiple Access), una red de servicio de radio por paquetes general (GPRS, General Packet Radio Service), una red de tercera generación, tal como una red UTMS, o similares.
Alternativamente o adicionalmente, el dispositivo de codificación puede comprender una o más de otras interfaces 504 para comunicar la señal T estéreo codificada con el dispositivo 505 de decodificación. Ejemplos de interfaces de este tipo incluyen una unidad de disco para almacenar datos en un medio 510 legible por ordenador, por ejemplo una unidad de disquete, una unidad CD-ROM de lectura/escritura, una unidad DVD, etc. Otros ejemplos incluyen una ranura de tarjeta de memoria, un lector/escritor de tarjeta magnética, una interfaz para acceder a una tarjeta inteligente, etc.
De manera correspondiente, el dispositivo 505 de decodificación comprende un receptor 508 correspondiente para recibir la señal transmitida por el transmisor y/o otra interfaz 506 para recibir la señal estéreo codificada comunicada a través de la interfaz 504 y el medio 510 legible por ordenador. El dispositivo adicionalmente comprende un decodificador 507 que recibe la señal T recibida y la decodifica en las componentes L’ y R’ de una señal estéreo decodificada. Una realización preferida de un decodificador de este tipo según la invención se describió anteriormente en conexión con la figura 4. El dispositivo de decodificación adicionalmente comprende una unidad 512 de salida para emitir las señales decodificadas que pueden alimentarse posteriormente a un reproductor de audio para la reproducción a través de un conjunto de altavoces, o similares.
Debe notarse que las disposiciones anteriores pueden implementarse como microprocesadores programables con finalidad especial o general, procesadores de señal digital (DSP, Digital Signal Processors), circuitos integrados específicos de aplicación (ASIC, Application Specific Integrates Circuits), dispositivos lógicos programables (PLA, Programmable Logic Array), dispositivos de compuertas programables por campo (FPGA, Field Programmable Gate Array), circuitos electrónicos especializados, etc., o una combinación de los mismos.
Deberá notarse que las realizaciones mencionadas anteriormente ilustran en lugar de limitar la invención, y que aquellos expertos en la técnica podrán diseñar muchas realizaciones alternativas sin alejarse del alcance de las reivindicaciones que se adjuntan.
Por ejemplo, la invención no está limitada a señales estereofónicas, sino que también puede aplicarse a otras señales de entrada multicanal que presentan dos o más canales de entrada. Ejemplos de señales de multicanal de este tipo incluyen señales recibidas desde un disco versátil digital (DVD) o un disco compacto de audio super, etc.
En las reivindicaciones, cualquier número de referencia situada entre paréntesis no debe interpretarse como un limitación de la reivindicación.
La palabra "comprendiendo" no excluye la presencia de elementos o etapas distintos a los enumerados en una reivindicación. La palabra "un" o "una" que precede a un elemento no excluye la presencia de una pluralidad de tales elementos.
La invención puede implementarse por medio de un hardware que comprende varios elementos diferentes, y por medio de un ordenador programado adecuadamente. En la reivindicación de dispositivo que enumera varios medios, varios de estos medios pueden incorporarse mediante un o el mismo artículo de hardware. El mero hecho de que determinadas medidas se enumeran en diferentes reivindicaciones dependientes mutuamente no indica que una combinación de estas medidas no pueda usarse de manera ventajosa.

Claims (8)

1. Método de sintetizar una primera y una segunda señal (L, R) de salida de audio a partir de una señal(x) de entrada. comprendiendo el método:
filtrar la señal (x) de entrada para generar una señal filtrada,
obtener un parámetro (r) de correlación indicativo de una correlación deseada entre las primeras y segundas señales (L, R) de salida;
obtener un parámetro (c) de nivel indicativo de una diferencia de nivel deseada entre las primeras y segundas señales (L, R) de salida; y
transformar la señal (x) de entrada y la señal filtrada mediante una operación de matrización a las primeras y segundas señales (L, R) de salida, en las que la operación de matrización depende del parámetro (r) de correlación y el parámetro (c) de nivel.
2. Método según la reivindicación 1, en el que la operación de matrización comprende una rotación común mediante un ángulo predeterminado de las primeras y segundas señales de salida en un espacio abarcado por la señal de entrada y la señal de entrada filtrada; y en el que el ángulo predeterminado depende del parámetro de nivel.
3. Método según la reivindicación 2, en el que el ángulo predeterminado se selecciona para maximizar una contribución total de la señal de entrada a las primeras y segundas señales de salida.
4. Método según la reivindicación 1, que adicionalmente comprende el ajuste a escala de cada una de las primeras y segundas señales de salida a dicha diferencia de nivel deseada entre las primeras y segundas señales de salida.
5. Método según la reivindicación 1, en el que la filtración de la señal de salida comprende la filtración pasa todo de la señal de entrada.
6. Método según la reivindicación 5, en el que el filtro pasa todo comprende un retardo dependiente de la frecuencia.
7. Disposición para sintetizar una primera y segunda señal (R, L) de salida de audio a partir de una señal (x) de entrada. comprendiendo la disposición:
medios (201) de filtro para filtrar la señal (x) de entrada para generar una señal filtrada,
medios (202) para obtener un parámetro (r) de correlación indicativo de una correlación deseada entre las primeras y segundas señales (L, R) de salida;
medios (202) para obtener un parámetro (c) de nivel indicativo de una diferencia de nivel deseada entre las primeras y segundas señales (L, R) de salida; y
medios (203) para transformar la señal (x) de entrada y la señal filtrada mediante una operación de matrización a la primeras y segundas señales (L, R) de salida, en las que la operación de matrización depende del parámetro (r) de correlación y el parámetro (c) de nivel.
8. Aparato para suministrar una señal de audio decodificada, comprendiendo el aparato una unidad de entrada para recibir una señal de audio codificada;
un decodificador para decodificar la señal de audio codificada, comprendiendo el decodificador una disposición para sintetizar una primera y segunda señal de audio según la reivindicación 7, y
una unidad de salida para proporcionar la primera y segunda señal de audio decodificada.
ES03712593T 2002-04-22 2003-04-22 Sintetizacion de señal. Expired - Lifetime ES2280736T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP02076588 2002-04-22
EP02076588 2002-04-22
EP02077863 2002-07-12
EP02077863 2002-07-12

Publications (1)

Publication Number Publication Date
ES2280736T3 true ES2280736T3 (es) 2007-09-16

Family

ID=29252213

Family Applications (1)

Application Number Title Priority Date Filing Date
ES03712593T Expired - Lifetime ES2280736T3 (es) 2002-04-22 2003-04-22 Sintetizacion de señal.

Country Status (11)

Country Link
US (2) US7933415B2 (es)
EP (1) EP1500082B1 (es)
JP (1) JP4401173B2 (es)
KR (1) KR101021076B1 (es)
CN (1) CN1312660C (es)
AT (1) ATE354161T1 (es)
AU (1) AU2003216682A1 (es)
BR (2) BRPI0304541B1 (es)
DE (2) DE60311794T2 (es)
ES (1) ES2280736T3 (es)
WO (1) WO2003090206A1 (es)

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003216682A1 (en) 2002-04-22 2003-11-03 Koninklijke Philips Electronics N.V. Signal synthesizing
US7809579B2 (en) 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
SE527713C2 (sv) 2003-12-19 2006-05-23 Ericsson Telefon Ab L M Kodning av polyfoniska signaler med villkorsbegränsade filter
US7725324B2 (en) 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
WO2005086139A1 (en) 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
CN1973320B (zh) * 2004-04-05 2010-12-15 皇家飞利浦电子股份有限公司 立体声编码和解码的方法及其设备
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7756713B2 (en) * 2004-07-02 2010-07-13 Panasonic Corporation Audio signal decoding device which decodes a downmix channel signal and audio signal encoding device which encodes audio channel signals together with spatial audio information
KR100745688B1 (ko) 2004-07-09 2007-08-03 한국전자통신연구원 다채널 오디오 신호 부호화/복호화 방법 및 장치
RU2391714C2 (ru) 2004-07-14 2010-06-10 Конинклейке Филипс Электроникс Н.В. Преобразование аудиоканалов
JP5312788B2 (ja) 2004-07-23 2013-10-09 コーニンクレッカ フィリップス エヌ ヴェ ソリッドステートライティングユニットの温度優先色制御のためのシステム
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
TWI498882B (zh) 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
KR20070051864A (ko) * 2004-08-26 2007-05-18 마츠시타 덴끼 산교 가부시키가이샤 멀티 채널 신호 부호화 장치 및 멀티 채널 신호 복호 장치
WO2006022190A1 (ja) * 2004-08-27 2006-03-02 Matsushita Electric Industrial Co., Ltd. オーディオエンコーダ
JP4936894B2 (ja) * 2004-08-27 2012-05-23 パナソニック株式会社 オーディオデコーダ、方法及びプログラム
KR20070056081A (ko) * 2004-08-31 2007-05-31 마츠시타 덴끼 산교 가부시키가이샤 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법
KR101158709B1 (ko) 2004-09-06 2012-06-22 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호 강화
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
BRPI0516658A (pt) * 2004-11-30 2008-09-16 Matsushita Electric Ind Co Ltd aparelho de codificação de estéreo, aparelho de decodificação de estéreo e seus métodos
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US9626973B2 (en) 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
ATE521143T1 (de) 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1905002B1 (en) 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
US8284961B2 (en) * 2005-07-15 2012-10-09 Panasonic Corporation Signal processing device
KR100857102B1 (ko) * 2005-07-29 2008-09-08 엘지전자 주식회사 인코딩된 오디오 신호 생성 및 처리 방법
US7706905B2 (en) 2005-07-29 2010-04-27 Lg Electronics Inc. Method for processing audio signal
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
EP1946062A4 (en) 2005-10-05 2009-09-09 Lg Electronics Inc METHOD AND DEVICE FOR SIGNAL PROCESSING AND CODING AND DECODING METHOD AND DEVICE THEREFOR
KR100857121B1 (ko) * 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US20070092086A1 (en) 2005-10-24 2007-04-26 Pang Hee S Removing time delays in signal paths
EP1974347B1 (en) 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
WO2007088853A1 (ja) * 2006-01-31 2007-08-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法
WO2007091850A1 (en) 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
EP1855457B1 (en) * 2006-05-10 2009-07-08 Harman Becker Automotive Systems GmbH Multi channel echo compensation using a decorrelation stage
CN101529898B (zh) * 2006-10-12 2014-09-17 Lg电子株式会社 用于处理混合信号的装置及其方法
CN102436822B (zh) * 2007-06-27 2015-03-25 日本电气株式会社 信号控制装置及其方法
GB2453117B (en) * 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
KR101444102B1 (ko) * 2008-02-20 2014-09-26 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
CN102037507B (zh) * 2008-05-23 2013-02-06 皇家飞利浦电子股份有限公司 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器
EP2304721B1 (fr) * 2008-06-26 2012-05-09 France Telecom Synthese spatiale de signaux audio multicanaux
US8233629B2 (en) * 2008-09-04 2012-07-31 Dts, Inc. Interaural time delay restoration system and method
EP2169664A3 (en) * 2008-09-25 2010-04-07 LG Electronics Inc. A method and an apparatus for processing a signal
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2169665B1 (en) * 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
US20110200201A1 (en) * 2008-10-16 2011-08-18 Pioneer Corporation Measurement signal generating device, measurement signal generating method, measurement signal generating program and storage medium
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
KR20110022252A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
EP2489040A1 (fr) * 2009-10-16 2012-08-22 France Telecom Decodage parametrique stereo optimise
EP2369861B1 (en) * 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
CH703771A2 (de) * 2010-09-10 2012-03-15 Stormingswiss Gmbh Vorrichtung und Verfahren zur zeitlichen Auswertung und Optimierung von stereophonen oder pseudostereophonen Signalen.
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
US20150078564A1 (en) * 2012-06-08 2015-03-19 Yongfang Guo Echo cancellation algorithm for long delayed echo
KR20230020553A (ko) 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
EP2989631A4 (en) * 2013-04-26 2016-12-21 Nokia Technologies Oy AUDIO SIGNAL ENCODER
PL3429233T3 (pl) 2013-07-30 2020-11-16 Dts, Inc. Dekoder matrycowy z panoramowaniem parami o stałej mocy
WO2015073597A1 (en) * 2013-11-13 2015-05-21 Om Audio, Llc Signature tuning filters
WO2015081293A1 (en) 2013-11-27 2015-06-04 Dts, Inc. Multiplet-based matrix mixing for high-channel count multichannel audio
WO2015104447A1 (en) 2014-01-13 2015-07-16 Nokia Technologies Oy Multi-channel audio signal classifier
CN106067819B (zh) * 2016-06-23 2021-11-26 广州市迪声音响有限公司 一种基于分量式矩阵算法的信号处理***
US10224042B2 (en) * 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
CA3127805C (en) * 2016-11-08 2023-12-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain
AU2018308668A1 (en) * 2017-07-28 2020-02-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for encoding or decoding an encoded multichannel signal using a filling signal generated by a broad band filter

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5172415A (en) * 1990-06-08 1992-12-15 Fosgate James W Surround processor
JPH06178164A (ja) * 1992-12-11 1994-06-24 Matsushita Electric Ind Co Ltd 適応等化処理における安定性および収束速度の適応制御方法
CN1059529C (zh) * 1994-06-23 2000-12-13 Ntt移动通信网株式会社 用于接收码分多址信号的方法和装置
US6895093B1 (en) * 1998-03-03 2005-05-17 Texas Instruments Incorporated Acoustic echo-cancellation system
US6658050B1 (en) * 1998-09-11 2003-12-02 Ericsson Inc. Channel estimates in a CDMA system using power control bits
JP2001109497A (ja) 1999-10-04 2001-04-20 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置およびオーディオ信号符号化方法
JP2001188599A (ja) 1999-10-19 2001-07-10 Matsushita Electric Ind Co Ltd オーディオ信号復号装置
JP2001142493A (ja) 1999-11-16 2001-05-25 Matsushita Electric Ind Co Ltd オーディオ信号高能率符号化装置
US6973184B1 (en) * 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
KR100809310B1 (ko) * 2000-07-19 2008-03-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 서라운드 및/또는 오디오 센터 신호를 구동하기 위한 다중-채널 스테레오 컨버터
DE10041512B4 (de) * 2000-08-24 2005-05-04 Infineon Technologies Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
JP2004517538A (ja) * 2000-12-22 2004-06-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 多チャネル・オーディオ変換器
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
AU2003216682A1 (en) 2002-04-22 2003-11-03 Koninklijke Philips Electronics N.V. Signal synthesizing
ES2323294T3 (es) * 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
US8284961B2 (en) 2005-07-15 2012-10-09 Panasonic Corporation Signal processing device
KR100857102B1 (ko) 2005-07-29 2008-09-08 엘지전자 주식회사 인코딩된 오디오 신호 생성 및 처리 방법

Also Published As

Publication number Publication date
EP1500082B1 (en) 2007-02-14
ATE354161T1 (de) 2007-03-15
US20050254446A1 (en) 2005-11-17
US8798275B2 (en) 2014-08-05
AU2003216682A1 (en) 2003-11-03
EP1500082A1 (en) 2005-01-26
CN1647157A (zh) 2005-07-27
KR20040101552A (ko) 2004-12-02
BR0304541A (pt) 2004-07-20
DE60311794T2 (de) 2007-10-31
JP2005523624A (ja) 2005-08-04
DE60311794D1 (en) 2007-03-29
US20110166866A1 (en) 2011-07-07
DE60311794C5 (de) 2022-11-10
WO2003090206A1 (en) 2003-10-30
KR101021076B1 (ko) 2011-03-11
CN1312660C (zh) 2007-04-25
US7933415B2 (en) 2011-04-26
BRPI0304541B1 (pt) 2017-07-04
JP4401173B2 (ja) 2010-01-20

Similar Documents

Publication Publication Date Title
ES2280736T3 (es) Sintetizacion de señal.
ES2300567T3 (es) Representacion parametrica de audio espacial.
US11671781B2 (en) Spatial audio signal format generation from a microphone array using adaptive capture
ES2294300T3 (es) Codificacion de audio.
ES2323275T3 (es) Conformacion de envolvente temporal de canal individual para esquemas de codificacion de indicacion binaural y similares.
US8861739B2 (en) Apparatus and method for generating a multichannel signal
ES2623365T3 (es) Compactación de información secundaria para la codificación paramétrica de audio espacial
ES2347274T3 (es) Codificacion de audio multicanal ajustable a escala.
RU2409911C2 (ru) Декодирование бинауральных аудиосигналов
ES2587196T3 (es) Extracción de una señal directa/de ambiente de una señal de mezcla descendente e información paramétrica espacial
ES2687952T3 (es) Reducción de fallas de filtro peine en mezcla descendente de canales múltiples con alineación de fase adaptativa
ES2340796T3 (es) Dispositivo y metodo para generar una señal estereofonica codificada de una pieza de audio o flujo de datos de audio.
ES2327158T3 (es) Codificacion y decodificacion de audio.
US8817992B2 (en) Multichannel audio coder and decoder
ES2401554T3 (es) Aparato, procedimiento y programa de computadora para mezclar hacia arriba una señal de audio mezclada hacia abajo
ES2609449T3 (es) Decodificación de audio
ES2547232T3 (es) Método y aparato para procesar una señal
MX2007004725A (es) Formacion de sonido difuso para esquemas de bbc y los semejantes.
ES2922532T3 (es) Codificador de escena de audio, decodificador de escena de audio y procedimientos relacionados que utilizan el análisis espacial híbrido de codificador / decodificador
US20240185869A1 (en) Combining spatial audio streams
ES2783975T3 (es) Codificación multicanal
US20230199417A1 (en) Spatial Audio Representation and Rendering
US20240079014A1 (en) Transforming spatial audio parameters
WO2020201619A1 (en) Spatial audio representation and associated rendering