ES2280736T3 - Sintetizacion de señal. - Google Patents
Sintetizacion de señal. Download PDFInfo
- Publication number
- ES2280736T3 ES2280736T3 ES03712593T ES03712593T ES2280736T3 ES 2280736 T3 ES2280736 T3 ES 2280736T3 ES 03712593 T ES03712593 T ES 03712593T ES 03712593 T ES03712593 T ES 03712593T ES 2280736 T3 ES2280736 T3 ES 2280736T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- signals
- output
- correlation
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims abstract description 17
- 238000001914 filtration Methods 0.000 claims abstract description 7
- 230000002194 synthesizing effect Effects 0.000 claims abstract 2
- 230000005236 sound signal Effects 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 claims description 14
- 230000001419 dependent effect Effects 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 abstract 1
- 230000000875 corresponding effect Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000005314 correlation function Methods 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 230000010363 phase shift Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 208000015976 Corneal dystrophy-perceptive deafness syndrome Diseases 0.000 description 1
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Networks Using Active Elements (AREA)
- Image Processing (AREA)
- Control Of Motors That Do Not Use Commutators (AREA)
- Control Of Charge By Means Of Generators (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Stereo-Broadcasting Methods (AREA)
- Burglar Alarm Systems (AREA)
Abstract
Método de sintetizar una primera y una segunda señal (L, R) de salida de audio a partir de una señal(x) de entrada. comprendiendo el método : filtrar la señal (x) de entrada para generar una señal filtrada, obtener un parámetro (r) de correlación indicativo de una correlación deseada entre las primeras y segundas señales (L, R) de salida; obtener un parámetro (c) de nivel indicativo de una diferencia de nivel deseada entre las primeras y segundas señales (L, R) de salida; y transformar la señal (x) de entrada y la señal filtrada mediante una operación de matrización a las primeras y segundas señales (L, R) de salida, en las que la operación de matrización depende del parámetro (r) de correlación y el parámetro (c) de nivel.
Description
Sintetización de señal.
Esta invención se refiere a la sintetización de
una primera y segunda señal de salida a partir de una señal de
entrada.
En el campo de la codificación de audio, los
codificadores de audio paramétricos han ganado un interés creciente.
Se ha mostrado que la transmisión (cuantificada) de parámetros que
describen señales de audio precisa sólo una capacidad de
transmisión pequeña y que permiten una decodificación en el extremo
de recepción que da como resultado una señal de audio que
perceptivamente no difiere significativamente de la señal original.
Por tanto, el ahorro de tasa de bits puede obtenerse mediante la
sola transmisión de un canal de audio combinado con un parámetro de
flujo de bits que describe las propiedades espaciales de la señal
estéreo y, por tanto, permite a un decodificador reproducir las
propiedades espaciales de la señal estéreo.
El artículo "Efficient representation of
spatial audio using perceptual parametriazation" (Faller y
Baumgarten, taller IEE en aplicaciones de procesamiento de señal
para audio y acústicas, 21 de Octubre de 2001) describe una
representación de audio espacial que comprende una señal de suma
monofónica y la diferencia de nivel interaural y la diferencia de
tiempo interaural en cada banda critica. Para sintetizar la señal
binaural, las diferencias de nivel y las diferencias de tiempo se
aplican a los coeficientes espectrales de la señal monofónica.
Uno de los parámetros espaciales anteriores que
es importante para la codificación de una señal estéreo que
comprende un canal L y un canal R es la correlación cruzada entre
canales entre los canales L y R. Por tanto, en muchos sistemas uno
de los parámetros de señal que se analizan mediante un codificador
es la correlación cruzada entre canales. La correlación cruzada
entonces se transmite junto con una señal mono del codificador a un
decodificador correspondiente.
En el decodificador dos señales de salida se
reconstruyen que tienen la correlación cruzada deseada.
Adicionalmente, se desea que la reconstrucción solo introduzca
pequeños artefactos con relación a la señal estéreo original.
Diversos métodos de decorrelacionar señales se
conocen como tal. La figura 1 ilustra el denominado dispositivo de
descorrelación Lauridsen. El dispositivo de descorrelación Lauridsen
comprende un filtro 101 pasa todo, por ejemplo un retardo, que
genera y posiblemente atenúa una versión retardada de la forma de
onda de la señal x de entrada. La salida H\varotimesx del filtro
101 se suma (102) posteriormente a la entrada dando como resultado
en el canal L izquierdo y se resta (103) de la entrada que da como
resultado en el canal R derecho.
El anterior dispositivo de descorrelación de la
técnica anterior es muy adecuado siempre que las dos señales de
salida sean muy similares o incluso iguales en nivel. Sin embargo,
los codificadores de audio paramétricos también aplican diferencias
de nivel a las señales de salida, la denominada panoramización de
amplitud (amplitude panning). El dispositivo de descorrelación
anterior implica el problema de que la calidad perceptiva de las
señales generadas se deteriora si las diferencias de nivel son
grandes.
El anterior y otros problemas se resuelven
mediante un método para sintetizar una primera y segunda señal de
salida de audio a partir de una señal de entrada, comprendiendo el
método:
- filtrar la señal de entrada para generar una señal filtrada,
- obtener un parámetro de correlación indicativo de una correlación deseada entre las primeras y segundas señales de salida;
- obtener un parámetro de nivel indicativo de una diferencia de nivel deseada entre las primeras y segundas señales de salida; y
- transformar la señal de salida y la señal filtrada mediante una operación de matrización a las primeras y segundas señales de salida, en las que la operación de matrización depende del parámetro de correlación y el parámetro de nivel.
Por tanto, realizando una operación de matriz
que depende tanto de la correlación deseada como de la diferencia
de nivel deseada, se consigue un incremento significativo en calidad
perceptiva de las señales de salida de un decodificador
paramétrico.
En una realización preferida, la operación de
matrización comprende una rotación común mediante un ángulo
predeterminado de las primeras y segundas señales en un espacio
abarcado por la señal de salida y la señal de entrada filtrada; y
en el que el ángulo predeterminado depende del parámetro de
nivel.
Por tanto, sumando una rotación adicional a la
operación de mezcla, el nivel relativo de las señales de salida
puede controlarse sin la influencia de la correlación cruzada entre
la señales de salida.
\newpage
En una realización preferida adicional, el
ángulo predeterminado se selecciona para maximizar una contribución
total de la señal de entrada a las primeras y segundas señales de
salida. Se sabe que la calidad perceptiva de la señal puede
incrementarse, si la cantidad de la señal filtrada presente en las
señales de salida se minimiza y, por tanto la cantidad de la señal
original se maximiza.
Cuando el método adicionalmente comprende el
ajuste a escala de cada una de las primeras y segundas señales de
salida a dicha diferencia de nivel deseada entre las señales
primeras y segundas de salida, se asegura que el nivel relativo de
las señales de salida corresponde al nivel deseado según a un
parámetro de nivel determinado por el codificador.
En una realización preferida, la filtración de
la señal de entrada comprende filtración de tipo pasa todo de la
señal de entrada, por ejemplo un filtro de peine. El espaciado
espectral de un filtro de peine se distribuye uniformemente sobre
la frecuencia. Por tanto para poder obtener un espaciado denso
deseado de los picos y valles en bajas frecuencias, el retardo del
dispositivo de descorrelación Lauridsen debería ser muy grande.
Esto, sin embargo, tiene la desventaja que en altas frecuencias,
pueden percibirse ecos para señales de entrada transitorias.
Este problema puede solventarse cuando el filtro
pasa todo comprende un retardo dependiente de la frecuencia. A
altas frecuencias, se usas un retardo relativamente pequeño, dando
como resultado una resolución de frecuencia aproximada. A bajas
frecuencias, un retardo grande da como resultado un espaciado denso
del filtro de peine.
La filtración puede realizarse en el ancho de
banda completo de la señal. Alternativamente, la filtración puede
combinarse con un filtro de limitación de banda, aplicando de ese
modo la decorrelación a una o más bandas de frecuencia
seleccionadas.
El termino operación de matriz se refiere a una
operación que transforma una señal multicanal de entrada en una
señal multicanal de salida en la que los componentes de la señal
multicanal de salida son combinaciones lineares de los componentes
de la señal multicanal de entrada.
La presente invención puede implementarse de
maneras diferentes incluyendo el método descrito anteriormente y a
continuación, disposiciones para la codificación y decodificación, y
medios de producto adicionales, cada uno produciendo uno o más de
los beneficios y ventajas descritas en conexión con el método
mencionado en primer lugar, y presentando cada uno una o más
realizaciones preferidas correspondientes a las realizaciones
preferidas descritas en conexión con el método mencionado en primer
lugar y descrito en las reivindicaciones dependientes.
Ha de observarse que las características del
método descrito anteriormente y a continuación pueden implementarse
en software y llevarse a cabo en un sistema de procesamiento de
datos u otros medios de procesamiento causados por la ejecución de
instrucciones ejecutables por ordenador. Las instrucciones pueden
ser medios de código de programa cargados en una memoria, tal como
una RAM, desde un medio de almacenamiento o desde otro ordenador a
través de una red informática. Alternativamente, las características
descritas pueden implementarse mediante un conjunto de circuitos
conectados físicamente por cable en lugar de software o una
combinación con software.
La invención adicionalmente se refiere a una
disposición para sintetizar una primera y segunda señal de salida
de audio a partir de una señal de entrada, comprendiendo la
disposición:
- medios de filtro para filtrar la señal de entrada para generar una señal filtrada,
- medios para obtener un parámetro de correlación indicativo de una correlación deseada entre las primeras y segundas señales de entrada;
- medios para obtener un parámetro de nivel indicativo de una diferencia de nivel deseada entre las primeras y segundas señales de entrada; y
- medios para transformar la señal de entrada y la señal filtrada mediante una operación de matrización a la primeras y segundas señales de salida, en las que la operación de matrización depende del parámetro de correlación y el parámetro de nivel.
La invención adicionalmente se refiere a un
aparato para suministrar una señal de audio decodificada,
comprendiendo el aparato:
- una unidad de entrada para recibir una señal de audio codificada;
- un decodificador para decodificar la señal de audio codificada, comprendiendo el decodificador una disposición para sintetizar una primera y segunda señal de audio como se describe anterior y a continuación, y
- una unidad de salida para proporcionar la primera y segunda señal de audio decodificada.
\newpage
Estos y otros aspectos de la invención
resultarán evidentes y aclaratorios a partir de las reivindicaciones
descritas a continuación con referencia a los dibujos en los
que:
la figura 1 muestra un dispositivo de
descorrelación de Lauridsen de la técnica anterior;
la figura 2 ilustra un dispositivo de
descorrelación según una realización de la invención,
las figuras 3a a 3c ilustran la generación de
señal según una realización de la invención,
la figura 4 muestra esquemáticamente un sistema
para codificación de audio espacial; y
la figura 5 muestra una vista esquemática de un
sistema para comunicar señales de audio multicanal;
La figura 2 ilustra un dispositivo de
descorrelación según una realización de la invención: El dispositivo
de descorrelación comprende un filtro 201 pasa todo que recibe una
señal x de entrada, por ejemplo de un codificador de audio
paramétrico que genera una señal x de audio mono y un conjunto de
parámetros P incluyendo una correlación p cruzada entre canales y
un parámetro indicativo de la diferencia c de canal.
Preferiblemente, el filtro pasa todo comprende un retardo
dependiente de la de frecuencia que proporciona un retardo
relativamente más pequeño a altas frecuencias que a bajas
frecuencias. Esto puede conseguirse mediante el reemplazo de un
retardo fijo del filtro pasa todo por un filtro pasa todo que
comprende un periodo de un complejo de fase Schroeder (véase por
ejemplo M.R. Schroeder, "Synthesis of
low-peak-factor signals and binary
sequences with low autocorrelation", IEEE Transact. Inf. Theor.,
16:85-89, 1970). El dispositivo de descorrelación
adicionalmente comprende un circuito 202 de análisis que recibe
parámetros espaciales del decodificador y extrae la correlación p
cruzada entre canales y la diferencia c de canal. El circuito 202
determina una matriz M(\alpha, \beta) de mezcla como se
describirá en conexión con las figuras 3a a c. Los componentes de la
matriz de mezcla se alimentan a un circuito 203 de transformación
que adicionalmente recibe la señal x de entrada y la señal
H\varotimesx filtrada. El circuito 203 realiza una operación de
mezcla según
dando como resultado las señales L
y R de
salida.
Las figuras 3a a c ilustran la generación de
señal según una realización de la invención. En la figura 3a la
señal x de salida se representa mediante el eje horizontal mientras
la señal H\varotimesx filtrada se representa mediante el eje
vertical. Como las dos señales no están correlacionadas pueden
representarse como vectores ortogonales que abarcan un espacio
bidimensional.
Las señales L y R de salida se representan como
vectores 301 y 302, respectivamente. En esta representación, la
correlación entre las señales L y R viene dada por el ángulo
\alpha entre los vectores 301 y 302 según \rho = cos
(\alpha), es decir mediante la distancia \alpha angular entre
los vectores 301 y 302. Consecuentemente, cualquier par de vectores
que exhiben la distancia angular correcta tienen la correlación
especificada.
Por tanto, una matriz M de mezcla que transforma
las señales x y H\varotimesx en señales L y R con una correlación
p predeterminada puede expresarse como sigue:
Por tanto, la cantidad de señal filtrada pasa
todo depende de la correlación deseada. Adicionalmente, la energía
de la componente de señal pasa todo es la misma en ambos canales de
salida (pero con un desplazamiento de fase de 180º).
Nótese que el dispositivo de descorrelación
Lauridsen de la figura 1 corresponde al caso en el que la matriz M
viene dada por
es decir \alpha = 90º que
corresponde a las señales de salida no correlacionadas (\rho =
0).
\newpage
Con el fin de ilustrar un problema con la matriz
de la ecuación (3), se asume una situación con una amplitud extrema
distribuyéndose hacia el canal izquierdo, es decir un caso en el que
una determinada señal está presente sólo en el canal izquierdo. Se
asume adicionalmente que la correlación deseada entre las salidas es
cero. En este caso, la salida del canal izquierdo de la
transformación de la ecuación (1) con la matriz de mezcla de la
ecuación (3) produce L = 1/\surd2(x + H\varotimesx). Por
tanto, la salida consiste en la señal x original combinada con toda
su versión H\varotimesx filtrada pasa todo.
Sin embargo, esta es una situación no deseada,
ya que el filtro pasa todo habitualmente deteriora la calidad
perceptiva de la señal. Adicionalmente, la suma de la señal original
y la señal filtrada da como resultado efectos de filtro de peine,
tales como una coloración percibida de la señal de salida. En este
caso extremo asumido, la mejor solución sería que la señal de
salida izquierda consistiera en la señal de entrada. De esta manera
la correlación de las dos señales de salida aun sería cero.
En situaciones con diferencias de nivel más
moderadas, la situación preferida es que el canal de salida con más
sonoridad contenga relativamente más de la señal original, y el
canal de salida con menos sonoridad contenga relativamente más de
la señal filtrada. Por tanto, en general, se prefiere maximizar la
cantidad de la señal original presente en las dos salidas
conjuntas, y minimizar la cantidad de la señal filtrada.
Según la invención, esto se consigue mediante la
introducción de una matriz de mezcla diferente que incluye una
rotación común adicional:
En este caso \beta es una rotación adicional,
y C es una matriz de ajuste a escala que asegura que la diferencia
de nivel relativa entre las señales de salida es igual a c, es
decir
Introduciendo la matriz de la ecuación (4) en la
ecuación (1) produce las señales de salida generadas mediante la
operación de matrización según la invención:
Esta situación se ilustra en la figura 3b. Las
señales de salida L y R todavía tienen una diferencia angular
\alpha, es decir la correlación entre las señales L y R no se ve
afectada por el ajuste a escala de las señales L y R según la
diferencia de nivel deseada y la rotación adicional mediante el
ángulo \beta de tanto la señal L como la R.
Como se mencionado anteriormente,
preferiblemente, la cantidad de la señal x original en la salida
sumada de L y R debería maximizarse. Esta condición puede usarse
para determinar el ángulo \beta, según
\newpage
que produce la
condición:
Esta situación se ilustra en la figura 3c, en la
que la suma de las componentes L y R está alineada con la dirección
de x.
La figura 4 muestra esquemáticamente un sistema
para codificación de audio espacial. El sistema comprende un
codificador 401 y un decodificador 405 correspondiente. El
codificador 401 describe los atributos espaciales de una señal de
audio multicanal mediante la especificación de una diferencia de
nivel interaural, una diferencia de tiempo (o fase) interaural, y
una correlación máxima como una función del tiempo y la frecuencia,
como se describe en el documento
WO-A1-03/090208.
El codificador 401 recibe las componentes L y R
de una señal estéreo como entradas. Inicialmente, mediante
circuitos 402 y 403 de corte de tiempo/frecuencia, las componentes R
y L, respectivamente, se dividen en diversas ranuras de
tiempo/frecuencia, por ejemplo mediante la aplicación de ventanas de
tiempo seguidas por una operación de transformación.
En una realización, las señales izquierda y
derecha de entrada se dividen en varias tramas de tiempo (por
ejemplo 2048 muestras a 44,1 kHz de tasa de muestreo) y partidas en
ventanas con una ventana de Hanning de raíz cuadrada.
Posteriormente, se computan las FFT. Las frecuencias FFT negativas
se descartan y las FFT resultantes se subdividen en grupos
(subbandas) de intervalos (bin) FFT. El número de intervalos FFT que
se combinan es una subbanda depende de la frecuencia: a frecuencias
más altas se combinan más intervalos que a frecuencias más bajas.
Por ejemplo, los intervalos FFT que corresponden a aproximadamente
1,8 ERB (equivalent rectangular bandwidth, ancho de banda
rectangular equivalente) pueden agruparse, dando como resultado por
ejemplo 20 subbandas para representar toda la gama de frecuencia
audible.
Posteriormente, en el circuito 404 de análisis,
para cada ranura de tiempo/frecuencia, se analizan las siguientes
propiedades de las señales entrantes:
La diferencia de nivel interaural, o ILD,
definido mediante los niveles relativos de las señales limitadas
por banda correspondientes que provienen de las dos entradas,
La diferencia (ITD o IPD) de tiempo(o
fase) interaural, definida por el retardo interaural (o
desplazamiento de fase) que corresponde al pico de la función de
correlación cruzada interaural, y
La similitud (o falta de similitud) de las
formas de onda que no pueden explicarse mediante las ITD o ILD, que
puede parametrizarse mediante el valor máximo de la función de
correlación cruzada (es decir, el valor de la función de
correlación cruzada en la posición del pico máximo).
Los tres parámetros descritos con anterioridad
varían con el tiempo; sin embargo, debido a que sabe que el sistema
auditivo binaural s muy lento en su procesamiento, la tasa de
actualización de estas propiedades es bastante baja (normalmente
decenas de milisegundos).
El circuito 404 de análisis genera
adicionalmente una señal S de suma (o dominante) que comprende una
combinación de las señales izquierda y derecha. Por tanto, las
señales L y R se codifican como una señal S de suma y un conjunto
de parámetros P como una función de frecuencia y tiempo,
comprendiendo los parámetros P la ILD, la ITD/IPD, y el valor
máximo de la función de correlación cruzada.
Debe notarse que el parámetro ILD en esta
realización está relacionado con el parámetro c de diferencia de
canal en la realización de la figura 2 mediante ILD
=k·log(c), en el que k es una constante, es decir que ILD es
proporcional al logaritmo de c.
En una realización, para cada subbanda, se
computan la correspondiente ILD, ITD y correlación p. La ITD y
correlación se computan simplemente estableciendo todos los
intervalos FFT que pertenecen a otros grupos a cero, multiplicando
las resultantes (limitadas por banda) FFT de los canales izquierdo y
derecho, seguidas por una transformada FFT inversa. La función de
correlación cruzada resultante se escanea para un pico dentro de un
retardo entre canales entre -64 y +63 muestras. El retardo interno
que corresponde al pico se usa como valor ITD, y el valor de la
función de correlación cruzada en este pico se usa como correlación
interaural de esta subbanda. Finalmente, la ILD se computa
simplemente tomando la relación de potencia de los canales
izquierdo y derecho para cada subbanda.
\newpage
La señal S de suma puede generarse sumando las
subbandas izquierda y derecha después de una corrección de fase
(alineamiento temporal). Esta corrección de fase continua a partir
de la ITD computada para esa subbanda y consiste en retardar la
subbanda de canal izquierdo con ITD/2 y la subbanda de canal derecho
-ITD/2. El retardo se realiza en el dominio de frecuencia mediante
la modificación apropiada de los ángulos de fase de cada intervalo
FFT. Posteriormente, la señal de suma se computa mediante la suma de
las versiones modificadas en fase de las señales de subbanda
izquierda y derecha. Finalmente, para compensar la suma
correlacionada y no correlacionada, cada subbanda de la señal de
suma se multiplica por \surd(2/(1+\rho)), con \rho
siendo la correlación de la subbanda correspondiente. Si fuera
necesario, la señal de suma puede convertirse al domino de tiempo
mediante (1) introduciendo conjugados complejos a frecuencias
negativas, (2) FFT inversa, (3) aplicación de ventanas, y (4) suma
de solapamiento.
Preferiblemente, los parámetros espaciales se
cuantifican para reducir la tasa de bits para su transmisión.
La señal S de suma y los parámetros P se
comunican a un decodificador 405. El decodificador 405 comprende un
circuito 406 de dispositivo de descorrelación que modifica la
correlación entre las señales izquierda y derecha como se describe
en relación con las figura 2. El decodificador adicionalmente
comprende circuitos 407 y 408 de retardo que retardan cada subbanda
de la señal izquierda mediante -ITD/2 y cada subbanda de la señal
derecha mediante ITD/2, respectivamente, dada la ITD (cuantificada)
que corresponde a esa subbanda. El decodificador adicionalmente
comprende un circuito 409 que ajusta a escala la subbandas según la
IID para esa subbanda y convierte las señales de salida al dominio
de tiempo, por ejemplo mediante la realización de las siguientes
etapas: 1) introducir conjugados complejos a frecuencias negativas,
(2) FFT inversa, (3) aplicación de ventanas, y (4) suma de
solapamiento.
La figura 5 muestra una vista esquemática de un
sistema para comunicar señales de audio estéreo según una
realización de la invención. El sistema comprende un dispositivo 501
de codificación para generar una señal de audio codificada y un
dispositivo 505 de decodificación para decodificar una señal
codificada recibida en una señal estéreo. El dispositivo 501 de
codificación y el dispositivo 505 de decodificación pueden ser en
cada caso cualquier equipo electrónico o una parte de un equipo de
este tipo.
En este caso, el término equipo electrónico
comprende ordenadores, tal como PC portátiles y estacionarios,
equipos de comunicación por radio portátiles y estacionarios y otros
dispositivos portátiles o de mano, tales como teléfonos móviles,
localizadores, reproductores de audio, reproductores de multimedia,
comunicadores, es decir organizadores electrónicos, teléfonos
inteligentes, asistentes digitales personales (PDA), ordenadores
portátiles, o similares. Debe notarse que el dispositivo 501 de
codificación y el dispositivo de decodificación pueden combinarse
en un equipo electrónico en el que las señales de audio se almacenan
en un medio legible por ordenador para la reproducción
posterior.
El dispositivo 501 de codificación comprende una
unidad 511 de entrada para recibir una señal estéreo, un
codificador 502 para codificar una señal de audio estéreo que
incluye una componente L de señal izquierda y una componente R de
señal derecha. El codificador 502 recibe las dos componentes de
señal a través de la unidad 511 de entrada y genera una señal T
codificada. La señal estéreo puede originarse a partir de un
conjunto de micrófonos, por ejemplo a través de equipo electrónico
adicional, tal como un equipo de mezcla, etc. Las señales pueden
recibirse adicionalmente como una salida de otro reproductor de
audio, por el aire como una señal de radio, o por cualquier otro
medio adecuado. Un ejemplo de un codificador de este tipo se ha
descrito anteriormente en conexión con la figura 4.
Según una realización, el codificador 502 está
conectado a un transmisor 503 para transmitir la señal T codificada
a través de un canal 509 de comunicaciones al dispositivo 505 de
decodificación. El transmisor 503 puede comprender un conjunto de
circuitos adecuado para permitir la comunicación de datos, por
ejemplo a través de un enlace 509 de datos alámbrico o inalámbrico.
Ejemplos de un transmisor de este tipo incluyen una interfaz de red,
una tarjeta de red, un radio transmisor, un transmisor para otras
señales electromagnéticas adecuadas, tales como un LED para
transmitir luz de infrarrojos, por ejemplo a través de un puerto
IrDa, comunicaciones basadas en radio, por ejemplo a través de un
transceptor Bluetooth, o similares. Ejemplos adicionales de
transmisores adecuados incluyen un módem de cable, un módem de
teléfono, un adaptador de red digital de servicios integrados
(ISDN), un adaptador de línea de abonado digital (DSL), un
transceptor de satélite, un adaptador Ethernet, o similares. De
manera correspondiente, el canal 509 de comunicaciones puede ser
cualquier enlace de datos alámbrico o inalámbrico adecuado, por
ejemplo una red de comunicaciones basada en paquetes, tal como
Internet u otra red TCP/IP, un enlace de comunicaciones de corto
alcance, tal como un enlace de infrarrojos, una conexión Bluetooth
u otro enlace basado en
radio.
radio.
Ejemplos adicionales del canal de comunicaciones
incluyen redes informáticas y redes de telecomunicaciones
inalámbricas, tales como una red de datos de paquetes digitales
celulares (CDPD, Cellular Digital Packet Data), una red de sistema
global para comunicaciones móviles (GSM, Global Sytem for Mobile),
una red de acceso múltiple por división de código (CDMA, Code
Division Multiple Access), una red de acceso múltiple por división
de tiempo (TDMA, Time Division Multiple Access), una red de
servicio de radio por paquetes general (GPRS, General Packet Radio
Service), una red de tercera generación, tal como una red UTMS, o
similares.
Alternativamente o adicionalmente, el
dispositivo de codificación puede comprender una o más de otras
interfaces 504 para comunicar la señal T estéreo codificada con el
dispositivo 505 de decodificación. Ejemplos de interfaces de este
tipo incluyen una unidad de disco para almacenar datos en un medio
510 legible por ordenador, por ejemplo una unidad de disquete, una
unidad CD-ROM de lectura/escritura, una unidad DVD,
etc. Otros ejemplos incluyen una ranura de tarjeta de memoria, un
lector/escritor de tarjeta magnética, una interfaz para acceder a
una tarjeta inteligente, etc.
De manera correspondiente, el dispositivo 505 de
decodificación comprende un receptor 508 correspondiente para
recibir la señal transmitida por el transmisor y/o otra interfaz 506
para recibir la señal estéreo codificada comunicada a través de la
interfaz 504 y el medio 510 legible por ordenador. El dispositivo
adicionalmente comprende un decodificador 507 que recibe la señal T
recibida y la decodifica en las componentes L’ y R’ de una señal
estéreo decodificada. Una realización preferida de un decodificador
de este tipo según la invención se describió anteriormente en
conexión con la figura 4. El dispositivo de decodificación
adicionalmente comprende una unidad 512 de salida para emitir las
señales decodificadas que pueden alimentarse posteriormente a un
reproductor de audio para la reproducción a través de un conjunto de
altavoces, o similares.
Debe notarse que las disposiciones anteriores
pueden implementarse como microprocesadores programables con
finalidad especial o general, procesadores de señal digital (DSP,
Digital Signal Processors), circuitos integrados específicos de
aplicación (ASIC, Application Specific Integrates Circuits),
dispositivos lógicos programables (PLA, Programmable Logic Array),
dispositivos de compuertas programables por campo (FPGA, Field
Programmable Gate Array), circuitos electrónicos especializados,
etc., o una combinación de los mismos.
Deberá notarse que las realizaciones mencionadas
anteriormente ilustran en lugar de limitar la invención, y que
aquellos expertos en la técnica podrán diseñar muchas realizaciones
alternativas sin alejarse del alcance de las reivindicaciones que
se adjuntan.
Por ejemplo, la invención no está limitada a
señales estereofónicas, sino que también puede aplicarse a otras
señales de entrada multicanal que presentan dos o más canales de
entrada. Ejemplos de señales de multicanal de este tipo incluyen
señales recibidas desde un disco versátil digital (DVD) o un disco
compacto de audio super, etc.
En las reivindicaciones, cualquier número de
referencia situada entre paréntesis no debe interpretarse como un
limitación de la reivindicación.
La palabra "comprendiendo" no excluye la
presencia de elementos o etapas distintos a los enumerados en una
reivindicación. La palabra "un" o "una" que precede a un
elemento no excluye la presencia de una pluralidad de tales
elementos.
La invención puede implementarse por medio de un
hardware que comprende varios elementos diferentes, y por medio de
un ordenador programado adecuadamente. En la reivindicación de
dispositivo que enumera varios medios, varios de estos medios
pueden incorporarse mediante un o el mismo artículo de hardware. El
mero hecho de que determinadas medidas se enumeran en diferentes
reivindicaciones dependientes mutuamente no indica que una
combinación de estas medidas no pueda usarse de manera
ventajosa.
Claims (8)
1. Método de sintetizar una primera
y una segunda señal (L, R) de salida de audio a partir de una
señal(x) de entrada. comprendiendo el método:
- filtrar la señal (x) de entrada para generar una señal filtrada,
- obtener un parámetro (r) de correlación indicativo de una correlación deseada entre las primeras y segundas señales (L, R) de salida;
- obtener un parámetro (c) de nivel indicativo de una diferencia de nivel deseada entre las primeras y segundas señales (L, R) de salida; y
- transformar la señal (x) de entrada y la señal filtrada mediante una operación de matrización a las primeras y segundas señales (L, R) de salida, en las que la operación de matrización depende del parámetro (r) de correlación y el parámetro (c) de nivel.
2. Método según la reivindicación 1,
en el que la operación de matrización comprende una rotación común
mediante un ángulo predeterminado de las primeras y segundas señales
de salida en un espacio abarcado por la señal de entrada y la señal
de entrada filtrada; y en el que el ángulo predeterminado depende
del parámetro de nivel.
3. Método según la reivindicación 2,
en el que el ángulo predeterminado se selecciona para maximizar una
contribución total de la señal de entrada a las primeras y segundas
señales de salida.
4. Método según la reivindicación 1,
que adicionalmente comprende el ajuste a escala de cada una de las
primeras y segundas señales de salida a dicha diferencia de nivel
deseada entre las primeras y segundas señales de salida.
5. Método según la reivindicación 1,
en el que la filtración de la señal de salida comprende la
filtración pasa todo de la señal de entrada.
6. Método según la reivindicación 5,
en el que el filtro pasa todo comprende un retardo dependiente de
la frecuencia.
7. Disposición para sintetizar una
primera y segunda señal (R, L) de salida de audio a partir de una
señal (x) de entrada. comprendiendo la disposición:
- medios (201) de filtro para filtrar la señal (x) de entrada para generar una señal filtrada,
- medios (202) para obtener un parámetro (r) de correlación indicativo de una correlación deseada entre las primeras y segundas señales (L, R) de salida;
- medios (202) para obtener un parámetro (c) de nivel indicativo de una diferencia de nivel deseada entre las primeras y segundas señales (L, R) de salida; y
- medios (203) para transformar la señal (x) de entrada y la señal filtrada mediante una operación de matrización a la primeras y segundas señales (L, R) de salida, en las que la operación de matrización depende del parámetro (r) de correlación y el parámetro (c) de nivel.
8. Aparato para suministrar una
señal de audio decodificada, comprendiendo el aparato una unidad de
entrada para recibir una señal de audio codificada;
- un decodificador para decodificar la señal de audio codificada, comprendiendo el decodificador una disposición para sintetizar una primera y segunda señal de audio según la reivindicación 7, y
- una unidad de salida para proporcionar la primera y segunda señal de audio decodificada.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02076588 | 2002-04-22 | ||
EP02076588 | 2002-04-22 | ||
EP02077863 | 2002-07-12 | ||
EP02077863 | 2002-07-12 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2280736T3 true ES2280736T3 (es) | 2007-09-16 |
Family
ID=29252213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES03712593T Expired - Lifetime ES2280736T3 (es) | 2002-04-22 | 2003-04-22 | Sintetizacion de señal. |
Country Status (11)
Country | Link |
---|---|
US (2) | US7933415B2 (es) |
EP (1) | EP1500082B1 (es) |
JP (1) | JP4401173B2 (es) |
KR (1) | KR101021076B1 (es) |
CN (1) | CN1312660C (es) |
AT (1) | ATE354161T1 (es) |
AU (1) | AU2003216682A1 (es) |
BR (2) | BRPI0304541B1 (es) |
DE (2) | DE60311794T2 (es) |
ES (1) | ES2280736T3 (es) |
WO (1) | WO2003090206A1 (es) |
Families Citing this family (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2003216682A1 (en) | 2002-04-22 | 2003-11-03 | Koninklijke Philips Electronics N.V. | Signal synthesizing |
US7809579B2 (en) | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
SE527713C2 (sv) | 2003-12-19 | 2006-05-23 | Ericsson Telefon Ab L M | Kodning av polyfoniska signaler med villkorsbegränsade filter |
US7725324B2 (en) | 2003-12-19 | 2010-05-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Constrained filter encoding of polyphonic signals |
US20090299756A1 (en) * | 2004-03-01 | 2009-12-03 | Dolby Laboratories Licensing Corporation | Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
WO2005086139A1 (en) | 2004-03-01 | 2005-09-15 | Dolby Laboratories Licensing Corporation | Multichannel audio coding |
CN1973320B (zh) * | 2004-04-05 | 2010-12-15 | 皇家飞利浦电子股份有限公司 | 立体声编码和解码的方法及其设备 |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
US7756713B2 (en) * | 2004-07-02 | 2010-07-13 | Panasonic Corporation | Audio signal decoding device which decodes a downmix channel signal and audio signal encoding device which encodes audio channel signals together with spatial audio information |
KR100745688B1 (ko) | 2004-07-09 | 2007-08-03 | 한국전자통신연구원 | 다채널 오디오 신호 부호화/복호화 방법 및 장치 |
RU2391714C2 (ru) | 2004-07-14 | 2010-06-10 | Конинклейке Филипс Электроникс Н.В. | Преобразование аудиоканалов |
JP5312788B2 (ja) | 2004-07-23 | 2013-10-09 | コーニンクレッカ フィリップス エヌ ヴェ | ソリッドステートライティングユニットの温度優先色制御のためのシステム |
TWI393121B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
TWI498882B (zh) | 2004-08-25 | 2015-09-01 | Dolby Lab Licensing Corp | 音訊解碼器 |
KR20070051864A (ko) * | 2004-08-26 | 2007-05-18 | 마츠시타 덴끼 산교 가부시키가이샤 | 멀티 채널 신호 부호화 장치 및 멀티 채널 신호 복호 장치 |
WO2006022190A1 (ja) * | 2004-08-27 | 2006-03-02 | Matsushita Electric Industrial Co., Ltd. | オーディオエンコーダ |
JP4936894B2 (ja) * | 2004-08-27 | 2012-05-23 | パナソニック株式会社 | オーディオデコーダ、方法及びプログラム |
KR20070056081A (ko) * | 2004-08-31 | 2007-05-31 | 마츠시타 덴끼 산교 가부시키가이샤 | 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법 |
KR101158709B1 (ko) | 2004-09-06 | 2012-06-22 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 신호 강화 |
SE0402650D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
BRPI0516658A (pt) * | 2004-11-30 | 2008-09-16 | Matsushita Electric Ind Co Ltd | aparelho de codificação de estéreo, aparelho de decodificação de estéreo e seus métodos |
EP1691348A1 (en) | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
US9626973B2 (en) | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
ATE521143T1 (de) | 2005-02-23 | 2011-09-15 | Ericsson Telefon Ab L M | Adaptive bitzuweisung für die mehrkanal- audiokodierung |
JP4988716B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
EP1905002B1 (en) | 2005-05-26 | 2013-05-22 | LG Electronics Inc. | Method and apparatus for decoding audio signal |
US8284961B2 (en) * | 2005-07-15 | 2012-10-09 | Panasonic Corporation | Signal processing device |
KR100857102B1 (ko) * | 2005-07-29 | 2008-09-08 | 엘지전자 주식회사 | 인코딩된 오디오 신호 생성 및 처리 방법 |
US7706905B2 (en) | 2005-07-29 | 2010-04-27 | Lg Electronics Inc. | Method for processing audio signal |
TWI396188B (zh) | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
EP1946062A4 (en) | 2005-10-05 | 2009-09-09 | Lg Electronics Inc | METHOD AND DEVICE FOR SIGNAL PROCESSING AND CODING AND DECODING METHOD AND DEVICE THEREFOR |
KR100857121B1 (ko) * | 2005-10-05 | 2008-09-05 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US20070092086A1 (en) | 2005-10-24 | 2007-04-26 | Pang Hee S | Removing time delays in signal paths |
EP1974347B1 (en) | 2006-01-19 | 2014-08-06 | LG Electronics Inc. | Method and apparatus for processing a media signal |
WO2007088853A1 (ja) * | 2006-01-31 | 2007-08-09 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法 |
WO2007091850A1 (en) | 2006-02-07 | 2007-08-16 | Lg Electronics Inc. | Apparatus and method for encoding/decoding signal |
EP1853092B1 (en) | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
EP1855457B1 (en) * | 2006-05-10 | 2009-07-08 | Harman Becker Automotive Systems GmbH | Multi channel echo compensation using a decorrelation stage |
CN101529898B (zh) * | 2006-10-12 | 2014-09-17 | Lg电子株式会社 | 用于处理混合信号的装置及其方法 |
CN102436822B (zh) * | 2007-06-27 | 2015-03-25 | 日本电气株式会社 | 信号控制装置及其方法 |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
KR101444102B1 (ko) * | 2008-02-20 | 2014-09-26 | 삼성전자주식회사 | 스테레오 오디오의 부호화, 복호화 방법 및 장치 |
CN102037507B (zh) * | 2008-05-23 | 2013-02-06 | 皇家飞利浦电子股份有限公司 | 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器 |
EP2304721B1 (fr) * | 2008-06-26 | 2012-05-09 | France Telecom | Synthese spatiale de signaux audio multicanaux |
US8233629B2 (en) * | 2008-09-04 | 2012-07-31 | Dts, Inc. | Interaural time delay restoration system and method |
EP2169664A3 (en) * | 2008-09-25 | 2010-04-07 | LG Electronics Inc. | A method and an apparatus for processing a signal |
WO2010036059A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
EP2169665B1 (en) * | 2008-09-25 | 2018-05-02 | LG Electronics Inc. | A method and an apparatus for processing a signal |
US20110200201A1 (en) * | 2008-10-16 | 2011-08-18 | Pioneer Corporation | Measurement signal generating device, measurement signal generating method, measurement signal generating program and storage medium |
JP5309944B2 (ja) * | 2008-12-11 | 2013-10-09 | 富士通株式会社 | オーディオ復号装置、方法、及びプログラム |
KR20110022252A (ko) * | 2009-08-27 | 2011-03-07 | 삼성전자주식회사 | 스테레오 오디오의 부호화, 복호화 방법 및 장치 |
EP2489040A1 (fr) * | 2009-10-16 | 2012-08-22 | France Telecom | Decodage parametrique stereo optimise |
EP2369861B1 (en) * | 2010-03-25 | 2016-07-27 | Nxp B.V. | Multi-channel audio signal processing |
CH703771A2 (de) * | 2010-09-10 | 2012-03-15 | Stormingswiss Gmbh | Vorrichtung und Verfahren zur zeitlichen Auswertung und Optimierung von stereophonen oder pseudostereophonen Signalen. |
FR2966634A1 (fr) * | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
US20150078564A1 (en) * | 2012-06-08 | 2015-03-19 | Yongfang Guo | Echo cancellation algorithm for long delayed echo |
KR20230020553A (ko) | 2013-04-05 | 2023-02-10 | 돌비 인터네셔널 에이비 | 스테레오 오디오 인코더 및 디코더 |
EP2989631A4 (en) * | 2013-04-26 | 2016-12-21 | Nokia Technologies Oy | AUDIO SIGNAL ENCODER |
PL3429233T3 (pl) | 2013-07-30 | 2020-11-16 | Dts, Inc. | Dekoder matrycowy z panoramowaniem parami o stałej mocy |
WO2015073597A1 (en) * | 2013-11-13 | 2015-05-21 | Om Audio, Llc | Signature tuning filters |
WO2015081293A1 (en) | 2013-11-27 | 2015-06-04 | Dts, Inc. | Multiplet-based matrix mixing for high-channel count multichannel audio |
WO2015104447A1 (en) | 2014-01-13 | 2015-07-16 | Nokia Technologies Oy | Multi-channel audio signal classifier |
CN106067819B (zh) * | 2016-06-23 | 2021-11-26 | 广州市迪声音响有限公司 | 一种基于分量式矩阵算法的信号处理*** |
US10224042B2 (en) * | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
CA3127805C (en) * | 2016-11-08 | 2023-12-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain |
AU2018308668A1 (en) * | 2017-07-28 | 2020-02-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for encoding or decoding an encoded multichannel signal using a filling signal generated by a broad band filter |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5172415A (en) * | 1990-06-08 | 1992-12-15 | Fosgate James W | Surround processor |
JPH06178164A (ja) * | 1992-12-11 | 1994-06-24 | Matsushita Electric Ind Co Ltd | 適応等化処理における安定性および収束速度の適応制御方法 |
CN1059529C (zh) * | 1994-06-23 | 2000-12-13 | Ntt移动通信网株式会社 | 用于接收码分多址信号的方法和装置 |
US6895093B1 (en) * | 1998-03-03 | 2005-05-17 | Texas Instruments Incorporated | Acoustic echo-cancellation system |
US6658050B1 (en) * | 1998-09-11 | 2003-12-02 | Ericsson Inc. | Channel estimates in a CDMA system using power control bits |
JP2001109497A (ja) | 1999-10-04 | 2001-04-20 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
JP2001188599A (ja) | 1999-10-19 | 2001-07-10 | Matsushita Electric Ind Co Ltd | オーディオ信号復号装置 |
JP2001142493A (ja) | 1999-11-16 | 2001-05-25 | Matsushita Electric Ind Co Ltd | オーディオ信号高能率符号化装置 |
US6973184B1 (en) * | 2000-07-11 | 2005-12-06 | Cisco Technology, Inc. | System and method for stereo conferencing over low-bandwidth links |
KR100809310B1 (ko) * | 2000-07-19 | 2008-03-04 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 스테레오 서라운드 및/또는 오디오 센터 신호를 구동하기 위한 다중-채널 스테레오 컨버터 |
DE10041512B4 (de) * | 2000-08-24 | 2005-05-04 | Infineon Technologies Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
JP2004517538A (ja) * | 2000-12-22 | 2004-06-10 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 多チャネル・オーディオ変換器 |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
AU2003216682A1 (en) | 2002-04-22 | 2003-11-03 | Koninklijke Philips Electronics N.V. | Signal synthesizing |
ES2323294T3 (es) * | 2002-04-22 | 2009-07-10 | Koninklijke Philips Electronics N.V. | Dispositivo de decodificacion con una unidad de decorrelacion. |
US8284961B2 (en) | 2005-07-15 | 2012-10-09 | Panasonic Corporation | Signal processing device |
KR100857102B1 (ko) | 2005-07-29 | 2008-09-08 | 엘지전자 주식회사 | 인코딩된 오디오 신호 생성 및 처리 방법 |
-
2003
- 2003-04-22 AU AU2003216682A patent/AU2003216682A1/en not_active Abandoned
- 2003-04-22 EP EP03712593A patent/EP1500082B1/en not_active Expired - Lifetime
- 2003-04-22 KR KR1020047017028A patent/KR101021076B1/ko active IP Right Grant
- 2003-04-22 WO PCT/IB2003/001586 patent/WO2003090206A1/en active IP Right Grant
- 2003-04-22 BR BRPI0304541-2A patent/BRPI0304541B1/pt unknown
- 2003-04-22 JP JP2003586871A patent/JP4401173B2/ja not_active Expired - Lifetime
- 2003-04-22 ES ES03712593T patent/ES2280736T3/es not_active Expired - Lifetime
- 2003-04-22 CN CNB038089785A patent/CN1312660C/zh not_active Expired - Lifetime
- 2003-04-22 BR BR0304541-2A patent/BR0304541A/pt active IP Right Grant
- 2003-04-22 DE DE60311794T patent/DE60311794T2/de not_active Expired - Lifetime
- 2003-04-22 AT AT03712593T patent/ATE354161T1/de active
- 2003-04-22 US US10/511,798 patent/US7933415B2/en active Active
- 2003-04-22 DE DE60311794.5A patent/DE60311794C5/de not_active Expired - Lifetime
-
2011
- 2011-03-21 US US13/052,176 patent/US8798275B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP1500082B1 (en) | 2007-02-14 |
ATE354161T1 (de) | 2007-03-15 |
US20050254446A1 (en) | 2005-11-17 |
US8798275B2 (en) | 2014-08-05 |
AU2003216682A1 (en) | 2003-11-03 |
EP1500082A1 (en) | 2005-01-26 |
CN1647157A (zh) | 2005-07-27 |
KR20040101552A (ko) | 2004-12-02 |
BR0304541A (pt) | 2004-07-20 |
DE60311794T2 (de) | 2007-10-31 |
JP2005523624A (ja) | 2005-08-04 |
DE60311794D1 (en) | 2007-03-29 |
US20110166866A1 (en) | 2011-07-07 |
DE60311794C5 (de) | 2022-11-10 |
WO2003090206A1 (en) | 2003-10-30 |
KR101021076B1 (ko) | 2011-03-11 |
CN1312660C (zh) | 2007-04-25 |
US7933415B2 (en) | 2011-04-26 |
BRPI0304541B1 (pt) | 2017-07-04 |
JP4401173B2 (ja) | 2010-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2280736T3 (es) | Sintetizacion de señal. | |
ES2300567T3 (es) | Representacion parametrica de audio espacial. | |
US11671781B2 (en) | Spatial audio signal format generation from a microphone array using adaptive capture | |
ES2294300T3 (es) | Codificacion de audio. | |
ES2323275T3 (es) | Conformacion de envolvente temporal de canal individual para esquemas de codificacion de indicacion binaural y similares. | |
US8861739B2 (en) | Apparatus and method for generating a multichannel signal | |
ES2623365T3 (es) | Compactación de información secundaria para la codificación paramétrica de audio espacial | |
ES2347274T3 (es) | Codificacion de audio multicanal ajustable a escala. | |
RU2409911C2 (ru) | Декодирование бинауральных аудиосигналов | |
ES2587196T3 (es) | Extracción de una señal directa/de ambiente de una señal de mezcla descendente e información paramétrica espacial | |
ES2687952T3 (es) | Reducción de fallas de filtro peine en mezcla descendente de canales múltiples con alineación de fase adaptativa | |
ES2340796T3 (es) | Dispositivo y metodo para generar una señal estereofonica codificada de una pieza de audio o flujo de datos de audio. | |
ES2327158T3 (es) | Codificacion y decodificacion de audio. | |
US8817992B2 (en) | Multichannel audio coder and decoder | |
ES2401554T3 (es) | Aparato, procedimiento y programa de computadora para mezclar hacia arriba una señal de audio mezclada hacia abajo | |
ES2609449T3 (es) | Decodificación de audio | |
ES2547232T3 (es) | Método y aparato para procesar una señal | |
MX2007004725A (es) | Formacion de sonido difuso para esquemas de bbc y los semejantes. | |
ES2922532T3 (es) | Codificador de escena de audio, decodificador de escena de audio y procedimientos relacionados que utilizan el análisis espacial híbrido de codificador / decodificador | |
US20240185869A1 (en) | Combining spatial audio streams | |
ES2783975T3 (es) | Codificación multicanal | |
US20230199417A1 (en) | Spatial Audio Representation and Rendering | |
US20240079014A1 (en) | Transforming spatial audio parameters | |
WO2020201619A1 (en) | Spatial audio representation and associated rendering |