ES2605248T3 - Aparato para generar señal de mezcla descendente mejorada, método para generar señal de mezcla descendente mejorada y programa de ordenador - Google Patents

Aparato para generar señal de mezcla descendente mejorada, método para generar señal de mezcla descendente mejorada y programa de ordenador Download PDF

Info

Publication number
ES2605248T3
ES2605248T3 ES11703882.8T ES11703882T ES2605248T3 ES 2605248 T3 ES2605248 T3 ES 2605248T3 ES 11703882 T ES11703882 T ES 11703882T ES 2605248 T3 ES2605248 T3 ES 2605248T3
Authority
ES
Spain
Prior art keywords
channel
signal
improved
microphone signal
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11703882.8T
Other languages
English (en)
Inventor
Fabian KÜCH
Jürgen HERRE
Christof Faller
Christophe Tournery
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2605248T3 publication Critical patent/ES2605248T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

Un aparato (100; 200; 300; 500) para generar una señal de mezcla descendente mejorada (112; 212; 312) en base a una señal de micrófono de multicanal (110; 210; 310), donde el aparato comprende: un analizador espacial (120; 220; 320) configurado para calcular un conjunto de parámetros de pista espacial (E{NN*}, E{SS*}, a, α) que comprenden una información de dirección (a, α) que describe una dirección de llegada de sonido directo, una información de potencia de sonido directo (E{SS*}), y una información de potencia de sonido difuso (E{NN*}, en base a la señal de micrófono de multicanal; un calculador de filtro (130; 230; 316) para calcular parámetros de filtro mejorados (132; 232; 332) en dependencia de la información de dirección (a, α) que describe la dirección de llegada de sonido directo, en dependencia de la información de potencia de sonido directo (E{SS*}) y en dependencia de la información de potencia de sonido difuso (E{NN*}); y un filtro (140; 240; 340) para filtrar la señal de micrófono (110; 210; 310) o una señal derivada de la misma, utilizando los parámetros de filtro mejorados (132; 232; 332) para obtener la señal de mezcla descendente mejorada (112; 212; 312); en donde el calculador de filtro está configurado para calcular los parámetros de filtro mejorados (H1, H2; H1,1, H1,2, H2,1, H2,2) en dependencia de los factores de ganancia dependientes de la dirección (g1, g2, g3, g4, g5) que describen contribuciones deseadas de un componente de sonido directo (S) de la señal de micrófono de multicanal a una pluralidad de señales de altavoz (L, R, C, Ls, Rs; Zl) y en dependencia de uno o más valores de matriz de mezcla descendente (gs; mj,l) que describen contribuciones deseadas de una pluralidad de canales de audio (L, R, C, Ls, Rs; Zl) a uno o más canales de la señal de mezcla descendente mejorada.

Description

5
10
15
20
25
30
35
40
45
50
55
60
DESCRIPCION
Aparato para generar senal de mezcla descendente mejorada, metodo para generar senal de mezcla descendente mejorada y programa de ordenador
Las realizaciones de acuerdo con la invencion son concernientes con un aparato para generar una senal de mezcla descendente mejorada con un metodo para generar una senal de mezcla descendente mejorada y con un programa de ordenador para generar una senal de mezcla descendente mejorada.
Una realizacion de acuerdo con la invencion es concerniente con el calculo de mezcla descendente mejorada para microfonos de audio espaciales.
Antecedentes de la invencion
La grabacion del sonido envolvente (“surround”) con una configuracion de microfono pequeno sigue siendo un reto. Una de tal configuracion mas ampliamente conocida es un microfono de campo de sonido y descodificadores envolvente correspondientes (vease, por ejemplo referencia [3]), que filtran y combinan sus cuatro senales de capsula de microfono casi coincidentes para generar los canales de salida de sonido envolvente. En tanto que la alta fidelidad de senal de un solo canal es mantenida, la debilidad de este procedimiento es su separacion de canal limitada concerniente con la directividad limitada de respuestas direccionales de microfono de primer orden.
Alternativamente, se pueden aplicar tecnicas basadas en una representacion parametrica del campo de sonido observado. En la referencia [2], se ha propuesto un metodo utilizando pares de microfono estereo coincidentes convencionales para grabar sonido envolvente. Se demostro como estimar las proporciones de sonido directo a sonido difuso de los parametros de pista espacial y direcciones de llegada del sonido a partir de estas senales de microfono direccionales y como aplicar esta informacion para conducir una slntesis de codificacion de audio espacial para generar sonidos envolvente. En la referencia [2] tambien se ha discutido como la informacion parametrica, esto es direccion de llegada (DOA) del sonido y la proporcion de sonido difuso (DSR) del campo de sonido puede ser usada para calcular directamente los parametros espaciales especlficos que son usados en el esquema de codificacion envolvente de MPEG (MPS) (vease, por ejemplo referencia [6]).
El envolvente de MPEG es una representacion parametrica de senales de audio de multicanal que representa un procedimiento eficiente a la codificacion de audio espacial de alta calidad. MPS aprovecha el hecho de que, desde un punto de vista perceptual, las senales de audio de multicanal contienen redundancia significativa con respecto a los diferentes canales de altavoz. El codificador de MPS toma multiples senales de altavoz como entrada, con la configuracion espacial correspondiente de los altavoces que tiene que ser conocida de antemano. En base a estas senales de entrada, el codificador de MPS calcula los parametros espaciales en sub-bandas de frecuencia, tales como diferencias de nivel de canal (CLD) entre dos canales y correlacion de intercanal (ICC) entre dos canales. Luego, la informacion lateral de MPS real es derivada a partir de estos parametros espaciales. Ademas, el codificador calcula una senal de mezcla descendente, que podrla consistir de uno o mas canales de audio.
Se ha encontrado que las senales de entrada de microfono estero son apropiadas para estimar los parametros de pista espacial. Sin embargo, tambien se ha encontrado que la senal de entrada de microfono esterero sin procesar es en general no apropiada para ser usada directamente como la senal de mezcla descendente envolvente de MPEg correspondiente. Se ha encontrado que en muchos casos, la diafonla entre canales izquierdo y derecho es demasiado alta, dando como resultado una separacion de canal escasa en las senales decodificadas envolvente de MPEG.
En vista de esta situacion, hay la necesidad de un concepto para generar una senal de mezcla descendente mejorada en base a una senal de microfono de multicanal, de tal manera que las senales de mezcla descendente mejoradas conducen a una calidad de audio espacial suficientemente buena y propiedad de localizacion despues de la descodificacion envolvente de MPEG.
Un ejemplo mas de un sistema de slntesis conocido se describe en la referencia [9].
Breve descripcion de la invencion
Este objetivo es obtenido por el aparato reivindicado para generar una senal de mezcla descendente mejorada, mediante el metodo reivindicado para generar una senal de mezcla descendente mejora y por el programa de ordenador reivindicado para mejorar una senal de mezcla descendente mejorada.
5
10
15
20
25
30
35
40
45
50
55
60
Una realizacion de acuerdo con la invencion crea un aparato para generar una senal de mezcla descendente mejorada en base a una senal de microfono de multicanal. El aparato comprende un analizador espacial configurado para calcular un conjunto de parametros de pista espacial que comprenden informacion de direccion que describe la direccion de llegada de sonido directo, informacion de potencia de sonido directo e informacion de potencia de sonido difuso en base a la senal de microfono de multicanal. El aparato tambien comprende un calculador de filtro para calcular parametros de filtro mejorados en dependencia de la informacion de direccion que describe la direccion de llegada de sonido directo, en dependencia de la informacion de potencia de sonido directo y en dependencia de la informacion de potencia de sonido difuso. El aparato tambien comprende un filtro para filtrar la senal de microfono o una senal derivada de la misma, utilizando los parametros de filtro mejorados, para obtener la senal de mezcla descendente mejorada.
Esta realizacion de acuerdo con la invencion esta basada en el hallazgo de que una mezcla de senal descendente mejorada, que es apropiada mas que la senal de microfono de multicanal de entrada, puede ser derivada de la senal de microfono de multicanal de entrada por una operacion de filtracion y que los parametros de filtro para tal operacion de filtracion mejorada de senal puede ser derivada eficientemente de los parametros de pista espacial.
Asl, es posible reutilizar la misma informacion, es decir los parametros de pista espacial, que es tambien apropiada para la derivacion de los parametros de envolvente de MPEG, para el calculo de los parametros de filtro mejorados. Asl, un sistema altamente eficiente puede ser creado utilizando el concepto descrito anteriormente.
Ademas, es posible derivar una senal de mezcla descendente que permite una buena separacion de canal cuando es procesada en un descodificador envolvente de MPEG aun si las senales de canal de la senal de microfono de multicanal solamente comprenden una baja separacion espacial. Asl, la senal de mezcla descendente mejorada puede conducir a una calidad de audio espacial significativamente mejorada y propiedad de localizacion despues de la descodificacion envolvente de MPEG en comparacion con los sistemas convencionales.
Para resumir, la realizacion descrita anteriormente de acuerdo con la invencion permite proveer una senal de mezcla descendente mejorada que tiene buenas propiedades de separacion espacial en un esfuerzo computacional moderado.
En una realizacion preferida, el calculador de filtro esta calculado para calcular los parametros de filtro mejorados, de tal manera que la senal de mezcla descendente mejorada se aproxima a una senal de mezcla descendente deseada. Utilizando este procedimiento, se puede asegurar que los parametros de filtro mejorados esten bien adaptados a un resultado deseado del filtrado. Por ejemplo, parametros de filtro mejorados pueden ser calculados de tal manera que una o mas propiedades estadlsticas de la senal de mezcla descendente mejorada se aproximan a las propiedades estadlsticas deseadas de la senal de mezcla descendente. Asl, se puede alcanzar que la senal de mezcla descendente mejorada es bien adaptada a las expectativas, en donde las expectativas pueden ser definidas numericamente en terminos de valores de correlacion deseados.
En una realizacion preferida, el calculador de filtro esta configurado para calcular valores de correlacion deseados entre la senal de microfono de multicanal (o mas precisamente, senales de canal del mismo) y senales de canal deseadas de la senal de mezcla descendente en dependencia de los parametros de pista espacial. En este caso, el calculador de filtro esta configurado preferiblemente para calcular los parametros de filtro mejorados en dependencia de los valores de correlacion cruzada deseados. Se ha encontrado que dichos valores de correlacion cruzada son una buena medida de si las senales de canal de la senal de mezcla descendente exhiben caracterlsticas de separacion de canal suficientemente buenas. Tambien, se ha encontrado que los valores de correlacion deseados pueden ser calculados con esfuerzo computacional moderado en base a los parametros de pista espacial.
En una realizacion preferida, el calculador de filtro esta configurado para calcular los valores de correlacion cruzada deseados en dependencia de los factores de ganancia dependientes de la direccion, que describen contribuciones deseadas de un componente de sonido directo de un componente de sonido directo de la senal de microfono de multicanal a una pluralidad de senales de altavoz y en dependencia de uno o mas valores de matriz de mezcla descendente que describen contribuciones deseadas de una pluralidad de canales de audio (por ejemplo, senales de altavoz) a uno o mas canales de la senal de mezcla descendente mejoradas. Se ha encontrado que tanto los factores de ganancia dependientes de la direccion como los valores de matriz de mezcla descendente son apropiados para calcular los valores de correlacion cruzada deseados y que dichos factores de ganancia dependientes de la direccion y dichos valores de matriz de mezcla descendente son facilmente obtenibles. Ademas, se ha encontrado que los valores de correlacion cruzada deseados son facilmente obtenibles en base a dicha informacion.
En una realizacion preferida, el calculador de filtro esta configurado para mapear la informacion de direccion sobre un conjunto de factores de ganancia dependientes de la direccion. Se ha encontrado que se puede usar una ley de toma panoramica de amplitud de multicanal para determinar los factores de ganancia con el esfuerzo moderado en dependencia de la informacion de direccion. Se ha encontrado que la informacion de direccion de llegada es apropiada para determinar
5
10
15
20
25
30
35
40
45
50
55
60
los factores de ganancia dependientes de la direccion, que pueden describir, por ejemplo cuales altavoces deben presentar el componente de sonido directo. Es facilmente comprensible que el componente de sonido directo este distribuido a diferentes senales de altavoz en dependencia de la informacion de direccion de llegada (designada brevemente como informacion de direccion) y que es relativamente simple determinar los factores de ganancia que describen cual de los altavoces deben presentar el componente de sonido directo. Por ejemplo, la regla de mapeo que es usada para mapear la informacion de direccion sobre conjunto de factores de ganancia dependientes de la direccion, puede simplemente determinar que aquellos altavoces que estan asociados con la direccion de llegada podrlan presentar (o principalmente presentar) el componente de sonido directo, mientras que los otros altavoces que estan asociados con otras direcciones deben solamente presentar una pequena porcion del componente de sonido directo o deben aun suprimir el componente de sonido directo.
En una realizacion preferida, el calculador de filtro esta configurado para considerar la informacion de potencia de sonido directo y la informacion de potencia de sonido difuso para calcular los valores de correlacion cruzada deseados. Se ha encontrado que la consideracion de las potencias de ambos de dichos componentes de sonido (componente de sonido directo y componente de sonido difuso) da como resultado una impresion de audicion particularmente buena, debido a que tanto el componente de sonido directo como el componente de sonido difuso pueden ser asignados apropiadamente a las senales de canal de la senal de mezcla descendente (comunmente de multicanal).
En una realizacion preferida, el calculador de filtro esta configurado para ponderar la informacion de potencia de sonido directo en dependencia de la informacion de direccion y para aplicar una ponderacion predeterminada que es independiente de la informacion de direccion a la informacion de potencia de sonido difuso con el fin de calcular los valores de correlacion cruzada deseados. Asl, se puede distinguir entre los componentes de sonido directo y los componentes de sonido difuso lo que da como resultado una estimacion particularmente real de los valores de correlacion cruzada deseados.
En una realizacion preferida, el calculador de filtro esta configurado para evaluar una ecuacion de Wiener-Hopf para derivar los parametros de filtro mejorados. En este caso, la ecuacion de Wiener-Hopf describe una relacion entre valores de correlacion que describen una correlacion entre diferentes pares de canal de la senal de microfono de multicanal, parametros de filtro mejorados y valores de correlacion cruzada deseados entre senales de canal desde las senales de microfono de multicanal y senales de canal deseados de la senal de mezcla descendente. Se ha encontrado que la evaluacion de tal ecuacion de Wiener-Hopf da como resultados parametros de filtro mejorados que son bien adaptados a las caracterlsticas de correlacion deseadas de las senales de canal de la senal de mezcla descendente.
En una realizacion preferida, el calculador de filtro esta configurado para calcular los parametros de filtro mejorados en dependencia de un modelo de canales de mezcla descendente deseados. Al modelar los canales de mezcla descendente deseados, los parametros de filtro mejorados pueden ser calculados de tal manera que producen una senal de mezcla descendente que permite una buena reconstruccion de las senales de altavoz de multicanal deseadas en un decodificador de multicanal.
En algunas realizaciones, el modelo de los canales de mezcla descendente deseados puede comprender un modelo de una mezcla descendente ideal, que serla efectuada si las senales de canal (por ejemplo, senales de altavoz) estuvieran disponibles individualmente. Ademas, el modelado puede incluir un modelo de como las senales de canal individual podrlan ser obtenidas a partir de la senal de microfono de multicanal, aun si la senal de microfono de multicanal comprende senales de canal que tienen solamente una separacion espacial limitada. Asl, un modelo global de los canales de mezcla descendente deseados puede ser obtenido, por ejemplo al combinar un modelado de como obtener senales de canal individuales (por ejemplo, senales de altavoz) y como derivar canales de mezcla descendente deseados a partir de dichas senales de canal individuales. Asl, es una referencia suficientemente buena para el calculo de los parametros de filtro mejorados obtenibles con un esfuerzo computacional relativamente pequeno.
En una realizacion preferida, el calculador de filtro esta configurado para efectuar selectivamente un filtrado de un solo canal, en el cual un primer canal de la senal de mezcla descendente es derivado mediante un filtrado de un primer canal de la senal de microfono de multicanal y en el cual un segundo canal la senal de mezcla descendente es derivado mediante un filtrado de un segundo canal de la senal de microfono de multicanal mientras que evita la diafonla del primer canal de la senal de microfono de multicanal al segundo canal de senal de mezcla descendente y del segundo canal de la senal de microfono de multicanal al primer canal de la senal de mezcla descendente o un filtrado de dos canales, en el cual un primer canal de la senal de mezcla descendente es derivado mediante filtracion de un primero y un segundo canal de la senal de microfono de multicanal y en el cual un segundo canal de la senal de mezcla descendente es derivada mediante filtracion de un primero y un segundo canal de la senal de microfono de multicanal. La seleccion de el filtrado de un solo canal y de el filtrado de dos canales se hace en dependencia de un valor de correlacion que describe una correlacion entre el primer canal de la senal de microfono de multicanal y el segundo canal de la senal de microfono de multicanal. Al seleccionar entre el filtrado de un solo canal y el filtrado de dos canales, se pueden evitar errores numericos que pueden algunas veces aparecer si se usa filtracion de dos canales en una situacion en la cual el canal izquierdo y derecho estan altamente
5
10
15
20
25
30
35
40
45
50
55
60
correlacionados. Asl, una senal de mezcla descendente de buena calidad puede ser obtenida sin consideracion de si las senales de canal de la senal microfono de multicanal estan altamente correlacionadas o no.
Otra realizacion de acuerdo con la invencion crea un metodo para generar una senal de mezcla descendente mejorada.
Otra realizacion de acuerdo con la invencion crea un programa de ordenador para efectuar dichos metodos para generar una senal de mezcla descendente mejorada.
El metodo y programas de ordenador estan basados en los mismos hallazgos como el aparato y pueden ser complementados por cualquiera de los elementos y funcionalidades discutidas con respecto al aparato.
Breve descripcion de las figuras
Realizaciones de acuerdo con la invencion seran subsecuentemente descritas con referencia a las figuras adjuntas en las cuales:
La Figura 1 muestra un diagrama esquematico en bloques de un aparato para generar una senal de mezcla descendente mejorada de acuerdo con una realizacion de la invencion;
la Figura 2 muestra una ilustracion grafica del procesamiento de microfono de audio espacial de acuerdo con una realizacion de la invencion;
la Figura 3 muestra una ilustracion grafica del calculo de mezcla descendente mejorada de acuerdo con una realizacion de la invencion;
la Figura 4 muestra una ilustracion grafica del mapeo de canal para el calculo de las senales de mezcla descendente deseada Y1 e Y2, que pueden ser usadas en realizaciones de acuerdo con la invencion;
la Figura 5 muestra una ilustracion grafica de un calculo de mezcla descendente mejorada en base a senales de microfono pre procesadas de acuerdo con una realizacion de la invencion;
la Figura 6 muestra una representacion esquematica de calculos para derivar los parametros de filtro mejorados a partir de la senal de microfono de multicanal de acuerdo con una realizacion de la invencion y
la Figura 7 muestra una representacion esquematica de calculos para derivar los parametros de filtro mejorados a partir de la senal de microfono de multicanal de acuerdo con otra realizacion de la invencion.
Descripcion detallada de las realizaciones
1. Aparato para generar una senal de mezcla descendente mejorada de acuerdo con la Figura 1
La Figura 1 muestra un diagrama de bloque esquematico de un aparato para generar una senal de mezcla descendente mejorada en base a una senal de microfono de multicanal. El aparato 100 esta configurada para recibir una senal de microfono de multicanal 100 y para proveer, en base a la misma, una senal de mezcla descendente mejorada 112. El aparato 100 comprende un analizador espacial 120 configurado para calcular un conjunto de parametros de pista espaciales 122 en base a la senal de microfono de multicanal 110. Los parametros de pista espacial comprenden comunmente una informacion de direccion que describe una direccion de llegada de sonido directo (tal sonido directo esta incluido en la senal de microfono de multicanal), informacion de potencia de sonido directo e informacion de potencia de sonido difuso. El aparato 100 tambien comprende un calculador de filtro 130 para calcular parametros de filtro mejorados 132 en dependencia de los parametros de pista espacial 122, esto es, en dependencia de la informacion de direccion que describe la direccion de llegada de sonido directo, en dependencia de la informacion de potencia de sonido directo y en dependencia de la informacion de potencia de sonido difuso. El aparato 100 tambien comprende un filtro 140 para filtrar la senal de microfono 110 o una senal 110' derivada de la misma, utilizando los parametros de filtro mejorados 132, para obtener la senal de mezcla descendente 112. La senal 110' puede opcionalmente ser derivada de la senal de microfono de multicanal 110 utilizando un pre-procesamiento opcional 150.
Con respecto a la funcionalidad del aparato 100, se puede notar que la senal de mezcla descendente mejorada 112 es provista comunmente de tal manera que la senal de mezcla descendente mejorada 112 permite una calidad de audio espacial mejorada despues de la descodificacion envolvente de MPEG cuando se compara con la senal de microfono multicanal 110, debido a que los parametros de filtro mejorados 132, son provistos comunmente por el calculador de filtro 130 con el fin de obtener este objetivo. La provision de los parametros de filtro mejorados 130 esta basada en los
5
10
15
20
25
30
35
40
45
50
55
60
parametros de pista espacial 122 provistos por el analizador espacial, de tal manera que los parametros de filtro mejorados 130 son provistos de acuerdo con una caracteristica espacial de la senal de microfono del multicanal 110 y con el fin de enfatizar la caracteristica espacial de la senal de microfono del multicanal 110. Asi, el filtrado efectuado por el filtro 140 permite una mejora senal-adaptable de la caracteristica espacial de la senal de mezcla descendente mejorada 112 cuando se compara con la senal de microfono del multicanal de entrada 110.
Detalles con respecto al analisis espacial efectuado por el administrador espacial 120 con respecto al calculo de parametros de filtro efectuados por el calculador de filtro 130 y con respecto a el filtrado efectuada por el filtro 140 seran subsecuentemente descritos en mas detalle.
2. Aparato para generar una senal de mezcla descendente mejorada de acuerdo con la Figura 2
La Figura 2 muestra un diagrama de bloque esquematico de un aparato 200 para generar una senal de mezcla descendente mejorada (que puede tomar la forma de una senal de audio de dos canales) y un conjunto de pistas espaciales asociadas con una senal de mezcla ascendente que tiene mas de dos canales. El aparato 200 comprende una disposicion de microfono 205 configurado para proveer una senal de microfono de dos canales que comprende una senal de primer canal 210a y una senal del segundo canal 210b.
El aparato 200 comprende ademas un procesador 210 para proveer un conjunto de pistas espaciales asociadas con una senal de mezcla ascendente que tiene mas de dos canales en base a la senal de microfono de dos canales. El procesador 216 tambien esta configurado para proveer parametros de filtro mejorados 232. El procesador 216 esta configurado para recibir senales de entrada, la senal del primer canal 210a y la senal del segundo canal 210b proporcionada por la disposicion de microfono 205. El aparato 216 esta configurado para proveer los parametros de filtro mejorados 232 y para tambien proveer una informacion de pista espacial 262. EL aparato 200 comprende ademas un proveedor de senal de audio de dos canales 240 que esta configurado para recibir la senal del primer canal 210a y la senal del segundo canal 210b provista por la disposicion de microfono 205 y para proveer versiones procesadas de la senal de microfono del primer canal 210a y la senal de microfono del segundo canal 210b como la senal de audio de dos canales 212 que comprende las senales de canal 212a, 212b.
La disposicion de microfono 205 comprende un primer microfono direccional 206 y un segundo microfono direccional 208. El primer microfono direccional 206 y el segundo microfono direccional 208 estan preferiblemente espaciados por no mas de 30 cm. Asi, la senales recibidas por el primer microfono direccional 206 y el segundo microfono direccional 208 estan correlacionadas fuertemente, lo que se ha encontrado que es benefico para el calculo de la informacion del componente de energia (o informacion de energia componente) 122a e informacion de direccion 122b por el analizador de senal 220. Sin embargo, el primer microfono direccional 206 y el segundo microfono direcciona 208 estan orientados de tal manera que una caracteristica direccional 209 del segundo microfono direccional 208 es una version girada de una caracteristica direcciona 207 del primer microfono direccional 206. Asi, la senal de microfono del primer canal 210a y la senal de microfono del segundo canal 210b estan fuertemente correlacionadas (debido a la proximidad espacial de los microfonos 206, 208) y todavia diferentes (debido a las diferentes caracteristicas direccional 207, 209 de los microfonos direccionales 206, 208). En particular, una senal direccional incidente sobre la disposicion de microfono 205 desde una direccion aproximadamente constante provoca que componentes de senal fuertemente correlacionados de la senal de microfono del primer canal 210a y la senal de microfono del segundo canal 210b que tienen una proporcion de amplitud dependiente de la direccion temporalmente constante (o proporcion de intensidad). Una senal de audio ambiental incidente sobre la disposicion de microfono 205 desde direcciones que varian temporalmente provoca que los componentes de senal de la senal de microfono del primer canal 210a y la senal de microfono del segundo canal 210b que tienen una correlacion significativa pero proporciones de amplitud que fluctuan temporalmente (o proporciones de intensidad). Asi, la disposicion de microfono 205 provee una senal de microfono de dos canales, 210a, 210b que permite que el analizador de senal 220 del procesador 216 distinga que entre sonidos directos y sonidos difusos aunque los microfonos 206, 208 esten espaciados estrechamente. Asi, el aparato 200 constituye un proveedor de senal de audio que puede ser implementado de forma espacialmente compacta y que es no obstante apto de proveer pistas espaciales asociadas con una senal de mezcla ascendente que tiene mas de dos canales.
Las pistas espaciales 262 pueden ser usadas en combinacion con la senal de audio de dos canales provista 212a, 212b por un descodificador de audio espacial para proveer una senal de salida de sonido envolvente.
En lo siguiente, se daran algunas explicaciones adicionales con respecto al aparato 200. El aparato 200 comprende opcionalmente una disposicion de microfono 205 que provee la senal del primer canal 210a y la senal del segundo canal 210b. La senal del primer canal 210a es tambien designada con X1 (t) y la senal del segundo canal 210b es tambien designada con X2(t). Tambien se debe notar que la senal del primer canal 210a y la senal del segundo canal 210b pueden representar la senal de microfono de multicanal 110, que es introducida al aparato 100 de acuerdo con la Figura 1.
5
10
15
20
25
30
35
40
45
50
55
60
El proveedor de senal de audio de dos canales 240 provee la sena del primer canal 210a y la senal del segundo canal 210b y comunmente tambien recibe la informacion del parametro de filtro mejorado 232. El proveedor de senal de audio de dos canales 240 puede por ejemplo efectuar la funcionalidad del pre-procesamiento opcional 150 y del filtro 240 para proveer la senal de audio de dos canales 212 que es representada por una senal de primer canal 212a y una senal del segundo canal 212b. La senal de audio de dos canales 212 puede ser equivalente a la senal de mezcla descendente mejorada 112 emitida por el aparato 100 de la Figura 1.
El analizador de senal 220 puede ser configurado para recibir la senal del primer canal 219a y la senal del segundo canal 210b. Tambien, el administrador de senal 220 puede estar configurado para obtener informacion de energla componente 112a e informacion de direccion 122b en base a la senal de microfono de dos canales 210 esto es, en base a la senal del primer canal 210a y la senal del segundo canal 210b. Preferiblemente, el analizador de senal 220 esta configurado para obtener informacion de energla componente 122a y la informacion de direccion 122b de tal manera que la informacion de energla componente 122a describe valores estimativos de energla (o equivalentemente de potencia) de un componente de sonido directo de la senal de microfono de dos canales y de un componente de sonido difuso de la senal de microfono de dos canales y de tal manera que la informacion de direccion 122 describe un valor estimativo de la direccion desde la cual el componente de sonido directa de la senal de microfono de dos canales 210a y 210b se origina. Asl, el analizador de senal 220 puede tomar la funcionalidad del analizador espacial 120 y la informacion de energla componente 122a y la informacion de direccion 122b puede ser equivalente a los parametros de pista espacial 122. La informacion de energla componente 122a puede ser equivalente a la informacion de potencia de sonido directa y la informacion de potencia de sonido difuso. El procesador 216 tambien comprende el generador de informacion lateral espacial 260 que recibe la informacion de energla componente 122a y la informacion de direccion 122b del analizador de senal 220. El generador de informacion lateral espacial 260 esta configurado para proveer en base al mismo, la informacion de pista espacial 262. Preferiblemente, el generador de informacion lateral espacial 260 esta configurado para mapear la informacion de energla componente 122a de la senal de microfono de dos canales 210a, 210b y la informacion de direccion 122b de la senal de microfono de dos canales 210a, 210b sobre la informacion de pista espacial 262. Asl, la informacion lateral espacial 262 es obtenida de tal manera que la informacion de pista espacial 262 describe un conjunto de pistas espaciales asociadas con una senal de audio de mezcla ascendente que tiene mas de dos canales.
El procesador 216 permite un calculo computacionalmente muy eficiente de la informacion de pista espacial 262 que esta asociada con una senal de audio de mezcla ascendente que tiene mas de dos canales en base a una senal de microfono de dos canales 210a, 210b. El analizador de senal 220 es apto de extraer una gran cantidad de informacion a partir de la senal de microfono de dos canales, es decir la informacion de energla componente 122a que describe tanto un valor estimativo de la energla de un componente de sonido directo como un valor estimativo de la energla de un componente de sonido difuso y la informacion de direccion 122b que describe un valor estimativo de la direccion desde la cual el componente de sonido directo de la senal de microfono de dos canales se origina. Se ha encontrado que esta informacion que puede ser obtenida por el analizador de senal 220 en base a la senal de microfono de dos canales 210a, 210b es suficiente para derivar la informacion de pista espacial 262 a un para una senal de audio de mezcla ascendente que tiene mas de dos canales. Importantemente se ha encontrado que la informacion de energla componente 122a y la informacion de direccion 122b son suficientes para determinar directamente la informacion de pista espacial 262 sin usar realmente los canales de audio de mezcla ascendente como una cantidad intermedia.
Ademas, el procesador 216 comprende un calculador de filtro 230 que esta configurado para recibir la informacion de energla componente 122a y la informacion de direccion 122b y para proveer, en base a las mismas, la informacion de parametro de filtro mejorado 232. Asl, el calculador de filtro 230 puede tomar la funcionalidad del calculador de filtro 130.
Para resumir lo anterior, el aparato 200 es apto de determinar eficientemente tanto la senal de mezcla descendente mejorada 212 como la informacion de pista espacial 262 de manera eficiente, utilizando la misma informacion intermedia 122a, 122b en ambos casos. Tambien, se debe notar que el aparato 200 es apto de usar una disposicion de microfono espacialmente pequeno 205 con el fin de obtener tanto la senal de mezcla descendente (mejorada) 212 como la informacion de pista espacial 262. La senal de mezcla descendente 212 comprende una caracterlstica de separacion espacial particularmente buena a pesar del uso de la disposicion de microfono pequeno 205 (que puede ser parte del aparato 200 o que puede ser externo al aparato 200 pero conectado al aparato 200) debido al calculo de los parametros de filtro mejorados 232 por el calculador de filtro 230. Asl, la senal de mezcla descendente (mejorada) 212 puede ser apropiada para una presentacion espacial (por ejemplo, utilizando un descodificador envolvente de MPEG) cuando es tomado en combinacion con la informacion de pista espacial 262.
Para resumir, la Figura 2 muestra un diagrama de bloque esquematico de un procedimiento de microfono de audio espacial. Como se puede ver, las senales de entrada de microfono estereo 210a (tambien designada con X1 (t) y 210b (tambien designada con x2(t)) son usadas en el bloque 216 para calcular el conjunto de informacion de pista espacial 262 asociada con la senal de mezcla ascendente de multicanal (por ejemplo, la senal de audio de dos canales 212). Ademas, se provee una senal de mezcla descendente de dos canales 212.
5
10
15
20
25
30
40
45
50
En las siguientes secciones, se requeriran las etapas requeridas para determinar la information de pista espacial 262 en base al analisis de las senales de microfono estereo. Asl, se hara referencia a la presentation en referencia [2].
3. Analisis de senal estereo
En lo siguiente, un analisis de senal estereo sera descrito que puede ser efectuado por el analizador espacial 120 o por el analizador de senal 220. Se debe notar que en algunas realizaciones en las cuales hay mas de dos microfonos usados y en las cuales hay mas de dos senales de canal de una senal de microfono de multicanal, se puede usar un analisis de senal mejorado.
El analisis de senal estereo descrito en la presente puede ser usado para proveer los parametros de pista espacial 122, que pueden tomar la forma de la informacion de energla del componente 122a e informacion de direction 122b. Se debe notar que el analisis de senal estereo puede ser efectuado en un dominio de tiempo-frecuencia. Asl, las senales de canal 210a, 210b de la senal de microfono de multicanal 110, 210 pueden ser transformadas a una representation de dominio de tiempo-frecuencia por el proposito del analisis adicional.
La representacion de tiempo-frecuencia de las senales de microfono son X1(t) y X2(t) y X1(k, i) y X2(k, i), en donde k e i son Indices de tiempo y frecuencia. Se supone que Xi(k, i) y X2(k, i) pueden ser modelados como
Xi{kA) = S(k. i) 4- Ni(k,i)
Xo{k- i) — a (A;. i)S(k. i) + N>(k. i).
en donde a(k,i) es un factor de ganancia, S(k,i) es el sonido directo en el canal izquierdo y Ni(k,i) y N2(k,i) representan sonido difuso.
La senal de mezcla descendente^ de codification de audio espacial (SAC) 112, 212 e informacion lateral 262 son calculadas como funcion de E{SS*}, E{N1N1*} y E{N2N2*}, en donde E{.} es una operation de promedio de tiempo corto y en donde * denota conjugado complejo. Estos valores son derivados en lo siguiente.
De (1) se sigue que
EfXiXf} = E{SS*} + E{NiN$}
E{X2X%} = a2E{SS*} + E{N2N$}
E{XiX2*} = aE{55*} + V{NiN*2}. (2)
Se debe notar aqul que E{SS*} puede ser considerado porno informacion de potencia de sonido directo o equivalentemente, informacion de energla de sonido directo y que E{N1N1*} y E{N2N2*} pueden ser considerados como informacion de potencia de sonido difuso o informacion de energla de sonido difuso. E{SS} y E{N1N1*} pueden ser considerados como informacion de energla del componente. a puede ser considerada como informacion de direccion.
Se supone que la cantidad de sonido difuso en ambas senales de microfono es la misma, esto es E{N1N1*} = E{N2N2*} = E{NN*} y que el coeficiente de relacion cruzada normalizado entre N1 y N2 es Odiff esto es
imagen1
Odiff puede por ejemplo tomar un valor predeterminado o puede ser calculado de acuerdo con algun algoritmo. Dadas estas suposiciones, (2) puede ser escrito como
5
10
15
20
25
30
35
E{XiXl} = E{SS*} + E{NN*} E{X2X$} = a2E{SS*} + E{AW*} E{Xi*2*} = dE{SS*} + *mE{NN*}
La
(2) produce la ecuacion cuadratica
,4E{ATiV*}2 + BB{NN*} = 0
Con
(4)
(5)
eliminacion de {SS} y a en
.4
D
C
1 - ^ditt -
2<I»diffE{X1.\l} - E{A'iA'i) - E{A2A.;} E{A'iA7}E{X2X2*} - EfA'iA'o}2.
(6)
Entonces {NN } es una de las dos soluciones de (5) la flsicamente posible, esto es
imagen2
La otra solucion de (5) produce una potencia de salida difuso mas grande que la potencia de senal del microfono, lo que es flsicamente imposible.
Dado (7), es facil calcular a y E {SS}:
E {SS*} <cE{SS*}
imagen3
(8)
Como se discute en la referencia [2],, la direccion de llegada de a(k,i) de sonido directo puede ser determinada como funcion de la proporcion de amplitud estimada a(k,i)
imagen4
El mapeo especlfico depende de las caracterlsticas direccionales de microfonos estereo usados para la grabacion del
9
5
10
15
20
25
30
35
40
45
50
55
sonido.
4. Generation de information lateral espacial
En lo siguiente, se describira la generation de la information de pista espacial 262, que puede ser provista por el generador de informacion lateral espacial 260. Sin embargo, se debe notar que la generacion de informacion lateral espacial en forma de la informacion de pista espacial 262 no es un elemento necesario de realizaciones de la presente invention. Asl, se debe notar que la generacion de la informacion lateral espacial puede ser omitida en algunas realizaciones. Tambien, se debe notar que se pueden usar diferentes metodos para obtener la informacion de pista espacial 262 o cualquier otra informacion lateral espacial.
No obstante, tambien se debe notar que la generacion de la informacion lateral espacial que es discutida en lo siguiente puede ser considerada como un concepto preferido para generar una informacion de pista espacial.
Dados los resultados de analisis dp la senal estereo 122a, 122b, esto es los parametros a respectivamente a de acuerdo con la ecuacion (9) E{SS*} y E{NN*}, parametros espaciales compatibles con el descodificador de SAC son generados, por ejemplo por el generador de informacion lateral espacial 260. Se ha encontrado que una manera eficiente de hacer esto es considerando un modelo de senal de multicanal. Como un ejemplo, se considera la configuration de altavoces como se muestra en la Figura 4 en lo siguiente, que implican:
L{k
i) = = 91 (fc, i)S(k, i) + hi(k, i)N\(k i)
R(k,
0 = = 92(fc, i)S(k, *) + h2(k i)
C(k,
i) = = 9s(k, i)S(k, *) + h3(k, i)Ns(k i)
Ls(k,
0 = = 54 (A, i)S(k, i) + ht(k i)N4(k, 0
Rs(k,
*) = 55 (fc, i)S(k, i) + hs(k, i)Ns(k i),
(10)
donde S (k,i) es la senal de sonido directo y Nx a N5 son senales difusas (independientes de inter-canal). S corresponde a la cantidad total ganancia-compensada de sonido directo en la senal de microfono estereo, esto es
imagen5
y la senales de sonido difuso, Nx a N5, tienen todas la misma potencia igual a E{NN}. Se debe notar que esta definition
de potencia de sonido difuso es arbitraria, puesto que finalmente las ganancias h1 a h5 determinan la cantidad de sonido difuso.
Se debe notar que L(k,i), R(k,i), C(k,i), Ls(k,i) y Rs(k,i) pueden ser por ejemplo senales de canal deseados o senales de altavoz deseadas.
En una primera etapa, como funcion de la direction de llegada de sonido directo a(k, i), se aplica una ley de toma panoramica de amplitud de multicanal (veanse, por ejemplo referencias [7] y [4])) para determinar los factores de ganancia g1 a g5. Luego, se usa un procedimiento heurlstico para determinar las ganancias de sonido difuso h1 a h5. Los valores constantes h1= 1.0, h2= 1.0, h3= 0, h4= 1.0 y h5= 1.0 son una election razonable, esto es, el ambientes es distribuido igualmente a la parte frontal y parte posterior, mientras que el canal central es generado por como una senal seca. Sin embargo, una eleccion diferente de h1 a h5 es posible.
El sonido directo de la parte lateral y parte posterior es atenuado en relation con el sonido que llega desde direcciones delanteras. El sonido directo contenido en las senales de microfono es preferiblemente compensado en ganancia por un factor g(a) que depende del patron de directividad de los microfonos.
10
5
10
15
20
25
30
35
40
45
50
55
60
Dado, el modelo de senal envolvente (10), el analisis de pista espacial del SAC especlfico usado es aplicado al modelo de senal para obtener las pistas espaciales para envolvente de MPEG.
Los espectros de potencia de las senales definidas en (10) son
donde
imagen6
imagen7
Los espectros cruzados, usados en lo siguiente son
q (a ) ~
PlUM) = fliff4l0~(l + o2)E{5S*}
PjudM) = „2ff510—(l+a2)E{SS*}. (14)
Envolvente de MPEG aplica una ganancia de -3dB (gs 1/V2) a los canales envolvente antes de procesarlos adicionalmente. Esto puede ser considerado para generar mezcla descendente e information lateral espacial.
El primer bloque de dos a uno (TTO) del envolvente MPEG utiliza diferencia de nivel de inter-canal (ICLD) y coherencia de inter-canal (ICC) entre L y Ls. En base a (10) y compensado por el pre-escalamiento de los canales envolvente estas pistas son:
ICLDLts
ICCLLs
imagen8
Similarmente, la ICLD e ICC del segundo bloque de TTO para R Rs son calculados:
5
10
15
20
25
30
35
40
45
50
55
60
icldRRs
iccRRs
10log10
Pr(M)
PrrJjM)
^PR(kJ)PRJkJ)'
(16)
El bloque de tres a dos (TTT) de envolvente de MPEG es usado en “modo de energla”, vease, por ejemplo referenda [1].
Notese que el bloque de TTT escala descendentemente el canal central por V1/2 antes de calcular las mezclas descendentes e information lateral espacial. Tomando en cuenta el pre-escalamiento de los canales envolvente, los dos parametros de ICLD usados por el bloque de TTT son
ICLDi
icld2
imagen9
10 log10
Pl±^PLs
Pr + 92sPrs '
(17)
Notese que los Indices i y k han sido dejados otra vez por brevedad de notation.
Asl, una informacion de pista espacial que comprende las pistas ICLDlls, ICClls, ICLDrrs, ICCrrs, ICLDi y ICLD2 es obtenida por el generador de informacion lateral espacial 260 en base a los parametros de pista espacial 122, 122a, 122b esto es, en base a la informacion de energla de componente 122a y la informacion de direction 122b.
5. Descodificacion envolvente de MPEG
En lo siguiente, se describira una descodificacion de envolvente de MPEG posible, que puede ser usada para derivar senales de canal multiple, por ejemplo senales de altavoz multiples a partir de una senal de mezcla descendente (por ejemplo, a partir de la senal de mezcla descendente mejorada 112 o la senal de mezclada descendente mejorada 212)
Utilizando la informacion de pista espacial 262 (o cualquier otra informacion de pista espacial apropiada).
En el descodificador envolvente de MPEG, la senal de mezcla descendente recibida 112, 212 es expandida a mas de dos canales utilizando la informacion lateral espacial recibida 262. Esta mezcla ascendente es efectuada mediante la representation en cascada apropiadamente de los llamados bloques de una a dos inverso (R-OTT) y tres a dos inverso (R- TTT) , respectivamente (vease, por ejemplo referencia [6]). Mientras que el bloque de R-OTT emite dos canales de audio en base a una entrada de audio mono e informacion lateral, el bloque de R-TTT determina tres canales de audio en base a una entrada de audio de dos canales y la informacion lateral asociada. En otras palabras, los bloques inversos efectuan el procesamiento inverso como los bloques de TTT y OTT correspondientes descritos anteriormente.
Analogamente al modelo de senal de multicanal en el codificador, el descodificador supone una configuration de altavoces especlfica para reproducir correctamente el sonido envolvente original. Adicionalmente, el descodificador supone que el codificador de MPS (codificador envolvente de MPEG) efectua una mezcla especlfica de los multiples canales de entrada para calcular de senal de mezcla descendente correcta.
El calculo de la mezcla descendente estereo envolvente de MPEG es presentado en la siguiente section.
6. Generation de senal de mezcla descendente estereo envolvente de MPEG
En lo siguiente, se describira como se genera la senal de mezcla descendente estereo envolvente de MPEG.
En realizaciones preferidas, la mezcla descendente es determinada de tal manera que no hay diafonla entre canales de altavoz correspondientes al hemisferio izquierdo y derecho. Esto tiene la ventaja de que no hay fugas indeseables de
5
10
15
20
25
30
35
40
45
50
55
60
energla de sonido del hemisferio izquierdo al derecho, lo que incrementa significativamente la separacion izquierdo/derecho despues de la descodificacion de la corriente envolvente de MPEG. Ademas, el mismo razonamiento se aplica para las fugas de senal de los canales derecho a izquierdo.
Cuando se usa envolvente de MPEG para la codificacion de senales de audio envolvente de 5.1 convencionales, la mezcla descendente estereo que es usada es
[ Yx F2]T = M[Z R C Ls Rs ]T , (18)
donde la matriz de mezcla descendentes es
M
0 gs 0
0 1 0 gs
(19)
donde gs es la pre-ganancia mencionada previamente dada al canal envolvente.
El calculo de mezcla descendente de acuerdo a (18), (19) puede ser considerado como un mapeo de las areas de reproduccion, cubiertas por posiciones de altavoz correspondientes, a los dos canales de mezcla descendente. Este mapeo es ilustrado en la Figura 4 para casos especlficos del calculo de mezcla descendente convencional (18), (19).
7. Calculo de mezcla descendente mejorada
7.1 Vista general con respecto al calculo de mezcla descendente mejorada
En lo siguiente, se describiran detalles con respecto al calculo de mezcla descendente mejorada. Con el fin de facilitar el entendimiento de las ventajas del concepto presente, se dara en la presente una comparacion con algunos sistemas convencionales.
En el caso del microfono de audio espacial como se describe en la seccion 2, la senal de mezcla descendente corresponded basicamente a las senales grabadas del microfono estereo (por ejemplo, de la disposicion de microfono 205) en ausencia del calculo de mezcla descendente mejorada descrito en lo siguiente. Se ha encontrado que los microfonos estereo practicos no proveen la separacion deseada de los componentes de senal izquierdos y derechos debido a sus patrones de directividad especlficos. Tambien se ha encontrado que consecuentemente, la diafonla entre los canales izquierdo y derecho (por ejemplo, senales de canal 210a, 210b) es demasiado alta, dando como resultado una separacion de canal escasa en la senal descodificada envolvente de MPEG.
Las realizaciones de acuerdo con la invencion crean un procedimiento para calcular una senal de mezcla descendente mejorada 112, 212 que se aproxima a las senales de mezcla descendente de SAC deseadas (por ejemplo, la senales Y1, Y2), esto es, exhibe un nivel deseado de diafonla entre los diferentes canales, que es diferente del nivel de diafonla incluido en la entrada estereo original 110, 210. Esto da como resultado una calidad de sonido mejorada despues de la descodificacion de audio espacial utilizando la informacion lateral espacial asociada 262.
Los diagramas de bloques esquematicos mostrados en las Figuras 1, 2, 3 y 5 ilustran el procedimiento propuesto. Como se puede ver, las senales de microfono originales 110, 210, 310 son procesadas por una unidad de mejora de mezcla descendente 140, 240, 340 para obtener canales de mezcla descendente mejorada 112, 212, 312. La modificacion de las senales de microfono 110, 210, 310 es controlada por una unidad de control 120, 130, 216, 316. La unidad de control toma en cuenta el modelo de senal de multicanal para la reproduccion de altavoz y los parametros de pista espacial estimados 122, 122a, 122b, 322. A partir de esta informacion, la unidad de control determina un objetivo para la mejora, esto es, el modelo de la senal de mezcla descendente deseada (por ejemplo, senales de mezcla descendente Y1, Y2). Los detalles de la invencion seran discutidos en lo siguiente.
7.2 Modelo para la senal de mezcla descendente estereo deseada
En esta seccion, se discute un modelo de la senal de mezcla descendente estereo deseada, que tambien presenta el objetivo para el calculo de mezcla descendente mejorada propuesta.
5
10
15
20
25
30
35
40
45
50
55
Si se aplican las ecuaciones (18) y (19) al modelo de senal envolvente supuesta de acuerdo con la ecuacion (10) que tiene un modelo de sena de mezcla descendente deseada de acuerdo con
r2
G91 +
(92 +
V293
71®
+ 9s9a)S + Ari + 9s9s)S + N2 j
(20)
donde las dos senales de sonido difuso N 1 y N 2 son
imagen10
El sonido difuso en la senal de microfono izquierda y derecha es N1 y N2. Asl, la mezcla descendente debe estar basada en el sonido difuso relacionado con N1 y N2. Puesto que como se define previamente, la potencia de N1, N2 y N 1 y N 5 son las mismas, las senales difusas basadas en N1 y N2 con la misma potencia como N 1 A N 2 (21) son
JVi = yfti+^Ai + gMJVi
N2 = ^ + ifcl+9|ftiiV2.
(22)
Asl, el modelo de senal de mezcla descendente estereo deseada permite expresar la senales de canal Y1, Y2 de la senal de mezcla descendente estereo deseada como funcion de valores de ganancia g1, g2, g3, g4, g5, gs, h1, h2, h3, h4, h5 y tambien
en dependencia de la cantidad total compensada en ganancia S de sonido directo en la senal de microfono estereo y la senal difusa N1, N2.
7.3 Filtracion de un solo canal
En lo siguiente, se describira un procedimiento en el cual un primer canal de la senal de mezcla descendente mejorada es derivada a partir de una senal del primer canal de la senal de microfono de multicanal y en el cual un segundo canal de la senal de mezcla descendente mejorada es derivado a partir de una senal del segundo canal de la senal del microfono del multicanal. Se debe notar que el filtrado descrito en lo siguiente puede ser efectuada por el filtro 40 o por el proveedor de senal de audio de dos canales 240 o por el mejorador de mezcla descendente 340. Tambien se debe notar que los parametros de filtro mejorados H1, H2 pueden ser provistos por el calculador de filtro 130, por el calculador de filtro 230 o por el control 316.
Un procedimiento posible para determinar la senales de mezcla descendente deseadas Y1(k, i) y Y2(k, i) de acuerdo con (20) es aplicar un filtro mejorado a la entrada de microfono estereo original X1(k, i) y X2(k, i), esto es
Yi(k,i) = Hi(k,i)Xi(k,i)
H U) = H2(k,i)X2(k,i). (23)
Estos filtros son escogidos de tal manera que Y1(k, i) y Y2(k, i) (esto es, la senales de mezcla descendente reales obtenidas mediante filtracion de las senales de canal de la senal de microfono de multicanal) se aproximan a las senales de mezcla descendente deseadas Y1(k, i) y Y2(k, i), respectivamente. Una aproximacion apropiada es que Y1(k, i) y Y2(k, i)comparten la
14
5
10
15
20
25
30
35
40
45
50
55
60
misma distribucion de energla con respecto a las energlas del modelo de senal de altavoz de multicanal como es dado en las senales de mezcla descendente objetivo Y1(k, i) y Y2(k, i), respectivamente. En otras palabras, los filtros son escogidos de tal manera que las senales de mezcla descendente reales obtenidas mediante filtracion de las senales de canal de la senal de microfono de multicanal se aproximan a las senales de mezcla descendente deseadas con respecto a algunas propiedades estadlsticas como por ejemplo caracterlsticas de energla o caracterlsticas de correlacion cruzada.
En el caso en que los filtros mejorados corresponden a filtros de Wiener (vease, por ejemplo referencia [5]), Hi(k, i) y H2(k, i) pueden ser determinados de acuerdo con
E{A-iiy> E{XtX^} E{A:2Y2*} E{X2X$} ■
Sustituyendo (20) con (22) en (24), producen
(24)
imagen11
Con
imagen12
(26)
(27)
(28)
(29)
como se puede notar, los filtros mejorados dependen directamente de los diferentes componentes del modelo de senal multicanal (10). Puesto que estos componentes son estimados en base a los parametros de pista espacial, se puede concluir que los filtros H1(k, i) y H2(k, i) para el calculo de mezcla descendente mejorada dependen de estos parametros de pista espacial tambien. En otras palabras, el calculo de los filtros mejorados puede ser controlado por los parametros de pista espacial estimados, como tambien se ilustra en la Figura 3.
7. 4 Filtracion de dos canales
En esta seccion, se presenta un metodo alternativo al procedimiento de un solo canal discutido en la seccion titulada “filtracion de un solo canal”. En este caso, cada canal de mezcla descendente mejorado Y1, Y2 es determinado a partir de versiones filtradas de ambas senales de entrada de microfono X1, X2. Ya que este procedimiento es apto de combinar ambos canales de microfono de manera optima, se puede esperar un desempeno mejorado en comparacion con el metodo de filtracion de un solo canal.
La senal de mezcla descendente real puede ser obtenida de acuerdo con
5
10
15
20
35
40
45
50
55
60
Y2 (k,i)
[Hi,i Ht>2] [H-2,1 Hi,2]
Xi(k,i) X2 (k,i)
X2(k,i)
(30)
(31)
En lo siguiente, se muestra el ejemplo para estimar los filtros mejorados en base a filtros de Wiener de dos canales. Por simplicidad de presentation, se dejan los Indices (k, i) en lo siguiente. La ecuacion de Wiener-Hopf para el primer canal de mezcla descendente es Yi (k, i) :
E
e{XiX2*}1 \Hu 'E{Xi YfY
_E{X2Xt}
E{X2X2*}. Hv2_ E{X2Y{}_
Los filtros son por consiguiente obtenidos como
Hu
1 -E{X,X,*)' ■IMA',)',-)
Hi,2
d -E{X2Xf} E{X,Xf} E(X2r,*}
Ho.i
1 ' E{X>XJ) H ! A i A - ' '!•: rv,> n
H2,2
d -e{x2x;j E{X,Xf} E{A'2y2*)
donde
d = E {XxXl} E {X1X2 }- E {XiX|} E .
(32)
(33)
(34)
La correlation cruzada entre las senales de entrada de microfono Xi, X2 y los canales de mezcla descendente Yi,Y2 pueden ser expresadas por
E{Xi Yj*} = wiE{SS*} + v%E E {X2Y{} = aw1E
E{XiYj} = —E{ T*}
E{X2YJ} = W2E{,S5*} + W4E {NN*}
donde los pesos Wi han sido introducidos en (26)-(29).
(35)
7.5 Seleccion entre filtracion de un canal y filtracion de dos canales
En lo siguiente, se describira un concepto que permite una seleccion senal-adaptable entre filtracion de un canal y filtracion de dos canales.
El filtrado de dos canales, como se describe hasta ahora tiene el problema de que en la practica algunas veces (o aun frecuentemente) produce filtros que introducen artefactos de audio. Siempre que el canal izquierdo y derecho estan altamente correlacionados, la matriz de co-varianza en la ecuacion de Wiener-Hopf es malamente acondicionada. La sensibilidad numerica resultante da como resultado entonces filtros que son irrazonables y provocan artefactos de audio. Para impedir esto, se usa el filtrado de un solo canal, siempre que los dos canales exceden un cierto grado de correlacion. Esto puede ser implementado al calcular los filtros como
5
10
15
20
25
30
35
40
45
50
55
60
H 1,1
= Hx
h1>2
= 0
H2,i
= 0
Ho,2
- ,
(36)
donde
imagen13
donde el umbral de coherencia/correlacion T determina el grado de correlation en que el filtrado de un solo canal es usada. Un valor de T = 0.9 produce buenos resultados.
n otras palabras, es posible cambiar selectivamente entre filtration de un canal y filtration de dos canales dependiendo del grado de correlacion entre cualesquier senales de canal de la senal de microfono de multicanal. Si la correlacion es mayor que un valor de correlacion predeterminada, se puede usar filtracion de un canal en lugar de filtracion de dos canales.
7.6 Caso general de multicanal
En lo siguiente, se generalizara el calculo mejorada de las senales de mezcla descendente estereo envolvente de MPEG en base a un modelo de senal de multicanal de acuerdo con (10) a configuraciones de canal mas generales. Analogamente a (10) el modelo de senal de multicanal generalizado que supone K de canales de altavoz es dado por
Zt(k, i) = g,(k, i)S(k, i) + h,(k, i)N,(k, i), (38)
con l = 1,2 ..., K. Los factores de ganancia gl(k, i) dependen de la DOA de sonido directo y la position del lth altavoz dentro de la configuration de reproduction. Los factores de ganancia h1 pueden ser predeterminados y usados como se explica anteriormente. Z1 representa senales de canal deseadas de una pluralidad de canales con l = 1,2, ...K.
El calculo de la senal Yj(k, i) de un canal de mezcla descendente deseado j es obtenido por una operation de mezcla apropiada de acuerdo con
K—l
Yj(k,i) = Y/mjfZ,(k,i). (39)
/=0
Los pesos de mezcla rrij, representan una division o mapeo espacial especifica de areas de reproduccion, que estan asociadas con la posicion de lht altavoz al j-th de mezcla descendente.
Para dar un ejemplo: En el caso que de que un canal de altavoz L esto es a una cierta de reproduccion, no contribuyera a la jht de mezcla descendente, el peso de la mezcla correspondiente mj es ajustado a cero.
Analogamente a (23), (30) y (30), respectivamente, los canales de entrad de microfono originales Xj(k, i) son modificados por filtros mejorados escogidos apropiadamente para aproximar los canales de mezcla descendentes deseados mj.
En el caso de un filtro de un solo canal, se tiene
imagen14
5
10
15
20
25
30
35
40
45
50
55
Aqul, Yj designa senales de canal reales de la senal de mezcla descendente de multicanal.
Notese que (40) puede tambien ser aplicada en el caso de que haya mas de dos senales de microfono de entrada disponibles. Los filtros resultantes tambien de los parametros de pista espacial estimados. Asl, sin embargo, no se discute la estimacion de los parametros de pista espacial en base a mas de dos canales de entrada de microfono, ya que esto no es una parte esencial de la invencion.
Es posible derivar las ecuaciones requeridas para los filtros mejorados de mezcla descendente de multicanal generales analogamente a (30), (30). Suponiendo M senales de entrada de microfono, el jth canal de mezcla descendente deseado Yj(k, i) es aproximado al aplicar N filtros mejorados a las senales de microfonos mejorados Xm(k, i):
Yj(k, i) = Hj(M)X(M),
X(M) = \Xi (M)rX2(M),.--:vXM(M)]T, Hj(M) =
(41)
(42)
(43)
El canal de mezcla descendente deseado correspondiente Yj(k, i) puede ser obtenido de (39) utilizando el modelo de senal generalizado (38).
Los elementos de la matriz mejorada de multicanal Hj(k, i) pueden ser obtenidos al resolver la ecuacion de Wiener-Hopf correspondiente
imagen15
en donde H denota el ermitano de un operando.
Se debe mencionar que el metodo descrito anteriormente puede ser considerado como un supresor de diafonla de microfono general basado en la informacion de pista espacial si el numero de altavoces K en el modelo de senal de multicanal (38) es escogido grande. En este caso, la posicion del altavoz puede ser directamente ser considerado como una DOA correspondiente de sonido directo. Aplicando la invencion, un supresor de diafonla flexible puede ser implementado utilizando uno o mas filtros de supresion.
8. Pre-procesamiento de las senales de microfono
Hasta ahora, solamente se considero el caso en donde las senales Xj(k, i) representan las senales de salida de microfonos. El nuevo concepto o metodo propuesto puede ser alternativamente ser aplicado a senales de microfono pre-procesados en lugar de esto. El procedimiento correspondiente es ilustrado en la Figura 5.
El pre-procesamiento puede ser implementado al aplicar formacion de las no variantes en el tiempo fija (vease, por ejemplo referencia [8] en base a las senales de entrada de microfono originales). Como resultado del pre-procesamiento, alguna parte de las fugas de senal indeseables a ciertas senales de microfono pueden ya ser mitigadas, antes de la aplicacion de los filtros mejorados.
Los filtros mejorados basados en los canales de entrada pre-procesados pueden ser derivados analogamente a los filtros discutidos anteriormente, al reemplazar Xj(k, i) por la senales de salida de la etapa de pre-procesamiento Xj,mod(k, i).
9. Aparato de acuerdo con la Figura 3
La Figura 3 muestra un diagrama de bloques esquematico de un aparato 300 para generar una senal de mezcla descendente mejorada en base a una senal de microfono de multicanal de acuerdo con otra realizacion de la invencion.
EL aparato 300 comprende dos microfonos 306, 308 que proveen una senal de microfono de dos canales 310, que comprende una senal del primer canal, que es representada por una representacion de dominio de tiempo-frecuencia X1 (k,
5
10
15
20
25
30
35
40
45
50
55
60
i) y una senal del segundo canal que es representada por una segunda representacion de tiempo-frecuencia X2 (k, i). El aparato 300 tambien comprende un analisis espacial 320 que recibe la senal de microfono de dos canales 310 y provee, en base a la misma, parametros de pista espacial 322. El analisis espacial 320 puede tomar la funcionalidad del analizador espacial 320 o del analizado de senal 220, de tal manera que los parametros de pista espacial 322 pueden ser equivalentes a los parametros de pista espacial 122 o a la informacion de energla compuesta 122a y la informacion de direccion 122b. El aparato 300 tambien comprende un dispositivo de control 316 que recibe los parametros de pista espacial 322 y que tambien recibe la senal de microfono de dos canales 310. La unidad de control 316 tambien recibe un modelo de senal de multicanal 318 o comprende parametros de tal modelo de senal de multicanal 318. El dispositivo de control 316 provee parametros de filtro mejorados 332 al dispositivo de mejora de mezcla descendente 340. El dispositivo de control 316 puede por ejemplo tomar la funcionalidad del calculador de filtro 130 o del calculador de filtro 230, de tal manera que los parametros de filtro mejorados 332 pueden ser equivalentes a los parametros de filtro mejorados 132 o los parametros de filtro mejorados 232. El dispositivo de mejora de mezcla descendente 340 recibe la senal de microfono de dos canales 310 y tambien los parametros de filtro mejorados 332 y provee, en base a los mismos, la senal de mezcla descendente de multicanal mejorada 312. Un senal del primer canal de la senal de mezcla descendente mejorada de multicanal 312 es representada por una representacion de tiempo-frecuencia Y1 (k, i) y una senal de segundo canal de la senal de mezcla descendente de multicanal mejorada 312 es representada por una representacion de tiempo-frecuencia Y2 (k, i). Se debe notar que el dispositivo de mejora de mezcla descendente 340 puede tomar la funcionalidad del filtro 140 o del proveedor de senal de audio de dos canales 240.
10. Aparato de acuerdo con la Figura 5
La Figura 5 muestra un diagrama de bloques esquematico de un aparato 500 para generar una senal de mezcla descendente mejorada en base a la senal de microfono de multicanal. El aparato 500 de acuerdo con la Figura 5 es muy similar al aparato 300 de acuerdo con la Figura 3, de tal manera que los medios y senales identicos son designados con numeros de referencia iguales y no seran explicados otra vez. Sin embargo, ademas de los bloques funcionales del aparato 300, el aparato 500 tambien comprende un pre-procesamiento 580 que recibe la senal de microfono de multicanal 310 y provee en base a la misma una version pre procesada 310' de la senal de microfono de multicanal. En este caso, la mejora de mezcla de descendente 340 recibe la version procesada 310' de la senal de microfono de multicanal 210, en lugar de la senal de microfono de multicanal 310 misma. Tambien, el dispositivo de control 316 recibe la version procesada 310' de la senal de microfono de multicanal, en lugar de la senal de microfono de multicanal 310 misma. Sin embargo, la funcionalidad de la mejora de mezcla descendente 340 y del dispositivo de control 316 no es afectada sustancialmente por esta modificacion.
11. Asignacion de senales de canal a senales de mezcla descendente de acuerdo con la Figura 4
Como se discute anteriormente, el modelado de la mezcla descendente, que es usado para derivar los canales de mezcla descendente deseados Y1, Y2 o algunas de las caracterlsticas estadlsticas de los mismos, comprende un mapeo de un
componente de sonido directo (por ejemplo, S (k, i)) y de componente de sonido difuso (por ejemplo, Nt (k, i) sobre
senales de canal (por ejemplo, L (k, i), R (k, i), C (k, i), Ls (k, i), Rs (k, i) o Zl (k, i))) y un mapeo de senales de canal de altavoz sobre las senales de canal de mezcla descendente.
Con respecto al primer mapeo del componente de sonido directo y el componente de sonido difuso sobre las senales de canal de altavoz, un mapeo dependiente de la direccion puede ser usado, que es descrito por los factores de ganancia g1. Sin embargo, con respecto al mapeo de las senales de canal de altavoz sobre las senales de canal de mezcla descendente, se pueden usar suposiciones fijas que pueden ser descritas por una matriz de mezcla descendente. Como se ilustra en la Figura 4 se puede suponer que solamente las senales de canal de altavoz C, L y Ls deben contribuir a la primera senal de canal de mezcla descendente Y1 y que solamente las senales de canal de altavoz C, R y Rs deben contribuir a la senal de canal de mezcla descendente Y2.
Esto es ilustrado en la Figura 4.
12. Flujo de procesamiento de senal de acuerdo con la Figura 6
En lo siguiente, se describira el flujo del procesamiento de senal en una realizacion de acuerdo con la invencion con referencia a la Figura 6. La Figura 6 muestra una representacion esquematica del flujo de procesamiento de senal para derivar los parametros de filtro mejorados H a partir de la senal de microfono de multicanal representada por ejemplo, por representaciones de tiempo-frecuencia X1 y X2.
El flujo de procesamiento 600 comprende por ejemplo como una primera etapa, un analisis espacial 610 que puede tomar la funcionalidad de un calculo de parametro de pista espacial. Asl, una informacion de potencia de sonido directo (o
5
10
15
20
25
30
35
40
45
50
55
60
informacion de energla de sonido directo) E {SS*}, una informacion de potencia de sonido difuso (o informacion de energla de sonido difuso) E {NN*} y una informacion de direccion a, a puede ser obtenida en base a la senales de microfono de multicanal. Detalles con respecto a la derivacion de la informacion de potencia de sonido directo (o informacion de energla de sonido directo) de la informacion de potencia de sonido difuso (o informacion de energla de sonido difuso) y la informacion de direccion han sido discutidos anteriormente.
EL flujo de procesamiento 600 tambien comprende un mapeo del factor de ganancia 320, en el cual la informacion de direccion es mapeada sobre una pluralidad de factores de ganancia (por ejemplo, factores de ganancia gi a g5). El mapeo de factor de ganancia 620 puede por ejemplo ser efectuado utilizando una ley de toma panoramica de amplitud de multicanal como se describe anteriormente.
El flujo de procesamiento 600 tambien comprende un calculo del parametro de filtro 630, en el cual los parametros de filtro mejorados H son derivados a partir de la informacion de potencia de sonido directo, la informacion de potencia de sonido difuso, la informacion de direccion y los factores de ganancia. El calculo del parametro de filtro 630 puede usar adicionalmente uno o mas parametros constantes que describen por ejemplo un mapeo deseado de canales de altavoz sobre senales de canal de mezcla descendente. Tambien, se pueden aplicar parametros predeterminados que describen un mapeo del componente de sonido difuso sobre las senales de altavoz.
El calculo del parametro de filtro comprende, por ejemplo un mapeo W632. En el mapeo w, que puede ser efectuado de acuerdo con las ecuaciones 26 a 29 se pueden obtener valores wi a W4 que pueden servir como cantidades intermedias. El calculo del parametro de filtro 630 comprende ademas un mapeo H 634 que puede ser efectuado por ejemplo de acuerdo con la ecuacion 25. En el mapeo H 634, los parametros de filtro mejorados H pueden ser determinados. Para el mapeo H, valores de correlation cruzada deseados E {Xi, Yi*},E {X2 Y2*} entre canales de la senal de microfono y los canales de la senal de mezcla descendente pueden ser usados. Estos valores de correlacion cruzada deseados pueden ser obtenidos en base a la informacion de potencia de sonido directo E {SS*} y E {NN*}, como se puede ver en el numerador de las ecuaciones (25), que es identico al numerador de las ecuaciones (24).
Para concluir, el flujo de procesamiento de la Figura 6 puede ser aplicado para derivar los parametros de filtro mejorados H a partir de la senal de microfono de multicanal representada por las senales de canal Xi, X2.
13. Flujo de procesamiento de senal de acuerdo con la Figura 7
La Figura 7 muestra una representation esquematica de un flujo de procesamiento de senal 700 de acuerdo con otra realization de la invention. El flujo de procesamiento de senal 700 puede ser usado para derivar parametros de filtro mejorado H a partir de una senal de microfono de multicanal.
El flujo de procesamiento de senal 700 comprende un analisis espacial 7i0 que puede ser identico al analisis espacial 6i0. Tambien, el flujo de procesamiento de senal 700 comprende un mapeo del factor de ganancia 720, que puede ser identico al mapeo de facto de ganancia 620.
El flujo de procesamiento de senal 700 tambien comprende un calculo del parametro de filtro 730. El calculo del parametro de filtro 730 puede comprender un mapeo w 732 que puede ser identico al mapeo w 632 en algunos casos. Sin embargo, se pueden usar diferentes mapeos w si se aprecia que es apropiado.
El calculo del parametro de filtro 730 tambien comprende un calculo de correlacion cruzada deseada 734, en el curso del cual se calcula una correlacion cruzada deseada entre canales de la senal de microfono de multicanal y canales de la senal de mezcla descendente deseada. Este calculo puede ser efectuado por ejemplo de acuerdo con la ecuacion 35. Se debe notar que se puede aplicar un modelo de una senal de mezcla descendente deseada en el calculo de correlacion cruzada deseada 734. Por ejemplo, suposiciones en como el componente de sonido directo de la senal de microfono de multicanal debe ser mapeado a una pluralidad de senales de altavoz en dependencia de la informacion de direccion pueden ser aplicadas en el calculo de correlacion cruzada deseada 734. Ademas, suposiciones de como los componentes de sonido difuso de la senal de microfono de multicanal deben ser reflejados en las senales de altavoz pueden tambien ser evaluadas en el calculo de correlacion cruzada deseada 734. Ademas, suposiciones con respecto a un mapeo deseado de canales de altavoz multiples sobre la senal de mezcla descendente pueden tambien ser aplicadas al calculo de correlacion cruzada deseada 734. Asl, una correlacion cruzada deseada E {Xi Yj*} entre canales de la senal de microfono y canales de la senal de mezcla descendente (deseada) puede ser obtenida en base a la informacion de potencia de sonido directo, la informacion de potencia de sonido difuso, la direccion de informacion y factores de ganancia dependientes de la direccion (en donde la ultima informacion puede ser combinada para obtener valores de w intermedios).
El calculo del parametro de filtro 730 tambien comprende una solution de la ecuacion de Wiener-Hopf 736, que puede por ejemplo ser efectuado de acuerdo con las ecuaciones 33 y 34. Para este proposito, la ecuacion de Wiener-Hopf puede ser
5
10
15
20
25
30
35
40
45
50
55
60
ajustada en dependencia de la informacion de potencia de sonido directo, la informacion de potencia de sonido difuso y la correlacion cruzada deseada entre canales de la senal de microfono de multicanal y canales de la senal de mezcla descendente (deseada). Como una solucion de la ecuacion de Wiener-Hopf (por ejemplo, la ecuacion 32) se tienen parametros de filtro mejorados H.
Para resumir lo anterior, la determinacion de los parametros de filtro mejorado H puede comprender etapas separadas de calculo de una correlacion cruzada deseada y de establecimiento y solucion de una ecuacion de Wiener-Hopf (etapa 736) en algunas realizaciones.
14. Conclusiones
Para resumir lo anterior, las realizaciones de acuerdo con la invencion crean un concepto y metodos mejorados para calcular una senal de c deseada de codificadores de audio espacial parametricos en base a senales de entrada de microfono. Un ejemplo importante es dado por la conversion de una senal de microfono estereo a una mezcla de descendente envolvente de MPEG correspondiente a los parametros de MPS calculados. La senal de mezcla descendente mejorada conduce a una calidad de audio espacial significativamente mejorada y propiedad de localizacion despues de la descodificacion de MPS en comparacion con el caso del estado del arte propuesto en la referencia [2]. Una realizacion simple de acuerdo con la invencion comprende las siguientes etapas 1 a 4:
(1) recibir senales de entrada de microfono;
(2) calcular parametros de pista espacial;
(3) determinar filtros mejorados de mezcla descendente en base al modelo de los canales de mezcla descendente deseados, un modelo de senal de altavoz de multicanal para la salida del descodificador y parametros de pista espacial y
(4) aplicar los filtros mejorados a las senales de entrada de microfono para obtener senales de mezcla descendente mejoradas para uso con microfonos de audio espacial.
Otra realizacion simple de acuerdo con la invencion crea un aparato, un metodo o un programa de computador para generar una senal de mezcla descendente, el aparato, metodo o programa de ordenador comprende un calculador de filtro para calcular parametros de filtro mejorados en base a informacion de senal de microfono o en base a informacion en un montaje de reproduccion propuesto y el aparato, metodo o programa de ordenador comprende una disposicion de filtro (o etapa de filtracion) para filtrar senales de microfono utilizando los parametros de filtro mejorados para obtener la senal de mezcla descendente mejorada.
Este aparato, metodo o programa de ordenador puede opcionalmente puede ser mejorado en que el calculador de filtro esta configurado para calcular los parametros de filtro mejorados en base a un modelo de los canales de mezcla descendentes deseados, modelo de senal de altavoz de multicanal para la salida del descodificador o parametros de pista espacial.
15. Alternativas de implementacion
Aunque algunos aspectos han sido descritos en el contexto de un aparato, es claro que estos aspectos tambien representan una descripcion del metodo correspondiente, en donde un bloque o dispositivo corresponde a una etapa de metodo o un elemento de una etapa del metodo. Analogamente, aspectos descritos en el contexto de una etapa de metodo tambien representan una descripcion de un bloque o Item o elemento correspondiente de un aparato correspondiente. Algunas o todas las etapas de metodo pueden ser ejecutadas por (o usando) un aparato de elementos flsicos como por ejemplo un microprocesador, un ordenador programable o un circuito electronico. En algunas realizaciones, algunas o mas de las etapas de metodo mas importantes pueden ser ejecutadas por tal aparato.
La senal de audio codificada de la invencion puede ser almacenada en un medio de almacenamiento digital o puede ser transmitida en un medio de transmision tal como un medio de transmision inalambrico o un medio de transmision cableado tal como internet.
Dependiendo de ciertos requerimientos de implementacion, realizaciones de la invencion pueden ser implementados en elementos flsicos o en elementos de programacion. La implementacion puede ser efectuada utilizando un medio de almacenamiento digital, por ejemplo un disco flexible, un DVD, un blue-ray, un cd, un ROM, un PROM, un EPROM, un EEPROM o una memoria instantaneas, que tiene senales de control que se pueden leer electronicamente almacenadas en el mismo que cooperan (o son aptas de cooperar) con un sistema de ordenador programable de tal manera que el metodo respectivo es efectuado. Por consiguiente, el medio de almacenamiento digital se puede leer por ordenador.
5
10
15
20
25
30
35
40
45
50
55
60
Algunas realizaciones de acuerdo con la invencion comprenden un portador de datos que tiene senales de control que se pueden leer electronicamente que son aptas de cooperar un sistema de ordenador programable, de tal manera que uno de los metodos descritos en la presente es efectuado.
En general, las realizaciones de la presente invencion pueden ser implementadas como un producto de programa de ordenador con codigos de programa, los codigos de programa son operativos para efectuar uno de los metodos cuando el producto de programa de ordenador se ejecuta en un ordenador. Los codigos de programa pueden por ejemplo ser almacenados en un portador que se puede leer por la maquina.
Otras realizaciones comprenden el programa de ordenador para efectuar uno de los metodos descritos en la presente, almacenados en un portador que se puede leer por maquina.
En otras palabras, una realizacion del metodo de la invencion es por consiguiente un programa de ordenador que tiene codigos de programa para efectuar uno de los metodos descritos en la presente, cuando el programa de ordenador se ejecuta en un ordenador.
Una realizacion adicional de los metodos de la invencion es por consiguiente un portador de datos (o medio de almacenamiento digital o medio que se puede leer por ordenador) que comprende registrarlos en el mismo, el programa de ordenador para efectuar uno de los metodos descritos en la presente. El portador de datos, medios de almacenamiento digital o el medio grabado son comunmente tangibles y/o sin transicion.
Una realizacion adicional del metodo de la invencion es por consiguiente una corriente de datos o una secuencia de senales que representan el programa de ordenador para efectuar uno de los metodos descritos en la presente. La corriente de datos o la secuencia de senales pueden por ejemplo estar configuradas para ser transferidas via una coleccion de comunicacion de datos, por ejemplo via internet.
Una realizacion adicional comprende medios de procesamiento, por ejemplo un ordenador o un dispositivo logico programable configurado para o apto para efectuar uno de los metodos descritos en la presente.
Una realizacion adicional comprende un ordenador que tiene instalado en la misma el programa de ordenador para efectuar uno de los metodos descritos en la presente.
Una realizacion adicional de acuerdo con la invencion comprende un aparato o un sistema configurado para transferir (por ejemplo, electronica u opticamente) un programa de ordenador para efectuar uno de los metodos descritos en la presente a un receptor. El receptor puede ser por ejemplo, un ordenador, un dispositivo movil, un dispositivo de memoria o los semejantes. El aparato o sistema puede comprender por ejemplo un servidor de archivos para transferir programas de ordenador al receptor.
En algunas realizaciones, se puede usar un dispositivo logico programable (por ejemplo, una disposicion de compuerta programable en el campo) para efectuar algunas o todas las funcionalidades de los metodos descritos en la presente. En algunas realizaciones, una disposicion de compuerta programable al campo puede cooperar con un microprocesador con el fin de efectuar uno de los metodos descritos en la presente. En general, los metodos son preferiblemente efectuados mediante cualquier aparato de elementos flsicos.
Las realizaciones descritas anteriormente son solamente ilustrativas para los principios de la presente invencion. Se entendera que modificaciones y variaciones de las disposiciones y los detalles descritos en la presente seran evidentes para otros experimentados en el arte. Es la intencion por consiguiente estar limitado solamente por el alcance de las reivindicaciones de patente pendientes y no por los detalles especlficos presentados a manera de descripcion y explicacion de las realizaciones en el presente documento.
References
[1] ISO/IEC 23003-1:2007. Information technology - MPEG Audio technologies - Part 1: MPEG Surround. International Standards Organization, Geneva, Switzerland, 2007.
[2] C. Faller. Microphone front-ends for spatial audio coders. In 125th AES Convention, Paper 7508, San Francisco, Oct. 2008.
[3] M. A. Gerzon. Periphony: Width-Height Sound Reproduction. J. Aud. Eng. Soc., 21(1 ):2-10, 1973.
[4] D. Griesinger. Stereo and surround panning in practice. In Preprint 112th Conv. Aud. Eng. Soc., May 2002.
[5] S. Haykin. Adaptive Filter Theory (third edition). Prentice Hall, 1996.
5 [6] J. Herre, K. Kjorling, J. Breebaart, C. Faller, S. Disch, H. Purnhagen, J. Koppens, J. Hilpert, J. Rod'en, W. Oomen, K.
Linzmeier, and K. S. Chong. Mpeg surround-the iso/mpeg standard for efficient and compatible multi-channel audio coding. In Preprint 122th Conv. Aud. Eng. Soc., May 2007.
[7] V. Pulkki. Virtual sound source positioning using Vector Base Amplitude Panning. J. Audio Eng. Soc., 45:456-466, June
10 1997.
[8] B. D. Van Veen and K. M. Buckley. Beamforming: A versatile approach to spatial filtering. IEEE ASSP Magazine, 5(2):4- 24, April 1988.
15 [9] European Patent Application EP 1 565 036 A2, AGERE SYSTEM INC: Late reverberation-based synthesis of auditory
scenes, Published on 17 August 2005 .

Claims (16)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    REIVINDICACIONES
    1. Un aparato (100; 200; 300; 500) para generar una senal de mezcla descendente mejorada (112; 212; 312) en base a una senal de microfono de multicanal (110; 210; 310), donde el aparato comprende:
    un analizador espacial (120; 220; 320) configurado para calcular un conjunto de parametros de pista espacial (E{NN*}, E{SS*}, a, a) que comprenden una informacion de direccion (a, a) que describe una direccion de llegada de sonido directo, una informacion de potencia de sonido directo (E{SS*}), y una informacion de potencia de sonido difuso (E{NN*}, en base a la senal de microfono de multicanal;
    un calculador de filtro (130; 230; 316) para calcular parametros de filtro mejorados (132; 232; 332) en dependencia de la informacion de direccion (a, a) que describe la direccion de llegada de sonido directo, en dependencia de la informacion de potencia de sonido directo (E{SS*}) y en dependencia de la informacion de potencia de sonido difuso (E{NN*}); y
    un filtro (140; 240; 340) para filtrar la senal de microfono (110; 210; 310) o una senal derivada de la misma, utilizando los parametros de filtro mejorados (132; 232; 332) para obtener la senal de mezcla descendente mejorada (112; 212; 312);
    en donde el calculador de filtro esta configurado para calcular los parametros de filtro mejorados (H1, H2; H^, H1,2, H2,1, H2,2) en dependencia de los factores de ganancia dependientes de la direccion (g1, g2, g3, g4, g5) que describen contribuciones deseadas de un componente de sonido directo (S) de la senal de microfono de multicanal a una pluralidad de senales de altavoz (L, R, C, Ls, Rs; Zl) y en dependencia de uno o mas valores de matriz de mezcla descendente (gs; mj,l) que describen contribuciones deseadas de una pluralidad de canales de audio (L, R, C, Ls, Rs; Z) a uno o mas canales de la senal de mezcla descendente mejorada.
  2. 2. El aparato de acuerdo con la reivindicacion 1, en el que el calculador de filtro (130; 230; 316) esta configurado para calcular los parametros de filtro mejorados (132; 232; 332; H1, H2; H11, H12, H2,1, H22) de tal manera que la senal de mezcla
    descendente mejorada (112; 212; 312; Yj; Y2) se aproxima a una senal de mezcla descendente deseada (Y1, Y2).
  3. 3. El aparato de acuerdo con la reivindicacion 1 o la reivindicacion 2, en el que el calculador de filtro (130; 230; 316) esta configurado para calcular valores de correlacion cruzada deseados (E{X1Y1*}, E{X2Y1*}, E{X1Y2*}, E{X2Y2*}) entre senales de canal (X1, X2) de la senal de microfono de multicanal (110; 210; 310) y senales de canal deseadas (Y1, Y2) de la senal de mezcla descendente en dependencia de los parametros de pista espacial y
    en donde el calculador de filtro esta configurado para calcular los parametros de filtro mejorados (H1, H2; H1,1, H1,2, H2,1, H2,2) en dependencia de los valores de correlacion cruzada deseados.
  4. 4. El aparato de acuerdo con la reivindicacion 3, en el que el calculador de filtro esta configurado para calcular los valores de correlacion cruzada deseados en dependencia de los factores de ganancia dependientes de la direccion (g1, g2, g3, g4, g5) que describen contribuciones deseadas de un componente de sonido directo (S) de la senal de microfono de multicanal a una pluralidad de senales de altavoz (L, R, C, Ls, Rs; Zl).
  5. 5. El aparato de acuerdo con la reivindicacion 4, en el que el calculador de filtro (130; 230; 316) esta configurado para mapear la informacion de direccion (a, a) sobre un conjunto de factores de ganancia dependiente de la direccion (g1, g2, g3, g4, g5).
  6. 6. El aparato de acuerdo con cualquiera de las reivindicaciones 3 a 5, en el que el calculador de filtro (130; 230; 316) esta configurado para considerar la informacion de potencia de sonido directo (E{SS*}) y la informacionde potencia de sonido difuso (E{NN*}) para calcular los valores de correlacion cruzada deseados (E{X1Y1*}, E{X2Y1*}, E{X1Y2*}, e{X2Y2*}).
  7. 7. El aparato de acuerdo con la reivindicacion 6, en el que el calculador de filtro (130; 230; 316) esta configurado para ponderar la informacion de potencia de sonido directo (E{SS*}) en dependencia de la informacion de direccion (a, a), y para aplicar una ponderacion predeterminada, que es independiente de la informacion de direccion, a la informacion de potencia de sonido difuso (E{NN*}) con el fin de calcular los valores de correlacion cruzada deseados (E{X1Y1*}, E{X2Y1*}, E{X1Y2*}, E{X2Y2*}).
  8. 8. El aparato de acuerdo con cualquiera de las reivindicaciones 1 a 7, en el que el calculador de filtro (130; 230; 316) esta configurado para calcular los coeficientes de filtro H1, H2 de acuerdo con
    5
    10
    15
    20
    25
    30
    45
    50
    55
    = W1E{SS*} + WsE{NN*}
    1 E{SS*} + E{NN*}
    _ w2E{SS*} + W4tE{NNic}
    2 “ a2E{SS*} + E{NN*}
    donde E{SS*} es informacion de potencia de sonido directo, donde E{NN*} es informacion de potencia de sonido difuso,
    donde wi y W2 son coeficientes que son dependientes de la informacion de direccion (a, a), y donde W3 y W4 son coeficientes determinados por las ganancias de sonido difuso (hi, h2, h3, h4, h5); y
    donde el filtro (140; 240; 340) esta configurado para determinar una senal del primer canal Y1 (k,i) y una senal del segundo
    canal Y2 (k,i) de la senal de mezcla descendente mejorada (112; 212; 312) en dependencia de una senal del primer canal X1 (k,i) y de una senal del segundo canal X2(k,i) de la senal de microfono de multicanal de acuerdo con
    Y( k, i) = H,( k, i) X,( k, i)
    Y2( k, i) = H 2( k, i) X 2( k, i)
  9. 9. El aparato de acuerdo con cualquiera de las reivindicaciones 1 a 7, en el que el calculador de filtro (130; 230; 316) esta configurado para calcular coeficientes de filtro (H1, H12, H2,1 y H2,2) de acuerdo con
    1 ' E{A»XJ} -E{X,X2*}' 'E(.Vi)V)'
    Hu
    -E {A'oXf} E{X,Xf} E(.v2r,*}
    #2,1
    1 ' E{XoX;} -E{XiX|)' E{A,F2*)'
    #2.2
    -E{x2x;} E{x,Xf} E{A2r2*}
    donde
    imagen1
    donde
    X1 designa una senal del primer canal de la senal de microfono de multicanal,
    X2 designa una senal del segundo canal de la senal de microfono de multicanal,
    E{.} designa una operacion de promedio de tiempo corto,
    * designa una operacion conjugada compleja,
    E{X1Y1*}, E{X2Y1*}, E{X1Y2*} y E{X2Y2*} designan valores de correlacion cruzada entre senales de canal X1, X2 de la senal de microfono de multicanal y senales de canal deseados Y1, Y2 de la senal de mezcla descendente mejorada.
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
  10. 10. El aparato de acuerdo con la cualquiera de las reivindicaciones 1 a 9, en el que el calculador de filtro (130; 230; 316) esta configurado para calcular los parametros de filtro mejorados Hj,1(k,i) a Hj,M(k,i) de tal manera que las senales de canal
    Yj (k, i) de la senal de mezcla descendente mejorada (112; 212; 312) obtenida mediante filtracion de senales de canal (X1,
    X2) de la senal de microfono de multicanal de acuerdo con los parametros de filtro mejorados se aproxima, con respecto a una medida estadlstica de similaridad, a senales de canal Yj(k,i) deseadas definidas como
    K -1
    Y(k > 0=Z m Z(k ’ 0-
    i=0
    con
    Zi(k,0 = g,(k, i)S(k, i) + h (k, i) N,(k, 1).
    donde g1 son factores de ganancia que son dependientes de la informacion de direccion (a, a) y que representan
    contribuciones deseadas de un componente de sonido directo (S ) de la senal de microfono de multicanal (110; 210; 310) a una pluralidad de senales de altavoz (Zl);
    donde h1 son valores predeterminados que describen contribuciones deseadas del componente de sonido difuso (N ) de la senal de microfono de multicanal (110; 210; 310) a una pluralidad de senales de altavoz.
  11. 11. El aparato de acuerdo con cualquiera de las reivindicaciones 1 a 10, en el que el calculador de filtro (130; 230; 316) esta configurado para evaluar una ecuacion de Wiener-Hopf para derivar los parametros de filtro mejorados (132; 232; 332; H1,
    H2; H1,1, H12, H2,1, H2,2),
    donde la ecuacion de Wiener-Hopf describe una relacion entre los valores de correlacion E{X1X1*}, E{X1X2*}, E{X2X1*}, E{X2X2*}, tales valores de correlacion describen una relacion entre diferentes pares de canal de la senal de microfono de multicanal, parametros de filtro mejorados (H11, H1,2, H2,1, H2,2) y valores de correlacion cruzada deseados (E{X1Y1*}, E{X2Y1*}, E{X1Y2*}, E{X2Y2*}) entre senales de canal (X1, X2) de senal de microfono de multicanal (110; 210; 310) y senales de canal deseadas (Y1,Y2) de la senal de mezcla descendente.
  12. 12. El aparato de acuerdo con cualquiera de las reivindicaciones 1 a 11, en el que el calculador de filtro (130; 230; 316) esta configurado para calcular los parametros de filtro mejorados (132; 232; 332) en dependencia de un modelo de canales de mezcla descendentes deseados.
  13. 13. El aparato de acuerdo con cualquiera de las reivindicaciones 1 a 12, en el que el calculador de filtro (130; 230; 316) esta configurado para efectuar selectivamente un filtrado de un solo canal, en el cual un primer canal (Yj) de la senal de mezcla descendente mejorada (112; 212; 312) es derivado mediante un filtrado de un primer canal (X1) de la senal de microfono de multicanal (110; 210; 310) y en el cual un segundo canal (Y2) de la senal de mezcla descendente mejorada es derivado mediante un filtrado de un segundo canal (X2) de la senal de microfono de multicanal mientras que se evita la diafonla del primer canal de la senal de microfono de multicanal al segundo canal de la senal de mezcla descendente mejorada y del segundo canal de la senal de microfono de multicanal al primer canal de la senal de mezcla descendente mejorada,
    o un filtrado de dos canales en el cual un primer canal (Yj) de la senal de mezcla descendente mejorada es derivado mediante filtrado de un primero y un segundo canal (X1, X2) de la senal de microfono de multicanal, y en el cual un segundo canal (Y2) de la senal de mezcla descendente mejorada es derivado mediante filtrado de un primero y segundo canal (X1, X2) de la senal de microfono de multicanal,
    en dependencia de un valor de correlacion que describe una correlacion entre el primer canal (X1) de la senal de microfono de multicanal y el segundo canal (X2) de la senal de microfono de multicanal.
  14. 14. Un metodo para generar una senal de mezcla descendente mejorada en base a una senal de microfono de multicanal, donde el metodo comprende:
    calcular un conjunto de parametros de pista espacial que comprenden una informacion de direccion que describe una
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    direccion de llegada de un sonido directo, una informacion de potencia de sonido directo e informacion de potencia de sonido difuso en base a la senal de microfono de multicanal,
    calcular parametros de filtro mejorados en dependencia de la informacion de direccion que describe la direccion de llegada de sonido directo, en dependencia de la informacion de potencia de sonido directo y en dependencia de la informacion de potencia de sonido difuso; y
    filtrar la senal de microfono o una senal derivada de la misma, utilizando los parametros de filtro mejorados, para obtener la senal de mezcla descendente mejorada;
    donde los parametros de filtro mejorados (Hi, H2; Hi,i, Hi,2, H2,i, H2,2) son calculados en dependencia de los factores de ganancia dependientes de la direccion (gi, g2, g3, g4, g5) que describen contribuciones deseadas de un componente de sonido directo (S) de la senal de microfono de multicanal a una pluralidad de senales de altavoz (L, R, C, Ls, Rs; Zl) y en dependencia de uno o mas valores de matriz de mezcla descendente (gs; mj,l) que describen contribuciones deseadas de una pluralidad de canales de audio (L, R, C, Ls, Rs; Zl) a uno o mas canales de la senal de mezcla descendente mejorada.
  15. 15. Un aparato (100; 200; 300; 500) para generar una senal de mezcla descendente mejorada (112; 212; 312) en base a una senal de microfono de multicanal (110; 210; 310), donde el aparato comprende:
    un analizador espacial (120; 220; 320) configurado para calcular un conjunto de parametros de pista espacial, (E{NN*}, E{SS*}, a, a) que comprende informacion de direccion (a, a) que describe una direccion de llegada de sonido directo, una informacion de potencia de sonido directo (E{SS*}) y una informacion de potencia de sonido difuso (E{NN*}), en base a la senal de microfono de multicanal;
    un calculador de filtro (130; 230; 316) para calcular parametros de filtro mejorados (132; 232; 332) en dependencia de la informacion de direccion (a, a) que describe la direccion de llegada del sonido directo, en dependencia de la informacion de potencia de sonido directo (E{SS*}) y en dependencia de la informacion de potencia de sonido difuso (E{NN*}); y
    un filtro (140; 240; 340) para filtrar la senal de microfono (110; 210; 310), o una senal derivada de la misma, utilizando los parametros de filtro mejorados (132; 232; 332), para obtener la senal de mezcla descendente mejorada (112; 212; 312);
    en donde el calculador de filtro (130; 230; 316) esta configurado para efectuar selectivamente un filtrado de un solo canal, en el cual un primer canal (Yj) de la senal de mezcla descendente mejorada (112; 212; 312) es derivado mediante un filtrado
    de un primer canal (X1) de la senal de microfono de multicanal (110; 210; 310) y en el cual un segundo canal (Y2) de la senal de mezcla descendente mejorada es derivado mediante un filtrado de un segundo canal (X2) de la senal de microfono de multicanal mientras que se evita la diafonla del primer canal de la senal de microfono de multicanal al segundo canal de la senal de mezcla descendente mejorada y del segundo canal de la senal de microfono de multicanal al primer canal de la senal de mezcla descendente mejorada,
    o un filtrado de dos canales en el cual un primer canal (Yj) de la senal de mezcla descendente mejorada es derivado mediante filtrado de un primero y un segundo canal (X1, X2) de la senal de microfono de multicanal, y en el cual un segundo canal (Y2) de la senal de mezcla descendente mejorada es derivado mediante filtrado de un primero y un segundo canal (X1, X2) de la senal del microfono de multicanal,
    en dependencia de un valor de correlacion que describe una correlacion entre el primer canal (X1) de la senal de microfono del multicanal y el segundo canal (X2) de la senal de microfono de multicanal.
  16. 16. Un metodo para generar una senal de mezcla descendente mejorada en base a una senal de microfono de multicanal, donde el metodo comprende:
    calcular un conjunto de parametros de pista espacial que comprende informacion de direccion que describe una direccion de llegada de sonido directo, informacion de potencia de sonido directo e informacion de potencia de sonido difuso en base a la senal de microfono de multicanal;
    calcular parametros de filtro mejorados en dependencia de la informacion de direccion que describe la direccion de llegada de sonido directo, en dependencia de la informacion de potencia de sonido directo y en dependencia de la informacion de potencia de sonido difuso y
    filtrar la senal de microfono, o una senal derivada de la misma, utilizando los parametros de filtro mejorados, para obtener la senal de mezcla descendente mejorada;
    Y
    donde el metodo comprende efectuar selectivamente un filtrado de un solo canal, en el cual un primer canal ( 1) de la senal 5 de mezcla descendente mejorada (112; 212; 312) es derivado mediante filtrado de un primer canal (X1) de la senal de
    Y
    microfono de multicanal (110; 210; 310) y en el cual un segundo canal ( 2) de la senal de mezcla descendente mejorada es derivado mediante un filtrado de un segundo canal (X2) de la senal de microfono de multicanal mientras que se evita la diafonla del primer canal de la senal de microfono de multicanal al segundo canal de la senal de mezcla descendente mejorada y del segundo canal de la senal de microfono de multicanal al primer canal de la senal de mezcla descendente 10 mejorada,
    Y
    o un filtrado de dos canales en el cual un primer canal ( 1 ) de la senal de mezcla descendente mejorada es derivado mediante filtrado de un primero y un segundo canal (X1, X2) de la senal de microfono de multicanal, y en el cual un segundo
    Y
    canal ( 2) de la senal de mezcla descendente mejorada es derivado mediante filtrado de un primero y segundo canal (X1, 15 X2) de la senal de microfono de multicanal,
    en dependencia de un valor de correlacion que describe una correlacion entre el primer canal (X1) de la senal de microfono de multicanal y el segundo canal (X2) de la senal de microfono de multicanal.
    20 17. Un programa de ordenador adaptado para efectuar un metodo de acuerdo con la reivindicacion 14 o la reivindicacion
    16, cuando el programa de ordenador se ejecuta en un ordenador.
ES11703882.8T 2010-02-24 2011-02-15 Aparato para generar señal de mezcla descendente mejorada, método para generar señal de mezcla descendente mejorada y programa de ordenador Active ES2605248T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US30755310P 2010-02-24 2010-02-24
US307553P 2010-02-24
PCT/EP2011/052246 WO2011104146A1 (en) 2010-02-24 2011-02-15 Apparatus for generating an enhanced downmix signal, method for generating an enhanced downmix signal and computer program

Publications (1)

Publication Number Publication Date
ES2605248T3 true ES2605248T3 (es) 2017-03-13

Family

ID=43652304

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11703882.8T Active ES2605248T3 (es) 2010-02-24 2011-02-15 Aparato para generar señal de mezcla descendente mejorada, método para generar señal de mezcla descendente mejorada y programa de ordenador

Country Status (12)

Country Link
US (1) US9357305B2 (es)
EP (1) EP2539889B1 (es)
JP (1) JP5508550B2 (es)
KR (1) KR101410575B1 (es)
CN (2) CN103811010B (es)
AU (1) AU2011219918B2 (es)
BR (1) BR112012021369B1 (es)
CA (1) CA2790956C (es)
ES (1) ES2605248T3 (es)
MX (1) MX2012009785A (es)
RU (1) RU2586851C2 (es)
WO (1) WO2011104146A1 (es)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
CN104054126B (zh) * 2012-01-19 2017-03-29 皇家飞利浦有限公司 空间音频渲染和编码
EP2665208A1 (en) * 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US9219460B2 (en) 2014-03-17 2015-12-22 Sonos, Inc. Audio settings based on environment
CN103596116B (zh) * 2012-08-15 2015-06-03 华平信息技术股份有限公司 一种视频会议***中自动调节实现立体声效果的方法
US10149048B1 (en) 2012-09-26 2018-12-04 Foundation for Research and Technology—Hellas (F.O.R.T.H.) Institute of Computer Science (I.C.S.) Direction of arrival estimation and sound source enhancement in the presence of a reflective surface apparatuses, methods, and systems
US9549253B2 (en) * 2012-09-26 2017-01-17 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Sound source localization and isolation apparatuses, methods and systems
US10175335B1 (en) 2012-09-26 2019-01-08 Foundation For Research And Technology-Hellas (Forth) Direction of arrival (DOA) estimation apparatuses, methods, and systems
US9554203B1 (en) 2012-09-26 2017-01-24 Foundation for Research and Technolgy—Hellas (FORTH) Institute of Computer Science (ICS) Sound source characterization apparatuses, methods and systems
US9955277B1 (en) 2012-09-26 2018-04-24 Foundation For Research And Technology-Hellas (F.O.R.T.H.) Institute Of Computer Science (I.C.S.) Spatial sound characterization apparatuses, methods and systems
US10136239B1 (en) 2012-09-26 2018-11-20 Foundation For Research And Technology—Hellas (F.O.R.T.H.) Capturing and reproducing spatial sound apparatuses, methods, and systems
US20160210957A1 (en) 2015-01-16 2016-07-21 Foundation For Research And Technology - Hellas (Forth) Foreground Signal Suppression Apparatuses, Methods, and Systems
MX354633B (es) 2013-03-05 2018-03-14 Fraunhofer Ges Forschung Aparato y metodo para la descomposicion directa-ambiental de multicanal para el procesamiento de señales de audio.
WO2014168618A1 (en) * 2013-04-11 2014-10-16 Nuance Communications, Inc. System for automatic speech recognition and audio entertainment
PL3429233T3 (pl) 2013-07-30 2020-11-16 Dts, Inc. Dekoder matrycowy z panoramowaniem parami o stałej mocy
US9552819B2 (en) 2013-11-27 2017-01-24 Dts, Inc. Multiplet-based matrix mixing for high-channel count multichannel audio
EP2884491A1 (en) * 2013-12-11 2015-06-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Extraction of reverberant sound using microphone arrays
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
EP2942982A1 (en) * 2014-05-05 2015-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. System, apparatus and method for consistent acoustic scene reproduction based on informed spatial filtering
ES2833424T3 (es) 2014-05-13 2021-06-15 Fraunhofer Ges Forschung Aparato y método para panoramización de amplitud de atenuación de bordes
CN111565352B (zh) * 2014-09-09 2021-08-06 搜诺思公司 由计算设备执行的方法和回放设备及其校准***和方法
US9952825B2 (en) 2014-09-09 2018-04-24 Sonos, Inc. Audio processing algorithms
DE102015203855B3 (de) * 2015-03-04 2016-09-01 Carl Von Ossietzky Universität Oldenburg Vorrichtung und Verfahren zum Ansteuern des Dynamikkompressors und Verfahren zum Ermitteln von Verstärkungswerten für einen Dynamikkompressor
EP3257270B1 (en) * 2015-03-27 2019-02-06 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for processing stereo signals for reproduction in cars to achieve individual three-dimensional sound by frontal loudspeakers
GB2540175A (en) 2015-07-08 2017-01-11 Nokia Technologies Oy Spatial audio processing apparatus
WO2017049169A1 (en) 2015-09-17 2017-03-23 Sonos, Inc. Facilitating calibration of an audio playback device
US9693165B2 (en) 2015-09-17 2017-06-27 Sonos, Inc. Validation of audio calibration using multi-dimensional motion check
US11432095B1 (en) * 2019-05-29 2022-08-30 Apple Inc. Placement of virtual speakers based on room layout
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
US11106423B2 (en) 2016-01-25 2021-08-31 Sonos, Inc. Evaluating calibration of a playback device
US10003899B2 (en) 2016-01-25 2018-06-19 Sonos, Inc. Calibration with particular locations
US11234072B2 (en) 2016-02-18 2022-01-25 Dolby Laboratories Licensing Corporation Processing of microphone signals for spatial playback
CN108463848B (zh) 2016-03-23 2019-12-20 谷歌有限责任公司 用于多声道语音识别的自适应音频增强
US9864574B2 (en) 2016-04-01 2018-01-09 Sonos, Inc. Playback device calibration based on representation spectral characteristics
US9860662B2 (en) 2016-04-01 2018-01-02 Sonos, Inc. Updating playback device configuration information based on calibration data
US9763018B1 (en) 2016-04-12 2017-09-12 Sonos, Inc. Calibration of audio playback devices
CN106024001A (zh) * 2016-05-03 2016-10-12 电子科技大学 一种提高麦克风阵列语音增强性能的方法
US11589181B1 (en) * 2016-06-07 2023-02-21 Philip Raymond Schaefer System and method for realistic rotation of stereo or binaural audio
US11032660B2 (en) * 2016-06-07 2021-06-08 Philip Schaefer System and method for realistic rotation of stereo or binaural audio
US9794710B1 (en) 2016-07-15 2017-10-17 Sonos, Inc. Spatial audio correction
US10372406B2 (en) 2016-07-22 2019-08-06 Sonos, Inc. Calibration interface
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
GB2559765A (en) 2017-02-17 2018-08-22 Nokia Technologies Oy Two stage audio focus for spatial audio processing
CN106960672B (zh) * 2017-03-30 2020-08-21 国家计算机网络与信息安全管理中心 一种立体声音频的带宽扩展方法与装置
GB201718341D0 (en) 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
CN110047478B (zh) * 2018-01-16 2021-06-08 中国科学院声学研究所 基于空间特征补偿的多通道语音识别声学建模方法及装置
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
US10299061B1 (en) 2018-08-28 2019-05-21 Sonos, Inc. Playback device calibration
US11206484B2 (en) 2018-08-28 2021-12-21 Sonos, Inc. Passive speaker authentication
CN109326296B (zh) * 2018-10-25 2022-03-18 东南大学 一种非自由场条件下的散射声有源控制方法
US10734965B1 (en) 2019-08-12 2020-08-04 Sonos, Inc. Audio calibration of a portable playback device

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5307405A (en) 1992-09-25 1994-04-26 Qualcomm Incorporated Network echo canceller
DE4320990B4 (de) * 1993-06-05 2004-04-29 Robert Bosch Gmbh Verfahren zur Redundanzreduktion
US5978473A (en) 1995-12-27 1999-11-02 Ericsson Inc. Gauging convergence of adaptive filters
US6973184B1 (en) * 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
AU2002358225A1 (en) * 2001-12-05 2003-06-17 Koninklijke Philips Electronics N.V. Circuit and method for enhancing a stereo signal
BRPI0304540B1 (pt) * 2002-04-22 2017-12-12 Koninklijke Philips N. V Methods for coding an audio signal, and to decode an coded audio sign, encoder to codify an audio signal, codified audio sign, storage media, and, decoder to decode a coded audio sign
JP4247037B2 (ja) * 2003-01-29 2009-04-02 株式会社東芝 音声信号処理方法と装置及びプログラム
WO2004084577A1 (en) * 2003-03-21 2004-09-30 Technische Universiteit Delft Circular microphone array for multi channel audio recording
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
CN101124740B (zh) * 2005-02-23 2012-05-30 艾利森电话股份有限公司 多声道音频信号编码和解码的方法和装置和音频传送***
KR100588218B1 (ko) * 2005-03-31 2006-06-08 엘지전자 주식회사 모노 보강 스테레오 시스템 및 그 신호 처리 방법
US20090252339A1 (en) * 2005-09-22 2009-10-08 Pioneer Corporation Signal processing device, signal processing method, signal processing program, and computer readable recording medium
JP4875142B2 (ja) * 2006-03-28 2012-02-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル・サラウンドサウンドのためのデコーダのための方法及び装置
MX2008012324A (es) * 2006-03-28 2008-10-10 Fraunhofer Ges Zur Foeerderung Metodo mejorado para la modulacion de señales en la reconstruccion de audio multicanal.
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
EP2575129A1 (en) * 2006-09-29 2013-04-03 Electronics and Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
MY145497A (en) * 2006-10-16 2012-02-29 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
CN102037507B (zh) * 2008-05-23 2013-02-06 皇家飞利浦电子股份有限公司 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器
US8472655B2 (en) * 2008-06-25 2013-06-25 Koninklijke Philips Electronics N.V. Audio processing
US8155714B2 (en) 2008-06-28 2012-04-10 Microsoft Corporation Portable media player having a flip form factor
KR101392546B1 (ko) * 2008-09-11 2014-05-08 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 마이크로폰 신호를 기반으로 공간 큐의 세트를 제공하는 장치, 방법 및 컴퓨터 프로그램과, 2채널 오디오 신호 및 공간 큐의 세트를 제공하는 장치
US8023660B2 (en) * 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
IL195613A0 (en) 2008-11-30 2009-09-01 S P F Productions Ltd Compact gear motor assembly
WO2010092568A1 (en) * 2009-02-09 2010-08-19 Waves Audio Ltd. Multiple microphone based directional sound filter
WO2010092913A1 (ja) * 2009-02-13 2010-08-19 日本電気株式会社 多チャンネル音響信号処理方法、そのシステム及びプログラム
EP2249334A1 (en) 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder

Also Published As

Publication number Publication date
US20130216047A1 (en) 2013-08-22
CA2790956A1 (en) 2011-09-01
KR101410575B1 (ko) 2014-06-23
KR20120128143A (ko) 2012-11-26
JP2013520691A (ja) 2013-06-06
MX2012009785A (es) 2012-11-23
RU2012140890A (ru) 2014-08-20
RU2586851C2 (ru) 2016-06-10
CN102859590B (zh) 2015-08-19
AU2011219918A1 (en) 2012-09-27
US9357305B2 (en) 2016-05-31
EP2539889B1 (en) 2016-08-24
BR112012021369B1 (pt) 2021-11-16
BR112012021369A2 (pt) 2020-10-27
CN103811010A (zh) 2014-05-21
JP5508550B2 (ja) 2014-06-04
WO2011104146A1 (en) 2011-09-01
AU2011219918B2 (en) 2013-11-28
CA2790956C (en) 2017-01-17
CN103811010B (zh) 2017-04-12
CN102859590A (zh) 2013-01-02
EP2539889A1 (en) 2013-01-02

Similar Documents

Publication Publication Date Title
ES2605248T3 (es) Aparato para generar señal de mezcla descendente mejorada, método para generar señal de mezcla descendente mejorada y programa de ordenador
ES2901109T3 (es) Codificador de audio para la codificación de una señal de múltiples canales y un decodificador de audio para la decodificación de una señal de audio codificada
ES2733878T3 (es) Codificación mejorada de señales de audio digitales multicanales
RU2493617C2 (ru) Устройство, способ и компьютерная программа для обеспечения набора пространственных указателей на основе сигнала микрофона и устройство для обеспечения двухканального аудиосигнала и набора пространственных указателей
US8023660B2 (en) Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
ES2644520T3 (es) Decodificador de señal de audio MPEG-SAOC, método para proporcionar una representación de señal de mezcla ascendente usando decodificación MPEG-SAOC y programa informático usando un valor de parámetro de correlación inter-objeto común dependiente del tiempo/frecuencia
ES2461601T3 (es) Procedimiento y aparato para generar una señal de audio binaural
ES2555579T3 (es) Codificador de audio multicanal y método para codificar una señal de audio multicanal
ES2925038T3 (es) Decorrelacionador multicanal, procedimiento y programa informático que utilizan una premezcla de señales de entrada del decorrelacionador
ES2649739T3 (es) Procedimiento y descodificador para un concepto paramétrico de codificación de objetos de audio espacial generalizado para casos de mezcla descendente/mezcla ascendente de multicanal
ES2709117T3 (es) Codificador y decodificador de audio
ES2654792T3 (es) Procedimiento y decodificador para codificación de objeto de audio espacial de multi-instancias que emplea un concepto paramétrico para casos de mezcla descendente/mezcla ascendente de multicanal
ES2595220T3 (es) Aparato y métodos para adaptar información de audio a codificación de objeto de audio espacial
ES2783975T3 (es) Codificación multicanal
ES2856423T3 (es) Decodificador de señal de audio MPEG-SAOC, codificador de señal de audio MPEG-SAOC, procedimiento para proporcionar una representación de señal de mezcla ascendente usando decodificación MPEG-SAOC, procedimiento para proporcionar una representación de señal de mezcla descendente usando decodificación MPEG-SAOC, y programa informático que usa un valor de parámetro de correlación inter-objeto común dependiente del tiempo/frecuencia