ES2496571T3 - Método y aparato para procesar una señal de medios - Google Patents

Método y aparato para procesar una señal de medios Download PDF

Info

Publication number
ES2496571T3
ES2496571T3 ES07708529.8T ES07708529T ES2496571T3 ES 2496571 T3 ES2496571 T3 ES 2496571T3 ES 07708529 T ES07708529 T ES 07708529T ES 2496571 T3 ES2496571 T3 ES 2496571T3
Authority
ES
Spain
Prior art keywords
information
rendering
signal
rendering information
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES07708529.8T
Other languages
English (en)
Inventor
Hyen O Oh
Hee Suck Pang
Dong Soo Kim
Jae Hyun Lim
Yang Won Jung
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Application granted granted Critical
Publication of ES2496571T3 publication Critical patent/ES2496571T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Stereophonic System (AREA)
  • Image Generation (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Television Systems (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Método de procesamiento de una señal de audio, que comprende las etapas siguientes: extraer información espacial a partir de un tren de bits; generar información de mapeado de fuentes mediante la utilización de la información espacial para fuentes múltiples; generar por lo menos una información de renderización mediante la utilización de información de mapeado de fuentes e información de filtro para un efecto de sonido envolvente; suavizar dicha por lo menos una información de renderización mediante la utilización de información de renderización adyacente a dicha por lo menos una información de renderización; y generar una señal de sonido envolvente que presenta el efecto de sonido envolvente aplicando dicha por lo menos una información de renderización suavizada a una señal de submezcla, siendo generada la señal de submezcla mediante la submezcla de las fuentes múltiples, en el que la señal de submezcla incluye un canal de entrada izquierdo y un canal de entrada derecho, y la señal de sonido envolvente generada incluye un canal de salida izquierdo y un canal de salida derecho, y la información de renderización comprende una primera información de renderización y una segunda información de renderización, estando la primera información de renderización destinada a generar el canal de salida izquierdo mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida derecho mediante su aplicación al canal de entrada derecho y estando la segunda información de renderización destinada a generar el canal de salida derecho mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida izquierdo mediante su aplicación al canal de entrada derecho.

Description

E07708529
27-08-2014
DESCRIPCIÓN
Método y aparato para procesar una señal de medios.
5 Campo técnico
La presente invención se refiere a un aparato para procesar una señal de medios y un método del mismo y, más particularmente, a un aparato para generar una señal de sonido envolvente mediante información espacial de la señal de medios y un método del mismo.
10
Antecedentes de la técnica
En general, diversos tipos de aparatos y métodos han tenido un amplio uso en la generación de una señal de medios multicanal mediante información espacial para la señal de medios multicanal y una señal de submezcla, en
15 la que la señal de submezcla se genera realizando la submezcla de la señal de medios multicanal para obtener una señal mono o estéreo.
Sin embargo, los métodos y aparatos anteriores no pueden utilizarse en entornos inadecuados para generar una señal multicanal. Por ejemplo, no pueden utilizarse para un dispositivo capaz de generar solo una señal estéreo. En
20 otras palabras, no existe ningún método ni aparato para generar una señal de sonido envolvente, en los que la señal de sonido envolvente presente características multicanal en un entorno incapaz de generar una señal multicanal mediante información espacial de la señal multicanal.
En consecuencia, dado que no existe ningún método ni aparato para generar una señal de sonido envolvente en un 25 dispositivo capaz de generar solo una señal mono o estéreo, es difícil procesar la señal de medios con eficacia.
El documento New use cases for spatial audio coding (Jakka, Julia et al., ISO/IEC JTC 1/SC 28/WG 11/M12913, 11 de enero de 2006, XP030041582) da a conocer un códec de audio espacial que admite la generación eficaz de salidas de audio binaural. En primer lugar, se realiza la transformación al dominio QMF de la señal de entrada que
30 consiste en uno o dos canales de audio sometidos a submezcla y, a continuación, se aplican los parámetros espaciales para reconstruir el audio multicanal que se transforma a su vez al dominio del tiempo mediante síntesis QMF.
Exposición de la invención
35 Problema técnico
En consecuencia, la presente invención va dirigida a un aparato para procesar una señal de audio y un método del mismo que evitan sustancialmente uno o más de los problemas debidos a las limitaciones y desventajas de la
40 técnica relacionada.
Uno de los objetivos de la presente invención es ofrecer un aparato para procesar una señal de medios y un método del mismo, por medio de los cuales la señal de medios puede convertirse en una señal de sonido envolvente mediante información espacial para la señal de medios.
45 En la descripción siguiente, se exponen características y ventajas adicionales de la presente invención, que en parte resultarán evidentes a partir de la presente descripción o se podrán deducir mediante la puesta en práctica de la presente invención. Los objetivos y otras ventajas de la presente invención se llevarán a cabo y alcanzarán mediante la estructura especialmente señalada en la descripción y las reivindicaciones, así como los dibujos adjuntos, del
50 presente documento.
Solución técnica
Para lograr estas y otras ventajas y de conformidad con el propósito de la presente invención, se definen un método 55 y un aparato en las reivindicaciones adjuntas.
Debe tenerse en cuenta que tanto la descripción general anterior como la descripción detallada siguiente son ejemplificativas e ilustrativas y tienen por objeto ofrecer más detalles de la invención reivindicada.
60 Efectos ventajosos
Un aparato y un método de procesamiento de señales según la presente invención permiten que un decodificador, que recibe un tren de bits que comprende una señal de submezcla generada realizando la submezcla de una señal multicanal e información espacial de la señal multicanal, para generar una señal que presenta un efecto de sonido
65 envolvente en entornos incapaces de recuperar la señal multicanal.
15
25
35
45
55
65 E07708529
27-08-2014
Breve descripción de los dibujos
Los dibujos adjuntos, que se facilitan para permitir una mayor comprensión de la presente invención y que se integran en la presente memoria y forman parte de esta, ilustran formas de realización de la presente invención y, junto con la descripción, sirven para explicar los principios de la presente invención.
En los dibujos:
la figura 1 es un diagrama de bloques de un aparato de codificación de señales de audio y un aparato de decodificación de señales de audio según una forma de realización de la presente invención;
la figura 2 es un diagrama estructural de un tren de bits de una señal de audio según una forma de realización de la presente invención;
la figura 3 es un diagrama de bloques detallado de una unidad de conversión de información espacial según una forma de realización de la presente invención;
las figuras 4 y 5 son diagramas de bloque de las configuraciones de canales utilizadas para el método de mapeado de fuentes según una forma de realización de la presente invención;
las figuras 6 y 7 son diagramas de bloque detallados de una unidad de renderización para una señal de submezcla estéreo según una forma de realización de la presente invención;
la figuras 8 y la figura 9 son diagramas de bloques detallados de una unidad de renderización para una señal de submezcla mono según una forma de realización de la presente invención;
las figuras 10 y 11 son diagramas de bloque de una unidad de suavizado y una unidad de expansión según una forma de realización de la presente invención;
la figura 12 es un gráfico para describir un primer método de suavizado según una forma de realización de la presente invención;
la figura 13 es un gráfico para describir un segundo método de suavizado según una forma de realización de la presente invención;
la figura 14 es un gráfico para describir un tercer método de suavizado según una forma de realización de la presente invención;
la figura 15 es un gráfico para describir un cuarto método de suavizado según una forma de realización de la presente invención;
la figura 16 es un gráfico para describir un quinto método de suavizado según una forma de realización de la presente invención;
la figura 17 es un diagrama para describir la información de filtro prototipo correspondiente a cada canal;
la figura 18 es un diagrama de bloques para un primer método de generación de información de filtro de renderización en una unidad de conversión de información espacial según una forma de realización de la presente invención;
la figura 19 es un diagrama de bloques para un segundo método de generación de información de filtro de renderización en una unidad de conversión de información espacial según una forma de realización de la presente invención;
la figura 20 es un diagrama de bloques para un tercer método de generación de información de filtro de renderización en una unidad de conversión de información espacial según una forma de realización de la presente invención;
la figura 21 es un diagrama para describir un método de generación de una señal de sonido envolvente en una unidad de renderización según una forma de realización de la presente invención;
la figura 22 es un diagrama para un primer método de interpolación según una forma de realización de la presente invención;
la figura 23 es un diagrama para un segundo método de interpolación según una forma de realización de la presente invención;
15
25
35
45
55
65 E07708529
27-08-2014
la figura 24 es un diagrama para un método de conmutación de bloques según una forma de realización de la presente invención;
la figura 25 es un diagrama de bloques para una posición a la cual se aplica una longitud de ventana elegida por una unidad de elección de longitud de ventana según una forma de realización de la presente invención;
la figura 26 es un diagrama para unos filtros de diversas longitudes utilizados en el procesamiento de una señal de audio según una forma de realización de la presente invención;
La figura 27 es un diagrama para un método de procesamiento dividido de una señal de audio mediante una pluralidad de subfiltros según una forma de realización de la presente invención;
la figura 28 es un diagrama de bloques para un método de renderización de información de renderización de partición generada por una pluralidad de subfiltros para una señal de submezcla mono según una forma de realización de la presente invención;
la figura 29 es un diagrama de bloques para un método de renderización de información de renderización de partición generada por una pluralidad de subfiltros para una señal de submezcla estéreo según una forma de realización de la presente invención;
la figura 30 es un diagrama de bloques para un primer método de conversión de dominio de una señal de submezcla según una forma de realización de la presente invención y
la figura 31 es un diagrama de bloques para un segundo método de conversión de dominio de una señal de submezcla según una forma de realización de la presente invención.
Mejor modo de poner en práctica la invención
A continuación, se hará referencia detallada a las formas de realización preferidas de la presente invención, ejemplos de las cuales se ilustran en los dibujos adjuntos.
La figura 1 es un diagrama de bloques de un aparato de codificación de señales de audio y un aparato de decodificación de señales de audio según una forma de realización de la presente invención.
Con referencia a la figura 1, un aparato de codificación 10 comprende una unidad de submezcla 100, una unidad de generación de información espacial 200, una unidad de codificación de señales de submezcla 300, una unidad de codificación de información espacial 400 y una unidad de multiplexación 500.
Si se suministra una señal de audio de fuentes múltiples (X1, X2,..., Xn) a la unidad de submezcla 100, la unidad de submezcla 100 realiza la submezcla de la señal suministrada hasta convertirla en una señal de submezcla. En este caso, la señal de submezcla comprende una señal de audio mono, estéreo y de fuentes múltiples.
La fuente comprende un canal y, por conveniencia, se representa como un canal en la descripción siguiente. En la presente memoria, la señal de submezcla mono o estéreo se denomina señal de referencia. Sin embargo, la presente invención no se limita a la señal de submezcla mono ni estéreo.
El aparato de codificación 10 es capaz de utilizar opcionalmente una señal de submezcla arbitraria facilitada directamente desde un entorno externo.
La unidad de generación de información espacial 200 genera información espacial a partir de una señal de audio multicanal. La información espacial puede generarse en el transcurso de un método de submezcla. La unidad de codificación de señales de submezcla 300 y la unidad de codificación de información espacial 400, respectivamente, codifican la señal de submezcla generada y la información espacial y, a continuación, las transfieren a la unidad de multiplexación 500.
En la presente invención, "información espacial" se refiere a la información necesaria para que un aparato de decodificación genere una señal multicanal sometiendo la señal de submezcla a aumento de mezcla, generando el aparato de codificación la señal de submezcla realizando la submezcla de la señal multicanal y transfiriéndola al aparato de decodificación. La información espacial comprende parámetros espaciales. Los parámetros espaciales comprenden la CLD (diferencia de nivel de los canales) que indica una diferencia de energía entre los canales, las ICC (coherencias intercanal) que indican un mapeado entre los canales, los CPC (coeficientes de predicción de canales) utilizados en la generación de tres canales a partir de dos canales, etc.
En la presente invención, "unidad de codificación de señales de submezcla" o "unidad de decodificación de señales de submezcla" se refieren a un códec que codifica o decodifica una señal de audio en lugar de información espacial.
10
15
20
25
30
35
40
45
50
55
60
65 E07708529
27-08-2014
En la presente memoria, se toma como ejemplo de señal de audio una señal de audio de submezcla en lugar de la información espacial. La unidad de codificación o decodificación de señales de submezcla puede comprender una unidad de MP3, AC-3, DTS o AAC. Por otra parte, la unidad de codificación o de decodificación de señales de submezcla puede comprender un códec del futuro, así como el códec de diseño anterior.
La unidad de multiplexación 500 genera un tren de bits multiplexando la señal de submezcla y la información espacial y, a continuación, transfiere el tren de bits generado al aparato de decodificación 20. La estructura del tren de datos se describirá en relación con la figura 2 más adelante.
Un aparato de decodificación 20 comprende una unidad de demultiplexación 600, una unidad de decodificación de señales de submezcla 700, una unidad de decodificación de información espacial 800, una unidad de renderización 900 y una unidad de conversión de información espacial 1000.
La unidad de demultiplexación 600 recibe un tren de bits y, a continuación, separa una señal de submezcla codificada y una información espacial codificada del tren de bits. Subsiguientemente, la unidad de decodificación de señales de submezcla 700 decodifica la señal de submezcla codificada, y la unidad de decodificación de información espacial 800 decodifica la información espacial codificada.
La unidad de conversión de información espacial 1000 genera información de renderización aplicable a una señal de submezcla mediante la información espacial decodificada e información de filtro. En este caso, la información de renderización se aplica a la señal de submezcla para generar una señal de sonido envolvente.
Por ejemplo, la señal de sonido envolvente se genera de la manera siguiente. En primer lugar, un método para generar una señal de submezcla a partir de una señal de audio multicanal llevado a cabo por el aparato de codificación 10 puede comprender varias etapas en las que se utiliza una caja OTT (uno a dos) o TTT (tres a tres). En este caso, puede generarse información espacial en cada una de las etapas. La información espacial se transfiere al aparato de decodificación 20. El aparato de decodificación 20 genera entonces una señal de sonido envolvente convirtiendo la información espacial y, a continuación, reproduciendo la información espacial convertida con una señal de submezcla. En lugar de generar una señal multicanal mediante el aumento de mezcla de una señal de submezcla, la presente invención se refiere a un método de renderización que comprende las etapas de extracción de información espacial para cada etapa de aumento de mezcla y de renderización mediante la información espacial extraída. Por ejemplo, el filtrado HRTF (head-related transfer functions) puede utilizarse en el método de renderización.
En este caso, la información espacial es un valor aplicable a un dominio híbrido también. Por lo tanto, la renderización puede clasificarse en los tipos siguientes dependiendo de los dominios.
En el primer tipo la renderización se ejecuta en un dominio híbrido haciendo pasar una señal de submezcla a través de un banco de filtros híbrido. En este caso, la conversión del dominio para la información espacial es innecesaria.
En el segundo tipo la renderización se ejecuta en el dominio del tiempo. En este caso, el segundo tipo aprovecha la modelización del filtro HRTF como filtro FIR (de respuesta finita inversa) o filtro IIR (de respuesta infinita inversa) en el dominio del tiempo. En consecuencia, es necesario un método para convertir información espacial en un coeficiente de filtro del dominio del tiempo.
En el tercer tipo la renderización se ejecuta en un dominio de frecuencia diferente. Por ejemplo, la renderización se ejecuta en el dominio de la DFT (transformada discreta de Fourier). En este caso, es necesario un método para transformar información espacial en un dominio correspondiente. En particular, el tercer tipo permite un funcionamiento rápido mediante la sustitución del filtrado en el dominio del tiempo por una operación en el dominio de la frecuencia.
En la presente invención, la información de filtro es la información necesaria para que un filtro procese una señal de audio y comprende un coeficiente de filtro facilitado a un filtro específico. A continuación se describen ejemplos de información de filtro. En primer lugar, la información de filtro prototipo es información de filtro original de un filtro específico y puede representarse como GL_L o de una forma similar. La información de filtro convertida indica un coeficiente de filtro una vez que la información de filtro prototipo se ha convertido y puede representarse como GL_L
o de una forma similar. La información de subrenderización se refiere a la información de filtro resultante de la espacialización de la información de filtro prototipo para generar una señal de sonido envolvente y puede representarse como FL_L1 o de una forma similar. La información de renderización se refiere a la información de filtro necesaria para ejecutar la renderización y puede representarse como HL_L o de una forma similar. La información de renderización interpolada/suavizada se refiere a la información de filtro resultante de la interpolación/suavizado de la información de renderización y puede representarse como HL_L o de una forma similar. En la presente memoria se hace referencia a las informaciones de filtro anteriores. Sin embargo, la presente invención no está restringida por los nombres de las informaciones de filtro. En particular, las funciones HRTF se toman como ejemplo de información de filtro. Sin embargo, la presente invención no se limita a las funciones HRTF.
15
25
35
45
55
65 E07708529
27-08-2014
La unidad de renderización 900 recibe la señal de submezcla decodificada y la información de renderización y, entonces, genera una señal de sonido envolvente mediante la señal de submezcla decodificada y la información de renderización. La señal de sonido envolvente puede ser la señal para facilitar un efecto envolvente a un sistema de audio capaz de generar solo una señal estéreo. Además, la presente invención puede aplicarse a diversos sistemas, así como al sistema de audio capaz de generar solo la señal estéreo.
La figura 2 es un diagrama estructural para un tren de bits de una señal de audio según una forma de realización de la presente invención, en la que el tren de bits comprende una señal de submezcla codificada e información espacial codificada.
Con referencia a la figura 2, una carga útil de audio de 1 trama comprende un campo de señal de submezcla y un campo de datos auxiliares. La información espacial codificada puede almacenarse en el campo de datos auxiliares. Por ejemplo, si una carga útil de audio es de 48~128 kb/s, la información espacial puede presentar un rango de 5~32 kb/s. Sin embargo, los rangos de la carga útil de audio y la información espacial no están sujetos a ninguna limitación.
La figura 3 es un diagrama de bloques detallado de una unidad de conversión de información espacial según una forma de realización de la presente invención.
Con referencia a la figura 3, una unidad de conversión de información espacial 1000 comprende una unidad de mapeado de fuentes 1010, una unidad de generación de información de subrenderización 1020, una unidad de integración 1030, una unidad de procesamiento 1040 y una unidad de conversión de dominio 1050.
La unidad de mapeado de fuentes 101 genera información de mapeado de fuentes correspondiente a cada fuente de una señal de audio ejecutando el mapeado de fuentes mediante información espacial. En este caso, la información de mapeado de fuentes se refiere a información de cada fuente generada para corresponderse con cada fuente de una señal de audio mediante información espacial y similares. La fuente comprende un canal y, en este caso, se genera la información de mapeado de fuente correspondiente a cada canal. La información de mapeado de fuentes puede representarse como un coeficiente. El método de mapeado de fuentes se describirá en detalle más adelante con referencia a la figura 4 y la figura 5.
La unidad de generación de información de subrenderización 1020 genera información de subrenderización correspondiente a cada fuente mediante la información de mapeado de fuentes y la información de filtro. Por ejemplo, si la unidad de renderización 900 es el filtro HRTF, la unidad de generación de información de subrenderización 1020 es capaz de generar información de subrenderización mediante información de filtro HRTF.
La unidad de integración 1030 genera información de renderización integrando la información de subpresentación para que se corresponda con cada fuente de una señal de submezcla. La información de renderización, que se genera mediante la información espacial y la información de filtro, se refiere a la información para generar una señal de sonido envolvente mediante su aplicación a la señal de submezcla. La información de renderización comprende un tipo de coeficiente de filtro. La integración puede omitirse para reducir la cantidad de operaciones del método de renderización. Subsiguientemente, la información de renderización se transfiere a la unidad de procesamiento 1042.
La unidad de procesamiento 1042 comprende una unidad de interpolación 1041 y/o una unidad de suavizado 1042. La información de renderización es interpolada por la unidad de interpolación 1041 y/o suavizada por la unidad de suavizado 1042.
La unidad de conversión de dominio 1050 convierte el dominio de la información de renderización al dominio de la señal de submezcla utilizada por la unidad de renderización 900. La unidad de conversión de dominio 1050 puede disponerse en una de diversas posiciones posibles que comprenden la posición representada en la figura 3. Por consiguiente, si la información de renderización se genera en el mismo dominio que la unidad de renderización 900, puede omitirse la unidad de conversión de dominio 1050. La información de renderización de dominio convertido se transfiere entonces a la unidad de renderización 900.
La unidad de conversión de información espacial 1000 puede comprender una unidad de conversión de información de filtro 1060. En la figura 3 la unidad de conversión de información de filtro 1060 está dispuesta dentro de la unidad de conversión de información espacial 100. Como alternativa, la unidad de conversión de información de filtro 1060 puede estar dispuesta fuera de la unidad de conversión de información espacial 100. La unidad de conversión de información de filtro 1060 se convierte con el objeto de adecuarla a la generación de información de subrenderización o información de renderización a partir de información de filtro aleatoria, por ejemplo, HRTF. El método de conversión de la información de filtro puede comprender las etapas siguientes.
En primer lugar, se incluye una etapa de adaptación de dominio para permitir su aplicación. Si el dominio de la información de filtro no coincide con el dominio para la ejecución de la renderización, es necesaria la etapa de adaptación de dominio. Por ejemplo, se necesita una etapa de conversión de información HRTF del dominio del tiempo al dominio DFT, QMF o un dominio híbrido para generar la información de renderización.
10
15
20
25
30
35
40
45
50
55
60 E07708529
27-08-2014
En segundo lugar, puede incluirse una etapa de reducción de coeficientes. En este caso, es fácil guardar la información HRTF de dominio convertido y aplicar la información HRTF de dominio convertido a la información espacial. Por ejemplo, si un coeficiente de filtro prototipo tiene una respuesta de número de muestras (longitud) elevado, será necesario almacenar en la memoria un correspondiente coeficiente que corresponde a una respuesta que equivale a una correspondiente longitud total de 10 en el caso de los canales 5.1. Esto incrementa la carga de la memoria y la cantidad de operaciones. Para prevenir este problema, puede utilizarse un método para reducir el coeficiente de filtro que se va a almacenar, mientras se mantienen las características de filtro en el método de conversión de dominio. Por ejemplo, la respuesta HRTF puede convertirse en varios valores de parámetros. En este caso, un método de generación de un parámetro y un valor de parámetro pueden diferir de conformidad con un dominio aplicado.
La señal de submezcla pasa a través de una unidad de conversión de dominio 1110 y/o una unidad de demapeado 1200 antes de reproducirse con la información de renderización. En caso de que el dominio de la información de renderización sea diferente del de la señal de submezcla, la unidad de conversión de dominio 1110 convierte el dominio de la señal de submezcla a fin de hacer corresponder los dos dominios.
La unidad de demapeado 1200 se aplica a la señal de submezcla de dominio convertido. Esto puede conllevar una cantidad de operaciones relativamente superior a la de un método de aplicación de un demapeador a la información de renderización. Sin embargo, permite evitar que se produzcan distorsiones en el método de generación de información de renderización. La unidad de demapeado 1200 puede comprender una pluralidad de demapeadores que difieren entre sí en características si la cantidad de operaciones es admisible. Si la señal de submezcla es una señal estéreo, la unidad de demapeado 1200 puede no utilizarse. En la figura 3, en caso de que en el método de renderización se utilice una señal de submezcla mono de dominio convertido, es decir, una señal de submezcla mono en un domino de frecuencia, híbrido, QMF o DFT, se utilizará un demapeador en el correspondiente dominio. La presente invención comprende un demapeador utilizado en el dominio del tiempo también. En este caso, una señal de submezcla mono anterior a la unidad de conversión de dominio 1100 se suministra directamente a la unidad de demapeado 1200. Como demapeador puede utilizarse un filtro IIR (o un filtro FIR) de primer orden o de orden superior.
Subsiguientemente, la unidad de renderización 900 genera una señal de sonido envolvente mediante la señal de submezcla, la señal de submezcla demapeada y la información de renderización. Si la señal de submezcla es una señal estéreo, no es necesario utilizar la señal de submezcla demapeada. Se facilitarán detalles del método de renderización más adelante, con referencia a las figuras 6 a 9.
Una unidad de conversión de dominio inversa 1300 convierte la señal de sonido envolvente al dominio del tiempo y, a continuación, la transmite. En tal caso, el usuario puede oír un sonido que tiene un efecto multicanal a través de auriculares estereofónicos o similares.
Las figuras 4 y 5 son diagramas de bloques de las configuraciones de canales utilizadas para el método de mapeado de fuentes según una forma de realización de la presente invención. Un método de mapeado de fuentes es un método para generar información de mapeado de fuente correspondiente a cada fuente de una señal de audio mediante información espacial. Como se ha mencionado en la descripción anterior, la fuente comprende un canal, y la información de mapeado de fuentes puede generarse de tal forma que se corresponda con los canales representados en la figura 4 y la figura 5. La información de mapeado de fuentes que se genera es de un tipo adecuado para un método de renderización.
Por ejemplo, si una señal de submezcla es una señal mono, puede generarse información de mapeado de fuentes mediante información espacial, tal como CLD1~CLD5, ICC1~ICC5 y similares.
La información de mapeado de fuentes puede representarse como un valor tal como D_L (=DL), D_R (=DR), D_C (=DC), D_LFE (DLFE), D_Ls (=DLs), D_Rs (=DRs) y similares. En este caso, el método para generar la información de mapeado de fuentes es variable de conformidad con una estructura en árbol correspondiente a la información espacial, el rango de información espacial que se va a utilizar y similares. En la presente memoria, la señal de submezcla es una señal mono, por ejemplo, que no impone ningún límite a la presente invención.
Las salidas del canal derecho e izquierdo obtenidas de la unidad de renderización 900 pueden expresarse como la figura matemática 1.
Figura matemática 1
imagen1
E07708529
27-08-2014
En este caso, el operador "*" indica un producto en un dominio DFT y puede sustituirse por una convolución en el dominio QMF o del tiempo.
La presente invención comprende un método de generación de los valores L, C, R, Ls y Rs sometiendo la
5 información a mapeado de fuentes mediante información espacial o sometiendo la información a mapeado de fuentes mediante información espacial e información de filtro. Por ejemplo, puede generarse información de mapeado de fuentes mediante la CLD de la información espacial solo o la CLD y la ICC de la información espacial. A continuación se describe el método de generación de información de mapeado de fuentes mediante la CLD solo.
10 En caso de que la estructura en árbol presente la estructura representada en la figura 4, un primer método de obtención de información de mapeado de fuentes mediante la CLD solo puede expresarse como la figura matemática 2.
Figura matemática 2 15
imagen2
En este caso:
imagen3
imagen4
y "m" indica una señal de submezcla mono.
25 En caso de que la estructura en árbol presente la estructura representada en la figura 5, un segundo método de obtención de información de mapeado de fuentes mediante la CLD solo puede expresarse como la figura matemática 3.
Figura matemática 3 30
imagen5
E07708529
27-08-2014
Si se genera información de mapeado de fuentes mediante la CLD solo, puede reducirse el efecto tridimensional. Por lo tanto, será posible generar información de mapeado de fuentes mediante la ICC y/o el demapeador. Una señal multicanal generada mediante el uso de una señal de salida de demapeador dx(m) puede expresarse como la figura matemática 4.
Figura matemática 4
imagen6
10 En este caso, "A", "B" y "C" son valores que pueden representarse mediante la CLD y la ICC. Los valores "d0" a "d3" indican demapeadores. El valor "m" indica una señal de submezcla mono. Sin embargo, este método es incapaz de generar información de mapeado de fuentes, tal como D_L, D_R y similares.
15 Por consiguiente, el primer método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los demapeadores para la señal de submezcla contempla dx(m) (x=0, 1, 2) como una entrada independiente. En este caso, el valor "dx" puede utilizarse en un método para generar información de filtro de subrenderización de conformidad con la figura matemática 5.
imagen7
La información de renderización puede generarse de conformidad con la figura matemática 6 mediante el resultado de la figura matemática 5.
imagen8
Más adelante se ofrecen detalles del método de generación de información de renderización. El primer método de generación de la información de mapeado de fuentes mediante la CLD, la ICC y/o los demapeadores procesa un valor de salida dx, es decir, "dx(m)" como una entrada independiente, lo cual puede incrementar la cantidad de
30 operaciones.
Un segundo método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los demapeadores emplea demapeadores aplicados al dominio de la frecuencia. En este caso, la información de mapeado de fuentes puede expresarse como la figura matemática 7.
35
E07708529
27-08-2014
imagen9
En este caso, aplicando los demapeadores al dominio de la frecuencia, puede generarse la misma información de mapeado de fuentes, tal como D_L, D_R y similares antes de la aplicación de los demapeadores. Por consiguiente, 5 la implementación puede realizarse de una manera sencilla.
Un tercer método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los demapeadores emplea demapeadores que presentan la característica "pasa todo" de los demapeadores del segundo método. En este caso, la característica pasa todo se refiere a que el tamaño es fijo y solo se produce
10 variación de la fase. La presente invención puede utilizar demapeadores que presentan la característica pasa todo de los demapeadores del primer método.
Un cuarto método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los demapeadores lleva a cabo la demapeado mediante demapeadores para los respectivos canales (por ej., L, R, C, 15 Ls, Rs, etc.) en lugar de utilizar los demapeadores "d0" a "d3" del segundo método. En este caso, la información de mapeado de fuentes puede expresarse como la figura matemática 8.
imagen10
20 En este caso, "k" es un valor de energía de una señal demapeada determinada a partir de valores de CLD e ICC. Los valores "d_L", "d_R", "d_C", "d_Ls" y "d_Rs" indican demapeadores aplicados a los respectivos canales.
Un quinto método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los demapeadores aumenta al máximo el efecto de demapeado configurando los demapeadores "d_L" y "d_R" para que
25 sean simétricos en el cuarto método y configurando los demapeadores "d_Ls" y "d_Rs" para que sean simétricos en el cuarto método. En particular, suponiendo que d_R=f(d_L) y d_Rs=f(d_Ls), es necesario diseñar los demapeadores "d_L", "d_C" y "d_Ls" solamente.
Un sexto método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los
30 demapeadores consiste en configurar los demapeadores "d_L" y "d_Ls" para que presenten un mapeado en el quinto método. Los demapeadores "d_L" y "d_C" pueden configurarse de tal forma que presenten un mapeado también.
Un séptimo método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los
E07708529
27-08-2014
demapeadores consiste en utilizar los demapeadores en el tercer método como una estructura en serie o anidada de los filtros pasa todo. El séptimo método aprovecha el hecho de que la característica pasa todo se mantiene aun cuando el filtro pasa todo se utilice como una estructura en serie o anidada. En caso de que el filtro pasa todo se utilice como la estructura en serie o anidada, será posible obtener una mayor diversidad de tipos de respuestas de
5 fase. En consecuencia, el efecto de demapeado puede aumentar al máximo.
Un octavo método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los demapeadores consiste en utilizar conjuntamente el demapeador de técnica relacionada y el demapeador del dominio de la frecuencia del segundo método. En este caso, una señal multicanal puede expresarse como la figura
10 matemática 9.
imagen11
En este caso, un método de generación de coeficientes de filtro utiliza el mismo método descrito en el primer método, excepto porque "A" se cambia por "A+Kd".
15 Un noveno método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los demapeadores consiste en generar un valor sometido a demapeado adicional aplicando un demapeador del dominio de la frecuencia a una salida del demapeador de técnica relacionada en caso de que se utilice el demapeador de técnica relacionada. Por lo tanto, es posible generar información de mapeado de fuentes con una pequeña cantidad
20 de operaciones salvando la limitación del demapeador del dominio de la frecuencia.
Un décimo método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los demapeadores se expresa como la figura matemática 10.
En este caso, "di_(m)" (i = L, R, C, Ls, Rs) es un valor de salida de demapeador aplicado a un canal i. El valor de salida puede procesarse en el dominio del tiempo, el dominio de la frecuencia, el dominio QMF, un dominio híbrido o similares. Si el valor de salida se procesa en un dominio que difiere del dominio procesado actualmente, este puede
30 convertirse mediante conversión de dominio. Es posible utilizar el mismo valor "d" para los demapeadores d_L, d_R, d_C, d_Ls y d_Rs. En este caso, la figura matemática 10 puede expresarse de una manera muy sencilla.
Si la figura matemática 10 se aplica a la figura matemática 1, la figura matemática 1 puede expresarse como la figura matemática 11.
35
imagen12
imagen13
E07708529
27-08-2014
En este caso, la información de renderización HM_L es un valor resultante de combinar información espacial e información de filtro para generar una señal de sonido envolvente Lo con una entrada m. La información de renderización HM_R es un valor resultante de combinar información espacial e información de filtro para generar una 5 señal de sonido envolvente Ro con una entrada m. Por otra parte, "d(m)" es un valor de salida de demapeador generado transfiriendo un valor de salida de demapeador de un dominio arbitrario a un valor de dominio actual, o un valor de salida de demapeador generado mediante procesamiento en el dominio actual. La Información de renderización HMD_L es un valor que indica en qué medida se ha añadido el valor de salida del demapeador d(m) a la señal "Lo" al representar el valor d(m), y también un valor resultante de combinar información espacial e
10 información de filtro. La Información de renderización HMD_R es un valor que indica en qué medida se ha añadido el valor de salida del demapeador d(m) a la señal "Ro" al representar el valor d(m).
Por lo tanto, a fin de aplicar un método de renderización a una señal de submezcla mono, la presente invención propone un método de generación de una señal de sonido envolvente mediante la renderización de la información
15 de renderización generada combinando información espacial e información de filtro (por ejemplo, el coeficiente de filtro HRTF) para una señal de submezcla y una señal de submezcla demapeada. El método de renderización puede ejecutarse independientemente de los dominios. Si "d(m)" se expresa como "d*m" (operador de producto) ejecutado en el dominio de la frecuencia, la figura matemática 11 puede expresarse como la figura matemática 12.
imagen14
Por lo tanto, en caso de aplicar un método de renderización a una señal de submezcla en el dominio de la frecuencia, es posible reducir al mínimo la cantidad de operaciones en la manera de representar un valor resultante de combinar correctamente información espacial, información de filtro y los demapeadores como un producto.
25 Las figuras 6 y 7 son diagramas de bloques detallados de una unidad de renderización para una señal de submezcla estéreo según una forma de realización de la presente invención.
Con referencia a la figura 6, la unidad de renderización 900 comprende una unidad de renderización A 910 y una 30 unidad de renderización B 920.
Si una señal de submezcla es una señal estéreo, la unidad de conversión de información espacial 1000 genera información de renderización para los canales izquierdo y derecho de la señal de submezcla. La unidad de renderización A 910 genera una señal de sonido envolvente reproduciendo la información de renderización para el
35 canal izquierdo de la señal de submezcla para el canal izquierdo de la señal de submezcla. La unidad de renderización B 920 genera una señal de sonido envolvente representando la información de renderización para el canal derecho de la señal de submezcla para el canal derecho de la señal de submezcla. Los nombres de los canales constituyen solo ejemplos y no imponen ninguna limitación a la presente invención.
40 La información de renderización puede comprender información de renderización facilitada a un mismo canal e información de renderización facilitada a otro canal.
Por ejemplo, la unidad de conversión de información espacial 1000 es capaz de generar información de renderización HL_L y HL_R suministrada a la unidad de renderización para el canal izquierdo de la señal de 45 submezcla, facilitándose la información de renderización HL_L a una salida izquierda correspondiente al mismo canal y facilitándose la información de renderización HL_R a una salida derecha correspondiente al otro canal. La unidad de conversión de información espacial 1000 es capaz de generar información de renderización HL_R y HL_L suministrada a la unidad de renderización para el canal derecho de la señal de submezcla, facilitándose la información de renderización HL_R a una salida derecha correspondiente al mismo canal y facilitándose la
50 información de renderización HL_L a una salida izquierda correspondiente al otro canal.
Con referencia a la figura 7, la unidad de renderización 900 comprende una unidad de renderización 1A 911, una unidad de renderización 2A 912, una unidad de renderización 1B 921 y una unidad de renderización 2B 922.
55 La unidad de renderización 900 recibe una señal de submezcla estéreo e información de renderización desde la unidad de conversión de información espacial 1000. Subsiguientemente, la unidad de renderización 900 genera una señal de sonido envolvente reproduciendo la información de renderización para la señal de submezcla estéreo.
En particular, la unidad de renderización 1A 911 lleva a cabo la renderización mediante la información de 60 renderización HL_L facilitada a un mismo canal, procedente de la información de renderización para el canal
E07708529
27-08-2014
izquierdo de la señal de submezcla. La unidad de renderización 2A 912 lleva a cabo la renderización mediante la información de renderización HL_R facilitada a otro canal, procedente de la información de renderización para el canal izquierdo de la señal de submezcla. La unidad de renderización 1B 921 lleva a cabo la renderización mediante la información de renderización HR_R facilitada a un mismo canal, procedente de la información de renderización
5 para el canal derecho de la señal de submezcla. La unidad de renderización 2B 922 lleva a cabo la renderización mediante la información de renderización HR_L facilitada a otro canal, procedente de la información de renderización para el canal derecho de la señal de submezcla.
En la siguiente descripción, la información de renderización facilitada a otro canal se denomina "información de
10 renderización cruzada". La información de renderización cruzada HL_R o HR_L se aplica a un mismo canal y, a continuación, se añade a otro canal por medio de un dispositivo de adición. En este caso, la información de renderización cruzada HL_R y/o HR_L puede ser igual a cero. Si la información de renderización cruzada HL_R y/o HR_L es igual a cero, significa que no se ha realizado ninguna aportación a la correspondiente trayectoria.
15 A continuación se describe un ejemplo del método de generación de la señal de sonido envolvente representado en la figura 6 o la figura 7.
En primer lugar, si la señal de submezcla es una señal estéreo, la señal de submezcla definida como "x", la información de mapeado de fuentes generada mediante información espacial definida como "D", la información de
20 filtro prototipo definida como "G", una señal multicanal definida como "p" y una señal de sonido envolvente definida como "y" pueden representarse mediante las matrices representadas en la figura matemática 13.
imagen15
25 En este caso, si los valores anteriores se encuentran en el dominio de la frecuencia, estos pueden resolverse de la manera indicada a continuación.
En primer lugar, la señal multicanal p, representada en la figura matemática 14, puede expresarse como un producto entre la información de mapeado de fuentes D generada mediante la información espacial y la señal de submezcla x. 30
imagen16
La señal de sonido envolvente y, representada en la figura matemática 15, puede generarse representando la información de filtro prototipo G para la señal multicanal p. 35 Figura matemática 15 y = G.p 40 En este caso, si se inserta la figura matemática 14 en p, puede generarse la figura matemática 16. Figura matemática 16 y = GDx
E07708529
27-08-2014
En este caso, si la información de renderización H se define como H=GD, la señal de sonido envolvente y la señal de submezcla x pueden tener la relación de la figura matemática 17.
imagen17
Por lo tanto, una vez que se ha generado la información de renderización H mediante procesamiento del producto entre la información de filtro y la información de mapeado de fuentes, la señal de submezcla x se multiplica por la información de renderización H para generar la señal de sonido envolvente y.
De conformidad con la definición de la información de renderización H, la información de renderización H puede expresarse como la figura matemática 18.
imagen18
15 Las figuras 8 y 9 son diagramas de bloques detallados de una unidad de renderización para una señal de submezcla mono según una forma de realización de la presente invención.
Con referencia a la figura 8, la unidad de renderización 900 comprende una unidad de renderización A 930 y una 20 unidad de renderización B 940.
Si la señal de submezcla es una señal mono, la unidad de conversión de información espacial 1000 genera la información de renderización HM_L y HM_R, siendo utilizada la información de renderización HM_L en la renderización de la señal mono para un canal izquierdo y siendo utilizada la información de renderización HM_R en
25 la renderización de la señal mono para un canal derecho.
La unidad de renderización A 930 aplica la información de renderización HM_L a la señal de submezcla mono para generar una señal de sonido envolvente del canal izquierdo. La unidad de renderización B 940 aplica la información de renderización HM_R a la señal de submezcla mono para generar una señal de sonido envolvente del canal
30 derecho.
En la unidad de renderización 900 del dibujo no se utiliza ningún demapeador. Sin embargo, si la unidad de renderización A 930 y la unidad de renderización B 940 llevan a cabo la renderización mediante las respectivas informaciones de renderización Hmoverall_L y Hmoverall_R definidas en la figura matemática 12, es posible obtener
35 las respectivas salidas a las cuales se aplica el demapeador.
Mientras tanto, en caso de que se trate de obtener una salida de una señal estéreo en lugar de una señal de sonido envolvente una vez terminada la renderización aplicada a una señal de submezcla mono, podrán llevarse a cabo los dos métodos siguientes.
40 El primer método consiste en utilizar un valor utilizado para una salida estéreo en lugar de utilizar información de renderización para un efecto envolvente. En este caso, es posible obtener una señal estéreo modificando solo la información de renderización en la estructura representada en la figura 3.
45 El segundo método consiste en un método de decodificación para generar una señal multicanal mediante una señal de submezcla e información espacial, que permite obtener una señal estéreo aplicando el método de decodificación solo a una correspondiente etapa para obtener un número de canales específico.
10
15
20
25
30
35
40
45
50 E07708529
27-08-2014
Con referencia a la figura 9, la unidad de renderización 900 ilustrada corresponde a un caso en el que la señal demapeada se representa como una sola (figura matemática 11). La unidad de renderización 900 comprende una unidad de renderización 1A 931, una unidad de renderización 2A 932, una unidad de renderización 1B 941 y una unidad de renderización 2B 942. La unidad de renderización 900 es similar a la unidad de renderización para la señal de submezcla estéreo, excepto porque la unidad de renderización 900 comprende las unidades de renderización 941 y 942 para una señal demapeada.
En el caso de la señal de submezcla estéreo, puede interpretarse que uno de los dos canales es una señal demapeada. Por lo tanto, sin emplear demapeadores adicionales, es posible realizar un método de renderización mediante los cuatro tipos de información de renderización definidos anteriormente HL_L, HL_R, etc. En particular, la unidad de renderización 1A 931 genera una señal que se va a facilitar a un mismo canal aplicando la información de renderización HM_L a una señal de submezcla mono. La unidad de renderización 2A 932 genera una señal que se va a facilitar a otro canal aplicando la información de renderización HM_R a la señal de submezcla mono. La unidad de renderización 1B 941 genera una señal que se va a facilitar a un mismo canal aplicando la información de renderización HMD_R a una señal demapeada. La unidad de renderización 2B 942 genera una señal que se va a facilitar a otro canal aplicando la información de renderización HMD_L a la señal demapeada.
Si una señal de submezcla es una señal mono, entonces una señal de submezcla definida como x, una información de canal de fuente definida como D, una información de filtro prototipo definida como G, una señal multicanal definida como p y una señal de sonido envolvente definida como y pueden representarse mediante las matrices indicadas en la figura matemática 19.
imagen19
En este caso, la relación entre las matrices es similar a la del caso en el que la señal de submezcla es la señal estéreo. Por este motivo, se omiten los detalles de esta.
Mientras tanto, la información de mapeado de fuentes descrita con referencia a la figura 4 y la figura 5 y la información de renderización generada mediante la información de mapeado de fuentes presentan valores diferentes según la banda de frecuencias, la banda de parámetros y/o el intervalo de tiempo transmitido. En este caso, si un valor de la información de mapeado de fuentes y/o la información de renderización presenta una diferencia considerable entre bandas o intervalos de tiempo adyacentes, podría producirse distorsión en el método de renderización. Para evitar la distorsión, es necesario aplicar un método de suavizado en el dominio de la frecuencia y/o en el dominio del tiempo. Además del suavizado en el dominio de la frecuencia y/o el suavizado en el dominio del tiempo puede utilizarse otro método de suavizado adecuado para la renderización. Es posible utilizar un valor resultante de multiplicar la información de mapeado de fuentes o la información de renderización por una ganancia específica.
Las figuras 10 y 11 son diagramas de bloques de una unidad de suavizado y una unidad de expansión según una forma de realización de la presente invención.
Un método de suavizado según la presente invención, tal como el representado en la figura 10 y la figura 11, es aplicable a la información de renderización y/o la información de mapeado de fuentes. No obstante, el método de suavizado es aplicable a información de otro tipo. La descripción siguiente se refiere al suavizado en el dominio de la frecuencia. Sin embargo, la presente invención comprende suavizado en el dominio del tiempo, así como suavizado en el dominio de la frecuencia.
Con referencia a la figura 10 y la figura 11, la unidad de suavizado 1042 es capaz de aplicar el suavizado a la información de renderización y/o la información de mapeado de fuentes. Más adelante se describirá un ejemplo detallado de la posición del suavizado con referencia a las figuras 18 a 20.
15
25
35
45
55 E07708529
27-08-2014
La unidad de suavizado 1042 puede configurarse con una unidad de expansión 1043, en la que la información de renderización y/o la información de mapeado de fuentes puede expandirse hasta un rango más amplio que el de una banda de parámetros, por ejemplo, una banda de filtros. En particular, la información de mapeado de fuentes puede ampliarse hasta una resolución de frecuencia (p. ej., una banda de filtros) correspondiente a la información de filtro que se va a multiplicar por la información del filtro (por ejemplo, el coeficiente de filtro HRTF). El suavizado según la presente invención se ejecuta antes o junto con la expansión. Cuando el suavizado tiene lugar junto con la expansión, puede emplearse uno de los métodos representados en las figuras 12 a 16.
La figura 12 es un gráfico para ilustrar un primer método de suavizado según una forma de realización de la presente invención.
Con referencia a la figura 12, un primer método de suavizado utiliza un valor que tiene el mismo tamaño que la información espacial de cada banda de parámetros. En este caso, es posible conseguir un efecto de suavizado mediante una función de suavizado adecuada.
La figura 13 es un gráfico para describir un segundo método de suavizado según una forma de realización de la presente invención.
Con referencia a la figura 13, un segundo método de suavizado consiste en obtener un efecto de suavizado conectando posiciones representativas de la banda de parámetros. La posición representativa es el centro justo de cada una de las bandas de parámetros, una posición central proporcional a una escala logarítmica, una escala Bark
o similares, un valor de la frecuencia más baja o una posición determinada previamente mediante un método diferente.
La figura 14 es un gráfico para describir un tercer método de suavizado según una forma de realización de la presente invención.
Con referencia a la figura 14, un tercer método de suavizado consiste en aplicar suavizado en forma de una curva o una línea recta que conecta con suavidad los límites de conexión de los parámetros. En este caso, el tercer método de suavizado utiliza una curva de suavizado de bordes predefinida o un filtrado pasabaja mediante el filtro IIR o el filtro FIR de primer orden o superior.
La figura 15 es un gráfico para describir un cuarto método de suavizado según una forma de realización de la presente invención.
Con referencia a la figura 15, un cuarto método de suavizado consiste en conseguir un efecto de suavizado añadiendo una señal, tal como un ruido aleatorio, a un contorno de información espacial. En este caso, puede utilizarse un valor que difiere en canal o en banda como ruido aleatorio. En caso de que se añada un ruido aleatorio en el dominio de la frecuencia, es posible añadir solo un valor de tamaño dejando intacto un valor de fase. El cuarto método de suavizado permite obtener un efecto de demapeado intercanal, así como un efecto de suavizado en el dominio de la frecuencia.
La figura 16 es un gráfico para describir un quinto método de suavizado según una forma de realización de la presente invención.
Con referencia a la figura 16, un quinto método de suavizado consiste en utilizar una combinación de los métodos de suavizado segundo a cuarto. Por ejemplo, una vez que se han conectado las posiciones representativas de las respectivas bandas de parámetros, se añade el ruido aleatorio y a continuación se aplica filtrado pasa baja. De esta manera, la secuencia puede modificarse. El quinto método de suavizado reduce al mínimo los puntos discontinuos en el dominio de la frecuencia, y el efecto de demapeado intercanal puede mejorarse.
En los métodos de suavizado primero a quinto, el total de potencias para los valores de información espacial (por ejemplo, los valores de CLD) en los respectivos dominios de frecuencia de cada canal debería ser tan uniforme como una constante. Por ello, tras realizarse el método de suavizado en cada canal, debería realizarse la normalización de las potencias. Por ejemplo, si una señal de submezcla es una señal mono, los valores de nivel de los respectivos canales deberían satisfacer la relación de la figura matemática 20.
imagen20
En este caso, "pb = 0~número total de bandas de parámetros 1", y "C" es una constante arbitraria. La figura 17 es un diagrama para describir la información de filtro prototipo de cada canal.
E07708529
27-08-2014
Con referencia a la figura 17, para la renderización, una señal que ha pasado a través del filtro GL_L para una fuente de canal izquierdo se envía a una salida izquierda, mientras que una señal que ha pasado a través del filtro GL_R se envía a una salida derecha.
Subsiguientemente, se genera una salida final izquierda (por ejemplo, Lo) y una salida final derecha (por ejemplo, Ro) combinando todas las señales recibidas desde los respectivos canales. En particular, las salidas de canal izquierdo/derecho reproducidas pueden expresarse como la figura matemática 21.
imagen21
En la presente invención, las salidas de canal izquierdo/derecho reproducidas pueden generarse mediante los valores L, R, C, Ls y Rs generados decodificando la señal de submezcla como la señal multicanal mediante la información espacial. La presente invención es capaz de generar las salidas de canal izquierdo/derecho
15 reproducidas mediante la información de renderización sin generar los valores L, R, C, Ls y Rs, generándose la información de renderización mediante la información espacial y la información de filtro.
A continuación se describe un método para generar información de renderización mediante información espacial, con referencia a las figuras 18 a 20.
20 La figura 18 es un diagrama de bloques para un primer método de generación de información de renderización en una unidad de conversión de información espacial 900 según una forma de realización de la presente invención.
Con referencia a la figura 18, tal como se menciona en la descripción anterior, la unidad de conversión de
25 información espacial 900 comprende la unidad de mapeado de fuentes 1010, la unidad de generación de información de subrenderización 1020, la unidad de integración 1030, la unidad de procesamiento 1040 y la unidad de conversión de dominio 1050. La unidad de conversión de información espacial 900 presenta la misma configuración que la representada en la figura 3.
30 La unidad de generación de información de subrenderización 1020 comprende por lo menos una o más unidades de generación de información de subrenderización (1.ª unidad de generación de información de subrenderización a N.ª unidad de generación de información de subrenderización).
La unidad de generación de información de subrenderización 1020 genera información de subrenderización 35 mediante información de filtro e información de mapeado de fuentes.
Por ejemplo, si una señal de submezcla es una señal mono, la primera unidad de generación de información de subrenderización es capaz de generar información de subrenderización correspondiente a un canal izquierdo de un multicanal. La información de subrenderización puede representarse como la figura matemática 22 mediante la
40 información de mapeado de fuentes D_L y la información de filtro convertida GL_L' y GL_R'.
imagen22
En este caso, el valor D_L es un valor generado mediante la información espacial en la unidad de mapeado de 45 fuentes 1010. Sin embargo, un método para generar el valor D_L puede seguir la estructura en árbol.
La segunda unidad de generación de información de subrenderización es capaz de generar información de subrenderización FR_L y FR_R correspondiente a un canal derecho del multicanal. La N.ª unidad de generación de información de subrenderización es capaz de generar información de subrenderización FRs_L y FRs_R
50 correspondiente a un canal derecho de sonido envolvente del multicanal.
E07708529
27-08-2014
Si una señal de submezcla es una señal estéreo, la primera unidad de generación de información de subpresentación es capaz de generar información de subrenderización correspondiente al canal izquierdo del multicanal. La información de subrenderización puede representarse como la figura matemática 23 mediante la
5 información de mapeado de fuentes D_L1 y D_L2.
Figura matemática 23
FL_L1 = D_L1 * GL_L' 10 (entrada izquierda → coeficiente de filtro a canal de salida izquierdo)
FL_L2 = D_L2 * GL_L' (entrada derecha → coeficiente de filtro a canal de salida izquierdo)
15 FL_R1 = D_L1 * GL_R' (entrada izquierda → coeficiente de filtro a canal de salida derecho)
FL_R2 = D_L2 * GL_R' (entrada derecha → coeficiente de filtro a canal de salida derecho) 20 En la figura matemática 23, la información FL_R1 se explica por ejemplo de la siguiente manera.
En primer lugar, en la FL_R1, "L" indica una posición del multicanal, "R" indica un canal de salida de una señal de sonido envolvente y "1" indica un canal de la señal de submezcla. En concreto, la FL_R1 indica la información de 25 subrenderización utilizada en la generación del canal de salida derecho de la señal de sonido envolvente a partir del canal izquierdo de la señal de submezcla.
En segundo lugar, los valores D_L1 y D_L2 son valores que se generan mediante la información espacial en la unidad de mapeado de fuentes 1010.
30 Si la señal de submezcla es una señal estéreo, es posible generar una pluralidad de informaciones de subrenderización a partir de por lo menos una unidad de generación de información de subrenderización, de la misma manera que en el caso en el que la señal de submezcla es la señal mono. Los tipos de informaciones de subrenderización generadas por una pluralidad de las unidades de generación de información de subrenderización
35 son ejemplos no limitativos de la presente invención.
La información de subrenderización generada por la unidad de generación de información de subrenderización 1020 se transfiere a la unidad de renderización 900 por medio de la unidad de integración 1030, la unidad de procesamiento 1040 y la unidad de conversión de dominio 1050.
40 La unidad de integración 1030 integra las informaciones de subrenderización generadas para cada canal como información de renderización (por ejemplo, HL_L, HL_R, HR_L, HR_R) para un método de renderización. A continuación se describe un método de integración efectuado en la unidad de integración 1030 para el caso de una señal mono y el caso de una señal estéreo.
45 En primer lugar, si la señal de submezcla es una señal mono, la información de renderización puede expresarse como la figura matemática 24.
imagen23
En segundo lugar, si la señal de submezcla es una señal estéreo, la información de renderización puede expresarse como la figura matemática 25.
E07708529
27-08-2014
imagen24
Subsiguientemente, la unidad de procesamiento 1040 comprende una unidad de interpolación 1041 y/o una unidad de suavizado 1042 y realiza la interpolación y/o el suavizado para la información de renderización. La interpolación
5 y/o el suavizado pueden ejecutarse en el dominio del tiempo, el dominio de la frecuencia o el dominio QMF. En la presente memoria, se utiliza el dominio del tiempo como un ejemplo que no impone ninguna limitación a la presente invención.
La interpolación se realiza para obtener información de renderización no existente entre las informaciones de
10 renderización si la información de renderización transmitida presenta un amplio intervalo en el dominio del tiempo. Por ejemplo, en el supuesto de que existan informaciones de renderización en un n-ésimo intervalo de tiempo y un (n+k)-ésimo intervalo de tiempo (k>1), respectivamente, será posible realizar la interpolación lineal en un intervalo de tiempo no transmitido mediante las informaciones de renderización generadas (por ejemplo, HL_L, HR_L, HL_R, HR_R).
15 La información de renderización generada a partir de la interpolación se describe con referencia a un caso en el que la señal de submezcla es una señal mono y a un caso en el que la señal de submezcla es una señal estéreo.
Si la señal de submezcla es la señal mono, la información de renderización interpolada puede expresarse como la 20 figura matemática 26.
imagen25
Si la señal de submezcla es la señal estéreo, la información de renderización interpolada puede expresarse como la 25 figura matemática 27.
imagen26
En este caso, es 0 <j<k. "j" y "k" son números enteros. Y "a" es un número real correspondiente a "0<a<1" que se 30 expresará como la figura matemática 28.
Figura matemática 28
a = j/k
35 Entonces, es posible obtener un valor correspondiente al intervalo de tiempo no transmitido en una línea recta que conecta los valores en los dos intervalos de tiempo según la figura matemática 27 y la figura matemática 28. Los detalles de la interpolación se facilitarán más adelante con referencia a la figura 22 y la figura 23.
40 En caso de que un valor de coeficiente de filtro varíe bruscamente entre dos intervalos de tiempo adyacentes en el dominio del tiempo, la unidad de suavizado 1042 ejecuta el suavizado para prevenir un problema de distorsión
E07708529
27-08-2014
debido a la presencia de un punto discontinuo. El suavizado en el dominio del tiempo puede llevarse a cabo mediante el método de suavizado descrito con referencia a las figuras 12 a 16. El suavizado puede realizarse junto con la expansión. El suavizado puede variar según la posición aplicada. Si la señal de submezcla es una señal mono, el suavizado en el dominio del tiempo puede representarse como la figura matemática 29.
imagen27
En concreto, el suavizado puede ejecutarse mediante el tipo de filtro IIR de 1 polo obtenido multiplicando la información de renderización HM_L(n-1) o HM_R(n-1) suavizada en un intervalo de tiempo anterior n-1 por (1-b),
10 multiplicando la información de renderización HM_L(n) o HM_R(n) generada en un intervalo de tiempo actual n por b y sumando las dos multiplicaciones. En este caso, "b" es una constante para 0<b<1. Si "b" disminuye, el efecto de suavizado aumenta. Si "b" aumenta, el efecto de suavizado disminuye. El resto de los filtros puede aplicarse de la misma manera.
15 La interpolación y el suavizado pueden representarse como la expresión mostrada en la figura matemática 30 utilizando la figura matemática 29 para el suavizado en el dominio del tiempo.
imagen28
20 Si la unidad de interpolación 1041 realiza la interpolación y/o si la unidad de suavizado 1042 realiza el suavizado, puede obtenerse información de renderización que presenta un valor de energía diferente al de la información de renderización prototipo. Para prevenir este problema, puede ejecutarse además la normalización de la energía.
Por último, la unidad de conversión de dominio 1050 aplica conversión de dominio a la información de renderización
25 de un dominio para ejecutar la renderización. Si el dominio para ejecutar la renderización es idéntico al dominio de la información de renderización, no es necesario ejecutar la conversión del dominio. A continuación, la información de renderización de dominio convertido se transfiere a la unidad de renderización 900.
La figura 19 es un diagrama de bloques para un segundo método de generación de información de renderización en 30 una unidad de conversión de información espacial según una forma de realización de la presente invención.
El segundo método es similar al primer método en la medida en que una unidad de conversión de información espacial 1000 comprende una unidad de mapeado de fuentes 1010, una unidad de generación de información de subrenderización 1020, una unidad de integración 1030, una unidad de procesamiento 1040 y una unidad de
35 conversión de dominio 1050, y en la medida en que la unidad de generación de información de subrenderización 1020 comprende por lo menos una unidad de generación de información de subrenderización.
Con referencia a la figura 19, el segundo método de generación de la información de renderización difiere del primer método en la posición de la unidad de procesamiento 1040. Por lo tanto, la interpolación y/o el suavizado puede
40 aplicarse en cada canal a las informaciones de subrenderización (por ejemplo, FL_L y FL_R en caso de que la señal sea mono o FL_L1, FL_L2 ,FL_R1, FL_R2 en caso de que la señal sea estéreo) generadas para cada canal en la unidad de generación de información de subrenderización 1020.
Subsiguientemente, la unidad de integración 1030 integra las informaciones de subrenderización interpoladas y/o 45 suavizadas en la información de renderización.
La información de renderización generada se transfiere a la unidad de renderización 900 por medio de la unidad de conversión de dominio 1050.
50 La figura 20 es un diagrama de bloques para un tercer método de generación de información de filtro de renderización en una unidad de conversión de información espacial según una forma de realización de la presente invención.
El tercer método es similar al primer o al segundo métodos en la medida en que una unidad de conversión de 55 información espacial 1000 comprende una unidad de mapeado de fuentes 1010, una unidad de generación de
15
25
35
45
55
65 E07708529
27-08-2014
información de subrenderización 1020, una unidad de integración 1030, una unidad de procesamiento 1040 y una unidad de conversión de dominio 1050, y en la medida en que la unidad de generación de información de subrenderización 1020 comprende por lo menos una unidad de generación de información de subrenderización.
Con referencia a la figura 20, el tercer método de generación de la información de renderización difiere del primer o el segundo métodos en la medida en que la unidad de procesamiento 1040 está situada junto a la unidad de mapeado de fuentes 1010. Por consiguiente, la interpolación y/o el suavizado pueden aplicarse en cada canal a la información de mapeado de fuentes generada mediante información espacial en la unidad de mapeado de fuentes 1010.
Subsiguientemente, la unidad de generación de información de subrenderización 1020 genera información de subrenderización mediante la información de mapeado de fuentes interpolada y/o suavizada e información de filtro.
La información de subrenderización se integra en la información de renderización en la unidad de integración 1030. La información de renderización generada se transfiere a la unidad de renderización 900 por medio de la unidad de conversión de dominio 1050.
La figura 21 es un diagrama para describir un método de generación de una señal de sonido envolvente en una unidad de renderización según una forma de realización de la presente invención. La figura 21 representa un método de renderización ejecutado en el dominio DFT. Sin embargo, el método de renderización puede implementarse también en un dominio diferente, de una manera similar. La figura 21 representa un caso en el que la señal de entrada es una señal de submezcla mono. Sin embargo, la figura 21 es aplicable a otros canales de entrada, incluida una señal de submezcla estéreo y similares, de la misma manera.
Con referencia a la figura 21, una señal de submezcla mono en el dominio del tiempo ejecuta preferentemente un enventanado que presenta un intervalo de superposición OL en la unidad de conversión de dominio. La figura 21 representa un caso en el que se utiliza un 50% de superposición. Sin embargo, la presente invención comprende casos en los que se utilizan otras superposiciones.
Una función ventana para ejecutar el enventanado puede emplear una función que presenta una buena selectividad en frecuencia en el dominio DFT gracias a su conexión sin interrupción ni discontinuidad en el dominio del tiempo. Por ejemplo, como función ventana, puede utilizarse una función ventana seno cuadrado.
Subsiguientemente, se aplica relleno de ceros a la izquierda ZL, de una longitud de muestras [exactamente, (longitud de muestras) -1] de un filtro de renderización mediante información de renderización convertida en la unidad de conversión de dominio, a una señal de submezcla mono que presenta una longitud OL*2 obtenida por enventanado. A continuación, se realiza una conversión de dominio al dominio DFT. La figura 21 representa cómo se realiza la conversión de dominio al dominio DFT de una señal de submezcla de bloque k.
La señal de submezcla de dominio convertido se reproduce mediante un filtro de renderización que utiliza información de renderización. El método de renderización puede representarse como un producto de una señal de submezcla e información de renderización. La señal de submezcla reproducida se somete a IDFT (transformada discreta de Fourier inversa) en la unidad de conversión de dominio inversa y, a continuación, se superpone a la señal de submezcla (bloque k-1 en la figura 21) ejecutada previamente con un retardo de longitud OL para generar una señal de sonido envolvente.
Puede aplicarse interpolación a cada uno de los bloques que se someten al método de renderización. El método de interpolación se describe a continuación.
La figura 22 es un diagrama para un primer método de interpolación según una forma de realización de la presente invención. La interpolación según la presente invención puede ejecutarse en diversas posiciones. Por ejemplo, la interpolación puede ejecutarse en diversas posiciones en la unidad de conversión de información espacial representada en las figuras 18 a 20 o puede ejecutarse en la unidad de renderización. La información espacial, la información de mapeado de fuentes, la información de filtro y similares pueden utilizarse como los valores que se van a interpolar. En la presente memoria, la información espacial se utiliza a título de ejemplo para la descripción. Sin embargo, la presente invención no se limita a la información espacial. La interpolación se ejecuta después o junto con la expansión a una banda más amplia.
Con referencia a la figura 22, la información espacial transferida desde un aparato de codificación c puede transferirse desde una posición aleatoria en lugar de transmitirse en cada intervalo de tiempo. Una trama espacial puede transmitir una pluralidad de conjuntos de información espacial (por ejemplo, los conjuntos de parámetros n y n+1 de la figura 22). En caso de que la tasa de bits sea baja, una trama espacial puede transmitir un único conjunto nuevo de información espacial. Por lo tanto, la interpolación se realiza para un intervalo de tiempo no transmitido mediante los valores de un conjunto de información espacial transmitido adyacente. El intervalo entre ventanas para ejecutar la renderización no siempre coincide con el intervalo de tiempo. Por consiguiente, se halla y utiliza un valor interpolado en el centro de las ventanas de renderización (K-1, K, K+1, K+2, etc.), tal como se representa en la
15
25
35
45
55
65 E07708529
27-08-2014
figura 22. Aunque la figura 22 muestra cómo la interpolación lineal se realiza entre intervalos de tiempo cuando se dispone de un conjunto de información espacial, la presente invención no se limita al método de interpolación. Por ejemplo, la interpolación no se realiza en un intervalo de tiempo en el que no se dispone de un conjunto de información espacial. En su lugar, puede utilizarse un valor anterior o predeterminado.
La figura 23 es un diagrama para un segundo método de interpolación según una forma de realización de la presente invención.
Con referencia a la figura 23, un segundo método de interpolación según una forma de realización de la presente invención presenta una estructura en la que se combinan un intervalo que utiliza un valor anterior, un intervalo que utiliza un valor predeterminado y similares. Por ejemplo, la interpolación puede realizarse mediante por lo menos uno de los siguientes métodos: un método de mantenimiento de un valor anterior, un método de utilización de un valor por predeterminado y un método de ejecución de interpolación lineal en un intervalo de una trama espacial. En caso de que existan por lo menos dos nuevos conjuntos de información espacial en una ventana, puede producirse distorsión. La siguiente descripción se refiere a la conmutación de bloques para prevenir la distorsión.
La figura 24 es un diagrama para un método de conmutación de bloques según una forma de realización de la presente invención.
En relación con la referencia (a) representada en la figura 24, puesto que la longitud de la ventana es superior a la longitud del intervalo de tiempo, pueden existir por lo menos dos conjuntos de información espacial (por ejemplo, los conjuntos de parámetros n y n+1 de la figura 24) en un intervalo de ventana. En ese caso, cada uno de los conjuntos de información espacial debería aplicarse a un intervalo de tiempo diferente. Sin embargo, si se aplica un valor resultante de interpolar los por lo menos dos conjuntos de información espacial, puede producirse distorsión. Es decir, puede producirse distorsión atribuida a la falta de resolución temporal según la longitud de la ventana.
Para resolver este problema puede utilizarse un método de conmutación de variación del tamaño de una ventana a fin de adaptar la resolución de un intervalo de tiempo. Por ejemplo, un tamaño de ventana, como el representado en
(b) en la figura 24, puede cambiarse por un tamaño de ventana más corto para un intervalo que requiera alta resolución. En este caso, en la parte inicial y la parte final de las ventanas conmutadas, se utiliza la conexión de ventanas para evitar que se produzcan discontinuidades en el dominio del tiempo de las ventanas conmutadas.
La longitud de la ventana puede elegirse utilizando información espacial en un aparato de decodificación, en lugar de transferirse como información adicional separada. Por ejemplo, la longitud de la ventana puede determinarse utilizando un plazo de un intervalo de tiempo para actualizar la información espacial. En concreto, si el plazo para actualizar la información espacial es corto, se utiliza una función de ventana de poca longitud. Si el plazo para actualizar la información espacial es largo, se utiliza una función de ventana de gran longitud. En este caso, cuando se utiliza una ventana de longitud variable durante la renderización, resulta ventajoso no utilizar bits para enviar información de longitud de ventana por separado. En la referencia (b) de la figura 24 se representan dos tipos de longitud de ventana. Sin embargo, pueden utilizarse ventanas que presentan diversas longitudes según la frecuencia de transmisión y las relaciones de la información espacial. La información de longitud de ventana elegida es aplicable a diversas etapas para generar una señal de sonido envolvente como se describe a continuación.
La figura 25 es un diagrama de bloques para una posición a la cual se aplica una longitud de ventana elegida por una unidad de elección de longitud de ventana según una forma de realización de la presente invención.
Con referencia a la figura 25, una unidad de elección de longitud de ventana 1400 es capaz de elegir la longitud de una ventana mediante información espacial. La información para la longitud de ventana elegida es aplicable a una unidad de mapeado de fuentes 1010, una unidad de integración 1030, una unidad de procesamiento 1040, unas unidades de conversión de dominio 1050 y 1100 y una unidad de conversión de dominio inversa 1300. La figura 25 representa un caso en el que se utiliza una señal de submezcla estéreo. Sin embargo, la presente invención no se limita a la señal de submezcla estéreo solo. Como se menciona en la descripción anterior, aunque la longitud de la ventana se reduzca, la longitud de relleno de ceros elegida según el número de muestras del filtro no es ajustable. Por este motivo, a continuación se describe una solución al problema.
La figura 26 es un diagrama para los filtros de diversas longitudes utilizados en el procesamiento de una señal de audio según una forma de realización de la presente invención. Como se ha indicado en la descripción anterior, si la longitud de relleno de ceros elegida según el número de muestras del filtro no está ajustada, se produce una superposición sustancial que equivale a una correspondiente longitud a fin de provocar un descenso de la resolución temporal. Una solución para el problema consiste en reducir la longitud del relleno de ceros restringiendo la longitud de una muestra del filtro. Un método de reducción de la longitud del relleno de ceros puede consistir en truncar una parte posterior de una respuesta (por ejemplo, un intervalo de difusión correspondiente a la reverberación). En este caso, un método de renderización puede ser menos preciso que un método en el que no se realiza el truncamiento de la parte posterior de la respuesta del filtro. Sin embargo, los valores de coeficiente de filtro en el dominio del tiempo son muy pequeños como para tener un efecto importante sobre la reverberación. Por consiguiente, la calidad del sonido no se ve significativamente afectada por el truncamiento.
15
25
35
45
55
65 E07708529
27-08-2014
Con referencia a la figura 26, pueden utilizarse cuatro tipos de filtro. Los cuatro tipos de filtro pueden utilizarse en el dominio de la DFT, lo cual no impone ninguna limitación a la presente invención.
Un filtro N indica un filtro que presenta una gran longitud de filtro FL y una gran longitud 2*OL de relleno de ceros cuyo número de muestras de filtro no está restringido. Un filtro N2 indica un filtro que presenta una longitud de relleno de ceros 2*OL más corta que la del filtro N1 mediante restricción del número de muestras del filtro con la misma longitud de filtro FL. Un filtro N3 indica un filtro que presenta una gran longitud de relleno de ceros 2*OL gracias a la no limitación del número de muestras del filtro con una longitud de filtro FL más corta que la del filtro N1. Y un filtro N4 indica un filtro que presenta una longitud de ventana FL más corta que la del filtro N1 con una longitud de relleno de ceros 2*OL corta mediante restricción del número de muestras del filtro.
Como se ha mencionado en la descripción anterior, es posible resolver el problema de la resolución temporal mediante los cuatro ejemplos de clases de filtros anteriores. Para la parte posterior de la respuesta del filtro, puede utilizarse un coeficiente de filtro diferente para cada dominio.
La figura 27 es un diagrama para un método de procesamiento dividido de una señal de audio mediante una pluralidad de subfiltros según una forma de realización de la presente invención. Un filtro puede dividirse en subfiltros que presentan coeficientes de filtro que difieren entre sí. Después de procesar la señal de audio mediante los subfiltros, puede utilizarse un método de adición de los resultados del método. En caso de que se aplique información espacial a una parte posterior de una respuesta de filtro que presenta poca energía, es decir, en caso de que se realice la renderización mediante un filtro con una muestra de filtro larga, el método ofrece una función para procesar de forma dividida la señal de audio según una unidad de longitud predeterminada. Por ejemplo, puesto que la parte posterior de la respuesta del filtro no varía de forma considerable en cada HRTF correspondiente a cada canal, es posible realizar la renderización extrayendo un coeficiente común a una pluralidad de ventanas. En la presente memoria, se describe un caso de ejecución en el dominio DFT. Sin embargo, la presente invención no se limita al dominio DFT.
Con referencia a la figura 27, una vez que un filtro FL se ha dividido en una pluralidad de subáreas, la pluralidad de subáreas puede procesarse mediante una pluralidad de subfiltros (filtro A y filtro B) que presentan coeficientes de filtro diferentes.
Subsiguientemente, una salida procesada por el filtro A y una salida procesada por el filtro B se combinan. Por ejemplo, se aplica IDFT (transformada discreta de Fourier inversa) a cada salida procesada por el filtro A y la salida procesada por el filtro B para generar una señal del dominio del tiempo. Las señales generadas se combinan. En este caso, el filtro FL aplica, a una posición a la cual se añade la salida procesada por el filtro B, un retardo que supera la posición de la salida procesada por el filtro A. De esta manera, la señal procesada por una pluralidad de subfiltros produce el mismo efecto que en el caso de una señal procesada por un único filtro.
La presente invención comprende un método de renderización de la salida procesada por el filtro B para una señal de submezcla directamente. En este caso, es posible representar la salida para la señal de submezcla mediante coeficientes que extraen una parte de la información espacial o sin utilizar la información espacial.
El método se caracteriza porque un filtro que presenta un número de muestras elevado puede aplicarse de forma dividida, y porque una parte posterior del filtro que presenta poca energía puede aplicarse sin conversión mediante información espacial. En este caso, si no se aplica conversión mediante información espacial, tampoco se aplica un filtro diferente a cada ventana procesada. Por consiguiente, no es necesario aplicar el mismo sistema que en la conmutación de bloques. La figura 26 representa el filtro dividido en dos áreas. Sin embargo, la presente invención permite dividir el filtro en una pluralidad de áreas.
La figura 28 es un diagrama de bloques para un método de renderización de información de renderización de partición generada por una pluralidad de subfiltros para una señal de submezcla mono según una forma de realización de la presente invención. La figura 28 se refiere a un coeficiente de renderización. El método puede ejecutarse para cada coeficiente de renderización.
Con referencia a la figura 28, la información de filtro A de la figura 27 corresponde a una primera información de renderización de partición HM_L_A, y la información de filtro B de la figura 27 corresponde a una segunda información de renderización de partición HM_L_B. La figura 28 representa una forma de realización de una partición en dos subfiltros. Sin embargo, la presente invención no se limita a los dos subfiltros. Los dos subfiltros pueden obtenerse por medio de una unidad de división 1500 a partir de la información de procesamiento HM_L generada en la unidad de generación de información espacial 1000. Como alternativa, los dos los subfiltros pueden obtenerse mediante información de filtro HRTF prototipo o información decidida en función de una selección del usuario. La información decidida en función de la selección del usuario puede comprender información espacial seleccionada según las preferencias del usuario, por ejemplo. En este caso, HM_L_A es la información de renderización basada en la información espacial recibida, y HM_L_B puede ser la información de renderización para dar un efecto tridimensional aplicado de forma generalizada a las señales.
15
25
35
45
55
65 E07708529
27-08-2014
Como se ha mencionado en la descripción anterior, el procesamiento con una pluralidad de subfiltros es aplicable al dominio de tiempo y al dominio QMF, así como al dominio DFT. En particular, los valores de coeficiente divididos por el filtro A y el filtro B se aplican a la señal de submezcla mediante renderización en el dominio del tiempo o en el dominio QMF y, a continuación, se suman para generar una señal definitiva.
La unidad de renderización 900 comprende una primera unidad de renderización de partición 950 y una segunda unidad de renderización de partición 960. La primera unidad de renderización de partición 950 realiza un método de renderización mediante la información HM_L_A, mientras que la segunda unidad de renderización de partición 960 realiza un método de renderización mediante la información HM_L_B.
Si el filtro A y el filtro B, representados en la figura 27, son divisiones de un mismo filtro en función del tiempo, es posible tomar en consideración un retardo adecuado para que se corresponda con el intervalo de tiempo. La figura 28 representa un ejemplo de señal de submezcla mono. En caso de que se utilice una señal de submezcla mono y un demapeador, la parte correspondiente al filtro B no se aplica al demapeador, sino a la señal de submezcla mono directamente.
La figura 29 es un diagrama de bloques para un método de renderización de información de renderización de partición generada por una pluralidad de subfiltros para una señal de submezcla estéreo según una forma de realización de la presente invención.
Un método de renderización de partición representado en la figura 29 es similar al de la figura 28, en la medida en que se obtienen dos subfiltros en un divisor 1500 mediante información de renderización generada por la unidad de conversión de información espacial 1000, información de filtro HRTF prototipo o información de elección por el usuario. La diferencia respecto de la figura 28 radica en que un método de renderización de partición correspondiente al filtro B se aplica de manera generalizada a las señales L/R.
En particular, el divisor 1500 genera una primera información de renderización de partición correspondiente a información del filtro A, una segunda información de renderización de partición y una tercera información de renderización de partición correspondiente a la información del filtro B. En este caso, la tercera información de renderización de partición puede generarse mediante información de filtro o información espacial aplicable de forma generalizada a las señales L/R.
Con referencia a la figura 29, una unidad de renderización 900 comprende una primera unidad de renderización de partición 970, una segunda unidad de renderización de partición 980 y una tercera unidad de renderización de partición 990.
La tercera información de renderización de partición generada se aplica a una señal de suma de las señales L/R en la tercera unidad de renderización de partición 990 para generar una señal de salida. La señal de salida se añade a las señales de salida L/R, que son reproducidas de manera independiente por un filtro A1 y un filtro A2 de la primera y la segunda unidades de renderización de partición 970 y 980, respectivamente, para generar señales de sonido envolvente. En este caso, la señal de salida de la tercera unidad de renderización de partición 990 se puede añadir después de un retardo adecuado. En la figura 29, la expresión de información de renderización cruzada aplicada a otro canal a partir de entradas L/R se omite de la descripción por conveniencia.
La figura 30 es un diagrama de bloques para un primer método de conversión de dominio de una señal de submezcla según una forma de realización de la presente invención. El método de renderización ejecutado en el dominio DFT se ha descrito ya. Como se ha mencionado en la descripción anterior, el método de renderización es ejecutable en otros dominios, así como en el dominio DFT. La figura 30 representa el método de renderización ejecutado en el dominio DFT. Una unidad de conversión de dominio 1100 comprende un filtro QMF y un filtro DFT. Una unidad de conversión de dominio inversa 1300 comprende un filtro IDFT y un filtro IQMF. La figura 30 se refiere a una señal de submezcla mono que no impone ninguna limitación a la presente invención.
Con referencia a la figura 30, una señal de submezcla del dominio del tiempo de p muestras pasa a través de un filtro QMF para generar P muestras de subbanda. Se reúnen W muestras por cada banda. Una vez que se ha aplicado enventanado a las muestras reunidas, se realiza el relleno de ceros. A continuación se ejecuta DFT de M puntos (FFT). En este caso, la DFT permite un procesamiento mediante el tipo de enventanado citado anteriormente. Un valor que conecta los M/2 valores del dominio de frecuencia de cada banda obtenidos mediante aplicación de la DFT de M puntos a P bandas puede considerarse un valor aproximado de un espectro de frecuencias obtenido mediante DFT de M/2*P puntos. Por lo tanto, un coeficiente de filtro representado en el dominio DFT de M/2*P puntos se multiplica por el espectro de frecuencias para llevar el mismo efecto del método de renderización al dominio DFT.
En este caso, la señal que ha pasado a través del filtro QMF presenta fugas, por ejemplo, solapamiento entre bandas adyacentes. En particular, un valor que corresponde a una banda adyacente se esparce por la banda actual y una parte de un valor existente en la banda actual se desplaza hasta la banda adyacente. En este caso, si se
10
15
20
25
30
35
40
45
50
55 E07708529
27-08-2014
ejecuta la integración QMF, es posible recuperar la señal original gracias a las características QMF. Sin embargo, si se aplica un método de filtrado a la señal de la correspondiente banda, como en el caso de la presente invención, la señal se distorsiona debido a la fuga. Para reducir al mínimo este problema, puede añadirse un método para recuperar una señal original, de tal manera que se hace pasar una señal a través de una mariposa B para reducir al mínimo las fugas antes de aplicar la DFT a cada banda tras la QMF en la unidad de conversión de dominio 100 y realizar un método de inversión V después de la IDFT en la unidad de conversión de dominio inversa 1300.
Mientras tanto, para hacer coincidir el método de generación de la información de renderización generada en la unidad de conversión de información espacial 1000 con el método de generación de la señal de submezcla, puede aplicarse DFT a una señal de paso QMF para información de filtro prototipo en lugar de ejecutar la DFT de M/2*P puntos al principio. En este caso, puede producirse retardo y dispersión de datos debido al filtro QMF.
La figura 31 es un diagrama de bloques para un segundo método de conversión de dominio de una señal de submezcla según una forma de realización de la presente invención. La figura 31 representa un método de renderización aplicado al dominio QMF.
Con referencia a la figura 31, una unidad de conversión de dominio 1100 comprende una unidad de conversión de dominio QMF, y una unidad de conversión de dominio inversa 1300 comprende una unidad de conversión de dominio IQMF. La configuración representada en la figura 31 es igual a la del caso en el que se utiliza la DFT, excepto porque la unidad de conversión de dominio es un filtro QMF. En la siguiente descripción, el término QMF comprende un QMF y un QMF híbrido que presentan el mismo ancho de banda. La diferencia con el caso en el que se utiliza solo la DFT radica en que la generación de la información de renderización se realiza en el dominio QMF y en que el método de renderización se representa como una convolución en lugar del producto en el dominio de la DFT, puesto que el método de renderización realizado por un reproductor M 3012 se ejecuta en el dominio QMF.
Suponiendo que el filtro QMF disponga de B bandas, un coeficiente de filtro puede representarse como un conjunto de coeficientes de filtro que presentan diferentes características (coeficientes) para la B bandas. Ocasionalmente, si el número de muestras de filtro se convierte en un número de primer orden (es decir, se multiplica por una constante), el método de renderización en el dominio DFT de B espectros de frecuencias y el método operativo coincidirán. La figura matemática 31 representa un método de renderización ejecutado en una banda QFM (b) para una trayectoria a fin de realizar el método de renderización mediante información de renderización HM_L.
imagen29
En este caso, k indica un orden temporal en la banda QMF, es decir, una unidad de intervalo de tiempo. El método de renderización ejecutado en el dominio QMF es ventajoso en la medida en que, si la información espacial transmitida es un valor aplicable al dominio QMF, la aplicación de los correspondientes datos se facilita mucho, y en la medida en que permite reducir al mínimo la distorsión en el transcurso de la aplicación. Sin embargo, en el caso de la conversión en el dominio QMF del método de conversión de la información de filtro prototipo (por ejemplo, el coeficiente de filtro prototipo), se necesita una cantidad de operaciones considerable para un método de aplicación del valor convertido. En este caso, la cantidad de operaciones puede reducirse al mínimo mediante el método de parametrización del coeficiente HRTF en el método de conversión de información de filtro.
Aplicabilidad industrial
En consecuencia, el método y el aparato de procesamiento de señales según la presente invención utilizan información espacial facilitada por un codificador para generar las señales de sonido envolvente mediante información de filtro HRTF o información de filtro de conformidad con un usuario en un aparato de decodificación capaz de generar multicanales. La presente invención es aplicable de forma ventajosa a diversos tipos de decodificadores capaces de reproducir señales estéreo solo.
Aunque en la presente memoria se ha descrito e ilustrado la presente invención con referencia a las formas de realización preferidas de esta, resultará evidente para los expertos en la materia que es posible realizar diversas modificaciones y variantes. Por lo tanto, la presente invención pretende cubrir las modificaciones y variantes de la invención que entran dentro del alcance de las reivindicaciones adjuntas y sus equivalentes.

Claims (12)

  1. 5
    15
    25
    35
    45
    55
    65 E07708529
    27-08-2014
    REIVINDICACIONES
    1. Método de procesamiento de una señal de audio, que comprende las etapas siguientes:
    extraer información espacial a partir de un tren de bits;
    generar información de mapeado de fuentes mediante la utilización de la información espacial para fuentes múltiples;
    generar por lo menos una información de renderización mediante la utilización de información de mapeado de fuentes e información de filtro para un efecto de sonido envolvente;
    suavizar dicha por lo menos una información de renderización mediante la utilización de información de renderización adyacente a dicha por lo menos una información de renderización; y
    generar una señal de sonido envolvente que presenta el efecto de sonido envolvente aplicando dicha por lo menos una información de renderización suavizada a una señal de submezcla, siendo generada la señal de submezcla mediante la submezcla de las fuentes múltiples, en el que
    la señal de submezcla incluye un canal de entrada izquierdo y un canal de entrada derecho, y la señal de sonido envolvente generada incluye un canal de salida izquierdo y un canal de salida derecho, y
    la información de renderización comprende una primera información de renderización y una segunda información de renderización, estando la primera información de renderización destinada a generar el canal de salida izquierdo mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida derecho mediante su aplicación al canal de entrada derecho y estando la segunda información de renderización destinada a generar el canal de salida derecho mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida izquierdo mediante su aplicación al canal de entrada derecho.
  2. 2.
    Método según la reivindicación 1, en el que el suavizado de dicha por lo menos una información de renderización se realiza en un dominio del tiempo o un dominio de la frecuencia.
  3. 3.
    Método según la reivindicación 1 o 2, que comprende además la expansión de la información de renderización desde una primera banda de frecuencias en la que se genera la información de renderización hasta una segunda banda de frecuencias.
  4. 4.
    Método según la reivindicación 3, en el que la información de renderización se expande mediante la utilización de un mismo valor de la información de renderización en la primera banda de frecuencias.
  5. 5.
    Método según cualquiera de las reivindicaciones 1 a 4, en el que el filtro utilizado para el suavizado de dicha por lo menos una información de renderización se realiza mediante un filtro IIR de primer orden.
  6. 6.
    Método según cualquiera de las reivindicaciones 1 a 5, que comprende además la generación de una señal de sonido envolvente que presenta el efecto de sonido envolvente aplicando dicha por lo menos una información de renderización suavizada a una señal de submezcla generada mediante la submezcla de las fuentes múltiples.
  7. 7.
    Método según cualquiera de las reivindicaciones 1 a 6, en el que la información del filtro comprende por lo menos una información de filtro HRTF o un valor decidido en función de una selección del usuario.
  8. 8.
    Aparato para procesar señales de audio, que comprende:
    una unidad de decodificación de información espacial (800) que extrae información espacial de un tren de bits;
    una unidad de mapeado de fuentes (1010) que genera información de mapeado de fuentes mediante la utilización de la información espacial para fuentes múltiples;
    una unidad de integración (1030) que genera por lo menos una información de renderización mediante la utilización de información de mapeado de fuentes e información de filtro para un efecto de sonido envolvente;
    una unidad de suavizado (1042) que suaviza dicha por lo menos una información de renderización mediante la utilización de información de renderización adyacente a dicha por lo menos una información de renderización; y
    una unidad de renderización (900) que genera una señal de sonido envolvente que presenta el efecto de sonido envolvente aplicando dicha por lo menos una información de renderización suavizada a una señal de submezcla, siendo generada la señal de submezcla mediante la submezcla de las fuentes múltiples, en el que
    26 E07708529
    27-08-2014
    la señal de submezcla incluye un canal de entrada izquierdo y un canal de entrada derecho, y la señal de sonido envolvente generada incluye un canal de salida izquierdo y un canal de salida derecho, y
    5 la información de renderización comprende una primera información de renderización y una segunda información de renderización, estando la primera información de renderización destinada a generar el canal de salida izquierdo mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida derecho mediante su aplicación al canal de entrada derecho, y estando la segunda información de renderización destinada a generar el canal de salida derecho mediante su aplicación al canal de entrada izquierdo o a generar el canal de
    10 salida izquierdo mediante su aplicación al canal de entrada derecho.
  9. 9. Aparato según la reivindicación 8, en el que la unidad de suavizado suaviza por lo menos una información de renderización en un dominio del tiempo o un dominio de la frecuencia.
    15 10. Aparato según la reivindicación 8 o 9, en el que la unidad de suavizado expande la información de renderización desde una primera banda de frecuencias en la que se genera la información de renderización hasta una segunda banda de frecuencias.
  10. 11. Aparato según la reivindicación 10, en el que la unidad de suavizado se expande mediante la utilización de un 20 mismo valor de la información de renderización en la primera banda de frecuencias.
  11. 12. Aparato según cualquiera de las reivindicaciones 8 a 11, en el que la unidad de suavizado suaviza dicha por lo menos una información de renderización mediante la utilización de un filtro IIR de primer orden.
    25 13. Aparato según cualquiera de las reivindicaciones 8 a 12, que comprende además una unidad de renderización
    (900) que genera una señal de sonido envolvente que presenta un efecto de sonido envolvente aplicando la información de renderización suavizada a una señal de submezcla generada mediante la submezcla de las fuentes múltiples.
    30 14. Aparato según cualquiera de las reivindicaciones 8 a 13, en el que la información del filtro incluye por lo menos una información de filtro HRTF o un valor decidido en función de una selección del usuario.
  12. 15. Aparato según la reivindicación 14, en el que la información de filtro se convierte mediante conversión de
    dominio en información de un dominio para generar la señal de sonido envolvente. 35
    27
ES07708529.8T 2006-01-19 2007-01-19 Método y aparato para procesar una señal de medios Active ES2496571T3 (es)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
US75998006P 2006-01-19 2006-01-19
US759980P 2006-01-19
US77672406P 2006-02-27 2006-02-27
US776724P 2006-02-27
US77944106P 2006-03-07 2006-03-07
US77944206P 2006-03-07 2006-03-07
US77941706P 2006-03-07 2006-03-07
US779417P 2006-03-07
US779442P 2006-03-07
US779441P 2006-03-07
US78717206P 2006-03-30 2006-03-30
US787172P 2006-03-30
US78751606P 2006-03-31 2006-03-31
US787516P 2006-03-31
PCT/KR2007/000340 WO2007083952A1 (en) 2006-01-19 2007-01-19 Method and apparatus for processing a media signal

Publications (1)

Publication Number Publication Date
ES2496571T3 true ES2496571T3 (es) 2014-09-19

Family

ID=38287846

Family Applications (3)

Application Number Title Priority Date Filing Date
ES07701036.1T Active ES2446245T3 (es) 2006-01-19 2007-01-19 Método y aparato para procesar una señal de medios
ES07708531.4T Active ES2513265T3 (es) 2006-01-19 2007-01-19 Procedimiento y aparato para procesar una señal de medios
ES07708529.8T Active ES2496571T3 (es) 2006-01-19 2007-01-19 Método y aparato para procesar una señal de medios

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES07701036.1T Active ES2446245T3 (es) 2006-01-19 2007-01-19 Método y aparato para procesar una señal de medios
ES07708531.4T Active ES2513265T3 (es) 2006-01-19 2007-01-19 Procedimiento y aparato para procesar una señal de medios

Country Status (11)

Country Link
US (6) US8488819B2 (es)
EP (6) EP1974348B1 (es)
JP (6) JP4814343B2 (es)
KR (8) KR100953641B1 (es)
AU (1) AU2007206195B2 (es)
BR (1) BRPI0707136A2 (es)
CA (1) CA2636494C (es)
ES (3) ES2446245T3 (es)
HK (1) HK1127433A1 (es)
TW (7) TWI333386B (es)
WO (6) WO2007083956A1 (es)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
EP1974348B1 (en) * 2006-01-19 2013-07-24 LG Electronics, Inc. Method and apparatus for processing a media signal
GB2452021B (en) * 2007-07-19 2012-03-14 Vodafone Plc identifying callers in telecommunication networks
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
CN101911182A (zh) 2008-01-01 2010-12-08 Lg电子株式会社 用于处理音频信号的方法和装置
KR101328962B1 (ko) * 2008-01-01 2013-11-13 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
KR101061129B1 (ko) * 2008-04-24 2011-08-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
JPWO2010005050A1 (ja) * 2008-07-11 2012-01-05 日本電気株式会社 信号分析装置、信号制御装置及びその方法と、プログラム
EP2175670A1 (en) 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
MX2011011399A (es) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
EP2214162A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
TWI404050B (zh) * 2009-06-08 2013-08-01 Mstar Semiconductor Inc 多聲道音頻信號解碼方法與裝置
KR101805212B1 (ko) * 2009-08-14 2017-12-05 디티에스 엘엘씨 객체-지향 오디오 스트리밍 시스템
KR101692394B1 (ko) * 2009-08-27 2017-01-04 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
WO2011027494A1 (ja) 2009-09-01 2011-03-10 パナソニック株式会社 デジタル放送送信装置、デジタル放送受信装置およびデジタル放送送受信システム
WO2011048067A1 (en) * 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Apparatus for providing an upmix signal representation on the basis of a downmix signal representation, apparatus for providing a bitstream representing a multichannel audio signal, methods, computer program and bitstream using a distortion control signaling
TWI557723B (zh) * 2010-02-18 2016-11-11 杜比實驗室特許公司 解碼方法及系統
MX2012001696A (es) 2010-06-09 2012-02-22 Panasonic Corp Metodo de extension de ancho de banda, aparato de extension de ancho de banda, programa, circuito integrado, y aparato de descodificacion de audio.
CA3160488C (en) 2010-07-02 2023-09-05 Dolby International Ab Audio decoding with selective post filtering
US20120035940A1 (en) * 2010-08-06 2012-02-09 Samsung Electronics Co., Ltd. Audio signal processing method, encoding apparatus therefor, and decoding apparatus therefor
US8948403B2 (en) * 2010-08-06 2015-02-03 Samsung Electronics Co., Ltd. Method of processing signal, encoding apparatus thereof, decoding apparatus thereof, and signal processing system
US8908874B2 (en) 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
EP2429208B1 (en) * 2010-09-09 2020-12-02 MK Systems USA Inc. Video bit-rate control
KR20120040290A (ko) * 2010-10-19 2012-04-27 삼성전자주식회사 영상처리장치, 영상처리장치에 사용되는 음성처리방법, 및 음성처리장치
WO2012122397A1 (en) 2011-03-09 2012-09-13 Srs Labs, Inc. System for dynamically creating and rendering audio objects
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
US9317458B2 (en) * 2012-04-16 2016-04-19 Harman International Industries, Incorporated System for converting a signal
EP2717262A1 (en) 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
BR112015018522B1 (pt) 2013-02-14 2021-12-14 Dolby Laboratories Licensing Corporation Método, aparelho e meio não transitório que tem um método armazenado no mesmo para controlar a coerência entre canais de sinais de áudio com upmix.
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
US9558785B2 (en) 2013-04-05 2017-01-31 Dts, Inc. Layered audio coding and transmission
EP3020042B1 (en) 2013-07-08 2018-03-21 Dolby Laboratories Licensing Corporation Processing of time-varying metadata for lossless resampling
EP2830335A3 (en) 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, and computer program for mapping first and second input channels to at least one output channel
EP2830052A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
EP2830333A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
MX361115B (es) 2013-07-22 2018-11-28 Fraunhofer Ges Forschung Descodificador de audio multicanal, codificador de audio multicanal, métodos, programa de computadora y representación de audio codificada usando una decorrelación de señales de audio renderizadas.
KR102381216B1 (ko) * 2013-10-21 2022-04-08 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
CN104681034A (zh) 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
US10754925B2 (en) 2014-06-04 2020-08-25 Nuance Communications, Inc. NLU training with user corrections to engine annotations
US10373711B2 (en) 2014-06-04 2019-08-06 Nuance Communications, Inc. Medical coding system with CDI clarification request notification
EP2980789A1 (en) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
CN107771346B (zh) 2015-06-17 2021-09-21 三星电子株式会社 实现低复杂度格式转换的内部声道处理方法和装置
CN108028988B (zh) * 2015-06-17 2020-07-03 三星电子株式会社 处理低复杂度格式转换的内部声道的设备和方法
US10366687B2 (en) * 2015-12-10 2019-07-30 Nuance Communications, Inc. System and methods for adapting neural network acoustic models
WO2018057639A1 (en) 2016-09-20 2018-03-29 Nuance Communications, Inc. Method and system for sequencing medical billing codes
US11133091B2 (en) 2017-07-21 2021-09-28 Nuance Communications, Inc. Automated analysis system and method
US11024424B2 (en) 2017-10-27 2021-06-01 Nuance Communications, Inc. Computer assisted coding systems and methods
CN109859766B (zh) 2017-11-30 2021-08-20 华为技术有限公司 音频编解码方法和相关产品
US10602292B2 (en) 2018-06-14 2020-03-24 Magic Leap, Inc. Methods and systems for audio signal filtering

Family Cites Families (187)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5166685A (en) 1990-09-04 1992-11-24 Motorola, Inc. Automatic selection of external multiplexer channels by an A/D converter integrated circuit
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
DE4217276C1 (es) 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US5561736A (en) * 1993-06-04 1996-10-01 International Business Machines Corporation Three dimensional speech synthesis
DE69428939T2 (de) * 1993-06-22 2002-04-04 Deutsche Thomson-Brandt Gmbh Verfahren zur Erhaltung einer Mehrkanaldekodiermatrix
EP0637191B1 (en) 1993-07-30 2003-10-22 Victor Company Of Japan, Ltd. Surround signal processing apparatus
TW263646B (en) 1993-08-26 1995-11-21 Nat Science Committee Synchronizing method for multimedia signal
US6118875A (en) * 1994-02-25 2000-09-12 Moeller; Henrik Binaural synthesis, head-related transfer functions, and uses thereof
JPH07248255A (ja) 1994-03-09 1995-09-26 Sharp Corp 立体音像生成装置及び立体音像生成方法
JPH07288900A (ja) * 1994-04-19 1995-10-31 Matsushita Electric Ind Co Ltd 音場再生装置
EP0760197B1 (en) 1994-05-11 2009-01-28 Aureal Semiconductor Inc. Three-dimensional virtual audio display employing reduced complexity imaging filters
US5703584A (en) * 1994-08-22 1997-12-30 Adaptec, Inc. Analog data acquisition system
GB9417185D0 (en) * 1994-08-25 1994-10-12 Adaptive Audio Ltd Sounds recording and reproduction systems
JP3395807B2 (ja) * 1994-09-07 2003-04-14 日本電信電話株式会社 ステレオ音響再生装置
US6072877A (en) * 1994-09-09 2000-06-06 Aureal Semiconductor, Inc. Three-dimensional virtual audio display employing reduced complexity imaging filters
JPH0884400A (ja) 1994-09-12 1996-03-26 Sanyo Electric Co Ltd 音像制御装置
JPH08123494A (ja) 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
US5668924A (en) * 1995-01-18 1997-09-16 Olympus Optical Co. Ltd. Digital sound recording and reproduction device using a coding technique to compress data for reduction of memory requirements
JPH0974446A (ja) 1995-03-01 1997-03-18 Nippon Telegr & Teleph Corp <Ntt> 音声通信制御装置
IT1281001B1 (it) 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3088319B2 (ja) 1996-02-07 2000-09-18 松下電器産業株式会社 デコード装置およびデコード方法
JPH09224300A (ja) 1996-02-16 1997-08-26 Sanyo Electric Co Ltd 音像位置の補正方法及び装置
JP3483086B2 (ja) * 1996-03-22 2004-01-06 日本電信電話株式会社 音声電話会議装置
US5970152A (en) 1996-04-30 1999-10-19 Srs Labs, Inc. Audio enhancement system for use in a surround sound environment
US6252965B1 (en) * 1996-09-19 2001-06-26 Terry D. Beard Multichannel spectral mapping audio apparatus and method
US5886988A (en) * 1996-10-23 1999-03-23 Arraycomm, Inc. Channel assignment and call admission control for spatial division multiple access communication systems
US6711266B1 (en) 1997-02-07 2004-03-23 Bose Corporation Surround sound channel encoding and decoding
US6721425B1 (en) * 1997-02-07 2004-04-13 Bose Corporation Sound signal mixing
TW429700B (en) 1997-02-26 2001-04-11 Sony Corp Information encoding method and apparatus, information decoding method and apparatus and information recording medium
US6449368B1 (en) 1997-03-14 2002-09-10 Dolby Laboratories Licensing Corporation Multidirectional audio decoding
JP3594281B2 (ja) 1997-04-30 2004-11-24 株式会社河合楽器製作所 ステレオ拡大装置及び音場拡大装置
JPH1132400A (ja) 1997-07-14 1999-02-02 Matsushita Electric Ind Co Ltd デジタル信号再生装置
US6307941B1 (en) * 1997-07-15 2001-10-23 Desper Products, Inc. System and method for localization of virtual sound
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
JP4627880B2 (ja) 1997-09-16 2011-02-09 ドルビー ラボラトリーズ ライセンシング コーポレイション リスナーの周囲にある音源の空間的ひろがり感を増強するためのステレオヘッドホンデバイス内でのフィルタ効果の利用
US6081783A (en) 1997-11-14 2000-06-27 Cirrus Logic, Inc. Dual processor digital audio decoder with shared memory data transfer and task partitioning for decompressing compressed audio data, and systems and methods using the same
US7085393B1 (en) 1998-11-13 2006-08-01 Agere Systems Inc. Method and apparatus for regularizing measured HRTF for smooth 3D digital audio
US6414290B1 (en) 1998-03-19 2002-07-02 Graphic Packaging Corporation Patterned microwave susceptor
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
JP3781902B2 (ja) 1998-07-01 2006-06-07 株式会社リコー 音像定位制御装置および音像定位制御方式
DE19846576C2 (de) 1998-10-09 2001-03-08 Aeg Niederspannungstech Gmbh Plombierbare Verschließeinrichtung
DE19847689B4 (de) 1998-10-15 2013-07-11 Samsung Electronics Co., Ltd. Vorrichtung und Verfahren zur dreidimensionalen Tonwiedergabe
US6574339B1 (en) 1998-10-20 2003-06-03 Samsung Electronics Co., Ltd. Three-dimensional sound reproducing apparatus for multiple listeners and method thereof
JP3346556B2 (ja) 1998-11-16 2002-11-18 日本ビクター株式会社 音声符号化方法及び音声復号方法
MY123651A (en) * 1999-04-07 2006-05-31 Dolby Laboratories Licensing Corp Matrix improvements to lossless encoding and decoding
GB2351213B (en) 1999-05-29 2003-08-27 Central Research Lab Ltd A method of modifying one or more original head related transfer functions
KR100416757B1 (ko) 1999-06-10 2004-01-31 삼성전자주식회사 위치 조절이 가능한 가상 음상을 이용한 스피커 재생용 다채널오디오 재생 장치 및 방법
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US6175631B1 (en) * 1999-07-09 2001-01-16 Stephen A. Davis Method and apparatus for decorrelating audio signals
US7031474B1 (en) 1999-10-04 2006-04-18 Srs Labs, Inc. Acoustic correction apparatus
US6931370B1 (en) 1999-11-02 2005-08-16 Digital Theater Systems, Inc. System and method for providing interactive audio in a multi-channel audio environment
US6633648B1 (en) * 1999-11-12 2003-10-14 Jerald L. Bauck Loudspeaker array for enlarged sweet spot
US6611293B2 (en) 1999-12-23 2003-08-26 Dfr2000, Inc. Method and apparatus for synchronization of ancillary information in film conversion
AUPQ514000A0 (en) * 2000-01-17 2000-02-10 University Of Sydney, The The generation of customised three dimensional sound effects for individuals
JP4281937B2 (ja) 2000-02-02 2009-06-17 パナソニック株式会社 ヘッドホンシステム
US7266501B2 (en) 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US6973130B1 (en) 2000-04-25 2005-12-06 Wee Susie J Compressed video signal including information for independently coded regions
TW468182B (en) 2000-05-03 2001-12-11 Ind Tech Res Inst Method and device for adjusting, recording and playing multimedia signals
JP2001359197A (ja) 2000-06-13 2001-12-26 Victor Co Of Japan Ltd 音像定位信号の生成方法、及び音像定位信号生成装置
JP3576936B2 (ja) 2000-07-21 2004-10-13 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
JP4645869B2 (ja) 2000-08-02 2011-03-09 ソニー株式会社 ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
EP1211857A1 (fr) 2000-12-04 2002-06-05 STMicroelectronics N.V. Procédé et dispositif d'estimation des valeurs successives de symboles numériques, en particulier pour l'égalisation d'un canal de transmission d'informations en téléphonie mobile
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
JP3566220B2 (ja) 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
US6504496B1 (en) * 2001-04-10 2003-01-07 Cirrus Logic, Inc. Systems and methods for decoding compressed data
US20030007648A1 (en) * 2001-04-27 2003-01-09 Christopher Currell Virtual audio system and techniques
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
EP1397937A2 (en) * 2001-06-21 2004-03-17 1... Limited Loudspeaker
JP2003009296A (ja) 2001-06-22 2003-01-10 Matsushita Electric Ind Co Ltd 音響処理装置および音響処理方法
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP2003111198A (ja) 2001-10-01 2003-04-11 Sony Corp 音声信号処理方法および音声再生システム
MXPA03005133A (es) 2001-11-14 2004-04-02 Matsushita Electric Ind Co Ltd Dispositivo de codificacion, dispositivo de decodificacion y sistema de los mismos.
EP1315148A1 (en) 2001-11-17 2003-05-28 Deutsche Thomson-Brandt Gmbh Determination of the presence of ancillary data in an audio bitstream
TWI230024B (en) 2001-12-18 2005-03-21 Dolby Lab Licensing Corp Method and audio apparatus for improving spatial perception of multiple sound channels when reproduced by two loudspeakers
WO2003065353A1 (en) 2002-01-30 2003-08-07 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device and methods thereof
EP1341160A1 (en) 2002-03-01 2003-09-03 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding and for decoding a digital information signal
US7707287B2 (en) * 2002-03-22 2010-04-27 F5 Networks, Inc. Virtual host acceleration system
EP1500085B1 (en) 2002-04-10 2013-02-20 Koninklijke Philips Electronics N.V. Coding of stereo signals
ATE354161T1 (de) 2002-04-22 2007-03-15 Koninkl Philips Electronics Nv Signalsynthese
JP4187719B2 (ja) * 2002-05-03 2008-11-26 ハーマン インターナショナル インダストリーズ インコーポレイテッド マルチチャネル・ダウンミキシング装置
JP4296752B2 (ja) * 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
DE10228999B4 (de) 2002-06-28 2006-12-14 Advanced Micro Devices, Inc., Sunnyvale Konstellationsmanipulation zur Frequenz/Phasenfehlerkorrektur
JP4322207B2 (ja) 2002-07-12 2009-08-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化方法
AU2003281128A1 (en) 2002-07-16 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
BR0311601A (pt) * 2002-07-19 2005-02-22 Nec Corp Aparelho e método decodificador de áudio e programa para habilitar computador
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
WO2004028204A2 (en) 2002-09-23 2004-04-01 Koninklijke Philips Electronics N.V. Generation of a sound signal
CN1973318B (zh) 2002-10-14 2012-01-25 汤姆森许可贸易公司 用于对音频信号的表示描述进行编码或解码的方法和设备
AU2003219428A1 (en) 2002-10-14 2004-05-04 Koninklijke Philips Electronics N.V. Signal filtering
AU2003269551A1 (en) 2002-10-15 2004-05-04 Electronics And Telecommunications Research Institute Method for generating and consuming 3d audio scene with extended spatiality of sound source
US7698006B2 (en) 2002-10-15 2010-04-13 Electronics And Telecommunications Research Institute Apparatus and method for adapting audio signal according to user's preference
KR100542129B1 (ko) * 2002-10-28 2006-01-11 한국전자통신연구원 객체기반 3차원 오디오 시스템 및 그 제어 방법
WO2004047489A1 (en) * 2002-11-20 2004-06-03 Koninklijke Philips Electronics N.V. Audio based data representation apparatus and method
US8139797B2 (en) 2002-12-03 2012-03-20 Bose Corporation Directional electroacoustical transducing
US6829925B2 (en) 2002-12-20 2004-12-14 The Goodyear Tire & Rubber Company Apparatus and method for monitoring a condition of a tire
US7519530B2 (en) 2003-01-09 2009-04-14 Nokia Corporation Audio signal processing
KR100917464B1 (ko) 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
US7391877B1 (en) * 2003-03-31 2008-06-24 United States Of America As Represented By The Secretary Of The Air Force Spatial processor for enhanced performance in multi-talker speech displays
JP4196274B2 (ja) 2003-08-11 2008-12-17 ソニー株式会社 画像信号処理装置および方法、プログラム、並びに記録媒体
CN1253464C (zh) 2003-08-13 2006-04-26 中国科学院昆明植物研究所 安丝菌素苷类化合物及其药物组合物,其制备方法及其应用
US20050063613A1 (en) 2003-09-24 2005-03-24 Kevin Casey Network based system and method to process images
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US6937737B2 (en) 2003-10-27 2005-08-30 Britannia Investment Corporation Multi-channel audio surround sound from front located loudspeakers
KR101217649B1 (ko) * 2003-10-30 2013-01-02 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
US7680289B2 (en) * 2003-11-04 2010-03-16 Texas Instruments Incorporated Binaural sound localization using a formant-type cascade of resonators and anti-resonators
US7949141B2 (en) 2003-11-12 2011-05-24 Dolby Laboratories Licensing Corporation Processing audio signals with head related transfer function filters and a reverberator
WO2005053356A1 (en) * 2003-11-17 2005-06-09 1... Limited Loudspeaker
KR20050060789A (ko) 2003-12-17 2005-06-22 삼성전자주식회사 가상 음향 재생 방법 및 그 장치
WO2005069638A1 (en) 2004-01-05 2005-07-28 Koninklijke Philips Electronics, N.V. Flicker-free adaptive thresholding for ambient light derived from video content mapped through unrendered color space
EP1704726B8 (en) 2004-01-05 2018-09-12 TP Vision Holding B.V. Ambient light derived from video content by mapping transformations through unrendered color space
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7492915B2 (en) 2004-02-13 2009-02-17 Texas Instruments Incorporated Dynamic sound source and listener position based audio rendering
WO2005081229A1 (ja) 2004-02-25 2005-09-01 Matsushita Electric Industrial Co., Ltd. オーディオエンコーダ及びオーディオデコーダ
DE602005005640T2 (de) 2004-03-01 2009-05-14 Dolby Laboratories Licensing Corp., San Francisco Mehrkanalige audiocodierung
US7805313B2 (en) 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
RU2396608C2 (ru) * 2004-04-05 2010-08-10 Конинклейке Филипс Электроникс Н.В. Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема
TWI253625B (en) 2004-04-06 2006-04-21 I-Shun Huang Signal-processing system and method thereof
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US20050276430A1 (en) 2004-05-28 2005-12-15 Microsoft Corporation Fast headphone virtualization
US7283065B2 (en) * 2004-06-02 2007-10-16 Research In Motion Limited Handheld electronic device with text disambiguation
KR100636145B1 (ko) * 2004-06-04 2006-10-18 삼성전자주식회사 확장된 고해상도 오디오 신호 부호화 및 복호화 장치
KR100636144B1 (ko) * 2004-06-04 2006-10-18 삼성전자주식회사 오디오 신호 부호화/복호화 장치 및 방법
US20050273324A1 (en) * 2004-06-08 2005-12-08 Expamedia, Inc. System for providing audio data and providing method thereof
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
JP4594662B2 (ja) 2004-06-29 2010-12-08 ソニー株式会社 音像定位装置
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US7617109B2 (en) 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
WO2006003813A1 (ja) * 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ符号化及び復号化装置
TW200603652A (en) 2004-07-06 2006-01-16 Syncomm Technology Corp Wireless multi-channel sound re-producing system
KR20060003444A (ko) * 2004-07-06 2006-01-11 삼성전자주식회사 모바일 기기에서 크로스토크 제거 장치 및 방법
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
CN1985544B (zh) * 2004-07-14 2010-10-13 皇家飞利浦电子股份有限公司 处理立体声下混合信号的方法、装置、编译码器和***
KR100773539B1 (ko) 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
JP4641751B2 (ja) * 2004-07-23 2011-03-02 ローム株式会社 ピークホールド回路、それを備えるモータ駆動制御回路、及びそれを備えるモータ装置
TWI498882B (zh) * 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
TWI393121B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
DE102004042819A1 (de) 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
KR20060022968A (ko) 2004-09-08 2006-03-13 삼성전자주식회사 음향재생장치 및 음향재생방법
US7634092B2 (en) 2004-10-14 2009-12-15 Dolby Laboratories Licensing Corporation Head related transfer functions for panned stereo audio content
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
WO2006054360A1 (ja) * 2004-11-22 2006-05-26 Mitsubishi Denki Kabushiki Kaisha 音像生成装置及び音像生成プログラム
WO2006060278A1 (en) * 2004-11-30 2006-06-08 Agere Systems Inc. Synchronizing parametric coding of spatial audio with externally provided downmix
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
EP1817767B1 (en) 2004-11-30 2015-11-11 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
KR100682904B1 (ko) 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US20060195981A1 (en) * 2005-03-02 2006-09-07 Hydro-Industries Tynat Ltd. Freestanding combination sink and hose reel workstation
KR100608025B1 (ko) 2005-03-03 2006-08-02 삼성전자주식회사 2채널 헤드폰용 입체 음향 생성 방법 및 장치
EP1866911B1 (en) * 2005-03-30 2010-06-09 Koninklijke Philips Electronics N.V. Scalable multi-channel audio coding
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
EP1829424B1 (en) * 2005-04-15 2009-01-21 Dolby Sweden AB Temporal envelope shaping of decorrelated signals
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
KR101251426B1 (ko) * 2005-06-03 2013-04-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
MX2008000122A (es) 2005-06-30 2008-03-18 Lg Electronics Inc Metodo y aparato para codificar y descodificar una senal de audio.
EP1906706B1 (en) 2005-07-15 2009-11-25 Panasonic Corporation Audio decoder
US7880748B1 (en) * 2005-08-17 2011-02-01 Apple Inc. Audio view using 3-dimensional plot
JP5108768B2 (ja) * 2005-08-30 2012-12-26 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
WO2007031906A2 (en) 2005-09-13 2007-03-22 Koninklijke Philips Electronics N.V. A method of and a device for generating 3d sound
KR100739776B1 (ko) 2005-09-22 2007-07-13 삼성전자주식회사 입체 음향 생성 방법 및 장치
US20080262853A1 (en) * 2005-10-20 2008-10-23 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
CN101310563A (zh) * 2005-12-16 2008-11-19 唯听助听器公司 用于监视助听器装配***中的无线连接的方法和***
JP4944902B2 (ja) 2006-01-09 2012-06-06 ノキア コーポレイション バイノーラルオーディオ信号の復号制御
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
EP1974348B1 (en) * 2006-01-19 2013-07-24 LG Electronics, Inc. Method and apparatus for processing a media signal
US8190425B2 (en) 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
KR20080093024A (ko) 2006-02-07 2008-10-17 엘지전자 주식회사 부호화/복호화 장치 및 방법
KR100773562B1 (ko) * 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
RU2407226C2 (ru) 2006-03-24 2010-12-20 Долби Свидн Аб Генерация пространственных сигналов понижающего микширования из параметрических представлений мультиканальных сигналов
MX2008012324A (es) 2006-03-28 2008-10-10 Fraunhofer Ges Zur Foeerderung Metodo mejorado para la modulacion de señales en la reconstruccion de audio multicanal.
JP4875142B2 (ja) 2006-03-28 2012-02-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル・サラウンドサウンドのためのデコーダのための方法及び装置
JP4778828B2 (ja) 2006-04-14 2011-09-21 矢崎総業株式会社 電気接続箱
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
US7876904B2 (en) 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
MX2008012250A (es) * 2006-09-29 2008-10-07 Lg Electronics Inc Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
KR101111520B1 (ko) * 2006-12-07 2012-05-24 엘지전자 주식회사 오디오 처리 방법 및 장치
JP2009044268A (ja) 2007-08-06 2009-02-26 Sharp Corp 音声信号処理装置、音声信号処理方法、音声信号処理プログラム、及び、記録媒体
JP5056530B2 (ja) * 2008-03-27 2012-10-24 沖電気工業株式会社 復号システム、方法及びプログラム

Also Published As

Publication number Publication date
KR100953640B1 (ko) 2010-04-20
EP1974347A1 (en) 2008-10-01
US8351611B2 (en) 2013-01-08
US20080310640A1 (en) 2008-12-18
TWI315864B (en) 2009-10-11
EP1979898B1 (en) 2014-08-06
US20090003635A1 (en) 2009-01-01
ES2446245T3 (es) 2014-03-06
WO2007083953A1 (en) 2007-07-26
AU2007206195A1 (en) 2007-07-26
KR100953643B1 (ko) 2010-04-20
EP1979897A4 (en) 2011-05-04
EP1974345A1 (en) 2008-10-01
KR20080086548A (ko) 2008-09-25
TWI344638B (en) 2011-07-01
TW200731832A (en) 2007-08-16
US8208641B2 (en) 2012-06-26
JP2009524337A (ja) 2009-06-25
KR20070077134A (ko) 2007-07-25
EP1974347B1 (en) 2014-08-06
US20090028344A1 (en) 2009-01-29
KR100953645B1 (ko) 2010-04-20
CA2636494C (en) 2014-02-18
EP1974345A4 (en) 2012-12-26
WO2007083959A1 (en) 2007-07-26
HK1127433A1 (en) 2009-09-25
KR20080044869A (ko) 2008-05-21
JP4806031B2 (ja) 2011-11-02
JP4801174B2 (ja) 2011-10-26
US8521313B2 (en) 2013-08-27
JP2009524338A (ja) 2009-06-25
BRPI0707136A2 (pt) 2011-04-19
KR20080044866A (ko) 2008-05-21
JP2009524340A (ja) 2009-06-25
ES2513265T3 (es) 2014-10-24
TW200731833A (en) 2007-08-16
KR100953644B1 (ko) 2010-04-20
TW200735037A (en) 2007-09-16
EP1979897B1 (en) 2013-08-21
EP1974348A1 (en) 2008-10-01
EP1979897A1 (en) 2008-10-15
EP1979898A1 (en) 2008-10-15
TW200805255A (en) 2008-01-16
JP4814344B2 (ja) 2011-11-16
JP2009524339A (ja) 2009-06-25
JP4695197B2 (ja) 2011-06-08
TW200731831A (en) 2007-08-16
US8411869B2 (en) 2013-04-02
EP1974345B1 (en) 2014-01-01
WO2007083960A1 (en) 2007-07-26
EP1974346B1 (en) 2013-10-02
EP1974346A4 (en) 2012-12-26
KR20080046185A (ko) 2008-05-26
EP1974348A4 (en) 2012-12-26
KR100953641B1 (ko) 2010-04-20
TW200939208A (en) 2009-09-16
US8488819B2 (en) 2013-07-16
TWI469133B (zh) 2015-01-11
KR20080044868A (ko) 2008-05-21
US20080279388A1 (en) 2008-11-13
TW200805254A (en) 2008-01-16
TWI329462B (en) 2010-08-21
JP2009524336A (ja) 2009-06-25
AU2007206195B2 (en) 2011-03-10
US20090274308A1 (en) 2009-11-05
KR20080044867A (ko) 2008-05-21
EP1979898A4 (en) 2012-12-26
JP4787331B2 (ja) 2011-10-05
EP1974348B1 (en) 2013-07-24
WO2007083956A1 (en) 2007-07-26
KR100953642B1 (ko) 2010-04-20
TWI333386B (en) 2010-11-11
WO2007083955A1 (en) 2007-07-26
EP1974346A1 (en) 2008-10-01
CA2636494A1 (en) 2007-07-26
KR20080044865A (ko) 2008-05-21
JP4814343B2 (ja) 2011-11-16
US20090003611A1 (en) 2009-01-01
EP1974347A4 (en) 2012-12-26
JP2009524341A (ja) 2009-06-25
TWI333642B (en) 2010-11-21
WO2007083952A1 (en) 2007-07-26
TWI329461B (en) 2010-08-21

Similar Documents

Publication Publication Date Title
ES2496571T3 (es) Método y aparato para procesar una señal de medios
ES2940283T3 (es) Filtración eficiente con un banco de filtros modulado complejo
ES2306076T3 (es) Aparato y metodo para construir una señal de salida multicanal o para generar una señal de downmix.
ES2905764T3 (es) Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro
ES2376889T3 (es) Generación de mezclas descendentes espaciales a partir de representaciones paramétricas de señales multicanal
ES2923661T3 (es) Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia
US20090225991A1 (en) Method and Apparatus for Decoding an Audio Signal
CN101185119B (zh) 解码音频信号的方法和装置
ES2818562T3 (es) Descodificador de audio y procedimiento de descodificación
RU2395854C2 (ru) Способ и устройство для обработки медиасигнала
ES2812343T3 (es) Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro