ES2547232T3 - Método y aparato para procesar una señal - Google Patents

Método y aparato para procesar una señal Download PDF

Info

Publication number
ES2547232T3
ES2547232T3 ES09012229.2T ES09012229T ES2547232T3 ES 2547232 T3 ES2547232 T3 ES 2547232T3 ES 09012229 T ES09012229 T ES 09012229T ES 2547232 T3 ES2547232 T3 ES 2547232T3
Authority
ES
Spain
Prior art keywords
signal
ipd
value
channels
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09012229.2T
Other languages
English (en)
Inventor
Hyun Kook Lee
Sung Yong Yoon
Dong Soo Kim
Jae Hyun Lim
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Application granted granted Critical
Publication of ES2547232T3 publication Critical patent/ES2547232T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Método de procesado de una señal que incluye una señal de habla y una señal de audio, comprendiendo el método: recibir la señal, información de extensión e información espacial que indican un atributo de una señal de varios canales (L, R) para mezclar en sentido ascendente una señal de mezcla descendente (DMX); decodificar la señal de audio en un dominio de la frecuencia de acuerdo con una transformada de coeficiente discreta modificada inversa; decodificar la señal de habla en un dominio del tiempo utilizando un esquema de codificación por predicción lineal; reconstruir la señal de mezcla descendente (DMX) expandiendo la señal de audio decodificada y la señal de habla decodificada en una señal de mezcla descendente de banda completa utilizando la información de extensión, generándose la señal de mezcla descendente (DMX) a partir de la señal de varios canales (L, R); obtener una bandera de codificación de diferencias de fase entre canales, IPD, (bsPhaseCoding) que indica si se utiliza un valor de IPD en la información espacial a partir de un encabezamiento de la información espacial; obtener una bandera de modo de IPD (bsPhaseMode) sobre la base de la bandera de codificación de IPD (bsPhaseCoding) a partir de una trama de la información espacial, indicando la bandera de modo de IPD (bsPhaseMode) si el valor de IPD se utiliza en la trama de la información espacial; obtener el valor de IPD de una banda paramétrica (pb>=0, ..., pb >=4) de un espacio de tiempo paramétrico ([0], [1],...) en la trama, sobre la base de la bandera de modo de IPD (bsPhaseMode); suavizar el valor de IPD modificando el valor de IPD utilizando el valor de IPD de un espacio de tiempo paramétrico previo; y generar una señal de varios canales aplicando el valor de IPD suavizado a la señal de mezcla descendente (DMX), en el que la información espacial está dividida por el encabezamiento y una pluralidad de las tramas, en el que el valor de IPD indica una diferencia de fase entre dos canales de la señal de varios canales (L,R), en el que el espacio de tiempo paramétrico ([0], [1],...) indica un espacio de tiempo (1, 2, 3, 4, ..., N) al que se aplica el valor de IPD, en el que la banda paramétrica (pb>=0, ..., pb>=4) es por lo menos una subbanda de un dominio de la frecuencia que incluye el valor de IPD, en el que el valor de IPD se recibe cuando la relación entre el valor de IPD y un valor de la diferencia de nivel entre canales, ILD, supera un umbral, y en el que el valor de ILD indica una diferencia de nivel entre dos canales de la señal de varios canales incluida en la señal de mezcla descendente.

Description

15
25
35
45
55
65 E09012229
14-09-2015
DESCRIPCIÓN
Método y aparato para procesar una señal.
Campo técnico
La presente invención se refiere a un aparato para procesar una señal de audio y a un método para lo mismo. Aunque la presente invención resulta adecuada para una amplia variedad de aplicaciones, la misma es particularmente apropiada para mejorar la calidad de sonido de una señal y reconstruir más perfectamente una señal introducida, de tal manera que usa una señal generada a partir de cambiar una fase de la señal introducida y utiliza un valor de diferencia de fase entre canales de la señal con fase cambiada.
Antecedentes técnicos
En general, para generar una señal estereofónica a partir de una señal monofónica, la señal se codifica usando un decorrelador.
Además, un procesador de señales puede codificar una señal utilizando un valor de diferencia de nivel entre canales y un valor de correlación entre canales.
El artículo “MPEG4-Ext2: CE on Low Complexity parametric stereo” de W. Oomen et al., y publicado por la Organización Internacional para la Normalización, proporciona una descripción técnica detallada para el denominado “Core Experiment” sobre estéreo paramétrico de baja complejidad. En particular, se describe una alternativa a la síntesis de sonido estereofónico paramétrico basada en la FFT, fundamentándose dicha alternativa en la QMF y siendo de baja complejidad, en donde en lugar de FFT, se usan bancos de filtros basados en una QMF híbrida compleja que funcionan sobre el banco de filtros de QMF Compleja de 64 bandas utilizado en la tecnología de SBR (Replicación de la Banda Espectral).
Se puede considerar que “Improved Externalization an Frontal Perception of Headphone Signals”, S. G. Weinrich, Proceedings of 92nd AES Convention Preprint, da a conocer una técnica en la cual la externalización de imágenes espaciales depende de la recreación de la relación entre diferencias de tiempo interaurales y diferencias de nivel interaurales. La discriminación entre la parte frontal y la posterior depende del equilibrio adecuado de sonoridad entre las bandas direccionales trasera y delantera y posiblemente también del grado de fusión binaural.
Se puede considerar que “Low complexity parametric stereo coding in MPEG-4”, de H. Purnhagen, Proceedings on the 7th International Conference on Digital Audio Effects, da a conocer una técnica para la codificación estereofónica paramétrica en un codificador para la señal de audio monoaural subyacente. La técnica utiliza bancos de filtros modulados complejos, lo cual permite una implementación con baja complejidad computacional. El sistema es retrocompatible y permite una codificación estereofónica de alta calidad con una velocidad de bits total de 24 kbit/s cuando se usa en combinación con AAC de Alta Eficiencia.
Exposición de la invención
Problema técnico
No obstante, en caso de que una señal de audio se genere utilizando un decorrelador, este último no puede reproducir de manera precisa una diferencia de fase o retardo existente entre señales del canal.
En caso de que se codifique una señal utilizando un valor de diferencia de nivel entre canales y un valor de correlación entre canales, no se puede restablecer ni reflejar una diferencia de fase entre canales de la señal de entrada. Por lo tanto, resulta difícil llevar a cabo una localización precisa de imágenes sonoras. Además, no se puede restablecer la reverberación de una señal de entrada.
Solución técnica
Por consiguiente, la presente invención se refiere a un aparato para procesar una señal de audio y a un método para lo mismo, según definen las reivindicaciones independientes adjuntas 1 y 4, las cuales eluden sustancialmente uno o más de los problemas debidos a limitaciones y desventajas de la técnica relacionada.
Un objetivo de la presente invención es proporcionar un aparato para procesar una señal y un método para lo mismo, por medio de los cuales la calidad de sonido se mejora y se puede proporcionar una señal próxima a un sonido original de tal manera que se reconstruye y cambia una fase de una señal decodificada de audio o de habla.
Efectos ventajosos
Por lo tanto, la presente invención proporciona los siguientes efectos y/o ventajas.
E09012229
14-09-2015
En un método y un aparato para procesar una señal de audio de acuerdo con la presente invención, recibiendo la bandera de modo de diferencia de fase entre canales (IPD) que indica si el valor de diferencia de fase entre canales (IPD) se usa para cada trama, se puede decodificar una señal utilizando el valor de diferencia de fase entre canales
5 (IPD) si ello fuera necesario.
Además, modificando (suavizando) el valor de diferencia de fase entre canales de un espacio de tiempo paramétrico actual con la utilización del valor de diferencia de fase entre canales de un espacio de tiempo paramétrico previo, se puede eliminar el ruido que se puede generar de manera transitoria a partir de una diferencia entre las dos
10 informaciones de fase entre canales.
Además, transmitiendo el valor de diferencia de fase entre canales únicamente si se cumple una condición predeterminada, se puede aumentar la eficiencia de codificación. Por otro lado, también se puede decodificar una señal próxima a un sonido original.
15
Descripción de los dibujos
Los dibujos adjuntos, los cuales se incluyen para aportar una interpretación adicional de la invención, ilustran formas de realización de la misma y, junto con la descripción, sirven para explicar los principios de la invención. 20 En los dibujos:
la figura 1 es un diagrama correspondiente a un concepto de un método de procesado de señales de audio según una forma de realización de la presente invención;
25 la figura 2 es un diagrama de bloques de un aparato para procesar una señal de audio de acuerdo con una forma de realización de la presente invención;
la figura 3 es una gráfica correspondiente a una relación entre una fase y un tiempo en una señal;
30 la figura 4 es un diagrama de bloques detallado de una unidad de medición de IPD y una unidad de obtención de IPD representadas en la figura 2;
la figura 5 es un diagrama de bloques de un aparato de procesado de señales de audio según otra forma de 35 realización de la presente invención;
la figura 6 es un diagrama de bloques de un aparato de procesado de señales de audio según otra forma de realización de la presente invención;
40 la figura 7 es un diagrama correspondiente a un concepto de espacio de tiempo paramétrico según una técnica relacionada;
la figura 8 es un diagrama esquemático correspondiente a un método de modificación (suavización) del valor de diferencia de fase entre canales según otra forma de realización de la presente invención;
45 la figura 9 es un diagrama de bloques de un aparato de procesado de señales de audio según otra forma de realización de la presente invención representada en la figura 8;
la figura 10 es un diagrama correspondiente a un concepto de un problema resuelto por un aparato y un método 50 de procesado de señales de audio según otra forma de realización de la presente invención;
la figura 11 y la figura 12 son diagramas de bloques de un aparato de procesado de señales de audio según otra forma de realización de la presente invención;
55 la figura 13 es un diagrama correspondiente a un concepto de utilización de un valor de diferencia de fase entre canales (IPD) global a nivel de tramas, según otra forma de realización de la presente invención;
la figura 14 es un diagrama de bloques de un aparato de procesado de señales de audio según otra forma de realización de la presente invención;
60 las figuras 15 a 17 son diagramas de bloques de un aparato de procesado de señales de audio según otra forma de realización de la presente invención;
la figura 18 es un diagrama esquemático de una configuración de un producto que incluye una unidad de 65 obtención de banderas de codificación de IPD, una unidad de obtención de banderas de modo de IPD, una
15
25
35
45
55
65 E09012229
14-09-2015
unidad de obtención de IPD y una unidad de mezclado ascendente según otra forma de realización de la presente invención;
la figura 19 representa diagramas esquemáticos correspondientes a relaciones de productos que incluyen una unidad de obtención de banderas de codificación de IPD, una unidad de obtención de banderas de modo de IPD, una unidad de obtención de IPD y una unidad de mezclado ascendente, según otra forma de realización de la presente invención, respectivamente; y
la figura 20 es un diagrama de bloques esquemático de un aparato de decodificación de señales de difusión general que incluye una unidad de obtención de banderas de codificación de IPD, una unidad de obtención de banderas de modo de IPD, una unidad de obtención de IPD y una unidad de mezclado ascendente según otra forma de realización de la presente invención.
Modo óptimo
En la descripción proporcionada a continuación se expondrán características y ventajas adicionales de la invención, y las mismas se pondrán de manifiesto parcialmente a partir de dicha descripción, o pueden llegar a asimilarse al poner en práctica la invención. Los objetivos y otras ventajas de la invención se materializarán y obtendrán con la estructura que se indica particularmente en la redacción de la descripción y de sus reivindicaciones, así como en los dibujos adjuntos.
Preferentemente, un método de procesado de una señal de audio incluye recibir una señal de mezcla descendente generada a partir de una señal de diversos canales e información especial que indica un atributo de la señal de diversos canales para mezclar en sentido ascendente la señal de mezcla descendente; obtener una bandera de codificación de diferencia de fase entre canales (IPD) que indica si un valor de IPD se usa para la información espacial a partir del encabezamiento de la información espacial; obtener una bandera de modo de IPD sobre la base de la bandera de codificación de IPD de la trama de la información espacial, indicando la bandera de modo de IPD si el valor de IPD se usa en una trama de la información espacial; obtener el valor de IPD de una banda paramétrica de un espacio de tiempo paramétrico en la trama, sobre la base de la bandera de modo de IPD; suavizar el valor de IPD modificando el valor de IPD con la utilización del valor de IPD de un espacio de tiempo paramétrico previo; y generar la señal de diversos canales aplicando el valor de IPD suavizado a la señal de mezcla descendente. Preferentemente, la información espacial permanece dividida por el encabezamiento y una pluralidad de las tramas, y el valor de IPD indica una diferencia de fase entre dos canales de la señal de diversos canales. El espacio de tiempo paramétrico indica un espacio de tiempo en el cual se aplica el valor de IPD, y la banda paramétrica es por lo menos una subbanda de un dominio de la frecuencia, que incluye el valor de IPD.
Preferentemente, el método comprende además generar un ángulo de corrección que indica un ángulo entre dos canales de la señal de diversos canales utilizando el valor de IPD; y modificar el ángulo de corrección utilizando el ángulo de corrección del espacio de tiempo paramétrico previo.
Preferentemente, el método comprende además determinar el valor de IPD del espacio de tiempo en el cual no se aplica el valor de IPD utilizando por lo menos uno del valor de IPD y el valor de IPD suavizado.
Debe apreciarse que tanto la anterior descripción general como la siguiente descripción detallada son ejemplificativas y explicativas, y están destinadas a proporcionar una explicación adicional de la invención según se reivindica.
Modo correspondiente a la invención
A continuación se hará referencia con mayor detalle a las formas de realización preferidas de la presente invención, cuyos ejemplos se ilustran en los dibujos adjuntos. En primer lugar, las terminologías o palabras utilizadas en esta memoria descriptiva y en las reivindicaciones no se consideran como limitadas a los significados generales o de diccionario, y deberían considerarse como significados y conceptos que se corresponden con la idea técnica de la presente invención sobre la base del principio de que un inventor puede definir apropiadamente los conceptos de las terminologías para describir su invención de la mejor manera. Las formas de realización que se dan a conocer en esta exposición y las configuraciones mostradas en los dibujos adjuntos son simplemente formas de realización preferidas y no representan todas las ideas técnicas de la presente invención. Por lo tanto, debe apreciarse que la presente invención comprende las modificaciones y variantes de esta invención siempre que se sitúen dentro del alcance de las reivindicaciones adjuntas.
En primer lugar, se entiende que el concepto de “codificación” en la presente invención incluye tanto codificación como decodificación.
En segundo lugar, “información” en esta exposición es una terminología que incluye de forma general valores, parámetros, coeficientes, elementos y similares, y su significado puede considerarse como diferente ocasionalmente, por lo cual la presente invención no es limitativa. Una señal estereofónica se considera como un
15
25
35
45
55 E09012229
14-09-2015
ejemplo de señal en esta exposición, por lo cual los ejemplos de la presente invención no son limitativos. Por ejemplo, una señal en esta exposición puede incluir una señal de diversos canales que tiene por lo menos tres o más canales.
La figura 1 es un diagrama correspondiente a un concepto de un método de procesado de señales de audio según una forma de realización de la presente invención.
Haciendo referencia a la figura 1, la información espacial se puede dividir con un encabezamiento y una pluralidad de tramas. En este caso, la información espacial es la información que indica un atributo de una señal de diversos canales que es una señal de entrada. Además, la información espacial puede incluir un valor de diferencia de nivel entre canales que indica una diferencia de nivel entre dos canales de entre diversos canales, un valor de correlación entre canales que indica una correlación entre los dos canales, y un valor de diferencia de fase entre canales que indica una diferencia de fase entre los dos canales. Esta información espacial es utilizable en la reconstrucción, mediante mezclado ascendente, de una señal de mezcla descendente, que se generó a partir del mezclado en sentido descendente de una señal de diversos canales por parte de un decodificador.
El encabezamiento de la información espacial incluye una bandera de codificación de diferencia de fase entre canales (bsPhaseCoding) que indica si en las tramas completas existe una trama para utilizar el valor de diferencia de fase entre canales. En particular, puesto que la bandera de codificación de diferencia de fase entre canales está incluida en el encabezamiento, se puede determinar si el valor de diferencia de fase entre canales se usa para por lo menos una de todas las tramas de la información espacial. En la Tabla 1 se muestra el significado de la bandera de codificación de diferencia de fase entre canales.
[Tabla 1]
bsPhaseCoding
Significado
1
Esto indica que se usa la codificación de IPD en la información espacial. Concretamente, esto indica que se usa un valor de IPD en por lo menos una de entre todas las tramas.
0
Esto indica que no se usa la codificación de IPD en la información espacial. Concretamente, esto indica que no se usa el valor de IPD en todas las tramas.
Por otra parte, en cada una de las tramas de la información espacial se incluye una bandera de modo de diferencia de fase entre canales (bsPhaseMode), la cual indica si el valor de diferencia de fase entre canales se usa para una trama. La bandera de modo de diferencia de fase entre canales se incluye en la trama únicamente si la bandera de codificación de diferencia de fase entre canales está fijada a 1, es decir, la bandera de codificación de diferencia de fase entre canales indica que la codificación de IPD se usa para la información espacial. El significado detallado de la bandera de modo de diferencia de fase entre canales (bsPhaseMode) se muestra en la Tabla 2.
[Tabla 2]
bsPhaseMode
Significado
1
Esto indica que se usa un valor de IPD en una trama actual.
0
Esto indica que el valor de IPD no se usa en una trama actual.
Haciendo referencia a continuación a la figura 1, si una bandera de modo de diferencia de fase entre canales de la Trama 2 se fija a 1 [bsPhaseMode=1], en la Trama 2 se incluye un valor de diferencia de fase entre canales (IPD) como valor diferente de cero. Si una bandera de modo de diferencia de fase entre canales de la Trama 3 se fija a 0 [bsPhaseMode=0], un valor de diferencia de fase entre canales (IPD) en la Trama 3 tiene un valor fijado a 0.
Por lo tanto, el valor de diferencia de fase entre canales se obtiene sobre la base de la bandera de codificación de diferencia de fase entre canales y la bandera de modo de diferencia de fase entre canales, y a continuación se aplica a una señal de mezcla descendente para obtener por mezcla ascendente una señal de diversos canales.
La figura 2 es un diagrama de bloques de un aparato para procesar una señal de audio de acuerdo con una forma de realización de la presente invención.
Haciendo referencia a la figura 2, un aparato de procesado de señales 200 incluye una unidad de mezclado descendente 210, una unidad de generación de información espacial 220, una unidad de obtención de información 230 y una unidad de mezclado ascendente 240.
La unidad de mezclado descendente 210 recibe una entrada de una señal de diversos canales y a continuación puede generar una señal de mezcla descendente (DMX). En este caso, la señal de diversos canales incluye una señal que tiene por lo menos tres o más canales. Además, la señal de diversos canales puede incluir una señal que tiene un canal monofónico o estereofónico. La unidad de mezclado descendente 210 puede generar una señal de
15
25
35
45
55
65 E09012229
14-09-2015
mezcla descendente que tiene menos canales que los correspondientes de la señal de diversos canales por medio del mezclado descendente de la señal de diversos canales.
Tal como se ha mencionado en la descripción anterior haciendo referencia a la figura 1, la unidad de generación de información espacial 220 genera información espacial para mezclar en sentido ascendente la señal de mezcla descendente en un decodificador más tarde. Además, esta información espacial puede incluir un atributo de la señal de diversos canales. Tal como se ha mencionado en la descripción anterior, la información espacial puede incluir un valor de diferencia de nivel entre canales, un valor de correlación entre canales, un valor de diferencia de fase entre canales, etcétera. En esta exposición, el valor de diferencia de fase entre canales se explica con mayor detalle haciendo referencia a la unidad de generación de información espacial 220 representada en la figura 2 de la manera siguiente.
En primer lugar, la unidad de generación de información espacial 220 incluye una unidad de determinación de uso de IPD 221, una unidad de medición de valores de IPD 222, una unidad de generación de banderas de modo de IPD 223 y una unidad de generación de banderas de codificación de IPD 224.
La unidad de determinación de uso de IPD 221 puede determinar si el valor de diferencia de fase entre canales (IPD) se incluirá en la información espacial. En particular, la unidad de determinación de uso de IPD 221 puede determinar si el valor de diferencia de fase entre canales (IPD) se incluirá en la información espacial basándose en una característica de la señal de diversos canales, y más particularmente, en una relación del valor de diferencia de fase entre canales y el valor de diferencia de nivel entre canales. Por ejemplo, si la señal de diversos canales es una señal de habla, se puede determinar que el valor de diferencia de fase entre canales (IPD) se incluirá en la información espacial. Esto se explicará con mayor detalle a continuación.
Si la unidad de determinación de uso de IPD 221 determina que se usa el valor de diferencia de fase entre canales, la unidad de medición de valores de IPD mide una diferencia de fase entre dos canales de la señal de diversos canales introducida en la unidad de generación de información espacial 200. En este caso, la diferencia de fase medida puede incluir una fase y/o un ángulo, una diferencia de tiempo o un valor de índice correspondiente al ángulo
o la diferencia de tiempo. En una señal, la fase y el tiempo presentan una relación estrecha, lo cual se explicará con mayor detalle a continuación haciendo referencia a la figura 3.
La unidad de generación de banderas de modo de IPD 223 genera la bandera de modo de diferencia de fase entre canales (bsPhaseMode) descrita en referencia a la figura 1. En particular, la bandera de modo de diferencia de fase entre canales indica si el valor de diferencia de fase entre canales se usa para una trama. Además, esta trama puede ser una trama actual en la cual se incluye el valor de diferencia de fase entre canales. Por lo tanto, la bandera de modo de diferencia de fase entre canales puede existir de forma diversa para cada trama. Particularmente, puede que la bandera de modo de diferencia de fase entre canales no se incluya en la trama, cuando la bandera de codificación de diferencia de fase entre canales indica que el valor de IPD no se usa para todas las tramas de la información espacial. Además, la bandera de modo de diferencia de fase entre canales puede tener un valor fijado a 0 o1.
Además, la unidad de generación de banderas de codificación de IPD 224 genera la bandera de codificación de diferencia de fase entre canales (bsPhaseCoding) descrita en referencia a la figura 1. En particular, puesto que se genera una bandera de codificación de IPD que indica si se usa la codificación de diferencia de fase entre canales en la información espacial, si el valor de diferencia de fase entre canales se usa en por lo menos una de las tramas de la información espacial compartimentada en la figura 1, lo normal es que la bandera de codificación de diferencia de fase entre canales indique 1.
La unidad de obtención de información 230 recibe una entrada de la información espacial proveniente de la unidad de generación de información espacial 220. En este caso, la bandera de codificación de diferencia de fase entre canales (bsPhaseCoding) y la bandera de modo de diferencia de fase entre canales (bsPhaseMode) se pueden incluir en la información espacial así como el valor de fase entre canales (IPD). La unidad de obtención de información 230 incluye una unidad de obtención de banderas de codificación de IPD 231, una unidad de obtención de banderas de modo de IPD 232 y una unidad de obtención de valores de IPD 233.
La unidad de obtención de banderas de codificación de IPD 231 obtiene una bandera de codificación de diferencia de fase entre canales que indica si el valor de diferencia de fase entre canales se usa en por lo menos una trama de todas las tramas de la información espacial, a partir de un encabezamiento de la información espacial. El significado de la bandera de codificación de diferencia de fase entre canales se muestra en la Tabla 1.
La unidad de obtención de banderas de modo de IPD 232 obtiene una bandera de modo de diferencia de fase entre canales que indica si el valor de diferencia de fase entre canales se usa para una trama, a partir de la trama de la información espacial. En particular, si la bandera de codificación de diferencia de fase entre canales indica que se usa el valor de diferencia de fase entre canales [bsPhaseCoding=1], la unidad de obtención de banderas de modo de IPD 232 puede obtener la bandera de modo de diferencia de fase entre canales.
15
25
35
45
55
65 E09012229
14-09-2015
Además, la unidad de obtención de valores de IPD 233 puede obtener el valor de diferencia de fase entre canales sobre la base de la bandera de modo de diferencia de fase entre canales. El valor de diferencia de fase entre canales puede existir para una banda paramétrica. En esta exposición, una banda paramétrica indica por lo menos una subbanda en la cual está incluido el valor de diferencia de fase entre canales. Esto se explicará con mayor detalle haciendo referencia a la figura 7 y la figura 8 a continuación.
Por otro lado, la unidad de mezclado ascendente 240 puede generar una señal de diversos canales aplicando el valor de diferencia de fase entre canales obtenido por la unidad de obtención de información 230 en la señal de mezcla descendente introducida desde la unidad de mezclado descendente 210. En este caso, mezclado ascendente significa que se aplica una matriz de mezclado ascendente para generar una señal que tiene más canales que los correspondientes de la señal de mezcla descendente. Además, una señal mezclada en sentido ascendente indica una señal a la cual se aplica la matriz de mezclado ascendente. La señal de diversos canales es la señal que tiene más canales que los correspondientes de la señal de mezcla descendente. Por otro lado, la señal de diversos canales puede indicar una señal en la cual se aplica la propia matriz de mezclado ascendente. La señal de diversos canales puede incluir una señal en el dominio de QMF generada para presentar una pluralidad de canales mediante la aplicación de la matriz de mezclado ascendente en ella o una señal final transformada en una señal en el dominio del tiempo a partir de la señal en el dominio de QMF.
Así, el aparato y el método de procesado de señales de acuerdo con la presente invención usan el valor de diferencia de fase entre canales sobre la base de la bandera de codificación de diferencia de fase entre canales y la bandera de modo de diferencia de fase entre canales. Por lo tanto, la presente invención restablece la reverberación la cual resulta difícil de restablecer usando el valor de diferencia de nivel entre canales y el valor de correlación entre canales. Además, la presente invención puede llevar a cabo claramente una localización de imágenes sonoras.
La figura 3 es una gráfica correspondiente a una relación entre la fase y el tiempo en una señal. La gráfica de la izquierda muestra una señal en el dominio de la fase-amplitud. Una señal (a) es una señal introducida sin variación de fase. Por otro lado, una señal (b) indica una señal que tiene una fase retardada adicionalmente en π/2 con respecto a la señal (a).
Al mismo tiempo, la gráfica de la derecha que se muestra en la figura 3 indica una señal en el dominio del tiempoamplitud y representa las señales (a)’ y (b)’ correspondientes a las señal (a) y (b) de la gráfica de la izquierda, respectivamente. En particular, la señal (b), que es la señal retardada adicionalmente en π/2 con respecto a la señal (a), se puede representar igual a la señal (b)’ que es la señal introducida con un retardo adicional de 33 ms con respecto a la señal (a)’. Así, la fase y el tiempo presentan una estrecha relación en una señal y proporcionan el mismo efecto incluso si se transforman en valores que se corresponden mutuamente.
La figura 4 es un diagrama de bloques detallado de la unidad de medición de valores de IPD 222 y la unidad de obtención de valores de IPD 233 mostradas en la figura 2. Haciendo referencia a la figura 4, la unidad de medición de IPD 410 incluye una unidad de medición de valores de IPD 411, una unidad de cuantificación de IPD 412 y una unidad de generación de banderas de modo de cuantificación de IPD 413.
La unidad de medición de valores de IPD 411 mide el valor de diferencia de fase entre canales a partir de la señal de diversos canales introducida. Tal como se ha mencionado en la descripción anterior, el valor de diferencia de fase entre canales puede incluir un ángulo de fase, un valor de retardo de tiempo o un valor de índice correspondiente al ángulo de fase o el valor de retardo de tiempo.
La unidad de cuantificación de IPD 412 cuantifica el valor de diferencia de fase entre canales medido por la unidad de medición de valores de IPD 411. La unidad de cuantificación de IPD 412 puede incluir además una estructura detallada para cuantificar el valor de diferencia de fase entre canales mediante un método de diferencia de acuerdo con un intervalo de cuantificación. Por ejemplo, una primera unidad de cuantificación (no representada en el dibujo) puede cuantificar el valor de diferencia de fase entre canales utilizando un intervalo de cuantificación preciso (intervalo preciso) y una segunda unidad de cuantificación puede cuantificar el valor de diferencia de fase entre canales utilizando un intervalo de cuantificación grueso (intervalo grueso).
Además, la unidad de generación de banderas de modo de cuantificación de IPD 413 puede generar una bandera de modo de cuantificación (IPD_quant_mode_flag) que indica un esquema de cuantificación del valor de diferencia de fase entre canales. En particular, la bandera de modo de cuantificación puede indicar si el valor de diferencia de fase entre canales se cuantifica usando un intervalo preciso o un intervalo grueso.
La unidad de obtención de valores de diferencia de fase entre canales 420 incluye una unidad de obtención de banderas de modo de cuantificación de IPD 421, una primera unidad de decuantificación 422, una segunda unidad de decuantificación 423 y una unidad de obtención de valores de IPD decuantificados 424.
En primer lugar, la unidad de obtención de banderas de modo de cuantificación de IPD 421 obtiene una bandera de modo de cuantificación (IPD_quant_mode_flag) que indica un esquema de cuantificación aplicado al valor de
10
15
20
25
30
35
40
45
50
55
60 E09012229
14-09-2015
diferencia de fase entre canales a partir de la información espacial recibida del codificador. El significado de la bandera de modo de cuantificación se muestra en la Tabla 3.
[Tabla 3]
IPD_quant_mode_flag
Significado
1
Este valor indica que el valor de diferencia de fase entre canales se cuantifica usando un intervalo preciso.
0
El valor indica que el valor de diferencia de fase entre canales se cuantifica utilizando un intervalo grueso.
Si la bandera de modo de cuantificación se fija a 0 (IPD_quant_mode_flag=0), la primera unidad de decuantificación 422 recibe un valor de diferencia de fase entre canales y a continuación decuantifica el valor de diferencia de fase entre canales utilizando el intervalo grueso. Por el contrario, si la bandera de modo de cuantificación se fija a 1 (IPD_quant_mode_flag=1), la segunda unidad de decuantificación 423 recibe el valor de diferencia de fase entre canales y a continuación decuantifica el valor de diferencia de fase entre canales utilizando el intervalo preciso.
Posteriormente, la unidad de obtención de valores de IPD decuantificados 424 puede obtener el valor de diferencia de fase entre canales decuantificado, a partir de la primera unidad de decuantificación 422 o la segunda unidad de decuantificación 423.
La figura 5 es un diagrama de bloques de un aparato de procesado de señales 500 para compensar una reconstrucción de fase de una señal de diversos canales utilizando una bandera de cambio de fase.
Haciendo referencia a la figura 5, un aparato de procesado de señales 500 incluye una unidad de determinación de valores de IPD globales a nivel de bandas 510, una unidad de modificación de señales 520, una unidad de mezclado descendente 530, una unidad de generación de información espacial 540, una unidad de obtención de información espacial 560 y una unidad de cambio de fase 570.
En primer lugar, la unidad de determinación de valores de IPD globales a nivel de bandas 510 recibe una entrada de una señal de diversos canales. En este caso, la señal de diversos canales puede incluir una señal que tiene por lo menos un canal desfasado y, particularmente, puede incluir una señal estereofónica o una señal que tiene por lo menos tres o más canales. La unidad de determinación de valores de IPD globales a nivel de bandas 510 determina una bandera de cambio de fase que indica el alcance de la fase, la cual se va a cambiar para conseguir que la señal de diversos canales introducida se sitúe en fase, a partir de la señal de diversos canales.
La bandera de cambio de fase puede incluir información de bandera que indica que una fase de la señal de diversos canales se ha cambiado y puede incluir además información relevante para un cambio de fase, tal como el alcance del cambio de fase, la señal de canal cuya fase se cambia, la banda de frecuencias en la que se produce el cambio de fase, información de tiempo correspondiente a un cambio de fase y similares, así como la información de bandera.
En primer lugar, en caso de que la bandera de cambio de fase indique solamente información de bandera, una fase de la señal de diversos canales se puede cambiar utilizando un valor fijo. Por ejemplo, en caso de que la señal de diversos canales sea una señal estereofónica, se puede generar la señal de diversos canales cambiando una fase de tal manera que los canales derecho a izquierdo resulten ortogonales entre sí reduciendo la fase del canal derecho de la señal estereofónica en π/2 o aumentando la fase de su canal izquierdo en π/2. En lugar de limitarse al cambio de fase de π/2, se puede generar la pluralidad de señales de canales cambiando una fase para permitir que los canales derecho e izquierdo resulten ortogonales entre sí.
Al hacer esto, la fase cambiada es aplicable igualmente a la totalidad de las bandas de frecuencia de la pluralidad de señales de canales. Por otra parte, en lugar de transferir información que indica que una fase de por lo menos un canal de la pluralidad de señales de canales se modifica en π/2 o información sobre una fase que se ha cambiado para obtener ortogonalidad, se puede usar información fijada previamente en el lado del decodificador más adelante, por lo cual la presente invención no queda limitada.
En este caso, el tamaño de transporte de la información se puede reducir a menos que el correspondiente de un valor de diferencia de fase entre canales, portador, en cada una de una pluralidad de bandas paramétricas. Además, también se puede evitar el problema de la posible aparición de una diferencia de fase en el caso en el que se aplique información de diferencia entre canales para cada banda paramétrica.
Adicionalmente, la bandera de cambio de fase puede incluir además información detallada asociada a un cambio de fase así como la información de bandera. En este caso, la información detallada puede incluir información de cambio de una fase, información sobre una señal de canal con la fase cambiada, información sobre una banda de frecuencias y el tiempo en el que se produce un cambio de fase, y similares.
15
25
35
45
55
65 E09012229
14-09-2015
Al mismo tiempo, la bandera de cambio de fase puede indicar de manera diversa el alcance de un cambio de fase de una pluralidad de señales de canal para cada trama. En caso de que la bandera de cambio de fase incluya solamente la información de bandera, se puede indicar si se ha cambiado la fase por cada trama. En caso de que la bandera de cambio de fase incluya información de bandera e información detallada sobre un cambio de fase, la información detallada puede indicar el alcance del cambio de la fase por cada subbanda o banda paramétrica, o puede indicar el alcance del cambio de fase en un tiempo correspondiente de forma diversa por cada cobertura de tiempo predeterminada, por ejemplo, una trama, un espacio de tiempo, etcétera.
Por otra parte, la bandera de cambio de fase se puede usar en paralelo con el valor de diferencia de fase entre canales que se ha explicado en referencia a las figuras 1 a 4.
La unidad de modificación de señales 520 recibe la bandera de cambio de fase y la pluralidad de señales de canal. La pluralidad de señales de canal puede generar una pluralidad de señales de canal con fase cambiada, modificando una fase de por lo menos un canal con la utilización de la bandera de cambio de fase. Aunque en la descripción anterior se menciona el método de modificación de una fase de una pluralidad de señales de canal para permitir que una pluralidad de señales de canal desfasadas se convierta en una pluralidad de señales de canal en fase y la generación de una bandera de cambio de fase pertinente para la pluralidad de señales de canal, la pluralidad de señales de canal en fase se cambia de forma intencionada para convertirse en una señal desfasada y a continuación se puede generar una bandera de cambio de fase correspondiente a la señal desfasada.
La unidad de mezclado descendente 530 recibe una entrada de la pluralidad de señales de canal con fase cambiada y a continuación puede generar una señal de mezcla descendente por medio del mezclado en sentido descendente de la señal introducida. En este caso, la pluralidad de señales de canal no se limita a una señal estereofónica sino que puede incluir una señal que tenga por lo menos tres canales. Si la pluralidad de señales de canal es una señal estereofónica, la señal de mezcla descendente puede incluir una señal monofónica. Si la pluralidad de señales de canal es una señal que tiene por lo menos tres canales, la señal de mezcla descendente puede incluir una señal que tenga menos canales que los correspondientes de la pluralidad de señales de canal.
La unidad de generación de información espacial 540 puede generar información espacial que indica un atributo de la pluralidad de señales de canal recibiendo una entrada de la pluralidad de señales de canal con fase cambiada. La información espacial se proporciona para que un decodificador decodifique la señal de mezcla descendente obteniendo la pluralidad de señales de canal con fase cambiada, y puede incluir un valor de diferencia del nivel entre canales, un valor de correlación entre canales, un coeficiente de predicción de canales, etcétera. Por lo tanto, la información espacial generada por la unidad de generación de información espacial 540 de la presente invención puede no ser igual a la información espacial generada a partir de una pluralidad de señales de canal con fase cambiada.
Por otra parte, una unidad de generación de flujos continuos de bits (no representada en el dibujo) puede generar un flujo continuo de bits que contiene la información espacial y la bandera de cambio de fase o un flujo continuo de bits que la señal que contiene la señal de mezcla descendente, la información espacial y la bandera de cambio de fase.
La unidad de obtención de información 550 obtiene la información espacial y la bandera de cambio de fase a partir del flujo continuo de bits para mezclar en sentido ascendente la señal de mezcla descendente.
La unidad de mezclado ascendente 560 tiene la misma configuración que la primera unidad de mezclado ascendente 240 representada en la figura 2 y lleva a cabo las mismas funciones que la primera unidad de mezclado ascendente 240 mostrada en la figura 2. La pluralidad de señales de canal, mezclada en sentido ascendente, puede ser la señal en la cual se aplica la matriz de mezclado ascendente. La señal de diversos canales mezclada en sentido ascendente puede ser una señal en el dominio QMF generada mediante mezclado ascendente. Además, la pluralidad de señales de canal, mezclada en sentido ascendente, puede ser una señal final generada como una señal en el dominio del tiempo. Por otra parte, la señal mezclada en sentido ascendente por la unidad de mezclado ascendente 560 puede incluir la pluralidad de señales de canal cuya fase ha sido cambiada por la unidad de modificación de señales 520.
La unidad de cambio de fase 570 recibe una entrada de la bandera de cambio de fase desde la unidad de obtención de información 550 y una entrada de la pluralidad de señales de canal con fase cambiada, desde la unidad de mezclado ascendente 560. Posteriormente, la unidad de cambio de fase 570 reconstruye la fase cambiada de la pluralidad de señales de canal aplicando la bandera de cambio de fase a la pluralidad de señales de canal con fase cambiada.
Tal como se ha mencionado en la descripción anterior, la bandera de cambio de fase puede incluir simplemente información de bandera que indica si una fase de por lo menos un canal de una pluralidad de señales de canal se cambia o puede incluir además información detallada relevante para el cambio de fase. Si se incluye solamente la información de bandera, la unidad de cambio de fase 570 determina si cambiar una fase de la señal de diversos canales mezclada en sentido ascendente, basándose en la información de bandera, y a continuación puede cambiar
10
15
20
25
30
35
40
45
50
55
60
65 E09012229
14-09-2015
la fase del por lo menos un canal de la pluralidad de señales de canal utilizando un valor fijo. En este caso, como valor fijo se puede utilizar un valor fijado previamente por un decodificador, en lugar de medirlo y transferirlo por parte de un codificador de manera independiente. Por ejemplo, se puede aumentar o reducir la fase de por lo menos un canal de una pluralidad de señales de canal en π/2. En este caso, se puede aplicar igualmente el π/2 a todas las bandas de frecuencia de la pluralidad de señales de canal. Por otra parte, puesto que la bandera de cambio de fase se puede determinar por cada trama, se puede indicar de manera diversa para cada trama el alcance de un cambio de fase de una pluralidad de señales de canal o la presencia o no presencia de un cambio de fase.
La figura 6 es un diagrama de bloques de un aparato de procesado de señales 600 para compensar la reconstrucción de fase de una pluralidad de señales de canal utilizando la bandera de cambio de fase según otra forma de realización de la presente invención.
Haciendo referencia a la figura 6, un aparato de procesado de señales 600 incluye una unidad de mezclado descendente 610, una unidad de generación de información espacial 620, una unidad de modificación de señales 630, una unidad de obtención de valores de IPD globales a nivel de bandas 640, una unidad de cambio de fase 650 y una unidad de mezclado ascendente 660.
En primer lugar, la unidad de mezclado descendente 610 genera una señal de mezcla descendente DMX mezclando en sentido descendente una pluralidad introducida de señales de canal. En este caso, la pluralidad de señales de canal es una señal que se introduce sin presentar su fase cambiada.
La unidad de generación de información espacial 620 puede generar información espacial que indica un atributo de la pluralidad introducida de señales de canal. Esta información espacial tiene la misma configuración y función que la primera información espacial mostrada en la figura 5, aunque difiere con respecto a la primera información espacial en que se genera a partir de una pluralidad de señales de canal sin cambio de fase. Al mismo tiempo, la unidad de generación de información espacial 620 incluye una unidad de determinación de valores de IPD globales a nivel de bandas 621. Esta unidad de determinación de valores de IPD globales a nivel de bandas 621 tiene la misma configuración y función que la primera unidad de determinación de valores de IPD globales a nivel de bandas, representada en la figura 5, omitiéndose sus detalles en la siguiente descripción.
La unidad de modificación de señales 630 puede generar una señal de mezcla descendente con fase modificada DMX’ modificando la fase de por lo menos un canal de la señal de mezcla descendente a la que se da salida desde la unidad de mezclado descendente 610 sobre la base de la bandera de cambio de fase a la que se da salida desde la unidad de determinación de IPD globales a nivel de bandas 621.
A continuación, la unidad de obtención de valores de IPD globales a nivel de bandas 640 obtiene una bandera de cambio de fase. A continuación, la unidad de cambio de fase 650 puede reconstruir la señal de mezcla descendente DMX cambiando la fase del por lo menos un canal de la señal de mezcla descendente modificada, introducida, DMX’, sobre la base de la bandera de cambio de fase. En este caso, la señal de mezcla descendente cuya fase ha sido cambiada por la unidad de cambio de fase 650 puede ser igual a la señal DMX introducida en la unidad de modificación de señales 630.
La unidad de mezclado ascendente 660 puede decodificar la pluralidad de señales de canal recibiendo la información espacial desde la unidad de generación de información espacial 620 y la señal de mezcla descendente DMX desde la unidad de cambio de fase 650.
Al mismo tiempo, un aparato y un método de procesado de señales según la presente invención llevan a cabo diversos métodos para eliminar ruido generado de forma transitoria a partir de un instante de tiempo en el que varía el valor de diferencia de fase entre canales. Esto se explica haciendo referencia a las figuras 7 a 9 de la manera siguiente.
En primer lugar, la figura 7 es un diagrama correspondiente a un concepto de espacio de tiempo paramétrico, en el cual una señal se puede representar en el dominio del tiempo-frecuencia.
Haciendo referencia a la figura 7, un conjunto de parámetros se aplica a dos (intervalo de tiempo 2 e espacio de tiempo 4) de N intervalos de tiempo de una trama. Además, un intervalo de frecuencias completo de una señal se divide en 5 bandas paramétricas. Por lo tanto, la unidad del eje del tiempo es un espacio de tiempo, la unidad del eje de frecuencia es una banda paramétrica (pb), y la banda paramétrica puede ser al menos una subbanda en el dominio de la frecuencia, en la cual se incluye la misma diferencia de fase entre canales. Además, a un espacio de tiempo que se define de manera que resulta habilitado por el conjunto de parámetros, y más particularmente por el valor de diferencia de fase entre canales que se aplica al mismo, se le denomina espacio de tiempo paramétrico.
La figura 8 es un diagrama esquemático correspondiente a un método de modificación (suavización) del valor de diferencia de fase entre canales según otra forma de realización de la presente invención.
10
15
20
25
30
35
40
45
50
55
60
65 E09012229
14-09-2015
Haciendo referencia a la figura 8, la gráfica inferior de la izquierda muestra el valor de diferencia de fase entre canales incluido en una segunda banda paramétrica en intervalos de tiempo paramétricos. El valor de diferencia de fase entre canales aplicado a un espacio de tiempo paramétrico [0] puede ser 10º, y el valor de diferencia de fase entre canales aplicado a un espacio de tiempo paramétrico [1] puede ser 60º. Por lo tanto, en el momento en el que el valor de diferencia de fase entre canales varía de manera considerable, se puede generar un ruido inesperado. Por lo tanto, el método y el aparato de procesado de señales de acuerdo con la presente invención proporcionan el efecto de eliminar el ruido mediante la suavización del valor de diferencia de fase entre canales aplicado a un espacio de tiempo paramétrico actual utilizando el valor de diferencia de fase entre canales aplicado a un espacio de tiempo paramétrico previo.
Haciendo referencia a continuación a la figura 8, suponiendo que el espacio de tiempo paramétrico actual es el espacio de tiempo [1], el espacio de tiempo paramétrico previo puede ser el espacio de tiempo paramétrico [0]. Observando la gráfica inferior de la derecha que se muestra en la figura 8, el valor de diferencia de fase entre canales (60º) que se aplica al espacio de tiempo paramétrico previo se puede suavizar utilizando el valor de diferencia de fase entre canales (10º) aplicado al espacio de tiempo paramétrico previo. Por tanto, el valor de diferencia de fase entre canales suavizado del espacio de tiempo paramétrico actual puede tener un valor menor de 60º.
Posteriormente, interpolando y/o copiando los valores de diferencia de fase entre canales, suavizados, que se aplican al espacio de tiempo paramétrico actual y/o previo, se puede obtener un valor de diferencia de fase entre canales que se aplicará a dicho espacio de tiempo tal que se ha definido de manera que no tiene un conjunto paramétrico aplicado al mismo, como el espacio de tiempo 1, el espacio de tiempo 3, ..., el espacio de tiempo N.
La figura 9 es un diagrama de bloques de un aparato de procesado de señales según otra forma de realización de la presente invención representada en la figura 8.
Haciendo referencia a la figura 9, la unidad de mezclado descendente 910, la unidad de determinación de uso de IPD 921, la unidad de medición de valores de IPD 922, la unidad de generación de banderas de modo de IPD 923, la unidad de generación de banderas de codificación de IPD 924, la unidad de obtención de banderas de codificación de IPD 931, la unidad de obtención de banderas de modo de IPD 932, la unidad de obtención de valores de IPD 933 y la unidad de mezclado ascendente 940 de la figura 9 tienen las mismas configuraciones y funciones que la unidad de mezclado descendente 210, la unidad de determinación de uso de IPD 221, la unidad de medición de valores de IPD 222, la unidad de generación de banderas de modo de IPD 223, la unidad de generación de banderas de codificación de IPD 224, la unidad de obtención de banderas de codificación de IPD 231, la unidad de obtención de banderas de modo de IPD 232, la unidad de obtención de valores de IPD 233 y la unidad de mezclado ascendente 240 de la figura 2, respectivamente. En la siguiente descripción se omiten sus detalles.
La unidad de obtención de información 930 puede incluir además una unidad de suavización de IPD 934. La unidad de suavización de valores de IPD 934 puede modificar (suavizar) un valor de diferencia de fase entre canales aplicado a un espacio de tiempo paramétrico actual utilizando un valor de diferencia de fase entre canales aplicado a un espacio de tiempo paramétrico previo. Así, si existe un espacio grande entre el valor de diferencia de fase entre canales aplicado a espacio de tiempo paramétrico actual y el valor de diferencia de fase entre canales aplicado al espacio de tiempo paramétrico previo, se puede evitar la posible generación de ruido.
La unidad de suavización de valores de IPD 934 puede generar un ángulo de corrección que indica el ángulo entre dos de la pluralidad de canales a partir del valor de diferencia de fase entre canales aplicado al espacio de tiempo paramétrico actual, y a continuación puede modificar el ángulo de corrección utilizando un ángulo de corrección del espacio de tiempo paramétrico previo. A continuación, se da salida al ángulo de corrección modificado hacia la unidad de mezclado ascendente 840. El ángulo de fase modificado se aplica a una señal de mezcla descendente por medio de la unidad de mezclado ascendente 640 para generar una pluralidad de señales de canal.
En la siguiente descripción, en caso de codificar una señal utilizando un valor de diferencia de nivel entre canales y un valor de correlación entre canales en lugar de utilizar un valor de diferencia de fase entre canales en general, se explican varias formas de realización para resolver posibles problemas de acuerdo con la presente invención.
La figura 10A y la figura 10B son diagramas correspondientes al concepto de problemas resueltos por un aparato y un método de procesado de señales según otra forma de realización de la presente invención.
En muchos tipos de dispositivos de codificación de señales, y más particularmente, en la EAAC+ normalizada por la 3GPP y el MPEG, o PS utilizado por AAC Plus USAC, el valor de diferencia de nivel entre canales y el valor de correlación entre canales se usan únicamente como información espacial en lugar de utilizar el valor de diferencia de fase entre canales. Esto se atribuye al envolvimiento de fase, el cual se puede generar en la generación del valor de diferencia de fase entre canales, y al deterioro de la calidad de sonido que se crea a partir de la síntesis del valor de diferencia de fase entre canales.
15
25
35
45
55
65 E09012229
14-09-2015
Sin embargo, si una pluralidad de señales de canal se codifica sin utilizar el valor de diferencia de fase entre canales, se puede crear un problema importante de localización de imágenes sonoras. En otras palabras, dicha señal, que se codifica principalmente utilizando el valor de diferencia de nivel entre canales, como señal grabada al disponer por lo menos dos micrófonos próximos entre sí puede no presentar ningún problema. No obstante, no se puede llevar a cabo correctamente una localización de imágenes sonoras sobre una señal grabada al disponer por lo menos dos micrófonos separados entre sí en la decodificación de una pluralidad de señales de canal a no ser que se use el valor de diferencia de fase entre canales.
La figura 10A muestra el resultado de un caso en el que una señal estereofónica que tiene un valor de diferencia de fase entre canales, únicamente se decodifica sin el valor de diferencia de fase entre canales.
Haciendo referencia a la figura 10A, la señal original es la señal configurada con el valor de diferencia de fase entre canales únicamente (IPD=30º). Sin embargo, si la decodificación se lleva a cabo utilizando el valor de diferencia de nivel entre canales y el valor de correlación entre canales únicamente, no existe ninguna información espacial (IPD) válida, la imagen sonora de una señal decodificada (señal de síntesis) se sitúa en el centro de la señal estereofónica con independencia de la señal original. En este caso, aunque el valor de correlación entre canales afecta a la localización de las imágenes sonoras, es imposible llevar a cabo una localización correcta de imágenes sonoras sin el valor de diferencia de fase entre canales.
La figura 10B representa el resultado de un caso en el que una señal estereofónica que tiene un valor de diferencia de fase entre canales y un valor de diferencia de nivel entre canales mezclados en ella se decodifica sin el valor de diferencia de fase entre canales.
Haciendo referencia a la figura 10B, la localización de imágenes sonoras de una señal estereofónica se determina como una suma lineal de un ángulo de ajuste determinado a partir del valor de diferencia de fase entre canales y un ángulo de ajuste determinado a partir del valor de diferencia de nivel entre canales. Si una señal izquierda de una señal estereofónica original tiene un valor mayor en 8 dB que su señal derecha y es más rápida que la señal derecha en 0,5 ms, tal como se muestra en la figura 10B, una diferencia de nivel de 8 dB puede desplazar una imagen sonora hacia la izquierda en 20º (-20º) desde el centro. Además, la diferencia de tiempo de 0,5 ms (igual al valor de diferencia de fase entre canales de “-10º”) puede desplazar una imagen sonora a la izquierda en 10º (-10º). Por tanto, la señal estereofónica original (Original) se localiza en una posición de -30º. No obstante, si una señal se decodifica sin el valor de diferencia de fase entre canales, la imagen sonora de la señal decodificada se localiza a 20º, y resulta imposible llevar a cabo una localización correcta de imágenes sonoras.
Por lo tanto, un método y un aparato de procesado de señales de acuerdo con otra forma de realización de la presente invención proporcionan adicionalmente varios métodos para resolver el problema de la localización de imágenes sonoras.
La figura 11 y la figura 12 son diagramas de bloques de un aparato y un método de procesado de señales de acuerdo con otra forma de realización de la presente invención.
En primer lugar, solamente si se cumple una condición predeterminada sobre la base de una relación entre el valor de diferencia de fase entre canales de una pluralidad de señales de canal y el valor de diferencia de nivel entre canales de la pluralidad de señales de canal, se puede utilizar el valor de diferencia de fase entre canales.
Haciendo referencia a la figura 11, un aparato de procesado de señales 1100 incluye una unidad de mezclado descendente 1110, una unidad de generación de información espacial 1120, una unidad de obtención de información 1130 y una unidad de mezclado ascendente 1140.
La unidad de mezclado descendente 1110 y la unidad de mezclado ascendente 1140 tienen las mismas configuraciones y funciones que la anterior unidad de mezclado descendente 210 y la anterior unidad de mezclado ascendente 240 de la figura 2. La unidad de generación de información espacial 1120 incluye una unidad de medición de valores de ILD 1121, una unidad de medición de valores de IPD 1122, una unidad de determinación de información 1123 y una unidad de generación de banderas de IPD 1124. La unidad de medición de valores de ILD 1121 y la unidad de medición de valores de IPD 1122 miden un valor de diferencia de nivel entre canales y el valor de diferencia de fase entre canales a partir de una pluralidad de señales de canal, respectivamente. En este caso, el valor de diferencia de nivel entre canales y el valor de diferencia de fase entre canales se pueden medir para cada banda paramétrica.
La unidad de determinación de información 1123 calcula cómo de alejada se localiza una señal en cuanto a imagen sonora utilizando el valor de diferencia de nivel entre canales medido y el valor de diferencia de fase entre canales medido, y calcula también una relación del nivel entre canales/información de diferencia de fase para una localización total de imagen sonora. La unidad de determinación de información 1123 determina a continuación que se usa el valor de diferencia de fase entre canales únicamente si la relación del valor de diferencia de fase entre canales es mayor que la otra. Por ejemplo, si el valor de diferencia de fase entre canales medido se corresponde con +20º y el valor de diferencia de nivel entre canales medido se corresponde con un valor para un cambio de fase
15
25
35
45
55
65 E09012229
14-09-2015
en +10º con 4 dB, el alcance de la contribución del valor de diferencia de fase entre canales y el alcance del valor de diferencia de nivel entre canales en la localización de la imagen sonora total (20º + 10º = 30º) puede llegar a ser de 20/30 y 10/30, respectivamente. En este caso, en la medida en la que se puede considerar que el valor de diferencia de fase entre canales tiene una importancia relativamente mayor, la unidad de determinación de información 1123 puede determinar que se usa además el valor de diferencia de fase entre canales.
Si la unidad de determinación de información 1123 determina que se usa además el valor de diferencia de fase entre canales, la unidad de generación de banderas de IPD 1124 puede generar una bandera de valor de diferencia de fase entre canales que indica que se utiliza el valor de diferencia de fase entre canales.
Al mismo tiempo, la unidad de obtención de información 1130 puede incluir una unidad de obtención de banderas de IPD 1131 y una unidad de obtención de IPD 1132. La unidad de obtención de banderas de IPD 1131 obtiene la bandera de valor de diferencia de fase entre canales, y a continuación determina si en la información espacial se incluye un valor de diferencia de fase entre canales. Si la bandera de valor de diferencia de fase entre canales se fija a 1, la unidad de obtención de IPD 1132 se activa y a continuación obtiene el valor de diferencia de fase entre canales a partir de la información espacial. Posteriormente, la unidad de mezclado ascendente 1140 decodifica una pluralidad de señales de canal mezclando en sentido ascendente una señal de mezcla descendente con la utilización de la información espacial que incluye el valor de diferencia de fase entre canales. Por lo tanto, una localización de imágenes sonoras se puede llevar a cabo de forma más correcta que en el caso en el que no se utiliza el valor de diferencia de fase entre canales. El valor de diferencia de fase entre canales se transfiere únicamente si se cumple una condición predeterminada. Por tanto, también se puede aumentar la eficiencia de codificación.
En segundo lugar, el valor de diferencia de fase entre canales se puede sustituir por un valor equivalente de diferencia de nivel entre canales, y viceversa. En este caso, puesto que el valor de diferencia de fase entre canales o el valor de diferencia de nivel entre canales necesarios para la localización de imágenes sonoras puede variar de acuerdo con la frecuencia, se remite a una base de datos definida por cada banda de frecuencias.
La figura 12 muestra un aparato de procesado de señales 1220 que usa un valor equivalente de diferencia de nivel de canales que sustituye al valor de diferencia de fase entre canales.
Haciendo referencia a la figura 12, un aparato de procesado de señales 1200 incluye una unidad de medición de valores de ILD 1210, una unidad de medición de valores de IPD 1220, una unidad de determinación de información 1230, una unidad de conversión de valores de IPD 1240 y una unidad de modificación de valores de ILD 1250.
La unidad de medición de valores de ILD 1210, la unidad de medición de valores de IPD 1220 y la unidad de determinación de información 1230 tienen las mismas configuraciones y funciones que la primera unidad de medición de valores de ILD 1110, la primera unidad de medición de valores de IPD 1120, y la primera unidad de determinación de información 1130, cuyos detalles se omiten en la siguiente descripción. En caso de que la unidad de determinación de información 1130 determine que se usa el valor de diferencia de fase entre canales, el valor de diferencia de fase entre canales medido se introduce en la unidad de conversión de valores de IPD 1240.
La unidad de conversión de valores de IPD 1240 convierte el valor de diferencia de fase entre canales medido en una banda de frecuencias correspondiente utilizando la base de datos para el valor de diferencia de nivel entre canales ILD’. A continuación, la unidad de modificación de valores de ILD 1250 calcula un valor de diferencia de nivel entre canales modificado ILD’’ sumando el valor de diferencia de nivel entre canales ILD’ convertido a partir del valor de diferencia de fase entre canales al valor de diferencia de nivel entre canales ILD introducido desde la unidad de medición de valores de ILD 1210.
Así, en caso de convertir el valor de diferencia de fase entre canales en el valor equivalente de diferencia de nivel entre canales a utilizar, se puede decodificar una señal, cuya reverberación y localización de imágenes sonoras se mejoran reflejando el valor de diferencia de fase entre canales, con la utilización del aparato y el método de procesado de señales, convencionales, que no aceptan la recepción del valor de diferencia de fase entre canales, en el HE AAC Plus del 3GPP o MPEG o PS en la normativa USAC.
En tercer lugar, aplicando el valor de diferencia de fase entre canales a por lo menos una o más tramas consecutivas en común, se puede mejorar correctamente la localización de imágenes sonoras y la eficiencia de codificación. En la presente memoria, el valor de diferencia de fase entre canales utilizado para varias tramas consecutivas se denomina valor de diferencia de fase entre canales global a nivel de tramas (valor de IPD global a nivel de tramas).
La figura 13 es un diagrama correspondiente a un concepto de utilización de un valor de diferencia de fase entre canales (IPD) global a nivel de tramas, de acuerdo con otra forma de realización de la presente invención. En la figura 13, los números de referencia 0 a 13 indican respectivamente tramas. Una trama sombreada indica una trama que usa el valor de diferencia de fase entre canales. Una trama no sombreada indica una trama que no utiliza el
10
15
20
25
30
35
40
45
50
55
60 E09012229
14-09-2015
valor de diferencia de fase entre canales. Se pueden determinar sobre la base de una bandera de modo de diferencia de fase entre canales (bsPhaseMode) tal como se describe en esta exposición.
Haciendo referencia a la figura 13, en caso de que solamente las tramas 1 a 3 y las tramas 8 a 12 utilicen el valor de diferencia de fase entre canales, se calcula un valor representativo sin transferir el valor de diferencia de fase entre canales para cada trama y a continuación dicho valor representativo se aplica igualmente a tramas consecutivas de las cuales se determina que el valor de diferencia de fase entre canales se ha aplicado a las mismas. El valor de diferencia de fase entre canales global a nivel de tramas se incluye en una primera de las tramas consecutivas. Además, cada trama puede incluir una bandera de diferencia de fase entre canales global a nivel de tramas que indica si se utiliza el valor de diferencia de fase entre canales global a nivel de tramas. En la Tabla 4 se muestra el significado de la bandera de diferencia de fase entre canales global a nivel de tramas.
[Tabla 4]
Global_frame_IPD_flag
Significado
1
Se utiliza el valor de diferencia de fase entre canales, global a nivel de tramas.
0
No se utiliza el valor de diferencia de fase entre canales, global a nivel de tramas.
Por ejemplo, una trama 0 no utiliza el valor de diferencia de fase entre canales global a nivel de tramas, sobre la base de la bandera de diferencia de fase entre canales global a nivel de tramas, pero la trama 1 utiliza el valor de diferencia de fase entre canales global a nivel de tramas. Por tanto, la trama 1 incluye el valor de diferencia de fase entre canales, global a nivel de tramas, y el mismo valor de diferencia de fase entre canales global a nivel de tramas es aplicable a las tramas 1 a 3. De manera similar, la trama 8 incluye el valor de diferencia de fase entre canales global a nivel de tramas, y el mismo valor de diferencia de fase entre canales global a nivel de tramas es aplicable a las tramas 8 a 12.
La figura 14 es un diagrama de bloques de un aparato de codificación de señales 1400 que utiliza un valor de diferencia de fase entre canales global a nivel de tramas de acuerdo con una forma de realización de la presente invención.
Haciendo referencia a la figura 14, un aparato de codificación de señales 1400 incluye una unidad de recepción de valores de IPD, globales a nivel de tramas, de una trama previa 1410, una unidad de cálculo de valores de IPD globales a nivel de tramas 1420, una unidad de generación de banderas de IPD globales a nivel de tramas 1430, una unidad de obtención de banderas de IPD globales a nivel de tramas 1440, una unidad de obtención de valores de IPD globales a nivel de tramas 1450 y una unidad de mezclado ascendente 1460.
La unidad de recepción de valores de IPD, globales a nivel de tramas, de la trama previa 1410 recibe el valor de diferencia de fase entre canales, global a nivel de tramas, de una trama previa. Por ejemplo, si una trama actual es una primera trama que incluye un valor de diferencia de fase entre canales global a nivel de tramas, no existirá un valor de diferencia de fase entre canales global a nivel de tramas de una trama previa recibida. Por el contrario, si una trama actual es una trama segunda o de orden superior de entre tramas consecutivas que incluyen el valor de diferencia de fase entre canales global a nivel de tramas, se puede recibir el valor de diferencia de fase entre canales global a nivel de tramas de una trama previa.
La unidad de cálculo de valores de ILD globales a nivel de tramas 1420 puede calcular el valor de diferencia de fase entre canales, global a nivel de tramas, si una trama actual es una primera trama que incluye el valor de diferencia de fase entre canales global a nivel de tramas, es decir, si el valor de diferencia de fase entre canales global a nivel de tramas de una trama previa no existe. El valor de diferencia de fase entre canales global a nivel de tramas de una trama actual puede incluir un promedio de los valores de diferencia de fase entre canales de las tramas consecutivas para las cuales se utiliza el valor de diferencia de fase entre canales.
La unidad de generación de banderas de IPD globales a nivel de tramas 1430 genera una bandera de IPD global a nivel de tramas (global_frame_IPD_flag) que indica si el valor de IPD global a nivel de tramas se usa en una trama actual.
A continuación, la unidad de obtención de banderas de IPD globales a nivel de tramas 1440 obtiene el valor de diferencia de fase entre canales global a nivel de tramas. Además, la unidad de obtención de valores de IPD globales a nivel de tramas 1450 puede obtener el valor de diferencia de fase entre canales global a nivel de tramas de una trama previa a la que se da salida desde la unidad de recepción de valores de IPD globales a nivel de tramas de tramas previas 1410 o el valor de diferencia de fase entre canales, global a nivel de tramas, de la trama actual a la que se da salida desde la unidad de cálculo de valores de IPD globales a nivel de tramas 1420. Preferentemente, si una trama actual es una primera de tramas consecutivas a la que se ha aplicado el valor de diferencia de fase entre canales, la unidad de obtención de valores de IPD globales a nivel de tramas 1450 obtiene el valor de diferencia de fase entre canales global a nivel de tramas de una trama previa. Si una trama actual es una trama
10
15
20
25
30
35
40
45
50
55
60
65 E09012229
14-09-2015
segunda o de orden superior, la unidad de obtención de valores de IPD globales a nivel de tramas 1450 puede obtener el valor de diferencia de fase entre canales global a nivel de tramas, calculado, de la trama actual.
Además, la unidad de mezclado ascendente 1460 genera una pluralidad de señales de canal aplicando el valor de diferencia de fase entre canales, global a nivel de tramas, a una señal de mezcla descendente.
En cuarto lugar, con el fin de ajustar una pluralidad decodificada de señales de canal de manera que presenten una reverberación lo más parecida posible a la de una pluralidad de señales de canal introducidos en un codificador, es posible ajustar un valor de correlación entre canales. Haciendo referencia a continuación a la figura 10B, en caso de decodificar una señal utilizando un valor de diferencia de fase entre canales y un valor de correlación entre canales, se genera el problema de exagerar la reverberación más de lo correspondiente a la señal original. Esta reverberación representa un efecto que simula la presencia de una señal en un espacio más amplio o más reducido debido al ambiente acústico. En la presente memoria, exagerar la reverberación significa que una señal decodificada se oye como si se hubiera grabado en una sala amplia a pesar de que la señal original se grabase en un estudio de grabación reducido.
Este problema se genera frecuentemente en un método y un aparato convencionales de procesado de señales, en los cuales no se transfiere el valor de diferencia de fase entre canales. Sin embargo, este problema se puede generar en caso de transferencia del valor de diferencia de fase entre canales.
Este problema se puede resolver de una manera que se muestra en la figura 15. La figura 15 es un diagrama de bloques de un aparato de procesado de señales 1500 de acuerdo con otra forma de realización de la presente invención.
Haciendo referencia a la figura 15, un aparato de procesado de señales 1500 incluye una unidad de medición de valores de ICC 1510, una unidad de medición de valores de IPD 1520, una unidad de medición de valores de ILD 1530, una unidad de determinación de información 1540, una unidad de modificación de valores de ICC 1550, una unidad de generación de banderas de modo de IPD 1560, una unidad de obtención de banderas de modo de IPD 1570, una unidad de obtención de valores de IPD 1580, una unidad de obtención de valores de ICC 1590, y una unidad de mezclado ascendente 1595.
La unidad de medición de valores de ICC 1510, la unidad de medición de valores de IPD 1520 y la unidad de medición de valores de ILD 1530 pueden medir un valor de correlación entre canales, un valor de diferencia de fase entre canales y un valor de diferencia de nivel entre canales de una pluralidad de señales de canal, respectivamente.
La unidad de determinación de información 1540 y la unidad de generación de banderas de modo de IPD 1560 tienen las mismas configuraciones y funciones que la anterior unidad de determinación de información y la anterior unidad de generación de banderas de IPD 1124 de la figura 11, respectivamente. La unidad de determinación de información 1540 calcula una relación de la información medida de diferencia de nivel/fase entre canales para una localización total de imágenes sonoras. A continuación, la unidad de determinación de información 1540 determina que se usa el valor de diferencia de fase entre canales únicamente si la relación del valor de diferencia de fase entre canales es mayor que la otra. La unidad de generación de banderas de modo de IPD 1560 genera una bandera de modo de diferencia de fase entre canales que indica si se utiliza el valor de diferencia de fase entre canales.
Si la unidad de determinación de información 1540 determina que se usa el valor de diferencia de fase entre canales, la unidad de modificación de valores de ICC 1550 puede modificar el valor de correlación entre canales introducido desde la unidad de medición de ICC 1510. Preferentemente, el valor de correlación entre canales medido no se puede incluir en una banda paramétrica que utiliza el valor de diferencia de fase entre canales. Para resolver el problema de la exageración de la reverberación, la magnitud de un valor indicado por el valor de correlación entre canales se puede modificar para su uso.
La unidad de obtención de banderas de IPD 1570 y la unidad de obtención de valores de IPD 1580 tienen las mismas configuraciones y funciones que la anterior unidad de obtención de banderas de IPD 1131 y la anterior unidad de obtención de valores de IPD 1132 de la figura 11, cuyos detalles se omiten en la siguiente descripción.
Si la bandera de diferencia de fase entre canales de la unidad de obtención de banderas de IPD 1570 indica que se utiliza el valor de diferencia de fase entre canales, la unidad de obtención de valores de ICC 1590 recibe de la unidad de modificación de valores de ICC 1550 el valor de correlación entre canales modificado.
Además, la unidad de mezclado ascendente 1595 puede generar una pluralidad de señales de canal aplicando el valor de diferencia de fase entre canales y el valor de correlación entre canales modificado a la señal de mezcla descendente recibida. Por lo tanto, se puede evitar la distorsión de una señal por la reverberación exagerada por el valor de correlación entre canales en el método y el aparato de procesado de señales que utilizan el valor de diferencia de fase entre canales.
15
25
35
45
55
65 E09012229
14-09-2015
En quinto lugar, el valor de diferencia de fase entre canales puede usar la característica de que la relevancia de una señal con una fuente de sonido más simple es mayor.
La figura 16 es un diagrama de bloques de un aparato de procesado de señales 1600 según otra forma de realización de la presente invención.
Haciendo referencia a la figura 16, un aparato de procesado de señales 1600 incluye una unidad de clasificación de señales de entrada 1610, una unidad de medición de valores de IPD 1620, una unidad de generación de banderas de IPD 1630, una unidad de obtención de banderas de IPD 1640, una unidad de obtención de valores de IPD 1650 y una unidad de mezclado ascendente 1660.
La unidad de clasificación de señales de entrada 1610 determina si una señal de entrada es una señal de habla pura que contiene únicamente voz, una señal musical o una señal mixta que tiene mezcladas entre sí señales de habla y de música. Preferentemente, la unidad de clasificación de señales de entrada 1610 puede incluir uno de entre un detector de actividad sonora (SAD), un clasificador de habla y música (SMC) y similares.
La unidad de medición de valores de IPD 1620 mide un valor de diferencia de fase entre canales únicamente si se determina que la señal de entrada es la señal que contiene solamente la señal de habla (señal de habla pura) por medio de la unidad de clasificación de señales de entrada 1610.
La unidad de generación de banderas de IPD 1630, la unidad de obtención de banderas de IPD 1640, la unidad de obtención de valores de IPD 1650 y la unidad de mezclado ascendente 1660 tienen las mismas configuraciones y funciones que la anterior unidad de generación de banderas de IPD 1124, la anterior unidad de obtención de banderas de IPD 1131, la anterior unidad de obtención de valores de IPD 1132 y la anterior unidad de mezclado ascendente 1140 de la figura 11, respectivamente, cuyos detalles se omiten en la siguiente descripción.
Una señal musical que contiene varias señales dentro de ella o una señal mixta que tiene señales de habla y musicales mezcladas en la misma permite la localización de imágenes sonoras a un nivel preestablecido utilizando el valor de diferencia de nivel entre canales y el valor de correlación entre canales a pesar de que no use el valor de diferencia de fase entre canales. Sin embargo, puesto que una fuente sonora tan sencilla como una señal de habla tiene una relevancia relativamente alta del valor de diferencia de fase entre canales, es imposible una localización correcta de imágenes sonoras sin el valor de diferencia de fase entre canales. Por lo tanto, si una señal de entrada es una señal de habla de acuerdo con la unidad de clasificación de señales de entrada 1610, se usa el valor de diferencia de fase entre canales, con lo cual una pluralidad de señales de canal se puede decodificar con una localización correcta de imágenes sonoras.
La figura 17 muestra un aparato de procesado de señales 1700 de acuerdo con otra forma de realización de la presente invención.
Haciendo referencia a la figura 17, un aparato de procesado de señales 1700 incluye una pluralidad de unidades de codificación de canales 1710, una unidad de codificación de señales de extensión de ancho de banda 1720, una unidad de codificación de señales de audio 1730, una unidad de codificación de señales de habla 1740, una unidad de decodificación de señales de audio 1750, una unidad de decodificación de señales de habla 1760, una unidad de decodificación de señales de extensión de ancho de banda 1770 y una unidad de decodificación de diversos canales 1780.
En primer lugar, a la señal de mezcla descendente, la cual se genera por medio de la pluralidad de unidades de codificación de canales 1710 a partir del mezclado en sentido descendente de una pluralidad de señales de canal, se denomina señal de mezcla descendente de banda completa. Además, la señal de mezcla descendente, la cual tiene una banda de frecuencias bajas ya que de la señal de mezcla descendente de banda completa se elimina la señal de banda de frecuencias altas, se denomina señal de mezcla descendente de banda de frecuencias bajas.
La pluralidad de unidades de codificación de canales 1710 recibe una entrada de una pluralidad de señales de canal que tienen diversos canales. La pluralidad de unidades de codificación de canales 1710 genera una señal de mezcla descendente de banda completa mezclando en sentido descendente la pluralidad introducida de señales de canal, y genera también información espacial correspondiente a la pluralidad de señales de canal. En este caso, la información espacial puede contener información de diferencia de nivel de canales, un coeficiente de predicción de canales, un valor de correlación entre canales, información de ganancia de mezcla descendente, etcétera.
La pluralidad de unidades de codificación de canales 1710 según una forma de realización de la presente invención determina si se usa un valor de diferencia de fase entre canales, y a continuación mide el valor de diferencia de fase entre canales. La pluralidad de unidades de codificación de canales 1710 genera información de modo de diferencia de fase entre canales que indica si una trama utiliza el valor de diferencia de fase entre canales, y genera también información de codificación de diferencia de fase entre canales que indica si, entre las tramas completas, existe una trama que utiliza el valor de diferencia de fase entre canales. A continuación, la pluralidad de unidades de codificación de canales 1710 puede transferir las informaciones generadas junto con información de mezcla. Esto
10
15
20
25
30
35
40
45
50
55
60 E09012229
14-09-2015
presenta un comportamiento tan satisfactorio como el descrito en referencia a las figuras 1 a 4, y sus detalles se omiten en la siguiente descripción.
Por tanto, la pluralidad de unidades de codificación de canales 1710 puede incluir el dispositivo de codificación del aparato de procesado de señales descrito en referencia a las figuras 1 a 4, o el aparato de procesado de señales según otra forma de realización de la presente invención descrita en referencia a las figuras 5 a 16.
La unidad de codificación de señales de extensión de ancho de banda 1720 recibe la señal de mezcla descendente de banda completa, y a continuación puede generar información de extensión que se corresponde con una señal de banda de frecuencias altas en la señal de mezcla descendente de banda completa. En este caso, la información de extensión es la información destinada a permitir que un lado de decodificador reconstruya una señal de mezcla descendente de banda de frecuencias bajas resultante de eliminar una banda de frecuencias altas en la señal de mezcla descendente de banda completa. Además, la información de extensión se puede transferir junto con la información espacial.
Se determina si una señal de mezcla descendente se codificará por medio de un esquema de codificación de señales de audio o un esquema de codificación de señales de habla sobre la base de una característica de la señal. Además, se genera información de modo para determinar el esquema de codificación [lo cual no se muestra en el dibujo]. En este caso, el esquema de codificación de audio puede usar la MDCT (transformada de coseno discreta modificada), por lo cual la presente invención no queda limitada. Además, el esquema de codificación de habla puede seguir la norma AMR-WB (banda ancha de multivelocidad adaptativa), por lo cual la presente invención no queda limitada.
La unidad de codificación de señales de audio 1730 codifica la señal de mezcla descendente de banda de frecuencias bajas, de la cual se elimina la región de frecuencias altas, de acuerdo con el esquema de codificación de señales de audio usando la información de extensión y la señal de mezcla descendente de banda completa introducida desde la unidad de codificación de señales de extensión de ancho de banda 1720.
Una señal codificada mediante el esquema de codificación de señales de audio puede incluir una señal de audio o una señal que presente una señal de habla incluida parcialmente en una señal de audio. Además, la unidad de codificación de señales de audio 1730 puede incluir una unidad de codificación en el dominio de la frecuencia.
La unidad de codificación de señales de habla 1740 codifica una señal de mezcla descendente de banda de frecuencias bajas, de la cual se elimina una región de frecuencias altas, de acuerdo con un esquema de codificación de señales de habla utilizando la información de extensión y la señal de mezcla descendente de banda completa introducida desde la unidad de codificación de señales de extensión de ancho de banda 1720.
La señal codificada mediante el esquema de codificación de señales de habla puede incluir una señal de habla o una señal de audio contenida parcialmente en una señal de habla. La unidad de codificación de señales de habla 1740 puede utilizar además un esquema de codificación por predicción lineal (LPC). Si una señal de entrada presenta una redundancia elevada en el eje del tiempo, se puede llevar a cabo un modelado mediante una predicción lineal para predecir una señal actual a partir de una señal pasada. En este caso, si se adopta el esquema de codificación por predicción lineal, se puede aumentar la eficiencia de codificación. Al mismo tiempo, la unidad de codificación de señales de habla 1740 puede incluir una unidad de codificación en el dominio del tiempo.
La unidad de decodificación de señales de audio 1750 decodifica una señal de acuerdo con un esquema de codificación de señales de audio. La señal introducida en y decodificada por la unidad de decodificación de señales de audio 1750 puede incluir una señal de audio o una señal que tenga una señal de habla incluida parcialmente en una señal de audio. Además, la unidad de decodificación de señales de audio 1750 puede incluir una unidad de decodificación en el dominio de la frecuencia y puede usar la IMDCT (transformada de coeficiente discreta modificada inversa).
La unidad de decodificación de señales de habla 1760 decodifica una señal de acuerdo con un esquema de codificación de señales de habla. La señal decodificada por la unidad de decodificación de señales de habla 1760 puede incluir una señal de habla o una señal que tenga una señal de audio incluida parcialmente en una señal de habla. La unidad de decodificación de señales de habla 1760 puede incluir una unidad de decodificación en el dominio del tiempo y puede usar además un esquema de codificación por predicción lineal (LPC).
La unidad de decodificación de extensión de ancho de banda 1770 recibe la señal de mezcla descendente de banda de frecuencias bajas, la cual es la señal decodificada por la unidad de decodificación de señales de audio 1750 o la unidad de decodificación de señales de habla 1760, y la información de extensión, y a continuación genera una señal de mezcla descendente de banda completa de la cual se reconstruye una señal correspondiente a la región de altas frecuencias que se ha eliminado en la codificación.
15
25
35
45
55
65 E09012229
14-09-2015
Puede generar la señal de mezcla descendente de banda completa utilizando la señal de mezcla descendente de banda completa de frecuencias bajas y la información de extensión o utilizando parcialmente la señal de mezcla descendente de banda de bajas frecuencias.
La unidad de decodificación de diversos canales 1780 recibe la señal de mezcla descendente de banda completa, la información espacial, el valor de diferencia de fase entre canales, la bandera de modo de diferencia de fase entre canales y la bandera de codificación de diferencia de fase entre canales, y a continuación genera una señal de mezcla descendente aplicando estas informaciones a la señal de mezcla descendente de banda completa. Se han descrito detalles de este proceso de forma minuciosa en referencia a las figuras 1 a 4 y los mismos se omiten en la siguiente descripción.
Así, en un método y un aparato de procesado de señales según la presente invención, una pluralidad de señales de canal se genera utilizando un valor de diferencia de fase entre canales, con lo cual se puede reproducir de manera eficaz una diferencia de fase o retardo complicada de reproducir por medio de una pluralidad de decodificadores de canales de la técnica relacionada.
La figura 18 es un diagrama esquemático de una configuración de un producto que incluye una unidad de obtención de banderas de codificación de IPD 1841, una unidad de obtención de banderas de modo de IPD 1842, una unidad de obtención de valores de IPD 1843 y una unidad de mezclado ascendente 1844 de acuerdo con otra forma de realización de la presente invención. Además, la figura 19A y la figura 19B son diagramas esquemáticos correspondientes a relaciones de productos que incluyen una unidad de obtención de banderas de codificación de IPD 1841, una unidad de obtención de banderas de modo de IPD 1842, una unidad de obtención de valores de IPD 1843 y una unidad de mezclado ascendente 1844 de acuerdo con otra forma de realización de la presente invención, respectivamente.
Haciendo referencia a la figura 18, una unidad de comunicación por cable/inalámbrica 1810 recibe un flujo continuo de bits mediante comunicaciones por cable/inalámbricas. En particular, la unidad de comunicación por cable/inalámbrica 1810 incluye por lo menos una de una unidad de comunicación por cable 1811, una unidad de comunicación por infrarrojos 1812, una unidad de Bluetooth 1813 y una unidad de comunicación LAN inalámbrica 1814.
Una unidad de autenticación de usuarios 1820 recibe una entrada de información de usuario y a continuación lleva a cabo la autenticación del usuario. La unidad de autenticación de usuarios 1820 puede incluir por lo menos una de entre una unidad de reconocimiento de huellas dactilares 1821, una unidad de reconocimiento de iris 1822, una unidad de reconocimiento facial 1823, y una unidad de reconocimiento de voz 1824. En este caso, la autenticación del usuario se puede realizar de manera que se recibe una entrada de información de huellas dactilares, información de iris, información de contorno facial o información de voz, se convierte la información introducida en información de usuario, y a continuación se determina si la información de usuario coincide con datos de usuario registrados.
Una unidad de entrada 1830 es un dispositivo de entrada para permitir que un usuario introduzca varios tipos de órdenes. Además, la unidad de entrada 1830 puede incluir por lo menos una de entre una unidad de teclado 1831, una unidad de panel táctil 1832 y una unidad de mando a distancia 1833, por lo cual los ejemplos de la unidad de entrada 1830 no están limitados.
Una unidad de decodificación de señales 1840 incluye una unidad de obtención de banderas de codificación de IPD 1841, una unidad de obtención de banderas de modo de IPD 1842, una unidad de obtención de valores de IPD 1843 y una unidad de mezclado ascendente 1844, que tienen las mismas configuraciones y funciones que las unidades anteriores con las mismas denominaciones en la figura 2, respectivamente. Además, en la siguiente descripción se omiten detalles de la unidad de decodificación de señales 1840.
Una unidad de control 1850 recibe señales de entrada desde los dispositivos de entrada, y controla todos los procesos de la unidad de decodificación de señales 1840 y una unidad de salida 1860. Tal como se ha mencionado en la descripción anterior, si en la unidad de control 1850 se introduce desde la unidad de entrada 1830 una entrada de usuario, tal como “on/off” de un cambio de fase de una señal de salida, una entrada/salida de metadatos, una operación on/off de una unidad de decodificación de señales y similares, la unidad de control 1850 decodifica la señal utilizando la entrada de usuario.
Además, la unidad de salida 1860 es un elemento destinado a dar salida a una señal de salida y similares generadas por la unidad de decodificación de señales 1840. La unidad de salida 1860 puede incluir una unidad de salida de señales 1861 y una unidad de visualización 1862. Si la señal de salida es una señal de audio, se da salida a la misma por medio de la unidad de salida de señales 1861. Si la señal de salida es una señal de vídeo, se da salida a la misma por medio de la unidad de visualización 1862. Por otra parte, si en la unidad de entrada 1830 se introducen metadatos, los mismos se visualizan en una pantalla por medio de la unidad de visualización 1862.
La figura 19 representa la relación entre terminales o entre un terminal y un servidor, que se corresponden con el producto mostrado en la figura 18.
15
25
35
45
55
65 E09012229
14-09-2015
Haciendo referencia a la figura 19A, puede apreciarse que las comunicaciones bidireccionales de datos o flujos continuos de bits se pueden llevar a cabo entre un primer terminal 1910 y un segundo terminal 1920 por medio de unidades de comunicación por cable/inalámbrica. En este caso, los datos o flujos continuos de bits intercambiados por medio de la unidad de comunicación por cable/inalámbrica pueden tener la estructura del anterior flujo continuo de bits de la presente invención que se muestra en la figura 1 o pueden incluir los anteriores datos que incluyen la bandera de cambio de fase, la bandera de cambio de fase entre canales, global a nivel de tramas, y similares de la presente invención, descritas en referencia a las figuras 5 a 16. Haciendo referencia a la figura 19B, puede observarse que las comunicaciones por cable/inalámbricas se pueden realizar entre un servidor 1930 y un primer terminal 1940.
La figura 20 es un diagrama de bloques esquemático de un aparato de decodificación de señales de difusión general que incluye una unidad de obtención de banderas de codificación de IPD 2041, una unidad de obtención de banderas de modo de IPD 2042, una unidad de obtención de valores de IPD 2043 y una unidad de mezclado ascendente 2044 según otra forma de realización de la presente invención.
Haciendo referencia a la figura 20, un demultiplexor 2020 recibe una pluralidad de datos relacionados con una emisión de difusión general de TV desde un sintonizador 2010. Los datos recibidos son separados por el demultiplexor 2020 y a continuación son decodificados por un decodificador de datos 2030. Al mismo tiempo, los datos separados por el demultiplexor 2020 se pueden almacenar en un soporte de almacenamiento 2050, tal como un HDD.
Los datos separados por el demultiplexor 2020 se introducen en una unidad de decodificación de señales 2040 que incluye una pluralidad de unidades de decodificación de canales 2041 y una unidad de decodificación de vídeo 2042 para su decodificación en una señal de audio y una señal de vídeo. La unidad de decodificación de señales 2040 incluye una unidad de obtención de banderas de codificación de codificación de IPD 2041, una unidad de obtención de banderas de modo de IPD 2042, una unidad de obtención de IPD 2043 y una unidad de mezclado ascendente 2044 de acuerdo con una forma de realización de la presente invención. Tienen las mismas configuraciones y funciones que las anteriores unidades que presentan las mismas denominaciones representadas en la figura 2 y sus detalles se omiten en la siguiente descripción. La unidad de decodificación de señales 2040 decodifica una señal utilizando el valor recibido de diferencia de fase entre canales y similares. Si se introduce una señal de vídeo, la unidad de decodificación de señales 2040 decodifica y da salida a la señal de vídeo. Si se generan metadatos, la unidad de decodificación de señales 2040 da salida a los metadatos en un tipo de texto.
Si la señal de vídeo se decodifica, y se generan a la salida una señal de vídeo y metadatos, una unidad de salida 2070 visualiza los metadatos a los que se da salida. La unidad de salida 2070 incluye una unidad de altavoz (no representada en el dibujo) y da salida a una señal de diversos canales, la cual se decodifica usando el valor de diferencia de fase entre canales, por medio de la unidad de altavoz incluida en la unidad de salida 2070. Por otra parte, los datos decodificados por la unidad de decodificación de señales 2040 se pueden almacenar en un soporte de almacenamiento 2050, tal como un HDD.
Al mismo tiempo, el aparato de decodificación de señales 2000 puede incluir además un administrador de aplicaciones 2060 con capacidad de controlar una pluralidad de datos recibidos de acuerdo con una entrada de información de un usuario. El administrador de aplicaciones 2060 incluye un administrador de interfaz de usuario 2061 y un administrador de servicios 2062. El administrador de interfaz de usuario 2061 controla una interfaz para recibir una entrada de información de un usuario. Por ejemplo, el administrador de interfaz de usuario 2061 puede controlar el tipo de fuente del texto visualizado en la unidad de salida 2070, el brillo de una pantalla, la configuración de un menú y similares. Al mismo tiempo, si se decodifica una señal de difusión general y a la misma se le da salida por medio de la unidad de decodificación de señales 2040 y la unidad de salida 2070, el administrador de servicios 2062 puede controlar una señal recibida de difusión general utilizando información introducida por un usuario. Por ejemplo, el administrador de servicios 2062 puede proporcionar un ajuste del canal de difusión general, un ajuste de la función de alarma, una función de autenticación para adultos, etcétera. Los datos a los que se da salida desde el administrador de aplicaciones 2060 son utilizables al transferirlos a la unidad de salida 2070 así como a la unidad de codificación de señales 2040.
Por consiguiente, en la medida en la que un aparato de procesado de señales de la presente invención se incluye en un producto real, la presente invención mejora la calidad del sonido, la cual se mejora de manera que es más satisfactoria que la correspondiente de la técnica relacionada para la pluralidad de señales de canal mezcladas en sentido ascendente utilizando solo el valor de diferencia de nivel entre canales y el valor de correlación entre canales. Por otra parte, la presente invención permite que un usuario escuche una pluralidad de señales de canal más parecidas a la señal de entrada original.
La presente invención aplicada a un método de decodificación/codificación se puede implementar en un soporte de grabación de programas en forma de códigos legibles por ordenador. Además, datos multimedia que presenten la estructura de datos de la presente invención se pueden almacenar en el soporte de grabación legible por ordenador. Los soportes de grabación legibles por ordenador incluyen todo tipo de dispositivos de almacenamiento en los
E09012229
14-09-2015
cuales se almacenan datos legibles por medio de un sistema de ordenador. Los soportes legibles por ordenador incluyen, por ejemplo, ROM, RAM, CD-ROM, cintas magnéticas, discos flexibles, dispositivos de almacenamiento óptico de datos, y similares, e incluyen también implementaciones del tipo ondas portadoras (por ejemplo, transmisión por Internet). Además, un flujo continuo de bits generado por el método de codificación se almacena en
5 un soporte de grabación legible por ordenador o se puede transmitir por medio de una red de comunicaciones por cable/inalámbricas.
Aplicabilidad industrial
10 Por lo tanto, la presente invención es aplicable a la codificación/decodificación de señales.
Aunque la presente invención se ha descrito e ilustrado en la presente memoria haciendo referencia a sus formas de realización preferidas, se pondrá de manifiesto para el experto en la materia que en la invención se pueden introducir varias modificaciones y variaciones sin apartarse del alcance de las reivindicaciones adjuntas. Por tanto,
15 se pretende que la presente invención comprenda las modificaciones y variaciones de la presente invención invención dentro del alcance de las reivindicaciones adjuntas. El alcance de la invención resulta definido meramente por las reivindicaciones adjuntas.

Claims (6)

  1. REIVINDICACIONES
    1. Método de procesado de una señal que incluye una señal de habla y una señal de audio, comprendiendo el método:
    5 recibir la señal, información de extensión e información espacial que indican un atributo de una señal de varios canales (L, R) para mezclar en sentido ascendente una señal de mezcla descendente (DMX);
    decodificar la señal de audio en un dominio de la frecuencia de acuerdo con una transformada de coeficiente discreta modificada inversa;
    decodificar la señal de habla en un dominio del tiempo utilizando un esquema de codificación por predicción lineal;
    15 reconstruir la señal de mezcla descendente (DMX) expandiendo la señal de audio decodificada y la señal de habla decodificada en una señal de mezcla descendente de banda completa utilizando la información de extensión, generándose la señal de mezcla descendente (DMX) a partir de la señal de varios canales (L, R);
    obtener una bandera de codificación de diferencias de fase entre canales, IPD, (bsPhaseCoding) que indica si se utiliza un valor de IPD en la información espacial a partir de un encabezamiento de la información espacial;
    obtener una bandera de modo de IPD (bsPhaseMode) sobre la base de la bandera de codificación de IPD (bsPhaseCoding) a partir de una trama de la información espacial, indicando la bandera de modo de IPD (bsPhaseMode) si el valor de IPD se utiliza en la trama de la información espacial;
    25 obtener el valor de IPD de una banda paramétrica (pb=0, ..., pb =4) de un espacio de tiempo paramétrico ([0], [1],...) en la trama, sobre la base de la bandera de modo de IPD (bsPhaseMode);
    suavizar el valor de IPD modificando el valor de IPD utilizando el valor de IPD de un espacio de tiempo paramétrico previo; y
    generar una señal de varios canales aplicando el valor de IPD suavizado a la señal de mezcla descendente (DMX),
    35 en el que la información espacial está dividida por el encabezamiento y una pluralidad de las tramas,
    en el que el valor de IPD indica una diferencia de fase entre dos canales de la señal de varios canales (L,R),
    en el que el espacio de tiempo paramétrico ([0], [1],...) indica un espacio de tiempo (1, 2, 3, 4, ..., N) al que se aplica el valor de IPD,
    en el que la banda paramétrica (pb=0, ..., pb=4) es por lo menos una subbanda de un dominio de la frecuencia que incluye el valor de IPD,
    45 en el que el valor de IPD se recibe cuando la relación entre el valor de IPD y un valor de la diferencia de nivel entre canales, ILD, supera un umbral, y
    en el que el valor de ILD indica una diferencia de nivel entre dos canales de la señal de varios canales incluida en la señal de mezcla descendente.
  2. 2. Método según la reivindicación 1, que comprende además:
    generar un ángulo de corrección que indica un ángulo entre dos canales de la señal de varios canales utilizando el valor de IPD; y
    55 modificar el ángulo de corrección utilizando un ángulo de corrección del espacio de tiempo paramétrico previo.
  3. 3. Método según la reivindicación 1, que comprende además:
    determinar el valor de IPD de un espacio de tiempo al que no se aplica el valor de IPD utilizando por lo menos uno de entre el valor de IPD y el valor de IPD suavizado.
  4. 4. Aparato (200, 900, 1700) para procesar una señal que incluye una señal de habla y una señal de audio, 65 comprendiendo el aparato (200, 900, 1700):
    21
    una unidad de recepción de señales (210, 240; 910, 940) adaptada para recibir la señal, información de extensión e información espacial que indican un atributo de una señal de varios canales (L, R) para mezclar en sentido ascendente una señal de mezcla descendente (DMX);
    5 una unidad de decodificación de señales de audio (1750) adaptada para decodificar la señal de audio en un dominio de la frecuencia de acuerdo con una transformada de coeficiente discreta modificada inversa;
    una unidad de decodificación de señales de habla (1760) adaptada para decodificar la señal de habla en un dominio del tiempo utilizando un esquema de codificación por predicción lineal;
    10 una unidad de decodificación de señales de extensión de ancho de banda (1770) adaptada para reconstruir la señal de mezcla descendente expandiendo la señal de audio decodificada y la señal de habla decodificada en una señal de mezcla descendente de banda completa utilizando la información de extensión, generándose la señal de mezcla descendente (DMX) a partir de la señal de varios canales (L, R);
    15 una unidad de obtención de banderas de codificación de diferencias de fase entre canales, IPD, (231, 931, 1781) adaptada para obtener una bandera de codificación de IPD que indica si se utiliza un valor de IPD en la información espacial a partir de un encabezamiento de la información espacial;
    20 una unidad de obtención de banderas de modo de IPD (232, 932, 1782) adaptada para obtener una bandera de modo de IPD sobre la base de la bandera de codificación de IPD a partir de una trama de la información espacial, indicando la bandera de modo de IPD si el valor de IPD se utiliza en la trama de la información espacial;
    25 una unidad de obtención de IPD (233, 933, 1783) adaptada para obtener el valor de IPD de una banda paramétrica (pb=0, ..., pb=4) de un espacio de tiempo paramétrico ([0], [1], ...), sobre la base de la bandera de modo de IPD;
    una unidad de suavización de IPD (934) adaptada para suavizar el valor de IPD modificando el valor de IPD 30 utilizando el valor de IPD de un espacio de tiempo paramétrico previo; y
    una unidad de mezclado ascendente (240, 940, 1784) adaptada para generar la señal de varios canales aplicando el valor de IPD suavizado a la señal de mezcla descendente,
    35 en el que la información espacial está dividida por un encabezamiento y una pluralidad de las tramas,
    en el que el valor de IPD indica una diferencia de fase entre dos canales de la señal de varios canales,
    en el que el espacio de tiempo paramétrico ([0], [1],...) indica un espacio de tiempo (1, 2, 3, 4, ..., N) al que se aplica 40 el valor de IPD,
    en el que la banda paramétrica (pb=0, ..., pb=4) es por lo menos una subbanda de un dominio de la frecuencia que incluye el valor de IPD,
    45 en el que el valor de IPD se recibe cuando la relación entre el valor de IPD y un valor de la diferencia de nivel entre canales, ILD, supera un umbral, y
    en el que el valor de ILD indica una diferencia de nivel entre dos canales de la señal de varios canales incluida en la señal de mezcla descendente. 50
  5. 5. Aparato según la reivindicación 4, en el que la unidad de suavización de IPD comprende:
    una unidad de generación de ángulos de corrección adaptada para generar un ángulo de corrección que indica un ángulo entre dos canales de la señal de varios canales, utilizando el valor de IPD; y
    55 una unidad de modificación de ángulos de corrección adaptada para modificar el ángulo de corrección utilizando un ángulo de corrección del espacio de tiempo paramétrico previo.
  6. 6. Aparato según la reivindicación 4, que comprende además una unidad de interpolación de IPD adaptada para
    60 determinar el valor de IPD de un espacio de tiempo en el que no se aplica el valor de IPD utilizando por lo menos uno de entre el valor de IPD y el valor de IPD suavizado.
    22
ES09012229.2T 2008-09-25 2009-09-25 Método y aparato para procesar una señal Active ES2547232T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US100262P 1998-09-14
US10026208P 2008-09-25 2008-09-25
KR1020090090518A KR101108061B1 (ko) 2008-09-25 2009-09-24 신호 처리 방법 및 이의 장치
KR20090090518 2009-09-24

Publications (1)

Publication Number Publication Date
ES2547232T3 true ES2547232T3 (es) 2015-10-02

Family

ID=42213076

Family Applications (1)

Application Number Title Priority Date Filing Date
ES09012229.2T Active ES2547232T3 (es) 2008-09-25 2009-09-25 Método y aparato para procesar una señal

Country Status (4)

Country Link
JP (2) JP5426680B2 (es)
KR (3) KR101108060B1 (es)
CN (2) CN102165520B (es)
ES (1) ES2547232T3 (es)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2746524C (en) * 2009-04-08 2015-03-03 Matthias Neusinger Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing
KR101767175B1 (ko) 2011-03-18 2017-08-10 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 코딩에서의 프레임 요소 길이 전송
CN102446507B (zh) 2011-09-27 2013-04-17 华为技术有限公司 一种下混信号生成、还原的方法和装置
JP5977434B2 (ja) * 2012-04-05 2016-08-24 ホアウェイ・テクノロジーズ・カンパニー・リミテッド パラメトリック空間オーディオ符号化および復号化のための方法、パラメトリック空間オーディオ符号器およびパラメトリック空間オーディオ復号器
EP2702587B1 (en) * 2012-04-05 2015-04-01 Huawei Technologies Co., Ltd. Method for inter-channel difference estimation and spatial audio coding device
EP2790419A1 (en) 2013-04-12 2014-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830049A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
RU2641463C2 (ru) * 2013-10-21 2018-01-17 Долби Интернэшнл Аб Структура декоррелятора для параметрического восстановления звуковых сигналов
CN104681029B (zh) 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
CN107452387B (zh) 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
CN108694955B (zh) * 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
CN109215668B (zh) 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
CN110556118B (zh) * 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002208869A (ja) * 2001-01-09 2002-07-26 Sony Corp マルチバンド無線信号送受信装置
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ATE332003T1 (de) 2002-04-22 2006-07-15 Koninkl Philips Electronics Nv Parametrische beschreibung von mehrkanal-audio
EP1914722B1 (en) * 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
PL1735774T3 (pl) * 2004-04-05 2008-11-28 Koninl Philips Electronics Nv Koder wielokanałowy
KR101117336B1 (ko) * 2004-05-19 2012-03-08 파나소닉 주식회사 오디오 신호 부호화 장치 및 오디오 신호 복호화 장치
WO2006003813A1 (ja) 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ符号化及び復号化装置
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
KR101512995B1 (ko) * 2005-09-13 2015-04-17 코닌클리케 필립스 엔.브이. 공간 디코더 유닛, 공간 디코더 장치, 오디오 시스템, 한 쌍의 바이노럴 출력 채널들을 생성하는 방법
CN101617360B (zh) * 2006-09-29 2012-08-22 韩国电子通信研究院 用于编码和解码具有各种声道的多对象音频信号的设备和方法
KR100917845B1 (ko) * 2006-12-04 2009-09-18 한국전자통신연구원 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그방법
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding

Also Published As

Publication number Publication date
JP5426680B2 (ja) 2014-02-26
KR20100035122A (ko) 2010-04-02
KR101108060B1 (ko) 2012-01-25
JP5480274B2 (ja) 2014-04-23
CN102165519A (zh) 2011-08-24
KR20100035120A (ko) 2010-04-02
JP2012503791A (ja) 2012-02-09
CN102165520B (zh) 2012-11-28
CN102165520A (zh) 2011-08-24
KR20100035121A (ko) 2010-04-02
KR101108061B1 (ko) 2012-01-25
JP2012503792A (ja) 2012-02-09

Similar Documents

Publication Publication Date Title
ES2547232T3 (es) Método y aparato para procesar una señal
JP6982113B2 (ja) 二次元または三次元音場のアンビソニックス表現の一連のフレームをエンコードおよびデコードする方法および装置
TWI752281B (zh) 用以使用量化及熵寫碼來編碼或解碼方向性音訊寫碼參數之設備及方法
KR102230727B1 (ko) 광대역 정렬 파라미터 및 복수의 협대역 정렬 파라미터들을 사용하여 다채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
JP5185340B2 (ja) マルチチャネルオーディオ信号を表示するための装置と方法
TWI508578B (zh) 音訊編碼及解碼
CA2645912C (en) Methods and apparatuses for encoding and decoding object-based audio signals
US20140025386A1 (en) Systems, methods, apparatus, and computer-readable media for audio object clustering
US20120134511A1 (en) Multichannel audio coder and decoder
Breebaart et al. High-quality parametric spatial audio coding at low bitrates
JP2015528926A (ja) マルチチャネルをダウンミックス/アップミックスする場合のため一般化された空間オーディオオブジェクト符号化パラメトリック概念のデコーダおよび方法
GB2485979A (en) Spatial audio coding
Breebaart et al. Binaural rendering in MPEG Surround
US20190304474A1 (en) Encoding/decoding apparatus for processing channel signal and method therefor
Herre et al. Perceptual audio coding
Jansson Stereo coding for the ITU-T G. 719 codec
Jiang et al. Multi-channel audio compression method based on ITU-T G. 719 codec
Li et al. The perceptual lossless quantization of spatial parameter for 3D audio signals
Mouchtaris et al. Multichannel Audio Coding for Multimedia Services in Intelligent Environments
Aggrawal et al. New Enhancements for Improved Image Quality and Channel Separation in the Immersive Sound Field Rendition (ISR) Parametric Multichannel Audio Coding System
KR20080033841A (ko) 믹스 신호 처리 방법 및 장치