ES2544077T3 - Aparato para descodificar una señal que comprende transitorios usando una unidad de combinación y un mezclador - Google Patents

Aparato para descodificar una señal que comprende transitorios usando una unidad de combinación y un mezclador Download PDF

Info

Publication number
ES2544077T3
ES2544077T3 ES11731316.3T ES11731316T ES2544077T3 ES 2544077 T3 ES2544077 T3 ES 2544077T3 ES 11731316 T ES11731316 T ES 11731316T ES 2544077 T3 ES2544077 T3 ES 2544077T3
Authority
ES
Spain
Prior art keywords
signal
transient
correlator
mixer
signal component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11731316.3T
Other languages
English (en)
Inventor
Achim Kuntz
Sascha Disch
Jürgen HERRE
Fabian Kuech
Johannes Hilpert
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44509236&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2544077(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2544077T3 publication Critical patent/ES2544077T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)
  • Error Detection And Correction (AREA)
  • Optical Communication System (AREA)

Abstract

Un aparato para descodificar una senal que comprende: un separador de transitorios (310; 410; 510; 610; 710; 910) para separar una senal de entrada de aparato en una primera componente de senal y en una segunda componente de senal de tal modo que la primera componente de senal comprende porciones de senal transitorias de la senal de entrada y de tal modo que la segunda componente de senal comprende porciones de senal no transitorias de la senal de entrada; un descorrelacionador de transitorios (320; 420; 520; 620; 720; 920) para descorrelacionar la primera componente de senal de acuerdo con un primer metodo de descorrelacion para obtener una primera componente de senal descorrelacionada; un segundo descorrelacionador (330; 430; 530; 630; 730; 930) adicional para descorrelacionar la segunda componente de senal de acuerdo con un segundo metodo de descorrelacion para obtener una segunda componente de senal descorrelacionada, en el que el segundo metodo de descorrelacion es diferente del primer metodo de descorrelacion; una unidad de combinacion (340; 440; 540; 640; 740; 940) para combinar la primera componente de senal descorrelacionada y la segunda componente de senal descorrelacionada para obtener una senal de combinacion descorrelacionada; y un mezclador (450; 552; 752; 952), que esta adaptado para recibir senales de entrada de mezclador y que esta adaptado para generar senales de salida sobre la base de las senales de entrada de mezclador y una regla de mezclado; en el que la unidad de combinacion (340; 440; 540; 640; 740; 940) y el mezclador (450; 552; 752; 952) estan dispuestos de tal modo que la senal de combinacion descorrelacionada se alimenta al mezclador (450; 552; 752; 952) como una primera senal de entrada de mezclador y que la senal de entrada de aparato o una senal derivada de la senal de entrada de aparato se alimenta al mezclador (450; 552; 752; 952) como una segunda senal de entrada de mezclador.

Description

imagen1
DESCRIPCIÓN
Aparato para descodificar una señal que comprende transitorios usando una unidad de combinación y un mezclador
5 La presente invención se refiere al campo del procesamiento de audio y la descodificación de audio, en particular a la descodificación de una señal que comprende transitorios.
En los últimos años ha avanzado de muchas maneras el procesamiento y / o la descodificación de audio. En particular, las aplicaciones de audio espacial se están volviendo cada vez más importantes. El procesamiento de
10 señales de audio se usa con frecuencia para descorrelacionar o reproducir señales. Además, la descorrelación y la reproducción de señales se emplea en el proceso de mezclado ascendente mono a estéreo, mezclado ascendente mono / estéreo a multicanal, reverberación artificial, ensanchamiento de estéreo o mezclado / reproducción interactivo con el usuario.
15 Diversos sistemas de procesamiento de señales de audio emplean descorrelacionadores. Un ejemplo importante es la aplicación de sistemas descorrelacionadores en descodificadores de audio espacial paramétricos para recuperar propiedades de descorrelación específicas entre dos o más señales que son reconstruidas a partir de una o varias señales de mezclado descendente. La aplicación de descorrelacionadores mejora significativamente la calidad perceptual de la señal de salida, por ejemplo, en comparación con estéreo de intensidad. Específicamente, el uso de
20 descorrelacionadores permite la correcta síntesis de sonido espacial con una amplia imagen de sonido, varios objetos de sonido concurrentes y / o atmósfera. No obstante, también se sabe que los descorrelacionadores introducen artefactos como cambios en la estructura temporal de la señal, el timbre, etc.
Otros ejemplos de aplicación de descorrelacionadores en procesamiento de audio son, por ejemplo, la generación
25 de reverberación artificial para cambiar la impresión espacial o el uso de descorrelacionadores en sistemas de cancelación de eco acústico multicanal para mejorar el comportamiento de convergencia.
En la figura 1 se ilustra una típica aplicación de un descorrelacionador del estado de la técnica en un mezclador ascendente mono a estéreo, por ejemplo, aplicado en Estéreo Paramétrico (PS, Parametric Stereo), en la que se 30 provee una señal de entrada mono M (una señal “seca”) a un descorrelacionador 110. El descorrelacionador 110 descorrelaciona la señal de entrada mono M de acuerdo con un método de descorrelación para proporcionar una señal descorrelacionada D (una señal “mojada”) en su salida. La señal descorrelacionada D se alimenta a un mezclador 120 como una primera señal de entrada de mezclador junto con la señal mono seca M como una segunda señal de entrada de mezclador. Además, una unidad de control de mezclado ascendente 130 alimenta
35 parámetros de control de mezclado ascendente al mezclador 120. El mezclador 120 genera a continuación dos canales de salida L y R (L = canal de salida estéreo izquierdo; R = canal de salida estéreo derecho) de acuerdo con una matriz de mezclado H. Los coeficientes de la matriz de mezclado pueden ser fijos, dependientes de la señal o controlados por un usuario.
40 Como alternativa, la matriz de mezclado es controlada por información conexa que es transmitida junto con el mezclado descendente que contiene una descripción paramétrica sobre cómo mezclar de forma ascendente las señales del mezclado descendente para formar la salida multicanal deseada. Esta información conexa espacial es generada por lo general durante el proceso de mezclado descendente mono en un codificador de señal compatible.
45 Este principio se aplica ampliamente en la codificación de audio espacial, por ejemplo, Estéreo Paramétrico, véase por ejemplo, de J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, “Codificación de Audio Espacial Paramétrico de Alta Calidad a bajas tasas de bits” (“HighQuality Parametric Spatial Audio Coding at Low Bitrates”) en Actas de la 116ª Convención de AES, Berlín, Preimpresión 6072, mayo de 2004.
50 Una estructura típica adicional del estado de la técnica de un descodificador estéreo paramétrico se ilustra en la figura 2, en la que el proceso de descorrelación se realiza en un dominio de transformada. Un banco de filtros de análisis 210 transforma una señal de entrada mono a un dominio de transformada, por ejemplo, a un dominio de la frecuencia. La descorrelación de la señal de entrada mono transformada M es realizada a continuación por un descorrelacionador 220 que genera una señal descorrelacionada D. Tanto la señal de entrada mono transformada M
55 como la señal descorrelacionada D, se alimentan a una matriz de mezclado 230. La matriz de mezclado 230 genera a continuación dos señales de salida L y R teniendo en cuenta parámetros de mezclado ascendente, que se proporcionan por la unidad de modificación de parámetros 240, que está provista con parámetros espaciales y está acoplada a una unidad de control de parámetros 250. En la figura 2, los parámetros espaciales pueden ser modificados por un usuario o herramientas adicionales, por ejemplo, postprocesamiento para reproducción /
60 presentación binaural. En este ejemplo, los parámetros de mezclado ascendente se combinan con los parámetros procedentes de los filtros binaurales para formar los parámetros de entrada para la matriz de mezclado ascendente. Finalmente, las señales de salida generadas por la matriz de mezclado 230 se alimentan a un banco de filtros de síntesis 260, que determina la señal de señal de salida estéreo.
imagen2
La salida L / R de la matriz de mezclado 230 es computada a partir de la señal de entrada modo M y la señal descorrelacionada D de acuerdo con una regla de mezclado, por ejemplo, mediante la aplicación de la siguiente fórmula:
L
h11 h12
M
⎢⎣=
⎢
⎥
⎥
⎢
⎥
R
hh
D
21 22
En la matriz de mezclado, la cantidad del sonido descorrelacionado alimentado a la salida es controlada sobre la base de los parámetros transmitidos, por ejemplo, Correlación / Coherencia Inter Canal (ICC, InterChannel Correlation / Coherence) y / o configuraciones fijas o definidas por el usuario.
10 Conceptualmente, la señal de salida de la salida del descorrelacionador D reemplaza una señal residual que idealmente permitiría una descodificación perfecta de las señales L / R originales. Utilizar la salida de descorrelacionador D en lugar de una señal residual en el mezclador ascendente da como resultado un ahorro de tasa de bits que de otra manera se hubiera requerido para transmitir la señal residual. El objeto del
15 descorrelacionador es, por lo tanto, generar una señal D a partir de la señal mono M, que exhiba propiedades similares a las de la señal residual que es reemplazada por D.
De forma correspondiente, en el lado del codificador, se extraen dos tipos de parámetros espaciales: Un primer grupo de parámetros comprende parámetros de correlación / coherencia (por ejemplo, ICCs = parámetros de
20 Correlación / Coherencia Inter Canal) que representan la coherencia o la correlación cruzada entre dos canales de entrada que serán codificados. Un segundo grupo de parámetros comprende parámetros de diferencia de nivel (por ejemplo, ILDs = parámetros de Diferencia de Nivel Inter Canal) que representan la diferencia de nivel entre los dos canales de entrada.
25 Además, una señal de mezclado descendente es generada mezclando de forma descendente los dos canales de entrada. Además, se genera una señal residual. Las señales residuales son señales que pueden ser usadas para regenerar las señales originales mediante el empleo adicional de la señal de mezclado descendente y una matriz de mezclado ascendente. Por ejemplo, cuando N señales son mezcladas de forma descendente a 1 señal, el mezclado descendente por lo general es 1 de las N componentes que resultan de la puesta en correspondencia de las N
30 señales de entrada. Las componentes restantes que resultan de la puesta en correspondencia (por ejemplo, N 1 componentes) son las señales residuales y permiten la reconstrucción de las N señales originales mediante una puesta en correspondencia inversa. La puesta en correspondencia puede ser, por ejemplo, una rotación. La puesta en correspondencia debe llevarse a cabo de tal modo que la señal de mezclado descendente sea maximizada y las señales residuales sean minimizadas, por ejemplo, similar a una transformación de eje principal. Por ejemplo, la
35 energía de la señal de mezclado descendente debe ser maximizada y las energías de las señales residuales deben ser minimizadas. Cuando se mezclan de forma descendente 2 señales a 1 señal, el mezclado descendente es normalmente una de las dos componentes que resultan de la puesta en correspondencia de las 2 señales de entrada. La componente restante que resulta de la puesta en correspondencia es la señal residual y permite la reconstrucción de las 2 señales originales mediante una puesta en correspondencia inversa.
40 En algunos casos, la señal residual puede representar un error asociado con la representación de las dos señales mediante sus parámetros de mezclado descendente, y otros asociados. Por ejemplo, la señal residual puede ser una señal de error que representa el error entre los canales originales L, R y los canales L’, R’, resultantes de mezclar de forma ascendente la señal de mezclado descendente que fue generada sobre la base de los canales originales L y
45 R.
Dicho de otra forma, una señal residual puede ser considerada como una señal en el dominio del tiempo o un dominio de la frecuencia o un dominio subbanda, que junto con la señal de mezclado descendente sola o con la señal de mezclado descendente y la información paramétrica permite una reconstrucción correcta o casi correcta de
50 un canal original. Casi correcto se debe entender como que la reconstrucción con la señal residual que tiene una energía mayor que cero es más cercana al canal original en comparación con una reconstrucción usando el mezclado descendente sin la señal residual o usando el mezclado descendente y la información paramétrica sin la señal residual.
55 Considerando MPEG Surround (MPS), se emplean estructuras similares a PS llamadas cajas de Uno a Dos (cajas OTT, onetotwo) en árboles de descodificación de audio espacial. Esto se puede ver como una generalización del concepto de mezclado ascendente mono a estéreo a esquemas de codificación / descodificación de audio espacial multicanal. En MPS, también existen sistemas de mezclado ascendente de dos a tres (cajas TTT, twotothree) que pueden aplicar descorrelacionadores dependiendo del modo de operación TTT. En el documento de J. Herre, K.
60 Kjörling, J. Breebaart, y col., “MPEG Surround la norma ISO / MPEG para codificación de audio multicanal eficiente y compatible” (“MPEG Surround  the ISO / MPEG standard for efficient and compatible multichannel audio coding”) en las Actas de la 122ª Convención de AES, Viena, Austria, mayo de 2007, se describen detalles.
imagen3
Con respecto a la Codificación de Audio Direccional (DirAC, Directional Audio Coding), la DirAC se refiere a un esquema de codificación de campo de sonido paramétrico que no está ligado a un número fijo de canales de salida de audio con posiciones de altavoz fijas. La DirAC aplica descorrelacionadores en el reproductor DirAC, es decir, en
5 el descodificador de audio espacial para sintetizar componentes no coherentes de campos de sonido. Se puede hallar más información relacionada con la codificación de audio direccional en el documento de Pulkki, Ville: “Reproducción de Sonido Espacial con Codificación de Audio Direccional” (“Spatial Sound Reproduction with Directional Audio Coding”) en J. Audio Eng. Soc., Vol. 55, Nº 6, 2007.
10 Con respecto a descorrelacionadores del estado de la técnica en descodificadores de audio espacial, se hace referencia a la Norma Internacional ISO / IEC “Tecnología de Información tecnologías de audio MPEG” Parte 1: MPEG Surround” (“Information Technology  MPEG audio technologies Part 1: MPEG Surround”), ISO / IEC 230031:2007 y también al documento de J. Engdegard, H. Purnhagen, J. Röden, L.Liljeryd, “Atmósfera Sintética en Codificación Paramétrica de Estéreo” (“Synthetic Ambience in Parametric Stereo Coding”) en Actas de la 116ª de
15 Convención de AES, Berlín, Preimpresión, mayo de 2004. Se usan estructuras reticulares pasa todo (lattice allpass structures) IIR como descorrelacionadores en descodificadores de audio espacial como MPS tal como se describe en el documento de J. Herre, K. Kjörling, J. Breebaart, y col., “MPEG Surround la norma ISO / MPEG para codificación de audio multicanal eficiente y compatible” (“MPEG Surround  the ISO / MPEG standard for efficient and compatible multichannel audio coding”) en las Actas de la 122ª Convención de AES, Viena, Austria, mayo de 2007, y
20 se describen en la Norma Internacional ISO / IEC “Tecnología de Información tecnologías de audio MPEG Parte
1: MPEG Surround” (“Information Technology  MPEG audio technologies  Part 1: MPEG Surround”), ISO / IEC 230031:2007. Otros descorrelacionadores del estado de la técnica aplican demoras (potencialmente dependientes de la frecuencia) para descorrelacionar señales o convolucionar las señales de entrada, por ejemplo, con ráfagas de ruido que decaen exponencialmente. Para una visión de conjunto de los descorrelacionadores del estado de la
25 técnica para sistemas de mezclado ascendente de audio espacial, véase “Atmósfera Sintética en Codificación Estéreo Paramétrica” (“Synthetic Ambience in Parametric Stereo Coding”) en Actas de la 116ª Convención de AES, Berlín, Preimpresión, mayo de 2004.
Otra técnica de procesamiento de señales es el “procesamiento de mezclado ascendente semántico” (semantic
30 upmix processing”). El procesamiento de mezclado ascendente semántico es una técnica para descomponer señales en unas componentes con diferentes propiedades semánticas (es decir, clases de señal) y aplicar diferentes estrategias de mezclado ascendente a las diferentes componentes de señal. Los diferentes algoritmos de mezclado ascendente pueden ser optimizados de acuerdo con las diferentes propiedades semánticas para mejorar el esquema de procesamiento de señales global. Este concepto se describe en el documento WO/2010/017967, “Un aparato
35 para determinar una señal de audio multicanalcanal de salida espacial” (An apparatus for determining a spatial output multichannelchannel audio signal), solicitud de patente internacional PCT/EP2009/005828, 8 11 2009, 6 11 2010 (FH090802PCT).
Un esquema de codificación de audio espacial adicional es el “método de permutación temporal”, tal como se
40 describe en el documento de Hotho, G., van de Par, S., y Breebaart, J.: “Codificación multicanal de señales de aplauso” (“Multichannel coding of applause signals”), EURASIP Journal on Advances in Signal Processing, enero de 2008, art. 10. DOI = http://dx.doi.org/10.1155/2008/. En este documento se propone un esquema de codificación de audio espacial que se adecua a medida a la codificación / descodificación de señales de tipo aplauso. Este esquema se basa en la similitud perceptual de segmentos de una señal de audio monofónica, en especial una señal de
45 mezclado descendente de un codificador de audio espacial. La señal de audio monofónica es segmentada en segmentos de tiempo que se superponen. Estos segmentos son permutados temporalmente de forma pseudo aleatoria (mutuamente independientes para n canales de salida) dentro de un “superbloque” para formar los canales de salida descorrelacionados.
50 Una técnica de codificación de audio espacial adicional es el “método demora temporal e intercambio” (“temporal delay and swapping method”). En el documento “DE 10 2007 018032 A: 20070417, Erzeugung dekorrelierter Signale”, 17.4.2007, 23.10.2008 (FH070414PDE), se propone un esquema que también se adecua a medida para codificación / descodificación de señales de tipo aplauso para presentación binaural. Este esquema también se basa en la similitud perceptual de segmentos de una señal de audio monofónica y se demora en canales de salida
55 respecto al otro. Para evitar un sesgo de localización hacia el canal adelantado, se intercambian de forma periódica los canales adelantado y retrasado.
En general, se sabe que las señales de tipo aplauso estéreo o multicanal codificadas / descodificadas en codificadores de audio espacial paramétricos dan como resultado una calidad de señal reducida (véase, por ejemplo, 60 Hotho, G., van de Par, S., y Breebaart, J.:”Codificación multicanal de señales de aplauso” (“Multichannel coding of applause signals”), EURASIP Journal on Advances in Signal Processing, enero de 2008, art. 10. DOI = http://dx.doi.org/10.1155/2008/531693, véase también el documento DE 10 2007 018032 A). Las señales de tipo aplauso se caracterizan por contener mezclas temporalmente densas de transitorios procedentes de diferentes direcciones. Ejemplos de tales señales son aplausos, el sonido de la lluvia, caballos al galope, etc. Las señales de
imagen4
tipo aplauso con frecuencia también contienen componentes de sonido procedentes de fuentes de sonido distantes, que se funden de forma perceptual en un campo de sonido de fondo, suave y de tipo ruido.
Las técnicas de descorrelación del estado de la técnica empleadas en descodificadores de audio espacial tipo
5 MPEG Surround comprenden estructuras reticulares pasa todo. Estas actúan como generadores de reverberación y, en consecuencia, son adecuadas para generar sonidos homogéneos, suaves y de tipo ruido, inmersivos (como colas de reverberación de sala). No obstante, hay ejemplos de campos de sonido con una estructura espaciotemporal no homogénea que aún son inmersores para el oyente: un ejemplo destacado son los campos de sonido de tipo aplauso que crean envolvimiento del oyente no solo mediante campos de tipo ruido homogéneos, sino también
10 mediante secuencias bastante densas de palmadas singulares procedentes de diferentes direcciones. Por lo tanto, la componente no homogénea de los campos de sonido de aplauso puede estar caracterizada por una mezcla espacialmente distribuida de transitorios. Obviamente, estas palmadas diferenciadas no son en absoluto homogéneas, suaves y de tipo ruido.
15 Debido a su comportamiento de tipo reverberación, los descorrelacionadores de retícula pasa todo son incapaces de generar un campo de sonido inmersivo con las características, por ejemplo, de aplauso. En su lugar, cuando se aplican a señales de tipo aplauso, tienden a aplicar un efecto estela de forma temporal sobre los transitorios de las señales. El resultado no deseado es un campo de sonido inmersivo de tipo ruido sin la estructura espaciotemporal distintiva de los campos de sonido de tipo aplauso. Además, eventos transitorios como un aplauso singular podrían
20 evocar artefactos de anillo de los filtros del descorrelacionador.
Un sistema de acuerdo con Hotho, G., van de Par, S., y Breebaart, J.: “Codificación multicanal de señales de aplauso” (“Multichannel coding of applause signals”), EURASIP Journal on Advances in Signal Processing, enero de 2008, art. 10. DOI = http://dx.doi.org/10.1155/2008/531693, exhibirá una degradación perceptible del sonido de 25 salida debido a una cierta cualidad repetitiva en la señal de audio de salida. Eso es debido a que uno y el mismo segmento de la señal de entrada aparece inalterado en cada canal de salida (aunque en un punto diferente en el tiempo). Además, para evitar una densidad de aplauso aumentada, hay que suprimir algunos canales originales en el mezclado ascendente y, por lo tanto, podría faltar algún evento auditivo importante en el mezclado ascendente resultante. El método solo es aplicable si es posible hallar segmentos de señal que comparten las mismas 30 propiedades perceptuales, es decir, segmentos de señal que suenan de forma similar. El método en general cambia profundamente la estructura temporal de las señales, lo cual podría ser aceptable solo para muy pocas señales. En el caso de aplicar el esquema a señales que no son de tipo aplauso (por ejemplo, debido a una mala clasificación de señal), la permutación temporal conducirá en la mayor parte de los casos a unos resultados inaceptables. La permutación temporal además limita la susceptibilidad de aplicación a casos en los que se pueden mezclar entre sí
35 varios segmentos de señal juntos sin artefactos como ecos o filtrado de peine. Inconvenientes similares son de aplicación al método descrito en el documento DE 10 2007 018032 A.
El procesamiento semántico de mezclado ascendente descrito en el documento WO/2010/017967 separa las componentes transitorias de las señales antes de la aplicación de descorrelacionadores. La señal (sin transitorios)
40 remanente se alimenta al procesador de descorrelación y de mezclado ascendente convencional, mientras que las señales transitorias son manipuladas de diferente manera; estas últimas son distribuidas (por ejemplo de forma aleatoria) a diferentes canales de la señal de salida estéreo o multicanal mediante la aplicación de técnicas de panorámica de amplitud. La panorámica de amplitud muestra varias desventajas:
45 La panorámica de amplitud no necesariamente produce una señal de salida que sea cercana a la original. La señal de salida puede ser cercana a la original solo si la distribución de los transitorios en la señal original puede describirse por las leyes de panorámica de amplitud. Es decir: la panorámica de amplitud solo puede reproducir correctamente eventos con panorámica en amplitud pura, pero no las diferencias de fase o tiempo entre las componentes transitorias en diferentes canales de salida.
50 Además, la aplicación del enfoque de panorámica de amplitud en MPS requeriría saltarse no solo el descorrelacionador sino también la matriz de mezclado ascendente. Debido a que la matriz de mezclado ascendente refleja los parámetros espaciales (correlaciones inter canal: ICCs, diferencias de nivel inter canal: ILDs) que son necesarios para sintetizar una salida de mezclado ascendente que muestra las propiedades espaciales correctas, el
55 propio sistema de panorámica tiene que aplicar alguna regla para sintetizar señales de salida con las propiedades espaciales correctas. No se conoce una regla genérica para hacer esto. Además, esta estructura agrega complejidad debido a que hay que encargarse dos veces de los parámetros espaciales: una vez, para la parte no transitoria de la señal y, en segundo lugar, para la parte transitoria con panorámica en amplitud de la señal.
60 Por lo tanto un objeto de la presente invención es la provisión de un concepto mejorado para generar una señal descorrelacionada para descodificar una señal. El objeto de la presente invención se resuelve mediante un aparato para generar para descodificar una señal descorrelacionada de acuerdo con la reivindicación 1, mediante un método para descodificar una señal de acuerdo con la reivindicación 13 y mediante un programa informático de acuerdo con la reivindicación 14.
imagen5
Un aparato de acuerdo con una realización comprende un separador de transitorios para separar una señal de entrada en una primera componente de señal y en una segunda componente de señal de tal modo que la primera componente de señal comprende porciones de señal transitorias de la señal de entrada y de tal modo que la
5 segunda componente de señal comprende porciones de señal no transitorias de la señal de entrada. El separador de transitorios puede separar las diferentes componentes de señal una de otra para permitir que las componentes de señal que comprenden transitorios puedan procesarse de manera diferente que las componentes de señal que no comprenden transitorios.
10 El aparato comprende además un descorrelacionador de transitorios para descorrelacionar componentes de señal que comprenden transitorios de acuerdo con un método de descorrelación que es particularmente adecuado para descorrelacionar componentes de señal que comprenden transitorios. Además, el aparato comprende un segundo descorrelacionador para descorrelacionar componentes de señal que no comprenden transitorios.
15 De este modo, el aparato es capaz o bien de procesar componentes de señal usando un descorrelacionador convencional o bien, como alternativa, de procesar componentes de señal usando el descorrelacionador de transitorios particularmente adecuado para procesar componentes de señal transitorias. En una realización, el separador de transitorios decide si una componente de señal se alimenta o bien al descorrelacionador convencional
o bien al descorrelacionador de transitorios.
20 Además, el aparato puede estar adaptado para separar una componente de señal de tal modo que la componente de señal se alimenta parcialmente al descorrelacionador de transitorios y se alimenta parcialmente al segundo descorrelacionador.
25 Además, el aparato comprende una unidad de combinación para combinar las componentes de señal emitidas por el descorrelacionador convencional y el descorrelacionador de transitorios para generar una señal de combinación descorrelacionada.
En una realización, el aparato comprende un mezclador que está adaptado para recibir señales de entrada y que
30 también está adaptado para generar señales de salida sobre la base de las señales de entrada y de una regla de mezclado. Se alimenta una señal de entrada de aparato a un separador de transitorios y, a continuación, es descorrelacionada por un separador de transitorios y / o un segundo descorrelacionador tal como se ha descrito en lo que antecede. La unidad de combinación y el mezclador pueden ser dispuestos de tal modo que la señal de combinación descorrelacionada sea alimentada al mezclador como una primera señal de entrada de mezclador. Una
35 segunda señal de entrada de mezclador puede ser la señal de entrada de aparato o una señal derivada de la señal de entrada de aparato. Debido a que el proceso de descorrelación ya se ha completado cuando la señal de combinación descorrelacionada se alimenta al mezclador, el mezclador no tiene que tener en cuenta la descorrelación de transitorios. Por lo tanto, se puede emplear un mezclador convencional.
40 En una realización adicional, el mezclador está adaptado para recibir datos de parámetro de correlación / coherencia que indican una correlación o coherencia entre dos señales y está adaptado para generar las señales de salida sobre la base de los datos de parámetro de correlación / coherencia. En otra realización, el mezclador está adaptado para recibir datos de parámetro de diferencia de nivel que indican una diferencia de energía entre dos señales y está adaptado para generar las señales de salida sobre la base de los datos de parámetro de diferencia de nivel. En una
45 realización de este tipo, el descorrelacionador de transitorios, el segundo descorrelacionador y la unidad de combinación no tienen que estar adaptados para procesar tales datos de parámetro, debido a que el mezclador se ocupará de procesar los datos correspondientes. Por otro lado, en una realización de este tipo se puede emplear un mezclador convencional con un procesamiento de parámetros de correlación / coherencia y de diferencia de nivel convencional.
50 En una realización, el separador de transitorios está adaptado o bien para alimentar una porción de señal considerada de una señal de entrada de aparato al descorrelacionador de transitorios, o bien para alimentar la porción de señal considerada al segundo descorrelacionador dependiendo de una información de separación de transitorios que, o bien indica que la porción de señal considerada comprende un transitorio, o bien que indica que la
55 porción de señal considerada no comprende un transitorio. Una realización de este tipo permite un procesamiento fácil de información de separación de transitorios.
En otra realización, el separador de transitorios está adaptado para alimentar parcialmente una porción de señal considerada de una señal de entrada de aparato al descorrelacionador de transitorios y para alimentar parcialmente
60 la porción de señal considerada al segundo descorrelacionador. La cantidad de la porción de señal considerada que se alimenta al separador de transitorios y la cantidad de porción de señal considerada que se alimenta al segundo descorrelacionador dependen de la información de separación de transitorios. Por este medio se puede tener en cuenta la intensidad de un transitorio.
imagen6
En una realización adicional, el separador de transitorios está adaptado para separar una señal de entrada de aparato que está representada en un dominio de la frecuencia. Esto permite el procesamiento (separación y descorrelación) de transitorios dependiente de la frecuencia. De este modo, ciertas componentes de señal de una primera banda de frecuencia pueden procesarse de acuerdo con un método de descorrelación de transitorios, 5 mientras que componentes de señal de otra banda de frecuencia pueden procesarse de acuerdo con otro método, por ejemplo de descorrelación convencional. Por consiguiente, en una realización el separador de transitorios está adaptado para separar una señal de entrada de aparato sobre la base de una información de separación de transitorios dependiente de la frecuencia. No obstante, en una realización alternativa, el separador de transitorios está adaptado para separar una señal de entrada de aparato sobre la base de una información de separación
10 independiente de la frecuencia. Esto permite un procesamiento de señales transitorias más eficiente.
En otra realización, el separador de transitorios puede estar adaptado para separar una señal de entrada de aparato que está representada en un dominio de la frecuencia de tal modo que todas las porciones de señal de la señal de entrada de aparato dentro de un primer intervalo de frecuencias se alimentan al segundo descorrelacionador. Un
15 aparato correspondiente, por lo tanto, está adaptado para restringir el procesamiento de señales transitorias a componentes de señal con frecuencias de señal en un segundo intervalo de frecuencias, mientras que ninguna componente de señal con frecuencias de señal en el primer intervalo de frecuencias se alimenta al descorrelacionador de transitorios (sino en su lugar al segundo descorrelacionador).
20 En una realización adicional, el descorrelacionador de transitorios puede estar adaptado para descorrelacionar la primera componente de señal mediante la aplicación de una información de fase que representa una diferencia de fase entre una señal residual y una señal de mezclado descendente. En el lado del codificador se puede emplear una matriz de mezclado “inversa” para crear una señal de mezclado descendente y una señal residual, por ejemplo, a partir de los dos canales de una señal estéreo, tal como se ha explicado en lo que antecede. Mientras que la señal
25 de mezclado descendente puede ser transmitida al descodificador, la señal residual puede ser descartada. De acuerdo con una realización, la diferencia de fase empleada por el descorrelacionador de transitorios puede ser la diferencia de fase entre la señal residual y la señal de mezclado descendente. De este modo, puede ser posible reconstruir una señal residual “artificial”, mediante la aplicación de la fase original del residuo al mezclado descendente. En una realización, la diferencia de fase puede estar relacionada con una cierta banda de frecuencia,
30 es decir, puede ser dependiente de la frecuencia. Como alternativa, una diferencia de fase no estar relacionada con ciertas bandas de frecuencia sino que puede ser aplicada como un parámetro de banda ancha independiente de la frecuencia.
En una realización, el aparato comprende una unidad de recepción para recibir información de fase, en la que el
35 descorrelacionador de transitorios está adaptado para aplicar la información de fase a la primera componente de señal. La información de fase podría ser generada por un codificador adecuado.
En una realización adicional, se podría aplicar un término de fase a la primera componente de señal mediante la multiplicación del término de fase con la primera componente de señal.
40 En una realización adicional, el segundo descorrelacionador puede ser un descorrelacionador convencional, por ejemplo, un descorrelacionador IIR de retícula.
A continuación se explicarán realizaciones en más detalle con respecto a las figuras, en las que: 45 la figura 1 ilustra una aplicación del estado de la técnica, de un descorrelacionador en un mezclador ascendente mono a estéreo;
la figura 2 representa otra aplicación del estado de la técnica, de un descorrelacionador en un mezclador 50 ascendente mono a estéreo;
la figura 3 ilustra un aparato para generar una señal descorrelacionada de acuerdo con una realización;
la figura 4 ilustra un aparato para descodificar una señal de acuerdo con una realización;
55 la figura 5 es una vista de conjunto de un sistema uno a dos (OTT) de acuerdo con una realización;
la figura 6 ilustra un aparato para generar una señal descorrelacionada que comprende una unidad de recepción de acuerdo con una realización adicional; 60 la figura 7 es una vista de conjunto de un sistema uno a dos de acuerdo con otra realización adicional;
la figura 8 ilustra unas puestas en correspondencia a modo de ejemplo de medidas de consistencia de fase a intensidad de separación de transitorios;
imagen7
la figura 9 es una vista de conjunto de un sistema uno a dos de acuerdo con otra realización adicional;
la figura 10 ilustra un aparato para codificar una señal de audio que tiene una pluralidad de canales de acuerdo con 5 una realización.
La figura 3 ilustra un aparato para generar una señal descorrelacionada de acuerdo con una realización. El aparato comprende un separador de transitorios 310, un descorrelacionador de transitorios 320, un descorrelacionador convencional 330 y una unidad de combinación 340. El enfoque de manipulación de transitorios de la presente
10 realización tiene por objeto generar señales descorrelacionadas a partir de señales de audio de tipo aplauso, por ejemplo, para la aplicación en el proceso de mezclado ascendente de descodificadores de audio espacial. En la figura 3, una señal de entrada se alimenta al separador de transitorios 310. La señal de entrada puede haber sido transformada a un dominio de la frecuencia, por ejemplo, mediante la aplicación de un banco de filtros de QMF híbrido. El separador de transitorios 310 puede decidir para cada componente de señal considerada de la señal de
15 entrada, si esta comprende un transitorio. Además, el separador de transitorios 310 puede estar dispuesto para alimentar la porción de señal considerada, o bien al descorrelacionador de transitorios 320, si la porción de señal considerada comprende un transitorio (componente de señal s1), o bien puede alimentar la porción de señal considerada al descorrelacionador convencional 330, si la porción de señal considerada no comprende un transitorio (componente de señal s2). El separador de transitorios 310 también puede estar dispuesto para dividir la porción de
20 señal considerada dependiendo de la existencia de un transitorio en la porción de señal considerada y proporcionar estos parcialmente al descorrelacionador de transitorios 320 y parcialmente al descorrelacionador convencional 330.
En una realización, el descorrelacionador de transitorios 320 descorrelaciona la componente de señal s1 de acuerdo con un método de descorrelación de transitorios que es particularmente adecuado para descorrelacionar 25 componentes de señal transitorias. Por ejemplo, la descorrelación de las componentes de señal transitorias puede ser llevada a cabo mediante la aplicación de información de fase, por ejemplo mediante la aplicación de términos de fase. Se explica en lo sucesivo un método de descorrelación en el que se aplican términos de fase sobre componentes de señal transitorias, en relación con la realización de la figura 5. También se puede emplear un método de descorrelación de este tipo como un método de descorrelación de transitorios del descorrelacionador de
30 transitorios 320 de la realización de la figura 3.
La componente de señal s2, que comprende porciones de señal no transitorias, se alimenta al descorrelacionador convencional 330. El descorrelacionador convencional 330 puede descorrelacionar a continuación la componente de señal s2 de acuerdo con un método de descorrelación convencional, por ejemplo, mediante la aplicación de
35 estructuras reticulares pasa todo, por ejemplo, un filtro de IIR (infinite impulse response, respuesta de impulso infinito) reticular.
Después de ser descorrelacionada mediante el descorrelacionador convencional 330, la componente de señal descorrelacionada procedente del descorrelacionador convencional 330 se alimenta a la unidad de combinación 340.
40 La componente de señal transitoria descorrelacionada procedente del descorrelacionador de transitorios 320 se alimenta también a la unidad de combinación 340. La unidad de combinación 340 combina a continuación ambas componentes de señal descorrelacionadas, por ejemplo, mediante la adición de ambas componentes de señal, para obtener una señal de combinación descorrelacionada.
45 En general, un método que descorrelaciona una señal que comprende transitorios de acuerdo con una realización, puede realizarse tal como sigue:
En una etapa de separación, la señal de entrada es separada en dos componentes: una componente s1 comprende los transitorios de la señal de entrada, otra componente s2 comprende la parte restante (no
50 transitoria) de la señal de entrada. La componente no transitoria s2 de la señal puede procesarse como en sistemas sin aplicar el método de descorrelación del descorrelacionador de transitorios de la presente realización. Es decir: la señal sin transitorios s2 puede alimentarse a una o varias estructuras de procesamiento de señales de descorrelación convencional como estructuras pasa todo de IIR reticulares.
55 Además, la componente de señal que comprende los transitorios (el flujo de transitorios s1) se alimenta a una estructura de “descorrelacionador de transitorios” que descorrelaciona el flujo de transitorios a la vez que mantiene las propiedades especiales de señal mejor que las estructuras descorrelacionadoras convencionales. La descorrelación del flujo de transitorios es llevada a cabo mediante la aplicación de información de fase a una resolución temporal alta. Preferiblemente, la información de fase comprende términos de fase. Además, se prefiere
60 que la información de fase pueda proporcionarse por un codificador.
Además, las señales de salida tanto del descorrelacionador convencional como del descorrelacionador de transitorios, son combinadas para formar la señal descorrelacionada que podría ser utilizada en el proceso de mezclado ascendente de los codificadores de audio espacial. Los elementos (h11, h12, h21, h22) de la matriz de
imagen8
mezclado (Mmezclado) del descodificador de audio espacial pueden permanecer sin cambios.
La figura 4 ilustra un aparato para descodificar una señal de entrada de aparato de acuerdo con una realización, en la que la señal de entrada de aparato se alimenta al separador de transitorios 410. El aparato comprende el 5 separador de transitorios 410, un descorrelacionador de transitorios 420, un descorrelacionador convencional 430, una unidad de combinación 440 y un mezclador 450. El separador de transitorios 410, el descorrelacionador de transitorios 420, el descorrelacionador convencional 430 y la unidad de combinación 440 de la presente realización pueden ser similares al separador de transitorios 310, el descorrelacionador de transitorios 320, el descorrelacionador convencional 330 y la unidad de combinación 340 de la realización de la figura 3, 10 respectivamente. Una señal de combinación descorrelacionada generada por la unidad de combinación 440 se alimenta a un mezclador 450 como una primera señal de entrada de mezclador. Además, la señal de entrada de aparato que ha sido alimentada al separador de transitorios 410, se alimenta también al mezclador 450 como una segunda señal de entrada de mezclador. Como alternativa, la señal de entrada de aparato no se alimenta directamente al mezclador 450, sino que se alimenta al mezclador 450 una señal derivada de la señal de entrada de 15 aparato. A partir de la señal de entrada de aparato se puede derivar una señal, por ejemplo, mediante la aplicación de un método de procesamiento de señales convencional a la señal de entrada de aparato, por ejemplo, mediante la aplicación de un filtro. El mezclador 450 de la realización de la figura 4 está adaptado para generar señales de salida sobre la base de las señales de entrada y una regla de mezclado. Una regla de mezclado de este tipo puede ser, por ejemplo, multiplicar las señales de entrada y una matriz de mezclado, por ejemplo mediante la aplicación de la
20 fórmula
⎢⎣
⎡=
L
h11 h12
M
⎢
⎥
⎥
⎢
R
hh
D
21 22
El mezclador 450 puede generar los canales de salida L, R sobre la base de datos de parámetro de correlación /
25 coherencia, por ejemplo, Correlación / Coherencia Inter Canal (ICC) y / o datos de parámetro de diferencia de nivel, por ejemplo, Diferencia de Nivel Inter Canal (ILD, Inter Channel Level). Por ejemplo, los coeficientes de una matriz de mezclado pueden depender de los datos de parámetro de correlación / coherencia y / o de los datos de parámetro de diferencia de nivel. En la realización de la figura 4, el mezclador 450 genera los dos canales de salida L y R. No obstante, en realizaciones alternativas, el mezclador puede generar una pluralidad de señales de salida,
30 por ejemplo, 3, 4, 5 o 9 señales de salida, que pueden ser señales de sonido envolvente.
La figura 5 representa una vista de conjunto del sistema del enfoque de manipulación de transitorios en un sistema de mezclado ascendente 1 a 2 (OTT), por ejemplo, un descodificador de audio espacial de MPS (MPEG Surround). La trayectoria de señal paralela para los transitorios separados de acuerdo con una realización, está comprendida en 35 la caja de manipulación de transitorios en forma de U. Una señal de entrada de aparato DMX se alimenta a un separador de transitorios 510. La señal de entrada de aparato puede ser representada en un dominio de la frecuencia. Por ejemplo, una señal de entrada en el dominio del tiempo puede haber sido transformada a un dominio de la frecuencia mediante la aplicación de un banco de filtros de QMF tal como se usa en MPEG Surround. A continuación, el separador de transitorios 510 puede alimentar las componentes de la señal de entrada de aparato 40 DMX a un descorrelacionador de transitorios 520 y / o a un descorrelacionador reticular de IIR 530. A continuación, las componentes de la señal de entrada de aparato se descorrelacionan por el descorrelacionador de transitorios 520 y / o el descorrelacionador reticular de IIR 530. A continuación de lo anterior, las componentes de señal descorrelacionadas D1 y D2 se combinan mediante una unidad de combinación 540, por ejemplo, mediante la adición de ambas componentes de señal, para obtener una señal de combinación descorrelacionada D. La señal de 45 combinación descorrelacionada se alimenta a un mezclador 552 como una primera señal de entrada de mezclador
D. Además, la señal de entrada de aparato DMX (o, como alternativa: una señal derivada de la señal de entrada de aparato DMX) se alimenta también al mezclador 552 como una segunda señal de entrada de mezclador. A continuación, el mezclador 552 genera una primera y una segunda señal “seca”, dependiendo de la señal de entrada de aparato DMX. El mezclador 552 genera también una primera y una segunda señal “mojada” dependiendo de la 50 señal de combinación descorrelacionada D. Las señales, generadas por el mezclador 552 también pueden ser generadas sobre la base de parámetros transmitidos, por ejemplo, datos de parámetro de correlación / coherencia, por ejemplo, Correlación / Coherencia Inter Canal (ICC) y / o datos de parámetro de diferencia de nivel, por ejemplo, Diferencia de Nivel Inter Canal (ILD). En una realización, las señales generadas por el mezclador 552 pueden proporcionarse a una unidad de modelado 554 que modela las señales provistas sobre la base de datos de
55 modelado temporal provistos. En otras realizaciones no tiene lugar modelado de señal alguno. A continuación, las señales generadas se proporcionan a una primera 556 y una segunda 558 unidad de adición que combinan las señales provistas para generar una primera señal de salida L y una segunda señal de salida R, respectivamente.
Los principios de procesamiento que se muestran en la figura 5 pueden ser aplicados en sistemas de mezclado
60 ascendente mono a estéreo (por ejemplo, codificadores de audio estéreo) así como en disposiciones multicanal (por ejemplo, MPEG Surround). En realizaciones, el esquema de manipulación de transitorios propuesto puede ser aplicado como una mejora de calidad a los sistemas de mezclado ascendente existentes sin grandes cambios
E11731316 29-07-2015
5
10
15
20
25
30
35
40
45
50
55
60
conceptuales del sistema de mezclado ascendente, debido a que se introduce solo una trayectoria de señal de descorrelacionador paralela sin alterar el propio proceso de mezclado ascendente.
La separación de señal en las componentes transitorias y no transitorias es controlada mediante parámetros que podrían ser generados en un codificador y / o el descodificador de audio espacial. El descorrelacionador de transitorios 520 utiliza información de fase, por ejemplo, términos de fase que podrían ser obtenidos en un codificador o en el descodificador de audio espacial. Se describen en lo sucesivo posibles variantes para obtener parámetros de manipulación de transitorios (es decir, parámetros de separación de transitorios como posiciones de transitorios o intensidad de separación y parámetros de descorrelación de transitorios como información de fase).
La señal de entrada puede ser representada en un dominio de la frecuencia. Por ejemplo, una señal puede haber sido transformada a un dominio de la frecuencia mediante el empleo de un banco de filtros de análisis. Se puede aplicar un banco de filtros de QMF para obtener una pluralidad de señales de subbanda a partir de una señal en el dominio del tiempo. Para la mejor calidad perceptual, el procesamiento de señales transitorias puede ser restringido, preferiblemente, a unas frecuencias de señal en un intervalo de frecuencias limitado. Un ejemplo sería limitar el intervalo de procesamiento a unos índices de banda de frecuencia k ≥ 8 de un banco de filtros de QMF híbrido tal como se usa en MPS, similar a la limitación de banda de frecuencia del modelado de envolvente guiado (GES, Guided Envelope Shaping) en MPS.
En lo que sigue se explicarán en más detalle realizaciones de un separador de transitorios 520. El separador de transitorios 510 divide la señal de entrada DMX en unas componentes transitorias y no transitorias s1 y s2, respectivamente. El separador de transitorios 510 puede emplear información de separación de transitorios para dividir la señal de entrada DMX, por ejemplo, un parámetro de separación de transitorios β[n]. La división de la señal de entrada DMX se puede hacer de una manera tal que la suma de las componentes s1 + s2, sea igual a la señal de entrada DMX:
s1[n]=DMX[n] ⋅β [n]
[] DMX[n] ⋅( −β [
s2 n = 1 n])
en la que n es el índice tiempo de las señales de subbanda muestreadas de forma descendente y los valores válidos para el parámetro de separación de transitorios variante en el tiempo β[n] están en el intervalo [0, 1]. β[n] puede ser un parámetro independiente de la frecuencia. Un separador de transitorios 510 que está adaptado para separar una señal de entrada de aparato sobre la base de un parámetro de separación independiente de la frecuencia puede alimentar todas las porciones de señal de subbanda con un índice de tiempo n o bien al descorrelacionador de transitorios 520 o bien al segundo descorrelacionador dependiendo del valor de β[n].
Como alternativa, β[n] puede ser un parámetro dependiente de la frecuencia. Un separador de transitorios 510 que está adaptado para separar una señal de entrada de aparato sobre la base de una información de separación de transitorios dependiente de la frecuencia puede procesar porciones de señal de subbanda con el mismo índice de tiempo de forma diferente, si difiere su información de separación de transitorios.
Además, la dependencia de la frecuencia puede ser usada, por ejemplo, para limitar el intervalo de frecuencias del procesamiento de transitorios tal como se menciona en la sección anterior.
En una realización, la información de separación de transitorios puede ser un parámetro o bien que indica que una porción de señal considerada de una señal de entrada DMX comprende un transitorio, o bien que indica que la porción de señal considerada no comprende un transitorio. El separador de transitorios 510 alimenta la porción de señal considerada al descorrelacionador de transitorios 520, si la información de separación de transitorios indica que la porción de señal considerada comprende un transitorio. Como alternativa, el separador de transitorios 510 alimenta la porción de señal considerada al segundo descorrelacionador, por ejemplo, el descorrelacionador de retícula IIR 530, si la información de separación de transitorios indica que la porción de señal considerada comprende un transitorio.
Por ejemplo, se puede emplear un parámetro de separación de transitorios β[n] como una información de separación de transitorios que puede ser un parámetro binario. n es el índice de tiempo de una porción de señal considerada de la señal de entrada DMX. β[n] puede ser 1 (lo que indica que la porción de señal considerada será alimentada al descorrelacionador de transitorios) o 0 (lo que indica que la porción de señal considerada será alimentada al segundo descorrelacionador). Restringir β[n] a β ∈ {0, 1} da como resultado unas decisiones transitorias / no transitorias estrictas, es decir: las componentes que son tratadas como transitorios están completamente separadas de la entrada (β = 1).
imagen9
En otra realización, el separador de transitorios 510 está adaptado para alimentar parcialmente una porción de señal considerada de la señal de entrada de aparato al descorrelacionador de transitorios 520 y para alimentar parcialmente la porción de señal considerada al segundo descorrelacionador 530. La cantidad de la porción de señal 5 considerada que se alimenta al separador de transitorios 520 y la cantidad de porción de señal considerada que se alimenta al segundo descorrelacionador 530 depende de la información de separación de transitorios. En una realización, β[n] tiene que estar en el intervalo [0, 1]. En una realización adicional, β[n] puede estar restringido a β[n] ∈ [0, βmáx], en la que βmáx < 1, da como resultado una separación parcial de los transitorios, lo que conduce a un efecto menos pronunciado del esquema de manipulación de transitorios. Por lo tanto, cambiar βmáx permite un
10 desvanecimiento entre la salida del procesamiento de mezclado ascendente convencional sin manipulación de transitorios y el procesamiento de mezclado ascendente que incluye la manipulación de transitorios.
En lo que sigue se explicará en más detalle un descorrelacionador de transitorios 520 de acuerdo con una realización.
15 Un descorrelacionador de transitorios 520 de acuerdo con una realización crea una señal de salida que está suficientemente descorrelacionada de la entrada. No altera la estructura temporal de aplausos singulares / transitorios (sin efecto estela temporal, sin demora). En su lugar, conduce a una distribución espacial de las componentes de señal transitoria (después del proceso de mezclado ascendente), que es similar a la distribución
20 espacial en la señal original (no codificada). El descorrelacionador de transitorios 520 puede prever compensaciones recíprocas de la tasa de bits frente a la calidad (por ejemplo, distribución espacial de transitorios a una baja tasa de bits ↔ cerca de la original (casi transparente) a una alta tasa de bits. Además, esto se logra con una complejidad computacional baja.
25 Tal como se ha explicado en lo que antecede, en el lado del codificador se puede emplear una matriz de mezclado “inversa” para crear una señal de mezclado descendente y una señal residual, por ejemplo, a partir de los dos canales de una señal estéreo. Mientras que la señal de mezclado descendente puede ser transmitida al descodificador, la señal residual puede ser descartada. De acuerdo con una realización, la diferencia de fase entre la señal residual y la señal de mezclado descendente puede ser determinada, por ejemplo, mediante un
30 descodificador, y puede ser empleada por un descodificador cuando se descorrelaciona una señal. Por este medio puede ser posible reconstruir a continuación una señal residual “artificial” mediante la aplicación de la fase original del residuo sobre el mezclado descendente.
En lo que sigue se explicará un método de descorrelación correspondiente del descorrelacionador de transitorios 35 520 de acuerdo con una realización:
De acuerdo con un método de descorrelación de transitorios, se puede emplear un término de fase. La descorrelación se logra simplemente mediante la multiplicación del flujo de transitorios por términos de fase a una resolución temporal alta, por ejemplo, a una resolución de tiempo de señal de subbanda en sistemas del
40 dominio de transformada como MPS:
j ⋅ Δϕ[n]
D1[n]=s1[n]⋅ e
En esta ecuación, n es el índice de tiempo de las señales de subbanda muestreadas de forma descendente. ∆φ
45 refleja idealmente la diferencia de fase entre mezclado descendente y residuo. Por lo tanto, los residuos transitorios son reemplazados por una copia de los transitorios procedentes del mezclado descendente, modificados de tal modo que exhiban la fase original.
Aplicar la información de fase de forma intrínseca da como resultado una panorámica de los transitorios a la posición
50 original en el proceso de mezclado ascendente. Como ejemplo ilustrativo, considérese el caso ICC = 0, ILD = 0: La parte transitoria de las señales de salida indica entonces:
j⋅Δϕ [n]
L[n]=c ⋅(s[n]+D1[n]) =c ⋅ s[n]⋅ (1+e )
j⋅Δϕ [n]
R[n]=c ⋅(s[n]− D1[n]) =c ⋅ s[n]⋅ (1 − e )
55 Para ∆φ=0, esto da como resultado L=2c*s, R=0, mientras que ∆φ=π conduce a L=0, R=2c*s. Otros valores de ∆φ, ICC e ILD conducen a diferentes relaciones de nivel y fase entre los transitorios reproducidos.
60 Los valores de ∆φ[n] pueden ser aplicados como parámetros de banda ancha independientes de la frecuencia o como parámetros dependientes de la frecuencia. En el caso de señales de tipo aplauso sin componentes tonales, valores de ∆φ[n] de banda ancha pueden ser ventajosos debido a unas menores demandas de tasa de datos y una manipulación consistente de transitorios de banda ancha (consistencia sobre la frecuencia).
imagen10
La estructura de manipulación de transitorios de la figura 5 está dispuesta de tal modo que solo el descorrelacionador convencional 530 es saltado en relación con las componentes de señal transitorias mientras que
5 la matriz de mezclado permanece inalterada. De este modo, los parámetros espaciales (ICC, ILD) también son tenidos en cuenta de forma intrínseca para las señales transitorias, por ejemplo, la ICC controla de forma automática la anchura de la distribución de transitorios que se reproduce.
En una realización, considerando el aspecto de cómo obtener información de fase, puede ser recibida información 10 de fase a partir de un codificador.
La figura 6 ilustra una realización de un aparato para generar una señal descorrelacionada. El aparato comprende un separador de transitorios 610, un descorrelacionador de transitorios 620, un descorrelacionador convencional 630, una unidad de combinación 640 y una unidad de recepción 650. El separador de transitorios 610, el 15 descorrelacionador convencional 630 y la unidad de combinación 640 son similares al separador de transitorios 310, el descorrelacionador convencional 330 y la unidad de combinación 340 de la realización que se muestra en la figura
3. No obstante, la figura 6 ilustra además una unidad de recepción 650 que está adaptada para recibir información de fase. La información de fase puede haber sido transmitida por un codificador (que no se muestra). Por ejemplo, un codificador puede haber computado la diferencia de fase entre señales residuales y de mezclado descendente 20 (fase relativa de la señal residual con respecto a un mezclado descendente). La diferencia de fase puede haber sido calculada para ciertas bandas de frecuencia o banda ancha (por ejemplo, en un dominio del tiempo). El codificador puede codificar de forma apropiada los valores de fase mediante una cuantificación uniforme o no uniforme y una codificación potencialmente sin pérdidas. A continuación de lo anterior, el codificador puede transmitir los valores de fase codificados al sistema de descodificación de audio espacial. Obtener la información de fase a partir de un
25 codificador es ventajoso debido a que, a continuación, la información de fase original está disponible en un descodificador (excepto por el error de cuantificación).
La unidad de recepción 650 alimenta la información de fase al descorrelacionador de transitorios 620 que usa la información de fase cuando este descorrelaciona una componente de señal. Por ejemplo, la información de fase 30 puede ser un término de fase y el descorrelacionador de transitorios 620 puede multiplicar una componente de señal transitoria recibida por el término de fase.
En el caso de transmitir información de fase ∆φ[n] desde el codificador al descodificador, la tasa de datos requerida se puede reducir tal como sigue:
35 La información de fase ∆φ[n] puede ser aplicada solo a las componentes de señal transitorias en el descodificador. Por lo tanto, solo es necesario que la información de fase esté disponible en el descodificador en tanto que haya componentes transitorias en la señal a ser descorrelacionada. La transmisión de la información de fase puede ser limitada de este modo por el codificador, de tal modo que solo se transmita la información
40 necesaria al descodificador. Esto se puede hacer mediante la aplicación de una detección de transitorios en el codificador tal como se describe en lo sucesivo. La información de fase ∆φ[n] solo es transmitida para puntos en el tiempo n, para los cuales se han detectado transitorios en el codificador.
Considerando el aspecto de separación de transitorios, en una realización, la separación de transitorios puede ser 45 accionada por codificador.
De acuerdo con una realización, la información de separación de transitorios (a lo que también se hace referencia como “información de transitorios”) puede obtenerse a partir de un codificador. El codificador puede aplicar métodos de detección de transitorios tal como se describe en el documento “Uso de Supresión de Transitorios en Algoritmos 50 de Mezclado Ascendente Multicanal Ciega” (“Using Transient Suppression in Blind Multichannel Upmix Algorithms”) de Andreas Walther, Christian Uhle, Sascha Disch, en Proc. 122ª Convención de AES, Viena, Austria, mayo de 2007,
o bien a las señales de entrada de codificador o bien a las señales de mezclado descendente. A continuación, la información de transitorios es transmitida al descodificador y preferiblemente es obtenida, por ejemplo, a la resolución de tiempo de las señales de subbanda muestreadas de forma descendente.
55 La información de transitorios preferiblemente puede comprender una simple decisión binaria (de transitorio / no transitorio) para cada muestra de señal en el tiempo. Esta información puede también ser representada, preferiblemente, mediante las posiciones de transitorios en el tiempo y las duraciones de los transitorios.
60 La información de transitorios puede ser codificada de forma sin pérdidas (por ejemplo, codificación de longitud de ejecución, codificación entrópica) para reducir la tasa de datos que es necesaria para transmitir la información de transitorios desde el codificador al descodificador.
La información de transitorios puede ser transmitida como información de banda ancha o como información dependiente de la frecuencia a una resolución de frecuencia. Transmitir la información de transitorios como parámetros de banda ancha reduce la tasa de datos de información de transitorios y mejora potencialmente la calidad de audio debido a la manipulación consistente de transitorios de banda ancha. En lugar de la decisión binaria (de transitorio / no transitorio), también puede ser transmitida la intensidad de los transitorios, por ejemplo,
imagen11
5 cuantificada en dos o cuatro escalones. La intensidad de transitorios puede controlar entonces la separación de los transitorios en el descodificador de audio espacial tal como sigue: Los transitorios fuertes son separados completamente de la entrada de descorrelacionador reticular de IIR, mientras que los transitorios más débiles solo están separados parcialmente.
10 La información de transitorios solo puede ser transmitida, si el codificador detecta señales de tipo aplauso, por ejemplo usando sistemas de detección de aplausos tal como se describe en el documento “Detección de Sonido de Aplauso con Baja Latencia” (“Applause Sound Detection with Low Latency”) de Christian Uhle, en la 127ª Convención de la Sociedad de Ingeniería de Audio, Nueva York, 2009.
15 El resultado de la detección para la similitud de la señal de entrada con señales de tipo aplauso también puede ser transmitido a menor resolución de tiempo (por ejemplo, a la tasa de actualización de parámetros espaciales en MPS) al descodificador para controlar la intensidad de la separación de transitorios. El resultado de la detección de aplausos puede ser transmitido como un parámetro binario (es decir, como una decisión estricta) o como un parámetro no binario (es decir, como una decisión no estricta). Este parámetro controla la intensidad de separación
20 en el descodificador de audio espacial. Por lo tanto, este permite encender / apagar (de forma estricta o gradual) la manipulación de transitorios en el descodificador. Esto permite evitar artefactos que podrían tener lugar, por ejemplo, cuando se aplica un esquema de manipulación de transitorios de banda ancha a señales que contienen componentes tonales.
25 La figura 7 ilustra un aparato para descodificar una señal de acuerdo con una realización. El aparato comprende un separador de transitorios 710, un descorrelacionador de transitorios 720, un descorrelacionador reticular de IIR 730, una unidad de combinación 740, un mezclador 752, una unidad de modelado opcional 754, una primera unidad de adición 756 y una segunda unidad de adición 758, que se corresponden con el separador de transitorios 510, el descorrelacionador de transitorios 520, el descorrelacionador reticular de IIR 530, la unidad de combinación 540, el
30 mezclador 552 la unidad de modelado opcional 554, la primera unidad de adición 556 y la segunda unidad de adición 558 de la realización de la figura 5, respectivamente. En la realización de la figura 7, un codificador obtiene información de fase e información de posición de transitorios y transmite la información a un aparato para la descodificación. No se transmite señal residual alguna. La figura 7 ilustra una configuración de mezclado ascendente 1 a 2 como una caja OTT en MPS. Esto se puede aplicar en un codificador descodificador estéreo para mezclar de
35 forma ascendente de un mezclado descendente mono a una salida estéreo de acuerdo con una realización. En la realización de la figura 7 se transmiten tres parámetros de manipulación de transitorios como parámetros independientes de la frecuencia desde el codificador al descodificador, tal como se puede ver en la figura 7:
Un primer parámetro de manipulación de transitorios a ser transmitido es la decisión binaria de transitorio / no
40 transitorio de un detector de transitorios que se ejecuta en el codificador. Este se usa para controlar la separación de transitorios en el descodificador. En un esquema simple, la decisión binaria de transitorio / no transitorio puede ser transmitida como una bandera binaria por muestra de tiempo de subbanda sin codificación adicional.
Un parámetro de manipulación de transitorios adicional a ser transmitido es el valor de fase (o los valores de fase)
45 ∆φ[n] que es necesario para el descorrelacionador de transitorios. ∆φ[n] solo es transmitida para unos instantes n, para los cuales se han detectado transitorios en el codificador. Los valores de ∆φ son transmitidos como índices de un cuantificador con una resolución de, por ejemplo, 3 bits por muestra.
Otro parámetro de manipulación de transitorios a ser transmitido es la intensidad de separación (es decir, la
50 intensidad de efecto del esquema de manipulación de transitorios). Esta información es transmitida a la misma resolución temporal que los parámetros espaciales ILD, ICC.
La tasa de bits BR necesaria para transmitir decisiones de separación de transitorios e información de fase de banda ancha desde el codificador al descodificador, puede ser estimada para los sistemas de tipo MPS como:
55
imagen12
en la que σ es la densidad de transitorios (fracción de ranuras de tiempo (= muestras de tiempo de subbanda) que están marcadas como transitorios), Q es el número de bits por valor de fase transmitido, y fs es la tasa de muestreo. 60 Se hace notar que (fs / 64) es la tasa de muestreo de las señales de subbanda muestreadas de forma descendente.
E{σ} < 0,25 se ha medido para un conjunto de diversos ítems de aplauso representativos, en la que E{.} denota la media a lo largo de la duración del ítem. Q = 3 es un compromiso razonable entre la exactitud de los valores de fase y la tasa de bits de parámetro. Para reducir la tasa de datos de parámetro, los ICCs y los ILDs pueden ser transmitidos como indicios de banda ancha. La transmisión de los ICCs y los ILDs como indicios de banda ancha es especialmente aplicable a señales no tonales, como aplauso.
imagen13
5 Adicionalmente, los parámetros para señalizar la intensidad de separación son transmitidos a la tasa de actualización de los ICCs / ILDs. Para tramas espaciales largas en MPS (32 veces 64 muestras) e intensidades de separación cuantificadas en 4 escalones, esto da como resultado una tasa de bits adicional de
imagen14
10 El parámetro de intensidad de separación puede ser obtenido en el codificador a partir de los resultados de algoritmos de análisis de señal que evalúan la similitud con señales de tipo aplauso, la tonalidad, u otras características de señal que indican beneficios o problemas potenciales cuando se aplica la descorrelación de transitorios de la realización.
15 Los parámetros transmitidos para la manipulación de transitorios pueden ser sometidos a codificación sin pérdidas para reducir la redundancia, dando como resultado una menor tasa de bits de parámetro (por ejemplo, codificación de longitud de ejecución de información de separación de transitorios, codificación entrópica).
20 Volviendo al aspecto de la obtención de información de fase, en una realización, la información de fase puede obtenerse en un descodificador.
En una realización de este tipo, el aparato para la descodificación no obtiene información de fase a partir de un codificador, sino que puede determinar la información de fase por sí mismo. Por lo tanto, no es necesario transmitir
25 información de fase lo que da como resultado una tasa de transmisión global reducida.
En una realización, se obtiene información de fase en un descodificador basado en MPS a partir de datos de “Modelado de Envolvente Guiado (GES)”) (Guided Envelope Shaping). Esto solo es aplicable si se transmiten datos de GES, es decir, si la característica de GES está activada en un codificador. La característica de GES está 30 disponible por ejemplo, en sistemas de MPS. La relación de valores de envolvente de GES entre los canales de salida refleja posiciones de panorámica para los transitorios a una resolución temporal alta. La relación de envolvente de GES (GESR, GES envelope ratio) puede ponerse en correspondencia con la información de fase necesaria para la manipulación de transitorios. En GES, la puesta en correspondencia puede realizarse de acuerdo con una regla de puesta en correspondencia obtenida de forma empírica a partir de unas estadísticas de 35 construcción de distribución de fase relativa a GESR para un conjunto representativo de señales de prueba apropiadas. La determinación de la regla de puesta en correspondencia es una etapa para diseñar el sistema de manipulación de transitorios, no un proceso en tiempo de ejecución cuando se aplica el sistema de manipulación de transitorios. Por lo tanto, es ventajoso que no hay necesidad alguna de pagar costes de transmisión adicionales para los datos de fase si de todos modos son necesarios datos de DES para la aplicación de la característica de GES. La
40 compatibilidad con versiones anteriores de flujos de bits se logra con flujos de bits / descodificadores de MPS. No obstante, la información de fase extraída a partir de datos de GES no es tan exacta (por ejemplo, el signo de la fase estimada es desconocido) como la información de fase que podría ser obtenida en el codificador.
En una realización adicional, la información de fase también puede ser obtenida en un descodificador, pero a partir
45 de residuos no de banda completa transmitidos. Esto es aplicable, por ejemplo, si se transmiten señales residuales limitadas en banda (por lo general, cubriendo un intervalo de frecuencias de hasta una cierta frecuencia de transición) en un esquema de codificación de MPS. En una realización de este tipo, se calcula la relación de fase entre el mezclado descendente y la señal residual transmitida en la banda residual o las bandas residuales, es decir, para frecuencias para las cuales son transmitidas las señales residuales. Además, la información de fase de la
50 banda residual o las bandas residuales a la banda no residual o las bandas no residuales es extrapolada (y / o posiblemente interpolada). Una posibilidad es poner en correspondencia la relación de fase obtenida en la banda residual o las bandas residuales a un valor de relación de fase independiente de la frecuencia global que se usa a continuación para el descorrelacionador de transitorios. Esto da como resultado el beneficio de que no aparecen costes de transmisión adicionales para los datos de fase, si de todos modos se transmiten residuos no de banda
55 completa. No obstante, se debe considerar que la corrección de la estimación de fase depende de la anchura de la banda o las bandas de frecuencia en las que se transmiten señales residuales. La corrección de las estimaciones de fase también depende de la consistencia de la relación de fase entre el mezclado descendente y el residuo a lo largo del eje de frecuencia. Para señales claramente transitorias, por lo general se encuentra una consistencia alta.
60 En una realización adicional, la información de fase es obtenida en un descodificador mediante el empleo de información de corrección adicional transmitida desde el codificador. Una realización de este tipo es similar a las dos realizaciones anteriores (fase a partir de GES, fase a partir de residuos) pero adicionalmente es necesario generar datos de corrección en el codificador que se transmiten al descodificador. Los datos de corrección permiten reducir
E11731316 29-07-2015
el error de estimación de fase que puede tener lugar en las dos variantes descritas en lo que antecede (fase a partir de GES, fase a partir de residuos). Además, los datos de corrección pueden ser obtenidos a partir de la estimación del error de estimación de fase de lado de descodificador en el codificador. Los datos de corrección pueden ser este error de estimación estimado (potencialmente codificado). Además, con respecto al enfoque de estimación de fase a 5 partir de datos de GES, los datos de corrección pueden ser simplemente el signo correcto de los valores de fase generados por codificador. Esto permite generar términos de fase con el signo correcto en el descodificador. El beneficio de un enfoque de este tipo es que debido a los datos de corrección, la exactitud de la información de fase recuperable en el descodificador está mucho más cerca de la información de fase generada por codificador. No obstante, la entropía de la información de corrección es menor que la entropía de la propia información de fase
10 correcta. De este modo, se disminuye la tasa de bits de parámetros en comparación con la transmisión directa de la información de fase obtenida en el codificador.
En otra realización, se obtienen información / término de fase a partir de un proceso (pseudo) aleatorio en un descodificador. El beneficio de un enfoque de este tipo es que no hay necesidad alguna de transmitir información de
15 fase alguna con una resolución temporal alta. Esto da como resultado una tasa de datos reducida. En una realización, un método simple es generar valores de fase con una distribución aleatoria uniforme en un intervalo [180º, 180º].
En una realización adicional, se miden las propiedades estadísticas de la distribución de fase en el codificador. Estas
20 propiedades son codificadas y, a continuación, transmitidas (a una resolución temporal baja) al descodificador. Se generan valores de fase aleatorios en el descodificador que son sometidos a las propiedades estadísticas transmitidas. Estas propiedades podrían ser la media, variantes u otras medidas estadísticas de la distribución de fase estadística.
25 Cuando se ejecuta más de una instancia de descorrelacionador en paralelo (por ejemplo, para un mezclado ascendente multicanal), se debe tener cuidado para asegurar salidas de descorrelacionador mutuamente descorrelacionadas. En una realización, en la que se generan múltiples vectores de valores de fase (pseudo) aleatorios (en lugar de un solo vector) para todas menos para la primera instancia de descorrelacionador, se selecciona un conjunto de vectores que da como resultado la menor correlación del valor de fase a través de todas
30 las instancias de descorrelacionador.
En el caso de transmitir información de corrección de fase desde el codificador al descodificador, la tasa de datos requerida se puede reducir tal como sigue:
35 Solo es necesario que la información de corrección de fase esté disponible en el descodificador en tanto que haya componentes transitorias en la señal a ser descorrelacionada. La transmisión de la información de corrección de fase puede ser limitada de este modo por el codificador, de tal modo que solo se transmita la información necesaria al descodificador. Esto se puede hacer mediante la aplicación de una detección de transitorios en el codificador tal como se ha descrito en lo que antecede. La información de corrección de fase
40 solo es transmitida para puntos en el tiempo n, para los cuales se han detectado transitorios en el codificador.
Volviendo al aspecto de separación de transitorios, en una realización, la separación de transitorios puede ser accionada por descodificador.
45 En una realización de este tipo, también se puede obtener información de separación de transitorios en el descodificador, por ejemplo, mediante la aplicación de un método de detección de transitorios tal como se describe en el documento “Uso de Supresión de Transitorios en Algoritmos de Mezclado Ascendente Multicanal Ciega” (“Using Transient Suppression in Blind Multichannel Upmix Algorithms”) de Andreas Walther, Christian Uhle, Sascha Disch, en Proc. 122ª Convención de AES, Viena, Austria, mayo de 2007, a la señal de mezclado descendente que
50 está disponible en el descodificador de audio espacial antes de mezclar de forma ascendente a una señal de salida estéreo o multicanal. En este caso, no se tiene que transmitir información de transitorios alguna, lo cual ahorra tasa de datos de transmisión.
No obstante, la realización de la detección de transitorios en la descodificación podría dar lugar a problemas cuando,
55 por ejemplo, se normaliza el esquema de manipulación de transitorios: por ejemplo, podría ser difícil hallar un algoritmo de detección de transitorios que dé como resultado exactamente los mismos resultados de detección de transitorios cuando se implementa en diferentes plataformas / arquitecturas que comportan diferentes precisiones numéricas, esquemas de redondeo, etc. Para la normalización, un comportamiento del descodificador predecible de este tipo es con frecuencia imprescindible. Además, el algoritmo de detección de transitorios normalizado podría
60 fallar para algunas señales de entrada, dando lugar a unas distorsiones intolerables en las señales de salida. Podría ser entonces difícil corregir el algoritmo que falla después de la normalización sin construir un descodificador que no sea conforme a la norma. Esta cuestión podría ser menos grave si por lo menos se transmite un parámetro que controla la intensidad de separación de transitorios a una resolución temporal baja (por ejemplo, a la tasa de actualización de parámetros espaciales del MPS) desde el codificador al descodificador.
imagen15
En una realización adicional, la separación de transitorios también es accionada por descodificador y se transmiten residuos no de banda completa. En la presente realización, la separación de transitorios accionada por descodificador puede ser refinada mediante el empleo de estimaciones de fase obtenidas a partir de residuos no de
5 banda completa transmitidos (véase en lo que antecede). Se hace notar que este refinamiento puede ser aplicado en el descodificador sin transmitir datos adicionales desde el codificador al descodificador.
En la presente realización, los términos de fase que son aplicados a un descorrelacionador de transitorios son obtenidos mediante la extrapolación de los valores de fase correctos desde las bandas residuales a frecuencias en
10 las que no hay residuo alguno disponible. Un método es calcular un valor de fase medio (potencialmente por ejemplo, ponderado por potencia de señal) a partir de los valores de fase que pueden ser calculados para aquellas frecuencias en las que hay señales residuales disponibles. El valor de fase medio puede ser aplicado como un parámetro independiente de la frecuencia en el descorrelacionador de transitorios.
15 En tanto que la relación de fase correcta entre el mezclado descendente y el residuo sea independiente de la frecuencia, el valor de fase medio representa una buena estimación del valor correcto de fase. No obstante; en el caso de una relación de fase que no es consistente a lo largo del eje de frecuencia, el valor de fase medio puede ser una estimación menos correcta, que conduce posiblemente a unos valores de fase incorrectos y a artefactos audibles.
20 La consistencia de la relación de fase entre el mezclado descendente y el residuo transmitido a lo largo del eje de frecuencia, por lo tanto, puede ser usada como una medida de fiabilidad de la estimación de fase extrapolada que se aplica en el descorrelacionador de transitorios. Para reducir el riesgo de artefactos audibles, se puede usar la medida de consistencia obtenida en el descodificador para controlar la intensidad de separación de transitorios en el
25 descodificador, por ejemplo, tal como sigue:
Los transitorios para los cuales la información de fase correspondiente (es decir, la información de fase para el mismo índice de tiempo n) es consistente a lo largo de la frecuencia, son totalmente separados de la entrada de descorrelacionador convencional y son totalmente alimentados al descorrelacionador de transitorios. Debido a
30 que son improbables unos errores de estimación de fase grandes, se usa todo el potencial de la manipulación de transitorios.
Los transitorios para los cuales la información de fase correspondiente es menos consistente a lo largo de la frecuencia, solo están separados parcialmente, lo que conduce a un efecto menos destacado del esquema de
35 manipulación de transitorios.
Los transitorios para los cuales la información de fase correspondiente es muy inconsistente a lo largo de la frecuencia, no son separados, lo que conduce al comportamiento convencional de un sistema de mezclado ascendente convencional sin la manipulación de transitorios propuesta. De este modo, no pueden tener lugar
40 artefactos debido a grandes errores de estimación de fase.
Las medidas de consistencia para la información de fase pueden ser deducidas, por ejemplo, a partir de la varianza (posiblemente ponderada por potencia de señal) de la desviación estándar de la información de fase a lo largo de la frecuencia.
45 Debido a que solo pueden estar disponibles unas pocas frecuencias para las cuales se transmiten las señales residuales, la medida de la consistencia puede tener que ser estimada a partir de solo unas pocas muestras a lo largo de la frecuencia, lo que conduce a una medida de la consistencia que solo alcanza rara vez unos valores extremos (“perfectamente consistentes” o “perfectamente inconsistentes”). De este modo, la medida de la
50 consistencia puede ser distorsionada de forma lineal o no lineal antes de ser usada para controlar la intensidad de separación de transitorios. En una realización, se implementa una característica de umbral tal como se ilustra en la figura 8, ejemplo de la derecha.
La figura 8 representa diferentes puestas en correspondencia a modo de ejemplo de medidas de consistencia de
55 fase con respecto a intensidades de separación de transitorios, ilustrando el impacto de las variantes para obtener parámetros de manipulación de transitorios sobre la robustez frente a una mala clasificación de transitorios. Las variantes para obtener la información de separación de transitorios y la información de fase listada en lo que antecede difieren en cuanto a la tasa de datos de parámetro y, por lo tanto, representan diferentes puntos operativos en términos de tasa de bits global de un codificador descodificador que implementa la técnica de manipulación de
60 transitorios propuesta. Aparte de esto, la elección de la fuente para obtener la información de fase también afecta a aspectos tales como la robustez frente a clasificaciones de transitorios falsas: manipular una señal no transitoria como un transitorio da lugar a muchas menos distorsiones audibles si es aplicada la información de fase correcta en la manipulación de transitorios. De este modo, un error de clasificación de señal da lugar a artefactos menos graves en el escenario de valores de fase transmitidos en comparación con el escenario de generación de fase aleatoria en el descodificador.
imagen16
La figura 9 es una vista de conjunto de un sistema Uno a Dos con manipulación de transitorios de acuerdo con una realización adicional, en la que se transmiten señales residuales de banda estrecha. Los datos de fase ∆φ se
5 estiman a partir de la relación de fase entre el mezclado descendente (DMX) y la señal residual en la banda o las bandas de frecuencia de la señal residual. Opcionalmente, se transmiten datos de corrección de fase para reducir el error de estimación de fase.
La figura 9 ilustra un separador de transitorios 910, un descorrelacionador de transitorios 920, un descorrelacionador
10 reticular de IIR 930, una unidad de combinación 940, un mezclador 952, una unidad de modelado opcional 954, una primera unidad de adición 956 y una segunda unidad de adición 958, que se corresponden con el separador de transitorios 510, el descorrelacionador de transitorios 520, el descorrelacionador reticular de IIR 530, la unidad de combinación 540, el mezclador 552 la unidad de modelado opcional 554, la primera unidad de adición 556 y la segunda unidad de adición 558 de la realización de la figura 5, respectivamente. La realización de la figura 8
15 comprende además una unidad de estimación de fase 960. La unidad de estimación de fase 960 recibe una señal de entrada DMX, un “residuo” de señal residual y opcionalmente, datos de corrección de fase. Sobre la base de la información recibida, la unidad de información de fase calcula los datos de fase ∆φ. Opcionalmente, la unidad de estimación de fase también determina información de consistencia de fase y pasa al separador de transitorios 910 la información de consistencia de fase. Por ejemplo, la información de consistencia de fase puede ser usada por el
20 separador de transitorios para controlar la intensidad de separación de transitorios.
La realización de la figura 9 aplica el hallazgo de que, si se transmiten residuos dentro del esquema de codificación en una manera no de banda completa, la diferencia de fase media ponderada por potencia de señal entre el residuo y el mezclado descendente (∆φbandas_residuales) puede ser aplicada como información de fase de banda ancha a los 25 transitorios separados (∆φ = ∆φbandas_residuales bajas). En este caso, no hay que transmitir información de fase adicional alguna, reduciendo la demanda de tasa de bits para la manipulación de transitorios. En la realización de la figura 9, la estimación de fase a partir de las bandas residuales puede desviarse considerablemente de la estimación de fase de banda ancha más precisa que está disponible en el codificador. Una opción es, por lo tanto, transmitir datos de corrección de fase (por ejemplo, ∆φcorrección ∆φ ∆φbandas_residuales) de modo las ∆φ correctas estén disponibles en el 30 descodificador. No obstante, debido a que la ∆φcorrección puede mostrar una entropía menor que ∆φ, la tasa de datos de parámetro necesaria puede ser menor que la tasa que sería necesaria para transmitir ∆φ (este concepto es similar al uso general de predicción en codificación: en lugar de codificar datos directamente, se codifica un error de predicción con una entropía menor. En la realización de la figura 9, la etapa de predicción es la extrapolación de la fase desde las bandas de frecuencia residuales a las bandas no residuales). La consistencia de la diferencia de fase
35 en las bandas de frecuencia residuales (∆φbandas_residuales) a lo largo del eje de frecuencia puede ser usada para controlar la intensidad de separación de transitorios.
En realizaciones, un descodificador puede recibir información de fase a partir de un codificador, o el propio descodificador puede determinar la información de fase. Además, el descodificador puede recibir información de
40 separación de transitorios a partir de un codificador, o el descodificador puede determinar por sí mismo la información de separación de transitorios.
En realizaciones, un aspecto de la manipulación de transitorios es la aplicación del concepto de “descorrelación semántica” descrito en el documento WO/2010/017967 junto con el “descorrelacionador de transitorios”, que está 45 basado en la multiplicación de la entrada con términos de fase. Se mejora la calidad perceptual de señales de tipo aplauso reproducidas debido a que ambas etapas de procesamiento evitan alterar la estructura temporal de las señales transitorias. Además, la distribución espacial de transitorios así como las relaciones de fase entre transitorios, es reconstruida en los canales de salida. Además, las realizaciones también son computacionalmente eficientes y pueden ser integradas fácilmente en sistemas de mezclado ascendente de tipo PS o MPS. En
50 realizaciones, la manipulación de transitorios no afecta al proceso de matriz de mezclado, de tal modo que todas las propiedades de reproducción espacial que están definidas por la matriz de mezclado también son aplicadas a la señal transitoria.
En realizaciones, se aplica un esquema de descorrelación novedoso que es particularmente adecuado para la
55 aplicación en sistemas de mezclado ascendente, que es particularmente adecuado para la aplicación de esquemas de codificación de audio espacial como PS o MPS y que mejora la calidad perceptual de las señales de salida en el caso de señales de tipo aplauso, es decir, señales que contienen mezclas densas de transitorios espacialmente distribuidos y / o pueden ser vistas como una implementación particularmente mejorada del marco de trabajo genérico de “descorrelación semántica”. Además, en realizaciones, está comprendido un esquema de descorrelación
60 novedoso que reconstruye la distribución espacial / temporal de los transitorios similar a la distribución en la señal original, conserva la estructura temporal de las señales transitorias, prevé la variación de la compensación recíproca de la tasa de bits frente a la calidad y / o es idealmente adecuado para una combinación con características de MPS como residuos no de banda completa o GES. Las combinaciones son complementarias, es decir, la información de características de MPS convencional es vuelta a usar para la manipulación de transitorios.
imagen17
La figura 10 ilustra un aparato para codificar una señal de audio que tiene una pluralidad de canales. Dos canales de entrada L, R se alimentan a un mezclador descendente 1010 y a un calculador de señal residual 1020. En otras realizaciones, una pluralidad de canales se alimenta al mezclador descendente 1010 y al calculador de señal
5 residual 1020, por ejemplo, 3, 5 o 9 canales de sonido envolvente. El mezclador descendente 1010 mezcla de forma descendente a continuación los dos canales L, R, para obtener una señal de mezclado descendente. Por ejemplo, el mezclador descendente 1010 puede emplear una matriz de mezclado y realizar una multiplicación de matrices de la matriz de mezclado y los dos canales de entrada L, R, para obtener la señal de mezclado descendente. La señal de mezclado descendente puede ser transmitida a un descodificador.
10 Además, el generador de señal residual 1020 está adaptado para calcular una señal adicional a la que se hace referencia como señal residual. Las señales residuales son señales que pueden ser usadas para regenerar las señales originales mediante el empleo adicional de la señal de mezclado descendente y una matriz de mezclado ascendente. Por ejemplo, cuando N señales son mezcladas de forma descendente a 1 señal, el mezclado
15 descendente por lo general es 1 de las N componentes que resultan de la puesta en correspondencia de las N señales de entrada. Las componentes restantes que resultan de la puesta en correspondencia (por ejemplo, N 1 componentes) son las señales residuales y permiten la reconstrucción de las N señales originales mediante una puesta en correspondencia inversa. La puesta en correspondencia puede ser, por ejemplo, una rotación. La puesta en correspondencia debe llevarse a cabo de tal modo que la señal de mezclado descendente sea maximizada y las
20 señales residuales sean minimizadas, por ejemplo, similar a una transformación de eje principal. Por ejemplo, la energía de la señal de mezclado descendente debe ser maximizada y las energías de las señales residuales deben ser minimizadas. Cuando se mezclan de forma descendente 2 señales a 1 señal, el mezclado descendente es normalmente una de las dos componentes que resultan de la puesta en correspondencia de las 2 señales de entrada. La componente restante que resulta de la puesta en correspondencia es la señal residual y permite la
25 reconstrucción de las 2 señales originales mediante una puesta en correspondencia inversa.
En algunos casos, la señal residual puede representar un error asociado con la representación de las dos señales mediante sus parámetros de mezclado descendente, y otros asociados. Por ejemplo, la señal residual puede ser una señal de error que representa el error entre los canales originales L, R y los canales L’, R’, resultantes de mezclar de
30 forma ascendente la señal de mezclado descendente que fue generada sobre la base de los canales originales L y
R.
Dicho de otra forma, una señal residual puede ser considerada como una señal en el dominio del tiempo o un dominio de la frecuencia o un dominio subbanda, que junto con la señal de mezclado descendente sola o con la
35 señal de mezclado descendente y la información paramétrica permite una reconstrucción correcta o casi correcta de un canal original. Casi correcto se debe entender como que la reconstrucción con la señal residual que tiene una energía mayor que cero es más cercana al canal original en comparación con una reconstrucción usando el mezclado descendente sin la señal residual o usando el mezclado descendente y la información paramétrica sin la señal residual.
40 Además, el codificador comprende un calculador de información de fase 1030. La señal de mezclado descendente y la señal residual se alimentan al calculador de información de fase 1030. El calculador de información de fase calcula a continuación información acerca de la diferencia de fase entre el mezclado descendente y la señal residual para obtener información de fase. Por ejemplo, el calculador de información de fase puede aplicar funciones que
45 calculan una correlación cruzada del mezclado descendente y la señal residual.
Además, el codificador comprende un generador de salida 1040. La información de fase generada por el calculador de información de fase 1030 se alimenta al generador de salida 1040. El generador de salida 1040 emite a continuación la información de fase.
50 En una realización, el aparato comprende además un cuantificador de información de fase para cuantificar la información de fase. La información de fase generada por el calculador de información de fase puede alimentarse al cuantificador de información de fase. El cuantificador de información de fase cuantifica a continuación la información de fase. Por ejemplo, la información de fase puede ponerse en correspondencia con 8 valores diferentes, por
55 ejemplo son uno de los valores 0, 1, 2, 3, 4, 5, 6 o 7. Los valores pueden representar las diferencias de fase 0, π / 4, π / 2, 3π / 4, π, 5π / 4, 3π / 2 y 7π / 4, respectivamente. La información de fase cuantificada puede alimentarse a continuación al generador de salida 1040.
En una realización adicional, el aparato comprende además un codificador sin pérdidas. La información de fase
60 procedente del calculador de información de fase 1040 o la información de fase cuantificada procedente del cuantificador de información de fase, puede alimentarse al codificador sin pérdidas. El codificador sin pérdidas está adaptado para codificar información de fase mediante la aplicación de codificación sin pérdidas. Se puede emplear cualquier tipo de esquema de codificación sin pérdidas. Por ejemplo, el codificador puede emplear codificación aritmética. El codificador sin pérdidas alimenta a continuación la información de fase codificada de forma sin pérdidas al generador de salida 1040.
imagen18
Con respecto al descodificador y al codificador y a los métodos de las realizaciones descritas, se menciona lo siguiente:
5 A pesar de que se han descrito algunos aspectos en el contexto de un aparato, es evidente que estos aspectos también representan una descripción del método correspondiente, en la que un bloque o dispositivo se corresponde con una etapa de método o con una característica de una etapa de método. De manera análoga, los aspectos descritos en el contexto de una etapa de método también representan una descripción de un bloque o
10 ítem o característica correspondiente de un aparato correspondiente.
Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención pueden ser implementadas en soporte físico o en soporte lógico. La implementación se puede llevar a cabo utilizando un medio de almacenamiento digital, por ejemplo un disquete flexible, un DVD, un CD, una ROM, una EPROM, una EEPROM o
15 una memoria FLASH, que tienen unas señales de control electrónicamente legibles almacenadas en los mismos, que cooperan (o son capaces de cooperar) con un sistema informático programable de tal modo que se ejecuta el método respectivo.
Algunas realizaciones de acuerdo con la invención comprenden un soporte de datos que tiene señales de control
20 electrónicamente legibles, que son capaces de cooperar con un sistema informático programable, de tal modo que sea ejecutado uno de los métodos descrito en el presente documento.
En general, realizaciones de la presente invención pueden ser implementadas como un producto de programa informático con un código de programa, siendo el código de programa operativo para realizar uno de los métodos
25 cuando el producto de programa informático se ejecuta en un ordenador. El código de programa puede ser almacenado, por ejemplo, sobre un soporte legible por máquina.
Otras realizaciones comprenden el programa informático para realizar uno de los métodos descritos en el presente documento, almacenado en un soporte legible por máquina o en un medio de almacenamiento no transitorio.
30 Dicho de otra forma, una realización del método de la invención es, por lo tanto, un programa informático que tiene un código de programa para realizar uno de los métodos descritos en el presente documento, cuando el programa informático se ejecuta en un ordenador.
35 Una realización adicional de los métodos de la invención es, por lo tanto, un soporte de datos (o un medio de almacenamiento digital, o un medio legible por ordenador) que comprende, grabado en el mismo, el programa informático para realizar uno de los métodos descritos en el presente documento.
Una realización adicional del método de la invención es, por lo tanto, un flujo de datos o una secuencia de señales
40 que representan el programa informático para realizar uno de los métodos descritos en el presente documento. El flujo de datos o la secuencia de señales pueden ser configurados, por ejemplo, para ser transferidos por medio de una conexión de comunicación de datos, por ejemplo, por medio de Internet.
Una realización adicional comprende unos medios de procesamiento, por ejemplo, un ordenador, o un dispositivo
45 lógico programable, configurado para o adaptado para realizar uno de los métodos descritos en el presente documento.
Una realización adicional comprende un ordenador que tiene instalado en el mismo el programa informático para realizar uno de los métodos descritos en el presente documento.
50 En algunas realizaciones, se puede usar un dispositivo de lógica programable (por ejemplo una disposición de puertas programable de campo) para realizar algunas o todas las funcionalidades de los métodos descritos en el presente documento. En algunas realizaciones, la disposición de puertas programable de campo puede cooperar con un microprocesador con el fin de realizar uno de los métodos descritos en el presente documento. En general,
55 los métodos son realizados, preferiblemente, mediante algún aparato de soporte físico.
Las realizaciones que se han descrito en lo que antecede son puramente ilustrativas para los principios de la presente invención. Se entiende que las modificaciones y variaciones de las disposiciones y de los detalles descritos en el presente documento serán evidentes para los expertos en la materia. Por lo tanto, la intención es que la
60 invención esté limitada solo por el alcance de las reivindicaciones de patente inmediatamente siguientes y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones en el presente documento.

Claims (11)

  1. imagen1
    REIVINDICACIONES
    1. Un aparato para descodificar una señal que comprende:
    5 un separador de transitorios (310; 410; 510; 610; 710; 910) para separar una señal de entrada de aparato en una primera componente de señal y en una segunda componente de señal de tal modo que la primera componente de señal comprende porciones de señal transitorias de la señal de entrada y de tal modo que la segunda componente de señal comprende porciones de señal no transitorias de la señal de entrada; un descorrelacionador de transitorios (320; 420; 520; 620; 720; 920) para descorrelacionar la primera
    10 componente de señal de acuerdo con un primer método de descorrelación para obtener una primera componente de señal descorrelacionada; un segundo descorrelacionador (330; 430; 530; 630; 730; 930) adicional para descorrelacionar la segunda componente de señal de acuerdo con un segundo método de descorrelación para obtener una segunda componente de señal descorrelacionada, en el que el segundo método de descorrelación es diferente del primer
    15 método de descorrelación; una unidad de combinación (340; 440; 540; 640; 740; 940) para combinar la primera componente de señal descorrelacionada y la segunda componente de señal descorrelacionada para obtener una señal de combinación descorrelacionada; y un mezclador (450; 552; 752; 952), que está adaptado para recibir señales de entrada de mezclador y que está
    20 adaptado para generar señales de salida sobre la base de las señales de entrada de mezclador y una regla de mezclado; en el que la unidad de combinación (340; 440; 540; 640; 740; 940) y el mezclador (450; 552; 752; 952) están dispuestos de tal modo que la señal de combinación descorrelacionada se alimenta al mezclador (450; 552; 752; 952) como una primera señal de entrada de mezclador y que la señal de entrada de aparato o una señal
    25 derivada de la señal de entrada de aparato se alimenta al mezclador (450; 552; 752; 952) como una segunda señal de entrada de mezclador.
  2. 2. Un aparato de acuerdo con la reivindicación 1, en el que el mezclador (450; 552; 752; 952) está adaptado además para recibir datos de parámetro de correlación /
    30 coherencia que indican una correlación o coherencia entre dos señales y en el que el mezclador (450; 552; 752; 952) está adaptado además para generar las señales de salida sobre la base de los datos de parámetro de correlación / coherencia.
  3. 3. Un aparato de acuerdo con la reivindicación 1 o 2,
    35 en el que el mezclador (450; 552; 752; 952) está adaptado además para recibir datos de parámetro de diferencia de nivel que indican una diferencia de energía entre dos señales y en el que el mezclador (450; 552; 752; 952) está adaptado además para generar las señales de salida sobre la base de los datos de parámetro de diferencia de nivel.
  4. 4. Un aparato de acuerdo con una de las reivindicaciones precedentes,
    40 en el que el mezclador (450; 552; 752; 952) está adaptado para emplear una regla de mezclado que comprende la regla para multiplicar la primera y la segunda señal de entrada de mezclador mediante una matriz de mezclado.
  5. 5. Un aparato de acuerdo con una de las reivindicaciones precedentes, en el que la unidad de combinación (340; 440; 540; 640; 740; 940) está adaptada para combinar la primera
    45 componente de señal descorrelacionada y la segunda componente de señal descorrelacionada mediante la adición de la primera componente de señal descorrelacionada y la segunda componente de señal descorrelacionada.
  6. 6. Un aparato de acuerdo con una de las reivindicaciones precedentes, en el que el separador de transitorios (310; 410; 510; 610; 710; 910) está adaptado o bien para alimentar una
    50 porción de señal considerada de la señal de entrada de aparato al descorrelacionador de transitorios (320; 420; 520; 620; 720; 920), o bien para alimentar la porción de señal considerada al segundo descorrelacionador (330; 430; 530; 630; 730; 930) dependiendo de una información de separación de transitorios que, o bien indica que la porción de señal considerada comprende un transitorio, o bien que indica que la porción de señal considerada no comprende un transitorio.
    55
  7. 7. Un aparato de acuerdo con una de las reivindicaciones 1 a 5, en el que el separador de transitorios (310; 410; 510; 610; 710; 910) está adaptado para alimentar parcialmente una porción de señal considerada de la señal de entrada de aparato al descorrelacionador de transitorios (320; 420; 520; 620; 720; 920) y para alimentar parcialmente la porción de señal considerada al segundo descorrelacionador (330;
    60 430; 530; 630; 730; 930) y en el que la cantidad de la porción de señal considerada que se alimenta al separador de transitorios y la cantidad de la porción de señal considerada que se alimenta al segundo descorrelacionador dependen de información de separación de transitorios.
    20
    imagen2
  8. 8. Un aparato de acuerdo con una de las reivindicaciones precedentes, en el que el separador de transitorios (310; 410; 510; 610; 710; 910) está adaptado para separar una señal de entrada de aparato que está representada en un dominio de la frecuencia.
    5 9. Un aparato de acuerdo con una de las reivindicaciones precedentes, en el que el separador de transitorios (310; 410; 510; 610; 710; 910) está adaptado para separar la señal de entrada de aparato en una primera componente de señal y en una segunda componente de señal sobre la base de una información de separación de transitorios independiente de la frecuencia.
    10 10. Un aparato de acuerdo con una de las reivindicaciones precedentes, en el que el separador de transitorios (310; 410; 510; 610; 710; 910) está adaptado para separar la señal de entrada de aparato en una primera componente de señal y en una segunda componente de señal sobre la base de una información de separación de transitorios dependiente de la frecuencia.
    15 11. Un aparato de acuerdo con una de las reivindicaciones precedentes, en el que el aparato comprende además una unidad de recepción (650) que está adaptada para recibir la información de fase a partir de un codificador; y en el que el descorrelacionador de transitorios (320; 420; 520; 620; 720; 920) está adaptado para aplicar la información de fase procedente del codificador a la primera componente de señal.
    20
  9. 12.
    Un aparato de acuerdo con una de las reivindicaciones precedentes, en el que el segundo descorrelacionador (330; 430; 530; 630; 730; 930) es un descorrelacionador reticular de IIR.
  10. 13.
    Un método para descodificar una señal que comprende:
    25 separar una señal de entrada de aparato en una primera componente de señal y en una segunda componente de señal de tal modo que la primera componente de señal comprende porciones de señal transitorias de la señal de entrada de aparato y de tal modo que la segunda componente de señal comprende porciones de señal no transitorias de la señal de entrada de aparato;
    30 descorrelacionar la primera componente de señal mediante un descorrelacionador de transitorios de acuerdo con un primer método de descorrelación para obtener una primera componente de señal descorrelacionada; descorrelacionar la segunda componente de señal mediante un segundo descorrelacionador adicional de acuerdo con un segundo método de descorrelación para obtener una segunda componente de señal descorrelacionada, en el que el segundo método de descorrelación es diferente del primer método de
    35 descorrelación; combinar la primera componente de señal descorrelacionada y la segunda componente de señal descorrelacionada para obtener una señal de combinación descorrelacionada; y generar señales de salida sobre la base de una regla de mezclado, la señal de combinación descorrelacionada y la señal de entrada de aparato.
    40
  11. 14. Un programa informático que implementa un método de acuerdo con la reivindicación 13.
    21
ES11731316.3T 2010-08-25 2011-07-06 Aparato para descodificar una señal que comprende transitorios usando una unidad de combinación y un mezclador Active ES2544077T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US37698010P 2010-08-25 2010-08-25
US376980P 2010-08-25
PCT/EP2011/061360 WO2012025282A1 (en) 2010-08-25 2011-07-06 Apparatus for decoding a signal comprising transients using a combining unit and a mixer

Publications (1)

Publication Number Publication Date
ES2544077T3 true ES2544077T3 (es) 2015-08-27

Family

ID=44509236

Family Applications (3)

Application Number Title Priority Date Filing Date
ES11743459.7T Active ES2585402T3 (es) 2010-08-25 2011-07-06 Aparato para generar una señal descorrelacionada usando información de fase transmitida
ES11731316.3T Active ES2544077T3 (es) 2010-08-25 2011-07-06 Aparato para descodificar una señal que comprende transitorios usando una unidad de combinación y un mezclador
ES16196394T Active ES2706490T3 (es) 2010-08-25 2011-07-06 Un aparato para la codificación de una señal de audio que tiene una pluralidad de canales

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES11743459.7T Active ES2585402T3 (es) 2010-08-25 2011-07-06 Aparato para generar una señal descorrelacionada usando información de fase transmitida

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES16196394T Active ES2706490T3 (es) 2010-08-25 2011-07-06 Un aparato para la codificación de una señal de audio que tiene una pluralidad de canales

Country Status (21)

Country Link
US (3) US8831931B2 (es)
EP (5) EP3471091A1 (es)
JP (3) JP5775583B2 (es)
KR (2) KR101445293B1 (es)
CN (2) CN103180898B (es)
AR (3) AR082543A1 (es)
AU (2) AU2011295367B2 (es)
BR (2) BR112013004365B1 (es)
CA (3) CA2809437C (es)
ES (3) ES2585402T3 (es)
HK (2) HK1186833A1 (es)
MX (2) MX2013002188A (es)
MY (3) MY156770A (es)
PL (3) PL3144932T3 (es)
PT (2) PT3144932T (es)
RU (3) RU2640650C2 (es)
SG (3) SG188254A1 (es)
TR (1) TR201900417T4 (es)
TW (2) TWI457912B (es)
WO (2) WO2012025282A1 (es)
ZA (1) ZA201302050B (es)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG188254A1 (en) 2010-08-25 2013-04-30 Fraunhofer Ges Forschung Apparatus for decoding a signal comprising transients using a combining unit and a mixer
CN103262158B (zh) * 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
US9064318B2 (en) 2012-10-25 2015-06-23 Adobe Systems Incorporated Image matting and alpha value techniques
US9355649B2 (en) * 2012-11-13 2016-05-31 Adobe Systems Incorporated Sound alignment using timing information
US10638221B2 (en) 2012-11-13 2020-04-28 Adobe Inc. Time interval sound alignment
US9201580B2 (en) 2012-11-13 2015-12-01 Adobe Systems Incorporated Sound alignment user interface
US9076205B2 (en) 2012-11-19 2015-07-07 Adobe Systems Incorporated Edge direction and curve based image de-blurring
US10249321B2 (en) 2012-11-20 2019-04-02 Adobe Inc. Sound rate modification
US9451304B2 (en) 2012-11-29 2016-09-20 Adobe Systems Incorporated Sound feature priority alignment
US10455219B2 (en) 2012-11-30 2019-10-22 Adobe Inc. Stereo correspondence and depth sensors
US9135710B2 (en) 2012-11-30 2015-09-15 Adobe Systems Incorporated Depth map stereo correspondence techniques
US10249052B2 (en) 2012-12-19 2019-04-02 Adobe Systems Incorporated Stereo correspondence model fitting
US9208547B2 (en) 2012-12-19 2015-12-08 Adobe Systems Incorporated Stereo correspondence smoothness tool
US9214026B2 (en) 2012-12-20 2015-12-15 Adobe Systems Incorporated Belief propagation and affinity measures
RU2630370C9 (ru) * 2013-02-14 2017-09-26 Долби Лабораторис Лайсэнзин Корпорейшн Способы управления межканальной когерентностью звуковых сигналов, подвергнутых повышающему микшированию
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2989631A4 (en) 2013-04-26 2016-12-21 Nokia Technologies Oy AUDIO SIGNAL ENCODER
CA2919080C (en) 2013-07-22 2018-06-05 Sascha Disch Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2838086A1 (en) * 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
EP2830333A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
JP6242489B2 (ja) * 2013-07-29 2017-12-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法
CN105531761B (zh) * 2013-09-12 2019-04-30 杜比国际公司 音频解码***和音频编码***
RU2641463C2 (ru) * 2013-10-21 2018-01-17 Долби Интернэшнл Аб Структура декоррелятора для параметрического восстановления звуковых сигналов
KR102231755B1 (ko) 2013-10-25 2021-03-24 삼성전자주식회사 입체 음향 재생 방법 및 장치
KR101841380B1 (ko) 2014-01-13 2018-03-22 노키아 테크놀로지스 오와이 다중-채널 오디오 신호 분류기
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
EP2963648A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
EP2980789A1 (en) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
US10225675B2 (en) 2015-02-17 2019-03-05 Electronics And Telecommunications Research Institute Multichannel signal processing method, and multichannel signal processing apparatus for performing the method
US11234072B2 (en) 2016-02-18 2022-01-25 Dolby Laboratories Licensing Corporation Processing of microphone signals for spatial playback
TWI616095B (zh) * 2016-08-26 2018-02-21 配信裝置、配信系統、配信方法、電子機器、播放裝置及接收程式
MY196198A (en) 2016-11-08 2023-03-22 Fraunhofer Ges Forschung Apparatus and Method for Downmixing or Upmixing a Multichannel Signal Using Phase Compensation
CA3045847C (en) * 2016-11-08 2021-06-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Downmixer and method for downmixing at least two channels and multichannel encoder and multichannel decoder
EP3382704A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
US11232804B2 (en) 2017-07-03 2022-01-25 Dolby International Ab Low complexity dense transient events detection and coding
SG11202000510VA (en) 2017-07-28 2020-02-27 Fraunhofer Ges Forschung Apparatus for encoding or decoding an encoded multichannel signal using a filling signal generated by a broad band filter
US10306391B1 (en) 2017-12-18 2019-05-28 Apple Inc. Stereophonic to monophonic down-mixing
EP3550561A1 (en) 2018-04-06 2019-10-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value
US11990141B2 (en) * 2018-12-20 2024-05-21 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for controlling multichannel audio frame loss concealment
FR3136099A1 (fr) * 2022-05-30 2023-12-01 Orange Codage audio spatialisé avec adaptation d’un traitement de décorrélation

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010006291A (ko) * 1998-02-13 2001-01-26 요트.게.아. 롤페즈 서라운드 음향 재생 시스템, 음향/시각 재생 시스템, 서라운드 신호 처리 유닛 및 입력 서라운드 신호 처리 방법
EP1500085B1 (en) 2002-04-10 2013-02-20 Koninklijke Philips Electronics N.V. Coding of stereo signals
CN1307612C (zh) * 2002-04-22 2007-03-28 皇家飞利浦电子股份有限公司 声频信号的编码解码方法、编码器、解码器及相关设备
ATE339759T1 (de) * 2003-02-11 2006-10-15 Koninkl Philips Electronics Nv Audiocodierung
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
WO2007109338A1 (en) * 2006-03-21 2007-09-27 Dolby Laboratories Licensing Corporation Low bit rate audio encoding and decoding
EP1914722B1 (en) * 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
JP4521633B2 (ja) 2004-03-12 2010-08-11 直樹 末広 符号分割多重信号の相関分離識別方式
PL1735774T3 (pl) 2004-04-05 2008-11-28 Koninl Philips Electronics Nv Koder wielokanałowy
EP3573055B1 (en) * 2004-04-05 2022-03-23 Koninklijke Philips N.V. Multi-channel decoder
CA2572805C (en) * 2004-07-02 2013-08-13 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
US7283634B2 (en) * 2004-08-31 2007-10-16 Dts, Inc. Method of mixing audio channels using correlated outputs
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
JP5191886B2 (ja) 2005-06-03 2013-05-08 ドルビー ラボラトリーズ ライセンシング コーポレイション サイド情報を有するチャンネルの再構成
RU2393550C2 (ru) * 2005-06-30 2010-06-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Устройство и способ кодирования и декодирования звукового сигнала
JP5053849B2 (ja) 2005-09-01 2012-10-24 パナソニック株式会社 マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
RU2393646C1 (ru) * 2006-03-28 2010-06-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Усовершенствованный способ для формирования сигнала при восстановлении многоканального аудио
KR20080052813A (ko) * 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
US8064624B2 (en) * 2007-07-19 2011-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for generating a stereo signal with enhanced perceptual quality
GB2467668B (en) * 2007-10-03 2011-12-07 Creative Tech Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
KR20100095586A (ko) 2008-01-01 2010-08-31 엘지전자 주식회사 신호 처리 방법 및 장치
ES2404563T3 (es) * 2008-02-14 2013-05-28 Dolby Laboratories Licensing Corporation Ampliación estereofónica
EP2254110B1 (en) 2008-03-19 2014-04-30 Panasonic Corporation Stereo signal encoding device, stereo signal decoding device and methods for them
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
EP2154911A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
SG188254A1 (en) * 2010-08-25 2013-04-30 Fraunhofer Ges Forschung Apparatus for decoding a signal comprising transients using a combining unit and a mixer

Also Published As

Publication number Publication date
HK1186833A1 (en) 2014-03-21
US9368122B2 (en) 2016-06-14
BR112013004365A2 (pt) 2020-06-02
PL2609591T3 (pl) 2016-11-30
CA2809437A1 (en) 2012-03-01
BR112013004362A2 (pt) 2017-09-19
HK1187144A1 (zh) 2014-03-28
AR082542A1 (es) 2012-12-12
MX2013002188A (es) 2013-03-18
AU2011295367B2 (en) 2014-07-31
CN103180898A (zh) 2013-06-26
EP2609590A1 (en) 2013-07-03
US20130173274A1 (en) 2013-07-04
JP5775583B2 (ja) 2015-09-09
CN103180898B (zh) 2015-04-08
PT3144932T (pt) 2019-02-04
AU2011295368A1 (en) 2013-03-28
EP3144932A1 (en) 2017-03-22
KR101445291B1 (ko) 2014-09-29
MY180970A (en) 2020-12-14
CA2809404A1 (en) 2012-03-01
SG187950A1 (en) 2013-03-28
AU2011295368B2 (en) 2015-05-07
SG188254A1 (en) 2013-04-30
AR098078A2 (es) 2016-04-27
EP2924687B1 (en) 2016-11-02
JP2013539554A (ja) 2013-10-24
AR082543A1 (es) 2012-12-12
SG2014006738A (en) 2014-03-28
EP3144932B1 (en) 2018-11-07
TWI459380B (zh) 2014-11-01
US20130173273A1 (en) 2013-07-04
ZA201302050B (en) 2013-12-23
PT2609591T (pt) 2016-07-12
CA2887939A1 (en) 2012-03-01
TW201214414A (en) 2012-04-01
RU2573774C2 (ru) 2016-01-27
CN103460282B (zh) 2015-08-19
US8831931B2 (en) 2014-09-09
EP2609590B1 (en) 2015-05-20
TR201900417T4 (tr) 2019-02-21
ES2706490T3 (es) 2019-03-29
RU2015102326A (ru) 2015-06-10
EP2609591B1 (en) 2016-06-01
KR101445293B1 (ko) 2014-09-29
JP2013539553A (ja) 2013-10-24
BR112013004362B1 (pt) 2020-12-01
RU2013112853A (ru) 2014-09-27
EP3471091A1 (en) 2019-04-17
AU2011295367A1 (en) 2013-04-11
MY178197A (en) 2020-10-06
PL2609590T3 (pl) 2015-10-30
TW201214417A (en) 2012-04-01
CN103460282A (zh) 2013-12-18
ES2585402T3 (es) 2016-10-05
PL3144932T3 (pl) 2019-04-30
US20140222441A1 (en) 2014-08-07
MX2013002187A (es) 2013-03-18
CA2887939C (en) 2017-11-07
JP5775582B2 (ja) 2015-09-09
KR20130079507A (ko) 2013-07-10
WO2012025282A1 (en) 2012-03-01
TWI457912B (zh) 2014-10-21
WO2012025283A1 (en) 2012-03-01
RU2640650C2 (ru) 2018-01-10
MY156770A (en) 2016-03-31
EP2924687A1 (en) 2015-09-30
JP6196249B2 (ja) 2017-09-13
CA2809437C (en) 2016-06-21
RU2580084C2 (ru) 2016-04-10
CA2809404C (en) 2016-06-21
EP2609591A1 (en) 2013-07-03
JP2015129953A (ja) 2015-07-16
US9431019B2 (en) 2016-08-30
BR112013004365B1 (pt) 2021-01-12
KR20130069770A (ko) 2013-06-26
RU2013112903A (ru) 2014-09-27

Similar Documents

Publication Publication Date Title
ES2544077T3 (es) Aparato para descodificar una señal que comprende transitorios usando una unidad de combinación y un mezclador
AU2015201672B2 (en) Apparatus for generating a decorrelated signal using transmitted phase information