MX2007011995A - Codificacion y decodificacion de audio. - Google Patents

Codificacion y decodificacion de audio.

Info

Publication number
MX2007011995A
MX2007011995A MX2007011995A MX2007011995A MX2007011995A MX 2007011995 A MX2007011995 A MX 2007011995A MX 2007011995 A MX2007011995 A MX 2007011995A MX 2007011995 A MX2007011995 A MX 2007011995A MX 2007011995 A MX2007011995 A MX 2007011995A
Authority
MX
Mexico
Prior art keywords
signal
channels
improvement data
data
channel
Prior art date
Application number
MX2007011995A
Other languages
English (en)
Inventor
Arnoldus W J Oomen
Gerard H Hotho
Francois P Myburg
Original Assignee
Koninkl Philips Electronics Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36607294&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=MX2007011995(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Koninkl Philips Electronics Nv filed Critical Koninkl Philips Electronics Nv
Publication of MX2007011995A publication Critical patent/MX2007011995A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

Un codificador de audio de multiples canales (10) codifica una senal de audio de N canales. Una primera unidad (110) genera una primera senal de M canales codificada, por ejemplo un down-mix estereo espacial, para la senal de N canales (N<M). Los mezcladores down-mix (115, 116, 117) generan los primeros datos de mejoramiento para la senal relativa a la senal de audio de N canales. Una segunda senal de M canales, tal como una mezcla estereo artistica, es generada para la senal de N canales. Un procesador (123) entonces genera los segundos datos de mejoramiento para la segunda senal de M canales relativa a la primera senal de M canales. Una segunda unidad (120) genera una senal de salida comprende la segunda senal de M canales, los primeros datos de mejoramiento y los segundos datos de mejoramiento. El generador (123) puede seleccionar dinamicamente entre generar los segundos datos de mejoramiento como datos de mejoramiento absolutos o como datos de mejoramiento en relacion a la segunda senal de M canales codificada. Un decodificador (20) puede ejecutar la operacion inversa y puede aplicar los segundos datos de mejoramiento como de mejoramiento absolutos o relativos dependiendo de un indicacion en el flujo de datos recibido.

Description

CODIFICACIÓN Y DECODIFICACION DE AUDIO CAMPO DE LA INVENCIÓN La invención se relaciona con la codificación y/o decodificación de audio para señales de múltiples canales. ANTECEDENTES DE LA INVENCIÓN Una señal de audio de múltiples canales es una señal de audio que tiene dos o más canales de audio. Ejemplos suficientemente conocidos de señales de audio de múltiples canales son las señales de audio estéreo de dos canales y señales de audio de 5.1 canales que tienen dos canales de audio frontales, dos canales de audio posteriores, una señal de audio central y un canal mejorado de baja frecuencia adicional (LFE, por sus siglas en inglés) . Tales señales de audio de 5.1 canales se utilizan en sistemas DVD (Disco Versátil Digital) y de SACD (disco compacto de súper audio) . Debido a la creciente popularidad de material de múltiples canales, la codificación eficiente de material de múltiples canales ha llegado a ser más importante. En el campo de procesamiento de audio, es suficientemente conocido convertir un número de canales de audio en otro número de canales audio. Tal conversión se puede realizar por varias razones. Por ejemplo, una señal de audio se puede convertir en otro formato para proporcionar una experiencia de usuario mejorada. Por ejemplo las grabaciones estéreo tradicionales comprenden solamente dos canales mientras que No. Ref.: 185003 los sistemas de audio avanzados modernos típicamente utilizan cinco o seis canales, como en los sistemas populares de sonido ambiental 5.1. Por consiguiente, los dos canales estéreo se pueden convertir en cinco o seis canales con el fin de aprovechar completamente el sistema de audio avanzado. Otra razón para una conversión de canal es la eficacia de codificación. Se ha descubierto que por ejemplo las señales de audio de sonido ambiental pueden ser codificadas como señales de audio de canal estéreo combinadas con un flujo de bit de parámetro que describe las propiedades espaciales de múltiples canales de la señal de audio. El decodificador puede reproducir las señales de audio de sonido ambiental con un grado de exactitud muy satisfactorio. De esta manera, se pueden obtener ahorros substanciales del índice de bit. Es conocido el sistema de codificación de audio de múltiples canales 5.1-2-5.1. En este sistema de codificación de audio conocido, una señal de audio de entrada 5.1 es codificada en y representada por dos canales down-mix y parámetros asociados . Las señales down-mix también son referidas conjuntamente como down-mix espacial. En el sistema conocido, el down-mix espacial forma una señal de audio estéreo que tiene una imagen estéreo es decir, en cuanto a calidad, comparable a un down-mix ITU fijo de los 5.1 canales de entrada. Los usuarios que tienen solamente equipo estéreo pueden escuchar esta mezcla down-mix estéreo espacial, mientras que los radioescuchas con un equipo de 5.1 canales pueden escuchar la reproducción de 5.1 canales que es hecha utilizando esta mezcla down-mix estéreo espacial y los parámetros asociados. El equipo de 5.1 canales decodifica/reconstituye la señal de audio 5.1 canales a partir de mezcla down-mix estéreo espacial (en este caso la señal de audio estéreo) y los parámetros asociados. Sin embargo, una mezcla down-mix estéreo espacial frecuentemente se considera que se reduce en calidad en comparación con una señal estéreo original o una señal estéreo generada explícitamente. Por ejemplo, los ingenieros de estudios profesionales frecuentemente tienden a encontrar el down-mix estéreo espacial un tanto sin nitidez y poco interesante. Por esta razón, frecuentemente se genera un down-mix estéreo artístico, el cual difiere del down-mix estéreo espacial. Por ejemplo son agregadas reverberación o fuentes extras, la imagen estéreo es ampliada, etc. Con el propósito de que los usuarios puedan disfrutar del down-mix estéreo artístico, el down-mix artístico, en lugar del down-mix espacial, puede ser transmitido vía un medio de transmisión o almacenado en un medio de almacenamiento. Sin embargo, al igual que en los datos paramétricos para generar las 5.1 señales desde la señal estéreo está basada en la señal down-mix original, este acercamiento afecta seriamente la calidad de la reproducción de señal de audio de 5.1 canales .
Específicamente, la señal de audio de 5.1 canales entrante fue codificada en un down-mix estéreo espacial y parámetros asociados. Al reemplazar el down-mix estéreo espacial por el down-mix estéreo artístico, el down-mix estéreo espacial puede ya no estar disponible en la codificación final del sistema y no es posible una reconstrucción de alta calidad de la señal de audio de 5.1 canales. Un acercamiento posible para mejorar la calidad de la señal de audio de 5.1 canales es incluir datos adicionales de la señal down-mix estéreo espacial. Por ejemplo, en adición a la down-mix estéreo artística, la señal down-mix estéreo espacial puede ser incluida en el mismo flujo o puede ser transmitida en paralelo. Sin embargo, esto incrementa substancialmente el índice de datos y de esa manera el ancho de banda de comunicaciones o los requerimientos de almacenamiento y degradará la calidad de la proporción del índice de datos para una señal de múltiples canales codificada. Por lo tanto, un sistema de codificación/decodificación mejorado para audio de múltiples canales, es conveniente y en particular sería conveniente un sistema que permita un desempeño, calidad y/o calidad para la proporción de índice de datos mejorados. Por consiguiente, la invención busca preferiblemente mitigar, aliviar o eliminar uno o más de las desventajas mencionadas anteriormente o en cualquier combinación.
De conformidad con un aspecto de la invención se proporciona un codificador de audio de múltiples canales A para codificar una señal de audio de N-canales, el codificador de audio de múltiples canales comprende: un medio para generar una primera señal de M-canales para la señal de audio de N canales, M es menor que N; un medio para generar primeros datos de mejora para la primera señal de M canales en relación con la señal de audio de N canales : un medio para generar una segunda señal de M canales para la señal de audio de N canales; un medio de mejoramiento para generar segundos datos de mejoramiento para la segunda señal de M canales en relación con la primera señal de M canales; un medio para generar una señal de salida codificada que comprende la segunda de M canales, los primeros datos de mejoramiento y los segundos datos de mejoramiento ; y en donde el medio de mejoramiento está arreglado para seleccionar dinámicamente entre generar los segundos datos de mejoramiento como datos de mejoramiento absolutos o datos de mejoramiento relacionados con la segunda señal de M canales . La invención puede permitir una codificación eficiente de una señal de múltiples canales. En particular, se puede alcanzar una codificación eficiente con una calidad incrementada de la velocidad de transferencia de datos. La invención puede permitir una señal de M canales para reemplazar otra señal de M canales con un impacto reducido en la generación de múltiples canales basada en datos de mejoramiento que se relacionan con la primera señal de M canales. Específicamente, una señal down-mix artística puede ser transmitida en lugar de una down-mix espacial y al mismo tiempo permitir una eficiente reconstrucción de múltiples canales en un decodificador basado en datos de mejoramiento asociados con el down-mix espacial . La selección dinámica de datos de mejoramiento permite un tamaño significativamente reducido de los datos de mejoramiento y/o una calidad mejorada de las señales que pueden ser generadas . Los datos de mejoramiento absolutos describen la primer señal de M canales sin referencia a la segunda señal de M canales mientras que los datos de mejoramiento relativos describen la primera señal de M canales con referencia a la segunda señal de M canales . El medio para generar la primera y/o segunda señal de M canales puede generar las señales mediante el procesamiento de la señal de N canales o por ejemplo al recibir la señal (es) de M canales de fuentes internas o externas . De conformidad con una característica opcional de la invención, el medio de mejoramiento está arreglado para seleccionar entre los datos de mejoramiento absolutos y los datos de mejoramiento relativos en respuesta a una característica de la señal de N canales.
Esto puede permitir un desempeño y en particular puede proporcionar una señal codificada con calidad mejorada para la velocidad de transferencia de datos. La selección puede por ejemplo ser ejecutada al evaluar uno o más parámetros derivados de una característica de un segmento de la señal de N canales y específicamente con base en uno o más parámetros derivados de la primera y/o segunda señal de M canales (las cuales por si mismas pueden ser derivadas de las señal de N canales) . De conformidad con una característica opcional de la invención, el medio de mejoramiento está arreglado para seleccionar entre los datos de mejoramiento absolutos y los datos de mejoramiento relativos en respuesta a una característica relativa de los datos de mejoramiento absolutos y los datos de mejoramiento relativos . Esto puede permitir un desempeño eficiente y en particular puede proporcionar una señal codificada con calidad mejorada para la velocidad de transmisión de datos. Alternativamente o adicionalmente, puede permitir una implementación eficiente y/o de baja complejidad. De conformidad con una característica opcional de la invención, la característica relativa es una energía de señal de los datos de mejoramiento absolutos en relación con una energía de señal de los datos de mejoramiento relativos.
Esto puede permitir un desempeño eficiente y en particular puede proporcionar una señal codificada con una calidad mejorada de velocidad de transmisión de datos. Alternativamente o adicionalmente, puede permitir una implementación eficiente y/o de baja complejidad. Específicamente, el medio de mejoramiento puede seleccionar el tipo de datos de mejoramiento el cual tiene la más baja energía de señal . De conformidad con una característica opcional de la invención, el medio de mejoramiento está arreglado para dividir la segunda señal de M canales en bloque de señal y para seleccionar individualmente entre los datos de mejoramiento absolutos y los datos de mejoramiento relativos para cada bloque de señal . Esto puede permitir un desempeño eficiente y en particular puede proporcionar una señal codificada con calidad mejorada para la velocidad de transmisión de datos. Alternativamente o adicionalmente, puede permitir una implementación eficiente y/o de baja complejidad. Los bloques de señal pueden ser divididos en el dominio de tiempo y/o frecuencia y cada bloque de señal puede comprender específicamente un grupo de mosaicos de tiempo/ frecuencia . La división en bloque de señales puede ser aplicada a la primera señal de M canales y/o la señal de N canales.
De conformidad con una característica opcional de la invención, el medio de mejoramiento está arreglado para seleccionar entre datos de mejoramiento absolutos y los datos de mejoramiento relativos para un bloque de señales basado solamente en características asociadas con el bloque de señales . Esto puede permitir un desempeño eficiente y en particular puede proporcionar una señal codificada con calidad mejorada para la velocidad de transmisión de datos. Alternativamente o adicionalmente, puede permitir una implementación eficiente y/o de baja complejidad. Específicamente, el medio de mejoramiento puede seleccionar el tipo de datos de mejoramiento el cual tiene la más baja energía de señal . De conformidad con una característica opcional de la invención, el medio de mejoramiento está arreglado para generar los datos de mejoramiento como una combinación de los datos de mejoramiento absolutos y los datos de mejoramiento relativos durante un intervalo de conmutación de tiempo de una conmutación entre la generación de los datos de mejoramiento como datos de mejoramiento absolutos y como datos de mejoramiento relativos. Esto puede permitir conmutación mejorada y en particular puede reducir artefactos asociados con la conmutación. Se puede lograr una calidad de sonido mejorada. La combinación durante un intervalo de conmutación de tiempo puede ser aplicada cuando se conmuta desde datos de mejoramiento absolutos hasta relativos y/o desde datos de mejoramiento relativos hasta absolutos. La combinación se puede lograr utilizando una técnica de superposición y agregación. De conformidad con una característica opcional de la invención, la combinación comprende una interpolación entre los datos de mejoramiento absolutos y los datos de mejoramiento relativos. Esto puede permitir una implementación práctica y eficiente con alta calidad. Se puede lograr un sonido con calidad me orada. De conformidad con una característica opcional de la invención, el medio para generar la señal de salida codificada está arreglado para incluir datos que indican si se utilizan datos de mejoramiento relativo o datos de mejoramiento absoluto. Esto puede permitir un desempeño eficiente y en particular puede proporcionar una señal codificada con calidad mejorada de velocidad de transmisión de datos. Alternativamente o adicionalmente, puede permitir una implementación eficiente y/o de baja complejidad. Los datos de indicación pueden incluir específicamente una indicación de selección para cada bloque de señal .
De conformidad con una característica opcional de la invención, los segundos datos de mejoramiento comprenden una primera parte de datos de mejoramiento y una segunda parte de datos de mejoramiento, la segunda parte proporciona una representación de calidad más alta de la primera señal de M canales que la primera parte. Esto puede permitir un desempeño eficiente y en particular puede proporcionar una señal codificada con calidad mejorada de velocidad de transmisión de datos. La primera parte puede tener una transmisión de datos más baja que la segunda parte. La segunda parte puede comprender datos que más exactamente permiten un decodificador para recrear la primera señal de M canales . De conformidad con una característica opcional de la invención, el medio de mejoramiento está arreglado para seleccionar dinámicamente solo entre generar la segunda parte como datos de mejoramiento absolutos o como datos de mejoramiento relativos. Esto puede permitir un desempeño eficiente y en particular puede proporcionar una señal codificada con calidad mejorada de velocidad de transmisión de datos. De conformidad con una característica opcional de la invención, el medio de mejoramiento está arreglado para generar datos relativos de la segunda parte en relación con una señal de referencia generada por la aplicación de datos de mejoramiento de la primera parte a la primera señal de M canales . Esto puede permitir un desempeño eficiente y en particular puede proporcionar una señal codificada con calidad mejorada en la velocidad de transmisión de datos. De conformidad con otro aspecto de la invención, se proporciona un decodificador de audio de múltiples canales para decodificar una señal de audio de N canales, el decodificador de audio de múltiples canales comprende: un medio para recibir una señal de audio codificada que comprende una primera señal de M-canales para la señal de audio de N canales, M es menor que N; primeros datos de mejoramiento para expansión de múltiples canales, los primeros datos de mejoramiento que son relativos a una segunda señal de M canales diferente de la primera señal de M canales; segundos datos de mejoramiento para la primera señal de M canales en relación con la segunda señal de M canales; los segundos datos de mejoramiento que comprende datos de mejoramiento absolutos y datos de mejoramiento relativos en relación con la primera señal de M canales, y datos de indicación indicativos de si los segundos datos para un bloque de señales son datos de mejoramiento absolutos o datos de mejoramiento relativos; un medio de generación para generar una señal expansión de M-canales múltiples-canales en respuesta a la primera señal de M canales y los segundos datos de mejoramiento; y un medio para generar una señal de N canales decodificada en respuesta a la señal de expansión de M-canales múltiples-canales y los primeros datos de mejoramiento; y en donde el medio de generación está arreglado para seleccionar entre aplicar los segundos datos de mejoramiento como datos de mejoramiento absolutos o datos de mejoramiento relativos en respuesta a los datos de indicación. La invención puede permitir un alto y eficiente desempeño de decodificación de una señal de múltiples canales. En particular, se puede lograr una decodificación eficiente de una señal con calidad mejorada un índice de transmisión de datos dado. La invención puede permitir una señal de M canales para reemplazar otra señal de M canales con un impacto reducido en la generación de múltiples canales con base en datos de mejoramiento que se relacionan con la primera señal de M canales. Específicamente, un down-mix artístico puede ser transmitido en lugar de un down-mix espacial mientras tanto permitir una eficiente recreación de múltiples canales en el decodificador con base en datos de mejoramiento asociados con el down-mix espacial . Los datos de mejoramiento absolutos describen las segunda señal de M canales sin referencia a la primera señal de M canales mientras que los datos de mejoramiento relativos describen la segunda señal de M canales con referencia a la primera señal de M canales .
De conformidad con una característica opcional de la invención, el medio de generación está arreglado para aplicar los segundos datos de mejoramiento a la primera señal de M canales en el dominio de tiempo. Esto puede permitir un desempeño eficiente y en particular puede proporcionar una señal decodificada con calidad mejorada para una transmisión de datos dada. Alternativamente o adicionalmente, puede permitir una implementación eficiente y/o de baja complejidad. De conformidad con una característica opcional de la invención, el medio de generación está arreglado para aplicar los segundos datos de mejoramiento a la primera señal de M canales en el dominio de frecuencia. Esto puede permitir un desempeño eficiente y en particular puede proporcionar una señal decodificada con calidad mejorada para una transmisión de datos dada. Alternativamente o adicionalmente, puede permitir una implementación eficiente y/o de baja complejidad. En particular, en muchas modalidades, la aplicación de dominio de frecuencia puede reducir el numero requerido de tiempo para transformaciones de frecuencia. El dominio de frecuencia puede por ejemplo ser un Banco de Filtros Espejo en Cuadratura (QMF, por sus siglas en inglés) o un dominio de Transformada de Coseno Discreta Modificada (MDCT, por sus siglas en inglés) .
De conformidad con una característica opcional de la invención, los segundos datos de mejoramiento comprenden una primera parte de datos de mejoramiento y una segunda parte de datos de mejoramiento, la segunda parte que proporciona una representación de más alta calidad de la primera señal de M canales que la primera parte. Esto puede permitir un desempeño eficiente y en particular puede proporcionar una señal decodificada con calidad mejorada para una transmisión de datos dada. Alternativamente o adicionalmente, puede permitir una implementación eficiente y/o de baja complejidad. La segunda parte puede comprender datos que permiten de forma más precisa a un decodificador recrear la primera señal de M canales. De conformidad con una característica opcional de la invención, el medio de generación está arreglado para solamente seleccionar entre aplicar segundos datos de mejoramiento de la segunda parte como datos de mejoramiento absolutos o datos de mejoramiento relativos. Esto puede permitir un desempeño eficiente y en particular puede proporcionar una señal decodificada con calidad mejorada para una transmisión de datos dada.
Alternativamente o adicionalmente, puede permitir una implementación eficiente y/o de baja complejidad. De conformidad con una característica opcional de la invención, el medio de generación está arreglado para generar la expansión de M-canales múltiples-canales al aplicar datos de mejoramiento relativos de la segunda parte a una señal generada al aplicar datos de mejoramiento de la primera parte a la primera señal de M canales . Esto puede permitir un desempeño eficiente y en particular puede proporcionar una señal decodificada con calidad mejorada para una transmisión de datos dada. Alternativamente o adicionalmente, puede permitir una implementación eficiente y/o de baja complejidad. De conformidad con otro aspecto de la invención, se proporciona un método para codificar una señal de audio de N canales, el método comprende: generar una primera señal de M canales para la señal de audio de N canales, M es menor que N; generar primeros datos de mejoramiento para la primera señal de M canales en relación con la señal de audio de N canales, generar una segunda señal de M canales para la señal de audio de N canales; generar segundos datos de mejoramiento para la segunda señal de M canales en relación con la primera señal de M canales; generar una señal de salida codificada que comprende la segunda señal de M canales, los primeros datos de mejoramiento y los segundos datos de mejoramiento; y en donde la generación de los segundos datos de mejoramiento comprende seleccionar dinámicamente entre generar los segundos datos de mejoramiento como datos de mejoramiento absolutos o como datos de mejoramiento relativos en relación con la segunda señal de M canales . De conformidad con otro aspecto de la invención, se proporciona un método para decodificar una señal de audio de N canales, el método comprende: recibir una señal de audio codificada que comprende una primera señal de M canales para la señal de audio de N canales, M es menor que N, primeros datos de mejoramiento para expansión de múltiples canales, los primeros datos de mejoramiento son relativos a una segunda señal de M canales diferente de la primera señal de M canales; segundos datos de mejoramiento para la primera señal de M canales relativa a la segunda señal de M canales, los segundos datos de mejoramiento comprenden datos de mejoramiento absolutos y datos de mejoramiento relativos en relación a la primera señal de M canales, y datos de indicación indicativos de si los segundos datos de mejoramiento para un bloque de señal son datos de mejoramiento absolutos o datos de mejoramiento relativos; generar una señal de expansión de M-canales de múltiples-canales en respuesta a la primera señal de M canales y los segundos datos de mejoramiento; y generar una señal decodificada de N canales en respuesta a la señal de expansión de M-canales de m?ltiples-canales y los primeros datos de mejoramiento; y en donde la generación de la señal de expansión de M-canales de múltiples-canales comprende seleccionar entre aplicar los segundos datos de mejoramiento como datos de mejoramiento absolutos o datos de mejoramiento relativos en respuesta a los datos de indicación. De conformidad con otro aspecto de la invención, se proporciona una señal de audio de múltiples canales codificada para una señal de audio de N canales que comprende: datos de señal de M canales para la señal de audio de N canales, M es menor que N; primeros datos de mejoramiento para expansión de múltiples canales, los primeros datos de mejoramiento son relativos a una segunda señal de M canales diferente de la primera señal de M canales; segundos datos de mejoramiento para la primera señal de M canales relativa a la segunda señal de M canales, los segundos datos de mejoramiento comprenden datos de mejoramiento absolutos y datos de mejoramiento relativos en relación con la primera señal de M canales; y datos de indicación indicativos de si los segundos datos de mejoramiento para un bloque de señales son datos de mejoramiento absolutos o datos de mejoramiento relativos. De conformidad con otro aspecto de la invención, se proporciona un medio de almacenamiento que tiene almacenada en el mismo una señal de acuerdo a lo descrito anteriormente. De conformidad con otro aspecto de la invención, se proporciona un transmisor para transmitir una señal de audio de múltiples canales codificada, el transmisor comprende un codificador de audio de múltiples canales de acuerdo a lo descrito anteriormente.
De conformidad con otro aspecto de la invención, se proporciona un receptor para recibir una señal de audio de múltiples canales, el receptor comprende un decodificador de audio de múltiples canales de acuerdo a lo descrito anteriormente. De conformidad con otro aspecto de la invención, se proporciona un sistema de transmisión que comprende un transmisor para transmitir una señal de audio de múltiples canales codificada a través de un canal de transmisión hacia un receptor, el transmisor comprende un codificador de audio de múltiples canales de acuerdo a lo descrito anteriormente y el receptor comprende un decodificador de audio de múltiples canales de acuerdo a lo descrito anteriormente. De conformidad con otro aspecto de la invención, se proporciona un método para transmitir una señal de audio de múltiples canales codificada, el método comprende codificar una señal de audio de N canales, en donde la codificación comprende: generar una primera señal de M canales para la señal de audio de N canales, M es menor que N, generar primeros datos de mejoramiento para la primera señal de M canales relativas a la señal de audio de N canales; generar una segunda señal de M canales para la señal de audio de N canales; generar segundos datos de mejoramiento para la segunda señal de M canales relativa a la primera señal de M canales; generar una señal de salida codificada que comprende la segunda señal de M canales, los primeros datos de mejoramiento y los segundos datos de mejoramiento; y en donde la generación de los segundos datos de mejoramiento comprende seleccionar dinámicamente entre generar los segundos datos de mejoramiento como datos de mejoramiento absolutos o como datos de mejoramiento relativos en relación con la segunda señal de M canales . De conformidad con otro aspecto de la invención, se proporciona un método para recibir una señal de audio de múltiples canales codificada, el método comprende decodificar la señal de múltiples canales codificada, la decodificación comprende recibir la señal de audio de múltiples canales codificada que comprende una primera señal de M canales para la señal de audio de N canales, M es menor que N, primeros datos de mejoramiento para expansión de múltiples canales, los primeros datos de mejoramiento son relativos a una segunda señal de M canales diferente que la primera señal de M canales; segundos datos de mejoramiento para la primera señal de M canales relativa a la segunda señal de M canales, los segundos datos de mejoramiento comprenden datos de mejoramiento absolutos y datos de mejoramiento relativos en relación con la primera señal de M canales, y datos de indicación indicativos de si los segundos datos de mejoramiento para un bloque de señales son datos de mejoramiento absolutos o datos de mejoramiento relativos; generar una señal de expansión de M-canales de múltiples-canales en respuesta a la primera señal de M canales y los segundos datos de mejoramiento; y generar una señal de N canales decodificada en respuesta a la señal de expansión de M-canales de múltiples-canales y los primeros datos de mejoramiento; y en donde la generación de la señal de expansión de M-canales de múltiples-canales comprende seleccionar entre aplicar los segundos datos de mejoramiento como datos de mejoramiento absolutos o datos de mejoramiento relativos en respuesta a los datos de indicación. De conformidad con otro aspecto de la invención, se proporciona un método para transmitir y recibir una señal de audio, el método comprende: codificar una señal de audio de N canales, en donde la codificación comprende: generar una primera señal de M canales para la señal de audio de N canales, M es menor que N, generar primeros datos de mejoramiento para la primera señal de M canales relativos a la señal de audio de N canales, generar una segunda señal de M canales para la señal de audio de N canales, generar segundos datos de mejoramiento para la segunda señal de M canales relativos a la primera señal de M canales, la generación de los segundos datos de mejoramiento comprende seleccionar dinámicamente entre generar los segundos datos de mejoramiento como datos de mejoramiento absolutos o como datos de datos de mejoramiento relativos en relación con la segunda señal de M canales que genera una señal de salida codificada que comprende la segunda señal de M canales, los primeros datos de mejoramiento y los segundos datos de mejoramiento ; transmitir la señal de salida codificada desde un transmisor hacia un receptor; recibir, en el receptor, la señal de salida codificada; decodificar la señal de salida codificada en donde la decodificación comprende: generar una señal de expansión de M-canales de múltiples-canales en respuesta a la segunda señal de M canales y los segundos datos de mejoramiento, la generación de la señal de expansión de M-canales de múltiples-canales comprende seleccionar entre aplicar los segundos datos de mejoramiento como datos de mejoramiento absolutos o datos de mejoramiento relativos, y generar una señal decodificada de N canales en respuesta a la señal de expansión de M-canales de múltiples-canales y los primeros datos de mejoramiento. De conformidad con otro aspecto de la invención, se proporciona un producto operativo de programa computacional para provocar que un procesador ejecute los pasos del método descrito anteriormente. De conformidad con otro aspecto de la invención, se proporciona una grabadora de audio de múltiples canales que comprende un codificador de audio de múltiples canales de acuerdo a lo descrito anteriormente. De conformidad con otro aspecto de la invención, se proporciona un reproductor de audio de múltiples canales (60) que comprende un decodificador de audio de múltiples canales de acuerdo a lo descrito anteriormente. Estos y otros aspectos, características y ventajas de la invención serán evidentes a partir de, y elucidadas con la modalidad (es) descritas en adelante. BREVE DESCRIPCIÓN DE LAS FIGURAS Las modalidades de la invención se describirán, únicamente a manera de ejemplo, con referencia a las Figuras en las cuales : La Figura 1 muestra un diagrama en bloques de un codificador de audio de múltiples canales de conformidad con algunas modalidades de la invención; la Figura 2 muestra un diagrama en bloques de un decodificador de audio de múltiples canales de conformidad con algunas modalidades de la invención; la Figura 3 muestra un diagrama en bloques de un sistema de transmisión de conformidad con algunas modalidades de la invención; la Figura 4 muestra un diagrama en bloques de un reproductor/grabadora de audio de múltiples canales de conformidad con algunas modalidades de la invención; la Figura 5 muestra un diagrama en bloques de un codificador de audio de múltiples canales para algunas modalidades de la invención; la Figura 6 muestra un diagrama en bloques de un generador de datos mejorado de conformidad con algunas modalidades de la invención; la Figura 7 muestra un diagrama en bloques de un decodificador de audio de múltiples canales de conformidad con algunas modalidades de la invención; la Figura 8 muestra un diagrama en bloques de elementos de un decodificador de audio de múltiples canales; la Figura 9 muestra un diagrama en bloques de elementos de un decodificador de audio de múltiples canales de conformidad con algunas modalidades de la invención; la Figura 10 muestra un diagrama en bloques de elementos de un decodificador de audio de múltiples canales de conformidad con algunas modalidades de la invención; y la Figura 11 muestra un diagrama en bloques de elementos de un decodificador de audio de múltiples canales de conformidad con algunas modalidades de la invención. DESCRIPCIÓN DETALLADA DE LA INVENCIÓN La siguiente descripción se enfoca en varias modalidades de la invención aplicables a un codificador 5.1-a-2 y/o un decodificador de 2-a-5.1. Sin embargo, se deberá apreciar que la invención no está limitada a esta aplicación. La Figura 1 muestra un diagrama en bloques de una modalidad de un codificador de audio de múltiples canales 10 de conformidad con algunas modalidades de la invención. Este codificador de audio de múltiples canales 10 está arreglado para codificar N señales de audio 101 en M señales de audio 102 y datos paramétricos asociados 104, 105. En este, M y N son enteros, con N > M y M = 1. Un ejemplo del codificador de audio de múltiples canales 10 es un codificador de 5.1 a 2 en el cual N es igual a 6, en este caso 5+1 canales, y M es igual a 2. Tal codificador de audio de múltiples canales 10 codifica una señal de audio de entrada de 5.1 canales en una señal de audio de salida de 2 canales, por ejemplo una señal de audio de salida estéreo, y parámetros asociados. Otros ejemplos del codificador de audio de múltiples canales 10 son codificadores 5.1 a 1, 6.1 a 2, 6.1 a 1, 7.1 a 2 y 7.1 a 1. También codificadores que tienen otros valores para N y M son posibles siempre que N sea mayor que M y siempre que M sea mayor o igual a 1. El codificador 10 comprende una primera unidad de codificación 110 y acoplado al mismo una segunda unidad de codificación 120. La primera unidad de codificación 110 recibe las N señales de audio de entrada 101 y codifica las N señales de audio 101 en las M señales de audio 102 y primeros datos paramétricos asociados 104. Las M señales de audio 102 y los primeros datos paramétricos asociados 104 representan las N señales de audio 101. La codificación de las N señales de audio 101 en las M señales de audio 102 de acuerdo a lo ejecutado por la primera unidad 110 pueden también ser referidas como down-mix y las M señales de audio 102 también pueden ser referidas como down-mix espacial 102. La unidad 110 puede ser un codificador de audio de múltiples canales paramétrico convencional que codifica una señal de audio de múltiples canales 101 en una señal de audio down-mix mono o estéreo 102 y parámetros asociados 104. Los parámetros asociados 104 permiten que un decodificador reconstituya la señal de audio de múltiples canales 101 a partir de la señal de audio down-mix mono o estéreo 102. Se debe observar que el down-mix 102 también tiene más de dos canales. La primera unidad 110 suministra el down-mix espacial 102 a la segunda unidad 120. La segunda unidad 120 genera, a partir del down-mix espacial 102, los segundos datos de mejoramiento en la forma de segundos datos paramétricos asociados 105. Los segundos datos paramétricos asociados 105 representan el down-mix espacial 102, en este caso estos parámetros 105 comprenden características o propiedades del down-mix espacial 102 lo cual permite a un decodificador reconstituir por lo menos parte del down-mix espacial 102, por ejemplo al sintetizar una señal que se asemeja al down-mix espacial 102. Los datos paramétricos asociados comprenden los primeros y segundos datos paramétricos asociados 104 y 105. Los segundos datos paramétricos asociados 105 comprenden parámetros de modificación que permiten la reconstrucción del down-mix espacial 102 a partir de las K(=M) señales de audio adicionales 103. De esta manera, un decodificador puede ejecutar una reconstrucción aun mejor del down-mix espacial 102. Esta reconstrucción puede realizarse con base en una down-mix alternativo 103, en este caso las K señales de audio adicionales 103, tal como un down-mix artístico. Un decodificador puede aplicar los parámetros de modificación a la señal down-mix alternativa 103 de manera más cercana se asemejan al down-mix espacial 102. La segunda unidad 120 puede recibir en sus entradas el down-mix alternativo 103. El down-mix alternativo 103 puede ser recibido desde una fuente externa al codificador 10 (de acuerdo a lo mostrado en al Figura 1) o, alternativamente, el down-mix alternativo 103 puede ser generado dentro del codificador 10 (no se muestra) , por ejemplo de las N señales de audio 101. La segunda unidad 120 puede comparar por lo menos algo del down-mix espacial 102 con el down-mix alternativo 103 y generar parámetros de modificación 105 que representan una diferencia entre el down-mix espacial 102 y el down-mix alternativo 103, por ejemplo una diferencia entre una propiedad del down-mix espacial 102 y una propiedad del down-mix alternativo 103. En el ejemplo, el down-mix alternativo 103 es específicamente un down-mix artístico asociado con el down-mix espacial . En el ejemplo, la segunda unidad 120 puede además generar los parámetros de modificación con valores absolutos los cuales representan directamente el down-mix espacial 102 sin alguna referencia al down-mix alternativo 103. Adicionalmente, la segunda unidad 120 comprende una funcionalidad para la selección entre los parámetros de modificación relativos y los absolutos para la señal de salida de codificador. Específicamente, esta selección es ejecutada dinámicamente y puede ser realizada para bloques de señales individuales dependiendo de las características de la señal y/o los datos paramétricos . En adición, la segunda unidad 120 puede comprender una funcionalidad para incluir una indicación de los parámetros de modificación (absolutos o relativos) han sido utilizados para diferentes secciones de la señal codificada. Por ejemplo, para cada bloque de señales, un bit de datos puede ser incluido para indicar si han sido incluidos datos paramétricos relativos o absolutos para ese bloque de señales. Los parámetros de modificación 105 preferiblemente comprenden (una diferencia entre) una o más propiedades de señales estadísticas tal como varianza, covarianza y correlación, o una proporción de estas propiedades, o de la (diferencia entre la) señal (es) down-mix. Se debe observar que la varianza de una señal es equivalente a la energía o potencia de esa señal. Estas propiedades de señal estadística permiten una buena reconstrucción del down-mix espacial. La Figura 2 muestra un diagrama en bloques de una modalidad de un decodificador de audio de múltiples canales 20 de conformidad con algunas modalidades de la invención. El decodificador 20 está arreglado para decodificar K señales de audio 103 y datos paramétricos asociados 104, 105 en N señales de audio 203. En éste, K y N son enteros, con N > K y K = 1. las K señales de audio 103, en este caso el down-mix alternativo 103, y los datos paramétricos asociados 104, 105 representan las N señales de audio, en este caso la señal de audio de múltiples canales 203. Un ejemplo del decodificador de audio de múltiples canales 20 es un decodificador de 2 a 5.1 en el cual N es igual a 6, en este caso 5+1 canales, y K es igual a 2. El decodificador de audio de múltiples canales decodifica una señal de audio de entrada de 2 canales, por ejemplo una señal de audio de entrada estéreo, y parámetros asociados en una señal de audio de salida de 5.1 canales. Otros ejemplos del decodificador de audio de múltiples canales 20 son decodificadores l a 5.1, 2 a 6.1, l a 6.1, 2 a 7.1 y 1 a 7.1. También decodificadores que tienen otros valores para N y K son posibles siempre que N sea mayor que K y siempre que K sea mayor o igual a 1. El decodificador de audio de múltiples canales 20 comprende una primera unidad 210 y acoplado al mismo una segunda unidad 220. La primera unidad 210 recibe down-mix alternativo 103 y datos de mejoramiento en la forma de parámetros de modificación 105 y reconstruye las M señales de audio adicionales 202, en este caso el down-mix espacial 202 o una aproximación de la misma, del down-mix alternativo 103 y parámetros de modificación 105. En este, M es un entero, con M = 1. Los parámetros de modificación 105 representan el down-mix espacial 202. La primera unidad 210 está arreglada específicamente para determinar si los parámetros de modificación 105 representan el down-mix espacial 202. La primera unidad 210 está arreglada específicamente para determinar si los parámetros de modificación 105 son parámetros de modificación absolutos o relativos y por consiguiente aplicar los parámetros. Específicamente, la primera unidad 210 puede determinar si los parámetros de modificación 105 para los bloques de señales individuales son parámetros relativos o absolutos basados en datos explícitos en el flujo de datos recibidos. Por ejemplo, un bit de datos único puede ser incluido para cada bloque de señales indicando si los parámetros son parámetros de modificación absolutos o relativos es ese bloque de señales . La segunda unidad 220 recibe el down-mix espacial 202 desde la primera unidad 210 y parámetros de modificación 104. La segunda unidad 220 decodifica el down-mix espacial 202 y los parámetros de modificación 104 en la señal de audio de múltiples canales 203. La segunda unidad 220 puede ser un decodificador de audio de múltiples canales paramétrico convencional que decodifica una señal de audio down-mix mono o estéreo 202 y parámetros asociados 104 en una señal de audio de múltiples canales 203.
La primera unidad 210 puede ser arreglada para determinar si es necesario o deseable reconstruir la señal 202 de la señal de entrada 103. La reconstrucción puede no ser aplicable cuando la señal down-mix espacial 202 es suministrada por la primera unidad 210 en lugar del down-mix alternativo 103. La primera unidad 210 puede determinar esto al generar a partir de la señal de entrada 103 similares o iguales propiedades como que se encuentran comprendidas en los parámetros de modificación 105 y al comparar estas propiedades de señales generadas con los parámetros de modificación 105. Si esta comparación muestra que las propiedades de señales generadas son iguales a o substancialmente iguales a los parámetros de modificación 105 entonces la señal de entrada 103 se asemeja suficientemente a la señal down-mix espacial 202 y la primera unidad 210 puede retransmitir la señal de entrada 103 hacia la segunda unidad 220. Si la comparación muestra que las propiedades de señales generadas no son iguales o substancialmente iguales a los parámetros de modificación 105 entonces la señal de entrada 103 no se asemeja suficientemente a la señal down-mix espacial 202 y la primera unidad 210 puede reconstruir/aproximarse a la señal down-mix espacial 202 a partir de la señal de entrada 103 y de los parámetros de modificación 105. La primera unidad 210 puede generar, a partir del down-mix alternativo, parámetros/propiedades de modificación adicionales que representan el down-mix alternativo 103. En tal caso, la primera unidad 210 puede reconstruir el down-mix espacial 202 a partir del down-mix alternativo 103 y (una diferencia entre) los parámetros de modificación 105 y los parámetros de modificación adicionales. Los parámetros de modificación 105 y los parámetros de modificación adicionales, respectivamente, pueden incluir propiedades estadísticas del down-mix espacial 202 y del down-mix alternativo 103, respectivamente. Estas propiedades estadísticas tal como varianza, correlación y covarianza, etc. proporcionan buenas representaciones de las señales de que se derivan. Son útiles en la reconstrucción del down-mix espacial 202, por ejemplo al transformar el down-mix alternativo de manera que sus propiedades asociadas correspondan con las propiedades comprendidas en los parámetros de modificación 105. La Figura 3 muestra un diagrama en bloques de una modalidad de un sistema de transmisión 70 de conformidad con algunas modalidades de la invención. El sistema de transmisión 70 comprende un transmisor 40 para transmitir una señal de audio de múltiples canales codificada por medio de un canal de transmisión 30, por ejemplo una conexión de comunicación por cable o inalámbrica, hacia un receptor 50. El transmisor 40 comprende un codificador de audio de múltiples canales 10 de acuerdo a lo descrito anteriormente para codificar la señal de audio de múltiples canales 101 en un down-mix espacial 102 y parámetros asociados 104, 105. El transmisor 40 además comprende un medio 41 para transmitir una señal de audio de múltiples canales que comprende los parámetros 104, 105 y el down-mix espacial 102 o el down-mix alternativo 103 por medio del canal de transmisión 30 hacia el receptor 50. El receptor 50 comprende un medio 51 para recibir la señal de audio de múltiples canales codificada y un decodificador de audio de múltiples canales 20 de acuerdo a lo descrito anteriormente para decodificar el down-mix alternativo 103 o el down-mix espacial 102 y los parámetros asociados 104, 105 en la señal de audio de múltiples canales 203. La Figura 4 muestra un diagrama en bloques de una modalidad de un reproductor/grabadora de audio de múltiples canales 60 de conformidad con algunas modalidades de la invención. El reproductor/grabadora de audio 60 comprende un decodificador de audio de múltiples canales 20 y/o codificador de audio de múltiples canales 10 de conformidad con algunas modalidades de la invención. El reproductor/grabadora de audio 60 puede tener su propio almacenamiento por ejemplo una memoria en estado sólido o un disco duro. El reproductor/grabadora de audio 60 también puede facilitar un medio de almacenamiento portátil tal como discos DVD (registrable) o discos CD (registrables) . Las señales de audio de múltiples canales codificadas almacenadas que comprenden un down-mix alternativo 103 y parámetros 104, 105 pueden ser decodificadas por el decodificador 20 y ser ejecutadas o reproducidas por el reproductor/grabadora de audio 60. El codificador 10 puede codificar señal de audio de múltiples canales para su almacenamiento en el medio de almacenamiento. La Figura 5 muestra un diagrama en bloques de un codificador de audio de múltiples canales 10 de conformidad con algunas modalidades de la invención. El codificador de la Figura 5 específicamente puede ser el codificador 10 de la Figura 1. El codificador 10 comprende una primera unidad 110 y acoplado al mismo una segunda unidad 120. La primera unidad 110 recibe una señal de audio de múltiples canales 5.1 101 que comprende señales de audio izquierda frontal, izquierda trasera, derecha frontal, derecha trasera, central y de baja frecuencia mejoradas, respectivamente lf, Ir, rf, rr, co y lfe. La segunda unidad 120 recibe un down-mix estéreo artístico 103 que comprende señales de audio artístico izquierdo y artístico derecho respectivamente la y ra. La señal de audio de múltiples canales 101 y el down-mix artístico 103 son señales de audio de dominio de tiempo. En la primera y segunda unidades 110 y 120 estas señales 101 y 103 son segmentadas y transformadas al dominio de frecuencia-tiempo. En la primera unidad 110, los datos paramétricos 104 se derivan en tres etapas. En una primera etapa, tres pares de señales de audio lf y rf, rf y rr, y co y lfe, respectivamente, son segmentadas y las señales segmentadas son transformadas al dominio de frecuencia en unidades de segmentación y transformación 112, 113, y 114, respectivamente. Las representaciones de dominio de frecuencia resultantes de las señales segmentadas son mostradas como señales de dominio de frecuencia Lf, Lr, Rf, Rr, Co y LFE, respectivamente. En una segunda etapa, tres pares de estas señales de dominio de frecuencia Lf y Lr, Rf y Rr, y Co y LFE, respectivamente son mezcladas en down-mix en mezcladores down- iz 115, 116, y 117, respectivamente, para generar señales de audio mono L, R, y C, respectivamente y parámetros asociados 141, 142, y 143, respectivamente. Los mezcladores down-mix 115, 116, y 117 pueden ser codificadores estéreo paramétricos MPEG4 convencionales. Finalmente, en una tercera etapa las tres señales de audio mono L, R y C son mezcladas down-mix en un mezclador down-mix 118 para obtener un down-mix estéreo espacial 102 y parámetros asociados 144. La señal down-mix espacial 102 comprende señales Lo y Ro. Los datos paramétricos 141, 142, 143, y 144 están comprendidos en los primeros datos de mejoramiento en la forma de primeros datos paramétricos asociados 104. Los datos paramétricos 104 y la señal down-mix espacial 102 representan las 5.1 señales de entrada 101.
En la segunda unidad, la señal down-mix artística 103 representada en dominio de tiempo por las señales de audio la y ra, respectivamente, primero es segmentada en una unidad de segmentación 121. La señal de audio segmentada resultante 127 comprende señales las y ras, respectivamente. Posteriormente, esta señal de audio segmentada 127 es transformada al dominio de frecuencia por el transformador 122. La señal de dominio de frecuencia resultante 126 comprende señales La y Ra. Finalmente, la señal de dominio de frecuencia 126, la cual es una representación de dominio de frecuencia del down-mix artístico segmentado 103, y la representación de dominio de frecuencia del down-mix espacial segmentado 202 son suministrados a un generador 123 el cual genera datos de mejoramiento adicionales (segundos) en la forma de parámetros de modificación 105 lo cual permite a un decodificador modificar/transformar el down-mix artístico 103 de manera que se asemeje más cercanamente al down-mix espacial 102. En el ejemplo específico, la señal de dominio de tiempo segmentada 127 también es suministrada hacia un selector 124. Las otras dos entradas a este selector 124 son la representación de dominio de frecuencia del down-mix estéreo espacial 102 y una señal de control 128. La señal de control 128 determina si el selector 124 es para salir el down-mix artístico 103 o el down-mix espacial 102 como parte de la señal de audio de múltiples canales codificada. El down-mix espacial 102 puede ser seleccionado cuando el down-mix artístico no está disponible. La señal de control 128 puede ser establecida manualmente o puede ser generada automáticamente al detectar la presencia del down-mix artístico 103. La señal de control 128 puede ser incluida en el flujo de bits de manera que un decodificador correspondiente 20 puede hacer uso de éste posteriormente de acuerdo a lo descrito. Así, el codificador ejemplar específico permite que una señal sea generada la cual incluye el down-mix espacial 102 o el down-mix artístico 103. La señal de salida 102, 103 del selector 124 es mostrada como señales lo y ro. Si el down-mix estéreo artístico 127 debe ser una salida del selector 124 las señales de dominio de tiempo segmentadas las y ras son combinadas en el selector 124 por superposición-agregación en señales lo y ro. Si el down-mix estéreo espacial 102 debe ser una salida de acuerdo a lo indicado por la señal de control 128, el selector 124 transforma las señales Lo y Ra de regreso al dominio de tiempo y las combina mediante superposición-agregación en señales lo y ro. Las señales de tiempo-dominio lo y ro forman el down-mix estéreo del codificador 5.1-a-2 10. Una descripción más detallada del generador 123 es proporcionada a continuación. La función del generador 123 es determinar los segundos datos de mejoramiento y específicamente parámetros de modificación que describen una transformación del down-mix artístico 103 de manera que éste, en algún sentido, se asemeje al down-mix espacial original 102. En general, esta transformación puede ser descrita como En donde La y Ra son vectores que comprenden muestras de un mosaico de tiempo/frecuencia del canal izquierdo y derecho del down-mix artístico 103, y en donde Ld y Rd son vectores que comprenden muestras de un mosaico de tiempo/frecuencia del canal izquierdo y derecho del down-mix artístico modificado, en donde Ai,..., AN comprenden las muestras de un mosaico de tiempo/frecuencia de canales auxiliares opcionales, y en donde T es una matriz de transformación. Obsérvese que cualquier vector V está definido como un vector columna. El down-mix artístico modificado es el down-mix artístico 103 que es transformado por la transformación de manera que se asemeja al down-mix espacial original 102. Los canales auxiliares Ai , ..., AN son en el sistema descrito las señales down-mix espaciales o el contenido de baja frecuencia de los mismos. La matriz de transformación (N+2)x2 T describe la transformación desde el down-mix artístico 103 y los canales auxiliares al down-mix artístico modificado. La matriz de transformación T o elementos de la misma preferiblemente están comprendidos en los parámetros de modificación 105 de manera que un decodificador 20 pueda reconstruir por lo menos parte de la matriz de transformación T. A partir de ese momento, el decodificador 20 puede aplicar la matriz de transformación T al down-mix artístico 103 para reconstruir el down-mix espacial 102 (de acuerdo a lo descrito más adelante) . Alternativamente, los parámetros de modificación 105 comprenden propiedades de señales, por ejemplo, valores de energía o potencia y/o valores de correlación, del down-mix espacial 102. El decodificador 20 entonces puede generar tales propiedades de señal a partir del down-mix artístico 103. Las propiedades de señal del down-mix espacial 102 y el down-mix artístico 103 permiten al decodificador 20 construir una matriz de transformación T (descrita más adelante) y aplicarla al down-mix artístico 103 para reconstruir el down-mix espacial 102 (también descrito más adelante) . Específicamente, el generador 123 está arreglado para generar ambos datos de modificación absolutos y relativos y para seleccionar entre estos datos para bloques de señal individuales (o segmentos). Así, los parámetros de modificación 105 para la señal codificada comprenden ambos los datos de modificación absolutos y los datos de modificación relativos para diferentes bloques de señales. En contraste a los datos de modificación absolutos, los datos de modificación relativos describen al down-mix espacial 102 en relación con el down-mix artístico 103. Específicamente, los datos de modificación relativos pueden ser datos diferenciales los cuales permiten que muestras down-mix artístico sean modificadas para corresponder (más estrechamente) a las muestras down-mix espacial mientras que los datos de modificación absolutos pueden corresponder directamente a las muestras down-mix espacial sin alguna referencia o dependencia de las muestras down-mix artísticos. Se deberá apreciar que existen varias maneras de modificar el down-mix estéreo artístico 103 para asemejarse al down-mix estéreo original 102, que incluyen: I. Correspondencia de formas de onda. II. Correspondencia de propiedades estadísticas: a. Correspondencia de la energía o potencia del canal izquierdo y del derecho. b. Correspondencia de la matriz de covarianza del canal izquierdo y derecho. III. Obtener la mejor correspondencia posible de la forma de onda bajo la restricción de una correspondencia de energía o potencia del canal izquierdo y del derecho. IV. Mezclar los métodos mencionados anteriormente I-III. Para propósitos de claridad, los canales auxiliares Ai , ..., Aw de (1) primero no son considerados, de manera que la matriz de transformación T puede ser escrita como y los datos de mejoramiento relativos pueden por ejemplo se generados como sigue: I. Correspondencia de forma de onda (método I) Una correspondencia de las formas de onda del down-mix artístico 103 y el down-mix espacial 102 se puede obtener al expresar ambas la señal izquierda y la derecha del down-mix artístico modificado como una combinación lineal de la señal izquierda y la derecha del down-mix estéreo artístico 103: ^=a.^ + ß.?ß, fi/=oc3¿a + ß2Rß. Entonces la matriz T de (2) puede ser escrita como: Una manera para seleccionar los parámetros ai, a2, ßi y ß2, es minimizar el cuadrado de la distancia Euclidiana entre las señales down-mix espacial Ls y Rs y sus estimaciones (en este caso las señales down-mix artístico modificado L¿ y Rd) < de ahí ?¡R,[k]-a2I1.[k]-hltm[kf . (5) II. Correspondencia de las propiedades estadísticas (método II) Método II. a: ahora se discute la correspondencia de las energías de las señales izquierdas y las derechas. La señal down-mix artístico izquierda y derecha, denotadas por ¿ y R respectivamente, ahora son calculadas como ké = *k =ß?„ (6) en donde, en el caso de parámetros reales, a y ß son dados por de manera que la matriz de transformación T puede ser escrita como Con estas selecciones puede ser asegurado que las señales d y -Rd» respectivamente, tienen la misma energía igual a las señales Ls y Rs ? respectivamente. Método II. b: Para la correspondencia de las matrices de covarianza del down-mix estéreo artístico 103 y el down-mix estéreo espacial 102 estas matrices pueden ser descompuestas con el uso de una descomposición de auto valor como sigue: ca =uasau r, (9) Co - ^O^O^O s en donde la matriz de covarianza del down-mix estéreo artístico 103, Ca, está dada por Ca=[LaRa]"[LaRa]. (10) Ua es una matriz unitaria y Sa es una matriz diagonal. C0 es la matriz de covarianza del down-mix estéreo espacial 102, U0 es una matriz unitaria y S0 es una matriz diagonal. Cuando se calcula x„=[ „*.„] = [ . .Wms:1'2, Oí) se obtienen dos señales mutuamente no correlacionadas Law y Raw (debido a la multiplicación con la matriz Ua) , las señales tienen energía unitaria (debido a la multiplicación -1/2 con la matriz ^ ) . Al calcular: x =Í < R = Í a Ra]Uasl,2u?,2u0", (12) primero la matriz de covarianza de [La Ra] es transformada en una matriz de covarianza S^' U"iguala la matriz identidad, en este caso las matriz de covarianza [La a]UaS~ Aplicando cualquier matriz unitaria arbitraria Ur no cambiará la estructura de covarianza, y aplicando resulta en una estructura de covarianza igual a la del down-mix estéreo espacial 102. Definición de la matriz Sow y las señales Low y Row como sigue: SOW = [ o„B.o = [ sRsW0s: (13) La matriz Ur? puede ser seleccionada de manera que corresponda la mejor forma de onda posible, en términos de la distancia Euclidiana cuadrada mínima, se puede obtener entre las señales L0w y Law y las señales R0w y aw son dados por (11) . Con esta selección para Ur, se puede utilizar una correspondencia de forma de onda en el método estadístico. De (12) se puede observar que la matriz de transformación T está da por III. Mejor correspondencia de forma de onda bajo un restricción de energía (método III) Asumiendo (3) los parámetros al, a2 , ßl y ß2 pueden ser obtenidos al minimizar (4) y (5) bajo las restricciones de energía Conforme se mezclen los diferentes métodos, combinaciones posibles incluyen mezclar los métodos II. a y II.b, o mezclar los métodos II. a y III. Uno puede proceder como sigue: a) Si la correspondencia de forma de onda entre Ls y Ld y entre Rs y R que es obtenida cuando se utiliza el método Il.b/III es buena: utilizar el método Il.b/III. b) Si esta correspondencia de forma de onda es pobre, utilizar el método II. a. c) Asegurar una transición gradual entre los dos métodos, al mezclar sus matrices de transformación, como una función de la calidad de esta correspondencia de forma de onda. Esto se puede expresar matemáticamente como sigue: Utilizando (3) y (2) la matriz de transformación T puede ser escrita en su forma general como Esta matriz se vuelve a escribir con el uso de dos vectores , TL y TR, como sigue La calidad de la correspondencia de forma de onda entre Ls y Ld obtenida utilizando ya sea el método II. b o el método III, es expresado por ?L. Se define como sigue La calidad de la correspondencia de longitud de onda entre Rs y Rd obtenida utilizando ya sea el método II. b o el método III, es expresada por ?R. Se define como Ambos ?L y YR se encuentran entre 0 y 1. El coeficiente mezclado del canal izquierdo, d¿, y el coeficiente mezclado del canal derecho dR l puede ser definido como sigue: en donde son valores entre 0 y 1/ uL,min < \?L,max y \iR,min < \íR,max- La ecuación (20) asegura que los coeficientes mezclados, dL y dR se encuentran entre 0 y 1. Define la matriz de transformación T del método II.a, II.b y III, respectivamente, como Te, el cual es dado por (8), Ta, el cual es dado por (14) , y Tce, respectivamente. Cada matriz de transformación puede ser dividida en dos vectores, similar a la división de T en (17), como sigue: t0 = \ra¡L ta , te = [re,L T , tce = \r^L t^\. (2i) La matriz de transformación T para el método mezclado II. a y el método II. b es obtenida como t = tL tR] = {?>Lta +(?-dL)te d?rtt? + (?-ds)r . (22) La matriz de transformación T para mezclar el método II. a y el método III se obtiene como t = tL r = ld/.z:„,. + (?-dL^,/ d?rfí,s + (?-d?)rJ. (23) Ahora, considerando dos canales auxiliares correspondientes a dos canales de capa de mejoramiento, la Ec. (1) anterior se puede volver a escribir como: En donde La, Ra (igual a lo anterior) contiene las muestras de un mosaico de tiempo/frecuencia del canal izquierdo y derecho del down-mix artístico respectivamente, L , Rd contiene las muestras de un mosaico de tiempo/frecuencia del canal izquierdo y derecho del down-mix artístico modificado respectivamente y los Lenh y Renh contienen las muestras de un mosaico de tiempo/frecuencia de las señales de capa de mejoramiento. La matriz de transformación T' 4x2 de esa manera describe la transformación desde el down-mix artístico y las señales de capa de mejoramiento hacia el down-mix artístico modificado. En relación a la Ec. (1), los solamente dos canales auxiliares utilizados aquí son las señales de capa de mejoramiento Lenh; Ren . En el sistema ejemplar específico, la segunda capa de mejoramiento puede contener dos tipos diferentes de datos: El primer tipo de datos comprende los parámetros contenidos en la matriz T de la Ec. (1) . Estos parámetros son calculados en el ejemplo para el ancho de banda de señal completa y transformar el down-mix estéreo artístico de manera que en algún sentido se asemeja down-mix espacial. Así, este tipo de parámetros puede proporcionar un down-mix artístico modificado el cual se asemeja de manera más cercana al down-mix espacial original pero no (necesariamente) permite a un decodificador generar exactamente el down-mix espacial. Para cada mosaico de tiempo/ frecuencia se requieren solamente cuatro parámetros, es decir se requieren los valores de T (T11,,T12, T21 y T22) . Estos parámetros pueden ser codificados ya sea absolutamente o diferencialmente y el codificador 10 específicamente puede conmutar dinámicamente entre la codificación absoluta y la diferencial.
El segundo tipo de datos corresponde al down-mix espacial real y es en el ejemplo específico una representación de una versión de banda limitada del down-mix espacial. Específicamente, este tipo de datos representa una parte de baja frecuencia del down-mix espacial (por ejemplo, frecuencias menores, por ejemplo, 1.7 kHz). Esto hace posible reconstruir de manera muy precisa esta parte del down-mix espacial en el decodificador más que al generar una señal la cual tiene las mismas, por ejemplo propiedades, estadísticas (como con la matriz T) . Este tipo de datos pueden ser codificados absolutamente o relativamente con respecto al down-mix artístico. Específicamente, este tipo de datos pueden ser codificados diferencialmente. Por ejemplo, la matriz de transformación T es aplicada al down-mix artístico (ver por ejemplo Ec. (26)) y la diferencia de esa señal y el down-mix espacial puede ser codificada. De esa manera, en algunas modalidades los segundos datos de mejoramiento se dividen en una primera y segunda parte de datos de mejoramiento en donde la primera parte describe el down-mix espacial de manera menos precisa que la segunda parte. Típicamente, la transmisión de datos correspondientes de la primera parte de los segundos datos de mejoramiento es menor que la de la segunda parte. Los datos de mejoramiento de la segunda parte de los segundos datos de mejoramiento pueden relacionarse con solamente una parte del down-mix y específicamente pueden solamente relacionarse con una parte de baja frecuencia. En algunas modalidades, el generador 123 puede ser arreglado para seleccionar entre datos de absolutos y relativos para ambas la primera parte y la segunda parte de los segundos datos de mejoramiento ya sea de forma individual o en conjunto. En otras modalidades, el generador 123 puede solamente seleccionar datos absolutos y relativos para una de las partes de datos. Específicamente, en las siguientes modalidades serán descritas en donde la primera parte de los segundos datos de mejoramiento comprende los parámetros de T mientras que la segunda parte comprende una representación de baja frecuencia del down-mix espacial y la selección dinámica entre datos absolutos y relativos es solamente aplicada a la segunda parte de los segundos datos de mejoramiento. Los datos relativos de la segunda parte de los segundos datos de mejoramiento pueden en estas modalidades por ejemplo ser generados como valores diferenciales relativos al down-mix artístico después de que los datos de mejoramiento de la primera parte han sido aplicados (en este caso, como valores diferenciales relativos al down-mix artístico modificado) . En adelante, se describen a continuación las modalidades en donde el generador 123 selecciona solamente entre datos relativos y absolutos para la segunda parte de los segundos datos de mejoramiento.
Los datos de mejoramiento absolutos para la parte de la primera y la segunda parte de los segundos datos de mejoramiento pueden en este ejemplo ser derivados por los mosaicos de tiempo/ frecuencia asociados al establecer: En donde Ls, Rs contienen las muestras de un mosaico de tiempo/ frecuencia del canal izquierdo y derecho del down-mix estéreo espacial respectivamente. Así, en el ejemplo específico, los datos de mejoramiento absolutos corresponden simplemente a las muestras de mosaico de tiempo/frecuencia reales del down-mix espacial 102 el cual reemplaza las muestras de mosaico de tiempo/ frecuencia correspondientes del down-mix artístico 103. Adicionalmente, para la parte de la primera y la segunda parte de los segundos datos de mejoramiento, datos de mejoramiento relativos para los mosaicos de tiempo/ frecuencia asociados pueden específicamente ser derivados como datos diferenciales al establecer: Aquí, los parámetros Tu, Ti2, T2i y T22 constituyen la matriz T de la Ec. (2) : De esta manera, el generador 123 puede generar ambos los datos de mejoramiento absolutos y datos de mejoramiento relativos para el down-mix artístico 103 permitiendo a un decodificador generar un down-mix artístico modificado el cual se asemeja más cercanamente al down-mix espacial 102 utilizado para generar los datos de mejoramiento de múltiples canales. El generador 123 adicionalmente es arreglado para seleccionar entre datos de mejoramiento absolutos y datos de mejoramiento relativos. Esta selección es ejecutada en el ejemplo específico para bloques de señales individuales (por ejemplo segmentos individuales) y basados en características de las señales dentro de estos bloques de señales. Específicamente, el generador 123 puede evaluar características de los datos de mejoramiento absolutos y los datos de mejoramiento relativos para un bloque de señales dado y puede decidir cual dato incluir en la capa de mejoramiento para el bloque de señales dado. Adicionalmente, el generador 123 puede incluir una indicación de cuáles datos fueron seleccionados con ello permitir al decodificador aplicar los datos de mejoramiento recibidos correctamente.
En algunas modalidades, el generador 123 puede evaluar la codificación para determinar si los datos de mejoramiento absolutos o los datos de mejoramiento relativos pueden ser codificados más eficientemente (por ejemplo, con un número menor de bits para una precisión dada) . Puede ser un acercamiento con toda la capacidad de computación para codificar realmente ambos tipos de datos de mejoramiento y comparar el tamaño de datos codificados. Sin embargo, este puede ser un acercamiento complejo en algunas modalidades, y en el codificador ejemplar 10, el generador 123 evalúa la energía de señal de los datos de mejoramiento absolutos en relación con la energía de señal de los datos de mejoramiento relativos y selecciona cual tipo de datos incluir con base en una comparación entre los dos . Específicamente, para los codificadores de audio es benéfico frecuentemente, en términos de la transmisión de datos, codificar una señal con tan poca energía como sea posible. Por consiguiente, el generador 123 selecciona el tipo de datos de mejoramiento el cual tiene la más baja energía de señal. En particular, los datos de mejoramiento relativos se seleccionan cuando \\LS - t - t2lRa( +||?, - tu a - t22Raf <|| f +||*,|2 (28) y de otra manera se seleccionan los datos de mejoramiento absolutos .
Un problema con la conmutación entre diferentes datos de mejoramiento es que pueden resultar algunos artefactos que se pueden notar. En el codificador ejemplar 10, el generador 123 también comprende una funcionalidad para una conmutación gradual entre diferentes datos de mejoramiento. De esa manera, en lugar de conmutar directamente desde un tipo de datos de mejoramiento en un bloque de señales hacia otro tipo en el siguiente bloque de señales, la conmutación es realizada gradualmente desde un conjunto de datos al otro. De esa manera, durante un intervalo de tiempo (el cual puede tener una duración menor o mayor que un bloque de señales) , el generador 123 genera los datos de mejoramiento con una combinación de los datos de mejoramiento absolutos y los datos de mejoramiento relativos. La combinación puede por ejemplo ser alcanzada por una interpolación entre los diferentes tipos de datos o puede usar una técnica de superposición y agregación. Como un ejemplo específico, en lugar de conmutar abruptamente entre diferentes tipos de datos de mejoramiento: mh = , - T\ l a - T2 íRa, ?„? = Rt - T La - ^R^ or Lcl? = L„ ?,nA = RS los datos de mejoramiento los cuales son transmitidos pueden ser generados como * = -*Tu L -aT2l Ra,R„h = Rs -aTl2 L0 - T22Ra , (29) en donde el valor de a para el marco de datos k-avo puede ser determinado como: ímaxíO a -d) si el narco de corriente es codificado absolutamente „ = (30) min(l,at_, +d), si el narco de corriente es codificado diferencialmente en donde a* denota el valor de a en el marco k-avo y d es la velocidad de adaptación. Un valor de d = 0.33 puede proporcionar una codificación libre de artefactos confiable en muchos escenarios. Las señales Lenh y Renh dadas en la Ec. (29) pueden ser obtenidas con el uso de una interpolación de parámetros o de una técnica de superposición agregación y son codificados y agregados al flujo de bits. Adicionalmente, la decisión con respecto a los datos de mejoramiento diferenciales o absolutos está incluida en el flujo de bits, con ello hacer posible para un decodificador derivar el mismo valor para a conforme es utilizado en el codificador. Se deberá apreciar que aun cuando la descripción se enfoca en el uso de modos diferenciales y absolutos con una codificación (intra canales) de cada uno de estos M canales individualmente, otras modalidades pueden usar un acercamiento de codificación diferente. Por ejemplo, para M=2, un paso siguiente puede ser aplicar por ejemplo una codificación M/S (codificación media/lateral, de ahí codificar la suma y la diferencia de señal) cuando se realiza la codificación (ínter- canal) de la señal estéreo. En muchas modalidades esto puede ser conveniente para ambos en el modo diferencial y el absoluto de la codificación (intra canal) de los canales individuales .
Los elementos de la matriz de transformación T' pueden ser valores reales o valores complejos. Estos elementos pueden ser codificados en parámetros de modificación como sigue: los elementos de la matriz de transformación T que son reales y positivos pueden ser cuantificados de manera logarítmica, como los parámetros IID utilizados en el MPEG4 Estéreo Paramétrico. Es posible establecer un límite superior para los valores de los parámetros para evitar una sobre amplificación de señales pequeñas. Este límite superior puede ser ya sea fijo o ser en función de la correlación entre el canal izquierdo y el canal izquierdo artístico generados automáticamente y la correlación entre el canal derecho y el canal derecho artístico generados automáticamente. De los elementos de T' que son complejos, la magnitud puede ser cuantificada utilizando los parámetros IID, y la fase puede ser cuantificada linealmente. Los elementos de T' que son reales y posiblemente negativos pueden ser codificados al tomar el logaritmo del valor absoluto de un elemento, mientras tanto asegurar una distinción entre los valores negativos y positivos. La Figura 6 ilustra un ejemplo del generador 123 de la Figura 5 con mayor detalle. En el ejemplo, el generador 123 comprende un procesador de bloque de señales 145 el cual recibe las mezclas down-mix espacial y artística de dominio de frecuencia 102, 126 y divide la señal en bloques de señales. Cada bloque de señales puede corresponder a un intervalo de tiempo de una duración predeterminada. En algunas modalidades, los bloques de señales pueden ser alternativamente o adicionalmente divididos en el dominio de frecuencia y por ejemplo los subcanales de transformación pueden ser agrupados juntos en diferentes bloques de señales. El procesador de bloques de señales 145 está acoplado a un procesador de datos de miramiento absolutos 146 el cual genera los datos de mejoramiento absolutos para los bloques de señales individuales de acuerdo a lo descrito anteriormente. Adicionalmente, el procesado de bloque de señales 145 está acoplado a un procesador de datos de mejoramiento relativos 147 el cual genera los datos de mejoramiento relativos para los bloques de señales individuales de acuerdo a lo descrito previamente. Los datos de mejoramiento relativos y absolutos se determinan con base en las características de señal dentro del bloque de señales y específicamente, los datos de mejoramiento para un grupo de mosaicos de tiempo/frecuencia dado pueden ser determinados con base en solamente en ese grupo de mosaicos de tiempo/frecuencia. El procesador de datos de mejoramiento absoluto 146 está acoplado a un primer procesador de energía de señal 148 el cual determina la energía de señal de los datos de mejoramiento absolutos en cada bloque de señales de acuerdo a lo descrito previamente. Similarmente, el procesador de datos de mejoramiento relativos 147 está acoplado a un segundo procesador de energía de señal 149 el cual determina la energía de señal de los datos de mejoramiento relativos en cada bloque de señales de acuerdo a lo descrito previamente. El primero y segundo procesadores de energía de señal 148, 149 están acoplados a un procesador de selección 150 el cual para cada bloque de señales selecciona ya sea los datos de mejoramiento absolutos o relativos dependiendo de cual tipo tiene la más baja energía de señal. El procesador de selección 150 es suministrado a un procesador de datos de mejoramiento 151 el cual adicionalmente acoplado al procesador de datos de mejoramiento 146 y el procesador de datos de mejoramiento relativos 147. El procesador de selección 151 recibe una señal de control que indica cual tipo de dato de mejoramiento ha sido seleccionado y por consiguiente genera los datos de mejoramiento de acuerdo a los datos de mejoramiento seleccionados. Adicionalmente, el procesador de selección 151 está arreglado para ejecutar una conmutación gradual que incluye una interpolación entre los parámetros absolutos y relativos durante un intervalo de tiempo de conmutación. El procesador de selección 151 está acoplado a un procesador de codificación 152 el cual codifica los datos de mejoramiento de conformidad con un protocolo dado. En adición, el procesador de codificación 152 codifica los datos que indican cual tipo de datos es seleccionado en cada bloque de señal, por ejemplo al establecer un bit para cada bloque de señal para indicar el tipo de datos. Los datos codificados por el procesador de codificación 152 son incluidos en el flujo de bits codificados generados por el codificador 10. La Figura 7 muestra un diagrama en bloques de otra modalidad de un decodificador de audio de múltiples canales de conformidad con algunas modalidades de la invención el cual específicamente puede ser el decodificador de audio 20 de la Figura 2. El decodificador 20 comprende una primera unidad 210 y acoplada al mismo una segunda unidad 220. La primera unidad 210 recibe señales down-mix lo y ro y parámetros de modificación 105 como entradas. Las entradas pueden por ejemplo ser recibidas como un flujo de bits único desde el codificador 10 de la Figura 1 ó 5. Las señales down-mix lo y ro pueden ser parte de un down-mix espacial 102 o un down-mix artístico 103. La primera unidad 210 comprende una unidad de segmentación y fragmentación 211 y una unidad de modificación down-mix 212. Las señales down-mix lo y ro, respectivamente son segmentadas y las señales segmentadas son transformadas al dominio de frecuencia en la unidad de segmentación y fragmentación 211. Las representaciones de dominio de frecuencia resultantes de las señales down-mix segmentadas son mostradas como señales de dominio de frecuencia Lo y Ro, respectivamente. Posteriormente, las señales de dominio de frecuencia lo y ro son procesadas en la unidad de modificación down-mix 212. La función de esta unidad de modificación down-mix 212 es modificar el down-mix de entrada de manera que se asemeje al down-mix espacial 202, en este caso reconstruir el down-mix espacial 202 a partir del down-mix artístico 103 y los parámetros de modificación 105. Si el down-mix espacial 102 es recibido por el decodificador 20 la unidad de modificación down-mix 212 no tiene que modificar las señales down-mix Lo y Ro y estas señales down-mix Lo y Ro pueden simplemente ser transmitidas en la segunda unidad 220 como señales down-mix Ld y Rd de down-mix espacial 202. Una señal de control 217 puede indicar si existe una necesidad por una modificación del down-mix de entrada, en este caso si el down-mix de entrada es un down-mix espacial o un down-mix alternativo. La señal de control 217 puede ser generada internamente en el decodificador 20, por ejemplo al analizar el down-mix de entrada y los parámetros asociados 105 los cuales pueden describir propiedades de señal del down-mix espacial deseado. Si el down-mix de entrada corresponde a las propiedades de señal deseadas la señal de control 217 puede ser establecida para indicar que no existe una necesidad de una modificación. Alternativamente, la señal de control 217 puede ser establecida manualmente o su configuración puede ser recibida como parte de la señal de audio de múltiples canales codificada, por ejemplo en el conjunto de parámetros 105. Si el decodificador 20 recibe el down-mix artístico 103 y la señal de control 217 indica que las señales down-mix recibidas Lo y Ro deben ser modificadas por la unidad de modificación 212 entonces el decodificador puede operar de dos maneras, dependiendo de la representación de los parámetros de modificación recibidos. Si los parámetros representan la transformación relativa desde el down-mix artístico al down-mix espacial (en este caso si los parámetros son datos de mejoramiento relativos), las variables de transformación son obtenidas directamente al aplicar los parámetros de modificación al down-mix artístico en invertir a la operación ejecutada en el codificador. En diferentes modalidades, esto puede ser aplicado por ejemplo a la segunda parte de los segundos datos de mejoramiento existentes. Por otro lado si los parámetros transmitidos representan propiedades absolutas del down-mix espacial, el decodificador puede reemplazar directamente las muestras down-mix artístico por la muestras down-mix espacial. Por ejemplo, si la segunda parte de los segundos datos de mejoramiento consiste simplemente en las muestras de mosaico de tiempo/frecuencia del down-mix espacial, el decodificador puede reemplazar directamente las muestras de mosaico de tiempo/frecuencia correspondientes del down-mix artístico por estos. Se deberá apreciar que también es posible para el decodificador calcular primero las propiedades correspondientes del down-mix artístico transmitido realmente. Utilizando esta información (parámetros transmitidos y propiedades calculadas del down-mix artístico transmitido) , las variables de transformación entonces son determinadas que describen la transformación desde (propiedades de) el down-mix artístico transmitido a (propiedades de) el down-mix espacial. Para ser más específicos la matriz de transformación T puede ser determinada con el uso de ya sea el método II. a o (uno modificado ligeramente) II.b que fueron descritos previamente.
El método II. a puede ser utilizado si energías absolutas son transmitidas en la primera parte de los segundos datos de mejoramiento. Los parámetros transmitidos (absolutos), ELs y ERs, representan la energía de la señal izquierda y derecha del down-mix espacial respectivamente y son dadas por Las energías del down-mix transmitido, EDLs y EDrs, son calculadas en el decodificador. Utilizando estas variables se pueden calcular los parámetros de a y ß de (7), como sigue La matriz de transformación T está dada por 0 -C (33) ß Específicamente, la unidad de modificación down-mix 212 comprende una funcionalidad para extraer el down-mix artístico y los parámetros de modificación 105 a partir del flujo de bits recibido. El down-mix artístico está dividido en bloques de señales (correspondientes a los bloques de señales utilizados por el decodificador) . Para cada bloque de señal la unidad de modificación down-mix 212 evalúa la indicación de datos recibida del flujo de datos para determinar si se proporcionan segundos datos de mejoramiento relativos o absolutos para la primera y para la segunda parte para este bloque de señales. La unidad de modificación down-mix 212 entonces aplica la primera parte y la segunda parte de los segundos datos de mejoramiento como datos de mejoramiento absolutos o datos de mejoramiento relativos en respuesta a los datos de indicación. Se ha descubierto que se puede alcanzar una baja complejidad pero un alto desempeño cuando los elementos de matriz de transformación T12 y T2i son fijados en cero. A continuación, se describen algunas implementaciones especificas de la unidad de modificación down-mix 212 con esta restricción. Sin embargo, se deberá apreciar que las implementaciones pueden ser ampliadas fácilmente al caso cuando Ti2 y/o Ti son diferentes de cero. En el caso en donde no son transmitidos datos de mejoramiento de la segunda parte de los segundos datos de mejoramiento para la señal de down-mix artístico, la primera unidad 210 puede ser implementada de acuerdo a lo mostrado en la Figura 8. Los canales down-mix estéreo de dominio de tiempo, lo y ro, son primero segmentados y transformados al dominio de frecuencia por una transformación QMF resultando en las señales La y Ra, que representan un mosaico de tiempo/frecuencia del down-mix estéreo artístico. Posteriormente, estas señales son transformadas utilizando la matriz de transformación T, resultando en las señales TnLa y T22Ra. Se deberá apreciar que los datos de mejoramiento pueden ser generados y aplicados en el dominio de tiempo y/o frecuencia. De esa manera, es posible incluir los datos de mejoramiento de dominio de tiempo codificados (Lenh, Renh) en el flujo de bits. Sin embargo, en algunas aplicaciones puede ser conveniente incluir los datos de mejoramiento de dominio de frecuencia codificados en lugar de los datos de mejoramiento de dominio de tiempo. Por ejemplo, en muchos codificadores los datos de mejoramiento son generados en el dominio de frecuencia para los mosaicos de tiempo/frecuencia con el propósito de generar la señal de dominio de tiempo, es requerida en el codificador una frecuencia para la transformación de dominio de tiempo. Adicionalmente, con el propósito de aplicar tales datos de mejoramiento, el decodificador convierte los datos desde el dominio de tiempo al dominio de frecuencia. Las conversiones de dominio de esa manera pueden ser reducidas al incluir los datos de mejoramiento en el dominio de frecuencia. En algunas modalidades, pueden ser utilizadas diferentes conversiones de tiempo a frecuencia para generar el down-mix artístico y los datos de mejoramiento. Por ejemplo, la codificación del down-mix artístico puede utilizar una transformación QMF mientras que los datos de mejoramiento utilizan una transformación MDCT. En este caso, los datos de mejoramiento pueden ser incluidos en el dominio de frecuencia (MDCT) y puede ser realizada directamente una transformación entre los dos dominios de frecuencia por la unidad de modificación down-mix 212 de acuerdo a lo ilustrado en la Figura 9. En el ejemplo, la matriz de transformación T* simplemente puede ser la matriz de transformación T de la Ec. (2). Sin embargo, con el propósito de reducir artefactos de conmutación T* puede corresponder a la matriz de transformación T de la Ec. (2) pero modificada por una conmutación gradual. Específicamente, la matriz T* puede incluir el factor de acuerdo a lo determinado por la Ec. (30), en donde la decisión con respecto a los datos de mejoramiento absolutos o relativos es recuperada del flujo de bits. Este esquema es utilizado para las bandas de frecuencia/bloques de señales en donde los datos de capa de mejoramiento de la segunda parte de los segundos datos de mejoramiento están presentes y de otra manera puede ser utilizado el acercamiento de la Figura 8. Si los datos de mejoramiento (Lenh, Renh) son proporcionados en el dominio de tiempo, puede ser utilizado un acercamiento similar al de la Figura 9 de acuerdo a lo ilustrado en la Figura 10. Sin embargo, en este caso la transformación de frecuencia a frecuencia es reemplazada por una transformación de tiempo a frecuencia lo cual específicamente puede ser por una transformación de dominio tiempo a QMF cuando las transformaciones QMF son utilizadas para codificar el down-mix artístico. De esa manera, en este ejemplo, los datos de mejoramiento son aplicados en el dominio de frecuencia. En muchas modalidades, puede ser utilizada una implementación de decodificador para datos de mejoramiento de dominio de tiempo la cual utiliza solamente una transformación de dominio tiempo a frecuencia en la primera unidad 210. Específicamente, pueden ser utilizados los parámetros de datos de mejoramiento diferenciales siguientes: \ 0 0 1 T - ¡ 0 . 0 1 Siempre que la matriz T, dada por la Ec . (27), no es singular (de ahí que existe su inversa) . Ahora la Ec . (1) puede ser cambiada a: La Figura 11 ilustra una implementación eficiente de la unidad de modificación down-mix 212 para datos de mejoramiento de dominio de tiempo con base en la Ec . (34) y (35) proporcionada. Para mayor claridad, Ti2 y T21 de la matriz T son establecidas en cero. En comparación a la implementación de la Figura 10, solamente se requiere una transformación de dominio de tiempo a QMF por la implementación de la Figura 11.
Así, de acuerdo a lo descrito anteriormente la unidad de modificación down-mix 212 genera una señal 202 la cual se asemeja muy estrechamente al down-mix espacial utilizado para los datos de mejoramiento de múltiples canales. Esto puede ser utilizado eficazmente por la segunda unidad 220 para expandir los dos señales de audio de canal a una señal de múltiples canales de sonido ambiental completa. Adicionalmente, al seleccionar dinámicamente y flexiblemente el tipo más apropiado de datos de mejoramiento (relativos o absolutos) para cada bloque de señales, se alcanza una codificación substancialmente más eficiente y se alcanza una codificación/decodificación de múltiples canales con una calidad mejorada para la velocidad de transmisión de datos .
La segunda unidad 220 puede ser un decodificador de múltiples canales de 2 a 5.1 convencional el cual decodifica el down-mix espacial reconstruido 202 y los datos paramétricos asociados 104 en una señal de salida de 5.1 canales 203. De acuerdo a lo descrito anteriormente, los datos parametritos 104 comprenden datos paramétricos 141, 142 143 y 144. La segunda unidad 220 ejecuta el procesamiento inverso de la primera unidad 110 en el codificador 10. La segunda unidad 220 comprende un mezclador de ascenso 221, el cual convierte el down-mix estéreo 202 y parámetros asociados 144 en tres señales de audio mono L, R y C. Posteriormente, cada una de las señales de audio mono L, R y C, respectivamente, son descorrelacionadas en los descorrelacionadores 222, 225, y 228, respectivamente. A partir de ese momento una matriz mezclada 223 transforma las señal de audio mono L, su contraparte descorrelacionada y parámetros asociados 141 en señales Lf y Lr. De forma similar, una matriz mezclada 226 transforma la señal de audio mono R, su contraparte correlacionada y parámetros asociados 142 en señales Rf y Rr, y una matriz mezclada 229 transforma la señal de audio mono C, su contraparte descorrelacionada y parámetros asociados 143 en señales Co y LFE. Finalmente, los tres pares de señales de dominio de frecuencia segmentadas Lf y Lr, Rf y Rf, Co y LFE, respectivamente, son transformados al dominio de tiempo y combinados por superposición-agregación en transformadores inversos 224, 227 y 230, respectivamente para obtener tres pares de señales de salida lf y lr, rf y rr, y co y lfe, respectivamente. Las señales de salida lf, lr, rf, rr, co y lfe forman la señal de audio de múltiples canales decodificada. El codificador de audio de múltiples canales 10 y el decodificador de audio de múltiples canales 20 pueden ser implementados por medio de equipo físico digital o por medio de un programa computacional el cual es ejecutado por un procesador de señales digital o por un microprocesador de múltiples propósitos. Se deberá apreciar que la descripción anterior para mayor claridad tiene modalidades descritas de la invención con referencia a diferentes unidades y procesadores funcionales. Sin embargo, se deberá apreciar que cualquier distribución apropiada de funcionalidad entre diferentes unidades o procesadores funcionales puede ser utilizada sin ser una detracción de la invención. Por ejemplo, la funcionalidad ilustrada para ser ejecutada por procesadores o controladores separados puede ser ejecutada por los mismos procesadores o controladores. De ahí que, las referencias a unidades funcionales específicas son solamente para ser observadas como referencias a medios apropiados para proporcionar la funcionalidad descrita más que ser un indicativo de un estructura u organización lógica o física estricta.
La invención puede ser implementada en cualquier forma apropiada incluyendo equipo computacional, programas computacionales, micro programas o cualquier combinación de estos. La invención opcionalmente puede ser implementada pro lo menos parcialmente con un programa computacional que se ejecuta en uno o más procesadores de datos y/o procesadores de señales digitales. Los elementos y componentes de una modalidad de la invención pueden ser implementados físicamente, funcionalmente, y lógicamente en cualquier manera apropiada. De hecho la funcionalidad puede ser implementada en una unidad única, en una pluralidad de unidades o como parte de otras unidades funcionales. Como tal, la invención puede ser implementada en una unida única o puede ser distribuida físicamente y funcionalmente entre diferentes unidades y procesadores. Aun cuando la presente invención ha sido descrita en conexión con algunas modalidades, no está previsto que esté limitada por la forma específica establecida aquí. En cambio, el alcance de la presente invención está limitado solamente por las reivindicaciones anexas. Adicionalmente, aun cuando una característica pueda parecer que está descrita en conexión con modalidades particulares, una persona experimentada en la técnica reconocería que varias características de las modalidades descritas pueden ser combinadas de conformidad con la invención. En las reivindicaciones, el término comprende no excluye la presencia de otros elementos o pasos.
Adicionalmente, aun cuando sean listadas individualmente, una pluralidad de medios, elementos o pasos de método pueden ser implementados por, por ejemplo una unidad o procesador único. Adicionalmente, aun cuando las características individuales pueden ser incluidas en reivindicaciones diferentes, estas posiblemente pueden ser convenientemente combinadas, y la inclusión en diferentes reivindicaciones no implica que una combinación de características factible y/o conveniente. También la inclusión de una característica en una categoría de reivindicaciones no implica una limitación a esta categoría sino más bien indica que la característica es igualmente aplicable a otras categorías de reivindicaciones según sea apropiado. Adicionalmente, el orden de las características en las reivindicaciones no implica que algún orden específico en el cual las características deben ser trabajadas y en particular el orden de los pasos individuales en una reivindicación de método no implica que los pasos deben ser ejecutados en ese orden. Más bien, los pasos deben ser ejecutados en cualquier orden apropiado. Adicionalmente, las referencias en singular no excluyen a una pluralidad. De esa forma para "un", "una", "primero", "segundo", etc. no excluyen una pluralidad. Los signos de referencia en las reivindicaciones son proporcionados simplemente como un ejemplo de clarificación, no deberán se interpretados como una limitante del alcance de las reivindicaciones en alguna forma.
Se hace constar que con relación a esta fecha, el mejor método conocido por el solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims (31)

  1. REIVINDICACIONES Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones : 1. Un codificador de audio de múltiples canales para codificar una señal de audio de N-canales, caracterizado porque comprende : un medio para generar una primera señal de M-canales para la señal de audio de N canales, M es menor que N; un medio para generar primeros datos de mejora para la primera señal de M canales en relación con la señal de audio de N canales; un medio para generar una segunda señal de M canales para la señal de audio de N canales; un medio de mejoramiento para generar segundos datos de mejoramiento para la segunda señal de M canales en relación con la primera señal de M canales; un medio para generar una señal de salida codificada que comprende la segunda de M canales, los primeros datos de mejoramiento y los segundos datos de mejoramiento; y en donde el medio de mejoramiento está arreglado para seleccionar dinámicamente entre generar los segundos datos de mejoramiento como datos de mejoramiento absolutos o datos de mejoramiento relacionados con la segunda señal de M canales .
  2. 2. Un codificador de audio de múltiples canales de conformidad con la reivindicación 1, caracterizado porque el medio de mejoramiento está arreglado para seleccionar entre los datos de mejoramiento absolutos y los datos de mejoramiento relativos en respuesta a una característica de la señal de N canales.
  3. 3. Un codificador de audio de múltiples canales de conformidad con la reivindicación 1, caracterizado porque el medio de mejoramiento está arreglado para seleccionar entre los datos de mejoramiento absolutos y los datos de mejoramiento relativos en respuesta a una característica relativa de los datos de mejoramiento absolutos y los datos de mejoramiento relativos.
  4. 4. Un codificador de audio de múltiples canales de conformidad con la reivindicación 1, caracterizado porque la característica relativa es una energía de señal de los datos de mejoramiento absolutos en relación con una energía de señal de los datos de mejoramiento relativos.
  5. 5. Un codificador de audio de múltiples canales de conformidad con la reivindicación 1, caracterizado porque el medio de mejoramiento está arreglado para dividir la segunda señal de M canales en bloques de señal y para seleccionar individualmente entre los datos de mejoramiento absolutos y los datos de mejoramiento relativos para cada bloque de señal .
  6. 6. Un codificador de audio de múltiples canales de conformidad con la reivindicación 5, caracterizado porque el medio de mejoramiento está arreglado para seleccionar entre datos de mejoramiento absolutos y los datos de mejoramiento relativos para un bloque de señales basado solamente en características asociadas con el bloque de señales.
  7. 7. Un codificador de audio de múltiples canales de conformidad con la reivindicación 1, caracterizado porque el medio de mejoramiento está arreglado para generar los datos de mejoramiento como una combinación de los datos de mejoramiento absolutos y los datos de mejoramiento relativos durante un intervalo de conmutación de tiempo de una conmutación entre la generación de los datos de mejoramiento como datos de mejoramiento absolutos y como datos de mejoramiento relativos.
  8. 8. Un codificador de audio de múltiples canales de conformidad con la reivindicación 7, caracterizado porque la combinación comprende una interpolación entre los datos de mejoramiento absolutos y los datos de mejoramiento relativos.
  9. 9. Un codificador de audio de múltiples canales de conformidad con la reivindicación 1, caracterizado porque el medio para generar la señal de salida codificada está arreglado para incluir datos que indican si se utilizan datos de mejoramiento relativo o datos de mejoramiento absoluto.
  10. 10. Un codificador de audio de múltiples canales de conformidad con la reivindicación 1, caracterizado porque los segundos datos de mejoramiento comprenden una primera parte de datos de mejoramiento y una segunda parte de datos de mejoramiento, la segunda parte proporciona una representación de calidad más alta de la primera señal de M canales que la primera parte.
  11. 11. Un codificador de audio de múltiples canales de conformidad con la reivindicación 1, caracterizado porque el medio de mejoramiento está arreglado para seleccionar dinámicamente solo entre generar la segunda parte como datos de mejoramiento absolutos o como datos de mejoramiento relativos .
  12. 12. Un codificador de audio de múltiples canales de conformidad con la reivindicación 10, caracterizado porque el medio de mejoramiento está arreglado para generar datos relativos de la segunda parte en relación con una señal de referencia generada por la aplicación de datos de mejoramiento de la primera parte a la primera señal de M canales.
  13. 13. Un decodificador de audio de múltiples canales para decodificar una señal de audio de N-canales, caracterizado porque comprende: un medio para recibir una señal de audio codificada que comprende : una primera señal de M-canales para la señal de audio de N canales, M es menor que N; primeros datos de mejoramiento para expansión de múltiples canales, los primeros datos de mejoramiento que son relativos a una segunda señal de M canales diferente de la primera señal de M canales; segundos datos de mejoramiento para la primera señal de M canales en relación con la segunda señal de M canales, los segundos datos de mejoramiento que comprende datos de mejoramiento absolutos y datos de mejoramiento relativos en relación con la primera señal de M canales, y datos de indicación indicativos de si los segundos datos de mejoramiento para un bloque de señales son datos de mejoramiento absolutos o datos de mejoramiento relativos; un medio de generación para generar una señal expansión de M-canales múltiples-canales en respuesta a la primera señal de M canales y los segundos datos de mejoramiento; y un medio para generar una señal de N canales decodificada en respuesta a la señal de expansión de M-canales múltiples-canales y los primeros datos de me oramiento; y en donde el medio de generación está arreglado para seleccionar entre aplicar los segundos datos de mejoramiento como datos de mejoramiento absolutos o datos de mejoramiento relativos en respuesta a los datos de indicación.
  14. 14. Un decodificador de audio de múltiples canales de conformidad con la reivindicación 13, caracterizado porque el medio de generación está arreglado para aplicar los segundos datos de mejoramiento a la primera señal de M canales en el dominio de tiempo.
  15. 15. Un decodificador de audio de múltiples canales de conformidad con la reivindicación 13, caracterizado porque el medio de generación está arreglado para aplicar los segundos datos de mejoramiento a la primera señal de M canales en el dominio de frecuencia.
  16. 16. Un decodificador de audio de múltiples canales de conformidad con la reivindicación 13, caracterizado porque los segundos datos de mejoramiento comprenden una primera parte de datos de mejoramiento y una segunda parte de datos de mejoramiento, la segunda parte proporciona una representación de más alta calidad de la primera señal de M canales que la primera parte.
  17. 17. Un decodificador de audio de múltiples canales de conformidad con la reivindicación 13, caracterizado porque el medio de generación está arreglado para solamente seleccionar entre aplicar segundos datos de mejoramiento de la segunda parte como datos de mejoramiento absolutos o datos de mejoramiento relativos.
  18. 18. Un decodificador de audio de múltiples canales de conformidad con la reivindicación 13, caracterizado porque el medio de generación está arreglado para generar la expansión de M-canales múltiples-canales al aplicar datos de mejoramiento relativos de la segunda parte a una señal generada al aplicar datos de mejoramiento de la primera parte a la primera señal de M canales .
  19. 19. Un método para codificar una señal de audio de N canales, caracterizado porque comprende: generar una primera señal de M canales para la señal de audio de N canales, M es menor que regenerar primeros datos de mejoramiento para la primera señal de M canales en relación con la señal de audio de N canales, generar una segunda señal de M canales para la señal de audio de N canales; generar segundos datos de mejoramiento para la segunda señal de M canales en relación con la primera señal de M canales; generar una señal de salida codificada que comprende la segunda señal de M canales, los primeros datos de mejoramiento y los segundos datos de mejoramiento; y en donde la generación de los segundos datos de mejoramiento comprende seleccionar dinámicamente entre generar los segundos datos de mejoramiento como datos de mejoramiento absolutos o como datos de mejoramiento relativos en relación con la segunda señal de M canales.
  20. 20. Un método para decodificar una señal de audio de N canales, caracterizado porque comprende: recibir una señal de audio codificada que comprende: una primera señal de M canales para la señal de audio de N canales, M es menor que N, primeros datos de mejoramiento para expansión de múltiples canales, los primeros datos de mejoramiento son relativos a una segunda señal de M canales diferente de la primera señal de M canales; segundos datos de mejoramiento para la primera señal de M canales relativa a la segunda señal de M canales, los segundos datos de mejoramiento comprenden datos de mejoramiento absolutos y datos de mejoramiento relativos en relación a la primera señal de M canales, y datos de indicación indicativos de si los segundos datos de mejoramiento para un bloque de señal son datos de mejoramiento absolutos o datos de mejoramiento relativos; generar una señal de expansión de M-canales de múltiples-canales en respuesta a la primera señal de M canales y los segundos datos de mejoramiento; y generar una señal decodificada de N canales en respuesta a la señal de expansión de M-canales de múltiples-canales y los primeros datos de mejoramiento; y en donde la generación de la señal de expansión de M-canales de múltiples-canales comprende seleccionar entre aplicar los segundos datos de mejoramiento como datos de mejoramiento absolutos o datos de mejoramiento relativos en respuesta a los datos de indicación.
  21. 21. Una señal de audio de múltiples canales codificada para una señal de audio de N canales caracterizada porque comprende : datos de señal de M canales para la señal de audio de N canales, M es menor que N; primeros datos de mejoramiento para expansión de múltiples canales, los primeros datos de mejoramiento son relativos a una segunda señal de M canales diferente de la primera señal de M canales; segundos datos de mejoramiento para la primera señal de M canales relativa a la segunda señal de M canales, los segundos datos de mejoramiento comprenden datos de mejoramiento absolutos y datos de mejoramiento relativos en relación con la primera señal de M canales; y datos de indicación indicativos de si los segundos datos de mejoramiento para un bloque de señales son datos de mejoramiento absolutos o datos de mejoramiento relativos.
  22. 22. Un medio de almacenamiento caracterizado porque tiene almacenada en el mismo una señal de conformidad con la reivindicación 21.
  23. 23. Un transmisor para transmitir una señal de audio de múltiples canales codificada, caracterizado porque comprende un codificador de audio de múltiples canales de conformidad con la reivindicación 1.
  24. 24. Un receptor para recibir una señal de audio de múltiples canales, caracterizado porque comprende un decodificador de audio de múltiples canales de conformidad con la reivindicación 13.
  25. 25. Un sistema de transmisión caracterizado porque comprende un transmisor para transmitir una señal de audio de múltiples canales codificada a través de un canal de transmisión hacia un receptor, el transmisor comprende un codificador de audio de múltiples canales de conformidad con la reivindicación 1 y el receptor comprende un decodificador de audio de múltiples canales de conformidad con la reivindicación 13.
  26. 26. Un método para transmitir una señal de audio de múltiples canales codificada, caracterizado porque comprende codificar una señal de audio de N canales, en donde la codificación comprende: generar una primera señal de M canales para la señal de audio de N canales, M es menor que N, generar primeros datos de mejoramiento para la primera señal de M canales relativas a la señal de audio de N canales; generar una segunda señal de M canales para la señal de audio de N canales; generar segundos datos de mejoramiento para la segunda señal de M canales relativa a la primera señal de M canales; generar una señal de salida codificada que comprende la segunda señal de M canales, los primeros datos de mejoramiento y los segundos datos de mejoramiento; y en donde la generación de los segundos datos de mejoramiento comprende seleccionar dinámicamente entre generar los segundos datos de mejoramiento como datos de mejoramiento absolutos o como datos de mejoramiento relativos en relación con la segunda señal de M canales.
  27. 27. Un método para recibir una señal de audio de múltiples canales codificada, caracterizado porque comprende decodificar la señal de múltiples canales codificada, la decodificación comprende: recibir la señal de audio de múltiples canales codificada que comprende : una primera señal de M canales para la señal de audio de N canales, M es menor que N, primeros datos de mejoramiento para expansión de múltiples canales, los primeros datos de mejoramiento son relativos a una segunda señal de M canales diferente que la primera señal de M canales; segundos datos de mejoramiento para la primera señal de M canales relativa a la segunda señal de M canales, los segundos datos de mejoramiento comprenden datos de mejoramiento absolutos y datos de mejoramiento relativos en relación con la primera señal de M canales, y datos de indicación indicativos de si los segundos datos de mejoramiento para un bloque de señales son datos de mejoramiento absolutos o datos de mejoramiento relativos; generar una señal de expansión de M-canales de múltiples-canales en respuesta a la primera señal de M canales y los segundos datos de mejoramiento; y generar una señal de N canales decodificada en respuesta a la señal de expansión de M-canales de múltiples-canales y los primeros datos de mejoramiento; y en donde la generación de la señal de expansión de M-canales de múltiples-canales comprende seleccionar entre aplicar los segundos datos de mejoramiento como datos de mejoramiento absolutos o datos de mejoramiento relativos en respuesta a los datos de indicación.
  28. 28. Un método para transmitir y recibir una señal de audio, caracterizado porque comprende: codificar una señal de audio de N canales, en donde la codificación comprende: generar una primera señal de M canales para la señal de audio de N canales, M es menor que N, generar primeros datos de mejoramiento para la primera señal de M canales relativos a la señal de audio de N canales, generar una segunda señal de M canales para la señal de audio de N canales, generar segundos datos de mejoramiento para la segunda señal de M canales relativos a la primera señal de M canales, la generación de los segundos datos de mejoramiento comprende seleccionar dinámicamente entre generar los segundos datos de mejoramiento como datos de mejoramiento absolutos o como datos de datos de mejoramiento relativos en relación con la segunda señal de M canales, generar una señal de salida codificada que comprende la segunda señal de M canales, los primeros datos de mejoramiento y los segundos datos de mejoramiento; transmitir la señal de salida codificada desde un transmisor hacia un receptor; recibir, en el receptor, la señal de salida codificada; decodificar la señal de salida codificada en donde la decodificación comprende: generar una señal de expansión de M-canales de múltiples-canales en respuesta a la segunda señal de M canales y los segundos datos de mejoramiento, la generación de la señal de expansión de M-canales de múltiples-canales comprende seleccionar entre aplicar los segundos datos de mejoramiento como datos de mejoramiento absolutos o datos de mejoramiento relativos, y generar una señal decodificada de N canales en respuesta a la señal de expansión de M-canales de múltiples-canales y los primeros datos de me oramiento.
  29. 29. Un producto operativo de programa computacional caracterizado porque provoca que un procesador ejecute los pasos del método de conformidad con cualquiera de las reivindicaciones 19, 20 , 26, 27 y 28.
  30. 30. Una grabadora de audio de múltiples canales caracterizada porque comprende un codificador de audio de múltiples canales de conformidad con la reivindicación 1.
  31. 31. Un reproductor de audio de múltiples canales caracterizado porque comprende un decodificador de audio de múltiples canales de conformidad con la reivindicación 13.
MX2007011995A 2005-03-30 2006-03-16 Codificacion y decodificacion de audio. MX2007011995A (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP05102515 2005-03-30
EP05103085 2005-04-18
EP06100245 2006-01-11
PCT/IB2006/050826 WO2006103586A1 (en) 2005-03-30 2006-03-16 Audio encoding and decoding

Publications (1)

Publication Number Publication Date
MX2007011995A true MX2007011995A (es) 2007-12-07

Family

ID=36607294

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2007011995A MX2007011995A (es) 2005-03-30 2006-03-16 Codificacion y decodificacion de audio.

Country Status (11)

Country Link
US (1) US7840411B2 (es)
EP (1) EP1866913B1 (es)
JP (1) JP5106383B2 (es)
KR (2) KR101346120B1 (es)
CN (2) CN101151660B (es)
AT (1) ATE406651T1 (es)
BR (1) BRPI0608756B1 (es)
DE (1) DE602006002501D1 (es)
ES (1) ES2313646T3 (es)
MX (1) MX2007011995A (es)
WO (1) WO2006103586A1 (es)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006035705A1 (ja) * 2004-09-28 2006-04-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
CN101167124B (zh) * 2005-04-28 2011-09-21 松下电器产业株式会社 语音编码装置和语音编码方法
RU2007139784A (ru) * 2005-04-28 2009-05-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Устройство кодирования звука и способ кодирования звука
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
CN101589623B (zh) * 2006-12-12 2013-03-13 弗劳恩霍夫应用研究促进协会 对表示时域数据流的数据段进行编码和解码的编码器、解码器以及方法
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
CN101809656B (zh) * 2008-07-29 2013-03-13 松下电器产业株式会社 音响编码装置、音响解码装置、音响编码解码装置及会议***
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
EP2578000A1 (en) * 2010-06-02 2013-04-10 Koninklijke Philips Electronics N.V. System and method for sound processing
DK2691951T3 (en) 2011-03-28 2016-11-14 Dolby Laboratories Licensing Corp TRANSFORMATION WITH REDUCED COMPLEXITY OF AN Low-Frequency
CN102802112B (zh) * 2011-05-24 2014-08-13 鸿富锦精密工业(深圳)有限公司 具有音频文件格式转换功能的电子装置
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830333A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
EP2830052A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
CN103413553B (zh) 2013-08-20 2016-03-09 腾讯科技(深圳)有限公司 音频编码方法、音频解码方法、编码端、解码端和***
US9067135B2 (en) * 2013-10-07 2015-06-30 Voyetra Turtle Beach, Inc. Method and system for dynamic control of game audio based on audio analysis
EP2879408A1 (en) * 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
CN105206278A (zh) * 2014-06-23 2015-12-30 张军 一种基于流水线的三维音频编码加速方法
CN106576211B (zh) * 2014-09-01 2019-02-15 索尼半导体解决方案公司 音频处理装置
BR112021025420A2 (pt) * 2019-07-08 2022-02-01 Voiceage Corp Método e sistema para codificar metadados em fluxos de áudio e para adaptação de taxa de bits intraobjeto e interobjeto flexível

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
US5946352A (en) * 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
CN1705980A (zh) * 2002-02-18 2005-12-07 皇家飞利浦电子股份有限公司 参数音频编码
BRPI0308691B1 (pt) * 2002-04-10 2018-06-19 Koninklijke Philips N.V. “Métodos para codificar um sinal de canal múltiplo e para decodificar informação de sinal de canal múltiplo, e arranjos para codificar e decodificar um sinal de canal múltiplo”
JP4322207B2 (ja) * 2002-07-12 2009-08-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化方法
KR100528325B1 (ko) * 2002-12-18 2005-11-15 삼성전자주식회사 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
CN1985544B (zh) * 2004-07-14 2010-10-13 皇家飞利浦电子股份有限公司 处理立体声下混合信号的方法、装置、编译码器和***
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme

Also Published As

Publication number Publication date
ATE406651T1 (de) 2008-09-15
CN101151658B (zh) 2011-07-06
ES2313646T3 (es) 2009-03-01
WO2006103586A1 (en) 2006-10-05
CN101151660A (zh) 2008-03-26
KR20070116174A (ko) 2007-12-06
KR20130079627A (ko) 2013-07-10
KR101346120B1 (ko) 2014-01-02
US20100153118A1 (en) 2010-06-17
BRPI0608756B1 (pt) 2019-06-04
EP1866913B1 (en) 2008-08-27
JP5106383B2 (ja) 2012-12-26
BRPI0608756A2 (pt) 2011-03-15
DE602006002501D1 (de) 2008-10-09
US7840411B2 (en) 2010-11-23
CN101151658A (zh) 2008-03-26
CN101151660B (zh) 2011-10-19
JP2008535015A (ja) 2008-08-28
EP1866913A1 (en) 2007-12-19

Similar Documents

Publication Publication Date Title
MX2007011995A (es) Codificacion y decodificacion de audio.
RU2411594C2 (ru) Кодирование и декодирование аудио
US10433091B2 (en) Compatible multi-channel coding-decoding
JP4685925B2 (ja) 適応残差オーディオ符号化
KR100947013B1 (ko) 멀티채널 오디오 신호의 시간적 및 공간적 정형
RU2367033C2 (ru) Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией
JP4772279B2 (ja) オーディオ信号のマルチチャネル/キュー符号化/復号化
TWI393119B (zh) 多通道編碼器、編碼方法、電腦程式產品及多通道解碼器
TWI413108B (zh) 音訊解碼器、接收機與傳輸系統、音訊解碼方法、用於發射及接收音訊信號之方法及相關電腦程式產品與音訊播放裝置
CN109448741B (zh) 一种3d音频编码、解码方法及装置
CN110660401B (zh) 一种基于高低频域分辨率切换的音频对象编解码方法

Legal Events

Date Code Title Description
FG Grant or registration