MX2008012439A - Metodo de codificacion y decodificacion de señal de audio basada en objetos y aparato para lo mismo. - Google Patents

Metodo de codificacion y decodificacion de señal de audio basada en objetos y aparato para lo mismo.

Info

Publication number
MX2008012439A
MX2008012439A MX2008012439A MX2008012439A MX2008012439A MX 2008012439 A MX2008012439 A MX 2008012439A MX 2008012439 A MX2008012439 A MX 2008012439A MX 2008012439 A MX2008012439 A MX 2008012439A MX 2008012439 A MX2008012439 A MX 2008012439A
Authority
MX
Mexico
Prior art keywords
audio
signal
audio signal
encoded
vocal
Prior art date
Application number
MX2008012439A
Other languages
English (en)
Inventor
Hee Suk Pang
Dong Soo Kim
Jae Hyun Lim
Sung Yong Yoon
Hyun Kook Lee
Original Assignee
Lg Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lg Electronics Inc filed Critical Lg Electronics Inc
Publication of MX2008012439A publication Critical patent/MX2008012439A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

La presente invención se refiere a un método y aparato para codificar y decodificar señales de audio basadas en objetos. Este método de decodificación de audio incluye extraer una primera señal de audio y un primer parámetro de audio en la cual se codifica un objeto de música sobre una base de canal y una segunda señal de audio y un segundo parámetro de audio en la cual un objeto vocal se codifica sobre una base de objeto, de una señal de audio, generando una tercera señal de audio empleando por lo menos una de las primera y segunda señales de audio y genera una señal de audio de múltiples canales empleando por lo menos uno de los primero y segundo parámetros de audio y la tercera señal de audio. Consecuentemente, la cantidad de calcula para proceso de codificación y decodificación y se puede reducir eficientemente el tamaño de una corriente e bits que se codifica.

Description

MÉTODO DE CODIFICACIÓN Y DECODIFICACIÓN DE SEÑAL DE AUDIO BASADA EN OBJETOS Y APARATO PARA LO MISMO Campo Técnico La presente invención se refiere a un método de codificación y decodificación de audio y aparato para codificar y decodificar señales de audio basadas en objetos de manera que las señales de audio pueden procesarse a través de la agrupación eficiente.
Técnica Anterior En general, un codee de audio basado en objetos emplea un método para enviar la suma de un parámetro especifico extraído de cada señal de objeto y las señales de objetos, restaurando las señales de objetos respectivas de los mismos y mezclando tantas señales de objetos como cierto número deseado de canales. Por lo tanto, cuando es grande el número de señales de objetos, la cantidad de información necesaria para mezclar señales de objetos respectivas se incrementa en proporción al número de las señales de objetos. Sin embargo, en las señales de objetos que tienen una correlación estrecha, la información de mezclado similar y así sucesivamente, se envían con respecto a cada señal de objeto. Consecuentemente, si las señales de objetos se empaquetan en un grupo y la misma información se envía solo una vez, se puede mejorar eficientemente. Aún en un método de codificación y decodificación general, un efecto similar puede obtenerse empaquetando varias señales de objetos en la señal de objetos. Sin embargo, si se usa este método, la unidad de la señal de objeto se incrementa y también es imposible mezclar la señal de objetos como una unidad de señal de objetos original antes de empaquetarlas.
Descripción de la Invención Problema Técnico Consecuentemente, un objeto de la presente invención es proveer un método de codificación y decodificación de audio para codificar y decodificar señales de objetos, en las cuales las señales de audio de objetos con una asociación de empaque en un grupo y por lo tanto pueden procesarse sobre una base por grupo y un aparato para lo mismo .
Solución Técnica Para lograr el objeto anterior, un método de decodificación de señal de audio de acuerdo con la presente invención incluye los pasos de extraer una primera señal de audio y una primer parámetro de audio en el cual se codifica un objeto de música sobre una base de canales y una segunda señal de audio y un segundo parámetro de audio en el cual se codifica un objeto vocal sobre una base de objeto de una señal de audio; generando una tercera señal de audio empleando por lo menos una de las primera y segunda señales de audio y generando una señal de audio de múltiples canales empleando por lo menos uno de los primero y segundo parámetros de audio y la tercera señal de audio. Además, para lograr el objetivo anterior, un método de decodificación de audio de acuerdo con la presente invención incluye los pasos de recibir una señal de mezclado descendente, extrayendo una primera señal de audio en la cual se codifica un objeto de música incluyendo un objeto vocal y una segunda señal de audio en la cual se codifica un objeto vocal, de la señal mixta descendente, y generando cualquiera de una señal de audio incluyendo solo el objeto vocal, una señal de audio comprendiendo el objeto vocal, y una señal de audio que no incluye el objeto vocal basado en las primera y segunda señales de audio. Mientras, un aparato de decodificación de señal de audio de acuerdo con la presente invención incluye un multiplexor para extraer una señal de mezcla descendente e información lateral de una corriente de bits recibida, un decodificador de objetos para generar una tercera señal de audio empleando por lo menos uno de una primera señal de audio en la cual un objeto de música extraído de la señal de mezcla descendente se codifica sobre una base de canal y una segunda señal de audio en la cual se extrae un objeto vocal extraído de la señal mixta descendente se codifica sobre una base de objeto, y un decodificador de múltiples canales para generar una señal de audio de múltiples canales empleando por lo menos uno de un primer parámetro de audio y un segundo parámetro de audio extraído de la información lateral, y la tercera señal de audio. Además, un aparato de decodificación de audio de acuerdo con la presente invención incluye un decodificador de objetos para generar cualquiera de una señal de audio incluyendo solo un objeto vocal, una señal de audio comprendiendo el objeto vocal, y una señal de audio que no incluye el objeto vocal basado en una primera señal de audio en la cual un objeto de música extraído de una señal mixta descendente se codifica y una segunda señal de audio en la cual un objeto vocal extraída de la señal mixta descendente se codifica, y un decodificador de múltiples canales para generar una señal de audio de múltiples canales empelado una salida de señales del decodificador de objetos. Además, el método de decodificación de audio de acuerdo con la presente invención incluye los pasos de generar una primera señal de audio en la cual se codifica un objeto de música sobre una base de canal, y un primer parámetro de audio que corresponde al objeto musical, generando una segunda señal de audio en la cual se codifica un objeto vocal sobre una base de objetos, y un segundo parámetro de audio que corresponde al objeto vocal y que genera una corriente de bits incluyendo las primera y segunda señales de audio y los primero y segundo parámetros de audio. De acuerdo con la presente invención, se provee un aparato de codificación de audio que incluye un codificador de múltiples canales para generar una primera señal de audio en la cual se codifica un objeto de música sobre una base de canales y un primer parámetro de audio basado en canales con respecto al objeto de música, un codificador de objetos para generar una segunda señal de audio en lea cual se codifica un objeto vocal sobre una base de objeto, y un segundo parámetro de audio basado en objetos con respecto al objeto vocal y un multiplexor para generar una corriente de bits incluyendo las primera y segunda señales de audio, y los primero y segundo parámetros de audio. Para logar el objeto anterior, la presente invención provee un medio de grabación que puede leerse en computadora en el cual se registra un programa para ejecutar el método anterior en una computadora.
Efectos Ventajosos De acuerdo con la presente invención, las señales de audio de objeto con una asociación se pueden procesar sobre una base de grupo mientras que utiliza las ventajas para codificar y decodificar las señales de audio basadas en objetos al mayor grado posible. Consecuentemente, se pueden mejorar la eficiencia en términos de la cantidad de cálculo en los proceso de codificación y decodificación, el tamaño de una corriente de bits que se codifican, y asi sucesivamente. Además, la presente invención se puede aplicar a un sistema de karaoke, etc., de manera útil mediante la agrupación de señas de objetos en un objeto de música, un objeto vocal, etc .
Breve Descripción de los Dibujos La Fig. 1 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una primera modalidad de la presente invención, La Fig. 2 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una segunda modalidad de la presente invención, La Fig. 3 es una vista que ilustra una correlación entre una fuente de sonido, grupos y señales de objetos; La Fig. 4 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una tercera modalidad de la presente invención; Las Figs. 5 y 6 son vistas que lustran un objeto principal y un objeto de fondo; Las Figs. 7 y 8 son vistas que ilustran una configuración de una corriente de bits generada en el aparato de codificación; La Fig. 9 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una cuarta modalidad de la presente invención; La Fig. 10 es una vista que ilustra una caja en donde se usa una pluralidad de objetos principales; La Fig. 11 es un diagrama de bloque de un aparato de codificación y decodificación de audio de acuerdo con una quinta modalidad de la presente invención; La Fig. 12 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una sexta modalidad de la presente invención; La Fig. 13 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una séptima modalidad de la presente invención; La Fig. 14 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una octava modalidad de la presente invención; La Fig. 15 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una novena modalidad de la presente invención; y La Fig. 16 es una vista que ilustra la caja en donde se codifican paso por paso los objetos vocales.
Mejor Modo para Llevar a Cabo la Invención La presente invención será descrita ahora en detalle con referencia a los dibujos anexos. La Fig. 1 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una primera modalidad de la presente invención. El aparato de codificación y decodificación de audio de acuerdo con la presente modalidad decodifica y decodifica una señal de objetos que corresponde a una señal de audio basada en objetos sobre la base de un concepto de agrupación. En otras palabras, se llevan a cabo un proceso de codificación y decodificación sobre una base por grupo uniendo una o más señales de objetos con una asociación en el mismo grupo. Haciendo referencia a la Fig. 1, se muestra un aparato de codificación de audio 110 incluyendo un codificador de objetos 111, y un aparato de decodificación de audio 120 incluyendo un decodificador de objetos 121 y una mezcladora/procesador 123. Aunque no se muestra en el dibujo, el aparato de codificación 110 puede incluir un multiplexor, etc. para generar una corriente de bits en la cual se combinan una señal de mezclado descendente e información lateral, y el aparato de decodificación 120 puede incluir un desmultiplexor, etc. para extraer una señal de mezcla descendente e información lateral de una corriente de bits recibida. Esta construcción es la caja, con el aparato de codificación y decodificación de acuerdo con otras modalidades que se describen más adelante. El aparato de codificación 110 recibe señales de objetos N e información de grupos que incluyen información de posición relativa, información de tamaño, información de registros de tiempo, etc., sobre una base por grupo, de la señal de objetos con una asociación. El aparato de codificación 110 codifica una señal en la cual se agrupan las señales de objetos con una asociación, y genera una señal de mezclado descendente basado en objetos que tienen uno o más canales e información lateral, incluyendo información extraída de cada señal de objeto, etc. En el aparato de decodificación 120, el decodificador de objetos 121 genera señales que se codifican sobre la base de agrupación, basado en la señal de mezclado descendente y la información lateral, y el mezclador/procesador 123 coloca las señales fuera del decodificador de objetos 121 en posiciones específicas sobre un espacio de múltiples canales a un nivel específico basado en la información de control. Es decir, el aparato de decodificación 120 genera señales de múltiples canales sin señales no empacadas que se codifican sobre la base de agrupación sobre una base por objeto. A través de esta construcción, la cantidad de información que será transmitida puede reducirse agrupando y codificando señales de objetos que tienen cambio se posición similar, cambio de tamaño, cambio de retardo, etc., de acuerdo con el tiempo. Además, si se agrupan las señas de objetos, se puede transmitir la información lateral común con respecto a un grupo, por lo que varias señales de objetos que pertenecen al mismo grupo pueden controlarse fácilmente. La Fig. 2 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una segunda modalidad de la presente invención. Un aparato de decodificación de señal de audio 140 de acuerdo con la presente modalidad es diferente de la primera modalidad en cuanto a que incluye además un extractor de objetos 143. En otras palabras, el aparato de codificación 130, el decodificador de objetos 141, y la mezcladora/procesador 145 tiene la misma función y construcciones que aquellas de la primera modalidad. Sin embargo, dado que el aparato de decodificación 140 además incluye el extractor de objetos 143, puede desempaquetarse un grupo al cual pertenece una señal de objetos sobre una base de objetos cuando es necesario que se desempaquete una unidad de objetos. En este caso, todos los grupos no se desempaqueten sobre una base por objetos, pero las señales de objetos pueden extraerse con respecto únicamente a grupos en los cuales no puede llevarse a cabo el mezclado de cada grupo, etc. La Fig. 3 es una vista que ilustra una correlación entre una fuente de sonidos, grupos y señales de objetos.
Como se muestra en la fig. 3, las señales de objetos que tienen una propiedad similar se agrupan de manera que puede reducirse el tamaño de una corriente de bits y todas las señales de objetos pertenece a un grupo superior. La Fig. 4 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una tercera modalidad de la presente invención. En el aparato de codificación y decodificación de audio de acuerdo con la presente modalidad, se usa el concepto de un canal de mezclado descendente de núcleo. Haciendo referencia a la Fig. 4, se muestra un codificador de objetos 151 que pertenece a un aparato de codificación de audio y un aparato de decodificación de audio 160 que incluye un decodificador de objetos 161 y una mezcladora/creadora de imágenes 163. El codificador de objetos 151 recibe señales de objetos N (N>1) y genera señales que se mezclan descendentemente sobre canales M (1>M>N). En el aparato de decodificación 160, el decodificador de objetos 161 decodifica las señales que se han mezclado descendentemente sobre los canales M, en señales de objetos N de nuevo y la mezcladora/productora 163 finalmente da señales de canal L (L>1) . En este momento, los canales de mezclado descendente M generados por el codificador de objetos 151 comprende canales de mezclado descendente de núcleo K (K<M) y canales de mezclado descendente sin núcleo M-K. La razón por la cual se construyen canales de mezclado descendente como se describió antes es que la importancia del mismo puede cambiar de acuerdo con una señal de objeto. En otras palabras, un método de codificación y decodificación general no tiene una resolución suficiente con respecto a una señal de objeto y por lo tanto puede incluir los componentes de otras señales de objetos sobre una base de señal por objeto. Por lo tanto, si se comprenden canales de mezclado descendente de los canales de mezclado descendente de núcleo y los canales de mezclado descendente sin núcleo como se describió antes, se puede reducir la interferencia entre las señales de objetos. En este caso, el canal de mezcla descendente puede usar un método de proceso diferente al del canal de mezcla descendente sin núcleo. Por ejemplo, en la Fig. 4, la entrada de información lateral a la mezcladora/procesador 163 puede definirse únicamente en el canal de mezclado descendente. En otras palabras, la mezcladora/procesador 163 puede configurarse para controlar cualesquiera señales de objetos decodificadas del canal de mezclado descendente sin señales de objetos decodificadas del canal de mezclado descendente sin núcleo. Como otro ejemplo, el canal de mezclado descendente de núcleo se puede construir únicamente de un pequeño grupo de señales de objetos, y las señales de objetos se agrupan y se controlan con base en la información de control. Por ejemplo, un canal de mezclado descendente de núcleo adicional puede construirse únicamente de señales vocales con el fin de construir un sistema de karaoke. Además, se puede construir un canal de mezclado descendente de núcleo adicional agrupando solo señales de un tambor, etc., de manera que la intensidad de una señal de baja frecuencia, tal como una señal de tambor, puede controlarse con precisión. Mientras, la música se genera generalmente mezclando varias señales de audio que tienen la forma de una pista, etc. por ejemplo, en el caos de música comprendida de tambor, guitarra, piano y señales vocales, cada uno del tambor, guitarra, piano y señales vocales pueden convertirse en una señal de objetos. En este caso, una de las señales de objetos totales, que se determina que es especialmente importante y se puede controlar por un usuario, o un número de señales de objetos, que se mezclan y controlan como una señal de objetos, se puede definir como un objeto principal. Además, una mezcla de señales de objetos diferentes al objeto principal de las señales de objetos totales puede definirse como un objeto de fondo. De acuerdo con esta definición, puede ser tal que un objeto total o un objeto de música consiste del objeto principal y el objeto de fondo. Las Figs. 5 y 6 son vistas que ilustran el objeto principal y el objeto de fondo. Como se muestra en la fig. 5a, suponiendo que el objeto principal es sonido vocal y el objeto de fondo es la mezcla de sonidos de todos los instrumentos musicales diferentes al sonido vocal, un objeto musical puede incluir un objeto vocal y un objeto de fondo del sonido mezclado de los instrumentos musicales diferentes al sonido vocal. El número del objeto principal puede ser uno o más, como se muestra en la Fig. 5b. Además, el objeto principal puede tener una forma en la cual varias señales de objetos se mezclan. Por ejemplo, como se muestra en la Fig. 6, el mezclado de sonido vocal y de guitarra puede usarse como los objetos principales y los sonidos de los instrumentos musicales restantes pueden usarse como los objetos de fondo. Con el fin de controlar por separado el objeto principal y el objeto de fondo en el objeto de música, la corriente de bits codificada en el aparato de codificación deberá tener uno de los formaos mostrados en la Fig. 7.
La Fig. 7a ilustra un caso en donde la corriente de bits generada en el aparato de codificación está comprendido de una corriente de bits de música y una corriente de bits del objeto principal. La corriente de bits de música tiene una forma en la cual se mezclan las señales de objetos, y se refiere a una corriente de bits que corresponde a la suma de todos los objetos principales y objetos de fondo. La Fig. 7b ilustra un caso en donde la corriente de bits está comprendida de una corriente de bits de música y una corriente de bits del objeto de fondo. La Fig. 7c ilustra un caso en donde la corriente de bits está comprendida de una corriente de bits del objeto principal y una corriente de bits del objeto de fondo. En la Fig. 7, se crea una regla para generar la corriente de bits de música, la corriente de bits del objeto principal y la corriente de bits del objeto de fondo usando un codificador y un decodificador que tiene el mismo método. Sin embargo, cuando se usa el objeto principal como un objeto vocal, la corriente de bits de música puede codificarse usando un codee de voz, tal como AMR, QCELP, EFR, o EVRC con el fin de reducir la capacidad de la corriente de bits. En otras palabras, los métodos de codificación y decodificación del objeto de música y el objeto principal, el objeto principal y el objeto de fondo y por lo tanto puede diferir.
En la Fig. 7a, la parte de corriente de bits de música se configura usando el mismo método que un método de codificación general. Además, en el método de codificación tal como MP3 o AAC, un aparte en la cual la información lateral, tal como una región complementaria o una región auxiliar, se indica incluida en la última mitad de la corriente de bits. La corriente de bits del objeto principal puede agregarse a esta parte. Por lo tanto, una corriente de bits esta comprendida de una región en donde el objeto de música se codifica y una región de objeto principal subsiguiente a la región en donde se codifica el objeto de música. En este momento, un indicador, etiqueta o similares, que informa que se agregó el objeto principal, puede agregarse a la primera mitad de la región lateral de manera que se puede determinar si existe o no el objeto principal en el aparato de decodificación. El caso de la Fig. 7b tiene básicamente el mismo formato que el de la Fig. 7a. En la Fig. 7b, el objeto de fondo se usa en lugar del objeto principal de la Fig. 7a. La Fig. 7c ilustra un caos en donde la corriente de bits está comprendida de una corriente de bits del objeto principal y una corriente de bits del objeto de fondo. En este caos, el objeto de música esta comprendido de la suma o mezcla del objeto principal y el objeto de fondo. En un método para configurar la corriente de bits, el objeto de fondo puede almacenarse primero y el objeto principal puede almacenarse en la región auxiliar. Alternativamente, el objeto principal primero puede almacenarse y el objeto de fondo puede almacenarse en la región auxiliar. En tal caso, se puede agregar un indicador para informar la información acerca de la región lateral a la primera mitad de la región lateral, que es igual que la descrita antes. La Fig. 8 ilustra un método para configurar la corriente de bits de manera que se puede determinar si se ha agregado el objeto principal. Un primer ejemplo es uno en el cual después de que se termina la corriente de bits, una región correspondiente es una región auxiliar hasta que empieza un siguiente marco. En el primer ejemplo, solo se puede incluir un indicador, que informa que el objeto principal se ha codificado. Un segundo ejemplo corresponde a un método de codificación que requiere un indicador, informando que empieza una región auxiliar o una región de datos después de que termina una corriente de bits. Con este fin, para codificar un objeto principal, se requieren dos clases de indicadores, tal como un indicador para informar el inicio de la región auxiliar y un indicador para informar el objeto principal. Para decodificar esta corriente de bits, el tipo de datos se determina leyendo el indicador y luego se decodifica la corriente de bits leyendo una parte de datos.
La Fig. 9 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una cuarta modalidad de la presente invención. El aparato de codificación y decodificación de audio de acuerdo con la presente modalidad codifica y decodifica una corriente de bits en la cual se agrega un objeto vocal como un objeto principal . Haciendo referencia a la Fig. 9, un codificador 211 incluido en un aparato de codificación codifica una señal de música que incluye un objeto ocal y un objeto de música. Ejemplos de las señales de música del codificador 211 puede incluir MP3, AAC, WMA, y asi sucesivamente. El codificador 211 adiciona el objeto vocal a una corriente de bits como un objeto principal diferente a las señales de música. En este momento, el codificador 211 adiciona el objeto vocal a una parte, informando la información lateral tal como una región complementaria o una región auxiliar, como se mencionó antes, y también agrega un indicador, etc., informando al aparato de codificación del hecho que el objeto vocal existe adicionalmente a la parte. Un aparato de decodificación 220 incluye un decodificador codee general 221, un decodificador vocal 223, y una mezcladora 225. El decodificador codee general 221 decodifica la parte de corriente de bits de música de la corriente de bits recibida. En este caso, una región de objeto principal simplemente se reconoce como una región lateral o una región de datos, pero no se usa en el proceso de decodificación. El decodificador vocal 223 decodifica la parte de objeto vocal de la corriente de bits recibida. La mezcladora 225 mezcla las señales decodificadas en el decodificador codee general 221 y el decodificador vocal 223 y da los resultados de mezclado. Cuando una corriente de bits en la cual se incluye un objeto vocal cuando se recibe un objeto principal, el aparato de codificación que no incluye el decodificador vocal 223 decodifica únicamente una corriente de bits de música y da los resultados de decodificación. Sin embargo, aún en este caso, es igual que una salida de audio general dado que la señal vocal se incluye en la corriente de música. Además, en el proceso de decodificación, se determina si el objeto vocal se ha agregado a la corriente de bits basado en un indicador, etc. Cuando es imposible decodificar el objeto vocal, el objeto vocal se pasa por alto mediante omisiones, etc., pero cuando es posible decodificar el objeto vocal, el objeto vocal se decodifica y se usa para mezclado. El decodificador codee general 221 se adapta para reproducir música y generalmente usa decodificación de audio. Por ejemplo hay MP3, AAC, HE-AAC, WMA, Ogg Vorbis, y similares. El decodificador vocal 223 puede usar el mismo codee o uno diferente de aquel del decodificador de codee general 221. Por ejemplo, el decodificador vocal 223 puede usar un codee de voz, tal como VRC, EFR, AMR o QCELP. En este caso, se puede reducir la cantidad de calculo para decodificación . Además, si el objeto vocal está comprendido de señal mono, el régimen de bits puede reducirse al mayor grado posible. Sin embargo, si la corriente de bits de música no puede estar comprendida únicamente de señal mono debido a que esta comprendida de canales estéreo y señales de voz y difieren los canales de izquierda y derecha, el objeto vocal también puede estar comprendido de estéreo. En el aparato de decodificación 220 de acuerdo con la presente modalidad, cualquiera de un modo en el cual se reproduce solamente música, un modo en el cual solo se reproduce un objeto principal, y un modo en el cual la música y un objeto principal se mezclan y reproducen adecuadamente pueden seleccionarse y reproducirse en respuesta a un comando de control de usuario tal como un botón o manipulación de menú en un dispositivo reproductor. En el caso en donde un objeto principal se pasa por alto y solo se reproduce música original, corresponde a la reproducción de música existente. Sin embargo, dado que es posible el mezclado en respuesta a un comando de control de usuario, etc., se puede controlar el tamaño del objeto principal o un objeto de fondo, etc.. Cuando el objeto principal es un objeto vocal, se entiende que solo se puede incrementar o disminuir lo vocal cuando se compara con la música de fondo. Un ejemplo en el cual solo se produce un objeto principal puede incluir uno en el cual un objeto vocal o un sonido de instrumento musical especial se usa como el objeto principal. En otras palabras, se entiende que solo se escucha una voz sin música de fondo, únicamente se escucha un sonido de instrumento musical sin música de fondo, y similares. Cuando se mezclan y escuchan adecuadamente la música y un objeto principal, se entiende que solo la vocal se incrementa o disminuye cuando se compara con la música de fondo. En particular, en el caso en el que los componentes vocales se eliminan completamente de la música, la música puede usarse como un sistema de karaoke dado que desabracen los componentes vocales. Si se codifica un objeto vocal en el aparato de codificación en un estado en donde se invierte la fase del objeto vocal, el aparato de decodificación puede reproducir un sistema de karaoke agregando el objeto vocal a un objeto musical. En el proceso anterior, se ah descrito que el objeto musical y el objeto principal se decodifican respectivamente y luego se mezclan. Sin embargo, el proceso de mezclado puede llevarse a cabo durante el proceso de decodificación. Por ejemplo, para transformar la serie de codificación tal como MDCT (Transformación de Coseno Discreta modificada, MDCT por sus siglas en inglés) incluyendo MP3 y AAC, el mezclado puede llevarse a cabo en coeficientes de MDCT y se puede realizar finamente MDCT, generando asi salidas de PCM. En este caso, una cantidad de total de cálculo puede reducirse significativamente. Además, la presente invención no se limita a MDCT, pero incluye todas las transformaciones en las cuales se mezclan los coeficientes en un dominio de transformación con respecto a un decodificador en serie de codificación de transformación general y se lleva a cabo la decodificación. Además, un ejemplo en el cual se usa un objeto principal se ha descrito en el ejemplo anterior. Sin embargo, se puede usar cierto número de objetos principales. Por ejemplo, como se muestra en la Fig. 10, se puede usar la voz como un objeto principal 1 y se puede usar una guitarra como un objeto principal 2. Esta construcción es muy útil cuando solo se reproduce un objeto de fondo diferente a la voz y se reproduce una guitarra en la música y un usuario produce directamente la voz y una guitarra. Además, esta corriente de bits puede reproducirse a través de varias combinaciones de música, una en la cual se excluye la voz de la música, una en la cual se excluye una guitarra de la música, una en la cual la voz y una vocal de guitarra se excluyen de la música, y asi sucesivamente.
Mientras, en la presente invención, un canal indicado por una corriente de bits bocal puede expandirse. Por ejemplo, todas las partes de música, una parte de sonido de tambor de música, o una parte en la cual solo se excluye el sonido de tambor de todas las partes en la música pueden reproducirse usando una corriente de bits de tambor. Además, se puede controlar el mezclado sobre una base por partes usando dos o más corrientes de bits adicionales tales como la corriente de bits de voz y la corriente de bits de tambor. Además, en la presente modalidad, solo el estereo/mono se ha descrito principalmente. Sin embargo, la modalidad presente también puede expandirse a una caja de múltiples canales. Por ejemplo, una corriente de bits puede configurarse agregando un objeto vocal, una corriente de bits del objeto principal, y asi sucesivamente a una corriente de bits del canal 5.1, y al reproducirse, puede eliminarse cualquiera del sonido original, sonido del cual se produce la voz, y sonido incluyendo solo voz. La presente modalidad también puede configurarse para soportar solamente música y un modo en el cual se elimina la voz de la música, pero no soporta un modo en el cual se reproduce cualquier voz (un objeto principal) . Este método puede usarse cuando lo cantantes no desean que solo se reproduzca la voz. Se puede expandir a la configuración de un decodificador en el cual un identificador, indicando si existe o no una función para soportar solo la voz, se coloca en una corriente de bits y el rango de reproducción se decide con base en la corriente de bits. La Fig. 11 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una quinta modalidad de la presente invención. El aparato de codificación y decodificación de audio de acuerdo con la presente modalidad puede implementar un sistema de karaoke usando una señal residual. Cuando se especializa un sistema de karaoke, se puede dividir un objeto musical en un objeto de fondo y un objeto principal como se mencionó antes. El objeto principal se refiere a una señal de objetos que será controlada por separado del objeto de fondo. En particular, el objeto principal puede referirse a una señal de objeto vocal. El objeto de fondo es la suma de todas las señales de objeto diferentes al objeto principal. Haciendo referencia a la Fig. 11, un codificador 251 incluido en un aparato de codificación codifica un objeto de fondo y un objeto principal cuando se colocan juntos. En el momento de codificación, un codee de audio general tal como AAC o MP3 puede usarse. Si la señal se decodifica en un aparato de decodificación 260, la señal decodificada incluye una señal de objeto de fondo y una señal de objeto principal. Suponiendo que la señal decodificada es una señal de codificación original, el siguiente método puede usarse con el fin de aplicar un sistema de karaoke a la señal. El objeto principal se incluye en una corriente de bits total en la forma de una señal residual. El objeto principal se decodifica y luego se sustrae de la señal de decodificación original. En este caso, un primer decodificador 261 decodifica la señal total y el segundo decodificador 263 decodifica la señal residual, en donde g = 1. Alternativamente, la señal de objeto principal que tiene una fase inversa puede incluirse en la corriente de bits total en la forma de una señal residual. La señal de objeto principal puede codificarse y luego agregarse a la señal de decodificación original. En este caso, g = -1. En cualquier caso, una clase de un sistema de karaoke decreciente es posible controlando el valor de g. Por ejemplo, cuando g = -0.5, el objeto principal o el objeto vocal no se remueve completamente, pero solo el nivel puede controlarse. Además, si el valor g se fija aun número positivo o un número negativo, hay un efecto en cuanto a que se puede controlar el tamaño del objeto vocal. Si no se usa la señal de decodificación original y solo sale la señal residual, un modo de solo puede soportarse también cuando solo hay voz. La Fig. 12 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una sexta modalidad de la presente invención. El aparato de codificación y decodificación de audio de acuerdo con la presente modalidad usa dos señales residuales diferenciando las señales residuales para una salida de señal de karaoke y una salida de modo de vocal. Haciendo referencia a la Fig. 12, una señal de decodificación original codificada en un primer decodificador 291 se divide en una señal de objeto de fondo y una señal de objeto principal y luego sale en una unidad de separación de objeto 295. En realidad, el objeto de fondo incluye algunos componentes de objetos principales asi como el objeto de fondo original y el objeto principal también incluye algunos componentes de objeto de fondo asi como el objeto principal original. Esto se debe al proceso de dividir la señal de decodificación original en el objeto de fondo y la señal de objeto principal no se completa. En particular, con respecto al objeto de fondo, los componentes del objeto principal incluidos en el objeto de fondo pueden incluirse previamente en la corriente de bits total en la forma de la señal residual, la corriente de bits total puede decodificarse y los componentes de objetos principales pueden sustraerse luego del objeto de fondo. En este caso, en la Fig. 12, g = 1. Alternativamente, una fase inversa puede darse a los componentes del objeto principal incluidos en el objeto de fondo, los componentes del objeto principal pueden incluirse en la corriente de bits total en forma de una señal residual, y la corriente de bits total puede decodificarse y luego agregarse a la señal de objeto de fondo. En este caos, en la Fig. 12, g = -1. En cualquier caso, es posible un sistema de karaoke creciente controlando el valor g como se mencionó antes junto con la quinta modalidad . De la misma manera, un modo de solo puede soportarse controlando un valor gl después de que se aplica a la señal residual a la señal de objeto principal. El valor gl puede aplicarse como se describió antes en consideración de la comparación de fases de la señal residual y el objeto original y el grado de un modo vocal. La Fig. 13 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una séptima modalidad de la presente invención. En la presente modalidad, se usa el siguiente método con el fin de reducir más el régimen de bits de una señal residual en la modalidad anterior. Cuando una señal de objeto principal es de señal mono, una unidad de conversión de estéreo a tres canales 305 realiza la transformación de estéreo a tres canales en una señal de estéreo original decodificada en un primer decodificador 301. Dado que la transformación de estéreo a tres canales no es completa, un objeto de fondo (es decir, una salida del mismo) incluye algunos componentes de objetos principales asi como componentes de objetos de fondo, y un objeto principal (es decir, otra salida del mismo) también incluye algunos componentes de objeto de fondo asi como los componentes del objeto principal. Luego, un segundo decodificador 303 realiza la decodificación (o después de la decodificación, conversión de qmf o conversión de mdct-a-qmf ) en una parte residual de una corriente de bits total y suma sopesando la señal de objeto de fondo y la señal de objeto principal. Consecuentemente, se pueden obtener las señales comprendidas respectivamente de los componentes de objeto de fondo y los componentes de objeto principales. La ventaja de este método es que dado que la señal de objeto de fondo y la señal de objeto principal se han dividido una vez a través de la conversión de estéreo a tres canales, una señal residual para remover otro componentes incluidos en la señal 8es decir, los componentes del objeto principal que permanecen dentro de la señal de objeto de fondo y los componentes de objeto de fondo que permanecen dentro de la señal de objeto principal) pueden construirse usando un régimen de bits menor. Haciendo referencia a la Fig. 13, suponiendo que el componente de objeto de fondo es B y el componente de objeto principal es m dentro de la señal de objeto de fondo y los componentes de objeto de fondo que permanecen dentro de la señal de objeto principal) pueden construirse usando un régimen de bits menor. Haciendo referencia a la Fig. 13, suponiendo que el componente de objeto de fondo es B y el componente de objeto principal es m dentro de la señal de objeto de fondo BS y el componente de objeto principal es M y el componente de objeto de fondo es b dentro de la señal de objeto principal MS, se establece la siguiente fórmula. Figura Matemática 1 BS = B + MS = M +b Por ejemplo, cuando la señal residual R está comprendida de b-m, una salida de karaoke final KO da como resultado: Figura Matemática 2 KO = BS + R = B + b Una salida de modo solo final SO da como resultado: Figura Matemática 3 SO = BS - R = M + m El signo de la señal residual puede invertirse en la fórmula anterior, es decir, R = m - b, g = -1 y gl = 1. Cuando se configura BS y MS, los valores de g y gl en los cuales los valores finales de kO y SO comprenderán B y b, y M y m pueden calcularse fácilmente dependiendo de la forma en que se colocan los signos de B, m, M y/o b. En los casos anteriores, tantotas señales de karaoke como de solo cambian ligeramente de las señales originales, pero son posibles las salidas de señales de alta calidad que pueden usarse realmente debido a que la salida de karaoke no incluye los componentes de solo y la salida de solo no incluye los componentes de karaoke. Además, cuando existen dos objetos principales, de dos a tres canales de conversión y un incremento/disminución de la señal residual se puede usar paso a paso. La Fig. 14 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una octava modalidad de la presente invención. Un aparato de decodificación de señales 290 de acuerdo con la presente modalidad es diferente de la séptima modalidad en la que se lleva a cavo la conversión de mono a estero en cada canal de estéreo original dos veces cuando una señal de objeto principal es una señal de estéreo. Dado que la conversión de mono a estéreo no es perfecta, una señal de objeto de fondo (es decir, una salida del mismo) incluye algunos componentes de objeto principales asi como componentes de objetos de fondo y una señal de objeto principal (es decir, la otra salida del mismo) también incluye algunos componentes de objetos de fondo asi como componentes de objetos principales. Después, se lleva a cabo la decodificación (o después de la decodificación, la conversión de qumf o conversión de mdct-a-qmf ) en una parte residual de una corriente de bits total y los componentes de canal de izquierda y derecha de los mismos y se agrega a los canales de izquierda y derecha de una señal de objeto de fono y una señal de objeto principal, respectivamente, que se multiplican por un peso, de manera que se pueden obtener las señales comprendidas de un componente de objeto de fondo 8estreo) y un componente de objeto principal (estéreo) . En el caso en que se formen las señales residuales estéreo empleado la diferencia entre los componentes de izquierda y derecha del objeto de fondo de estéreo y el objeto principal, g = g2 = g3 = 1 en la Fig. 14. Además, como se describió antes los valores de g, gl, g2, y g3 pueden calcularse fácilmente de acuerdo con los signos de la señal de objeto de fondo, la señal de objeto principal y la señal residual . En general, una señal de objeto principal puede ser mono o estéreo. Por esta razón, una etiqueta, indicando si la señal de objeto principal es mono o estéreo, se coloca dentro de una corriente de bits total. Cuando la señal de objeto principal es mono, la señal de objeto principal puede decodificarse usando el método descrito junto con la séptima modalidad de la Fig. 13, y cuando la señal de objeto principal es estéreo, la señal de objeto principal puede decodificarse usando el método descrito junto con la octava modalidad de la Fig. 14, leyendo la etiqueta. Además, cuando se incluyen uno o más objetos principales, los métodos anteriores se usan consecutivamente dependiendo de si cada uno de los objetos principales es mono estero. En este momento, el número de veces en los cuales se usa cada método es idéntico al número de objetos principales de mono/estereo . Por ejemplo, cuando el número de objetos principales es 3, el número de objetos principales mono de los tres objetos principales es 2, y el número de objetos principales estéreo es 1, las señales de karaoke pueden salir usando el método descrito junto con la séptima modalidad dos veces y el método descrito junto con la octava modalidad de la Fig. 14 una vez. En este momento, la secuencia del método descrito junto con la séptima modalidad y el método descrito junto con la octava modalidad pueden decidirse previamente. Por ejemplo, el método descrito junto con la séptima modalidad pueden realizarse siempre sobre los objetos mono principales y el método descrito junto con la octava modalidad puede realizarse entonces en los objetos estéreo principales. Como otro método de decisión de secuencias, un descriptor, que describe la secuencia del método descrito junto con la séptima modalidad y el método descrito junto con la octava modalidad, se puede colocar dentro de una corriente de bits total y los métodos pueden realizarse selectivamente con base en el descriptor. La Fig. 15 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una novena modalidad de la presente invención. El aparato de codificación y decodificación de audio de cuerdo con la presente modalidad genera objetos musicales u objetos de fondo usando codificadores de múltiples canales. Haciendo referencia a la Fig. 15, se muestra un aparato de codificación de audio 350 incluyendo un codificador de múltiples canales 351, un codificador de objetos 353, y un multiplexor 355, y un aparato de decodificación de audio 360 incluyendo un desmultiplexor 361, un decodificador de objetos 363, y un decodificador de múltiples canales 369. El decodificador de objetos 363 puede incluir un convertidor de canales 365 y una mezcladora 367. El codificador de múltiples canales 351 genera una señal, que se mezcla descendentemente usando objetos musicales como una base de canal, y primera información de parámetros de audio basada en canales extrayendo información acerca del objeto musical. El decodificador de objetos 353 genera una señal mixta descendente, que se codifica usando objetos de vocales y la señal mixta descendente del codificador de múltiples canales 351, como una base de objeto, segunda información de parámetro de audio basada en objetos, y señales residuales que corresponden a los objetos vocales. El multiplexor 355 genera una corriente de bits en la cual se combinan la señal mixta inferior generada del codificador de objetos 353 e información lateral. En este momento, la información lateral es información que incluye el primer parámetro de uso generado del codificador de múltiples canales 351, las señales residuales y el segundo parámetro de audio generado del decodificador de objetos 353, y asi sucesivamente. En el aparato de codificación de audio 360, el desmultiplexor 361 desmultiplexa la señal de mezcla descendente y la información lateral en la corriente de bits recibida. El decodificador de objetos 363 genera señales de audio con componentes vocales controlados empleando por lo menos una señal de audio en la cual se codifica el objeto musical sobre una base de canales y una señal de audio en la cual se codifica el objeto vocal. El decodificador de objetos 363 incluye el convertidor de canales 365 y por lo tanto puede realizar la conversión de mono a estéreo o conversión de dos a tres en el proceso de decodificación. La mezcladora 367 puede controlar el nivel, posición, etc. de una señal de objeto especifica usando un parámetro de mezclado, etc., que se incluyen en la información de control. El decodificador de múltiples canales 369 genera señales de múltiples canales usando la señal de audio y la información lateral decodificada en el decodificador de objeto 361, y asi sucesivamente . El decodificador de objetos 363 puede generar una señal de audio que corresponde a cualquiera de un modo de karaoke en el cual se generan las señales de audio sin componentes vocales, un modo de solo en el cual se generan las señales de audio que incluye solo componentes vocales, un solo modo en el cual se generan las señales de audio que incluyen solo componentes vocales, y un modo general en el cual las señales de audio incluyendo componentes vocales se generan de acuerdo con la información de control de entrada. La Fig. 16 es una vista que ilustra la caja en donde los objetos vocales se codifican paso a paso. Haciendo referencia a la Fig. 16, un aparato de codificación 380 de acuerdo con la presente modalidad incluye un codificador de múltiples canales 381, primero a tercero objetos decodificador 383, 385 y 387, y un multiplexor 389. El codificador de múltiples canales 381 tiene la misma construcción y función que aquellas del codificador de múltiples canales mostrado en la Fig. 15. La presente modalidad difiere de la novena modalidad de la Fig. 15 en cuanto a que los primero a tercero codificadores de objetos 383, 385 y 387 se configuran para agrupar objetos vocales paso a paso y señales residuales, que se generan en pasos de agrupación respectivos, se incluyen en una corriente de bits generada por el multiplexor 389. En el caos en el que la corriente de bits generada por este proceso se decodifique, una señal con componentes vocales controlados u otros componentes de objetos deseados pueden genere aplicando las señales residuales, que se extraen de la corriente de bits a una señal de audio codificada agrupando los objetos musicales o una señal de audio codificado agrupando los objetos vocales paso a paso. Mientras, en la modalidad anterior, un lugar en donde se lleva a cabo la suma o diferencia de la señal de descodificación original y la señal residual, o la suma o diferencia de la señal de objeto de fondo o la señal de objeto principal y la señal residual, no se limita como un dominio especifico. Por ejemplo, este proceso puede llevarse a cabo en un dominio de tiempo o una clase de dominio de frecuencia tal como un dominio de MDCT. Alternativamente, este proceso puede llevarse a cabo en un dominio de banda secundaria tal como un dominio de banda secundaria de QMF o un dominio de banda secundaria híbrido. En particular, cuando se lleva a cabo este proceso en el dominio de frecuencia o el dominio de banda secundaria, se puede generar una señal de karaoke creciente controlando el número de bandas excluyendo los componentes residuales. Por ejemplo, cuando el número de bandas secundarias de una señal de decodificación original es de 20, si el número de bandas de una señal residual se establece en 20, puede darse una señal de karaoke perfecta. Cuando solo se cubren 10 bajas frecuencias, los componentes ocales se excluyen únicamente de las partes de baja frecuencia y permanecen las partes de alta frecuencia. En el último caso, la calidad de sonido puede ser inferior a la del caso anterior, pero hay una ventaja en cuanto a que puede disminuir el régimen de bits. Además, cuando el número de objetos principales no es uno, se pueden incluir varias señales residuales en una corriente de bits total y la suma o diferencia de las señales residuales pueden realizarse varias veces. Por ejemplo, cuando dos objetos principales incluyen voz y una guitarra y sus señales residuales se incluyen en una corriente de bits total, una señal de karaoke de la cual tanto la señal de voz como de guitarra se han removido, pueden generarse de manera que la señal vocal se remueve primero de la señal total y luego se remueve la señal de guitarra. En este caso, se puede generar una señal de karaoke de la cual solo la señal de vocal se ha removido y una señal de karaoke de la cual solo se ha removido la señal de guitarra. Alternativamente, solo puede salir una señal de voz o solo puede salir la señal de guitarra . Además, con el fin de generar la señal de karaoke removiendo solo la señal de voz de la señal total fundamentalmente, la señal total y la señal vocal se codifican respectivamente. Las dos siguientes clases de secciones se requieren de acuerdo con el tipo de un codee usado para codificación. Primero, siempre que se usa el mismo codee de codificación en la señal total y la señal de voz. En este caso, un identificador , que puede determinar el tipo de un codee de codificación con respecto a la señal total y la señal vocal, tiene que construirse en una corriente de bits y un decodificador realiza el proceso de identificar el tipo de un codee determinando el identificador , decodificando las señales y luego removiendo los componentes vocales. En este proceso, como se mencionó antes, se usa la suma o diferencia. La información acerca del identificado puede incluir información acerca de si una señal residual ha usado el mismo codee como aquel de una señal de decodificación original, el tipo de un codee usado para codificar una señal residual y asi sucesivamente. Además, se pueden usar diferentes codees de codificación para la señal total y la señal de voz. Por ejemplo, la señal de voz (es decir, la señal residual) siempre usa un codee fijo. En este caso, un identificador para la señal residual no es necesario y solo se puede usar un codee predeterminado para decodificar la señal total Sin embargo, en este caso, se limita u proceso para remover la señal residual de la señal total a un dominio en donde el proceso entre las dos señales es posible inmediatamente, tal como un dominio de tiempo o un dominio de banda secundaria. Por ejemplo, un dominio tal como mdct, que procesa entre dos señales es imposible inmediatamente. Además, de acuerdo con la presente invención, puede darse una señal de karaoke comprendida únicamente de una señal de objeto de fondo. Una señal de múltiples canales puede generarse llevando a cabo un proceso de mezclado ascendente adicional en la señal de karaoke. Por ejemplo, si las cercanías de MPEG se aplican adicionalmente a la señal de karaoke generada por la presente invención, se puede generar una señal de karaoke de canal 5.1. Incidentalmente, en las modalidades anteriores, se ha descrito que el número del objeto musical y el objeto principal, o el objeto de fondo y el objeto principal dentro de un marco es idéntico. Sin embargo, puede diferir el número del objeto musical y el objeto principal, o el objeto de fondo y el objeto principal dentro de un marco. Sin embargo, puede diferir el número del objeto de música y el objeto principal o el objeto de fondo y el objeto principal dentro de un marco. Por ejemplo, la música puede existir en cada marco y un objeto principal puede existir cada dos marcos. En este tiempo, el objeto principal puede decodificarse y el resultado de decodificación puede aplicarse a dos marcos.
La música y el objeto principal pueden tener diferentes frecuencias de muestreo. Por ejemplo, cuando la frecuencia de muestreo de música es 44.1 KHz y la frecuencia de muestreo de un objeto principal es de 22.05 KHz, los coeficientes de MDCT del objeto principal pueden calcularse y la mezcla puede llevarse a cabo únicamente en una región correspondiente de coeficientes de MDCT de la música. Esto emplea el principio de que el sonido vocal tiene una banda de frecuencia inferior a la del sonido de instrumento musical con respecto a un sistema de karaoke, y es ventajoso en cuanto a que se puede reducir la capacidad de datos. Además, de acuerdo con la presente invención, los códigos que pueden leer por un procesador pueden implementarse en un medio de grabación que puede leerse por el procesador. El medio de grabación que puede leerse por el procesador puede incluir todas las clases de dispositivos de grabación en los cuales se almacenan los datos que pueden leerse por el procesador. Ejemplos de los medios de grabación que pueden leerse por el procesador pueden incluir ROM, RAM, CD-ROM, cintas magnéticas, discos blandos, almacenamientos de datos ópticos, y asi sucesivamente, y también incluyen ondas portadoras tales como transmisión en una Internet. Además, el medio de grabado que puede leerse por el procesador puede distribuirse en sistemas conectados en una red, y los códigos que pueden leerse por el procesador se pueden almacenar y ejecutarse de una forma distribuida. Mientras que la presente invención se ha descrito en relación con lo que se considera actualmente como las modalidades preferidas, se deberá entender que la presente invención no se limita a las modalidades especificas, pero son posibles varias modificaciones por aquellos que tienen experiencia ordinaria en la materia. Se deberá observar que estas modificaciones no se deberán entender individualmente del espíritu técnico y prospecto de la presente invención.
Aplicabilidad Industrial La presente invención se puede usar para proceso de codificación y decodificación de señales de audio basada sen objetos, etc. señales de objetos de proceso con una asociación sobre una base por grupo y puede proveer modos de reproducción tales como un modo de karaoke, un modo de solo, y un modo general.

Claims (19)

REIVINDICACIONES
1. - Un método de decodificación de audio que comprende : extraer una primera señal de audio y un primer parámetro de audio en el cual se codifica un objeto musical sobre una base de canales y una segunda señal de audio y un segundo parámetro de audio en el cual se codifica un objeto vocal sobre una base de objetos, de una señal de audio, generar una tercera señal de audio empleando por lo menos una de las primera y segunda señales de audio; y generar una señal de audio de múltiples canales empleando por lo menos uno de los primero y segundo parámetros de audio y la tercera señal de audio.
2. - El método de decodificación de audio de la reivindicación 1, en donde la primera señal de audio reobtiene codificando por lo menos dos objetos musicales, y la segunda señal de audio se obtiene codificando por lo menos dos objetos vocales.
3. - El método de decodificación de audio de la reivindicación 1, en donde la tercera señal de audio se genera basado en un comando de control de usuarios.
4. - El método de decodificación de audio de la reivindicación 1, en donde la tercera señal de audio se genera sobre la base de adición/sustracción de una señal de por lo menos una de las primera y segunda señales de audio.
5. - El método de decodificación de audio de la reivindicación 1, en donde la tercera señal de audio se genera removiendo por lo menos una de las primera y segunda señales de audio.
6. - El método de decodificación de audio de la reivindicación 1, en donde la primera señal de audio es una señal que no incluye un componente vocal.
7. - El método de codificación de audio de la reivindicación 1, en donde la señal de audio es una señal recibida de una señal de difusión.
8. - Un aparato de decodificación de audio que comprende : un multiplexor para extraer una señal de mezcla descendente y la información lateral de una corriente de bits recibida; un decodificador de objeto para generar una tercera señal de audio empelado por lo menos uno de una primera señal de audio en la cual un objeto de música extraído de la señal de mezcla descendente se codifica sobre una base de canal y una segunda señal de audio en la cual un objeto vocal extraído de la señal mixta descendente se codifica sobre una base de objeto; y un decodificador de múltiples canales para generar una señal de audio de múltiples canales empleando por lo menos un primer parámetro de audio y un segundo parámetro de audio extraído de la información lateral y la tercera señal de audio.
9. - El aparato de decodificación de audio de la reivindicación 8, en donde el decodificador de objetos genera la tercera señal de audio sobre la base de adición/sustracción de una señal de por lo menos una de las primera y segunda señales de audio.
10. - Un método de decodificación de audio que comprende los pasos de: recibir una señal de mezcla descendente; extraer una primer señal de audio en la cual un objeto musical que incluye un objeto vocal se codifica y una segunda señal de audio en la cual se codifica un objeto vocal, de la señal de mezcla descendente; y generar cualquiera de una señal de audio que incluye únicamente el objeto vocal, una señal de audio comprendiendo el objeto vocal y una señal de audio que no incluye el objeto vocal basado en las primera y segunda señales de audio.
11. - El método de decodificación de audio de la reivindicación 10, en donde la primera señal de audio es una señal que se codifica sobre una base de canal, y la segunda señal de audio es una señal que se codifica sobre una base de objeto.
12. - El método de decodificación de audio de la reivindicación 10, en donde la segunda señal de audio es una señal de una forma residual.
13. - Un aparato de decodificación de audio, que comprende : un decodificador de objeto para generar cualquiera de una señal de audio incluyendo solo un objeto vocal, una señal de audio que comprende el objeto vocal, y se codifica una señal de audio que no incluye el objeto vocal basado en una primera señal de audio en la cual un objeto musical extraído de una señal de mezcla descendente y se codifica una segunda señal de audio en la cual se extrae un objeto vocal de la señal de mezcla descendente; y un decodificador de múltiples canales para generar una señal de audio de múltiples canales empleando una salida de señal del decodificador de objeto.
14. - El aparato de codificador de audio de la reivindicación 13, en donde la primera señal de audio se usan señal que se codifica sobre una base de canales, la segunda señal de audio es una señal que se codifica sobre una base de objeto.
15. - El aparto de decodificación de audio de la reivindicación 13, comprende además un desmultiplexor para extraer la señal de mezcla descendente y la información lateral usada para generar la señal de audio de múltiples canales de una corriente de bits recibida. 16.- Un método de codificación de audio que comprende los pasos de: generar una primera señal de audio en la cual se codifica un objeto musical sobre una base de canal, y un primer parámetro de audio que corresponde al objeto musical; generar una segunda señal de audio en la cual un objeto vocal se codifica sobre una base de objeto, y un segundo parámetro de audio que corresponde al objeto vocal; y generar una corriente de bits que incluye las primera y segunda señales de audio y los primero y segundo parámetros de audio. 17.- Un aparato de codificación de audio que compren : un codificador de múltiples canales para generar una primera señal de audio en la cual se codifica un objeto musical sobre una base de canal, y un primer parámetro de audio basado en canales con respecto al objeto musical; un codificador de objeto para generar una segunda señal de audio en la cual se codifica un objeto vocal sobre una base de objeto; y un segundo parámetro de audio con base en objeto con respecto al objeto vocal; y un multiplexor para generar una corriente de bits incluyendo las primera y segunda señales de audio y los primero y segundo parámetros de audio. 18. - Un medio de grabación en el cual un programa para ejecutar un método de codificación de acuerdo con una de las reivindicaciones 1 a 7, en un procesador se graba, el medio de grabado pudiéndose leer por el procesador. 19. - Un medio de grabación en la cual un programa para ejecutar un método de codificación de acuerdo con la reivindicación 16, en un procesador se graba, el medio de grabación pudiéndose leer por el procesador.
MX2008012439A 2006-11-24 2007-11-24 Metodo de codificacion y decodificacion de señal de audio basada en objetos y aparato para lo mismo. MX2008012439A (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US86082306P 2006-11-24 2006-11-24
US90164207P 2007-02-16 2007-02-16
US98151707P 2007-10-22 2007-10-22
US98240807P 2007-10-24 2007-10-24
PCT/KR2007/005968 WO2008063034A1 (en) 2006-11-24 2007-11-24 Method for encoding and decoding object-based audio signal and apparatus thereof

Publications (1)

Publication Number Publication Date
MX2008012439A true MX2008012439A (es) 2008-10-10

Family

ID=39429918

Family Applications (2)

Application Number Title Priority Date Filing Date
MX2008012918A MX2008012918A (es) 2006-11-24 2007-11-24 Metodo de codificacion y decodificacion de señal de audio y aparato para los mismo.
MX2008012439A MX2008012439A (es) 2006-11-24 2007-11-24 Metodo de codificacion y decodificacion de señal de audio basada en objetos y aparato para lo mismo.

Family Applications Before (1)

Application Number Title Priority Date Filing Date
MX2008012918A MX2008012918A (es) 2006-11-24 2007-11-24 Metodo de codificacion y decodificacion de señal de audio y aparato para los mismo.

Country Status (11)

Country Link
US (2) US20090210239A1 (es)
EP (2) EP2095365A4 (es)
JP (2) JP5394931B2 (es)
KR (3) KR101055739B1 (es)
AU (2) AU2007322488B2 (es)
BR (2) BRPI0710935A2 (es)
CA (2) CA2645911C (es)
ES (1) ES2387692T3 (es)
MX (2) MX2008012918A (es)
RU (2) RU2484543C2 (es)
WO (2) WO2008063035A1 (es)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8370164B2 (en) 2006-12-27 2013-02-05 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel including information bitstream conversion
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8781843B2 (en) * 2007-10-15 2014-07-15 Intellectual Discovery Co., Ltd. Method and an apparatus for processing speech, audio, and speech/audio signal using mode information
JP5243555B2 (ja) 2008-01-01 2013-07-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
WO2009087923A1 (ja) * 2008-01-11 2009-07-16 Nec Corporation 信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム
US8639519B2 (en) 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
US7928307B2 (en) * 2008-11-03 2011-04-19 Qnx Software Systems Co. Karaoke system
KR20100065121A (ko) * 2008-12-05 2010-06-15 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8670575B2 (en) 2008-12-05 2014-03-11 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
WO2011083981A2 (en) * 2010-01-06 2011-07-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
BR122019026166B1 (pt) 2010-04-09 2021-01-05 Dolby International Ab sistema decodificador, aparelho e método para emitir um sinal de áudio estereofônico tendo um canal esquerdo e um canal direito e meio legível por computador não transitório
JP5532518B2 (ja) * 2010-06-25 2014-06-25 ヤマハ株式会社 周波数特性制御装置
KR20120071072A (ko) * 2010-12-22 2012-07-02 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
US9754595B2 (en) 2011-06-09 2017-09-05 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding 3-dimensional audio signal
KR102172279B1 (ko) * 2011-11-14 2020-10-30 한국전자통신연구원 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법
RU2643644C2 (ru) * 2012-07-09 2018-02-02 Конинклейке Филипс Н.В. Кодирование и декодирование аудиосигналов
US9190065B2 (en) 2012-07-15 2015-11-17 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
US9479886B2 (en) * 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
CN104541524B (zh) 2012-07-31 2017-03-08 英迪股份有限公司 一种用于处理音频信号的方法和设备
US9489954B2 (en) 2012-08-07 2016-11-08 Dolby Laboratories Licensing Corporation Encoding and rendering of object based audio indicative of game audio content
IN2015DN02595A (es) * 2012-11-15 2015-09-11 Ntt Docomo Inc
US9336791B2 (en) * 2013-01-24 2016-05-10 Google Inc. Rearrangement and rate allocation for compressing multichannel audio
CN109712630B (zh) 2013-05-24 2023-05-30 杜比国际公司 包括音频对象的音频场景的高效编码
BR112015029129B1 (pt) 2013-05-24 2022-05-31 Dolby International Ab Método para codificar objetos de áudio em um fluxo de dados, meio legível por computador, método em um decodificador para decodificar um fluxo de dados e decodificador para decodificar um fluxo de dados incluindo objetos de áudio codificados
US9769586B2 (en) 2013-05-29 2017-09-19 Qualcomm Incorporated Performing order reduction with respect to higher order ambisonic coefficients
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830049A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
EP2830048A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
BR122020017207B1 (pt) * 2013-08-28 2022-12-06 Dolby International Ab Método, sistema de processamento de mídia, aparelho e meio de armazenamento legível por computador não transitório
KR102243395B1 (ko) * 2013-09-05 2021-04-22 한국전자통신연구원 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치
US10492014B2 (en) 2014-01-09 2019-11-26 Dolby Laboratories Licensing Corporation Spatial error metrics of audio content
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
CN104882145B (zh) 2014-02-28 2019-10-29 杜比实验室特许公司 使用音频对象的时间变化的音频对象聚类
EP3127109B1 (en) 2014-04-01 2018-03-14 Dolby International AB Efficient coding of audio scenes comprising audio objects
EP3127110B1 (en) 2014-04-02 2018-01-31 Dolby International AB Exploiting metadata redundancy in immersive audio metadata
FR3020732A1 (fr) * 2014-04-30 2015-11-06 Orange Correction de perte de trame perfectionnee avec information de voisement
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
JP6520937B2 (ja) * 2014-06-06 2019-05-29 ソニー株式会社 オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム
KR102208477B1 (ko) 2014-06-30 2021-01-27 삼성전자주식회사 마이크 운용 방법 및 이를 지원하는 전자 장치
US10863297B2 (en) 2016-06-01 2020-12-08 Dolby International Ab Method converting multichannel audio content into object-based audio content and a method for processing audio content having a spatial position
JP7230799B2 (ja) * 2017-03-28 2023-03-01 ソニーグループ株式会社 情報処理装置、情報処理方法、およびプログラム
EP3761672B1 (en) 2019-07-02 2023-04-05 Dolby International AB Using metadata to aggregate signal processing operations
GB2587614A (en) * 2019-09-26 2021-04-07 Nokia Technologies Oy Audio encoding and audio decoding

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3882280A (en) * 1973-12-19 1975-05-06 Magnavox Co Method and apparatus for combining digitized information
JP2944225B2 (ja) * 1990-12-17 1999-08-30 株式会社東芝 ステレオ信号処理装置
KR960007947B1 (ko) * 1993-09-17 1996-06-17 엘지전자 주식회사 가라오케-콤팩트 디스크(karaoke-cd) 및 이를 이용한 오디오 제어장치
JPH1039881A (ja) * 1996-07-19 1998-02-13 Yamaha Corp カラオケ採点装置
JPH10247090A (ja) * 1997-03-04 1998-09-14 Yamaha Corp 音楽情報送信方法、音楽情報記録方法、音楽情報記録媒体、音楽情報再生方法および音楽情報再生装置
JPH11167390A (ja) * 1997-12-04 1999-06-22 Ricoh Co Ltd 音楽演奏装置
RU2121718C1 (ru) * 1998-02-19 1998-11-10 Яков Шоел-Берович Ровнер Портативная музыкальная система для караоке и картридж для нее
US20050120870A1 (en) * 1998-05-15 2005-06-09 Ludwig Lester F. Envelope-controlled dynamic layering of audio signal processing and synthesis for music applications
JP3632891B2 (ja) * 1998-09-07 2005-03-23 日本ビクター株式会社 オーディオ信号の伝送方法、オーディオディスク、エンコード装置及びデコード装置
US6351733B1 (en) * 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US6849794B1 (en) * 2001-05-14 2005-02-01 Ronnie C. Lau Multiple channel system
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
JP3590377B2 (ja) * 2001-11-30 2004-11-17 株式会社東芝 デジタル放送システム、デジタル放送編成装置及びその編成方法
JP2004064363A (ja) * 2002-07-29 2004-02-26 Sony Corp デジタルオーディオ処理方法、デジタルオーディオ処理装置およびデジタルオーディオ記録媒体
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
ES2282860T3 (es) * 2003-04-17 2007-10-16 Koninklijke Philips Electronics N.V. Generacion de señal de audio.
JP2005141121A (ja) * 2003-11-10 2005-06-02 Matsushita Electric Ind Co Ltd オーディオ再生装置
RU2396608C2 (ru) * 2004-04-05 2010-08-10 Конинклейке Филипс Электроникс Н.В. Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
EP2575129A1 (en) * 2006-09-29 2013-04-03 Electronics and Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
KR20090013178A (ko) * 2006-09-29 2009-02-04 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
EP2437257B1 (en) * 2006-10-16 2018-01-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Saoc to mpeg surround transcoding
UA94117C2 (ru) * 2006-10-16 2011-04-11 Долби Свиден Ав Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов
MX2009005159A (es) * 2006-11-15 2009-05-25 Lg Electronics Inc Un metodo y un aparato para descodificar una señal de audio.
JP5133401B2 (ja) * 2007-04-26 2013-01-30 ドルビー・インターナショナル・アクチボラゲット 出力信号の合成装置及び合成方法
CN101821799B (zh) * 2007-10-17 2012-11-07 弗劳恩霍夫应用研究促进协会 使用上混合的音频编码

Also Published As

Publication number Publication date
CA2645863C (en) 2013-01-08
RU2010147691A (ru) 2012-05-27
CA2645911A1 (en) 2008-05-29
ES2387692T3 (es) 2012-09-28
US20090265164A1 (en) 2009-10-22
RU2544789C2 (ru) 2015-03-20
JP2010511190A (ja) 2010-04-08
EP2095364A1 (en) 2009-09-02
CA2645911C (en) 2014-01-07
WO2008063034A1 (en) 2008-05-29
JP2010511189A (ja) 2010-04-08
US20090210239A1 (en) 2009-08-20
EP2095364A4 (en) 2010-04-28
KR20110002489A (ko) 2011-01-07
RU2484543C2 (ru) 2013-06-10
BRPI0711094A2 (pt) 2011-08-23
JP5394931B2 (ja) 2014-01-22
AU2007322488B2 (en) 2010-04-29
KR101102401B1 (ko) 2012-01-05
EP2095364B1 (en) 2012-06-27
BRPI0710935A2 (pt) 2012-02-14
AU2007322487B2 (en) 2010-12-16
KR20090018839A (ko) 2009-02-23
KR101055739B1 (ko) 2011-08-11
EP2095365A4 (en) 2009-11-18
WO2008063035A1 (en) 2008-05-29
AU2007322487A1 (en) 2008-05-29
EP2095365A1 (en) 2009-09-02
CA2645863A1 (en) 2008-05-29
JP5139440B2 (ja) 2013-02-06
RU2010140328A (ru) 2012-04-10
MX2008012918A (es) 2008-10-15
KR20090028723A (ko) 2009-03-19
AU2007322488A1 (en) 2008-05-29

Similar Documents

Publication Publication Date Title
MX2008012439A (es) Metodo de codificacion y decodificacion de señal de audio basada en objetos y aparato para lo mismo.
CN101632118B (zh) 用于对多对象音频信号进行编码和解码的设备和方法
RU2551797C2 (ru) Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
WO2015056383A1 (ja) オーディオエンコード装置及びオーディオデコード装置
JP2011501544A (ja) ダウンミックスを用いたオーディオコーディング
CN101490744B (zh) 用于编码和解码基于对象的音频信号的方法和装置
RU2455708C2 (ru) Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
Marchand et al. DReaM: a novel system for joint source separation and multi-track coding

Legal Events

Date Code Title Description
FG Grant or registration