ES2390181T3

ES2390181T3 - Procedimiento y aparato para procesar una señal de audio

Info

Publication number: ES2390181T3
Application number: ES07768547T
Authority: ES
Inventors: Hyen O Oh
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2006-06-29
Filing date: 2007-06-29
Publication date: 2012-11-07
Anticipated expiration: 2027-06-29
Also published as: WO2008002098A1; TWI371694B; EP2036204B1; TW200816655A; US8326609B2; EP2036204A4; US20090278995A1; EP2036204A1

Abstract

Procedimiento de procesamiento de una señal de audio que comprende:recibir un flujo de bits correspondiente a la señal de audio, en el que la señal de audio comprende una tramaprincipal que contiene una cabecera y una pluralidad de subtramas;extraer de la cabecera información de la frecuencia de muestreo e información que indica si se utiliza replicaciónde la banda espectral, SBR;decidir un número de subtramas incluidas en la trama principal utilizando la información de la frecuencia demuestreo y la información que indica si se utiliza SBR;obtener la información de la posición inicial de la subtrama a partir de la cabecera basándose en el número desubtramas; yprocesar la señal de audio basándose en la información de la posición inicial de la subtrama,en el que la información de la posición inicial de la subtrama representa un número de bytes en el flujo de bits.

Description

Procedimiento y aparato para procesar una señal de audio.

Campo técnico

La presente invención se refiere a difusión digital, y más particularmente a un aparato para procesar una señal de audio y a un procedimiento para ello.

Técnica anterior

Últimamente, las difusiones de audio, de vídeo y de datos se transmiten mediante un sistema digital en lugar del sistema analógico convencional. Se han realizado muchos esfuerzos para estudiar y desarrollar dispositivos para transmitir y visualizar las difusiones de audio, de vídeo y de datos. Y, en parte, ya se han comercializado dispositivos. Por ejemplo, un sistema para transmitir digitalmente emisiones de audio, de vídeo, de datos y similares es la llamada difusión digital. Por difusión digital se entiende la difusión digital de audio, la difusión digital multimedia,

o similar.

La difusión digital es ventajosa porque proporciona diversos servicios de información multimedia de forma económica, siendo utilizada para la difusión móvil según la asignación de banda de frecuencia, crea nuevas fuentes de beneficios a través de dispositivos adicionales de transporte de datos y provoca extensos efectos industriales al aportar nuevos estímulos al mercado receptor.

Se han introducido numerosas tecnologías para la compresión y reconstrucción de señales, que se aplican generalmente a diferentes datos, incluyendo audio y vídeo. Estas tecnologías tienden a evolucionar en una dirección para mejorar las calidades de audio y vídeo con una elevada proporción de compresión. Y se han realizado muchos esfuerzos para aumentar la eficacia de transmisión para la adaptación a diversos entornos de comunicación.

Generalmente, una señal de audio puede ser generada por uno o varios sistemas de codificación. Asumiendo que existen flujos de bits codificados por un primer y un segundo sistemas de codificación, respectivamente, un decodificador adecuado para el segundo sistema de codificación es incapaz de decodificar el flujo de bits decodificado por el primer sistema de codificación.

El documento US 2005/0283362 A1 se refiere a un codificador/decodificador de voz, en el que un circuito de control de parámetros de codificación calcula una longitud de trama a partir de la tasa de bits y el retardo de codificación, y suministra los datos de longitud de trama calculados para un circuito de codificación CELP. Basándose en la longitud de trama calculada, el circuito de control de parámetros de codificación selecciona parámetros de control de una tabla, en la cual se encuentran almacenados una pluralidad de parámetros de control para controlar la operación del circuito de codificación CELP, y suministra los parámetros de control seleccionados al circuito de codificación CELP. El circuito de control de parámetros de codificación suministra la longitud de subtrama, y el número de bits distribuidos a la señal multipulso para el circuito de fijación de parámetros de generación de señal multipulso. El circuito de fijación de parámetros de generación de señal multipulso calcula un número de impulsos de la señal de excitación multipulso, candidatos de posición de impulso de cada impulso y posiciones candidatas a partir de la longitud de subtrama y del número de bits de la señal multipulso.

El documento EP 0 677 961 A2 se refiere a un procedimiento para grabar y reproducir datos, en el que se dispone una cabecera para controlar cada bloque de datos en el inicio de una unidad de datos formada por una combinación de datos de vídeo, datos de sonido y datos de subpicture. Los datos de cabecera se disponen en el inicio de cada bloque de datos para controlar datos en el bloque de datos. Por lo tanto, particularmente cuando se graba una pluralidad de canales de datos y una pluralidad de flujos de datos en un bloque de datos y se selecciona uno de ellos, se puede controlar adecuadamente cada dato de canal y cada dato de flujo.

El documento US 2004/0083258 A1 se refiere a un procedimiento y a un aparato de procesamiento de información, a un medio de grabación y a un programa, en el que al recibir una solicitud de envío de datos adicionales de respuesta, un dispositivo de transmisión de datos adicionales genera datos adicionales de respuesta y los envía al solicitante. La cabecera de los datos adicionales de respuesta contiene un ID de contenido y el número de zonas muestra. En la cabecera de las tramas adicionales de cada zona de muestra en línea, se indican la posición inicial de los datos de muestra y la longitud de la zona de muestra. Al recibir los datos adicionales de respuesta, el solicitante genera datos de reproducción de muestra utilizando datos de muestra y los datos adicionales de respuesta. En los datos de reproducción de muestra, las tramas que se reconstruyen en datos de calidad superior a los datos adicionales de respuesta se indican en zonas de muestra. Otras zonas contienen tramas de muestra. La invención se puede aplicar a un dispositivo de codificación, a un dispositivo de transmisión de datos adicionales, a un dispositivo de reproducción de datos y a un dispositivo de grabación de datos.

El documento US 2002/0191963 A1 se refiere a un medio de grabación, a un aparato de grabación y a un procedimiento de grabación para grabar datos en un medio de grabación, y a un aparato de reproducción y a un

procedimiento de reproducción para reproducir datos de un medio de grabación, en el que se graban datos en un área de datos de un disco en una estructura jerárquica de cadenas de programas, programas, celdas y conjuntos, estando cada conjunto constituido por una cabecera de conjunto para identificar el conjunto y un paquete que contiene un flujo de datos grabado en su interior, presentando el paquete una cabecera de paquete que contiene un ID de flujo que indica por lo menos un ID de flujo privado y de subflujo que indica la clasificación del flujo privado descrito en su interior, y la clasificación indica datos de paquetes de datos de audio AC3 Dolby, datos de paquetes de datos de audio lineales, datos de paquetes de datos de subpicture, o datos de paquete de datos de ordenador.

Exposición de la invención

Problema técnico

Por lo tanto, se necesita un nuevo procedimiento de procesamiento de señales para maximizar la eficiencia de la transmisión de señales en entornos de comunicación complicados.

Y, para la compatibilidad de la secuencia de bits, es necesario generar un ajuste del flujo de bits para un formato de una señal de salida analizando un flujo de bits mínimo de la señal transmitida.

Solución técnica

En consecuencia, la presente invención se refiere a un aparato y a un procedimiento para procesar una señal de audio los cuales, sustancialmente, eluden uno o más de los problemas debidos a las limitaciones e inconvenientes de la técnica relacionada.

Un objetivo de la presente invención consiste en proporcionar un aparato y un procedimiento para procesar una señal de audio, mediante los cuales se pueda procesar la señal de audio de forma eficiente.

Otro objetivo de la presente invención consiste en proporcionar un aparato y un procedimiento para transmitir una señal, y una estructura de datos que los implemente, mediante los cuales se puedan transportar más señales dentro de una frecuencia de banda predeterminada.

Otro objetivo de la presente invención consiste en proporcionar un aparato y un procedimiento para transmitir una señal, mediante los cuales se pueda reducir la pérdida causada por error en una parte prescrita de la señal transmitida.

Otro objetivo de la presente invención consiste en proporcionar un aparato y un procedimiento para transmitir una señal, mediante los cuales se pueda optimizar la eficiencia de transmisión de señales.

Otro objetivo de la presente invención consiste en proporcionar un aparato y un procedimiento para transmitir una señal, mediante los cuales se procese de forma eficiente una señal de difusión utilizando una pluralidad de códecs.

Otro objetivo de la presente invención consiste en proporcionar un aparato y un procedimiento para codificar datos, mediante los cuales se pueda procesar la codificación de datos de forma eficiente.

Otro objetivo de la presente invención consiste en proporcionar un aparato y un procedimiento para transmitir una señal, de audio mediante los cuales se pueda obtener compatibilidad entre flujos de bits codificados respectivamente por diferentes sistemas de codificación.

Otro objetivo de la presente invención consiste en proporcionar un aparato y un procedimiento para transmitir una señal de audio, mediante los cuales se pueda descodificar un flujo de bits codificado por un sistema de codificación diferente del de un decodificador.

Otro objetivo de la presente invención consiste en proporcionar un sistema que comprenda un aparato de decodificación.

Efectos ventajosos

La presente invención proporciona los siguientes efectos o ventajas.

En primer lugar, la información de posición de inicio de una subtrama se inserta en el área de cabecera de la trama principal de una señal de audio. De este modo puede aumentar la eficiencia de la transmisión de datos.

En segundo lugar, se utiliza información de parámetros de audio insertándola en un área de cabecera de una trama principal. De este modo, se pueden suministrar diversos servicios y se pueden procesar servicios de audio codificados por lo menos por un sistema.

En tercer lugar, la presente invención puede procesar servicios de audio codificados mediante la técnica relacionada

o sistemas convencionales, manteniendo la compatibilidad.

En cuarto lugar, al transmitir datos consecutivos de difusión, comunicación, y similares, si se genera una sección discontinua de datos debido a un error de transmisión, a un entorno cambiado por la exigencia del restablecimiento de un decodificador, a un cambio de canal por una selección de usuario, o similar, se utiliza información de regeneración para permitir una gestión eficiente.

En quinto lugar, la presente invención permite la codificación eficiente de datos, proporcionando una compresión y una reconstrucción de datos con una elevada eficiencia de transmisión.

En sexto lugar, aunque se transfiera algún tipo de señal, se puede generar un flujo de datos adecuado para un formato correspondiente, Por lo tanto, se puede mejorar la compatibilidad entre una señal codificada y un decodificador. Por ejemplo, si se transmite una señal codificada con estéreo paramétrico a un decodificador MPEG surround, la señal codificada con estéreo paramétrico se convierte y decodifica utilizando una señal de conversión dentro del decodificador MPEG. Esto se puede aplicar de forma idéntica a un caso en el que se transmita una señal SAOC en lugar de la señal codificada con estéreo paramétrico y viceversa.

En séptimo lugar en el caso de que se transmitan diversas señales, el decodificador se modifica parcialmente para permitir que las señales sean decodificadas. Por lo tanto, se puede mejorar la compatibilidad del decodificador.

Descripción de los dibujos

Los dibujos adjuntos, que se incluyen para proporcionar una mejor comprensión de la invención, y se incorporan como parte constituyente de esta especificación, ilustran formas de realización de la invención y considerados junto con la descripción sirven para explicar los principios de la invención.

En los dibujos:

la figura 1 es un diagrama de bloques esquemático de un receptor de difusión 100 capaz de recibir una señal de audio según una forma de realización de la presente invención;

la figura 2 es un diagrama estructural esquemático de datos de una trama principal que comprende una pluralidad de subtramas según una forma de realización de la presente invención;

la figura 3 es un diagrama de bloques esquemático de una unidad de decodificación de audio 150 para procesar una señal de audio transmitida según una forma de realización de la presente invención;

la figura 4 es un diagrama para explicar un proceso para insertar información de regeneración en un flujo de bits de audio y procesarla en una unidad de decodificación según una forma de realización de la presente invención; y

la figura 5 es un diagrama para explicar un procedimiento de transmisión de información de regeneración según una forma de realización de la presente invención;

(a): es un diagrama para explicar un procedimiento de transmisión de información de inserción de información de punto de regeneración (bsRefreshPoint) en una subtrama;

(b): es un diagrama para explicar un procedimiento de transmisión de inserción de inicio de regeneración (bsRefreshStart) en una subtrama e insertar información de duración de la regeneración (bsRefreshDuration) que indica la duración disponible para la ejecución de la regeneración si se aplica regeneración;

(c): es un diagrama para explicar un procedimiento de transmisión de inserción de información de punto de regeneración (bsRefreshPoint) que indica información de regeneración disponible e información de cese de regeneración (bsRefreshStop) para detener la regeneración en una subtrama;

la figura 6 es un diagrama (a) para explicar un procedimiento de transmisión de información de causa de regeneración y un diagrama (b) para explicar ejemplos de información de la causa de regeneración;

la figura 7 es un diagrama (a) para explicar un procedimiento de transmisión de información del nivel para proporcionar extensibilidad de regeneración, y un diagrama de ejemplo de información de nivel;

la figura 8 es un diagrama de bloques esquemático de un sistema para obtener compatibilidad entre el flujo de bits A y el flujo de bits B según una forma de realización de la presente invención;

la figura 9 es un diagrama de bloques esquemático de un sistema para obtener compatibilidad entre el flujo de

bits A y el flujo de bits B según otra forma de realización de la presente invención;

la figura 10 es un diagrama de ejemplo de información de parámetros convertida en el curso de la conversión de una señal codificada con estéreo paramétrico a una señal MPEG surround según una forma de realización de la presente invención.

Mejor modo de realización de la invención

En la siguiente descripción, se describen características y ventajas adicionales de la invención, la cual en parte se pondrá de manifiesto a partir de la descripción o se podrá aprender a través de su puesta en práctica. Los objetivos y otras ventajas de la invención se realizarán y alcanzarán mediante la estructura indicada específicamente en la descripción escrita y las reivindicaciones, así como en los dibujos adjuntos.

Se proporciona un procedimiento y un aparato según las reivindicaciones independientes. Las reivindicaciones subordinadas contienen desarrollos de los mismos.

Preferentemente, un procedimiento de procesamiento de una señal de audio comprende obtener información de posición inicial de la subtrama de la cabecera de la trama principal y procesar una señal de audio basándose en la información de posición inicial de la subtrama, comprendiendo la trama principal una pluralidad de subtramas.

Preferentemente, un procedimiento de procesamiento de una señal de audio comprende obtener información de regeneración de una trama principal o subtrama a partir de la cabecera de la trama principal y procesar la señal de audio basándose en la información de regeneración, en el que la información de regeneración indica si la señal de audio se procesará utilizando información adicional diferente de la información de una trama principal o subtrama previa o actual , y comprendiendo la trama principal una pluralidad de subtramas.

Preferentemente, un procedimiento de transporte de una señal de audio comprende insertar en la información de posición inicial una subtrama en la cabecera de una trama principal y transmitir la señal de audio que presenta la información de posición inicial de la subtrama insertada en ella a un receptor de señales, comprendiendo la trama principal una pluralidad de subtramas.

Preferentemente, un procedimiento de transporte de una señal de audio comprende insertar información de regeneración una trama principal o subtrama en la cabecera de la trama principal y transmitir la señal de audio que presenta la información de regeneración insertada en ella a un receptor de señales, indicando la información de regeneración si la señal de audio se procesará utilizando información adicional diferente de la información de una trama principal o subtrama anterior o actual, y comprendiendo la trama principal una pluralidad de subtramas.

Preferentemente, en un receptor de difusión capaz de recibir una difusión digital, el receptor de difusión digital comprende una unidad de sintonización que recibe un flujo de difusión configurado de modo que la información de posición inicial de una subtrama está insertada en la cabecera de una trama principal de una señal de audio, comprendiendo la señal de audio la trama principal, la cual comprende una pluralidad de subtramas y presenta un valor específico, una unidad de definición que define una posición de la subtrama del flujo de difusión recibido utilizando la información de posición inicial, y una unidad de control que controla la información de cabecera correspondiente a la subtrama que se debe utilizar en el procesamiento de la subtramas según el resultado de la etapa de decisión.

Preferentemente, un procedimiento para procesar una señal comprende extraer una primera información de parámetros de un flujo de bits codificado mediante un primer sistema de codificación, y convertir la primera información de parámetros en una segunda información de parámetros requerida para un segundo sistema de codificación, y generar un flujo de bits codificado mediante el segundo sistema de codificación utilizando la segunda información de parámetros convertida, correspondiendo la segunda información de parámetros a la primera información de parámetros.

Preferentemente, un procedimiento para procesar una señal comprende extraer primera información de parámetros de un flujo de bits codificado mediante un primer sistema de codificación, y convertir la primera información de parámetros en una segunda información de parámetros requerida para un segundo sistema de codificación, y la salida de un flujo de bits decodificado mediante el segundo sistema de codificación utilizando la segunda información de parámetros convertida, correspondiendo la segunda información de parámetros a la primera información de parámetros.

Se debe entender que tanto la descripción general anterior como la siguiente descripción detallada se dan a título de ejemplo y de explicación y tienen el propósito de explicar adicionalmente la invención de acuerdo con las reivindicaciones.

Modo de realización de la invención

A continuación se describen de forma detallada formas de realización preferidas de la presente invención, cuyos ejemplos se ilustran en los dibujos adjuntos.

En primer lugar, se describe un receptor de difusión capaz de procesar una señal de audio según la presente invención de la manera siguiente.

La figura 1 es un diagrama de bloques esquemático de un receptor de difusión 100 capaz de recibir una señal de audio según una forma de realización de la presente invención.

Con referencia a la figura 1, un receptor de difusión 100 según una forma de realización de la presente invención comprende una interfaz de usuario 110, un controlador 120, un sintonizador 130, una unidad de decodificación de datos 140, una unidad de decodificación de audio 150, un altavoz 160, una unidad de decodificación de vídeo 170, y una unidad de visualización 170.

En particular, el receptor de difusión 100 puede comprender un dispositivo capaz de recibir para emitir una señal de difusión como una señal de televisión, de teléfono móvil, de un dispositivo de difusión multimedia, y similares.

Si un usuario introduce una orden para un ajuste de canal, un ajuste de volumen, o similar, la interfaz de usuario 110 desempeña una función en el envío de la orden al controlador 120.

El controlador 120 desempeña un papel en las funciones de control orgánico de la interfaz de usuario 110, el sintonizador 130, la unidad de decodificación de datos 140, la unidad de decodificación de audio 150, y la unidad de decodificación de vídeo 170.

El sintonizador 130 recibe información para un canal de una frecuencia correspondiente a la información de control del controlador 120. La información que sale del sintonizador 130 se divide en datos principales y una pluralidad de datos de servicio para ser demodulados por la unidad de paquetes. Estos datos se demultiplexan y a continuación se envían respectivamente a las unidades de decodificación de datos correspondientes de acuerdo con la información de control del controlador 120. En este caso, los datos pueden comprender información del sistema e información del servicio de difusión, Por ejemplo, se puede utilizar PSI/PSIP (información específica de programa/protocolo de información de programa y sistema) como información del sistema, sin carácter limitativo para el ámbito de la presente invención. En particular, cualquier protocolo para transmisión de información del sistema en formato de tabla es aplicable para la presente invención, prescindiendo de su denominación.

La unidad de decodificación de datos 140 recibe la información del sistema o la información del servicio de difusión y efectúa la decodificación de la información recibida.

La unidad de decodificación de audio 150 recibe una señal de audio comprimida mediante un sistema de codificación específico de audio y reconfigura la señal de audio recibida a un formato emisible a través del altavoz

160.

En particular, se puede codificar la señal de audio en unidades de subtrama o de trama. Una pluralidad de subtramas codificada puede configurar una trama principal. La subtrama es una unidad mínima para transmitir o decodificar. Y la subtrama puede ser una unidad de acceso o una trama.

Además, las subtramas pueden comprender una muestra de audio. Puede existir una cabecera en la trama principal y se puede incluir información de un parámetro de audio en la cabecera de la trama principal. Por ejemplo, el parámetro de audio puede comprender información de frecuencia de muestreo, información que indica si se utiliza SBR (Replicación de la Banda Espectral), información del modo de canal, información que indica si se utiliza estéreo paramétrico, información de la configuración MPEG surround, etc.

Por lo tanto, la unidad de decodificación de audio 150 puede comprender por lo menos un decodificador AAC, o un decodificador AAC-SBR, o un decodificador envolvente AAC-MPEG, o un decodificador AAC-SBR (con MPEG surround). Y se puede insertar información de la posición inicial de la subtrama e información de regeneración en la cabecera de la trama principal.

La unidad de decodificación de vídeo 170 recibe una señal de vídeo comprimida mediante un sistema específico de codificación de vídeo y puede reconfigurar la señal recibida a un formato emisible a través de la unidad de visualización 180.

A continuación se describe de con detalle y con referencia a las figuras 2 y 4 un procedimiento de procesamiento de una señal recibida de forma más eficiente. La señal recibida puede comprender por lo menos una señal de audio, o una señal de vídeo, o una señal de datos. A continuación se describe de forma detallada un procedimiento de procesamiento de una señal de audio como forma de realización de la presente invención.

La figura 2 es un diagrama estructural esquemático de datos de una trama principal que comprende una pluralidad de subtramas según una forma de realización de la presente invención.

Con referencia a la figura 2, la difusión de audio digital es capaz de transmitir diversas clases de datos adicionales, así como transmitir audios en diversos canales con alta calidad. Al transmitir la señal de audio, es capaz de codificar la señal de audio en subtramas. Y la por lo menos una subtrama codificada puede configurar una trama principal.

Ahora bien, si se produce un error en una parte de la trama principal, es muy probable que se puedan perder otros datos. Para evitar esta pérdida, es necesario definir información indicando la longitud de la trama principal o las subtramas.

La información que indica la longitud de la trama principal o las subtramas se puede insertar en la cabecera de la trama principal. Si en la cabecera de la trama principal no existe la información que indica la longitud, se busca secuencialmente cada subtrama, se lee la longitud de cada subtrama, se busca la subtrama siguiente saltando al valor correspondiente de la longitud leída, y a continuación se lee la longitud de la subtrama siguiente. Este proceso resulta inconveniente e ineficiente.

Sin embargo, si la longitud de la trama principal o de las subtramas se obtiene de la cabecera de la trama principal, se puede solucionar el problema o ineficiencia descritos anteriormente.

En el caso de que se produzca este error en una subtrama dentro de la trama principal, es imposible conocer la posición de la subtrama que sigue a la subtrama errónea. Así pues, en la presente invención, la información de la posición de inicio de una subtrama se puede utilizar como ejemplo de la información que indica la longitud de la trama principal o las subtramas.

La información de la posición inicial no es el valor que indica la longitud de la subtrama, sino el valor que indica la posición de inicio de la subtrama. La información de la posición inicial se puede definir de diversas maneras.

Por ejemplo, es posible obtener información de la posición relativa de la subtrama representando la información de la posición inicial mediante un número fijo de bits. En este caso, es posible conocer el tamaño y la posición de una subtrama específica. En particular, notificando el valor de la posición inicial de una subtrama, aunque el valor de la posición inicial de la subtrama anterior se haya perdido por error, es posible decodificar datos de la subtrama correspondiente con el valor de la posición inicial de la subtrama siguiente, Por lo tanto, si la información de la posición inicial es un valor que indica la posición inicial de la subtrama, el valor puede ser un valor de orden ascendente.

Según una forma de realización de la presente invención, la información de la posición inicial (sf_start[0]) de una subtrama inicial dentro de la trama principal se puede obtener mediante una información predefinida en lugar de ser transmitida. Por ejemplo, se puede definir un valor de información de la posición según la información del número de subtramas que configuran la trama principal. El valor de la información de la posición inicial de la subtrama inicial se puede definir basándose en la longitud de cabecera de la trama principal. En particular, si el número de subtramas que configuran la trama principal es 2, el valor de la información de la posición inicial de la subtrama inicial puede indicar el punto byte 5 de la trama principal. En este caso, los 5 bytes pueden corresponder a la longitud de la cabecera.

Según otra forma de realización de la presente invención, la cabecera de la trama principal que configura la señal de audio puede comprender diversas clases de información. Por ejemplo, las diversas clases de información pueden comprender información para comprobar si existe error en la cabecera de la trama principal, información de parámetros de audio, información de la posición inicial, información de regeneración, etc.

En este caso, la información de la posición inicial se puede obtener de cada subtrama. Al hacerlo, se debe definir preferentemente cuántas subtramas existen dentro de la trama principal. Por ejemplo, la información del número de subtramas se puede obtener utilizando los parámetros de audio. Los parámetros de audio comprenden información de la frecuencia de muestreo, información que indica si se utiliza SBR, información del modo de canal, información que indica si se utiliza estéreo paramétrico, información de la configuración MPEG surround, etc. La información de la frecuencia de muestreo puede comprender información de la frecuencia de muestreo DAC.

En particular, la información de la frecuencia de muestreo DAC indica una frecuencia de muestreo de DAC (convertidor digital-a-analógico). Y, el DAC es un dispositivo para convertir una muestra de audio final procesada digitalmente en una señal analógica para enviar a un altavoz. Y, la frecuencia de muestreo indica cuántas señales de muestras se toman por segundo. Por lo tanto, la frecuencia de muestreo DAC debería ser igual a la frecuencia de muestreo para convertir una señal analógica original en una señal digital.

La información que indica si se utiliza SBR (replicación de banda espectral) es la información que indica si se ha aplicado SBR o no. La SBR (replicación de banda espectral) es una técnica de estimación de un componente de

banda de alta frecuencia que utiliza información de una banda de baja frecuencia. Por ejemplo, si se aplica la SBR, cuando se muestrea una señal de audio a 48 kHz, la frecuencia de muestreo AAC (codificación avanzada de audio) es de 24 kHz.

La información del modo canal es la información que indica si una señal de audio codificada corresponde a mono o a estéreo.

La información que indica si se utiliza PS (estéreo paramétrico) significa la información que indica si se ha utilizado estéreo paramétrico. El PS es una técnica para convertir una señal de audio de un canal (mono) en una señal de audio de dos canales (estéreo). Así, si se utiliza PS, la información del modo canal debe ser mono. Y el PS sólo es utilizable si se aplica la SBR.

Y, la información de la configuración de MPEG surround es la información que indica la clase de MPEG surround con información de canal prescrita se aplica. Por ejemplo, la información de la configuración de MPEG surround indica si se aplica MPEG surround de canal de salida 5.1, si se aplica MPEG surround de canal de salida 7.1, o si se aplica MPEG surround o no.

Según una forma de realización de la presente invención, se puede definir la información del número de subtramas que configuran una trama principal utilizando los parámetros de audio. Por ejemplo, son utilizables la información de frecuencia de muestreo DAC y la información que indica si se utiliza la SBR. Particularmente, si la frecuencia de muestreo DAC es de 32 kHz y si se utiliza la SBR, la frecuencia de muestreo AAC es de 16 kHz.

Mientras tanto, en el sistema DAB (difusión de audio digital), el número de muestras por canal de subtramas se puede fijar en un valor específico. El valor específico se puede establecer para obtener compatibilidad con otro códec. Por ejemplo, el valor específico se puede fijar a 960 para alcanzar compatibilidad con información de longitud de subtramas de HE-AAC. En este caso, la longitud temporal de la subtrama es de 960/16 kHz = 60 ms. Por lo tanto si la longitud temporal de una trama principal se fija en un valor específico (120 ms) con respecto al tiempo, el número de subtramas será 120 ms/60 ms = 2. Como se ha mencionado en la descripción anterior, si se define el número de subtramas, se puede obtener información de la posición inicial que asciende al número de las subtramas. Sin embargo, en este caso, la información de la posición inicial para una subtrama inicial puede ser definida por la información prefijada.

Según una forma de realización de la presente invención, se puede deducir la información del tamaño de la subtrama (sf_size[n]) utilizando la información de la posición inicial de la subtrama. Por ejemplo, se puede deducir información del tamaño de la subtrama anterior utilizando información de la posición inicial de la subtrama actual e información de la posición inicial de la subtrama anterior. Al efectuar esta operación, si existe información para comprobar errores de subtrama, se puede utilizar conjuntamente. Se puede expresar con la fórmula 1.

(Fórmula 1)

sf_size [n-1] = sf_start[n]-sf_start[n-1]+sf_CRC[n-1]

Por lo tanto, una vez definido el tamaño de la subtrama, es posible asignar bits de la subtrama utilizando el tamaño definido de la subtrama.

Según una forma de realización de la presente invención, es posible definir un tamaño de una trama principal utilizando un índice de subcanal. En este caso, el índice de subcanal puede significar información del número de paquetes RS (Reed-Solomon) necesarios para transportar la trama principal. Y, el valor del índice de subcanal se puede definir a partir del tamaño del subcanal del MSC (calan de servicio principal).

Por ejemplo, si un índice de subcanal es 1, el tamaño de subcanal del MSC será de 8 kbps. En este caso, la longitud de trama principal (120 ms) será de 120 ms x 8k = 960 bits. En concreto, la longitud de la trama principal será de 120 bytes. Sin embargo, puesto que 10 bytes de cada 120 bytes se reservan para otro uso, sólo son utilizables 110 bytes. Por lo tanto, el tamaño de la trama principal será de 110 bytes.

Si el número de subtramas es 4 y si los tamaños de las subtramas son 50, 20, 20 y 20 respectivamente, la información de la posición inicial de las subtramas será 50, 70 y 90, pero no se podrá enviar información de la posición inicial de una subtrama inicial.

La figura 3 es un diagrama de bloques esquemático de una unidad de decodificación de audio 150 para procesar una señal de audio transmitida según una forma de realización de la presente invención.

Con referencia a la figura 3, una unidad de audio 150 comprende una unidad de comprobación de errores de cabecera 151, una unidad de extracción de parámetros de audio 152, una unidad de decisión de información de números de subtramas 153, una unidad de obtención de información de la posición inicial de las subtramas 154, una unidad de procesamiento de señales de audio 155, y una unidad de control de parámetros 156.

La unidad de decodificación de audio 150 recibe la información de sistema de la información de servicio de difusión de la unidad de decodificación de datos 140 y decodifica una señal de audio transmitida comprimida mediante un sistema de codificación de audio específico. Al decodificar la señal de audio transmitida, se busca preferentemente una palabra de sincronización dentro de la cabecera de la trama, se realiza una decodificación RS (Reed-Solomon), y entonces se puede decodificar información del interior de la trama principal. Al efectuar esta operación, para aumentar la fiabilidad de la decisión de la palabra de sincronización de la cabecera de la trama principal son aplicables diversos procedimientos.

Según una forma de realización de la presente invención, la unidad de comprobación de errores de la cabecera 151 comprueba si existen errores en la cabecera de la trama principal de una señal de audio transmitida. Al efectuar esta operación se pueden aplicar diversas formas de actuación para detectar el error.

Por ejemplo, se comprueba si existe un campo reservado en la cabecera de la trama principal. Si existe el campo reservado, se puede detectar un error comprobando si existe un valor específico.

Por ejemplo, se puede detectar un error comprobando si se cumple una condición de restricción de uso entre parámetros de audio. En particular, en el caso de que el modo información de canal sea estéreo, si se aplica estéreo paramétrico, se puede reconocer la existencia de un error. O, en el caso de que no se aplique la SBR, si se aplica estéreo paramétrico, se puede reconocer que existe un error. O si se aplican tanto el estéreo paramétrico como el MPEG surround, se puede reconocer que existe un error. Por lo tanto, si se reconoce la existencia de un error en la cabecera de la trama principal, se define que se ha detectado la palabra de sincronización errónea.

La unidad de extracción de parámetros de audio 152 extrae parámetros de audio de la cabecera de la trama principal. En este caso, los parámetros de audio comprenden información de la frecuencia de muestreo, información que indica si se utiliza SBR, información de modo de canal, información que indica si se utiliza estéreo paramétrico, información de la configuración de MPEG surround, etc., que se han descrito con detalle con referencia a la figura 2.

La unidad de decodificación de la información del número de subtramas 153 define la información de las subtramas que configuran la trama principal utilizando los parámetros de audio procedentes de la unidad de extracción de parámetros de audio 152. Por ejemplo, la información de la frecuencia de muestreo DAC y la información que indica si se utiliza SBR se usan como parámetros de audio.

La unidad de obtención de información de la posición inicial de las subtramas 154 obtiene información de la posición inicial de cada subtrama utilizando la información del número de subtramas emitida desde la unidad de descodificación de la información del número de subtramas 153. En este caso, la información de la posición inicial de la subtrama inicial dentro de la trama principal se puede proporcionar como información predefinida en lugar de ser transmitida. Por ejemplo, la información predefinida puede comprender la información de la tabla definida basándose en la longitud de la cabecera de la trama principal. En caso de que se utilice la información de la posición inicial obtenida de cada subtrama, si se produce un error en una parte arbitraria de la trama principal, puede evitar que se pierdan otros datos.

La unidad de control de parámetros 156 comprueba si se cumple o no la condición de restricción de uso mutuo entre los parámetros de audio extraídos por la unidad de extracción de parámetros de audio 152. Por ejemplo, si tanto la información de estéreo paramétrico como la información de MPEG surround se insertan en la señal de audio, se pueden utilizar ambos. Sin embargo, si sólo se utiliza uno de ellos, el otro puede ser ignorado.

El MPEG surround puede convertir 1 canal en 5.1 canales (modo 515) o 2 canales en 5.1 canales (modo 525). En caso de mono según la información de modo de canal, se puede utilizar el modo 515. En caso de estéreo, se puede utilizar el modo 525. La información de configuración del MPEG surround se puede configurar basándose en información de perfil de la señal de audio. Por ejemplo, si un nivel de perfil de MPEG surround es 2 ó 3, es capaz de utilizar canales hasta 5.1 canales como canales de salida. Por lo tanto, los parámetros de audio se pueden utilizar de forma selectiva.

La unidad de procesamiento de señales de audio 155 selecciona un códec adecuado según la información de control de parámetros emitida desde la unidad de control de parámetros 156 y puede procesar eficientemente la señal de audio utilizando la información de la posición inicial de las subtramas procedente de la unidad de obtención de información de la posición inicial de las subtramas 154.

La figura 4 es un diagrama para explicar un proceso para insertar información de regeneración en un flujo de bits de audio y procesarla en una unidad de decodificación según una forma de realización de la presente invención.

Con referencia a la figura 4, al transmitir de forma temporalmente consecutiva datos tales como una señal de audio, no es preferible que se produzca una sección discontinua en medio de la transmisión hacia el lado receptor. La sección discontinua se genera por varias razones, incluidas un error de flujo debido a un error de transmisión, un cambio en el entorno que requiera un restablecimiento de un decodificador (por ejemplo cambio de frecuencia de

muestreo, cambio de códec, etc.), un cambio de canal debido a una selección de usuario, etc.

En el caso de que una selección de usuario cambie un canal o programa, se genera el silenciamiento de la señal de audio dentro de una sección de intervalo temporal conforme al cambio de canal. Es insignificante que la sección sea corta. No obstante, en el caso de que el cambio del entorno que requiere un restablecimiento del decodificador sea necesario, se genera una distorsión innecesaria en el lado receptor si la posición correspondiente es inadecuada.

En la transmisión de señales digitales para un servicio de difusión, se definen una pluralidad de códecs para utilizar un códec conveniente de acuerdo con una selección para una estación de difusión y a continuación se utilizan selectivamente. En el servicio de difusión A/V que utiliza una pluralidad de códecs, si se produce un caso de cambio de códec en el curso de la difusión correspondiente, un dispositivo de decodificación para el códec correspondiente normalmente efectúa un restablecimiento y es necesario efectuar una nueva decodificación utilizando un códec nuevo. En particular, para cambiar de códec sin efectuar el restablecimiento, diversos códec se encuentran siempre en modo de espera para poder hacer frente al caso de un cambio de códec para cada subtrama.

Por lo tanto, según una forma de realización de la presente invención, se puede insertar información de regeneración en la cabecera de una trama principal que configura una señal de audio. En este caso, la información de regeneración puede corresponder a la información que indica si la señal de audio se procesará utilizando información nueva diferente de la información de la trama principal actual o la subtrama actual.

Según una forma de realización de la presente invención, la información de regeneración se puede colocar para proporcionar información de marca de punto de regeneración que indica que hay regeneración disponible en la posición adecuada. En este caso, la información de marca de punto de regeneración se puede generar o proveer de diversas maneras. Por ejemplo, hay un procedimiento de notificación de la presencia de regeneración disponible para cada subtrama correspondiente, un procedimiento de notificación de que se inicia una sección regenerable a partir de la subtrama actual y de cuántas secciones existirán, un procedimiento de notificación del principio y el final de un punto regenerable, y similares. Además, puede existir un procedimiento para incluir información adicional que indique la razón o el nivel de la regeneración. Por ejemplo, la información adicional comprende información, por ejemplo, de un cambio de código, de un cambio de frecuencia de muestreo, de un cambio de número de canales de audio, etc. Y la información de regeneración puede ser el concepto que comprende toda la información asociada con la regeneración.

Aunque no exista una razón como un cambio de código, si existe una sección silenciosa a lo largo de la longitud de una subtrama de una señal de audio, la información de regeneración asociada se puede transmitir con un intervalo adecuado. Un dispositivo de decodificación utiliza eficientemente la información de una sección para un mantenimiento como, por ejemplo, alineación temporal para sincronía labial A/V, mejorando la cualidad de los contenidos de difusión.

Según una forma de realización de la presente invención, se describe un ejemplo de un momento en el que una señal de audio original que se debe difundir está a punto de introducir música a través de una sección de voz de un locutor de continuidad o un DJ. En particular, suponiendo que una sección de comentario utilice un códec HE-AAC V2 de 2 canales y que la música utilice un códec envolvente AAC+MPEG, un dispositivo de decodificación entre las dos secciones necesita cambiar su códec para decodificar. En este caso, si existe una sección silenciosa entre las dos secciones, la marca de punto de regeneración (RPF) de la subtrama del interior de la sección silenciosa se fija en 1 para ser transmitida. Esto se debe a que si tiene lugar una situación de cambio de código en un valor significante de contenidos de audio, es decir, en una sección en la cual existe sonido, se genera distorsión debido a la desconexión. Por lo tanto, puede ser preferible que la información de regeneración se inserte en una sección relativamente insignificante.

Mientras realiza la decodificación mediante un códec HE-AAC V2 de 2 canales, el dispositivo de decodificación comprueba si se debe realizar regeneración en el punto temporal en el cual la marca de punto de regeneración se ha cambiado a 1. En este caso, se confirma un cambio de códec a través de otra información adicional y se realiza la preparación para descargar un códec nuevo etc. con el fin de efectuar la decodificación mediante un nuevo códec (envolvente AAC/MPEG). El cambio se puede realizar mientras la marca de punto de regeneración es 1. Una vez completada la operación de regeneración, se inicia la decodificación con el nuevo códec.

Puesto que no es posible emitir una señal decodificada a través del DAC durante la sección de regeneración, se puede emitir una señal en modo silenciado. Al transmitirse la información que presenta la marca de punto de regeneración fijada en 1 dentro de la sección silenciosa, el corte o distorsión de la señal emitida del dispositivo decodificador no es sensible aunque la señal silenciada se emita mientras la marca de punto de regeneración está fijada en 1.

La figura 5 es un diagrama de bloques que ilustra diversos ejemplos de un procedimiento de transmisión de información de regeneración según una forma de realización de la presente invención.

La figura 5(a) es un diagrama que ilustra un procedimiento de transmisión de inserción de información de punto de

regeneración (bsRefreshPoint) en una subtrama.

Con referencia a la figura 5(a), por ejemplo, es posible asignar 1 bit a una subtrama. Si la información de punto de regeneración es 1, la subtrama correspondiente puede ser regenerable.

La figura 5(b) es un diagrama que ilustra un procedimiento de transmisión de inserción de información de inicio de la regeneración (bsRefreshStart) en una subtrama e inserción de duración de la regeneración (bsRefreshDuration) que indica la duración disponible para realizar la regeneración si se aplica regeneración.

Con referencia a la figura 5(b), la información de inicio de regeneración puede existir en forma de 1 bit básico en una subtrama. Si este valor es 1, se pueden transmitir adicionalmente n bits. En este caso, la realización de la regeneración puede estar disponible para la subtrama correspondiente hasta un número de subtramas que asciende al número correspondiente a la información de la duración de la regeneración. Un dispositivo de decodificación puede reconocer el número de secciones disponibles para regeneración que existen.

La figura 5(c) es un diagrama que ilustra un procedimiento de transmisión de la inserción de información de punto de regeneración (bsRefreshPoint) que indica información de regeneración disponible e información de cese de la regeneración (bsRefreshStop) para detener la regeneración en una subtrama.

Con referencia a la figura 5(c), en una subtrama existen 2 bits de información de punto de regeneración e información de cese de regeneración. Si la información de punto de regeneración es 1, significa que la regeneración está disponible para la subtrama actual. Si la información de punto de regeneración no está fijada en 1, se puede reconocer anticipadamente que la información de punto de regeneración es 1 en la subtrama siguiente. Para que la información de punto de regeneración esté fijada en 0 en la trama siguiente, la información de cese de regeneración en la trama actual debería estar fijada en 1.

La figura 6 es un diagrama (a) para ilustrar un procedimiento de transmisión de información de la razón de la regeneración, y un diagrama (b) para ilustrar ejemplos de información de la razón de la regeneración.

Con referencia a la figura 6(a), en el caso de una subtrama cuya información de punto de regeneración está fijada en 1, la información de fuente (bsRefreshSource) correspondiente a su razón de regeneración se puede transmitir como m bits adicionales. El protocolo para un valor de fuente y un número de bits m se puede negociar anticipadamente entre los dispositivos de codificación y decodificación. Por ejemplo, se puede realizar el mapeado representado en la figura 6(b).

La figura 7 es un diagrama (a) que ilustra un procedimiento de transmisión de información de nivel para proveer prolongabilidad de regeneración, y un diagrama de ejemplo de información de nivel.

Con referencia a la figura 7(a), para una subtrama cuya información de punto de regeneración está fijada en 1, se puede transmitir información de nivel mínimo solicitada por un dispositivo de decodificación en forma de k bits adicionales. Por ejemplo, se puede acordar el nivel como en la figura 7(b).

Las diversas formas de realización descritas anteriormente se han combinado entre sí para transmitirlas de forma compleja.

A continuación se describirán de forma detallada otras formas de realización de la presente invención.

En un sistema de codificación de una señal de audio multicanal, la eficiencia de la señal de audio se puede mejorar de forma efectiva utilizando una señal de audio comprimida (por ejemplo, señal de audio estéreo, señal de audio mono) e información secundaria de baja velocidad (por ejemplo información espacial).

El MPEG surround para codificar multicanales utilizando un parámetro de información espacial comprende conceptualmente una técnica de codificación de una señal estéreo utilizando este parámetro como estéreo paramétrico. Sin embargo, surge el problema de que la compatibilidad del flujo de bits entre el MPEG surround y el estéreo paramétrico no es fácil de conseguir debido a la diferencia de definiciones sintácticas, la diferencia de características técnicas, y similares. Por ejemplo, es imposible decodificar un flujo de bits codificado mediante estéreo paramétrico utilizando un decodificador de MPEG surround, y viceversa. En este caso, el sistema de codificación de MPEG surround y el sistema de codificación paramétrico sólo tienen carácter de ejemplo. Y la presente invención es aplicable a otros sistemas de codificación.

Para resolver el problema, la presente invención propone un procedimiento de generación de un flujo de bits adecuado para un formato de una señal de salida. Por ejemplo, tenemos un caso en el que un flujo de bits A se convierte en un flujo de bits B que se debe transmitir o almacenar. En este caso, si ya existe un canal de transporte

o decodificador compatible con el flujo de bits B, se mantiene la compatibilidad añadiendo un convertidor. Se puede dar el caso de que un decodificador capaz de decodificar el flujo de bits B intente decodificar el flujo de bits A. Esta es la estructura adecuada para configurar un decodificador capaz de decodificar tanto el flujo de bits A como el flujo de bits B modificando parcialmente el decodificador correspondiente al flujo de bits B. A continuación se describen detalles de estas formas de realización con referencia a los dibujos adjuntos.

La figura 8 es un diagrama de bloques esquemático de un sistema para que exista compatibilidad entre el flujo de 5 bits A y el flujo de bits B según una forma de realización de la presente invención.

Con referencia a la figura 8, de un sistema para que exista compatibilidad entre el flujo de bits A y el flujo de bits B según una forma de realización de la presente invención comprende una unidad de demultiplexación A 810, una unidad de conversión de A a B 830, una unidad de multiplexación B 850, y una unidad de control 870.

10 La unidad de conversión de A a B 830 puede comprender una primera unidad de conversión 831 que convierte la información que requiere un proceso de conversión para generar un flujo de bits nuevo y una segunda unidad de conversión 833 que convierte la información secundaria necesaria para complementar la información.

15 En el caso de intentar decodificar un flujo de bits codificado mediante un primer sistema de codificación utilizando un decodificador adecuado para un segundo sistema de codificación, se supone que el primer y segundo sistemas de codificación son, por ejemplo, respectivamente sistema estéreo paramétrico y sistema MPEG surround.

La unidad de demultiplexación A 810 recibe un flujo de bits codificado por el sistema estéreo paramétrico y a

20 continuación separa la información de parámetros y la información secundaria que configura el flujo de bits. La información separada se transfiere seguidamente a la unidad convertidor de A a B 830.

La unidad de conversión de A a B 890 puede realizar un trabajo para convertir el flujo de bits estéreo paramétrico recibido a flujo de bits MPEG surround.

25 Y, la información de parámetros y la información secundaria transmitida por la unidad de demultiplexación A 810 se pueden transferir respectivamente a la primera unidad de conversión 831 y a la segunda unidad de conversión 833.

La primera unidad de conversión 831 es capaz de convertir la información de parámetros transmitida. En este caso,

30 la información de parámetros transmitida puede comprender diversas clases de información de parámetros necesaria para configurar un flujo de bits codificado mediante el sistema estéreo paramétrico.

Por ejemplo, las diversas clases de información de parámetros pueden comprender información IID (diferencia de intensidad entre canales), información IPD (diferencia de intensidad entre canales), información IPD (fiferencia de

35 fase entre canales) e información OPD (diferencia de fase global), información ICC (coherencia entre canales) y similares. En este caso, la información IID significa niveles relativos de una señal de banda limitada. La información IDP y la información OPD indican una diferencia de fase de la señal de banda limitada. Y la información ICC indica correlación entre una señal de banda limitada izquierda y una señal de banda limitada derecha.

40 En este caso, la información de parámetros que la primera unidad de conversión 831 intenta convertir comprende información de parámetros para aplicar el sistema MPEG surround. En particular, la información de parámetros puede corresponder a parámetros tales como información espacial y similares. Por ejemplo, la información de parámetros puede comprender CLD (diferencia de nivel de canales) que indica una diferencia de energía entre canales, ICC (coherencia entre canales) que indica correlación entre canales, CPC (coeficientes de predicción de

45 canales) utilizado e la generación de tres canales a partir de dos canales, y similares.

Así, la primera unidad de conversión 831 puede realizar la conversión de parámetros utilizando las relaciones correspondientes entre la información de parámetros requerida para el sistema de estéreo paramétrico y la información de parámetros requerida para sistema MPEG surround. Esto se describirá con detalle más adelante en

50 relación con la figura 10.

La segunda unidad de conversión 833 es capaz de convertir información secundaria transmitida por la unidad de demultiplexación A 810. En la información secundaria, se puede transferir directamente información secundaria en un formato compatible con el flujo de bits B a la unidad de multiplexación B 850 sin un proceso de conversión

55 especial. En este caso, puede ser necesario un simple trabajo de mapeado. Por ejemplo puede ser información de cuadrícula tiempo/frecuencia o similar.

No obstante, se puede procesar diferencialmente información incompatible. Por ejemplo, se puede descartar información innecesaria para el proceso de decodificación del flujo de bits B. La información que necesita estar

60 representada en otro formato para decodificar el flujo de bits B, se somete a un proceso de conversión y a continuación se transfiere a la unidad de multiplexación B 850.

La unidad de multiplexación B 850 es capaz de configurar el flujo de bits B utilizando la información de parámetros transferida de la primera unidad de conversión 831 y la información secundaria transferida de la segunda unidad de

65 conversión 833.

En este caso, la unidad de control 870 recibe información de control necesaria para la conversión mediante el segundo sistema de codificación y a continuación controla la operación de la unidad de conversión de A a B 830. Por ejemplo, la operación de la unidad de conversión de A a B 830 puede variar según el ajuste de una variable de control definida correspondientemente a la velocidad/calidad etc. de los datos de destino para el formato del flujo de bits B.

En particular, si la velocidad de los datos de un flujo de bits de estéreo paramétrico es superior a la de un flujo de bits de MPEG surround, se puede efectuar parcialmente una abreviación sobre la información espacial. En este caso, la abreviación comprende un procedimiento de aniquilación, un procedimiento de sacar la media o similar.

En el caso de una dirección tiempo/frecuencia, se puede procesar bidireccionalmente o en una dirección. No obstante, en el caso de que la velocidad de los datos de destino sea superior a la de los datos de entrada, se puede añadir información. Para este propósito se encuentran disponibles diversos sistemas de dirección tiempo/frecuencia.

Además, puede existir información imposible de convertir en un proceso de conversión de parámetros. En este caso, la información imposible de convertir se omite o se sustituye de acuerdo con la representación en otro formato. En el caso de un factor que afecte considerablemente a la calidad de sonido, puede ser preferible que esta pseudoinformación se transfiera mediante sustitución.

Según otra forma de realización de la presente invención, se supone que el primer y el segundo sistemas de codificación son sistemas SAOC (codificación de objetos de audio espacial) y MPEG surround respectivamente.

El sistema SAOC es el sistema para generar una señal de objeto de audio independiente distinto de la generación de canales del MPEG surround. Por lo tanto, en el caso de intento de decodificación de un flujo de bits codificado mediante el sistema SAOC utilizando un decodificador adecuado para el sistema de codificación MPEG surround, es necesario convertir el flujo de bits codificado mediante el sistema SAOC en un flujo de bits de MPEG surround.

La unidad de demultiplexación A 810 recibe el flujo de datos codificado mediante el sistema SAOC y es capaz de separar información de parámetros e información secundaria del flujo de datos recibido. La información separada se transfiere a la unidad de conversión de A a B 830.

La unidad de conversión de A a B 830 es capaz de realizar un trabajo de conversión del flujo de bits de SAOC recibido en un flujo de bits de MPEG surround.

La información de parámetros y secundaria transferida desde la unidad de multiplexación A 810 se puede transferir a la primera y la segunda unidades de conversión 831 y 833, respectivamente.

La primera unidad de conversión 831 es capaz de convertir la información de parámetros transferida. En este caso, la información de parámetros transferida puede comprender información de parámetros necesaria para configurar un flujo de bits codificado mediante SAOC. Por ejemplo, la información de parámetros se puede asociar con una señal de objeto de audio. En este caso, la señal de objeto de audio puede comprender una fuente de sonido individual o mezclas complejas de varios sonidos. Y, la señal de objeto de audio se puede configurar con canales de entrada mono o estéreo.

En este caso, la información de parámetros que la primera unidad de conversión 831 intenta convertir puede comprender información de parámetros para aplicar el sistema MPEG surround. Por lo tanto, la primera unidad de conversión 831 puede efectuar la conversión de parámetros utilizando la correspondencia entre la información de parámetros necesitada por el sistema MPEG surround y la información de parámetros necesitada por el sistema SAOC.

La primera unidad de conversión 831 puede comprender una unidad de renderización (no representada en el dibujo). En este caso "renderización" puede significar que un decodificador genera una señal de canal de salida utilizando una señal de objeto. En el caso de recepción de por lo menos una señal de reducción de mezcla y un flujo de información secundaria, la unidad de renderización puede transformar señales de objeto para generar el número deseado de canales de salida. En este caso, los parámetros de la unidad de renderización para transformar las señales de objeto se pueden controlar mediante interactividad con el usuario.

La segunda unidad de conversión 833 puede convertir la información secundaria transferida desde la unidad de demultiplexación A 810. En la información secundaria, la información secundaria en un formato compatible con el flujo de bits B se puede transferir directamente a la unidad de multiplexación B 850 sin ningún proceso de conversión inicial. En este caso, puede ser necesario un simple trabajo de mapeado. No obstante, la información incompatible se puede procesar de un modo diferente. Por ejemplo, se puede descartar la información innecesaria para el proceso de decodificación del flujo de bits de MPEG surround. La información que se debe representar en otro formato para decodificar el flujo de bits de MPEG surround se somete a un proceso de conversión y a continuación se transfiere a la unidad de multiplexación B 850.

La unidad de multiplexación B 850 puede configurar el flujo de bits B utilizando la información de parámetros transferida desde la primera unidad de conversión 831 y la información secundaria transferida de la segunda unidad de conversión 833.

En este caso, la unidad de control 870 recibe la información de control necesaria para la conversión mediante el segundo sistema de codificación y a continuación controla la operación de la unidad de conversión de A a B 830. Por ejemplo, la operación de la unidad de conversión de A a B 830 puede variar de acuerdo con el ajuste de una variable de control definida correspondientemente a la velocidad/calidad etc. de los datos de destino para el formato del flujo de bits B.

En particular, si la velocidad de los datos de un flujo de bits de SAOC es superior a la del flujo de MPEG surround, se puede efectuar parcialmente la abreviación sobre la información espacial.

Según otra forma de realización de la presente invención, se propone otra estructura de la unidad de conversión de A a B 830. Y, se puede añadir una señal de audio básica como señal introducida en la unidad de conversión de A a B 830. La señal de audio básica es una señal utilizable en la unidad de conversión de A a B 830.

Por ejemplo, en el caso de que el flujo de bits A sea un flujo de bits de MPEG surround, la señal de audio básica puede ser una señal de reducción de mezcla. En el caso de que el flujo de bits A sea un flujo de bits de estéreo paramétrico, la señal de audio básica puede ser una señal mono. Utilizando la señal de audio básica, es posible reforzar la información inespecífica o insuficiente en un proceso de conversión de flujos de bits.

La figura 9 es un diagrama de bloques esquemático de un sistema para compatibilidad entre el flujo de bits A y el flujo de bits B según otra forma de realización de la presente invención.

Con referencia a la figura 9, el sistema es aplicable en el caso de que el decodificador capaz de decodificar el flujo de bits B reciba y decodifique el flujo de bits A. Modificando parcialmente el decodificador correspondiente al flujo de bits B, es sistema es adecuado para configurar un decodificador capaz de decodificar tanto el flujo de bits A como el flujo de bits B.

En particular, el sistema comprende una unidad de demultiplexación A 810, una unidad de conversión de A a B 830, una unidad de multiplexación B 910, y una unidad de decodificación 930. A diferencia del sistema anteriormente descrito de la figura 8, el presente sistema no necesita efectuar ningún empaquetamiento en el formato del flujo de bits. Por lo tanto, la unidad de multiplexación B 810 y la unidad de control 870 representadas en la figura 8 pueden no ser necesarias.

Las funciones y operaciones de la unidad de demultiplexación A 810, la primera unidad de conversión 831 y la segunda unidad de conversión 833 son similares a las descritas en la figura 8. Puesto que las salidas de la primera y la segunda unidades de conversión 831 y 832 se pueden introducir directamente en la unidad de decodificación 930, esta forma de realización puede resultar más eficiente en el aspecto de la cantidad de operación que la forma de realización anterior. En este caso, la unidad de decodificación B 930 puede necesitar ser parcialmente modificada para recibir y procesar datos en un formato intermedio diferente del flujo de bits B.

En caso de recibir el flujo de bits B, por ejemplo, si el flujo de bits B es un flujo de bits de MPEG surround, la información de parámetros espaciales y su información secundaria se envían a la unidad de decodificación B 930. En este caso, la unidad de decodificación B 930 puede decodificar directamente el flujo de bits B. Mediante el procedimiento de decodificación anteriormente descrito, es posible decodificar tanto el flujo de bits en el formato A como el flujo de bits en el formato B.

La figura 10 es un diagrama de ejemplo de una información de parámetros transformada en el curso de la conversión de una señal de estéreo paramétrico en una señal de MPEG surround según una forma de realización de la presente invención.

Con referencia a la figura 10, suponiendo que el primer y el segundo sistemas de codificación son él estéreo paramétrico y el MPEG surround respectivamente, un flujo de bits codificado mediante el primer sistema de codificación debe ser decodificado por un decodificador adecuado para el segundo sistema de codificación.

La primera unidad de conversión 831 representada en la figura 8 o la figura 9, puede efectuar la transformación de un parámetro utilizando la correspondencia entre la información de parámetros requerida por el sistema estéreo paramétrico y la información de parámetros requerida por el sistema MPEG surround. Esto se puede aplicar analógicamente al caso de que el primer y el segundo sistemas de codificación son el sistema MPEG surround y el sistema estéreo paramétrico respectivamente.

La información IID entre parámetros del estéreo paramétrico se puede transformar en información CLD como un parámetro de MPEG surround. Un valor de la "cuadrícula por defecto IID" representada en la figura 10 significa información de índices y un valor de "Valor" significa un valor de IID real. Y, la información de CLD correspondiente indica la información de índices transformada utilizando un cuantificador preciso o un cuantificador aproximado. En la transformación utilizando el cuantificador aproximado, pueden ser necesarios recursos aparte para la parte coloreada representada en la figura 10. Y la información ICC corresponde a la información de parámetros de estéreo paramétrico o de MPEG surround para una coincidencia de 1:1.

Aplicabilidad industrial

En consecuencia, la presente invención puede proporcionar un medio para almacenar datos al cual se aplica por lo menos una de las características de la presente invención.

10 Aunque la presente invención ha sido descrita e ilustrada en la presente memoria con referencia a las formas de realización preferidas de la misma, resultará obvio para los expertos en la materia que se pueden efectuar diversas modificaciones y variaciones sin apartarse por ello del marco de la invención. Por lo tanto, se pretende que la presente invención comprenda las modificaciones y variaciones de esta invención comprendidas en el marco de las

15 reivindicaciones adjuntas.

Claims

REIVINDICACIONES

1. Procedimiento de procesamiento de una señal de audio que comprende:

5 recibir un flujo de bits correspondiente a la señal de audio, en el que la señal de audio comprende una trama principal que contiene una cabecera y una pluralidad de subtramas;

extraer de la cabecera información de la frecuencia de muestreo e información que indica si se utiliza replicación de la banda espectral, SBR;

decidir un número de subtramas incluidas en la trama principal utilizando la información de la frecuencia de muestreo y la información que indica si se utiliza SBR;

obtener la información de la posición inicial de la subtrama a partir de la cabecera basándose en el número de 15 subtramas; y

procesar la señal de audio basándose en la información de la posición inicial de la subtrama,

en el que la información de la posición inicial de la subtrama representa un número de bytes en el flujo de bits.
2. Procedimiento según la reivindicación 1, que comprende además extraer información del modo de canal, información que indica si se utiliza estéreo paramétrico, e información de la configuración de MPEG surround, en el que la señal de audio se procesa además mediante decodificación basándose en la información del modo de canal, la información que indica si se utiliza estéreo paramétrico, y la información de la configuración de MPEG surround.
3.

Procedimiento según la reivindicación 2, en el que se utiliza estéreo paramétrico cuando se utiliza la SBR y si el modo de canal es mono.
4.

Procedimiento según la reivindicación 2, en el que se decide la información de configuración MPEG surround como uno de diversos modos basándose en la información de perfil.
5.

Procedimiento según la reivindicación 4, en el que si la señal de audio comprende información de datos para estéreo paramétrico e información de datos para MPEG surround de acuerdo con la información que indica si se utiliza estéreo paramétrico y la información de la configuración de MPEG surround, se puede utilizar o bien la

35 información de datos para estéreo paramétrico o bien información de datos para MPEG surround y el resto se ignora.
6.

Procedimiento según la reivindicación 1, que comprende además:

deducir la información del tamaño de la subtrama a partir de la información de la posición inicial de la subtrama.
7.

Procedimiento según la reivindicación 1, en el que se decide el tamaño de la trama principal utilizando un número de paquetes requerido para transportar la trama principal.

45 8. Procedimiento según la reivindicación 1, en el que el número de muestras por canal de la subtrama tiene un valor constante para compatibilizar con la información de longitud temporal de la subtrama y en el que se calcula la información de longitud temporal de la subtrama a partir de un valor específico de la trama principal con respecto al tiempo y al número de subtramas.
9.

Procedimiento según la reivindicación 1, en el que la trama principal corresponde a un valor específico con respecto al tiempo.
10.

Procedimiento según la reivindicación 1, que comprende además extraer información de comprobación de

errores de la subtrama de acuerdo con el número de subtramas. 55
11. Receptor de difusión digital (100) que comprende:

una unidad de sintonización (130) configurada para recibir un flujo de difusión correspondiente a una señal de audio, en el que la señal de audio comprende una trama principal que incluye una cabecera y una pluralidad de subtramas; y

una unidad de decodificación de audio (150) configurada para:

extraer de la cabecera información de frecuencia de muestreo e información que indica si se utiliza 65 replicación de banda espectral, SBR;

decidir un número de subtramas incluidas en la trama principal utilizando la información de frecuencia de muestreo y la información que indica si se utiliza SBR;

obtener información de la posición inicial de la subtrama a partir de la cabecera basándose en el número de 5 subtramas; y

procesar la señal de audio basándose en la información de la posición inicial de la subtrama,

en el que la información de la posición inicial de la subtrama representa un número de bytes en el flujo de bits. 10