ES2383217T3

ES2383217T3 - Codificador, descodificador y métodos para codificar y descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo

Info

Publication number: ES2383217T3
Application number: ES07856467T
Authority: ES
Inventors: Ralf Geiger; Max Neuendorf; Yoshikazu Yokotani; Nikolaus Rettelbach; Juergen Herre; Stefan Geyersberger
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2006-12-12
Filing date: 2007-12-07
Publication date: 2012-06-19
Anticipated expiration: 2027-12-07
Also published as: US20170249952A1; US9355647B2; US10714110B2; WO2008071353A2; US8818796B2; US9043202B2; BRPI0718738A8; ZA200903159B; US20230154475A1; US11961530B2; EP2052548B1; TWI363563B; IL198725A; CN101589623A; IL198725A0; BRPI0718738A2; KR20090085655A; NO342080B1; CN102395033A; NO20092506L

Abstract

Aparato para descodificar segmentos de datos que representan una corriente de datos de dominio detiempo, codificándose uno o más segmentos de datos en el dominio de tiempo, codificándose uno o mássegmentos de datos en el dominio de frecuencia teniendo bloques de datos sucesivos que representan bloquessucesivos y superpuestos de las muestras de datos de dominio de tiempo, comprendiendo el aparato:un descodificador de dominio de tiempo para descodificar un segmento de datos que se codifica en eldominio de tiempo;un procesador para procesar los segmentos de datos que se codifican en el dominio de frecuencia y losdatos de salida del descodificador de dominio de tiempo para obtener bloques de datos de dominio detiempo de tal manera que bloques de datos de dominio de tiempo obtenidos basándose en segmentos dedatos posteriores que se codifican en el dominio de frecuencia se superponen; yde tal manera que bloques de datos de dominio de tiempo consecutivos de los que uno se codifica en eldominio de frecuencia y de los que uno se codifica en el dominio de tiempo se superponen; yun combinador de superposición/suma para combinar los bloques de datos de dominio de tiemposuperpuestos para obtener los segmentos de datos descodificados de la corriente de datos de dominio detiempo;en el que el combinador de superposición/suma está adaptado para aplicar pesos según funcionesventana de síntesis a bloques de datos de dominio de tiempo superpuestos,en el que la función ventana de síntesis está adaptada a un tamaño de una región de superposición debloques de datos de dominio de tiempo superpuestos consecutivos,en el que una ventana con un tamaño de superposición reducido se aplica a un bloque de datos dedominio de tiempo codificado en el dominio de frecuencia cuando se cambia del dominio de frecuencia aldominio de tiempo;en el que un tamaño de una región de superposición de dos bloques de datos de dominio de tiempoconsecutivos que se codifican en el dominio de frecuencia es mayor que un tamaño de una región desuperposición de dos bloques de datos de dominio de tiempo consecutivos de los cuales uno se codificaen el dominio de frecuencia y uno se codifica en el dominio de tiempo.

Description

Codificador, descodificador y métodos para codificar y descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo

La presente invención se refiere al campo de la codificación, en la que se utilizan diferentes características de datos que van a codificarse para tasas de codificación, como por ejemplo, en codificación de vídeo y audio.

Las estrategias de codificación del estado de la técnica pueden hacer uso de características de una corriente de datos que va a codificarse. Por ejemplo, en codificación de audio, se utilizan modelos perceptivos a fin de comprimir los datos de origen casi sin disminuir la calidad y la degradación perceptibles cuando vuelven a reproducirse. Los esquemas de codificación de audio perceptivos modernos, tales como, por ejemplo, MPEG-2/4 AAC (MPEG = Moving Pictures Expert Group (Grupo experto en imágenes en movimiento), AAC = Advanced Audio Coding (Codificación de audio avanzada), cf. Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding, Norma Internacional 13818-7, ISO/IEC JTC1/SC29/WG11 Moving Pictures Expert Group, 1997, pueden utilizar bancos de filtros tales como, por ejemplo, la transformada de coseno discreta modificada) (MDCT), para representar la señal de audio en el dominio de frecuencia.

En el dominio de frecuencia la cuantificación de los coeficientes de frecuencia puede llevarse a cabo según un modelo perceptivo. Tales codificadores pueden proporcionar una excelente calidad de audio perceptivo para tipos generales de señales de audio como, por ejemplo, música. Por otra parte, los codificadores de voz modernos tales como por ejemplo, ACELP (ACELP = Algebraic Code Excited Linear Prediction (Predicción lineal excitada por código algebraico)), utilizan un enfoque predictivo y, de esta manera, pueden representar la señal de audio/voz en el dominio de tiempo. Tales codificadores de voz pueden modelar las características del proceso de producción de voz humana, es decir, del tracto vocal humano y, por consiguiente, logran un excelente rendimiento para señales de voz a bajas tasas de bits. Por el contrario, los codificadores de audio perceptivo no logran el nivel de rendimiento ofrecido por los codificadores de voz para señales de voz codificadas a bajas tasas de bits y el uso de codificadores de voz para representar señales de audio/música en general da como resultado significativos deterioros de calidad. Los conceptos convencionales proporcionan una combinación estratificada en la cual siempre se encuentran activos todos los codificadores parciales, es decir, los codificadores de dominio de tiempo y de dominio de frecuencia, y la señal de salida final se calcula combinando las contribuciones de los codificadores parciales para una trama de tiempo procesada dada. Un ejemplo popular de codificación estratificada es la codificación de voz/audio escalable MPEG-4 con un codificador de voz como capa base y una capa de mejoramiento basada en banco de filtros, cf. Bernhard Grill, Karlheinz Brandenburg, “A Two-or Three-Stage Bit-Rate Scalable Audio Coding System”, Número de preimpresión 4132, 99ª Convención de AES (Septiembre 1995).

Los codificadores de dominio de frecuencia convencionales pueden hacer uso de bancos de filtros MDCT. La MDCT se ha convertido en un banco de filtros dominante para codificadores de audio perceptivo convencionales debido a sus ventajosas propiedades. Por ejemplo, puede proporcionar una atenuación transversal suave entre los bloques de procesamiento. Incluso si una señal en cada bloque de procesamiento se altera de manera diferente, por ejemplo, debido a la cuantificación de coeficientes espectrales, no se presentan artefactos de bloqueo debidos a transiciones bruscas de bloque a bloque debido a operaciones de superposición/suma a las que se ha aplicado la función ventana. La MDCT utiliza el concepto de anulación de solapamiento de dominio de tiempo (TDAC).

La MDCT es una transformada relativa a Fourier basándose en la transformada de coseno discreta tipo IV, con la propiedad adicional de estar solapada. Está diseñada para llevarse a cabo en bloques consecutivos de un conjunto de datos mayor, en donde los bloques posteriores se superponen de manera que la última mitad de un bloque coincide con la primera mitad del siguiente bloque. Esta superposición, además de una calidad de compactación de energía de la DCT, hace a la MDCT especialmente atractiva para aplicaciones de compresión de señal, dado que ayuda a evitar que dichos artefactos sean producto de los límites de bloque. Como transformada solapada, la MDCT no es muy habitual, comparada con otras transformadas relativas a Fourier, porque tiene la mitad de salidas que de entradas, en lugar del mismo número. En particular, 2N números reales se transforman en N números reales, donde N es un entero positivo.

La MDCT inversa también se conoce como IMDCT. Debido a que existen diferentes números de entradas y salidas, a primera vista puede parecer que la MDCT no debería poder invertirse. Sin embargo, se logra una capacidad de inversión perfecta agregando las IMDCT superpuestas de bloques superpuestos posteriores, provocando la anulación de los errores y la recuperación de los datos originales, es decir, logrando la TDAC.

Con esto, el número de valores espectrales en la salida de un banco de filtros es igual al número de valores de entrada de dominio de tiempo en su entrada, lo que también se denomina muestreo crítico.

Un banco de filtros de MDCT proporciona una selectividad de alta frecuencia y permite una alta ganancia de codificación. Las propiedades de la superposición de bloques y el muestreo crítico pueden lograrse utilizando la técnica de anulación de solapamiento de dominio de tiempo, cf. J. Princen, A. Bradley, “Analysis/Synthesis Filter Bank Design Based on Time Domain Aliasing Cancellation”, IEEE Trans. ASSP. ASSP-34 (5): 1153-1161, 1986. La figura 4 ilustra estos efectos de una MDCT. La figura 4 muestra una señal de entrada MDCT en términos de un impulso a lo largo de un eje 400 de tiempo en la parte superior. La señal 400 de entrada se transforma entonces mediante dos bloques de función ventana y MDCT consecutivos, en donde las ventanas 410 se ilustran debajo de la señal 400 de entrada en la figura 4. Las señales a las que se ha aplicado la función ventana individuales transformadas de vuelta se despliegan en la figura 4 mediante las líneas 420 y 425 de tiempo.

Después de la MDCT inversa, el primer bloque produce una componente 420 de solapamiento con signo positivo, el segundo bloque produce una componente 425 de solapamiento con la misma magnitud y un signo negativo. Las componentes de solapamiento se anulan entre sí después de la suma de las dos señales 420 y 425 de salida como se muestra en la salida 430 final en la parte inferior de la figura 4. En “Extended Adaptive Multi-Rate – Wideband (AMR-WB+) códec”, 3GPP TS 26.290V6.3.0, 2005-06, Especificación Técnica, se especifica el códec AMR-WB+ (AMR-WB = Ancho de banda de tasa múltiple adaptativo). Según la sección 5.2, el algoritmo de codificación en el núcleo del códec AMR-WB+ se basa en un modelo híbrido ACELP/TCX (TCX = Transform coded Excitation (Excitación codificada por transformada). Para cada bloque de una señal de entrada, el codificador decide, o bien en modo de bucle abierto o de bucle cerrado, qué modelo de codificación, es decir, ACELP o TXC, es mejor. El modelo ACELP es un codificador predictivo de dominio de tiempo más adecuado para señales de voz y transitorias. El codificador AMR-WB se utiliza en modos ACELP. Alternativamente, el modelo TCX es un codificador basado en transformada y es más apropiado para muestras de música típicas.

Específicamente, el AMR-WB+ utiliza una transformada de Fourier discreta (DFT) para el modo de codificación por transformada TCX. A fin de permitir una transición suave entre bloques adyacentes, se utiliza función ventana y superposición. Estas función ventana y superposición son necesarias tanto para transiciones entre diferentes modos de codificación (TCX/ACELP) como para tramas de TCX consecutivas. Por tanto, la DFT conjuntamente con la función ventana y la superposición, representan un banco de filtros que no está muestreado críticamente. El banco de filtros produce más valores de frecuencia que el número de nuevas muestras de entrada, cf. figura 4 en 3GPP TS 26.290V6.3.0 (3GPP = Third Generation Partnership Project (Proyecto de sociedad de tercera generación), TS = Technical Specification (Especificación técnica)). Cada trama de TCX utiliza una superposición de 1/8 de la longitud de trama que es igual al número de nuevas muestras de entrada. Por consiguiente, la longitud correspondiente de la DFT es 9/8 de la longitud de trama.

Considerando el banco de filtros de DFT no muestreado críticamente en TXC, es decir, el número de valores espectrales en la salida del banco de filtros es mayor que el número de valores de entrada de dominio de tiempo en su entrada, este modo de codificación de dominio de frecuencia es diferente de los códecs de audio tales como AAC (AAC = Advanced Audio Coding (Codificación de audio avanzada)), que utiliza una MDCT, una transformada solapada críticamente muestreada.

El códec Dolby E se describe en Fielder, Louis D.; Todd, Craig C., “The Design of a Video Friendly Audio Coding System for Distributing Applications”, Número de documento 17-008, The AES 17th International Conference: High-Quality Audio Coding, y Fielder, Louis D.; Davidson, Grant A., “Audio Coding Tools for Digital Television Distribution”, Número de preimpresión 5104, 108ª Convención del AES (Enero 2000). El códec Dolby E utiliza el banco de filtros de MDCT. En el diseño de esta codificación, se puso especial atención en la posibilidad de llevar a cabo edición en el dominio de codificación. Para lograr esto, se utilizan ventanas especiales sin solapamiento. En los límites de estas ventanas es posible una atenuación transversal uniforme o empalme de diferentes partes de señal. En los documentos antes referidos, se señala, por ejemplo, cf. Sección 3 de “The Design of a Video Friendly Audio Coding System for Distribution Applications”, que esto no sería posible simplemente utilizando las ventanas de MDCT habituales que introducen el solapamiento de dominio de tiempo. Sin embargo, también se describe que la eliminación del solapamiento se logra a costa de un mayor número de coeficientes de transformada, lo que indica que el banco de filtros resultante ya no tiene la propiedad de muestreo crítico.

El documento EP 1 396 844 A1 describe una compresión de audio con pérdidas y sin pérdidas unificada. El esquema de compresión de audio con pérdidas y sin pérdidas unificada combina compresión de audio con pérdidas y sin pérdidas dentro de una misma señal de audio. El enfoque emplea codificación sin pérdidas mezclada de una trama de transición entre tramas de codificación con pérdidas y sin pérdidas para producir transiciones sin interrupciones. La codificación sin pérdidas mezclada realiza una transformada solapada y una transformada solapada inversa para producir una trama de dominio de pseudotiempo plegada y a la que se ha aplicado la función ventana de manera apropiada, que entonces puede codificarse sin pérdidas. La codificación sin pérdidas mezclada también puede aplicarse a tramas que presentan un rendimiento de compresión con pérdidas malo.

Información de antecedentes técnicos adicional se facilita, por ejemplo, en el ártículo “Optimal Time Segmentation for Overlap-Add Systems with Variable Amount of Window Overlap” de O.A. Niamut y R. Heusdens (publicado en: IEEE Signal Processing Letters, Vol 12, n.o 10, octubre de 2005). Información de antecedentes técnicos adicional se facilita en los documentos US 2006/0247928 A1, US 6.226.608 B1, US 2005/0071402 A1 y US 5.987.407.

El objetivo de la presente invención es proporcionan un concepto más eficaz para codificar y descodificar segmentos de datos.

El objetivo se logra entre otros mediante un aparato de descodificación según la reivindicación 1, un método de descodificación según la reivindicación 25, un aparato para generar una corriente de datos codificados según la reivindicación 27 y un método para generar una corriente de datos codificados según la reivindicación 40.

La presente invención se basa en el hallazgo de que puede utilizarse un concepto de codificación y descodificación más eficaz utilizando codificadores, respectivamente descodificadores de dominio de tiempo y de dominio de frecuencia combinados. El problema del solapamiento de tiempo puede combatirse eficazmente transformando los datos de dominio de tiempo al dominio de frecuencia en el descodificador y combinando los datos de dominio de frecuencia transformados resultantes con los datos de dominio de frecuencia descodificados recibidos. Las sobrecargas pueden reducirse adaptando las regiones de superposición de ventanas superpuestas que se aplican a los segmentos de datos a cambios de dominio de codificación. El uso de ventanas con regiones de superposición más pequeñas puede ser beneficioso cuando se utiliza codificación de dominio de tiempo, respectivamente, cuando se cambia de o a codificación de dominio de tiempo.

Las realizaciones pueden proporcionar un concepto de codificación y descodificado de audio universal que logra un rendimiento mejorado para ambos tipos de señales de entrada tales como, las señales de voz y las señales de música. Las realizaciones pueden aprovecharse de la combinación de múltiples enfoques de codificación, por ejemplo, conceptos de codificación de dominio de tiempo y de dominio de frecuencia. Las realizaciones pueden combinar eficazmente conceptos de codificación basados en banco de filtros y basados en dominio de tiempo en un solo esquema. Las realizaciones pueden dar como resultado un códec combinado que puede ser capaz, por ejemplo, de cambiar entre un códec de audio para contenido de audio de tipo música y un códec de voz para contenido de tipo voz. Las realizaciones pueden utilizar este cambio frecuentemente, especialmente para contenido mezclado.

Las realizaciones de la presente invención pueden proporcionar la ventaja de que no se produce ningún artefacto de cambio. En las realizaciones, la cantidad de datos de transmisión adicionales o muestras codificadas adicionalmente, para un proceso de cambio puede minimizarse a fin de evitar una eficacia reducida durante esta fase de operación. Con esto, el concepto de combinación cambiada de codificadores parciales es diferente del de la combinación estratificada en la que siempre están activos todos los codificadores parciales. A continuación se describirán realizaciones de la presente invención en detalle utilizando las figuras adjuntas, en las cuales:

la figura 1a muestra una realización de un aparato de descodificación;

la figura 1b muestra otra realización de un aparato de descodificación;

la figura 1c muestra otra realización de un aparato de descodificación;

la figura 1d muestra otra realización de un aparato de descodificación;

la figura 1e muestra otra realización de un aparato de descodificación;

la figura 1f muestra otra realización de un aparato de descodificación;

la figura 2a muestra una realización de un aparato de codificación;

la figura 2b muestra otra realización de un aparato de codificación;

la figura 2c muestra otra realización de un aparato de codificación;

la figura 3a ilustra las regiones de superposición cuando se cambia entre codificación de dominio de frecuencia y de dominio de tiempo para la duración de una ventana;

la figura 3b ilustra las regiones de superposición cuando se cambia entre codificación de dominio de frecuencia y codificación de dominio de tiempo para una duración de dos ventanas;

la figura 3c ilustra múltiples ventanas con diferentes regiones de superposición;

la figura 3d ilustra la utilización de ventanas con diferentes regiones de superposición en una realización; y

la figura 4 ilustra la anulación de solapamiento de dominio de tiempo cuando se utiliza MDCT.

La figura 1a muestra un aparato 100 para descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo, codificándose un segmento de datos en un dominio de tiempo o en un dominio de frecuencia, codificándose un segmento de datos en el dominio de frecuencia teniendo bloques de datos sucesivos que representan bloques sucesivos y superpuestos de muestras de datos de dominio de tiempo. Esta corriente de datos, por ejemplo, podría corresponder a una corriente de audio, en la que algunos de los bloques de datos se codifican en el dominio de tiempo y otros se codifican en el dominio de frecuencia. Los bloques o segmentos de datos que se han codificado en el dominio de frecuencia pueden representar muestras de datos de dominio de tiempo de bloques de datos superpuestos.

El aparato 100 comprende un descodificador 110 de dominio de tiempo para descodificar un segmento de datos que se codifica en el dominio de tiempo. Además, el aparato 100 comprende un procesador 120 para procesar el segmento de datos que se codifica en el dominio de frecuencia y datos de salida del descodificador 110 de dominio de tiempo para obtener bloques de datos de dominio de tiempo superpuestos. Además, el aparato 100 comprende un combinador 130 de superposición/suma para combinar los bloques de datos de dominio de tiempo superpuestos para obtener los segmentos de datos descodificados de la corriente de datos de dominio de tiempo.

La figura 1b muestra otra realización del aparato 100. En las realizaciones, el procesador 120 puede comprender un descodificador 122 de dominio de frecuencia para descodificar segmentos de datos que se codifican en el dominio de frecuencia para obtener segmentos de datos de dominio de frecuencia. Además, en realizaciones, el procesador 120 puede comprender un convertidor 124 de dominio de tiempo a dominio de frecuencia para convertir los datos de salida del descodificador 110 de dominio de tiempo para obtener segmentos de datos de dominio de frecuencia convertidos.

Además, en realizaciones, el procesador 120 puede comprender un combinador 126 de dominio de frecuencia para combinar los segmentos de dominio de frecuencia y los segmentos de datos de dominio de frecuencia convertidos para obtener una corriente de datos de dominio de frecuencia. El procesador 120 puede comprender además un convertidor 128 de dominio de frecuencia a dominio de tiempo para convertir la corriente de datos de dominio de frecuencia en bloques de datos de dominio de tiempo superpuestos que a continuación pueden combinarse mediante el combinador 130 de superposición/suma.

Las realizaciones pueden utilizar un banco de filtros de MDCT como, por ejemplo, el utilizado en MPEG-4 AAC, sin ninguna modificación, especialmente sin abandonar la propiedad de muestreo crítico. Las realizaciones pueden proporcionar una eficacia de codificación óptima. Las realizaciones pueden lograr una transición suave a un códec de dominio de tiempo compatible con las ventanas de MDCT establecidas al tiempo que no introducen ningún artefacto de cambia y solamente una mínima sobrecarga.

Las realizaciones pueden mantener el solapamiento de dominio de tiempo en el banco de filtros e introducir de manera intencionada un solapamiento de dominio de tiempo correspondiente en las partes de señal codificadas por el códec de dominio de tiempo. Por tanto, las componentes resultantes del solapamiento de dominio de tiempo pueden anularse entre sí de la misma manera que lo hacen para dos tramas consecutivos de los espectros de MDCT.

La figura 1c ilustra otra realización de un aparato 100. Según la figura 1c, el descodificador 122 de dominio de frecuencia puede comprender una etapa 122a de recuantificación. Además, el convertidor 124 de dominio de tiempo a dominio de frecuencia puede comprender un banco de filtros modulado en coseno, una transformada solapada extendida, un banco de filtros de bajo retardo o un banco de filtros polifase. La realización mostrada en la figura 1c ilustra que el convertidor 124 de dominio de tiempo a dominio de frecuencia puede comprender una MDCT 124a.

Además, la figura 1c representa que el combinador 126 de dominio de frecuencia puede comprender un sumador 126a. Como se muestra en la figura 1c, el convertidor 128 de dominio de frecuencia a dominio de tiempo puede comprender un banco de filtros modulado en coseno, respectivamente una MDCT 128ª inversa. La corriente de datos que comprende el segmento de datos codificado de dominio de tiempo y codificado de dominio de frecuencia, puede generarse por un codificador lo que se detallará adicionalmente a continuación. El cambio entre la codificación de dominio de frecuencia y la codificación de dominio de tiempo puede lograrse codificando algunas partes de la señal de entrada con un codificador de dominio de frecuencia y algunas partes de señal de entrada con un codificador de dominio de tiempo. La realización del aparato 100 representado en la figura 1c ilustra la estructura de principio de un aparato 100 para descodificar correspondiente. En otras realizaciones, la recuantificación 122a y la transformada 128a de coseno discreta modificada inversa pueden representar un descodificador de dominio de frecuencia.

Como se indica en la figura 1c para partes de señal, cuando el descodificador 110 de dominio de tiempo toma el mando, la salida de dominio de tiempo del descodificador 110 de dominio de tiempo puede transformarse mediante la MDCT 124a directa. El descodificador de dominio de tiempo puede utilizar un filtro de predicción para descodificar los datos codificados de dominio de tiempo. En este caso, puede introducirse cierta superposición en la entrada de la MDCT 124a y, por tanto, cierta sobrecarga. A continuación se describirán realizaciones que reducen o minimizan esta sobrecarga.

En principio, la realización mostrada en la figura 1c comprende también un modo de operación en el que ambos códecs pueden operar en paralelo. En realizaciones, el procesador 120 puede estar adaptado para procesar un segmento de datos que se codifica en paralelo en el dominio de tiempo y en el dominio de frecuencia. De esta manera, la señal puede codificarse parcialmente en el dominio de frecuencia y parcialmente en el dominio de tiempo, de manera similar a un enfoque de codificación estratificada. Las señales resultantes se suman entonces en el dominio de frecuencia, comparando el combinador 126 de dominio de frecuencia. No obstante, las realizaciones pueden llevar a cabo un modo de operación que es cambiar exclusivamente entre los dos códecs y solamente tener preferiblemente un número mínimo de muestras en las que ambos códecs están activos a fin de obtener la eficacia mejor posible.

En la figura 1c, la salida del descodificador 110 de dominio de tiempo se transforma mediante la MDCT 124a, seguida de la MDCT 128a. En otra realización, estas dos etapas pueden combinarse ventajosamente en una sola etapa a fin de reducir la complejidad. La figura 1d ilustra una realización de un aparato 100 que ilustra este enfoque. El aparato 100 mostrado en la figura 1d ilustra que el procesador 120 puede comprender un calculador 129 para calcular los bloques de datos de dominio de tiempo superpuestos basándose en los datos de salida del descodificador 110 de dominio de tiempo. El procesador 120 o el calculador 129 pueden estar adaptados para reproducir una propiedad, respectivamente, una propiedad de superposición del convertidor 128 de dominio de frecuencia a dominio de tiempo basándose en los datos de salida del descodificador 110 de dominio de tiempo, es decir, el procesador 120 o el calculador 129 pueden reproducir una característica de superposición de los bloques de datos de dominio de tiempo similar a una característica de superposición producida mediante el convertidor 128 de dominio de frecuencia a dominio de tiempo. Además, el procesador 120 o el calculador 129 pueden estar adaptados para reproducir el solapamiento de dominio de tiempo similar al solapamiento de dominio de tiempo introducido por el convertidor 128 de dominio de frecuencia a dominio de tiempo basándose en los datos de salida del descodificador de dominio de tiempo 110.

El convertidor 128 de dominio de frecuencia a dominio de tiempo puede entonces estar adaptado para convertir los segmentos de datos de dominio de frecuencia proporcionados por el descodificador 122 de dominio de frecuencia en bloques de datos de dominio de tiempo superpuestos. El combinador 130 de superposición/suma puede estar adaptado para combinar los bloques de datos proporcionados por el convertidor 128 de dominio de frecuencia a dominio de tiempo del calculador 129 para obtener los segmentos de datos descodificados de la corriente de datos de dominio de tiempo.

El calculador 129 puede comprender una etapa 129a de solapamiento de dominio de tiempo como se ilustra en la realización mostrada en la figura 1e. La etapa 129a de solapamiento de dominio de tiempo puede estar adaptada a los datos de salida de solapamiento de tiempo del descodificador de dominio de tiempo para obtener los bloques de datos de dominio de tiempo superpuestos.

Para los datos codificados de dominio de tiempo, una combinación de la MDCT y la IMDCT puede hacer que el proceso en las realizaciones sea mucho más sencillo tanto en estructura como en complejidad computacional dado que solamente el proceso de solapamiento de dominio de tiempo (TDA) permanece en las realizaciones. Este proceso eficaz puede basarse en varias observaciones. La MDCT a la que se ha aplicado la función ventana de los segmentos de entrada de 2N muestras puede descomponerse en tres etapas.

En primer lugar, la señal de entrada se multiplica por medio de una ventana de análisis.

En segundo lugar, el resultado se desdobla entonces de 2N muestras a N muestras. Para la MDCT, este proceso implica que el primer cuarto de las muestras se combina, es decir, se resta, en orden inverso en tiempo con el segundo cuarto de las muestras, y que el cuarto cuarto de las muestras se combina, es decir, se suma, con el tercer cuarto de las muestras en orden inverso en tiempo. El resultado es la señal muestreada de manera descendente con solapamiento en tiempo en el segundo y tercer cuarto modificado de la señal, que comprende N muestras.

En tercer lugar, la señal muestreada de manera descendente se transforma entonces, utilizando una transformada de tipo DCT ortogonal que correlaciona N muestras de entrada con N muestras de salida para formar la salida de MDCT final.

La reconstrucción de IMDCT a la que se ha aplicado la función ventana de una secuencia de entrada de N muestras espectrales puede descomponerse asimismo en tres etapas.

En primer lugar, la secuencia de entrada de N muestras espectrales se transforma, utilizando una transformada de tipo DCT inversa ortogonal que correlaciona N muestras de entrada con N muestras de salida.

En segundo lugar, los resultados desdoblados de N a 2N muestras mediante la escritura de los valores transformados de DCT inversa en el segundo y tercer cuarto de una memoria intermedia de salida de 2N muestras, llenando el primer cuarto con la versión inversa en tiempo e invertida del segundo cuarto, y el cuarto cuarto con una versión invertida en tiempo del tercer cuarto, respectivamente.

En tercer lugar, las 2N muestras resultantes se multiplican con la ventana de síntesis para formar la salida de IMDCT a la que se ha aplicado la función ventana.

Por tanto, la concatenación de la MDCT a la que se ha aplicado la función ventana y la IMDCT a la que se ha aplicado la función ventana puede llevarse a cabo eficazmente en las realizaciones mediante la secuencia de las etapas primera y segunda de la MDCT a la que se ha aplicado la función ventana y las etapas segunda y tercera de la IMDCT a la que se ha aplicado la función ventana. La tercera etapa de la MDCT y la primera etapa de la IMDCT pueden omitirse completamente en las realizaciones, debido a que son operaciones inversas entre sí y, por tanto, se anulan. Las etapas restantes pueden llevarse a cabo solamente en el dominio de tiempo y, por tanto, las realizaciones que utilizan este enfoque pueden ser sustancialmente bajas en complejidad computacional.

Para un bloque de MDCT e IMDCT consecutiva, la etapa segunda y tercera de la MDCT y la etapa segunda y tercera de la IMDCT pueden escribirse como una multiplicación con la siguiente matriz 2Nx2N dispersa.

-

10 0

-

1 10 0

0 01 1 0 01 1

En otras palabras, el calculador 129 puede estar adaptado para segmentar la salida del descodificador 110 de dominio de tiempo en segmentos de calculador que comprenden 2N muestras secuenciales, aplicando pesos a las 2N muestras según una función ventana de análisis, restando las primeras N/2 muestras en orden inverso a partir de las segundas N/2 muestras, y las últimas N/2 muestras en orden inverso a partir de las terceras N/2 muestras, invirtiendo las N/2 muestras segunda y tercera, reemplazando las primeras N/2 muestras con la versión inversa en tiempo e invertida de las segundas N/2 muestras, reemplazando las cuartas N/2 muestras con la versión inversa en tiempo de las terceras N/2 muestras y aplicando pesos a las 2N muestras según una función ventana de síntesis.

En otras realizaciones, el combinador 130 de superposición/suma puede estar adaptado para aplicar pesos según una función ventana de síntesis a bloques de datos de dominio de tiempo superpuestos proporcionados por el convertidor 128 de dominio de frecuencia a dominio de tiempo. Además, el combinador 130 de superposición/suma puede estar adaptado para aplicar pesos según una función ventana de síntesis que está adaptada al tamaño de una región de superposición de bloques de datos de dominio de tiempo superpuestos consecutivos.

El calculador 129 puede estar adaptado para aplicar pesos a las 2N muestras según una función ventana de análisis que está adaptada al tamaño de una región de superposición de bloques de datos de dominio de tiempo superpuestos consecutivos y el calculador puede estar adaptado además para aplicar pesos a las 2N muestras según una función ventana de síntesis que está adaptada al tamaño de la región de superposición.

En realizaciones, el tamaño de la región de superposición de dos bloques de datos de dominio de tiempo consecutivos que se codifican en el dominio de frecuencia, puede ser mayor que el tamaño de una superposición de dos bloques de datos de dominio de tiempo consecutivos, de los cuales uno se codifica en el dominio de frecuencia y uno se codifica en el dominio de tiempo.

En realizaciones, el tamaño de los segmentos de datos puede estar adaptado al tamaño de las regiones de superposición. Las realizaciones pueden tener una implementación eficaz de un procesamiento de MDCT/IMDCT combinado, es decir, un TDA de bloque que comprende las operaciones de aplicación de función ventana de análisis, de doblado y desdoblado y de aplicación de función ventana de síntesis. Además, en realizaciones, algunas de estas etapas pueden combinarse parcial o totalmente en una implementación real.

Otra realización de un aparato 100, como se muestra en la figura 1f, ilustra que el aparato 100 puede comprender además una derivación 140 para el procesador 120 y adaptando el combinador 130 de superposición/suma para evitar el procesador 120 y el combinador 130 de superposición/suma, cuando se presentan bloques de datos de dominio de tiempo consecutivos no superpuestos en segmentos de datos, que se codifican en el dominio de tiempo. Si se codifican múltiples segmentos de datos en el dominio de tiempo, es decir, puede no ser necesaria la conversión al dominio de frecuencia para descodificar segmentos de datos consecutivos, éstos pueden transmitirse sin ninguna superposición. Para estos casos, las realizaciones tal como se muestran en la figura 1f, pueden evitar el procesador 120 y el combinador 130 de superposición/suma. En realizaciones la superposición de bloques puede determinarse según las especificaciones AAC.

La figura 2a muestra una realización de un aparato 200 para generar una corriente de datos codificados basándose en una corriente de datos de dominio de tiempo, teniendo la corriente de datos de dominio de tiempo muestras de una señal. La corriente de datos de dominio de tiempo, por ejemplo, podría corresponder a una señal de audio que comprende secciones de voz y secciones de música o ambas al mismo tiempo. El aparato 200 comprende un procesador 210 de segmentos para proporcionar segmentos de datos a partir de la corriente de datos, teniendo dos segmentos de datos consecutivos una primera o una segunda región de superposición, siendo la segunda región de superposición más pequeña que la primera región de superposición. El aparato 200 comprende además un codificador 220 de dominio de tiempo para codificar un segmento de datos en el dominio de tiempo y un codificador 230 de dominio de frecuencia para aplicar pesos a muestras de la corriente de datos de dominio de tiempo de según una primera o una segunda función ventana para obtener un segmento de datos al que se ha aplicado la función ventana, estando adaptadas las funciones ventana primera y segunda a las regiones de superposición primera y segunda y para codificar el segmento de datos al que se ha aplicado la función ventana en el dominio de frecuencia.

Además, el aparato 200 comprende un analizador 240 de datos de dominio de tiempo para determinar una indicación de transmisión asociada con un segmento de datos y un controlador 250 para controlar el aparato de tal manera que para los segmentos de datos que tienen una primera indicación de transición los datos de salida del codificador 220 de dominio de tiempo se incluyen en la corriente de datos codificados y para los segmentos de datos que tienen una segunda indicación de transición los datos de salida del codificador 230 de dominio de frecuencia se incluyen en la corriente de datos codificados.

En las realizaciones, el analizador 240 de datos de dominio de tiempo, puede adaptarse para determinar la indicación de transición a partir de la corriente de datos de dominio de tiempo o a partir de los segmentos de datos proporcionados por el procesador 210 de segmentos. Estas realizaciones se indican en la figura 2b. En la figura 2b se ilustra que el analizador 240 de datos de dominio de tiempo puede acoplarse a la entrada del procesador 210 de segmentos a fin de determinar la indicación de transición a partir de la corriente de datos de dominio de tiempo. En otra realización, el analizador 240 de datos de dominio de tiempo puede acoplarse a la salida del procesador 210 de segmentos a fin de determinar la indicación de transición a partir de los segmentos de datos. En las realizaciones, el analizador 240 de datos de dominio de tiempo puede acoplarse directamente al procesador 210 de segmentos a fin de determinar la indicación de transición a partir de los datos proporcionados directamente por el procesador de segmentos. Estas realizaciones se indican mediante las líneas de puntos en la figura 2b.

En las realizaciones, el analizador 240 de datos de dominio de tiempo puede adaptarse para determinar una medida de transición, basándose la medida de transición en un nivel de transitoriedad en la corriente de datos de dominio de tiempo o en los segmentos de datos, en el que el indicador de transición puede indicar si el nivel de transitoriedad supera un umbral predeterminado.

La figura 2c muestra otra realización del aparato 200. En las realizaciones mostradas en la figura 2c el procesador 210 de segmentos puede adaptarse para proporcionar segmentos de datos con las regiones de superposición primera y segunda, el codificador 220 de dominio de tiempo puede adaptarse para codificar todos los segmentos de datos, el codificador 230 de dominio de frecuencia puede adaptarse para codificar todos los segmentos de datos a los que se ha aplicado la función ventana y el controlador 250 puede adaptarse para controlar el codificador 220 de dominio de tiempo y el codificador 230 de dominio de frecuencia de tal manera que para los datos de segmentos que tienen una primera indicación de transición los datos de salida del codificador 220 de dominio de tiempo se incluyen en la corriente de datos codificados y para los segmentos de datos que tienen una segunda indicación de transición los datos de salida del codificador 230 de dominio de frecuencia se incluyen en la corriente de datos codificados. En otras realizaciones, los datos de salida tanto del codificador 220 de dominio de tiempo como del codificador 230 de dominio de frecuencia pueden incluirse en la corriente de datos codificados. El indicador de transición puede indicar si un segmento de datos se encuentra o bien asociado o bien correlacionado con una señal de voz o con una señal de música. En las realizaciones, el codificador 230 de dominio de frecuencia puede utilizarse para más segmentos de datos tipo música y el codificador 220 de dominio de tiempo puede utilizarse para más segmentos de datos tipo voz. En las realizaciones, puede utilizarse la codificación paralela, por ejemplo, para una señal de audio tipo voz que tiene música de fondo.

En la realización representada en la figura 2c, son concebibles múltiples posibilidades para que el controlador 250 controle los múltiples componentes dentro del aparato 200. Las diferentes posibilidades se indican mediante líneas de puntos en la figura 2c. Por ejemplo, el controlador 250 podría acoplarse con el codificador 220 de dominio de tiempo y el codificador 230 de dominio de frecuencia a fin de seleccionar el codificador que debe producir una salida codificada basándose en la indicación de transición. En otra realización, el controlador 250 puede controlar un interruptor en las salidas del codificador 220 de dominio de tiempo y del codificador 230 de dominio de frecuencia.

En tal realización, tanto el codificador 220 de dominio de tiempo como el codificador 230 de dominio de frecuencia pueden codificar todos los segmentos de datos y el controlador 250 puede adaptarse para seleccionar mediante dicho interruptor que se encuentra acoplado a las salidas de los codificadores, el segmento de datos codificados que debe incluirse en la corriente de datos codificados, basándose en la eficiencia de codificación, respectivamente, la indicación de transición. En otras realizaciones, el controlador 250 puede adaptarse para controlar el procesador 210 de segmentos para proporcionar los segmentos de datos o bien al codificador 220 de dominio de tiempo o bien al codificador 230 de dominio de frecuencia. El controlador 250 también puede controlar el procesador 210 de segmentos a fin de establecer regiones de superposición para un segmento de datos. En otras realizaciones, el controlador 250 puede adaptarse para controlar un interruptor entre el procesador 210 de segmentos y el codificador 220 de dominio de tiempo, respectivamente, el codificador 230 de dominio de frecuencia. El controlador 250 podría entonces influir en el interruptor para dirigir los segmentos de datos o bien a uno de los codificadores, respectivamente, o a ambos. El controlador 250 puede adaptarse además para establecer las funciones ventana para el codificador 230 de dominio de frecuencia conjuntamente con las regiones de superposición y las estrategias de codificación.

Además, en las realizaciones, el codificador 230 de dominio de frecuencia puede adaptarse para aplicar pesos de funciones ventana según las especificaciones AAC. El codificador 230 de dominio de frecuencia puede adaptarse para convertir un segmento de datos al que se ha aplicado la función ventana al dominio de frecuencia para obtener un segmento de datos de dominio de frecuencia. Además, el codificador 230 de dominio de frecuencia puede adaptarse para cuantificar los segmentos de datos de dominio de frecuencia y, además, el codificador 230 de dominio de frecuencia puede adaptarse para evaluar los segmentos de datos de dominio de frecuencia, según un modelo perceptivo.

El codificador 230 de dominio de frecuencia puede adaptarse para utilizar un banco de filtros modulado en coseno, una transformada solapada extendida, un banco de filtros de bajo retardo o un banco de filtros polifase para obtener los segmentos de datos de dominio de frecuencia.

El codificador 230 de dominio de frecuencia puede adaptarse para utilizar una MDCT para obtener los segmentos de datos de frecuencia. El codificador 220 de dominio de tiempo puede adaptarse para utilizar un modelo predictivo para codificar los segmentos de datos.

En las realizaciones en las que una MDCT en el codificador 230 de dominio de frecuencia opera en un denominado modo de bloque largo, es decir, el modo de operación regular que se utiliza para codificar señales de entrada no transitorias, véanse las especificaciones AAC, la sobrecarga que se introduce mediante el proceso de cambio puede ser alta. Esto puede ser verdadero para los casos en los que solamente debe codificarse una trama, es decir, una tasa de longitud/trama de N muestras, utilizando el codificador 220 de dominio de tiempo en lugar del codificador 230 de dominio de frecuencia.

Después, todos los valores de entrada para la MDCT pueden tener que codificarse con el codificador 220 de dominio de tiempo, es decir, se encuentran disponibles 2N muestras en la salida del descodificador 110 de dominio de tiempo. Por tanto, podría introducirse una sobrecarga de N muestras adicionales. Las figuras 3a a 3d ilustran algunas regiones de superposición de segmentos concebibles, respectivamente aplicables a las funciones ventana. Las 2N muestras pueden tener que codificarse con el codificador 220 de dominio de tiempo a fin de reemplazar un bloque de datos codificados de dominio de frecuencia. La figura 3a ilustra un ejemplo, en el que los bloques de datos codificados de dominio de frecuencia utilizan una línea continua y los datos codificados de dominio de tiempo utilizan una línea de puntos. Debajo de las funciones ventana se representan segmentos de datos que pueden codificarse en el dominio de frecuencia (recuadros con líneas continuas) o en el dominio de tiempo (recuadros con líneas de puntos). A esta representación se hará referencia también en las figuras 3b a 3d.

La figura 3a ilustra el caso en el que los datos se codifican en el dominio de frecuencia interrumpidos por un segmento de datos que se codifica en el dominio de tiempo, y el segmento de datos después de codificarse de nuevo en el dominio de frecuencia. A fin de proporcionar los datos de dominio de tiempo que son necesarios para anular el solapamiento de dominio de tiempo evocado por el codificador 230 de dominio de frecuencia, al cambiar del dominio de frecuencia al dominio de tiempo, se requiere la mitad del tamaño de un segmento para la superposición, lo mismo se aplica para volver a cambiar del dominio de tiempo al dominio de frecuencia. Suponiendo que el segmento de datos codificados de dominio de tiempo en la figura 3a tiene un tamaño de 2N, entonces en su inicio y al final se superpone con los datos codificados de dominio de frecuencia mediante N/2 muestras.

En caso de que pueda codificarse más de una trama subsecuente utilizando el codificador 220 de dominio de tiempo, la sobrecarga para la sección codificada de dominio de tiempo permanece en N muestras. Como se ilustra en la figura 3b en donde dos tramas consecutivas se codifican en el dominio de tiempo y las regiones de superposición al inicio y al final del dominio de tiempo las secciones codificadas tienen la misma superposición explicada con respecto a la figura 3a. La figura 3b muestra la estructura de superposición en el caso de dos tramas codificadas con el codificador 220 de dominio de tiempo. Las 3N muestras tienen que codificarse con el codificador 220 de dominio de tiempo en este caso.

Esta sobrecarga puede reducirse en las realizaciones utilizando cambio de ventana, por ejemplo, según la estructura que se utiliza en AAC. La figura 3c ilustra una secuencia típica de ventanas arga, inicial, corta y de detención a medida que se utilizan en AAC. A partir de la figura 3c puede observarse que los tamaños de ventana, los tamaños de segmento de datos y, por consiguiente, el tamaño de las regiones de superposición, cambian con las diferentes ventanas. La secuencia representada en la figura 3c es un ejemplo de la secuencia mencionada anteriormente.

Las realizaciones no deben limitarse a ventanas del tamaño de las ventanas de AAC, sin embargo, las realizaciones se aprovechan de las ventanas con diferentes regiones de superposición y también de ventanas de diferentes duraciones. En las realizaciones, las transiciones hacia y desde ventanas cortas pueden utilizar una superposición reducida como, por ejemplo, la descrita en Bernd Edler, “Codierung von Audiosignalen mit überlappender Transformation und adaptiven Fensterfunktionen”, Frequenz, Vol. 43, n.º 9, pág. 252-256, septiembre de 1989 y Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding, Estándar Internacional 13818-7, ISO/IEC JTC1/SC29/WG11 Moving Pictures Expert Group 1997, para reducir la sobrecarga para las transiciones hacia y desde las regiones codificadas de dominio de tiempo, como se ilustra en la figura 3d. La figura 3d ilustra cuatro segmentos de datos, de los cuales los primeros dos y el último se codifican en el dominio de frecuencia y el tercero se codifica en el dominio de tiempo. Cuando se cambia del dominio de frecuencia al dominio de tiempo, se utilizan ventanas diferentes con el tamaño de superposición reducido, reduciendo así la sobrecarga.

En las realizaciones, la transición puede basarse en las ventanas de inicio y detención idénticas a las utilizadas en AAC. Las ventanas correspondientes para las transiciones hacia y desde las regiones codificadas de dominio de tiempo son ventanas solamente con regiones pequeñas de superposición. Como consecuencia, la sobrecarga, es decir, el número de valores adicionales que van a transmitirse debido al proceso de cambio, disminuye sustancialmente. En general, la sobrecarga puede ser Nov1/2 para cada transición con la superposición de ventana de Nov1 muestras. Por tanto, una transición con la ventana común totalmente superpuesta como una AAC con Nov1 = 1024, incurre en una sobrecarga de 1024/2 = 512 muestras para la izquierda, es decir, la ventana de aparición gradual de imagen y de 1024/2 = 512 muestras para la derecha, es decir, la ventana de desvanecimiento de imagen, dando como resultado una sobrecarga total de 1024 (= N) muestras. La selección de una ventana superpuesta reducida como las ventanas de bloque corto AAC con Nov1 = 128, solamente da como resultado una sobrecarga total de 128 muestras.

Las realizaciones pueden utilizar un banco de filtros en el codificador 230 de dominio de frecuencia como, por ejemplo, el banco de filtros de MDCT ampliamente utilizado, sin embargo, también pueden utilizarse otras realizaciones con códecs de dominio de frecuencia basándose en otros bancos de filtros modulados en coseno. Esto puede comprender los derivados de la MDCT, tales como transformadas solapadas extendidas o bancos de filtros de bajo retardo así como bancos de filtros polifase, tales como, por ejemplo, el utilizado en los códecs de audio MPEG-1-Layer-1/2/3. En las realizaciones, la implementación eficaz de una operación de banco de filtros hacia delante/atrás puede tener en cuenta un tipo de ventana específico y utilizar doblado/desdoblado en el banco de filtros. Para cada tipo de banco de filtros modulado, la etapa de análisis puede implementarse eficazmente mediante una etapa de preprocesamiento y una transformada de bloque, es decir, tipo DCT o DEFT, para la modulación. En las realizaciones, la etapa de síntesis correspondiente puede implementarse utilizando la transformada inversa correspondiente y una etapa de posprocesamiento. Las realizaciones pueden utilizar solamente las etapas de pre y posprocesamiento para las partes de señal codificadas de dominio de tiempo.

Las realizaciones de la presente invención proporcionan la ventaja de que puede lograrse una mejor eficiencia de codificación, dado que el cambio entre un codificador 220 de dominio de tiempo y el codificador 230 de dominio de frecuencia pueden efectuarse introduciendo una sobrecarga muy baja. Solamente en secciones de señal de codificación de dominio de tiempo subsiguiente puede omitirse completamente la superposición en las realizaciones. Las realizaciones del aparato 100 permiten la descodificación correcta de la corriente de datos codificados.

Las presentes realizaciones proporcionan la ventaja de que puede lograrse una tasa de codificación más baja con la misma calidad, por ejemplo, de una señal de audio, respectivamente puede lograrse una calidad más alta con la misma tasa de codificación, dado que los codificadores respectivos pueden adaptarse a la transitoriedad en la señal de audio.

Dependiendo de ciertos requisitos de implementación de los métodos de la invención, los métodos de la invención pueden implementarse en hardware o en software. La implementación puede llevarse a cabo utilizando un medio de almacenamiento digital, en particular un disco, DVD o CD que tiene señales de control almacenadas electrónicamente, almacenadas en el mismo, que actúan conjuntamente con el sistema informático programable de tal manera que se realizan los métodos de la invención. Generalmente, la presente invención, es por tanto un producto de programa informático que tiene un código de programa almacenado en un soporte legible por máquina, siendo el código de programa operativo para llevar a cabo los métodos de la invención cuando el producto de programa informático se ejecuta en un ordenador. En otras palabras, los métodos de la invención, son por tanto un programa informático que tiene un código de programa para llevar a cabo al menos uno de los métodos de la invención cuando el programa informático se ejecuta en un ordenador.

Lista de referencias

100 aparato de descodificación 110 descodificador de dominio de tiempo 120 procesador 122 descodificador de dominio de frecuencia 122a recuantificación

124 convertidor de dominio de tiempo a dominio de frecuencia 124a transformada de coseno discreta modificada 126 combinador de dominio de frecuencia 126a sumador

128 convertidor de dominio de frecuencia a dominio de tiempo 128a transformada inversa de coseno discreta modificada 129 calculador 129a etapa de solapamiento de dominio de tiempo 130 combinador de superposición/suma 200 aparato de codificación 210 procesador de segmentos 220 codificador de dominio de tiempo 230 codificador de dominio de frecuencia 240 analizador de datos de dominio de tiempo 250 controlador

400 entrada de transformada de coseno discreta modificada

410 ventanas 420 primera ventana de salida de la transformada inversa de coseno discreta modificada 425 segunda ventana de salida de la transformada inversa de coseno discreta modificada

430 salida final

Claims

REIVINDICACIONES

1. Aparato para descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo, codificándose uno o más segmentos de datos en el dominio de tiempo, codificándose uno o más segmentos de datos en el dominio de frecuencia teniendo bloques de datos sucesivos que representan bloques sucesivos y superpuestos de las muestras de datos de dominio de tiempo, comprendiendo el aparato:

un descodificador de dominio de tiempo para descodificar un segmento de datos que se codifica en el dominio de tiempo;

un procesador para procesar los segmentos de datos que se codifican en el dominio de frecuencia y los datos de salida del descodificador de dominio de tiempo para obtener bloques de datos de dominio de tiempo de tal manera que bloques de datos de dominio de tiempo obtenidos basándose en segmentos de datos posteriores que se codifican en el dominio de frecuencia se superponen; y

de tal manera que bloques de datos de dominio de tiempo consecutivos de los que uno se codifica en el dominio de frecuencia y de los que uno se codifica en el dominio de tiempo se superponen; y

un combinador de superposición/suma para combinar los bloques de datos de dominio de tiempo superpuestos para obtener los segmentos de datos descodificados de la corriente de datos de dominio de tiempo;

en el que el combinador de superposición/suma está adaptado para aplicar pesos según funciones ventana de síntesis a bloques de datos de dominio de tiempo superpuestos,

en el que la función ventana de síntesis está adaptada a un tamaño de una región de superposición de bloques de datos de dominio de tiempo superpuestos consecutivos,

en el que una ventana con un tamaño de superposición reducido se aplica a un bloque de datos de dominio de tiempo codificado en el dominio de frecuencia cuando se cambia del dominio de frecuencia al dominio de tiempo;

en el que un tamaño de una región de superposición de dos bloques de datos de dominio de tiempo consecutivos que se codifican en el dominio de frecuencia es mayor que un tamaño de una región de superposición de dos bloques de datos de dominio de tiempo consecutivos de los cuales uno se codifica en el dominio de frecuencia y uno se codifica en el dominio de tiempo.
2.

Aparato según la reivindicación 1, en el que el procesador comprende un descodificador de dominio de frecuencia para descodificar segmentos de datos que se codifican en el dominio de frecuencia para obtener segmentos de datos de dominio de frecuencia.
3.

Aparato según la reivindicación 1, en el que el procesador está adaptado para procesar un segmento de datos que se codifica en el dominio de tiempo y en el dominio de frecuencia en paralelo.
4.

Aparato según la reivindicación 2, en el que el procesador comprende un convertidor de dominio de tiempo a dominio de frecuencia para convertir los datos de salida del descodificador de dominio de tiempo para obtener segmentos de datos de dominio de frecuencia convertidos.
5.

Aparato según la reivindicación 4, en el que el procesador comprende un combinador de dominio de frecuencia para combinar los segmentos de datos de dominio de frecuencia y los segmentos de datos de dominio de frecuencia convertidos para obtener una corriente de datos de dominio de frecuencia.
6.

Aparato según la reivindicación 5, en el que el procesador comprende un convertidor de dominio de frecuencia a dominio de tiempo para convertir la corriente de datos de dominio de frecuencia en bloques de datos de dominio de tiempo superpuestos.
7.

Aparato según la reivindicación 2, en el que el descodificador de dominio de frecuencia comprende además una etapa de recuantificación.
8.

Aparato según la reivindicación 4, en el que el convertidor de dominio de tiempo a dominio de frecuencia comprende un banco de filtros modulado en coseno, una transformada solapada extendida, un banco de filtros de bajo retardo, un banco de filtros polifase o una transformada de coseno discreta modificada.
9.

Aparato según la reivindicación 5, en el que el combinador de dominio de frecuencia comprende un sumador.
10.

Aparato según la reivindicación 6, en el que el convertidor de dominio de frecuencia a dominio de tiempo comprende un banco de filtros modulado en coseno o una transformada inversa de coseno discreta modificada.
11.

Aparato según la reivindicación 1, en el que el descodificador de dominio de tiempo está adaptado para utilizar un filtro de predicción para descodificar un segmento de datos codificado en el dominio de tiempo.
12.

Aparato según la reivindicación 1, en el que el procesador comprende un calculador para calcular los bloques de datos de dominio de tiempo superpuestos basándose en los datos de salida del descodificador de dominio de tiempo.
13.

Aparato según la reivindicación 12, en el que el calculador está adaptado para reproducir una propiedad de superposición del convertidor de dominio de frecuencia a dominio de tiempo basándose en los datos de salida del descodificador de dominio de tiempo.
14.

Aparato según la reivindicación 13, en el que el calculador está adaptado para reproducir una característica de solapamiento de dominio de tiempo del convertidor de dominio de frecuencia a dominio de tiempo basándose en los datos de salida del descodificador de dominio de tiempo.
15.

Aparato según la reivindicación 6, en el que el convertidor de dominio de frecuencia a dominio de tiempo está adaptado para convertir los segmentos de datos de dominio de frecuencia proporcionados por el descodificador de dominio de frecuencia en bloques de datos de dominio de tiempo superpuestos.
16.

Aparato según la reivindicación 15, en el que el combinador de superposición/suma está adaptado para combinar los bloques de datos de dominio de tiempo superpuestos proporcionados por el convertidor de dominio de frecuencia a dominio de tiempo y el calculador para obtener segmentos de datos descodificados de la corriente de datos de dominio de tiempo.
17.

Aparato según la reivindicación 8, en el que el calculador comprende una etapa de solapamiento de dominio de tiempo para los datos de salida de solapamiento de tiempo del descodificador de dominio de tiempo para obtener los bloques de datos de dominio de tiempo superpuestos.
18.

Aparato según la reivindicación 12, en el que el calculador está adaptado para

segmentar la salida del descodificador de dominio de tiempo en segmentos de calculador que comprenden 2N muestras secuenciales,

aplicar pesos a las 2N muestras según una función ventana de análisis,

restar las primeras N/2 muestras en orden inverso de las segundas N/2 muestras,

agregar las últimas N/2 muestras en orden inverso a las terceras N/2 muestras,

invertir la segunda y tercera N/2 muestras,

reemplazar las primeras N/2 muestras con la versión inversa en tiempo e invertida de las segundas N/2 muestras, reemplazando las cuartas N/2 muestras con la versión inversa en tiempo de las terceras N/2 muestras, y aplicar pesos a las 2N muestras según una función ventana de síntesis.
19.

Aparato según la reivindicación 6, en el que el combinador de superposición/suma está adaptado para aplicar pesos según una función ventana de síntesis a los bloques de datos de dominio de tiempo superpuestos proporcionados por el convertidor de dominio de frecuencia a dominio de tiempo.
20.

Aparato según la reivindicación 19, en el que el combinador de superposición/suma está adaptado para aplicar pesos según una función ventana de síntesis que están adaptados a un tamaño de una región de superposición de los bloques de datos de dominio de tiempo superpuestos consecutivos.
21.

Aparato según la reivindicación 20, en el que el calculador está adaptado para aplicar pesos a las 2N muestras según una función ventana de análisis que está adaptada a un tamaño de una región de superposición de los bloques de datos de dominio de tiempo superpuestos consecutivos y en el que el calculador está adaptado para aplicar pesos a las 2N muestras según una función ventana de síntesis que está adaptada al tamaño de la región de superposición.
22.

Aparato según la reivindicación 1, en el que un tamaño de una región de superposición de dos bloques de datos de dominio de tiempo consecutivos que se codifican en el dominio de frecuencia, es mayor que un tamaño de una región de superposición de dos bloques de datos de dominio de tiempo consecutivos de los cuales uno se codifica en el dominio de frecuencia y uno se codifica en el dominio de tiempo.
23.

Aparato según la reivindicación 1, en el que la superposición de bloques de datos se determina según las especificaciones AAC.
24.

Aparato según la reivindicación 1, que comprende además una derivación para el procesador y el combinador de superposición/suma, estando adaptada la derivación para evitar el procesador y el combinador

de superposición/suma cuando se presentan bloques de datos de dominio de tiempo consecutivos no superpuestos en los segmentos de datos que se codifican en el dominio de tiempo.
25.

Método para descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo, codificándose uno o más segmentos de datos en el dominio de tiempo, codificándose uno o más segmentos de datos en el dominio de frecuencia teniendo bloques de datos sucesivos que representan bloques sucesivos y superpuestos de las muestras de datos de dominio de tiempo, que comprende las etapas de:

descodificar un segmento de datos que se codifica en el dominio de tiempo;

procesar el segmento de datos que se codifica en el dominio de frecuencia y los datos de salida del descodificador de dominio de tiempo para obtener bloques de datos de dominio de tiempo superpuestos de tal manera que bloques de datos de dominio de tiempo obtenidos basándose en segmentos de datos posteriores que se codifican en el dominio de frecuencia se superponen; y

de tal manera que bloques de datos de dominio de tiempo consecutivos de los que uno se codifica en el dominio de frecuencia y de los que uno se codifica en el dominio de tiempo se superponen; y

combinar los bloques de datos de dominio de tiempo superpuestos para obtener los segmentos de datos descodificados de la corriente de datos de dominio de tiempo;

en el que se aplican pesos según funciones ventana de síntesis a los bloques de datos de dominio de tiempo superpuestos,

en el que la función ventana de síntesis está adaptada a un tamaño de una región de superposición de bloques de datos de dominio de tiempo superpuestos consecutivos,

en el que una ventana con un tamaño de superposición reducido se aplica a un bloque de datos de dominio de tiempo codificado en el dominio de frecuencia cuando se cambia del dominio de frecuencia al dominio de tiempo;

en el que un tamaño de una región de superposición de dos bloques de datos de dominio de tiempo consecutivos que se codifican en el dominio de frecuencia es mayor que un tamaño de una región de superposición de dos bloques de datos de dominio de tiempo consecutivos de los cuales uno se codifica en el dominio de frecuencia y uno se codifica en el dominio de tiempo.
26.

Programa informático que tiene un código de programa para llevar a cabo el método según la reivindicación 25, cuando el código de programa se ejecuta en un ordenador.
27.

Aparato para generar una corriente de datos codificados basándose en una corriente de datos de dominio de tiempo, teniendo la corriente de datos de dominio de tiempo muestras de una señal, comprendiendo el aparato:

un procesador de segmentos para proporcionar segmentos de datos a partir de la corriente de datos;

un codificador de dominio de tiempo para codificar un segmento de datos al que se ha aplicado la función ventana en el dominio de tiempo;

un codificador de dominio de frecuencia para aplicar pesos a muestras de la corriente de datos de dominio de tiempo según una primera o segunda función ventana para obtener un segmento de datos al que se ha aplicado la función ventana, estando adaptadas las funciones ventana primera y segunda a regiones de superposición de diferentes longitudes, estando adaptado el codificador de dominio de frecuencia para codificar un segmento de datos al que se ha aplicado la función ventana en el dominio de frecuencia;

un analizador de datos de dominio de tiempo para determinar una indicación de transición asociada con un segmento de datos; y

un controlador para controlar el aparato de tal manera que para los segmentos de datos que tienen una primera indicación de transición, los datos de salida del codificador de dominio de tiempo se incluyen en la corriente de datos codificados y para los segmentos de datos que tienen una segunda indicación de transición, los datos de salida del codificador de dominio de frecuencia se incluyen en la corriente de datos codificados;

en el que el controlador está adaptado para establecer las funciones ventana para el codificador de dominio de frecuencia, de tal manera que se utiliza una ventana con un tamaño de superposición reducido cuando se cambia del dominio de frecuencia al dominio de tiempo.
28.

Aparato según la reivindicación 27, en el que el controlador está adaptado para establecer las funciones ventana para el codificador de dominio de frecuencia, de tal manera que un tamaño de una región de superposición de dos segmentos de datos a los que se ha aplicado la función ventana consecutivos que se codifican en el dominio de frecuencia, es mayor que un tamaño de una región de superposición de dos segmentos de datos a los que se ha aplicado la función ventana consecutivos, de los cuales uno se codifica en el dominio de frecuencia y uno se codifica en el dominio de tiempo
29.

Aparato según la reivindicación 27 ó 28, en el que el analizador de datos de dominio de tiempo está adaptado para determinar la indicación de transición a partir de la corriente de datos de dominio de tiempo, de los segmentos de datos o a partir de los datos proporcionados directamente por el procesador de segmentos.
30.

Aparato según la reivindicación 27 ó 28, en el que el analizador de datos de dominio de tiempo está adaptado para determinar una medición de transición, basándose la medición de transición en el nivel de transitoriedad en la corriente de datos de dominio de tiempo o en el segmento de datos, y en el que el indicador de transición indica si un nivel de transitoriedad supera un umbral predeterminado.
31.

Aparato según la reivindicación 27 ó 28, en el que el procesador de segmentos está adaptado para proporcionar segmentos de datos con regiones de superposición de diferentes longitudes,

el codificador de dominio de tiempo está adaptado para codificar los segmentos de datos,

el codificador de dominio de frecuencia está adaptado para codificar los segmentos de datos a los que se ha aplicado la función ventana, y

el controlador está adaptado para controlar el codificador de dominio de tiempo y el codificador de dominio de frecuencia de tal manera que para los segmentos de datos que tienen una primera indicación de transición los datos de salida del codificador de dominio de tiempo se incluyen en la corriente de datos codificados y para los segmentos de datos a los que se ha aplicado la función ventana que tienen una segunda indicación de transición los datos de salida del codificador de dominio de frecuencia se incluyen en la corriente de datos codificados.
32. Aparato según la reivindicación 27 ó 28, en el que el controlador está adaptado para controlar el procesador de segmentos para proporcionar los segmentos de datos o bien al codificador de dominio de tiempo

o bien al codificador de dominio de frecuencia.
33.

Aparato según la reivindicación 27 ó 28, en el que el codificador de dominio de frecuencia está adaptado para aplicar pesos de funciones ventana según las especificaciones AAC.
34.

Aparato según la reivindicación 27 ó 28, en el que el codificador de dominio de frecuencia está adaptado para convertir un segmento de datos al que se ha aplicado la función ventana al dominio de frecuencia para obtener un segmento de datos de dominio de frecuencia.
35.

Aparato según la reivindicación 34, en el que el codificador de dominio de frecuencia está adaptado para cuantificar el segmento de datos de dominio de frecuencia.
36.

Aparato según la reivindicación 35, en el que el codificador de dominio de frecuencia está adaptado para evaluar el segmento de datos de dominio de frecuencia según un modelo perceptivo.
37.

Aparato según la reivindicación 36, en el que el codificador de dominio de frecuencia está adaptado para utilizar un banco de filtros modulado en coseno, una transformada solapada extendida, un banco de filtros de bajo retardo o un banco de filtros polifase para obtener los segmentos de datos de dominio de frecuencia.
38.

Aparato según la reivindicación 34, en el que el codificador de dominio de frecuencia está adaptado para utilizar una transformada de coseno discreta modificada para obtener los segmentos de datos de dominio de frecuencia.
39.

Aparato según la reivindicación 27 ó 28, en el que el codificador de dominio de tiempo está adaptado para utilizar un filtro de predicción para codificar los segmentos de datos.
40.

Método para generar una corriente de datos codificados basándose en una corriente de datos de dominio de tiempo, teniendo la corriente de datos de dominio de tiempo muestras de una señal, que comprende las etapas de:

proporcionar segmentos de datos a partir de la corriente de datos;

determinar una indicación de transición asociada con los segmentos de datos;

codificar un segmento de datos en el dominio de tiempo, y

aplicar pesos a las muestras de la corriente de datos de dominio de tiempo según una primera o una segunda función ventana para obtener un segmento de datos al que se ha aplicado la función ventana, estando adaptadas las funciones ventana primera y segunda a regiones de superposición de diferentes longitudes y codificando el segmento de datos al que se ha aplicado la función ventana en el dominio de 5 frecuencia; y

controlar de tal manera que para los segmentos de datos que tienen una primera indicación de transición, los datos de salida que se codifican en el dominio de tiempo se incluyen en la corriente de datos codificados y para los segmentos de datos que tienen una segunda indicación de transición, los datos de salida que se codifican en el dominio de frecuencia se incluyen en la corriente de datos codificados;

10 en el que las funciones ventana para la codificación de dominio de frecuencia se establecen de tal manera que se utiliza una ventana con un tamaño de superposición reducido cuando se cambia del dominio de frecuencia al dominio de tiempo o del dominio de tiempo al dominio de frecuencia.
41. Programa informático que tiene un código de programa para llevar a cabo el método según la reivindicación 40, cuando el código de programa se ejecuta en un ordenador.