ES2968927T3 - Decodificador que utiliza cancelación del efecto de solapamiento hacia delante - Google Patents

Decodificador que utiliza cancelación del efecto de solapamiento hacia delante Download PDF

Info

Publication number
ES2968927T3
ES2968927T3 ES22194160T ES22194160T ES2968927T3 ES 2968927 T3 ES2968927 T3 ES 2968927T3 ES 22194160 T ES22194160 T ES 22194160T ES 22194160 T ES22194160 T ES 22194160T ES 2968927 T3 ES2968927 T3 ES 2968927T3
Authority
ES
Spain
Prior art keywords
frame
type
subframe
cancellation
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES22194160T
Other languages
English (en)
Inventor
Jérémie Lecomte
Patrick Warmbold
Stefan Bayer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2968927T3 publication Critical patent/ES2968927T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Abstract

Un códec que soporta la conmutación entre el modo de codificación de transformación de cancelación de alias en el dominio del tiempo y el modo de codificación en el dominio del tiempo se hace menos propenso a la pérdida de fotogramas añadiendo una porción de sintaxis adicional a los fotogramas, dependiendo de cuál el analizador del decodificador puede seleccionar entre una primera acción. de esperar que el cuadro actual comprenda y, por lo tanto, leer datos de cancelación de alias directos del cuadro actual y una segunda acción de no esperar que el cuadro actual comprenda y, por lo tanto, no leer datos de cancelación de alias directos del cuadro actual. En otras palabras, aunque se pierde un poco de eficiencia de codificación debido a la provisión de la nueva porción de sintaxis, es simplemente la nueva porción de sintaxis la que proporciona la capacidad de utilizar el códec en caso de un canal de comunicación con pérdida de trama. Sin la nueva parte de sintaxis, el decodificador no sería capaz de decodificar ninguna parte del flujo de datos después de una pérdida y fallará al intentar reanudar el análisis. Por lo tanto, en un entorno propenso a errores, se evita que la eficiencia de la codificación desaparezca mediante la introducción de la nueva parte de sintaxis. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Decodificador que utiliza cancelación del efecto de solapamiento hacia delante
La presente invención se refiere a un códec que soporta un modo de codificación por transformada de cancelación del efecto de solapamiento en el dominio del tiempo y un modo de codificación en el dominio del tiempo, así como también la cancelación del efecto de solapamiento hacia delante para conmutar entre ambos modos.
Es favorable mezclar diferentes modos de codificación para codificar señales de audio generales que representan una mezcla de señales de audio de diferentes tipos tales como de voz, música o similares. Los modos de codificación individuales pueden estar adaptados a tipos de audio específicos y, por tanto, un codificador de audio multimodal puede aprovechar los cambios de modos de codificación en el tiempo, correspondientes al cambio del tipo de contenido de audio. En otras palabras, el codificador de audio multimodal puede decidir, por ejemplo, codificar partes de la señal de audio que tienen contenido de voz, utilizando un modo de codificación destinado especialmente a la codificación de voz y utilizar otro modo de codificación para codificar diferentes partes del contenido de audio que representa contenido que no es de voz, como en el caso de música. Los modos de codificación en el dominio del tiempo tales como los modos de codificación de predicción lineal excitada por libro de códigos, tienden a ser más adecuados para codificar contenidos de voz, mientras que los modos de codificación por transformadas tienden a funcionar mejor que los modos de codificación en el dominio del tiempo en lo que respecta a la codificación de música, por ejemplo.
Ya se han ideado soluciones para abordar el problema de hacer frente a la coexistencia de diferentes tipos de audio dentro de una señal de audio. La USAC que surge actualmente, por ejemplo, sugiere la conmutación entre un modo de codificación en el dominio de la frecuencia que cumple en gran parte con la norma AAC y dos modos de predicción lineal adicionales similares a los modos de subtrama de la norma AMR-WB más, es decir la variante basada en MDCT (transformada de coseno discreta modificada) del modo TCX (TCX = excitación codificada transformada) y un modo ACELP (predicción lineal excitada por libro de códigos adaptativo). Para ser más precisos, en la norma AMR-WB+, la TCX se basa en una transformada DFT, aunque en USAC la TCX tiene una base de transformada MDCT. Se utiliza una determinada estructura de entramado para conmutar entre el dominio de codificación FD similar a AAC y el dominio de predicción lineal similar a AMR-WB+. La norma AMR-WB+ en sí utiliza su propia estructura de entramado que forma una estructura de subentramado con respecto a la norma USAC. La norma Am R-WB+ da lugar a una cierta configuración de subdivisión que subdivide las tramas AMR-WB+ en tramas más pequeñas de TCX y/o ACELP. De modo similar, la norma AAC utiliza una estructura de entramado de base, pero permite el uso de diferentes longitudes de ventana para codificar por transformada el contenido de la trama. Por ejemplo, se puede emplear o bien una ventana larga y una longitud de transformada asociada larga, o bien ocho ventanas cortas con transformaciones asociadas de longitud menor.
La MDCT provoca efecto de solapamiento. Esto es cierto, por consiguiente, en los límites de las tramas de TXC y FD. En otras palabras, como en el caso de cualquier codificador en el dominio de la frecuencia que utiliza MDCT, el efecto de solapamiento se produce en las regiones de solapado de las ventanas, que se cancela con la ayuda de las tramas adyacentes. Es decir que, para cualquier transición entre dos tramas FD o entre dos tramas TCX (MDCT) o la transición entre FD y TCX o de TCX a FD, existe una cancelación implícita del efecto de solapamiento por el procedimiento de solapado/suma dentro de la reconstrucción en el lado del decodificador. Después de eso no hay más efecto de solapamiento tras el solapado/suma. Sin embargo, en el caso de las transiciones con ACELP, no hay cancelación inherente del efecto de solapamiento. Por lo tanto, se debe presentar una nueva herramienta que se puede denominar FAC (cancelación del efecto de solapamiento hacia delante). El FAC sirve para cancelar el efecto de solapamiento procedente de las tramas adyacentes, si son diferentes de ACELP.
Dicho de otro modo, y tal como se muestra en el documento titulado “Completion of Core Experiment on unification of USAC Windowing and Frame Transitions”, Max Neuendorfet al.,conferencia MPEG n.° 9, n.° M17167, 16 de enero de 2010, los problemas de cancelación del efecto de solapamiento tienen lugar cuando se producen las transiciones entre el modo de codificación por transformada y el modo de codificación en el dominio del tiempo, tal como ACELP. Para ejecutar la transformación desde el dominio del tiempo al dominio espectral de la manera más eficaz posible, se utiliza la codificación por transformada con cancelación del efecto de solapamiento en el dominio del tiempo, como por ejemplo MDCT, es decir un modo de codificación que utiliza una transformada solapada donde se transforman partes enventanadas solapadas de una señal utilizando una transformada según la cual el número de coeficientes de transformación por parte es menor que el número de muestras por parte, de manera que el efecto de solapamiento se produzca solo en lo que respecta a las partes individuales, donde este efecto de solapamiento se cancela merced a la cancelación del efecto de solapamiento en el dominio del tiempo, es decir, sumando las partes de efecto de solapamiento solapadas de las partes de la señal retransformada adyacente. La MDCT es una transformada de cancelación del efecto de solapamiento en el dominio del tiempo de este tipo. Lamentablemente, la TDAC (la cancelación del efecto de solapamiento en el dominio del tiempo) no está disponible en las transiciones entre el modo de codificación TC y el modo de codificación en el dominio del tiempo.
Para solucionar este problema, se puede emplear la cancelación del efecto de solapamiento hacia delante (FAC) según la cual el codificador señaliza dentro del flujo de datos datos de FAC adicionales dentro de una trama actual siempre que tenga lugar un cambio de modo de codificación de la codificación por transformada a la codificación en el dominio del tiempo. Sin embargo, esto hace que sea indispensable que el decodificador compare los modos de codificación de las tramas consecutivas con el fin de determinar si la trama decodificada actual comprende datos de FAC dentro de su sintaxis o no. Esto significa, a su vez, que pueden existir tramas para las cuales el decodificador puede no estar seguro si las tiene que leer o analizar los datos de FAC de la trama actual o no. Dicho de otro modo, en caso de que se perdieran una o más tramas durante la transmisión, el decodificador no sabe si en las tramas inmediatamente sucesivas (recibidas) se ha producido un cambio de modo de codificación o no, y si el flujo de bits de los datos codificados en la trama actual contiene datos de FAC o no. Por consiguiente, el decodificador tiene que desechar la trama actual y esperar la trama siguiente. De manera alternativa, el decodificador puede efectuar el análisis sintáctico de la trama actual ejecutando dos ensayos de decodificación, uno que presume la presencia de datos de FAC y el otro que presume la ausencia de datos de FAC, para decidir posteriormente si alguna de esas alternativas falla. Es muy probable que el proceso de decodificación haga que el decodificador falle en una de las dos condiciones. En otras palabras, en realidad esta última posibilidad no es un enfoque factible. El decodificador debe saber en todo momento cómo interpretar los datos y no basarse en su propia especulación sobre la manera de tratar los datos.
Por consiguiente, un objetivo de la presente invención es proporcionar un códec que es más robusto contra errores o más robusto contra pérdida de tramas, y que sin embargo soporte la conmutación entre el modo de codificación por transformada de cancelación del efecto de solapamiento en el dominio del tiempo y el modo de codificación en el dominio del tiempo.
Este objetivo se alcanza mediante la materia expuesta en cualquiera de las reivindicaciones independientes adjuntas en el presente documento.
La presente invención se basa en el hallazgo de que se puede obtener un códec más robusto contra errores o más robusto contra pérdida de tramas que soporta la conmutación entre el modo de codificación por transformada de cancelación del efecto de solapamiento en el dominio del tiempo y el modo de codificación en el dominio del tiempo si se agrega otra parte de sintaxis a las tramas sobre cuya base el analizador sintáctico del decodificador puede seleccionar entre una primera acción que esperar que la trama actual comprenda, y de esa manera leer los datos de cancelación del efecto de solapamiento hacia delante de la trama actual, y una segunda acción que no espera que la trama actual comprenda, y por consiguiente no leer los datos de cancelación del efecto de solapamiento hacia delante de la trama actual. Dicho de otro modo, si bien se pierde un bit de eficiencia codificadora debido a la inclusión de la segunda parte de sintaxis, es justamente la segunda parte de sintaxis la que permite la capacidad de emplear el códec en el caso de un canal de comunicaciones con pérdida de tramas. Sin la segunda parte de sintaxis, el decodificador no podría decodificar ninguna parte del flujo de datos después de una pérdida y tendría un fallo al intentar reanudar el análisis sintáctico. Por consiguiente, en un entorno propenso a errores, se impide que desaparezca la eficiencia codificadora mediante la introducción de la segunda parte de sintaxis.
Realizaciones preferidas adicionales de la presente invención constituyen el tema de las reivindicaciones dependientes. Además, a continuación, se describen las realizaciones preferidas de la presente invención de forma más detallada en conexión con las figuras. En particular
la figura 1 muestra un diagrama esquemático de bloques de un decodificador según una realización;
la figura 2 muestra un diagrama esquemático de bloques de un codificador según una realización que no forma parte de la invención;
la figura 3 muestra un diagrama de bloques de una implementación posible del reconstructor de la figura 2;
la figura 4 muestra un diagrama de bloques de una implementación posible del módulo decodificador FD de la figura 3;
la figura 5 muestra un diagrama de bloques de implementaciones posibles de los módulos de decodificación LPD de la figura 3;
la figura 6 muestra un diagrama esquemático que ilustra el procedimiento de codificación con el fin de generar datos de FAC según una realización que no forma parte de la invención;
la figura 7 muestra un diagrama esquemático de la posible retransformada de transformada TDAC según una realización que no forma parte de la invención;
las figuras 8, 9 muestran diagramas de bloques para ilustrar la lineación del trayecto de los datos de FAC en el codificador de otro procesamiento ejecutado en el codificador para evaluar el cambio de modo de codificación en el sentido de la optimización;
las figuras 10, 11 muestran diagramas de bloques del manejo del decodificador con el fin de derivar los datos de FAC de las figuras 8 y 9 a partir del flujo de datos;
la figura 12 muestra un diagrama esquemático de la reconstrucción basada en FAC del lado del decodificador a través de los límites de las tramas de diferentes modos de codificación;
las figuras 13, 14 muestran esquemáticamente el procesamiento ejecutado en el manipulador de transición de la figura 3 para llevar a cabo la reconstrucción de la figura 12;
las figuras 15 a 19 muestran partes de una estructura de sintaxis según una realización y
las figuras 20 a 22 muestran partes de una estructura de sintaxis según otra realización.
La figura 1 ilustra un decodificador 10 según una realización de la presente invención. El decodificador 10 es para decodificar un flujo de datos que comprende una secuencia de tramas 14a, 14b y 14c en las cuales se codifican los segmentos de tiempo 16a-c de una señal de información 18, respectivamente. Tal como se ilustra en la figura 1, los segmentos de tiempo 16a a 16c son segmentos no solapados que hacen tope directamente entre sí en el tiempo y están ordenados sucesivamente en el tiempo. Tal como se ilustra en la figura 1, los segmentos de tiempo 16a a 16c pueden ser de igual tamaño, aunque otras realizaciones también son factibles. Cada uno de los segmentos de tiempo 16a a 16c se codifica en una respectiva de las tramas 14a a 14c. Dicho de otro modo, cada segmento de tiempo 16a a 16c está exclusivamente asociado a una de las tramas 14a a 14c que, a su vez, también tienen un orden definido entre sí, que sigue el orden de los segmentos 16a a 16c que se codifican en las tramas 14a a 14c, respectivamente. Aunque la figura 1 sugiere que cada trama 14a a 14c es de igual longitud, medida, por ejemplo, en bits codificados, por supuesto esto no es excluyente. Por el contrario, la longitud de las tramas 14a a 14c puede variar según la complejidad del segmento de tiempo 16a a 16c con el cual está asociada la trama 14a a 14c respectiva.
Para facilitar la explicación de las realizaciones señaladas a continuación, se presume que la señal de información 18 es una señal de audio. Sin embargo, se debe tener en cuenta que la señal de información podría ser también cualquier otra señal, tal como una señal emitida por un sensor físico o similar, tal como un sensor óptico o similar. En particular, la señal 18 puede ser muestreada a una determinada velocidad de muestreo y los segmentos de tiempo 16a a 16c pueden cubrir partes inmediatamente consecutivas de esta señal 18 iguales en tiempo y número de muestras, respectivamente. Un número de muestras por segmento de tiempo 16a a 16c puede ser, por ejemplo, de 1024 muestras.
El decodificador 10 comprende un analizador sintáctico 20 y un reconstructor 22. El analizador sintáctico 20 está configurado para analizar sintácticamente el flujo de datos 12 y, al analizar sintácticamente el flujo de datos 12, leer una primera parte de sintaxis 24 y una segunda parte de sintaxis 26 de una trama actual 14b, es decir una trama que se ha de decodificar en el momento. En la figura 1, se presume, a modo de ejemplo, que la trama 14b es la trama a decodificar en el momento, en tanto que la trama 14a es la trama que acaba de ser decodificada. Cada trama 14a a 14c consta de una primera parte de sintaxis y una segunda parte de sintaxis que se incorporan a la misma y tienen una significación o significado que se detalla a continuación. En la figura 1, la primera parte de sintaxis dentro de las tramas 14a a 14c está indicada con un recuadro en el que hay un “1” y la segunda parte de sintaxis está indicada con un recuadro titulado “2”.
Naturalmente, cada trama 14a a 14c contiene además información adicional en la misma que es para representar el segmento de tiempo asociado 16a a 16c de una manera expuesta de forma más detallada más adelante. Esta información está indicada en la figura 1 por un bloque cuadriculado en el cual se utiliza el número de referencia 28 para la información adicional de la trama actual 14b. El analizador sintáctico 20 está configurado para, al analizar sintácticamente el flujo de datos 12, leer también la información 28 de la trama actual 14b.
El reconstructor 22 está configurado para reconstruir el segmento de tiempo actual 16b de la señal de información 18 asociada a la trama actual 14b basándose en la información adicional 28 utilizando uno seleccionado de entre un modo de decodificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento y un modo de decodificación en el dominio del tiempo. La selección depende del primer elemento de sintaxis 24. Ambos modos de decodificación difieren entre sí por la presencia o ausencia de alguna transición del dominio espectral nuevamente al dominio del tiempo empleando una retransformada. La retransformación (junto con su correspondiente transformación) introduce el efecto de solapamiento en lo que respecta a los segmentos de tiempo individuales, efecto de solapamiento que, sin embargo, se puede compensar por una cancelación del efecto de solapamiento en el dominio del tiempo en lo que se refiere a las transiciones en los límites entre las tramas consecutivas codificadas en el modo de codificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento. El modo de decodificación en el dominio del tiempo no requiere ninguna retransformación. Por el contrario, la decodificación se mantiene en el dominio del tiempo. Por consiguiente, en términos generales, el modo de decodificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento del reconstructor 22 conlleva la ejecución de una retransformación por el reconstructor 22. Esta retransformada mapea un primer número de coeficientes de transformada obtenidos de la información 28 de la trama actual 14b (que es de un modo de decodificación por transformada TDAC) sobre un segmento de señal retransformada con una longitud de muestreo de un segundo número de muestras, que es mayor que el primer número, causando así el efecto de solapamiento. El modo de decodificación en el dominio del tiempo, a su vez, puede conllevar un modo de decodificación por predicción lineal según el cual se reconstruyen los coeficientes de excitación y predicción lineal a partir de la información 28 de la trama actual que, en ese caso, es del modo de codificación en el dominio del tiempo.
Por consiguiente, como se puso de manifiesto en la discusión que antecede, en el modo de decodificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento, el reconstructor 22 obtiene de la información 28, un segmento de señal para reconstruir la señal de información en el respectivo segmento de tiempo 16b por una retransformada. El segmento de señal retransformado es más largo, en realidad, que el segmento de tiempo actual 16b y participa en la reconstrucción de la señal de información 18 dentro de una parte de tiempo que incluye y se extiende más allá del segmento de tiempo 16b. La figura 1 ilustra una ventana de transformación 32 empleada en la transformación de la señal original o tanto en la transformación como en la retransformación. Como se puede ver, la ventana 32 puede comprender la parte cero 321 al comienzo de la misma y una parte cero 322 en el extremo trasero de la misma, y partes de efecto de solapamiento 323 y 324 en un borde delantero y trasero del segmento de tiempo actual 16b, donde una parte sin efecto de solapamiento 325 donde la ventana 32 es uno, puede estar situada entre ambas partes solapadas 323 y 324. Las partes cero 321 y 322 son opcionales. También es posible que solo esté presente una de las partes cero 321 y 322. Tal como se ilustra en la figura 1, la función de ventana puede ser creciente/decreciente de manera monótona dentro de las partes solapadas. El efecto de solapamiento tiene lugar dentro de las partes solapadas 323 y 324 donde la ventana 32 avanza continuamente de cero a uno o viceversa. El solapamiento no es crítico, siempre que los segmentos de tiempo anteriores y sucesivos sean codificados también en el modo de codificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento. Esta posibilidad está ilustrada en la figura 1 con respecto al segmento de tiempo 16c. Una línea discontinua ilustra una ventana de transformación respectiva32correspondiente al segmento de tiempo 16c cuya parte solapada coincide con la parte solapada 324 del segmento de tiempo actual 16b. La suma de las señales de segmentos retransformados de los segmentos de tiempo 16b y 16c por el reconstructor 22 cancela el solapamiento de ambos segmentos de señal retransformados entre sí.
Sin embargo, en casos en que la trama anterior o sucesiva 14a o 14c sea codificada en el modo de codificación en el dominio del tiempo, una transición entre diferentes modos de codificación se produce en el borde delantero o trasero del segmento de tiempo actual 16b y, con el fin de justificar el efecto de solapamiento respectivo, el flujo de datos 12 comprende datos de cancelación del efecto de solapamiento hacia delante dentro de la trama respectiva que sigue de inmediato a la transición para habilitar al decodificador 10 para que compense el efecto de solapamiento que tiene lugar en esta transición respectiva. Por ejemplo, puede ocurrir que la trama actual 14b sea del modo de codificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento, aunque el decodificador 10 no sabe si la trama anterior 14a era del modo de codificación en el dominio del tiempo. Por ejemplo, la trama 14a puede haberse perdido durante la transmisión y, por lo tanto, el decodificador 10 no tiene acceso a la misma. Sin embargo, dependiendo del modo de codificación de la trama 14a, la trama actual 14b comprende datos de cancelación del efecto de solapamiento hacia delante con el fin de compensar el efecto de solapamiento que se produce en la parte solapada 323 o no. Del mismo modo, si la trama actual 14b era del modo de codificación en el dominio del tiempo, y la trama anterior 14a aún no ha sido recibida por el decodificador 10, entonces la trama actual 14b tiene datos de cancelación del efecto de solapamiento hacia delante incorporados a la misma o no, dependiendo del modo de la trama anterior 14a. En particular, si la trama anterior 14a era del otro modo de codificación, es decir, del modo de codificación por transformada de cancelación del efecto de solapamiento en el en el dominio del tiempo, entonces habría datos de cancelación del efecto de solapamiento hacia delante presentes en la trama actual 14b para cancelar el efecto de solapamiento que de lo contrario tiene lugar en el límite entre los segmentos de tiempo 16a y 16b. Sin embargo, si la trama anterior 14a era del mismo modo de codificación, es decir, el modo de codificación en el dominio del tiempo, entonces el analizador sintáctico 20 no esperaría que hubiera datos de cancelación del efecto de solapamiento hacia delante presentes en la trama actual 14b.
Por consiguiente, el analizador sintáctico 20 aprovecha una segunda parte de sintaxis 26 para dilucidar si hay presencia de datos de cancelación del efecto de solapamiento hacia delante 34 en la trama actual 14b o no. Al realizar el análisis sintáctico del flujo de datos 12, el analizador sintáctico 20 puede seleccionar una de una primera acción que consiste en estimar que la trama actual 14b comprende, y por consiguiente leer, datos de cancelación del efecto de solapamiento hacia delante 34 de la trama actual 14b y una segunda acción que consiste en no estimar que la trama actual 14b comprende, y por consiguiente, no leer datos de cancelación del efecto de solapamiento hacia delante 34 de la trama actual 14b, dependiendo la selección de la segunda parte de sintaxis 26. En caso de estar presente, el reconstructor 22 está configurado para ejecutar la cancelación del efecto de solapamiento hacia delante en el límite entre el segmento de tiempo actual 16b y el segmento de tiempo anterior 16a de la trama anterior 14a que usa los datos de cancelación del efecto de solapamiento hacia delante.
Por tanto, en comparación con la situación en que la segunda parte de sintaxis no está presente, el decodificador de la figura 1 no tiene que descartar, ni interrumpir desfavorablemente el análisis sintáctico, de la trama actual 14b aun en el caso de que el modo de codificación de la trama anterior 14a sea desconocido por el decodificador 10 debido a la pérdida de tramas, por ejemplo. Por el contrario, el decodificador 10 puede aprovechar la segunda parte de sintaxis 26 con el fin de dilucidar si la trama actual 14b tiene o no datos de cancelación del efecto de solapamiento hacia delante 34. Dicho de otro modo, la segunda parte de sintaxis permite un claro criterio para determinar si se aplica una de las alternativas, es decir si hay presencia de datos de FAC correspondientes al límite con la trama precedente o no, y garantiza que cualquier decodificador pueda funcionar de la misma manera independientemente de su implementación, aun en el caso de pérdida de tramas. Por lo tanto, la realización descrita anteriormente introduce mecanismos para superar el problema de la pérdida de trama.
Antes de describir las realizaciones más detalladas expuestas a continuación, se describe un codificador apto para generar el flujo de datos 12 de la figura 1 con la figura 2 respectiva. El codificador de la figura 2 está indicado, en general, con el número de referencia 40 y sirve para codificar la señal de información en el flujo de datos 12 de tal manera que el flujo de datos 12 comprenda la secuencia de tramas en las cuales se codifican los segmentos de tiempo 16a a 16c de la señal de información, respectivamente. El codificador 40 comprende un constructor 42 y un insertador 44. El constructor está configurado para codificar un segmento de tiempo actual 16b de la señal de información en la información de la trama actual 14b utilizando un primer modo seleccionado de entre el modo de codificación por transformada de cancelación del efecto de solapamiento en el dominio del tiempo y un modo de codificación en el dominio del tiempo. El insertador 44 está configurado para insertar la información 28 en la trama actual 14b junto con una primera parte de sintaxis 24 y una segunda parte de sintaxis 26, donde la primera parte de sintaxis señaliza la primera selección, es decir, la selección del modo de codificación. El constructor 42, a su vez, está configurado para determinar los datos de cancelación del efecto de solapamiento hacia delante para la cancelación del efecto de solapamiento hacia delante en un límite entre el segmento de tiempo actual 16b y un segmento de tiempo anterior 16a de una trama anterior 14a e inserta los datos de cancelación del efecto de solapamiento hacia delante 34 en la trama actual 14b en caso de que la trama actual 14b y la trama anterior 14a sean codificadas utilizando modos diferentes entre el modo de codificación por transformada de cancelación del efecto de solapamiento en el dominio del tiempo y el modo de codificación en el dominio del tiempo, y se abstiene de insertar datos de cancelación del efecto de solapamiento hacia delante en la trama actual 14b en caso de que la trama actual 14b y la trama anterior 14a sean codificadas utilizando el mismo modo, del modo de codificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento y el modo de codificación en el dominio del tiempo. En otras palabras, siempre que el constructor 42 del codificador 40 decide que es preferible, en el sentido de la optimización, conmutar de uno de ambos modos de codificación al otro, el constructor 42 y el insertador 44 están configurados para determinar e insertar datos de cancelación del efecto de solapamiento hacia delante 34 en la trama actual 14b, en tanto que, si se mantiene el modo de codificación entre las tramas 14a y 14b, no se insertan datos de FAC 34 en la trama actual 14b. Para permitir que el decodificador deduzca de la trama actual 14b, sin conocimiento del contenido de la trama anterior 14a, si hay datos de FAC 34 o no dentro de la trama actual 14b, se establece la determinada parte de sintaxis 26 dependiendo de si la trama actual 14b y la trama anterior 14a se codifican empleando modos iguales o diferentes del modo de codificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento y el modo de codificación en el dominio del tiempo. A continuación, se detallan ejemplos para realizar la segunda parte de sintaxis 26.
A continuación, se describe una realización a la cual pertenecen un códec, un decodificador y un codificador según las realizaciones antes descritas, que soporta un tipo especial de estructura de tramas según la cual las tramas 14a a 14c en sí son objeto de subentramado y existen dos versiones distintas de modo de codificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento. En particular, según estas realizaciones que se describen más adelante de forma detallada, la primera parte de sintaxis 24 asocia la respectiva trama de la cual se la ha leído con un primer tipo de trama que en lo sucesivo se denomina modo de codificación FD (dominio de la frecuencia) o un segundo tipo de trama que en lo sucesivo se denomina modo de codificación LPD y, si la trama respectiva es del segundo tipo de trama, asocia las subtramas de una subdivisión de la trama respectiva, compuesta por un número de subtramas, con un tipo de subtrama respectivo del primer tipo de subtrama y del segundo tipo de subtrama. Tal como se detalla más específicamente a continuación, el primer tipo de subtrama puede implicar que las correspondientes subtramas sean codificadas por TCX, en tanto que el segundo tipo de subtrama puede conllevar que sus subtramas respectivas sean codificadas utilizando ACELP, es decir Adaptive Codebook Excitation Linear Prediction (predicción lineal excitada por libro de códigos adaptativo). En cualquier caso, se puede utilizar asimismo cualquier otro modo de codificación de predicción lineal excitada por libro de códigos.
El reconstructor 22 de la figura 1 está configurado para manipular estos diferentes modos de codificación posibles. Para este fin, el reconstructor 22 puede estar construido de la manera indicada en la figura 3. Según la realización de la figura 3, el reconstructor 22 comprende dos conmutadores 50 y 52 y tres módulos de decodificación 54, 56 y 58 cada uno de los cuales está configurado para decodificar tramas y subtramas de un tipo específico, tal como se describe más adelante de forma más detallada.
El conmutador 50 tiene una entrada en la que se introduce la información 28 de la trama que se está decodificando en el momento 14b y una entrada de control a través de la cual se puede controlar el conmutador 50 dependiendo de la primera parte de sintaxis 25 de la trama actual. El conmutador 50 tiene dos salidas, una de las cuales está conectada a la entrada del módulo decodificador 54, que es responsable de la decodificación FD (FD = dominio de la frecuencia), y la otra de las cuales se conecta con la entrada del subconmutador 52 que también consta de dos salidas, una de las cuales está conectada a un módulo decodificador de entrada 56 responsable de la decodificación por predicción lineal excitada por código de transformada y la otra que está conectada a una entrada del módulo 58 responsable de la decodificación por predicción lineal excitada por libro de códigos. Todos los módulos codificadores 54 a 58 emiten segmentos de señal que reconstruyen los respectivos segmentos de tiempo asociados a las respectivas tramas y subtramas de las que derivaran estos segmentos de señal mediante el respectivo modo de decodificación, y un manipulador de transiciones 60 recibe los segmentos de señal en las respectivas entradas del mismo con el fin de ejecutar la manipulación de las transiciones y la cancelación del efecto de solapamiento antes descrita y que se describe más adelante de forma detallada para emitir en su salida de la señal de información reconstruida. El manipulador de transición 60 utiliza los datos de cancelación del efecto de solapamiento hacia delante 34 tal como se ilustra en la figura 3.
Según la realización de la figura 3, el reconstructor 22 funciona de la siguiente manera. Si la primera parte de sintaxis 24 asocia la trama actual con un primer tipo de trama, modo de codificación FD, el conmutador 50 reenvía la información 28 al módulo de decodificación FD 54 para usar la decodificación en el dominio de la frecuencia como primera versión del modo de decodificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento para reconstruir el segmento de tiempo 16b asociado con la trama actual 15b. De lo contrario, es decir si la primera parte de sintaxis 24 asocia la trama actual 14b con el segundo tipo de trama, modo de codificación LPD, el conmutador 50 reenvía la información 28 al subconmutador 52 que, a su vez, opera sobre la estructura de la subtrama de la trama actual 14. Para ser más precisos, según el modo LPD, se divide una trama en una o más subtramas, donde la subdivisión corresponde a una subdivisión del correspondiente segmento de tiempo 16b en subpartes no solapadas del segmento de tiempo actual 16b, tal como se describe más adelante con mayor detalle con respecto a las figuras siguientes. La parte de sintaxis 24 señaliza para cada una de la una o más subpartes si la misma está asociada a un primer o un segundo tipo de subtrama, respectivamente. Si una subtrama respectiva es del primer tipo de subtrama, el subconmutador 52 reenvía la información respectiva 28 que pertenece a esa subtrama al módulo de decodificación TCX 56 con el fin de usar la decodificación por predicción lineal excitada por códigos de transformada como segunda versión del modo de decodificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento para reconstruir la respectiva subparte del segmento de tiempo actual 16b. Si, por el contrario, la subtrama respectiva es del segundo tipo de subtrama, el subconmutador 52 reenvía la información 28 al módulo 58 con el fin de ejecutar la codificación por predicción lineal excitada por libro de códigos como modo de decodificación en el dominio del tiempo para reconstruir la respectiva subparte de la señal de tiempo actual 16b.
Los segmentos de señal reconstruida emitidos por los módulos 54 a 58 son reunidos por el manipulador de transición 60 en el orden temporal correcto (presentación) con la ejecución de la respectiva manipulación y solapado -suma de la transición y el procesamiento de cancelación del efecto de solapamiento en el dominio del tiempo antes descrito y descrito a continuación con más detalles.
En particular, se puede construir el módulo de decodificación FD 54 tal como se muestra en la figura 4 y funciona de la manera descrita a continuación. Según la figura 4, el módulo de decodificación FD 54 comprende un descuantizador 70 y un retransformador 72 conectados en serie entre sí. Tal como se describió anteriormente, si la trama actual 14b es una trama FD, la misma se envía al módulo 54 y el dispositivo cuantizador 70 ejecuta una descuantificación variable espectral de la información de coeficientes de transformada 74 dentro de información 28 de la trama actual 14b empleando la información de factores de escala 76 también comprendida en la información 28. Los factores de escala han sido determinados en el lado del codificador empleando, por ejemplo, principios psicoacústicos con el fin de mantener el ruido de cuantificación por debajo del umbral de enmascaramiento humano.
Entonces, el retransformador 72 ejecuta una retransformación de la información de coeficientes de transformación descuantificada para obtener un segmento de señal retransformado 78 que se extiende, en el tiempo, sobre y más allá del segmento de tiempo 16b asociado a la trama actual 14b. Tal como se describe de forma más detallada a continuación, la retransformación ejecutada por el retransformador 72 puede ser una IMDCT (transformada de coseno discreta modificada inversa) que conlleva una DCT IV seguida por una operación de despliegue en la cual, una vez ejecutado el enventanado utilizando una ventana de retransformada que podría ser igual a, o desviarse de, la ventana de transformación utilizada para generar la información de coeficientes de transformación 74 mediante la ejecución de las etapas antes mencionadas en el orden inverso, es decir, el enventanado seguido por una operación de plegado seguida por una DCT IV seguida por la cuantificación que puede ser dirigida por los principios psicoacústicos con el fin de mantener el ruido de cuantificación por debajo del umbral de enmascaramiento.
Cabe señalar que la cantidad de información de coeficientes de transformación 28 se debe a la naturaleza de TDAC de la retransformada del retransformador 72, más baja que el número de muestras de la longitud del segmento de señal reconstruido 78. En el caso de la IMDCT, el número de coeficientes de transformación dentro de la información 47 es prácticamente igual al número de muestras del segmento de tiempo 16b. En otras palabras, la transformada subyacente se puede denominar transformada de muestreo crítico que requiere la cancelación del efecto de solapamiento en el dominio del tiempo para cancelar el efecto de solapamiento que se produce debido a la transformación en los límites, es decir los bordes delantero y trasero del segmento de tiempo actual 16b.
Como observación menor, debe tenerse en cuenta que como en el caso de la estructura de subtramas de las tramas de LPD, las tramas FD también podrían ser objeto de una estructura de subentramado. Por ejemplo, las tramas FD podrían ser de modo de ventana larga en el cual se utiliza una única ventana para enventanar una parte de señal que se extiende más allá de los bordes delantero y trasero del segmento de tiempo actual con el fin de codificar el respectivo segmento de tiempo, o de un modo de ventana corta en el cual la respectiva parte de señal que se extiende más allá de los bordes del segmento de tiempo actual de la trama FD se subdivide en subpartes más pequeñas, cada una de las cuales se somete a un respectivo enventanado y transformación de forma individual. En ese caso, el módulo de codificación FD 54 emitiría un segmento de señal retransformada para la subparte del segmento de tiempo actual 16b.
Tras haber descrito una implementación posible del módulo de codificación FD 54, se describe una implementación posible del módulo de decodificación TCX LP y el módulo de decodificación LP excitado por libro de códigos 56 y 58, respectivamente, con respecto a la figura 5. Dicho de otro modo, la figura 5 se refiere al caso en el cual la trama actual es una trama LPD. En ese caso, se estructura la trama actual 14b en una o más subtramas. En el presente caso se ilustra una estructuración en tres subtramas 90a, 90b y 90c. Es posible que una estructuración se limite, por defecto, a ciertas posibilidades de subestructuración. Cada una de las subpartes está asociada a una subparte respectiva 92a, 92b y 92c del segmento de tiempo actual 16b. Es decir que dichas una o más subpartes 92a a 92c cubren sin brechas y sin solapado, la totalidad del segmento de tiempo 16b. Según el orden de las subpartes 92a a 92c dentro del segmento de tiempo 16b, se define un orden secuencial entre las subtramas 92a a 92c. Tal como se ilustra en la figura 5, la trama actual 14b no se subdivide por completo en las subtramas 90a a 90c. Dicho incluso de otro modo, algunas partes de la trama actual 14b pertenecen a todas las subtramas en común, como por ejemplo las partes de sintaxis 24 y 26 primera y segunda, los datos de FAC 34 y posiblemente datos adicionales tales como la información LPC, tal como se describe más adelante de forma detallada, si bien la información LPC también puede subestructurarse en subtramas individuales.
Para poder hacer frente a las subtramas de TCX, el módulo de decodificación TCX LP 56 comprende un derivador de ponderación espectral 94, un ponderador espectral 96 y un retransformador 98. Con fines ilustrativos, se muestra que la primera subtrama 90a es una subtrama TCX, en tanto que se presume que la segunda subtrama 90b es una subtrama de ACELP.
Para procesar la subtrama de TCX 90a, el derivador 94 deriva un filtro de ponderación espectral de la información de LPC 104 dentro de la información 28 de la trama actual 14b, y el ponderador espectral 96 pondera espectralmente la información de coeficientes de transformación dentro de la respectiva subtrama 90a usando el filtro de ponderación espectral recibido del derivador 94 indicado por la flecha 106.
El retransformador 98, a su vez, retransforma la información de coeficientes de transformación espectralmente ponderada para obtener un segmento de señal retransformado 108 que se extiende, en el tiempo t, sobre y más allá de la subparte 92a del segmento de tiempo actual. La retransformada ejecutada por el retransformador 98 puede ser igual a la ejecutada por el retransformador 72. En efecto, el retransformador 72 y 98 puede contar con hardware, una rutina de software o una parte de hardware programable en común.
La información de LPC 104 comprendida por la información 28 de la trama de LPD actual 16b puede representar coeficientes de LPC de un instante único dentro del segmento de tiempo 16b o de varios instantes de tiempo dentro del segmento de tiempo 16b tal como una serie de coeficientes de LPC por cada subparte 92a a 92c. El derivador de filtros de ponderación espectral 94 convierte los coeficientes de LPC en factores de ponderación espectral que ponderan espectralmente los coeficientes de transformación dentro de la información 90a según una función de transferencia que se derivada de los coeficientes de LPC por el derivador 94 de tal manera que la misma se aproxime sustancialmente al filtro de síntesis de LPC o alguna versión modificada del mismo. Cualquier descuantificación ejecutada más allá de la ponderación espectral por el ponderador 96, puede ser espectralmente invariable. Por consiguiente, a diferencia del modo de decodificación fD, el ruido de cuantificación según el modo de codificación TCX se forma espectralmente utilizando el análisis de LPC.
Debido al uso de la retransformada, sin embargo, el segmento de señal retransformado 108 está afectado por el efecto de solapamiento. Utilizando la misma retransformada, sin embargo, el efecto de solapamiento de los segmentos de señal retransformados 78 y 108 de las tramas y subtramas consecutivas puede ser cancelado por el manipulador de transición 60 meramente sumando las partes solapadas de los mismos.
En el procesamiento de las subtramas de (A)CELP 90b, el derivador de señales de excitación 100 deriva una señal de excitación de la información de actualización de excitación dentro de la respectiva subtrama 90b y el filtro de síntesis de LPC 102 ejecuta el filtrado de síntesis LPC de la señal de excitación usando la información de LPC 104 con el fin de obtener un segmento de señal sintetizado por LP 110 correspondiente a la subparte 92b del segmento de tiempo actual 16b.
Los derivadores 94 y 100 pueden estar configurados para ejecutar cierta interpolación para adaptar la información de LPC 104 dentro de la trama actual 16b a la posición variable de la subtrama actual correspondiente a la subparte actual dentro del segmento de tiempo actual 16b.
Describiendo de forma colectiva las figuras 3 a 5, los diversos segmentos de señal 108, 110 y 78 entran en el manipulador de transición 60 que, a su vez, reúne todos los segmentos de señal en el orden de tiempo correcto. En particular, el manipulador de transición 60 ejecuta la cancelación del efecto de solapamiento en el dominio del tiempo dentro de partes de ventana temporalmente solapadas en los límites entre segmentos de tiempo de tramas de FD y subtrama de TCX inmediatamente consecutivas para reconstruir la señal de información a través de estos límites. Por tanto, no hay necesidad de reenviar datos de cancelación del efecto de solapamiento hacia delante para los límites entre las tramas FD consecutivas, los límites entre tramas FD seguidas por tramas de TCX y subtramas de TCX seguidas por tramas FD, respectivamente.
Sin embargo, la situación cambia siempre que una trama de FD o una subtrama de TCX (que en ambos casos representan una variante del modo de codificación por transformadas) procede de una subtrama de ACELP (que representa una forma de modo de codificación en el dominio del tiempo). En ese caso, el manipulador de transición 16 deriva una señal de síntesis de cancelación del efecto de solapamiento hacia delante de los datos de cancelación del efecto de solapamiento hacia delante de la trama actual y suma la primera señal de síntesis de cancelación del efecto de solapamiento hacia delante al segmento de señal retransformado 100 o 78 del segmento de tiempo inmediatamente precedente para reconstruir la señal de información a través del límite respectivo. Si el límite cae en la parte interna del segmento de tiempo actual 16b porque una subtrama de TCX y una subtrama de ACELP dentro de la trama actual definen el límite entre las subpartes asociadas de segmento de tiempo, el manipulador de transición puede determinar la existencia de los respectivos datos de cancelación del efecto de solapamiento hacia delante correspondientes a estas transiciones de la primera parte de sintaxis 24 y la estructura de subentramado definida en la misma. La parte de sintaxis 26 no es necesaria. La trama anterior 14a se puede haber perdido o no.
Sin embargo, en el caso de un límite que coincide con el límite entre los segmentos de tiempo consecutivos 16a y 16b, el analizador sintáctico 20 tiene que inspeccionar la segunda parte de sintaxis 26 dentro de la trama actual con el fin de determinar si la trama actual 14b tiene datos de cancelación del efecto de solapamiento hacia delante 34, donde los datos de FAC 34 son para cancelar el efecto de solapamiento que se produce en el extremo delantero del segmento de tiempo actual 16b, puesto que la trama anterior es una trama FD o la última subtrama de la trama LPD precedente es una subtrama de TCX. Por lo menos, el analizador sintáctico 20 debe conocer la parte de sintaxis 26 en caso de que se haya perdido el contenido de la trama anterior.
Se aplican conceptos similares a las transiciones en la otra dirección, es decir de subtramas de ACELP a tramas FD o tramas de TCX. Siempre que los respectivos límites entre los respectivos segmentos y subpartes de segmentos se encuentren dentro del segmento de tiempo actual, el analizador sintáctico 20 no tiene problema para determinar la existencia de los datos de cancelación del efecto de solapamiento hacia delante 34 correspondientes a estas transiciones de la trama actual 14b en sí, es decir desde la primera parte de sintaxis 24. La segunda parte de sintaxis no es necesaria e incluso es irrelevante. Sin embargo, si el límite se presenta en, o coincide con, un límite entre el segmento de tiempo anterior 16a y el segmento de tiempo actual 16b, el analizador sintáctico 20 debe inspeccionar la segunda parte de sintaxis 26 con el fin de determinar si hay datos de cancelación del efecto de solapamiento hacia delante 34 presentes para la transición en el extremo delantero del segmento de tiempo actual 16b o no, por lo menos en el caso de no tener acceso a la trama anterior.
En el caso de las transiciones de ACELP a FD o TCX, el manipulador de transición 60 deriva una segunda señal de síntesis de cancelación del efecto de solapamiento hacia delante de los datos de cancelación del efecto de solapamiento hacia delante 34 y suma la segunda señal de síntesis de cancelación del efecto de solapamiento hacia delante al segmento de señal retransformado dentro del segmento de tiempo actual con el fin de reconstruir la señal de información a través del límite.
Después de describir las realizaciones con respecto a las figuras 3 a 5, que se referían en general a una realización según la cual existían tramas y subtramas de diferentes modos de codificación, a continuación se describe una implementación específica de estas realizaciones de forma más detallada. La descripción de estas realizaciones incluye simultáneamente medidas posibles para generar el respectivo flujo de datos que comprenden dichas tramas y subtramas, respectivamente. A continuación, se describe esta realización específica como un códec unificado de voz y audio (USAC), aunque los principios señalados en el presente documento también son aplicables a otras señales.
La conmutación de ventanas en USAC tiene varios fines. Mezcla las tramas FD, es decir las tramas codificadas con codificación de frecuencia y las tramas de LPD que, a su vez, están estructuradas en (sub)tramas de ACELP y (sub)tramas de TCX. Las tramas de ACELP (codificación en el dominio del tiempo) aplican un enventanado rectangular no solapado a las muestras de entrada, en tanto que las tramas de TCX (codificación en el dominio de la frecuencia) aplican un enventanado no rectangular solapado a las muestras de entrada y entonces codifican la señal utilizando una transformada de cancelación del efecto de solapamiento en el dominio del tiempo (TDAC), es decir la MDCT, por ejemplo. Para armonizar las ventanas en su totalidad, las tramas de TCX pueden utilizar ventanas centradas con formas homogéneas y para gestionar las transiciones en los límites de tramas de ACELP, se transmite información explícita para cancelar el efecto de solapamiento en el dominio del tiempo y los efectos de enventanado de las ventanas de TCX armonizadas. Esta información adicional se puede considerar como cancelación del efecto de solapamiento hacia delante (FAC). Los datos de FAC son cuantificados en la siguiente realización en el domino ponderado de LPC, de manera que los ruidos de cuantificación de FAC y la MDCT decodificada sean de la misma naturaleza.
La figura 6 ilustra el procesamiento que tiene lugar en el codificador en una trama 120 codificada por codificación por transformada (TC) que está precedida y seguida por una trama 122, 124 codificada por ACELp . En línea con la descripción que antecede, el concepto de TC incluye la MDCT en bloques largos y cortos utilizando AAC, como así también TCX basada en MDCT. En otras palabras, la trama 120 puede o bien ser una trama de FD o bien una (sub)trama de TCX tal como la subtrama 90a, 92a de la figura 5, por ejemplo. La figura 6 ilustra marcadores del dominio del tiempo y límites de tramas. Los límites de las tramas o segmentos de tiempo están indicados por líneas discontinuas, en tanto que los marcadores en el dominio del tiempo son líneas verticales cortas a lo largo de ejes horizontales. Se debe mencionar aquí que, en la descripción siguiente, los términos “segmento de tiempo” y “trama” se utilizan en ocasiones como sinónimos debido a la singular asociación entre los mismos.
Por tanto, las líneas discontinuas verticales de la figura 6 ilustran el comienzo y el final de la trama 120 que puede ser una subtrama/subparte de un segmento de tiempo o una trama/segmento de tiempo. LPC1 y LPC2 han de indicar el centro de una ventana de análisis correspondiente a los coeficientes de filtro de LPC o filtros de LPC que se utilizan a continuación con el fin de ejecutar la cancelación del efecto de solapamiento. Estos coeficientes de filtro son derivados en el decodificador, por ejemplo, por el reconstructor 22 o los derivadores 90 y 100 mediante el uso de interpolación empleando la información de LPC 104 (véase la figura 5). Los filtros de LPC comprenden: LPC1 correspondiente a un cálculo del mismo en el comienzo de la trama 120, y LPC2 correspondiente a un cálculo del mismo al final de la trama 120. Se presume que la trama 122 ha sido codificada por ACELP. Lo mismo se aplica a la trama 124.
La figura 6 está estructurada en cuatro líneas numeradas a la derecha de la figura 6. Cada línea representa una etapa del procesamiento que se realiza en el codificador. Se ha de entender que cada línea está alineada temporalmente con la línea superior.
La línea 1 de la figura 6 representa la señal de audio original, segmentada en las tramas 122, 120 y 124 tal como se indicó anteriormente. Por ende, a la izquierda del marcador “LPC1”, la señal original es codificada por ACELP. Entre los marcadores “LPC1” y “LPC2”, la señal original se codifica utilizando TC. Tal como se describió anteriormente, en la TC se aplica el modelado de ruido directamente en el dominio de la transformada en lugar del domino del tiempo. A la derecha del marcador LPC2, la señal original es codificada por ACELP una vez más, es decir, un modo de codificación en el dominio del tiempo. Se elige esta secuencia de modos de codificación (ACELP entonces TC entonces ACELP) para ilustrar el procesamiento en la FAC puesto que la FAC se relaciona con ambas transiciones (de ACELP a TC y de TC a ACELP).
Obsérvese, sin embargo, que las transiciones en LPC1 y LPC2 de la figura 6 pueden tener lugar dentro del interior de un segmento de tiempo actual o pueden coincidir con el extremo delantero del mismo. En el primer caso, la determinación de la existencia de los datos de FAC asociados puede ser ejecutada por el analizador sintáctico 20, basándose meramente en la primera parte de sintaxis 24, en tanto que, en el caso de la pérdida de tramas, el analizador sintáctico 20 puede requerir la parte de sintaxis 26 para hacerlo en el último caso.
La línea 2 de la figura 6 corresponde a las señales (de síntesis) decodificadas en cada una de las tramas 122, 120 y 124. Por consiguiente, el número de referencia 110 de la figura 5 se utiliza dentro de la trama 122 correspondiente a la posibilidad de que la última subparte de la trama 122 es una subparte codificada por ACELP como 92b de la figura 5, en tanto que se utiliza una combinación de números de referencia 108/78 para indicar la contribución de la señal a la trama 120, de manera análoga a las figuras 5 y 4. Una vez más, a la izquierda del marcador LPC1, se presume que la síntesis de esa trama 122 ha sido codificada por ACELP. Por ende, la señal de síntesis 110 a la izquierda del marcador LPC1 se identifica como señal de síntesis de ACELP. Existe, en principio, una gran similitud entre la síntesis de ACELP y la señal original en esa trama 122, puesto que la ACELP tiende a codificar la forma de onda lo más precisamente posible. Entonces, el segmento entre los marcadores LPC1 y LPC2 de la línea 2 de la figura 6 representa la salida de la MDCT inversa de ese segmento 120 visto en el decodificador. Una vez más, el segmento 120 puede ser el segmento de tiempo 16b de una trama de FD o una subparte de una subtrama codificada por TCX, tal como 90b en la figura 5, por ejemplo. En la figura, este segmento 108/78 se denomina “salida de la trama de TC”. En las figuras 4 y 5, este segmento se denominaba segmento de señal retransformado. En caso de que la trama/segmento 120 sea una subparte de segmento de TCX, la salida de la trama de TC representa una señal de síntesis de TLP reenventanada, donde TLP significa “codificación por transformada con predicción lineal” para indicar que, en el caso de TCX, se obtiene el modelado de ruido del segmento respectivo en el dominio de la transformada mediante el filtrado de los coeficientes de MDCT utilizando la información espectral de los filtros de LPC LPC1 y LPC2, respectivamente, lo que también se ha descrito con respecto a la figura 5 con respecto al ponderador espectral 96. Obsérvese asimismo que la señal de síntesis, es decir la señal reconstruida de forma preliminar que incluye el efecto de solapamiento, entre los marcadores “LPC1” y “LPC2” de la línea 2 de la figura 6, es decir la señal 108/78, contiene efectos de enventanado y efecto de solapamiento en el dominio del tiempo en el comienzo y en el final. En el caso de MDCT como transformada de TDAC, el efecto de solapamiento en el dominio del tiempo puede estar simbolizado en forma de desdoblamientos 126a y 126b, respectivamente. Dicho de otro modo, la curva superior de la línea 2 de la figura 6 que se extiende desde el comienzo hasta el final de ese segmento 120 y que está indicado con los números de referencia 108/78, ilustra el efecto de enventanado debido a que el enventanado de transformación es plano en el medio para dejar sin cambios la señal transformada, pero no al comienzo y al final. El efecto de doblamiento está indicado por las curvas inferiores 126a y 126b al comienzo y al final del segmento 120 con el signo menos al comienzo del segmento y el signo más al final del segmento. Este efecto de enventanado y efecto de solapamiento (o doblamiento) en el dominio del tiempo es inherente a la MDCT, que sirve como ejemplo explícito de transformadas de TDAC. El efecto de solapamiento se puede cancelar cuando se codifican dos tramas consecutivas utilizando la MDCT como se ha descrito anteriormente. Sin embargo, en caso de que la trama “codificada por MDCT” 120 no vaya precedida ni seguida por otras tramas MDCT, su enventanado y efecto de solapamiento en el dominio del tiempo no se cancela y permanece en la señal en el dominio del tiempo después de la MDCT inversa. Se puede emplear entonces la cancelación del efecto de solapamiento hacia delante (FAC) para corregir estos efectos de la manera antes expuesta. Por último, también se presume que el segmento 124 después del marcador LPC2 de la figura 6 es codificado utilizando ACELP. Obsérvese que para obtener la señal de síntesis en esa trama, los estados de filtrado del filtro de LPC 102 (véase la figura 5), es decir la memoria de los predictores de largo plazo y corto plazo, al comienzo de la trama 124 debe ser correctamente lo que implica que los efectos de efecto de solapamiento temporal y enventanado al final de la trama anterior 120 entre los marcadores LPC1 y LPC2 deben ser cancelados mediante la aplicación de FAC de una manera específica que se explica más adelante. Para resumir, la línea 2 de la figura 6 contiene la síntesis de señales reconstruidas de manera preliminar de las tramas consecutivas 122, 120 y 124, que incluye el efecto de enventanado en el efecto de solapamiento en el dominio del tiempo a la salida de la MDCT inversa correspondiente a la trama entre los marcadores LPC1 y LPC2.
Para obtener la línea 3 de la figura 6, se computa la diferencia entre la línea 1 de la figura 6, es decir en la señal de audio original 18, y la línea 2 de la figura 6, es decir las señales de síntesis 110 y 108/78, respectivamente, tal como se describió anteriormente. Esto da una primera señal de diferencia 128.
A continuación, se explica el procesamiento posterior ejecutado del lado del codificador en relación con la trama 120 con respecto a la línea 3 de la figura 6. Al comienzo de la trama 120, en primer lugar, se suman entre sí dos contribuciones tomadas de la síntesis ACELP 110 a la izquierda del marcador LPC1 en la línea 2 de la figura 6 de la siguiente manera:
La primera contribución 130 es una versión enventanada e invertida en el tiempo (doblada) de las últimas muestras de síntesis ACELP, es decir, las últimas muestras del segmento de señal 110 ilustrado en la figura 5. La longitud y forma de ventana correspondiente a esta señal invertida en el tiempo es igual a la parte solapada de la ventana de transformación a la izquierda de la trama 120. Esta contribución 130 se puede considerar una buena aproximación al efecto de solapamiento en el dominio del tiempo presente en la trama de MDCT 120 de la línea 2 en la figura 6.
La segunda contribución 132 es una respuesta de entrada cero enventanada (ZIR) del filtro de síntesis LPC1 donde el estado inicial se toma como estado final de este filtro al final de la síntesis ACELP 110, es decir, al final de la trama 122. La longitud y forma de ventana de esta segunda contribución pueden ser iguales a las de la primera contribución 130.
Con la nueva línea 3 de la figura 6, es decir después de sumar las dos contribuciones 130 y 132 antes citadas, el codificador toma una nueva diferencia para obtener la línea 4 de la figura 6. Obsérvese que la señal de diferencia 134 se detiene en el marcador LPC2. Una vista aproximada de la envolvente estimada de la señal de error en el dominio del tiempo se muestra en la línea 4 de la figura 6. Se estima que el error en la trama de ACELP 122 es de amplitud aproximadamente plana en el dominio del tiempo. Entonces, se estima que el error en la trama de TC 120 ha de exhibir la misma forma general, es decir, envolvente en el dominio del tiempo, tal como se muestra en este segmento 120 de la línea 4 en la figura 6. En el presente documento solo se ilustra esta forma estimada de la amplitud de error con fines explicativos.
Obsérvese que, si el decodificador fuera a usar solo las señales de síntesis de la línea 3 de la figura 6 para producir o reconstruir la señal de audio decodificada, entonces el ruido de cuantificación sería por lo general como la envolvente estimada de la señal de error 136 de la línea 4 de la figura 6. Por tanto, se ha de entender que se debería enviar una corrección al decodificador para compensar este error al comienzo y al final de la trama de TC 120. Este error procede de los efectos de enventanado y de efecto de solapamiento en el dominio del tiempo inherentes al par MDCT/MDCT inversa. El enventanado y el efecto de solapamiento en el dominio del tiempo se han reducido al comienzo de la trama de TC 120 mediante la adición de las contribuciones 132 y 130 de tubo de la trama de ACELP anterior 122 tal como se indicó anteriormente, aunque no puede ser cancelado por completo como en la operación de TDAC real de las tramas consecutivas de MDCT. A la derecha de la trama de TC 120 en la línea 4 de la figura 6 inmediatamente antes del marcador LPC2, se conserva la totalidad del enventanado y el efecto de solapamiento en el dominio del tiempo del par MDCT/MDCT inversa y, por tanto, tiene que ser cancelado por completo por la cancelación del efecto de solapamiento hacia delante.
Antes de proceder a describir el proceso de codificación para obtener los datos de cancelación del efecto de solapamiento hacia delante, se hace referencia a la figura 7 para explicar brevemente la MDCT como ejemplo de procesamiento por transformada TDAC. Se ilustran y describen ambas direcciones de transformación con respecto a la figura 7. La transición del dominio del tiempo al dominio de la transformada está ilustrada en la mitad superior de la figura 7, en tanto que la retransformada está ilustrada en la parte inferior de la figura 7.
Al efectuar la transición del dominio del tiempo al dominio de la transformada, la transformada de TDAC conlleva un enventanado 150 aplicado a un intervalo 152 de la señal que se ha de transformar, que se extiende más allá del segmento de tiempo 154 respecto del cual estos últimos coeficientes de transformación obtenidos se han de transmitir en realidad dentro del flujo de datos. La ventana aplicada en el enventanado 150 se muestra en la figura 7 comprendiendo una parte de efecto de solapamiento Lk que cruza el extremo delantero del segmento de tiempo 154 y una parte de efecto de solapamiento Rk en el extremo posterior del segmento de tiempo 154 con una parte sin efecto de solapamiento Mk que se extiende entre las mismas. Se aplica una MDCT 156 a la señal enventanada. En otras palabras, se ejecuta un doblamiento 158 con el fin de doblar un primer cuarto del intervalo 152 que se extiende entre el extremo delantero del intervalo 152 y el extremo delantero del segmento de tiempo 154 volviendo a lo largo del límite izquierdo (delantero) del segmento de tiempo 154. Lo mismo se hace con respecto a una parte de efecto de solapamiento Rk. Seguidamente, se ejecuta una DCT IV 160 de la señal enventanada y doblada así producida con tantas muestras como la señal temporal 154 para obtener coeficientes de transformación del mismo número. Entonces se lleva a cabo una conversación en 162. Naturalmente, la cuantificación 162 se puede considerar no comprendida por la transformada TDAC.
Una retransformada hace lo inverso. Es decir que, después de la descuantificación 164, se ejecuta una IMDCT 166 que conlleva, en primer lugar, una DCT-1 IV 168 con el fin de obtener muestras de tiempo, el número de las cuales es igual al número de muestras del segmento de tiempo 154 que se han de reconstruir. A continuación, se ejecuta un proceso de desdoblamiento 168 de la parte de señal inversamente transformada recibida del módulo 168 para expandir así el intervalo de tiempo o el número de muestras temporales del resultado de la IMDCT mediante la duplicación de la longitud de las partes solapadas. Seguidamente se ejecuta un enventanado en 170, utilizando una ventana de retransformación 172 que puede ser igual a la utilizada por el enventanado 150, aunque también puede ser diferente. El resto de los bloques de la figura 7 ilustran el procesamiento TDAC o de solapado/suma ejecutado en las partes solapadas de los segmentos consecutivos 154, es decir la suma de las partes solapadas desdobladas de los mismos, ejecutada por el manipulador de transición en la figura 3. Tal como se ilustra en la figura 7, la TDAC ejecutada por los bloques 172 y 174 da lugar a la cancelación del efecto de solapamiento.
Se procede ahora a continuar con la descripción de la figura 6. Para compensar de manera eficiente los efectos enventanado y de efecto de solapamiento en el dominio del tiempo al comienzo y al final de la trama de TC 120 en la línea 4 de la figura 6, y suponiendo que la trama de TC 120 utiliza modelado de ruido en el dominio de la frecuencia (FDNS), se aplica la corrección de efecto de solapamiento hacia delante (FAC) siguiendo el procesamiento descrito en la figura 8. En primer lugar, debe observarse que la figura 8 describe este procesamiento con respecto tanto a la parte izquierda de la trama de TC 120 alrededor del marcador LPC1, como con respecto a la parte derecha de la trama de TC 120 alrededor del marcador LPC2. Recuérdese que se presume que la trama de TC 120 de la figura 6 va precedida por una trama de ACELP 122 en el límite del marcador LPC1 y seguida por una trama de ACELP 124 en el límite del marcador LPC2.
Para compensar los efectos de enventanado y de efecto de solapamiento en el dominio del tiempo alrededor del marcador LPC1, se describe el procesamiento en la figura 8. En primer lugar, se computa un filtro de ponderación W(z) del filtro de LPC1. El filtro de ponderación W(z) podría ser un análisis modificado o un filtro de blanqueo A(z) de LPC1. Por ejemplo W(z) = A(z/X) donde X es un factor de ponderación predeterminado. La señal de error al comienzo de la trama de TC está indicada con el número de referencia 138 como en el caso de la línea 4 de la figura 6. Este error se denomina blanco de FAC en la figura 8. La señal de error 138 es filtrada por el filtro W(z) en 140, donde un estado inicial de este filtro, es decir donde un estado inicial de esta memoria de filtro, es el error de ACELP 141 en la trama de ACELP 122 de la línea 4 en la figura 6. La salida del filtro W(z) forma entonces la entrada de una transformada 142 en la figura 6. La transformada se muestra a modo de ejemplo como MDCT. A continuación, se cuantifican y codifican los coeficientes de transformación emitidos por la MDCT en el módulo de procesamiento 143. Estos coeficientes codificados pueden conformar por lo menos una parte de los datos de FAC antes mencionados 34. Estos coeficientes codificados pueden ser transmitidos al lado de codificación. La salida del proceso Q, es decir los coeficientes de MDCT cuantificados se introduce posteriormente como entrada de una transformada inversa tal como una IMDCT 144 para constituir una señal en el dominio del tiempo que entonces es filtrada por el filtro inverso 1/W(z) en 145 que tiene memoria cero (estado inicial cero). El filtrado a través de 1/W(z) se extiende más allá de la longitud del blanco de FAC utilizando entrada cero para las muestras que se extienden después del blanco de FAC. La salida del filtro 1/W(z) es una señal de síntesis FAC 146, que es una señal de corrección que se puede aplicar ahora al comienzo de la trama de TC 120 para compensar el efecto de enventanado y el efecto de solapamiento en el dominio del tiempo que ahí se producen.
Se describe ahora el procesamiento de corrección del enventanado y el efecto de solapamiento en el dominio del tiempo al final de la trama de TC 120 (antes del marcador LPC2). Para este fin se hace referencia a la figura 9.
La señal de error al final de la trama de TC 120 en la línea 4 de la figura 6 lleva el número de referencia 147 y representa el blanco de FAC de la figura 9. El blanco de FAC 147 se somete a la misma secuencia de procesamiento que el blanco de FAC 138 de la figura 8, donde el procesamiento difiere únicamente en el estado inicial del filtro de ponderación W(z) 140. El estado inicial del filtro 140 para filtrar el blanco de FAC 147 es el error de la trama de TC 120 de la línea 4 de la figura 6, indicada por el número de referencia 148 en la figura 6. A continuación, las demás etapas de procesamiento 142 a 145 son las mismas que en la figura 8 que se refería al procesamiento del blanco de FAC al comienzo de la trama de TC 120.
El procesamiento de las figuras 8 y 9 es ejecutado completamente de izquierda a derecha cuando se aplica al codificador para obtener la síntesis de FAC local y para computar la reconstrucción resultante con el fin de determinar si el cambio de modo de codificación implicado en la elección del modo de codificación TC de la trama 120 es o no la opción óptima. En el decodificador, el procesamiento realizado en las figuras 8 y 9 se aplica solamente desde el punto medio hasta la derecha. Es decir, los coeficientes de transformación codificados y cuantificados transmitidos por el procesador Q 143 son decodificados para constituir la entrada de la IMDCT. Obsérvense, por ejemplo, las figuras 10 y 11. La figura 10 es igual al lado a mano derecha de la figura 8, en tanto que la figura 11 es igual al lado a mano derecha de la figura 9. El manipulador de transición 60 de la figura 3 puede ser implementado, según la realización específica que se esboza a continuación, según las figuras 10 y 11. Es decir, el manipulador de transición 60 puede someter la información de coeficientes de transformación dentro de los datos de FAC 34 presentes dentro de la trama actual 14b a una retransformada para producir una primera señal de síntesis FAC 146 en caso de la transición de una subparte de un segmento de tiempo de ACELP a una subparte de un segmento de tiempo de FD o TCX, o una segunda señal de síntesis FAC 149 al efectuar la transición de una subparte de un segmento de tiempo de FD o TCX a una subparte de un segmento de tiempo de ACELP.
Obsérvese una vez más que los datos de FAC 34 se pueden referir a dicha transición que tiene lugar dentro del segmento de tiempo actual, en cuyo caso el analizador sintáctico 20 puede derivar la existencia de los datos de FAC 34 solamente de la parte de sintaxis 24, en tanto que el analizador sintáctico 20 tiene que aprovechar la parte de sintaxis 26 si se ha perdido la trama anterior, con el fin de determinar si existen datos de FAC 34 para tales transiciones en el borde delantero del segmento de tiempo actual 16b.
La figura 12 muestra cómo se pueden obtener las señales de síntesis completa o reconstruida correspondientes a la trama actual 120 utilizando las señales de síntesis FAC de las figuras 8 a 11 y aplicando las etapas inversas de la figura 6. Obsérvese de nuevo, que incluso las etapas que se muestran ahora en la figura 12, se realizan asimismo por el codificador con el fin de determinar si el modo de codificación correspondiente a la trama actual da lugar a la mejor optimización, por ejemplo, de la velocidad/sentido de distorsión o similar. En la figura 12, se presume que la trama de ACELP 122 a la izquierda del marcador LPC1 ya ha sido sintetizada o reconstruida, por ejemplo por el módulo 58 de la figura 3, hasta el marcador LPC1, llevando así a la señal de síntesis de ACELP en la línea 2 de la figura 12 con el número de referencia 110. Dado que también se utiliza una corrección de FAC al final de la trama de TC, también se presume que la trama 124 posterior al marcador LPC2 ha de ser una trama de ACELP. A continuación, para producir una señal de síntesis o reconstruida en la trama de TC 120 entre los marcadores LPC1 y LPC2 de la figura 12, se ejecutan las etapas siguientes. Estas etapas también están ilustradas en las figuras 13 y 14, donde la figura 13 ilustra las etapas ejecutadas por el manipulador de transición 60 con el fin de hacer frente a las transiciones de un segmento o subparte de un segmento codificado por TC a una subparte de segmento codificado por ACELP, en tanto que la figura 14 describe el funcionamiento del manipulador de transición en el caso de las transiciones inversas.
1. Una etapa consiste en decodificar la trama de TC codificada por MDCT y colocar la señal en el dominio del tiempo así obtenida entre los marcadores LPC1 y LPC2, tal como se muestra en la línea 2 de la figura 12. La decodificación es ejecutada por el módulo 54 o el módulo 56 e incluye la MDCT inversa como ejemplo de retransformada de TDAC, de manera que la trama TC decodificada contiene efectos de enventanado y de solapamiento en el dominio del tiempo. Dicho de otro modo, el segmento o subparte de segmento de tiempo que va a decodificarse actualmente, e indicado por el índice k en las figuras 13 y 14, puede ser una subparte de segmento de tiempo codificada por ACELP 92b tal como se ilustra en la figura 13 o un segmento de tiempo 16b que es codificado por Fd o una subparte codificada por TCX 92a tal como se ilustra en la figura 14. En el caso de la figura 13, la trama procesada anteriormente es, por tanto, un segmento o subparte de segmento de tiempo codificada por TC, y en el caso de la figura 14, el segmento de tiempo procesado precedentemente es una subparte codificada por ACELP. La señal de reconstrucción o síntesis producida como salida de los módulos 54 a 58 está afectada parcialmente por el efecto de solapamiento. Esto es así también en el caso de los segmentos de señal 78/108.
2. Otra etapa del procesamiento del manipulador de transición 60 consiste en la generación de la señal de síntesis de FAC según la figura 10 en el caso de la figura 14, y según la figura 11 en el caso de la figura 13. Es decir, el manipulador de transición 60 puede ejecutar una retransformada 191 sobre coeficientes de transformación dentro de los datos de FAC 34, con el fin de obtener las señales de síntesis FAC 146 y 149, respectivamente. Las señales de síntesis FAC 146 y 149 están colocadas al comienzo y al final del segmento codificado por TC, que a su vez está afectado por efectos de solapamiento y está nivelado con el segmento de tiempo 78/108. En el caso de la figura 13, por ejemplo, el manipulador de transición 60 coloca la señal de síntesis de FAC 149 al final de la trama codificada por TC k-1 como se ilustra asimismo en la línea 1 de la figura 12. En el caso de la figura 14, el manipulador de transición 60 posiciona la señal de síntesis de FAC 146 al comienzo de la trama codificada por TC k, tal como se ilustra asimismo en la línea 1 de la figura 12. Obsérvese otra vez que la trama k es la trama que va a decodificarse actualmente y que la trama k-1 es la trama decodificada precedentemente.
3. En lo que respecta a la situación de la figura 14, en la cual se produce el cambio de modo de codificación al comienzo de la trama de TC actual k, la señal de síntesis de ACELP (invertida) enventanada y doblada 130 de la trama de ACELP k-1 que precede a la trama de TC k, y la respuesta de entrada cero enventanada o ZIR, del filtro de síntesis LPC1, es decir la señal 132, están colocadas de manera que quedan en el mismo nivel que el segmento de señal retransformado 78/108 que está afectado por el efecto de solapamiento. Esta contribución está expuesta en la línea 3 de la figura 12. Tal como se ilustra en la figura 14 y como ya se describió anteriormente, el manipulador de transición 60 obtiene la señal de cancelación del efecto de solapamiento 132 mediante la continuación del filtrado de síntesis por LPC de la subtrama de CELP precedente más allá del límite delantero del segmento de tiempo actual k y enventanando la continuación de la señal 110 dentro de la señal actual k, indicándose ambas etapas con los números de referencia 190 y 192 en la figura 14. Para obtener la señal de cancelación del efecto de solapamiento 130, el manipulador de transición 60 también enventana, en la etapa 194, el segmento de señal reconstruido 110 de la trama de CELP precedente y utiliza esta señal enventanada e invertida en el tiempo como señal 130.
4. Las contribuciones de las líneas 1, 2 y 3 de la figura 12 y las contribuciones 78/108, 132, 130 y 146 de la figura 14 y las contribuciones 78/108, 149 y 196 de la figura 13, son sumadas por el manipulador de transición 60 en las posiciones niveladas antes explicadas, para formar la señal de audio de síntesis o reconstruida correspondiente a la trama actual k en el dominio original, tal como se muestra en la línea 4 de la figura 12. Obsérvese que el procesamiento de la figura 13 y 14 produce una señal de síntesis o reconstruida 198 en una trama de TC en la que se cancelan los efectos de solapamiento en el dominio del tiempo y enventanado al comienzo y al final de la trama, y donde la discontinuidad posible del límite de la trama alrededor del marcador LPC1 ha sido alisada y enmascarada perceptualmente por el filtro 1/W(z) de la figura 12.
Por tanto, la figura 13 se refiere al procesamiento actual de la trama codificada por CELP k y lleva a la cancelación del efecto de solapamiento hacia delante al final del segmento codificado por TC precedente. Tal como se ilustra en 196, la señal de audio reconstruida en última instancia es reconstruida sin efecto de solapamiento a través del límite entre los segmentos k-1 y k. El procesamiento de la figura 14 lleva a la cancelación del efecto de solapamiento hacia delante al comienzo del segmento codificado por TC actual k tal como se ilustra con el número de referencia 198 que muestra la señal reconstruida a través del límite entre los segmentos k y k -1. El resto del efecto de solapamiento en el extremo posterior del segmento actual k o bien se cancela por la TDAC en caso de que el segmento siguiente sea codificado por TC, o bien por FAC según la figura 13 en caso de que el segmento posterior sea un segmento codificado por ACELP. La figura 13 menciona esta última posibilidad asignando el número de referencia 198 al segmento de señal del segmento de tiempo k-1.
En los párrafos siguientes se mencionan posibilidades específicas de cómo se puede implementar la segunda parte de sintaxis 26.
Por ejemplo, con el fin de hacer frente a la aparición de tramas perdidas, la parte de sintaxis 26 puede realizarse como un campo de 2 bits prev_mode, que señaliza de manera explícita, dentro de la trama actual 14b, el modo de codificación que se aplicó en la trama anterior 14a según la siguiente tabla:
En otras palabras, este campo de 2 bits se puede denominar prev_mode y, por tanto, puede indicar un modo de codificación de la trama anterior 14a. En el caso del ejemplo recién mencionado, se diferencian cuatro estados diferentes, a saber:
1) la trama anterior 14a es una trama de LPD, cuya última subtrama es una subtrama de ACELP;
2) la trama anterior 14a es una trama de LPD, cuya última subtrama es una subtrama codificada por TCX;
3) la trama anterior es una trama de FD que utiliza una ventana de transformación larga y
4) la trama anterior es una trama de FD que utiliza ventanas de transformación cortas.
La posibilidad de utilizar posiblemente diferentes longitudes de ventana del modo de codificación FD ya ha sido mencionada anteriormente en conexión con la descripción de la figura 3. Naturalmente, la parte de sintaxis 26 puede tener simplemente tres estados diferentes y el modo de codificación FD puede ser ejecutado simplemente con una longitud de ventana constante, resumiendo así las dos últimas opciones 3 y 4 de las enumeradas anteriormente.
En cualquier caso, basándose en el campo de 2 bits antes mencionado, el analizador sintáctico 20 puede decidir si hay presencia de datos de FAC para la transición entre el segmento de tiempo actual y el segmento de tiempo anterior 16a dentro de la trama actual 14a o no. Como se describe más adelante de forma más detallada, el analizador sintáctico 20 y el reconstructor 22 pueden incluso determinar, basándose en prev_mode, si la trama anterior 14a ha sido una trama de FD que utiliza una ventana larga (FD_long) o si la trama anterior ha sido una trama de FD que utiliza ventanas cortas (FD_short) y si la trama actual 14b (si la trama actual es una trama de LPD) sigue a una trama de FD o a una trama LPD cuya diferenciación es necesaria según la siguiente realización con el fin de analizar correctamente la sintaxis del flujo de datos y reconstruir la señal de información, respectivamente.
Por tanto, según la posibilidad que se acaba de mencionar del uso de un identificador de 2 bits como parte de sintaxis 26, cada trama 16a a 16c estaría provista de un identificador de 2 bits adicional además de la parte de sintaxis 24 que define que el modo de codificación de la trama actual ha de ser un modo de codificación de FD o LPD y la estructura de subentramado en el caso del modo de codificación por LPD.
En cuanto a todas las realizaciones antes descritas, se debe mencionar que también se deben evitar otras dependencias entre tramas. Por ejemplo, el decodificador de la figura 1 podría tener capacidad para SBR. En ese caso, una frecuencia de cruce podría ser analizada sintácticamente por el analizador sintáctico 20 de cada trama 16a a 16c dentro de los respectivos datos de extensión SBR en lugar de realizar el análisis sintáctico de dicha frecuencia de cruce con un encabezado de SBR que podría ser transmitido dentro del flujo de datos 12 con menos frecuencia. En el mismo sentido se podrían eliminar otras dependencias entre tramas.
Cabe señalar en lo que respecta a todas las realizaciones antes descritas, que el analizador sintáctico 20 podría estar configurado para colocar en memoria intermedia por lo menos la trama actualmente decodificada 14b dentro de una memoria intermedia con el paso de la totalidad de las tramas 14a a 14c a través de esta memoria intermedia de manera FIFO (el primero que entra es el primero en salir). Al utilizar la memoria intermedia, el analizador sintáctico 20 podría ejecutar la retirada de las tramas de esta memoria intermedia en unidades de tramas 14a a 14c. Es decir, la carga y retirada de la memoria intermedia del analizador sintáctico 20 se podrían llevar a cabo en unidades de tramas 14a a 14c para cumplir con las restricciones impuestas por el máximo espacio disponible en memoria intermedia que alberga, por ejemplo, solo una o más de una trama de un tamaño máximo por vez.
A continuación, se describe una posibilidad de señalización alternativa a la parte de sintaxis 26 con consumo reducido de bits. Según esta alternativa, se utiliza una estructura de construcción diferente de la parte de sintaxis 26. En la realización descrita anteriormente, la parte de sintaxis 26 era un campo de 2 bits que se transmite en cada trama 14a a 14c del flujo de datos codificado por USAC. Dado que para la parte de FD solo es importante que el decodificador sepa si tiene que leer datos de FAC del flujo de bits en caso de que se haya perdido la trama anterior 14a, estos 2 bits se pueden dividir en dos indicadores de 1 bit, donde uno de ellos se señaliza en cada trama 14a a 14c como fac_data_present. Este bit puede ser introducido en la estructura single_channel_element y channel_pair_element, según corresponda, tal como se muestra en las tablas de las figuras 15 y 16. Las figuras 15 y 16 se pueden considerar como una definición de estructura de alto nivel de la sintaxis de las tramas 14 según la presente realización, donde las funciones “function_name(...)” evocan subrutinas y los nombres de elementos de sintaxis escritos en negritas indican la lectura del respectivo elemento de sintaxis del flujo de datos. Dicho de otro modo, las partes marcadas o las partes sombreadas de las figuras 15 y 16 indican que cada trama 14a a 14c está provista, según esta realización, de un indicador fac_data_present. El número de referencia 199 indica estas partes.
El otro indicador de 1 bit prev_frame_was_lpd solo se transmite, entonces, en la trama actual si esta ha sido codificada utilizando la parte de LPD de USAC, y señala asimismo si la trama anterior fue codificada utilizando el trayecto de LPD del USAC. Esto está ilustrado en la tabla de la figura 17.
La tabla de la figura 17 ilustra una parte de la información 28 de la figura 1 en el caso en que la trama actual 14b es una trama de LPD. Tal como se muestra en 200, cada trama de LPD está dotada de un indicador prev_frame_was_lpd. Esta información se utiliza para analizar la sintaxis de la trama de LPD actual. De la figura 18 se puede deducir que el contenido y la posición de los datos de FAC 34 de las tramas de LPD dependen de que la transición en el extremo delantero de la trama de LPD actual sea una transición entre el modo de codificación por TCX y el modo de codificación por CELP o una transición del modo de codificación FD al modo de codificación por CELP. En particular, si la trama que se está decodificando actualmente 14b es una trama de LPD precedida inmediatamente por una trama de FD 14a, y fac_data_present señala que hay datos de FAC presentes en la trama de LPD actual (puesto que la subtrama delantera es una subtrama de ACELP), entonces los datos de FAC se leen al final de la sintaxis de la trama LPD en 202, donde los datos de FAC 34 incluyen, en ese caso, un factor de ganancia fac_gain indicado en 204 en la figura 18. Con este factor de ganancia, se ajusta la ganancia de la contribución 149 de la figura 13.
Si, por el contrario, la trama actual es una trama de LPD, donde la trama anterior ha sido también una trama de LPD, es decir, si se produce una transición entre las subtramas de TCX y CELP entre la trama actual y la trama anterior, los datos de FAC son leídos en 206 sin la opción de ajuste de la ganancia, es decir sin que los datos de FAC 34 incluyan el elemento de sintaxis de ganancia de FAC fac_gain. Además, la posición de los datos de FAC leídos en 206 difiere de la posición en la cual se leen los datos de FAC en 202 en el caso en que la trama actual es una trama de LPD y la trama anterior es una trama de FD. Si bien la posición de lectura 202 tiene lugar al final de la trama de LPD actual, la lectura de los datos de FAC en 206 tiene lugar antes de la lectura de los datos específicos de la subtrama, es decir, los datos de ACELP o TCX dependiendo de los modos de las subtramas o de la estructura de las subtramas, en 208 y 210, respectivamente.
En el ejemplo de las figuras 15 a 18, la información de LPC 104 (figura 5) se lee después de los datos específicos de las subtramas tales como 90a y 90b (comparar con la figura 5) en 212.
Para completar solamente, se explica más profundamente la estructura de sintaxis de la trama de LPD según la figura 17 con referencia a los datos de FAC contenidos además, potencialmente, dentro de la trama de LPD, con el fin de otorgar información de FAC con respecto a las transiciones entre subtramas de TCX y ACELP en el interior del segmento de tiempo actual codificado por LPD. En particular, según la realización de las figuras 15 a 18, la estructura de subtramas de LPD se limita a subdividir el segmento de tiempo actual codificado por LPD meramente en unidades de cuartos, asignándose estos cuartos a TCX o ACELP. La estructura exacta de LPD está definida por el elemento de sintaxis lpd_mode leído en 214. El primero y segundo y el tercer y cuarto cuartos pueden formar, en conjunto, una subtrama de TCX, en tanto que las tramas de ACELP se limitan a la longitud de un cuarto solamente. Una subtrama de TCX se puede extender asimismo por todo el segmento de tiempo codificado por LPD, en cuyo caso el número de subtramas es simplemente uno. El bucle de la figura 17 atraviesa los cuartos del segmento de tiempo actual codificado por LPD y transmite, siempre que el cuarto actual k esté al comienzo de una nueva subtrama en el interior del segmento de tiempo actual codificado por LPD, los datos de FAC indicados en 216 siempre que la subtrama inmediatamente precedente a la trama de LPC actualmente en su comienzo/decodificada es de otro modo, es decir del modo TCX si la subtrama actual es del modo ACELP y viceversa.
Para detallar de forma más completa solamente, la figura 19 muestra una posible estructura de sintaxis de una trama de FD según la realización de las figuras 15 a 18. Se puede apreciar que los datos de FAC son leídos al final de la trama FD con la determinación de la presencia o no de datos de FAC 34, lo que meramente implica el indicador fac_data_present. En comparación con esto, el análisis sintáctico de los fac_data 34 en el caso de las tramas de LPD ilustradas en la figura 17 requiere, para un correcto análisis sintáctico, el conocimiento del indicador p rev_fra m e_wa s_lpd.
Por tanto, el indicador de 1 bit prev_frame_was_lpd solo se transmite si la trama actual es codificada empleando la parte de LPD de USAC y señaliza si la trama anterior fue codificada utilizando el trayecto de LPD del códec de USAC (véase la sintaxis de lpd_channel_stream() en la figura 17).
En lo que respecta a la realización de las figuras 15 a 19, se debe observar asimismo que se podría transmitir otro elemento de sintaxis en 220, es decir, en el caso de que la trama actual sea una trama de LPD y la trama anterior sea una trama de FD (donde una primera trama de la trama de LPD actual es una trama de ACELP) por lo que se deben leer los datos de FAC en 202 para abordar la transición de la trama de FD a la subtrama de ACELP en el extremo delantero de la trama de LPD actual. Este elemento de sintaxis adicional leído en 220 podría indicar si la trama FD anterior 14a es FD_long o FD_short. Dependiendo de este elemento de sintaxis, los datos de FAC 202 podrían verse afectados. Por ejemplo, la longitud de la señal de síntesis 149 podría resultar afectada dependiendo de la longitud de la ventana utilizada para transformar la trama de LPD precedente. Resumiendo la realización de las figuras 15 y 19 y transfiriendo las características mencionadas en las mismas a la realización descrita con respecto a las figuras 1 a 14, se podría aplicar lo siguiente a estas últimas realizaciones, ya sea de forma individual o en combinación:
1) Los datos de FAC 34 mencionados en las figuras anteriores tenían por fin indicar principalmente los datos de FAC presentes en la trama actual 14b con el fin de dar lugar a la cancelación del efecto de solapamiento hacia delante en la transición entre la trama anterior 14a y la trama actual 14b, es decir, entre los segmentos de tiempo correspondientes 16a y 16b. Sin embargo, puede haber otros datos de FAC presentes. Sin embargo, estos datos de FAC adicionales se refieren a las transiciones entre subtramas codificadas por TCX y subtramas codificadas por CELP situadas en el interior de la trama actual 14b en caso de que esta sea del modo LPD. La presencia o ausencia de estos datos de FAC adicionales es independiente de la parte de sintaxis 26. En la figura 17, estos datos de FAC adicionales son leídos en 216. La presencia o existencia de los mismos depende simplemente de lpd_mode leído en 214. Este último elemento de sintaxis es, a su vez, parte de la parte de sintaxis 24 que revela el modo de codificación de la trama actual. lpd_mode junto con core_mode leídos en 230 y 232 expuestos en las figuras 15 y 16 corresponden a la parte de sintaxis 24.
2) Además, la parte de sintaxis 26 puede estar compuesta por más de un elemento de sintaxis, tal como se describió anteriormente. El indicador FAC_data_present indica si hay presencia o no de datos de FAC correspondientes al límite entre la trama anterior y la trama actual. Este indicador está presente en una trama de LPD, como así también en las tramas FD. Otro indicador, que en la realización que antecede se denomina prev_frame_was_lpd, es transmitido en tramas de LPD solo para indicar si la trama anterior 14a era del modo LPD o no. Dicho de otro modo, este segundo indicador incluido en la parte de sintaxis 26 indica si la trama anterior 14a era una trama de FD. El analizador sintáctico 20 estima y lee este indicador solo en caso de que la trama actual sea una trama de LPD. En la figura 17, se lee este indicador en 200. Dependiendo de este indicador, el analizador sintáctico 20 puede esperar que los datos de FAC comprendan, y por tanto, lee de la trama actual, un valor de ganancia fac_gain. El valor de ganancia es utilizado por el reconstructor para establecer la ganancia de la señal de síntesis de FAC correspondiente a la FAC en la transición entre los segmentos de tiempo actual y anterior. En la realización de las figuras 15 a 19, este elemento de sintaxis se lee en 204, donde la dependencia del segundo indicador surge claramente de la comparación de las condiciones que conducen a la lectura 206 y 202, respectivamente. Adicional o alternativamente, prev_frame_was_lpd puede controlar una posición en la que el analizador sintáctico 20 estima y lee los datos de FAC. En la realización de las figuras 15 a 19, estas posiciones eran 206 o 202. Además, la segunda parte de sintaxis 26 puede comprender asimismo otro indicador en caso de que la trama actual sea una trama de LPD, donde la subtrama delantera de la cual es una trama de ACELP y una trama anterior es una trama de FD, para indicar si la trama de FD anterior se codifica utilizando una ventana de transformación larga o una ventana de transformación corta. Este último indicador podría leerse en 220 en el caso de la realización anterior de las figuras 15 a 19. El conocimiento de esta longitud de transformada FD se puede utilizar con el fin de determinar la longitud de las señales de síntesis de FAC y el tamaño de los datos de<f>A<c>38, respectivamente. Mediante esta medida, los datos de FAC se pueden adaptar en tamaño a la longitud de solapado de la ventana de la trama de FD anterior, para poder obtener un mejor compromiso entre la calidad de la codificación y la velocidad de codificación.
3) Dividiendo la segunda parte de sintaxis 26 en los tres indicadores recién mencionados, es posible transmitir solamente un indicador o bit para señalizar la segunda parte de sintaxis 26 en caso de que la trama actual sea una trama de FD, meramente dos indicadores o bits en caso de que la trama actual sea una trama de LPD y que la trama anterior sea una trama de LPD, también. Solamente en el caso de una transición de una trama de FD a una trama de LPD actual, se debe transmitir un tercer indicador en la trama actual. Alternativamente, tal como se indicó anteriormente, la segunda parte de sintaxis 26 puede ser un indicador de 2 bits transmitido para cada trama y que indica el modo de la trama que precede a esta trama en la medida de lo necesario para que el analizador sintáctico decida si los datos de FAC 38 tienen que ser leídos de la trama actual o no, y en caso de ser así, de dónde y de qué longitud es la señal de síntesis de fAc . Es decir, la realización específica de las figuras 15 a 19 podría hacerse extensiva fácilmente a la realización que utiliza el identificador de 2 bits anterior para implementar la segunda parte de sintaxis 26. En lugar de FAC_data_present indicado en las figuras 15 y 16, se transmitiría el identificador de 2 bits. No sería necesario transmitir los indicadores indicados en 200 y 220. Por el contrario, el contenido de fac_data_present en la cláusula “if” que lleva a 206 y 218, podría ser derivado por el analizador sintáctico 20 a partir del identificador de 2 bits. Se podría acceder a la siguiente tabla en el decodificador para aprovechar el indicador de 2 bits
Una parte de sintaxis 26 podría tener también meramente tres valores diferentes posibles en caso de que las tramas FD utilicen solo una longitud posible.
Una estructura de sintaxis ligeramente diferente, aunque similar a la descrita anteriormente con respecto a las figuras 15 a 19 es la mostrada en las figuras 20 a 22 usando los mismos números de referencia utilizados con respecto a las figuras 15 a 19, de modo que se hace referencia a esa realización para la explicación de la realización de la figura 20 a 22.
Con respecto a las realizaciones descritas con relación a la figura 3 y siguientes, se observa que se puede utilizar cualquier esquema de codificación por transformada con la propiedad de efecto de solapamiento en relación con las tramas de TCX, además de MDCT. Además, también se podría utilizar un esquema de codificación por transformada tal como FFT, sin efecto de solapamiento entonces en el modo LPD, es decir, sin FAC para las transiciones de subtramas dentro de las tramas de LPD y, por tanto, sin necesidad de transmitir datos de FAC para los límites de subtrama entre los límites de LPD. Los datos de FAC estarían incluidos, entonces, solamente para cada transición de FD a LPD y viceversa.
Con respecto a las realizaciones descritas con respecto a la figura 1 y siguientes, se observa que las mismas se referían al caso en que se incluyó la parte de sintaxis adicional 26 en línea, es decir dependiendo exclusivamente de una comparación entre el modo de codificación de la trama actual y el modo de codificación de la trama anterior tal como se define en la primera parte de sintaxis de esa trama anterior, de modo que en todas las realizaciones antes descritas, el decodificador o analizador sintáctico puede anticipar de manera singular el contenido de la segunda parte de sintaxis de la trama actual mediante el uso o la comparación de la primera parte de sintaxis de estas tramas, concretamente la trama anterior y la actual. Es decir, en el caso de no existir pérdida de tramas, fue posible que el decodificador o analizador sintáctico derivara, de las transiciones entre las tramas la existencia de datos de FAC presentes o no en la trama actual. En caso de perderse una trama, la segunda parte de sintaxis, como por ejemplo el bit de indicador de fac_data_present ofrece explícitamente esa información. Sin embargo, según otra realización, el codificador podría aprovechar esta posibilidad de señalización explícita ofrecida por la segunda parte de sintaxis 26 para aplicar una codificación inversa según la cual la parte de sintaxis 26 es adaptativa, es decir, con la decisión de la ejecución inmediata trama por trama, por ejemplo, establecida de tal manera que, si bien la transición entre la trama actual y la trama anterior es del tipo que habitualmente viene acompañada por datos de FAC (tales como FD/TCX, es decir, cualquier modo de codificación por TC, a ACELP, es decir cualquier modo de codificación en el dominio del tiempo, o viceversa) la parte de sintaxis de la trama actual indica la ausencia de FAC. El decodificador podría ser implementado entonces de manera que actúe estrictamente según la parte de sintaxis 26, deshabilitando así, o suprimiendo, con eficacia, la transmisión de datos de FAC en el codificador que señaliza esta supresión meramente estableciendo, por ejemplo, fac_data_present = 0. La situación en que esta puede ser una opción favorable es cuando la codificación se realiza a velocidades muy bajas, donde los datos de FAC adicionales podrían costar demasiados bits, en tanto que la distorsión por efecto de solapamiento producida como resultado puede ser tolerable en comparación con la calidad general del sonido.
Si bien se han descrito algunos aspectos en el contexto de un aparato, es evidente que estos aspectos también representan una descripción del método correspondiente, donde un bloque o dispositivo corresponde a una etapa del método o a una característica de una etapa del método. De manera análoga, los aspectos descritos en el contexto de la etapa de un método también representan una descripción de un correspondiente bloque o artículo o característica de un correspondiente aparato. Algunas o todas las etapas del método pueden ser ejecutadas por (o mediante el uso de) un aparato de hardware, como por ejemplo un microprocesador, un ordenador programable o un circuito electrónico. En algunas realizaciones, una o más de las etapas del método más importantes pueden ser ejecutadas por un aparato de este tipo.
Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención se pueden implementar en hardware o en software. La implementación se puede ejecutar empleando un medio de almacenamiento digital, por ejemplo un disco flexible, un DVD, un Blue-Ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene almacenadas en la misma señales control legibles electrónicamente, que actúan conjuntamente (o pueden actuar conjuntamente) con un sistema informático programable de tal manera que se ejecute el método respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible por ordenador.
Las realizaciones descritas anteriormente son meramente ilustrativas de los principios de la presente invención. Se entiende que las modificaciones y variaciones de las disposiciones y detalles descritos en el presente documento serán evidentes para los expertos en la técnica. Por lo tanto, solo es intención limitarse por el alcance de las siguientes reivindicaciones de patente y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones del presente documento.

Claims (1)

  1. REIVINDICACIONES
    Decodificador (10) para decodificar un flujo de datos (12) que comprende una secuencia de tramas en las cuales se codifican segmentos de tiempo de una señal de información (18), respectivamente, que comprende
    un analizador sintáctico (20) configurado para analizar el flujo de datos (12), donde el analizador sintáctico está configurado para, al analizar el flujo de datos (12), leer una primera parte de sintaxis (24) y una segunda parte de sintaxis de una trama actual (14b); y
    un reconstructor (22) configurado para reconstruir un segmento de tiempo actual (16b) de la señal de información (18) asociado con la trama actual (14b) basándose en la información (28) obtenida de la trama actual mediante el análisis sintáctico, utilizando un primer modo seleccionado de entre un modo de decodificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento y un modo de decodificación en el dominio del tiempo, dependiendo la primera selección de la primera parte de sintaxis (24),
    donde el analizador sintáctico (20) está configurado para, al analizar el flujo de datos (12), ejecutar una segunda acción seleccionada de entre:
    una primera acción de estimación de que la trama actual (14b) comprende, y por tanto leer, los datos de cancelación del efecto de solapamiento hacia delante (34) de la trama actual (14b) y
    una segunda acción de estimar que la trama actual (14b) no comprende, y por tanto no leer, los datos de cancelación del efecto de solapamiento hacia delante (34) de la trama actual (14b)
    dependiendo la segunda selección de la segunda parte de sintaxis,
    donde el reconstructor (22) está configurado para ejecutar la cancelación del efecto de solapamiento hacia delante en un límite entre el segmento de tiempo actual (16b) y un segmento de tiempo anterior (16a) de una trama anterior (14a) usando los datos de cancelación del efecto de solapamiento hacia delante (34),
    en el que las partes de sintaxis primera y segunda están comprendidas por cada trama, donde la primera parte de sintaxis (24) asocia la trama respectiva de la cual se ha leído, con un primer tipo de trama o un segundo tipo de trama y si la trama respectiva es del segundo tipo de trama, asocia subtramas de una subdivisión de la trama respectiva, compuesta por un número de subtramas, a una respectiva de un primer tipo de subtrama y un segundo tipo de subtrama, donde el reconstructor (22) está configurado, si la primera parte de sintaxis (24) asocia la trama respectiva con el primer tipo de trama, para utilizar la decodificación en el dominio de la frecuencia como una primera versión del modo de decodificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento para reconstruir el segmento de tiempo asociado a la trama respectiva y, si la primera parte de sintaxis (24) asocia la respectiva trama con el segundo tipo de trama, para utilizar, para cada subtrama de la trama respectiva, la decodificación por predicción lineal excitada por código de transformada como segunda versión del modo de decodificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento para reconstruir una subparte del segmento de tiempo de la trama respectiva, que está asociada a la respectiva subtrama, si la primera parte de sintaxis (24) asocia la respectiva subtrama de la respectiva trama con el primer tipo de trama, y la decodificación por predicción lineal excitada por libro de códigos adaptativo como modo de decodificación en el dominio del tiempo para reconstruir una subparte del segmento de tiempo de la trama respectiva, que está asociada a la respectiva subtrama, si la primera parte de sintaxis (24) asocia la respectiva subtrama con un segundo tipo de subtrama,
    en el que la segunda parte de sintaxis comprende un primer indicador que señaliza si los datos de cancelación de efecto de solapamiento hacia delante (34) están presentes o no en la trama respectiva, y el analizador sintáctico está configurado para realizar la segunda selección dependiendo del primer indicador, y en el que la segunda parte de sintaxis comprende además un segundo indicador simplemente dentro de tramas del segundo tipo de trama, señalizando el segundo indicador si la trama anterior es del primer tipo de trama o del segundo tipo de trama, siendo la última subtrama del primer tipo de subtrama,
    en el que el analizador sintáctico está configurado para realizar la lectura de los datos de cancelación de efecto de solapamiento hacia delante (34) a partir de la trama actual (14b), si la trama actual (14b) es del segundo tipo de trama, dependiendo del segundo indicador porque una ganancia de cancelación de efecto de solapamiento hacia delante se analiza sintácticamente a partir de datos de cancelación de efecto de solapamiento hacia delante (34) en caso de que la trama anterior sea del primer tipo de trama, y no si la trama anterior es del segundo tipo de trama, siendo la última subtrama del mismo primer tipo de subtrama, en el que el reconstructor está configurado para realizar la cancelación de efecto de solapamiento hacia delante a una intensidad que depende de la ganancia de cancelación de efecto de solapamiento hacia delante en caso de que la trama anterior sea del primer tipo de trama,
    en el que el reconstructor está configurado para
    por trama del primer tipo de trama, realizar una descuantificación variable espectral (70) de la información del coeficiente de transformación dentro de la trama respectiva del primer tipo de trama basándose en la información del factor de escala dentro del trama respectivo del primer tipo de trama, y una retransformación que implica una transformada de coseno discreta modificada inversa en la información del coeficiente de transformación descuantificada para obtener un segmento de señal retransformado (78) que se extiende, en el tiempo, más allá del segmento de tiempo asociado con la trama respectiva del primer tipo de trama, y
    por trama del segundo tipo de trama,
    por subtrama del primer tipo de subtrama de la respectiva trama del segundo tipo de trama,
    derivar (94) un filtro de ponderación espectral a partir de información LPC dentro de la trama respectiva del segundo tipo de trama,
    ponderar espectralmente (96) información de coeficiente de transformación dentro de la subtrama respectiva del primer tipo de subtrama usando el filtro de ponderación espectral, y
    retransformar (98) la información del coeficiente de transformación ponderada espectralmente para obtener un segmento de señal retransformado que se extiende, en el tiempo, más allá de la subparte del segmento de tiempo asociado con la subtrama respectiva del primer tipo de subtrama, y,
    por subtrama del segundo tipo de subtrama de la respectiva trama de la segunda trama,
    derivar (100) una señal de excitación a partir de información de actualización de excitación dentro de la subtrama respectiva del segundo tipo de subtrama y
    realizar filtrado de síntesis LPC (102) en la señal de excitación usando la información LPC dentro de la trama respectiva del segundo tipo de trama con el fin de obtener un segmento de señal sintetizada LP (110) para la subparte del segmento de tiempo asociado con la subtrama respectiva del segundo tipo de subtrama, y
    realizar la cancelación de alias en el dominio del tiempo dentro de porciones de ventana que se superponen temporalmente en los límites entre segmentos de tiempo de cuadros inmediatamente consecutivos del primer tipo de trama y subpartes de segmentos de tiempo, que están asociados con subtramas del primer tipo de subtrama, para reconstruir la señal de información (18) a través del mismo, y
    si la trama anterior es del primer tipo de trama o del segundo tipo de trama siendo una última subtrama de la misma del primer tipo de subtrama, y la trama actual (14b) es del segundo tipo de trama siendo su primera subtrama del segundo tipo de subtrama, derivar una primera señal de síntesis de cancelación del efecto de solapamiento hacia delante a partir de los datos de cancelación del efecto de solapamiento hacia delante (34) y añadir la primera señal de síntesis de cancelación del efecto de solapamiento hacia delante al segmento de señal retransformado (78) dentro del segmento de tiempo anterior para reconstruir la señal de información (18) a través del límite entre las tramas anterior y actual (14a, 14b), y
    si la trama anterior (14a) es del segundo tipo de trama siendo la última subtrama de la misma del segundo tipo de subtrama, y la trama actual (14b) es del primer tipo de trama o del segundo tipo de trama con una primera sub siendo la trama de la misma del primer tipo de subtrama, derivar una segunda señal de síntesis de cancelación del efecto de solapamiento hacia delante a partir de los datos de cancelación del efecto de solapamiento hacia delante (34) y añadir la segunda señal de síntesis de cancelación del efecto de solapamiento hacia delante al segmento de señal retransformado dentro del segmento de tiempo actual (16b). ) para reconstruir la señal de información (18) a través del límite entre los segmentos de tiempo anterior y actual (16a, 16b).
    Decodificador según la reivindicación 1, en el cual la segunda parte de sintaxis comprende además un tercer indicador que señaliza si la trama anterior implica una ventana de transformación larga o ventanas de transformación cortas, simplemente dentro de tramas del segundo tipo de trama si el segundo indicador señala que la trama anterior es del primer tipo de trama, donde el analizador sintáctico está configurado para ejecutar la lectura de los datos de cancelación del efecto de solapamiento hacia delante (34) de la trama actual (14b) dependiendo del tercer indicador, por lo que la cantidad de datos de cancelación del efecto de solapamiento hacia delante (34) es mayor si la trama anterior implica la ventana de transformación larga, y es menor si la trama anterior implica las ventanas de transformación cortas.
    3. Decodificador según la reivindicación 1 o 2, en el cual el reconstructor está configurado para, si la trama anterior es del segundo tipo de trama, siendo la última subtrama de la misma del segundo tipo de subtrama y la trama actual (14b) es del primer tipo de trama o el segundo tipo de trama siendo su primera subtrama del primer tipo de subtrama, realizar una ventana en el segmento de señal de síntesis LP de la última subtrama de la trama anterior para obtener un primer segmento de señal de cancelación del efecto de solapamiento y añadir el primer segmento de señal de cancelación del efecto de solapamiento al segmento de señal retransformado dentro del segmento de tiempo actual.
    4. Decodificador según cualquiera de las reivindicaciones 1 a 3, en el cual el reconstructor está configurado para, si la trama anterior es del segundo tipo de trama con una última subtrama de la misma que es del segundo tipo de subtrama y la trama actual (14b) es del primer tipo de trama o del segundo tipo de trama siendo su primera subtrama del primer tipo de subtrama, continuar el filtrado de síntesis LPC realizado en la señal de excitación de la trama anterior en la trama actual, ventana una continuación así derivada del segmento de señal de síntesis LP de la trama anterior dentro de la trama actual (14b) para obtener un segundo segmento de señal de cancelación del efecto de solapamiento y añadir el segundo segmento de señal de cancelación del efecto de solapamiento al segmento de señal retransformado dentro del segmento de tiempo actual.
    5. Decodificador según cualquiera de las reivindicaciones 1 o 4, en el cual el analizador sintáctico (20) está configurado para, al analizar sintácticamente el flujo de datos (12), ejecutar la segunda selección dependiendo de la segunda parte de sintaxis e independientemente del hecho de si la trama actual (14b) y la trama anterior (14a) se codifican utilizando el mismo modo o uno diferente del modo de decodificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento y el modo de decodificación en el dominio del tiempo.
    6. Método para decodificar un flujo de datos (12) que comprende una secuencia de tramas en la cual se codifican segmentos de tiempo de una señal de información (18), respectivamente, que comprende
    efectuar el análisis sintáctico del flujo de datos (12), donde el análisis del flujo de datos comprende leer una primera parte de sintaxis (24) y una segunda parte de sintaxis de una trama actual (14b); y
    reconstruir un segmento de tiempo actual de la señal de información (18) asociado a la trama actual (14b) basándose en la información obtenida de la trama actual (14b) mediante el análisis sintáctico, utilizando un primer modo seleccionado de entre un modo de decodificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento y un modo de decodificación en el dominio del tiempo, dependiendo la primera selección de la primera parte de sintaxis (24),
    donde, al analizar el flujo de datos (12), se ejecuta una segunda acción seleccionada de entre una primera acción que consiste en estimar que la trama actual (14b) comprende, y por tanto leer, los datos de cancelación del efecto de solapamiento hacia delante (34) de la trama actual (14b) y una segunda acción que consiste en estimar que la trama actual (14b) no comprende, y por tanto no leer, datos de cancelación del efecto de solapamiento hacia delante (34) de la trama actual (14b), dependiendo la segunda selección de la segunda parte de sintaxis,
    donde la reconstrucción comprende ejecutar la cancelación del efecto de solapamiento hacia delante en un límite entre el segmento de tiempo actual y un segmento de tiempo anterior de una trama anterior utilizando los datos de cancelación del efecto de solapamiento hacia delante (34),
    en el que las partes de sintaxis primera y segunda están comprendidas por cada trama, donde la primera parte de sintaxis (24) asocia la trama respectiva de la cual se ha leído, con un primer tipo de trama o un segundo tipo de trama, y si la trama respectiva es del segundo tipo de trama, asocia subtramas de una subdivisión de la trama respectiva, compuesta por un número de subtramas, a una respectiva un primer tipo de subtrama y un segundo tipo de subtrama, donde la reconstrucción comprende, si la primera parte de sintaxis (24) asocia la trama respectiva con el primer tipo de trama, utilizar la decodificación en el dominio de la frecuencia como una primera versión del modo de decodificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento para reconstruir el segmento de tiempo asociado a la trama respectiva y, si la primera parte de sintaxis (24) asocia la respectiva trama con el segundo tipo de trama, utilizar, para cada subtrama de la trama respectiva, la decodificación por predicción lineal excitada por código de transformada como segunda versión del modo de decodificación por transformada en el dominio del tiempo con cancelación del efecto de solapamiento para reconstruir una subparte del segmento de tiempo de la trama respectiva, que está asociada a la respectiva subtrama, si la primera parte de sintaxis (24) asocia la respectiva subtrama de la respectiva trama con el primer tipo de trama, y la decodificación por predicción lineal excitada por libro de códigos adaptativo como modo de decodificación en el dominio del tiempo para reconstruir una subparte del segmento de tiempo de la trama respectiva, que está asociada a la respectiva subtrama, si la primera parte de sintaxis (24) asocia la respectiva subtrama con un segundo tipo de subtrama,
    en el que la segunda parte de sintaxis comprende un primer indicador que indica si los datos de cancelación del efecto de solapamiento hacia delante (34) están presentes o no en la trama respectiva, y la segunda selección se realiza dependiendo del primer indicador, y en el que la segunda parte de sintaxis comprende además un segundo indicador simplemente dentro de tramas del segundo tipo de trama, señalizando el segundo indicador si la trama anterior es del primer tipo de trama o del segundo tipo de trama, siendo su última subtrama del primer tipo de subtrama,
    en el que la lectura de los datos de cancelación del efecto de solapamiento hacia delante (34) de la trama actual (14b), si la trama actual (14b) es del segundo tipo de trama, se realiza dependiendo del segundo indicador en el que se analiza una ganancia de cancelación del efecto de solapamiento hacia delante a partir de los datos de cancelación del efecto de solapamiento hacia delante (34) en el caso de que la trama anterior sea del primer tipo de trama, y no si la trama anterior sea del segundo tipo de trama siendo la última subtrama de la misma del primer tipo de subtrama, en donde la cancelación del efecto de solapamiento hacia delante se realiza a una intensidad que depende de la ganancia de cancelación del efecto de solapamiento hacia delante en caso de que la trama anterior sea del primer tipo de trama,
    comprendiendo el método además
    por trama del primer tipo de trama, realizando una descuantización variable espectral (70) de la información del coeficiente de transformación dentro de la trama respectiva del primer tipo de trama basándose en la información del factor de escala dentro de la trama respectiva del primer tipo de trama, y una retransformación que implica una transformada de coseno discreta modificada inversa en la información del coeficiente de transformación descuantificada para obtener un segmento de señal retransformado (78) que se extiende, en el tiempo, más allá del segmento de tiempo asociado con la trama respectiva del primer tipo de trama, y
    por trama del segundo tipo de trama,
    por subtrama del primer tipo de subtrama de la respectiva trama del segundo tipo de trama,
    derivar (94) un filtro de ponderación espectral a partir de información LPC dentro de la trama respectiva del segundo tipo de trama,
    la ponderación espectral (96) transforma la información del coeficiente dentro de la subtrama respectiva del primer tipo de subtrama usando el filtro de ponderación espectral, y
    retransformar (98) la información del coeficiente de transformación ponderada espectralmente para obtener un segmento de señal retransformado que se extiende, en el tiempo, más allá de la subparte del segmento de tiempo asociado con la subtrama respectiva del primer tipo de subtrama, y,
    por subtrama del segundo tipo de subtrama de la respectiva trama de la segunda trama,
    derivar (100) una señal de excitación a partir de información de actualización de excitación dentro de la subtrama respectiva del segundo tipo de subtrama y
    realizar filtrado de síntesis LPC (102) en la señal de excitación usando la información LPC dentro de la trama respectiva del segundo tipo de trama para obtener un segmento de señal sintetizada LP (110) para la subparte del segmento de tiempo asociado con la subtrama respectiva del segundo tipo de subtrama, y
    realizar la cancelación del efecto de solapamiento en el dominio del tiempo dentro de porciones de ventana que se superponen temporalmente en los límites entre segmentos de tiempo de tramas inmediatamente consecutivas del primer tipo de trama y subpartes de segmentos de tiempo, que están asociadas con<subtramas del primer tipo de subtrama, para reconstruir el señal de información (>18<) a través del mismo, y>
    si la trama anterior es del primer tipo de trama o del segundo tipo de trama siendo una última subtrama de la misma del primer tipo de subtrama, y la trama actual (14b) es del segundo tipo de trama siendo su primera subtrama del segundo tipo de subtrama, derivar una primera señal de síntesis de cancelación del efecto de solapamiento hacia delante a partir de los datos de cancelación del efecto de solapamiento hacia delante (34) y añadir la primera señal de síntesis de cancelación del efecto de solapamiento hacia delante al segmento de señal retransformado (78) dentro del segmento de tiempo anterior para reconstruir la señal de información (18) a través del límite entre las tramas anterior y actual (14a, 14b), y
    si la trama anterior (14a) es del segundo tipo de trama siendo la última subtrama de la misma del segundo tipo de subtrama, y la trama actual (14b) es del primer tipo de trama o del segundo tipo de trama con una primera sub siendo su trama del primer tipo de subtrama, derivando una segunda señal de síntesis de cancelación del efecto de solapamiento hacia delante a partir de los datos de cancelación del efecto de solapamiento hacia delante (34) y añadiendo la segunda señal de síntesis de cancelación del efecto de solapamiento hacia delante al segmento de señal retransformado dentro del segmento de tiempo actual (16b) para reconstruir la señal de información (18) a través del límite entre los segmentos de tiempo anterior y actual (16a, 16b).
    7. Un programa informático que tiene un código de programa para realizar, cuando se ejecuta en un ordenador, un método según la reivindicación 6.
ES22194160T 2010-07-08 2011-07-07 Decodificador que utiliza cancelación del efecto de solapamiento hacia delante Active ES2968927T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US36254710P 2010-07-08 2010-07-08
US37234710P 2010-08-10 2010-08-10

Publications (1)

Publication Number Publication Date
ES2968927T3 true ES2968927T3 (es) 2024-05-14

Family

ID=44584140

Family Applications (3)

Application Number Title Priority Date Filing Date
ES11730006T Active ES2710554T3 (es) 2010-07-08 2011-07-07 Codificador que utiliza cancelación del efecto de solapamiento hacia delante
ES18200492T Active ES2930103T3 (es) 2010-07-08 2011-07-07 Codificador que utiliza cancelación del efecto de solapamiento hacia delante
ES22194160T Active ES2968927T3 (es) 2010-07-08 2011-07-07 Decodificador que utiliza cancelación del efecto de solapamiento hacia delante

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES11730006T Active ES2710554T3 (es) 2010-07-08 2011-07-07 Codificador que utiliza cancelación del efecto de solapamiento hacia delante
ES18200492T Active ES2930103T3 (es) 2010-07-08 2011-07-07 Codificador que utiliza cancelación del efecto de solapamiento hacia delante

Country Status (17)

Country Link
US (1) US9257130B2 (es)
EP (10) EP4398246A2 (es)
JP (5) JP5981913B2 (es)
KR (1) KR101456639B1 (es)
CN (1) CN103109318B (es)
AR (1) AR082142A1 (es)
AU (1) AU2011275731B2 (es)
BR (3) BR122021002104B1 (es)
CA (1) CA2804548C (es)
ES (3) ES2710554T3 (es)
MX (1) MX2013000086A (es)
MY (1) MY161986A (es)
PL (3) PL4120248T3 (es)
PT (2) PT3451333T (es)
SG (1) SG186950A1 (es)
TW (1) TWI476758B (es)
WO (1) WO2012004349A1 (es)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2401487T3 (es) * 2008-07-11 2013-04-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena
EP2524374B1 (en) * 2010-01-13 2018-10-31 Voiceage Corporation Audio decoding with forward time-domain aliasing cancellation using linear-predictive filtering
EP4398246A2 (en) * 2010-07-08 2024-07-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder using forward aliasing cancellation
EP3503098B1 (en) * 2011-02-14 2023-08-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
BR112015019543B1 (pt) * 2013-02-20 2022-01-11 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho para codificar um sinal de áudio, descodificador para descodificar um sinal de áudio, método para codificar e método para descodificar um sinal de áudio
EP3671738B1 (en) * 2013-04-05 2024-06-05 Dolby International AB Audio encoder and decoder
CA2915805C (en) 2013-06-21 2021-10-19 Jeremie Lecomte Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pitch lag estimation
TR201808890T4 (tr) 2013-06-21 2018-07-23 Fraunhofer Ges Forschung Bir konuşma çerçevesinin yeniden yapılandırılması.
CN105556600B (zh) * 2013-08-23 2019-11-26 弗劳恩霍夫应用研究促进协会 用于混迭误差信号来处理音频信号的装置及方法
ES2716652T3 (es) * 2013-11-13 2019-06-13 Fraunhofer Ges Forschung Codificador para la codificación de una señal de audio, sistema de transmisión de audio y procedimiento para la determinación de valores de corrección
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980796A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
FR3024582A1 (fr) * 2014-07-29 2016-02-05 Orange Gestion de la perte de trame dans un contexte de transition fd/lpd
KR101892086B1 (ko) 2016-05-19 2018-08-27 주식회사 삼양사 옥심에스테르 유도체 화합물, 이를 포함하는 광중합 개시제, 및 감광성 조성물
US10438597B2 (en) * 2017-08-31 2019-10-08 Dolby International Ab Decoder-provided time domain aliasing cancellation during lossy/lossless transitions
KR101991903B1 (ko) 2017-12-07 2019-10-01 주식회사 삼양사 카바졸 옥심에스테르 유도체 화합물 및 이를 포함하는 광중합 개시제와 감광성 조성물
WO2020094263A1 (en) 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
KR102228630B1 (ko) 2018-12-28 2021-03-16 주식회사 삼양사 카바졸 멀티 베타 옥심에스테르 유도체 화합물 및 이를 포함하는 광중합 개시제와 포토레지스트 조성물
US11488613B2 (en) * 2019-11-13 2022-11-01 Electronics And Telecommunications Research Institute Residual coding method of linear prediction coding coefficient based on collaborative quantization, and computing device for performing the method

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE302991T1 (de) * 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
US7516064B2 (en) 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
FI118835B (fi) * 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
FI118834B (fi) * 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
EP1798724B1 (en) * 2004-11-05 2014-06-18 Panasonic Corporation Encoder, decoder, encoding method, and decoding method
KR100878766B1 (ko) * 2006-01-11 2009-01-14 삼성전자주식회사 오디오 데이터 부호화 및 복호화 방법과 장치
US20070168197A1 (en) 2006-01-18 2007-07-19 Nokia Corporation Audio coding
US8379868B2 (en) 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
KR101016224B1 (ko) 2006-12-12 2011-02-25 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 인코더, 디코더 및 시간 영역 데이터 스트림을 나타내는 데이터 세그먼트를 인코딩하고 디코딩하는 방법
CN101231850B (zh) * 2007-01-23 2012-02-29 华为技术有限公司 编解码方法及装置
CA2691993C (en) * 2007-06-11 2015-01-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal
CA2871498C (en) * 2008-07-11 2017-10-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and decoder for encoding and decoding audio samples
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
ES2401487T3 (es) * 2008-07-11 2013-04-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena
KR20100007738A (ko) * 2008-07-14 2010-01-22 한국전자통신연구원 음성/오디오 통합 신호의 부호화/복호화 장치
PT2146344T (pt) * 2008-07-17 2016-10-13 Fraunhofer Ges Forschung Esquema de codificação/descodificação de áudio com uma derivação comutável
US9037474B2 (en) * 2008-09-06 2015-05-19 Huawei Technologies Co., Ltd. Method for classifying audio signal into fast signal or slow signal
FR2936898A1 (fr) * 2008-10-08 2010-04-09 France Telecom Codage a echantillonnage critique avec codeur predictif
KR101649376B1 (ko) * 2008-10-13 2016-08-31 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
KR101315617B1 (ko) 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
KR101797033B1 (ko) * 2008-12-05 2017-11-14 삼성전자주식회사 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
WO2010125228A1 (en) 2009-04-30 2010-11-04 Nokia Corporation Encoding of multiview audio signals
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
EP3352168B1 (en) * 2009-06-23 2020-09-16 VoiceAge Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
US9613630B2 (en) * 2009-11-12 2017-04-04 Lg Electronics Inc. Apparatus for processing a signal and method thereof for determining an LPC coding degree based on reduction of a value of LPC residual
EP2524374B1 (en) * 2010-01-13 2018-10-31 Voiceage Corporation Audio decoding with forward time-domain aliasing cancellation using linear-predictive filtering
CN102934161B (zh) * 2010-06-14 2015-08-26 松下电器产业株式会社 音频混合编码装置以及音频混合解码装置
EP4398246A2 (en) * 2010-07-08 2024-07-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder using forward aliasing cancellation
AR085445A1 (es) * 2011-03-18 2013-10-02 Fraunhofer Ges Forschung Codificador y decodificador que tiene funcionalidad de configuracion flexible

Also Published As

Publication number Publication date
TWI476758B (zh) 2015-03-11
SG186950A1 (en) 2013-02-28
US20130124215A1 (en) 2013-05-16
AR082142A1 (es) 2012-11-14
JP6417299B2 (ja) 2018-11-07
ES2930103T3 (es) 2022-12-05
JP2021006924A (ja) 2021-01-21
MX2013000086A (es) 2013-02-26
BR112013000489B1 (pt) 2021-06-01
PL3451333T3 (pl) 2023-01-23
EP4398248A2 (en) 2024-07-10
PT3451333T (pt) 2022-11-22
EP4120248B1 (en) 2023-12-20
JP2013532310A (ja) 2013-08-15
EP4322160A2 (en) 2024-02-14
JP2019032550A (ja) 2019-02-28
JP5981913B2 (ja) 2016-08-31
MY161986A (en) 2017-05-31
AU2011275731A1 (en) 2013-02-21
AU2011275731B2 (en) 2015-01-22
PL2591470T3 (pl) 2019-05-31
EP3451333A1 (en) 2019-03-06
EP4398244A2 (en) 2024-07-10
EP2591470B1 (en) 2018-12-05
EP4372742A2 (en) 2024-05-22
CN103109318B (zh) 2015-08-05
EP4120248A1 (en) 2023-01-18
EP4120248C0 (en) 2023-12-20
CN103109318A (zh) 2013-05-15
JP2023071685A (ja) 2023-05-23
JP6773743B2 (ja) 2020-10-21
KR20130045349A (ko) 2013-05-03
KR101456639B1 (ko) 2014-11-04
JP7488926B2 (ja) 2024-05-22
JP2016006535A (ja) 2016-01-14
CA2804548C (en) 2016-06-21
PT2591470T (pt) 2019-04-08
EP2591470A1 (en) 2013-05-15
WO2012004349A1 (en) 2012-01-12
EP3451333B1 (en) 2022-09-07
BR122021002104B1 (pt) 2021-11-03
EP4398246A2 (en) 2024-07-10
TW201222529A (en) 2012-06-01
JP7227204B2 (ja) 2023-02-21
ES2710554T3 (es) 2019-04-25
RU2013105268A (ru) 2014-08-20
PL4120248T3 (pl) 2024-05-13
BR122021002034B1 (pt) 2021-11-03
EP4322160A3 (en) 2024-05-08
EP4398247A2 (en) 2024-07-10
US9257130B2 (en) 2016-02-09
CA2804548A1 (en) 2012-01-12
EP4398245A2 (en) 2024-07-10

Similar Documents

Publication Publication Date Title
ES2968927T3 (es) Decodificador que utiliza cancelación del efecto de solapamiento hacia delante
ES2755166T3 (es) Decodificador de audio y método para proporcionar una información de audio decodificada usando una ocultación de error que modifica una señal de excitación de dominio de tiempo
ES2683077T3 (es) Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
ES2529221T3 (es) Codificación de sonido con bajo retardo que alterna codificación predictiva y codificación por transformada
ES2732952T3 (es) Decodificador de audio y procedimiento para proporcionar una información de audio decodificada usando un ocultamiento de error basado en una señal de excitación en el dominio del tiempo
ES2900594T3 (es) Procedimiento para determinar un modo de codificación
ES2676834T3 (es) Gestión de la pérdida de trama en un contexto de transición FD/LPD
ES2972833T3 (es) Métodos y aparatos para mejoras de descodificación unificada de habla y de audio
ES2967262T3 (es) Aparato y procesador de señal de audio, para proporcionar una representación de la señal de audio procesada, decodificador de audio, codificador de audio, procedimientos y programas informáticos
RU2575809C2 (ru) Кодер, использующий прямое подавление помех дискретизации
BR122020023793B1 (pt) Método de codificação de um sinal de áudio